La guía definitiva: cómo leer archivos CSV con Pandas

Actualizado por ultima vez el 7 de mayo de 2021, por .

Los archivos CSV (valores separados por comas) son una de las formas más comunes de almacenar datos. Afortunadamente, la función de pandas read_csv () le permite leer fácilmente archivos CSV en Python en casi cualquier formato que desee.

Este tutorial explica varias formas de leer archivos CSV en Python usando el siguiente archivo CSV llamado ‘data.csv’ :

playerID, equipo, puntos
1, Lakers, 26
2, Mavs, 19
3, dólares, 24
4, espuelas, 22

HOLA, estas en Statologos la enciclopedia más grande de estadística aplicada en español, no olvides que tienes un potente buscador de información en el menú utilizalo sabiamente 😉

Ejemplo 1: leer archivo CSV en pandas DataFrame

El siguiente código muestra cómo leer el archivo CSV en un DataFrame de pandas:

#importar archivo CSV como DataFrame 
df = pd. read_csv ('data.csv')

#view DataFrame
df

        puntos del equipo playerID
0 1 Lakers 26
1 2 Mavs 19
2 3 dólares 24
3 4 Espuelas 22

Ejemplo 2: leer columnas específicas de un archivo CSV

El siguiente código muestra cómo leer solo las columnas tituladas ‘playerID’ y ‘puntos’ en el archivo CSV en un DataFrame de pandas:

#importar solo columnas específicas del archivo CSV 
df = pd. read_csv ('data.csv', usecols = [' playerID ', ' points '])

#view DataFrame
df

	puntos playerID
0 1 26
1 2 19
2 3 24
3 4 22

Alternativamente, puede especificar índices de columna para leer en un DataFrame de pandas:

#importar solo columnas específicas del archivo CSV 
df = pd. read_csv ('data.csv', usecols = [ 0 , 1 ])

#view DataFrame
df

        playerID equipo
0 1 Lakers
1 2 Mavs
2 3 dólares
3 4 espuelas

Ejemplo 3: especificar la fila de encabezado al importar un archivo CSV

En algunos casos, es posible que la fila del encabezado no sea la primera fila de un archivo CSV. Por ejemplo, considere el siguiente archivo CSV en el que la fila de encabezado aparece en la segunda fila:

aleatorio, datos, valores
playerID, equipo, puntos
1, Lakers, 26
2, Mavs, 19
3, dólares, 24
4, espuelas, 22

Para leer este archivo CSV en un DataFrame de pandas, podemos especificar header = 1 de la siguiente manera:

#importe del archivo CSV y especifique que el encabezado comienza en la segunda fila 
df = pd. read_csv ('data.csv', encabezado = 1 )

#view DataFrame
df

        puntos del equipo playerID
0 1 Lakers 26
1 2 Mavs 19
2 3 dólares 24
3 4 Espuelas 22

Ejemplo 4: omitir filas al importar un archivo CSV

También puede omitir filas fácilmente al importar un archivo CSV utilizando el argumento skiprows . Por ejemplo, el siguiente código muestra cómo omitir la segunda fila al importar el archivo CSV:

#importar desde el archivo CSV y omitir la segunda fila 
df = pd. read_csv ('data.csv', skiprows = [ 1 ] )

#view DataFrame
df

        puntos del equipo playerID
0 2 Mavs 19
1 3 dólares 24
2 4 Espuelas 22

Y el siguiente código muestra cómo omitir la segunda y tercera fila al importar el archivo CSV:

#importar desde el archivo CSV y omitir la segunda y tercera filas 
df = pd. read_csv ('data.csv', skiprows = [ 1, 2 ] )

#view DataFrame
df

        puntos del equipo playerID
1 3 dólares 24
2 4 Espuelas 22

Ejemplo 5: leer archivos CSV con delimitador personalizado

Ocasionalmente, es posible que tenga un archivo CSV con un delimitador diferente de una coma. Por ejemplo, supongamos que nuestro archivo CSV tiene un guión bajo como delimitador:

playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

Para leer este archivo CSV en pandas, podemos usar el argumento sep para especificar el delimitador que se usará al leer el archivo:

#importe del archivo CSV y especifique el delimitador para usar 
df = pd. read_csv ('data.csv', sep = ' _ ')

#view DataFrame
df

	puntos del equipo playerID
0 1 Lakers 26
1 2 Mavs 19
2 3 dólares 24
3 4 Espuelas 22

Puede encontrar la documentación completa para la pandas read_csv () la función aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

A menudo, en las estadísticas, nos interesa recopilar datos para poder responder alguna pregunta de investigación. Por ejemplo, es posible…
statologos comunidad-2

You have Successfully Subscribed!