La guía definitiva: cómo leer archivos CSV con Pandas

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

Los archivos CSV (valores separados por comas) son una de las formas más comunes de almacenar datos. Afortunadamente, la función de pandas read_csv () le permite leer fácilmente archivos CSV en Python en casi cualquier formato que desee.

Este tutorial explica varias formas de leer archivos CSV en Python usando el siguiente archivo CSV llamado ‘data.csv’ :

playerID, equipo, puntos
1, Lakers, 26
2, Mavs, 19
3, dólares, 24
4, espuelas, 22

Ejemplo 1: leer archivo CSV en pandas DataFrame

El siguiente código muestra cómo leer el archivo CSV en un DataFrame de pandas:

#importar archivo CSV como DataFrame 
df = pd. read_csv ('data.csv')

#view DataFrame
df

        puntos del equipo playerID
0 1 Lakers 26
1 2 Mavs 19
2 3 dólares 24
3 4 Espuelas 22

Ejemplo 2: leer columnas específicas de un archivo CSV

El siguiente código muestra cómo leer solo las columnas tituladas ‘playerID’ y ‘puntos’ en el archivo CSV en un DataFrame de pandas:

#importar solo columnas específicas del archivo CSV 
df = pd. read_csv ('data.csv', usecols = [' playerID ', ' points '])

#view DataFrame
df

	puntos playerID
0 1 26
1 2 19
2 3 24
3 4 22

Alternativamente, puede especificar índices de columna para leer en un DataFrame de pandas:

#importar solo columnas específicas del archivo CSV 
df = pd. read_csv ('data.csv', usecols = [ 0 , 1 ])

#view DataFrame
df

        playerID equipo
0 1 Lakers
1 2 Mavs
2 3 dólares
3 4 espuelas

Ejemplo 3: especificar la fila de encabezado al importar un archivo CSV

En algunos casos, es posible que la fila del encabezado no sea la primera fila de un archivo CSV. Por ejemplo, considere el siguiente archivo CSV en el que la fila de encabezado aparece en la segunda fila:

aleatorio, datos, valores
playerID, equipo, puntos
1, Lakers, 26
2, Mavs, 19
3, dólares, 24
4, espuelas, 22

Para leer este archivo CSV en un DataFrame de pandas, podemos especificar header = 1 de la siguiente manera:

#importe del archivo CSV y especifique que el encabezado comienza en la segunda fila 
df = pd. read_csv ('data.csv', encabezado = 1 )

#view DataFrame
df

        puntos del equipo playerID
0 1 Lakers 26
1 2 Mavs 19
2 3 dólares 24
3 4 Espuelas 22

Ejemplo 4: omitir filas al importar un archivo CSV

También puede omitir filas fácilmente al importar un archivo CSV utilizando el argumento skiprows . Por ejemplo, el siguiente código muestra cómo omitir la segunda fila al importar el archivo CSV:

#importar desde el archivo CSV y omitir la segunda fila 
df = pd. read_csv ('data.csv', skiprows = [ 1 ] )

#view DataFrame
df

        puntos del equipo playerID
0 2 Mavs 19
1 3 dólares 24
2 4 Espuelas 22

Y el siguiente código muestra cómo omitir la segunda y tercera fila al importar el archivo CSV:

#importar desde el archivo CSV y omitir la segunda y tercera filas 
df = pd. read_csv ('data.csv', skiprows = [ 1, 2 ] )

#view DataFrame
df

        puntos del equipo playerID
1 3 dólares 24
2 4 Espuelas 22

Ejemplo 5: leer archivos CSV con delimitador personalizado

Ocasionalmente, es posible que tenga un archivo CSV con un delimitador diferente de una coma. Por ejemplo, supongamos que nuestro archivo CSV tiene un guión bajo como delimitador:

playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

Para leer este archivo CSV en pandas, podemos usar el argumento sep para especificar el delimitador que se usará al leer el archivo:

#importe del archivo CSV y especifique el delimitador para usar 
df = pd. read_csv ('data.csv', sep = ' _ ')

#view DataFrame
df

	puntos del equipo playerID
0 1 Lakers 26
1 2 Mavs 19
2 3 dólares 24
3 4 Espuelas 22

Puede encontrar la documentación completa para la pandas read_csv () la función aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

A menudo, en las estadísticas, nos interesa recopilar datos para poder responder alguna pregunta de investigación. Por ejemplo, es posible…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!