¿Cómo leer un archivo de texto con Pandas? (incluidos ejemplos)

Actualizado el 3 de noviembre de 2022, por Dereck Amesquita.

Para leer un archivo .txt con pandas en Python, puede usar la siguiente sintaxis básica:

df = pd. read_csv (" data.txt ", sep = "")

Este tutorial proporciona varios ejemplos de cómo utilizar esta función en la práctica.

Leer un archivo .txt  con encabezado en Pandas

Supongamos que tenemos el siguiente archivo de texto llamado data.txt con un encabezado:

Leer archivo de texto en Pandas

Para leer este archivo en un DataFrame de pandas, podemos usar la siguiente sintaxis:

import pandas as pd

# Código para leer un archivo txt con pandas
df = pd.read_csv("data.txt", sep=" ")

# Ver el DataFrame
print(df)

   column1  column2
0        1        4
1        3        4
2        2        5
3        7        9
4        9        1
5        6        3
6        4        4
7        5        2
8        4        8
9        6        8

Podemos imprimir la clase del DataFrame y encontrar el número de filas y columnas usando la siguiente sintaxis:

# Mostrar la clase del DataFrame
print(type(df))

<class 'pandas.core.frame.DataFrame'>

# Mostrar el número de filas y columnas 
df.shape

(10, 2)

Podemos ver que df es un DataFrame de pandas con 10 filas y 2 columnas.

Leer un archivo de texto sin encabezado

Supongamos que tenemos el siguiente archivo de texto llamado data.txt sin encabezados:

Pandas lee el archivo de texto sin encabezados

Para leer este archivo en un DataFrame de pandas, podemos usar la siguiente sintaxis:

# Cargar el archivo de texto en Python
df = pd.read_csv("data.txt", sep=" ", header=None)

# Mostrar Dataframe
print(df)

   0  1
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Dado que el archivo de texto no tenía encabezados, los pandas simplemente nombraron las columnas 0 y 1 .

Leer un archivo de texto sin encabezado y especificar nombres de columna

Si lo deseamos, podemos asignar nombres de columna mientras importamos el archivo de texto usando el argumento de nombres :

df = pd.read_csv("data.txt", sep=" ", header=None, names=["A", "B"])

#display DataFrame
print(df)

   A  B
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Recursos adicionales

Cómo leer archivos CSV con Pandas
Cómo leer archivos Excel con Pandas
Cómo leer un archivo JSON con Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

En estadística, la curtosis se utiliza para describir la forma de una distribución de probabilidad. Específicamente, nos dice el grado…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!