Cómo importar archivos CSV a R (paso a paso)

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

Supongamos que tengo un archivo CSV llamado data.csv guardado en la siguiente ubicación:

C: Users Bob Desktop data.csv

Y supongamos que el archivo CSV contiene los siguientes datos:

equipo, puntos, asistencias
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Hay tres formas comunes de importar este archivo CSV a R:

1. Use read.csv de la base R (método más lento, pero funciona bien para conjuntos de datos más pequeños)

data1 <- read.csv (" C: \ Users \ Bob \ Desktop \ data.csv ", header = TRUE , stringsAsFactors = FALSE )

2. Utilice read_csv del paquete readr ( 2-3 veces más rápido que read.csv)

biblioteca (readr)

data2 <- read_csv (" C: \ Users \ Bob \ Desktop \ data.csv ")

3. Utilice el paquete fread from data.table ( 2-3 veces más rápido que read_r)

biblioteca (tabla de datos)

data3 <- fread (" C: \ Users \ Bob \ Desktop \ data.csv ")

Este tutorial muestra un ejemplo de cómo utilizar cada uno de estos métodos para importar el archivo CSV a R.

Método 1: usar read.csv

Si su archivo CSV es razonablemente pequeño, puede usar la función read.csv de Base R para importarlo.

Cuando utilice este método, asegúrese de especificar stringsAsFactors = FALSE para que R no convierta variables de carácter o categóricas en factores.

El siguiente código muestra cómo usar read.csv para importar este archivo CSV a R:

#import data 
data1 <- read.csv (" C: \ Users \ Bob \ Desktop \ data.csv ", header = TRUE , stringsAsFactors = FALSE )

#ver la estructura de la cadena de datos
 (data1)

'data.frame': 5 obs. de 3 variables:
 $ equipo: chr "'A'" "'B'" "'C'" "'D'" ...
 $ puntos: int 78 85 93 90 91
 $ asistencias: int 12 20 23 8 14

Método 2: usar read_csv

Si se trabaja con archivos más grandes, se puede utilizar el read_csv función del paquete readr:

biblioteca (readr)

#import data 
data2 <- read_csv (" C: \ Users \ Bob \ Desktop \ data.csv ")

#ver estructura de datos
 str (data2)

'data.frame': 5 obs. de 3 variables:
 $ equipo: chr "'A'" "'B'" "'C'" "'D'" ...
 $ puntos: int 78 85 93 90 91
 $ asistencias: int 12 20 23 8 14

Método 3: usar fread

Si su CSV es extremadamente grande, la manera más rápida para importar en R es con el fread función del paquete data.table:

biblioteca (tabla de datos)

#import data 
data3 <- fread (" C: \ Users \ Bob \ Desktop \ data.csv ")

#ver estructura de datos
 str (data3)

Clases 'data.table' y 'data.frame': 5 obs. de 3 variables:
 $ equipo: chr "'A'" "'B'" "'C'" "'D'" ...
 $ puntos: int 78 85 93 90 91
 $ asistencias: int 12 20 23 8 14

Tenga en cuenta que en cada ejemplo usamos barras invertidas dobles (\) en la ruta del archivo para evitar el siguiente error común:

Error: ' U' usado sin dígitos hexadecimales en la cadena de caracteres que comienza con "" C:  U "

Relacionado: Cómo importar archivos de Excel a R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La propagación de errores ocurre cuando mide algunas cantidades a , b , c , ... con incertidumbres δ a…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!