Cómo eliminar filas con algunos o todos los NA en R

A menudo, es posible que desee eliminar filas con todos o algunos NA (valores perdidos) en un marco de datos en R.

Este tutorial explica cómo eliminar estas filas usando base R y el paquete tidyr . Usaremos el siguiente marco de datos para cada uno de los siguientes ejemplos:

# crear un marco de datos con algunos valores faltantes
df <- data.frame (puntos = c (12, NA, 19, 22, 32),
                 asiste = c (4, NA, 3, NA, 5),
                 rebotes = c (5, NA, 7, 12, NA))

#ver marco de datos
 df

  puntos ayuda a rebotes
1 12 4 5
2 NA NA NA
3 19 3 7
4 22 NA 12
5 32 5 NA

Eliminar NA con Base R

El siguiente código muestra cómo usar complete.cases () para eliminar todas las filas en un marco de datos que tienen un valor faltante en cualquier columna:

# eliminar todas las filas con un valor faltante en cualquier columna 
df [ complete.cases (df),]

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7

El siguiente código muestra cómo usar complete.cases () para eliminar todas las filas en un marco de datos que tienen un valor faltante en columnas específicas :

#remove todas las filas con un valor faltante en la tercera columna 
df [ complete.cases (df ​​[, 3]),]

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7
4 22 NA 12

# eliminar todas las filas con un valor faltante en la primera o la tercera columna
 df [ complete.cases (df ​​[, c (1,3)]),]

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7
4 22 NA 12

Eliminar NA con Tidyr

El siguiente código muestra cómo usar drop_na () del paquete tidyr para eliminar todas las filas en un marco de datos que tienen un valor faltante en cualquier columna:

#cargar 
biblioteca de paquetes tidyr (tidyr)

# eliminar todas las filas con un valor faltante en cualquier columna
df%>% drop_na ()

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7

El siguiente código muestra cómo usar drop_na () del paquete tidyr para eliminar todas las filas en un marco de datos que tienen un valor faltante en columnas específicas :

#cargar 
biblioteca de paquetes tidyr (tidyr)

# eliminar todas las filas con un valor faltante en la tercera columna
df%>% drop_na (rebotes)

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7
4 22 NA 12

Puede encontrar más tutoriales de R aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Dos distribuciones que son similares en estadísticas son la distribución binomial y la distribución de Poisson . Este tutorial proporciona…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!