Cómo eliminar filas con algunos o todos los NA en R

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

A menudo, es posible que desee eliminar filas con todos o algunos NA (valores perdidos) en un marco de datos en R.

Este tutorial explica cómo eliminar estas filas usando base R y el paquete tidyr . Usaremos el siguiente marco de datos para cada uno de los siguientes ejemplos:

# crear un marco de datos con algunos valores faltantes
df <- data.frame (puntos = c (12, NA, 19, 22, 32),
                 asiste = c (4, NA, 3, NA, 5),
                 rebotes = c (5, NA, 7, 12, NA))

#ver marco de datos
 df

  puntos ayuda a rebotes
1 12 4 5
2 NA NA NA
3 19 3 7
4 22 NA 12
5 32 5 NA

Eliminar NA con Base R

El siguiente código muestra cómo usar complete.cases () para eliminar todas las filas en un marco de datos que tienen un valor faltante en cualquier columna:

# eliminar todas las filas con un valor faltante en cualquier columna 
df [ complete.cases (df),]

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7

El siguiente código muestra cómo usar complete.cases () para eliminar todas las filas en un marco de datos que tienen un valor faltante en columnas específicas :

#remove todas las filas con un valor faltante en la tercera columna 
df [ complete.cases (df ​​[, 3]),]

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7
4 22 NA 12

# eliminar todas las filas con un valor faltante en la primera o la tercera columna
 df [ complete.cases (df ​​[, c (1,3)]),]

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7
4 22 NA 12

Eliminar NA con Tidyr

El siguiente código muestra cómo usar drop_na () del paquete tidyr para eliminar todas las filas en un marco de datos que tienen un valor faltante en cualquier columna:

#cargar 
biblioteca de paquetes tidyr (tidyr)

# eliminar todas las filas con un valor faltante en cualquier columna
df%>% drop_na ()

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7

El siguiente código muestra cómo usar drop_na () del paquete tidyr para eliminar todas las filas en un marco de datos que tienen un valor faltante en columnas específicas :

#cargar 
biblioteca de paquetes tidyr (tidyr)

# eliminar todas las filas con un valor faltante en la tercera columna
df%>% drop_na (rebotes)

  puntos ayuda a rebotes
1 12 4 5
3 19 3 7
4 22 NA 12

Puede encontrar más tutoriales de R aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Dos distribuciones que son similares en estadísticas son la distribución binomial y la distribución de Poisson . Este tutorial proporciona…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!