R: Cómo eliminar filas que contienen una cadena específica

Puede usar la siguiente sintaxis para eliminar filas que contienen una determinada cadena en un marco de datos en R:

df [! grepl (' cadena ', df $ columna),]

Este tutorial proporciona varios ejemplos de cómo usar esta sintaxis en la práctica con el siguiente marco de datos en R:

#create data frame
 df <- data. frame (equipo = c ('A', 'A', 'A', 'B', 'B', 'C'),
                 conference = c ('Este', 'Este', 'Este', 'Oeste', 'Oeste', 'Este'),
                 puntos = c (11, 8, 10, 6, 6, 5))

#ver marco de datos
df

  puntos de conferencia del equipo
1 A Este 11
2 A Este 8
3 A Este 10
4 B Oeste 6
5 B Oeste 6
6 C Este 5

Ejemplo 1: eliminar filas que contienen una cadena específica

El siguiente código muestra cómo eliminar todas las filas del marco de datos que contienen ‘A’ en la columna del equipo:

df [! grepl (' A ', df $ equipo),]

  puntos de conferencia del equipo
4 B Oeste 6
5 B Oeste 6
6 C Este 5

O podríamos eliminar todas las filas del marco de datos que contienen ‘Oeste’ en la columna de la conferencia:

df [! grepl (' Oeste ', df $ conferencia),]

  puntos de conferencia del equipo
1 A Este 11
2 A Este 8
3 A Este 10
6 C Este 5

Ejemplo 2: eliminar filas que contienen una cadena en una lista

El siguiente código muestra cómo eliminar todas las filas en el marco de datos que contienen ‘A’ o ‘B’ en la columna del equipo:

df [! grepl (' A | B ', df $ equipo),]

6 C Este 5

También podríamos definir un vector de cadenas y luego eliminar todas las filas en el marco de datos que contienen cualquiera de las cadenas en el vector en la columna del equipo:

#define vector de cadenas
 remove <- c (' A ', ' B ')

#remove filas que contienen cualquier cadena en el vector en la columna del equipo 
df [! grepl ( paste (remove, collapse = ' | '), df $ team),]

6 C Este 5

Observe que ambos métodos conducen al mismo resultado.

Recursos adicionales

Cómo eliminar filas con algunos o todos los NA en R
Cómo eliminar filas duplicadas en R
Cómo sumar filas específicas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Puede utilizar la siguiente sintaxis para seleccionar varias columnas mediante la función de consulta de Hojas de cálculo de Google:…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!