R: Cómo eliminar filas que contienen una cadena específica

Puede usar la siguiente sintaxis para eliminar filas que contienen una determinada cadena en un marco de datos en R:

df [! grepl (' cadena ', df $ columna),]

Este tutorial proporciona varios ejemplos de cómo usar esta sintaxis en la práctica con el siguiente marco de datos en R:

#create data frame
 df <- data. frame (equipo = c ('A', 'A', 'A', 'B', 'B', 'C'),
                 conference = c ('Este', 'Este', 'Este', 'Oeste', 'Oeste', 'Este'),
                 puntos = c (11, 8, 10, 6, 6, 5))

#ver marco de datos
df

  puntos de conferencia del equipo
1 A Este 11
2 A Este 8
3 A Este 10
4 B Oeste 6
5 B Oeste 6
6 C Este 5

Ejemplo 1: eliminar filas que contienen una cadena específica

El siguiente código muestra cómo eliminar todas las filas del marco de datos que contienen ‘A’ en la columna del equipo:

df [! grepl (' A ', df $ equipo),]

  puntos de conferencia del equipo
4 B Oeste 6
5 B Oeste 6
6 C Este 5

O podríamos eliminar todas las filas del marco de datos que contienen ‘Oeste’ en la columna de la conferencia:

df [! grepl (' Oeste ', df $ conferencia),]

  puntos de conferencia del equipo
1 A Este 11
2 A Este 8
3 A Este 10
6 C Este 5

Ejemplo 2: eliminar filas que contienen una cadena en una lista

El siguiente código muestra cómo eliminar todas las filas en el marco de datos que contienen ‘A’ o ‘B’ en la columna del equipo:

df [! grepl (' A | B ', df $ equipo),]

6 C Este 5

También podríamos definir un vector de cadenas y luego eliminar todas las filas en el marco de datos que contienen cualquiera de las cadenas en el vector en la columna del equipo:

#define vector de cadenas
 remove <- c (' A ', ' B ')

#remove filas que contienen cualquier cadena en el vector en la columna del equipo 
df [! grepl ( paste (remove, collapse = ' | '), df $ team),]

6 C Este 5

Observe que ambos métodos conducen al mismo resultado.

Recursos adicionales

Cómo eliminar filas con algunos o todos los NA en R
Cómo eliminar filas duplicadas en R
Cómo sumar filas específicas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Directo & CEO de Statologos LSI

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

Puede utilizar la siguiente sintaxis para seleccionar varias columnas mediante la función de consulta de Hojas de cálculo de Google:…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!