Coincidencia parcial de cadenas en R (con ejemplos)

A menudo, es posible que desee encontrar las filas en un marco de datos cuyo valor en una determinada columna coincida con alguna cadena parcial.

Afortunadamente podemos usar la función grep () para hacerlo, usando la siguiente sintaxis:

df [ grep (" cadena ", df $ nombre_columna),]

Este tutorial proporciona varios ejemplos de cómo utilizar esta función en la práctica en el siguiente marco de datos:

#create data frame 
df <- data. marco (jugador = c ('A', 'B', 'C', 'D', 'E', 'F', 'G'),
                 position = c ('S Guard', 'P Guard', 'P Guard', 'S Forward',
                            'P Adelante', 'Centro', 'Centro'),
                 puntos = c (28, 17, 19, 14, 23, 26, 5))

#ver marco de datos
df

  puntos de posición del jugador
1 AS Guardia 28
2 BP Guardia 17
3 CP Guardia 19
4 DS Adelante 14
5 EP Delantero 23
6 F Centro 26
7 G Centro 5

Ejemplo 1: buscar coincidencias parciales en una columna específica

El siguiente código muestra cómo encontrar todas las filas en el marco de datos que contienen la cadena ‘Gua’ en la columna de posición:

df [ grep (" Gua ", df $ posición),]

  puntos de posición del jugador
1 AS Guardia 28
2 BP Guardia 17
3 CP Guardia 19

Y el siguiente código muestra cómo encontrar todas las filas en el marco de datos que contienen la cadena ‘P Gua’ en la columna de posición:

df [ grep (" P Gua ", df $ posición),]

  puntos de posición del jugador
2 BP Guardia 17
3 CP Guardia 19

Ejemplo 2: encontrar varias coincidencias parciales

El siguiente código muestra cómo buscar todas las filas en el marco de datos que contienen la cadena ‘S Gua’ o la cadena ‘Cen’ en la columna de posición mediante el uso de | operador para indicar «o» en el argumento grep:

df [ grep (" S Gua | Cen ", df $ posición),]

  puntos de posición del jugador
1 AS Guardia 28
6 F Centro 26
7 G Centro 5

Tenga en cuenta que podemos utilizar el | operador para buscar tantas cadenas parciales como queramos.

El siguiente código muestra cómo usar este operador para devolver las filas con cadenas parciales ‘A’, ‘C’, ‘D’, ‘F’ o ‘G’ en la columna del reproductor:

df [ grep (" A | C | D | F | G ", df $ jugador),]

  puntos de posición del jugador
1 AS Guardia 28
3 CP Guardia 19
4 DS Adelante 14
6 F Centro 26
7 G Centro 5

Puede encontrar más tutoriales de R en esta página .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba U de Mann-Whitney (a veces llamada prueba de suma de rangos de Wilcoxon) para comparar las…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!