Coincidencia parcial de cadenas en R (con ejemplos)

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

A menudo, es posible que desee encontrar las filas en un marco de datos cuyo valor en una determinada columna coincida con alguna cadena parcial.

Afortunadamente podemos usar la función grep () para hacerlo, usando la siguiente sintaxis:

df [ grep (" cadena ", df $ nombre_columna),]

Este tutorial proporciona varios ejemplos de cómo utilizar esta función en la práctica en el siguiente marco de datos:

#create data frame 
df <- data. marco (jugador = c ('A', 'B', 'C', 'D', 'E', 'F', 'G'),
                 position = c ('S Guard', 'P Guard', 'P Guard', 'S Forward',
                            'P Adelante', 'Centro', 'Centro'),
                 puntos = c (28, 17, 19, 14, 23, 26, 5))

#ver marco de datos
df

  puntos de posición del jugador
1 AS Guardia 28
2 BP Guardia 17
3 CP Guardia 19
4 DS Adelante 14
5 EP Delantero 23
6 F Centro 26
7 G Centro 5

Ejemplo 1: buscar coincidencias parciales en una columna específica

El siguiente código muestra cómo encontrar todas las filas en el marco de datos que contienen la cadena ‘Gua’ en la columna de posición:

df [ grep (" Gua ", df $ posición),]

  puntos de posición del jugador
1 AS Guardia 28
2 BP Guardia 17
3 CP Guardia 19

Y el siguiente código muestra cómo encontrar todas las filas en el marco de datos que contienen la cadena ‘P Gua’ en la columna de posición:

df [ grep (" P Gua ", df $ posición),]

  puntos de posición del jugador
2 BP Guardia 17
3 CP Guardia 19

Ejemplo 2: encontrar varias coincidencias parciales

El siguiente código muestra cómo buscar todas las filas en el marco de datos que contienen la cadena ‘S Gua’ o la cadena ‘Cen’ en la columna de posición mediante el uso de | operador para indicar «o» en el argumento grep:

df [ grep (" S Gua | Cen ", df $ posición),]

  puntos de posición del jugador
1 AS Guardia 28
6 F Centro 26
7 G Centro 5

Tenga en cuenta que podemos utilizar el | operador para buscar tantas cadenas parciales como queramos.

El siguiente código muestra cómo usar este operador para devolver las filas con cadenas parciales ‘A’, ‘C’, ‘D’, ‘F’ o ‘G’ en la columna del reproductor:

df [ grep (" A | C | D | F | G ", df $ jugador),]

  puntos de posición del jugador
1 AS Guardia 28
3 CP Guardia 19
4 DS Adelante 14
6 F Centro 26
7 G Centro 5

Puede encontrar más tutoriales de R en esta página .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Se utiliza una prueba U de Mann-Whitney (a veces llamada prueba de suma de rangos de Wilcoxon) para comparar las…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!