Cómo recodificar valores usando dplyr

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

Ocasionalmente, puede estar interesado en recodificar ciertos valores en un marco de datos en R. Afortunadamente, esto se puede hacer fácilmente usando la función recode () del paquete dplyr.

Este tutorial muestra varios ejemplos de cómo utilizar esta función en la práctica.

Ejemplo 1: recodificar una sola columna en un marco de datos

El siguiente código muestra cómo recodificar una sola columna en un marco de datos:

biblioteca (dplyr)

 #create dataframe 
df <- data.frame (jugador = c ('A', 'B', 'C', 'D'),
                 puntos = c (24, 29, 13, 15),
                 result = c ('Ganar', 'Perder', 'Ganar', 'Perder'))

#ver marco de datos 
df

#cambiar 'Win' y 'Loss' por '1' y '0' 
df%>% mutate (result = recode (result, ' Win ' = '1', ' Loss ' = '0'))

       resultado de puntos de jugador
1 A 24 1
2 B 29 0
3 C 13 1
4 D 15 0

Ejemplo 2: recodificar una sola columna en un marco de datos y proporcionar valores NA

El siguiente código muestra cómo recodificar una sola columna en un marco de datos y dar un valor de NA a cualquier valor al que no se le haya dado explícitamente un nuevo valor:

biblioteca (dplyr)
 
#create dataframe 
df <- data.frame (jugador = c ('A', 'B', 'C', 'D'),
                 puntos = c (24, 29, 13, 15),
                 result = c ('Ganar', 'Perder', 'Ganar', 'Perder'))

#ver marco de datos 
df

#cambie 'Win' a '1' y asigne a todos los demás valores un valor de NA 
df%>% mutate (result = recode (result, ' Win ' = '1', .default = NA_character_))

       resultado de puntos de jugador
1 A 24 1
2 B 29 <NA>
3 C 13 1
4 D 15 <NA>

Ejemplo 3: recodificar varias columnas en un marco de datos

El siguiente código muestra cómo recodificar varias columnas a la vez en un marco de datos:

biblioteca (dplyr)
 
#create dataframe 
df <- data.frame (jugador = c ('A', 'B', 'C', 'D'),
                 puntos = c (24, 29, 13, 15),
                 result = c ('Ganar', 'Perder', 'Ganar', 'Perder'))

#recodificar las columnas 'player' y 'result' 
df%>% mutate (player = recode (player, ' A ' = 'Z'),
              resultado = recodificar (resultado, ' Ganar ' = '1', ' Pérdida ' = '0'))

       resultado de puntos de jugador
1 Z 24 1
2 B 29 0
3 C 13 1
4 D 15 0

Puede encontrar la documentación completa para la función recode () aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

El término análisis bivariado se refiere al análisis de dos variables. Puede recordar esto porque el prefijo "bi" significa "dos".…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!