Cómo recodificar valores usando dplyr

Actualizado por ultima vez el 7 de mayo de 2021, por .

Ocasionalmente, puede estar interesado en recodificar ciertos valores en un marco de datos en R. Afortunadamente, esto se puede hacer fácilmente usando la función recode () del paquete dplyr.

Este tutorial muestra varios ejemplos de cómo utilizar esta función en la práctica.

Ejemplo 1: recodificar una sola columna en un marco de datos

El siguiente código muestra cómo recodificar una sola columna en un marco de datos:

biblioteca (dplyr)

 #create dataframe 
df <- data.frame (jugador = c ('A', 'B', 'C', 'D'),
                 puntos = c (24, 29, 13, 15),
                 result = c ('Ganar', 'Perder', 'Ganar', 'Perder'))

#ver marco de datos 
df

#cambiar 'Win' y 'Loss' por '1' y '0' 
df%>% mutate (result = recode (result, ' Win ' = '1', ' Loss ' = '0'))

       resultado de puntos de jugador
1 A 24 1
2 B 29 0
3 C 13 1
4 D 15 0

Ejemplo 2: recodificar una sola columna en un marco de datos y proporcionar valores NA

El siguiente código muestra cómo recodificar una sola columna en un marco de datos y dar un valor de NA a cualquier valor al que no se le haya dado explícitamente un nuevo valor:

biblioteca (dplyr)
 
#create dataframe 
df <- data.frame (jugador = c ('A', 'B', 'C', 'D'),
                 puntos = c (24, 29, 13, 15),
                 result = c ('Ganar', 'Perder', 'Ganar', 'Perder'))

#ver marco de datos 
df

#cambie 'Win' a '1' y asigne a todos los demás valores un valor de NA 
df%>% mutate (result = recode (result, ' Win ' = '1', .default = NA_character_))

       resultado de puntos de jugador
1 A 24 1
2 B 29 <NA>
3 C 13 1
4 D 15 <NA>

Ejemplo 3: recodificar varias columnas en un marco de datos

El siguiente código muestra cómo recodificar varias columnas a la vez en un marco de datos:

biblioteca (dplyr)
 
#create dataframe 
df <- data.frame (jugador = c ('A', 'B', 'C', 'D'),
                 puntos = c (24, 29, 13, 15),
                 result = c ('Ganar', 'Perder', 'Ganar', 'Perder'))

#recodificar las columnas 'player' y 'result' 
df%>% mutate (player = recode (player, ' A ' = 'Z'),
              resultado = recodificar (resultado, ' Ganar ' = '1', ' Pérdida ' = '0'))

       resultado de puntos de jugador
1 Z 24 1
2 B 29 0
3 C 13 1
4 D 15 0

Puede encontrar la documentación completa para la función recode () aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El término análisis bivariado se refiere al análisis de dos variables. Puede recordar esto porque el prefijo "bi" significa "dos".…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!