Cómo crear un diagrama de caja agrupado en R usando ggplot2

Los diagramas de caja son útiles para visualizar el resumen de cinco números de un conjunto de datos, que incluye:

  • El mínimo
  • El primer cuartil
  • La mediana
  • El tercer cuartil
  • El maximo

Relacionado: Una suave introducción a los diagramas de caja

Afortunadamente, es fácil crear diagramas de caja en R usando la biblioteca de visualización ggplot2 .

También sirve para crear diagramas de caja agrupados por una variable particular en un conjunto de datos. Por ejemplo, supongamos que tenemos el siguiente conjunto de datos que muestra el aumento en la eficiencia de 150 jugadores de baloncesto en tres equipos diferentes basados ​​en dos programas de entrenamiento diferentes:

#definir variables 
equipo = rep (c ('A', 'B', 'C'), cada uno = 50)
programa = rep (c ('bajo', 'alto'), cada uno = 25)
aumentar = seq (1: 150) + muestra (1: 100, 100, reemplazar = VERDADERO )

#create un conjunto de datos usando variables
data = data.frame (equipo, programa, aumento)

#ver las primeras seis filas del conjunto de datos 
cabeza (datos)

  aumento del programa de equipo
1 A bajo 62
2 A bajo 37
3 A bajo 49
4 A bajo 60
5 A bajo 64
6 A bajo 105

Podemos usar el siguiente código para crear diagramas de caja que muestren el aumento de la eficiencia de los jugadores, agrupados por equipo y completados según el programa de entrenamiento:

biblioteca (ggplot2)

ggplot (datos, aes (x = equipo, y = aumentar, llenar = programa)) + 
  geom_boxplot ()

Diagrama de caja agrupado en R

Podemos usar una sintaxis similar para crear diagramas de caja que muestren el aumento de la eficiencia de los jugadores, agrupados por programa de entrenamiento y completados según el equipo:

biblioteca (ggplot2)

ggplot (datos, aes (x = programa, y ​​= aumentar, llenar = equipo)) + 
  geom_boxplot ()

Diagrama de caja agrupado en R

Una alternativa similar es el uso de facetas , en el que cada subgrupo se muestra en su propio panel:

biblioteca (ggplot2)

ggplot (datos, aes (x = equipo, y = aumentar, llenar = programa)) + 
  geom_boxplot () +
   facet_wrap (~ programa)

Diagramas de caja en R agrupados por faceta

Dependiendo de los datos con los que esté trabajando, la creación de facetas puede o no tener sentido para sus necesidades de visualización.

Recursos adicionales

Cómo eliminar valores atípicos en diagramas de caja en R
Cómo crear gráficos lado a lado en ggplot2
Una guía completa de los mejores temas de ggplot2

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un diagrama de dispersión es una forma útil de visualizar la relación entre dos variables. Afortunadamente, es fácil crear diagramas…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!