- 0
- 0
- 0
- 0
Los diagramas de caja son útiles para visualizar el resumen de cinco números de un conjunto de datos, que incluye:
- El mínimo
- El primer cuartil
- La mediana
- El tercer cuartil
- El maximo
Relacionado: Una suave introducción a los diagramas de caja
Afortunadamente, es fácil crear diagramas de caja en R usando la biblioteca de visualización ggplot2 .
También sirve para crear diagramas de caja agrupados por una variable particular en un conjunto de datos. Por ejemplo, supongamos que tenemos el siguiente conjunto de datos que muestra el aumento en la eficiencia de 150 jugadores de baloncesto en tres equipos diferentes basados en dos programas de entrenamiento diferentes:
#definir variables equipo = rep (c ('A', 'B', 'C'), cada uno = 50) programa = rep (c ('bajo', 'alto'), cada uno = 25) aumentar = seq (1: 150) + muestra (1: 100, 100, reemplazar = VERDADERO ) #create un conjunto de datos usando variables data = data.frame (equipo, programa, aumento) #ver las primeras seis filas del conjunto de datos cabeza (datos) aumento del programa de equipo 1 A bajo 62 2 A bajo 37 3 A bajo 49 4 A bajo 60 5 A bajo 64 6 A bajo 105
Podemos usar el siguiente código para crear diagramas de caja que muestren el aumento de la eficiencia de los jugadores, agrupados por equipo y completados según el programa de entrenamiento:
biblioteca (ggplot2) ggplot (datos, aes (x = equipo, y = aumentar, llenar = programa)) + geom_boxplot ()
Podemos usar una sintaxis similar para crear diagramas de caja que muestren el aumento de la eficiencia de los jugadores, agrupados por programa de entrenamiento y completados según el equipo:
biblioteca (ggplot2) ggplot (datos, aes (x = programa, y = aumentar, llenar = equipo)) + geom_boxplot ()
Una alternativa similar es el uso de facetas , en el que cada subgrupo se muestra en su propio panel:
biblioteca (ggplot2) ggplot (datos, aes (x = equipo, y = aumentar, llenar = programa)) + geom_boxplot () + facet_wrap (~ programa)
Dependiendo de los datos con los que esté trabajando, la creación de facetas puede o no tener sentido para sus necesidades de visualización.
Recursos adicionales
Cómo eliminar valores atípicos en diagramas de caja en R
Cómo crear gráficos lado a lado en ggplot2
Una guía completa de los mejores temas de ggplot2
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: