Cómo trazar múltiples diagramas de caja en un gráfico en R

Una gráfica de caja (a veces llamada gráfica de caja y bigotes) es una gráfica que muestra el resumen de cinco números de un conjunto de datos. El resumen de cinco números es el mínimo, el primer cuartil, la mediana, el tercer cuartil y el máximo. Podemos usar un diagrama de caja para visualizar fácilmente un conjunto de datos en un diagrama simple.

Este tutorial explica cómo trazar múltiples diagramas de caja en un diagrama en R, usando la base R y ggplot2.

Diagramas de caja en Base R

Para ilustrar cómo crear diagramas de caja en base R, trabajaremos con el conjunto de datos de calidad del aire incorporado en R:

#ver las primeras 6 filas del conjunto de datos "airquality" 
cabeza (calidad del aire)

# Ozone Solar.R Wind Temp Mes Day
# 1 41 190 7,4 67 5 1
# 2 36118 8.0 72 5 2
# 3 12 149 12,6 74 5 3
# 4 18 313 11,5 62 5 4
# 5 NA NA 14,3 56 5 5
# 6 28 NA 14,9 66 5 6

Para crear un diagrama de caja único para la variable «Ozono», podemos usar la siguiente sintaxis:

#create boxplot para la variable "Ozono" 
diagrama de caja (calidad del aire $ ozono)

Esto genera el siguiente diagrama de caja:

Supongamos que, en cambio, queremos generar una gráfica de caja para cada mes en el conjunto de datos. La siguiente sintaxis muestra cómo hacerlo:

#create boxplot que muestre la distribución de temperatura para cada mes en el conjunto de datos
diagrama de caja (Temp ~ Mes,
datos = calidad del aire,
main = "Distribución de temperatura por mes",
xlab = "Mes",
ylab = "Grados (F)",
col = "azul acero",
border = "negro"
)

Esto genera el siguiente gráfico que muestra un diagrama de caja para cada mes:

Diagramas de caja en ggplot2

Otra forma de crear diagramas de caja en R es usando el paquete ggplot2 . Usaremos el conjunto de datos integrado airquality nuevamente para los siguientes ejemplos.

Para crear un diagrama de caja único para la variable «Ozono» en el conjunto de datos de calidad del aire, podemos usar la siguiente sintaxis:

#create boxplot para la variable "Ozono" 
biblioteca (ggplot2)

ggplot (datos = calidad del aire, aes (y = ozono)) + geom_boxplot ()

Esto genera el siguiente diagrama de caja:

Diagrama de caja en R

Si, en cambio, queremos generar un diagrama de caja para cada mes en el conjunto de datos, podemos usar la siguiente sintaxis para hacerlo:

#create boxplot que muestre la distribución de temperatura para cada mes en el conjunto de datos
biblioteca (ggplot2)

ggplot (data = airquality, aes (x = as.character (Month), y = Temp)) +
    geom_boxplot (fill = "steelblue") +
    laboratorios (título = "Distribución de temperatura por mes", x = "Mes", y = "Grados (F)")

Esto genera el siguiente gráfico que muestra un diagrama de caja para cada mes:

Diagrama de caja usando ggplot2 en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La distribución normal es la distribución más utilizada en estadística. En este tutorial se explica cómo trabajar con la distribución…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!