Cómo crear un gráfico de bandas en R

Un gráfico de franjas es un tipo de gráfico que muestra datos numéricos a lo largo de una sola franja. De manera similar a los diagramas de caja , los gráficos de bandas pueden ayudarlo a visualizar la distribución de datos. Los gráficos de bandas pueden ser una buena alternativa a los diagramas de caja cuando los tamaños de muestra son pequeños para que pueda ver los puntos de datos individuales.

Este tutorial explica cómo crear un gráfico de bandas en R usando la función incorporada stripchart () .

La función stripchart ()

La sintaxis básica para crear un gráfico de bandas en R es la siguiente:

stripchart (x, método, jitter, main, xlab, ylab, col, pch, vertical, group.names)

  • x : un vector numérico o una lista de vectores numéricos que se trazarán. Este es el único argumento necesario para producir una trama.
  • método : el método que se utilizará para separar puntos que tienen valores idénticos. El método predeterminado «overplot» hace que dichos puntos se sobreploten, pero es posible especificar «jitter» para alterar los puntos o «apilar» para apilar los puntos.
  • jitter : cuando se utiliza method = «jitter», esto proporciona la cantidad de jitter que se aplicará.
  • principal: título del gráfico
  • xlab : etiqueta del eje x
  • ylab : etiqueta del eje y
  • col : color de los puntos en la trama
  • pch : forma de los puntos en el gráfico
  • vertical : cuando vertical es «VERDADERO», la gráfica se dibuja verticalmente en lugar de la horizontal predeterminada
  • group.names : etiquetas de grupo que se imprimirán junto al gráfico, si se está trazando más de un vector numérico.

Gráfico de bandas para un solo vector numérico

El siguiente ejemplo utiliza el iris del conjunto de datos R integrado para crear un gráfico de bandas para un solo vector numérico.

#ver las primeras seis filas del conjunto de datos de iris
cabeza (iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Especies
# 1 5,1 3,5 1,4 0,2 setosa
# 2 4,9 3,0 1,4 0,2 setosa
# 3 4,7 3,2 1,3 0,2 setosa
# 4 4,6 3,1 1,5 0,2 setosa
# 5 5.0 3.6 1.4 0.2 setosa
# 6 5,4 3,9 1,7 0,4 setosa

El siguiente código crea un gráfico de bandas básico para la variable Sepal.Length :

stripchart (iris $ Sepal.Length)

Gráfico de bandas básico en R

También podemos agregar argumentos adicionales para agregar un título y una etiqueta del eje x, cambiar el color de los puntos, cambiar la forma de los puntos y usar el método «jitter» para que los puntos individuales no se superpongan entre sí:

stripchart (iris $ Sepal.Length,
           main = 'Distribución de la longitud del sépalo',
           xlab = 'Longitud del sépalo',
           col = 'rojo',
           pch = 1,
           método = 'jitter')

Gráfico de bandas personalizado en R

En lugar de alterar los puntos, podemos «apilarlos» en su lugar:

stripchart (iris $ Sepal.Length,
           main = 'Distribución de la longitud del sépalo',
           xlab = 'Longitud del sépalo',
           col = 'rojo',
           pch = 1,
           método = 'pila' )

Gráfico de bandas con puntos de datos apilados en R

También podemos mostrar la gráfica verticalmente en lugar de la horizontal predeterminada, y cambiar la etiqueta del eje para que esté en el eje y en su lugar:

stripchart (iris $ Sepal.Length,
           main = 'Distribución de la longitud del sépalo',
           ylab = 'Longitud del sépalo' ,
           col = 'rojo',
           pch = 1,
           método = 'jitter',
           vertical = VERDADERO )

Gráfico de bandas vertical en R

Gráfico de bandas para múltiples vectores numéricos

También podemos dibujar varios gráficos de bandas en un solo gráfico pasando una lista de vectores numéricos.

El siguiente código crea una lista que contiene las variables Longitud del sépalo y Ancho del sépalo en el conjunto de datos del iris y produce un gráfico de bandas para cada variable en un solo gráfico:

#crear lista de variables
x <- list ('Sepal Length' = iris $ Sepal.Length, 'Sepal Width' = iris $ Sepal.Width)

#cree un gráfico que contenga un gráfico de bandas por cada gráfico de bandas variable
 (x,
           main = 'Distribuciones de ancho y largo de sépalo',
           xlab = 'Medida', 
           ylab = 'Variable',
           col = c ('azul acero', 'coral2'),
           pch = 16,
           método = 'jitter')

Múltiples gráficos de bandas en un gráfico en R

Al igual que en el ejemplo anterior, podemos elegir trazar los gráficos de banda verticalmente en lugar de la horizontal predeterminada:

stripchart (x, main = 'Distribuciones de ancho y largo de sépalo',
           xlab = 'Medida', 
           ylab = 'Variable',
           col = c ('azul acero', 'coral2'),
           pch = 16,
           método = 'jitter',
           vertical = VERDADERO )

Múltiples gráficos de bandas verticales en R

Además, podemos pasar una fórmula en forma de y ~ x a la función stripchart (), donde y es un vector numérico agrupado por el valor de x .

Por ejemplo, en el conjunto de datos de iris , podríamos agrupar los datos de acuerdo con la especie, que tiene tres valores distintos («setosa», «versicolor» y «virginica») y luego trazar la longitud del sépalo para cada especie en un gráfico de tiras:

stripchart (Sepal.Length ~ Especie,
           datos = iris,
           main = 'Longitud del sépalo por especie',
           xlab = 'Especie', 
           ylab = 'Longitud del sépalo',
           col = c ('azul acero', 'coral2', 'violeta'),
           pch = 16,
           método = 'jitter',
           vertical = VERDADERO)

Múltiples gráficos de bandas en R

Para ver la documentación completa sobre la función stripchart () en R, simplemente escriba:

? stripchart
  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

R cuadrado , a menudo escrito como r 2 , es una medida de qué tan bien se ajusta un…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!