Cómo crear un diagrama de Pareto en R (paso a paso)

Un gráfico de Pareto es un tipo de gráfico que muestra las frecuencias de diferentes categorías junto con las frecuencias acumuladas de categorías.

Diagrama de Pareto en R

Este tutorial proporciona un ejemplo paso a paso de cómo crear un diagrama de Pareto en R.

Paso 1: crear los datos

Supongamos que realizamos una encuesta en la que le pedimos a 350 personas diferentes que identifiquen su marca de cereal favorita entre las marcas A, B, C, D y E.

El siguiente conjunto de datos muestra el total de votos para cada marca:

#create data 
df <- data. marco (favorito = c ('A', 'B', 'C', 'D', 'E', 'F'),
                 cuenta = c (140, 97, 58, 32, 17, 6))

#ver datos
 df

  conteo favorito
1 A 140
2 B 97
3 C 58
4 D 32
5 E 17
6 F 6

Paso 2: crea el diagrama de Pareto

Para crear un diagrama de Pareto para visualizar los resultados de esta encuesta, podemos usar la función pareto.chart () del paquete qcc :

biblioteca (qcc)

#crear diagrama de Pareto Pareto 
. gráfico (df ​​$ count)

Análisis de gráfico de Pareto para df $ count
     Frecuencia Cum.Freq. Porcentaje acumulado Porcentaje.
  A 140,000000 140,000000 40,000000 40,000000
  B 97.000000 237.000000 27.714286 67.714286
  C 58.000000 295.000000 16.571429 84.285714
  D 32.000000 327.000000 9.142857 93.428571
  E 17.000000 344.000000 4.857143 98.285714
  F 6,000000 350,000000 1,714286 100,000000

La tabla de salida nos muestra la frecuencia y frecuencia acumulada de cada marca. Por ejemplo:

  • Frecuencia de la marca A: 140 | Frecuencia acumulada: 140
  • Frecuencia de la marca B: 97 | Frecuencia acumulada de A, B: 237
  • Frecuencia de la marca C: 58 | Frecuencia acumulada de A, B, C: 295

Y así.

Paso 3: modificar el diagrama de Pareto (opcional)

El siguiente código muestra cómo modificar el título del gráfico junto con la paleta de colores utilizada:

pareto. chart (df ​​$ count,
             main = ' Diagrama de Pareto para las marcas de cereales favoritas ',
             col = calor. colores ( longitud (df ​​$ count)))

Diagrama de Pareto en R

Puede encontrar una lista completa de las paletas de colores disponibles en esta Hoja de referencia de R Color .

Recursos adicionales

Cómo crear tablas de frecuencia en R
Cómo crear un histograma de frecuencia relativa en R
Cómo calcular sumas acumulativas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El teorema del límite central establece que la distribución muestral de una media muestral es aproximadamente normal si el tamaño…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!