Cómo crear un diagrama de Pareto en R (paso a paso)

Un gráfico de Pareto es un tipo de gráfico que muestra las frecuencias de diferentes categorías junto con las frecuencias acumuladas de categorías.

Diagrama de Pareto en R

Este tutorial proporciona un ejemplo paso a paso de cómo crear un diagrama de Pareto en R.

Paso 1: crear los datos

Supongamos que realizamos una encuesta en la que le pedimos a 350 personas diferentes que identifiquen su marca de cereal favorita entre las marcas A, B, C, D y E.

El siguiente conjunto de datos muestra el total de votos para cada marca:

#create data 
df <- data. marco (favorito = c ('A', 'B', 'C', 'D', 'E', 'F'),
                 cuenta = c (140, 97, 58, 32, 17, 6))

#ver datos
 df

  conteo favorito
1 A 140
2 B 97
3 C 58
4 D 32
5 E 17
6 F 6

Paso 2: crea el diagrama de Pareto

Para crear un diagrama de Pareto para visualizar los resultados de esta encuesta, podemos usar la función pareto.chart () del paquete qcc :

biblioteca (qcc)

#crear diagrama de Pareto Pareto 
. gráfico (df ​​$ count)

Análisis de gráfico de Pareto para df $ count
     Frecuencia Cum.Freq. Porcentaje acumulado Porcentaje.
  A 140,000000 140,000000 40,000000 40,000000
  B 97.000000 237.000000 27.714286 67.714286
  C 58.000000 295.000000 16.571429 84.285714
  D 32.000000 327.000000 9.142857 93.428571
  E 17.000000 344.000000 4.857143 98.285714
  F 6,000000 350,000000 1,714286 100,000000

La tabla de salida nos muestra la frecuencia y frecuencia acumulada de cada marca. Por ejemplo:

  • Frecuencia de la marca A: 140 | Frecuencia acumulada: 140
  • Frecuencia de la marca B: 97 | Frecuencia acumulada de A, B: 237
  • Frecuencia de la marca C: 58 | Frecuencia acumulada de A, B, C: 295

Y así.

Paso 3: modificar el diagrama de Pareto (opcional)

El siguiente código muestra cómo modificar el título del gráfico junto con la paleta de colores utilizada:

pareto. chart (df ​​$ count,
             main = ' Diagrama de Pareto para las marcas de cereales favoritas ',
             col = calor. colores ( longitud (df ​​$ count)))

Diagrama de Pareto en R

Puede encontrar una lista completa de las paletas de colores disponibles en esta Hoja de referencia de R Color .

Recursos adicionales

Cómo crear tablas de frecuencia en R
Cómo crear un histograma de frecuencia relativa en R
Cómo calcular sumas acumulativas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

El teorema del límite central establece que la distribución muestral de una media muestral es aproximadamente normal si el tamaño…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!