Matplotlib: Cómo crear diagramas de caja por grupo

Puede usar la siguiente sintaxis para crear diagramas de caja por grupo en Matplotlib:

importar matplotlib como plt
 importar seaborn como sns

sns. diagrama de caja (x = ' grupo ', y = ' valores ', datos = df)

Los siguientes ejemplos muestran cómo utilizar esta sintaxis para crear diagramas de caja por grupo para conjuntos de datos en formato largo y ancho.

Ejemplo 1: Diagramas de caja por grupo para datos de formato largo

El siguiente código muestra cómo crear diagramas de caja por grupo para un DataFrame de pandas en un formato largo:

importar pandas como pd 
importar numpy como np 
importar matplotlib como plt
 importar seaborn como sns

# crear datos de formato largo
 df = pd. DataFrame ({' puntos ': [7, 8, 9, 12, 14, 5, 6, 6, 8, 11, 8, 9, 11, 13, 17],
                   ' equipo ': np. repetir ([' A ', ' B ', ' C '], 5)})

#ver impresión de datos
 (df)

    equipo de puntos
0 7 A
1 8 A
2 9 A
3 12 A
4 14 A
5 5 B
6 6 B
7 6 B
8 8 B
9 11 B
10 8 C
11 9 C
12 11 C
13 13 C
14 17 C

#create boxplot por grupo
 sns. boxplot (x = ' equipo ', y = ' puntos ', datos = df)

Diagrama de caja de Matplotilb por grupo

Ejemplo 2: Diagramas de caja por grupo para datos de formato ancho

El siguiente código muestra cómo crear diagramas de caja por grupo para un DataFrame de pandas en un formato ancho:

importar pandas como pd 
importar numpy como np 
importar matplotlib como plt
 importar seaborn como sns

#crear datos de formato ancho
 df = pd. DataFrame ({' A ': [7, 8, 9, 12, 14],
                   ' B ': [5, 6, 6, 8, 11],
                   ' C ': [8, 9, 11, 13, 17]})

#ver impresión de datos
 (df)

    A B C
0 7 5 8
1 8 6 9
2 9 6 11
3 12 8 13
4 14 11 17

#create boxplot por grupo
 sns. boxplot (x = ' variable ', y = ' valor ', datos = pd. melt (df)). conjunto (
            xlabel = ' equipo ',
            ylabel = ' puntos ')

Diagrama de caja de Matplotilb por grupo

Recursos adicionales

Cómo trazar varias líneas en Matplotlib
Cómo crear gráficos de barras apiladas en Matplotlib

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La varianza residual (a veces denominada "varianza inexplicable") se refiere a la varianza en un modelo que no se puede…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!