Cómo realizar la prueba de Tukey en Python

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Se utiliza un ANOVA de una vía para determinar si existe o no una diferencia estadísticamente significativa entre las medias de tres o más grupos independientes.

Si el valor p general de la tabla ANOVA es menor que algún nivel de significancia, entonces tenemos evidencia suficiente para decir que al menos una de las medias de los grupos es diferente de las otras.

Sin embargo, esto no nos dice qué grupos son diferentes entre sí. Simplemente nos dice que no todas las medias del grupo son iguales. Para saber exactamente qué grupos son diferentes entre sí, debemos realizar una prueba post hoc .

Una de las pruebas post hoc más utilizadas es la prueba de Tukey , que nos permite hacer comparaciones por pares entre las medias de cada grupo mientras se controla la tasa de error familiar .

Este tutorial proporciona un ejemplo paso a paso de cómo realizar la prueba de Tukey en Python.

Paso 1: Cargue los paquetes y las funciones necesarios

Primero, cargaremos los paquetes y funciones necesarios en Python:

importar pandas como pd
 importar numpy como np
 desde scipy. stats  import f_oneway
 de statsmodels. estadísticas . importación multicomp  pairwise_tukeyhsd

Paso 2: ajuste el modelo ANOVA

El siguiente código muestra cómo crear un conjunto de datos falso con tres grupos (A, B y C) y ajustar un modelo ANOVA unidireccional a los datos para determinar si los valores medios de cada grupo son iguales:

#introducir datos para tres grupos
 a = [85, 86, 88, 75, 78, 94, 98, 79, 71, 80]
b = [91, 92, 93, 90, 97, 94, 82, 88, 95, 96]
c = [79, 78, 88, 94, 92, 85, 83, 85, 82, 81]

# realizar ANOVA
 unidireccional f_oneway (a, b, c)

F_onewayResult (estadística = 5.167774552944481, pvalue = 0.012582197136592609)

Podemos ver que el valor p general de la tabla ANOVA es 0.01258 .

Dado que esto es menor que .05, tenemos evidencia suficiente para decir que los valores medios en cada grupo no son iguales.

Por lo tanto, podemos proceder a realizar la prueba de Tukey para determinar exactamente qué medias de grupo son diferentes.

Paso 3: Realice la prueba de Tukey

Para realizar la prueba de Tukey en Python, podemos usar la función pairwise_tukeyhsd () de la biblioteca statsmodels :

#create DataFrame para contener datos
 df = pd. DataFrame ({'puntuación': [85, 86, 88, 75, 78, 94, 98, 79, 71, 80,
                             91, 92, 93, 90, 97, 94, 82, 88, 95, 96,
                             79, 78, 88, 94, 92, 85, 83, 85, 82, 81],
                   'grupo': np. repetir (['a', 'b', 'c'], repeats = 10 )})

# realizar la prueba de Tukey
 tukey = pairwise_tukeyhsd (endog = df ['score'],
                          grupos = df ['grupo'],
                          alfa = 0,05 )

# mostrar resultados
 imprimir (tukey)

 Comparación múltiple de medias - Tukey HSD, FWER = 0.05 
================================================ ===
grupo1 grupo2 meandiff p-adj inferior superior rechazo
-------------------------------------------------- ---
     ab 8.4 0.0158 1.4272 15.3728 Verdadero
     ac 1.3 0.8864 -5.6728 8.2728 Falso
     bc -7.1 0.0453 -14.0728 -0.1272 Verdadero
-------------------------------------------------- ---

A continuación, se explica cómo interpretar la salida:

  • Valor p para la diferencia de medias entre ayb: 0,0158
  • Valor p para la diferencia de medias entre ayc : .8864
  • Valor p para la diferencia de medias entre byc: 0,0453

Por lo tanto, concluiríamos que hay una estadísticamente significativa diferencia entre las medias de los grupos a y b y los grupos b y c , pero no una diferencia estadísticamente significativa entre las medias de los grupos de una y c .

Recursos adicionales

Cómo realizar un ANOVA unidireccional en Python
Cómo realizar un ANOVA bidireccional en Python
Cómo realizar un ANOVA de medidas repetidas en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Se utiliza un coeficiente de correlación intraclase (CCI) para medir la confiabilidad de las calificaciones en los estudios donde hay…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!