Contenido de este artículo
- 0
- 0
- 0
- 0
Se utiliza un ANOVA de una vía para determinar si existe o no una diferencia estadísticamente significativa entre las medias de tres o más grupos independientes.
Si el valor p general de la tabla ANOVA es menor que algún nivel de significancia, entonces tenemos evidencia suficiente para decir que al menos una de las medias de los grupos es diferente de las otras.
Sin embargo, esto no nos dice qué grupos son diferentes entre sí. Simplemente nos dice que no todas las medias del grupo son iguales. Para saber exactamente qué grupos son diferentes entre sí, debemos realizar una prueba post hoc .
Una de las pruebas post hoc más utilizadas es la prueba de Tukey , que nos permite hacer comparaciones por pares entre las medias de cada grupo mientras se controla la tasa de error familiar .
Este tutorial proporciona un ejemplo paso a paso de cómo realizar la prueba de Tukey en Python.
Paso 1: Cargue los paquetes y las funciones necesarios
Primero, cargaremos los paquetes y funciones necesarios en Python:
importar pandas como pd importar numpy como np desde scipy. stats import f_oneway de statsmodels. estadísticas . importación multicomp pairwise_tukeyhsd
Paso 2: ajuste el modelo ANOVA
El siguiente código muestra cómo crear un conjunto de datos falso con tres grupos (A, B y C) y ajustar un modelo ANOVA unidireccional a los datos para determinar si los valores medios de cada grupo son iguales:
#introducir datos para tres grupos a = [85, 86, 88, 75, 78, 94, 98, 79, 71, 80] b = [91, 92, 93, 90, 97, 94, 82, 88, 95, 96] c = [79, 78, 88, 94, 92, 85, 83, 85, 82, 81] # realizar ANOVA unidireccional f_oneway (a, b, c) F_onewayResult (estadística = 5.167774552944481, pvalue = 0.012582197136592609)
Podemos ver que el valor p general de la tabla ANOVA es 0.01258 .
Dado que esto es menor que .05, tenemos evidencia suficiente para decir que los valores medios en cada grupo no son iguales.
Por lo tanto, podemos proceder a realizar la prueba de Tukey para determinar exactamente qué medias de grupo son diferentes.
Paso 3: Realice la prueba de Tukey
Para realizar la prueba de Tukey en Python, podemos usar la función pairwise_tukeyhsd () de la biblioteca statsmodels :
#create DataFrame para contener datos df = pd. DataFrame ({'puntuación': [85, 86, 88, 75, 78, 94, 98, 79, 71, 80, 91, 92, 93, 90, 97, 94, 82, 88, 95, 96, 79, 78, 88, 94, 92, 85, 83, 85, 82, 81], 'grupo': np. repetir (['a', 'b', 'c'], repeats = 10 )}) # realizar la prueba de Tukey tukey = pairwise_tukeyhsd (endog = df ['score'], grupos = df ['grupo'], alfa = 0,05 ) # mostrar resultados imprimir (tukey) Comparación múltiple de medias - Tukey HSD, FWER = 0.05 ================================================ === grupo1 grupo2 meandiff p-adj inferior superior rechazo -------------------------------------------------- --- ab 8.4 0.0158 1.4272 15.3728 Verdadero ac 1.3 0.8864 -5.6728 8.2728 Falso bc -7.1 0.0453 -14.0728 -0.1272 Verdadero -------------------------------------------------- ---
A continuación, se explica cómo interpretar la salida:
- Valor p para la diferencia de medias entre ayb: 0,0158
- Valor p para la diferencia de medias entre ayc : .8864
- Valor p para la diferencia de medias entre byc: 0,0453
Por lo tanto, concluiríamos que hay una estadísticamente significativa diferencia entre las medias de los grupos a y b y los grupos b y c , pero no una diferencia estadísticamente significativa entre las medias de los grupos de una y c .
Recursos adicionales
Cómo realizar un ANOVA unidireccional en Python
Cómo realizar un ANOVA bidireccional en Python
Cómo realizar un ANOVA de medidas repetidas en Python
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: