Cómo realizar la prueba de Tukey en R

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Se utiliza un ANOVA de una vía para determinar si existe o no una diferencia estadísticamente significativa entre las medias de tres o más grupos independientes.

Si el valor p general de la tabla ANOVA es menor que algún nivel de significancia, entonces tenemos evidencia suficiente para decir que al menos una de las medias de los grupos es diferente de las otras.

Sin embargo, esto no nos dice qué grupos son diferentes entre sí. Simplemente nos dice que no todas las medias del grupo son iguales. Para saber exactamente qué grupos son diferentes entre sí, debemos realizar una prueba post hoc .

Una de las pruebas post hoc más utilizadas es la prueba de Tukey , que nos permite hacer comparaciones por pares entre las medias de cada grupo mientras se controla la tasa de error familiar .

Este tutorial explica cómo realizar la prueba de Tukey en R.

Nota: Si uno de los grupos de su estudio se considera un grupo de control, debe utilizar la prueba de Dunnett como prueba post-hoc.

Ejemplo: prueba de Tukey en R

Paso 1: ajuste el modelo ANOVA.

El siguiente código muestra cómo crear un conjunto de datos falso con tres grupos (A, B y C) y ajustar un modelo ANOVA unidireccional a los datos para determinar si los valores medios de cada grupo son iguales:

#Haga que este ejemplo sea reproducible
set.seed (0)

#create data 
data <- data.frame (grupo = rep (c ("A", "B", "C"), cada uno = 30),
                   valores = c (runif (30, 0, 3),
                                   runif (30, 0, 5),
                                   runif (30, 1, 7)))

#ver las primeras seis filas de datos
cabeza (datos)

  valores de grupo
1 A 2.6900916
2 A 0,7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0,6050458

# ajustar modelo de 
modelo ANOVA unidireccional <- aov (valores ~ grupo, datos = datos)

#ver el resumen de salida del modelo
 (modelo)

            Df Suma Sq Valor medio Sq F Pr (> F)    
grupo 2 98,93 49,46 30,83 7,55e-11 ***
Residuos 87139,57 1,60                     
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Podemos ver que el valor p general de la tabla ANOVA es 7.55e-11 . Dado que esto es menor que .05, tenemos evidencia suficiente para decir que los valores medios en cada grupo no son iguales. Por lo tanto, podemos proceder a realizar la prueba de Tukey para determinar exactamente qué medias de grupo son diferentes.

Paso 2: Realice la prueba de Tukey.

El siguiente código muestra cómo utilizar la función TukeyHSD () para realizar la prueba de Tukey:

# realizar la prueba de Tukey
 TukeyHSD (modelo, conf.level = .95 )

  Comparaciones múltiples de medias de Tukey
    95% de nivel de confianza familiar

Ajustar: aov (fórmula = valores ~ grupo, datos = datos)

$ grupo
         diff lwr upr p adj
BA 0,9777414 0,1979466 1,757536 0,0100545
CA 2,5454024 1,7656076 3,325197 0,0000000
CB 1,5676610 0,7878662 2,347456 0,0000199

El valor p indica si existe o no una diferencia estadísticamente significativa entre cada programa. Podemos ver en el resultado que hay una diferencia estadísticamente significativa entre la pérdida de peso promedio de cada programa al nivel de significancia de 0.05.

En particular:

  • Valor p para la diferencia de medias entre B y A: .0100545
  • Valor p para la diferencia de medias entre C y A: .0000000
  • Valor p para la diferencia de medias entre C y B: .0000199

Paso 3: Visualiza los resultados.

Podemos usar la función plot (TukeyHSD ()) para visualizar también los intervalos de confianza:

#plot 
gráfico de intervalos de confianza (TukeyHSD (modelo, nivel conf. = .95 ), las = 2 )

Nota: El argumento las especifica que las etiquetas de las marcas de graduación deben ser perpendiculares (las = 2) al eje.

Prueba de Tukey en R

Podemos ver que ninguno de los intervalos de confianza para el valor medio entre grupos contiene el valor cero, lo que indica que existe una diferencia estadísticamente significativa en la pérdida media entre los tres grupos. Esto es consistente con el hecho de que todos los valores p de nuestras pruebas de hipótesis están por debajo de 0.05.

Para este ejemplo en particular, podemos concluir lo siguiente:

  • Los valores medios del grupo C son significativamente más altos que los valores medios de los grupos A y B.
  • Los valores medios del grupo B son significativamente más altos que los valores medios del grupo A.

Recursos adicionales

Una guía para el uso de pruebas post hoc con ANOVA
Cómo realizar un ANOVA unidireccional en R
Cómo realizar un ANOVA bidireccional en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Un gráfico QQ , abreviatura de gráfico "cuantiles-cuantiles", se utiliza a menudo para evaluar si un conjunto de datos proviene…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!