Prueba de Brown-Forsythe en R: ejemplo paso a paso

Se utiliza un ANOVA de una vía para determinar si existe o no una diferencia significativa entre las medias de tres o más grupos independientes.

Uno de los supuestos de un ANOVA de una vía es que las varianzas de las poblaciones de las que provienen las muestras son iguales.

Una de las formas más comunes de probar esto es mediante la prueba de Brown-Forsythe , que es una prueba estadística que utiliza las siguientes hipótesis :

  • H 0 : Las variaciones entre las poblaciones son iguales.
  • H A : Las variaciones entre las poblaciones no son iguales.

Si el valor p de la prueba es menor que algún nivel de significancia (por ejemplo, α = .05), entonces rechazamos la hipótesis nula y concluimos que las varianzas no son iguales entre las diferentes poblaciones.

Este tutorial proporciona un ejemplo paso a paso de cómo realizar una prueba de Brown-Forsythe en R.

Paso 1: ingrese los datos

Suponga que nos gustaría saber si tres programas de entrenamiento diferentes conducen a diferentes niveles de pérdida de peso.

Para probar esto, reclutamos a 90 personas y asignamos al azar a 30 para usar cada programa. Luego medimos la pérdida de peso de cada persona después de un mes.

El siguiente conjunto de datos contiene información sobre cuánto peso perdieron las personas en cada programa:

#Haga que este ejemplo sea reproducible
 set.seed (0)

#create data frame
 data <- data.frame (programa = as . factor ( rep (c (" A ", " B ", " C "), cada uno = 30)),
                   pérdida_peso = c ( runif (30, 0, 3),
                                    runif (30, 0, 5),
                                    runif (30, 1, 7)))

#ver las primeras seis filas del encabezado del marco de datos
 (datos)

# program weight_loss
# 1 A 2.6900916
# 2 A 0,7965260
# 3 A 1.1163717
# 4 A 1.7185601
# 5 A 2.7246234
# 6 A 0.6050458

Paso 2: resumir y visualizar los datos

Antes de realizar una prueba de Brown-Forsythe, podemos crear diagramas de caja para visualizar la varianza de la pérdida de peso para cada grupo:

diagrama de caja (programa de pérdida de peso ~, datos = datos)

También podemos calcular la varianza de la pérdida de peso en cada grupo:

#cargar 
biblioteca de paquetes dplyr (dplyr)

#calcular la varianza de la pérdida de peso por grupo de
 datos%>%
   group_by (programa)%>%
   resumir (var = var (weight_loss))

# A tibble: 3 x 2
  programa var
     
1 A 0,819
2 B 1,53 
3 C 2,46 

Podemos ver que las varianzas entre los grupos difieren, pero para determinar si estas diferencias son estadísticamente significativas podemos realizar la prueba de Brown-Forsythe.

Paso 3: Realice la prueba Brown-Forsythe

Para realizar una prueba de Brown-Forsythe en R, podemos usar la función bf.test () del paquete onewaytests :

#cargar 
biblioteca de paquetes onewaytests (onewaytests)

#realice la prueba de Brown-Forsythe
bf.test (programa de pérdida de peso ~, datos = datos)

  Prueba de Brown-Forsythe (alfa = 0,05) 
-------------------------------------------------- ----------- 
  datos: peso_pérdida y programa 

  estadística: 30.83304 
  núm df: 2 
  denom df: 74.0272 
  p. valor: 1.816529e-10 

  Resultado: la diferencia es estadísticamente significativa. 
-------------------------------------------------- ----------- 

El valor p de la prueba resulta ser menor que 0,000 y, como declara el resultado, las diferencias en las varianzas entre los tres grupos son estadísticamente significativas.

Próximos pasos

Si no rechaza la hipótesis nula de la prueba de Brown-Forsythe, puede proceder a realizar un ANOVA unidireccional en los datos.

Sin embargo, si rechaza la hipótesis nula, esto significa que se viola el supuesto de varianzas iguales. En este caso, tiene dos opciones:

1. Continúe con un ANOVA unidireccional de todos modos.

Resulta que un ANOVA unidireccional es realmente robusto a variaciones desiguales siempre que la variación más grande no sea mayor que 4 veces la variación más pequeña.

En el paso 2 del ejemplo anterior, encontramos que la varianza más pequeña era 0,819 y la varianza más grande era 2,46. Por lo tanto, la relación de la más grande a la variación más pequeña es de 2,46 / 0.819 = 3.003 .

Dado que este valor es menor que 4, simplemente podríamos proceder con el ANOVA de una vía.

2. Realice una prueba de Kruskal-Wallis

Si la relación entre la varianza más grande y la varianza más pequeña es mayor que 4, podemos optar por realizar una prueba de Kruskal-Wallis . Esto se considera el equivalente no paramétrico del ANOVA de una vía.

Puede encontrar un ejemplo paso a paso de una prueba de Kruskal-Wallis en R aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La regresión logarítmica es un tipo de regresión que se utiliza para modelar situaciones en las que el crecimiento o…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!