Cómo realizar una prueba de Brown-Forsythe en Python

Se utiliza un ANOVA de una vía para determinar si existe o no una diferencia significativa entre las medias de tres o más grupos independientes.

Uno de los supuestos de un ANOVA de una vía es que las varianzas de las poblaciones de las que provienen las muestras son iguales.

Una de las formas más comunes de probar esto es mediante el uso de una prueba de Brown-Forsythe , que es una prueba estadística que utiliza las siguientes hipótesis :

  • H 0 : Las variaciones entre las poblaciones son iguales.
  • H A : Las variaciones entre las poblaciones no son iguales.

Si el valor p de la prueba es menor que algún nivel de significancia (por ejemplo, α = .05), entonces rechazamos la hipótesis nula y concluimos que las varianzas no son iguales entre las diferentes poblaciones.

Este tutorial proporciona un ejemplo paso a paso de cómo realizar una prueba de Brown-Forsythe en Python.

Paso 1: ingrese los datos

Suponga que los investigadores quieren saber si tres fertilizantes diferentes conducen a diferentes niveles de crecimiento de las plantas.

Seleccionan al azar 30 plantas diferentes y las dividen en tres grupos de 10, aplicando un fertilizante diferente a cada grupo. Al cabo de un mes miden la altura de cada planta.

Las siguientes matrices muestran la altura de las plantas en cada uno de los tres grupos:

grupo1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8]
grupo2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8]
grupo3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]

Paso 2: resumir los datos

Antes de realizar una prueba de Brown-Forsythe, podemos calcular la varianza de las medidas de la planta en cada grupo:

#import numpy 
import numpy as np

#calcular la varianza de las medidas de la planta en cada grupo
print(np.var(group1), np.var(group2), np.var(group3))

8,69 7,81 7,0

Podemos ver que las varianzas entre los grupos difieren, pero para determinar si estas diferencias son estadísticamente significativas podemos realizar la prueba de Brown-Forsythe.

Paso 3: Realice la prueba Brown-Forsythe

Para realizar una prueba de Brown-Forsythe en Python, podemos usar la función scipy.stats.levene () y especificar que el centro sea la mediana :

importar scipy.stats como estadísticas

Estadísticas. levene (grupo1, grupo2, grupo3, centro = ' mediana ')

LeveneResult (estadístico = 0.17981072555205047, pvalue = 0.8364205218185946)

Del resultado podemos observar lo siguiente:

  • Estadística de prueba: 0,1798
  • valor p: 0.8364

El valor p de la prueba resulta ser mayor que .05, por lo que no rechazamos la hipótesis nula de la prueba.

Las diferencias en las variaciones entre los grupos no son estadísticamente significativas.

Próximos pasos

Si no rechazamos la hipótesis nula de la prueba de Brown-Forsythe, entonces podemos proceder a realizar un ANOVA unidireccional sobre los datos.

Sin embargo, si rechazamos la hipótesis nula, esto indica que se viola el supuesto de varianzas iguales. En este caso, tenemos dos opciones:

1. Continúe con un ANOVA unidireccional de todos modos.

Resulta que un ANOVA unidireccional es realmente robusto a variaciones desiguales siempre que la variación más grande no sea mayor que 4 veces la variación más pequeña.

En el paso 2 del ejemplo anterior, encontramos que la varianza más pequeña fue 7.0 y la varianza más grande fue 8.69. Por lo tanto, la relación entre la varianza más grande y la más pequeña es 8,69 / 7,0 = 1,24 .

Dado que este valor es menor que 4, podríamos simplemente proceder con el ANOVA de una vía incluso si la prueba de Brown-Forsythe indicaba que las varianzas no eran iguales.

2. Realice una prueba de Kruskal-Wallis

Si la relación entre la varianza más grande y la varianza más pequeña es mayor que 4, podemos optar por realizar una prueba de Kruskal-Wallis . Esto se considera el equivalente no paramétrico del ANOVA de una vía.

Puede encontrar un ejemplo paso a paso de una prueba de Kruskal-Wallis en Python aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba t de muestras pareadas para comparar las medias de dos muestras cuando cada observación en una…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!