Homocedasticidad / Homogeneidad de varianza / Suposición de igual varianza

Actualizado por ultima vez el 13 de marzo de 2022, por Luis Benites.

homocedasticidad

Imagen: Sreebot| Wikimedia Commons

En pocas palabras, la homocedasticidad significa «tener la misma dispersión». Para que exista en un conjunto de datos, los puntos deben estar aproximadamente a la misma distancia de la línea, como se muestra en la imagen de arriba. Lo opuesto es la heterocedasticidad («dispersión diferente»), donde los puntos están a distancias muy variables de la línea de regresión .

homocedástico.

Los puntos más altos en el eje x tienen una varianza mayor que los valores más pequeños.

Tenga en cuenta que dije «distancia» aquí y no varianza . Al ver un gráfico, es más fácil mirar las distancias desde los puntos hasta la línea para determinar si un conjunto de datos muestra homocedasticidad. Técnicamente, lo que cuenta es la varianza , y eso es lo que usaría en los cálculos. Sin embargo, como la varianza requiere una fórmula, es imposible observar un gráfico.

Fórmula de varianza.

Fórmula de varianza .

Como la varianza es solo la desviación estándar al cuadrado, también puede ver la homocedasticidad descrita como una condición en la que las desviaciones estándar son iguales para todos los puntos.

En términos más formales

Rara vez se encontrará con un conjunto de datos que tenga una varianza de cero. Es más probable que vea variaciones que oscilan entre 0,01 y 101,01. Entonces, ¿cuándo se clasifica un conjunto de datos como homocedasticidad? La regla general 1 es:

Si la relación entre la varianza más grande y la varianza más pequeña es 1,5 o menos, los datos son homocedásticos.

¿Qué es el supuesto de igual varianza?

La suposición de varianzas iguales (es decir, la suposición de homocedasticidad) asume que diferentes muestras tienen la misma varianza, incluso si provienen de diferentes poblaciones. La suposición se encuentra en muchas pruebas estadísticas, incluido el análisis de varianza (ANOVA) y la prueba T de Student . Otras pruebas, como la prueba T de Welch , no requieren varianzas iguales en absoluto.
Ejecutar una prueba sin verificar la igualdad de variaciones puede tener un impacto significativo en sus resultados e incluso puede invalidarlos por completo. La medida en que se ven afectados sus resultados depende de la prueba que utilice y de la sensibilidad de esa prueba a las varianzas desiguales. Por ejemplo, mientras que una prueba ANOVA de factor fijo con tamaños de muestra iguales solo se ve afectada en una pequeña cantidad, una prueba ANOVA con tamaños desiguales los tamaños de muestra pueden darte resultados completamente inválidos.

La suposición de varianzas iguales también se usa en la regresión lineal , que supone que los datos son homocedásticos. En términos simples, si sus datos están muy dispersos (como la forma de cono en la imagen heteroscedástica de arriba), la regresión no funcionará tan bien. Para obtener más información sobre este tema, consulte Supuestos y condiciones para la regresión .

Prueba de homogeneidad de varianza

Las pruebas que puede ejecutar para verificar que sus datos cumplan con esta suposición incluyen:

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Conclusiones clave: La distribución Dagum es una forma de modelar la distribución de la riqueza. Cuando se aplica a datos…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!