▷ Varianza Explicada / Variación en 2024 → STATOLOGOS®

Actualizado por ultima vez el 7 de agosto de 2021, por Luis Benites.

¿Qué es la varianza explicada?

La varianza explicada (también llamada variación explicada ) se usa para medir la discrepancia entre un modelo y los datos reales. En otras palabras, es la parte de la varianza total del modelo que se explica por factores que realmente están presentes y no se debe a la varianza del error .

Los porcentajes más altos de varianza explicada indican una mayor fuerza de asociación. También significa que haces mejores predicciones (Rosenthal & Rosenthal, 2011).

r ² = R ² = η ²

La varianza explicada se puede denotar con r ² . En ANOVA, se llama eta cuadrado (η ² ) y en análisis de regresión , se llama Coeficiente de Determinación (R ² ). Los tres términos son básicamente sinónimos, excepto que R ² supone que los cambios en la variable dependiente se deben a una relación lineal con la variable independiente ; Eta ² no tiene esta suposición subyacente.

En ANOVA , la varianza explicada se calcula con la relación “ eta-squared (η ² ) ” Suma de cuadrados (SS) _entre SS _total ; Es la proporción de varianzas para las diferencias entre grupos .

R ² en regresión tiene una interpretación similar: qué proporción de la varianza en Y puede ser explicada por X (Warner, 2013).

Los problemas con múltiples predictores

En general, cuantas más variables predictoras agregue, mayor será la varianza explicada. La cantidad de varianza superpuesta (la varianza explicada por más de un predictor) también aumenta. Sin embargo, llega un punto de rendimientos decrecientes cuando los nuevos predictores en el modelo resultan en la incapacidad de saber qué predictor está produciendo qué resultado. Además, si agrega dos predictores altamente correlacionados a un modelo, introduce la posibilidad de multicolinealidad .

Por otro lado, agregar muy pocos predictores también puede plantear un problema: omitir una variable predictora que potencialmente pueda explicar parte de la varianza da como resultado un sesgo . Por lo tanto, se debe hacer un cuidadoso equilibrio entre demasiados predictores y muy pocos.

Referencias

Rosenthal, G. & Rosenthal, J. (2011). Estadística e Interpretación de Datos para Trabajo Social . Editorial Springer.
Warner, R. (2013). Estadística Aplicada: De Técnicas Bivariadas A Multivariadas. SABIO.

Luis Benites

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

https://statologos.com

winaycirculo@gmail.com

¿Qué es la varianza explicada?

r 2 = R 2 = η 2

Los problemas con múltiples predictores

Referencias

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!

r ² = R ² = η ²