Varianza Explicada / Variación

Actualizado por ultima vez el 7 de agosto de 2021, por Luis Benites.

¿Qué es la varianza explicada?

La varianza explicada (también llamada variación explicada ) se usa para medir la discrepancia entre un modelo y los datos reales. En otras palabras, es la parte de la varianza total del modelo que se explica por factores que realmente están presentes y no se debe a la varianza del error .

Los porcentajes más altos de varianza explicada indican una mayor fuerza de asociación. También significa que haces mejores predicciones (Rosenthal & Rosenthal, 2011).

r 2 = R 2 = η 2

La varianza explicada se puede denotar con r 2 . En ANOVA, se llama eta cuadrado 2 ) y en análisis de regresión , se llama Coeficiente de Determinación (R 2 ). Los tres términos son básicamente sinónimos, excepto que R 2 supone que los cambios en la variable dependiente se deben a una relación lineal con la variable independiente ; Eta 2 no tiene esta suposición subyacente.

En ANOVA , la varianza explicada se calcula con la relación “ eta-squared (η 2 ) Suma de cuadrados (SS) entre SS total ; Es la proporción de varianzas para las diferencias entre grupos .

R 2 en regresión tiene una interpretación similar: qué proporción de la varianza en Y puede ser explicada por X (Warner, 2013).

Los problemas con múltiples predictores

En general, cuantas más variables predictoras agregue, mayor será la varianza explicada. La cantidad de varianza superpuesta (la varianza explicada por más de un predictor) también aumenta. Sin embargo, llega un punto de rendimientos decrecientes cuando los nuevos predictores en el modelo resultan en la incapacidad de saber qué predictor está produciendo qué resultado. Además, si agrega dos predictores altamente correlacionados a un modelo, introduce la posibilidad de multicolinealidad .

Por otro lado, agregar muy pocos predictores también puede plantear un problema: omitir una variable predictora que potencialmente pueda explicar parte de la varianza da como resultado un sesgo . Por lo tanto, se debe hacer un cuidadoso equilibrio entre demasiados predictores y muy pocos.

Referencias

Rosenthal, G. & Rosenthal, J. (2011). Estadística e Interpretación de Datos para Trabajo Social . Editorial Springer.
Warner, R. (2013). Estadística Aplicada: De Técnicas Bivariadas A Multivariadas. SABIO.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

RFM y valor para el cliente Identificar a su mejor cliente puede conducir a un mejor enfoque de marketing. RFM…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!