Contenido de este artículo
- 0
- 0
- 0
- 0
La multicolinealidad en el análisis de regresión ocurre cuando dos o más variables explicativas están altamente correlacionadas entre sí, de manera que no brindan información única o independiente en el modelo de regresión. Si el grado de correlación entre variables es lo suficientemente alto, puede causar problemas al ajustar e interpretar el modelo de regresión.
Afortunadamente, es posible detectar la multicolinealidad utilizando una métrica conocida como factor de inflación de la varianza (VIF) , que mide la correlación y la fuerza de la correlación entre las variables explicativas en un modelo de regresión.
Este tutorial explica cómo calcular VIF en Excel.
Ejemplo: calcular VIF en Excel
Para este ejemplo, realizaremos una regresión lineal múltiple utilizando el siguiente conjunto de datos que describe los atributos de 10 jugadores de baloncesto. Ajustaremos un modelo de regresión usando rating como variable de respuesta y puntos, asistencias y rebotes como variables explicativas. Luego, identificaremos los valores de VIF para cada variable explicativa.
Paso 1: Realice una regresión lineal múltiple.
A lo largo de la cinta superior, vaya a la pestaña Datos y haga clic en Análisis de datos. Si no ve esta opción, primero debe instalar el paquete de herramientas de análisis gratuito .
Una vez que haga clic en Análisis de datos, aparecerá una nueva ventana. Seleccione Regresión y haga clic en Aceptar.
Complete las matrices necesarias para las variables de respuesta y las variables explicativas, luego haga clic en Aceptar.
Esto produce la siguiente salida:
Paso 2: Calcule el VIF para cada variable explicativa.
A continuación, podemos calcular el VIF para cada una de las tres variables explicativas realizando regresiones individuales utilizando una variable explicativa como variable de respuesta y las otras dos como variables explicativas.
Por ejemplo, podemos calcular el VIF para los puntos variables realizando una regresión lineal múltiple utilizando puntos como variable de respuesta y asistencias y rebotes como variables explicativas.
Esto produce la siguiente salida:
El VIF para puntos se calcula como 1 / (1 – R Cuadrado) = 1 / (1 – .433099) = 1.76 .
Luego podemos repetir este proceso para las otras dos variables, asistencias y rebotes .
Resulta que los VIF para las tres variables explicativas son los siguientes:
puntos: 1,76
asistencias: 1,96
rebotes: 1,18
Cómo interpretar los valores de VIF
El valor de VIF comienza en 1 y no tiene límite superior. Una regla general para interpretar los VIF es la siguiente:
- Un valor de 1 indica que no hay correlación entre una variable explicativa dada y cualquier otra variable explicativa en el modelo.
- Un valor entre 1 y 5 indica una correlación moderada entre una variable explicativa dada y otras variables explicativas en el modelo, pero esto a menudo no es lo suficientemente grave como para requerir atención.
- Un valor mayor que 5 indica una correlación potencialmente severa entre una variable explicativa dada y otras variables explicativas en el modelo. En este caso, las estimaciones de los coeficientes y los valores p en el resultado de la regresión probablemente no sean confiables.
Dado que cada uno de los valores de VIF para las variables explicativas en nuestro modelo de regresión está cerca de 1, la multicolinealidad no es un problema en nuestro ejemplo.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: