Cómo calcular VIF en Excel

La multicolinealidad en el análisis de regresión ocurre cuando dos o más variables explicativas están altamente correlacionadas entre sí, de manera que no brindan información única o independiente en el modelo de regresión. Si el grado de correlación entre variables es lo suficientemente alto, puede causar problemas al ajustar e interpretar el modelo de regresión.

Afortunadamente, es posible detectar la multicolinealidad utilizando una métrica conocida como factor de inflación de la varianza (VIF) , que mide la correlación y la fuerza de la correlación entre las variables explicativas en un modelo de regresión.

Este tutorial explica cómo calcular VIF en Excel.

Ejemplo: calcular VIF en Excel

Para este ejemplo, realizaremos una regresión lineal múltiple utilizando el siguiente conjunto de datos que describe los atributos de 10 jugadores de baloncesto. Ajustaremos un modelo de regresión usando rating como variable de respuesta y puntos, asistencias y rebotes como variables explicativas. Luego, identificaremos los valores de VIF para cada variable explicativa.

Datos brutos en Excel

Paso 1: Realice una regresión lineal múltiple.

A lo largo de la cinta superior, vaya a la pestaña Datos y haga clic en Análisis de datos. Si no ve esta opción, primero debe instalar el paquete de herramientas de análisis gratuito .

Paquete de herramientas de análisis de datos en Excel

Una vez que haga clic en Análisis de datos, aparecerá una nueva ventana. Seleccione Regresión y haga clic en Aceptar.

Regresión con paquete de herramientas de análisis de datos en Excel

Complete las matrices necesarias para las variables de respuesta y las variables explicativas, luego haga clic en Aceptar.

Regresión múltiple en Excel

Esto produce la siguiente salida:

Salida de regresión en Excel

Paso 2: Calcule el VIF para cada variable explicativa.

A continuación, podemos calcular el VIF para cada una de las tres variables explicativas realizando regresiones individuales utilizando una variable explicativa como variable de respuesta y las otras dos como variables explicativas.

Por ejemplo, podemos calcular el VIF para los puntos variables realizando una regresión lineal múltiple utilizando puntos como variable de respuesta y asistencias y rebotes como variables explicativas.

Esto produce la siguiente salida:

Calcular VIF en Excel

El VIF para puntos se calcula como 1 / (1 – R Cuadrado) = 1 / (1 – .433099) = 1.76 .

Luego podemos repetir este proceso para las otras dos variables, asistencias y rebotes .

Resulta que los VIF para las tres variables explicativas son los siguientes:

puntos: 1,76
asistencias: 1,96
rebotes: 1,18

Cómo interpretar los valores de VIF

El valor de VIF comienza en 1 y no tiene límite superior. Una regla general para interpretar los VIF es la siguiente:

  • Un valor de 1 indica que no hay correlación entre una variable explicativa dada y cualquier otra variable explicativa en el modelo.
  • Un valor entre 1 y 5 indica una correlación moderada entre una variable explicativa dada y otras variables explicativas en el modelo, pero esto a menudo no es lo suficientemente grave como para requerir atención.
  • Un valor mayor que 5 indica una correlación potencialmente severa entre una variable explicativa dada y otras variables explicativas en el modelo. En este caso, las estimaciones de los coeficientes y los valores p en el resultado de la regresión probablemente no sean confiables.

Dado que cada uno de los valores de VIF para las variables explicativas en nuestro modelo de regresión está cerca de 1, la multicolinealidad no es un problema en nuestro ejemplo.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un mapa de calor es un tipo de gráfico que usa diferentes tonos de colores para representar valores de datos.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!