R múltiple vs.R-cuadrado: ¿Cuál es la diferencia?

Actualizado por ultima vez el 7 de mayo de 2021, por .

Cuando ajusta un modelo de regresión con la mayoría del software estadístico, a menudo notará los siguientes dos valores en la salida:

R múltiple: el coeficiente de correlación múltiple entre tres o más variables.

R-cuadrado: se calcula como (R múltiple) 2 y representa la proporción de la varianza en la variable de respuesta de un modelo de regresión que se puede explicar mediante las variables predictoras. Este valor varía de 0 a 1.

En la práctica, a menudo nos interesa el valor R cuadrado porque nos dice qué tan útiles son las variables predictoras para predecir el valor de la variable de respuesta.

Sin embargo, cada vez que agregamos una nueva variable de predicción al modelo, se garantiza que el R cuadrado aumentará incluso si la variable de predicción no es útil.

El R-cuadrado ajustado es una versión modificada de R-cuadrado que se ajusta al número de predictores en un modelo de regresión. Se calcula como:

R 2 ajustado = 1 – [(1-R 2 ) * (n-1) / (nk-1)]

dónde:

  • R 2 : El R 2 del modelo
  • n : el número de observaciones
  • k : el número de variables predictoras

Dado que R-cuadrado siempre aumenta a medida que agrega más predictores a un modelo, el R-cuadrado ajustado puede servir como una métrica que le dice qué tan útil es un modelo, ajustado por el número de predictores en un modelo .

Para comprender mejor cada uno de estos términos, considere el siguiente ejemplo.

Ejemplo: R múltiple, R al cuadrado y R al cuadrado ajustado

Supongamos que tenemos el siguiente conjunto de datos que contiene las siguientes tres variables para 12 estudiantes diferentes:

Supongamos que ajustamos un modelo de regresión lineal múltiple utilizando las horas de estudio y el grado actual como variables predictoras y la puntuación del examen como variable de respuesta y obtenemos el siguiente resultado:

R múltiple frente a R cuadrado

Podemos observar los valores de las siguientes tres métricas:

R múltiple: 0,978 . Esto representa la correlación múltiple entre la variable de respuesta y las dos variables predictoras.

Cuadrado R: 0,956 . Esto se calcula como (R múltiple) 2 = (0.978) 2 = 0.956. Esto nos dice que el 95,6% de la variación en los puntajes de los exámenes se puede explicar por la cantidad de horas dedicadas al estudio del estudiante y su calificación actual en el curso.

Cuadrado R ajustado: 0,946 . Esto se calcula como:

R 2 ajustado = 1 – [(1-R 2 ) * (n-1) / (nk-1)] = 1 – [(1-.956) * (12-1) / (12-2-1) ] = 0,946.

Esto representa el valor de R cuadrado, ajustado por el número de variables predictoras en el modelo .

Esta métrica sería útil si, digamos, ajustamos otro modelo de regresión con 10 predictores y encontramos que el R-cuadrado ajustado de ese modelo es 0,88 . Esto indicaría que el modelo de regresión con solo dos predictores es mejor porque tiene un valor de R cuadrado ajustado más alto.

Recursos adicionales

Introducción a la regresión lineal múltiple
¿Qué es un buen valor R cuadrado?

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Una forma de cuantificar la relación entre dos variables es utilizar el coeficiente de correlación de Pearson , que es…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!