Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 7 de mayo de 2021, por Luis Benites.
Cuando ajusta un modelo de regresión con la mayoría del software estadístico, a menudo notará los siguientes dos valores en la salida:
R múltiple: el coeficiente de correlación múltiple entre tres o más variables.
R-cuadrado: se calcula como (R múltiple) 2 y representa la proporción de la varianza en la variable de respuesta de un modelo de regresión que se puede explicar mediante las variables predictoras. Este valor varía de 0 a 1.
En la práctica, a menudo nos interesa el valor R cuadrado porque nos dice qué tan útiles son las variables predictoras para predecir el valor de la variable de respuesta.
Sin embargo, cada vez que agregamos una nueva variable de predicción al modelo, se garantiza que el R cuadrado aumentará incluso si la variable de predicción no es útil.
El R-cuadrado ajustado es una versión modificada de R-cuadrado que se ajusta al número de predictores en un modelo de regresión. Se calcula como:
R 2 ajustado = 1 – [(1-R 2 ) * (n-1) / (nk-1)]
dónde:
- R 2 : El R 2 del modelo
- n : el número de observaciones
- k : el número de variables predictoras
Dado que R-cuadrado siempre aumenta a medida que agrega más predictores a un modelo, el R-cuadrado ajustado puede servir como una métrica que le dice qué tan útil es un modelo, ajustado por el número de predictores en un modelo .
Para comprender mejor cada uno de estos términos, considere el siguiente ejemplo.
Ejemplo: R múltiple, R al cuadrado y R al cuadrado ajustado
Supongamos que tenemos el siguiente conjunto de datos que contiene las siguientes tres variables para 12 estudiantes diferentes:
Supongamos que ajustamos un modelo de regresión lineal múltiple utilizando las horas de estudio y el grado actual como variables predictoras y la puntuación del examen como variable de respuesta y obtenemos el siguiente resultado:
Podemos observar los valores de las siguientes tres métricas:
R múltiple: 0,978 . Esto representa la correlación múltiple entre la variable de respuesta y las dos variables predictoras.
Cuadrado R: 0,956 . Esto se calcula como (R múltiple) 2 = (0.978) 2 = 0.956. Esto nos dice que el 95,6% de la variación en los puntajes de los exámenes se puede explicar por la cantidad de horas dedicadas al estudio del estudiante y su calificación actual en el curso.
Cuadrado R ajustado: 0,946 . Esto se calcula como:
R 2 ajustado = 1 – [(1-R 2 ) * (n-1) / (nk-1)] = 1 – [(1-.956) * (12-1) / (12-2-1) ] = 0,946.
Esto representa el valor de R cuadrado, ajustado por el número de variables predictoras en el modelo .
Esta métrica sería útil si, digamos, ajustamos otro modelo de regresión con 10 predictores y encontramos que el R-cuadrado ajustado de ese modelo es 0,88 . Esto indicaría que el modelo de regresión con solo dos predictores es mejor porque tiene un valor de R cuadrado ajustado más alto.
Recursos adicionales
Introducción a la regresión lineal múltiple
¿Qué es un buen valor R cuadrado?
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: