Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
El coeficiente de determinación (comúnmente denominado R 2 ) es la proporción de la varianza en la variable de respuesta que puede explicarse por las variables explicativas en un modelo de regresión.
Este tutorial proporciona un ejemplo de cómo encontrar e interpretar R 2 en un modelo de regresión en R.
Relacionado: ¿Qué es un buen valor R cuadrado?
Ejemplo: encontrar e interpretar R-cuadrado en R
Supongamos que tenemos el siguiente conjunto de datos que contiene datos sobre la cantidad de horas estudiadas, los exámenes de preparación realizados y la puntuación del examen recibida para 15 estudiantes:
#create marco de datos df <- data.frame (horas = c (1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3), exámenes_preparación = c (1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4), puntuación = c (76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82)) #ver las primeras seis filas del marco de datos cabeza (df) horas puntuación de prep_exams 1 1 1 76 2 2 3 78 3 2 3 85 4 4 5 88 5 2 2 72 6 1 2 69
El siguiente código muestra cómo ajustar un modelo de regresión lineal múltiple a este conjunto de datos y ver el resultado del modelo en R:
#fit modelo de regresión modelo <- lm (puntuación ~ horas + prep_exams, data = df) #ver resumen del modelo resumen (modelo) Llamada: lm (fórmula = puntuación ~ horas + exámenes_preparación, datos = gl) Derechos residuales de autor: Mín. 1T Mediana 3T Máx. -7,9896 -2,5514 0,3079 3,3370 7,0352 Coeficientes: Estimar Std. Valor t de error Pr (> | t |) (Intercepción) 71.8078 3.5222 20.387 1.12e-10 *** horas 5.0247 0.8964 5.606 0.000115 *** prep_exams -1.2975 0.9689 -1.339 0.205339 --- Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1 Error estándar residual: 4.944 en 12 grados de libertad R cuadrado múltiple: 0,7237, R cuadrado ajustado: 0,6776 Estadístico F: 15,71 en 2 y 12 DF, valor de p: 0,0004454
El R-cuadrado del modelo (que se muestra cerca de la parte inferior de la salida) resulta ser 0,7237 .
Esto significa que el 72,37% de la variación en los puntajes de los exámenes puede explicarse por el número de horas estudiadas y el número de exámenes de preparación realizados.
Tenga en cuenta que también puede acceder a este valor mediante la siguiente sintaxis:
resumen (modelo) $ r.squared [1] 0,7236545
Cómo interpretar el valor R cuadrado
Un valor de R cuadrado siempre variará entre 0 y 1.
Un valor de 1 indica que las variables explicativas pueden explicar perfectamente la varianza en la variable de respuesta y un valor de 0 indica que las variables explicativas no tienen capacidad para explicar la varianza en la variable de respuesta.
En general, cuanto mayor sea el valor R cuadrado de un modelo de regresión, mejor podrán predecir las variables explicativas el valor de la variable de respuesta.
Consulte este artículo para obtener detalles sobre cómo determinar si un valor de R cuadrado dado se considera «bueno» para un modelo de regresión dado.
Relacionado Cómo calcular R-cuadrado ajustado en R
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: