Cómo encontrar el coeficiente de determinación (R-cuadrado) en R

Actualizado por ultima vez el 7 de mayo de 2021, por .

El coeficiente de determinación (comúnmente denominado R 2 ) es la proporción de la varianza en la variable de respuesta que puede explicarse por las variables explicativas en un modelo de regresión.

Este tutorial proporciona un ejemplo de cómo encontrar e interpretar R 2 en un modelo de regresión en R.

Relacionado: ¿Qué es un buen valor R cuadrado?

Ejemplo: encontrar e interpretar R-cuadrado en R

Supongamos que tenemos el siguiente conjunto de datos que contiene datos sobre la cantidad de horas estudiadas, los exámenes de preparación realizados y la puntuación del examen recibida para 15 estudiantes:

#create marco de datos
df <- data.frame (horas = c (1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3),
                 exámenes_preparación = c (1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4),
                 puntuación = c (76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82))

#ver las primeras seis filas del marco de datos
cabeza (df)

  horas puntuación de prep_exams
1 1 1 76
2 2 3 78
3 2 3 85
4 4 5 88
5 2 2 72
6 1 2 69

El siguiente código muestra cómo ajustar un modelo de regresión lineal múltiple a este conjunto de datos y ver el resultado del modelo en R:

#fit modelo de regresión
modelo <- lm (puntuación ~ horas + prep_exams, data = df)

#ver resumen del modelo
resumen (modelo)

Llamada:
lm (fórmula = puntuación ~ horas + exámenes_preparación, datos = gl)

Derechos residuales de autor:
    Mín. 1T Mediana 3T Máx. 
-7,9896 -2,5514 0,3079 3,3370 7,0352 

Coeficientes:
            Estimar Std. Valor t de error Pr (> | t |)    
(Intercepción) 71.8078 3.5222 20.387 1.12e-10 ***
horas 5.0247 0.8964 5.606 0.000115 ***
prep_exams -1.2975 0.9689 -1.339 0.205339    
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 4.944 en 12 grados de libertad
R cuadrado múltiple: 0,7237, R cuadrado ajustado: 0,6776 
Estadístico F: 15,71 en 2 y 12 DF, valor de p: 0,0004454

El R-cuadrado del modelo (que se muestra cerca de la parte inferior de la salida) resulta ser 0,7237 .

Esto significa que el 72,37% de la variación en los puntajes de los exámenes puede explicarse por el número de horas estudiadas y el número de exámenes de preparación realizados.

Tenga en cuenta que también puede acceder a este valor mediante la siguiente sintaxis:

resumen (modelo) $ r.squared

[1] 0,7236545

Cómo interpretar el valor R cuadrado

Un valor de R cuadrado siempre variará entre 0 y 1.

Un valor de 1 indica que las variables explicativas pueden explicar perfectamente la varianza en la variable de respuesta y un valor de 0 indica que las variables explicativas no tienen capacidad para explicar la varianza en la variable de respuesta.

En general, cuanto mayor sea el valor R cuadrado de un modelo de regresión, mejor podrán predecir las variables explicativas el valor de la variable de respuesta.

Consulte este artículo para obtener detalles sobre cómo determinar si un valor de R cuadrado dado se considera «bueno» para un modelo de regresión dado.

Relacionado Cómo calcular R-cuadrado ajustado en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un ANOVA anidado es un tipo de ANOVA ("análisis de varianza") en el que al menos un factor está anidado…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!