Cómo calcular R-cuadrado ajustado en R

Actualizado por ultima vez el 7 de mayo de 2021, por .

R cuadrado , a menudo escrito R 2 , es la proporción de la varianza en la variable de respuesta que puede explicarse por las variables predictoras en un modelo de regresión lineal .

El valor de R-cuadrado puede oscilar entre 0 y 1. Un valor de 0 indica que la variable de respuesta no puede ser explicada por la variable de predicción en absoluto, mientras que un valor de 1 indica que la variable de respuesta puede ser explicada perfectamente sin errores por el predictor. variables.

El R-cuadrado ajustado es una versión modificada de R-cuadrado que se ajusta al número de predictores en un modelo de regresión. Se calcula como:

R 2 ajustado = 1 – [(1-R 2 ) * (n-1) / (nk-1)]

dónde:

  • R 2 : El R 2 del modelo
  • n : el número de observaciones
  • k : el número de variables predictoras

Debido a que R 2 siempre aumenta a medida que agrega más predictores a un modelo, el R 2 ajustado puede servir como una métrica que le indica qué tan útil es un modelo, ajustado por el número de predictores en un modelo .

Este tutorial explica cómo calcular R 2 ajustado para un modelo de regresión en R.

Relacionado: ¿Qué es un buen valor R cuadrado?

Ejemplo: Cómo calcular R cuadrado ajustado en R

Podemos usar el siguiente código para construir un modelo de regresión lineal múltiple en R usando el conjunto de datos incorporado llamado mtcars :

modelo <- lm (hp ~ mpg + wt + drat + qsec, data = mtcars)

Y podemos usar uno de los siguientes tres métodos para encontrar el R cuadrado ajustado del modelo:

Método 1: use la función de resumen ()

Podemos ver tanto el R cuadrado como el R cuadrado ajustado del modelo simplemente usando la función summary () :

resumen (modelo)

Llamada:
lm (fórmula = hp ~ mpg + wt + drat + qsec, data = mtcars)

Derechos residuales de autor:
    Mín. 1T Mediana 3T Máx. 
-48.801 -16.007 -5.482 11.614 97.338 

Coeficientes:
            Estimar Std. Valor t de error Pr (> | t |)    
(Intercepción) 473.779 105.213 4.503 0.000116 ***
mpg -2.877 2.381 -1.209 0.237319    
peso 26.037 13.514 1.927 0.064600.  
maldita sea 4.819 15.952 0.302 0.764910    
qsec -20.751 3.993 -5.197 1.79e-05 ***
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 32,25 en 27 grados de libertad
R cuadrado múltiple: 0,8073, R cuadrado ajustado: 0,7787 
Estadístico F: 28,27 en 4 y 27 DF, valor p: 2,647e-09

En la parte inferior de la salida podemos ver lo siguiente:

  • Múltiple R cuadrado: 0,8073
  • R cuadrado ajustado: 0,7787

Método 2: resumen de uso (modelo) $ adj.r.squared

Si simplemente quisiéramos obtener el R cuadrado ajustado del modelo, podríamos usar la siguiente función:

resumen (modelo) $ adj.r.squared

[1] 0,7787005

Método 3: usar una función personalizada

Otra forma más de encontrar el R cuadrado ajustado del modelo es escribir una función personalizada:

#define la función para calcular el R-cuadrado ajustado 
adj_r2 <- función (x) {
    return (1 - ((1-x $ adj.r.squared) * ( nobs (x) -1) / ( nobs (x) - longitud (x $ coeficientes) -1)))
}

#utilice la función para calcular el R cuadrado ajustado del modelo
 adj_r2 (modelo)

[1] 0,7787005
numérico (0)

Observe que cada uno de los tres métodos compartidos aquí dan como resultado el mismo valor para R cuadrado ajustado.

Recursos adicionales

Cómo realizar una regresión lineal simple en R
Cómo realizar una regresión lineal múltiple en R
Cómo realizar una regresión polinomial en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La forma más fácil de exportar un marco de datos a un archivo de Excel en R es usar la…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!