Cómo calcular la suma residual de cuadrados en R

Actualizado por ultima vez el 7 de mayo de 2021, por .

Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión.

Se calcula como:

Residual = Valor observado – Valor previsto

Una forma de comprender qué tan bien se ajusta un modelo de regresión a un conjunto de datos es calcular la suma de cuadrados residual , que se calcula como:

Suma de cuadrados residual = Σ (e i ) 2

dónde:

  • Σ : un símbolo griego que significa «suma»
  • e i : El i- ésimo residuo

Cuanto menor sea el valor, mejor se ajustará un modelo a un conjunto de datos.

Podemos calcular fácilmente la suma de cuadrados residual para un modelo de regresión en R utilizando uno de los dos métodos siguientes:

#build modelo de regresión
modelo <- lm (y ~ x1 + x2 + ..., datos = df)

# calcular la suma residual de cuadrados (método 1)
 desviación (modelo)

# calcular la suma residual de cuadrados (método 2)
suma (resid (modelo) ^ 2)

Ambos métodos producirán exactamente los mismos resultados.

El siguiente ejemplo muestra cómo utilizar estas funciones en la práctica.

Ejemplo: cálculo de la suma residual de cuadrados en R

Para este ejemplo, usaremos el conjunto de datos mtcars integrado en R:

#ver las primeras seis filas del conjunto de datos mtcars
cabeza (mtcars)

                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21,0 6160110 3,90 2,620 16,46 0 1 4 4
Mazda RX4 Wag 21.0 6160110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22,8 4108 93 3,85 2,320 18,61 1 1 4 1
Hornet 4 Impulso 21,4 6258110 3,08 3,215 19,44 1 0 3 1
Hornet Sportabout 18,7 8360175 3,15 3,440 17,02 0 0 3 2
Valiente 18,1 6225105 2,76 3,460 20,22 1 0 3 1

El siguiente código muestra cómo ajustar un modelo de regresión lineal múltiple para este conjunto de datos y calcular la suma de cuadrados residual del modelo:

#construir modelo de modelo de regresión lineal múltiple
 <- lm (mpg ~ wt + hp, data = mtcars)

# calcular la suma residual de cuadrados (método 1)
 desviación (modelo)

[1] 195.0478

# calcular la suma residual de cuadrados (método 2)
 suma (resid (modelo) ^ 2)

[1] 195.0478

Podemos ver que la suma de cuadrados residual resulta ser 195.0478 .

Si tenemos dos modelos en competencia, podemos calcular la suma de cuadrados residual de ambos para determinar cuál se ajusta mejor a los datos:

#construir dos modelos diferentes
 model1 <- lm (mpg ~ wt + hp, data = mtcars)
model2 <- lm (mpg ~ wt + disp, datos = mtcars)

# calcular la suma residual de cuadrados para la desviación de ambos modelos
 (modelo1)

[1] 195.0478

desviación (modelo2)

[1] 246,6825 

Podemos ver que la suma de cuadrados residual para el modelo 1 es menor, lo que indica que se ajusta mejor a los datos que el modelo 2.

Podemos confirmar esto calculando el R cuadrado de cada modelo:

#construir dos modelos diferentes
 model1 <- lm (mpg ~ wt + hp, data = mtcars)
model2 <- lm (mpg ~ wt + disp, datos = mtcars)

# calcular R-cuadrado para ambos modelos
 resumen (modelo1) $ r.squared

[1] 0.8267855
resumen (modelo2) $ r.squared

[1] 0,7809306

El R cuadrado para el modelo 1 resulta ser más alto, lo que indica que puede explicar más la varianza en los valores de respuesta en comparación con el modelo 2.

Recursos adicionales

Cómo realizar una regresión lineal simple en R
Cómo realizar una regresión lineal múltiple en R
Calculadora de suma de cuadrados residual

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Una variable de criterio es simplemente otro nombre para una variable dependiente o una variable de respuesta . Esta es…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!