Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión.
Se calcula como:
Residual = Valor observado – Valor previsto
Una forma de comprender qué tan bien se ajusta un modelo de regresión a un conjunto de datos es calcular la suma de cuadrados residual , que se calcula como:
Suma de cuadrados residual = Σ (e i ) 2
dónde:
- Σ : un símbolo griego que significa «suma»
- e i : El i- ésimo residuo
Cuanto menor sea el valor, mejor se ajustará un modelo a un conjunto de datos.
Podemos calcular fácilmente la suma de cuadrados residual para un modelo de regresión en R utilizando uno de los dos métodos siguientes:
#build modelo de regresión modelo <- lm (y ~ x1 + x2 + ..., datos = df) # calcular la suma residual de cuadrados (método 1) desviación (modelo) # calcular la suma residual de cuadrados (método 2) suma (resid (modelo) ^ 2)
Ambos métodos producirán exactamente los mismos resultados.
El siguiente ejemplo muestra cómo utilizar estas funciones en la práctica.
Ejemplo: cálculo de la suma residual de cuadrados en R
Para este ejemplo, usaremos el conjunto de datos mtcars integrado en R:
#ver las primeras seis filas del conjunto de datos mtcars cabeza (mtcars) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21,0 6160110 3,90 2,620 16,46 0 1 4 4 Mazda RX4 Wag 21.0 6160110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22,8 4108 93 3,85 2,320 18,61 1 1 4 1 Hornet 4 Impulso 21,4 6258110 3,08 3,215 19,44 1 0 3 1 Hornet Sportabout 18,7 8360175 3,15 3,440 17,02 0 0 3 2 Valiente 18,1 6225105 2,76 3,460 20,22 1 0 3 1
El siguiente código muestra cómo ajustar un modelo de regresión lineal múltiple para este conjunto de datos y calcular la suma de cuadrados residual del modelo:
#construir modelo de modelo de regresión lineal múltiple <- lm (mpg ~ wt + hp, data = mtcars) # calcular la suma residual de cuadrados (método 1) desviación (modelo) [1] 195.0478 # calcular la suma residual de cuadrados (método 2) suma (resid (modelo) ^ 2) [1] 195.0478
Podemos ver que la suma de cuadrados residual resulta ser 195.0478 .
Si tenemos dos modelos en competencia, podemos calcular la suma de cuadrados residual de ambos para determinar cuál se ajusta mejor a los datos:
#construir dos modelos diferentes model1 <- lm (mpg ~ wt + hp, data = mtcars) model2 <- lm (mpg ~ wt + disp, datos = mtcars) # calcular la suma residual de cuadrados para la desviación de ambos modelos (modelo1) [1] 195.0478 desviación (modelo2) [1] 246,6825
Podemos ver que la suma de cuadrados residual para el modelo 1 es menor, lo que indica que se ajusta mejor a los datos que el modelo 2.
Podemos confirmar esto calculando el R cuadrado de cada modelo:
#construir dos modelos diferentes model1 <- lm (mpg ~ wt + hp, data = mtcars) model2 <- lm (mpg ~ wt + disp, datos = mtcars) # calcular R-cuadrado para ambos modelos resumen (modelo1) $ r.squared [1] 0.8267855 resumen (modelo2) $ r.squared [1] 0,7809306
El R cuadrado para el modelo 1 resulta ser más alto, lo que indica que puede explicar más la varianza en los valores de respuesta en comparación con el modelo 2.
Recursos adicionales
Cómo realizar una regresión lineal simple en R
Cómo realizar una regresión lineal múltiple en R
Calculadora de suma de cuadrados residual
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: