Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión.
Se calcula como:
Residual = Valor observado – Valor previsto
Una forma de comprender qué tan bien se ajusta un modelo de regresión a un conjunto de datos es calcular la suma de cuadrados residual , que se calcula como:
Suma de cuadrados residual = Σ (e i ) 2
dónde:
- Σ : un símbolo griego que significa «suma»
- e i : El i- ésimo residuo
Cuanto menor sea el valor, mejor se ajustará un modelo a un conjunto de datos.
Este tutorial proporciona un ejemplo paso a paso de cómo calcular la suma residual de cuadrados para un modelo de regresión en Python.
Paso 1: ingrese los datos
Para este ejemplo, ingresaremos datos para la cantidad de horas dedicadas al estudio, el total de exámenes de preparación tomados y la puntuación del examen recibida por 14 estudiantes diferentes:
importar pandas como pd #create DataFrame df = pd. DataFrame ({' horas ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5], ' exámenes ': [1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4], ' puntuación ': [76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90]})
Paso 2: ajustar el modelo de regresión
A continuación, usaremos la función OLS () de la biblioteca statsmodels para realizar una regresión de mínimos cuadrados ordinarios, usando «horas» y «exámenes» como variables predictoras y «puntuación» como variable de respuesta:
importar modelos de estadísticas. api como sm #define la variable de respuesta y = df [' puntuación '] #definir variables predictoras x = df [[' horas ', ' exámenes ']] #add constante a las variables predictoras x = sm. add_constant (x) #fit modelo de regresión lineal modelo = sm. MCO (y, x). encajar () #ver impresión del resumen del modelo (modelo. resumen ()) Resultados de regresión de OLS ================================================ ============================ Dep. Variable: puntuación R cuadrado: 0,722 Modelo: OLS Adj. R cuadrado: 0,671 Método: Estadístico F de mínimos cuadrados: 14,27 Fecha: sábado, 02 de enero de 2021 Prob (estadística F): 0,000878 Hora: 15:58:35 Log-Probabilidad: -41.159 No. Observaciones: 14 AIC: 88,32 Residuos Df: 11 BIC: 90.24 Modelo Df: 2 Tipo de covarianza: no robusto ================================================ ============================ coef std err t P> | t | [0.025 0.975] -------------------------------------------------- ---------------------------- const 71,8144 3,680 19,517 0,000 63,716 79,913 horas 5.0318 0.942 5.339 0.000 2.958 7.106 exámenes -1.3186 1.063 -1.240 0.241 -3.658 1.021 ================================================ ============================ Ómnibus: 0,976 Durbin-Watson: 1,270 Problema (Ómnibus): 0,614 Jarque-Bera (JB): 0,757 Sesgo: -0,245 Prob (JB): 0,685 Curtosis: 1.971 Cond. No. 12.1 ================================================ ============================
Paso 3: Calcule la suma residual de cuadrados
Podemos usar el siguiente código para calcular la suma de cuadrados residual del modelo:
imprimir (modelo. ssr ) 293.25612951525414
La suma de cuadrados residual resulta ser 293,256 .
Recursos adicionales
Cómo realizar una regresión lineal simple en Python
Cómo realizar una regresión lineal múltiple en Python
Calculadora de suma de cuadrados residual
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: