Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 17 de julio de 2024, por Luis Benites.
A menudo usamos tres valores de suma de cuadrados diferentes para medir qué tan bien una línea de regresión realmente se ajusta a un conjunto de datos:
1. Suma de cuadrados totales (SST): la suma de las diferencias cuadradas entre los puntos de datos individuales (y i ) y la media de la variable de respuesta ( y ).
- SST = Σ (y i – y ) 2
2. Regresión de la suma de cuadrados (SSR) : la suma de las diferencias cuadradas entre los puntos de datos predichos (ŷ i ) y la media de la variable de respuesta ( y ).
- SSR = Σ (ŷ i – y ) 2
3. Error de suma de cuadrados (SSE) : la suma de las diferencias cuadradas entre los puntos de datos predichos (ŷ i ) y los puntos de datos observados (y i ).
- SSE = Σ (ŷ i – y i ) 2
El siguiente ejemplo paso a paso muestra cómo calcular cada una de estas métricas para un modelo de regresión determinado en Excel.
Paso 1: crear los datos
Primero, creemos un conjunto de datos que contenga la cantidad de horas estudiadas y el puntaje del examen recibido por 20 estudiantes diferentes en una escuela determinada:
Paso 2: ajustar un modelo de regresión
A lo largo de la cinta superior en Excel, haga clic en la pestaña Datos y haga clic en Análisis de datos . Si no ve esta opción, primero debe instalar el paquete de herramientas de análisis gratuito .
Una vez que haga clic en Análisis de datos, aparecerá una nueva ventana. Seleccione Regresión y haga clic en Aceptar.
En la nueva ventana que aparece, complete la siguiente información:
Una vez que haga clic en Aceptar , aparecerá el resultado de la regresión.
Paso 3: analizar el resultado
Las tres métricas de suma de cuadrados (SST, SSR y SSE) se pueden ver en la columna SS de la tabla ANOVA :
Las métricas resultan ser:
- Suma de cuadrados total (SST): 1248,55
- Regresión de suma de cuadrados (SSR): 917,4751
- Error de suma de cuadrados (SSE): 331.0749
Podemos verificar que SST = SSR + SSE:
- SST = SSR + SSE
- 1248.55 = 917.4751 + 331.0749
También podemos calcular manualmente el R cuadrado del modelo de regresión:
- R-cuadrado = SSR / SST
- R-cuadrado = 917,4751 / 1248,55
- R-cuadrado = 0,7348
Esto nos dice que el 73,48% de la variación en los puntajes de los exámenes se puede explicar por el número de horas estudiadas.
Recursos adicionales
Cómo realizar una regresión lineal simple en Excel
Cómo realizar una regresión lineal múltiple en Excel
Cómo realizar una regresión polinomial en Excel
Cómo realizar una regresión exponencial en Excel
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: