Cómo calcular SST, SSR y SSE en Excel

Actualizado por ultima vez el 7 de mayo de 2021, por .

A menudo usamos tres valores de suma de cuadrados diferentes para medir qué tan bien una línea de regresión realmente se ajusta a un conjunto de datos:

1. Suma de cuadrados totales (SST): la suma de las diferencias cuadradas entre los puntos de datos individuales (y i ) y la media de la variable de respuesta ( y ).

  • SST = Σ (y iy ) 2

2. Regresión de la suma de cuadrados (SSR) : la suma de las diferencias cuadradas entre los puntos de datos predichos (ŷ i ) y la media de la variable de respuesta ( y ).

  • SSR = Σ (ŷ iy ) 2

3. Error de suma de cuadrados (SSE) : la suma de las diferencias cuadradas entre los puntos de datos predichos (ŷ i ) y los puntos de datos observados (y i ).

  • SSE = Σ (ŷ i – y i ) 2

El siguiente ejemplo paso a paso muestra cómo calcular cada una de estas métricas para un modelo de regresión determinado en Excel.

HOLA, estas en Statologos la enciclopedia más grande de estadística aplicada en español, no olvides que tienes un potente buscador de información en el menú utilizalo sabiamente 😉

Paso 1: crear los datos

Primero, creemos un conjunto de datos que contenga la cantidad de horas estudiadas y el puntaje del examen recibido por 20 estudiantes diferentes en una escuela determinada:

Paso 2: ajustar un modelo de regresión

A lo largo de la cinta superior en Excel, haga clic en la pestaña Datos y haga clic en Análisis de datos . Si no ve esta opción, primero debe instalar el paquete de herramientas de análisis gratuito .

Opción de análisis de datos en Excel

Una vez que haga clic en Análisis de datos, aparecerá una nueva ventana. Seleccione Regresión y haga clic en Aceptar.

En la nueva ventana que aparece, complete la siguiente información:

Una vez que haga clic en Aceptar , aparecerá el resultado de la regresión.

Paso 3: analizar el resultado

Las tres métricas de suma de cuadrados (SST, SSR y SSE) se pueden ver en la columna SS de la tabla ANOVA :

SST, SSR y SSE en Excel

Las métricas resultan ser:

  • Suma de cuadrados total (SST): 1248,55
  • Regresión de suma de cuadrados (SSR): 917,4751
  • Error de suma de cuadrados (SSE): 331.0749

Podemos verificar que SST = SSR + SSE:

  • SST = SSR + SSE
  • 1248.55 = 917.4751 + 331.0749

También podemos calcular manualmente el R cuadrado del modelo de regresión:

  • R-cuadrado = SSR / SST
  • R-cuadrado = 917,4751 / 1248,55
  • R-cuadrado = 0,7348

Esto nos dice que el 73,48% de la variación en los puntajes de los exámenes se puede explicar por el número de horas estudiadas.

Recursos adicionales

Cómo realizar una regresión lineal simple en Excel
Cómo realizar una regresión lineal múltiple en Excel
Cómo realizar una regresión polinomial en Excel
Cómo realizar una regresión exponencial en Excel

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Ocasionalmente, es posible que desee agregar una matriz NumPy como una nueva columna a un DataFrame de pandas. Afortunadamente, puede…
statologos comunidad-2

You have Successfully Subscribed!