Contenido de este artículo
- 0
- 0
- 0
- 0
Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión .
Se calcula como:
Residual = Valor observado – Valor previsto
Si graficamos los valores observados y superponemos la línea de regresión ajustada, los residuos para cada observación serían la distancia vertical entre la observación y la línea de regresión:
Un tipo de residual que usamos a menudo para identificar valores atípicos en un modelo de regresión se conoce como residual estandarizado .
Se calcula como:
r i = e i / s (e i ) = e i / RSE√ 1-h ii
dónde:
- e i : El i- ésimo residuo
- RSE: el error estándar residual del modelo
- h ii : El apalancamiento de la i- ésima observación
En la práctica, a menudo consideramos que cualquier residuo estandarizado con un valor absoluto superior a 3 es un valor atípico.
Este tutorial proporciona un ejemplo paso a paso de cómo calcular residuos estandarizados en Excel.
Paso 1: ingrese los datos
Primero, ingresaremos los valores para un pequeño conjunto de datos en Excel:
Paso 2: Calcule los residuos
A continuación, iremos a la pestaña Datos a lo largo de la cinta superior y haremos clic en Análisis de datos dentro del grupo Análisis :
Si aún no ha instalado este complemento, consulte este tutorial sobre cómo hacerlo. Es fácil de instalar y completamente gratis.
Una vez que haya hecho clic en Análisis de datos, haga clic en la opción que dice Regresión y luego haga clic en Aceptar . En la nueva ventana que aparece, complete la siguiente información y haga clic en Aceptar :
El residual de cada observación aparecerá en la salida:
Copie y pegue estos residuos en una nueva columna junto a los datos originales:
Paso 3: Calcule el apalancamiento
A continuación, necesitamos calcular el apalancamiento de cada observación.
La siguiente imagen muestra cómo hacerlo:
Aquí están las fórmulas utilizadas en las distintas celdas:
- B14: = CONTAR (B2: B13)
- B15: = PROMEDIO (B2: B13)
- B16: = DEVSQ (B2: B13)
- E2: = 1 / $ B $ 14 + (B2- $ B $ 15) ^ 2 / $ B $ 16
Paso 4: Calcule los residuos estandarizados
Por último, podemos calcular los residuos estandarizados mediante la fórmula:
r yo = e yo / RSE√ 1-h ii
El RSE para el modelo se puede encontrar en el resultado del modelo anterior. Resulta ser 4.44 :
Por lo tanto, podemos usar la siguiente fórmula para calcular el residuo estandarizado para cada observación:
De los resultados podemos ver que ninguno de los residuales estandarizados excede un valor absoluto de 3. Por lo tanto, ninguna de las observaciones parece ser un valor atípico.
Vale la pena señalar en algunos casos que los investigadores consideran que las observaciones con residuos estandarizados que exceden un valor absoluto de 2 se consideran valores atípicos.
Depende de usted decidir si utilizar un valor absoluto de 2 o 3 como umbral para los valores atípicos, según el problema específico en el que esté trabajando.
Recursos adicionales
¿Qué son los residuos?
¿Qué son los residuos estandarizados?
Introducción a la regresión lineal múltiple
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: