Cómo calcular residuos estandarizados en Excel

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión .

Se calcula como:

Residual = Valor observado – Valor previsto

Si graficamos los valores observados y superponemos la línea de regresión ajustada, los residuos para cada observación serían la distancia vertical entre la observación y la línea de regresión:

Ejemplo de residual en estadística

Un tipo de residual que usamos a menudo para identificar valores atípicos en un modelo de regresión se conoce como residual estandarizado .

Se calcula como:

r i = e i / s (e i ) = e i / RSE√ 1-h ii

dónde:

  • e i : El i- ésimo residuo
  • RSE: el error estándar residual del modelo
  • h ii : El apalancamiento de la i- ésima observación

En la práctica, a menudo consideramos que cualquier residuo estandarizado con un valor absoluto superior a 3 es un valor atípico.

Este tutorial proporciona un ejemplo paso a paso de cómo calcular residuos estandarizados en Excel.

Paso 1: ingrese los datos

Primero, ingresaremos los valores para un pequeño conjunto de datos en Excel:

Paso 2: Calcule los residuos

A continuación, iremos a la pestaña Datos a lo largo de la cinta superior y haremos clic en Análisis de datos dentro del grupo Análisis :

Si aún no ha instalado este complemento, consulte este tutorial sobre cómo hacerlo. Es fácil de instalar y completamente gratis.

Una vez que haya hecho clic en Análisis de datos, haga clic en la opción que dice Regresión y luego haga clic en Aceptar . En la nueva ventana que aparece, complete la siguiente información y haga clic en Aceptar :

El residual de cada observación aparecerá en la salida:

Residuos en Excel

Copie y pegue estos residuos en una nueva columna junto a los datos originales:

Paso 3: Calcule el apalancamiento

A continuación, necesitamos calcular el apalancamiento de cada observación.

La siguiente imagen muestra cómo hacerlo:

Aprovechar el cálculo en Excel para estadísticas

Aquí están las fórmulas utilizadas en las distintas celdas:

  • B14: = CONTAR (B2: B13)
  • B15: = PROMEDIO (B2: B13)
  • B16: = DEVSQ (B2: B13)
  • E2: = 1 / $ B $ 14 + (B2- $ B $ 15) ^ 2 / $ B $ 16

Paso 4: Calcule los residuos estandarizados

Por último, podemos calcular los residuos estandarizados mediante la fórmula:

r yo = e yo / RSE√ 1-h ii

El RSE para el modelo se puede encontrar en el resultado del modelo anterior. Resulta ser 4.44 :

Por lo tanto, podemos usar la siguiente fórmula para calcular el residuo estandarizado para cada observación:

Residuos estandarizados en Excel

De los resultados podemos ver que ninguno de los residuales estandarizados excede un valor absoluto de 3. Por lo tanto, ninguna de las observaciones parece ser un valor atípico.

Vale la pena señalar en algunos casos que los investigadores consideran que las observaciones con residuos estandarizados que exceden un valor absoluto de 2 se consideran valores atípicos.

Depende de usted decidir si utilizar un valor absoluto de 2 o 3 como umbral para los valores atípicos, según el problema específico en el que esté trabajando.

Recursos adicionales

¿Qué son los residuos?
¿Qué son los residuos estandarizados?
Introducción a la regresión lineal múltiple

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Una medida de tendencia central es un valor único que representa el punto central de un conjunto de datos. Este…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!