¿Qué son los residuos estandarizados?

Un residual es la diferencia entre un valor observado y un valor predicho en un modelo de regresión .

Se calcula como:

Residual = Valor observado – Valor previsto

Si graficamos los valores observados y superponemos la línea de regresión ajustada, los residuos para cada observación serían la distancia vertical entre la observación y la línea de regresión:

Ejemplo de residual en estadística

Un tipo de residual que usamos a menudo para identificar valores atípicos en un modelo de regresión se conoce como residual estandarizado .

Se calcula como:

r i = e i / s (e i ) = e i / RSE√ 1-h ii

dónde:

  • e i : El i- ésimo residuo
  • RSE: el error estándar residual del modelo
  • h ii : El apalancamiento de la i- ésima observación

En la práctica, a menudo consideramos que cualquier residuo estandarizado con un valor absoluto superior a 3 es un valor atípico.

Esto no significa necesariamente que eliminaremos estas observaciones del modelo, pero al menos deberíamos investigarlas más para verificar que no sean el resultado de un error de entrada de datos o alguna otra ocurrencia extraña.

Nota: A veces, los residuos estandarizados también se denominan «residuos estudiados internamente».

Ejemplo: cómo calcular residuos estandarizados

Supongamos que tenemos el siguiente conjunto de datos con 12 observaciones en total:

Si usamos algún software estadístico (como R , Excel , Python , Stata , etc.) para ajustar una línea de regresión lineal a este conjunto de datos, encontraremos que la línea de mejor ajuste resulta ser:

y = 29,63 + 0,7553x

Usando esta línea, podemos calcular el valor predicho para cada valor de Y basado en el valor de X. Por ejemplo, el valor predicho de la primera observación sería:

y = 29,63 + 0,7553 * (8) = 35,67

Luego podemos calcular el residual para esta observación como:

Residual = Valor observado – Valor previsto = 41 – 35,67 = 5,33

Podemos repetir este proceso para encontrar el residuo de cada observación:

Cómo calcular los residuos

También podemos usar software estadístico para encontrar que el error estándar residual del modelo es 4.44 .

Y, aunque está más allá del alcance de este tutorial, podemos usar software para encontrar la estadística de apalancamiento (h ii ) para cada observación:

Luego, podemos usar la siguiente fórmula para calcular el residuo estandarizado para cada observación:

r yo = e yo / RSE√ 1-h ii

Por ejemplo, el residuo estandarizado para la primera observación se calcula como:

r i = 5.33 / 4.44√ 1-.27 = 1.404

Podemos repetir este proceso para encontrar el residuo estandarizado para cada observación:

Ejemplo de cálculo de residuos estandarizados

Luego, podemos crear una gráfica de dispersión rápida de los valores del predictor frente a los residuos estandarizados para ver visualmente si alguno de los residuos estandarizados excede un umbral de valor absoluto de 3:

Gráfica de valores predictores frente a residuos estandarizados

En el gráfico podemos ver que ninguno de los residuales estandarizados excede un valor absoluto de 3. Por lo tanto, ninguna de las observaciones parece ser un valor atípico.

Vale la pena señalar en algunos casos que los investigadores consideran que las observaciones con residuos estandarizados que exceden un valor absoluto de 2 se consideran valores atípicos.

Depende de usted decidir, según el campo en el que esté trabajando y el problema específico en el que esté trabajando, si utilizar un valor absoluto de 2 o 3 como umbral para los valores atípicos.

Recursos adicionales

¿Qué son los residuos en las estadísticas?
Cómo calcular residuos estandarizados en Excel
Cómo calcular residuos estandarizados en R
Cómo calcular residuos estandarizados en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un gráfico de franjas es un tipo de gráfico que muestra datos numéricos a lo largo de una sola franja.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!