Gráfica de Residuales: Definición y Ejemplos

Actualizado por ultima vez el 1 de abril de 2022, por Luis Benites.

¿Qué es una Parcela Residual?

Mire el video para obtener una descripción general y varios ejemplos de tramas residuales:

¿Qué es una Parcela Residual? Mira este video en YouTube .
¿No puedes ver el vídeo? Haga clic aquí

Un valor residual es una medida de cuánto pierde una línea de regresión verticalmente un punto de datos. Las líneas de regresión son el mejor ajuste de un conjunto de datos. Puedes pensar en las líneas como promedios; algunos puntos de datos encajarán en la línea y otros no. Una gráfica residual tiene los valores residuales en el eje vertical; el eje horizontal muestra la variable independiente . Una gráfica residual se usa típicamente para encontrar problemas con la regresión . Algunos conjuntos de datos no son buenos candidatos para la regresión, incluidos:
parcela residual

Estos problemas se ven más fácilmente con un gráfico residual que mirando un gráfico del conjunto de datos original. Idealmente, los valores residuales deberían estar igualmente espaciados al azar alrededor del eje horizontal.

Ejemplos

Si su gráfico se parece a cualquiera de las siguientes imágenes, entonces su conjunto de datos probablemente no sea adecuado para la regresión.

Este gráfico de residuos absolutos frente a Y-hat muestra claramente un patrón heteroscedástico.

Esta gráfica de residuos absolutos frente a Y-hat muestra claramente un patrón heteroscedástico (en forma de cono). Imagen: UCLA

El valor atípico es claramente evidente en este gráfico residual.  Imagen: PSU.edu

El valor atípico es claramente evidente en este gráfico residual. Imagen: PSU.edu

Un patrón no lineal.  Imagen: Estado de Oregón.

Un patrón no lineal. Imagen: Estado de Oregón.

El gráfico residual en sí mismo no tiene un valor predictivo (no es una línea de regresión), por lo que si observa su gráfico de residuos y puede predecir valores residuales que no se muestran, es una señal de que necesita repensar su modelo. Por ejemplo, en la imagen de arriba, la función cuadrática le permite predecir dónde podrían caer otros puntos de datos. Para una trama residual, eso no es bueno. Si su gráfico indica un problema, puede haber varias razones por las que la regresión no es adecuada. No siempre significa desechar tu modelo por completo, podría ser algo simple, como:

  • Faltan términos variables de orden superior que explican un patrón no lineal.
  • Falta interacción entre términos en su modelo existente.
  • Variables que faltan .

Gráfico de Residuales: Referencias

Beyer, WH CRC Standard Mathematical Tables, 31ª ed. Boca Raton, FL: CRC Press, págs. 536 y 571, 2002.
Agresti A. (1990) Análisis de datos categóricos. John Wiley and Sons, Nueva York.
Klein, G. (2013). La caricatura Introducción a la estadística. Colina y Wamg.
Vogt, WP (2005). Diccionario de estadística y metodología: una guía no técnica para las ciencias sociales . SABIO.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Puede que le resulte útil leer primero sobre la validez. Ver: Validez interna Validez de construcción Coeficiente de Validez: Definición…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!