Cómo interpretar una gráfica de ubicación a escala (con ejemplos)

Una gráfica de ubicación a escala es un tipo de gráfica que muestra los valores ajustados de un modelo de regresión a lo largo del eje xy la raíz cuadrada de los residuos estandarizados a lo largo del eje y.

Gráfico de ubicación de escala

Al mirar esta gráfica, verificamos dos cosas:

1. Verifique que la línea roja sea más o menos horizontal a lo largo del gráfico. Si es así, es probable que se satisfaga el supuesto de homocedasticidad para un modelo de regresión dado. Es decir, la dispersión de los residuos es aproximadamente igual en todos los valores ajustados.

2. Verifique que no haya un patrón claro entre los residuos. En otras palabras, los residuos deben estar distribuidos aleatoriamente alrededor de la línea roja con una variabilidad aproximadamente igual en todos los valores ajustados.

Gráfico de ubicación de escala en R

Podemos usar el siguiente código para ajustar un modelo de regresión lineal simple en R y producir una gráfica de ubicación de escala para el modelo resultante:

#fit modelo de modelo de regresión lineal simple
 <- lm (Ozone ~ Temp, data = airquality)

#producir gráfico de parcela de ubicación a escala
 (modelo)

Gráfico de ubicación de escala en R

Podemos observar las dos cosas siguientes en la gráfica de ubicación de escala para este modelo de regresión.

1. La línea roja es aproximadamente horizontal a lo largo de la trama. Si es así, entonces se satisface el supuesto de homocedasticidad para un modelo de regresión dado. Es decir, la dispersión de los residuos es aproximadamente igual en todos los valores ajustados.

2. Verifique que no haya un patrón claro entre los residuos. En otras palabras, los residuos deben estar distribuidos aleatoriamente alrededor de la línea roja con una variabilidad aproximadamente igual en todos los valores ajustados.

Nota tecnica

Las tres observaciones del conjunto de datos con los residuos estandarizados más altos se etiquetan en la gráfica.

Podemos ver que las observaciones en las filas 30, 62 y 117 tienen los residuos estandarizados más altos.

Esto no significa necesariamente que estas observaciones sean valores atípicos, pero es posible que desee ver los datos originales para observar más de cerca estas observaciones.

Aunque podemos ver que la línea roja es aproximadamente horizontal a través del gráfico de ubicación de escala, esto solo sirve como una forma visual de ver si se cumple el supuesto de homocedasticidad.

Una prueba estadística formal que podemos usar para ver si se cumple el supuesto de homocedasticidad es la Prueba de Breusch-Pagan .

Prueba de Breusch-Pagan en R

El siguiente código muestra cómo usar la función bptest () del paquete lmtest para realizar una prueba Breusch-Pagan en R:

#cargar biblioteca de paquetes
 lmtest (lmtest)

# realizar la prueba de Breusch-Pagan
 bptest (modelo)

	prueba Studentized Breusch-Pagan

modelo de datos
BP = 1,4798, gl = 1, valor p = 0,2238

Una prueba de Breusch-Pagan utiliza las siguientes hipótesis nulas y alternativas:

  • Hipótesis nula (H 0 ): los residuos son homocedásticos (es decir, distribuidos uniformemente)
  • Hipótesis alternativa (H A ): Los residuos son heterocedásticos (es decir, no se distribuyen uniformemente)

De la salida podemos ver que el valor p de la prueba es 0.2238 . Dado que este valor p no es menor que 0.05, no rechazamos la hipótesis nula. No tenemos evidencia suficiente para decir que la heterocedasticidad está presente en el modelo de regresión.

Este resultado coincide con nuestra inspección visual de la línea roja en el gráfico de ubicación de escala.

Recursos adicionales

Comprender la heterocedasticidad en el análisis de regresión
Cómo crear una gráfica residual en R
Cómo realizar una prueba de Breusch-Pagan en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

A menudo, es posible que desee convertir una o más columnas en un DataFrame de pandas en cadenas.Afortunadamente, esto es…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!