Cómo crear e interpretar gráficos QQ en Stata

Un gráfico QQ , abreviatura de gráfico «cuantiles-cuantiles», se utiliza a menudo para evaluar si los residuos en un análisis de regresión están distribuidos normalmente o no.

Este tutorial explica cómo crear e interpretar una gráfica QQ en Stata.

Ejemplo: QQ Plot en Stata

Para este ejemplo, usaremos el conjunto de datos automático incorporado en Stata. Ajustaremos un modelo de regresión lineal múltiple, usando mpg y desplazamiento como variables explicativas y precio como variable de respuesta. Luego obtendremos los residuos del modelo y crearemos una gráfica QQ para ver si los residuos siguen una distribución normal.

Paso 1: cargue y vea los datos.

Primero, cargaremos los datos usando el siguiente comando:

sysuse auto

A continuación, obtendremos un resumen rápido de los datos usando el siguiente comando:

resumir

Resumir comando en Stata

Paso 2: ajuste el modelo de regresión.

A continuación, usaremos el siguiente comando para ajustar el modelo de regresión:

retroceso precio mpg desplazamiento

Salida del modelo de regresión en Stata

Paso 3: Calcule los residuos .

Recuerde que un residuo es simplemente la diferencia entre el valor de respuesta pronosticado (calculado por la ecuación de regresión estimada) y el valor de respuesta real.

Podemos obtener los residuales de cada predicción usando el comando residuals y almacenando estos valores en una variable llamada como queramos. En este caso, usaremos el nombre resid_price :

predecir resid_price, residuales

Paso 4: Cree el gráfico QQ.

Ahora que tenemos una lista de residuos, podemos crear una gráfica QQ usando el comando qnorm :

qnorm resid_price

Parcela QQ en Stata

Paso 5: Interprete la gráfica QQ.

La idea detrás de una gráfica QQ es simple: si los residuos caen a lo largo de una línea recta aproximadamente en un ángulo de 45 grados, entonces los residuos se distribuyen de manera aproximadamente normal. Podemos ver en nuestro gráfico QQ anterior que los residuos tienden a desviarse bastante de la línea de 45 grados, especialmente en los extremos de la cola, lo que podría ser una indicación de que no están distribuidos normalmente.

Aunque un gráfico QQ no es una prueba estadística formal, ofrece una manera fácil de verificar visualmente si los residuos están distribuidos normalmente o no.

Si resulta que sus residuos se desvían severamente de la línea de 45 grados en la gráfica QQ, puede considerar realizar una transformación en la variable de respuesta en su regresión, como usar la raíz cuadrada o el logaritmo de la variable de respuesta.

Si los residuos solo se desvían ligeramente, no necesita preocuparse por transformar la variable de respuesta, ya que la regresión es bastante robusta a las desviaciones de la normalidad.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El riesgo atribuible se refiere a la diferencia en las tasas de incidencia entre las personas expuestas a algún factor…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!