Cómo obtener valores y residuos pronosticados en Stata

La regresión lineal es un método que podemos utilizar para comprender la relación entre una o más variables explicativas y una variable de respuesta.

Cuando realizamos una regresión lineal en un conjunto de datos, terminamos con una ecuación de regresión que se puede usar para predecir los valores de una variable de respuesta, dados los valores de las variables explicativas.

Luego, podemos medir la diferencia entre los valores predichos y los valores reales para obtener los residuos de cada predicción. Esto nos ayuda a tener una idea de qué tan bien nuestro modelo de regresión es capaz de predecir los valores de respuesta.

Este tutorial explica cómo obtener tanto los valores predichos como los residuales para un modelo de regresión en Stata.

Ejemplo: cómo obtener valores y residuos previstos

Para este ejemplo usaremos el conjunto de datos integrado de Stata llamado auto . Usaremos mpg y desplazamiento como variables explicativas y precio como variable de respuesta.

Utilice los siguientes pasos para realizar una regresión lineal y, posteriormente, obtener los valores y residuales predichos para el modelo de regresión.

Paso 1: cargue y vea los datos.

Primero, cargaremos los datos usando el siguiente comando:

sysuse auto

A continuación, obtendremos un resumen rápido de los datos usando el siguiente comando:

resumir

Resumir comando en Stata

Paso 2: ajuste el modelo de regresión.

A continuación, usaremos el siguiente comando para ajustar el modelo de regresión:

retroceso precio mpg desplazamiento

Salida del modelo de regresión en Stata

La ecuación de regresión estimada es la siguiente:

precio estimado = 6672.766 -121.1833 * (mpg) + 10.50885 * (desplazamiento)

Paso 3: Obtenga los valores predichos.

Podemos obtener los valores predichos usando el comando de predicción y almacenando estos valores en una variable llamada como queramos. En este caso, usaremos el nombre pred_price :

predecir precio_previa

Podemos ver los precios reales y los precios predichos uno al lado del otro usando el comando list . Hay 74 valores pronosticados totales, pero veremos solo los primeros 10 usando el comando in 1/10 :

precio de lista pred_price en 1/10

Valores reales frente a valores predichos en regresión en Stata

Paso 4: Obtenga los residuales.

Podemos obtener los residuales de cada predicción usando el comando residuals y almacenando estos valores en una variable llamada como queramos. En este caso, usaremos el nombre resid_price :

predecir resid_price, residuales

Podemos ver el precio real, el precio predicho y los residuos, todos uno al lado del otro, usando el comando list nuevamente:

precio de lista precio_pred_precio_precio en 1/10

Residuos vs valores predichos en Stata

Paso 5: Cree una gráfica de valores predichos frente a residuos.

Por último, podemos crear un diagrama de dispersión para visualizar la relación entre los valores predichos y los residuos:

scatter resid_price pred_price

Gráfica de residuos frente a valores predichos en Stata

Podemos ver que, en promedio, los residuos tienden a crecer a medida que aumentan los valores ajustados. Esto podría ser un signo de heterocedasticidad , cuando la propagación de los residuos no es constante en todos los niveles de respuesta.

Podríamos probar formalmente la heterocedasticidad usando la prueba de Breusch-Pagan y podríamos abordar este problema usando errores estándar robustos .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Hay dos formas de extraer rápidamente el año de una fecha en R: Método 1: usar formato () df $…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!