- 0
- 0
- 0
- 0
La regresión lineal es un método que podemos utilizar para comprender la relación entre una o más variables explicativas y una variable de respuesta.
Cuando realizamos una regresión lineal en un conjunto de datos, terminamos con una ecuación de regresión que se puede usar para predecir los valores de una variable de respuesta, dados los valores de las variables explicativas.
Luego, podemos medir la diferencia entre los valores predichos y los valores reales para obtener los residuos de cada predicción. Esto nos ayuda a tener una idea de qué tan bien nuestro modelo de regresión es capaz de predecir los valores de respuesta.
Este tutorial explica cómo obtener tanto los valores predichos como los residuales para un modelo de regresión en Stata.
Ejemplo: cómo obtener valores y residuos previstos
Para este ejemplo usaremos el conjunto de datos integrado de Stata llamado auto . Usaremos mpg y desplazamiento como variables explicativas y precio como variable de respuesta.
Utilice los siguientes pasos para realizar una regresión lineal y, posteriormente, obtener los valores y residuales predichos para el modelo de regresión.
Paso 1: cargue y vea los datos.
Primero, cargaremos los datos usando el siguiente comando:
sysuse auto
A continuación, obtendremos un resumen rápido de los datos usando el siguiente comando:
resumir
Paso 2: ajuste el modelo de regresión.
A continuación, usaremos el siguiente comando para ajustar el modelo de regresión:
retroceso precio mpg desplazamiento
La ecuación de regresión estimada es la siguiente:
precio estimado = 6672.766 -121.1833 * (mpg) + 10.50885 * (desplazamiento)
Paso 3: Obtenga los valores predichos.
Podemos obtener los valores predichos usando el comando de predicción y almacenando estos valores en una variable llamada como queramos. En este caso, usaremos el nombre pred_price :
predecir precio_previa
Podemos ver los precios reales y los precios predichos uno al lado del otro usando el comando list . Hay 74 valores pronosticados totales, pero veremos solo los primeros 10 usando el comando in 1/10 :
precio de lista pred_price en 1/10
Paso 4: Obtenga los residuales.
Podemos obtener los residuales de cada predicción usando el comando residuals y almacenando estos valores en una variable llamada como queramos. En este caso, usaremos el nombre resid_price :
predecir resid_price, residuales
Podemos ver el precio real, el precio predicho y los residuos, todos uno al lado del otro, usando el comando list nuevamente:
precio de lista precio_pred_precio_precio en 1/10
Paso 5: Cree una gráfica de valores predichos frente a residuos.
Por último, podemos crear un diagrama de dispersión para visualizar la relación entre los valores predichos y los residuos:
scatter resid_price pred_price
Podemos ver que, en promedio, los residuos tienden a crecer a medida que aumentan los valores ajustados. Esto podría ser un signo de heterocedasticidad , cuando la propagación de los residuos no es constante en todos los niveles de respuesta.
Podríamos probar formalmente la heterocedasticidad usando la prueba de Breusch-Pagan y podríamos abordar este problema usando errores estándar robustos .
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: