Cómo realizar una regresión jerárquica en Stata

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

La regresión jerárquica es una técnica que podemos utilizar para comparar varios modelos lineales diferentes.

La idea básica es que primero ajustamos un modelo de regresión lineal con una sola variable explicativa. Luego ajustamos otro modelo de regresión usando una variable explicativa adicional. Si el R-cuadrado (la proporción de varianza en la variable de respuesta que puede ser explicado por las variables explicativas) en el segundo modelo es significativamente más alto que el R-cuadrado en el modelo anterior, esto significa que el segundo modelo es mejor.

Luego repetimos el proceso de ajustar modelos de regresión adicionales con más variables explicativas y ver si los modelos más nuevos ofrecen alguna mejora con respecto a los modelos anteriores.

Este tutorial proporciona un ejemplo de cómo realizar una regresión jerárquica en Stata.

Ejemplo: regresión jerárquica en Stata

Usaremos un conjunto de datos incorporado llamado auto para ilustrar cómo realizar una regresión jerárquica en Stata. Primero, cargue el conjunto de datos escribiendo lo siguiente en el cuadro Comando:

sysuse auto

Podemos obtener un resumen rápido de los datos usando el siguiente comando:

resumir

Resumen del conjunto de datos automáticos en Stata

Podemos ver que el conjunto de datos contiene información sobre 12 variables diferentes para 74 automóviles en total.

Ajustaremos los siguientes tres modelos de regresión lineal y usaremos la regresión jerárquica para ver si cada modelo subsiguiente proporciona una mejora significativa al modelo anterior o no:

Modelo 1: precio = intercepción + mpg

Modelo 2: precio = intercepción + mpg + peso

Modelo 3: precio = intercepción + mpg + peso + relación de transmisión

Para realizar una regresión jerárquica en Stata, primero necesitaremos instalar el paquete Hireg . Para hacerlo, escriba lo siguiente en el cuadro Comando:

Findit Hireg

En la ventana que aparece, haga clic en Hireg desde http://fmwww.bc.edu/RePEc/bocode/h

Instalar el paquete de alquiler en Stata

En la siguiente ventana, haga clic en el enlace que dice haga clic aquí para instalar .

El paquete se instalará en cuestión de segundos. A continuación, para realizar la regresión jerárquica usaremos el siguiente comando:

precio de alquiler (mpg) (peso) (gear_ratio)

Esto es lo que esto le dice a Stata que haga:

  • Realice una regresión jerárquica utilizando el precio como variable de respuesta en cada modelo.
  • Para el primer modelo, use mpg como variable explicativa.
  • Para el segundo modelo, agregue el peso como una variable explicativa adicional.
  • Para el tercer modelo, agregue gear_ratio como otra variable explicativa.

Aquí está el resultado del primer modelo:

Salida de regresión jerárquica en Stata

Vemos que el R-cuadrado del modelo es 0.2196 y el valor p general (Prob> F) para el modelo es 0.0000 , que es estadísticamente significativo en α = 0.05.

A continuación, vemos el resultado del segundo modelo:

Salida de regresión jerárquica del segundo modelo en Stata

El R cuadrado de este modelo es 0.2934 , que es más grande que el primer modelo. Para determinar si esta diferencia es estadísticamente significativa, Stata realizó una prueba F que dio como resultado los siguientes números en la parte inferior de la salida:

  • Diferencia de R cuadrado entre los dos modelos = 0.074
  • Estadístico F para la diferencia = 7.416
  • Valor p correspondiente del estadístico F = 0,008

Debido a que el valor p es menor que 0.05, concluimos que hay una mejora estadísticamente significativa en el segundo modelo en comparación con el primer modelo.

Por último, podemos ver el resultado del tercer modelo:

Regresión jerárquica en la interpretación de Stata

El R-cuadrado de este modelo es 0.3150 , que es más grande que el segundo modelo. Para determinar si esta diferencia es estadísticamente significativa, Stata realizó una prueba F que dio como resultado los siguientes números en la parte inferior de la salida:

  • Diferencia de R cuadrado entre los dos modelos = 0.022
  • Estadístico F para la diferencia = 2.206
  • Valor p correspondiente del estadístico F = 0,142

Debido a que el valor p no es menor que 0.05, no tenemos evidencia suficiente para decir que el tercer modelo ofrece alguna mejora con respecto al segundo modelo.

Al final de la salida, podemos ver que Stata proporciona un resumen de los resultados:

Resultados de regresión jerárquica en Stata

En este ejemplo particular, concluiríamos que el modelo 2 ofreció una mejora significativa sobre el modelo 1, pero el modelo 3 no ofreció una mejora significativa sobre el modelo 2.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La prueba de esfericidad de Bartlett compara una matriz de correlación observada con la matriz de identidad. Básicamente, comprueba si…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!