Cómo realizar una prueba de Breusch-Pagan en Stata

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

La regresión lineal múltiple es un método que podemos utilizar para comprender la relación entre varias variables explicativas y una variable de respuesta.

Desafortunadamente, un problema que ocurre a menudo en la regresión se conoce como heterocedasticidad , en el que hay un cambio sistemático en la varianza de los residuos en un rango de valores medidos.

Una prueba que podemos usar para determinar si hay heterocedasticidad es la prueba de Breusch-Pagan . Esta prueba produce un estadístico de prueba de Chi-Cuadrado y un valor p correspondiente.

Si el valor p está por debajo de un cierto umbral (las opciones comunes son 0.01, 0.05 y 0.10), entonces hay evidencia suficiente para decir que hay heterocedasticidad.

Este tutorial explica cómo realizar una prueba Breusch-Pagan en Stata.

Ejemplo: prueba de Breusch-Pagan en Stata

Usaremos el conjunto de datos integrado de Stata automático para ilustrar cómo realizar la prueba Breusch-Pagan.

Paso 1: cargue y vea los datos.

Primero, use el siguiente comando para cargar los datos:

sysuse auto

Luego, vea los datos sin procesar usando el siguiente comando:

br

Conjunto de datos automático en Stata

Paso 2: Realice una regresión lineal múltiple.

A continuación, escribiremos el siguiente comando para realizar una regresión lineal múltiple utilizando el precio como variable de respuesta y el mpg y el peso como variables explicativas:

retroceso precio mpg peso

Salida de regresión múltiple en Stata

Paso 3: Realice la prueba Breusch-Pagan.

Una vez que ajustamos el modelo de regresión, podemos realizar la Prueba de Breusch-Pagan usando el comando más alto , que es la abreviatura de “prueba de heterocedasticidad”:

más fuerte

Salida de prueba de Breusch-Pagan en Stata

A continuación se explica cómo interpretar la salida:

Ho: Ésta es la hipótesis nula de la prueba, que establece que existe una varianza constante entre los residuales.

Variables: Esto nos dice la variable de respuesta que se usó en el modelo de regresión. En este caso, fue el precio variable .

chi2 (1): este es el estadístico de la prueba de chi-cuadrado de la prueba. En este caso, es 14,78.

Prob> chi2: Este es el valor p que corresponde al estadístico de la prueba Chi-Cuadrado. En este caso, es 0,0001. Dado que este valor es menor que 0.05, podemos rechazar la hipótesis nula y concluir que la heterocedasticidad está presente en los datos.

Qué hacer a continuación

Si no rechaza la hipótesis nula de la prueba de Breusch-Pagan, la heterocedasticidad no está presente y puede proceder a interpretar la salida de la regresión original.

Sin embargo, si rechaza la hipótesis nula de la prueba de Breusch-Pagan, esto significa que la heterocedasticidad está presente en los datos. En este caso, los errores estándar que se muestran en la tabla de salida de la regresión no son confiables. Hay varias formas de solucionar este problema, que incluyen:

1. Transforme la variable de respuesta.Puede intentar realizar una transformación en la variable de respuesta. Por ejemplo, puede utilizar log (precio) en lugar de precio como variable de respuesta. Normalmente, tomar el logaritmo de la variable de respuesta es una forma eficaz de hacer desaparecer la heterocedasticidad. Otra transformación común es usar la raíz cuadrada de la variable de respuesta.

2. Utilice regresión ponderada.Este tipo de regresión asigna un peso a cada punto de datos en función de la varianza de su valor ajustado. Esencialmente, esto da pequeños pesos a los puntos de datos que tienen variaciones más altas, lo que reduce sus residuos al cuadrado. Cuando se utilizan los pesos adecuados, esto puede eliminar el problema de la heterocedasticidad.

3. Utilice errores estándar robustos.Los errores estándar robustos son más “robustos” al problema de la heterocedasticidad y tienden a proporcionar una medida más precisa del verdadero error estándar de un coeficiente de regresión. Consulte este tutorial para aprender cómo usar errores estándar robustos en regresión en Stata.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Hay dos formas básicas de crear un marco de datos vacío en R: Método 1: Matriz con nombres de columna…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!