Cómo realizar una prueba de Breusch-Pagan en R

Actualizado por ultima vez el 7 de mayo de 2021, por .

Se utiliza una prueba de Breusch-Pagan para determinar si hay heterocedasticidad en un análisis de regresión.

Este tutorial explica cómo realizar una prueba Breusch-Pagan en R.

Ejemplo: prueba de Breusch-Pagan en R

En este ejemplo, ajustaremos un modelo de regresión utilizando el conjunto de datos R integrado mtcars y luego realizaremos una prueba de Breusch-Pagan utilizando la función bptest de la biblioteca lmtest para determinar si hay heterocedasticidad.

Paso 1: ajuste un modelo de regresión.

Primero, ajustaremos un modelo de regresión usando mpg como variable de respuesta y disp y hp como las dos variables explicativas.

#cargar el conjunto de datos
datos (mtcars)

#ajustar un modelo de regresión
modelo <- lm (mpg ~ disp + hp, data = mtcars)

#ver resumen de
 resumen del modelo (modelo)

Coeficientes:
             Estimar Std. Valor t de error Pr (> | t |)    
(Intercepción) 30.735904 1.331566 23.083 <2e-16 ***
disp -0.030346 0.007405 -4.098 0.000306 ***
CV -0,024840 0,013385 -1,856 0,073679.  
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 3,127 en 29 grados de libertad
R cuadrado múltiple: 0,7482, R cuadrado ajustado: 0,7309 
Estadístico F: 43,09 en 2 y 29 DF, valor de p: 2,062e-09

Paso 2: Realice una prueba de Breusch-Pagan.

A continuación, realizaremos una prueba de Breusch-Pagan para determinar si existe heterocedasticidad.

#cargar biblioteca lmtest
biblioteca (lmtest)

#realice la prueba de Breusch-Pagan
bptest (modelo)

	prueba Studentized Breusch-Pagan

modelo de datos
BP = 4.0861, gl = 2, valor p = 0.1296

El estadístico de prueba es 4.0861 y el valor p correspondiente es 0.1296 . Dado que el valor p no es menor que 0.05, no rechazamos la hipótesis nula. No tenemos evidencia suficiente para decir que la heterocedasticidad está presente en el modelo de regresión.

Qué hacer a continuación

Si no rechaza la hipótesis nula de la prueba de Breusch-Pagan, la heterocedasticidad no está presente y puede proceder a interpretar la salida de la regresión original.

Sin embargo, si rechaza la hipótesis nula, esto significa que la heterocedasticidad está presente en los datos. En este caso, los errores estándar que se muestran en la tabla de salida de la regresión pueden no ser confiables.

Hay un par de formas comunes de solucionar este problema, que incluyen:

1. Transforme la variable de respuesta.Puede intentar realizar una transformación en la variable de respuesta. Por ejemplo, puede utilizar el registro de la variable de respuesta en lugar de la variable de respuesta original. Normalmente, tomar el logaritmo de la variable de respuesta es una forma eficaz de hacer desaparecer la heterocedasticidad. Otra transformación común es usar la raíz cuadrada de la variable de respuesta.

2. Utilice regresión ponderada.Este tipo de regresión asigna un peso a cada punto de datos en función de la varianza de su valor ajustado. Esencialmente, esto da pequeños pesos a los puntos de datos que tienen variaciones más altas, lo que reduce sus residuos al cuadrado. Cuando se utilizan los pesos adecuados, esto puede eliminar el problema de la heterocedasticidad.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, una observación es simplemente una ocurrencia de algo que está midiendo. Por ejemplo, suponga que está midiendo el…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!