Cómo realizar la prueba de White en R (con ejemplos)

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 7 de mayo de 2021, por Luis Benites.

La prueba de White se utiliza para determinar si la heterocedasticidad está presente en un modelo de regresión.

La heterocedasticidad se refiere a la dispersión desigual de los residuos en diferentes niveles de una variable de respuesta en un modelo de regresión, que viola uno de los supuestos clave de la regresión lineal de que los residuos están igualmente dispersos en cada nivel de la variable de respuesta.

Este tutorial explica cómo realizar la prueba de White en R para determinar si la heterocedasticidad es un problema en un modelo de regresión dado.

Ejemplo: prueba de White en R

En este ejemplo, ajustaremos un modelo de regresión lineal múltiple utilizando el conjunto de datos R integrado mtcars.

Una vez que hayamos ajustado el modelo, usaremos la función bptest de la biblioteca lmtest para realizar la prueba de White y determinar si hay heterocedasticidad.

Paso 1: ajuste un modelo de regresión.

Primero, ajustaremos un modelo de regresión usando mpg como variable de respuesta y disp y hp como las dos variables explicativas.

#cargar el conjunto de datos
datos (mtcars)

#ajustar un modelo de regresión
modelo <- lm (mpg ~ disp + hp, data = mtcars)

#ver resumen de
 resumen del modelo (modelo)

Coeficientes:
             Estimar Std. Valor t de error Pr (> | t |)    
(Intercepción) 30.735904 1.331566 23.083 <2e-16 ***
disp -0.030346 0.007405 -4.098 0.000306 ***
CV -0,024840 0,013385 -1,856 0,073679.  
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 3,127 en 29 grados de libertad
R cuadrado múltiple: 0,7482, R cuadrado ajustado: 0,7309 
Estadístico F: 43,09 en 2 y 29 DF, valor de p: 2,062e-09

Paso 2: Realice la prueba de White.

A continuación, usaremos la siguiente sintaxis para realizar la prueba de White para determinar si hay heterocedasticidad presente:

#cargar biblioteca lmtest
biblioteca (lmtest)

#realiza la prueba de White
bptest (modelo, ~ disp * hp + I (disp ^ 2) + I (hp ^ 2), datos = mtcars)

	prueba Studentized Breusch-Pagan

modelo de datos
BP = 7.0766, gl = 5, valor p = 0.215

A continuación se explica cómo interpretar la salida:

  • El estadístico de prueba es X 2 = 7.0766 .
  • Los grados de libertad son 5 .
  • El valor p correspondiente es 0,215 .

La prueba de White utiliza las siguientes hipótesis nulas y alternativas:

  • Nulo (H 0 ) : hay homocedasticidad.
  • Alternativa (H A ): Hay heterocedasticidad.

Dado que el valor p no es menor que 0.05, no rechazamos la hipótesis nula. No tenemos evidencia suficiente para decir que la heterocedasticidad está presente en el modelo de regresión.

Qué hacer a continuación

Si no rechaza la hipótesis nula de la prueba de White, la heterocedasticidad no está presente y puede proceder a interpretar el resultado de la regresión original.

Sin embargo, si rechaza la hipótesis nula, esto significa que la heterocedasticidad está presente en los datos. En este caso, los errores estándar que se muestran en la tabla de salida de la regresión pueden no ser confiables.

Hay un par de formas comunes de solucionar este problema, que incluyen:

1. Transforme la variable de respuesta.

Puede intentar realizar una transformación en la variable de respuesta, como tomar el registro, la raíz cuadrada o la raíz cúbica de la variable de respuesta. Normalmente, esto puede hacer que desaparezca la heterocedasticidad.

2. Utilice regresión ponderada.

La regresión ponderada asigna un peso a cada punto de datos en función de la varianza de su valor ajustado. Esencialmente, esto da pequeños pesos a los puntos de datos que tienen variaciones más altas, lo que reduce sus residuos al cuadrado. Cuando se utilizan los pesos adecuados, esto puede eliminar el problema de la heterocedasticidad.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Siempre que realice una prueba t, obtendrá una estadística de prueba como resultado. Para determinar si los resultados de la…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!