Cómo probar la importancia de una pendiente de regresión

Supongamos que tenemos el siguiente conjunto de datos que muestra los pies cuadrados y el precio de 12 casas diferentes:

Ejemplo de regresión lineal simple

Queremos saber si existe una relación significativa entre pies cuadrados y precio. Para tener una idea de cómo se ven los datos, primero creamos una gráfica de dispersión con pies cuadrados en el eje xy el precio en el eje y:

Diagrama de dispersión de regresión lineal simple

Podemos ver claramente que existe una correlación positiva entre los pies cuadrados y el precio. A medida que aumentan los pies cuadrados, el precio de la casa también tiende a aumentar.

Sin embargo, para saber si existe una relación estadísticamente significativa entre pies cuadrados y precio, necesitamos ejecutar una regresión lineal simple.

Entonces, ejecutamos una regresión lineal simple usando pies cuadrados como predictor y precio como respuesta y obtenemos el siguiente resultado:

Salida de regresión lineal simple

Ya sea que ejecute una regresión lineal simple en Excel, SPSS, R o algún otro software, obtendrá un resultado similar al que se muestra arriba.

Recuerde que una regresión lineal simple producirá la línea de mejor ajuste, que es la ecuación de la línea que mejor se «ajusta» a los datos de nuestra gráfica de dispersión. Esta línea de mejor ajuste se define como:

ŷ = segundo 0 + segundo 1 x

donde ŷ es el valor predicho de la variable de respuesta, b 0 es la intersección con el eje y, b 1 es el coeficiente de regresión y x es el valor de la variable predictora.

El valor de b 0 viene dado por el coeficiente de la intersección, que es 47588.70.

El valor de b 1 viene dado por el coeficiente de la variable predictora pies cuadrados , que es 93,57.

Por lo tanto, la línea de mejor ajuste en este ejemplo es ŷ = 47588.70+ 93.57x

A continuación se explica cómo interpretar esta línea de mejor ajuste:

  • b 0 : Cuando el valor de los pies cuadrados es cero, el valor promedio esperado para el precio es $ 47,588.70. (En este caso, realmente no tiene sentido interpretar la intersección, ya que una casa nunca puede tener cero pies cuadrados)
  • b 1 : Por cada pie cuadrado adicional, el aumento promedio esperado en el precio es $ 93.57.

Entonces, ahora sabemos que por cada pie cuadrado adicional, el aumento promedio esperado en el precio es de $ 93.57. Para saber si este aumento es estadísticamente significativo, necesitamos realizar una prueba de hipótesis para B 1 o construir un intervalo de confianza para B 1 .

Nota: Una prueba de hipótesis y un intervalo de confianza siempre darán los mismos resultados.

Construcción de un intervalo de confianza para una pendiente de regresión

Para construir un intervalo de confianza para una pendiente de regresión, usamos la siguiente fórmula:

b 1 +/- (t 1-∝ / 2, n-2 ) * (error estándar de b 1 )

dónde:

  • b 1 es el coeficiente de pendiente dado en el resultado de la regresión
  • (t 1-∝ / 2, n-2 ) es el valor crítico t para el nivel de confianza 1-∝ con n-2 grados de libertad donde n es el número total de observaciones en nuestro conjunto de datos
  • (error estándar de b 1 ) es el error estándar de b 1 dado en el resultado de la regresión

Para nuestro ejemplo, aquí se explica cómo construir un intervalo de confianza del 95% para B 1 :

  • b 1 es 93,57 del resultado de la regresión.
  • Como estamos usando un intervalo de confianza del 95%, ∝ = .05 y n-2 = 12-2 = 10, entonces t .975, 10 es 2.228 de acuerdo con la tabla de distribución t
  • (error estándar de b 1 ) es 11,45 del resultado de la regresión

Por lo tanto, nuestro intervalo de confianza del 95% para B 1 es:

93,57 +/- (2,228) * (11,45) = (68,06; 119,08)

Esto significa que tenemos un 95% de confianza en que el verdadero aumento promedio en el precio por cada pie cuadrado adicional está entre $ 68.06 y $ 119.08.

Observe que $ 0 no está en este intervalo, por lo que la relación entre pies cuadrados y precio es estadísticamente significativa al nivel de confianza del 95%.

Realización de una prueba de hipótesis para una pendiente de regresión

Para realizar una prueba de hipótesis para una pendiente de regresión, seguimos los cinco pasos estándar para cualquier prueba de hipótesis :

Paso 1. Exprese las hipótesis.

La hipótesis nula (H0): B 1 = 0

La hipótesis alternativa: (Ha): B 1 ≠ 0

Paso 2. Determine un nivel de significancia a utilizar.

Dado que construimos un intervalo de confianza del 95% en el ejemplo anterior, usaremos el enfoque equivalente aquí y elegiremos usar un nivel de significancia de 0.05.

Paso 3. Encuentre el estadístico de prueba y el valor p correspondiente.

En este caso, el estadístico de prueba es t = coeficiente de b 1 / error estándar de b 1 con n-2 grados de libertad. Podemos encontrar estos valores del resultado de la regresión:

Salida de regresión lineal simple
Por tanto, el estadístico de prueba t = 92,89 / 13,88 = 6,69.

Utilizando la calculadora de puntuación T a valor P con una puntuación de 6,69 con 10 grados de libertad y una prueba de dos colas, el valor p = 0,000 .

Paso 4. Rechace o no rechace la hipótesis nula.

Dado que el valor p es menor que nuestro nivel de significancia de .05, rechazamos la hipótesis nula.

Paso 5. Interprete los resultados.

Dado que rechazamos la hipótesis nula, tenemos suficiente evidencia para decir que el verdadero aumento promedio en el precio por cada pie cuadrado adicional no es cero.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Las frecuencias nos dicen con qué frecuencia ocurren valores diferentes en un conjunto de datos. Podemos calcular fácilmente frecuencias en…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!