Contenido de este artículo
- 0
- 0
- 0
- 0
Supongamos que tenemos el siguiente conjunto de datos que muestra los pies cuadrados y el precio de 12 casas diferentes:
Queremos saber si existe una relación significativa entre pies cuadrados y precio. Para tener una idea de cómo se ven los datos, primero creamos una gráfica de dispersión con pies cuadrados en el eje xy el precio en el eje y:
Podemos ver claramente que existe una correlación positiva entre los pies cuadrados y el precio. A medida que aumentan los pies cuadrados, el precio de la casa también tiende a aumentar.
Sin embargo, para saber si existe una relación estadísticamente significativa entre pies cuadrados y precio, necesitamos ejecutar una regresión lineal simple.
Entonces, ejecutamos una regresión lineal simple usando pies cuadrados como predictor y precio como respuesta y obtenemos el siguiente resultado:
Ya sea que ejecute una regresión lineal simple en Excel, SPSS, R o algún otro software, obtendrá un resultado similar al que se muestra arriba.
Recuerde que una regresión lineal simple producirá la línea de mejor ajuste, que es la ecuación de la línea que mejor se «ajusta» a los datos de nuestra gráfica de dispersión. Esta línea de mejor ajuste se define como:
ŷ = segundo 0 + segundo 1 x
donde ŷ es el valor predicho de la variable de respuesta, b 0 es la intersección con el eje y, b 1 es el coeficiente de regresión y x es el valor de la variable predictora.
El valor de b 0 viene dado por el coeficiente de la intersección, que es 47588.70.
El valor de b 1 viene dado por el coeficiente de la variable predictora pies cuadrados , que es 93,57.
Por lo tanto, la línea de mejor ajuste en este ejemplo es ŷ = 47588.70+ 93.57x
A continuación se explica cómo interpretar esta línea de mejor ajuste:
- b 0 : Cuando el valor de los pies cuadrados es cero, el valor promedio esperado para el precio es $ 47,588.70. (En este caso, realmente no tiene sentido interpretar la intersección, ya que una casa nunca puede tener cero pies cuadrados)
- b 1 : Por cada pie cuadrado adicional, el aumento promedio esperado en el precio es $ 93.57.
Entonces, ahora sabemos que por cada pie cuadrado adicional, el aumento promedio esperado en el precio es de $ 93.57. Para saber si este aumento es estadísticamente significativo, necesitamos realizar una prueba de hipótesis para B 1 o construir un intervalo de confianza para B 1 .
Nota: Una prueba de hipótesis y un intervalo de confianza siempre darán los mismos resultados.
Construcción de un intervalo de confianza para una pendiente de regresión
Para construir un intervalo de confianza para una pendiente de regresión, usamos la siguiente fórmula:
b 1 +/- (t 1-∝ / 2, n-2 ) * (error estándar de b 1 )
dónde:
- b 1 es el coeficiente de pendiente dado en el resultado de la regresión
- (t 1-∝ / 2, n-2 ) es el valor crítico t para el nivel de confianza 1-∝ con n-2 grados de libertad donde n es el número total de observaciones en nuestro conjunto de datos
- (error estándar de b 1 ) es el error estándar de b 1 dado en el resultado de la regresión
Para nuestro ejemplo, aquí se explica cómo construir un intervalo de confianza del 95% para B 1 :
- b 1 es 93,57 del resultado de la regresión.
- Como estamos usando un intervalo de confianza del 95%, ∝ = .05 y n-2 = 12-2 = 10, entonces t .975, 10 es 2.228 de acuerdo con la tabla de distribución t
- (error estándar de b 1 ) es 11,45 del resultado de la regresión
Por lo tanto, nuestro intervalo de confianza del 95% para B 1 es:
93,57 +/- (2,228) * (11,45) = (68,06; 119,08)
Esto significa que tenemos un 95% de confianza en que el verdadero aumento promedio en el precio por cada pie cuadrado adicional está entre $ 68.06 y $ 119.08.
Observe que $ 0 no está en este intervalo, por lo que la relación entre pies cuadrados y precio es estadísticamente significativa al nivel de confianza del 95%.
Realización de una prueba de hipótesis para una pendiente de regresión
Para realizar una prueba de hipótesis para una pendiente de regresión, seguimos los cinco pasos estándar para cualquier prueba de hipótesis :
Paso 1. Exprese las hipótesis.
La hipótesis nula (H0): B 1 = 0
La hipótesis alternativa: (Ha): B 1 ≠ 0
Paso 2. Determine un nivel de significancia a utilizar.
Dado que construimos un intervalo de confianza del 95% en el ejemplo anterior, usaremos el enfoque equivalente aquí y elegiremos usar un nivel de significancia de 0.05.
Paso 3. Encuentre el estadístico de prueba y el valor p correspondiente.
En este caso, el estadístico de prueba es t = coeficiente de b 1 / error estándar de b 1 con n-2 grados de libertad. Podemos encontrar estos valores del resultado de la regresión:
Por tanto, el estadístico de prueba t = 92,89 / 13,88 = 6,69.
Utilizando la calculadora de puntuación T a valor P con una puntuación de 6,69 con 10 grados de libertad y una prueba de dos colas, el valor p = 0,000 .
Paso 4. Rechace o no rechace la hipótesis nula.
Dado que el valor p es menor que nuestro nivel de significancia de .05, rechazamos la hipótesis nula.
Paso 5. Interprete los resultados.
Dado que rechazamos la hipótesis nula, tenemos suficiente evidencia para decir que el verdadero aumento promedio en el precio por cada pie cuadrado adicional no es cero.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: