- 0
- 0
- 0
- 0
En estadística, la regresión lineal simple es una técnica que podemos utilizar para cuantificar la relación entre una variable predictora, x, y una variable de respuesta, y.
Cuando realizamos una regresión lineal simple, obtenemos una «línea de mejor ajuste» que describe la relación entre xey, que se puede escribir como:
ŷ = segundo 0 + segundo 1 x
dónde:
- ŷ es el valor predicho de la variable de respuesta
- b 0 es la intersección con el eje y
- b 1 es el coeficiente de regresión
- x es el valor de la variable predictora
A veces estamos interesados en usar esta línea de mejor ajuste para construir un intervalo de predicción para un valor dado de x 0 , que es un intervalo alrededor del valor predicho ŷ 0 de manera que existe una probabilidad del 95% de que el valor real de y en la población correspondiente ax 0 está dentro de este intervalo.
La fórmula para calcular el intervalo de predicción para un valor dado x 0 se escribe como:
ŷ 0 +/- t α / 2, gl = n-2 * se
dónde:
se = S yx √ (1 + 1 / n + (x 0 – x ) 2 / SS x )
La fórmula puede parecer un poco intimidante, pero en realidad es fácil de calcular en Excel. A continuación, veremos un ejemplo de cómo usar esta fórmula para calcular un intervalo de predicción para un valor dado en Excel.
Ejemplo: cómo construir un intervalo de predicción en Excel
El siguiente conjunto de datos muestra la cantidad de horas estudiadas junto con el puntaje del examen recibido por 15 estudiantes diferentes:
Suponga que nos gustaría crear un intervalo de predicción del 95% para el valor x 0 = 3. Es decir, queremos crear un intervalo tal que haya una probabilidad del 95% de que la puntuación del examen esté dentro de este intervalo para un estudiante que estudia para 3 horas.
La siguiente captura de pantalla muestra cómo calcular todos los valores necesarios para obtener este intervalo de predicción.
Nota: Las fórmulas de la columna F muestran cómo se calcularon los valores de la columna E.
El intervalo de predicción del 95% para un valor de x 0 = 3 es (74,64, 86,90) . Es decir, predecimos con un 95% de probabilidad que un alumno que estudia durante 3 horas obtendrá una puntuación entre 74,64 y 86,90.
Un par de notas sobre los cálculos utilizados:
- Para calcular el valor t-crítico de t α / 2, gl = n-2 usamos α / 2 = .05 / 2 = 0.25 ya que queríamos un intervalo de predicción del 95%. Tenga en cuenta que los intervalos de predicción más altos (por ejemplo, un intervalo de predicción del 99%) conducirán a intervalos más amplios. Por el contrario, un intervalo de predicción más bajo (por ejemplo, un intervalo de predicción del 90%) conducirá a un intervalo más estrecho.
- Usamos la fórmula = PRONÓSTICO () para obtener el valor predicho para ŷ 0 pero la fórmula = PRONÓSTICO.LINEAL () devolverá exactamente el mismo valor.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: