Cómo construir un intervalo de predicción en Excel

En estadística, la regresión lineal simple es una técnica que podemos utilizar para cuantificar la relación entre una variable predictora, x, y una variable de respuesta, y.

Cuando realizamos una regresión lineal simple, obtenemos una «línea de mejor ajuste» que describe la relación entre xey, que se puede escribir como:

ŷ = segundo 0 + segundo 1 x

dónde:

  • ŷ es el valor predicho de la variable de respuesta
  • b 0 es la intersección con el eje y
  • b 1 es el coeficiente de regresión
  • x es el valor de la variable predictora

A veces estamos interesados ​​en usar esta línea de mejor ajuste para construir un intervalo de predicción para un valor dado de x 0 , que es un intervalo alrededor del valor predicho ŷ 0 de manera que existe una probabilidad del 95% de que el valor real de y en la población correspondiente ax 0 está dentro de este intervalo.

La fórmula para calcular el intervalo de predicción para un valor dado x 0 se escribe como:

ŷ 0 +/- t α / 2, gl = n-2 * se

dónde:

se = S yx √ (1 + 1 / n + (x 0x ) 2 / SS x )

La fórmula puede parecer un poco intimidante, pero en realidad es fácil de calcular en Excel. A continuación, veremos un ejemplo de cómo usar esta fórmula para calcular un intervalo de predicción para un valor dado en Excel.

Ejemplo: cómo construir un intervalo de predicción en Excel

El siguiente conjunto de datos muestra la cantidad de horas estudiadas junto con el puntaje del examen recibido por 15 estudiantes diferentes:

Ejemplo de conjunto de datos en Excel

Suponga que nos gustaría crear un intervalo de predicción del 95% para el valor x 0 = 3. Es decir, queremos crear un intervalo tal que haya una probabilidad del 95% de que la puntuación del examen esté dentro de este intervalo para un estudiante que estudia para 3 horas.

La siguiente captura de pantalla muestra cómo calcular todos los valores necesarios para obtener este intervalo de predicción.

Nota: Las fórmulas de la columna F muestran cómo se calcularon los valores de la columna E.

Cómo calcular un intervalo de predicción en Excel

El intervalo de predicción del 95% para un valor de x 0 = 3 es (74,64, 86,90) . Es decir, predecimos con un 95% de probabilidad que un alumno que estudia durante 3 horas obtendrá una puntuación entre 74,64 y 86,90.

Un par de notas sobre los cálculos utilizados:

  • Para calcular el valor t-crítico de t α / 2, gl = n-2 usamos α / 2 = .05 / 2 = 0.25 ya que queríamos un intervalo de predicción del 95%. Tenga en cuenta que los intervalos de predicción más altos (por ejemplo, un intervalo de predicción del 99%) conducirán a intervalos más amplios. Por el contrario, un intervalo de predicción más bajo (por ejemplo, un intervalo de predicción del 90%) conducirá a un intervalo más estrecho.
  • Usamos la fórmula = PRONÓSTICO () para obtener el valor predicho para ŷ 0 pero la fórmula = PRONÓSTICO.LINEAL () devolverá exactamente el mismo valor.
  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Ocasionalmente, es posible que desee eliminar la columna de índice de un DataFrame de pandas en Python. Dado que pandas…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!