Cómo construir un intervalo de predicción en Excel

En estadística, la regresión lineal simple es una técnica que podemos utilizar para cuantificar la relación entre una variable predictora, x, y una variable de respuesta, y.

Cuando realizamos una regresión lineal simple, obtenemos una «línea de mejor ajuste» que describe la relación entre xey, que se puede escribir como:

ŷ = segundo 0 + segundo 1 x

dónde:

  • ŷ es el valor predicho de la variable de respuesta
  • b 0 es la intersección con el eje y
  • b 1 es el coeficiente de regresión
  • x es el valor de la variable predictora

A veces estamos interesados ​​en usar esta línea de mejor ajuste para construir un intervalo de predicción para un valor dado de x 0 , que es un intervalo alrededor del valor predicho ŷ 0 de manera que existe una probabilidad del 95% de que el valor real de y en la población correspondiente ax 0 está dentro de este intervalo.

La fórmula para calcular el intervalo de predicción para un valor dado x 0 se escribe como:

ŷ 0 +/- t α / 2, gl = n-2 * se

dónde:

se = S yx √ (1 + 1 / n + (x 0x ) 2 / SS x )

La fórmula puede parecer un poco intimidante, pero en realidad es fácil de calcular en Excel. A continuación, veremos un ejemplo de cómo usar esta fórmula para calcular un intervalo de predicción para un valor dado en Excel.

Ejemplo: cómo construir un intervalo de predicción en Excel

El siguiente conjunto de datos muestra la cantidad de horas estudiadas junto con el puntaje del examen recibido por 15 estudiantes diferentes:

Ejemplo de conjunto de datos en Excel

Suponga que nos gustaría crear un intervalo de predicción del 95% para el valor x 0 = 3. Es decir, queremos crear un intervalo tal que haya una probabilidad del 95% de que la puntuación del examen esté dentro de este intervalo para un estudiante que estudia para 3 horas.

La siguiente captura de pantalla muestra cómo calcular todos los valores necesarios para obtener este intervalo de predicción.

Nota: Las fórmulas de la columna F muestran cómo se calcularon los valores de la columna E.

Cómo calcular un intervalo de predicción en Excel

El intervalo de predicción del 95% para un valor de x 0 = 3 es (74,64, 86,90) . Es decir, predecimos con un 95% de probabilidad que un alumno que estudia durante 3 horas obtendrá una puntuación entre 74,64 y 86,90.

Un par de notas sobre los cálculos utilizados:

  • Para calcular el valor t-crítico de t α / 2, gl = n-2 usamos α / 2 = .05 / 2 = 0.25 ya que queríamos un intervalo de predicción del 95%. Tenga en cuenta que los intervalos de predicción más altos (por ejemplo, un intervalo de predicción del 99%) conducirán a intervalos más amplios. Por el contrario, un intervalo de predicción más bajo (por ejemplo, un intervalo de predicción del 90%) conducirá a un intervalo más estrecho.
  • Usamos la fórmula = PRONÓSTICO () para obtener el valor predicho para ŷ 0 pero la fórmula = PRONÓSTICO.LINEAL () devolverá exactamente el mismo valor.
  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Ocasionalmente, es posible que desee eliminar la columna de índice de un DataFrame de pandas en Python. Dado que pandas…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!