¿Qué es Y Hat en estadísticas?

En estadística, el término y hat (escrito como ŷ ) se refiere al valor estimado de una variable de respuesta en un modelo de regresión lineal .

Normalmente escribimos una ecuación de regresión estimada de la siguiente manera:

ŷ = β 0 + β 1 x

dónde:

  • ŷ : el valor estimado de la variable de respuesta
  • β 0 : el valor promedio de la variable de respuesta cuando la variable predictora es cero
  • β 1 : El cambio promedio en la variable de respuesta asociado con un aumento de una unidad en la variable predictora.

Por ejemplo, supongamos que tenemos el siguiente conjunto de datos que muestra la cantidad de horas estudiadas por seis estudiantes diferentes junto con sus puntajes en el examen final:

Supongamos que usamos algún software estadístico (como R , Excel , Python o incluso a mano ) para ajustar el siguiente modelo de regresión usando las horas estudiadas como variable predictiva y la puntuación del examen como variable de respuesta:

Puntuación = 66.615 + 5.0769 * (Horas)

La forma de interpretar los coeficientes de regresión en este modelo es la siguiente:

  • El puntaje promedio del examen para un estudiante que estudia cero horas es 66.615 .
  • La puntuación del examen aumenta en un promedio de 5.0769 puntos por cada hora adicional estudiada.

Podemos usar esta ecuación de regresión para estimar el puntaje de un estudiante dado en función del número de horas que estudió.

Por ejemplo, se prevé que un estudiante que estudia durante 3 horas obtenga una puntuación de:

Puntuación = 66,615 + 5,0769 * (3) = 81,85

¿Por qué se usa el sombrero Y?

El símbolo «sombrero» en las estadísticas se utiliza para denotar cualquier término que sea «estimado». Por ejemplo, ŷ se usa para denotar una variable de respuesta estimada.

Por lo general, cuando ajustamos modelos de regresión lineal, usamos una muestra de datos de una población, ya que es más conveniente y requiere menos tiempo que recopilar datos para cada observación posible en una población.

Entonces, cuando encontramos una ecuación de regresión, solo estamos estimando la verdadera relación entre una variable predictora y una variable de respuesta.

Es por eso que usamos el término ŷ en la ecuación de regresión en lugar de y.

Recursos adicionales

Introducción a la regresión lineal simple
Introducción a la regresión lineal múltiple
Introducción a las variables explicativas y de respuesta

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un diagrama de barras es útil para visualizar las cantidades de diferentes variables categóricas. A veces queremos crear un diagrama…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!