Contenido de este artículo
- 0
- 0
- 0
- 0
Se utiliza una prueba F parcial para determinar si existe una diferencia estadísticamente significativa entre un modelo de regresión y alguna versión anidada del mismo modelo.
Un modelo anidado es simplemente uno que contiene un subconjunto de las variables predictoras en el modelo de regresión general.
Por ejemplo, supongamos que tenemos el siguiente modelo de regresión con cuatro variables predictoras:
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
Un ejemplo de un modelo anidado sería el siguiente modelo con solo dos de las variables predictoras originales:
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
Para determinar si estos dos modelos son significativamente diferentes, podemos realizar una prueba F parcial.
Prueba F parcial: conceptos básicos
Una prueba F parcial calcula la siguiente estadística de prueba F:
F = ((RSS reducido – RSS completo ) / p) / (RSS completo / nk)
dónde:
- RSS reducido : La suma residual de cuadrados del modelo reducido (es decir, «anidado»).
- RSS completo : la suma residual de cuadrados del modelo completo.
- p: el número de predictores eliminados del modelo completo.
- n: el total de observaciones en el conjunto de datos.
- k: el número de coeficientes (incluida la intersección) en el modelo completo.
Tenga en cuenta que la suma de cuadrados residual siempre será menor para el modelo completo, ya que la adición de predictores siempre conducirá a una reducción del error.
Por lo tanto, una prueba F parcial esencialmente prueba si el grupo de predictores que eliminó del modelo completo es realmente útil y debe incluirse en el modelo completo.
Esta prueba utiliza las siguientes hipótesis nulas y alternativas:
H 0 : Todos los coeficientes eliminados del modelo completo son cero.
H A : Al menos uno de los coeficientes eliminados del modelo completo es distinto de cero.
Si el valor p correspondiente al estadístico de prueba F está por debajo de un cierto nivel de significancia (por ejemplo, 0.05), entonces podemos rechazar la hipótesis nula y concluir que al menos uno de los coeficientes eliminados del modelo completo es significativo.
Prueba F parcial: un ejemplo
En la práctica, utilizamos los siguientes pasos para realizar una prueba F parcial:
1. Ajuste el modelo de regresión completo y calcule RSS completo .
2. Ajuste el modelo de regresión anidado y calcule RSS reducido .
3. Realice un ANOVA para comparar el modelo completo y reducido, que producirá el estadístico de prueba F necesario para comparar los modelos.
Por ejemplo, el siguiente código muestra cómo ajustar los siguientes dos modelos de regresión en R usando datos del conjunto de datos integrado de mtcars :
Modelo completo: mpg = β 0 + β 1 disp + β 2 carb + β 3 hp + β 4 cyl
Modelo reducido: mpg = β 0 + β 1 disp + β 2 carb
#fit modelo completo model_full <- lm (mpg ~ disp + carb + hp + cyl, data = mtcars) #fit modelo reducido model_reduced <- lm (mpg ~ disp + carb, data = mtcars) # realizar ANOVA para probar las diferencias en los modelos anova (model_reduced, model_full) Tabla de análisis de varianza Modelo 1: mpg ~ disp + carb Modelo 2: mpg ~ disp + carb + hp + cyl Res.Df RSS Df Suma de Sq F Pr (> F) 1 29 254,82 2 27 238,71 2 16,113 0,9113 0,414
De la salida podemos ver que el estadístico de prueba F del ANOVA es 0.9113 y el valor p correspondiente es 0.414 .
Dado que este valor p no es menor que .05, no rechazaremos la hipótesis nula. Esto significa que no tenemos suficiente evidencia para decir que cualquiera de las variables predictoras hp o cyl sean estadísticamente significativas.
En otras palabras, agregar hp y cyl al modelo de regresión no mejora significativamente el ajuste del modelo.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: