¿Qué es una prueba F parcial?

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Se utiliza una prueba F parcial para determinar si existe una diferencia estadísticamente significativa entre un modelo de regresión y alguna versión anidada del mismo modelo.

Un modelo anidado es simplemente uno que contiene un subconjunto de las variables predictoras en el modelo de regresión general.

Por ejemplo, supongamos que tenemos el siguiente modelo de regresión con cuatro variables predictoras:

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

Un ejemplo de un modelo anidado sería el siguiente modelo con solo dos de las variables predictoras originales:

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

Para determinar si estos dos modelos son significativamente diferentes, podemos realizar una prueba F parcial.

Prueba F parcial: conceptos básicos

Una prueba F parcial calcula la siguiente estadística de prueba F:

F = ((RSS reducido – RSS completo ) / p) / (RSS completo / nk)

dónde:

  • RSS reducido : La suma residual de cuadrados del modelo reducido (es decir, «anidado»).
  • RSS completo : la suma residual de cuadrados del modelo completo.
  • p: el número de predictores eliminados del modelo completo.
  • n: el total de observaciones en el conjunto de datos.
  • k: el número de coeficientes (incluida la intersección) en el modelo completo.

Tenga en cuenta que la suma de cuadrados residual siempre será menor para el modelo completo, ya que la adición de predictores siempre conducirá a una reducción del error.

Por lo tanto, una prueba F parcial esencialmente prueba si el grupo de predictores que eliminó del modelo completo es realmente útil y debe incluirse en el modelo completo.

Esta prueba utiliza las siguientes hipótesis nulas y alternativas:

H 0 : Todos los coeficientes eliminados del modelo completo son cero.

H A : Al menos uno de los coeficientes eliminados del modelo completo es distinto de cero.

Si el valor p correspondiente al estadístico de prueba F está por debajo de un cierto nivel de significancia (por ejemplo, 0.05), entonces podemos rechazar la hipótesis nula y concluir que al menos uno de los coeficientes eliminados del modelo completo es significativo.

Prueba F parcial: un ejemplo

En la práctica, utilizamos los siguientes pasos para realizar una prueba F parcial:

1. Ajuste el modelo de regresión completo y calcule RSS completo .

2. Ajuste el modelo de regresión anidado y calcule RSS reducido .

3. Realice un ANOVA para comparar el modelo completo y reducido, que producirá el estadístico de prueba F necesario para comparar los modelos.

Por ejemplo, el siguiente código muestra cómo ajustar los siguientes dos modelos de regresión en R usando datos del conjunto de datos integrado de mtcars :

Modelo completo: mpg = β 0 + β 1 disp + β 2 carb + β 3 hp + β 4 cyl

Modelo reducido: mpg = β 0 + β 1 disp + β 2 carb

#fit modelo completo
model_full <- lm (mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit modelo reducido
 model_reduced <- lm (mpg ~ disp + carb, data = mtcars)

# realizar ANOVA para probar las diferencias en los modelos
 anova (model_reduced, model_full)

Tabla de análisis de varianza

Modelo 1: mpg ~ disp + carb
Modelo 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Suma de Sq F Pr (> F)
1 29 254,82                           
2 27 238,71 2 16,113 0,9113 0,414

De la salida podemos ver que el estadístico de prueba F del ANOVA es 0.9113 y el valor p correspondiente es 0.414 .

Dado que este valor p no es menor que .05, no rechazaremos la hipótesis nula. Esto significa que no tenemos suficiente evidencia para decir que cualquiera de las variables predictoras hp o cyl sean estadísticamente significativas.

En otras palabras, agregar hp y cyl al modelo de regresión no mejora significativamente el ajuste del modelo.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Uno de los errores más comunes que encontrará en R es: columnas indefinidas seleccionadas Este error ocurre cuando intenta seleccionar…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!