Selección hacia adelante: Definición

Actualizado por ultima vez el 28 de febrero de 2022, por Luis Benites.

La selección hacia adelante es un tipo de regresión paso a paso que comienza con un modelo vacío y agrega variables una por una. En cada paso adelante, agrega la única variable que brinda la mejor mejora individual a su modelo.

Es uno de los dos métodos comúnmente utilizados de regresión por pasos; el otro es eliminación hacia atrás , y es casi opuesto. En eso, comienza con un modelo que incluye todas las variables posibles y elimina las variables extrañas una por una.

Método general detrás de la selección directa

La selección hacia adelante generalmente comienza con solo una intercepción. Uno prueba las diversas variables que pueden ser relevantes, y la variable ‘mejor’, donde «mejor» está determinada por algunos criterios predeterminados, se agrega al modelo.

A medida que el modelo continúa mejorando (según ese mismo criterio), continuamos el proceso, agregando una variable a la vez y probando en cada paso. Una vez que el modelo ya no mejora al agregar más variables, el proceso se detiene.

El criterio utilizado para determinar qué variable entra cuando se varían. Podría estar intentando encontrar la puntuación más baja en la validación cruzada , el valor p más bajo o cualquiera de otras pruebas o medidas de precisión.

Dado que la regresión por pasos tiende a sobreajustarse, lo que sucede cuando ponemos más variables de las que realmente son buenas para el modelo; por lo general, muestra un ajuste muy cercano y nítido de los datos utilizados en la regresión, pero el modelo estará lejos de los puntos de datos adicionales y no será bueno para la interpolación. Por lo tanto, generalmente es bueno tener criterios estrictos para agregar cualquier variable.

Referencias

Brant, Rollin. Selección de avance. MDSC 643.02 Materiales de lectura. Obtenido de
https://www.stat.ubc.ca/~rollin/teach/643w04/lec/node41.html el 7 de julio de 2018
Cook, Perry. Selección por pasos. Notas de clase de tecnología de interfaz hombre-computadora (CS436). Recuperado de
https://www.cs.princeton.edu/courses/archive/fall08/cos436/Duda/FS/stepwise.htm el 8 de julio de 2018.
Shalizi, Cosma. Lección 26: Selección de Variables . Regresión moderna para notas de clase de estudiantes universitarios.
http://www.stat.cmu.edu/~cshalizi/mreg/15/lectures/26/lecture-26.pdf
Soporte SAS. Selección de avance. El procedimiento GLMSELECT. Obtenido de http://support.sas.com/documentation/cdl/en/statug/66859/HTML/default/viewer.htm#statug_glmselect_details03.htm el 8 de julio de 2018.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es un árbol de decisión? Un árbol de decisión es un tipo muy específico de árbol de probabilidad que…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!