Técnicas de remuestreo

Actualizado por ultima vez el 22 de septiembre de 2021, por Luis Benites.

Las técnicas de remuestreo son un conjunto de métodos para repetir el muestreo de una muestra o población determinada , o una forma de estimar la precisión de una estadística. Aunque el método suena desalentador, las matemáticas involucradas son relativamente simples y solo requieren una comprensión de álgebra de nivel secundario.

Informalmente, volver a muestrear puede significar algo un poco más simple: repetir cualquier método de muestreo. Por ejemplo, si está realizando una prueba de razón de probabilidad secuencial y no llega a una conclusión, vuelva a muestrear y ejecutar la prueba. Sin embargo, para la mayoría de las intenciones y propósitos, si lee sobre el remuestreo (en lugar de «remuestreo»), lo más probable es que el autor esté hablando de una técnica de remuestreo específica.

Técnicas específicas de remuestreo

Las principales técnicas son:

  1. Bootstrapping y Normal resampling (muestreo a partir de una distribución normal).
  2. Remuestreo de permutación (también llamado Reordenamientos o Realeatorización),
  3. Validación cruzada .

1. Bootstrapping y remuestreo normal

Bootstrapping es un tipo de remuestreo en el que se extraen repetidamente grandes cantidades de muestras más pequeñas del mismo tamaño, con reemplazo, a partir de una única muestra original. El remuestreo normal es muy similar al bootstrapping, ya que es un caso especial del modelo de cambio normal, uno de los supuestos del bootstrapping (Westfall et al., 1993). Tanto el bootstrapping como el remuestreo normal suponen que las muestras se extraen de una población real (ya sea real o teórica). Otra similitud es que ambas técnicas utilizan muestreo con reemplazo .

Idealmente, le gustaría extraer muestras grandes y no repetidas de una población para crear una distribución de muestreo para una estadística. Sin embargo, los recursos limitados pueden impedirle obtener la estadística ideal. Remuestrear significa que puede extraer pequeñas muestras una y otra vez de la misma población. Además de ahorrar tiempo y dinero, las muestras pueden ser aproximaciones bastante buenas para los parámetros de la población.

2. Remuestreo de permutación

A diferencia del arranque, el remuestreo de permutación no necesita ninguna «población»; el remuestreo depende únicamente de la asignación de unidades a los grupos de tratamiento. El hecho de que se trate de muestras reales, en lugar de poblaciones, es una de las razones por las que a veces se la denomina técnica de arranque estándar de oro (Strawderman y Mehr, 1990). Otra diferencia importante es que el remuestreo por permutación es una técnica de muestreo sin reemplazo .

3. Validación cruzada

La validación cruzada es una forma de validar un modelo predictivo. Se eliminan subconjuntos de datos para usarlos como un conjunto de validación; los datos restantes se usan para formar un conjunto de entrenamiento, que se usa para predecir el conjunto de validación.

Referencias

Bueno, P. (2006). Métodos de remuestreo: una guía práctica para el análisis de datos. Springer Science & Business Media.
Strawderman y Mehta (1990). Sobre la validación de pruebas exactas en paquetes de software. Manuscrito inédito.
Westfall, P. y otros, (1993). Pruebas múltiples basadas en remuestreo: ejemplos y métodos para el ajuste del valor P. John Wiley & Sons.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

El efecto suelo es lo que sucede cuando hay un límite inferior artificial, por debajo del cual no se pueden…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!