Submuestra: Definición

Actualizado por ultima vez el 7 de junio de 2022, por Luis Benites.

submuestraEn estadística, una submuestra es una muestra de una muestra. En otras palabras, una muestra es parte de una población y una submuestra es parte de una muestra.

Por ejemplo, supongamos que tiene una población de un millón de personas y utilizó un muestreo aleatorio simple para obtener una muestra de 1000 personas. Podría usar el muestreo aleatorio simple nuevamente en las 1,000 personas para obtener una porción más pequeña de 100 personas.

¿Por qué submuestra?

Una razón es dividir una muestra de manera justa y equitativa para un análisis posterior. Por ejemplo, supongamos que está realizando una encuesta en una muestra de 1000 personas con 10 entrevistadores. Sospecha que los entrevistadores pueden aportar sus propios sesgos a la entrevista, por lo que decide dividir la muestra al azar en 10 submuestras diferentes, cada una con 100 personas para cada entrevistador.

Submuestreo frente a remuestreo y división de muestras

La división de muestras es donde los datos se dividen por la mitad. La mitad de los datos se ajusta a un modelo de regresión penalizado (con regresión de lazo o similar) y la mitad restante de los datos se ajusta a mínimos cuadrados ordinarios . Una desventaja en comparación con el submuestreo es el menor poder estadístico y los resultados inciertos, que varían según la división que se elija para el análisis [1].

Si bien el submuestreo se puede realizar una vez, todos los métodos de remuestreo generalmente se realizan varias veces utilizando el mismo procedimiento, como bootstrap , validación cruzada o Jackknife [2, 3]. Esta no es una regla estricta: a veces , el submuestreo se usa como sinónimo de bootstrapping [4]. El remuestreo se puede hacer con reemplazo o sin reemplazo.

Referencias

[1] Breheny, P. (2013). Inferencia: enfoques de submuestreo y remuestreo. Recuperado el 27 de noviembre de 2021 de: https://myweb.uiowa.edu/pbreheny/7600/s16/notes/4-13.pdf
[2] McLapham, M. Métodos de remuestreo. Recuperado el 27 de noviembre de 2021 de: https://websites.pmc.ucsc.edu/~mclapham/Rtips/resampling
[3] Estadísticas computacionales en Python .
[4] Geyer, C. (2013). Bootstrap de submuestreo. Recuperado el 27 de noviembre de 2021 de: https://www.stat.umn.edu/geyer/5601/notes/sub.pdf

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

El término “estadística V” podría referirse a cualquiera de varias estadísticas . El que esté utilizando depende del tipo de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!