Estimador de razón

Actualizado por ultima vez el 27 de agosto de 2021, por Luis Benites.

Un estimador de razón , comúnmente utilizado en el muestreo de encuestas, es una razón de las medias de dos variables aleatorias . Están sesgados , por lo que se deben hacer correcciones de error al usarlos en experimentos.
estimador de razón

¿Por qué usar un estimador de razón?

Un par de circunstancias podrían llevarlo a usar un estimador de razón en lugar de un estimador más simple :

  1. Si y y x están muy linealmente correlacionados a través del origen (es decir, x contribuye a predecir y),
  2. Si no conoce el número de elementos de la población .

Estadísticas auxiliares

Las estadísticas auxiliares se pueden usar para calcular estadísticas difíciles de obtener, con el uso de un estimador de razón. Una variable auxiliar es una variable x fácil de estudiar, que se utiliza para recopilar información sobre la variable objetivo y más difícil de investigar. Por ejemplo (Borkowski, sin fecha):

Variable de Interés Auxiliar
Cantidad de madera que produce un árbol Diámetro del árbol
nivel de ingresos de una persona de 50 años número de años de educación completados
número de granjas por condado en los EE. UU. número de granjas por condado en el censo anterior

Históricamente, John Graunt (1662) fue la primera persona en utilizar la relación de estimación de razón y/x, para la población total y y los nacimientos registrados (la variable auxiliar x), en la misma área para el año anterior (Sen, 1993). Laplace usó un método similar en un momento posterior para medir la población total de Francia. No había un censo en ese momento, por lo que Laplace tomó una muestra de 30 comunidades francesas y obtuvo la siguiente información:

  • norte = 30
  • población comunitaria = 2.037.615.

Información adicional (auxiliar) que Laplace obtuvo de los registros del gobierno:

  • Total de nacimientos registrados para n = 71.866,33.

Dividiendo la población de la comunidad por el número real de nacimientos registrados:

  • 2.037.615 / 71.866,33 = 28,35.

Sólo hubo un nacimiento registrado por cada 28,35 personas. Laplace usó esta información auxiliar para producir una fórmula que estimaba la población total en Francia:
Población total = número total de nacimientos anuales * 28,35

Precauciones

El sesgo y la varianza de un estimador de razón disminuyen rápidamente a medida que aumenta el tamaño de la muestra (en el que se basan). Por lo tanto, el error cuadrático medio para el estimador de razón, o el estimador de una razón, también disminuye rápidamente.

A veces, es ventajoso estratificar la población antes de usar un estimador de razón (Scheaffer, 2011). Sin embargo, los tamaños de muestra pequeños dentro de los estratos pueden generar problemas de sesgo. Este efecto se puede reducir utilizando un estimador de razón combinado (es decir, utilizando un estimador promedio en todas las muestras).

Referencias

Borkowski, J. Razón y Estimación de Regresión. http://www.math.montana.edu/jobo/st446/documents/ho5a.pdf
Scheaffer, R. et al. (2011). Muestreo de Encuestas Elementales. Aprendizaje Cengage.
Sen, A. (1993). Algunos desarrollos tempranos en la estimación de razones. https://doi.org/10.1002/bimj.4710350102

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es el sesgo de espectro? El sesgo de espectro (o sesgo de mezcla de casos ) es la variabilidad…
statologos comunidad-2

You have Successfully Subscribed!