Distribución de Wallenius: definición, ejemplos

Actualizado por ultima vez el 29 de agosto de 2021, por Luis Benites.

¿Qué es la distribución de Wallenius?

La distribución de Wallenius, más formalmente llamada distribución hipergeométrica no central de Wallenius , es una distribución con muestreo sesgado . Suele describirse como un modelo de urna sin reposición y con sesgo.

distribución de walleniusEn un modelo de urna general , se coloca un juego de bolas en una urna y las bolas se extraen una a la vez sin reemplazo . Si las bolas son idénticas, entonces el proceso no está sesgado y seguirá una distribución hipergeométrica. Sin embargo, un modelo de urna sesgado donde las bolas tienen diferentes pesos o tamaños afectará la probabilidad de que se elija una bola individual y, por lo tanto, producirá una distribución de Wallenius.
Un modelo de urna que sigue esta distribución tiene las siguientes características:

  1. Los elementos se eligen uno por uno de una población fija de diferentes elementos (por ejemplo, 100 bolas de diferentes colores).
  2. Hay un número fijo de intentos independientes (por ejemplo, bolas a elegir).
  3. Los artículos se eligen al azar y sin reemplazo.
  4. La probabilidad de elegir cualquier artículo en particular es igual a su fracción del peso o volumen total de todos los artículos. En otras palabras, una bola más pesada o más grande tendrá una mayor probabilidad de ser elegida.
  5. El sesgo de una bola (por ejemplo, su peso o volumen) depende únicamente de su color. En otras palabras, todas las bolas azules pesan lo mismo, todas las bolas rojas pesan lo mismo, todas las bolas verdes pesan lo mismo, etc.

Otro ejemplo de la distribución de Wallenius (¡uno que no involucra urnas!):
estás recogiendo 50 grillos con un par de pinzas grandes, uno a la vez, de una pequeña jaula llena de grillos verdes, negros y blancos. Los grillos verdes son los más grandes, seguidos por los negros y luego los grillos blancos. Como los grillos verdes son más grandes, tienen una mayor probabilidad de ser elegidos. La distribución de los tipos de grillos capturados será igual a la distribución hipergeométrica no central de Wallenius.

Desventajas

La distribución generalmente se considera ineficiente y numéricamente inestable. Fuera del modelado de escenarios teóricos de muestreo sesgado, solo es aplicable a unas pocas áreas muy estrechas como:

  • Depredación selectiva y supervivencia en ecología y biología evolutiva.
  • Eficacia de la vacuna.

Otras Distribuciones

Una distribución relacionada es la distribución hipergeométrica no central de Fisher, que usa el mismo modelo de urna excepto que las bolas se toman independientemente unas de otras. Se puede tomar un juego de bolas al mismo tiempo, mientras que en el modelo de Wallenius, las bolas se toman una por una.

Referencias
Fog, A. Teoría de la urna sesgada. Recuperado el 15 de julio de 2016 de: http://cran.r-project.org/web/packages/BiasedUrn/vignettes/UrnTheory.pdf.
Hernández-Suárez, CM y Castillo-Chávez, C. (2000). Modelos de urnas y
estimación de eficacia de vacunas. Estadísticas en Medicina 19, 827-835.
Varonil, BFJ (1985). Las Estadísticas de Selección Natural sobre Poblaciones Animales. Londres:
Chapman y Hal
Wallenius, KT (1963).
Muestreo sesgado: la distribución de probabilidad hipergeométrica no central . Doctor. tesis, Universidad de Stanford (También publicado con el mismo título que
el Informe técnico no. 70). Departamento de Estadística, Universidad de Stanford.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es la distribución gamma inversa? La distribución gamma inversa (también llamada distribución gamma invertida) es el recíproco de la…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!