Distribución de Wallenius: definición, ejemplos

Actualizado por ultima vez el 29 de agosto de 2021, por Luis Benites.

¿Qué es la distribución de Wallenius?

La distribución de Wallenius, más formalmente llamada distribución hipergeométrica no central de Wallenius , es una distribución con muestreo sesgado . Suele describirse como un modelo de urna sin reposición y con sesgo.

distribución de wallenius

  1. Los elementos se eligen uno por uno de una población fija de diferentes elementos (por ejemplo, 100 bolas de diferentes colores).
  2. Hay un número fijo de intentos independientes (por ejemplo, bolas a elegir).
  3. Los artículos se eligen al azar y sin reemplazo.
  4. La probabilidad de elegir cualquier artículo en particular es igual a su fracción del peso o volumen total de todos los artículos. En otras palabras, una bola más pesada o más grande tendrá una mayor probabilidad de ser elegida.
  5. El sesgo de una bola (por ejemplo, su peso o volumen) depende únicamente de su color. En otras palabras, todas las bolas azules pesan lo mismo, todas las bolas rojas pesan lo mismo, todas las bolas verdes pesan lo mismo, etc.

Otro ejemplo de la distribución de Wallenius (¡uno que no involucra urnas!):
estás recogiendo 50 grillos con un par de pinzas grandes, uno a la vez, de una pequeña jaula llena de grillos verdes, negros y blancos. Los grillos verdes son los más grandes, seguidos por los negros y luego los grillos blancos. Como los grillos verdes son más grandes, tienen una mayor probabilidad de ser elegidos. La distribución de los tipos de grillos capturados será igual a la distribución hipergeométrica no central de Wallenius.

Desventajas

La distribución generalmente se considera ineficiente y numéricamente inestable. Fuera del modelado de escenarios teóricos de muestreo sesgado, solo es aplicable a unas pocas áreas muy estrechas como:

  • Depredación selectiva y supervivencia en ecología y biología evolutiva.
  • Eficacia de la vacuna.

Otras Distribuciones

Una distribución relacionada es la distribución hipergeométrica no central de Fisher, que usa el mismo modelo de urna excepto que las bolas se toman independientemente unas de otras. Se puede tomar un juego de bolas al mismo tiempo, mientras que en el modelo de Wallenius, las bolas se toman una por una.

Referencias
Fog, A. Teoría de la urna sesgada. Recuperado el 15 de julio de 2016 de: http://cran.r-project.org/web/packages/BiasedUrn/vignettes/UrnTheory.pdf.
Hernández-Suárez, CM y Castillo-Chávez, C. (2000). Modelos de urnas y
estimación de eficacia de vacunas. Estadísticas en Medicina 19, 827-835.
Varonil, BFJ (1985). Las Estadísticas de Selección Natural sobre Poblaciones Animales. Londres:
Chapman y Hal
Wallenius, KT (1963).
Muestreo sesgado: la distribución de probabilidad hipergeométrica no central . Doctor. tesis, Universidad de Stanford (También publicado con el mismo título que
el Informe técnico no. 70). Departamento de Estadística, Universidad de Stanford.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es la distribución gamma inversa? La distribución gamma inversa (también llamada distribución gamma invertida) es el recíproco de la…
statologos comunidad-2

You have Successfully Subscribed!