Proceso de restaurante chino: definición simple y ejemplo

Actualizado por ultima vez el 2 de diciembre de 2021, por Luis Benites.

El proceso del restaurante chino es una forma metafórica de cómo un proceso de Dirichlet genera datos. El proceso de Dirichlet modela la aleatoriedad de una función de masa de probabilidad (PMF) con opciones ilimitadas (por ejemplo, una cantidad ilimitada de dados en una bolsa). Se llama específicamente Proceso de restaurante chino porque los creadores del algoritmo, Jim Pitman y Lester Dubins, lo llamaron después de ver restaurantes chinos masivos en el barrio chino de San Francisco (Aldous, 1983; Stanford 2016).

Ejemplo simple del proceso de un restaurante chino

El siguiente ejemplo (adaptado de Bello et al, 2008) es tan simple como parece. No caiga en la tentación de tratar de asignar probabilidades simples como 1/8 o 4/32 a las tablas. Aquí se trata de cantidades infinitas, por lo que las técnicas habituales de probabilidad no funcionan. De hecho, calcular la probabilidad de sentarse en cualquier mesa de un número infinito de mesas implica el uso de un hiperparámetro escalar positivo y lleva mucho tiempo resolverlo, incluso para una computadora. Para obtener más información sobre la elección de hiperprámetros, consulte Amir-Ahmadi et. Selección de hiperparámetros previos de al .


En el ejemplo anterior, los clientes 1, 3, 4 y 7 están sentados en mesas vacías; los clientes 2, 5, 6 y 8 están sentados en las mesas existentes. El número de mesas en el restaurante es infinito.

Cuando el cliente 1 entra, puede sentarse donde quiera. El cliente 2 puede sentarse en cualquier asiento vacío, con las siguientes probabilidades:

  • Tabla 1 : 1 / (1 + α)
  • Nueva tabla (es decir, cualquier tabla vacía): α / (1 + α)

Las probabilidades de dónde se sentará el cliente 9 son las siguientes:

  • Tabla 1: 3 / (8 + α)
  • Tabla 2: 1 / (8 + α)
  • Tabla 3: 3 / (8 + α)
  • Tabla 4: 1 / (8 + α)
  • Nueva Tabla: α / (8 + α)

El numerador es el número de personas que ya se sentaron en una mesa en particular, y el denominador es el número de clientes en el restaurante ( i – 1) más α (un hiperparámetro escalar positivo , que se establece antes de que comience el proceso).

  • La probabilidad de que el i -ésimo cliente se siente en una mesa existente es n k / (α + i – 1),
  • La probabilidad de que el i -ésimo cliente se siente en una mesa nueva es α / (α + i – 1).

A medida que más personas se sientan en una mesa en particular, esas mesas aumentan en popularidad, por lo que es menos probable que los nuevos clientes se sienten en mesas vacías.

Referencias

Aldous, DJ (1985). “Intercambiabilidad y temas relacionados”. École d’Été de Probabilités de Saint-Flour XIII – 1983. Apuntes de clase de matemáticas. 1117. págs. 1–1.
Amir-Ahmadi et. al (2016). Elección de hiperparámetros previos. Recuperado el 13 de febrero de 2018 de: https://www.richmondfed.org/-/media/richmondfedorg/publications/research/working_papers/2016/pdf/wp16-09.pdf
Bello, J. et. al (2008). ISMIR 2008: Actas de la 9ª Conferencia Internacional de Recuperación de Información Musical. Prensa Lulú.
Universidad de Stanford (2016). Mirador del restaurante chino. Recuperado el 13 de febrero de 2018 de: https://cs.stanford.edu/~ppasupat/a9online/1083.html

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

La prueba de rachas (también llamada prueba de rachas de una muestra de Wald-Wolfowitz) le dirá si el orden de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!