Modelo de mezcla gaussiana: definición simple

Actualizado el 30 de mayo de 2022, por Luis Benites.

GMM

Un modelo de mezcla gaussiana.

Un modelo de mezcla gaussiana es una distribución ensamblada a partir de distribuciones gaussianas* multivariadas ponderadas. Los factores de ponderación asignan a cada distribución diferentes niveles de importancia. El modelo resultante es una superposición (es decir, una superposición) de curvas en forma de campana.

Los modelos de mezcla gaussiana son semiparamétricos . Paramétrico implica que el modelo proviene de una distribución conocida (que en este caso es un conjunto de distribuciones normales). Es semiparamétrico porque se pueden agregar al modelo más componentes, posiblemente de distribuciones desconocidas.

Usos

Los GMM se utilizan ampliamente para la estimación de densidad y agrupamiento en física . Sin embargo, tienen una amplia gama de aplicaciones en otros campos, como el modelado de observaciones meteorológicas en geociencias (Zi, 2011), ciertos modelos autorregresivos o el ruido de algunas series temporales .

Si cree que sus datos provienen de un conjunto de diferentes distribuciones normales, entonces el GMM es una herramienta de análisis adecuada. La distribución normal es una suposición subyacente , lo que significa que, si bien se supone que las distribuciones son gaussianas, es posible que no lo sean. En algunos casos, es posible que no pueda saberlo, pero use la lógica o el conocimiento previo para asumir que sus datos tienen una distribución normal. Por lo tanto, los modelos creados a partir de métodos GMM conllevan un cierto nivel de incertidumbre. Sin embargo, es fácil de usar (el software más popular tiene la capacidad de producir GMM) y, en comparación con el modelado no paramétrico , es relativamente simple.

En la mayoría de los casos, usará software para crear modelos de mezcla gaussiana. La agrupación, K-means e ISODATA se basan en el modelo de mezcla gaussiana.

La fórmula básica para un GMM con m componentes es:
modelo de mezcla gaussiana

*Nota: En estadística, la distribución gaussiana se denomina distribución normal o curva normal. En las ciencias sociales, se llama curva de campana.

Referencias:
Li, Z. Aplicaciones del Modelo de Mezcla Gaussiana a las Observaciones Meteorológicas . IEEE Geoscience and Remote Sensing Letters (Volumen: 8, Número: 6, noviembre de 2011)
McLachlan, G. & Peel, D. (2000). Modelos de mezcla finita . Wiley-Interscience.

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Deja un comentario en el muro del agradecimiento para que todos sepán que Statologos explica mejor y facil y si te es viable puedes hacer una donación:

Puedes hacer un donativo
Muro del agradecimiento

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

¿Qué es un gráfico espectral? Un gráfico espectral es un gráfico que nos permite examinar la estructura cíclica, en el…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!