Regresión logística multinomial: definición y ejemplos

Actualizado por ultima vez el 21 de febrero de 2022, por Luis Benites.

¿Qué es la regresión logística multinomial?

La regresión logística multinomial se usa cuando tiene una variable dependiente categórica con dos o más niveles desordenados (es decir, dos o más resultados discretos). Es prácticamente idéntico a la regresión logística , excepto que tiene múltiples resultados posibles en lugar de uno solo.

Por ejemplo, las elecciones de alimentos de los niños están influenciadas por las elecciones de sus padres y los pasatiempos de los niños (por ejemplo, entusiasta de los deportes versus jugador). Podría estudiar la relación entre las elecciones de alimentos de un niño con las elecciones de sus padres y los pasatiempos de los niños. Los niveles de la variable dependiente serían las diferentes opciones de alimentos (comida rápida, opciones saludables, llenas de proteínas, veganas, etc.). O podría estudiar cómo los niveles de educación de los trabajadores y el tiempo en el trabajo afectan las promociones. Las variables independientes serían los niveles de educación y el tiempo en el trabajo, y los niveles de la variable dependiente podrían ser la promoción a roles de líder de equipo, puestos de ventas o puestos gerenciales.

Se elige un nivel de la variable dependiente como categoría de referencia. Esta suele ser la categoría más común o más frecuente. En el primer ejemplo anterior, esto podría ser «comida rápida». La probabilidad de estar en cualquiera de las otras categorías se compara con la probabilidad de estar en la categoría de referencia. Estas probabilidades relativas son las probabilidades logarítmicas predichas (el logarítmico de las probabilidades).

Ejecución de regresión logística multinomial

Este tipo de regresión generalmente se realiza con software. Esencialmente, el software ejecutará una serie de regresiones logísticas binomiales individuales para M – 1 categorías (un cálculo para cada categoría, menos la categoría de referencia). Cuando M = 2, la regresión logística multinomial, la regresión logística ordenada y la regresión logística son iguales.

Antes de la llegada de los programas informáticos, se habrían realizado estas regresiones individuales y luego se habrían comparado los resultados. El software elimina esa tarea y estima los parámetros simultáneamente, lo que resulta en una mayor eficiencia .

Las suposiciones incluyen:

Interpretación de resultados

La regresión logística multinomial funciona de la misma manera que otros tipos de regresión: está buscando una relación entre las variables independientes y dependientes. La salida le dará conjuntos de coeficientes para cada variable. El resultado de cada paquete de software variará. UCLA tiene varios recursos excelentes sobre la interpretación de los resultados. Por ejemplo, salida anotada de SPSS y salida anotada de STATA .

Otros nombres

La regresión logística multinomial se conoce por una variedad de otros nombres:

  • modelo de máxima entropía condicional,
  • Clasificador de máxima entropía,
  • Regresión logística multiclase.
  • logit multinomial,
  • regresión logística politómica,
  • Regresión softmax.

Métodos similares

  • Regresión probit multinomial : tiene términos de error normales independientes.
  • Regresión logística ordinal : una mejor opción si está ordenada (el modelo será más parsimonioso ).
  • Análisis de función discriminante (grupos múltiples): para variables de resultado multinomiales.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

La prueba de bondad de ajuste se utiliza para comprobar si los datos de la muestra se ajustan a una…
statologos comunidad-2

You have Successfully Subscribed!