regresión logística ordenada; Logit ordinal/ordenado

Actualizado por ultima vez el 19 de abril de 2022, por Luis Benites.

Es posible que desee leer este artículo primero: ¿Qué es el modelo Logit?

¿Qué es la regresión logística ordenada?

La regresión logística ordenada (también llamada modelo logit o modelo de enlace acumulativo ) es un subtipo de regresión logística donde se ordena la categoría Y. Se utiliza cuando su variable dependiente tiene:

  1. Un orden significativo, y
  2. Más de dos categorías (o niveles).

Los ejemplos de variables adecuadas incluyen:

  • Encuestas de opinión (de acuerdo/neutral/en desacuerdo),
  • Nivel socioeconómico (bajo/medio/alto),
  • Puntajes en una prueba (excelente/ promedio /pobre).
  • Tamaños de productos solicitados (grande, mediano, pequeño).

La regresión logística y la regresión logística ordenada difieren con los cálculos de probabilidades. Donde la regresión logística asigna probabilidades de que una variable tome un valor específico, logit ordenado asigna probabilidades de que los valores caigan por debajo de un cierto umbral.

Precauciones con el modelo logit ordenado

El uso de la regresión logística ordenada es una cuestión de criterio y puede que no sea la mejor opción para sus datos (Menard, 1997). El modelo, y sus resultados, pueden ser difíciles de entender para los legos. Dicho esto, suele ser el mejor método para analizar datos realmente ordenados.

Cuando utiliza este modelo, lo que básicamente está haciendo es tratar sus variables como si la estructura subyacente fuera una escala de intervalo o una escala de razón . Debe considerar todas las opciones antes de decidirse por un modelo logit:

  • Si tiene más de 5 categorías , considere tratar sus variables como variables continuas . A continuación, puede utilizar la regresión de mínimos cuadrados ordinarios .
  • Si no está seguro de si su variable está realmente ordenada (por ejemplo, tiene un gerente/subgerente/supervisor principal), tiene un par de opciones:
    1. Ignore la ordinalidad y utilice la regresión logística multinomial en su lugar. Sin embargo, tenga en cuenta que si utiliza modelos multinomiales para datos que están realmente ordenados, podría sobrestimar la cantidad de parámetros, lo que aumenta el riesgo de perder un resultado estadísticamente significativo .
    2. Trate la variable como ordenada y use el modelo slogit en su lugar.

Los límites borrosos entre todos estos análisis de regresión son la razón principal por la que decidir usar el modelo logit es una elección tan subjetiva y, a veces, desafiante.

Diferentes modelos

Existe una variedad de modelos logísticos ordenados. El que es más probable que encuentre, y el que utilizan la mayoría de los paquetes de software estadístico, es el modelo de probabilidades proporcionales . Este modelo asume que los coeficientes para cada nivel son los mismos. Si los coeficientes no son los mismos, los datos pueden manejarse mediante un modelo logístico ordenado generalizado o un modelo de probabilidades proporcionales parciales.

Otros modelos menos utilizados que se pueden usar para respuestas ordenadas incluyen:

  • Modelo de categoría adyacente
  • Modelo de relación de continuación
  • Modelo de elección heterogénea
  • Modelo logístico a escala de ubicación
  • El modelo elegido por McFadden
  • modelo de línea paralela
  • Regresión ordenada por rango
  • Modelo logístico estereotipado

Software

El modelo logit ordenado no suele calcularse a mano. La mayoría de los paquetes estadísticos tienen comandos para ejecutar el procedimiento, que incluyen:

  • Stata (use ologit ). Los valores numéricos representan las categorías. estos pueden ser cualquier número, pero cuanto mayor sea el número, mayor será el elemento. Por ejemplo: Malo (1), Aceptable (2), Excelente (3).
  • SAS: utilice PROC LOGÍSTICA.
  • R: Usa el paquete ‘Ordinal’ .

Referencias:
Menard, S. (1997) “Análisis de regresión logística aplicada”. SABIO.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

La distribución de Arfwedson es una distribución de probabilidad discreta para un problema de muestreo de urnas para dibujos sin…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!