Prueba de Hosmer-Lemeshow: Definición

Actualizado por ultima vez el 3 de mayo de 2022, por Luis Benites.

Puede que le resulte útil leer este artículo primero: ¿Qué es la regresión logística?

¿Qué es la prueba de Hosmer-Lemeshow?

La prueba de Hosmer-Lemeshow (prueba HL) es una prueba de bondad de ajuste para la regresión logística, especialmente para los modelos de predicción de riesgo. Una prueba de bondad de ajuste le dice qué tan bien se ajustan sus datos al modelo. Específicamente, la prueba HL calcula si las tasas de eventos observadas coinciden con las tasas de eventos esperadas en los subgrupos de población.

La prueba solo se usa para variables de respuesta binaria (una variable con dos resultados, como vivo o muerto, sí o no).

Ejecutando la prueba

Primero se reagrupan los datos ordenando las probabilidades predichas y formando el número de grupos, g .
La estadística de prueba de Hosmer-Lemeshow se calcula con la siguiente fórmula (que es para el caso de 10 grupos; modifíquela para su número específico de grupos): Donde:
Prueba de Hosmer-Lemeshow

  • Χ 2 = chi cuadrado.
  • n j = número de observaciones en el j -ésimo grupo.
  • Oj = número de casos observados en el j ésimo grupo.
  • Oj = número de casos esperados en el j ésimo grupo.
  • Σ = notación de suma . Para la fórmula anterior, estamos sumando del 1 al 10. Modifique la suma para su número de grupos.

Esta prueba generalmente se ejecuta utilizando tecnología. La salida devuelve un valor de chi-cuadrado (un chi-cuadrado de Hosmer-Lemeshow) y un valor p (p. ej., Pr > ChiSq). Los valores p pequeños significan que el modelo no se ajusta bien.

Como la mayoría de las pruebas de bondad de ajuste, estos pequeños valores p (generalmente por debajo del 5 %) significan que su modelo no se ajusta bien. Pero los valores p grandes no significan necesariamente que su modelo se ajuste bien, solo que no hay suficiente evidencia para decir que se ajusta mal. Muchas situaciones pueden causar valores de p grandes, incluida una potencia de prueba deficiente . La baja potencia es una de las razones por las que esta prueba ha sido muy criticada.

Problemas con la prueba HL

Desde sus inicios, se han identificado varios problemas con la prueba HL. Por ejemplo, no tiene en cuenta el sobreajuste y tiende a tener poca potencia. También hay muy poca orientación para seleccionar el número de subgrupos. El número de subgrupos, g, generalmente se calcula mediante la fórmula g> P + 1.

Por ejemplo, si tuviera 12 covariables en su modelo, entonces g > 12. Cuánto más grande que 12 g debe ser esencialmente depende de usted. Los valores pequeños de g le dan a la prueba menos oportunidades de encontrar especificaciones erróneas. Los valores más grandes significan que la cantidad de elementos en cada subgrupo puede ser demasiado pequeña para encontrar diferencias entre los valores observados y esperados. A veces, cambiar g por cantidades muy pequeñas (por ejemplo, por 1 o 2) puede dar lugar a cambios bruscos en los valores de p. Como tal, la selección de g suele ser confusa y, en parte, arbitraria.

Hay otros problemas, incluidas las elecciones arbitrarias de contenedores . Como tal, la prueba generalmente no se recomienda.

Referencias

Hosmer, DW, Jr., SA Lemeshow y RX Sturdivant. 2013. Regresión Logística Aplicada . 3ra ed. Hoboken, Nueva Jersey: Wiley.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Un residuo estandarizado es un residuo que ha sido dividido por su desviación estándar. Se calcula como: r yo =…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!