Prueba de Hosmer-Lemeshow: Definición

Contenido de este artículo

1 ¿Qué es la prueba de Hosmer-Lemeshow?
2 Ejecutando la prueba
3 Problemas con la prueba HL
4 Referencias
5 Redactor del artículo
6 ¿Te hemos ayudado?

Actualizado el 3 de mayo de 2022, por Luis Benites.

Puede que le resulte útil leer este artículo primero: ¿Qué es la regresión logística?

¿Qué es la prueba de Hosmer-Lemeshow?

La prueba de Hosmer-Lemeshow (prueba HL) es una prueba de bondad de ajuste para la regresión logística, especialmente para los modelos de predicción de riesgo. Una prueba de bondad de ajuste le dice qué tan bien se ajustan sus datos al modelo. Específicamente, la prueba HL calcula si las tasas de eventos observadas coinciden con las tasas de eventos esperadas en los subgrupos de población.

La prueba solo se usa para variables de respuesta binaria (una variable con dos resultados, como vivo o muerto, sí o no).

Ejecutando la prueba

Primero se reagrupan los datos ordenando las probabilidades predichas y formando el número de grupos, g .
La estadística de prueba de Hosmer-Lemeshow se calcula con la siguiente fórmula (que es para el caso de 10 grupos; modifíquela para su número específico de grupos): Donde:

Χ ² = chi cuadrado.
n _j = número de observaciones en el j ^-ésimo grupo.
Oj = número de casos observados en el j _– ^ésimo grupo.
Oj = número de casos esperados en el j _– ^ésimo grupo.
Σ = notación de suma . Para la fórmula anterior, estamos sumando del 1 al 10. Modifique la suma para su número de grupos.

Esta prueba generalmente se ejecuta utilizando tecnología. La salida devuelve un valor de chi-cuadrado (un chi-cuadrado de Hosmer-Lemeshow) y un valor p (p. ej., Pr > ChiSq). Los valores p pequeños significan que el modelo no se ajusta bien.

Como la mayoría de las pruebas de bondad de ajuste, estos pequeños valores p (generalmente por debajo del 5 %) significan que su modelo no se ajusta bien. Pero los valores p grandes no significan necesariamente que su modelo se ajuste bien, solo que no hay suficiente evidencia para decir que se ajusta mal. Muchas situaciones pueden causar valores de p grandes, incluida una potencia de prueba deficiente . La baja potencia es una de las razones por las que esta prueba ha sido muy criticada.

Problemas con la prueba HL

Desde sus inicios, se han identificado varios problemas con la prueba HL. Por ejemplo, no tiene en cuenta el sobreajuste y tiende a tener poca potencia. También hay muy poca orientación para seleccionar el número de subgrupos. El número de subgrupos, g, generalmente se calcula mediante la fórmula g> P + 1.

Por ejemplo, si tuviera 12 covariables en su modelo, entonces g > 12. Cuánto más grande que 12 g debe ser esencialmente depende de usted. Los valores pequeños de g le dan a la prueba menos oportunidades de encontrar especificaciones erróneas. Los valores más grandes significan que la cantidad de elementos en cada subgrupo puede ser demasiado pequeña para encontrar diferencias entre los valores observados y esperados. A veces, cambiar g por cantidades muy pequeñas (por ejemplo, por 1 o 2) puede dar lugar a cambios bruscos en los valores de p. Como tal, la selección de g suele ser confusa y, en parte, arbitraria.

Hay otros problemas, incluidas las elecciones arbitrarias de contenedores . Como tal, la prueba generalmente no se recomienda.

Referencias

Hosmer, DW, Jr., SA Lemeshow y RX Sturdivant. 2013. Regresión Logística Aplicada . 3ra ed. Hoboken, Nueva Jersey: Wiley.

Redactor del artículo

Luis Benites
Director de Statologos.com
Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Equipo de Statologos

Luis Benites

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Director de Statologos.com
Dereck Amesquita

I am a Bachelor of Science in Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.
Statistics content writer
Cisco Pfoccori

15 años haciendo SEO, monetizando, haciendo nichos y ayudando a empresas a mejoras sus estrategia digital. Pueden contactarme si necesitan mejorar su digitalización, actualmente trabajo para CirculoSEO.
Editor de contenido y SEO

¿Qué es la prueba de Hosmer-Lemeshow?

Ejecutando la prueba

Problemas con la prueba HL

Referencias

Redactor del artículo

¿Te hemos ayudado?

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!