Estadística C: definición, ejemplos, ponderación y significado

Actualizado por ultima vez el 8 de abril de 2022, por Luis Benites.

Es posible que desee leer este artículo primero: ¿Qué es una curva característica operativa del receptor (ROC)? .

¿Qué es una estadística C?

C-estadística

La estadística de concordancia es igual al área bajo una curva ROC.

La estadística C (a veces llamada estadística de «concordancia» o índice C) es una medida de bondad de ajuste para resultados binarios en un modelo de regresión logística . En estudios clínicos, la estadística C da la probabilidad de que un paciente seleccionado al azar que experimentó un evento (por ejemplo, una enfermedad o afección) tuviera una puntuación de riesgo más alta que un paciente que no experimentó el evento. Es igual al área bajo la curva de características operativas del receptor (ROC) y varía de 0,5 a 1.

  • Un valor por debajo de 0,5 indica un modelo muy pobre.
  • Un valor de 0,5 significa que el modelo no es mejor para predecir un resultado que el azar.
  • Valores superiores a 0,7 indican un buen modelo.
  • Valores superiores a 0,8 indican un modelo fuerte.
  • Un valor de 1 significa que el modelo predice perfectamente qué miembros del grupo experimentarán un determinado resultado y quiénes no.

La estadística C no se usa con mucha frecuencia ya que solo le da una idea general sobre un modelo; Una curva ROC contiene mucha más información sobre precisión , sensibilidad y especificidad .

Ponderación

Se usa un índice c ponderado cuando el costo de no predecir un resultado positivo (como una prueba para el cáncer) es mayor que el beneficio de predecir correctamente un resultado negativo. La ponderación penaliza los modelos que generan pequeñas diferencias de probabilidad para resultados positivos y negativos, pero no cambia el valor de la estadística C. También se puede utilizar para ajustar el muestreo aleatorio estratificado .

Significancia estadística

Como la mayoría de las estadísticas, la estadística C a veces se combina con un intervalo de confianza . Por ejemplo, podría tener un resultado de 0,63 con un intervalo de confianza que oscila entre 0,53 y 0,73). En general, cualquier resultado no es significativo si incluye 0,5, incluso si incluye la estadística C relevante. Por ejemplo, un resultado de 0,63 con un IC entre 0,43 y 0,83 no sería significativo porque incluye 0,5 en ese rango.

Referencia :
Hosmer DW, Lemeshow S. Regresión logística aplicada (2ª edición) . Nueva York, NY: John Wiley & Sons; 2000.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Los mínimos cuadrados regularizados son una forma de resolver problemas de regresión de mínimos cuadrados con una restricción adicional en…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!