Cómo crear e interpretar una curva ROC en SPSS

La regresión logística es un método estadístico que utilizamos para ajustar un modelo de regresión cuando la variable de respuesta es binaria. Para evaluar qué tan bien se ajusta un modelo de regresión logística a un conjunto de datos, podemos observar las siguientes dos métricas:

  • Sensibilidad: la probabilidad de que el modelo prediga un resultado positivo para una observación cuando en realidad el resultado es positivo.
  • Especificidad: La probabilidad de que el modelo prediga un resultado negativo para una observación cuando en realidad el resultado es negativo.

Una forma fácil de visualizar estas dos métricas es creando una curva ROC , que es un gráfico que muestra la sensibilidad y especificidad de un modelo de regresión logística.

Este tutorial explica cómo crear e interpretar una curva ROC en SPSS.

Ejemplo: curva ROC en SPSS

Supongamos que tenemos el siguiente conjunto de datos que muestra si un jugador de baloncesto fue reclutado o no en la NBA (0 = no, 1 = sí) junto con su promedio de puntos por juego en la universidad:

Para crear una curva ROC para este conjunto de datos, haga clic en la pestaña Analizar , luego en Clasificar , luego en Curva ROC :

En la nueva ventana que aparece, arrastre el borrador de la variable al cuadro etiquetado como Variable de estado. Defina el valor de la variable de estado en 1 . (Este es el valor que indica que un jugador fue reclutado). Arrastre los puntos variables al cuadro etiquetado como Variable de prueba.

Marque las casillas junto a Con línea de referencia diagonal y Puntos de coordenadas de la curva ROC . Luego haga clic en Aceptar .

A continuación se explica cómo interpretar la salida:

Resumen de procesamiento de casos:

Esta tabla muestra el número total de casos positivos y negativos en el conjunto de datos. En este ejemplo, 8 jugadores fueron seleccionados (resultado positivo) y 6 jugadores no fueron seleccionados (resultado negativo):

Interpretación de la curva ROC en SPSS

Curva ROC:

La curva ROC (Receiver Operating Characteristic) es un gráfico de los valores de sensibilidad frente a 1-especificidad a medida que el valor del punto de corte se mueve de 0 a 1:

Curva ROC en SPSS

Un modelo con alta sensibilidad y alta especificidad tendrá una curva ROC que abraza la esquina superior izquierda del gráfico. Un modelo con baja sensibilidad y baja especificidad tendrá una curva cercana a la línea diagonal de 45 grados.

Podemos ver que la curva ROC (la línea azul) en este ejemplo abraza la esquina superior izquierda de la trama, lo que indica que el modelo hace un buen trabajo al predecir si los jugadores serán reclutados o no, en función de su promedio de puntos por juego. .

Área bajo la curva:

El área bajo la curva nos da una idea de qué tan bien el modelo es capaz de distinguir entre resultados positivos y negativos. El AUC puede variar de 0 a 1. Cuanto mayor sea el AUC, mejor será el modelo para clasificar correctamente los resultados.

AUC en la curva ROC en SPSS

Podemos ver que el AUC para este modelo de regresión logística en particular es .948 , que es extremadamente alto. Esto indica que el modelo hace un buen trabajo al predecir si un jugador será seleccionado o no.

Coordenadas de la curva:

Esta última tabla muestra la sensibilidad y 1 – especificidad de la curva ROC para varios puntos de corte.

Interpretación de coordenadas de la curva en regresión logística en SPSS

Por ejemplo:

Si permitimos que el punto de corte sea 8.50 , esto significa que predecimos que cualquier jugador que obtenga menos de 8.50 puntos por juego no será seleccionado, y cualquier jugador que obtenga más de 8.50 puntos por juego será seleccionado.

Usando esto como un punto de corte, nuestra sensibilidad sería del 100% (ya que cada jugador que anotó menos de 8.50 puntos por juego de hecho no fue seleccionado) y nuestra especificidad 1 sería del 66.7% (ya que 8 de cada 12 jugadores que anotaron más de 8,50 puntos por partido en realidad fueron seleccionados).

La tabla anterior nos permite ver la sensibilidad y la especificidad 1 para cada punto de corte potencial.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Una puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor dado de la media. La puntuación z…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!