Cómo realizar una regresión logística en SPSS

La regresión logística es un método que utilizamos para ajustar un modelo de regresión cuando la variable de respuesta es binaria.

Este tutorial explica cómo realizar una regresión logística en SPSS.

Ejemplo: regresión logística en SPSS

Utilice los siguientes pasos para realizar una regresión logística en SPSS para un conjunto de datos que muestre si los jugadores de baloncesto universitario fueron reclutados o no en la NBA (draft: 0 = no, 1 = sí) según su promedio de puntos por juego y nivel de división.

Paso 1: Ingrese los datos.

Primero, ingrese los siguientes datos:

Paso 2: Realice una regresión logística.

Haga clic en la pestaña Analizar , luego en Regresión , luego en Regresión logística binaria :

Opción de regresión logística binaria en SPSS

En la nueva ventana que aparece, arrastre el borrador de la variable de respuesta binaria al cuadro etiquetado como Dependiente. A continuación, arrastre los dos puntos de las variables predictoras y la división en el cuadro etiquetado como Bloque 1 de 1. Deje el Método establecido en Entrar. Luego haga clic en Aceptar .

Entrada de regresión logística en SPSS

Paso 3. Interprete el resultado.

Una vez que haga clic en Aceptar , aparecerá el resultado de la regresión logística:

Salida de regresión logística en SPSS

A continuación se explica cómo interpretar la salida:

Resumen del modelo: la métrica más útil de esta tabla es el cuadrado R de Nagelkerke, que nos indica el porcentaje de variación en la variable de respuesta que se puede explicar mediante las variables predictoras. En este caso, los puntos y la división son capaces de explicar el 72,5% de la variabilidad en el draft.

Tabla de clasificación: la métrica más útil de esta tabla es el porcentaje general, que nos indica el porcentaje de observaciones que el modelo pudo clasificar correctamente. En este caso, el modelo de regresión logística fue capaz de predecir correctamente el resultado del draft del 85,7% de los jugadores.

Variables en la ecuación: esta última tabla nos proporciona varias métricas útiles, que incluyen:

  • Wald: el estadístico de prueba de Wald para cada variable predictora, que se utiliza para determinar si cada variable predictiva es o no estadísticamente significativa.
  • Sig: el valor p que corresponde al estadístico de la prueba de Wald para cada variable predictora. Vemos que el valor p para los puntos es .039 y el valor p para la división es .557.
  • Exp (B): la razón de posibilidades para cada variable de predicción. Esto nos dice el cambio en las probabilidades de que un jugador sea seleccionado asociado con un aumento de una unidad en una variable predictora determinada. Por ejemplo, las probabilidades de que un jugador de la división 2 sea seleccionado son solo .339 de las probabilidades de que un jugador de la división 1 sea seleccionado. De manera similar, cada aumento de unidad adicional en puntos por juego está asociado con un aumento de 1.319 en las probabilidades de que un jugador sea seleccionado.

Luego, podemos usar los coeficientes (los valores en la columna etiquetada como B) para predecir la probabilidad de que un jugador determinado sea seleccionado, usando la siguiente fórmula:

Probabilidad = e -3.152 + .277 (puntos) – 1.082 (división) / (1 + e -3.152 + .277 (puntos) – 1.082 (división) )

Por ejemplo, la probabilidad de que un jugador que promedia 20 puntos por juego y juega en la división 1 sea reclutado se puede calcular como:

Probabilidad = e -3.152 + .277 (20) – 1.082 (1) / (1 + e -3.152 + .277 (20) – 1.082 (1) ) = .787 .

Dado que esta probabilidad es mayor que 0.5, predeciríamos que este jugador sería reclutado.

Paso 4. Informe los resultados.

Por último, queremos informar los resultados de nuestra regresión logística. A continuación, se muestra un ejemplo de cómo hacerlo:

Se realizó una regresión logística para determinar cómo los puntos por juego y el nivel de división afectan la probabilidad de que un jugador de baloncesto sea seleccionado. Se utilizó un total de 14 jugadores en el análisis.

El modelo explicó el 72,5% de la variación en el resultado del borrador y clasificó correctamente el 85,7% de los casos.

Las probabilidades de que un jugador de la división 2 fuera reclutado eran solo .339 de las probabilidades de que un jugador de la división 1 fuera reclutado.

Cada aumento de unidad adicional en puntos por juego se asoció con un aumento de 1.319 en las probabilidades de que un jugador sea seleccionado.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Para ajustar un modelo de regresión lineal en R, podemos usar la función lm () , que usa la siguiente…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!