Cómo realizar una regresión logística en Stata

La regresión logística es un método que usamos para ajustar un modelo de regresión cuando la variable de respuesta es binaria. A continuación, se muestran algunos ejemplos de cuándo podemos usar la regresión logística:

  • Queremos saber cómo el ejercicio, la dieta y el peso afectan la probabilidad de sufrir un ataque cardíaco. La variable de respuesta es un ataque cardíaco y tiene dos resultados potenciales: ocurre o no ocurre un ataque cardíaco.
  • Queremos saber cómo el GPA, el puntaje ACT y la cantidad de clases AP tomadas afectan la probabilidad de ser aceptado en una universidad en particular. La variable de respuesta es la aceptación y tiene dos posibles resultados: aceptado o no aceptado.
  • Queremos saber si el número de palabras y el título del correo electrónico afectan la probabilidad de que un correo electrónico sea spam. La variable de respuesta es spam y tiene dos posibles resultados: spam o no spam.

Este tutorial explica cómo realizar una regresión logística en Stata.

Ejemplo: regresión logística en Stata

Suponga que estamos interesados ​​en comprender si la edad de una madre y sus hábitos de fumar afectan la probabilidad de tener un bebé con bajo peso al nacer.

Para explorar esto, podemos realizar una regresión logística utilizando la edad y el tabaquismo (sí o no) como variables explicativas y el bajo peso al nacer (sí o no) como variable de respuesta. Dado que la variable de respuesta es binaria, solo hay dos resultados posibles, es apropiado utilizar la regresión logística.

Realice los siguientes pasos en Stata para realizar una regresión logística utilizando el conjunto de datos llamado lbw , que contiene datos sobre 189 madres diferentes.

Paso 1: cargue los datos.

Cargue los datos escribiendo lo siguiente en el cuadro de comando:

use http://www.stata-press.com/data/r13/lbw

Paso 2: obtenga un resumen de los datos.

Obtenga una comprensión rápida de los datos con los que está trabajando escribiendo lo siguiente en el cuadro Comando:

resumir

Conjunto de datos de bajo peso al nacer en Stata

Podemos ver que hay 11 variables diferentes en el conjunto de datos, pero las únicas tres que nos importan son las siguientes:

  • bajo : si el bebé tuvo bajo peso al nacer o no. 1 = sí, 0 = no.
  • edad – edad de la madre.
  • humo – si la madre fumó o no durante el embarazo. 1 = sí, 0 = no.

Paso 3: Realice una regresión logística.

Escriba lo siguiente en el cuadro Comando para realizar una regresión logística utilizando la edad y el humo como variables explicativas y bajo como variable de respuesta.

logit humo de baja edad

Salida de regresión logística en Stata

A continuación se explica cómo interpretar los números más interesantes en la salida:

Coef (edad): -.0497792. Manteniendo el humo constante, cada aumento de un año en la edad se asocia con un aumento exp (-. 0497792) = .951 en las probabilidades de que un bebé tenga bajo peso al nacer. Debido a que este número es menor que 1, significa que un aumento en la edad en realidad está asociado con una disminución en las probabilidades de tener un bebé con bajo peso al nacer.

Por ejemplo, suponga que la madre A y la madre B son ambas fumadoras. Si la madre A es un año mayor que la madre B, entonces las probabilidades de que la madre A tenga un bebé con bajo peso al nacer son solo el 95,1% de las probabilidades de que la madre B tenga un bebé con bajo peso al nacer.

P> | z | (edad): 0,119. Este es el valor p asociado con el estadístico de prueba para la edad . Dado que este valor no es inferior a 0,05, la edad no es un predictor estadísticamente significativo de bajo peso al nacer.

Odds Ratio (humo): .6918486. Manteniendo la edad constante, una madre que fuma durante el embarazo tiene exp (.6918486) = 1.997 probabilidades más altas de tener un bebé con bajo peso al nacer en comparación con una madre que no fuma durante el embarazo.

Por ejemplo, suponga que la madre A y la madre B tienen 30 años. Si la madre A fuma durante el embarazo y la madre B no, entonces las probabilidades de que la madre A tenga un bebé con bajo peso al nacer son 99,7% más altas que las probabilidades de que la madre B tenga un bebé con bajo peso al nacer.

P> | z | (humo): 0.032. Este es el valor p asociado con la estadística de prueba para humo . Dado que este valor es menor de 0.05, el humo es un predictor estadísticamente significativo de bajo peso al nacer.

Paso 4: Informe los resultados.

Por último, queremos informar los resultados de nuestra regresión logística. A continuación, se muestra un ejemplo de cómo hacerlo:

Se realizó una regresión logística para determinar si la edad de la madre y sus hábitos de fumar afectan la probabilidad de tener un bebé con bajo peso al nacer. En el análisis se utilizó una muestra de 189 madres.

Los resultados mostraron que hubo una relación estadísticamente significativa entre el tabaquismo y la probabilidad de bajo peso al nacer (z = 2.15, p = .032) mientras que no hubo una relación estadísticamente significativa entre la edad y la probabilidad de bajo peso al nacer (z = -1.56, p =. 119).

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Puede usar el argumento de tamaño para ajustar el grosor de una línea en ggplot2 : ggplot (gl, aes (x…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!