Modelo Probit (Regresión Probit): Definición

Actualizado por ultima vez el 3 de septiembre de 2021, por Luis Benites.

¿Qué es el Modelo Probit?

modelo probit

Los modelos probit se utilizan en el análisis de regresión.

Un modelo probit (también llamado regresión probit ) es una forma de realizar una regresión para variables de resultado binarias. Las variables de resultado binarias son variables dependientes con dos posibilidades, como sí/no, resultado de prueba positivo/resultado de prueba negativo o único/no único. La palabra “probit” es una combinación de las palabras probabilidad y unidad; el modelo probit estima la probabilidad de que un valor caiga en uno de los dos posibles resultados binarios (es decir, unitarios).
Los valores pronosticados de un modelo probit son similares a los puntajes Z ; Un valor probit de:

  • -3 tiene alrededor de un 0,13 % de posibilidades de éxito,
  • 0 tiene un 50% de posibilidades de éxito,
  • 1 tiene alrededor de un 84% de posibilidades de éxito,
  • 3 tiene alrededor de un 99% de posibilidades de éxito.

Ejemplos de cuándo podría usar un modelo probit:

  • Quiere saber si un candidato en particular ganará una elección. La variable de respuesta es 0 = ganar o 1 = perder.
  • Desea saber cómo variables como el prestigio de una determinada facultad de derecho y el GPA de pregrado afectan la contratación de un candidato. La variable de respuesta , contratar/no contratar, es una variable binaria.

Métodos similares

Otros métodos similares que podría considerar en lugar de un modelo probit:

  • Regresión logística (logit) : da resultados prácticamente idénticos a la regresión probit. Cuál elige ejecutar es principalmente una cuestión de elección personal. Es posible que deba usar el probit para una selección limitada de modelos. Por ejemplo, si está trabajando con sistemas de ecuaciones múltiples que involucran variables dependientes cualitativas, el logit es una buena opción porque el modelo se ajustará mejor. Además, si tiene variables dependientes nominales con tres categorías o más, el logit es más fácil de calcular.
  • T 2 de Hotelling : es posible ejecutar la T 2 de Hotelling en variables de resultado binarias con un par de cambios de datos: la variable de resultado binaria se convierte en la variable de agrupación y las variables predictoras se convierten en variables de resultado. Aunque puede ejecutar la prueba de esta manera, surgen un par de problemas importantes: no obtendrá coeficientes para cada variable individual y el impacto de las variables predictoras en otras variables predictoras no está claro.
  • Regresión de mínimos cuadrados ordinarios (OLS) : se denomina modelo de probabilidad lineal cuando se utiliza con variables de resultado binarias. Sin embargo, hay muchos problemas con este modelo, incluido que un modelo de probabilidad lineal viola varios supuestos de la regresión OLS (como la normalidad de los errores). Por lo tanto, no se recomienda ejecutar MCO con variables de resultado binarias, ya que los resultados de las pruebas de hipótesis no serán válidos (Long, 1997).
  • Análisis de función discriminante de dos grupos : este es un método multivariante para variables de resultado binarias.

Referencias:
Long, J. Scott (1997). Modelos de regresión para variables dependientes categóricas y limitadas. Thousand Oaks, CA: Publicaciones de Sage.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Markov Chain Monte Carlo es una forma de muestrear una distribución complicada . ¿Qué es una “distribución complicada”? Uno para…
statologos comunidad-2

You have Successfully Subscribed!