Regresión de Poisson / Regresión de conteos: Definición

Actualizado por ultima vez el 18 de octubre de 2022, por Luis Benites.

¿Qué es la regresión de Poisson?

regresión de poisson

La familia de distribuciones de Poisson.

La regresión de Poisson se utiliza para modelar variables de respuesta (valores Y) que son recuentos. Le dice qué variables explicativas tienen un efecto estadísticamente significativo en la variable de respuesta. En otras palabras, le dice qué valores de X funcionan en el valor de Y. Se utiliza mejor para eventos raros, ya que tienden a seguir una distribución de Poisson (a diferencia de los eventos más comunes que tienden a tener una distribución normal ). Por ejemplo:

  • Número de resfriados contraídos en aviones.
  • Número de bacterias encontradas en una placa de Petri.
  • Conteos de fallas informáticas catastróficas en una gran empresa de tecnología en un año calendario.
  • Número de llamadas al 911 que terminan en la muerte de un sospechoso.

Para medias grandes, la distribución normal es una buena aproximación a la distribución de Poisson. Por lo tanto, la regresión de Poisson es más adecuada para los casos en los que la variable de respuesta es un número entero pequeño .

La regresión de Poisson solo se usa para datos continuos numéricos. La misma técnica se puede utilizar para modelar variables explicativas categóricas o recuentos en las celdas de una tabla de contingencia . Cuando se usan de esta manera, los modelos se denominan modelos loglineales .

suposiciones

Los supuestos para la regresión de Poisson son:

  • Los valores de Y son conteos. Si sus variables de respuesta no cuentan, la regresión de Poisson no es un buen método para usar.
  • Los conteos deben ser números enteros positivos (es decir, números enteros) 0 o mayor (0,1,2,3…k). La técnica no funcionará con fracciones o números negativos, porque la distribución de Poisson es una distribución discreta .
  • Los recuentos deben seguir una distribución de Poisson . Por lo tanto, la media y la varianza deben ser iguales.
  • Las variables explicativas deben ser continuas, dicotómicas u ordinales .
  • Las observaciones deben ser independientes .

Ejecución de la prueba

La regresión de Poisson consiste en estimar los coeficientes de regresión utilizando la máxima verosimilitud . Estos cálculos complejos generalmente no se realizan a mano, pero la mayoría de los paquetes estadísticos incluyen un procedimiento.

  • R : El Poisson clásico utiliza un modelo lineal generalizado (GLM) ; use la función glm() en el paquete stats y la función glm.nb() en el paquete MASS.
  • STATA : utilice el comando Poisson . Desde el menú: Estadísticas > Contar resultados > Regresión de Poisson.

Referencia :
Zeileis, A. Regression Models for Count Data in R. Recuperado el 9 de septiembre de 2016 de:
https://cran.r-project.org/web/packages/pscl/vignettes/countreg.pdf

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Hay muchas distribuciones diferentes en forma de campana en las estadísticas. La más conocida es la “ curva de campana…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!