Criterio de información bayesiano (BIC) / Criterio de Schwarz

Actualizado por ultima vez el 5 de enero de 2022, por Luis Benites.

El criterio de información bayesiano (BIC) es un índice utilizado en las estadísticas bayesianas para elegir entre dos o más modelos alternativos .

El BIC también se conoce como el criterio de información de Schwarz (abrv. SIC) o el criterio de información de Schwarz-Bayesian . Fue publicado en un artículo de 1978 por Gideon E. Schwarz y está estrechamente relacionado con el criterio de información de Akaike (AIC) que se publicó formalmente en 1974.

Definición del Criterio de Información Bayesiano / Criterio de Schwarz

El criterio de información bayesiano (BIC) se define como

k log(n)- 2log(L(θ̂)).

Aquí n es el tamaño de la muestra ; el número de observaciones o el número de puntos de datos con los que está trabajando. k es el número de parámetros que estima su modelo y θ es el conjunto de todos los parámetros.

L(θ̂) representa la probabilidad del modelo probado, dados sus datos, cuando se evalúa en los valores de máxima probabilidad de θ. Podría llamar a esto la probabilidad de que el modelo se alinee con todo lo más favorable.

Otra forma de entender L(θ̂) es que es la probabilidad de obtener los datos que tienes, suponiendo que el modelo que se está probando sea un dado.

Comparación de modelos

Comparar modelos con el criterio de información bayesiano simplemente implica calcular el BIC para cada modelo. El modelo con el BIC más bajo se considera el mejor y se puede escribir BIC * (o SIC * si usa ese nombre y abreviatura).

También podemos calcular el Δ BIC; la diferencia entre un modelo en particular y el ‘mejor’ modelo con el BIC más bajo, y utilícelo como argumento contra el otro modelo. Δ BIC es solo el modelo BIC – BIC * , donde BIC* es el mejor modelo.

Si Δ BIC es menor que 2, se considera que ‘apenas vale la pena mencionarlo’ como argumento a favor de la mejor teoría o en contra de la alternativa. La ventaja que le da a nuestro mejor modelo es demasiado pequeña para ser significativa . Pero si Δ BIC está entre 2 y 6, se puede decir que la evidencia contra el otro modelo es positiva; es decir, tenemos un buen argumento a favor de nuestro ‘mejor modelo’. Si está entre 6 y 10, la evidencia a favor del mejor modelo y en contra del modelo más débil es fuerte. Un Δ BIC mayor que diez significa que la evidencia a favor de nuestro mejor modelo frente al alternativo es muy fuerte.

Ejemplo

Suponga que tiene un conjunto de datos con 50 puntos de observación y el Modelo 1 estima 3 parámetros. El modelo 2 estima 4 parámetros. Digamos que el logaritmo de su máxima verosimilitud para el modelo 1 es a ; y para el modelo 2 es 2 a . Usando la fórmula k log(n)- 2log(L(θ)):

Calcular el SIC con estos datos nos da:

  • Modelo 1: 3log(50) – 2a = 5.1 – 2a
  • Modelo 2: 4log(50) – 4a = 6,8 – 4a

Entonces ΔBIC es 1.7 – 2a.

Dado que la evidencia que nos brinda el Criterio de Información Bayesiano para el modelo 1 solo ‘valdrá la pena mencionarla’ si 1.7 – 2a > 2, solo podemos reclamar resultados concluyentes si -2a > 0.3; es decir, a < -0,15.

Referencias

Claeskins, G. y Hkort, N. (2008). Selección de modelos y promedio de modelos (Serie de Cambridge en matemáticas estadísticas y probabilísticas) 1ª edición. Prensa de la Universidad de Cambridge.
Fabozzi, Focardi, Rachev y Arshanapalli. Los fundamentos de la econometría financiera: herramientas, conceptos y aplicaciones de gestión de activos. Apéndice E: Criterio de selección del modelo: AIC y BIC. Obtenido de http://onlinelibrary.wiley.com/store/10.1002/9781118856406.app5/asset/app5.pdf;jsessionid=A6726BA5AE1AD2A5AF007FFF78528249.f03t01?v=1&t=je8jr983&s=09eca6efc0573a238457d475d3ac909ec816a699 el 1 de marzo, 2018
Wasserman, Larry. STAT 705 Apuntes de clase: selección de modelos
Obtenido de http://www.stat.cmu.edu/~larry/=stat705/Lecture16.pdf el 1 de marzo de 2018

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es el muestreo dirigido por los encuestados? El muestreo basado en los encuestados se puede considerar como un grupo…
statologos comunidad-2

You have Successfully Subscribed!