Cómo realizar una prueba de Jarque-Bera en Python

La prueba de Jarque-Bera es una prueba de bondad de ajuste que determina si los datos de la muestra tienen asimetría y curtosis que coinciden con una distribución normal.

La estadística de prueba de la prueba de Jarque-Bera es siempre un número positivo y cuanto más se aleja de cero, más evidencia de que los datos de la muestra no siguen una distribución normal.

Este tutorial explica cómo realizar una prueba de Jarque-Bera en Python.

Cómo realizar una prueba de Jarque-Bera en Python

Para realizar una prueba de Jarque-Bera en Python podemos usar la función jarque_bera de la biblioteca Scipy, que usa la siguiente sintaxis:

jarque_bera (x)

dónde:

  • x: una matriz de observaciones

Esta función devuelve una estadística de prueba y un valor p correspondiente.

Ejemplo 1

Supongamos que realizamos una prueba de Jarque-Bera en una lista de 5000 valores que siguen una distribución normal:

importar numpy como np
 importar scipy.stats como estadísticas

#generar una matriz de 5000 valores que siguen una distribución normal estándar
 np.random.seed (0)
datos = np.random.normal (0, 1, 5000)

# realizar la prueba Jarque-Bera
 stats.jarque_bera (datos)

(estadístico = 1.2287, pvalue = 0.54098)

El estadístico de prueba es 1.2287 y el valor p correspondiente es 0.54098 . Dado que este valor p no es menor que .05, no rechazamos la hipótesis nula. No tenemos evidencia suficiente para decir que estos datos tienen asimetría y curtosis significativamente diferentes de una distribución normal.

Este resultado no debería sorprendernos ya que los datos que generamos están compuestos por 5000 variables aleatorias que siguen una distribución normal.

Ejemplo 2

Ahora suponga que realizamos una prueba de Jarque-Bera en una lista de 5000 valores que siguen una distribución uniforme:

importar numpy como np
 importar scipy.stats como estadísticas

#generar una matriz de 5000 valores que siguen una distribución uniforme
 np.random.seed (0)
datos = np.random.uniform (0, 1, 5000)

# realizar la prueba Jarque-Bera
 stats.jarque_bera (datos)

(estadístico = 300.1043, pvalue = 0.0)

El estadístico de prueba es 300.1043 y el valor p correspondiente es 0.0 . Dado que este valor p es menor que .05, rechazamos la hipótesis nula. Por lo tanto, tenemos evidencia suficiente para decir que estos datos tienen asimetría y curtosis que son significativamente diferentes de una distribución normal.

Este resultado tampoco debería sorprender, ya que los datos que generamos se componen de 5000 variables aleatorias que siguen una distribución uniforme, que deberían tener asimetría y curtosis muy diferentes a una distribución normal.

Cuándo usar la prueba de Jarque-Bera

La prueba de Jarque-Bera se usa generalmente para grandes conjuntos de datos (n> 2000) en los que otras pruebas de normalidad (como la prueba de Shapiro-Wilk) no son confiables.

Esta es una prueba apropiada para usar antes de realizar algún análisis en el que se asume que el conjunto de datos sigue una distribución normal. Una prueba de Jarque-Bera puede decirle si esta suposición se cumple o no.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Cuando queremos comparar las medias de dos grupos independientes, podemos elegir entre dos pruebas diferentes: Prueba t de Student: supone…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!