Cómo realizar una prueba de bondad de ajuste de chi-cuadrado en Python

Actualizado por ultima vez el 7 de mayo de 2021, por .

Se utiliza una prueba de bondad de ajuste de chi-cuadrado para determinar si una variable categórica sigue o no una distribución hipotética.

Este tutorial explica cómo realizar una prueba de bondad de ajuste de chi-cuadrado en Python.

Ejemplo: prueba de bondad de ajuste de chi-cuadrado en Python

El propietario de una tienda afirma que un número igual de clientes entra en su tienda todos los días de la semana. Para probar esta hipótesis, un investigador registra la cantidad de clientes que ingresan a la tienda en una semana determinada y encuentra lo siguiente:

  • Lunes: 50 clientes
  • Martes: 60 clientes
  • Miércoles: 40 clientes
  • Jueves: 47 clientes
  • Viernes: 53 clientes

Utilice los siguientes pasos para realizar una prueba de bondad de ajuste de chi-cuadrado en Python para determinar si los datos son consistentes con la afirmación del propietario de la tienda.

Paso 1: crea los datos.

Primero, crearemos dos matrices para contener nuestro número observado y esperado de clientes para cada día:

esperado = [50, 50, 50, 50, 50]
observado = [50, 60, 40, 47, 53]

Paso 2: Realice la prueba de bondad de ajuste de chi-cuadrado.

A continuación, podemos realizar la prueba de bondad de ajuste de chi-cuadrado utilizando la función chisquare de la biblioteca SciPy, que utiliza la siguiente sintaxis:

chisquare (f_obs, f_exp)

dónde:

  • f_obs: una matriz de recuentos observados.
  • f_exp: una matriz de recuentos esperados. De forma predeterminada, se supone que cada categoría es igualmente probable.

El siguiente código muestra cómo usar esta función en nuestro ejemplo específico:

importar scipy.stats como estadísticas

# realizar la prueba de bondad de ajuste de chi-cuadrado
stats.chisquare (f_obs = observado, f_exp = esperado)

(estadístico = 4,36, valor de p = 0,35947)

Se encuentra que el estadístico de la prueba de chi-cuadrado es 4,36 y el valor p correspondiente es 0,35947 .

Tenga en cuenta que el valor p corresponde a un valor de chi-cuadrado con n-1 grados de libertad (dof), donde n es el número de categorías diferentes. En este caso, dof = 5-1 = 4. Puede utilizar la calculadora de chi-cuadrado a valor P para confirmar que el valor p que corresponde a X 2 = 4,36 con dof = 4 es 0,35947 .

Recuerde que una prueba de bondad de ajuste de chi-cuadrado utiliza las siguientes hipótesis nulas y alternativas:

  • H 0 : (hipótesis nula) Una variable sigue una distribución hipotética.
  • H 1 : (hipótesis alternativa) Una variable no sigue una distribución hipotética.

Dado que el valor p (.35947) no es menor que 0.05, no rechazamos la hipótesis nula. Esto significa que no tenemos pruebas suficientes para decir que la verdadera distribución de los clientes es diferente de la distribución que afirmaba el dueño de la tienda.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

A menudo, en estadística, nos interesa medir la correlación entre dos variables. Esto nos ayuda a comprender lo siguiente: La…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!