Cómo realizar una prueba de bondad de ajuste de chi-cuadrado en Python

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

Se utiliza una prueba de bondad de ajuste de chi-cuadrado para determinar si una variable categórica sigue o no una distribución hipotética.

Este tutorial explica cómo realizar una prueba de bondad de ajuste de chi-cuadrado en Python.

Ejemplo: prueba de bondad de ajuste de chi-cuadrado en Python

El propietario de una tienda afirma que un número igual de clientes entra en su tienda todos los días de la semana. Para probar esta hipótesis, un investigador registra la cantidad de clientes que ingresan a la tienda en una semana determinada y encuentra lo siguiente:

  • Lunes: 50 clientes
  • Martes: 60 clientes
  • Miércoles: 40 clientes
  • Jueves: 47 clientes
  • Viernes: 53 clientes

Utilice los siguientes pasos para realizar una prueba de bondad de ajuste de chi-cuadrado en Python para determinar si los datos son consistentes con la afirmación del propietario de la tienda.

Paso 1: crea los datos.

Primero, crearemos dos matrices para contener nuestro número observado y esperado de clientes para cada día:

esperado = [50, 50, 50, 50, 50]
observado = [50, 60, 40, 47, 53]

Paso 2: Realice la prueba de bondad de ajuste de chi-cuadrado.

A continuación, podemos realizar la prueba de bondad de ajuste de chi-cuadrado utilizando la función chisquare de la biblioteca SciPy, que utiliza la siguiente sintaxis:

chisquare (f_obs, f_exp)

dónde:

  • f_obs: una matriz de recuentos observados.
  • f_exp: una matriz de recuentos esperados. De forma predeterminada, se supone que cada categoría es igualmente probable.

El siguiente código muestra cómo usar esta función en nuestro ejemplo específico:

importar scipy.stats como estadísticas

# realizar la prueba de bondad de ajuste de chi-cuadrado
stats.chisquare (f_obs = observado, f_exp = esperado)

(estadístico = 4,36, valor de p = 0,35947)

Se encuentra que el estadístico de la prueba de chi-cuadrado es 4,36 y el valor p correspondiente es 0,35947 .

Tenga en cuenta que el valor p corresponde a un valor de chi-cuadrado con n-1 grados de libertad (dof), donde n es el número de categorías diferentes. En este caso, dof = 5-1 = 4. Puede utilizar la calculadora de chi-cuadrado a valor P para confirmar que el valor p que corresponde a X 2 = 4,36 con dof = 4 es 0,35947 .

Recuerde que una prueba de bondad de ajuste de chi-cuadrado utiliza las siguientes hipótesis nulas y alternativas:

  • H 0 : (hipótesis nula) Una variable sigue una distribución hipotética.
  • H 1 : (hipótesis alternativa) Una variable no sigue una distribución hipotética.

Dado que el valor p (.35947) no es menor que 0.05, no rechazamos la hipótesis nula. Esto significa que no tenemos pruebas suficientes para decir que la verdadera distribución de los clientes es diferente de la distribución que afirmaba el dueño de la tienda.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

A menudo, en estadística, nos interesa medir la correlación entre dos variables. Esto nos ayuda a comprender lo siguiente: La…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!