Cómo realizar una prueba de independencia de chi-cuadrado en Python

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Se utiliza una prueba de independencia de chi-cuadrado para determinar si existe o no una asociación significativa entre dos variables categóricas.

Este tutorial explica cómo realizar una prueba de independencia de chi-cuadrado en Python.

Ejemplo: prueba chi-cuadrado de independencia en Python

Supongamos que queremos saber si el género está asociado o no con la preferencia de un partido político. Tomamos una muestra aleatoria simple de 500 votantes y los encuestamos sobre su preferencia de partido político. La siguiente tabla muestra los resultados de la encuesta:

Republicano Demócrata Independiente Total
Masculino 120 90 40 250
Mujer 110 95 45 250
Total 230 185 85 500

Utilice los siguientes pasos para realizar una prueba de independencia de chi-cuadrado en Python para determinar si el género está asociado con la preferencia de un partido político.

Paso 1: crea los datos.

Primero, crearemos una tabla para contener nuestros datos:

datos = [[120, 90, 40],
        [110, 95, 45]]

Paso 2: Realice la prueba de independencia de chi-cuadrado.

A continuación, podemos realizar la Prueba de Independencia de Chi-Cuadrado usando la función chi2_contingency de la biblioteca SciPy, que usa la siguiente sintaxis:

chi2_contingency (observado)

dónde:

  • observado: una tabla de contingencia de valores observados.

El siguiente código muestra cómo usar esta función en nuestro ejemplo específico:

importar scipy.stats como estadísticas

#realice la prueba chi-cuadrado de independencia
stats.chi2_contingency (datos)

(0,864,
 0,649,
 2,
 matriz ([[115., 92.5, 42.5],
        [115. , 92,5, 42,5]]))

La forma de interpretar la salida es la siguiente:

  • Estadística de prueba de chi-cuadrado: 0.864
  • valor p: 0,649
  • Grados de libertad: 2 (calculado como # filas-1 * # columnas-1)
  • Matriz: la última matriz muestra los valores esperados para cada celda en la tabla de contingencia.

Recuerde que la prueba de independencia de chi-cuadrado utiliza las siguientes hipótesis nulas y alternativas:

  • H 0 : (hipótesis nula) Las dos variables son independientes.
  • H 1 : (hipótesis alternativa) Las dos variables no son independientes.

Dado que el valor p (.649) de la prueba no es menor que 0.05, no rechazamos la hipótesis nula. Esto significa que no tenemos evidencia suficiente para decir que existe una asociación entre género y preferencia de partido político.

En otras palabras, las preferencias de género y de partido político son independientes.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

En estadística, ajustamos modelos de regresión por dos razones: (1) Para explicar la relación entre una o más variables explicativas…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!