- 0
- 0
- 0
- 0
Se utiliza una prueba de independencia de chi-cuadrado para determinar si existe o no una asociación significativa entre dos variables categóricas.
Este tutorial explica cómo realizar una prueba de independencia de chi-cuadrado en Python.
Ejemplo: prueba chi-cuadrado de independencia en Python
Supongamos que queremos saber si el género está asociado o no con la preferencia de un partido político. Tomamos una muestra aleatoria simple de 500 votantes y los encuestamos sobre su preferencia de partido político. La siguiente tabla muestra los resultados de la encuesta:
Republicano | Demócrata | Independiente | Total | |
Masculino | 120 | 90 | 40 | 250 |
Mujer | 110 | 95 | 45 | 250 |
Total | 230 | 185 | 85 | 500 |
Utilice los siguientes pasos para realizar una prueba de independencia de chi-cuadrado en Python para determinar si el género está asociado con la preferencia de un partido político.
Paso 1: crea los datos.
Primero, crearemos una tabla para contener nuestros datos:
datos = [[120, 90, 40], [110, 95, 45]]
Paso 2: Realice la prueba de independencia de chi-cuadrado.
A continuación, podemos realizar la Prueba de Independencia de Chi-Cuadrado usando la función chi2_contingency de la biblioteca SciPy, que usa la siguiente sintaxis:
chi2_contingency (observado)
dónde:
- observado: una tabla de contingencia de valores observados.
El siguiente código muestra cómo usar esta función en nuestro ejemplo específico:
importar scipy.stats como estadísticas #realice la prueba chi-cuadrado de independencia stats.chi2_contingency (datos) (0,864, 0,649, 2, matriz ([[115., 92.5, 42.5], [115. , 92,5, 42,5]]))
La forma de interpretar la salida es la siguiente:
- Estadística de prueba de chi-cuadrado: 0.864
- valor p: 0,649
- Grados de libertad: 2 (calculado como # filas-1 * # columnas-1)
- Matriz: la última matriz muestra los valores esperados para cada celda en la tabla de contingencia.
Recuerde que la prueba de independencia de chi-cuadrado utiliza las siguientes hipótesis nulas y alternativas:
- H 0 : (hipótesis nula) Las dos variables son independientes.
- H 1 : (hipótesis alternativa) Las dos variables no son independientes.
Dado que el valor p (.649) de la prueba no es menor que 0.05, no rechazamos la hipótesis nula. Esto significa que no tenemos evidencia suficiente para decir que existe una asociación entre género y preferencia de partido político.
En otras palabras, las preferencias de género y de partido político son independientes.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: