Corrección de continuidad de Yate: definición y ejemplo

Se utiliza una prueba de independencia de chi-cuadrado para determinar si existe o no una asociación significativa entre dos variables categóricas.

Esta prueba utiliza las siguientes hipótesis nulas y alternativas:

  • H 0 : (hipótesis nula) Las dos variables son independientes.
  • H 1 : (hipótesis alternativa) Las dos variables no son independientes. (es decir, están asociados)

Usamos la siguiente fórmula para calcular el estadístico de la prueba de Chi-Cuadrado X 2 para esta prueba:

X 2 = Σ (O i -E i ) 2 / E i

dónde:

  • Σ: es un símbolo elegante que significa «suma»
  • O: valor observado
  • E: valor esperado

Esta prueba asume que las probabilidades discretas de las frecuencias en una tabla de contingencia se pueden aproximar mediante la distribución Chi-Cuadrado, que es una distribución continua.

Sin embargo, esta suposición tiende a ser ligeramente incorrecta y la estadística de prueba resultante tiende a estar sesgada al alza.

Para corregir este sesgo, podemos aplicar la corrección de continuidad de Yate , que aplica la siguiente corrección a la fórmula X 2 :

X 2 = Σ (| O i -E i | – 0.5) 2 / E i

Por lo general, solo usamos esta corrección cuando al menos una celda en la tabla de contingencia tiene una frecuencia esperada menor que 5.

Ejemplo: aplicar la corrección de continuidad de Yate

Supongamos que queremos saber si el género está asociado o no con la preferencia de un partido político. Tomamos una muestra aleatoria simple de 40 votantes y los encuestamos sobre su preferencia de partido político. La siguiente tabla muestra los resultados de la encuesta:

A continuación se explica cómo realizar una prueba de independencia de chi-cuadrado con la corrección de continuidad de Yate:

Valores observados:

Valores esperados:

Nota: Calculamos el valor esperado en cada celda multiplicando el total de la fila por el total de la columna y luego dividiéndolo por el total general. Por ejemplo, el número esperado de republicanos varones es (21 * 19) / 40 = 9,975.

Estadístico de prueba de chi-cuadrado: X 2 = Σ (| O i -E i | – 0.5) 2 / E i

  • (| 8-9,975 | – 0,5) 2 / 9,975 = .218
  • (| 9-6,3 | – 0,5) 2 / 6,3 = .768
  • (| 4-4.725 | – 0.5) 2 / 4.725 = .011
  • (| 11-9.025 | – 0.5) 2 / 9.025 = .241
  • (| 3-5.7 | – 0.5) 2 / 5.7 = .849
  • (| 5-4.275 | – 0.5) 2 / 4.275 = .012

Por lo tanto, X 2 = .218 + .768 + .011 + .241 + .849 + .012 = 2.099

Valor P: De acuerdo con la Calculadora de Chi-Cuadrado a Valor P , el valor p que corresponde a un estadístico de prueba de Chi-Cuadrado con 2 grados de libertad es 0.3501 .

Dado que este valor p no es menor que .05, no rechazaríamos la hipótesis nula. Esto significa que no tenemos evidencia suficiente para decir que existe una asociación entre género y preferencia de partido político.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La forma más común de comparar las medias entre dos grupos independientes es utilizar una prueba t de dos muestras…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!