Corrección de continuidad de Yate: definición y ejemplo

Se utiliza una prueba de independencia de chi-cuadrado para determinar si existe o no una asociación significativa entre dos variables categóricas.

Esta prueba utiliza las siguientes hipótesis nulas y alternativas:

  • H 0 : (hipótesis nula) Las dos variables son independientes.
  • H 1 : (hipótesis alternativa) Las dos variables no son independientes. (es decir, están asociados)

Usamos la siguiente fórmula para calcular el estadístico de la prueba de Chi-Cuadrado X 2 para esta prueba:

X 2 = Σ (O i -E i ) 2 / E i

dónde:

  • Σ: es un símbolo elegante que significa «suma»
  • O: valor observado
  • E: valor esperado

Esta prueba asume que las probabilidades discretas de las frecuencias en una tabla de contingencia se pueden aproximar mediante la distribución Chi-Cuadrado, que es una distribución continua.

Sin embargo, esta suposición tiende a ser ligeramente incorrecta y la estadística de prueba resultante tiende a estar sesgada al alza.

Para corregir este sesgo, podemos aplicar la corrección de continuidad de Yate , que aplica la siguiente corrección a la fórmula X 2 :

X 2 = Σ (| O i -E i | – 0.5) 2 / E i

Por lo general, solo usamos esta corrección cuando al menos una celda en la tabla de contingencia tiene una frecuencia esperada menor que 5.

Ejemplo: aplicar la corrección de continuidad de Yate

Supongamos que queremos saber si el género está asociado o no con la preferencia de un partido político. Tomamos una muestra aleatoria simple de 40 votantes y los encuestamos sobre su preferencia de partido político. La siguiente tabla muestra los resultados de la encuesta:

A continuación se explica cómo realizar una prueba de independencia de chi-cuadrado con la corrección de continuidad de Yate:

Valores observados:

Valores esperados:

Nota: Calculamos el valor esperado en cada celda multiplicando el total de la fila por el total de la columna y luego dividiéndolo por el total general. Por ejemplo, el número esperado de republicanos varones es (21 * 19) / 40 = 9,975.

Estadístico de prueba de chi-cuadrado: X 2 = Σ (| O i -E i | – 0.5) 2 / E i

  • (| 8-9,975 | – 0,5) 2 / 9,975 = .218
  • (| 9-6,3 | – 0,5) 2 / 6,3 = .768
  • (| 4-4.725 | – 0.5) 2 / 4.725 = .011
  • (| 11-9.025 | – 0.5) 2 / 9.025 = .241
  • (| 3-5.7 | – 0.5) 2 / 5.7 = .849
  • (| 5-4.275 | – 0.5) 2 / 4.275 = .012

Por lo tanto, X 2 = .218 + .768 + .011 + .241 + .849 + .012 = 2.099

Valor P: De acuerdo con la Calculadora de Chi-Cuadrado a Valor P , el valor p que corresponde a un estadístico de prueba de Chi-Cuadrado con 2 grados de libertad es 0.3501 .

Dado que este valor p no es menor que .05, no rechazaríamos la hipótesis nula. Esto significa que no tenemos evidencia suficiente para decir que existe una asociación entre género y preferencia de partido político.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La forma más común de comparar las medias entre dos grupos independientes es utilizar una prueba t de dos muestras…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!