Tabla de contingencia: ¿Para qué sirve?

Actualizado por ultima vez el 5 de octubre de 2021, por Luis Benites.

Tabla de contingencia: descripción general

Las tablas de contingencia (también llamadas tabulaciones cruzadas o tablas de doble entrada) se utilizan en estadística para resumir la relación entre varias variables categóricas . Una tabla de contingencia es un tipo especial de tabla de distribución de frecuencias , donde dos variables se muestran simultáneamente.

Por ejemplo, un investigador podría estar investigando la relación entre el SIDA y la preferencia sexual. Las dos variables serían SIDA y PREFERENCIA SEXUAL. La pregunta es “¿Existe una relación significativa entre el SIDA y la preferencia sexual?”. Luego se podría ejecutar una prueba de chi-cuadrado en la tabla para determinar si existe una relación entre las dos variables.

La siguiente tabla de contingencia muestra la exposición a una fuente potencial de enfermedades transmitidas por los alimentos (en este caso, los helados). En la tabla, puedes ver que 13 personas en un estudio de caso comieron helado; 17 personas no:

mesa de contingencia

Imagen: Departamento de Agricultura de Michigan

En la imagen de arriba, hay un cálculo de Odds Ratio . Para obtener más información, consulte: ¿Qué es la razón de probabilidades ?

Pruebas de chi-cuadrado

Se puede realizar una prueba de chi 2 en tablas de contingencia para comprobar si existe o no una relación entre las variables . Estos efectos se definen como relaciones entre filas y columnas. La prueba de chi 2 :

mesa de contingencia

Donde “O” es el valor observado, “E” es el valor esperado e “i” es la posición “ésima” en la tabla. El sigma (Σ) es el símbolo de suma . La siguiente imagen muestra cómo se vería su tabla de contingencia con sus datos, además de los resultados de ejecutar una prueba de chi 2 en sus datos. Un valor chi 2 pequeño significa que hay poca relación entre las variables categóricas. Un valor grande de chi 2 significa que existe una correlación definida entre las dos variables. Dado que existe evidencia bastante sólida de que la orientación sexual está relacionada con un mayor riesgo de contraer el SIDA, no sorprende que el chi 2 el valor es bastante alto:

contingencia
Sin embargo, la nota debajo de los resultados establece que «4 celdas (66.7%) han esperado contar menos de 5». Por lo general, si supera el 25 %, el resultado podría deberse únicamente al azar. Por lo tanto, los resultados de esta prueba en particular no son estadísticamente significativos .

Tabla de contingencia en Excel

Una tabla de contingencia en Excel se crea en Excel con la herramienta Tabla dinámica. Mire este video sobre cómo crear uno en Excel:

Cómo hacer una tabla dinámica en Excel (¡en 5 minutos!)

Las tablas de contingencia son notoriamente laboriosas de producir e implican calcular la frecuencia esperada para cada celda. El procedimiento se complica aún más por el hecho de que es posible que deba realizar una corrección de continuidad si la frecuencia de celda esperada es inferior a 5 (la corrección de continuidad para tablas de 2 x 2 se denomina corrección de Yates) . Muchos programas populares tienen la capacidad de hacer tablas de contingencia, incluido Microsoft Excel (tenga en cuenta que incluso en Excel, el proceso es bastante complicado e involucra la creación de tablas dinámicas).

Referencias

Agresti, A. Introducción al análisis de datos categóricos (Serie de Wiley en probabilidad y estadística) 3.ª edición, 2018.

Crédito de la imagen: Universidad Estatal de Missouri

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es el error medio? El error medio es un término informal que generalmente se refiere al promedio de todos…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!