Coeficiente de contingencia: Definición

Actualizado por ultima vez el 11 de mayo de 2022, por Luis Benites.

El coeficiente de contingencia es un coeficiente de asociación que indica si dos variables o conjuntos de datos son independientes o dependientes entre sí. También se conoce como Coeficiente de Pearson (que no debe confundirse con el Coeficiente de asimetría de Pearson ).

Se basa en el estadístico chi-cuadrado y se define por:

coeficiente de contingencia
En esta fórmula:

  • χ 2 es el estadístico chi-cuadrado,
  • N es el número total de casos u observaciones en nuestro análisis/estudio,
  • C es el coeficiente de contingencia.

Comprender los valores del coeficiente de contingencia

El coeficiente de contingencia nos ayuda a decidir si la variable b es ‘contingente’ en la variable a. Sin embargo, es una medida aproximada y no cuantifica exactamente la dependencia; Se puede utilizar como una guía aproximada:

  • Si C está cerca de cero (o igual a cero), puede concluir que sus variables son independientes entre sí; no hay asociación entre ellos.
  • Si C está lejos de cero , existe alguna relación; C solo puede tomar valores positivos.

Cuanto más grande sea la tabla a partir de la cual se calcula el coeficiente de chi-cuadrado, más cerca de 1 se acercará una asociación perfecta. Es por eso que algunos estadísticos sugieren usar el coeficiente de contingencia solo si está trabajando con una tabla de 5 por 5 o más grande.

Cuándo usar un coeficiente de contingencia

Un coeficiente de contingencia es particularmente informativo si está trabajando con una muestra grande y no necesita averiguar si una asociación está completa o no, solo si la asociación existe o no.

Otras medidas alternativas de asociación incluyen el coeficiente phi (que tiene el mismo punto débil que nuestro C; nunca llega a uno), y Cramers V. A menudo se prefiere Cramers V porque con una asociación perfecta, se convierte exactamente en 1 sin importar cuán grande sea la tabla.

Referencias

Tattao, L. (2007). Conceptos Básicos de Estadística . Recuperado de https://books.google.com/books?id=og4a_700L-4C el 10 de enero de 2018
Medidas de Asociación. Recuperado de http://uregina.ca/~gingrich/ch11a.pdf el 10 de enero de 2018

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Contenido: Normal bivariado Normal multivariado 1. ¿Qué es una distribución normal bivariada? La distribución normal "regular" tiene una variable aleatoria…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!