Correlación tetracórica: definición, ejemplos, fórmula

Actualizado por ultima vez el 12 de diciembre de 2021, por Luis Benites.

Correlación tetracórica

¿Qué es la correlación tetracórica?

La correlación tetracórica se usa para medir el acuerdo del evaluador para datos binarios ; Los datos binarios son datos con dos posibles respuestas, generalmente correcta o incorrecta. La correlación tetracórica estima cuál sería la correlación si se midiera en una escala continua. Se utiliza por una variedad de razones, incluido el análisis de puntajes en la Teoría de Respuesta al Ítem (IRT) y la conversión de estadísticas de comorbilidad en coeficientes de correlación . Este tipo de correlación tiene la ventaja de que no se ve afectada por el número de niveles de calificación o las proporciones marginales de los niveles de calificación.

El término “correlación tetracórica” proviene de la serie tetracórica , un método numérico utilizado antes de la llegada de las computadoras. Si bien es más común estimar correlaciones con métodos como la estimación de máxima verosimilitud, existe una fórmula básica que puede usar.

Fórmula y ejemplo

correlación tetracórica

Una tabla de contingencia simple. Imagen: Departamento de Agricultura de Michigan


La fórmula involucra la función trigonométrica del coseno y se puede aplicar a una matriz de 2 × 2 o a una tabla de contingencia:

r tet = cos (180/(1 + √(BC/AD)).

Para la tabla de contingencia que se muestra, tenga en cuenta la ubicación de a/b/c/d en la tabla. Usando esos valores y conectándolos a la fórmula, obtenemos:

  • r tet = cos (180/(1 + √(32*17/13*23))
  • r tet = cos (180/(1 + 1,34885))
  • r tet = cos (180/(2.34885))
  • r tet = cos (76.63324)
  • r tet = 0,23.

.23 es una correlación baja.

Supuestos para la prueba

Los dos supuestos principales son:

  • Las variables subyacentes provienen de una distribución normal . Con solo dos variables, esto es imposible de probar. Por lo tanto, debe tener una buena razón teórica para usar este tipo particular de correlación; en otras palabras, es posible que sepa que el tipo de datos con los que está tratando tiende a seguir una distribución normal la mayor parte del tiempo. Los errores de calificación también deben seguir una distribución normal.
  • Hay una escala continua latente debajo de sus datos binarios. En otras palabras, el rasgo que está midiendo debe ser continuo y no discreto .

Además, es posible que desee asegurarse de que los errores sean independientes entre los evaluadores y los casos y que la varianza de los errores sea homogénea en todos los niveles de la variable independiente .

Qué significa la correlación

El coeficiente de correlación tetracórico r tet (a veces escrito como r* o r t ) le indica qué tan fuerte (o débil) es la asociación entre las calificaciones de dos evaluadores. Un «0» indica que no hay acuerdo y un «1» representa un acuerdo perfecto. La mayoría de las correlaciones caerán en algún punto intermedio; lo que constituye un nivel aceptable de acuerdo depende en gran medida del tipo de datos con los que esté tratando. Por ejemplo, las calificaciones médicas entre profesionales médicos requerirán un mayor nivel de acuerdo que la mayoría de las situaciones no médicas. En general, un acuerdo de más de 0,7 suele considerarse «suficientemente fuerte».

Referencias

Universidad Andrews. Más coeficientes de correlación . Recuperado el 13-7-2016 de: http://ow.ly/5GLJ50wqTVC
Kotz, S.; et al., editores. (2006), Enciclopedia de Ciencias Estadísticas , Wiley.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Es posible que desee leer este artículo primero: ¿Qué es una variable endógena? ¿Qué es la prueba de Hausman? La…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!