Tau de Kendall: definición + ejemplo

En estadística, la correlación se refiere a la fuerza y ​​dirección de una relación entre dos variables. El valor de un coeficiente de correlación puede variar de -1 a 1, donde -1 indica una relación negativa perfecta, 0 indica que no hay relación y 1 indica una relación positiva perfecta.

El coeficiente de correlación más utilizado es el coeficiente de correlación de Pearson , que mide la asociación lineal entre dos variables numéricas.Un coeficiente de correlación menos utilizado es el Tau de Kendall , que mide la relación entre dos columnas de datos clasificados.

La fórmula para calcular la Tau de Kendall, a menudo abreviada como τ, es la siguiente:

τ = (CD) / (C + D)

dónde:

C = el número de pares concordantes

D = el número de pares discordantes

El siguiente ejemplo ilustra cómo utilizar esta fórmula para calcular el coeficiente de correlación de rango Tau de Kendall para dos columnas de datos clasificados.

Ejemplo de cálculo de la Tau de Kendall

Suponga que dos entrenadores de baloncesto clasifican a 12 de sus jugadores de peor a mejor. La siguiente tabla muestra las clasificaciones que cada entrenador asignó a los jugadores:

Ejemplo de Tau de Kendall

Debido a que estamos trabajando con dos columnas de datos clasificados, es apropiado usar la Tau de Kendall para calcular la correlación entre las clasificaciones de los dos entrenadores. Utilice los siguientes pasos para calcular la Tau de Kendall:

Paso 1: Cuente el número de pares concordantes.

Mire solo los rangos del Entrenador # 2. Comenzando con el primer jugador, cuente cuántos rangos debajo de él son más grandes . Por ejemplo, hay 11 números debajo de «1» que son más grandes, por lo que escribiremos 11:

Conjunto de datos tau de Kendall

Pasa al siguiente jugador y repite el proceso. Hay 10 números debajo de «2» que son más grandes, por lo que escribiremos 10:

Cálculo de pares concordantes tau de Kendalls

Una vez que llegamos a un jugador cuyo rango es menor que el jugador antes que él, simplemente le asignamos el mismo valor que el jugador antes que él. Por ejemplo, Elliot tiene un rango de «4» que es menor que el rango de «5» del jugador anterior, por lo que simplemente le asignamos el mismo valor que el jugador antes que él:

Tau de Kendall

Repite este proceso para todos los jugadores:

Tau de Kendall

Paso 2: Cuente el número de pares discordantes.

Nuevamente, mire solo los rangos del Entrenador # 2. Para cada jugador, cuente cuántos rangos debajo de él son más pequeños . Por ejemplo, el entrenador # 2 le asignó a AJ un rango de “1” y no hay jugadores debajo de él con un rango menor. Así, le asignamos un valor de 0:

Cálculo de tau de Kendall para pares discordantes

Repite este proceso para cada jugador:

El ejemplo de tau de Kendall

Paso 3: Calcula la suma de cada columna y encuentra la Tau de Kendall.

Cálculo de tau de Kendall

Tau de Kendall = (CD) / (C + D) = (63-3) / (63 + 3) = (60/66) = 0.909 .

Importancia estadística de la Tau de Kendall

Cuando tienes más de n = 10 pares, la Tau de Kendall generalmente sigue una distribución normal. Puede utilizar la siguiente fórmula para calcular una puntuación z para la Tau de Kendall:

z = 3τ * √ n (n-1) / √ 2 (2n + 5)

dónde:

τ = valor que calculó para la Tau de Kendall

n = número de pares

A continuación, se explica cómo calcular z para el ejemplo anterior:

z = 3 (.909) * √ 12 (12-1) / √ 2 (2 * 12 + 5) = 4.11 .

Usando la Calculadora de puntaje Z a valor P , vemos que el valor p para este puntaje z es 0.00004 , que es estadísticamente significativo en el nivel alfa 0.05. Así, existe una correlación estadísticamente significativa entre los rangos que los dos entrenadores asignaron a los jugadores.

Bono: Cómo calcular la Tau de Kendall en R

En el software estadístico R, puede usar la función kendall.tau () de la biblioteca VGAM para calcular la Tau de Kendall para dos vectores, que usa la siguiente sintaxis:

kendall.tau (x, y)

donde x y y son dos vectores numéricos de igual lenghth.

El siguiente código ilustra cómo calcular la Tau de Kendall para los datos exactos que usamos en el ejemplo anterior:

#load MAVG
 biblioteca (MAVG)

#crear vector para la clasificación de cada entrenador
entrenador_1 <- c (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)
entrenador_2 <- c (1, 2, 3, 5, 4, 7, 6, 8, 10, 9, 11, 12)

#calcular el Tau kendall.tau de Kendall
 (coach_1, coach_2)

# [1] 0.9090909

Observe cómo el valor de Tau de Kendall coincide con el valor que calculamos a mano.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba z de dos proporciones para probar la diferencia entre dos proporciones de población. Por ejemplo, suponga…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!