Cómo calcular la correlación de rango de Spearman en Python

En estadística, la correlación se refiere a la fuerza y ​​dirección de una relación entre dos variables. El valor de un coeficiente de correlación puede variar de -1 a 1, con las siguientes interpretaciones:

  • -1: una relación negativa perfecta entre dos variables
  • 0: sin relación entre dos variables
  • 1: una relación positiva perfecta entre dos variables

Un tipo especial de correlación se llama Correlación de rango de Spearman , que se utiliza para medir la correlación entre dos variables clasificadas. (por ejemplo, rango del puntaje del examen de matemáticas de un estudiante versus rango del puntaje del examen de ciencias en una clase).

Este tutorial explica cómo calcular la correlación de rango de Spearman entre dos variables en Python

Ejemplo: correlación de rango de Spearman en Python

Supongamos que tenemos el siguiente marco de datos de pandas que contiene el puntaje del examen de matemáticas y el puntaje del examen de ciencias de 10 estudiantes en una clase en particular:

importar pandas como pd

#create DataFrame 
df = pd. DataFrame ({'estudiante': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   'matemáticas': [70, 78, 90, 87, 84, 86, 91, 74, 83, 85],
                   'ciencia': [90, 94, 79, 86, 84, 83, 88, 92, 76, 75]})

Para calcular la correlación de rango de Spearman entre los puntajes de matemáticas y ciencias, podemos usar la función spearmanr () de scipy.stats :

de scipy. Estadísticas  importar spearmanr
 
#calculate Spearman Rango de correlación y el correspondiente valor de p
rho, p = spearmanr (df [ 'matemáticas'], df ['ciencia'])

#print Correlación de rango de Spearman e impresión de valor p
 (rho)

-0,41818181818181815

imprimir (p)

0,22911284098281892

A partir de la salida, podemos ver que la correlación de rango de Spearman es -0,41818 y el valor p correspondiente es 0,22911 .

Esto indica que existe una correlación negativa entre las calificaciones de los exámenes de ciencias y matemáticas.

Sin embargo, dado que el valor p de la correlación no es menor de 0.05, la correlación no es estadísticamente significativa.

Tenga en cuenta que también podríamos usar la siguiente sintaxis para simplemente extraer el coeficiente de correlación o el valor p:

#extract Coeficiente de correlación de rango de Spearman spearmanr
 (df ​​[' matemáticas '], df [' ciencia ']) [0]

-0,41818181818181815

# extraer el valor p del coeficiente de correlación de rango de Spearman 
spearmanr (df [' matemáticas '], df [' ciencia ']) [1]

0,22911284098281892

Recursos adicionales

Cómo calcular la correlación de rango de Spearman en R
Cómo calcular la correlación de rango de Spearman en Excel
Cómo calcular la correlación de rango de Spearman en Stata

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba F parcial para determinar si existe una diferencia estadísticamente significativa entre un modelo de regresión y…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!