Cómo calcular la correlación punto-biserial en Python

La correlación punto-biserial se utiliza para medir la relación entre una variable binaria, x, y una variable continua, y.

Similar al coeficiente de correlación de Pearson , el coeficiente de correlación biserial puntual toma un valor entre -1 y 1 donde:

  • -1 indica una correlación perfectamente negativa entre dos variables
  • 0 indica que no hay correlación entre dos variables
  • 1 indica una correlación perfectamente positiva entre dos variables

Este tutorial explica cómo calcular la correlación biserial puntual entre dos variables en Python.

Ejemplo: correlación punto-biserial en Python

Supongamos que tenemos una variable binaria, x, y una variable continua, y:

x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0]
y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]

Podemos usar la función pointbiserialr () de la biblioteca scipy.stats para calcular la correlación punto-biserial entre las dos variables.

Tenga en cuenta que esta función devuelve un coeficiente de correlación junto con un valor p correspondiente:

importar scipy.stats como estadísticas

#calcular 
estadísticas de correlación biserial-puntual . pointbiserialr (x, y)

PointbiserialrResult (correlación = 0.21816, pvalue = 0.51928)

El coeficiente de correlación biserial puntual es 0,21816 y el valor p correspondiente es 0,51928 .

Dado que el coeficiente de correlación es positivo, esto indica que cuando la variable x toma el valor «1», la variable y tiende a tomar valores más altos en comparación con cuando la variable x toma el valor «0».

Dado que el valor p de esta correlación no es inferior a .05, esta correlación no es estadísticamente significativa.

Puede encontrar los detalles exactos de cómo se calcula esta correlación en la documentación de scipy.stats .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Un coeficiente de variación , a menudo abreviado como CV , es una forma de medir qué tan dispersos están…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!