Cómo calcular la correlación punto-biserial en R

La correlación punto-biserial se utiliza para medir la relación entre una variable binaria, x, y una variable continua, y.

Similar al coeficiente de correlación de Pearson , el coeficiente de correlación biserial puntual toma un valor entre -1 y 1 donde:

  • -1 indica una correlación perfectamente negativa entre dos variables
  • 0 indica que no hay correlación entre dos variables
  • 1 indica una correlación perfectamente positiva entre dos variables

Este tutorial explica cómo calcular la correlación biserial puntual entre dos variables en R.

Ejemplo: correlación punto-biserial en R

Supongamos que tenemos una variable binaria, x, y una variable continua, y:

x <- c (0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0)

y <- c (12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)

Podemos usar la función R incorporada cor.test () para calcular la correlación biserial puntual entre las dos variables:

#calcular la correlación biserial puntual
cor.test (x, y)

	Correlación producto-momento de Pearson

datos: xey
t = 0,67064, gl = 9, valor p = 0,5193

hipótesis alternativa: la correlación verdadera no es igual a 0

Intervalo de confianza del 95 por ciento:
 -0,4391885 0,7233704

estimaciones de muestra:
      cor 
0.2181635 

Del resultado podemos observar lo siguiente:

  • El coeficiente de correlación biserial puntual es 0,218
  • El valor p correspondiente es 0.5193

Dado que el coeficiente de correlación es positivo, esto indica que cuando la variable x toma el valor «1», la variable y tiende a tomar valores más altos en comparación con cuando la variable x toma el valor «0».

Sin embargo, dado que el valor p de esta correlación no es menor a .05, esta correlación no es estadísticamente significativa.

Tenga en cuenta que la salida también proporciona un intervalo de confianza del 95% para el coeficiente de correlación real, que resulta ser:

IC del 95% = (-0,439, 0,723)

Dado que este intervalo de confianza contiene cero, esto es una prueba más de que el coeficiente de correlación no es estadísticamente significativo.

Puede encontrar la documentación completa para la función cor.test () aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Una tabla de dos factores es un tipo de tabla que muestra las frecuencias de dos variables categóricas. Por ejemplo,…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!