Cómo calcular un coeficiente de correlación de Pearson a mano

Actualizado el 17 de julio de 2024, por Luis Benites.

Un coeficiente de correlación de Pearson mide la asociación lineal entre dos variables.

Siempre toma un valor entre -1 y 1 donde:

  • -1 indica una correlación lineal perfectamente negativa entre dos variables
  • 0 indica que no hay correlación lineal entre dos variables
  • 1 indica una correlación lineal perfectamente positiva entre dos variables

La fórmula para calcular un coeficiente de correlación de Pearson, denotado r , es:

Fuente: Wikipedia

Este tutorial proporciona un ejemplo paso a paso de cómo calcular manualmente un coeficiente de correlación de Pearson para el siguiente conjunto de datos:

Paso 1: Calcule la media de X e Y

Primero, calcularemos la media de los valores X e Y:

Paso 2: Calcule la diferencia entre medias

A continuación, calcularemos la diferencia entre cada uno de los valores X e Y individuales y sus respectivas medias:

Paso 3: Calcule los valores restantes

A continuación, calcularemos los valores restantes necesarios para completar la fórmula del coeficiente de correlación de Pearson:

Paso 4: Calcule las sumas

A continuación, calcularemos las sumas de las últimas tres columnas:

Paso 5: Calcule el coeficiente de correlación de Pearson

Ahora simplemente ingresaremos las sumas del paso anterior en la fórmula para el coeficiente de correlación de Pearson:

Coeficiente de correlación de Pearson a mano

El coeficiente de correlación de Pearson resulta ser 0,947 .

Dado que este valor es cercano a 1, esto es una indicación de que X e Y están fuertemente correlacionados positivamente.

En otras palabras, a medida que aumenta el valor de X, el valor de Y también aumenta de una manera muy predecible.

Recursos adicionales

Introducción al coeficiente de correlación de Pearson
Cómo encontrar un intervalo de confianza para un coeficiente de correlación

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La distribución normal es la distribución de probabilidad más utilizada en todas las estadísticas. Tiene las siguientes propiedades: En forma…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!