Cómo crear e interpretar una matriz de correlación en Excel

Una forma de cuantificar la relación entre dos variables es utilizar el coeficiente de correlación de Pearson , que es una medida de la asociación lineal entre dos variables .Tiene un valor entre -1 y 1 donde:

  • -1 indica una correlación lineal perfectamente negativa entre dos variables
  • 0 indica que no hay correlación lineal entre dos variables
  • 1 indica una correlación lineal perfectamente positiva entre dos variables

Cuanto más lejos esté el coeficiente de correlación de cero, más fuerte será la relación entre las dos variables.

Pero en algunos casos queremos comprender la correlación entre más de un par de variables. En estos casos, podemos crear una matriz de correlación , que es una tabla cuadrada que muestra los coeficientes de correlación entre varias combinaciones de variables por pares.

Este tutorial explica cómo crear e interpretar una matriz de correlación en Excel.

Cómo crear una matriz de correlación en Excel

Supongamos que tenemos el siguiente conjunto de datos que muestra el promedio de puntos, rebotes y asistencias de 10 jugadores de baloncesto:

Para crear una matriz de correlación para este conjunto de datos, vaya a la pestaña Datos en la cinta superior de Excel y haga clic en Análisis de datos .

Paquete de herramientas de análisis de datos en Excel

Si no ve esta opción, primero debe cargar el paquete de herramientas de análisis de datos gratuito en Excel .

En la nueva ventana que aparece, seleccione Correlación y haga clic en Aceptar .

Matriz de correlación con paquete de herramientas de análisis de datos en Excel

Para Rango de entrada , seleccione las celdas donde se encuentran los datos (incluida la primera fila con las etiquetas). Marque la casilla junto a Etiquetas en la primera fila . Para Rango de salida , seleccione una celda donde le gustaría que aparezca la matriz de correlación. Luego haga clic en Aceptar .

Matriz de correlación en Excel

Esto producirá automáticamente la siguiente matriz de correlación:

Salida de la matriz de correlación en Excel

Cómo interpretar una matriz de correlación en Excel

Los valores de las celdas individuales de la matriz de correlación nos indican el coeficiente de correlación de Pearson entre cada combinación de variables por pares. Por ejemplo:

Correlación entre puntos y rebotes: -0.04639. Los puntos y los rebotes tienen una correlación levemente negativa, pero este valor es tan cercano a cero que no hay pruebas sólidas de una asociación significativa entre estas dos variables.

Correlación entre puntos y asistencias: 0.121871. Los puntos y las asistencias tienen una correlación levemente positiva, pero este valor también es bastante cercano a cero, por lo que no hay pruebas sólidas de una asociación significativa entre estas dos variables.

Correlación entre rebotes y asistencias: 0,713713. Los rebotes y las asistencias están fuertemente correlacionados positivamente. Es decir, los jugadores que tienen más rebotes también suelen tener más asistencias.

Observe que los valores diagonales en la matriz de correlación son todos iguales a 1 porque la correlación entre una variable y ella misma es siempre 1. En la práctica, este número no es útil para interpretar.

Bono: Visualización de coeficientes de correlación

Una forma sencilla de visualizar el valor de los coeficientes de correlación en la tabla es aplicar el formato condicional a la tabla. A lo largo de la cinta superior en Excel, vaya a la pestaña Inicio , luego al grupo Estilos . Haga clic en Gráfico de formato condicional , luego haga clic en Escalas de color , luego haga clic en Escala de color verde-amarillo-rojo .

Esto aplica automáticamente la siguiente escala de colores a la matriz de correlación:

Matriz de correlación con formato condicional en Excel

Esto nos ayuda a visualizar fácilmente la fuerza de las correlaciones entre las variables. Este es un truco particularmente útil si estamos trabajando con una matriz de correlación que tiene muchas variables porque nos ayuda a identificar rápidamente las variables que tienen las correlaciones más fuertes.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Uno de los supuestos de la regresión lineal es que no existe correlación entre los residuos. En otras palabras, se…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!