En estadística, la correlación entre dos variables nos informa sobre la relación entre esas dos variables.
Uno de los tipos más básicos de correlación se conoce como correlación de orden cero , que se refiere a la correlación entre dos variables sin controlar la posible influencia de otras variables.
Un ejemplo de este tipo de correlación es el Coeficiente de Correlación de Pearson , que mide la asociación lineal entre dos variables y puede tomar valores entre -1 y 1 donde:
- -1 indica una correlación lineal perfectamente negativa entre dos variables
- 0 indica que no hay correlación lineal entre dos variables
- 1 indica una correlación lineal perfectamente positiva entre dos variables
Cuanto más lejos esté la correlación de cero, más fuerte será la asociación entre las dos variables.
Correlaciones de primer y segundo orden
Si calculamos la correlación entre dos variables A y B controlando la influencia de una tercera variable C, nos referiríamos a la correlación entre A y B como una correlación de primer orden .
De manera similar, si calculamos la correlación entre dos variables A y B controlando la influencia de las variables C y D, nos referiremos a la correlación entre A y B como una correlación de segundo orden .
Ejemplo de correlación de orden cero
Supongamos que tenemos el siguiente conjunto de datos que muestra la cantidad de horas dedicadas al estudio y la puntuación del examen recibida por 10 estudiantes diferentes:
Resulta que la correlación entre estas dos variables es 0,762 . Esto se consideraría la correlación de orden cero entre las dos variables porque no estamos controlando la influencia potencial de una tercera variable.
Sin embargo, en realidad es posible que otros factores puedan afectar la relación entre estas dos variables. Por ejemplo, quizás la calificación actual del estudiante en la clase tenga un efecto en la calificación de su examen. Supongamos que también tuviéramos acceso a estos datos:
Si luego calculamos la correlación entre las horas y el examen mientras controlamos el efecto de la calificación actual , encontraríamos que la correlación de primer orden entre las horas y el examen es 0.578 .
Esto significa que todavía existe una correlación positiva bastante fuerte entre las horas estudiadas y el puntaje del examen recibido, incluso después de controlar el efecto de la calificación actual del estudiante en la clase.
Nota: La correlación de primer orden a veces se denomina correlación parcial . Este tutorial explica cómo calcular correlaciones parciales en Excel.
Correlaciones de orden cero en una matriz de correlación
Siempre que creamos una matriz de correlación para un conjunto de variables, los coeficientes de correlación que se muestran dentro de la matriz son siempre correlaciones de orden cero porque son simplemente las correlaciones entre cada combinación de variables por pares sin considerar la influencia de otras variables.
Por ejemplo, considere nuestro conjunto de datos del ejemplo anterior:
Si creáramos una matriz de correlación para este conjunto de datos, se vería así:
La forma de interpretar esto es la siguiente:
- La correlación entre el grado actual y las horas estudiadas es de 0,689 .
- La correlación entre la calificación actual y el puntaje del examen recibido es de 0.637 .
- La correlación entre las horas estudiadas y la puntuación obtenida en el examen es de 0,762 .
Cada una de estas correlaciones es una correlación de orden cero .
Recursos adicionales
Introducción al coeficiente de correlación de Pearson
Cómo leer una matriz de correlación
Cómo calcular la correlación parcial en Excel
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/