Cómo crear una matriz de covarianza en hojas de Google

Actualizado por ultima vez el 7 de mayo de 2021, por .

La covarianza es una medida de cómo los cambios en una variable se asocian con los cambios en una segunda variable. Específicamente, es una medida del grado en que dos variables están asociadas linealmente.

La fórmula para calcular la covarianza entre dos variables, X e Y es:

COV ( X , Y ) = Σ (x- x ) (y- y ) / n

Una matriz de covarianza es una matriz cuadrada que muestra la covarianza entre muchas variables diferentes. Esta puede ser una forma útil de comprender cómo se relacionan las diferentes variables en un conjunto de datos.

El siguiente ejemplo muestra cómo crear una matriz de covarianza en Google Sheets para un conjunto de datos determinado.

Cómo crear una matriz de covarianza en hojas de Google

Supongamos que tenemos el siguiente conjunto de datos que muestra los puntajes de las pruebas de 10 estudiantes diferentes para tres materias: matemáticas, ciencias e historia.

Para crear una matriz de covarianza para este conjunto de datos, podemos usar la función COVAR () con la siguiente sintaxis:

COVAR (datos_y, datos_x)

La matriz de covarianza para este conjunto de datos se muestra en las celdas B15: D17, mientras que las fórmulas utilizadas para crear la matriz de covarianza se muestran en las celdas B21: D23 a continuación:

Matriz de covarianza en Google Sheets

Cómo interpretar una matriz de covarianza

Una vez que tenemos una matriz de covarianza, es sencillo interpretar los valores en la matriz.

Los valores a lo largo de las diagonales de la matriz son simplemente las variaciones de cada sujeto. Por ejemplo:

  • La varianza de las puntuaciones de matemáticas es 64,96
  • La varianza de las puntuaciones de ciencias es 56,4
  • La varianza de las puntuaciones del historial es 75,56

Los otros valores de la matriz representan las covarianzas entre los distintos sujetos. Por ejemplo:

  • La covarianza entre los puntajes de matemáticas y ciencias es 33.2
  • La covarianza entre las puntuaciones de matemáticas e historia es -24,44
  • La covarianza entre las puntuaciones de ciencia e historia es -24,1

Un número positivo de covarianza indica que dos variables tienden a aumentar o disminuir en conjunto. Por ejemplo, las matemáticas y las ciencias tienen una covarianza positiva (33,2), lo que indica que los estudiantes que obtienen un puntaje alto en matemáticas también tienden a obtener un puntaje alto en ciencias. Del mismo modo, los estudiantes que obtienen calificaciones bajas en matemáticas también tienden a obtener calificaciones bajas en ciencias.

Un número negativo de covarianza indica que a medida que aumenta una variable, una segunda variable tiende a disminuir. Por ejemplo, las matemáticas y la historia tienen una covarianza negativa (-24,44), lo que indica que los estudiantes que obtienen una puntuación alta en matemáticas tienden a obtener una puntuación baja en la historia. Del mismo modo, los estudiantes que obtienen una puntuación baja en matemáticas tienden a obtener una puntuación alta en historia.

Recursos adicionales

Cómo crear una matriz de covarianza en Excel
Cómo crear una matriz de covarianza en R
Cómo crear una matriz de covarianza en Python
Cómo crear una matriz de covarianza en SPSS

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, cuando estamos interesados ​​en determinar si existe o no una diferencia significativa entre dos grupos, a menudo realizamos…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!