Contenido de este artículo
- 0
- 0
- 0
- 0
La covarianza es una medida de cómo los cambios en una variable se asocian con los cambios en una segunda variable. Específicamente, es una medida del grado en que dos variables están asociadas linealmente.
La fórmula para calcular la covarianza entre dos variables, X e Y es:
COV ( X , Y ) = Σ (x- x ) (y- y ) / n
Una matriz de covarianza es una matriz cuadrada que muestra la covarianza entre muchas variables diferentes. Esta puede ser una forma fácil y útil de comprender cómo se relacionan las diferentes variables en un conjunto de datos.
El siguiente ejemplo muestra cómo crear una matriz de covarianza en Excel usando un conjunto de datos simple.
Cómo crear una matriz de covarianza en Excel
Supongamos que tenemos el siguiente conjunto de datos que muestra los puntajes de las pruebas de 10 estudiantes diferentes para tres materias: matemáticas, ciencias e historia.
Para crear una matriz de covarianza para este conjunto de datos, haga clic en la opción Análisis de datos en la parte superior derecha de Excel en la pestaña Datos .
Nota: Si no ve la opción Análisis de datos, primero debe cargar el Paquete de herramientas de análisis de datos .
Una vez que haga clic en esta opción, aparecerá una nueva ventana. Haga clic en Covarianza .
En el cuadro Rango de entrada , escriba «$ A $ 1: $ C $ 11», ya que este es el rango de celdas donde se encuentra nuestro conjunto de datos. Marque la casilla que dice Etiquetas en la primera fila para decirle a Excel que las etiquetas de nuestras variables se encuentran en la primera fila. Luego, en el cuadro Rango de salida , escriba cualquier celda en la que desee que aparezca la matriz de covarianza. Elegí la celda $ E $ 2. Luego haga clic en Aceptar .
La matriz de covarianza se genera automáticamente y aparece en la celda $ E $ 2:
Cómo interpretar una matriz de covarianza
Una vez que tenemos una matriz de covarianza, es bastante simple interpretar los valores en la matriz.
Los valores a lo largo de las diagonales de la matriz son simplemente las variaciones de cada sujeto. Por ejemplo:
- La varianza de las puntuaciones de matemáticas es 64,96
- La varianza de las puntuaciones de ciencias es 56,4
- La varianza de las puntuaciones del historial es 75,56
Los otros valores de la matriz representan las covarianzas entre los distintos sujetos. Por ejemplo:
- La covarianza entre los puntajes de matemáticas y ciencias es 33.2
- La covarianza entre las puntuaciones de matemáticas e historia es -24,44
- La covarianza entre las puntuaciones de ciencia e historia es -24,1
Un número positivo de covarianza indica que dos variables tienden a aumentar o disminuir en conjunto. Por ejemplo, las matemáticas y las ciencias tienen una covarianza positiva (33,2), lo que indica que los estudiantes que obtienen un puntaje alto en matemáticas también tienden a obtener un puntaje alto en ciencias. Del mismo modo, los estudiantes que obtienen calificaciones bajas en matemáticas también tienden a obtener calificaciones bajas en ciencias.
Un número negativo de covarianza indica que a medida que aumenta una variable, una segunda variable tiende a disminuir. Por ejemplo, las matemáticas y la historia tienen una covarianza negativa (-24,44), lo que indica que los estudiantes que obtienen una puntuación alta en matemáticas tienden a obtener una puntuación baja en la historia. Del mismo modo, los estudiantes que obtienen una puntuación baja en matemáticas tienden a obtener una puntuación alta en historia.
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: