Contenido de este artículo
- 0
- 0
- 0
- 0
En estadística, la correlación se refiere a la fuerza y dirección de una relación entre dos variables. El valor de un coeficiente de correlación puede variar de -1 a 1, donde -1 indica una relación negativa perfecta, 0 indica que no hay relación y 1 indica una relación positiva perfecta.
Hay tres formas habituales de medir la correlación:
Correlación de Pearson: se utiliza para medir la correlación entre dos variables continuas. (por ejemplo, altura y peso)
Correlación de Spearman: se utiliza para medir la correlación entre dos variables clasificadas. (por ejemplo, rango del puntaje del examen de matemáticas de un estudiante frente al rango del puntaje del examen de ciencias en una clase)
Correlación de Kendall: se utiliza cuando desea utilizar la correlación de Spearman, pero el tamaño de la muestra es pequeño y hay muchos rangos empatados.
Este tutorial explica cómo encontrar los tres tipos de correlaciones en Stata.
Cargando los datos
Para cada uno de los siguientes ejemplos usaremos un conjunto de datos llamado auto . Puede cargar este conjunto de datos escribiendo lo siguiente en el cuadro Comando:
use http://www.stata-press.com/data/r13/auto
Podemos echar un vistazo rápido al conjunto de datos escribiendo lo siguiente en el cuadro de Comando:
resumir
Podemos ver que hay 12 variables en total en el conjunto de datos.
Cómo encontrar la correlación de Pearson en Stata
Podemos encontrar el coeficiente de correlación de Pearson entre las variables peso y longitud usando el comando pwcorr :
pwcorr peso longitud
El coeficiente de correlación de Pearson entre estas dos variables es 0,9460 . Para determinar si este coeficiente de correlación es significativo, podemos encontrar el valor p usando el comando sig :
pwcorr peso longitud, sig
El valor p es 0,000 . Dado que es inferior a 0,05, la correlación entre estas dos variables es estadísticamente significativa.
Para encontrar el coeficiente de correlación de Pearson para múltiples variables, simplemente escriba una lista de variables después del comando pwcorr :
pwcorr peso longitud desplazamiento, sig
A continuación se explica cómo interpretar la salida:
- Correlación de Pearson entre peso y longitud = 0,9460 | valor p = 0.000
- Correlación de Pearson entre peso y desplazamiento = 0,8949 | valor p = 0.000
- Correlación de Pearson entre desplazamiento y longitud = 0,8351 | valor p = 0.000
Cómo encontrar la correlación de Spearman en Stata
Podemos encontrar el coeficiente de correlación de Spearman entre las variables tronco y rep78 utilizando el Spearman comando:
baúl de lancero rep78
A continuación se explica cómo interpretar la salida:
- Número de observaciones : este es el número de observaciones por pares que se utilizan para calcular el coeficiente de correlación de Spearman. Debido a que faltaban algunos valores para la variable rep78 , Stata utilizó solo 69 (en lugar de las 74 completas) observaciones por pares.
- Rho de Spearman: este es el coeficiente de correlación de Spearman. En este caso, es -0,2235, lo que indica que existe una correlación negativa entre las dos variables. A medida que uno aumenta, el otro tiende a disminuir.
- Prob> | t |: Este es el valor p asociado con la prueba de hipótesis. En este caso, el valor p es 0.0649, lo que indica que no existe una correlación estadísticamente significativa entre las dos variables en α = 0.05.
Podemos encontrar el coeficiente de correlación de Spearman para variables múltiples simplemente escribiendo más variables después del lancero de comandos. Podemos encontrar el coeficiente de correlación y el valor p correspondiente para cada correlación por pares usando el comando stats (rho p) :
spearman trunk rep78 gear_ratio, stats (rho p)
A continuación se explica cómo interpretar la salida:
- Correlación de Spearman entre tronco y rep78 = -0,2235 | valor p = 0.0649
- Correlación de Spearman entre tronco y relación_engranaje = -0,5187 | valor p = 0,0000
- Correlación de Spearman entre gear_ratio y rep78 = 0.4275 | valor p = 0,0002
Cómo encontrar la correlación de Kendall en Stata
Podemos encontrar el coeficiente de correlación de Kendall entre las variables trunk y rep78 usando el comando ktau :
ktau tronco rep78
A continuación se explica cómo interpretar la salida:
- Número de observaciones : este es el número de observaciones por pares que se utilizan para calcular el coeficiente de correlación de Kendall. Debido a que había algunos valores faltantes para la variable rep78 , Stata utilizó solo 69 (en lugar de las 74 completas) observaciones por pares.
- Tau-b de Kendall : este es el coeficiente de correlación de Kendall entre las dos variables. Normalmente usamos este valor en lugar de tau-a porque tau-b hace ajustes para los empates. En este caso, tau-b = -0,1752, lo que indica una correlación negativa entre las dos variables.
- Prob> | z |: Este es el valor p asociado con la prueba de hipótesis. En este caso, el valor p es 0.0662, lo que indica que no existe una correlación estadísticamente significativa entre las dos variables en α = 0.05.
Podemos encontrar el coeficiente de correlación de Kendall para múltiples variables simplemente escribiendo más variables después del comando ktau . Podemos encontrar el coeficiente de correlación y el valor p correspondiente para cada correlación por pares usando el comando stats (taub p) :
ktau maletero rep78 gear_ratio, stats (taub p)
- Correlación de Kendall entre tronco y rep78 = -0,1752 | valor p = 0.0662
- Correlación de Kendall entre tronco y relación_engranaje = -0,3753 | valor p = 0,0000
- Correlación de Kendall entre gear_ratio y rep78 = 0.3206 | valor p = 0,0006
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: