Correlaciones en Stata: Pearson, Spearman y Kendall

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

En estadística, la correlación se refiere a la fuerza y ​​dirección de una relación entre dos variables. El valor de un coeficiente de correlación puede variar de -1 a 1, donde -1 indica una relación negativa perfecta, 0 indica que no hay relación y 1 indica una relación positiva perfecta.

Hay tres formas habituales de medir la correlación:

Correlación de Pearson: se utiliza para medir la correlación entre dos variables continuas. (por ejemplo, altura y peso)

Correlación de Spearman: se utiliza para medir la correlación entre dos variables clasificadas. (por ejemplo, rango del puntaje del examen de matemáticas de un estudiante frente al rango del puntaje del examen de ciencias en una clase)

Correlación de Kendall: se utiliza cuando desea utilizar la correlación de Spearman, pero el tamaño de la muestra es pequeño y hay muchos rangos empatados.

Este tutorial explica cómo encontrar los tres tipos de correlaciones en Stata.

Cargando los datos

Para cada uno de los siguientes ejemplos usaremos un conjunto de datos llamado auto . Puede cargar este conjunto de datos escribiendo lo siguiente en el cuadro Comando:

use http://www.stata-press.com/data/r13/auto

Podemos echar un vistazo rápido al conjunto de datos escribiendo lo siguiente en el cuadro de Comando:

resumir

Comando resumir de ejemplo en Stata

Podemos ver que hay 12 variables en total en el conjunto de datos.

Cómo encontrar la correlación de Pearson en Stata

Podemos encontrar el coeficiente de correlación de Pearson entre las variables peso y longitud usando el comando pwcorr :

pwcorr peso longitud

Correlación de Pearson en Stata

El coeficiente de correlación de Pearson entre estas dos variables es 0,9460 . Para determinar si este coeficiente de correlación es significativo, podemos encontrar el valor p usando el comando sig :

pwcorr peso longitud, sig

Importancia de la correlación de Pearson en Stata

El valor p es 0,000 . Dado que es inferior a 0,05, la correlación entre estas dos variables es estadísticamente significativa.

Para encontrar el coeficiente de correlación de Pearson para múltiples variables, simplemente escriba una lista de variables después del comando pwcorr :

pwcorr peso longitud desplazamiento, sig

Correlación de Pearson para múltiples variables en Stata

A continuación se explica cómo interpretar la salida:

  • Correlación de Pearson entre peso y longitud = 0,9460 | valor p = 0.000
  • Correlación de Pearson entre peso y desplazamiento = 0,8949 | valor p = 0.000
  • Correlación de Pearson entre desplazamiento y longitud = 0,8351 | valor p = 0.000

Cómo encontrar la correlación de Spearman en Stata

Podemos encontrar el coeficiente de correlación de Spearman entre las variables tronco y rep78 utilizando el Spearman comando:

baúl de lancero rep78

Correlación de Spearman en Stata

A continuación se explica cómo interpretar la salida:

  • Número de observaciones : este es el número de observaciones por pares que se utilizan para calcular el coeficiente de correlación de Spearman. Debido a que faltaban algunos valores para la variable rep78 , Stata utilizó solo 69 (en lugar de las 74 completas) observaciones por pares.
  • Rho de Spearman: este es el coeficiente de correlación de Spearman. En este caso, es -0,2235, lo que indica que existe una correlación negativa entre las dos variables. A medida que uno aumenta, el otro tiende a disminuir.
  • Prob> | t |: Este es el valor p asociado con la prueba de hipótesis. En este caso, el valor p es 0.0649, lo que indica que no existe una correlación estadísticamente significativa entre las dos variables en α = 0.05.

Podemos encontrar el coeficiente de correlación de Spearman para variables múltiples simplemente escribiendo más variables después del lancero de comandos. Podemos encontrar el coeficiente de correlación y el valor p correspondiente para cada correlación por pares usando el comando stats (rho p) :

spearman trunk rep78 gear_ratio, stats (rho p)

Correlación de Spearman para múltiples variables en Stata

A continuación se explica cómo interpretar la salida:

  • Correlación de Spearman entre tronco y rep78 = -0,2235 | valor p = 0.0649
  • Correlación de Spearman entre tronco y relación_engranaje = -0,5187 | valor p = 0,0000
  • Correlación de Spearman entre gear_ratio y rep78 = 0.4275 | valor p = 0,0002

Cómo encontrar la correlación de Kendall en Stata

Podemos encontrar el coeficiente de correlación de Kendall entre las variables trunk y rep78 usando el comando ktau :

ktau tronco rep78

Correlación de Kendall en Stata

A continuación se explica cómo interpretar la salida:

  • Número de observaciones : este es el número de observaciones por pares que se utilizan para calcular el coeficiente de correlación de Kendall. Debido a que había algunos valores faltantes para la variable rep78 , Stata utilizó solo 69 (en lugar de las 74 completas) observaciones por pares.
  • Tau-b de Kendall : este es el coeficiente de correlación de Kendall entre las dos variables. Normalmente usamos este valor en lugar de tau-a porque tau-b hace ajustes para los empates. En este caso, tau-b = -0,1752, lo que indica una correlación negativa entre las dos variables.
  • Prob> | z |: Este es el valor p asociado con la prueba de hipótesis. En este caso, el valor p es 0.0662, lo que indica que no existe una correlación estadísticamente significativa entre las dos variables en α = 0.05.

Podemos encontrar el coeficiente de correlación de Kendall para múltiples variables simplemente escribiendo más variables después del comando ktau . Podemos encontrar el coeficiente de correlación y el valor p correspondiente para cada correlación por pares usando el comando stats (taub p) :

ktau maletero rep78 gear_ratio, stats (taub p)

Tau de Kendall para múltiples variables en Stata

  • Correlación de Kendall entre tronco y rep78 = -0,1752 | valor p = 0.0662
  • Correlación de Kendall entre tronco y relación_engranaje = -0,3753 | valor p = 0,0000
  • Correlación de Kendall entre gear_ratio y rep78 = 0.3206 | valor p = 0,0006
  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La prueba de McNemar se utiliza para determinar si existe una diferencia estadísticamente significativa en las proporciones entre los datos…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!