¿Qué se considera una correlación «débil»?

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

En estadística, a menudo nos interesa comprender cómo se relacionan dos variables entre sí. Por ejemplo, podríamos querer saber:

  • ¿Cuál es la relación entre la cantidad de horas que estudia un estudiante y la puntuación del examen que recibe?
  • ¿Cuál es la relación entre la temperatura exterior y la cantidad de barras de helado que vende un camión de comida?
  • ¿Cuál es la relación entre los dólares gastados en publicidad y los ingresos totales obtenidos para una determinada empresa?

En cada escenario, estamos interesados ​​en comprender la relación entre dos variables.

Una de las formas más comunes de cuantificar una relación entre dos variables es utilizar el coeficiente de correlación de Pearson , que es una medida de la asociación lineal entre dos variables.

Siempre toma un valor entre -1 y 1 donde:

  • -1 indica una correlación lineal perfectamente negativa entre dos variables
  • 0 indica que no hay correlación lineal entre dos variables
  • 1 indica una correlación lineal perfectamente positiva entre dos variables

Denotado a menudo como r , este número nos ayuda a comprender la fuerza de la relación entre dos variables. Cuanto más cerca de cero esté r , más débil será la relación entre las dos variables .

Es importante señalar que dos variables pueden tener una correlación positiva débil o una correlación negativa débil .

Correlación positiva débil: cuando una variable aumenta, la otra también tiende a aumentar, pero de manera débil o poco confiable.

Ejemplo de correlación positiva débil

Correlación negativa débil: cuando una variable aumenta, la otra tiende a disminuir, pero de manera débil o poco confiable.

Ejemplo de correlación negativa débil

La siguiente tabla muestra la regla empírica para interpretar la fuerza de la relación entre dos variables según el valor de r :

Valor absoluto de r Fuerza de la relación
r <0,25 Sin relación
0,25 <r <0,5 Relación débil
0,5 <r <0,75 Relación moderada
r> 0,75 Relación fuerte

La correlación entre dos variables se considera débil si el valor absoluto de r está entre 0,25 y 0,5.

Sin embargo, la definición de una correlación «débil» puede variar de un campo a otro.

Médico

En el campo de la medicina, la definición de relación «débil» suele ser mucho más baja. Si la relación entre tomar un determinado medicamento y la reducción de los ataques cardíacos es r = 0.2, esto podría considerarse «sin relación» en otros campos, pero en medicina es lo suficientemente significativo como para que valga la pena tomar el medicamento para reducir las posibilidades de tener un infarto.

Recursos humanos

En un campo como los recursos humanos, las correlaciones más bajas también se utilizan con más frecuencia. Por ejemplo, se ha demostrado que la correlación entre el GPA universitario y el desempeño laboral es de aproximadamente r = 0.16 . Esto es bastante bajo, pero es lo suficientemente grande como para que sea algo que una empresa al menos miraría durante un proceso de entrevista.

Tecnología

En los campos de la tecnología, es posible que la correlación entre las variables deba ser mucho más alta para incluso ser considerada «débil». Por ejemplo, si una empresa crea un automóvil autónomo y la correlación entre las decisiones de giro del automóvil y la probabilidad de evitar un accidente es r = 0,95 , esto puede considerarse una correlación «débil» y es probable que sea demasiado baja para que el automóvil lo haga. ser considerado seguro ya que el resultado de tomar una decisión incorrecta puede ser fatal.

Uso de diagramas de dispersión para visualizar correlaciones

Cuando calcula el coeficiente de correlación entre dos variables, es útil crear un diagrama de dispersión para visualizar también la correlación.

En particular, los diagramas de dispersión ofrecen dos beneficios:

1. Los diagramas de dispersión pueden ayudarlo a identificar valores atípicos que afectan el coeficiente de correlación.

Un valor atípico extremo puede tener un gran impacto en el coeficiente de correlación. Considere el ejemplo siguiente, en el que las variables X e Y tienen un coeficiente de correlación de Pearson de r = 0,91 .

Ahora imagine que modificamos el primer punto de datos para que sea mucho más grande. El coeficiente de correlación se convierte repentinamente en r = 0.29 .

Este único dato hace que el coeficiente de correlación cambie de una relación positiva fuerte a una relación positiva débil.

(2) Los diagramas de dispersión pueden ayudarlo a identificar relaciones no lineales entre variables.

Un coeficiente de correlación de Pearson simplemente nos dice si dos variables están relacionadas linealmente . Pero incluso si un coeficiente de correlación de Pearson nos dice que dos variables no están correlacionadas, aún podrían tener algún tipo de relación no lineal.

Por ejemplo, considere la gráfica de dispersión a continuación entre las variables X e Y , en la que su correlación es r = 0.00 .

Las variables claramente no tienen relación lineal, sino que hacer tener una relación no lineal: Los valores de y son simplemente los valores de x al cuadrado.

Un coeficiente de correlación por sí solo no podría captar esta relación, pero un diagrama de dispersión sí.

Conclusión

En resumen:

1. Como regla general, un coeficiente de correlación entre 0,25 y 0,5 se considera una correlación «débil» entre dos variables.

2. Esta regla general puede variar de un campo a otro. Por ejemplo, una correlación mucho menor podría considerarse débil en un campo médico en comparación con un campo tecnológico. Asegúrese de utilizar la experiencia en la materia al decidir qué se considera una correlación débil.

3. Cuando se usa un coeficiente de correlación para describir la relación entre dos variables, también es útil crear un diagrama de dispersión para que pueda identificar cualquier valor atípico en el conjunto de datos junto con una posible relación no lineal.

Recursos adicionales

¿Qué se considera una correlación “fuerte”?
Calculadora de matriz de correlación
Correlación y asociación: ¿Cuál es la diferencia?

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

A menudo, en los experimentos, los investigadores están interesados ​​en comprender la relación entre una variable explicativa y una variable…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!