Coeficiente de correlación de Matthews

Actualizado por ultima vez el 11 de mayo de 2022, por Luis Benites.

El coeficiente de correlación de Matthews (MCC), inventado por Brian Matthews en 1975, es una herramienta para la evaluación de modelos. Mide las diferencias entre los valores reales y los valores predichos y es equivalente al estadístico chi-cuadrado para una tabla de contingencia de 2 x 2 (Kaden et al., 2014).

El coeficiente tiene en cuenta verdaderos negativos, verdaderos positivos, falsos negativos y falsos positivos. Esta medida confiable produce puntajes altos solo si la predicción arroja buenas tasas para las cuatro categorías (Chicco & Jurman, 2020).

Fórmula del coeficiente de correlación de Matthews

La fórmula se calcula con la ecuación (Măndoiu, 2007):
coeficiente de correlación de matthews

Como la mayoría de los coeficientes de correlación, MCC oscila entre -1 y 1, donde (Vothihong et al., 2017):

  • 1 es la mejor concordancia entre datos reales y predicciones,
  • cero es ningún acuerdo en absoluto. En otras palabras, la predicción es aleatoria con respecto a los datos reales.

En algunos contextos, como la predicción de estructuras secundarias en bioinformática, MCC es equivalente al coeficiente de correlación de Pearson (Baldi et al., 2000).

Referencias

Baldi, P. et al. (2000). Evaluación de la precisión de los algoritmos de predicción para la clasificación: una descripción general. Bioinformatics, volumen 16, número 5, mayo, páginas 412–424, https://doi.org/10.1093/bioinformatics/16.5.412
Chicco, D. & Jurman, G. (2020). Las ventajas del coeficiente de correlación de Matthews (MCC) sobre la puntuación F1 y la precisión en la evaluación de la clasificación binaria. BMC Genomics volumen 21, Número de artículo: 6.
Kaden, M. et al., (2014). Optimización de Medidas Generales de Precisión Estadística para Clasificación Basada en Aprendizaje VectorQuantization . Actas de ESANN 2014, Simposio Europeo sobre Redes Neuronales Artificiales, Inteligencia Computacional
y Aprendizaje Automático. Brujas (Bélgica), 23-25 ​​de abril de 2014, i6doc.com publ., ISBN 978-287419095-7.
Disponible en http://www.i6doc.com/fr/livre/?GCOI=28001100432440.
Vothihong, P. et al. (2007). Python: análisis de datos de extremo a extremo . Publicación de paquetes.
Yang, Z. (2007). Predicción de sitios de palmitoilación utilizando una red neuronal de función de base biológica regularizada. Tercer Simposio Internacional de Investigación y Aplicaciones de Bioinformática
, ISBRA 2007, Atlanta, GA, EE. UU., 7 al 10 de mayo de 2007, Actas. Saltador.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

El coeficiente de contingencia es un coeficiente de asociación que indica si dos variables o conjuntos de datos son independientes…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!