Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 11 de mayo de 2022, por Luis Benites.
El coeficiente de correlación de Matthews (MCC), inventado por Brian Matthews en 1975, es una herramienta para la evaluación de modelos. Mide las diferencias entre los valores reales y los valores predichos y es equivalente al estadístico chi-cuadrado para una tabla de contingencia de 2 x 2 (Kaden et al., 2014).
El coeficiente tiene en cuenta verdaderos negativos, verdaderos positivos, falsos negativos y falsos positivos. Esta medida confiable produce puntajes altos solo si la predicción arroja buenas tasas para las cuatro categorías (Chicco & Jurman, 2020).
Fórmula del coeficiente de correlación de Matthews
La fórmula se calcula con la ecuación (Măndoiu, 2007):
Como la mayoría de los coeficientes de correlación, MCC oscila entre -1 y 1, donde (Vothihong et al., 2017):
- 1 es la mejor concordancia entre datos reales y predicciones,
- cero es ningún acuerdo en absoluto. En otras palabras, la predicción es aleatoria con respecto a los datos reales.
En algunos contextos, como la predicción de estructuras secundarias en bioinformática, MCC es equivalente al coeficiente de correlación de Pearson (Baldi et al., 2000).
Referencias
Baldi, P. et al. (2000). Evaluación de la precisión de los algoritmos de predicción para la clasificación: una descripción general. Bioinformatics, volumen 16, número 5, mayo, páginas 412–424, https://doi.org/10.1093/bioinformatics/16.5.412
Chicco, D. & Jurman, G. (2020). Las ventajas del coeficiente de correlación de Matthews (MCC) sobre la puntuación F1 y la precisión en la evaluación de la clasificación binaria. BMC Genomics volumen 21, Número de artículo: 6.
Kaden, M. et al., (2014). Optimización de Medidas Generales de Precisión Estadística para Clasificación Basada en Aprendizaje VectorQuantization . Actas de ESANN 2014, Simposio Europeo sobre Redes Neuronales Artificiales, Inteligencia Computacional
y Aprendizaje Automático. Brujas (Bélgica), 23-25 de abril de 2014, i6doc.com publ., ISBN 978-287419095-7.
Disponible en http://www.i6doc.com/fr/livre/?GCOI=28001100432440.
Vothihong, P. et al. (2007). Python: análisis de datos de extremo a extremo . Publicación de paquetes.
Yang, Z. (2007). Predicción de sitios de palmitoilación utilizando una red neuronal de función de base biológica regularizada. Tercer Simposio Internacional de Investigación y Aplicaciones de Bioinformática
, ISBRA 2007, Atlanta, GA, EE. UU., 7 al 10 de mayo de 2007, Actas. Saltador.
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: