Matriz de confusión

Actualizado por ultima vez el 9 de abril de 2022, por Luis Benites.

Una matriz de confusión , en análisis predictivo, es una tabla de dos por dos que nos dice la tasa de falsos positivos , falsos negativos , verdaderos positivos y verdaderos negativos para una prueba o predictor . Podemos hacer una matriz de confusión si conocemos tanto los valores predichos como los valores verdaderos para un conjunto de muestra.

En el aprendizaje automático y la clasificación estadística, una matriz de confusión es una tabla en la que las predicciones se representan en columnas y el estado real se representa en filas. A veces esto se invierte, con instancias reales en filas y predicciones en columnas. La tabla es una extensión de la matriz de confusión en el análisis predictivo y facilita ver si se ha producido un etiquetado incorrecto y si las predicciones son más o menos correctas.

Una matriz de confusión también se conoce como matriz de error y es un tipo de tabla de contingencia .

Terminología relacionada con una matriz de confusión

Suponga que su matriz de confusión es una tabla simple de 2 por 2, dada por:


Aquí a es el número de verdaderos negativos y d el número de verdaderos positivos. b es el número de falsos positivos y c es el número de falsos negativos.

  • La precisión de la predicción o prueba se define como (a + d)/(a + c + d + e).
  • La tasa de verdaderos positivos viene dada por d/(c + d), y también se denomina recuperación. Nos dice qué proporción de casos positivos fueron correctamente identificados.
  • La tasa de falsos positivos , o proporción de casos negativos (incorrectamente) identificados como positivos, viene dada por b/(a + b).
  • La tasa de verdaderos negativos es a/(a + b), y representa la proporción de casos negativos que se identificaron correctamente.
  • La tasa de falsos negativos es c/(c + d), y nos dice qué proporción de casos positivos se etiquetaron incorrectamente como negativos.
  • La proporción de las instancias que etiquetamos correctamente como positivas (por predicción positiva total) está dada por d/(b + d) y se denomina precisión .

Referencias

Hamilton, Howard J. Matriz de confusión. Notas del curso de Ciencias de la Computación 831: Descubrimiento de conocimiento en bases de datos. Recuperado de http://www2.cs.uregina.ca/~hamilton/courses/831/notes/confusion_matrix/confusion_matrix.html el 1 de agosto de 2018.
Oliver, Arnau. Matrices de confusión. Matrices de Evaluación, 2008-06-17. Recuperado de http://eia.udg.edu/~aoliver/publications/tesi/node143.html el 3 de agosto de 2018.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Mire el video para la definición, ejecución de la prueba (SPSS/Excel) e interpretación: Omega al cuadrado con SPSS y Excel…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!