Análisis Discriminante Lineal: Definición Simple

Actualizado por ultima vez el 8 de enero de 2022, por Luis Benites.

¿Qué es el análisis discriminante lineal?

En estadística, reconocimiento de patrones y aprendizaje automático, el análisis discriminante lineal (LDA) , también llamado análisis de variación canónico (CVA), es una forma de estudiar las diferencias entre objetos. Este método de clasificación utiliza una combinación lineal de características para caracterizar las clases. Más específicamente, las puntuaciones que separan un objeto de una clase particular a la siguiente se expresan como “combinaciones lineales de las variables explicativas que separan de manera óptima los grupos (clases) definidos a priori* ” (Šmilauer & Lepš, 2014).

Desarrollado en 1936 por RA Fisher , es simple y robusto , y los modelos que genera suelen ser tan buenos como los generados por algoritmos más complicados.

LDA es similar a la regresión logística y la regresión probit , y también, hasta cierto punto, al análisis de varianza (ANOVA) . Aunque tiene el término “lineal” en el título, puede expandirse al análisis de sistemas no lineales , utilizando funciones base spline no lineales (Decker & Lenz, 2007).

Objetivos del análisis discriminante lineal

LDA tiene dos objetivos amplios Elston et. al, 2002):

  • Predicción : encuentre una regla que permita ordenar los objetos en clases predefinidas.
  • Analizar : construye un modelo que pueda ayudar al usuario a descubrir patrones y ordenar los datos.

Análisis de series temporales

Cuando se utiliza para analizar ciclos económicos, es importante tener en cuenta que la técnica ignora el orden cronológico subyacente de los ciclos de series temporales (Decker & Lenz, 2007).

Nota

*A priori es: relacionado con lo que se puede saber mediante la comprensión de cómo funcionan ciertas cosas [es decir, una hipótesis] en lugar de mediante la observación” ~ Miriam Webster.

Referencias

Decker, R. y Lenz, H. (2007). Avances en análisis de datos: actas de la 30.ª conferencia anual de Gesellschaft für Klassifikation eV, Freie Universität Berlin, 8 al 10 de marzo de 2006. Springer Science & Business Media.
Elston et. al (Eds.) (2002). Genética Bioestadística y Epidemiología Genética. John Wiley & Sons.
Šmilauer, P. & Lepš, J. (2014). Análisis Multivariado de Datos Ecológicos usando CANOCO 5 . Prensa de la Universidad de Cambridge.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es la teoría fundamentada? La teoría fundamentada implica la recopilación y el análisis de datos. La teoría está "basada"…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!