Una rápida introducción al aprendizaje supervisado y no supervisado

Actualizado por ultima vez el 29 de abril de 2022, por Dereck Amesquita.

El campo del aprendizaje automático contiene un conjunto masivo de algoritmos que se pueden usar para comprender los datos. Estos algoritmos se pueden clasificar en una de dos categorías:

1. Algoritmos de aprendizaje supervisado: Implica la construcción de un modelo para estimar o predecir un resultado basado en una o más entradas.

2. Algoritmos de aprendizaje no supervisados: Implica encontrar estructuras y relaciones a partir de las entradas. No hay salida de «supervisión».

Este tutorial explica la diferencia entre estos dos tipos de algoritmos junto con varios ejemplos de cada uno.

Algoritmos de aprendizaje supervisado

Se puede utilizar un algoritmo de aprendizaje supervisado cuando tenemos una o más variables explicativas (X 1 , X 2 , X 3 ,…, X p ) y una variable de respuesta (Y) y nos gustaría encontrar alguna función que describa la relación entre las variables explicativas y la variable de respuesta:

Y = f (X) + ε

donde f representa información sistemática que X proporciona sobre Y y donde ε es un término de error aleatorio independiente de X con una media de cero.

Algoritmos de aprendizaje supervisado

Hay dos tipos principales de algoritmos de aprendizaje supervisado:

1. Regresión: la variable de salida es continua (por ejemplo, peso, altura, tiempo, etc.)

2. Clasificación: La variable de salida es categórica (por ejemplo, hombre o mujer, aprobado o reprobado, benigno o maligno, etc.)

Hay dos razones principales por las que usamos algoritmos de aprendizaje supervisado:

1. Predicción: a menudo usamos un conjunto de variables explicativas para predecir el valor de alguna variable de respuesta (por ejemplo, usando pies cuadrados y número de habitaciones para predecir el precio de la vivienda )

2. Inferencia: Es posible que nos interese comprender la forma en que una variable de respuesta se ve afectada a medida que cambia el valor de las variables explicativas (p. Ej., ¿Cuánto aumenta el precio de la vivienda, en promedio, cuando el número de dormitorios aumenta en uno?)

Dependiendo de si nuestro objetivo es la inferencia o la predicción (o una combinación de ambos), podemos usar diferentes métodos para estimar la función f . Por ejemplo, los modelos lineales ofrecen una interpretación más fácil, pero los modelos no lineales que son difíciles de interpretar pueden ofrecer una predicción más precisa.

A continuación, se muestra una lista de los algoritmos de aprendizaje supervisado más utilizados:

  • Regresión lineal
  • Regresión logística
  • Análisis discriminante lineal
  • Análisis discriminante cuadrático
  • Árboles de decisión
  • Bayes ingenuos
  • Máquinas de vectores de soporte
  • Redes neuronales

Algoritmos de aprendizaje no supervisados

Se puede utilizar un algoritmo de aprendizaje no supervisado cuando tenemos una lista de variables (X 1 , X 2 , X 3 ,…, X p ) y simplemente nos gustaría encontrar estructuras o patrones subyacentes dentro de los datos.

Algoritmos de aprendizaje no supervisados ​​en el aprendizaje automático

Hay dos tipos principales de algoritmos de aprendizaje no supervisados:

1. Agrupación: con este tipo de algoritmos, intentamos encontrar «agrupaciones» de observaciones en un conjunto de datos que sean similares entre sí. Esto se usa a menudo en el comercio minorista cuando una empresa desea identificar grupos de clientes que tienen hábitos de compra similares para poder crear estrategias de marketing específicas que se dirijan a ciertos grupos de clientes.

2. Asociación: Utilizando este tipo de algoritmos, intentamos encontrar «reglas» que puedan usarse para dibujar asociaciones. Por ejemplo, los minoristas pueden desarrollar un algoritmo de asociación que diga «si un cliente compra el producto X, es muy probable que también compre el producto Y».

A continuación, se muestra una lista de los algoritmos de aprendizaje no supervisado más utilizados:

  • Análisis de componentes principales
  • Agrupación de K-medias
  • Agrupación de k-medoides
  • Agrupación jerárquica
  • Algoritmo a priori

Resumen: aprendizaje supervisado o no supervisado

La siguiente tabla resume las diferencias entre los algoritmos de aprendizaje supervisados ​​y no supervisados:

Aprendizaje supervisado o no supervisado

Y el siguiente diagrama resume los tipos de algoritmos de aprendizaje automático:

Algoritmos de aprendizaje automático supervisados ​​frente a no supervisados

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

I’m a Bachelor of Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages with aplications in Finance or Econometrics, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.

Deja un comentario

Se utiliza una prueba de Breusch-Pagan para determinar si hay heterocedasticidad en un análisis de regresión. Este tutorial explica cómo…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!