Una rápida introducción al aprendizaje supervisado y no supervisado

Contenido de este artículo

0.1 Algoritmos de aprendizaje supervisado
0.2 Algoritmos de aprendizaje no supervisados
0.3 Resumen: aprendizaje supervisado o no supervisado

1 Redactor del artículo
2 ¿Te hemos ayudado?

Actualizado el 17 de julio de 2024, por Luis Benites.

El campo del aprendizaje automático contiene un conjunto masivo de algoritmos que se pueden usar para comprender los datos. Estos algoritmos se pueden clasificar en una de dos categorías:

1. Algoritmos de aprendizaje supervisado: Implica la construcción de un modelo para estimar o predecir un resultado basado en una o más entradas.

2. Algoritmos de aprendizaje no supervisados: Implica encontrar estructuras y relaciones a partir de las entradas. No hay salida de «supervisión».

Este tutorial explica la diferencia entre estos dos tipos de algoritmos junto con varios ejemplos de cada uno.

Algoritmos de aprendizaje supervisado

Se puede utilizar un algoritmo de aprendizaje supervisado cuando tenemos una o más variables explicativas (X ₁ , X ₂ , X ₃ ,…, X _p ) y una variable de respuesta (Y) y nos gustaría encontrar alguna función que describa la relación entre las variables explicativas y la variable de respuesta:

Y = f (X) + ε

donde f representa información sistemática que X proporciona sobre Y y donde ε es un término de error aleatorio independiente de X con una media de cero.

Hay dos tipos principales de algoritmos de aprendizaje supervisado:

1. Regresión: la variable de salida es continua (por ejemplo, peso, altura, tiempo, etc.)

2. Clasificación: La variable de salida es categórica (por ejemplo, hombre o mujer, aprobado o reprobado, benigno o maligno, etc.)

Hay dos razones principales por las que usamos algoritmos de aprendizaje supervisado:

1. Predicción: a menudo usamos un conjunto de variables explicativas para predecir el valor de alguna variable de respuesta (por ejemplo, usando pies cuadrados y número de habitaciones para predecir el precio de la vivienda )

2. Inferencia: Es posible que nos interese comprender la forma en que una variable de respuesta se ve afectada a medida que cambia el valor de las variables explicativas (p. Ej., ¿Cuánto aumenta el precio de la vivienda, en promedio, cuando el número de dormitorios aumenta en uno?)

Dependiendo de si nuestro objetivo es la inferencia o la predicción (o una combinación de ambos), podemos usar diferentes métodos para estimar la función f . Por ejemplo, los modelos lineales ofrecen una interpretación más fácil, pero los modelos no lineales que son difíciles de interpretar pueden ofrecer una predicción más precisa.

A continuación, se muestra una lista de los algoritmos de aprendizaje supervisado más utilizados:

Regresión lineal
Regresión logística
Análisis discriminante lineal
Análisis discriminante cuadrático
Árboles de decisión
Bayes ingenuos
Máquinas de vectores de soporte
Redes neuronales

Algoritmos de aprendizaje no supervisados

Se puede utilizar un algoritmo de aprendizaje no supervisado cuando tenemos una lista de variables (X ₁ , X ₂ , X ₃ ,…, X _p ) y simplemente nos gustaría encontrar estructuras o patrones subyacentes dentro de los datos.

Hay dos tipos principales de algoritmos de aprendizaje no supervisados:

1. Agrupación: con este tipo de algoritmos, intentamos encontrar «agrupaciones» de observaciones en un conjunto de datos que sean similares entre sí. Esto se usa a menudo en el comercio minorista cuando una empresa desea identificar grupos de clientes que tienen hábitos de compra similares para poder crear estrategias de marketing específicas que se dirijan a ciertos grupos de clientes.

2. Asociación: Utilizando este tipo de algoritmos, intentamos encontrar «reglas» que puedan usarse para dibujar asociaciones. Por ejemplo, los minoristas pueden desarrollar un algoritmo de asociación que diga «si un cliente compra el producto X, es muy probable que también compre el producto Y».

A continuación, se muestra una lista de los algoritmos de aprendizaje no supervisado más utilizados:

Análisis de componentes principales
Agrupación de K-medias
Agrupación de k-medoides
Agrupación jerárquica
Algoritmo a priori

Resumen: aprendizaje supervisado o no supervisado

La siguiente tabla resume las diferencias entre los algoritmos de aprendizaje supervisados y no supervisados:

Y el siguiente diagrama resume los tipos de algoritmos de aprendizaje automático:

https://r-project.org
https://www.python.org/
https://www.stata.com/

Redactor del artículo

Luis Benites
Director de Statologos.com
Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Algoritmos de aprendizaje supervisado

Algoritmos de aprendizaje no supervisados

Resumen: aprendizaje supervisado o no supervisado

Redactor del artículo

¿Te hemos ayudado?

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!