Una rápida introducción al aprendizaje supervisado y no supervisado

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

El campo del aprendizaje automático contiene un conjunto masivo de algoritmos que se pueden usar para comprender los datos. Estos algoritmos se pueden clasificar en una de dos categorías:

1. Algoritmos de aprendizaje supervisado: Implica la construcción de un modelo para estimar o predecir un resultado basado en una o más entradas.

2. Algoritmos de aprendizaje no supervisados: Implica encontrar estructuras y relaciones a partir de las entradas. No hay salida de «supervisión».

Este tutorial explica la diferencia entre estos dos tipos de algoritmos junto con varios ejemplos de cada uno.

Algoritmos de aprendizaje supervisado

Se puede utilizar un algoritmo de aprendizaje supervisado cuando tenemos una o más variables explicativas (X 1 , X 2 , X 3 ,…, X p ) y una variable de respuesta (Y) y nos gustaría encontrar alguna función que describa la relación entre las variables explicativas y la variable de respuesta:

Y = f (X) + ε

donde f representa información sistemática que X proporciona sobre Y y donde ε es un término de error aleatorio independiente de X con una media de cero.

Algoritmos de aprendizaje supervisado

Hay dos tipos principales de algoritmos de aprendizaje supervisado:

1. Regresión: la variable de salida es continua (por ejemplo, peso, altura, tiempo, etc.)

2. Clasificación: La variable de salida es categórica (por ejemplo, hombre o mujer, aprobado o reprobado, benigno o maligno, etc.)

Hay dos razones principales por las que usamos algoritmos de aprendizaje supervisado:

1. Predicción: a menudo usamos un conjunto de variables explicativas para predecir el valor de alguna variable de respuesta (por ejemplo, usando pies cuadrados y número de habitaciones para predecir el precio de la vivienda )

2. Inferencia: Es posible que nos interese comprender la forma en que una variable de respuesta se ve afectada a medida que cambia el valor de las variables explicativas (p. Ej., ¿Cuánto aumenta el precio de la vivienda, en promedio, cuando el número de dormitorios aumenta en uno?)

Dependiendo de si nuestro objetivo es la inferencia o la predicción (o una combinación de ambos), podemos usar diferentes métodos para estimar la función f . Por ejemplo, los modelos lineales ofrecen una interpretación más fácil, pero los modelos no lineales que son difíciles de interpretar pueden ofrecer una predicción más precisa.

A continuación, se muestra una lista de los algoritmos de aprendizaje supervisado más utilizados:

  • Regresión lineal
  • Regresión logística
  • Análisis discriminante lineal
  • Análisis discriminante cuadrático
  • Árboles de decisión
  • Bayes ingenuos
  • Máquinas de vectores de soporte
  • Redes neuronales

Algoritmos de aprendizaje no supervisados

Se puede utilizar un algoritmo de aprendizaje no supervisado cuando tenemos una lista de variables (X 1 , X 2 , X 3 ,…, X p ) y simplemente nos gustaría encontrar estructuras o patrones subyacentes dentro de los datos.

Algoritmos de aprendizaje no supervisados ​​en el aprendizaje automático

Hay dos tipos principales de algoritmos de aprendizaje no supervisados:

1. Agrupación: con este tipo de algoritmos, intentamos encontrar «agrupaciones» de observaciones en un conjunto de datos que sean similares entre sí. Esto se usa a menudo en el comercio minorista cuando una empresa desea identificar grupos de clientes que tienen hábitos de compra similares para poder crear estrategias de marketing específicas que se dirijan a ciertos grupos de clientes.

2. Asociación: Utilizando este tipo de algoritmos, intentamos encontrar «reglas» que puedan usarse para dibujar asociaciones. Por ejemplo, los minoristas pueden desarrollar un algoritmo de asociación que diga «si un cliente compra el producto X, es muy probable que también compre el producto Y».

A continuación, se muestra una lista de los algoritmos de aprendizaje no supervisado más utilizados:

  • Análisis de componentes principales
  • Agrupación de K-medias
  • Agrupación de k-medoides
  • Agrupación jerárquica
  • Algoritmo a priori

Resumen: aprendizaje supervisado o no supervisado

La siguiente tabla resume las diferencias entre los algoritmos de aprendizaje supervisados ​​y no supervisados:

Aprendizaje supervisado o no supervisado

Y el siguiente diagrama resume los tipos de algoritmos de aprendizaje automático:

Algoritmos de aprendizaje automático supervisados ​​frente a no supervisados

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Se utiliza una prueba de Breusch-Pagan para determinar si hay heterocedasticidad en un análisis de regresión. Este tutorial explica cómo…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!