Análisis / modelado de clases latentes: definición simple, tipos

Actualizado el 25 de agosto de 2021, por Luis Benites.

¿Qué es el análisis de clases latentes?

análisis de clases latentes

LCA es una forma de agrupar datos.

El análisis de clase latente (LCA) es una forma de descubrir agrupaciones ocultas en los datos. Más específicamente, es una forma de agrupar sujetos a partir de datos multivariados en «clases latentes»: grupos o subgrupos con miembros similares e inobservables .

  • Latente implica que el análisis se basa en una variable latente libre de errores (Collins & Lanza, 2013).
  • Las clases son grupos formados al descubrir patrones ocultos ( latentes ) en los datos.

Variables latentes y clases

Una variable latente o variable «oculta» (también llamada constructo ) es una variable que no se puede medir ni observar directamente. Lo que sucede en cambio es que las variables observadas en sus datos actúan como indicadores para medir las variables latentes.

Una variedad de razones pueden causar variables latentes, no observables. Es posible que las personas no quieran ser honestas o que no sean conscientes de ningún factor importante. Por ejemplo, el nivel de neurosis, escrupulosidad o apertura de una persona son todas variables latentes; Son casi imposibles de medir directamente. Ejemplos de clases latentes , donde los participantes pueden formar grupos basados ​​en estas variables ocultas, incluyen:

  • Las personas en función de cuánto beben, qué trastornos alimentarios tienen o qué neurosis padecen.
  • Pacientes basados ​​en tipos de fobia.
  • Factores de riesgo para los adolescentes. Por ejemplo, el consumo de cocaína, la inhalación de pegamento, la conducción en estado de ebriedad.

El análisis de clases latentes descubre patrones ocultos de asociación que pueden existir entre observaciones . Los patrones de probabilidad condicional , que indican que las variables de probabilidad tomarán ciertos valores, crean la base para la formación de clases latentes.

LCA trabaja con datos binarios , escala Likert , variables nominales o variables categóricas ordenadas . No funciona con variables ordinales .

ACV frente a análisis de conglomerados y análisis factorial

El análisis de clase latente es similar al análisis de conglomerados . Los datos observados se analizan, se encuentran conexiones y los datos se agrupan en grupos.

LCA también es similar al análisis factorial ; La principal diferencia es que el análisis factorial tiene que ver con las correlaciones entre variables, mientras que LCA se ocupa de la estructura de grupos (o casos ). Otra diferencia es que LCA incluye variables categóricas latentes discretas que tienen una distribución multinomial . El análisis factorial utiliza variables latentes continuas con distribución normal. Ruscio y Ruscio (2008) describen las diferencias entre los dos:

  • Variables latentes categóricas (LCA) : “…existen diferencias cualitativas entre grupos de personas u objetos”.
  • Variables latentes continuas (Análisis factorial) : “…las personas u objetos difieren cualitativamente a lo largo de uno o más continuos”.

Esencialmente, el análisis factorial existe desde hace mucho más tiempo que el análisis de clases latentes. La necesidad de LCA surgió de las ciencias sociales, donde muchas variables no se encuentran en un continuo. Allan McCutcheon da el ejemplo de una tipología, un grupo específico de variables. Teóricamente, cualquier combinación de estas variables podría ocurrir, pero solo algunas de ellas ocurren . LCA le da al científico social una forma de limitar estas tipologías a las pocas combinaciones de interés.

Tipos de análisis de clases latentes

LCA se divide en tres amplias categorías:

  • Modelos de clústeres: identifica clústeres que agrupan a personas en función de comportamientos, características, intereses o valores similares. Las variables latentes de categoría K representan los grupos. El número y tamaño de las clases no se conocen de antemano.
  • Modelos factoriales: identifica factores que agrupan variables con una fuente común de variación.
  • Modelos de regresión : predecir una variable dependiente en función de predictores.

Software para análisis de clases latentes

Muchos programas populares de software estadístico, como IBM SPSS, no tienen la capacidad de ejecutar LCA. Al momento de escribir este artículo, IBM planea agregar LCA a SPSS en el futuro. Los programas que admiten LCA incluyen R y SAS. Otros programas menos conocidos (algunos de los cuales, como MLLSA, son gratuitos) incluyen:

Análisis de transición latente

El análisis de transición latente es una extensión del análisis de clase latente para datos longitudinales (a diferencia de los datos transversales utilizados en LCA). LTA descubre el movimiento entre los subgrupos a lo largo del tiempo. Solo puede usar LTA si tiene datos longitudinales (por ejemplo, datos de un estudio longitudinal retrospectivo ). El término modelo de clase latente se utiliza a veces como un término genérico para describir tanto el LCA como el LTA.

Referencias

Collins, L. y Lanza, S. (2013). Análisis de transición latente y clase latente: con aplicaciones en las ciencias sociales, conductuales y de la salud. John Wiley & Sons.
McCutcheon, A. (1987). Análisis de clase latente, número 64. SAGE.
Ruscio, J. y Ruscio, A. (2008). Avance de la ciencia psicológica a través del estudio de la estructura latente. En Direcciones actuales en la ciencia psicológica. 17:203-207.

Redactor del artículo

  • Luis Benites
    Directo & CEO de Statologos LSI

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

PDF de la distribución secante hiperbólica. La distribución de la secante hiperbólica es un miembro simétrico en forma de campana…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!