Variables ficticias / Variable indicadora: definición simple, ejemplos

Contenido de este artículo

1 ¿Qué son las variables ficticias?
2 Codificación de variables categóricas con múltiples niveles
3 Referencias
4 Redactor del artículo
5 ¿Te hemos ayudado?

Puedes opinar sobre este contenido:

Actualizado el 18 de octubre de 2022, por Luis Benites.

Análisis de regresión.

¿Qué son las variables ficticias?

Las variables ficticias (a veces denominadas variables indicadoras ) se utilizan en análisis de regresión y análisis de clase latente . Como su nombre lo indica, estas variables son atributos artificiales y se utilizan con dos o más categorías o niveles. Se utiliza cuando desea trabajar con variables categóricas que no tienen una relación cuantificable entre sí.

Por ejemplo, la raza puede clasificarse en caucásica, afroamericana, asiática, hispana, otra. Si asigna los números del 1 al 5 para estas categorías al realizar el análisis de regresión, los resultados no tendrían ningún sentido (¿es la categoría «Otro» de alguna manera 5 veces la categoría «Caucásica»?). Sin embargo, si crea una variable llamada Caucásico y asigna la variable ficticia 1 para que signifique «es caucásico» y 0 para que signifique «no es caucásico», entonces puede comenzar a ver cómo las variables ficticias son útiles.

En el análisis de clases latentes , el término variable indicadora significa algo más específico, aunque sigue siendo una variable artificial. Un conjunto de variables observadas puede “indicar” la presencia de una o más variables latentes (ocultas) , de ahí el término variable indicadora .

Codificación de variables categóricas con múltiples niveles

Si tiene una variable categórica con más de dos niveles (los grupos o los niveles son grupos diferentes en la misma variable independiente ), es necesario crear varias variables ficticias. En el ejemplo anterior, la variable categórica «Raza» tiene cinco niveles (caucásico, afroamericano, asiático, hispano, otro). La fórmula k-1 se utiliza para decidir cuántas variables ficticias codificar, donde «k» es el número de niveles. En otras palabras, solo cuatro de estos cinco niveles están codificados con variables ficticias. ¿Qué variable debería dejar de lado? Por lo general, es el grupo más grande con el que se compararán todos los demás. En este ejemplo, supongamos que se trata de algún tipo de datos para la Ciudad de México, México. el grupo más grande sería el hispano y ese sería el nivel que quedara fuera. En última instancia, qué variable no está codificada con una variable ficticia depende de usted, el investigador, y con qué variable está comparando las demás.

Referencias

Edwards, A. (1976). Una introducción a la regresión lineal y la correlación . WH Freeman
Everitt, BS; Skrondal, A. (2010), The Cambridge Dictionary of Statistics , Cambridge University Press.

Redactor del artículo

Luis Benites
Director de Statologos.com
Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Equipo de Statologos

Luis Benites

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Director de Statologos.com
Dereck Amesquita

I am a Bachelor of Science in Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.
Statistics content writer
Cisco Pfoccori

15 años haciendo SEO, monetizando, haciendo nichos y ayudando a empresas a mejoras sus estrategia digital. Pueden contactarme si necesitan mejorar su digitalización, actualmente trabajo para CirculoSEO.
Editor de contenido y SEO

¿Qué son las variables ficticias?

Codificación de variables categóricas con múltiples niveles

Referencias

Redactor del artículo

¿Te hemos ayudado?

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!