¿Qué es el análisis univariante? (Definición y ejemplo)

El término análisis univariado se refiere al análisis de una variable. Puede recordar esto porque el prefijo «uni» significa «uno».

El propósito del análisis univariado es comprender la distribución de valores para una sola variable. Puede contrastar este tipo de análisis con los siguientes:

  • Análisis bivariado : el análisis de dos variables.
  • Análisis multivariado: el análisis de dos o más variables.

Por ejemplo, supongamos que tenemos el siguiente conjunto de datos:

Podríamos optar por realizar un análisis univariado en cualquiera de las variables individuales en el conjunto de datos para obtener una mejor comprensión de su distribución de valores.

Por ejemplo, podemos optar por realizar un análisis univariado de la variable Tamaño del hogar :

Ejemplo de análisis univariado

Hay tres formas habituales de realizar análisis univariados:

1. Resumen de estadísticas

La forma más común de realizar un análisis univariado es describir una variable utilizando estadísticas de resumen .

Hay dos tipos populares de estadísticas resumidas:

  • Medidas de tendencia central : estos números describen dónde se encuentra el centro de un conjunto de datos. Los ejemplos incluyen la media y la mediana .
  • Medidas de dispersión : estos números describen qué tan dispersos están los valores en el conjunto de datos. Los ejemplos incluyen el rango , el rango intercuartílico , la desviación estándar y la varianza .

2. Distribuciones de frecuencia

Otra forma de realizar un análisis univariado es crear una distribución de frecuencia , que describe la frecuencia con la que ocurren valores diferentes en un conjunto de datos.

3. Gráficos

Otra forma más de realizar análisis univariados es crear gráficos para visualizar la distribución de valores para una determinada variable.

Los ejemplos comunes incluyen:

  • Diagramas de caja
  • Histogramas
  • Curvas de densidad
  • Gráficos circulares

Los siguientes ejemplos muestran cómo realizar cada tipo de análisis univariado utilizando la variable Tamaño del hogar de nuestro conjunto de datos mencionado anteriormente:

Ejemplo de análisis univariado

Resumen estadístico

Podemos calcular las siguientes medidas de tendencia central para el tamaño del hogar:

  • Media (el valor medio): 3,8
  • Mediana (el valor medio): 4

Estos valores nos dan una idea de dónde se encuentra el valor «central».

También podemos calcular las siguientes medidas de dispersión:

  • Rango (la diferencia entre el máximo y el mínimo): 6
  • Rango intercuartílico (la dispersión del 50% medio de los valores): 2.5
  • Desviación estándar (una medida promedio de propagación): 1,87

Estos valores nos dan una idea de cuán dispersos están los valores para esta variable.

Distribuciones de frecuencia

También podemos crear la siguiente tabla de distribución de frecuencia para resumir la frecuencia con la que ocurren diferentes valores:

Esto nos permite ver rápidamente que el tamaño de hogar más frecuente es 4 .

Recurso: puede utilizar esta calculadora de frecuencia para producir automáticamente una distribución de frecuencia para cualquier variable.

Gráficos

Podemos crear los siguientes gráficos para ayudarnos a visualizar la distribución de valores para el tamaño del hogar:

1. Diagrama de caja

Una gráfica de caja es una gráfica que muestra el resumen de cinco números de un conjunto de datos.

El resumen de cinco números incluye:

  • El valor mínimo
  • El primer cuartil
  • El valor mediano
  • El tercer cuartil
  • El valor máximo

Así es como se vería una gráfica de caja para la variable Tamaño del hogar:

Recurso: puede utilizar este generador de gráficos de caja para producir automáticamente un gráfico de caja para cualquier variable.

2. Histograma

Un histograma es un tipo de gráfico que usa barras verticales para mostrar frecuencias. Este tipo de gráfico es una forma útil de visualizar la distribución de valores en un conjunto de datos.

Así es como se vería un histograma para la variable Tamaño del hogar:

3. Curva de densidad

Una curva de densidad es una curva en un gráfico que representa la distribución de valores en un conjunto de datos.

Es particularmente útil para visualizar la «forma» de una distribución, incluido si una distribución tiene o no uno o más «picos» de valores que ocurren con frecuencia y si la distribución está sesgada o no hacia la izquierda o hacia la derecha .

Así es como se vería una curva de densidad para la variable Tamaño del hogar:

4. Gráfico circular

Un gráfico circular es un tipo de gráfico que tiene la forma de un círculo y utiliza sectores para representar proporciones de un todo.

Así es como se vería un gráfico circular para la variable Tamaño del hogar:

Dependiendo del tipo de datos, uno de estos gráficos puede ser más útil para visualizar la distribución de valores que los demás.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

1 comentario en «¿Qué es el análisis univariante? (Definición y ejemplo)»

Deja un comentario

Cuando los investigadores realizan un experimento, a menudo están interesados ​​en comprender si un determinado "tratamiento" afecta un resultado. Para…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!