Definición y ejemplo de análisis bivariado

Actualizado por ultima vez el 12 de septiembre de 2021, por Luis Benites.

¿Qué son los datos bivariados?

Mire el video para obtener una descripción general de los datos bivariados y el análisis de datos bivariados:

¿Qué es el análisis de datos bivariado? Mira este video en YouTube .
¿No puedes ver el vídeo? Haga clic aquí
Los datos en estadística a veces se clasifican de acuerdo con cuántas variables hay en un estudio en particular. Por ejemplo, «altura» podría ser una variable y «peso» podría ser otra variable. Dependiendo de la cantidad de variables que se observen, los datos pueden ser univariados o bivariados.

Cuando realiza un estudio que analiza una sola variable, ese estudio involucra datos univariados. Por ejemplo, puede estudiar a un grupo de estudiantes universitarios para averiguar sus puntajes promedio en el SAT o puede estudiar a un grupo de pacientes diabéticos para encontrar su peso. Los datos bivariados son cuando estás estudiando dos variables . Por ejemplo, si está estudiando a un grupo de estudiantes universitarios para averiguar su puntaje promedio en el SAT y su edad , tiene que encontrar dos piezas del rompecabezas (puntaje del SAT y edad). O si quieres saber los pesos y alturas de los pacientes diabéticos, entonces también tiene datos bivariados. Los datos bivariados también podrían ser dos conjuntos de elementos que dependen el uno del otro. Por ejemplo:

  • Venta de helados comparada con la temperatura de ese día.
  • Accidentes de tráfico junto con el clima en un día en particular.

Los datos bivariados tienen muchos usos prácticos en la vida real. Por ejemplo, es bastante útil poder predecir cuándo podría ocurrir un evento natural. Una herramienta en la caja de herramientas del estadístico es el análisis de datos bivariados. A veces, algo tan simple como graficar una variable contra otra en un plano cartesiano puede brindarle una imagen clara de lo que los datos intentan decirle. Por ejemplo, el siguiente diagrama de dispersión muestra la relación entre el tiempo entre las erupciones en Old Faithful y la duración de la erupción.

datos bivariados.

Tiempo de espera entre erupciones y duración de la erupción del géiser Old Faithful en el Parque Nacional de Yellowstone, Wyoming, EE. UU. Este diagrama de dispersión sugiere que, en general, hay dos «tipos» de erupciones: de corta duración de espera corta y de larga duración de espera larga.


¿Qué es el análisis bivariado?

El análisis bivariado significa el análisis de datos bivariados. Es una de las formas más simples de análisis estadístico, que se utiliza para averiguar si existe una relación entre dos conjuntos de valores. Por lo general involucra las variables X e Y.

Los resultados del análisis bivariado se pueden almacenar en una tabla de datos de dos columnas. Por ejemplo, es posible que desee averiguar la relación entre la ingesta calórica y el peso (por supuesto, existe una relación bastante fuerte entre los dos. Puede leer más aquí ). La ingesta calórica sería su variable independiente , X, y el peso sería su variable dependiente , Y. El análisis bivariado no es lo mismo que el análisis de datos de dos muestras . Con dos análisis de datos de muestra (como una prueba z de dos muestras en Excel
análisis bivariado
), X e Y no están directamente relacionados. También puede tener un número diferente de valores de datos en cada muestra; con el análisis bivariado, hay un valor de Y para cada X. Digamos que tiene una ingesta calórica de 3000 calorías por día y un peso de 300 libras. Lo escribirías con la variable x seguida de la variable y: (3000,300).
Análisis de datos de dos muestras
Muestra 1: 100,45,88,99
Muestra 2: 44,33,101
Análisis bivariado
(X,Y)=(100,56),(23,84),(398,63),(56,42 )

Tipos de análisis bivariado

Los tipos comunes de análisis bivariado incluyen:

1. Diagramas de dispersión ,

Estos le dan una idea visual del patrón que siguen sus variables.

Un diagrama de dispersión simple.

Un diagrama de dispersión simple.

2. Análisis de regresión

El análisis de regresión es un término general para una amplia variedad de herramientas que puede usar para determinar cómo se pueden relacionar sus puntos de datos. En la imagen de arriba, parece que los puntos podrían seguir una curva exponencial (a diferencia de una línea recta). El análisis de regresión puede darte la ecuación para esa curva o línea. También puede darte el coeficiente de correlación .

3. Coeficientes de correlación

El cálculo de los valores de los coeficientes de correlación generalmente se realiza en una computadora, aunque puede encontrar los pasos para encontrar el coeficiente de correlación a mano aquí . Este coeficiente te dice si las variables están relacionadas. Básicamente, un cero significa que no están correlacionadas (es decir, relacionadas de alguna manera), mientras que un 1 (ya sea positivo o negativo) significa que las variables están perfectamente correlacionadas (es decir, están perfectamente sincronizadas entre sí).

Referencias

Beyer, WH CRC Standard Mathematical Tables, 31ª ed. Boca Ratón, FL: CRC Press, págs. 536 y 571, 2002.
Gonick, L. (1993). La guía de dibujos animados de estadísticas . Harper Perennial.
Klein, G. (2013). La caricatura Introducción a la estadística. Colina y Wamg.
Vogt, WP (2005). Diccionario de estadística y metodología: una guía no técnica para las ciencias sociales . SABIO.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

El gráfico AU es un tipo de gráfico de control de atributos. Un gráfico de control de atributos es una…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!