¿Qué es una distribución condicional en estadística?

Actualizado por ultima vez el 7 de mayo de 2021, por .

Si X e Y son dos variables aleatorias distribuidas conjuntamente , entonces la distribución condicional de Y dada X es la distribución de probabilidad de Y cuando se sabe que X tiene un cierto valor.

Por ejemplo, la siguiente tabla bidireccional muestra los resultados de una encuesta que preguntó a 100 personas qué deporte les gustaba más: béisbol, baloncesto o fútbol.

Si queremos saber la probabilidad de que una persona prefiera un determinado deporte dado que es hombre, entonces este es un ejemplo de distribución condicional.

Se conoce el valor de una variable aleatoria (la persona es hombre), pero se desconoce el valor de la otra variable aleatoria (no sabemos cuál es su deporte favorito).

Para encontrar la distribución condicional de la preferencia deportiva entre los hombres, simplemente miraríamos los valores en la fila para Hombres en la tabla:

Ejemplo de distribución condicional

La distribución condicional se calcularía como:

  • Hombres que prefieren el béisbol: 13/48 = .2708
  • Hombres que prefieren el baloncesto: 15/48 = .3125
  • Hombres que prefieren el fútbol: 20/48 = .4167

Observe que la suma de las probabilidades suma 1: 13/48 + 15/48 + 20/48 = 48/48 = 1.

Podemos usar esta distribución condicional para responder preguntas como: Dado que un individuo es hombre, ¿cuál es la probabilidad de que el béisbol sea su deporte favorito?

De la distribución condicional que calculamos anteriormente, podemos ver que la probabilidad es .2708 .

En términos técnicos, cuando calculamos una distribución condicional, decimos que estamos interesados ​​en una subpoblación particular de la población general. La subpoblación del ejemplo anterior eran hombres:

Subpoblación para una distribución condicional

Y cuando queremos calcular una probabilidad relacionada con esta subpoblación, decimos que estamos interesados ​​en un personaje de interés en particular . El personaje de interés en el ejemplo anterior fue el béisbol:

Distribución condicional en estadísticas

Para encontrar la probabilidad de que el carácter de interés ocurra en la subpoblación, simplemente dividimos el valor del carácter de interés (por ejemplo, 13) por los valores totales en la subpoblación (por ejemplo, 48) para obtener 13/48 = .2708 .

Distribuciones condicionales e independencia

Podemos decir que las variables aleatorias X e Y son independientes si y sólo si la distribución condicional de Y dado X es, para todas las variantes posibles de X , igual a la distribución incondicional de Y .

Por ejemplo, en la tabla anterior ¿podemos ver que los eventos “prefiere béisbol” y “masculino” son independientes?

Para responder a esto, calculemos las siguientes probabilidades:

  • P (prefiere el béisbol)
  • P (prefiere béisbol | masculino) «prefiere el béisbol, dado que son hombres

La probabilidad de que un individuo prefiera el béisbol es:

  • P (prefiere el béisbol) = 36/100 = .36 .

La probabilidad de que un individuo prefiera el béisbol, dado que es hombre es

  • P (prefiere béisbol | masculino) = 13/48 = .2708 .

Dado que P (prefiere béisbol) no es igual a P (prefiere béisbol | masculino), las variables aleatorias de preferencia deportiva y género no son independientes.

¿Por qué utilizar distribuciones condicionales?

Las distribuciones de probabilidad condicional son útiles porque a menudo recopilamos datos para dos variables (como Género y Preferencia deportiva), pero estamos interesados ​​en responder preguntas sobre probabilidad cuando conocemos el valor de una de las variables.

En el ejemplo anterior, consideramos el escenario en el que sabíamos que un individuo dado era un hombre y simplemente queríamos saber la probabilidad de que el individuo prefiriera el béisbol.

Hay muchos casos en la vida real en los que conocemos el valor de una variable y podemos usar una distribución condicional para encontrar la probabilidad de que otra variable adopte un valor determinado.

Recursos adicionales

¿Qué es una distribución marginal?
¿Qué es una distribución de probabilidad conjunta?
Cómo encontrar la frecuencia relativa condicional en una tabla de dos factores

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!