Introducción a la distribución hipergeométrica

La distribución hipergeométrica describe la probabilidad de elegir k objetos con una determinada característica en n dibujos sin reemplazo, de una población finita de tamaño N que contiene K objetos con esa característica.

Si una variable aleatoria X sigue una distribución hipergeométrica, entonces la probabilidad de elegir k objetos con una determinada característica se puede encontrar mediante la siguiente fórmula:

P (X = k) = K C k ( NK C n-k ) / N C n

dónde:

  • N: tamaño de la población
  • K: número de objetos en la población con una determinada característica
  • n: tamaño de la muestra
  • k: número de objetos en la muestra con una característica determinada
  • K C k : número de combinaciones de K cosas tomadas k a la vez

Por ejemplo, hay 4 Reinas en una baraja estándar de 52 cartas. Supongamos que elegimos al azar una carta de un mazo y luego, sin reemplazo, elegimos al azar otra carta del mazo. ¿Cuál es la probabilidad de que ambas cartas sean reinas?

Para responder a esto, podemos utilizar la distribución hipergeométrica con los siguientes parámetros:

  • N: tamaño de la población = 52 cartas
  • K: número de objetos en la población con una determinada característica = 4 reinas
  • n: tamaño de la muestra = 2 sorteos
  • k: número de objetos en la muestra con una característica determinada = 2 reinas

Reemplazando estos números en la fórmula, encontramos que la probabilidad es:

P (X = 2) = K C k ( NK C n-k ) / N C n = 4 C 2 ( 52-4 C 2-2 ) / 52 C 2 = 6 * 1/1326 = 0.00452 .

Esto debería tener sentido intuitivamente. Si se imagina sacando dos cartas de una baraja, una tras otra, la probabilidad de que ambas cartas sean Reinas debería ser muy baja.

Propiedades de la distribución hipergeométrica

La distribución hipergeométrica tiene las siguientes propiedades:

La media de la distribución es (nK) / N

La varianza de la distribución es (nK) (NK) (Nn) / (N 2 (n-1))

Problemas de práctica de distribución hipergeométrica

Utilice los siguientes problemas de práctica para evaluar su conocimiento de la distribución hipergeométrica.

Nota: Usaremos la Calculadora de distribución hipergeométrica para calcular las respuestas a estas preguntas.

Problema 1

Pregunta: Supongamos que elegimos al azar cuatro cartas de un mazo sin reemplazarlas. ¿Cuál es la probabilidad de que dos de las cartas sean reinas?

Para responder a esto, podemos utilizar la distribución hipergeométrica con los siguientes parámetros:

  • N: tamaño de la población = 52 cartas
  • K: número de objetos en la población con una determinada característica = 4 reinas
  • n: tamaño de la muestra = 4 sorteos
  • k: número de objetos en la muestra con una característica determinada = 2 reinas

Al insertar estos números en la Calculadora de distribución hipergeométrica, encontramos que la probabilidad es 0.025 .

Problema 2

Pregunta: Una urna contiene 3 bolas rojas y 5 bolas verdes. Eliges aleatoriamente 4 bolas. ¿Cuál es la probabilidad de que elija exactamente 2 bolas rojas?

Para responder a esto, podemos utilizar la distribución hipergeométrica con los siguientes parámetros:

  • N: tamaño de la población = 8 bolas
  • K: número de objetos en la población con una determinada característica = 3 bolas rojas
  • n: tamaño de la muestra = 4 sorteos
  • k: número de objetos en la muestra con una determinada característica = 2 bolas rojas

Al insertar estos números en la Calculadora de distribución hipergeométrica, encontramos que la probabilidad es 0.42857 .

Problema 3

Pregunta: Una canasta contiene 7 canicas moradas y 3 canicas rosas. Elige 6 canicas al azar. ¿Cuál es la probabilidad de que elijas exactamente 3 canicas rosas?

Para responder a esto, podemos utilizar la distribución hipergeométrica con los siguientes parámetros:

  • N: tamaño de la población = 10 canicas
  • K: número de objetos en la población con una determinada característica = 3 bolas rosas
  • n: tamaño de la muestra = 6 sorteos
  • k: número de objetos en la muestra con una característica determinada = 3 bolas rosas

Al insertar estos números en la Calculadora de distribución hipergeométrica, encontramos que la probabilidad es 0.16667 .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Cuando dos variables tienen una relación lineal, a menudo puede utilizar la regresión lineal simple para cuantificar su relación. Sin…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!