Muestreo con reemplazo / Muestreo sin reemplazo

Actualizado por ultima vez el 24 de abril de 2022, por Luis Benites.

Contenido (haga clic para saltar a esa sección):

  1. Muestreo con reemplazo
  2. Muestreo sin reemplazo

Muestreo con reemplazo


El muestreo con reemplazo se utiliza para encontrar la probabilidad con reemplazo . En otras palabras, desea encontrar la probabilidad de algún evento donde hay una cantidad de bolas, cartas u otros objetos, y reemplaza el elemento cada vez que elige uno.

Digamos que tiene una población de 7 personas y quiere muestrear 2. Sus nombres son:

  • John
  • Jacobo
  • Qiu
  • Tina
  • sombrerero
  • Jacques
  • Des

muestreo con reemplazo

Imagen: CSUS.edu

Podrías poner sus nombres en un sombrero. Si toma una muestra con reemplazo , elegiría el nombre de una persona, volvería a poner el nombre de esa persona en el sombrero y luego elegiría otro nombre. Las posibilidades para su muestra de dos nombres son:

  • Juan, Juan
  • Juan, Jack
  • Juan, Qui
  • Jack, Qui
  • jack tina
  • …y así.


Cuando toma muestras con reemplazo, sus dos artículos son independientes . En otras palabras, uno no afecta el resultado del otro. Tiene una probabilidad de 1 entre 7 (1/7) de elegir el primer nombre y una probabilidad de 1/7 de elegir el segundo nombre.

  • P(Juan, Juan) = (1/7) * (1/7) = .02.
  • P(Juan, Jack) = (1/7) * (1/7) = .02.
  • P(Juan, Qui) = (1/7) * (1/7) = .02.
  • P(Jack, Qui) = (1/7) * (1/7) = 0,02.
  • P(Jack Tina) = (1/7) * (1/7) = 0,02.

Tenga en cuenta que P (John, John) solo significa «la probabilidad de elegir el nombre de John y luego el nombre de John nuevamente». Puedes calcular estas probabilidades usando la regla de la multiplicación .

Pero, ¿qué sucede si no reemplaza el primer nombre antes de elegir el segundo? En otras palabras, ¿qué sucede si toma una muestra sin reemplazo?

Muestreo sin reemplazo


El muestreo sin reemplazo es una forma de calcular la probabilidad sin reemplazo . En otras palabras, no reemplaza el primer elemento que elige antes de elegir un segundo. Esto cambia drásticamente las probabilidades de elegir artículos de muestra. Tomando el ejemplo anterior, tendría la misma lista de nombres para elegir a dos personas. Y su lista de resultados sería similar, excepto que no podría elegir a la misma persona dos veces:

  • Juan, Jack
  • Juan, Qui
  • Jack, Qui
  • JackTina…

Pero ahora, sus dos elementos son dependientes o están vinculados entre sí. Cuando elige el primer elemento, tiene una probabilidad de 1/7 de elegir un nombre. Pero luego, suponiendo que no reemplace el nombre, solo tiene seis nombres para elegir. Eso le da una probabilidad de 1/6 de elegir un segundo nombre. Las probabilidades se convierten en:

  • P(Juan, Jack) = (1/7) * (1/6) = .024.
  • P(Juan, Qui) = (1/7) * (1/6) = .024.
  • P(Jack, Qui) = (1/7) * (1/6) = .024.
  • P(Jack Tina) = (1/7) * (1/6) = .024…

Como probablemente pueda darse cuenta, solo he usado algunos elementos aquí, por lo que las probabilidades solo cambian un poco. Pero muestras más grandes tomadas de poblaciones pequeñas pueden tener resultados más dramáticos.

Puede saber qué tan dramáticos son estos resultados al calcular la covarianza . Esa es una medida de cuántas probabilidades de dos elementos están vinculadas entre sí; cuanto mayor sea la covarianza, más dramáticos serán los resultados. Una covarianza de cero significaría que no hay diferencia entre el muestreo con reemplazo o el muestreo sin él.

Referencias

Agresti A. (1990) Análisis de datos categóricos. John Wiley and Sons, Nueva York.
Esquivar, Y. (2008). La Enciclopedia Concisa de Estadística . Saltador.
Everitt, BS; Skrondal, A. (2010), The Cambridge Dictionary of Statistics , Cambridge University Press.
Gonick, L. (1993). La guía de dibujos animados de estadísticas . Harper Perennial.

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

Esta calculadora encuentra el valor crítico de Chi-Cuadrado para un grado de libertad y un nivel de significación dados. Grados…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!