Muestreo de conglomerados en R (con ejemplos)

Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre la población en su conjunto.

Un método de muestreo comúnmente utilizado es el muestreo por conglomerados , en el que una población se divide en conglomerados y todos los miembros de algunos conglomerados se eligen para ser incluidos en la muestra.

Este tutorial explica cómo realizar el muestreo de conglomerados en R.

Ejemplo: muestreo de conglomerados en R

Supongamos que una empresa que ofrece visitas guiadas por la ciudad quiere encuestar a sus clientes. De diez recorridos que ofrecen un día, seleccionan al azar cuatro recorridos y le piden a cada cliente que califique su experiencia en una escala del 1 al 10.

El siguiente código muestra cómo crear un marco de datos falso en R para trabajar:

#Haga que este ejemplo sea reproducible
 set.seed (1)

 #crear marco de datos
df <- data.frame (recorrido = rep (1:10, cada uno = 20),
                 experiencia = rnorm (200, media = 7, sd = 1))

#ver las primeras seis filas del marco de datos
cabeza (df)

  experiencia de viaje
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

Y el siguiente código muestra cómo obtener una muestra de clientes seleccionando aleatoriamente cuatro recorridos e incluyendo a todos los miembros de esos recorridos en la muestra:

# Elija aleatoriamente 4 grupos de viajes de los 10 
grupos <- muestra ( único (df ​​$ tour), tamaño = 4, reemplazo = F )

#define sample como todos los miembros que pertenecen a uno de los 4 grupos de viajes 
cluster_sample <- df [df $ tour % in% clusters,]

#ver cuántos clientes vinieron de cada recorrido
tabla (cluster_sample $ tour)

 2 7 8 10 
20 20 20 20 

De la salida podemos ver que:

  • En la muestra se incluyeron 20 clientes del grupo turístico n. ° 2.
  • En la muestra se incluyeron 20 clientes del grupo turístico n. ° 7.
  • En la muestra se incluyeron 20 clientes del grupo turístico n. ° 8.
  • En la muestra se incluyeron 20 clientes del grupo turístico # 10.

Así, esta muestra está compuesta por un total de 80 clientes que provenían de 4 grupos turísticos diferentes.

Relacionado: Cómo utilizar% en% Operador en R

Recursos adicionales

Comprensión de los diferentes tipos de métodos de muestreo Muestreo
estratificado en R
Muestreo sistemático en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La forma más sencilla de importar un archivo de Excel a R es utilizando la función read_excel () del paquete…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!