Muestreo de conglomerados en R (con ejemplos)

Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre la población en su conjunto.

Un método de muestreo comúnmente utilizado es el muestreo por conglomerados , en el que una población se divide en conglomerados y todos los miembros de algunos conglomerados se eligen para ser incluidos en la muestra.

Este tutorial explica cómo realizar el muestreo de conglomerados en R.

Ejemplo: muestreo de conglomerados en R

Supongamos que una empresa que ofrece visitas guiadas por la ciudad quiere encuestar a sus clientes. De diez recorridos que ofrecen un día, seleccionan al azar cuatro recorridos y le piden a cada cliente que califique su experiencia en una escala del 1 al 10.

El siguiente código muestra cómo crear un marco de datos falso en R para trabajar:

#Haga que este ejemplo sea reproducible
 set.seed (1)

 #crear marco de datos
df <- data.frame (recorrido = rep (1:10, cada uno = 20),
                 experiencia = rnorm (200, media = 7, sd = 1))

#ver las primeras seis filas del marco de datos
cabeza (df)

  experiencia de viaje
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

Y el siguiente código muestra cómo obtener una muestra de clientes seleccionando aleatoriamente cuatro recorridos e incluyendo a todos los miembros de esos recorridos en la muestra:

# Elija aleatoriamente 4 grupos de viajes de los 10 
grupos <- muestra ( único (df ​​$ tour), tamaño = 4, reemplazo = F )

#define sample como todos los miembros que pertenecen a uno de los 4 grupos de viajes 
cluster_sample <- df [df $ tour % in% clusters,]

#ver cuántos clientes vinieron de cada recorrido
tabla (cluster_sample $ tour)

 2 7 8 10 
20 20 20 20 

De la salida podemos ver que:

  • En la muestra se incluyeron 20 clientes del grupo turístico n. ° 2.
  • En la muestra se incluyeron 20 clientes del grupo turístico n. ° 7.
  • En la muestra se incluyeron 20 clientes del grupo turístico n. ° 8.
  • En la muestra se incluyeron 20 clientes del grupo turístico # 10.

Así, esta muestra está compuesta por un total de 80 clientes que provenían de 4 grupos turísticos diferentes.

Relacionado: Cómo utilizar% en% Operador en R

Recursos adicionales

Comprensión de los diferentes tipos de métodos de muestreo Muestreo
estratificado en R
Muestreo sistemático en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Directo & CEO de Statologos LSI

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

La forma más sencilla de importar un archivo de Excel a R es utilizando la función read_excel () del paquete…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!