Contenido de este artículo
- 0
- 0
- 0
- 0
Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre la población en su conjunto.
Un método de muestreo comúnmente utilizado es el muestreo sistemático , que se implementa con un proceso simple de dos pasos:
1. Coloque a cada miembro de una población en algún orden.
2. Elija un punto de partida aleatorio y seleccione cada enésimo miembro para estar en la muestra.
Este tutorial explica cómo realizar un muestreo sistemático en R.
Ejemplo: muestreo sistemático en R
Suponga que un superintendente desea obtener una muestra de 100 estudiantes de una escuela que tiene 500 estudiantes en total. Ella elige usar un muestreo sistemático en el que coloca a cada estudiante en orden alfabético de acuerdo con su apellido, elige al azar un punto de partida y elige a cada quinto estudiante para que esté en la muestra.
El siguiente código muestra cómo crear un marco de datos falso para trabajar en R:
#Haga que este ejemplo sea reproducible set.seed (1) #crear una función simple para generar apellidos aleatorios randomNames <- función (n = 5000) { do.call (paste0, replicate (5, sample (LETTERS, n, TRUE), FALSE)) } #create data frame df <- data.frame (last_name = randomNames (500), gpa = rnorm (500, media = 82, sd = 3)) #ver las primeras seis filas del marco de datos cabeza (df) apellido gpa 1 GONBW 82.19580 2 JRRWZ 85.10598 3 ORJFW 88.78065 4 XRYNL 85.94409 5 FMDCE 79.38993 6 XZBJC 80.49061
Y el siguiente código muestra cómo obtener una muestra de 100 estudiantes mediante muestreo sistemático:
#define la función para obtener una muestra sistemática get_sys = function (N, n) { k = techo (N / n) r = muestra (1: k, 1) seq (r, r + k * (n-1), k) } #obtener muestra sistemática sys_sample_df = df [get_sys ( nrow (df), 100),] #ver las primeras seis filas del encabezado del marco de datos (sys_sample_df) apellido gpa 3 ORJFW 88.78065 8 RWPSB 81.96988 13 RACZU 79.21433 18 ZOHKA 80.47246 23 QJETK 87.09991 28 JTHWB 83.87300 #ver dimensiones del marco de datos dim (sys_sample_df) [1] 100 2
Observe que el primer miembro incluido en la muestra estaba en la fila 3 del marco de datos original. Cada miembro subsiguiente de la muestra se ubica 5 filas después del miembro anterior.
Y al usar dim () podemos ver que la muestra sistemática que obtuvimos es un marco de datos con 100 filas y 2 columnas.
Recursos adicionales
Tipos de métodos de muestreo Muestreo
estratificado en R
Muestreo de conglomerados en R
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: