Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 7 de mayo de 2021, por Luis Benites.
Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre la población en su conjunto.
Un método de muestreo comúnmente utilizado es el muestreo aleatorio estratificado , en el que una población se divide en grupos y un cierto número de miembros de cada grupo se seleccionan al azar para ser incluidos en la muestra.
Este tutorial explica cómo realizar un muestreo aleatorio estratificado en R.
Ejemplo: muestreo estratificado en R
Una escuela secundaria está compuesta por 400 estudiantes que son Freshman, Sophomores, Juniors o Seniors. Suponga que nos gustaría tomar una muestra estratificada de 40 estudiantes de manera que se incluyan en la muestra 10 estudiantes de cada grado.
El siguiente código muestra cómo generar un marco de datos de muestra de 400 estudiantes:
#Haga que este ejemplo sea reproducible set.seed (1) #create data frame df <- data.frame (grade = rep (c ('Freshman', 'Sophomore', 'Junior', 'Senior'), cada uno = 100), gpa = rnorm (400, media = 85, sd = 3)) #ver las primeras seis filas del encabezado del marco de datos (df) Grado / GPA 1 estudiante de primer año 83.12064 2 Estudiante de primer año 85.55093 3 Estudiante de primer año 82.49311 4 Estudiante de primer año 89.78584 5 Estudiante de primer año 85.98852 6 Estudiante de primer año 82.53859
Muestreo estratificado mediante el número de filas
El siguiente código muestra cómo usar las funciones group_by () y sample_n () del paquete dplyr para obtener una muestra aleatoria estratificada de 40 estudiantes en total con 10 estudiantes de cada grado:
biblioteca (dplyr) #obtener muestra estratificada muestra_estrat <- df%>% group_by (grado)%>% sample_n (tamaño = 10) # encontrar la frecuencia de los estudiantes de cada tabla de calificaciones (strat_sample $ grade) Freshman Junior Senior Sophomore 10 10 10 10
Muestreo estratificado utilizando una fracción de filas
El siguiente código muestra cómo usar las funciones group_by () y sample_frac () del paquete dplyr para obtener una muestra aleatoria estratificada en la que seleccionamos al azar al 15% de los estudiantes de cada grado:
biblioteca (dplyr) #obtener muestra estratificada muestra_estrat <- df%>% group_by (grado)%>% sample_frac (tamaño = .15) # encontrar la frecuencia de los estudiantes de cada tabla de calificaciones (strat_sample $ grade) Freshman Junior Senior Sophomore 15 15 15 15
Recursos adicionales
Tipos de métodos
de muestreo Muestreo por conglomerados en R
Muestreo sistemático en R
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: