Muestreo estratificado en R (con ejemplos)

Contenido de este artículo

1 Ejemplo: muestreo estratificado en R
2 Redactor del artículo
3 ¿Te hemos ayudado?

Puedes opinar sobre este contenido:

Actualizado el 7 de mayo de 2021, por Luis Benites.

Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre la población en su conjunto.

Un método de muestreo comúnmente utilizado es el muestreo aleatorio estratificado , en el que una población se divide en grupos y un cierto número de miembros de cada grupo se seleccionan al azar para ser incluidos en la muestra.

Este tutorial explica cómo realizar un muestreo aleatorio estratificado en R.

Ejemplo: muestreo estratificado en R

Una escuela secundaria está compuesta por 400 estudiantes que son Freshman, Sophomores, Juniors o Seniors. Suponga que nos gustaría tomar una muestra estratificada de 40 estudiantes de manera que se incluyan en la muestra 10 estudiantes de cada grado.

El siguiente código muestra cómo generar un marco de datos de muestra de 400 estudiantes:

#Haga que este ejemplo sea reproducible
set.seed (1)

#create data frame 
df <- data.frame (grade = rep (c ('Freshman', 'Sophomore', 'Junior', 'Senior'), cada uno = 100),
                 gpa = rnorm (400, media = 85, sd = 3))

#ver las primeras seis filas del encabezado del marco de datos
 (df)

     Grado / GPA
1 estudiante de primer año 83.12064
2 Estudiante de primer año 85.55093
3 Estudiante de primer año 82.49311
4 Estudiante de primer año 89.78584
5 Estudiante de primer año 85.98852
6 Estudiante de primer año 82.53859

Muestreo estratificado mediante el número de filas

El siguiente código muestra cómo usar las funciones group_by () y sample_n () del paquete dplyr para obtener una muestra aleatoria estratificada de 40 estudiantes en total con 10 estudiantes de cada grado:

biblioteca (dplyr)

#obtener muestra estratificada
muestra_estrat <- df%>%
                  group_by (grado)%>%
                   sample_n (tamaño = 10)

# encontrar la frecuencia de los estudiantes de cada tabla de calificaciones
 (strat_sample $ grade)

 Freshman Junior Senior Sophomore 
       10 10 10 10

Muestreo estratificado utilizando una fracción de filas

El siguiente código muestra cómo usar las funciones group_by () y sample_frac () del paquete dplyr para obtener una muestra aleatoria estratificada en la que seleccionamos al azar al 15% de los estudiantes de cada grado:

biblioteca (dplyr)

#obtener muestra estratificada
muestra_estrat <- df%>%
                  group_by (grado)%>%
                   sample_frac (tamaño = .15)

# encontrar la frecuencia de los estudiantes de cada tabla de calificaciones
 (strat_sample $ grade)

 Freshman Junior Senior Sophomore 
       15 15 15 15

Recursos adicionales

Tipos de métodos
de muestreo Muestreo por conglomerados en R
Muestreo sistemático en R

https://r-project.org
https://www.python.org/
https://www.stata.com/

Redactor del artículo

Luis Benites
Director de Statologos.com
Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Equipo de Statologos

Luis Benites

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Director de Statologos.com
Dereck Amesquita

I am a Bachelor of Science in Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.
Statistics content writer
Cisco Pfoccori

15 años haciendo SEO, monetizando, haciendo nichos y ayudando a empresas a mejoras sus estrategia digital. Pueden contactarme si necesitan mejorar su digitalización, actualmente trabajo para CirculoSEO.
Editor de contenido y SEO

Ejemplo: muestreo estratificado en R

Muestreo estratificado mediante el número de filas

Muestreo estratificado utilizando una fracción de filas

Recursos adicionales

Redactor del artículo

¿Te hemos ayudado?

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!