¿Qué es una distribución de muestreo?

Imagínese que existe una población de 10,000 delfines y el peso medio de un delfín en esta población es de 300 libras.

Si tomamos una muestra aleatoria simple de 50 delfines de esta población, podríamos encontrar que el peso medio de los delfines en esta muestra es de 305 libras.

Luego, si tomamos otra muestra aleatoria simple de 50 delfines, podríamos encontrar que el peso medio de los delfines en esa muestra es de 295 libras.

Cada vez que tomamos una muestra aleatoria simple de 50 delfines, es probable que el peso medio de los delfines en la muestra esté cerca de la media poblacional de 300 libras, pero no exactamente 300 libras.

Imagine que tomamos 200 muestras aleatorias simples de 50 delfines de esta población y hacemos un histograma del peso medio de cada muestra:

En la mayoría de las muestras, el peso medio estará cerca de las 300 libras. En escenarios raros, puede ocurrir que tomemos una muestra llena de delfines pequeños donde el peso promedio es de solo 250 libras. O puede ocurrir que tomemos una muestra llena de delfines grandes donde el peso medio es de 350 libras. En general, la distribución de las medias muestrales será aproximadamente normal con el centro de la distribución ubicado en el verdadero centro de la población.

Esta distribución de medias muestrales se conoce como distribución muestral de la media y tiene las siguientes propiedades:

μ x = μ

donde μ x es la media de la muestra y μ es la media de la población.

σ x = σ / √n

donde σ x es la desviación estándar de la muestra, σ es la desviación estándar de la población y n es el tamaño de la muestra.

Por ejemplo, en esta población de delfines sabemos que el peso medio es μ = 300. Entonces, la media de la distribución de muestreo es μ x = 300 .

Suponga que también sabemos que la desviación estándar de la población es de 18 libras. Entonces, la desviación estándar de la muestra es σ x = 18 / √50 = 2.546 .

Distribución muestral de la proporción

Considere la misma población de 10,000 delfines. Supongamos que el 10% de los delfines son negros y el resto grises. Suponga que tomamos una muestra aleatoria simple de 50 delfines y encontramos que el 14% de los delfines en esa muestra son negros. Luego tomamos otra muestra aleatoria simple de 50 delfines y encontramos que el 8% de los delfines en esa muestra son negros.

Imagine que tomamos 200 muestras aleatorias simples de 50 delfines de esta población y hacemos un histograma de la proporción de delfines negros en cada muestra:

En la mayoría de las muestras, la proporción de delfines negros estará cerca de la población real del 10%. La distribución de la proporción muestral de delfines negros será aproximadamente normal con el centro de la distribución ubicado en el verdadero centro de la población.

Esta distribución de proporciones muestrales se conoce como distribución muestral de la proporción y tiene las siguientes propiedades:

μ p = P

donde p es la proporción de la muestra y P es la proporción de la población.

σ p = √ (P) (1-P) / n

donde P es la proporción de la población yn es el tamaño de la muestra.

Por ejemplo, en esta población de delfines sabemos que la verdadera proporción de delfines negros es 10% = 0,1. Entonces, la media de la distribución muestral de la proporción es μ p = 0.1 .

Suponga que también sabemos que la desviación estándar de la población es de 18 libras. Entonces, la desviación estándar de la muestra es σ p = √ (P) (1-P) / n = √ (.1) (1-.1) / 50 = .042 .

Estableciendo la normalidad

Para utilizar las fórmulas anteriores, la distribución muestral debe ser normal.

Según el teorema del límite central , la distribución muestral de una media muestral es aproximadamente normal si el tamaño de la muestra es lo suficientemente grande, incluso si la distribución de la población no es normal . En la mayoría de los casos, consideramos que un tamaño de muestra de 30 o más es suficientemente grande.

La distribución muestral de una proporción muestral es aproximadamente normal si el número esperado de éxitos y fracasos es al menos 10.

Ejemplos de

Podemos usar distribuciones muestrales para calcular probabilidades.

Ejemplo 1: cierta máquina crea cookies. La distribución del peso de estas galletas está sesgada hacia la derecha con una media de 10 onzas y una desviación estándar de 2 onzas. Si tomamos una muestra aleatoria simple de 100 galletas producidas por esta máquina, ¿cuál es la probabilidad de que el peso medio de las galletas en esta muestra sea inferior a 9,8 onzas?

Paso 1: establece la normalidad.

Necesitamos asegurarnos de que la distribución muestral de la media muestral sea normal. Dado que el tamaño de nuestra muestra es mayor o igual a 30, de acuerdo con el teorema del límite central podemos asumir que la distribución muestral de la media muestral es normal.

Paso 2: Encuentre la media y la desviación estándar de la distribución muestral.

μ x = μ

σ x = σ / √n

μ x = 10 onzas

σ x = 2 / √100 = 2/10 = 0.2 onzas

Paso 3: Utilice la calculadora de área de puntuación Z para encontrar la probabilidad de que el peso medio de las galletas en esta muestra sea inferior a 9,8 onzas.

Introduzca los siguientes números en la puntuación z del Área de la calculadora . Puede dejar en blanco «Puntuación bruta 2», ya que solo encontramos un número en este ejemplo.


Dado que queremos saber la probabilidad de que el peso medio de las galletas en esta muestra sea inferior a 9,8 onzas, nos interesa el área a la izquierda de 9,8. La calculadora nos dice que esta probabilidad es 0.15866 .

Ejemplo 2: Según un estudio de toda la escuela, el 87% de los estudiantes de una escuela en particular prefieren la pizza al helado. Suponga que tomamos una muestra aleatoria simple de 200 estudiantes. ¿Cuál es la probabilidad de que la proporción de estudiantes que prefieren la pizza sea menor al 85%?

Paso 1: establece la normalidad.

Recuerde que la distribución muestral de una proporción muestral es aproximadamente normal si el número esperado de «éxitos» y «fracasos» es de al menos 10.

En este caso, el número esperado de estudiantes que preferirán la pizza es 87% * 200 estudiantes = 174 estudiantes. El número esperado de estudiantes que no preferirán la pizza es 13% * 200 estudiantes = 26 estudiantes. Dado que ambos números son al menos 10, podemos suponer que la distribución muestral de la proporción muestral de estudiantes que preferirán la pizza es aproximadamente normal.

Paso 2: Encuentre la media y la desviación estándar de la distribución muestral.

μ p = P

σ p = √ (P) (1-P) / n

μ p = 0,87

σ p = √ (.87) (1-.87) / 200 = .024

Paso 3: Use la Calculadora de área de puntaje Z para encontrar la probabilidad de que la proporción de estudiantes que prefieren la pizza sea menor al 85%.

Introduzca los siguientes números en la puntuación z del Área de la calculadora . Puede dejar en blanco «Puntuación bruta 2», ya que solo encontramos un número en este ejemplo.

Como queremos saber la probabilidad de que la proporción de estudiantes que prefieren la pizza sea inferior al 85%, nos interesa el área a la izquierda de 0,85. La calculadora nos dice que esta probabilidad es 0.20233 .

Bono: Explicación en video de las distribuciones de muestreo

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La forma más fácil de calcular los valores p en Google Sheets es usar la función T.TEST () , que…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!