Media muestral vs. Media poblacional: ¿Cuál es la diferencia?

A menudo, en las estadísticas, nos interesa responder preguntas como:

  • ¿Cuál es el ingreso familiar medio en una ciudad determinada?
  • ¿Cuál es el peso medio de una determinada especie de tortuga?
  • ¿Cuál es la asistencia media a los partidos de fútbol americano universitario?

En cada escenario, nos interesa responder alguna pregunta sobre una población , que representa todos los elementos individuales posibles que nos interesa medir.

Sin embargo, en lugar de recopilar datos sobre cada individuo de una población, recopilamos datos sobre una muestra de la población, que representa una parte de la población total.

Por ejemplo, podríamos querer saber el peso medio de una determinada especie de tortuga que tiene una población total de 800 tortugas.

Dado que llevaría demasiado tiempo ubicar y pesar cada tortuga de la población, en su lugar recolectamos una muestra aleatoria simple de 30 tortugas y medimos sus pesos:

Ejemplo de media de muestra

Entonces podríamos usar el peso medio de esta muestra de tortugas para estimar el peso medio de todas las tortugas en la población.

Cómo calcular la media muestral

La fórmula para calcular la media muestral, a menudo denotada x , es la siguiente:

x = Σx i / n

dónde:

  • Σ: un elegante símbolo griego que significa «suma»
  • x i : el valor de la i-ésima observación en el conjunto de datos
  • n: el tamaño de la muestra

Por ejemplo, supongamos que recolectamos una muestra de 10 tortugas con los siguientes pesos (en libras):

  • 70, 80, 80, 85, 90, 95, 110, 120, 140, 150

La media de la muestra se calcularía como:

  • x = (70+ 80 + 80 + 85 + 90 + 95 + 110 + 120 + 140 + 150) / 10 = 102

Por qué la media muestral es imparcial

En la jerga estadística, diríamos que la media de la muestra es una estadística mientras que la media de la población es un parámetro .

Aquí está la diferencia entre los dos términos:

Una estadística es un número que describe alguna característica de una muestra.

Un parámetro es un número que describe alguna característica de una población.

El parámetro es el valor que realmente nos interesa medir, pero la estadística es el valor que usamos para estimar el valor del parámetro, ya que la estadística es mucho más fácil de obtener.

Cuando usamos un método como el muestreo aleatorio simple para obtener una muestra, decimos que la media muestral es un estimador insesgado de la media poblacional.

En otras palabras, no tenemos ninguna razón para creer que la media de la muestra subestimaría o sobrestimaría la media de la población real.

La razón es que cuando usamos un método como el muestreo aleatorio simple, cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra, lo que significa que es probable que la muestra sea una “mini versión” de la población general.

Diríamos que la muestra es representativa de la población en general , lo que significa que la media de la muestra debe ser una buena estimación de la media de la población, asumiendo que el tamaño de la muestra es lo suficientemente grande.

Sobre el uso de intervalos de confianza con la media muestral

Aunque la media de la muestra proporciona una estimación no sesgada de la media de la población, es poco probable que la media de la muestra coincida exactamente con la media de la población.

Por ejemplo, si queremos usar una muestra de tortugas para estimar el peso medio de una población de tortugas, es posible que simplemente tomemos una muestra llena de tortugas de bajo peso o quizás una muestra llena de tortugas pesadas.

Para capturar esta incertidumbre en torno a nuestra estimación de la media poblacional, podemos crear un intervalo de confianza .

Un intervalo de confianza es un rango de valores que probablemente contenga un parámetro de población con un cierto nivel de confianza.

Por ejemplo, podríamos recolectar una muestra de 30 tortugas y encontrar que el peso medio de esta muestra es 102 libras. Si luego construimos un intervalo de confianza del 95%, podríamos encontrar que el intervalo es el siguiente:

Intervalo de confianza del 95% = [98,5, 105,5]

Interpretaríamos que esto significa que hay un 95% de probabilidad de que el intervalo de confianza de [98,5, 105,5] contenga el peso medio real de la población de tortugas.

Este intervalo de confianza es más útil que solo la media de la muestra porque nos da un rango de valores en el que es probable que caiga la media de la población real.

Recursos adicionales

Población frente a muestra: ¿Cuál es la diferencia?
Estadística frente a parámetro: ¿Cuál es la diferencia?
Introducción a los intervalos de confianza

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Una variable aleatoria , típicamente denotada como X, es una variable cuyos posibles valores son resultados de un proceso aleatorio.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!