Contenido de este artículo
- 0
- 0
- 0
- 0
A menudo, en las estadísticas, nos interesa responder preguntas como:
- ¿Cuál es el ingreso familiar medio en una ciudad determinada?
- ¿Cuál es el peso medio de una determinada especie de tortuga?
- ¿Cuál es la asistencia media a los partidos de fútbol americano universitario?
En cada escenario, nos interesa responder alguna pregunta sobre una población , que representa todos los elementos individuales posibles que nos interesa medir.
Sin embargo, en lugar de recopilar datos sobre cada individuo de una población, recopilamos datos sobre una muestra de la población, que representa una parte de la población total.
Por ejemplo, podríamos querer saber el peso medio de una determinada especie de tortuga que tiene una población total de 800 tortugas.
Dado que llevaría demasiado tiempo ubicar y pesar cada tortuga de la población, en su lugar recolectamos una muestra aleatoria simple de 30 tortugas y medimos sus pesos:
Entonces podríamos usar el peso medio de esta muestra de tortugas para estimar el peso medio de todas las tortugas en la población.
Cómo calcular la media muestral
La fórmula para calcular la media muestral, a menudo denotada x , es la siguiente:
x = Σx i / n
dónde:
- Σ: un elegante símbolo griego que significa «suma»
- x i : el valor de la i-ésima observación en el conjunto de datos
- n: el tamaño de la muestra
Por ejemplo, supongamos que recolectamos una muestra de 10 tortugas con los siguientes pesos (en libras):
- 70, 80, 80, 85, 90, 95, 110, 120, 140, 150
La media de la muestra se calcularía como:
- x = (70+ 80 + 80 + 85 + 90 + 95 + 110 + 120 + 140 + 150) / 10 = 102
Por qué la media muestral es imparcial
En la jerga estadística, diríamos que la media de la muestra es una estadística mientras que la media de la población es un parámetro .
Aquí está la diferencia entre los dos términos:
Una estadística es un número que describe alguna característica de una muestra.
Un parámetro es un número que describe alguna característica de una población.
El parámetro es el valor que realmente nos interesa medir, pero la estadística es el valor que usamos para estimar el valor del parámetro, ya que la estadística es mucho más fácil de obtener.
Cuando usamos un método como el muestreo aleatorio simple para obtener una muestra, decimos que la media muestral es un estimador insesgado de la media poblacional.
En otras palabras, no tenemos ninguna razón para creer que la media de la muestra subestimaría o sobrestimaría la media de la población real.
La razón es que cuando usamos un método como el muestreo aleatorio simple, cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra, lo que significa que es probable que la muestra sea una “mini versión” de la población general.
Diríamos que la muestra es representativa de la población en general , lo que significa que la media de la muestra debe ser una buena estimación de la media de la población, asumiendo que el tamaño de la muestra es lo suficientemente grande.
Sobre el uso de intervalos de confianza con la media muestral
Aunque la media de la muestra proporciona una estimación no sesgada de la media de la población, es poco probable que la media de la muestra coincida exactamente con la media de la población.
Por ejemplo, si queremos usar una muestra de tortugas para estimar el peso medio de una población de tortugas, es posible que simplemente tomemos una muestra llena de tortugas de bajo peso o quizás una muestra llena de tortugas pesadas.
Para capturar esta incertidumbre en torno a nuestra estimación de la media poblacional, podemos crear un intervalo de confianza .
Un intervalo de confianza es un rango de valores que probablemente contenga un parámetro de población con un cierto nivel de confianza.
Por ejemplo, podríamos recolectar una muestra de 30 tortugas y encontrar que el peso medio de esta muestra es 102 libras. Si luego construimos un intervalo de confianza del 95%, podríamos encontrar que el intervalo es el siguiente:
Intervalo de confianza del 95% = [98,5, 105,5]
Interpretaríamos que esto significa que hay un 95% de probabilidad de que el intervalo de confianza de [98,5, 105,5] contenga el peso medio real de la población de tortugas.
Este intervalo de confianza es más útil que solo la media de la muestra porque nos da un rango de valores en el que es probable que caiga la media de la población real.
Recursos adicionales
Población frente a muestra: ¿Cuál es la diferencia?
Estadística frente a parámetro: ¿Cuál es la diferencia?
Introducción a los intervalos de confianza
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: