Cómo calcular el error estándar de la media en Python

El error estándar de la media es una forma de medir qué tan dispersos están los valores en un conjunto de datos. Se calcula como:

Error estándar de la media = s / √n

dónde:

  • s : desviación estándar de la muestra
  • n : tamaño de la muestra

Este tutorial explica dos métodos que puede utilizar para calcular el error estándar de la media para un conjunto de datos en Python. Tenga en cuenta que ambos métodos producen exactamente los mismos resultados.

Método 1: utilizar SciPy

La primera forma de calcular el error estándar de la media es usar la función sem () de la biblioteca SciPy Stats.

El siguiente código muestra cómo utilizar esta función:

de scipy. estadísticas de  importación sem

#define dataset 
datos = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calcular el error estándar de la media 
sem (datos)

2.001447

El error estándar de la media resulta ser 2,001447 .

Método 2: usar NumPy

Otra forma de calcular el error estándar de la media de un conjunto de datos es usar la función std () de NumPy.

Tenga en cuenta que debemos especificar ddof = 1 en el argumento de esta función para calcular la desviación estándar de la muestra en contraposición a la desviación estándar de la población.

El siguiente código muestra cómo hacerlo:

importar numpy como np

#define dataset
data = np.array ([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

# calcular el error estándar de la media  
np. std (datos, ddof = 1 ) / np. sqrt ( tamaño np. (datos))

2.001447

Una vez más, el error estándar de la media resulta ser 2.001447 .

Cómo interpretar el error estándar de la media

El error estándar de la media es simplemente una medida de cuán dispersos están los valores alrededor de la media. Hay dos cosas a tener en cuenta al interpretar el error estándar de la media:

1. Cuanto mayor sea el error estándar de la media, más dispersos estarán los valores alrededor de la media en un conjunto de datos.

Para ilustrar esto, considere si cambiamos el último valor en el conjunto de datos anterior a un número mucho mayor:

de scipy. estadísticas de  importación sem

#define dataset  
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calcular el error estándar de la media 
sem (datos)

6.978265

Observe cómo el error estándar salta de 2,001447 a 6,978265 . Esta es una indicación de que los valores en este conjunto de datos están más dispersos alrededor de la media en comparación con el conjunto de datos anterior.

2. A medida que aumenta el tamaño de la muestra, el error estándar de la media tiende a disminuir.

Para ilustrar esto, considere el error estándar de la media para los siguientes dos conjuntos de datos:

de  scipy . estadísticas de  importación  sem 

# definir el primer conjunto de datos y encontrar SEM
datos1 = [1, 2, 3, 4, 5]
sem (datos1)

0,7071068

#define el segundo conjunto de datos y encuentre SEM
datos2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem (datos2)

0,4714045

El segundo conjunto de datos es simplemente el primer conjunto de datos que se repite dos veces. Por lo tanto, los dos conjuntos de datos tienen la misma media, pero el segundo conjunto de datos tiene un tamaño de muestra más grande, por lo que tiene un error estándar menor.

Recursos adicionales

Cómo calcular el error estándar de la media en R
Cómo calcular el error estándar de la media en Excel
Cómo calcular el error estándar de la media en Google Sheets

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba t de dos muestras para comprobar si las medias de dos poblaciones son iguales o no.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!