Contenido de este artículo
- 0
- 0
- 0
- 0
El error estándar de la media es una forma de medir qué tan dispersos están los valores en un conjunto de datos. Se calcula como:
Error estándar de la media = s / √n
dónde:
- s : desviación estándar de la muestra
- n : tamaño de la muestra
Este tutorial explica dos métodos que puede utilizar para calcular el error estándar de la media para un conjunto de datos en Python. Tenga en cuenta que ambos métodos producen exactamente los mismos resultados.
Método 1: utilizar SciPy
La primera forma de calcular el error estándar de la media es usar la función sem () de la biblioteca SciPy Stats.
El siguiente código muestra cómo utilizar esta función:
de scipy. estadísticas de importación sem #define dataset datos = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29] #calcular el error estándar de la media sem (datos) 2.001447
El error estándar de la media resulta ser 2,001447 .
Método 2: usar NumPy
Otra forma de calcular el error estándar de la media de un conjunto de datos es usar la función std () de NumPy.
Tenga en cuenta que debemos especificar ddof = 1 en el argumento de esta función para calcular la desviación estándar de la muestra en contraposición a la desviación estándar de la población.
El siguiente código muestra cómo hacerlo:
importar numpy como np #define dataset data = np.array ([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]) # calcular el error estándar de la media np. std (datos, ddof = 1 ) / np. sqrt ( tamaño np. (datos)) 2.001447
Una vez más, el error estándar de la media resulta ser 2.001447 .
Cómo interpretar el error estándar de la media
El error estándar de la media es simplemente una medida de cuán dispersos están los valores alrededor de la media. Hay dos cosas a tener en cuenta al interpretar el error estándar de la media:
1. Cuanto mayor sea el error estándar de la media, más dispersos estarán los valores alrededor de la media en un conjunto de datos.
Para ilustrar esto, considere si cambiamos el último valor en el conjunto de datos anterior a un número mucho mayor:
de scipy. estadísticas de importación sem #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ] #calcular el error estándar de la media sem (datos) 6.978265
Observe cómo el error estándar salta de 2,001447 a 6,978265 . Esta es una indicación de que los valores en este conjunto de datos están más dispersos alrededor de la media en comparación con el conjunto de datos anterior.
2. A medida que aumenta el tamaño de la muestra, el error estándar de la media tiende a disminuir.
Para ilustrar esto, considere el error estándar de la media para los siguientes dos conjuntos de datos:
de scipy . estadísticas de importación sem # definir el primer conjunto de datos y encontrar SEM datos1 = [1, 2, 3, 4, 5] sem (datos1) 0,7071068 #define el segundo conjunto de datos y encuentre SEM datos2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] sem (datos2) 0,4714045
El segundo conjunto de datos es simplemente el primer conjunto de datos que se repite dos veces. Por lo tanto, los dos conjuntos de datos tienen la misma media, pero el segundo conjunto de datos tiene un tamaño de muestra más grande, por lo que tiene un error estándar menor.
Recursos adicionales
Cómo calcular el error estándar de la media en R
Cómo calcular el error estándar de la media en Excel
Cómo calcular el error estándar de la media en Google Sheets
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: