Contenido de este artículo
- 0
- 0
- 0
- 0
La desviación absoluta mediana mide la dispersión de las observaciones en un conjunto de datos.
Es una métrica particularmente útil porque se ve menos afectada por valores atípicos que otras medidas de dispersión como la desviación estándar y la varianza.
La fórmula para calcular la desviación absoluta mediana, a menudo abreviada como MAD, es la siguiente:
MAD = mediana (| x i – x m |)
dónde:
- x i : el i- ésimo valor en el conjunto de datos
- x m : el valor mediano en el conjunto de datos
Los siguientes ejemplos muestran cómo calcular la desviación absoluta media en Python mediante el uso de la función mad de statsmodels .
Ejemplo 1: Calcular MAD para una matriz
El siguiente código muestra cómo calcular la desviación absoluta mediana para una sola matriz NumPy en Python:
importar numpy como np de statsmodels import robusto #define data datos = np. matriz ([1, 4, 4, 7, 12, 13, 16, 19, 22, 24]) #calcular MAD robusto. loco (datos) 11.1195
La desviación absoluta mediana para el conjunto de datos resulta ser 11,1195 .
Es importante tener en cuenta que la fórmula utilizada para calcular MAD calcula una estimación robusta de la desviación estándar asumiendo una distribución normal al escalar el resultado por un factor de aproximadamente 0,67.
Para evitar usar este factor de escala, simplemente establezca c = 1 de la siguiente manera:
#calcular MAD sin factor de escala robusto. loco (datos, c = 1) 7.5
Ejemplo 2: Calcular MAD para un DataFrame
El siguiente código muestra cómo calcular MAD para una sola columna en un DataFrame de pandas:
#Haga que este ejemplo sea reproducible np. al azar . semilla (1) #create pandas DataFrame data = pd. Trama de datos (np. Aleatorio . Randint (0, 10, tamaño = (5, 3)), las columnas = [ ' A ', ' B ', ' C ']) #ver datos de DataFrame A B C 0 5 8 9 1 5 0 0 2 1 7 6 3 9 2 4 4 5 2 4 #calcular MAD para los datos de la columna B [[' B ']]. aplicar (robusto. loco ) B 2.965204 dtype: float64
La desviación absoluta mediana para la columna B resulta ser 2.965204 .
Podemos usar una sintaxis similar para calcular MAD para múltiples columnas en pandas DataFrame:
#calcular MAD para todos los datos de las columnas [[' A ', ' B ', ' C ']]. aplicar (robusto. loco ) Un 0,000000 B 2.965204 C 2.965204 dtype: float64
La desviación absoluta mediana es 0 para la columna A, 2.965204 para la columna B y 2.965204 para la columna C.
Recursos adicionales
Cómo calcular MAPE en Python
Cómo calcular SMAPE en Python
Cómo calcular RMSE en Python
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: