Cómo calcular la desviación absoluta media en Python

La desviación absoluta mediana mide la dispersión de las observaciones en un conjunto de datos.

Es una métrica particularmente útil porque se ve menos afectada por valores atípicos que otras medidas de dispersión como la desviación estándar y la varianza.

La fórmula para calcular la desviación absoluta mediana, a menudo abreviada como MAD, es la siguiente:

MAD = mediana (| x i – x m |)

dónde:

  • x i : el i- ésimo valor en el conjunto de datos
  • x m : el valor mediano en el conjunto de datos

Los siguientes ejemplos muestran cómo calcular la desviación absoluta media en Python mediante el uso de la función mad de statsmodels .

Ejemplo 1: Calcular MAD para una matriz

El siguiente código muestra cómo calcular la desviación absoluta mediana para una sola matriz NumPy en Python:

importar numpy como np
 de statsmodels import robusto

#define data
datos = np. matriz ([1, 4, 4, 7, 12, 13, 16, 19, 22, 24])

#calcular MAD
 robusto. loco (datos)

11.1195

La desviación absoluta mediana para el conjunto de datos resulta ser 11,1195 .

Es importante tener en cuenta que la fórmula utilizada para calcular MAD calcula una estimación robusta de la desviación estándar asumiendo una distribución normal al escalar el resultado por un factor de aproximadamente 0,67.

Para evitar usar este factor de escala, simplemente establezca c = 1 de la siguiente manera:

#calcular MAD sin factor de escala
 robusto. loco (datos, c = 1)

7.5

Ejemplo 2: Calcular MAD para un DataFrame

El siguiente código muestra cómo calcular MAD para una sola columna en un DataFrame de pandas:

#Haga que este ejemplo sea reproducible
 np. al azar . semilla (1)

#create pandas DataFrame
 data = pd. Trama de datos (np. Aleatorio . Randint (0, 10, tamaño = (5, 3)), las columnas = [ ' A ', ' B ', ' C '])

#ver datos de DataFrame


        A B C
0 5 8 9
1 5 0 0
2 1 7 6
3 9 2 4
4 5 2 4

#calcular MAD para los 
datos de la columna B [[' B ']]. aplicar (robusto. loco )

B 2.965204
dtype: float64

La desviación absoluta mediana para la columna B resulta ser 2.965204 .

Podemos usar una sintaxis similar para calcular MAD para múltiples columnas en pandas DataFrame:

#calcular MAD para todos los 
datos de las columnas [[' A ', ' B ', ' C ']]. aplicar (robusto. loco )

Un 0,000000
B 2.965204
C 2.965204
dtype: float64

La desviación absoluta mediana es 0 para la columna A, 2.965204 para la columna B y 2.965204 para la columna C.

Recursos adicionales

Cómo calcular MAPE en Python
Cómo calcular SMAPE en Python
Cómo calcular RMSE en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Una variable dicotómica es un tipo de variable que solo toma dos valores posibles. Algunos ejemplos de variables dicotómicas incluyen:…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!