Cómo calcular la desviación absoluta media en Python

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

La desviación absoluta mediana mide la dispersión de las observaciones en un conjunto de datos.

Es una métrica particularmente útil porque se ve menos afectada por valores atípicos que otras medidas de dispersión como la desviación estándar y la varianza.

La fórmula para calcular la desviación absoluta mediana, a menudo abreviada como MAD, es la siguiente:

MAD = mediana (| x i – x m |)

dónde:

  • x i : el i- ésimo valor en el conjunto de datos
  • x m : el valor mediano en el conjunto de datos

Los siguientes ejemplos muestran cómo calcular la desviación absoluta media en Python mediante el uso de la función mad de statsmodels .

Ejemplo 1: Calcular MAD para una matriz

El siguiente código muestra cómo calcular la desviación absoluta mediana para una sola matriz NumPy en Python:

importar numpy como np
 de statsmodels import robusto

#define data
datos = np. matriz ([1, 4, 4, 7, 12, 13, 16, 19, 22, 24])

#calcular MAD
 robusto. loco (datos)

11.1195

La desviación absoluta mediana para el conjunto de datos resulta ser 11,1195 .

Es importante tener en cuenta que la fórmula utilizada para calcular MAD calcula una estimación robusta de la desviación estándar asumiendo una distribución normal al escalar el resultado por un factor de aproximadamente 0,67.

Para evitar usar este factor de escala, simplemente establezca c = 1 de la siguiente manera:

#calcular MAD sin factor de escala
 robusto. loco (datos, c = 1)

7.5

Ejemplo 2: Calcular MAD para un DataFrame

El siguiente código muestra cómo calcular MAD para una sola columna en un DataFrame de pandas:

#Haga que este ejemplo sea reproducible
 np. al azar . semilla (1)

#create pandas DataFrame
 data = pd. Trama de datos (np. Aleatorio . Randint (0, 10, tamaño = (5, 3)), las columnas = [ ' A ', ' B ', ' C '])

#ver datos de DataFrame


        A B C
0 5 8 9
1 5 0 0
2 1 7 6
3 9 2 4
4 5 2 4

#calcular MAD para los 
datos de la columna B [[' B ']]. aplicar (robusto. loco )

B 2.965204
dtype: float64

La desviación absoluta mediana para la columna B resulta ser 2.965204 .

Podemos usar una sintaxis similar para calcular MAD para múltiples columnas en pandas DataFrame:

#calcular MAD para todos los 
datos de las columnas [[' A ', ' B ', ' C ']]. aplicar (robusto. loco )

Un 0,000000
B 2.965204
C 2.965204
dtype: float64

La desviación absoluta mediana es 0 para la columna A, 2.965204 para la columna B y 2.965204 para la columna C.

Recursos adicionales

Cómo calcular MAPE en Python
Cómo calcular SMAPE en Python
Cómo calcular RMSE en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Una variable dicotómica es un tipo de variable que solo toma dos valores posibles. Algunos ejemplos de variables dicotómicas incluyen:…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!