Cómo calcular la desviación absoluta media en R

La desviación absoluta mediana mide la dispersión de las observaciones en un conjunto de datos.

Es una métrica particularmente útil porque se ve menos afectada por valores atípicos que otras medidas de dispersión como la desviación estándar y la varianza.

La fórmula para calcular la desviación absoluta mediana, a menudo abreviada como MAD, es la siguiente:

MAD = mediana (| x i – x m |)

dónde:

  • x i : el i- ésimo valor en el conjunto de datos
  • x m : el valor mediano en el conjunto de datos

Los siguientes ejemplos muestran cómo calcular la desviación absoluta mediana en R utilizando la función incorporada mad () .

Ejemplo 1: Calcular MAD para un vector

El siguiente código muestra cómo calcular la desviación absoluta mediana para un solo vector en R:

#definir datos
 datos <- c (1, 4, 4, 7, 12, 13, 16, 19, 22, 24)

#calcular MAD
 mad (datos)

[1] 11.1195

La desviación absoluta mediana para el conjunto de datos resulta ser 11,1195 .

Ejemplo 2: Calcular MAD para una columna en un marco de datos

El siguiente código muestra cómo calcular MAD para una sola columna en un marco de datos:

#define data
 data <- data.frame (x = c (1, 4, 4, 6, 7, 8, 12),
                   y = c (3, 4, 6, 8, 8, 9, 19),
                   z = c (2, 2, 2, 3, 5, 8, 11))

#calcular MAD para la columna y en el marco de datos
 mad (data $ y)

[1] 2.9652

La desviación absoluta mediana para la columna y resulta ser 2.9652 .

Ejemplo 3: Calcular MAD para varias columnas en un marco de datos

El siguiente código muestra cómo calcular MAD para múltiples columnas en un marco de datos usando la función sapply () :

#define data
 data <- data.frame (x = c (1, 4, 4, 6, 7, 8, 12),
                   y = c (3, 4, 6, 8, 8, 9, 19),
                   z = c (2, 2, 2, 3, 5, 8, 11))

#calcular MAD para todas las columnas en el marco de datos
sapply (datos, loco)

     xyz 
2.9652 2.9652 1.4826

La desviación absoluta mediana es 2.9652 para la columna x, 2.9652 para la columna y y 1.4826 para la columna z.

Relacionado: Una guía para aplicar (), lapply (), sapply () y tapply () en R

Recursos adicionales

Cómo calcular MAPE en R
Cómo calcular MSE en R
Cómo calcular RMSE en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La covarianza es una medida de cómo los cambios en una variable se asocian con los cambios en una segunda…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!