Comparación de la desviación absoluta media frente a la desviación estándar

La desviación estándar es una de las formas más comunes de medir la dispersión de un conjunto de datos.

Se calcula como:

Desviación estándar = √ (Σ (x ix ) 2 / n)

Una forma alternativa de medir la dispersión de observaciones en un conjunto de datos es la desviación absoluta media .

Se calcula como:

Desviación absoluta media = Σ | x ix | / n

Este tutorial explica las diferencias entre estas dos métricas junto con ejemplos de cómo calcular cada una.

Similitudes y diferencias

Como implican los nombres, tanto la desviación estándar como la desviación media absoluta intentan cuantificar la desviación típica de las observaciones de la media en un conjunto de datos dado.

Sin embargo, el método que utiliza cada métrica es diferente.

Desviación Estándar

La desviación estándar encuentra la diferencia al cuadrado entre cada observación y la media de un conjunto de datos. Luego toma el promedio de estas diferencias cuadradas y saca la raíz cuadrada.

Esto nos deja con un número que representa la desviación «estándar» o típica de una observación de la media.

Desviación media absoluta

Por el contrario, la desviación absoluta media encuentra la desviación absoluta entre cada observación y la media del conjunto de datos. Luego encuentra el promedio de estas desviaciones.

Esto nos deja con un número que representa la desviación promedio de las observaciones de la media.

Debido a que la desviación estándar encuentra las diferencias al cuadrado, siempre será igual o mayor que la desviación absoluta media.

Cuando existen valores atípicos extremos, la desviación estándar será considerablemente mayor que la desviación absoluta media. El siguiente ejemplo ilustra este punto.

Ejemplo: desviación absoluta media frente a desviación estándar

Supongamos que tenemos el siguiente conjunto de datos de 8 valores:

La media resulta ser 11 .

Por lo tanto, calcularíamos la desviación absoluta media como:

Desviación absoluta media = (| 3-11 | + | 5-11 | + | 6-11 | + | 8-11 | + | 11-11 | + | 14-11 | + | 17-11 | + | 24- 11 |) / 8 = 5,5 .

Y calcularíamos la desviación estándar como:

Desviación estándar = √ ( (3-11) 2 + (5-11) 2 + (6-11) 2 + (8-11) 2 + (11-11) 2 + (14-11) 2 + (17- 11) 2 + (24-11) 2 ) / 8) = 6.595 .

Como se mencionó anteriormente, la desviación estándar siempre será igual o mayor que la desviación absoluta media.

Sin embargo, la diferencia entre la desviación estándar y la desviación absoluta media será particularmente grande si hay valores atípicos extremos en el conjunto de datos.

Por ejemplo, considere el siguiente conjunto de datos con un valor atípico extremo para el último valor:

Resulta que la desviación estándar para este conjunto de datos es 63,27 mientras que la desviación absoluta media es 41,75 .

El valor atípico extremo hace que la desviación estándar sea mucho mayor que la desviación absoluta media.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Hay dos formas sencillas de ordenar un marco de datos por fecha en R: Método 1: orden de usuario ()…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!