¿El rango intercuartil (IQR) se ve afectado por valores atípicos?

En estadística, a menudo nos interesa saber qué tan «dispersos» están los valores en una distribución.

Una forma popular de medir la dispersión es el rango intercuartil , que se calcula como la diferencia entre el primer cuartil y el tercer cuartil en un conjunto de datos. Los cuartiles son simplemente valores que dividen un conjunto de datos en cuatro partes iguales.

Ejemplo: calcular el rango intercuartil

El siguiente ejemplo muestra cómo calcular el rango intercuartílico para un conjunto de datos determinado:

Varianza y desviación estándar de un conjunto de datos

Paso 1: Organice los valores de menor a mayor.

58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88, 88, 88, 90, 90, 92, 92, 94, 96, 98

2. Encuentra la mediana.

58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88 , 88, 88, 90, 90, 92, 92, 94, 96, 98

En este caso, la mediana está entre 85 y 88.

3. La mediana divide el conjunto de datos en dos mitades. La mediana de la mitad inferior es el cuartil inferior y la mediana de la mitad superior es el cuartil superior:

58, 66, 71, 73, 74, 77 , 78, 82, 84, 85, 88, 88, 88, 90, 90, 92 , 92, 94, 96, 98

4. Calcule el rango intercuartílico.

En este caso, el primer cuartil es el promedio de los dos valores del medio en la mitad inferior del conjunto de datos (75,5) y el tercer cuartil es el promedio de los dos valores del medio en la mitad superior del conjunto de datos (91).

Por tanto, el rango intercuartílico es 91 – 75,5 = 15,5

El rango intercuartil no se ve afectado por valores atípicos

Una razón por la que las personas prefieren usar el rango intercuartil (IQR) al calcular la «extensión» de un conjunto de datos es porque es resistente a valores atípicos. Dado que el IQR es simplemente el rango del 50% medio de los valores de datos, no se ve afectado por valores atípicos extremos .

Para demostrar esto, considere el siguiente conjunto de datos:

[1, 4, 8, 11, 13, 17, 17, 20]

Estas son las diversas medidas de propagación para este conjunto de datos:

  • Rango intercuartil: 11
  • Alcance: 19
  • Desviación estándar: 6.26
  • Varianza: 39,23

Ahora, considere el mismo conjunto de datos pero con un valor atípico extremo agregado:

[1, 4, 8, 11, 13, 17, 17, 20, 150 ]

Estas son las diversas medidas de propagación para este conjunto de datos:

  • Rango intercuartil: 12,5
  • Alcance: 149
  • Desviación estándar: 43,96
  • Varianza: 1.932,84

Observe cómo el rango intercuartílico cambia solo ligeramente, de 11 a 12,5. Sin embargo, todas las demás medidas de dispersión cambian drásticamente.

Esto demuestra que el rango intercuartílico no se ve afectado por valores atípicos como las otras medidas de dispersión. Por esta razón, es una forma confiable de medir la dispersión del 50% medio de los valores en cualquier distribución.

Otras lecturas:

Calculadora de medidas de dispersión de
rango intercuartílico

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Dos términos que los estudiantes a menudo confunden en estadística son error estándar y margen de error . El error…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!