Cómo calcular el rango intercuartil en Python

El rango intercuartil , a menudo denominado «IQR», es una forma de medir la dispersión del 50% medio de un conjunto de datos. Se calcula como la diferencia entre el primer cuartil * (el percentil 25) y el tercer cuartil (el percentil 75) de un conjunto de datos.

Afortunadamente, es fácil calcular el rango intercuartil de un conjunto de datos en Python usando la función numpy.percentile () .

Este tutorial muestra varios ejemplos de cómo utilizar esta función en la práctica.

Ejemplo 1: rango intercuartílico de una matriz

El siguiente código muestra cómo calcular el rango intercuartílico de valores en una sola matriz:

importar numpy como np

#define matriz de datos
datos = np.array ([14, 19, 20, 22, 24, 26, 27, 30, 30, 31, 36, 38, 44, 47])

# calcular el rango intercuartílico  
q3, q1 = np. percentil (datos, [75, 25])
iqr = q3 - q1

#display rango intercuartílico 
iqr

12.25

El rango intercuartílico de este conjunto de datos resulta ser 12,25 . Esta es la dispersión del 50% medio de los valores en este conjunto de datos.

Ejemplo 2: rango intercuartílico de una columna de marco de datos

El siguiente código muestra cómo calcular el rango intercuartil de una sola columna en un marco de datos:

importar numpy como np
 importar pandas como pd

#create marco de datos
df = pd.DataFrame ({'calificación': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'puntos': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'asiste': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebotes': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#calcular el rango intercuartílico de valores en la columna 'puntos' 
q75, q25 = np. percentil (df ​​['puntos'], [75, 25])
iqr = q75 - q25

#display rango intercuartílico 
iqr

5,75

El rango intercuartílico de valores en la columna de puntos resulta ser 5,75 .

Ejemplo 3: rango intercuartílico de múltiples columnas de marcos de datos

El siguiente código muestra cómo calcular el rango intercuartil de varias columnas en un marco de datos a la vez:

importar numpy como np
 importar pandas como pd

#create marco de datos
df = pd.DataFrame ({'calificación': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'puntos': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'asiste': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebotes': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#define función para calcular el rango intercuartílico
 def find_iqr (x):
   return np. restar (* np. percentil (x, [75, 25]))

#calcular IQR para las columnas de 'calificación' y 'puntos'
 df [[' calificación ', ' puntos ']]. aplicar (find_iqr)

puntuación 6.75
puntos 5.75
dtype: float64

#calcular IQR para todas las columnas
 df. aplicar (find_iqr)

puntuación 6.75
puntos 5.75
asiste 2.50
rebotes 3,75
dtype: float64

Nota: Usamos la función pandas.DataFrame.apply () para calcular el IQR para múltiples columnas en el marco de datos anterior.

Recursos adicionales

¿El rango intercuartil (IQR) se ve afectado por valores atípicos?
Cómo calcular el rango intercuartílico (IQR) en la calculadora de rango intercuartílico de Excel

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Cuando realiza un análisis de regresión o ANOVA en R, las tablas de salida contendrán valores p para las variables…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!