Contenido de este artículo
- 0
- 0
- 0
- 0
El rango intercuartil , a menudo denominado «IQR», es una forma de medir la dispersión del 50% medio de un conjunto de datos. Se calcula como la diferencia entre el primer cuartil * (el percentil 25) y el tercer cuartil (el percentil 75) de un conjunto de datos.
Afortunadamente, es fácil calcular el rango intercuartil de un conjunto de datos en Python usando la función numpy.percentile () .
Este tutorial muestra varios ejemplos de cómo utilizar esta función en la práctica.
Ejemplo 1: rango intercuartílico de una matriz
El siguiente código muestra cómo calcular el rango intercuartílico de valores en una sola matriz:
importar numpy como np #define matriz de datos datos = np.array ([14, 19, 20, 22, 24, 26, 27, 30, 30, 31, 36, 38, 44, 47]) # calcular el rango intercuartílico q3, q1 = np. percentil (datos, [75, 25]) iqr = q3 - q1 #display rango intercuartílico iqr 12.25
El rango intercuartílico de este conjunto de datos resulta ser 12,25 . Esta es la dispersión del 50% medio de los valores en este conjunto de datos.
Ejemplo 2: rango intercuartílico de una columna de marco de datos
El siguiente código muestra cómo calcular el rango intercuartil de una sola columna en un marco de datos:
importar numpy como np importar pandas como pd #create marco de datos df = pd.DataFrame ({'calificación': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'puntos': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'asiste': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebotes': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #calcular el rango intercuartílico de valores en la columna 'puntos' q75, q25 = np. percentil (df ['puntos'], [75, 25]) iqr = q75 - q25 #display rango intercuartílico iqr 5,75
El rango intercuartílico de valores en la columna de puntos resulta ser 5,75 .
Ejemplo 3: rango intercuartílico de múltiples columnas de marcos de datos
El siguiente código muestra cómo calcular el rango intercuartil de varias columnas en un marco de datos a la vez:
importar numpy como np importar pandas como pd #create marco de datos df = pd.DataFrame ({'calificación': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'puntos': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'asiste': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebotes': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #define función para calcular el rango intercuartílico def find_iqr (x): return np. restar (* np. percentil (x, [75, 25])) #calcular IQR para las columnas de 'calificación' y 'puntos' df [[' calificación ', ' puntos ']]. aplicar (find_iqr) puntuación 6.75 puntos 5.75 dtype: float64 #calcular IQR para todas las columnas df. aplicar (find_iqr) puntuación 6.75 puntos 5.75 asiste 2.50 rebotes 3,75 dtype: float64
Nota: Usamos la función pandas.DataFrame.apply () para calcular el IQR para múltiples columnas en el marco de datos anterior.
Recursos adicionales
¿El rango intercuartil (IQR) se ve afectado por valores atípicos?
Cómo calcular el rango intercuartílico (IQR) en la calculadora de rango intercuartílico de Excel
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: