Contenido de este artículo
En estadística, los deciles son números que dividen un conjunto de datos en diez grupos de igual frecuencia.
El primer decil es el punto donde el 10% de todos los valores de datos se encuentran por debajo de él. El segundo decil es el punto donde el 20% de todos los valores de datos se encuentran por debajo de él, y así sucesivamente.
Podemos usar la siguiente sintaxis para calcular los deciles de un conjunto de datos en Python:
importar numpy como np notario público. percentil (var, np. rango (0, 100, 10))
El siguiente ejemplo muestra cómo utilizar esta función en la práctica.
Ejemplo: calcular deciles en Python
El siguiente código muestra cómo crear un conjunto de datos falso con 20 valores y luego calcular los valores para los deciles del conjunto de datos:
importar numpy como np #create data data = np. matriz ([56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99]) #calcular deciles de datos np. percentil (datos, np. rango (0, 100, 10)) matriz ([56., 63,4, 67,8, 76,5, 83,6, 88,5, 90,4, 92,3, 93,2, 95,2])
La forma de interpretar los deciles es la siguiente:
- El 10% de todos los valores de datos se encuentran por debajo de 63,4
- El 20% de todos los valores de datos se encuentran por debajo de 67,8 .
- El 30% de todos los valores de datos se encuentran por debajo de 76,5 .
- El 40% de todos los valores de datos se encuentran por debajo de 83,6 .
- El 50% de todos los valores de datos se encuentran por debajo de 88,5 .
- El 60% de todos los valores de los datos se encuentran por debajo de 90,4 .
- El 70% de todos los valores de los datos se encuentran por debajo de 92,3 .
- El 80% de todos los valores de datos se encuentran por debajo de 93,2 .
- El 90% de todos los valores de los datos se encuentran por debajo de 95,2 .
Tenga en cuenta que el primer valor en la salida (56) simplemente denota el valor mínimo en el conjunto de datos.
Ejemplo: colocar valores en deciles en Python
Para colocar cada valor de datos en un decil, podemos usar la función qcut pandas.
A continuación, se explica cómo utilizar esta función para el conjunto de datos que creamos en el ejemplo anterior:
importar pandas como pd #create data frame df = pd. DataFrame ({' valores ': [56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99]}) # calcular el decil de cada valor en el marco de datos df [' Decil '] = pd. qcut (df [' valores '], 10, etiquetas = Falso ) #display marco de datos df valores Decil 0 56 0 1 58 0 2 64 1 3 67 1 4 68 2 5 73 2 6 78 3 7 83 3 8 84 4 9 88 4 10 89 5 11 90 5 12 91 6 13 92 6 14 93 7 15 93 7 16 94 8 17 95 8 18 97 9 19 99 9
La forma de interpretar la salida es la siguiente:
- El valor de los datos 56 cae entre el percentil 0% y el 10%, por lo que cae en el decil 0 .
- El valor de los datos 58 cae entre el percentil 0% y el 10%, por lo que cae en el decil 0 .
- El valor de los datos 64 cae entre el percentil 10% y el 20%, por lo que cae en el decil 1 .
- El valor de los datos 67 cae entre el percentil 10% y el 20%, por lo que cae del decil 1 .
- El valor de los datos 68 se encuentra entre el percentil 20% y el 30%, por lo que cae del decil 2 .
Y así.
Recursos adicionales
Cómo calcular percentiles en Python
Cómo calcular el rango intercuartil en Python
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: