Contenido de este artículo
- 0
- 0
- 0
- 0
En estadística, los deciles son números que dividen un conjunto de datos en diez grupos de igual frecuencia.
El primer decil es el punto donde el 10% de todos los valores de datos se encuentran por debajo de él. El segundo decil es el punto donde el 20% de todos los valores de datos se encuentran por debajo de él, y así sucesivamente.
Podemos usar la siguiente sintaxis para calcular los deciles de un conjunto de datos en Python:
importar numpy como np notario público. percentil (var, np. rango (0, 100, 10))
El siguiente ejemplo muestra cómo utilizar esta función en la práctica.
Ejemplo: calcular deciles en Python
El siguiente código muestra cómo crear un conjunto de datos falso con 20 valores y luego calcular los valores para los deciles del conjunto de datos:
importar numpy como np
#create data
data = np. matriz ([56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99])
#calcular deciles de datos
np. percentil (datos, np. rango (0, 100, 10))
matriz ([56., 63,4, 67,8, 76,5, 83,6, 88,5, 90,4, 92,3, 93,2, 95,2])
La forma de interpretar los deciles es la siguiente:
- El 10% de todos los valores de datos se encuentran por debajo de 63,4
- El 20% de todos los valores de datos se encuentran por debajo de 67,8 .
- El 30% de todos los valores de datos se encuentran por debajo de 76,5 .
- El 40% de todos los valores de datos se encuentran por debajo de 83,6 .
- El 50% de todos los valores de datos se encuentran por debajo de 88,5 .
- El 60% de todos los valores de los datos se encuentran por debajo de 90,4 .
- El 70% de todos los valores de los datos se encuentran por debajo de 92,3 .
- El 80% de todos los valores de datos se encuentran por debajo de 93,2 .
- El 90% de todos los valores de los datos se encuentran por debajo de 95,2 .
Tenga en cuenta que el primer valor en la salida (56) simplemente denota el valor mínimo en el conjunto de datos.
Ejemplo: colocar valores en deciles en Python
Para colocar cada valor de datos en un decil, podemos usar la función qcut pandas.
A continuación, se explica cómo utilizar esta función para el conjunto de datos que creamos en el ejemplo anterior:
importar pandas como pd
#create data frame
df = pd. DataFrame ({' valores ': [56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99]})
# calcular el decil de cada valor en el marco de datos
df [' Decil '] = pd. qcut (df [' valores '], 10, etiquetas = Falso )
#display marco de datos
df
valores Decil
0 56 0
1 58 0
2 64 1
3 67 1
4 68 2
5 73 2
6 78 3
7 83 3
8 84 4
9 88 4
10 89 5
11 90 5
12 91 6
13 92 6
14 93 7
15 93 7
16 94 8
17 95 8
18 97 9
19 99 9
La forma de interpretar la salida es la siguiente:
- El valor de los datos 56 cae entre el percentil 0% y el 10%, por lo que cae en el decil 0 .
- El valor de los datos 58 cae entre el percentil 0% y el 10%, por lo que cae en el decil 0 .
- El valor de los datos 64 cae entre el percentil 10% y el 20%, por lo que cae en el decil 1 .
- El valor de los datos 67 cae entre el percentil 10% y el 20%, por lo que cae del decil 1 .
- El valor de los datos 68 se encuentra entre el percentil 20% y el 30%, por lo que cae del decil 2 .
Y así.
Recursos adicionales
Cómo calcular percentiles en Python
Cómo calcular el rango intercuartil en Python
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: