A menudo, puede estar interesado en contar solo la cantidad de filas en un DataFrame de pandas que cumplen con algunos criterios.
Afortunadamente, esto es fácil de hacer usando la siguiente sintaxis básica:
suma (df. nombre_columna == algún_valor )
Los siguientes ejemplos muestran cómo utilizar esta sintaxis en la práctica en el siguiente marco de datos:
importar pandas como pd #create DataFrame df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13], ' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]}) #ver jefe de DataFrame df. cabeza () x y 0 3 3 1 4 4 2 5 5 3 6 7 4 7 9
Ejemplo 1: contar filas iguales a algún valor
El siguiente código muestra cómo contar el número de filas donde la variable x es igual a 10:
suma (gl. x == 10 ) 2
El siguiente código muestra cómo contar el número de filas donde la variable x es igual a 10 o la variable y es igual a 5:
suma ((gl. x == 10 ) | (gl. y == 5 )) 3
El siguiente código muestra cómo contar el número de filas donde la variable x no es igual a 10:
suma (gl. x ! = 10 ) 9
Ejemplo 2: contar filas mayores o iguales a algún valor
El siguiente código muestra cómo contar el número de filas donde x es mayor que 10:
suma (gl. x > 10 ) 2
El siguiente código muestra cómo contar el número de filas donde x es menor o igual que 7:
suma (gl. x <= 7 ) 5
Ejemplo 3: contar filas entre dos valores
El siguiente código muestra cómo contar el número de filas donde x está entre 10 y 20:
suma ((gl. x > = 5 ) & (gl. x <= 10 )) 7
Recursos adicionales
Pandas: cómo encontrar la diferencia entre dos filas
Pandas: cómo eliminar filas que contienen una cadena específica
Pandas: cómo eliminar filas duplicadas en un marco de datos
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/