Cómo filtrar un DataFrame de Pandas por valores de columna

La forma más sencilla de filtrar un DataFrame de pandas por valores de columna es usar la función de consulta .

Este tutorial proporciona varios ejemplos de cómo usar esta función en la práctica con los siguientes pandas DataFrame:

importar pandas como pd

#create DataFrame 
df = pd. DataFrame ({'equipo': ['A', 'A', 'B', 'B', 'C'],
                   'puntos': [25, 12, 15, 14, 19],
                   'asiste': [5, 7, 7, 9, 12],
                   'rebotes': [11, 8, 10, 6, 6]})

#view DataFrame 
df

        puntos de equipo ayuda a rebotes
0 A 25 5 11
1 A 12 7 8
2 B 15 7 10
3 B 14 9 6
4 C 19 12 6

Ejemplo 1: filtro basado en una columna

El siguiente código muestra cómo filtrar las filas del DataFrame en función de un solo valor en la columna «puntos»:

df. consulta (' puntos == 15 ')

     puntos de equipo ayuda a rebotes
2 B 15 7 10

Ejemplo 2: filtro basado en varias columnas

El siguiente código muestra cómo filtrar las filas del DataFrame en función de varios valores en diferentes columnas:

#Return filas donde los puntos son iguales a 15 o 14 
df. consulta (' puntos == 15 | puntos == 14 ')

     puntos de equipo ayuda a rebotes
2 B 15 7 10
3 B 14 9 6

#Return filas donde los puntos son mayores que 13 y los rebotes son mayores que 6
 gl. consulta (' puntos> 13 y puntos> 6 ')

     puntos de equipo ayuda a rebotes
0 A 25 5 11
2 B 15 7 10

Ejemplo 3: filtro basado en valores en una lista

El siguiente código muestra cómo filtrar las filas del DataFrame según los valores de una lista

#definir lista de valores
 value_list = [12, 19, 25]

 #volver filas donde los puntos están en la lista de valores
 df. query (' puntos en @value_list ')

     puntos de equipo ayuda a rebotes
0 A 25 5 11
1 A 12 7 8
4 C 19 12 6

#retornar filas donde los puntos no están en la lista de valores 
df. query (' puntos que no están en @value_list ')

     puntos de equipo ayuda a rebotes
2 B 15 7 10
3 B 14 9 6

Recursos adicionales

Cómo reemplazar valores en Pandas
Cómo eliminar filas con valores NaN en Pandas
Cómo eliminar filas duplicadas en Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba de independencia de chi-cuadrado para determinar si existe o no una asociación significativa entre dos variables…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!