Cómo filtrar un DataFrame de Pandas por valores de columna

La forma más sencilla de filtrar un DataFrame de pandas por valores de columna es usar la función de consulta .

Este tutorial proporciona varios ejemplos de cómo usar esta función en la práctica con los siguientes pandas DataFrame:

importar pandas como pd

#create DataFrame 
df = pd. DataFrame ({'equipo': ['A', 'A', 'B', 'B', 'C'],
                   'puntos': [25, 12, 15, 14, 19],
                   'asiste': [5, 7, 7, 9, 12],
                   'rebotes': [11, 8, 10, 6, 6]})

#view DataFrame 
df

        puntos de equipo ayuda a rebotes
0 A 25 5 11
1 A 12 7 8
2 B 15 7 10
3 B 14 9 6
4 C 19 12 6

Ejemplo 1: filtro basado en una columna

El siguiente código muestra cómo filtrar las filas del DataFrame en función de un solo valor en la columna «puntos»:

df. consulta (' puntos == 15 ')

     puntos de equipo ayuda a rebotes
2 B 15 7 10

Ejemplo 2: filtro basado en varias columnas

El siguiente código muestra cómo filtrar las filas del DataFrame en función de varios valores en diferentes columnas:

#Return filas donde los puntos son iguales a 15 o 14 
df. consulta (' puntos == 15 | puntos == 14 ')

     puntos de equipo ayuda a rebotes
2 B 15 7 10
3 B 14 9 6

#Return filas donde los puntos son mayores que 13 y los rebotes son mayores que 6
 gl. consulta (' puntos> 13 y puntos> 6 ')

     puntos de equipo ayuda a rebotes
0 A 25 5 11
2 B 15 7 10

Ejemplo 3: filtro basado en valores en una lista

El siguiente código muestra cómo filtrar las filas del DataFrame según los valores de una lista

#definir lista de valores
 value_list = [12, 19, 25]

 #volver filas donde los puntos están en la lista de valores
 df. query (' puntos en @value_list ')

     puntos de equipo ayuda a rebotes
0 A 25 5 11
1 A 12 7 8
4 C 19 12 6

#retornar filas donde los puntos no están en la lista de valores 
df. query (' puntos que no están en @value_list ')

     puntos de equipo ayuda a rebotes
2 B 15 7 10
3 B 14 9 6

Recursos adicionales

Cómo reemplazar valores en Pandas
Cómo eliminar filas con valores NaN en Pandas
Cómo eliminar filas duplicadas en Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

Se utiliza una prueba de independencia de chi-cuadrado para determinar si existe o no una asociación significativa entre dos variables…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!