Contenido de este artículo
- 0
- 0
- 0
- 0
A menudo, es posible que desee seleccionar las filas de un DataFrame de pandas en función de su valor de índice.
Si desea seleccionar filas según la indexación de enteros, puede usar la función .iloc .
Si desea seleccionar filas según la indexación de etiquetas, puede usar la función .loc .
Este tutorial proporciona un ejemplo de cómo utilizar cada una de estas funciones en la práctica.
Ejemplo 1: seleccionar filas según la indexación de enteros
El siguiente código muestra cómo crear un DataFrame de pandas y usar .iloc para seleccionar la fila con un valor entero de índice de 3 :
importar pandas como pd importar numpy como np #Haga que este ejemplo sea reproducible np. al azar . semilla (0) #create DataFrame df = pd. Trama de datos (np. Aleatorio . Rand (6,2), índice = rango (0,18,3), columnas = [ ' A ', ' B ']) #view trama de datos df A B 0 0,548814 0,715189 3 0,602763 0,544883 6 0,423655 0,645894 9 0,437587 0,891773 12 0,963663 0,383442 15 0,791725 0,528895 #seleccione la quinta fila del DataFrame df. iloc [[4]] A B 12 0,963663 0,383442
Podemos usar una sintaxis similar para seleccionar varias filas:
#seleccione las filas 3, 4 y 5 del DataFrame df. iloc [[2, 3, 4]] A B 6 0,423655 0,645894 9 0,437587 0,891773 12 0,963663 0,383442
O podríamos seleccionar todas las filas en un rango:
#seleccione las filas 3, 4 y 5 del DataFrame df. iloc [2: 5] A B 6 0,423655 0,645894 9 0,437587 0,891773 12 0,963663 0,383442
Ejemplo 2: Seleccionar filas según la indexación de etiquetas
El siguiente código muestra cómo crear un DataFrame de pandas y usar .loc para seleccionar la fila con una etiqueta de índice de 3 :
importar pandas como pd importar numpy como np #Haga que este ejemplo sea reproducible np. al azar . semilla (0) #create DataFrame df = pd. Trama de datos (np. Aleatorio . Rand (6,2), índice = rango (0,18,3), columnas = [ ' A ', ' B ']) #view DataFrame df A B 0 0,548814 0,715189 3 0,602763 0,544883 6 0,423655 0,645894 9 0,437587 0,891773 12 0,963663 0,383442 15 0,791725 0,528895 #seleccione la fila con la etiqueta de índice '3' df. loc [[3]] A B 3 0,602763 0,544883
Podemos usar una sintaxis similar para seleccionar varias filas con diferentes etiquetas de índice:
#seleccione las filas con etiquetas de índice '3', '6' y '9' df. loc [[3, 6, 9]] A B 3 0,602763 0,544883 6 0,423655 0,645894 9 0,437587 0,891773
La diferencia entre .iloc y .loc
Los ejemplos anteriores ilustran la sutil diferencia entre .iloc y .loc :
- .iloc selecciona filas basándose en un índice entero . Entonces, si desea seleccionar la quinta fila en un DataFrame, usaría df.iloc [[4]] ya que la primera fila está en el índice 0, la segunda fila está en el índice 1, y así sucesivamente.
- .loc selecciona filas basándose en un índice etiquetado . Entonces, si desea seleccionar la fila con una etiqueta de índice de 5, debe usar directamente df.loc [[5]].
Recursos adicionales
Cómo obtener números de fila en un DataFrame de Pandas
Cómo soltar filas con valores NaN en Pandas
Cómo soltar la columna de índice en Pandas
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: