Contenido de este artículo
- 0
- 0
- 0
- 0
Actualizado el 7 de mayo de 2021, por Luis Benites.
A menudo, es posible que desee comparar dos columnas en un Pandas DataFrame y escribir los resultados de la comparación en una tercera columna.
Puede hacer esto fácilmente usando la siguiente sintaxis:
condiciones = [(condición1), (condición2)] elecciones = [" elección1 ", " elección2 "] df [" new_column_name "] = np. seleccionar (condiciones, opciones, predeterminado)
Esto es lo que hace este código:
- Las condiciones son las condiciones que se deben verificar entre las dos columnas.
- Las opciones son los resultados que se devolverán según las condiciones.
- np.select se usa para devolver los resultados a la nueva columna
El siguiente ejemplo muestra cómo utilizar este código en la práctica.
Ejemplo: comparar dos columnas en pandas
Supongamos que tenemos el siguiente DataFrame que muestra el número de goles marcados por dos equipos de fútbol en cinco partidos diferentes:
importar numpy como np
importar pandas como pd
#create DataFrame
df = pd. DataFrame ({' A_points ': [1, 3, 3, 3, 5],
' B_points ': [4, 5, 2, 3, 2]})
#view DataFrame
df
A_points B_points
0 1 4
1 3 5
2 3 2
3 3 3
4 5 2
Podemos usar el siguiente código para comparar el número de goles por fila y mostrar el ganador del partido en una tercera columna:
#definir condiciones
condiciones = [df [' A_points ']> df [' B_points '],
df [' A_points '] <df [' B_points ']]
#definir opciones
opciones = [' A ', ' B ']
# crear una nueva columna en DataFrame que muestre los resultados de las comparaciones
df [' ganador '] = np. seleccionar (condiciones, opciones, predeterminado = ' Empate ')
#ver el DataFrame
df
Ganador de A_points B_points
0 1 4 B
1 3 5 B
2 3 2 A
3 3 3 Corbata
4 5 2 A
Los resultados de la comparación se muestran en la nueva columna denominada ganador .
Notas
Aquí hay algunas cosas a tener en cuenta al comparar dos columnas en un DataFrame de pandas:
- El número de condiciones y opciones debe ser igual.
- El valor predeterminado especifica el valor que se mostrará en la nueva columna si no se cumple ninguna de las condiciones.
- Se requieren tanto NumPy como Pandas para que este código funcione.
Puede encontrar más tutoriales de Python aquí .
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: