Cómo agregar una matriz Numpy a un DataFrame de Pandas

Actualizado por ultima vez el 7 de mayo de 2021, por .

Ocasionalmente, es posible que desee agregar una matriz NumPy como una nueva columna a un DataFrame de pandas.

Afortunadamente, puede hacer esto fácilmente usando la siguiente sintaxis:

df [' nueva_columna '] = nombre_matriz. tolist ()

Este tutorial muestra un par de ejemplos de cómo utilizar esta sintaxis en la práctica.

Ejemplo 1: Agregar matriz NumPy como nueva columna en DataFrame

El siguiente código muestra cómo crear un DataFrame de pandas para contener algunas estadísticas para los jugadores de baloncesto y agregar una matriz NumPy como una nueva columna titulada ‘bloques’:

importar numpy como np
 importar pandas como pd

#create pandas DataFrame
df = pd.DataFrame ({' puntos ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' asiste ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebotes ': [11, 8, 10, 6, 6, 5, 9, 12]})

#create NumPy array para 'bloques'
 blocks = np. matriz ([2, 3, 1, 0, 2, 7, 8, 2])

#add 'blocks' array como nueva columna en DataFrame
 df [' blocks '] = blocks. tolist ()

#muestra la impresión de DataFrame
 (df)

   puntos ayuda rebotes bloques
0 25 5 11 2
1 12 7 8 3
2 15 7 10 1
3 14 9 6 0
4 19 12 6 2
5 23 9 5 7
6 25 9 9 8
7 29 4 12 2

Tenga en cuenta que el nuevo DataFrame ahora tiene una columna adicional titulada bloques .

Ejemplo 2: Agregar matriz NumPy como nuevas columnas en DataFrame

El siguiente código muestra cómo crear un DataFrame de pandas para contener algunas estadísticas para los jugadores de baloncesto y agregar una matriz NumPy como una nueva columna titulada ‘bloques’:

importar numpy como np
 importar pandas como pd

#create pandas DataFrame
df = pd.DataFrame ({' puntos ': [25, 12, 15, 14, 19, 23

#create NumPy matrix
 mat = np.matrix ([[2, 3],
                 [1, 0],
                 [2, 7],
                 [8, 2],
                 [3, 4],
                 [7, 7],
                 [7, 5],
                 [6, 3]])

#add NumPy matrix como nuevas columnas en DataFrame
 df_new = pd. concat ([df, pd.DataFrame (mat)], axis = 1 )

#display new DataFrame
 print (df_new)

   puntos asiste rebotes 0 1
0 25 5 11 2 3
1 12 7 8 1 0
2 15 7 10 2 7
3 14 9 6 8 2
4 19 12 6 3 4
5 23 9 5 7 7
6 25 9 9 7 5
7 29 4 12 6 3

Tenga en cuenta que los nombres de las columnas para la matriz que agregamos al DataFrame reciben los nombres de columna predeterminados de 0 y 1 .

Podemos cambiar fácilmente el nombre de estas columnas usando la función df.columns :

# 
cambiar el nombre de las columnas df_new. columnas = ['pts', 'ast', 'rebs', 'new1', 'new2']

#display DataFrame 
print (df_new)
 
   pts ast rebs new1 new2
0 25 5 11 2 3
1 12 7 8 1 0
2 15 7 10 2 7
3 14 9 6 8 2
4 19 12 6 3 4
5 23 9 5 7 7
6 25 9 9 7 5
7 29 4 12 6 3

Recursos adicionales

Cómo apilar múltiples marcos de datos de Pandas
Cómo combinar dos marcos de datos de Pandas en el índice
Cómo cambiar el nombre de las columnas en Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, a menudo usamos el coeficiente de correlación de Pearson para medir la relación lineal entre dos variables. Sin…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!