Cómo agregar una matriz Numpy a un DataFrame de Pandas

Actualizado el 17 de julio de 2024, por Luis Benites.

Ocasionalmente, es posible que desee agregar una matriz NumPy como una nueva columna a un DataFrame de pandas.

Afortunadamente, puede hacer esto fácilmente usando la siguiente sintaxis:

df [' nueva_columna '] = nombre_matriz. tolist ()

Este tutorial muestra un par de ejemplos de cómo utilizar esta sintaxis en la práctica.

Ejemplo 1: Agregar matriz NumPy como nueva columna en DataFrame

El siguiente código muestra cómo crear un DataFrame de pandas para contener algunas estadísticas para los jugadores de baloncesto y agregar una matriz NumPy como una nueva columna titulada ‘bloques’:

importar numpy como np
 importar pandas como pd

#create pandas DataFrame
df = pd.DataFrame ({' puntos ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' asiste ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebotes ': [11, 8, 10, 6, 6, 5, 9, 12]})

#create NumPy array para 'bloques'
 blocks = np. matriz ([2, 3, 1, 0, 2, 7, 8, 2])

#add 'blocks' array como nueva columna en DataFrame
 df [' blocks '] = blocks. tolist ()

#muestra la impresión de DataFrame
 (df)

   puntos ayuda rebotes bloques
0 25 5 11 2
1 12 7 8 3
2 15 7 10 1
3 14 9 6 0
4 19 12 6 2
5 23 9 5 7
6 25 9 9 8
7 29 4 12 2

Tenga en cuenta que el nuevo DataFrame ahora tiene una columna adicional titulada bloques .

Ejemplo 2: Agregar matriz NumPy como nuevas columnas en DataFrame

El siguiente código muestra cómo crear un DataFrame de pandas para contener algunas estadísticas para los jugadores de baloncesto y agregar una matriz NumPy como una nueva columna titulada ‘bloques’:

importar numpy como np
 importar pandas como pd

#create pandas DataFrame
df = pd.DataFrame ({' puntos ': [25, 12, 15, 14, 19, 23

#create NumPy matrix
 mat = np.matrix ([[2, 3],
                 [1, 0],
                 [2, 7],
                 [8, 2],
                 [3, 4],
                 [7, 7],
                 [7, 5],
                 [6, 3]])

#add NumPy matrix como nuevas columnas en DataFrame
 df_new = pd. concat ([df, pd.DataFrame (mat)], axis = 1 )

#display new DataFrame
 print (df_new)

   puntos asiste rebotes 0 1
0 25 5 11 2 3
1 12 7 8 1 0
2 15 7 10 2 7
3 14 9 6 8 2
4 19 12 6 3 4
5 23 9 5 7 7
6 25 9 9 7 5
7 29 4 12 6 3

Tenga en cuenta que los nombres de las columnas para la matriz que agregamos al DataFrame reciben los nombres de columna predeterminados de 0 y 1 .

Podemos cambiar fácilmente el nombre de estas columnas usando la función df.columns :

# 
cambiar el nombre de las columnas df_new. columnas = ['pts', 'ast', 'rebs', 'new1', 'new2']

#display DataFrame 
print (df_new)
 
   pts ast rebs new1 new2
0 25 5 11 2 3
1 12 7 8 1 0
2 15 7 10 2 7
3 14 9 6 8 2
4 19 12 6 3 4
5 23 9 5 7 7
6 25 9 9 7 5
7 29 4 12 6 3

Recursos adicionales

Cómo apilar múltiples marcos de datos de Pandas
Cómo combinar dos marcos de datos de Pandas en el índice
Cómo cambiar el nombre de las columnas en Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

En estadística, a menudo usamos el coeficiente de correlación de Pearson para medir la relación lineal entre dos variables. Sin…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!