Cómo crear un DataFrame de Pandas a partir de una matriz NumPy

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Ocasionalmente, es posible que desee crear un DataFrame de pandas a partir de una matriz NumPy. Afortunadamente, esto es fácil de hacer con la siguiente sintaxis:

#create NumPy array
 data = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]])

#convertir la matriz NumPy a pandas DataFrame
 df = pd. DataFrame (datos = datos)

Este tutorial proporciona un ejemplo de cómo crear un DataFrame de pandas a partir de una matriz NumPy en la práctica.

Cree Pandas DataFrame a partir de una matriz NumPy

Supongamos que tenemos la siguiente matriz NumPy:

importar numpy como np

#create matriz NumPy
datos = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]])

#print clase de impresión de matriz NumPy
 (tipo (datos))

<clase 'numpy.ndarray'>

Podemos usar la siguiente sintaxis para crear un DataFrame de pandas a partir de la matriz:

importar pandas como pd

#convertir matriz NumPy a pandas DataFrame
gl = pd. DataFrame (datos = datos)

#print DataFrame
imprimir (df)

   0 1 2 3 4
0 1 7 6 5 6
1 4 4 4 3 1

#print clase de 
impresión DataFrame (tipo (df))

<clase 'pandas.core.frame.DataFrame'>

Especificar manualmente los nombres de filas y columnas

Podemos especificar nombres de fila para el DataFrame de pandas usando el argumento de índice y los nombres de columna usando el argumento de columnas :

#convierta la matriz NumPy a pandas DataFrame y especifique filas y columnas
 df = pd. DataFrame (datos = datos, índice = ["r1", "r2"], columnas = ["A", "B", "C", "D", "E"])

#imprima el DataFrame
imprimir (df)

    A B C D E
r1 1 7 6 5 6
r2 4 4 4 3 1

Especificar automáticamente nombres de filas y columnas

Si la matriz NumPy es bastante grande, puede que no sea razonable especificar manualmente cada nombre de fila y columna. En este caso, podríamos usar un bucle for simple para especificar nombres de filas y columnas.

El siguiente código muestra cómo hacerlo:

#create la matriz NumPy con 100 valores
 data = np. arange (0,100,1). remodelar (20,5)

#print NumPy array 
print (datos)

[[0 1 2 3 4]
 [5 6 7 8 9]
 [10 11 12 13 14]
 [15 16 17 18 19]
 [20 21 22 23 24]
 [25 26 27 28 29]
 [30 31 32 33 34]
 [35 36 37 38 39]
 [40 41 42 43 44]
 [45 46 47 48 49]
 [50 51 52 53 54]
 [55 56 57 58 59]
 [60 61 62 63 64]
 [65 66 67 68 69]
 [70 71 72 73 74]
 [75 76 77 78 79]
 [80 81 82 83 84]
 [85 86 87 88 89]
 [90 91 92 93 94]
 [95 96 97 98 99]]

#convierta a pandas DataFrame y especifique automáticamente los nombres de filas y columnas
 df = pd. DataFrame (datos = datos [0:, 0:],
                índice = [i para i en el rango (datos. forma [0])],
                columnas = ['col' + str (i) para i en el rango (datos. forma [1])])

#print DataFrame 
imprimir (df)

    col0 col1 col2 col3 col4
0 0 1 2 3 4
1 5 6 7 8 9
2 10 11 12 13 14
3 15 16 17 18 19
4 20 21 22 23 24
5 25 26 27 28 29
6 30 31 32 33 34
7 35 36 37 38 39
8 40 41 42 43 44
9 45 46 47 48 49
10 50 51 52 53 54
11 55 56 57 58 59
12 60 61 62 63 64
13 65 66 67 68 69
14 70 71 72 73 74
15 75 76 77 78 79
16 80 81 82 83 84
17 85 86 87 88 89
18 90 91 92 93 94
19 95 96 97 98 99

Podemos confirmar rápidamente la clase del DataFrame junto con la forma:

#print clase de impresión DataFrame
 (tipo (df))

<clase 'pandas.core.frame.DataFrame'>

#imprima el número de filas y columnas de DataFrame 
df. forma

(20, 5)

Recursos adicionales

Cómo agregar una matriz Numpy a un DataFrame de Pandas
Cómo soltar la columna de índice en Pandas
Pandas: seleccione las filas donde aparece el valor en cualquier columna

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

En estadística, a menudo usamos el coeficiente de correlación de Pearson para medir la relación lineal entre dos variables. Sin…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!