Contenido de este artículo
- 0
- 0
- 0
- 0
Ocasionalmente, es posible que desee crear un DataFrame de pandas a partir de una matriz NumPy. Afortunadamente, esto es fácil de hacer con la siguiente sintaxis:
#create NumPy array data = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]]) #convertir la matriz NumPy a pandas DataFrame df = pd. DataFrame (datos = datos)
Este tutorial proporciona un ejemplo de cómo crear un DataFrame de pandas a partir de una matriz NumPy en la práctica.
Cree Pandas DataFrame a partir de una matriz NumPy
Supongamos que tenemos la siguiente matriz NumPy:
importar numpy como np #create matriz NumPy datos = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]]) #print clase de impresión de matriz NumPy (tipo (datos)) <clase 'numpy.ndarray'>
Podemos usar la siguiente sintaxis para crear un DataFrame de pandas a partir de la matriz:
importar pandas como pd #convertir matriz NumPy a pandas DataFrame gl = pd. DataFrame (datos = datos) #print DataFrame imprimir (df) 0 1 2 3 4 0 1 7 6 5 6 1 4 4 4 3 1 #print clase de impresión DataFrame (tipo (df)) <clase 'pandas.core.frame.DataFrame'>
Especificar manualmente los nombres de filas y columnas
Podemos especificar nombres de fila para el DataFrame de pandas usando el argumento de índice y los nombres de columna usando el argumento de columnas :
#convierta la matriz NumPy a pandas DataFrame y especifique filas y columnas
df = pd. DataFrame (datos = datos, índice = ["r1", "r2"], columnas = ["A", "B", "C", "D", "E"])
#imprima el DataFrame
imprimir (df)
A B C D E
r1 1 7 6 5 6
r2 4 4 4 3 1
Especificar automáticamente nombres de filas y columnas
Si la matriz NumPy es bastante grande, puede que no sea razonable especificar manualmente cada nombre de fila y columna. En este caso, podríamos usar un bucle for simple para especificar nombres de filas y columnas.
El siguiente código muestra cómo hacerlo:
#create la matriz NumPy con 100 valores
data = np. arange (0,100,1). remodelar (20,5)
#print NumPy array
print (datos)
[[0 1 2 3 4]
[5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]
[20 21 22 23 24]
[25 26 27 28 29]
[30 31 32 33 34]
[35 36 37 38 39]
[40 41 42 43 44]
[45 46 47 48 49]
[50 51 52 53 54]
[55 56 57 58 59]
[60 61 62 63 64]
[65 66 67 68 69]
[70 71 72 73 74]
[75 76 77 78 79]
[80 81 82 83 84]
[85 86 87 88 89]
[90 91 92 93 94]
[95 96 97 98 99]]
#convierta a pandas DataFrame y especifique automáticamente los nombres de filas y columnas
df = pd. DataFrame (datos = datos [0:, 0:],
índice = [i para i en el rango (datos. forma [0])],
columnas = ['col' + str (i) para i en el rango (datos. forma [1])])
#print DataFrame
imprimir (df)
col0 col1 col2 col3 col4
0 0 1 2 3 4
1 5 6 7 8 9
2 10 11 12 13 14
3 15 16 17 18 19
4 20 21 22 23 24
5 25 26 27 28 29
6 30 31 32 33 34
7 35 36 37 38 39
8 40 41 42 43 44
9 45 46 47 48 49
10 50 51 52 53 54
11 55 56 57 58 59
12 60 61 62 63 64
13 65 66 67 68 69
14 70 71 72 73 74
15 75 76 77 78 79
16 80 81 82 83 84
17 85 86 87 88 89
18 90 91 92 93 94
19 95 96 97 98 99
Podemos confirmar rápidamente la clase del DataFrame junto con la forma:
#print clase de impresión DataFrame (tipo (df)) <clase 'pandas.core.frame.DataFrame'> #imprima el número de filas y columnas de DataFrame df. forma (20, 5)
Recursos adicionales
Cómo agregar una matriz Numpy a un DataFrame de Pandas
Cómo soltar la columna de índice en Pandas
Pandas: seleccione las filas donde aparece el valor en cualquier columna
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: