Contenido de este artículo
- 0
- 0
- 0
- 0
Ocasionalmente, es posible que desee crear un DataFrame de pandas a partir de una matriz NumPy. Afortunadamente, esto es fácil de hacer con la siguiente sintaxis:
#create NumPy array data = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]]) #convertir la matriz NumPy a pandas DataFrame df = pd. DataFrame (datos = datos)
Este tutorial proporciona un ejemplo de cómo crear un DataFrame de pandas a partir de una matriz NumPy en la práctica.
Cree Pandas DataFrame a partir de una matriz NumPy
Supongamos que tenemos la siguiente matriz NumPy:
importar numpy como np #create matriz NumPy datos = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]]) #print clase de impresión de matriz NumPy (tipo (datos)) <clase 'numpy.ndarray'>
Podemos usar la siguiente sintaxis para crear un DataFrame de pandas a partir de la matriz:
importar pandas como pd #convertir matriz NumPy a pandas DataFrame gl = pd. DataFrame (datos = datos) #print DataFrame imprimir (df) 0 1 2 3 4 0 1 7 6 5 6 1 4 4 4 3 1 #print clase de impresión DataFrame (tipo (df)) <clase 'pandas.core.frame.DataFrame'>
Especificar manualmente los nombres de filas y columnas
Podemos especificar nombres de fila para el DataFrame de pandas usando el argumento de índice y los nombres de columna usando el argumento de columnas :
#convierta la matriz NumPy a pandas DataFrame y especifique filas y columnas df = pd. DataFrame (datos = datos, índice = ["r1", "r2"], columnas = ["A", "B", "C", "D", "E"]) #imprima el DataFrame imprimir (df) A B C D E r1 1 7 6 5 6 r2 4 4 4 3 1
Especificar automáticamente nombres de filas y columnas
Si la matriz NumPy es bastante grande, puede que no sea razonable especificar manualmente cada nombre de fila y columna. En este caso, podríamos usar un bucle for simple para especificar nombres de filas y columnas.
El siguiente código muestra cómo hacerlo:
#create la matriz NumPy con 100 valores data = np. arange (0,100,1). remodelar (20,5) #print NumPy array print (datos) [[0 1 2 3 4] [5 6 7 8 9] [10 11 12 13 14] [15 16 17 18 19] [20 21 22 23 24] [25 26 27 28 29] [30 31 32 33 34] [35 36 37 38 39] [40 41 42 43 44] [45 46 47 48 49] [50 51 52 53 54] [55 56 57 58 59] [60 61 62 63 64] [65 66 67 68 69] [70 71 72 73 74] [75 76 77 78 79] [80 81 82 83 84] [85 86 87 88 89] [90 91 92 93 94] [95 96 97 98 99]] #convierta a pandas DataFrame y especifique automáticamente los nombres de filas y columnas df = pd. DataFrame (datos = datos [0:, 0:], índice = [i para i en el rango (datos. forma [0])], columnas = ['col' + str (i) para i en el rango (datos. forma [1])]) #print DataFrame imprimir (df) col0 col1 col2 col3 col4 0 0 1 2 3 4 1 5 6 7 8 9 2 10 11 12 13 14 3 15 16 17 18 19 4 20 21 22 23 24 5 25 26 27 28 29 6 30 31 32 33 34 7 35 36 37 38 39 8 40 41 42 43 44 9 45 46 47 48 49 10 50 51 52 53 54 11 55 56 57 58 59 12 60 61 62 63 64 13 65 66 67 68 69 14 70 71 72 73 74 15 75 76 77 78 79 16 80 81 82 83 84 17 85 86 87 88 89 18 90 91 92 93 94 19 95 96 97 98 99
Podemos confirmar rápidamente la clase del DataFrame junto con la forma:
#print clase de impresión DataFrame (tipo (df)) <clase 'pandas.core.frame.DataFrame'> #imprima el número de filas y columnas de DataFrame df. forma (20, 5)
Recursos adicionales
Cómo agregar una matriz Numpy a un DataFrame de Pandas
Cómo soltar la columna de índice en Pandas
Pandas: seleccione las filas donde aparece el valor en cualquier columna
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: