首頁 > 軟體

Python陣列變形的幾種實現方法

2022-05-30 22:02:15

1.reshape

reshape是重塑,常用的三種寫法如下:

numpy.arange(n).reshape(a, b)    
# 依次生成 n個自然數,並且以 a行 b列的陣列形式顯示
numpy.arange(a,b,c)    
# 從數位 a起, 步長為 c, 到 b結束,生成 array
numpy.arange(a,b,c).reshape(m,n) 
# 將array的維度變為 m 行 n 列。

例一:

import numpy as np
arr=np.arange(1,25.0).reshape(4,6)

關於order:
order可以是陣列排序的方向不同
(1)order='F'列為主序
(2)order='C'行為主序

一種是以order='F'的方式讓陣列豎著排序:

arr=np.arange(1,25.0).reshape((6,-1),order='F')

一種是以order='C'的方式讓陣列橫著排序:

arr=np.arange(1,25.0).reshape((6,-1),order='C')

reshapeflattern:
前者完成的是從低維到高維的轉換,後者則相反,還可以使用reval函數

2.flatten

numpy.ndarray.flattern()是用來返回一維陣列的函數。
也可以像reshape一樣使用order

arr2=arr.flatten(order='F')

一般預設是使用order='C',有特定需求則使用order='F'

flatten()返回的是拷貝,意味著改變元素的值不會影響原始陣列。

3.ravel

ravel()方法將陣列維度拉成一維陣列

ravelflatten的區別:

  • ravel在進行扁平化處理的時候沒有複製原來的陣列,只在列主序打平時複製原來的陣列
  • flatten在所有情況下打平時都複製了原來的陣列
  • ravel()返回的是檢視,意味著改變元素的值會影響原始陣列;
  • flatten()返回的是拷貝,意味著改變元素的值不會影響原始陣列。
  • 相同點:這兩個函數的功能都是將多維陣列轉換成一維

ravel()返回的是檢視,意味著改變元素的值會影響原始陣列;

4.stack

numpy.stack(arrays, axis=0):沿著新軸連線陣列的序列。

一系列的stack函數有:stack(),hstack(),vstack()

(1)concatenate

還有屬性例如:concatenate
numpy.concatenate((a1,a2,…), axis=0)函數,能夠一次完成多個陣列的拼接。其中a1,a2,…是陣列型別的引數

arr1=['穿過寒冬擁抱你','反貪風暴5:最終章','李茂扮太子','誤殺2']
arr2=['以年為單位的戀愛','愛情神話','駭客帝國:矩陣重啟','雄獅少年']
np.concatenate([arr1,arr2])

注意,兩個list合併的時候需要用到 [ ] ,否則出錯。

axis引數指定新軸在結果尺寸中的索引。例如,如果axis=0,它將是第一個維度,如果axis=-1,它將是最後一個維度。

預設情況下axis=0

arr1=np.arange(1,25.0).reshape(4,6)
arr2=np.arange(26,50.0).reshape(4,6)
np.concatenate([arr1,arr2],axis=1)
np.concatenate([arr1,arr2],axis=0)

如上圖所示,axis=1是將不同的列串聯起來,axis=0則類似於append,是合併。

arr1arr2進行對調:

(2)vstack

函數原型:vstack(tup) ,引數tup可以是元組,列表,或者numpy陣列,返回結果為numpy的陣列。它是垂直(按照行順序)的把陣列給堆疊起來。

vstack 和concatenate( ),axis=0等價

(3)dstack

dstack是deep stack,即在深度方向進行合併。

dstack可以將一維陣列變成三維陣列。

import numpy as np

# vstack
np.vstack([arr1,arr2])
#結果:
array([[ 1.,  2.,  3.,  4.,  5.,  6.],
       [ 7.,  8.,  9., 10., 11., 12.],
       [13., 14., 15., 16., 17., 18.],
       [19., 20., 21., 22., 23., 24.],
       [26., 27., 28., 29., 30., 31.],
       [32., 33., 34., 35., 36., 37.],
       [38., 39., 40., 41., 42., 43.],
       [44., 45., 46., 47., 48., 49.]])
       
# dstack
np.dstack([arr1,arr2])
# 結果:
array([[[ 1., 26.],
        [ 2., 27.],
        [ 3., 28.],
        [ 4., 29.],
        [ 5., 30.],
        [ 6., 31.]],

       [[ 7., 32.],
        [ 8., 33.],
        [ 9., 34.],
        [10., 35.],
        [11., 36.],
        [12., 37.]],

       [[13., 38.],
        [14., 39.],
        [15., 40.],
        [16., 41.],
        [17., 42.],
        [18., 43.]],

       [[19., 44.],
        [20., 45.],
        [21., 46.],
        [22., 47.],
        [23., 48.],
        [24., 49.]]])

(4)hstack

函數原型:hstack(tup) ,引數tup可以是元組,列表,或者numpy陣列,返回結果為numpy的陣列,水平(按列順序)把陣列給堆疊起來,vstack()函數正好和它相反。

(5)r,c模式

np.r_[arr1,arr2] ,實際上是vstack 與 axis=0 做了一個合併(concatenate)。
np.c_[arr1,arr2] , hstack 與 axis=1 做了一個合併(concatenate)。

print(np.r_[-2:2:1,[0]*3,5,6])

上面那段程式碼由三部分組成,-2:2:1表示從-2~2的數位,間隔為1,並且2沒有,然後是3個0,接下來是5和6

print((np.r_['r',-2:2:1,[0]*3,5,6])) #二維陣列,以行的方式呈現
print((np.r_['c',-2:2:1,[0]*3,5,6])) #二維陣列,以列的方式呈現

預設是為r,表示沿著行的方向建立,c則表示以列的方式建立。

注:shape表示矩陣的維度大小。

也可以用'a,b,c'來進行表示,a代表軸,沿著軸a來進行合併,代表合併後陣列維度至少是bc是代表在第c維度上做維度提升

print(np.r_['0,2,0',[1,2,3],[4,5,6]],'n')
print(np.r_['0,2,1',[1,2,3],[4,5,6]],'n')
print(np.r_['1,2,0',[1,2,3],[4,5,6]],'n')
print(np.r_['1,2,1',[1,2,3],[4,5,6]])

 b:合併後陣列的維度
 a=0,沿著軸0合併。(3,)-->(1,3)
 a=1,沿著軸1合併。(3,1)-->(3,2)
 c=0,在軸0上上升一維,(3,)-->(3,1)
 c=1,在軸1上上升一維,(3,)-->(1,3)

5.split

(1)split

split 具體有 split() , hsplit() , vsplit()

arr1=np.arange(1,13.0).reshape(2,6)
arr2=np.arange(14,26.0).reshape(2,6)
arr=np.concatenate([arr1,arr2])
arr3=np.split(arr,2)   # 預設情況下是 axis=0

由上圖可知,split分割成為二維陣列

arr4=np.split(arr,3,axis=1)
print(arr4[0].shape)
arr4

arr5=np.split(arr,4,axis=0)
arr6=np.split(arr,[1,2,3],axis=0)

上述程式碼塊的兩行表示是相同的,第二行相當於使用陣列的切片方式進行處理。

(2)vsplit和hsplit

  • vsplit 垂直(按行)將陣列拆分為多個子陣列。
  • hsplit 水平(按列)將陣列拆分為多個子陣列。

這部分希望大家看下圖體會~

arrv=np.vsplit(arr,[1,2,3,4])
arrh=np.hsplit(arr,[1,2,3,4,5])

6.repeat

repeat(): 複製陣列中的每個指定元素。
一維陣列:用整數型和列表型參考來控制元素被複制的個數
多維陣列:用整數型和列表型來控制元素被複制的個數

import numpy as np
arr=np.arange(3)
print(arr.shape)

(1)標量引數

print(arr.repeat(3))   # 每個元素複製三次

(2)列表引數

print(arr)
print(arr.repeat([1,2,3]))  
# 第一個沒有複製,第二個複製了兩個,,依次類推

當列表的元素少於陣列元素,或者多餘陣列元素,都會報錯,就如下圖所示。

上面是一維陣列的,接下來再看看二維陣列中利用標量引數和軸引數:

print(arr.repeat(2)) # 此時二維陣列變成一維的了
print(arr.repeat(2,1)) 
print(arr.repeat(2,axis=0)) # 在行上面進行復制

再來看看二維陣列中的列表引數和軸引數:

7.tile

關於repeat和title,二者的本質都是複製,而repeat是在元素層面進行賦值,title是在陣列層面進行賦值。

(1)標量引數

print(np.tile(arr,2))
print(np.repeat(arr,2))

(2)元組引數

元組引數即括號裡面用相關引數進行分割。

print(np.tile(arr,(2,3)))

print(np.tile(arr,(2,3,4)))

在軸0上面複製兩遍,複製3遍,複製4遍。

8.sort

排序分為:

  • 直接排序
  • 間接排序

直接排序sort() :在原來的陣列上進行排序操作,而不重新建立一個陣列

(1)一維陣列排序方法

arr=np.array([9,1,5,7,2,3,8,6]) # 先建立一個無序陣列
arr
print('排序之前的陣列:',arr)
arr.sort()
print('排序之後的陣列:',arr)

arr[::-1] # 使用倒序的方法顯示

(2)多維陣列排序方法

先使用random隨機生成一個二維陣列:(每次)

import numpy as np
np.random.seed(1000)
arr=np.random.randint(40,size=(3,4))
arr

以上的方法在每次重新重新整理了之後會變化陣列的數位。

如果對二維陣列直接使用arr.sort(),則會直接對行進行排序。

對列進行排序:

print('排序之前的陣列:')
print(arr)
arr[:,0].sort()
print('排序之後的陣列:')
print(arr)

np.sort(arr[:,2]) # 選擇第三列進行排序

arr.sort(axis=1) # 橫著排序,原來陣列改變
np.sort(arr,axis=1) # 橫著排序,但原來的陣列不會改變
arr.sort(axis=0) # 豎著排序,原來陣列改變
np.sort(arr,axis=0) # 豎著排序,但原來的陣列不會改變

(3)argsort函數

接下來看看間接排序:

間接排序:利用特定的引數進行排序,按需排序,需要使用argsort( )函數
argsort函數:返回的是陣列值從小到大的索引值。

score=np.array([100,65,76,89,58])
idx=score.argsort()
idx

因此如果列印陣列的時候帶上下標就相當於排序了:

print(score[idx]) # 利用索引標籤來列印

arr[:,arr[0].argsort()]
#按第一行從低到高進行排序,並且對應的列也會跟著變化 
arr#由於使用的是argsort,因此原陣列不會改變 

(4)lexsort函數

numpy.lexsort() 用於對多個序列進行排序。把它想象成對電子試算表進行排序,每一列代表一個序列,排序時優先照顧靠後的列。

這裡舉一個應用場景:小升初考試,重點班錄取學生按照總成績錄取。在總成績相同時,數學成績高的優先錄取,在總成績和數學成績都相同時,按照英語成績錄取…… 這裡,總成績排在電子試算表的最後一列,數學成績在倒數第二列,英語成績在倒數第三列。

arr1=np.array(['E','B','C','A','D'])
arr2=np.array(['4','1','3','2','5'])
idx=np.lexsort((arr1,arr2))

9.insert

insert 是插入,但原陣列不會改變。

arr=np.arange(6)
np.insert(arr,1,100) # 在下標為1的位置插入100

arr=np.arange(6)
np.insert(arr,1,100) # 在下標為1的位置插入100

10.delete

delete是刪除,但原陣列同樣不會改變。

arr=np.arange(6)
np.delete(arr,1)
np.delete(arr,[1,2])

11.copy

關於copyview ,這裡需要了解一下陣列切片和列表切片的區別:

  • 陣列切片得到的是原陣列的一個view(檢視),修改切片中的內容改變原來陣列
  • 列表切片得到的是原列表的一個copy(複製),修改切片後的列表不會改變原列表
arr=np.arange(6)
arr_copy=arr.copy()
arr_copy[0]=100
arr_copy

12.view

arr=np.arange(6)
arr_view=arr.view()
arr_view[0]=100
arr_view

講了以上12種陣列變形,那麼如何使用容器型資料的特性和陣列相關函數的方法對字串或者其他物件進行去重呢?

s='陣列切片得到的是原陣列的一個,修改切片中的內容會改變原來陣列'

假設現在要對s進行去重:

方法一:使用set

sets=set(s)

方法二:使用unique

sarr=np.array(s)
np.unique(list(s))

 到此這篇關於Python陣列變形的幾種實現方法的文章就介紹到這了,更多相關Python陣列變形內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com