首頁 > 軟體

Python中的np.random.seed()亂數種子問題及解決方法

2022-04-19 10:00:43

前言: 最近在學習過程中總是遇到np.random.seed()這個問題,剛開始總是覺得不過是一個簡單的亂數種子,就沒太在意,後來遇到的次數多了,才發現他竟然是如此之用處之大!接下來我就把我所學到的關於np.random.seed()的知識分享給大家!

1. 何為亂數種子

亂數種子,相當於我給接下來需要生成的亂數一個初值,按照我給的這個初值,按固定順序生成亂數
讀到這,你如何還感覺得晦澀難懂的話,那我再舉一個通俗易懂的例子:
看第一段程式碼:

import numpy as np
np.random.seed(0)  # 先定義一個亂數種子
print(np.random.rand(5))  # "隨機"生成5個數

結果:

[0.5488135  0.71518937 0.60276338 0.54488318 0.4236548 ]

這裡的rand(5)就是相當於生成五個資料

接著看第二段程式碼:

import numpy as np
np.random.seed(0)  # 先定義一個亂數種子
print(np.random.rand(5))  # "隨機"生成5個數
print(np.random.rand(5))  # 再"隨機"生成5個數

結果:

[0.5488135  0.71518937 0.60276338 0.54488318 0.4236548 ]
[0.64589411 0.43758721 0.891773   0.96366276 0.38344152]

這裡我們生成了十個亂數。

最後我們看第三段程式碼:

import numpy as np
np.random.seed(0)  # 先定義一個亂數種子
print(np.random.rand(5))  # "隨機"生成5個數
print(np.random.rand(5))  # 再"隨機"生成5個數

np.random.seed(0)
for i in range(7):
    print(np.random.random())  # "隨機"生成7個數

執行結果:

[0.5488135  0.71518937 0.60276338 0.54488318 0.4236548 ]
[0.64589411 0.43758721 0.891773   0.96366276 0.38344152]
0.7917250380826646
0.5288949197529045
0.5680445610939323
0.925596638292661
0.07103605819788694
0.08712929970154071
0.02021839744032572

接下來我們的對比一下,最後輸出的7個亂數的結果和我們之前分兩次輸出的亂數列表,我們可以很清晰的看到:我們最後輸出的7個亂數便是依次從我們之前的生成的10個亂數中取得的! 也就是說在程式碼中,我們看到 “ 隨機 ” ,那就是說並不是真正隨機(假隨機)。

注意:
設定的seed()值僅一次有效

2. np.random.seed()引數問題

先看一段程式碼:

import numpy as np
random.seed(0)
print(np.random.rand(2, 3))
np.random.seed(1)
print(np.random.rand(2, 3))
np.random.seed(2)
print(np.random.rand(2, 3))

執行結果:

[[0.5488135  0.71518937 0.60276338]
 [0.54488318 0.4236548  0.64589411]]
[[4.17022005e-01 7.20324493e-01 1.14374817e-04]
 [3.02332573e-01 1.46755891e-01 9.23385948e-02]]
[[0.4359949  0.02592623 0.54966248]
 [0.43532239 0.4203678  0.33033482]]

由此可知:這個引數好像並沒有什麼實際的意義。
最後,我們得出結論:這個引數是隨便取的,可以認為是初值的標誌,每次按照這個標誌都可以得到相同的初值。

3. 使用方法

使用之前都需要呼叫一下:np.random.seed(0)
錯誤範例:

import numpy as np
np.random.seed(1)
L1 = np.random.randn(3, 3)
L2 = np.random.randn(3, 3)
print(L1)
print(L2)
[[ 1.62434536 -0.61175641 -0.52817175]
 [-1.07296862  0.86540763 -2.3015387 ]
 [ 1.74481176 -0.7612069   0.3190391 ]]
[[-0.24937038  1.46210794 -2.06014071]
 [-0.3224172  -0.38405435  1.13376944]
 [-1.09989127 -0.17242821 -0.87785842]]

正確範例:

import numpy as np

np.random.seed(1)
L1 = np.random.randn(3, 3)
np.random.seed(1)
L2 = np.random.randn(3, 3)
print(L1)
print(L2)
[[ 1.62434536 -0.61175641 -0.52817175]
 [-1.07296862  0.86540763 -2.3015387 ]
 [ 1.74481176 -0.7612069   0.3190391 ]]
[[ 1.62434536 -0.61175641 -0.52817175]
 [-1.07296862  0.86540763 -2.3015387 ]
 [ 1.74481176 -0.7612069   0.3190391 ]]

4. 亂數種子問題總結

(1)亂數種子相當於給我們一個初值,之後按照固定順序生成亂數(也就是我們說的超級長的 list )
(2)亂數種子對後面的結果一直有影響,在一個亂數種子後生成的亂數都受這個亂數種子的影響,即生成的亂數都是由這個亂數種子給的初值,按照固定順序生成的
(3)每次使用之前都需要呼叫一下:np.random.seed(0)
(4)np.random.seed(0)中引數0是隨便取的,可以認為是初值的標誌,每次按照這個標誌都可以得到相同的初值
參考資料:What does numpy.random.seed(0) do?


IT145.com E-mail:sddin#qq.com