<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
solver算是caffe的核心的核心,它協調著整個模型的運作。caffe程式執行必帶的一個引數就是solver組態檔。執行程式碼一般為
# caffe train --solver=*_slover.prototxt
在Deep Learning中,往往loss function是非凸的,沒有解析解,我們需要通過優化方法來求解。solver的主要作用就是交替呼叫前向(forward)演演算法和後向(backward)演演算法來更新引數,從而最小化loss,實際上就是一種迭代的優化演演算法。
到目前的版本,caffe提供了六種優化演演算法來求解最優引數,在solver組態檔中,通過設定type型別來選擇。
type: "SGD"
),type: "AdaDelta"
),type: "AdaGrad"
),type: "Adam"
),type: "Nesterov"
) andtype: "RMSProp"
)具體的每種方法的介紹,請看本系列的下一篇文章, 本文著重介紹solver組態檔的編寫。
在每一次的迭代過程中,solver做了這幾步工作:
接下來,我們先來看一個範例:
net: "examples/mnist/lenet_train_test.prototxt" test_iter: 100 test_interval: 500 base_lr: 0.01 momentum: 0.9 type: SGD weight_decay: 0.0005 lr_policy: "inv" gamma: 0.0001 power: 0.75 display: 100 max_iter: 20000 snapshot: 5000 snapshot_prefix: "examples/mnist/lenet" solver_mode: CPU
接下來,我們對每一行進行詳細解譯:
net: "examples/mnist/lenet_train_test.prototxt"
設定深度網路模型。每一個模型就是一個net,需要在一個專門的組態檔中對net進行設定,每個net由許多的layer所組成。每一個layer的具體設定方式可參考本系列文文章中的(2)-(5)。注意的是:檔案的路徑要從caffe的根目錄開始,其它的所有設定都是這樣。
也可用train_net和test_net來對訓練模型和測試模型分別設定。例如:
train_net: "examples/hdf5_classification/logreg_auto_train.prototxt" test_net: "examples/hdf5_classification/logreg_auto_test.prototxt"
接下來第二行:
test_iter: 100
這個要與test layer中的batch_size結合起來理解。mnist資料中測試樣本總數為10000,一次性執行全部資料效率很低,因此我們將測試資料分成幾個批次來執行,每個批次的數量就是batch_size。假設我們設定batch_size為100,則需要迭代100次才能將10000個資料全部執行完。因此test_iter設定為100。執行完一次全部資料,稱之為一個epoch
test_interval: 500
測試間隔。也就是每訓練500次,才進行一次測試。
base_lr: 0.01 lr_policy: "inv" gamma: 0.0001 power: 0.75
這四行可以放在一起理解,用於學習率的設定。只要是梯度下降法來求解優化,都會有一個學習率,也叫步長。base_lr用於設定基礎學習率,在迭代的過程中,可以對基礎學習率進行調整。怎麼樣進行調整,就是調整的策略,由lr_policy來設定。
lr_policy可以設定為下面這些值,相應的學習率的計算為:
multistep範例:
base_lr: 0.01 momentum: 0.9 weight_decay: 0.0005 # The learning rate policy lr_policy: "multistep" gamma: 0.9 stepvalue: 5000 stepvalue: 7000 stepvalue: 8000 stepvalue: 9000 stepvalue: 9500
接下來的引數:
momentum :0.9
上一次梯度更新的權重,具體可參看下一篇文章。
type: SGD
優化演演算法選擇。這一行可以省掉,因為預設值就是SGD。總共有六種方法可選擇,在本文的開頭已介紹。
weight_decay: 0.0005
權重衰減項,防止過擬合的一個引數。
display: 100
每訓練100次,在螢幕上顯示一次。如果設定為0,則不顯示。
max_iter: 20000
最大迭代次數。這個數設定太小,會導致沒有收斂,精確度很低。設定太大,會導致震盪,浪費時間。
snapshot: 5000 snapshot_prefix: "examples/mnist/lenet"
快照。將訓練出來的model和solver狀態進行儲存,snapshot用於設定訓練多少次後進行儲存,預設為0,不儲存。snapshot_prefix設定儲存路徑。
還可以設定snapshot_diff,是否儲存梯度值,預設為false,不儲存。
也可以設定snapshot_format,儲存的型別。有兩種選擇:HDF5 和BINARYPROTO ,預設為BINARYPROTO
solver_mode: CPU
設定執行模式。預設為GPU,如果你沒有GPU,則需要改成CPU,否則會出錯。
注意:以上的所有引數都是可選引數,都有預設值。根據solver方法(type)的不同,還有一些其它的引數,在此不一一列舉。
以上就是Caffe折積神經網路solver及其設定詳解的詳細內容,更多關於Caffe solver設定的資料請關注it145.com其它相關文章!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45