在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>

<menu id="6qfwx"><dl id="6qfwx"></dl></menu>

<label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>

<center id="6qfwx"><dl id="6qfwx"></dl></center>

<object id="ic9ep"></object>

<label id="ic9ep"></label>

博客專欄

EEPW首頁 > 博客 > [Machine Learning] 梯度下降法的三種形式BGD、SGD以及MBGD

[Machine Learning] 梯度下降法的三種形式BGD、SGD以及MBGD

發(fā)布人：數(shù)據(jù)派THU 時間：2021-11-11 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發(fā)布文章

來源：信息網(wǎng)絡工程研究中心

1. 批量梯度下降法BGD

2. 隨機梯度下降法SGD

3. 小批量梯度下降法MBGD

4. 總結

在應用機器學習算法時，我們通常采用梯度下降法來對采用的算法進行訓練。其實，常用的梯度下降法還具體包含有三種不同的形式，它們也各自有著不同的優(yōu)缺點。

下面我們以線性回歸算法來對三種梯度下降法進行比較。

一般線性回歸函數(shù)的假設函數(shù)為：

對應的能量函數(shù)（損失函數(shù)）形式為：

　

下圖為一個二維參數(shù)組對應能量函數(shù)的可視化圖：

1. 批量梯度下降法BGD

批量梯度下降法（Batch Gradient Descent，簡稱BGD）是梯度下降法最原始的形式，它的具體思路是在更新每一參數(shù)時都使用所有的樣本來進行更新，其數(shù)學形式如下：

(1) 對上述的能量函數(shù)求偏導：

(2) 由于是最小化風險函數(shù)，所以按照每個參數(shù)θ梯度負方向來更新每個θ

具體的偽代碼形式為：

　　repeat{　　　　

　　

　　　　　　　?。╢or every j=0, ... , n）

　　}

從上面公式可以注意到，它得到的是一個全局最優(yōu)解，但是每迭代一步，都要用到訓練集所有的數(shù)據(jù)，如果樣本數(shù)目m大，那么可想而知這種方法的迭代速度！所以，這就引入了另外一種方法，隨機梯度下降。

優(yōu)點：全局最優(yōu)解；易于并行實現(xiàn)；

缺點：當樣本數(shù)目很多時，訓練過程會很慢。

從迭代的次數(shù)上來看，BGD迭代的次數(shù)相對較少。其迭代的收斂曲線示意圖可以表示如下：

2. 隨機梯度下降法SGD

由于批量梯度下降法在更新每一個參數(shù)時，都需要所有的訓練樣本，所以訓練過程會隨著樣本數(shù)量的加大而變得異常的緩慢。隨機梯度下降法（Stochastic Gradient Descent，簡稱SGD）正是為了解決批量梯度下降法這一弊端而提出的。

將上面的能量函數(shù)寫為如下形式：

利用每個樣本的損失函數(shù)對θ偏導得到對應的梯度，來更新θ：

具體的偽代碼形式為：

　　1. Randomly shuffle dataset；

　　2. repeat{

　　　　for i=1, ... ,m{

　　　　　　

　　　　　　(for j=0, ... ,n)

　　　　}

　　}

隨機梯度下降是通過每個樣本來迭代更新一次，如果樣本量很大的情況（例如幾十萬），那么可能只用其中幾萬條或者幾千條的樣本，就已經(jīng)將theta迭代到最優(yōu)解了，對比上面的批量梯度下降，迭代一次需要用到十幾萬訓練樣本，一次迭代不可能最優(yōu)，如果迭代10次的話就需要遍歷訓練樣本10次。但是，SGD伴隨的一個問題是噪音較BGD要多，使得SGD并不是每次迭代都向著整體最優(yōu)化方向。

優(yōu)點：訓練速度快；

缺點：準確度下降，并不是全局最優(yōu)；不易于并行實現(xiàn)。

從迭代的次數(shù)上來看，SGD迭代的次數(shù)較多，在解空間的搜索過程看起來很盲目。其迭代的收斂曲線示意圖可以表示如下：

3. 小批量梯度下降法MBGD

由上述的兩種梯度下降法可以看出，其各自均有優(yōu)缺點，那么能不能在兩種方法的性能之間取得一個折中呢？即，算法的訓練過程比較快，而且也要保證最終參數(shù)訓練的準確率，而這正是小批量梯度下降法（Mini-batch Gradient Descent，簡稱MBGD）的初衷。

MBGD在每次更新參數(shù)時使用b個樣本（b一般為10），其具體的偽代碼形式為：

　　Say b=10, m=1000.

　　Repeat{

　　　　for i=1, 11, 21, 31, ... , 991{

　　　　(for every j=0, ... ,n)

　　　　}

　　}

4. 總結

Batch gradient descent: Use all examples in each iteration；

Stochastic gradient descent: Use 1 example in each iteration；

Mini-batch gradient descent: Use b examples in each iteration.

*博客內容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 深度學習

相關推薦

一種改進的可遷移深度學習模型*

智能計算 202210 可遷移深度學習無標簽 | 2022-10-25

Deep Learning中文版

資源下載深度學習中文 | 2019-06-11

Firefly DL小巧輕便，嵌入式深度學習加速部署

智能計算 Firefly DL 深度學習人工智能 | 2023-12-22

深度強化學習核心技術開發(fā)與應用

szhlss123 | 2022-08-10

為什么深度學習如此容易被愚弄？AI研究員正努力修復神經(jīng)網(wǎng)絡缺陷

智能計算 DNN 深度神經(jīng)網(wǎng)絡深度學習 | 2022-07-05

基于深度學習的跌倒檢測技術對比與分析*

智能計算深度學習跌倒檢測卷積神經(jīng)網(wǎng)絡長短期記憶網(wǎng)絡 202212 | 2022-12-22

TFLite模型的開盲盒體驗

嵌入式系統(tǒng) TFLite 模型推理庫深度學習 | 2024-05-10

基于深度學習的智能電網(wǎng)短期日負荷曲線預測系統(tǒng)設計與實現(xiàn)

智能計算 202302 深度學習短期負荷預測卷積神經(jīng)網(wǎng)絡長短期記憶網(wǎng)格 Flask | 2023-02-27

深度學習（DeepLearning）

szhlss123 | 2022-08-17

視覺慣性導航融合算法研究進展

物聯(lián)網(wǎng)與傳感器 202302 視覺慣性導航優(yōu)化耦合算法深度學習 | 2023-02-21

射頻系統(tǒng)的深度學習

資源下載 ADI RF DSP 深度學習 | 2020-04-20

什么是人機交互技術？

龍騰AI技術 | 2022-11-02

深度學習（人工神經(jīng)網(wǎng)絡的研究的概念）

大綠葉 | 2020-07-28

AI深度學習

loof_lripa | 2024-04-20

深度學習模型的云邊協(xié)同訓練和部署*

智能計算云邊協(xié)同深度學習服務器部署 202212 | 2022-12-22

直覺有害！Facbook最新研究：易于解釋的神經(jīng)元會誤導DNN的學習

智能計算 DNN 深度神經(jīng)網(wǎng)絡深度學習 | 2022-07-05

基于圖結構的圖像注意力網(wǎng)絡

智能計算 202207 深度學習注意力機制圖像分類人臉識別 | 2022-07-26

焦點

推薦視頻

更多>>

技術專區(qū)

關閉

<menu id="6qfwx"><li id="6qfwx"></li></menu>

<menu id="6qfwx"><dl id="6qfwx"></dl></menu>

<label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>

<center id="6qfwx"><dl id="6qfwx"></dl></center>

<menu id="hcwoh"></menu>

<strike id="hcwoh"><small id="hcwoh"></small></strike>

<dfn id="hcwoh"><td id="hcwoh"><table id="hcwoh"></table></td></dfn>

<dfn id="hcwoh"><td id="hcwoh"></td></dfn>