• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    非光滑強(qiáng)凸情形Adam型算法的最優(yōu)收斂速率

    2022-11-09 07:11:22張澤東
    電子學(xué)報(bào) 2022年9期
    關(guān)鍵詞:對(duì)數(shù)情形步長

    隴 盛,陶 蔚,張澤東,陶 卿

    (1.國防科技大學(xué)信息系統(tǒng)工程重點(diǎn)實(shí)驗(yàn)室,湖南長沙 410073;2.軍事科學(xué)院戰(zhàn)略評(píng)估咨詢中心,北京 100091;3.陸軍炮兵防空兵學(xué)院信息工程系,安徽合肥 230031)

    1 引言

    在線學(xué)習(xí)(online learning)是用來分析迭代算法的流行框架,后悔界(regret bound)則是衡量在線優(yōu)化算法性能的重要指標(biāo)[1].針對(duì)一般凸優(yōu)化問題,Zinkevich提出的OGD(Online Gradient Decent)[2]方法達(dá)到了最壞情況下O()的后悔界,其中T是總迭代次數(shù).而在非光滑強(qiáng)凸情形中,Hazan等人在OGD基礎(chǔ)上調(diào)整步長階為得到了更好的O(logT)對(duì)數(shù)階后悔界[3],其中t=1,2,···,T.

    雖然在線學(xué)習(xí)理論和應(yīng)用方面都取得成功,但是實(shí)驗(yàn)中模擬在線流程較為復(fù)雜,算法往往需要更簡單的隨機(jī)實(shí)驗(yàn)環(huán)境[4].因此,本文關(guān)注OGD經(jīng)過標(biāo)準(zhǔn)的online-to-batch技巧轉(zhuǎn)換后,得到的隨機(jī)算法SGD(Stochastic Gradient Decent).兩者本質(zhì)上是同一算法,區(qū)別在于應(yīng)用場(chǎng)景不同,OGD用后悔界度量其在線學(xué)習(xí)性能,SGD靠收斂速率評(píng)價(jià)在隨機(jī)優(yōu)化中的表現(xiàn).在強(qiáng)凸情形中,SGD得到了O(logT/T)的收斂速率.與之相比,Agarwal等人證明了在最好情況下,一階隨機(jī)優(yōu)化算法解非光滑強(qiáng)凸問題的收斂速率是Ω(1/T)[5].為達(dá)到與之匹配的最壞情況下的最優(yōu)收斂速率O(1/T),許多算法在分析中引入了光滑條件(例如梯度Lipschitz連續(xù)、高階可微等).但是這些假設(shè)往往是不平凡的,并且無法應(yīng)用于非光滑目標(biāo)函數(shù)(例如hinge損失).文獻(xiàn)[6]提出一種結(jié)合了COMID(Composite Objective Mirror Descent)的非光滑隨機(jī)坐標(biāo)下降方法,不僅保持了正則化結(jié)構(gòu),而且計(jì)算代價(jià)極低,遺憾的是在強(qiáng)凸情形中未能達(dá)到最優(yōu).因此長期以來,SGD都無法跨過對(duì)數(shù)階的鴻溝,達(dá)到非光滑強(qiáng)凸情形的最優(yōu)收斂速率.

    為了解決這個(gè)問題,研究者通常采取兩種方案:其一是改進(jìn)SGD算法本身,結(jié)合各種加速技巧提升算法收斂速率.2011年,Hazan等人提出著名的Epoch-GD(Epoch Gradient Descent)[7],該算法其實(shí)是在SGD基礎(chǔ)上引入了“多階段循環(huán)”這個(gè)新的概念.雖然Epoch-GD達(dá)到了最優(yōu)收斂速率O(1/T),但Rakhlin等人認(rèn)為,大幅修改算法不足以證明SGD徹底突破了強(qiáng)凸優(yōu)化中對(duì)數(shù)因子的阻礙,因此提出了第二種方案——修改算法輸出方式.在以往收斂性分析中,SGD輸出全部T次迭代平均結(jié)果,Rakhlin提出在不改變算法的前提下,用α-suffix[8]方式(輸出后半部分迭代平均)進(jìn)行替換,最終達(dá)到了O(1/T)收斂速率.然而,α-suffix技巧也存在問題,首先它給收斂性分析增加了難度,其次不能以on-the-fly的模式存儲(chǔ)歷史迭代結(jié)果,從而增加了計(jì)算開銷.幸運(yùn)的是,文獻(xiàn)[9~11]中采用的加權(quán)平均輸出方式克服了這個(gè)缺點(diǎn).該方法對(duì)理論分析十分友好,且只需對(duì)SGD每次迭代結(jié)果賦予權(quán)重值最后進(jìn)行平均輸出,就可以在支持on-the-fly計(jì)算方式的同時(shí),保證最優(yōu)的收斂速率.

    近年來,在SGD基礎(chǔ)上使用自適應(yīng)梯度調(diào)整步長,并且用動(dòng)量搜索方向的算法稱為Adam型算法,例如Adam[12]、NAdam(Nesterov-accelerated Adaptive moment estimation)[13]、PAdam(Partially Adaptive moment estimation)[14]、Adaptive HB(Adaptive Polyak’s Heavy-Ball)[15]等.這類算法在非光滑凸情形中保證的收斂速率,并且具有適合稀疏優(yōu)化、體現(xiàn)不同維度差異等優(yōu)點(diǎn).然而文獻(xiàn)[16]指出,在某些簡單的凸環(huán)境中,所有基于指數(shù)移動(dòng)平均(Exponential Moving Average,EMA)的Adam型算法都不收斂,這就是著名的Reddi問題.針對(duì)該問題,Reddi等人提出了改進(jìn)算法AMSGrad[16]和AdamNC[16].另一方面,Adam型算法在強(qiáng)凸優(yōu)化中的應(yīng)用也逐漸發(fā)展起來.2017年Mukkamala等人提出了SC-Adagrad(Strongly Convex Adagrad)[17]和SC-RMSProp(Strongly Convex RMSProp)[17]算法,應(yīng)對(duì)在線學(xué)習(xí)問題得到了數(shù)據(jù)依賴(處理稀疏數(shù)據(jù)時(shí)表現(xiàn)更好)的對(duì)數(shù)階后悔界.2018年,Chen等人在Epoch-GD基礎(chǔ)上結(jié)合AdaGrad[18]提出了SadaGrad[19],雖然在隨機(jī)情形下得到了O(1/T)的最優(yōu)收斂速率,但是只適用于弱強(qiáng)凸環(huán)境.2019年,Wang等人提出SAdam[20],盡管在處理稀疏數(shù)據(jù)時(shí)得到比OGD更好的后悔界,體現(xiàn)出自適應(yīng)步長方法的優(yōu)勢(shì),但是轉(zhuǎn)換為隨機(jī)算法時(shí)只能得到O(logT/T)的收斂速率,因此沒有體現(xiàn)動(dòng)量的加速作用,與最優(yōu)收斂速率依然存在對(duì)數(shù)階的間隙.

    面對(duì)非光滑強(qiáng)凸優(yōu)化問題,SGD能夠得到最優(yōu)收斂速率O(1/T),但是到目前為止,SGD改良產(chǎn)生的Adam型算法反而無法達(dá)到上述目標(biāo).因此,如何使Adam型算法達(dá)到最優(yōu)收斂亟待解決.正如文獻(xiàn)[20]中所說,寄希望于SAdam與Epoch-GD技巧結(jié)合是不平凡的.綜上所述,本文旨在基于動(dòng)量法和自適應(yīng)步長,結(jié)合修改輸出方式這一技巧提出新的Adam型算法,保證其在非光滑強(qiáng)凸情形中達(dá)到最優(yōu)收斂速率O(1/T).

    本文的主要貢獻(xiàn)如下:

    (1)提出了一種名為WSAdam的Adam型算法,該算法在SAdam基礎(chǔ)上進(jìn)行改進(jìn),采用加權(quán)平均的輸出方式,設(shè)置了與以往強(qiáng)凸算法同階的步長超參數(shù).既保持了Adam型算法體現(xiàn)不同維度差異的優(yōu)點(diǎn),又通過on-the-fly計(jì)算降低了運(yùn)行成本;

    (2)針對(duì)約束的非光滑強(qiáng)凸優(yōu)化問題,證明了本文所提的WSAdam隨機(jī)情形下具有O(1/T)的最優(yōu)收斂速率(見定理1).據(jù)我們所知,這一結(jié)果消去了強(qiáng)凸優(yōu)化中常見的對(duì)數(shù)階因子,填補(bǔ)了Adam型算法強(qiáng)凸最優(yōu)收斂性方面的缺失;

    (3)證明了在導(dǎo)致Adam發(fā)散的優(yōu)化問題[16]上,WSAdam仍能保持收斂,表明WSAdam可以解決Reddi問題.另外,選擇了典型的l2范數(shù)約束下的hinge損失函數(shù)強(qiáng)凸優(yōu)化問題,通過與幾種常見強(qiáng)凸算法進(jìn)行比較實(shí)驗(yàn),驗(yàn)證了理論分析的正確性,也表明所提算法優(yōu)于現(xiàn)有的強(qiáng)凸Adam型算法.

    2 相關(guān)工作

    本文主要考慮求解如下非光滑約束優(yōu)化問題:

    其中Q∈Rd是閉凸集,為式(1)的一個(gè)最優(yōu)解,f是Q上的非光滑強(qiáng)凸函數(shù),定義如下:

    那么稱函數(shù)f為λ-強(qiáng)凸.

    在線學(xué)習(xí)的目標(biāo)是最小化后悔界(Regret bound),定義如下:

    其中ft(t=1,2,···,T)均為強(qiáng)凸函數(shù),ft(wt)表示ft在wt處的損失.常用優(yōu)化器是OGD,見算法1.

    算法1中αt代表步長,gt表示ft(wt)的次梯度,PQ表示在Q上投影算子.

    然而在線設(shè)置中,不可預(yù)見整體目標(biāo)函數(shù),需要學(xué)習(xí)環(huán)境響應(yīng)上一輪迭代結(jié)果后提供損失ft,然后才能觀察到當(dāng)前迭代的次梯度gt,因此不適用于算法的實(shí)驗(yàn)驗(yàn)證.

    通常用SGD解得上述隨機(jī)情形中的收斂速率,具體形式見算法2.

    算法2中αt代表步長,ξt?ξ表示第t次迭代時(shí)隨機(jī)抽取的樣本表示f(wt,ξt)的次梯度.

    SGD計(jì)算次梯度只與每輪隨機(jī)抽取的樣本相關(guān),當(dāng)假設(shè)全體樣本獨(dú)立同分布時(shí),在第t次迭代時(shí)刻,關(guān)于部分樣本的目標(biāo)函數(shù)f(wt,ξt)的次梯度?是整個(gè)目標(biāo)函數(shù)f(wt,ξ)次梯度的無偏估計(jì),也就是

    其中α∈(0,1),令αT為整數(shù).但是,這種方式需要將所有的迭代結(jié)果存入內(nèi)存或者提前知道總迭代次數(shù)T,這極大增加了計(jì)算開銷.

    針對(duì)這個(gè)問題,一種能夠on-the-fly計(jì)算的加權(quán)平均輸出方式被提出:

    除了改進(jìn)輸出方式,升級(jí)為Adam型算法也是提高SGD性能的主要途徑之一,其具體描述見算法3.

    在算法3中,動(dòng)量由歷史梯度緩沖器mt承載,自適應(yīng)步長由構(gòu)成.Adam型算法的自動(dòng)調(diào)整步長機(jī)制,關(guān)鍵技術(shù)是平方梯度的指數(shù)移動(dòng)平均(Exponential Moving Average,EMA):

    雖然該策略可以摒棄過早的梯度,并且避免訓(xùn)練提前終止,但是不能保證是單調(diào)非增的.迭代后期過大的步長可能導(dǎo)致算法不收斂,從而陷入Reddi問題(詳細(xì)例子在第4節(jié)實(shí)驗(yàn)中描述).

    解決方案是AMSGrad和AdamNC兩種算法,SAdam在AdamNC基礎(chǔ)上改進(jìn)而來也有效避免了不收斂問題.不同的αt,mt,Vt設(shè)定方案對(duì)應(yīng)不同Adam型算法,我們將常見的幾種列舉出來,后悔界和隨機(jī)情形下收斂速率對(duì)比如表1所示.其中前三種算法針對(duì)一般凸函數(shù),后三種針對(duì)強(qiáng)凸函數(shù).

    表1 常見Adam型算法對(duì)比

    表1中α為某一固定參數(shù),向量或矩陣間運(yùn)算都是基于元素的,diag(·)是取對(duì)角矩陣運(yùn)算,Id是d維單位矩陣,δ是平滑系數(shù).

    3 WSAdam算法

    對(duì)于非光滑強(qiáng)凸優(yōu)化問題,為了構(gòu)造達(dá)到最優(yōu)收斂速率O(1/T)的新算法,我們的思路是在SAdam基礎(chǔ)上,重新設(shè)計(jì)與以往強(qiáng)凸算法同階的步長超參數(shù)(即最終步長滿足O(1/t)),摒棄以往的標(biāo)準(zhǔn)平均輸出方式,用加權(quán)平均輸出方式取代之.本文提出的WSAdam算法見算法4.

    算法4 WSAdam算法輸入:w1=0 For t=1 to T Compute g?t=?f(wt,ξt)Update mt=β1,tmt-1+(1-β1,t)g?t Update Vt=β2,tVt-1+(1-β2,t)diag(g?2 t)Update V?t=Vt+δId Update wt+1=PV?t Q[wt-αtmtV?-1t]End for輸出:wˉw T=2 Ttwt T+1∑t=1 T( )

    由式(7)可知,WSAdam的有效步長為O(1/t),與以往強(qiáng)凸算法步長同階.由于Vt,i+δ積累矩陣第i維度數(shù)值,算法步長因此在不同維度上得到加權(quán)區(qū)分,從而在不同待訓(xùn)參數(shù)之間體現(xiàn)出差異性.

    另一方面,WSAdam采用加權(quán)平均的輸出方式,保持了on-the-fly計(jì)算的優(yōu)點(diǎn),更為重要的一點(diǎn)是,所加權(quán)重消去了導(dǎo)致以往算法產(chǎn)生對(duì)數(shù)階的結(jié)構(gòu),因此能夠達(dá)到最優(yōu)收斂,這將在下一節(jié)中展開說明.

    4 WSAdam算法收斂速率分析

    為了達(dá)到非光滑強(qiáng)凸情形的最優(yōu)收斂速率,我們首先尋找SGD產(chǎn)生對(duì)數(shù)階的原因,然后介紹加權(quán)平均輸出技巧解決此問題的原理.

    首先,我們需要給出一些假設(shè)條件,這些假設(shè)在以往收斂性分析中普遍存在.

    假設(shè)1存在常數(shù)G>0和G∞>0使得:

    假設(shè)2存在常數(shù)D>0和D∞>0使得:

    然后,根據(jù)文獻(xiàn)[9]中對(duì)強(qiáng)凸SGD的分析得下式:

    其中,αt是步長,λmin是強(qiáng)凸系數(shù)λ中的最小元素值.令上式得:

    對(duì)上式從t=1到t=T求和得:

    從上式第二行可以觀察到,前一項(xiàng)為負(fù)數(shù)可以放縮消去,第二項(xiàng)導(dǎo)致了對(duì)數(shù)因子的產(chǎn)生.

    因此我們著重處理后一項(xiàng),采用權(quán)重為t的加權(quán)平均輸出方式,令上式不等號(hào)兩邊同時(shí)乘t得到:

    觀察上式最后一行,發(fā)現(xiàn)后一項(xiàng)上的1t已被消去,此時(shí)從t=1到t=T求和不會(huì)再產(chǎn)生對(duì)數(shù)因子,做加權(quán)平均可得如下最優(yōu)收斂速率:

    本文將上述原理遷移到WSAdam算法的收斂性分析中,此外,還需要如下引理.

    引理1假設(shè)1≤t≤T,0<ν<1,f(ν)表示關(guān)于ν的函數(shù),(f(ν))'表示f(ν)的導(dǎo)函數(shù),則有下式成立:

    證明

    引理1證畢.

    定理1令假設(shè)1和假設(shè)2成立由算法4產(chǎn)生,f滿足定義1中的λ-強(qiáng)凸性質(zhì),w*∈Q為問題式(1)的一個(gè)最優(yōu)解,結(jié)合引理1,隨機(jī)WSAdam能夠保證如下收斂速率:

    注意,上式表明WSAdam具有O(1/T)的最優(yōu)收斂速率.與SAdam達(dá)到O(logT/T)次優(yōu)收斂速率相比,WSAdam體現(xiàn)出了動(dòng)量方法的加速性,填補(bǔ)了Adam型算法在非光滑強(qiáng)凸情形最優(yōu)收斂性方面的缺失.

    證明根據(jù)算法5中步驟7,由投影非擴(kuò)張性可得:

    上式移項(xiàng),兩邊除以2at(1-β1,t)得:

    因?yàn)閒(wt,ξt)滿足λ-強(qiáng)凸,聯(lián)立上式得:

    上式不等號(hào)兩邊同時(shí)取期望得:

    上式不等號(hào)兩邊同乘以t,并從t=1到t=T求和得:

    首先處理P1:

    即:

    然后處理P2,由m0=0,β1,t≤1,β1,t≤β1,t-1得:

    將mt和展開得:

    最后處理P3:

    上式結(jié)合引理1得:

    聯(lián)立P1,P2,P3得:

    由凸函數(shù)基本性質(zhì)得最終加權(quán)平均收斂速率:

    定理1證畢.

    5 實(shí)驗(yàn)

    本節(jié)分兩部分對(duì)上一節(jié)中最優(yōu)收斂速率的理論分析進(jìn)行實(shí)驗(yàn)驗(yàn)證.第一部分驗(yàn)證WSAdam算法能夠解決Reddi問題;第二部分驗(yàn)證WSAdam在非光滑強(qiáng)凸情形優(yōu)于現(xiàn)有算法.

    5.1 Reddi問題的實(shí)驗(yàn)結(jié)果與分析

    2018年,Reddi等人證明了Adam算法在優(yōu)化一個(gè)經(jīng)過特殊構(gòu)造的一般凸函數(shù)時(shí)發(fā)散.事實(shí)上,所有基于EMA技巧的Adam型算法都有可能存在這個(gè)問題,也被稱為Reddi問題:

    考慮如下定義域?yàn)閇-1,+1]的線性函數(shù)序列:

    其中C=3.在這個(gè)函數(shù)序列中,可以明顯看出當(dāng)w=-1時(shí)得到最小的后悔界.然而,Adam錯(cuò)誤地將參數(shù)指向+1方向進(jìn)行更新,導(dǎo)致不收斂.

    本文實(shí)驗(yàn)設(shè)置初始w=1,t=[1,5000],將WSAdam與其他4種經(jīng)典Adam型算進(jìn)行比較,觀察它們解上述在線優(yōu)化問題的表現(xiàn).為公平起見,所有算法統(tǒng)一設(shè)置參數(shù)α=0.5,β1=0,δ=1e-8,Adam和AMSGrad均設(shè)置β2=0.1,AdamNC、SAdam和WSAdam均設(shè)置β2,t=1-0.1t.實(shí)驗(yàn)結(jié)果如圖1所示,其中圖1(a)的橫坐標(biāo)代表迭代次數(shù)(t),縱坐標(biāo)代表平均后悔界(Regret boundt);圖1(b)的橫坐標(biāo)代表迭代次數(shù)(t),縱坐標(biāo)代表參數(shù)(w).如圖1所示,在迭代5000次后,Adam參數(shù)值w=+1是次優(yōu)解,平均后悔界無法收斂到0,從而證實(shí)了Reddi問題.AMSGrad、AdamNC、SAdam和WSAdam的參數(shù)值w=-1達(dá)到了最優(yōu)解,且平均后悔界均收斂到0,證實(shí)了這些算法改進(jìn)Adam是有效的,成功解決了Reddi問題.

    另外,從圖1(a)中還可以看出,強(qiáng)凸算法SAdam、WSAdam比一般凸算法Adam、AMSGrad、AdamNC收斂更快,說明SAdam、WSAdam對(duì)一般凸函數(shù)同樣適用,并且本文所提WSAdam收斂最快,優(yōu)于現(xiàn)有的Adam型算法.

    圖1 Reddi問題實(shí)驗(yàn)結(jié)果

    5.2 非光滑強(qiáng)凸情形標(biāo)準(zhǔn)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果與分析

    本文第二個(gè)實(shí)驗(yàn)繼承文獻(xiàn)[21]中隨機(jī)設(shè)置環(huán)境,考慮典型的二分類強(qiáng)凸支持向量機(jī)(SVM)問題,假設(shè)全體樣本集目標(biāo)函數(shù)f(w,ξ)由l2范數(shù)結(jié)構(gòu)項(xiàng)和非光滑hinge損失組成,描述如下:

    第t次迭代時(shí),抽取樣本子集ξt參與計(jì)算的次梯度?f(wt,ξt)可以寫成如下形式:

    采用6個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,分別是cod-rna、ijcnn1、gisette、madelon、a9a和live-disorders.這些數(shù)據(jù)集均來自于LIBSVM網(wǎng) 站(https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/),具體描述可見表2.

    表2 標(biāo)準(zhǔn)數(shù)據(jù)庫描述

    實(shí)驗(yàn)選擇了著名的解SVM問題的pegasos[21]算法,以及幾種典型的強(qiáng)凸Adam型算法作為比較對(duì)象.為公平起見,所有算法設(shè)置參數(shù)α=1.另外,pegasos根據(jù)文獻(xiàn)[21]所述無其他預(yù)設(shè)參數(shù);SAdam根據(jù)文獻(xiàn)[20]設(shè)置β1=0.9,β2,t=1-0.9t,δ=1e-2;WSAdam根據(jù)算法4設(shè) 置β1=0.9,ν=0.999,β2,t=1-0.9t,δ=1e-8;SCAdagrad根據(jù)文獻(xiàn)[17]設(shè)置ε1=0.1,ε2=1;SC-RMSProp根據(jù)文獻(xiàn)[17]設(shè)置β2,t=1-0.9t,ε1=0.1,ε2=1.

    所有算法在每個(gè)數(shù)據(jù)集上運(yùn)行10次并取平均值繪制收斂曲線errorbar對(duì)比圖.如圖2所示,橫坐標(biāo)表示迭代次數(shù)t=[1,5000],縱坐標(biāo)為相對(duì)目標(biāo)函數(shù)值,即當(dāng)前迭代目標(biāo)函數(shù)值與目標(biāo)函數(shù)最優(yōu)值(最優(yōu)值取所有迭代結(jié)果中的最小值)之差的對(duì)數(shù)值,4種比較算法的相對(duì)目標(biāo)函數(shù)值形式為WSAdam的相對(duì)目標(biāo)函數(shù)值形式為藍(lán)色實(shí)線代表pegasos算法的收斂趨勢(shì);綠色實(shí)線代表SAdam算法的收斂趨;紅色實(shí)現(xiàn)代表WSAdam算法的收斂趨;黑色實(shí)線代表SC-Adagrad算法的收斂趨;青綠色實(shí)現(xiàn)代表SC-RMSProp算法的收斂趨.

    從圖2可以看出,沒有使用自適應(yīng)步長和動(dòng)量技巧的pegasos十次平均曲線波動(dòng)較大、方差大也大,收斂速率平緩,總體性能要差于其他4種Adam型算法.而本文所提出的WSAdam十次平均曲線非常平滑(這是更改為加權(quán)平均輸出所導(dǎo)致的),方差也較小.在6個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上,WSAdam與現(xiàn)有流行的強(qiáng)凸Adam型算法均表現(xiàn)出基本相同的收斂趨勢(shì),甚至在一些訓(xùn)練集上(cod-rna)性能遠(yuǎn)超現(xiàn)有算法.并且在同一精度要求下,WSAdam的收斂速度總體上是最快的.這與理論分析中,WSAdam能達(dá)到優(yōu)于其他算法的O(1/T)收斂速率結(jié)果相吻合.

    圖2 目標(biāo)函數(shù)收斂速率比較圖

    表3和表4分別給出了算法在6個(gè)數(shù)據(jù)集上訓(xùn)練所得模型的訓(xùn)練準(zhǔn)確率(以及十次結(jié)果方差)、測(cè)試準(zhǔn)確率(以及十次結(jié)果方差).容易看出:WSAdam在所有訓(xùn)練數(shù)據(jù)集上的準(zhǔn)確率均為最高,方差較其他算法處于較低的層次.WSAdam在絕大部分測(cè)試數(shù)據(jù)集上準(zhǔn)確率最高(在cod-rna上SAdam算法準(zhǔn)確率最高)).一定程度上說明了WSAdam比其他幾種算法訓(xùn)練的模型泛化性能更好,并且在訓(xùn)練和測(cè)試集上都保持較小實(shí)驗(yàn)方差,反映出其出色的穩(wěn)定性.

    表3 訓(xùn)練準(zhǔn)確率和方差比較

    表4 測(cè)試準(zhǔn)確率和方差比較

    6 結(jié)論

    本文提出了一種名為WSAdam的Adam型算法,證明了在非光滑強(qiáng)凸情形,WSAdam能達(dá)到O(1T)的最優(yōu)收斂速率,體現(xiàn)了動(dòng)量方法的加速性.據(jù)我們所知這是第一個(gè)被證明具有最優(yōu)收斂速率的自適應(yīng)步長策略與動(dòng)量方法結(jié)合的算法.與SAdam算法相比,WSAdam改用了加權(quán)平均的輸出方式,使算法在保持on-the-fly計(jì)算特點(diǎn)的同時(shí),直接去掉了理論收斂速率上的對(duì)數(shù)階因子.實(shí)驗(yàn)驗(yàn)證了所提算法成功避免Reddi提出的不收斂問題,并在解決非光滑強(qiáng)凸優(yōu)化問題時(shí)比現(xiàn)有算法性能更優(yōu).

    另一方面,自適應(yīng)步長算法利用對(duì)角矩陣中記錄的歷史數(shù)據(jù)幾何知識(shí),緩和了對(duì)超參數(shù)的依賴性,因此非常適合訓(xùn)練深度神經(jīng)網(wǎng)絡(luò).將WSAdam與動(dòng)量方法[22]結(jié)合,探索其瞬時(shí)收斂速率[23]并推廣到深度學(xué)習(xí)[24,25]中,將是我們下一步研究的方向.

    猜你喜歡
    對(duì)數(shù)情形步長
    含有對(duì)數(shù)非線性項(xiàng)Kirchhoff方程多解的存在性
    基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
    指數(shù)與對(duì)數(shù)
    指數(shù)與對(duì)數(shù)
    避免房地產(chǎn)繼承糾紛的十二種情形
    四種情形拖欠勞動(dòng)報(bào)酬構(gòu)成“拒不支付”犯罪
    公民與法治(2020年4期)2020-05-30 12:31:34
    對(duì)數(shù)簡史
    出借車輛,五種情形下須擔(dān)責(zé)
    公民與法治(2016年9期)2016-05-17 04:12:18
    基于逐維改進(jìn)的自適應(yīng)步長布谷鳥搜索算法
    一種新型光伏系統(tǒng)MPPT變步長滯環(huán)比較P&O法
    亚洲精品美女久久av网站| 亚洲av免费高清在线观看| 亚洲内射少妇av| 啦啦啦在线免费观看视频4| 我要看黄色一级片免费的| av不卡在线播放| 精品国产超薄肉色丝袜足j| 少妇精品久久久久久久| www.av在线官网国产| av.在线天堂| 一区在线观看完整版| 免费久久久久久久精品成人欧美视频| 欧美国产精品va在线观看不卡| 久久久久久久大尺度免费视频| 精品国产一区二区三区四区第35| 伊人久久大香线蕉亚洲五| 精品午夜福利在线看| 免费av中文字幕在线| 久久久久久伊人网av| 亚洲美女视频黄频| 中文字幕另类日韩欧美亚洲嫩草| 在线观看一区二区三区激情| 久久人人爽人人片av| 欧美日韩av久久| 国产精品嫩草影院av在线观看| 午夜福利影视在线免费观看| xxx大片免费视频| 热99久久久久精品小说推荐| 国产在线一区二区三区精| 2022亚洲国产成人精品| 一级a爱视频在线免费观看| 最黄视频免费看| 国产成人一区二区在线| 9热在线视频观看99| 国产97色在线日韩免费| 日韩,欧美,国产一区二区三区| 九色亚洲精品在线播放| √禁漫天堂资源中文www| 最近最新中文字幕大全免费视频 | 国产精品国产三级国产专区5o| 婷婷色综合www| 少妇熟女欧美另类| 久久久久久久久免费视频了| 亚洲精品一二三| 亚洲欧美清纯卡通| 少妇猛男粗大的猛烈进出视频| 日韩成人av中文字幕在线观看| 爱豆传媒免费全集在线观看| 日韩一区二区视频免费看| 亚洲精品美女久久av网站| 亚洲国产精品一区二区三区在线| 最黄视频免费看| 亚洲内射少妇av| av在线播放精品| 亚洲五月色婷婷综合| 女人高潮潮喷娇喘18禁视频| 巨乳人妻的诱惑在线观看| 美女福利国产在线| 人妻系列 视频| 精品亚洲成a人片在线观看| 久久国产精品男人的天堂亚洲| 亚洲在久久综合| 免费观看av网站的网址| 两个人免费观看高清视频| 亚洲久久久国产精品| 欧美精品一区二区大全| 一区在线观看完整版| 十分钟在线观看高清视频www| av又黄又爽大尺度在线免费看| 欧美另类一区| 99久久综合免费| 少妇 在线观看| av在线老鸭窝| 宅男免费午夜| 国产在线免费精品| 麻豆av在线久日| 一区二区三区精品91| 亚洲欧洲国产日韩| 精品久久蜜臀av无| 丰满乱子伦码专区| 久久午夜福利片| 狂野欧美激情性bbbbbb| 亚洲伊人色综图| 宅男免费午夜| 亚洲人成77777在线视频| 亚洲精品自拍成人| av免费在线看不卡| 黑人欧美特级aaaaaa片| 美女福利国产在线| 2021少妇久久久久久久久久久| 黑人猛操日本美女一级片| 啦啦啦中文免费视频观看日本| 色视频在线一区二区三区| 亚洲伊人久久精品综合| 搡女人真爽免费视频火全软件| 99香蕉大伊视频| 97在线视频观看| 日日摸夜夜添夜夜爱| 国产无遮挡羞羞视频在线观看| 另类精品久久| 亚洲少妇的诱惑av| 午夜福利,免费看| 熟女电影av网| 最近最新中文字幕大全免费视频 | 色婷婷久久久亚洲欧美| 啦啦啦啦在线视频资源| 免费久久久久久久精品成人欧美视频| 国产免费一区二区三区四区乱码| a 毛片基地| 9热在线视频观看99| 国产在线一区二区三区精| 老汉色∧v一级毛片| 成人二区视频| 老汉色∧v一级毛片| 十八禁高潮呻吟视频| 人妻 亚洲 视频| 精品一品国产午夜福利视频| 不卡视频在线观看欧美| 国产一区二区激情短视频 | 日本wwww免费看| 日产精品乱码卡一卡2卡三| 大香蕉久久成人网| 91午夜精品亚洲一区二区三区| 美女脱内裤让男人舔精品视频| 亚洲欧美一区二区三区久久| 午夜日韩欧美国产| 午夜福利视频精品| 大码成人一级视频| 久久99热这里只频精品6学生| 香蕉精品网在线| 午夜91福利影院| 久久热在线av| 两个人看的免费小视频| 久久午夜福利片| 在线 av 中文字幕| 最近2019中文字幕mv第一页| www.自偷自拍.com| 午夜福利,免费看| 在线精品无人区一区二区三| 秋霞伦理黄片| 国产爽快片一区二区三区| 亚洲三级黄色毛片| 国产精品麻豆人妻色哟哟久久| 天天躁狠狠躁夜夜躁狠狠躁| kizo精华| videosex国产| 在线看a的网站| 久久99蜜桃精品久久| 青草久久国产| 国产精品国产三级专区第一集| 国产男女超爽视频在线观看| 亚洲男人天堂网一区| 黄色配什么色好看| 男女下面插进去视频免费观看| 亚洲一区二区三区欧美精品| 国产精品秋霞免费鲁丝片| 成年女人毛片免费观看观看9 | 老女人水多毛片| 亚洲图色成人| 男女边摸边吃奶| 久久热在线av| 丝袜喷水一区| 街头女战士在线观看网站| 久久国产亚洲av麻豆专区| 亚洲图色成人| 亚洲经典国产精华液单| 一级片免费观看大全| 亚洲av.av天堂| 观看美女的网站| 欧美国产精品va在线观看不卡| 在线亚洲精品国产二区图片欧美| 精品人妻在线不人妻| 久久毛片免费看一区二区三区| 人妻一区二区av| 亚洲av日韩在线播放| 一区二区日韩欧美中文字幕| 久热久热在线精品观看| 天堂俺去俺来也www色官网| 丰满饥渴人妻一区二区三| 老熟女久久久| 尾随美女入室| 亚洲人成77777在线视频| 超色免费av| 一本—道久久a久久精品蜜桃钙片| 亚洲av电影在线观看一区二区三区| 男女高潮啪啪啪动态图| 成人毛片60女人毛片免费| freevideosex欧美| 日本vs欧美在线观看视频| 久久人人爽av亚洲精品天堂| 午夜激情av网站| 最新中文字幕久久久久| 国产精品偷伦视频观看了| av在线观看视频网站免费| 日韩伦理黄色片| 久久久久国产一级毛片高清牌| 免费久久久久久久精品成人欧美视频| 少妇猛男粗大的猛烈进出视频| 色婷婷久久久亚洲欧美| 女人被躁到高潮嗷嗷叫费观| 十八禁高潮呻吟视频| 国产色婷婷99| 成年人免费黄色播放视频| 久久精品人人爽人人爽视色| 一区二区三区精品91| 亚洲熟女精品中文字幕| 一本—道久久a久久精品蜜桃钙片| 久久久久人妻精品一区果冻| 我要看黄色一级片免费的| 高清在线视频一区二区三区| 18+在线观看网站| 精品酒店卫生间| 午夜福利在线免费观看网站| 在线天堂最新版资源| 1024香蕉在线观看| 两个人看的免费小视频| 国产一区二区在线观看av| 日本av免费视频播放| 婷婷色综合大香蕉| 国产极品粉嫩免费观看在线| 日韩制服骚丝袜av| av一本久久久久| 久久午夜综合久久蜜桃| 欧美日韩视频高清一区二区三区二| 日本爱情动作片www.在线观看| 99久久综合免费| 女性被躁到高潮视频| 欧美成人午夜精品| 人妻系列 视频| 黄色 视频免费看| 久久精品国产鲁丝片午夜精品| 国产xxxxx性猛交| 午夜福利乱码中文字幕| 国产不卡av网站在线观看| 日产精品乱码卡一卡2卡三| av又黄又爽大尺度在线免费看| 免费观看无遮挡的男女| 九九爱精品视频在线观看| 人人妻人人澡人人爽人人夜夜| 久久免费观看电影| 侵犯人妻中文字幕一二三四区| 成人18禁高潮啪啪吃奶动态图| 精品一区在线观看国产| 国产综合精华液| 最新中文字幕久久久久| 成人漫画全彩无遮挡| 亚洲欧美精品综合一区二区三区 | 日韩一区二区视频免费看| 人体艺术视频欧美日本| 亚洲一级一片aⅴ在线观看| 免费观看性生交大片5| 少妇熟女欧美另类| 秋霞伦理黄片| 国产极品天堂在线| 色哟哟·www| 日韩中文字幕欧美一区二区 | 日日爽夜夜爽网站| 妹子高潮喷水视频| 人妻 亚洲 视频| 欧美日韩成人在线一区二区| 一级毛片电影观看| 久久精品夜色国产| 欧美人与善性xxx| 看非洲黑人一级黄片| 大片免费播放器 马上看| 久久久a久久爽久久v久久| 永久网站在线| 欧美国产精品一级二级三级| 日韩中文字幕欧美一区二区 | 97精品久久久久久久久久精品| 1024香蕉在线观看| 欧美人与性动交α欧美精品济南到 | 99国产综合亚洲精品| 国产一区亚洲一区在线观看| 久久久久网色| 美女午夜性视频免费| 人成视频在线观看免费观看| 搡老乐熟女国产| 如何舔出高潮| 国产成人精品在线电影| 日韩三级伦理在线观看| 国产成人aa在线观看| 亚洲,欧美,日韩| 精品国产一区二区久久| 最近手机中文字幕大全| 亚洲精品久久成人aⅴ小说| av在线观看视频网站免费| 亚洲,一卡二卡三卡| 最近2019中文字幕mv第一页| 国产xxxxx性猛交| 18在线观看网站| 综合色丁香网| 一级a爱视频在线免费观看| 丁香六月天网| 高清黄色对白视频在线免费看| av免费观看日本| 久久99热这里只频精品6学生| 老熟女久久久| 寂寞人妻少妇视频99o| 有码 亚洲区| 日韩中文字幕欧美一区二区 | 欧美成人午夜精品| 国产在线免费精品| 亚洲成国产人片在线观看| 亚洲国产精品成人久久小说| a级片在线免费高清观看视频| 欧美人与性动交α欧美精品济南到 | 欧美人与性动交α欧美软件| 一区二区日韩欧美中文字幕| 欧美日韩视频精品一区| 精品国产国语对白av| 成年女人在线观看亚洲视频| 中文欧美无线码| 国产免费视频播放在线视频| 一级爰片在线观看| 最新的欧美精品一区二区| 啦啦啦中文免费视频观看日本| 国产野战对白在线观看| 一级,二级,三级黄色视频| 亚洲 欧美一区二区三区| 午夜老司机福利剧场| 国产乱人偷精品视频| 边亲边吃奶的免费视频| 成人漫画全彩无遮挡| 亚洲美女搞黄在线观看| 高清黄色对白视频在线免费看| 两个人看的免费小视频| 亚洲av在线观看美女高潮| 成人毛片60女人毛片免费| 人人澡人人妻人| 十八禁高潮呻吟视频| 一级,二级,三级黄色视频| 亚洲色图综合在线观看| 在线观看一区二区三区激情| 免费人妻精品一区二区三区视频| 卡戴珊不雅视频在线播放| 亚洲三级黄色毛片| 制服诱惑二区| 国产在视频线精品| 18禁国产床啪视频网站| 日本wwww免费看| 777久久人妻少妇嫩草av网站| 国产一区二区三区综合在线观看| 女人精品久久久久毛片| 久久久久久免费高清国产稀缺| 中文字幕另类日韩欧美亚洲嫩草| 成人18禁高潮啪啪吃奶动态图| 又粗又硬又长又爽又黄的视频| 国产男人的电影天堂91| videossex国产| 纯流量卡能插随身wifi吗| av.在线天堂| 亚洲成色77777| 一区二区av电影网| 9热在线视频观看99| 不卡视频在线观看欧美| 国产一区亚洲一区在线观看| 久久久久国产精品人妻一区二区| 人妻 亚洲 视频| 这个男人来自地球电影免费观看 | 一本—道久久a久久精品蜜桃钙片| 亚洲国产精品成人久久小说| 1024香蕉在线观看| 久久久久精品久久久久真实原创| 美国免费a级毛片| 男人添女人高潮全过程视频| 91aial.com中文字幕在线观看| 亚洲精品国产色婷婷电影| 久久精品国产鲁丝片午夜精品| 亚洲av日韩在线播放| 久久午夜综合久久蜜桃| 亚洲伊人色综图| 亚洲精品视频女| 亚洲色图综合在线观看| tube8黄色片| 亚洲国产欧美日韩在线播放| 欧美日本中文国产一区发布| 91国产中文字幕| h视频一区二区三区| 中文字幕人妻丝袜一区二区 | 黄色怎么调成土黄色| 水蜜桃什么品种好| 自线自在国产av| 80岁老熟妇乱子伦牲交| 日韩,欧美,国产一区二区三区| 男女啪啪激烈高潮av片| 亚洲伊人久久精品综合| 亚洲欧洲精品一区二区精品久久久 | 久久精品国产鲁丝片午夜精品| 国产在线免费精品| 中文字幕人妻熟女乱码| 天天躁日日躁夜夜躁夜夜| 午夜影院在线不卡| 美女大奶头黄色视频| 啦啦啦在线免费观看视频4| 国产在线视频一区二区| 午夜日韩欧美国产| 欧美xxⅹ黑人| 少妇人妻精品综合一区二区| 街头女战士在线观看网站| 999精品在线视频| 这个男人来自地球电影免费观看 | 波野结衣二区三区在线| 视频区图区小说| av国产久精品久网站免费入址| 成人午夜精彩视频在线观看| 日本色播在线视频| 亚洲精品成人av观看孕妇| 十八禁网站网址无遮挡| 九草在线视频观看| 成年女人毛片免费观看观看9 | 国产精品99久久99久久久不卡 | 欧美日韩综合久久久久久| 在线观看国产h片| 亚洲欧美色中文字幕在线| 国产熟女午夜一区二区三区| 少妇猛男粗大的猛烈进出视频| 日本欧美视频一区| 最新中文字幕久久久久| 久久久久精品性色| 不卡视频在线观看欧美| 国产片内射在线| 久久久a久久爽久久v久久| 男人操女人黄网站| 欧美日韩av久久| 黑丝袜美女国产一区| 亚洲 欧美一区二区三区| 在线观看一区二区三区激情| 飞空精品影院首页| 亚洲第一区二区三区不卡| 一级毛片电影观看| 纯流量卡能插随身wifi吗| 成年美女黄网站色视频大全免费| 色视频在线一区二区三区| 高清在线视频一区二区三区| 18在线观看网站| 91精品国产国语对白视频| 巨乳人妻的诱惑在线观看| 亚洲国产av新网站| 亚洲欧美精品综合一区二区三区 | 男女啪啪激烈高潮av片| 婷婷色av中文字幕| 久久这里只有精品19| 国产精品久久久av美女十八| 欧美精品av麻豆av| 亚洲精品美女久久久久99蜜臀 | 久久精品国产自在天天线| 777米奇影视久久| 国产精品熟女久久久久浪| 国产精品.久久久| 熟女少妇亚洲综合色aaa.| 日本91视频免费播放| 国产精品无大码| 免费日韩欧美在线观看| 国产成人精品在线电影| 久久影院123| 久久这里有精品视频免费| 亚洲av.av天堂| 日本欧美视频一区| 黑人欧美特级aaaaaa片| 99re6热这里在线精品视频| 中文字幕最新亚洲高清| 欧美变态另类bdsm刘玥| 欧美国产精品一级二级三级| 国产淫语在线视频| 成人国产av品久久久| 一级片免费观看大全| videossex国产| 五月开心婷婷网| 黄色怎么调成土黄色| 蜜桃在线观看..| 18在线观看网站| 久久久精品区二区三区| 极品人妻少妇av视频| 久久精品熟女亚洲av麻豆精品| 97在线视频观看| 久久久精品免费免费高清| 有码 亚洲区| 欧美av亚洲av综合av国产av | 色吧在线观看| 欧美成人午夜免费资源| 亚洲国产毛片av蜜桃av| 男女啪啪激烈高潮av片| 狂野欧美激情性bbbbbb| 日韩av不卡免费在线播放| 日本欧美国产在线视频| 美女脱内裤让男人舔精品视频| 黄色毛片三级朝国网站| 国产在线视频一区二区| 亚洲情色 制服丝袜| 免费在线观看完整版高清| 亚洲精品国产色婷婷电影| 一区二区日韩欧美中文字幕| 赤兔流量卡办理| 免费不卡的大黄色大毛片视频在线观看| 亚洲av在线观看美女高潮| 欧美bdsm另类| 欧美成人精品欧美一级黄| 成人黄色视频免费在线看| 久久久久国产精品人妻一区二区| 一级毛片电影观看| 天天躁狠狠躁夜夜躁狠狠躁| 99久久中文字幕三级久久日本| 天天躁夜夜躁狠狠躁躁| 国产欧美日韩综合在线一区二区| 国产精品一二三区在线看| 超碰成人久久| 国产精品av久久久久免费| 叶爱在线成人免费视频播放| 国产精品一区二区在线不卡| 免费黄网站久久成人精品| 国产一区二区在线观看av| 丝瓜视频免费看黄片| 欧美日韩视频精品一区| 美女视频免费永久观看网站| 午夜av观看不卡| 精品国产超薄肉色丝袜足j| 波多野结衣一区麻豆| 亚洲三区欧美一区| 只有这里有精品99| 日韩一区二区三区影片| 久久精品亚洲av国产电影网| 热re99久久精品国产66热6| 一区二区三区精品91| 啦啦啦啦在线视频资源| 欧美日韩视频精品一区| 久久久久久久大尺度免费视频| 久久精品久久久久久噜噜老黄| 久久久久久人妻| 七月丁香在线播放| 国产又色又爽无遮挡免| 咕卡用的链子| 国产精品偷伦视频观看了| 精品亚洲成国产av| 国产综合精华液| 久久女婷五月综合色啪小说| 热99国产精品久久久久久7| 两性夫妻黄色片| 国产一区有黄有色的免费视频| 在线观看国产h片| 国产av码专区亚洲av| 久久久精品区二区三区| 精品久久蜜臀av无| 看免费成人av毛片| 欧美精品亚洲一区二区| 精品久久久久久电影网| 免费看不卡的av| 午夜91福利影院| 免费人妻精品一区二区三区视频| av在线老鸭窝| 色视频在线一区二区三区| 国产成人精品久久久久久| 妹子高潮喷水视频| av网站在线播放免费| 九草在线视频观看| 最近2019中文字幕mv第一页| 日韩一卡2卡3卡4卡2021年| 久久毛片免费看一区二区三区| av国产久精品久网站免费入址| 欧美日韩成人在线一区二区| 欧美精品高潮呻吟av久久| 校园人妻丝袜中文字幕| 天天操日日干夜夜撸| 亚洲美女搞黄在线观看| 国产人伦9x9x在线观看 | 一区二区三区四区激情视频| 伊人亚洲综合成人网| 久久精品国产a三级三级三级| 国产精品一区二区在线不卡| 中文字幕人妻丝袜制服| 如何舔出高潮| 多毛熟女@视频| 国产男女超爽视频在线观看| 激情视频va一区二区三区| 777米奇影视久久| 国产一区二区激情短视频 | 日韩伦理黄色片| 80岁老熟妇乱子伦牲交| 精品久久久精品久久久| 哪个播放器可以免费观看大片| 久久国产精品男人的天堂亚洲| 日日摸夜夜添夜夜爱| 视频在线观看一区二区三区| videos熟女内射| 色视频在线一区二区三区| 欧美精品一区二区大全| 精品亚洲乱码少妇综合久久| 国产综合精华液| 欧美精品一区二区大全| 亚洲少妇的诱惑av| 日本av手机在线免费观看| 亚洲av欧美aⅴ国产| 十八禁高潮呻吟视频| 天美传媒精品一区二区| 男的添女的下面高潮视频| 青春草国产在线视频| 亚洲熟女精品中文字幕| 国产精品女同一区二区软件| 精品视频人人做人人爽| 黑人猛操日本美女一级片| 少妇被粗大的猛进出69影院| 天堂8中文在线网| 久久国产精品大桥未久av| 在线 av 中文字幕| 国产黄色免费在线视频| 晚上一个人看的免费电影| 久久久久久伊人网av| 青春草视频在线免费观看| 久久热在线av| 免费高清在线观看日韩| 亚洲精品国产av成人精品| 日韩av不卡免费在线播放| 欧美成人精品欧美一级黄| 少妇人妻久久综合中文| 一区福利在线观看|