• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于值函數(shù)遷移的啟發(fā)式Sarsa算法

    2018-09-12 03:05:44陳建平楊正霞劉全吳宏杰徐楊傅啟明
    通信學(xué)報 2018年8期
    關(guān)鍵詞:變分貝葉斯度量

    陳建平,楊正霞,劉全,吳宏杰,徐楊,傅啟明

    ?

    基于值函數(shù)遷移的啟發(fā)式Sarsa算法

    陳建平1,2,3,楊正霞1,2,3,劉全4,吳宏杰1,2,3,徐楊5,傅啟明1,2,3

    (1. 蘇州科技大學(xué)電子與信息工程學(xué)院,江蘇 蘇州 215009;2. 蘇州科技大學(xué)江蘇省建筑智慧節(jié)能重點(diǎn)實(shí)驗室,江蘇 蘇州 215009;3. 蘇州科技大學(xué)蘇州市移動網(wǎng)絡(luò)技術(shù)與應(yīng)用重點(diǎn)實(shí)驗室,江蘇 蘇州 215009;4. 蘇州大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215000;5. 浙江紡織服裝職業(yè)技術(shù)學(xué)院信息工程學(xué)院,浙江 寧波 315000)

    針對Sarsa算法存在的收斂速度較慢的問題,提出一種改進(jìn)的基于值函數(shù)遷移的啟發(fā)式Sarsa算法(VFT-HSA)。該算法將Sarsa算法與值函數(shù)遷移方法相結(jié)合,引入自模擬度量方法,在相同的狀態(tài)空間和動作空間下,對新任務(wù)與歷史任務(wù)之間的不同狀態(tài)進(jìn)行相似性度量,對滿足條件的歷史狀態(tài)進(jìn)行值函數(shù)遷移,提高算法的收斂速度。此外,該算法結(jié)合啟發(fā)式探索方法,引入貝葉斯推理,結(jié)合變分推理衡量信息增益,并運(yùn)用獲取的信息增益構(gòu)建內(nèi)在獎賞函數(shù)作為探索因子,進(jìn)而加快算法的收斂速度。將所提算法用于經(jīng)典的Grid World問題,并與Sarsa算法、Q-Learning算法以及收斂性能較好的VFT-Sarsa算法、IGP-Sarsa算法進(jìn)行比較,實(shí)驗表明,所提算法具有較快的收斂速度和較好的穩(wěn)定性。

    強(qiáng)化學(xué)習(xí);值函數(shù)遷移;自模擬度量;變分貝葉斯

    1 引言

    強(qiáng)化學(xué)習(xí)(RL, reinforcement learning)又稱激勵學(xué)習(xí)、增強(qiáng)學(xué)習(xí),是在未知、動態(tài)環(huán)境中通過agent與環(huán)境的交互實(shí)現(xiàn)從狀態(tài)到動作的映射,并獲得最大期望累計獎賞的一類在線學(xué)習(xí)方法[1]。在強(qiáng)化學(xué)習(xí)問題中,新的強(qiáng)化學(xué)習(xí)任務(wù)與歷史任務(wù)之間會存在某種相似性,因此可利用兩者之間的相似性來提高目標(biāo)任務(wù)的學(xué)習(xí)速率,這需要運(yùn)用遷移學(xué)習(xí)(TL, transfer learning)方法。1995年,遷移學(xué)習(xí)被首次以“l(fā)earning to learn”的概念提出,引起學(xué)術(shù)界的廣泛關(guān)注[2]。遷移學(xué)習(xí)主要包括3個方面:遷移什么、如何進(jìn)行遷移、何時進(jìn)行遷移。通過這3個方面,可以使遷移學(xué)習(xí)達(dá)到提高目標(biāo)任務(wù)收斂速度的目的。然而遷移學(xué)習(xí)是對以往任務(wù)中學(xué)習(xí)的經(jīng)驗進(jìn)行利用,從而提高目標(biāo)任務(wù)的學(xué)習(xí)速率,但對于強(qiáng)化學(xué)習(xí)任務(wù)而言,其本身長期存在著平衡探索與利用之間關(guān)系的問題,有效地解決探索問題使agent獲得最大化環(huán)境信息的軌跡,可以加快目標(biāo)任務(wù)的學(xué)習(xí)速率。

    近年來,遷移學(xué)習(xí)在強(qiáng)化學(xué)習(xí)領(lǐng)域已引起廣大研究學(xué)者的關(guān)注。Ammar等[3]通過優(yōu)化不同任務(wù)間可轉(zhuǎn)移的知識庫,并通過對該知識庫間不同任務(wù)構(gòu)建映射關(guān)系,使新任務(wù)快速收斂。Gupta等[4]通過構(gòu)建狀態(tài)空間到不變特征空間之間的映射關(guān)系,將知識映射到不變特征空間,并利用構(gòu)建的映射關(guān)系實(shí)現(xiàn)知識的遷移,從而加快新任務(wù)的收斂速度。Laroche等[5]在假設(shè)不同任務(wù)具有相同狀態(tài)空間與動作空間的基礎(chǔ)上,通過添加探索因子構(gòu)建新的獎賞函數(shù),實(shí)現(xiàn)不同任務(wù)間的知識遷移,提高算法在后續(xù)任務(wù)中的收斂性能。Barreto等[6]提出在環(huán)境動態(tài)性不變的前提下,對不同任務(wù)之間的獎賞函數(shù)進(jìn)行遷移,從而加快算法的收斂速度。

    本文針對經(jīng)典的Sarsa算法存在收斂速度慢的問題,提出一種基于值函數(shù)遷移的啟發(fā)式Sarsa算法(VFT-HSA)。針對經(jīng)典Sarsa算法中值函數(shù)初始值的設(shè)定直接影響算法收斂速度的問題,VFT-HSA算法引入知識遷移,利用自模擬度量的方法,構(gòu)造目標(biāo)任務(wù)與歷史任務(wù)之間的度量關(guān)系,通過設(shè)定閾值,遷移歷史任務(wù)中的最優(yōu)值函數(shù),提高算法的收斂速度。針對大量算法問題中探索與利用不平衡的問題,VFT-HSA引入啟發(fā)式探索方法,利用貝葉斯推理,結(jié)合變分推理衡量信息增益,附加內(nèi)在獎賞函數(shù),從而提高算法的探索性能,加快算法的收斂速度。將VFT-HSA應(yīng)用于Grid World問題,實(shí)驗結(jié)果表明,VFT-HSA較其他算法具有更快的收斂速度和較好的穩(wěn)定性。

    2 相關(guān)理論

    2.1 馬爾可夫決策過程

    式(3)和式(4)也被稱為Bellman最優(yōu)方程。

    2.2 Sarsa算法

    在強(qiáng)化學(xué)習(xí)算法中,Sarsa算法能夠在未知獎賞函數(shù)與狀態(tài)轉(zhuǎn)移函數(shù)的情況下,采用狀態(tài)動作值迭代找到最優(yōu)策略,是一種在線學(xué)習(xí)算法。在Sarsa算法學(xué)習(xí)過程中,當(dāng)狀態(tài)動作對被無數(shù)次訪問時,Sarsa以概率1收斂到最優(yōu)策略以及最優(yōu)狀態(tài)動作值函數(shù),且策略將在有限的時間步內(nèi)收斂至貪心策略。然而,Sarsa算法是一種保守算法,為了減少損失,在學(xué)習(xí)過程中會選擇相對安全的動作,這使Sarsa算法在選取動作時缺乏一定的探索,進(jìn)而使Sarsa算法收斂速度相對較慢。Sarsa算法具體流程如算法1所示[1]。

    算法1 Sarsa算法

    2) repeat (對于每一個情節(jié))

    3) 初始化狀態(tài)

    4) 在狀態(tài)下,根據(jù)行為策略選擇動作

    5) repeat (對于情節(jié)中的每一步)

    10) end repeat

    11) end repeat

    12) 輸出:值函數(shù)

    2.3 自模擬度量

    2003年,Givan等[14]首次將自模擬關(guān)系引入MDP,并利用自模擬關(guān)系度量不同MDP中狀態(tài)之間的距離。其自模擬關(guān)系可簡單表述為:若2個狀態(tài)之間滿足自模擬關(guān)系,那么2個狀態(tài)之間的最優(yōu)值函數(shù)或最優(yōu)動作可相互共享。

    對于任意2個狀態(tài),它們之間的自模擬關(guān)系是“是”或“非”的關(guān)系,要么滿足自模擬關(guān)系,要么不滿足自模擬關(guān)系,但在實(shí)際應(yīng)用中,該方法太過于嚴(yán)苛。如果2個狀態(tài)的獎賞分布與狀態(tài)轉(zhuǎn)移概率分布極其近似,則2個狀態(tài)極其近似,根據(jù)以上條件可推測2個狀態(tài)具有相似的最優(yōu)動作和最優(yōu)值函數(shù),但自模擬關(guān)系無法證明該推測。因而Ferns等[15]針對該問題,利用Kantorovich距離,提出衡量2個狀態(tài)之間相似性關(guān)系的自模擬度量方法,并得到定理1。

    2.4 變分貝葉斯

    變分貝葉斯最早由Beal[16]提出,其可應(yīng)用于隱馬爾可夫模型、混合因子分析、非線性動力學(xué)、圖模型等。變分貝葉斯可較好地處理復(fù)雜統(tǒng)計模型。復(fù)雜統(tǒng)計模型由觀測變量、未知參數(shù)和潛變量這3類變量組成,其中,未知參數(shù)和潛變量統(tǒng)稱為不可觀測變量。

    采用變分貝葉斯具有如下優(yōu)點(diǎn):1)將不可觀測變量的后驗概率近似成其他變量,方便不可觀測變量的推斷;2)對于一個模型,給出邊緣似然函數(shù)的下界,當(dāng)邊緣似然函數(shù)值最高時,表明模型擬合程度越好,通過該方法可獲取最優(yōu)模型。

    3 VFT-HAS算法思想及簡介

    3.1 值函數(shù)遷移

    通常,對于MDP,可以通過迭代方法求出最優(yōu)狀態(tài)值函數(shù)或最優(yōu)動作值函數(shù),再由最優(yōu)值函數(shù)求解最優(yōu)策略。但對于每一個MDP,求解最優(yōu)值函數(shù)都需要進(jìn)行迭代計算,這會造成計算資源的浪費(fèi),因此考慮將已求解的歷史最優(yōu)值函數(shù)用于后續(xù)的MDP中,進(jìn)而求解最優(yōu)值函數(shù)。若2個狀態(tài)相似,它們應(yīng)該具有相似的最優(yōu)狀態(tài)值函數(shù),并利用自模擬度量關(guān)系,對相似狀態(tài)進(jìn)行值函數(shù)遷移。在對值函數(shù)遷移方法進(jìn)行介紹之前,先做如下假設(shè)。

    關(guān)于定理2的證明可參考文獻(xiàn)[17],為了更加充分地說明定理2,給出如下說明。

    圖1 MDP狀態(tài)轉(zhuǎn)移示意

    由定理2,給出不同MDP之間基于自模擬度量的值函數(shù)遷移算法,如算法2所示。

    算法2 基于自模擬度量的值函數(shù)遷移算法

    4) end for

    5) end for

    10) else

    12) end if

    13) end for

    3.2 基于變分貝葉斯的啟發(fā)式探索

    證畢。

    圖2 Kullback-Leibler散度關(guān)系

    結(jié)合上述原理,給出一種改進(jìn)的啟發(fā)式內(nèi)部獎賞函數(shù)的更新式,如式(9)所示。

    (14)

    3.3 VFT-HAS簡介

    基于值函數(shù)遷移的啟發(fā)式Sarsa算法主要利用自模擬度量方法對相似狀態(tài)之間的以往值函數(shù)知識進(jìn)行遷移,從而提高初始化值函數(shù)的精確性,并利用變分貝葉斯理論,獲得信息增益作為內(nèi)在獎賞函數(shù)進(jìn)行啟發(fā)式探索,結(jié)合Sarsa算法框架,利用V-Q算法中的更新方法更新值函數(shù)[18],提高算法收斂速度,具體如算法3所示。

    算法3 基于值函數(shù)遷移的啟發(fā)式Sarsa算法

    2) repeat (對于每一個情節(jié))

    4) repeat(對于情節(jié)中的每一個時間步)

    12) end repeat

    14) 算法終止

    15) end if

    18) end repeat

    基于值函數(shù)遷移的啟發(fā)式Sarsa算法主要分為3個部分,第一部分利用算法2知識遷移進(jìn)行初始化狀態(tài)值函數(shù);第二部分對狀態(tài)和動作及下一個狀態(tài)進(jìn)行采樣,通過變分貝葉斯理論衡量信息增益作為內(nèi)部獎賞函數(shù);第三部分在第二部分的基礎(chǔ)上更新狀態(tài)值函數(shù)和狀態(tài)動作值函數(shù),求解問題最優(yōu)策略,提高算法學(xué)習(xí)速率。

    4 實(shí)驗及結(jié)果分析

    為了研究算法的性能,將VFT-HSA應(yīng)用在Grid World問題中,并針對算法收斂的速度以及算法的穩(wěn)定性等方面進(jìn)行分析,將VFT-HSA與Sarsa算法、Q-Learning算法、VFT-Sarsa算法[17]、IGP-Sarsa[19]算法在相同的實(shí)驗環(huán)境中重復(fù)實(shí)驗24次,取每次實(shí)驗的平均值比較各算法的性能。

    4.1 Grid World問題介紹

    圖4 格子世界(目標(biāo)MDP)

    4.2 實(shí)驗設(shè)置

    圖5 格子世界(原始MDP)

    4.3 實(shí)驗分析

    圖6 5×6的Grid World問題中5種算法性能比較

    圖7 10×10的Grid World問題中5種算法性能比較

    為了驗證算法采用值函數(shù)遷移方法和啟發(fā)式探索方法的收斂性能,圖8分別表示Sarsa算法、本文提出的VFT-HSA、不采用值函數(shù)遷移算法、不采用啟發(fā)式探索算法在10×10的Grid World問題中達(dá)到收斂時所需的平均時間的變化趨勢,其中,橫坐標(biāo)為情節(jié)數(shù),縱坐標(biāo)為情節(jié)結(jié)束后到達(dá)目標(biāo)狀態(tài)所需的時間。在實(shí)驗過程中,每一個算法都獨(dú)立執(zhí)行24次,取其平均值。在圖8中,Sarsa算法不能保證較好收斂,收斂性能較差;不采用值函數(shù)遷移算法在大約40個情節(jié)處收斂,而VFT-HSA在大約30個情節(jié)處收斂,VFT-HSA相比于不采用值函數(shù)遷移算法收斂速度提升近25%,因而不采用值函數(shù)遷移算法收斂速度較慢,這是因為不采用值函數(shù)遷移算法使算法運(yùn)行過程中值函數(shù)的初始值未獲得最優(yōu)設(shè)置,算法收斂需要更多的樣本數(shù)量,最終導(dǎo)致算法收斂速度慢;不采用啟發(fā)式探索算法在大約50個情節(jié)處收斂,相比較而言,VFT-HSA收斂速度提升近40%,不采用啟發(fā)式探索算法收斂性能不及VFT-HSA,這是因為啟發(fā)式探索算法在算法收斂過程中可以提供更多的啟發(fā)式信息,加大agent探索力度,提高算法收斂速度。綜上所述,在值函數(shù)遷移方法與變分貝葉斯啟發(fā)式探索方法共同作用下,VFT-HSA的收斂速度更快,收斂性能更好。

    圖8 10×10的Grid World問題中4種算法的性能比較

    圖9 不同規(guī)模的Grid World問題中VFT-HSA取不同η值時收斂性能比較

    表1 不同規(guī)模的Grid World問題中VFT-HSA取不同值時收斂所需平均步數(shù)比較

    5 結(jié)束語

    本文針對Sarsa算法在維度較大的狀態(tài)空間和動作空間的MDP中存在收斂速度慢的問題,提出一種改進(jìn)的VFT-HSA。在不同任務(wù)間具有相同狀態(tài)空間和動作空間的MDP中,該算法運(yùn)用自模擬度量的方法構(gòu)建不同任務(wù)下狀態(tài)之間的距離關(guān)系,當(dāng)2個MDP達(dá)到一定相似度時,進(jìn)行值函數(shù)知識遷移,減少算法收斂所需的樣本,提高算法的收斂性能;針對強(qiáng)化學(xué)習(xí)問題中存在的探索與利用的平衡問題,結(jié)合貝葉斯推理,利用變分推理獲取信息增益并用其構(gòu)建內(nèi)部獎賞函數(shù)模型,加大agent探索力度,提高算法收斂速度。將本文提出的VFT-HSA與Q-Learning算法、IGP-Sarsa算法用于經(jīng)典的Grid World問題,實(shí)驗表明,VFT-HSA克服了經(jīng)典的Sarsa算法中存在的收斂速度慢以及收斂不穩(wěn)定的問題,在保證收斂精度的情況下,提高了算法的收斂速度和穩(wěn)定性。

    本文主要在Grid World仿真平臺中對算法進(jìn)行實(shí)驗分析,實(shí)驗結(jié)果表明,本文所提算法具有較快的收斂速度和較好的收斂穩(wěn)定性。本文主要對較大規(guī)模、離散的問題進(jìn)行實(shí)驗分析,接下來的工作是將算法運(yùn)用于更大規(guī)模的問題和連續(xù)問題中進(jìn)一步驗證算法的有效性。

    [1] SUTTON R S, BARTO G A. Reinforcement learning: an introduction[M]. Cambridge: MIT Press, 1998.

    [2] SCHMIDHUBER J, INFORMATIK T T. On learning how to learn learning strategies[R]. Germany: Technische University, 1995.

    [3] AMMAR H B, EATON E, LUNA J M, et al. Autonomous cross-domain knowledge transfer in lifelong policy gradient reinforcement learning[C]//The 15th International Conference on Artificial Intelligence. 2015: 3345-3351.

    [4] GUPTA A, DEVIN C, LIU Y X, et al. Learning invariant feature spaces to transfer skills with reinforcement learning[C]//The 5th International Conference on Learning Representations. 2017: 2147-2153.

    [5] LAROCHE R, BARLIER M. Transfer reinforcement learning with shared dynamics[C]//The 31th International Conference on the Association for the Advance of Artificial Intelligence. 2017: 2147-2153.

    [6] BARRETO A, DABNEY W, MUNOS R, et al. Successor features for transfer in reinforcement learning[C]//The 32th International Conference on Neural Information Processing Systems. 2017: 4055-4065.

    [7] DEARDEN R, NIR F, STUART R. Bayesian Q-learning[C]//The 21th International Conference on the Association for the Advance of Artificial Intelligence. 1998: 761-768.

    [8] GUEZ A, SILVER D, DAYAN P. Scalable and efficient Bayes- adaptive reinforcement learning based on Monte-Carlo tree search[J]. Journal of Artificial Intelligence Research, 2013, 48(1): 841-883.

    [9] LITTLE D Y, SOMMER F T. Learning and exploration in action-perception loops[J]. Frontiers in Neural Circuits, 2013, 7(7): 37-56.

    [10] MANSOUR Y, SLIVKINS A, SYRGKANIS V. Bayesian incentive-compatible bandit exploration[C]//The 16th International Conference on Economics and Computation. 2015: 565-582.

    [11] VIEN N A, LEE S G, CHUNG T C. Bayes-adaptive hierarchical MDPs[J]. Applied Intelligence, 2016, 45(1): 112-126.

    [12] WU B, FENG Y. Monte-Carlo Bayesian reinforcement learning using a compact factored representation[C]//The 4th International Conference on Information Science and Control Engineering. 2017: 466-469.

    [13] 傅啟明, 劉全, 伏玉琛, 等. 一種高斯過程的帶參近似策略迭代算法[J]. 軟件學(xué)報, 2013, 24(11): 2676-2687.

    FU Q M, LIU Q, FU Y C, et al. Parametric approximation policy strategy iteration algorithm based on Gaussian process[J]. Journal of Software, 2013, 24(11): 2676-2687.

    [14] GIVAN R, DEAN T, GREIG M. Equivalence notions and model minimization in Markov decision processes[J]. Artificial Intelligence, 2003, 147(1): 163-223.

    [15] FERNS N, PANANGADEN P, PRECUP D. Metrics for finite Markov decision processes[C]//The 20th International Conference on Uncertainty in Artificial Intelligence. 2004: 162-169.

    [16] BEAL M J. Variational algorithms for approximate Bayesian inference[D]. London: University of London, 2003.

    [17] 傅啟明, 劉全, 尤樹華, 等. 一種新的基于值函數(shù)遷移的快速Sarsa算法[J]. 電子學(xué)報, 2014, 42(11): 2157-2161.

    FU Q M, LIU Q, YOU S H, et al. A novel fast sarsa algorithm based on value function transfer[J]. Acta Electronica Sinica, 2014, 42(11): 2157-2161.

    [18] MIERING M, HASSELT H V. The QV family compared to other reinforcement learning algorithms[C]//The 17th International Conference on Approximate Dynamic Programming and Reinforcement Learning. 2008: 101-108.

    [19] CHUNG J J, LAWRANCE N R J, SUKKARIEH S. Gaussian processes for informative exploration in reinforcement learning[C]//The 20th International Conference on Robotics and Automation. 2013: 2633-2639.

    Heuristic Sarsa algorithm based on value function transfer

    CHEN Jianping1,2,3, YANG Zhengxia1,2,3, LIU Quan4, WU Hongjie1,2,3, XU Yang5, FU Qiming1,2,3

    1. Institute of Electronics and Information Engineering, Suzhou University of Science and Technology, Suzhou 215009, China 2. Jiangsu Province Key Laboratory of Intelligent Building Energy Efficiency, Suzhou University of Science and Technology, Suzhou 215009, China 3. Suzhou Key Laboratory of Mobile Networking and Applied Technologies, Suzhou University of Science and Technology, Suzhou 215009, China 4. School of Computer Science and Technology, Soochow University, Suzhou 215000, China 5. Institute of Information Engineering, Zhejiang Fashion Institute of Technology College, Ningbo 315000, China

    With the problem of slow convergence for traditional Sarsa algorithm, an improved heuristic Sarsa algorithm based on value function transfer was proposed. The algorithm combined traditional Sarsa algorithm and value function transfer method, and the algorithm introduced bisimulation metric and used it to measure the similarity between new tasks and historical tasks in which those two tasks had the same state space and action space and speed up the algorithm convergence. In addition, combined with heuristic exploration method, the algorithm introduced Bayesian inference and used variational inference to measure information gain. Finally, using the obtained information gain to build intrinsic reward function model as exploring factors, to speed up the convergence of the algorithm. Applying the proposed algorithm to the traditional Grid World problem, and compared with the traditional Sarsa algorithm, the Q-Learning algorithm, and the VFT-Sarsa algorithm, the IGP-Sarsa algorithm with better convergence performance, the experiment results show that the proposed algorithm has faster convergence speed and better convergence stability.

    reinforcement learning, value function transfer, bisimulation metric, variational Bayes

    TP391

    A

    10.11959/j.issn.1000?436x.2018133

    陳建平(1963?),男,江蘇南京人,博士,蘇州科技大學(xué)教授,主要研究方向為大數(shù)據(jù)分析與應(yīng)用、建筑節(jié)能、智能信息處理。

    楊正霞(1992?),女,江蘇揚(yáng)州人,蘇州科技大學(xué)碩士生,主要研究方向為強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)、建筑節(jié)能。

    劉全(1969?),男,內(nèi)蒙古牙克石人,博士,蘇州大學(xué)教授、博士生導(dǎo)師,主要研究方向為智能信息處理、自動推理與機(jī)器學(xué)習(xí)。

    吳宏杰(1977?),男,江蘇蘇州人,博士,蘇州科技大學(xué)副教授,主要研究方向為深度學(xué)習(xí)、模式識別、生物信息。

    徐楊(1980?),女,河北深州人,浙江紡織服裝職業(yè)技術(shù)學(xué)院講師,主要研究方向為數(shù)據(jù)分析與應(yīng)用、智能化與個性化教學(xué)。

    傅啟明(1985?),男,江蘇淮安人,博士,蘇州科技大學(xué)講師,主要研究方向為強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)及建筑節(jié)能。

    2018?03?22;

    2018?07?13

    傅啟明,fqm_1@126.com

    國家自然科學(xué)基金資助項目(No.61502329, No.61772357, No.61750110519, No.61772355, No.61702055, No.61672371, No.61602334);江蘇省自然科學(xué)基金資助項目(No.BK20140283);江蘇省重點(diǎn)研發(fā)計劃基金資助項目(No.BE2017663);江蘇省高校自然科學(xué)基金資助項目(No.13KJB520020);蘇州市應(yīng)用基礎(chǔ)研究計劃工業(yè)部分基金資助項目(No.SYG201422)

    The National Natural Science Foundation of China (No.61502329, No.61772357, No.61750110519, No.61772355, No.61702055, No.61672371, No.61602334), The Natural Science Foundation of Jiangsu Province (No.BK20140283), The Key Research and Development Program of Jiangsu Province (No.BE2017663), High School Natural Science Foundation of Jiangsu Province (No.13KJB520020), Suzhou Industrial Application of Basic Research Program Part (No.SYG201422)

    猜你喜歡
    變分貝葉斯度量
    有趣的度量
    模糊度量空間的強(qiáng)嵌入
    逆擬變分不等式問題的相關(guān)研究
    求解變分不等式的一種雙投影算法
    迷向表示分為6個不可約直和的旗流形上不變愛因斯坦度量
    關(guān)于一個約束變分問題的注記
    貝葉斯公式及其應(yīng)用
    一個擾動變分不等式的可解性
    基于貝葉斯估計的軌道占用識別方法
    地質(zhì)異常的奇異性度量與隱伏源致礦異常識別
    我要看黄色一级片免费的| 国产成人精品福利久久| 人妻系列 视频| 男女高潮啪啪啪动态图| 超色免费av| 亚洲人成77777在线视频| av在线app专区| 美国免费a级毛片| 国产精品欧美亚洲77777| 一级片免费观看大全| 伦理电影大哥的女人| 午夜福利乱码中文字幕| 伊人久久大香线蕉亚洲五| 美国免费a级毛片| 免费观看无遮挡的男女| 自拍欧美九色日韩亚洲蝌蚪91| 这个男人来自地球电影免费观看 | 亚洲av国产av综合av卡| 亚洲中文av在线| 国产日韩欧美在线精品| 三上悠亚av全集在线观看| 欧美日韩av久久| 亚洲国产最新在线播放| 91精品国产国语对白视频| 亚洲综合色网址| 大香蕉久久成人网| 久久人妻熟女aⅴ| 国产伦理片在线播放av一区| 国产免费又黄又爽又色| 中文字幕人妻熟女乱码| 欧美精品一区二区大全| 免费观看av网站的网址| 99re6热这里在线精品视频| 两个人免费观看高清视频| av线在线观看网站| 婷婷成人精品国产| 国产日韩欧美视频二区| 午夜激情av网站| 免费观看无遮挡的男女| 人人澡人人妻人| 一区二区av电影网| 美女大奶头黄色视频| 中文字幕另类日韩欧美亚洲嫩草| 日本黄色日本黄色录像| 亚洲精华国产精华液的使用体验| 少妇精品久久久久久久| 国产亚洲精品第一综合不卡| 免费黄网站久久成人精品| 天堂俺去俺来也www色官网| 建设人人有责人人尽责人人享有的| 2021少妇久久久久久久久久久| 黑人欧美特级aaaaaa片| av片东京热男人的天堂| 制服诱惑二区| 男女啪啪激烈高潮av片| 亚洲av日韩在线播放| 99re6热这里在线精品视频| 亚洲国产看品久久| 久久精品国产a三级三级三级| 丰满饥渴人妻一区二区三| 人妻少妇偷人精品九色| 中文乱码字字幕精品一区二区三区| 99九九在线精品视频| 日本av手机在线免费观看| 2018国产大陆天天弄谢| 日韩中文字幕视频在线看片| 久久99精品国语久久久| 国产精品.久久久| 99re6热这里在线精品视频| 亚洲视频免费观看视频| 日韩电影二区| 三上悠亚av全集在线观看| 人妻系列 视频| 亚洲综合精品二区| 久久久久久久久免费视频了| 日日撸夜夜添| 日本色播在线视频| 波多野结衣一区麻豆| 国产精品成人在线| 男女下面插进去视频免费观看| 国产精品.久久久| 青春草视频在线免费观看| 精品亚洲成a人片在线观看| 久久久久久人人人人人| 性色av一级| 欧美日韩精品网址| 熟女av电影| 日产精品乱码卡一卡2卡三| 日产精品乱码卡一卡2卡三| 亚洲五月色婷婷综合| 一个人免费看片子| 啦啦啦在线免费观看视频4| 久久影院123| 黄片播放在线免费| 色婷婷av一区二区三区视频| 女人精品久久久久毛片| 性少妇av在线| 日本wwww免费看| 成人黄色视频免费在线看| av在线观看视频网站免费| 亚洲av欧美aⅴ国产| 国产熟女欧美一区二区| 成人亚洲精品一区在线观看| 久久久国产精品麻豆| 免费大片黄手机在线观看| 久热这里只有精品99| 巨乳人妻的诱惑在线观看| 中文字幕制服av| 老汉色∧v一级毛片| 999精品在线视频| 男人舔女人的私密视频| 成人二区视频| 纯流量卡能插随身wifi吗| 亚洲av综合色区一区| 欧美亚洲日本最大视频资源| 亚洲av综合色区一区| 久久久久久人人人人人| 97精品久久久久久久久久精品| 狂野欧美激情性bbbbbb| 欧美精品高潮呻吟av久久| 婷婷成人精品国产| 在线亚洲精品国产二区图片欧美| 国产精品99久久99久久久不卡 | av一本久久久久| 亚洲综合色网址| 精品国产乱码久久久久久小说| 少妇被粗大猛烈的视频| 日韩中字成人| 日本色播在线视频| 99热国产这里只有精品6| 日本wwww免费看| 国产一区亚洲一区在线观看| www.精华液| 美女xxoo啪啪120秒动态图| 国产男女内射视频| 黄片播放在线免费| 午夜激情av网站| 国产成人精品一,二区| 欧美日韩综合久久久久久| 久久99精品国语久久久| 精品人妻偷拍中文字幕| 午夜福利在线观看免费完整高清在| 在线天堂最新版资源| 久久久国产精品麻豆| 美女高潮到喷水免费观看| 亚洲人成77777在线视频| 国产男女超爽视频在线观看| 叶爱在线成人免费视频播放| 丝袜美腿诱惑在线| 亚洲av欧美aⅴ国产| 婷婷色麻豆天堂久久| 天天操日日干夜夜撸| 久久久亚洲精品成人影院| 亚洲精品视频女| 久久久久久久久久久久大奶| 久久精品亚洲av国产电影网| 波多野结衣一区麻豆| av免费观看日本| 日产精品乱码卡一卡2卡三| 伊人亚洲综合成人网| 交换朋友夫妻互换小说| 久久99蜜桃精品久久| 国产精品一国产av| 成人国产麻豆网| 成人国产av品久久久| 成人国产麻豆网| 亚洲人成电影观看| 伊人亚洲综合成人网| 1024视频免费在线观看| 2022亚洲国产成人精品| 视频在线观看一区二区三区| 不卡视频在线观看欧美| 秋霞伦理黄片| av线在线观看网站| 久久久久久久大尺度免费视频| 国产日韩欧美亚洲二区| 亚洲第一av免费看| 免费大片黄手机在线观看| 久久精品国产亚洲av涩爱| 欧美老熟妇乱子伦牲交| 国产伦理片在线播放av一区| 国产精品麻豆人妻色哟哟久久| 精品人妻一区二区三区麻豆| av在线老鸭窝| 熟女av电影| 捣出白浆h1v1| 亚洲,欧美,日韩| 国产精品一区二区在线观看99| 在线天堂中文资源库| 日韩熟女老妇一区二区性免费视频| 亚洲av电影在线进入| 国产免费福利视频在线观看| 国产福利在线免费观看视频| 这个男人来自地球电影免费观看 | 99精国产麻豆久久婷婷| 午夜福利在线免费观看网站| 男女下面插进去视频免费观看| 欧美精品人与动牲交sv欧美| 亚洲精品,欧美精品| 亚洲美女视频黄频| 高清av免费在线| 久久韩国三级中文字幕| 午夜91福利影院| 我要看黄色一级片免费的| 久久久久久免费高清国产稀缺| 亚洲国产精品国产精品| 巨乳人妻的诱惑在线观看| 久久av网站| 日韩,欧美,国产一区二区三区| 天天操日日干夜夜撸| 黄片无遮挡物在线观看| 久久久久久伊人网av| 中文精品一卡2卡3卡4更新| 亚洲精品国产色婷婷电影| 中国三级夫妇交换| 男女高潮啪啪啪动态图| 日日摸夜夜添夜夜爱| 午夜老司机福利剧场| 美女福利国产在线| 免费在线观看视频国产中文字幕亚洲 | 日日啪夜夜爽| 巨乳人妻的诱惑在线观看| 捣出白浆h1v1| 国产成人精品久久久久久| 中文欧美无线码| 一区二区av电影网| 国产男女内射视频| 男女高潮啪啪啪动态图| 亚洲成人手机| 国产精品久久久久久精品电影小说| 侵犯人妻中文字幕一二三四区| 国产精品久久久久久久久免| 妹子高潮喷水视频| 久久精品国产鲁丝片午夜精品| tube8黄色片| av视频免费观看在线观看| 久久毛片免费看一区二区三区| 岛国毛片在线播放| 国产精品一区二区在线观看99| av网站免费在线观看视频| 少妇被粗大猛烈的视频| 2018国产大陆天天弄谢| 亚洲精品av麻豆狂野| www日本在线高清视频| 九九爱精品视频在线观看| 美女中出高潮动态图| 波野结衣二区三区在线| 午夜福利网站1000一区二区三区| 99香蕉大伊视频| 色哟哟·www| 国产成人a∨麻豆精品| 国产黄色视频一区二区在线观看| 久久久久久久国产电影| 亚洲精品一二三| 人体艺术视频欧美日本| 国产精品成人在线| 大片电影免费在线观看免费| 一区二区三区乱码不卡18| av线在线观看网站| 不卡视频在线观看欧美| 男女边摸边吃奶| av片东京热男人的天堂| 日本爱情动作片www.在线观看| 欧美日韩精品网址| 久久久a久久爽久久v久久| 亚洲av电影在线进入| 大香蕉久久成人网| 熟女少妇亚洲综合色aaa.| 嫩草影院入口| 中文字幕亚洲精品专区| 精品一品国产午夜福利视频| 亚洲av电影在线进入| 日韩伦理黄色片| 91久久精品国产一区二区三区| 老司机影院成人| 国产在线一区二区三区精| 伦精品一区二区三区| 日韩一本色道免费dvd| 亚洲国产av影院在线观看| 久久热在线av| 国产精品99久久99久久久不卡 | 我要看黄色一级片免费的| 美女视频免费永久观看网站| 午夜影院在线不卡| 人人妻人人澡人人爽人人夜夜| 日产精品乱码卡一卡2卡三| 丰满乱子伦码专区| 97精品久久久久久久久久精品| 男女午夜视频在线观看| 国产在线视频一区二区| 交换朋友夫妻互换小说| 一本色道久久久久久精品综合| 亚洲精品av麻豆狂野| 久久久久久免费高清国产稀缺| 欧美变态另类bdsm刘玥| 日本免费在线观看一区| 欧美日韩一级在线毛片| 一边亲一边摸免费视频| 美女福利国产在线| 青春草国产在线视频| 女人高潮潮喷娇喘18禁视频| a级片在线免费高清观看视频| 90打野战视频偷拍视频| 日韩一本色道免费dvd| 亚洲av男天堂| 日韩成人av中文字幕在线观看| 久久国内精品自在自线图片| 妹子高潮喷水视频| av在线老鸭窝| 在线天堂中文资源库| 永久免费av网站大全| 日韩伦理黄色片| 天美传媒精品一区二区| 国产成人aa在线观看| 久久久国产欧美日韩av| 日韩在线高清观看一区二区三区| 中文字幕人妻丝袜制服| 26uuu在线亚洲综合色| 9色porny在线观看| 9热在线视频观看99| 久久精品国产亚洲av天美| 欧美老熟妇乱子伦牲交| 国产av码专区亚洲av| 五月伊人婷婷丁香| 久久久久久久精品精品| 亚洲欧美日韩另类电影网站| 亚洲国产看品久久| 成年美女黄网站色视频大全免费| 亚洲国产av影院在线观看| 日日爽夜夜爽网站| 中文字幕av电影在线播放| 久久精品夜色国产| 欧美变态另类bdsm刘玥| 午夜福利网站1000一区二区三区| 2018国产大陆天天弄谢| 中文字幕精品免费在线观看视频| 黑人巨大精品欧美一区二区蜜桃| 成人免费观看视频高清| 看非洲黑人一级黄片| 国精品久久久久久国模美| 成人二区视频| www.av在线官网国产| 日韩伦理黄色片| 啦啦啦中文免费视频观看日本| 欧美日韩亚洲高清精品| 伦精品一区二区三区| 国产 一区精品| 啦啦啦中文免费视频观看日本| 国产精品久久久久久精品古装| 国产一区二区三区综合在线观看| 香蕉国产在线看| 我的亚洲天堂| 国产乱来视频区| 欧美激情 高清一区二区三区| 免费人妻精品一区二区三区视频| 欧美中文综合在线视频| 男人爽女人下面视频在线观看| av在线老鸭窝| 国产福利在线免费观看视频| 亚洲内射少妇av| 久久久久网色| 熟女av电影| 久久精品国产自在天天线| 99久久综合免费| 天天躁狠狠躁夜夜躁狠狠躁| 免费观看在线日韩| 精品久久蜜臀av无| 国产熟女欧美一区二区| 日韩av不卡免费在线播放| 国产精品 欧美亚洲| 婷婷成人精品国产| 最近中文字幕2019免费版| 亚洲内射少妇av| 另类精品久久| www.av在线官网国产| 免费播放大片免费观看视频在线观看| 99久久综合免费| 伊人久久国产一区二区| 免费观看av网站的网址| 亚洲内射少妇av| 麻豆精品久久久久久蜜桃| 免费看不卡的av| 久久99蜜桃精品久久| 亚洲精品乱久久久久久| 9热在线视频观看99| 国产xxxxx性猛交| 日韩人妻精品一区2区三区| 观看美女的网站| 亚洲图色成人| 欧美精品一区二区大全| 美女xxoo啪啪120秒动态图| 久久久久久免费高清国产稀缺| 免费大片黄手机在线观看| 少妇人妻 视频| av不卡在线播放| 午夜福利乱码中文字幕| 大香蕉久久成人网| 美女福利国产在线| 国产xxxxx性猛交| 街头女战士在线观看网站| 99久久综合免费| 一区福利在线观看| 亚洲美女黄色视频免费看| 日日摸夜夜添夜夜爱| 国产成人精品一,二区| 电影成人av| 亚洲精品av麻豆狂野| 免费少妇av软件| 国产精品成人在线| 性色avwww在线观看| 国产av一区二区精品久久| 成年美女黄网站色视频大全免费| 国产一区二区三区av在线| 精品国产乱码久久久久久小说| 七月丁香在线播放| 一级片'在线观看视频| 一区二区三区乱码不卡18| 亚洲伊人色综图| 巨乳人妻的诱惑在线观看| 深夜精品福利| 欧美变态另类bdsm刘玥| 亚洲精品日韩在线中文字幕| 一本—道久久a久久精品蜜桃钙片| 狂野欧美激情性bbbbbb| 99国产精品免费福利视频| 桃花免费在线播放| 水蜜桃什么品种好| 女人久久www免费人成看片| 啦啦啦在线观看免费高清www| 国产精品免费视频内射| 人人妻人人爽人人添夜夜欢视频| 国产成人91sexporn| 欧美日韩av久久| 国产成人精品福利久久| 亚洲精品乱久久久久久| 麻豆精品久久久久久蜜桃| 波野结衣二区三区在线| 有码 亚洲区| 女人被躁到高潮嗷嗷叫费观| 中文字幕另类日韩欧美亚洲嫩草| 亚洲av电影在线观看一区二区三区| 在线亚洲精品国产二区图片欧美| 老司机影院毛片| 久久久国产一区二区| 中文字幕制服av| 永久网站在线| 国精品久久久久久国模美| 亚洲三级黄色毛片| 国产精品国产三级专区第一集| 午夜福利影视在线免费观看| 捣出白浆h1v1| 成人18禁高潮啪啪吃奶动态图| 国产精品香港三级国产av潘金莲 | 黄色视频在线播放观看不卡| 欧美黄色片欧美黄色片| 最新中文字幕久久久久| 五月天丁香电影| 亚洲在久久综合| 欧美国产精品一级二级三级| 999久久久国产精品视频| 日韩人妻精品一区2区三区| 国产免费一区二区三区四区乱码| 久久这里有精品视频免费| 日韩伦理黄色片| 曰老女人黄片| 成人亚洲精品一区在线观看| 精品一区在线观看国产| 欧美国产精品va在线观看不卡| 国产淫语在线视频| 日韩伦理黄色片| 久久久久国产精品人妻一区二区| 久久久久久久久久久免费av| 国产亚洲最大av| 国产亚洲av片在线观看秒播厂| 国产精品无大码| 99久国产av精品国产电影| 99国产精品免费福利视频| 日韩中文字幕视频在线看片| 亚洲熟女精品中文字幕| 久久久精品国产亚洲av高清涩受| 侵犯人妻中文字幕一二三四区| 夫妻性生交免费视频一级片| 久久久久人妻精品一区果冻| 免费少妇av软件| 看非洲黑人一级黄片| 日韩 亚洲 欧美在线| 大陆偷拍与自拍| 日本av手机在线免费观看| 精品一品国产午夜福利视频| 女人精品久久久久毛片| 妹子高潮喷水视频| 精品福利永久在线观看| videossex国产| 老汉色av国产亚洲站长工具| 男女边吃奶边做爰视频| 十八禁高潮呻吟视频| 男人操女人黄网站| 97人妻天天添夜夜摸| 午夜福利在线免费观看网站| 国产亚洲欧美精品永久| 99久久人妻综合| 69精品国产乱码久久久| 最近2019中文字幕mv第一页| 久久人妻熟女aⅴ| 91精品国产国语对白视频| 亚洲精华国产精华液的使用体验| 日韩大片免费观看网站| 女人被躁到高潮嗷嗷叫费观| 亚洲激情五月婷婷啪啪| 亚洲av免费高清在线观看| 国产白丝娇喘喷水9色精品| 青春草亚洲视频在线观看| 久久精品熟女亚洲av麻豆精品| 色婷婷av一区二区三区视频| 黄色 视频免费看| 丝袜人妻中文字幕| 777久久人妻少妇嫩草av网站| 亚洲av电影在线进入| 久久青草综合色| 国产不卡av网站在线观看| 高清av免费在线| 午夜影院在线不卡| 日日撸夜夜添| 亚洲美女搞黄在线观看| 亚洲天堂av无毛| 麻豆精品久久久久久蜜桃| 国产成人精品久久二区二区91 | 制服诱惑二区| 麻豆乱淫一区二区| 亚洲激情五月婷婷啪啪| 我要看黄色一级片免费的| 成人亚洲精品一区在线观看| 综合色丁香网| 亚洲精华国产精华液的使用体验| av网站在线播放免费| 巨乳人妻的诱惑在线观看| 桃花免费在线播放| 久久久久久久国产电影| 成人黄色视频免费在线看| 国产亚洲一区二区精品| 2022亚洲国产成人精品| 九色亚洲精品在线播放| 国产女主播在线喷水免费视频网站| 国产精品久久久久成人av| 老司机影院毛片| 亚洲成人手机| 久久久久久久久久久免费av| 久久久久久久精品精品| 亚洲,欧美精品.| 久久ye,这里只有精品| 成年动漫av网址| 99久久中文字幕三级久久日本| 亚洲美女搞黄在线观看| 精品国产乱码久久久久久小说| 999精品在线视频| 香蕉国产在线看| 亚洲三区欧美一区| 婷婷色麻豆天堂久久| 在线 av 中文字幕| 黄频高清免费视频| 曰老女人黄片| 成人毛片a级毛片在线播放| 夜夜骑夜夜射夜夜干| 午夜福利在线免费观看网站| 好男人视频免费观看在线| 日韩熟女老妇一区二区性免费视频| 亚洲 欧美一区二区三区| 午夜福利,免费看| 久久热在线av| 亚洲,欧美精品.| 精品久久久久久久久久免费视频 | 母亲3免费完整高清在线观看| 久久精品亚洲熟妇少妇任你| 亚洲国产精品一区二区三区在线| 无限看片的www在线观看| 极品教师在线免费播放| 久久国产亚洲av麻豆专区| 成人亚洲精品一区在线观看| 色综合婷婷激情| 国产一区二区三区在线臀色熟女 | 欧美激情极品国产一区二区三区| 亚洲欧美日韩高清在线视频| 国产一区二区激情短视频| 亚洲 欧美一区二区三区| 久久久水蜜桃国产精品网| 中文字幕av电影在线播放| 国产精品日韩av在线免费观看 | 黄色怎么调成土黄色| 欧美黄色片欧美黄色片| 夜夜躁狠狠躁天天躁| 99在线人妻在线中文字幕| 日日摸夜夜添夜夜添小说| 琪琪午夜伦伦电影理论片6080| 麻豆一二三区av精品| 露出奶头的视频| netflix在线观看网站| 丝袜美腿诱惑在线| 欧美国产精品va在线观看不卡| cao死你这个sao货| 久热爱精品视频在线9| 日韩高清综合在线| 亚洲精品在线美女| 99在线视频只有这里精品首页| 亚洲成人久久性| 日本wwww免费看| 在线视频色国产色| 校园春色视频在线观看| 另类亚洲欧美激情| 久久人人爽av亚洲精品天堂| 99在线人妻在线中文字幕| 色播在线永久视频| 国内毛片毛片毛片毛片毛片| 老司机深夜福利视频在线观看| 人成视频在线观看免费观看| 水蜜桃什么品种好|