• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    帶狀態(tài)約束的事件觸發(fā)積分強(qiáng)化學(xué)習(xí)控制

    2023-08-03 02:06:22田奮銘
    計(jì)算機(jī)測量與控制 2023年7期
    關(guān)鍵詞:最優(yōu)控制控制策略約束

    田奮銘,劉 飛

    (1.江南大學(xué) 輕工過程先進(jìn)控制教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 無錫 214122;2.江南大學(xué) 自動(dòng)化研究所,江蘇 無錫 214122)

    0 引言

    非線性連續(xù)系統(tǒng)的控制問題一直是現(xiàn)代控制理論的基本問題之一。針對非線性連續(xù)系統(tǒng)的控制問題有眾多針對性的控制方法,如:PID控制[1-2]、自適應(yīng)控制[3-5]、滑模控制[6-7]、以及多種方法綜合應(yīng)用[8-9]。然而,對于大多數(shù)受控的系統(tǒng),在控制過程中必然要考慮狀態(tài)約束,以防止系統(tǒng)不穩(wěn)定問題的發(fā)生。以路徑跟蹤任務(wù)中的車輛控制為例,除了考慮跟蹤性能外,還必須將車輛的某些狀態(tài)限制在穩(wěn)定區(qū)域內(nèi)。

    針對帶有狀態(tài)約束系統(tǒng)的控制問題目前已經(jīng)產(chǎn)生多種基本理論框架[10-15]。文獻(xiàn)[12]針對帶有時(shí)變狀態(tài)約束的非線性純反饋系統(tǒng)的跟蹤控制問題,利用矩陣變換以及反步法展開討論,最終實(shí)現(xiàn)軌跡跟蹤控制并且系統(tǒng)的狀態(tài)始終滿足狀態(tài)約束。文獻(xiàn)[13]針對帶有時(shí)不變對稱狀態(tài)約束系統(tǒng)的代價(jià)函數(shù)優(yōu)化問題,通過將狀態(tài)約束轉(zhuǎn)化為障礙函數(shù)并入代價(jià)函數(shù),使用神經(jīng)網(wǎng)絡(luò)逼近技術(shù),基于自適應(yīng)動(dòng)態(tài)規(guī)劃算法,在系統(tǒng)模型完全已知的情況下實(shí)現(xiàn)最優(yōu)控制。文獻(xiàn)[14]基于矩陣變換以及自適應(yīng)評(píng)價(jià)設(shè)計(jì)算法,利用Critic-Actor神經(jīng)網(wǎng)絡(luò),有效的解決了非線性純反饋連續(xù)系統(tǒng)的“多人博弈”最優(yōu)控制問題。模型預(yù)測控制(MPC)方法作為解決帶有狀態(tài)約束的優(yōu)化控制問題最常用的方法,實(shí)際上也是利用障礙函數(shù)法,將狀態(tài)約束并入代價(jià)函數(shù)中。盡管上述方法都能解決帶有狀態(tài)約束的優(yōu)化控制問題,但都是基于系統(tǒng)動(dòng)力學(xué)完全已知或者利用辨識(shí)手段獲得動(dòng)力學(xué)信息展開討論。然而,如今的控制系統(tǒng)大多呈現(xiàn)強(qiáng)耦合、強(qiáng)非線性的特點(diǎn),如航天航空等,精確的動(dòng)力學(xué)大多難以獲得,直接或間接地阻礙了帶有狀態(tài)約束系統(tǒng)的控制問題的研究。以機(jī)電伺服系統(tǒng)為例,機(jī)電伺服系統(tǒng)是一個(gè)多變量、強(qiáng)耦合的系統(tǒng),系統(tǒng)的參數(shù)易受系統(tǒng)所處環(huán)境的影響,在考慮伺服系統(tǒng)跟蹤控制問題的同時(shí),也必須考慮狀態(tài)約束問題[16],因此考慮帶狀態(tài)約束且系統(tǒng)具有不確定性的最優(yōu)控制問題十分必要。這里的不確定性主要指系統(tǒng)動(dòng)力學(xué)部分未知、系統(tǒng)動(dòng)力學(xué)全部未知、系統(tǒng)某些時(shí)變參數(shù)變化規(guī)律未知等。

    近年來,積分強(qiáng)化學(xué)習(xí)(IRL)算法成為實(shí)現(xiàn)仿射非線性系統(tǒng)最優(yōu)控制問題的重要方法之一[17-23]。該方法起源于動(dòng)態(tài)規(guī)劃,結(jié)合了強(qiáng)化學(xué)習(xí)理論以及伸進(jìn)網(wǎng)絡(luò)技術(shù),利用系統(tǒng)的輸入輸出數(shù)據(jù),結(jié)合在線策略迭代的思想,通過交替執(zhí)行策略評(píng)估以及策略改進(jìn),最終在部分動(dòng)力學(xué)未知的情況下實(shí)現(xiàn)最優(yōu)控制,因此受到廣泛學(xué)者的青睞。針對部分動(dòng)力學(xué)未知的仿射非線性系統(tǒng)的最優(yōu)控制問題,文獻(xiàn)[18]提出積分強(qiáng)化學(xué)習(xí)算法。文獻(xiàn)[19]在文獻(xiàn)[18]的基礎(chǔ)上考慮了輸入受限的系統(tǒng),并且在使用梯度下降法求解權(quán)重時(shí)采用了經(jīng)驗(yàn)回放技術(shù),進(jìn)一步提高了算法的精度。針對系統(tǒng)動(dòng)力學(xué)完全未知的情況,基于最小二乘法以及離線策略迭代技術(shù),結(jié)合積分強(qiáng)化學(xué)習(xí)算法,成功實(shí)現(xiàn)最優(yōu)控制[20]??紤]到積分強(qiáng)化學(xué)習(xí)算法是一種時(shí)間觸發(fā)型算法,需要頻繁進(jìn)行策略評(píng)估以及策略更新運(yùn)算,同時(shí)更新控制策略,為了降低控制策略的更新頻率,將事件觸發(fā)機(jī)制與積分強(qiáng)化學(xué)習(xí)算法結(jié)合起來,同時(shí)考慮穩(wěn)態(tài)非零問題(當(dāng)系統(tǒng)處于穩(wěn)態(tài)時(shí),控制策略與狀態(tài)不為零),最終實(shí)現(xiàn)最優(yōu)控制[23]。然而,據(jù)作者所知,利用積分強(qiáng)化學(xué)習(xí)算法解決帶有狀態(tài)約束的部分動(dòng)力學(xué)未知系統(tǒng)的最優(yōu)控制問題尚未得到廣泛關(guān)注。

    為了克服現(xiàn)存控制方法存在的局限性,最終實(shí)現(xiàn)最優(yōu)控制。本文針對帶有全狀態(tài)約束且部分動(dòng)力學(xué)未知系統(tǒng)的最優(yōu)控制問題,基于IRL控制理論,提出一種帶狀態(tài)約束的事件觸發(fā)積分強(qiáng)化學(xué)習(xí)算法。利用矩陣變換將帶有約束的系統(tǒng)轉(zhuǎn)化為無約束系統(tǒng),基于轉(zhuǎn)換之后系統(tǒng)的狀態(tài),利用IRL算法,通過交替執(zhí)行策略評(píng)估以及策略改進(jìn),實(shí)現(xiàn)最優(yōu)控制,從而避免對原系統(tǒng)未知?jiǎng)討B(tài)的估計(jì)。此外,在控制過程中引入事件觸發(fā)機(jī)制,以降低控制策略的更新頻率,節(jié)約系統(tǒng)內(nèi)存資源。

    1 問題描述

    考慮如下仿射非線性連續(xù)系統(tǒng):

    (1)

    其中:x=[x1, ,xn]T∈Rn是系統(tǒng)可觀測的狀態(tài),Rn表示n維歐幾里得空間,u=[u1, ,um]T∈Rm是控制策略,f(x)∈Rn×1是未知的漂移動(dòng)力學(xué),g(x)∈Rn×m是已知的輸入動(dòng)力學(xué)。假設(shè)控制系統(tǒng)(1)是穩(wěn)定的。

    定義系統(tǒng)(1)的代價(jià)函數(shù),如下所述。

    (2)

    本文的控制目標(biāo)是設(shè)計(jì)容許的控制策略u(píng)使得代價(jià)函數(shù)最優(yōu),即:

    (3)

    并且u是有界的(不為無窮大)。同時(shí)系統(tǒng)狀態(tài)xi(i=1, ,n)始終是有界的,即|xi|0。

    2 控制策略設(shè)計(jì)

    控制策略設(shè)計(jì)主要包括五部分。首先利用矩陣變換技術(shù)將帶有約束的仿射非線性連續(xù)系統(tǒng)轉(zhuǎn)化為不含約束的仿射非線性連續(xù)系統(tǒng),以克服狀態(tài)約束控制系統(tǒng)的影響;其次介紹基本的積分強(qiáng)化學(xué)習(xí)算法;再次考慮到積分強(qiáng)化學(xué)習(xí)算法頻繁策略更新,為減少計(jì)算量和提高控制效率,引入事件觸發(fā)機(jī)制,基于李雅普諾夫穩(wěn)定性定理,設(shè)計(jì)了事件觸發(fā)條件,以減少控制策略的更新頻率;然后利用神經(jīng)網(wǎng)絡(luò)逼近值函數(shù)的方法,準(zhǔn)確地估計(jì)值函數(shù);最后給出帶狀態(tài)約束的事件觸發(fā)積分強(qiáng)化學(xué)習(xí)算法的流程。

    2.1 系統(tǒng)轉(zhuǎn)換

    本節(jié)利用系統(tǒng)轉(zhuǎn)換技術(shù)將帶有狀態(tài)約束的仿射非線性連續(xù)系統(tǒng)轉(zhuǎn)化為不含約束的仿射非線性連續(xù)系統(tǒng)[12]。

    在進(jìn)行系統(tǒng)轉(zhuǎn)換之前,首先,定義一組虛擬狀態(tài)變量z=[z1, ,zn]T?Rn,并且滿足如下等式條件:

    (4)

    其中:ai為xi的邊界值,i=1,2n。注意到,zi(xi)具有如下性質(zhì):首先,zi(xi)是單調(diào)遞增的函數(shù);其次,zi(0)=0;最后,若xi趨向于-ai時(shí),zi趨向于負(fù)無窮,若xi趨向于ai時(shí),zi趨向于正無窮。

    引理1[12]:對于任意初始狀態(tài),如果系統(tǒng)的初始狀態(tài)滿足狀態(tài)約束,利用式(4)得到轉(zhuǎn)換之后的系統(tǒng),若設(shè)計(jì)控制策略使得轉(zhuǎn)換之后系統(tǒng)的狀態(tài)有界,并將控制策略作用于實(shí)際系統(tǒng),則系統(tǒng)的實(shí)際狀態(tài)滿足狀態(tài)約束。

    對式(4)進(jìn)行關(guān)于時(shí)間的導(dǎo)數(shù)求解,將得到一個(gè)虛擬系統(tǒng),并且虛擬系統(tǒng)依然保持仿射非線性的形式。虛擬系統(tǒng)由下式給出:

    (5)

    其中:bGG與bG是正實(shí)數(shù)。

    通過將狀態(tài)約束邊界并入原始仿射非線性連續(xù)系統(tǒng)(1),將得到一個(gè)新的無約束系統(tǒng)(5)。此外,如果轉(zhuǎn)換之后的虛擬系統(tǒng)(5)的穩(wěn)態(tài)值趨向于零,則系統(tǒng)的實(shí)際狀態(tài)也趨向于零,那么,轉(zhuǎn)換前后的控制系統(tǒng)具有相同的漸近穩(wěn)定性。接下來,只需專注于對虛擬系統(tǒng)(5)設(shè)計(jì)控制策略使得代價(jià)函數(shù)最優(yōu)即可。

    2.2 積分強(qiáng)化學(xué)習(xí)算法

    本節(jié)主要利用積分強(qiáng)化學(xué)習(xí)算法求解具有部分動(dòng)力學(xué)未知的虛擬系統(tǒng)(5)的最優(yōu)控制問題。定義虛擬系統(tǒng)的代價(jià)函數(shù)如下所示:

    (6)

    對于任意時(shí)間間隔Δt>0,式(6)可以重寫為:

    (7)

    上式也被稱為積分強(qiáng)化學(xué)習(xí)-貝爾曼(IRL-Belleman)方程,是積分強(qiáng)化學(xué)習(xí)算法的核心。如果V(zt)是可微的,則:

    (8)

    根據(jù)式(5)以及式(8),哈密頓函數(shù)定義為:

    H(z,u,▽V(z))=▽VT(z)(F(z)+G(z)u)-

    ρV(z)+zTQz+uTRu

    (9)

    根據(jù)貝爾曼最優(yōu)原理,對于最優(yōu)的代價(jià)函數(shù)V*(z),哈密頓函數(shù)滿足:

    (10)

    令哈密頓函數(shù)關(guān)于控制策略的一階偏導(dǎo)數(shù)為零,即可獲得最優(yōu)控制策略。最優(yōu)控制策略如下所示:

    u*(z)=-0.5R-1GT(z)▽V*(z)

    (11)

    結(jié)合式(7),此時(shí)最優(yōu)代價(jià)函數(shù)V*(z)滿足:

    (12)

    基于前面所述,積分強(qiáng)化學(xué)習(xí)中最關(guān)鍵的兩步(策略評(píng)估以及策略改進(jìn))描述如下。

    策略評(píng)估:

    (13)

    策略改進(jìn):

    ui+1(z)=-0.5R-1GT(z)▽Vi(z)

    (14)

    其中:i為策略迭代指數(shù)。積分強(qiáng)化學(xué)習(xí)算法描述如下:首先給定初始可許的控制策略u(píng)0,通過交替執(zhí)行策略評(píng)估(13)以及策略改進(jìn)(14),最終控制策略以及代價(jià)函數(shù)將收斂于最優(yōu)值。

    對于積分強(qiáng)化學(xué)習(xí)算法來說,控制器無需時(shí)刻更新控制策略,在t時(shí)刻采集系統(tǒng)狀態(tài)信息,利用(13)以及(14)分別進(jìn)行策略評(píng)估以及策略改進(jìn),然后將改進(jìn)的控制策略作用于系統(tǒng),直至t+Δt時(shí)刻,因此積分強(qiáng)化學(xué)習(xí)算法是一種時(shí)間觸發(fā)型算法。對于Δt的選取,現(xiàn)有的文獻(xiàn)一般都會(huì)選擇固定值,每隔Δt,進(jìn)行一次策略改進(jìn)。若系統(tǒng)處于穩(wěn)態(tài),仍然需要不斷進(jìn)行策略評(píng)估以及策略改進(jìn)的計(jì)算。因此,下文將結(jié)合事件觸發(fā)機(jī)制確定Δt。

    2.3 事件觸發(fā)機(jī)制

    本節(jié)主要利用李雅普諾夫函數(shù)確定事件觸發(fā)條件,從而確定Δt。在分析之前,給出如下條件。u(z)滿足利普希茨連續(xù)條件,即:

    (15)

    (16)

    選取V(z)作為李雅普諾夫函數(shù),則:

    (17)

    結(jié)合式(10)以及式(14)可推導(dǎo)出:

    ▽VT(z)(F(z)+G(z)u(z))=

    ρV(z)-zTQz-u(z)TRu(z),▽VT(z)G(z)=-2uT(z)R

    故,式(17)進(jìn)一步推導(dǎo)為:

    (18)

    (19)

    綜上,如果選擇事件觸發(fā)條件:

    (20)

    2.4 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)

    一般來說,直接求解V(z)是不容易的。由逼近定理知,若V(z)是連續(xù)的、平滑的以及可微的,則V(z)及其關(guān)于狀態(tài)的導(dǎo)數(shù)▽V(z)可以用神經(jīng)網(wǎng)絡(luò)近似,即:

    V(z)=WTψ(z)+ε(z)

    (21a)

    ▽V(z)=▽ψT(z)W+▽ε(z)

    (21b)

    上述網(wǎng)絡(luò)也被稱為評(píng)論神經(jīng)網(wǎng)絡(luò),主要由三層組成:輸入層、隱藏層以及輸出層。簡單起見,選擇單隱藏層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并將輸入層到隱藏層的權(quán)重全部置為1,這意味著隱藏層的輸入即為輸入層的輸入。ψ(z)∈Rl×1是神經(jīng)元的激活函數(shù)組成的向量,▽φ(z)為φ(z)關(guān)于狀態(tài)z的導(dǎo)數(shù),l為隱藏層神經(jīng)元的數(shù)量。W∈Rl×1是隱藏層至輸出層的常參數(shù)組成的權(quán)重向量。ε(z)為評(píng)論神經(jīng)網(wǎng)絡(luò)的近似誤差,▽ε(z)為ε(z)關(guān)于狀態(tài)z的導(dǎo)數(shù)。

    對于求解非線性程度很高的函數(shù)來說,現(xiàn)有的文獻(xiàn)一般都會(huì)使用神經(jīng)網(wǎng)絡(luò)逼近定理來求解,但是如何設(shè)定神經(jīng)元的數(shù)量以及選擇合適的激活函數(shù)仍然是一個(gè)懸而未決的問題。針對上述情況,已經(jīng)產(chǎn)生許多合適的激活函數(shù),例如雙曲正切函數(shù)和徑向基函數(shù)。除此之外,雖然未知函數(shù)可以用神經(jīng)網(wǎng)絡(luò)來逼近,但結(jié)果未必滿足未知函數(shù)的梯度,這主要是由初始權(quán)重決定的,以上只能依靠設(shè)計(jì)師的反復(fù)設(shè)計(jì)以及經(jīng)驗(yàn)。由式(26)知,▽V(z)對于確定控制策略來說是必要的。

    利用式(21a)逼近式(13)的解,則式(10)可以重寫為:

    εb=p(t)+Wi,TΔψ(zt+Δt)

    (22)

    然而,在[t,t+Δt)時(shí)間段內(nèi)理想權(quán)重Wi是未知的。在忽略近似誤差的情況下,式(21a)重寫為:

    (23)

    (24)

    (25)

    利用(14),則基于事件觸發(fā)控制的策略更新調(diào)整為:

    (26)

    2.5 算法流程

    帶狀態(tài)約束的事件觸發(fā)積分強(qiáng)化學(xué)習(xí)算法歸納描述如下。

    第一步:初始化,選擇合適的初始控制策略u(píng)0、評(píng)論神經(jīng)網(wǎng)絡(luò)的初始權(quán)重W0、權(quán)重收斂誤差εw、權(quán)重學(xué)習(xí)率α、神經(jīng)元的數(shù)量以及各自的激活函數(shù);

    第二步:利用式(5)計(jì)算G(z);

    第三步:i=0;

    第四步:結(jié)合式(20),確定事件觸發(fā)條件ei(t);

    第五步:將ui作用于控制系統(tǒng),并且實(shí)時(shí)采集數(shù)據(jù),并利用式(4)計(jì)算虛擬狀態(tài)z,直至滿足事件觸發(fā)條件;

    3 穩(wěn)定性分析

    本節(jié)利用李雅普諾夫函數(shù)分析在事件觸發(fā)條件下控制系統(tǒng)的穩(wěn)定性。首先給出如下定理。

    定理1:考慮由非線性系統(tǒng)(1)轉(zhuǎn)換之后的虛擬系統(tǒng)(5)、權(quán)重更新律以及策略更新律分別如式(24)和式(26)所示,如果選擇事件觸發(fā)條件為式(20),則權(quán)重誤差動(dòng)態(tài)是有界的,并且系統(tǒng)是穩(wěn)定的。

    證明:定義李雅普諾夫函數(shù)為:

    L(t)=L1(t)+L2(t)+L3(t)

    (27)

    為了便于分析,下面分兩種情況來討論。

    (28)

    利用Young不等式和Cauchy-schwarz不等式,式(28)進(jìn)一步推導(dǎo)為:

    (29)

    (30)

    進(jìn)一步,式(30)推導(dǎo)為:

    (31)

    (32)

    (33)

    接下來分析L1(t),

    (34)

    然后,討論L3(t),

    (35)

    綜上所述,

    (36)

    若權(quán)重誤差滿足:

    情形二:在事件觸發(fā)的情況下,考慮間斷點(diǎn)處的穩(wěn)定性。

    (37)

    4 系統(tǒng)應(yīng)用

    為了驗(yàn)證帶有狀態(tài)約束的事件觸發(fā)積分強(qiáng)化學(xué)習(xí)算法有效性,本節(jié)利用單連桿機(jī)械臂的仿射非線性連續(xù)系統(tǒng)進(jìn)行仿真[12],其動(dòng)態(tài)系統(tǒng)描述如下:

    本實(shí)驗(yàn)的控制目標(biāo)是設(shè)計(jì)控制策略u(píng)使得二次型代價(jià)函數(shù)最優(yōu),并且在控制過程中系統(tǒng)的狀態(tài)滿足約束,即|xi|<1,i=1,2。二次型代價(jià)函數(shù)如下所示。

    其中:ρ=0.9為折扣因子,r(z,u)=zTQz+uTRu,R=10,Q=diag(0.2,0.2)。

    為了克服狀態(tài)約束,首先定義一組虛擬狀態(tài)z=[z1,z2]T用于系統(tǒng)轉(zhuǎn)換,轉(zhuǎn)換之后的系統(tǒng)依然是仿射非線性連續(xù)系統(tǒng),利用式(5),則G(z)表述:為:

    此外,F(xiàn)(z)是未知的。轉(zhuǎn)換之后的虛擬狀態(tài)可以用(4)計(jì)算獲得。定義轉(zhuǎn)換之后系統(tǒng)的代價(jià)函數(shù)為:

    選取Critic神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為2-8-1,其中:神經(jīng)網(wǎng)絡(luò)的輸入變量的個(gè)數(shù)為2,分別是系統(tǒng)經(jīng)轉(zhuǎn)換之后的虛擬狀態(tài)z1和z2。輸入層至隱藏層的權(quán)重設(shè)置為1。選擇單隱藏層神經(jīng)網(wǎng)絡(luò),并且隱藏層的神經(jīng)元的數(shù)量為8。輸出層神經(jīng)元的數(shù)量為1,代表代價(jià)函數(shù)的值。隱藏層神經(jīng)元代表的激活函數(shù)組成的向量用ψ(z)表示,為:

    仿真過程中參數(shù)設(shè)置:初始控制策略u(píng)0=-1、評(píng)論神經(jīng)網(wǎng)絡(luò)權(quán)重收斂誤差精度εw=0.005、權(quán)重學(xué)習(xí)率為α=0.9。評(píng)論神經(jīng)網(wǎng)絡(luò)的初始權(quán)重:

    W0=[8.67,-0.15,-5.87,6,0.8,-1.14,1.72,-2.23]T

    仿真結(jié)果以及分析如下所示。

    圖1為虛擬狀態(tài)的運(yùn)行軌跡,其中,實(shí)線代表虛擬狀態(tài)z1,虛線代表虛擬狀態(tài)z2。由圖所知,虛擬狀態(tài)在整個(gè)控制過程中始終是有界的(不為無窮大),故系統(tǒng)的實(shí)際運(yùn)行狀態(tài)必然滿足約束。

    圖1 虛擬狀態(tài)曲線

    圖2與圖3為考慮狀態(tài)約束與未考慮狀態(tài)約束的對比圖,虛線代表不考慮狀態(tài)約束的運(yùn)行軌跡,實(shí)線代表考慮狀態(tài)約束的運(yùn)行軌跡。兩種情況都是在事件觸發(fā)機(jī)制下完成的,并且都選擇相同初始參數(shù),可以避免因參數(shù)不同而對系統(tǒng)狀態(tài)軌跡的影響。由圖知,相較于未考慮狀態(tài)約束的情況,本文所提算法在整個(gè)控制過程中系統(tǒng)狀態(tài)均未超過事先設(shè)置的狀態(tài)約束,并且最終系統(tǒng)的狀態(tài)收斂到穩(wěn)態(tài)點(diǎn)附近,由此判定該算法能夠解決帶有狀態(tài)約束的控制問題。結(jié)合圖1,虛擬狀態(tài)以及實(shí)際狀態(tài)都收斂到零點(diǎn)附近,因此轉(zhuǎn)換前后的系統(tǒng)具備相同的漸近穩(wěn)定性。此外,注意到由于考慮了狀態(tài)約束,能使系統(tǒng)較快的收斂到穩(wěn)態(tài)點(diǎn)附近。大約經(jīng)過5 s之后,系統(tǒng)的狀態(tài)全部收斂于零。

    圖2 x1軌跡對比

    圖3 x2軌跡對比

    圖4為帶狀態(tài)約束的事件出發(fā)積分強(qiáng)化學(xué)習(xí)控制算法在整個(gè)控制過程中施加的控制策略。在經(jīng)過大約5 s之后,控制策略也收斂于零。對于二次型代價(jià)函數(shù),理想情況,最優(yōu)代價(jià)函數(shù)的對應(yīng)的穩(wěn)態(tài)值為零。結(jié)合圖2與圖3,5 s之后代價(jià)函數(shù)的值一直穩(wěn)定在0的較小鄰域內(nèi),說明所提算法是可行的。此外,注意到圖4中某個(gè)時(shí)刻控制策略顯著增大是由于此時(shí)刻實(shí)際狀態(tài)接近于邊界但并未超過邊界引起的。

    圖4 控制輸入軌跡

    事件觸發(fā)時(shí)刻以及事件觸發(fā)條件如圖5所示,其中橫軸代表觸發(fā)時(shí)刻,縱軸代表觸發(fā)條件誤差,一旦超過這個(gè)誤差,更新控制策略。由橫軸觸發(fā)時(shí)刻的間隔以及圖4更新控制策略的時(shí)刻知,該算法并非是周期觸發(fā)。圖6是評(píng)論神經(jīng)網(wǎng)絡(luò)部分權(quán)重的收斂曲線。由圖知,最終權(quán)重將收斂于某一值附近。

    圖5 事件觸發(fā)時(shí)刻以及觸發(fā)誤差

    圖6 評(píng)論神經(jīng)網(wǎng)絡(luò)部分權(quán)值軌跡

    5 結(jié)束語

    本文基于事件觸發(fā)機(jī)制的積分強(qiáng)化學(xué)習(xí)算法,設(shè)計(jì)仿射非線性連續(xù)系統(tǒng)的最優(yōu)控制策略,將系統(tǒng)轉(zhuǎn)換、事件觸發(fā)機(jī)制、積分強(qiáng)化學(xué)習(xí)算法緊密地結(jié)合起來,利用李雅普諾夫函數(shù)給出滿足系統(tǒng)穩(wěn)定運(yùn)行的事件觸發(fā)條件。在實(shí)際工程系統(tǒng)中,由于系統(tǒng)的動(dòng)力學(xué)大多難以獲得并且受狀態(tài)約束的影響,使本文算法更具普遍性。最后,針對單連桿機(jī)械臂的仿真結(jié)果表明所提方法的有效性。

    猜你喜歡
    最優(yōu)控制控制策略約束
    “碳中和”約束下的路徑選擇
    條件平均場隨機(jī)微分方程的最優(yōu)控制問題
    考慮虛擬慣性的VSC-MTDC改進(jìn)下垂控制策略
    能源工程(2020年6期)2021-01-26 00:55:22
    約束離散KP方程族的完全Virasoro對稱
    帶跳躍平均場倒向隨機(jī)微分方程的線性二次最優(yōu)控制
    工程造價(jià)控制策略
    山東冶金(2019年3期)2019-07-10 00:54:04
    現(xiàn)代企業(yè)會(huì)計(jì)的內(nèi)部控制策略探討
    Timoshenko梁的邊界最優(yōu)控制
    容錯(cuò)逆變器直接轉(zhuǎn)矩控制策略
    采用最優(yōu)控制無功STATCOM 功率流的解決方案
    老司机福利观看| 精品福利观看| www日本黄色视频网| 色综合站精品国产| 欧美日韩一级在线毛片| 国产精品电影一区二区三区| 麻豆成人av在线观看| 男人舔女人下体高潮全视频| 久久久久久久精品吃奶| 亚洲第一欧美日韩一区二区三区| 成人一区二区视频在线观看| 日韩免费av在线播放| 日韩欧美三级三区| 成年人黄色毛片网站| 久久久久国产一级毛片高清牌| 在线国产一区二区在线| 999久久久国产精品视频| 长腿黑丝高跟| 操出白浆在线播放| 久久久久久久久中文| 国产高清视频在线播放一区| 欧美日韩中文字幕国产精品一区二区三区| 久9热在线精品视频| 国产久久久一区二区三区| 超碰成人久久| 久久精品夜夜夜夜夜久久蜜豆 | 18禁国产床啪视频网站| 桃红色精品国产亚洲av| 黄色a级毛片大全视频| 午夜两性在线视频| 亚洲第一青青草原| 真人一进一出gif抽搐免费| 制服人妻中文乱码| 日本黄色视频三级网站网址| 国产av不卡久久| 亚洲成av人片免费观看| 成人一区二区视频在线观看| 神马国产精品三级电影在线观看 | 久9热在线精品视频| 欧美一级a爱片免费观看看 | 91成年电影在线观看| 亚洲一卡2卡3卡4卡5卡精品中文| 我的亚洲天堂| 欧美+亚洲+日韩+国产| 啦啦啦 在线观看视频| 亚洲色图 男人天堂 中文字幕| 最近最新中文字幕大全电影3 | 久久久久久久精品吃奶| 国产成人啪精品午夜网站| 亚洲午夜精品一区,二区,三区| 国产在线观看jvid| 黄频高清免费视频| 国产av一区在线观看免费| 午夜激情av网站| 在线观看一区二区三区| 这个男人来自地球电影免费观看| 欧美最黄视频在线播放免费| 欧美日本亚洲视频在线播放| 满18在线观看网站| 老司机福利观看| 老熟妇乱子伦视频在线观看| 国产私拍福利视频在线观看| 欧美色视频一区免费| 中文字幕久久专区| 国产三级在线视频| 香蕉丝袜av| 欧美黄色淫秽网站| 亚洲午夜精品一区,二区,三区| 在线观看一区二区三区| 国产色视频综合| 久久热在线av| 男人舔女人的私密视频| a级毛片a级免费在线| 非洲黑人性xxxx精品又粗又长| 在线国产一区二区在线| 亚洲精品粉嫩美女一区| 久久久精品国产亚洲av高清涩受| 国产成+人综合+亚洲专区| 亚洲精品一区av在线观看| 成在线人永久免费视频| 久久精品国产99精品国产亚洲性色| 国产精品亚洲美女久久久| 亚洲美女黄片视频| 欧美黑人巨大hd| 精品久久久久久久久久久久久 | 黄色视频,在线免费观看| 在线av久久热| 久热爱精品视频在线9| 少妇被粗大的猛进出69影院| 久久香蕉激情| 人人妻人人看人人澡| av天堂在线播放| 国产精品av久久久久免费| 性欧美人与动物交配| 免费在线观看视频国产中文字幕亚洲| 巨乳人妻的诱惑在线观看| av超薄肉色丝袜交足视频| 黄色丝袜av网址大全| 午夜两性在线视频| 淫秽高清视频在线观看| 欧美另类亚洲清纯唯美| 身体一侧抽搐| 丝袜美腿诱惑在线| 国产高清videossex| 亚洲成人免费电影在线观看| 一二三四社区在线视频社区8| 欧美人与性动交α欧美精品济南到| 午夜成年电影在线免费观看| 国产片内射在线| 国产精华一区二区三区| 久久久国产成人免费| 国产精品一区二区免费欧美| 亚洲熟女毛片儿| 国产不卡一卡二| 搡老妇女老女人老熟妇| 国产色视频综合| 亚洲国产中文字幕在线视频| 好看av亚洲va欧美ⅴa在| 天天躁夜夜躁狠狠躁躁| 日本 av在线| 天堂√8在线中文| 亚洲五月婷婷丁香| 久久久久精品国产欧美久久久| 亚洲免费av在线视频| 99国产精品99久久久久| 韩国av一区二区三区四区| 欧美亚洲日本最大视频资源| 在线免费观看的www视频| 亚洲性夜色夜夜综合| a在线观看视频网站| 美女扒开内裤让男人捅视频| 两性午夜刺激爽爽歪歪视频在线观看 | 国产欧美日韩精品亚洲av| 69av精品久久久久久| 久久香蕉激情| 欧美一级毛片孕妇| 日韩中文字幕欧美一区二区| 成在线人永久免费视频| 最新美女视频免费是黄的| 天天躁夜夜躁狠狠躁躁| 少妇裸体淫交视频免费看高清 | 黄色a级毛片大全视频| 日韩精品青青久久久久久| 国产一区二区三区在线臀色熟女| 日本在线视频免费播放| 嫩草影视91久久| 香蕉丝袜av| 丰满人妻熟妇乱又伦精品不卡| 亚洲熟女毛片儿| 久久久国产精品麻豆| 成人三级做爰电影| 久久久久久人人人人人| 亚洲五月天丁香| 啦啦啦韩国在线观看视频| 亚洲 欧美 日韩 在线 免费| 久久狼人影院| 午夜免费观看网址| 91av网站免费观看| 后天国语完整版免费观看| 黄色片一级片一级黄色片| 国产亚洲欧美精品永久| 欧美三级亚洲精品| 午夜亚洲福利在线播放| 精品国内亚洲2022精品成人| 一a级毛片在线观看| 亚洲成av人片免费观看| 成人国产综合亚洲| 淫秽高清视频在线观看| 久久人妻av系列| 精品电影一区二区在线| а√天堂www在线а√下载| 黄色丝袜av网址大全| 日韩欧美 国产精品| 99国产综合亚洲精品| 欧美中文综合在线视频| 色哟哟哟哟哟哟| 国产精品自产拍在线观看55亚洲| 精品第一国产精品| 成人三级黄色视频| 亚洲成人久久爱视频| 亚洲专区字幕在线| 亚洲精品美女久久久久99蜜臀| av片东京热男人的天堂| 国产成人欧美| 99久久无色码亚洲精品果冻| 一区二区三区国产精品乱码| 黄片小视频在线播放| 熟妇人妻久久中文字幕3abv| 久久人人精品亚洲av| 夜夜爽天天搞| 亚洲av片天天在线观看| 欧美黑人欧美精品刺激| 亚洲国产中文字幕在线视频| 人人妻人人澡欧美一区二区| 香蕉国产在线看| 国产熟女xx| 在线永久观看黄色视频| 久久久国产成人精品二区| 一边摸一边做爽爽视频免费| 亚洲av第一区精品v没综合| 国产在线精品亚洲第一网站| 99re在线观看精品视频| 久久午夜亚洲精品久久| 欧美精品亚洲一区二区| 成人亚洲精品一区在线观看| 国产高清videossex| 欧美又色又爽又黄视频| 青草久久国产| 免费无遮挡裸体视频| 亚洲av五月六月丁香网| 巨乳人妻的诱惑在线观看| 亚洲五月天丁香| 久久久久久久久免费视频了| 国产精品综合久久久久久久免费| 俄罗斯特黄特色一大片| 成人欧美大片| 18禁黄网站禁片免费观看直播| 久久午夜亚洲精品久久| 黄色成人免费大全| 欧美日韩乱码在线| 色综合婷婷激情| 国产欧美日韩一区二区三| 国产麻豆成人av免费视频| av免费在线观看网站| 精品久久久久久久毛片微露脸| 国产高清videossex| 人人妻人人澡欧美一区二区| 操出白浆在线播放| 欧美成人午夜精品| 一夜夜www| 高潮久久久久久久久久久不卡| 国产真人三级小视频在线观看| 好男人在线观看高清免费视频 | 亚洲性夜色夜夜综合| 国产在线精品亚洲第一网站| 久久精品国产亚洲av香蕉五月| 中文字幕精品亚洲无线码一区 | 18禁美女被吸乳视频| 精品国内亚洲2022精品成人| 亚洲国产精品sss在线观看| 久久久精品欧美日韩精品| 亚洲五月婷婷丁香| 日本一本二区三区精品| 999精品在线视频| 亚洲中文av在线| 十分钟在线观看高清视频www| 岛国在线观看网站| 一a级毛片在线观看| 一边摸一边抽搐一进一小说| 在线播放国产精品三级| 国产亚洲精品久久久久久毛片| 国产主播在线观看一区二区| 亚洲精品中文字幕一二三四区| 免费在线观看亚洲国产| 12—13女人毛片做爰片一| 99国产精品一区二区蜜桃av| 中文资源天堂在线| 久久香蕉国产精品| 亚洲在线自拍视频| 亚洲第一青青草原| 国产片内射在线| 亚洲国产精品999在线| 欧美日韩一级在线毛片| 身体一侧抽搐| 国产精品 国内视频| 亚洲av片天天在线观看| 琪琪午夜伦伦电影理论片6080| 久久午夜综合久久蜜桃| 久久精品夜夜夜夜夜久久蜜豆 | 国产成人啪精品午夜网站| 午夜免费成人在线视频| 午夜激情福利司机影院| 亚洲国产欧美日韩在线播放| 午夜福利在线观看吧| 亚洲一区二区三区不卡视频| 视频区欧美日本亚洲| 男女那种视频在线观看| 国产欧美日韩一区二区三| 欧美一级毛片孕妇| 美女大奶头视频| 在线观看免费午夜福利视频| 国产99白浆流出| 免费人成视频x8x8入口观看| 欧美 亚洲 国产 日韩一| 成人免费观看视频高清| 脱女人内裤的视频| 欧美午夜高清在线| 国产久久久一区二区三区| 国产野战对白在线观看| 国产成人一区二区三区免费视频网站| 亚洲国产欧美日韩在线播放| 真人一进一出gif抽搐免费| 一级a爱视频在线免费观看| 天天添夜夜摸| 久久精品国产综合久久久| 国产精品免费一区二区三区在线| 亚洲精品国产一区二区精华液| 伊人久久大香线蕉亚洲五| 俺也久久电影网| 亚洲午夜精品一区,二区,三区| 俄罗斯特黄特色一大片| 国产熟女xx| 亚洲中文av在线| 精品一区二区三区av网在线观看| 欧美激情 高清一区二区三区| 熟女少妇亚洲综合色aaa.| 无遮挡黄片免费观看| 非洲黑人性xxxx精品又粗又长| 久久婷婷成人综合色麻豆| 欧美成人一区二区免费高清观看 | 免费一级毛片在线播放高清视频| www.999成人在线观看| 国内久久婷婷六月综合欲色啪| 亚洲国产精品sss在线观看| 日本撒尿小便嘘嘘汇集6| 黄色 视频免费看| www.www免费av| 色老头精品视频在线观看| 国内毛片毛片毛片毛片毛片| 国产精品亚洲美女久久久| 亚洲av电影在线进入| 免费观看精品视频网站| 日韩三级视频一区二区三区| 黄色毛片三级朝国网站| 日韩三级视频一区二区三区| 丁香六月欧美| 色综合站精品国产| 99久久99久久久精品蜜桃| 久久久久久国产a免费观看| 亚洲天堂国产精品一区在线| 久久中文看片网| 国产片内射在线| 男女下面进入的视频免费午夜 | 国产高清视频在线播放一区| 可以在线观看的亚洲视频| 999久久久精品免费观看国产| 18美女黄网站色大片免费观看| 少妇熟女aⅴ在线视频| 久久中文字幕人妻熟女| 熟妇人妻久久中文字幕3abv| 亚洲七黄色美女视频| 亚洲国产日韩欧美精品在线观看 | 欧美日韩瑟瑟在线播放| 免费女性裸体啪啪无遮挡网站| 亚洲国产精品久久男人天堂| 一进一出好大好爽视频| 亚洲第一电影网av| 婷婷六月久久综合丁香| 欧美日韩亚洲国产一区二区在线观看| 久久国产精品男人的天堂亚洲| 国产区一区二久久| 亚洲成人精品中文字幕电影| www国产在线视频色| 此物有八面人人有两片| 很黄的视频免费| 999久久久国产精品视频| 欧美日韩福利视频一区二区| 久久婷婷成人综合色麻豆| 一本一本综合久久| 亚洲国产高清在线一区二区三 | 成人18禁高潮啪啪吃奶动态图| 日韩欧美一区二区三区在线观看| 精品久久久久久久久久久久久 | 欧美一级毛片孕妇| 日韩 欧美 亚洲 中文字幕| 少妇的丰满在线观看| 日韩成人在线观看一区二区三区| 欧美成人免费av一区二区三区| 亚洲自拍偷在线| 国产单亲对白刺激| 啦啦啦免费观看视频1| 亚洲欧美精品综合久久99| 在线视频色国产色| 午夜福利成人在线免费观看| 少妇被粗大的猛进出69影院| 欧美日韩黄片免| 国产av又大| 每晚都被弄得嗷嗷叫到高潮| 午夜激情福利司机影院| 午夜福利18| 国产精品亚洲av一区麻豆| 在线视频色国产色| www.精华液| 日本 av在线| 国产精品永久免费网站| 岛国视频午夜一区免费看| 亚洲欧美日韩高清在线视频| 19禁男女啪啪无遮挡网站| 久久国产亚洲av麻豆专区| 国产欧美日韩精品亚洲av| 国产99久久九九免费精品| 国产av不卡久久| 丁香六月欧美| 国内毛片毛片毛片毛片毛片| 搞女人的毛片| 人成视频在线观看免费观看| 亚洲人成网站在线播放欧美日韩| 一本一本综合久久| 韩国精品一区二区三区| 国产97色在线日韩免费| 午夜a级毛片| 国产av一区在线观看免费| 亚洲第一青青草原| 丁香六月欧美| 91av网站免费观看| 亚洲色图av天堂| 一边摸一边抽搐一进一小说| 亚洲精品国产区一区二| 久久这里只有精品19| 99国产极品粉嫩在线观看| av片东京热男人的天堂| 久久久久亚洲av毛片大全| 国产97色在线日韩免费| 国内揄拍国产精品人妻在线 | 国产三级在线视频| 亚洲avbb在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 日韩一卡2卡3卡4卡2021年| 久久久国产欧美日韩av| 99热这里只有精品一区 | 国产精品98久久久久久宅男小说| 久久性视频一级片| 国内少妇人妻偷人精品xxx网站 | av福利片在线| av天堂在线播放| 老司机午夜福利在线观看视频| 男人舔女人下体高潮全视频| 九色国产91popny在线| 国产精品一区二区三区四区久久 | 亚洲精品色激情综合| 可以在线观看毛片的网站| 嫩草影院精品99| 一本大道久久a久久精品| 日本a在线网址| 婷婷亚洲欧美| 俺也久久电影网| 国产高清视频在线播放一区| 亚洲一区高清亚洲精品| 黄色女人牲交| 日韩大尺度精品在线看网址| 亚洲无线在线观看| 两性午夜刺激爽爽歪歪视频在线观看 | 久久久久久久精品吃奶| 日韩中文字幕欧美一区二区| av福利片在线| 美女大奶头视频| 欧美国产日韩亚洲一区| 变态另类丝袜制服| 国产免费男女视频| 色精品久久人妻99蜜桃| 免费在线观看影片大全网站| 十分钟在线观看高清视频www| 男人舔女人下体高潮全视频| 国产又黄又爽又无遮挡在线| 亚洲无线在线观看| 婷婷亚洲欧美| 精品欧美国产一区二区三| 伊人久久大香线蕉亚洲五| 狂野欧美激情性xxxx| 久久久国产成人免费| 国产免费男女视频| 国产成人影院久久av| 麻豆久久精品国产亚洲av| 美女 人体艺术 gogo| 天天躁狠狠躁夜夜躁狠狠躁| 国产高清videossex| 变态另类丝袜制服| 不卡av一区二区三区| 日本 欧美在线| 国产成人欧美| 久久精品国产99精品国产亚洲性色| 久久99热这里只有精品18| 一级毛片女人18水好多| 国产伦人伦偷精品视频| 夜夜看夜夜爽夜夜摸| 在线观看日韩欧美| 在线视频色国产色| 日本三级黄在线观看| 国产精品,欧美在线| 亚洲精品av麻豆狂野| 极品教师在线免费播放| 午夜激情av网站| 欧美色视频一区免费| 久久久久亚洲av毛片大全| 熟女少妇亚洲综合色aaa.| 两个人免费观看高清视频| 国产v大片淫在线免费观看| 精品国产一区二区三区四区第35| 国产免费av片在线观看野外av| 精品欧美国产一区二区三| 精品不卡国产一区二区三区| 久久精品国产亚洲av高清一级| 国产伦在线观看视频一区| 亚洲狠狠婷婷综合久久图片| 国产熟女xx| 欧美成人性av电影在线观看| 国产熟女xx| 亚洲狠狠婷婷综合久久图片| 国产伦一二天堂av在线观看| 日本a在线网址| 变态另类成人亚洲欧美熟女| 黄片大片在线免费观看| 成人av一区二区三区在线看| 亚洲精品久久国产高清桃花| 国产黄片美女视频| 99riav亚洲国产免费| 国产高清视频在线播放一区| 亚洲欧美激情综合另类| 亚洲成人精品中文字幕电影| www.精华液| 在线免费观看的www视频| 国产激情欧美一区二区| 欧美日韩中文字幕国产精品一区二区三区| 精品卡一卡二卡四卡免费| or卡值多少钱| 欧美精品啪啪一区二区三区| 老鸭窝网址在线观看| 精品不卡国产一区二区三区| 欧美成狂野欧美在线观看| 丝袜在线中文字幕| 中文字幕精品亚洲无线码一区 | 日韩欧美一区视频在线观看| 国产又黄又爽又无遮挡在线| 国产成年人精品一区二区| 国产在线精品亚洲第一网站| 19禁男女啪啪无遮挡网站| 丁香六月欧美| 一个人免费在线观看的高清视频| 国产伦一二天堂av在线观看| 免费人成视频x8x8入口观看| 成年版毛片免费区| 高清毛片免费观看视频网站| 亚洲三区欧美一区| 亚洲色图 男人天堂 中文字幕| 国内少妇人妻偷人精品xxx网站 | 听说在线观看完整版免费高清| 色婷婷久久久亚洲欧美| 18美女黄网站色大片免费观看| 精品少妇一区二区三区视频日本电影| 国产精华一区二区三区| 久久久久久人人人人人| 18禁黄网站禁片午夜丰满| 免费看a级黄色片| 亚洲成a人片在线一区二区| av在线播放免费不卡| 免费高清在线观看日韩| 亚洲国产中文字幕在线视频| 一进一出抽搐gif免费好疼| 国产国语露脸激情在线看| 大型黄色视频在线免费观看| 午夜免费激情av| 曰老女人黄片| 18禁裸乳无遮挡免费网站照片 | 黄片小视频在线播放| 精品一区二区三区av网在线观看| 欧美日韩中文字幕国产精品一区二区三区| 黑人操中国人逼视频| 69av精品久久久久久| 少妇 在线观看| 国产精华一区二区三区| 大型黄色视频在线免费观看| 很黄的视频免费| 国产又色又爽无遮挡免费看| 一本精品99久久精品77| 天堂√8在线中文| 热re99久久国产66热| 少妇裸体淫交视频免费看高清 | 久久 成人 亚洲| 国产精品精品国产色婷婷| 亚洲av五月六月丁香网| 好男人在线观看高清免费视频 | 久久久久国产一级毛片高清牌| 婷婷六月久久综合丁香| 精品久久久久久久久久免费视频| 国产精品九九99| 国产成+人综合+亚洲专区| 国产精品久久视频播放| 一进一出抽搐gif免费好疼| 在线av久久热| 久热这里只有精品99| 啦啦啦韩国在线观看视频| 久久久国产精品麻豆| 欧美 亚洲 国产 日韩一| 亚洲精华国产精华精| 亚洲国产高清在线一区二区三 | 99国产精品99久久久久| 免费看美女性在线毛片视频| 亚洲精品一卡2卡三卡4卡5卡| 国产精品久久久久久人妻精品电影| 欧美三级亚洲精品| 97超级碰碰碰精品色视频在线观看| 日韩 欧美 亚洲 中文字幕| 精品第一国产精品| 国产精品日韩av在线免费观看| 在线观看舔阴道视频| 国内毛片毛片毛片毛片毛片| 日韩精品中文字幕看吧| 嫁个100分男人电影在线观看| 成人av一区二区三区在线看| 在线av久久热| 久久婷婷人人爽人人干人人爱| 啦啦啦观看免费观看视频高清| 亚洲九九香蕉| 久久精品91蜜桃| 在线av久久热| 国产欧美日韩一区二区三| 色av中文字幕| 国产午夜精品久久久久久| 日本熟妇午夜| 麻豆成人午夜福利视频| 日韩成人在线观看一区二区三区| 亚洲欧美精品综合久久99| 国产一卡二卡三卡精品| 精品国内亚洲2022精品成人| 国产亚洲精品久久久久5区|