李樹榮
(中國(guó)石油大學(xué)信息與控制工程學(xué)院,山東青島266580)
在求解最優(yōu)控制問(wèn)題的方法中,直接法始終是一種被廣泛應(yīng)用的方法[1-2]。其中,利用某些函數(shù)序列對(duì)原控制問(wèn)題進(jìn)行近似從而進(jìn)行直接求解的方法在直接法中也多有使用。Chen等[3]將沃爾什序列法引入最優(yōu)控制問(wèn)題的直接求解中,并得到相應(yīng)最優(yōu)控制問(wèn)題的分段常數(shù)解。勒讓德小波法[4]、切比雪夫多項(xiàng)式法[5]、傅里葉序列法[6]和高斯偽譜法[7]也被引入來(lái)對(duì)最優(yōu)控制問(wèn)題進(jìn)行直接求解。不同于以上的正交函數(shù),Anish等[8]提出了一種源于方脈沖函數(shù)(BPFs)的三角正交函數(shù),給出了該函數(shù)的積分計(jì)算矩陣,并驗(yàn)證了三角正交函數(shù)在近似求解數(shù)值問(wèn)題時(shí)較好的近似性能和較快的計(jì)算速度。筆者基于此三角正交函數(shù),提出一種求解帶有狀態(tài)和不等式約束的非線性最優(yōu)控制問(wèn)題的數(shù)值求解方法。
基于方脈沖函數(shù),Anis等[8]提出了三角正交函數(shù)。通過(guò)拆分,在區(qū)間[0,1)中將一個(gè)方脈沖函數(shù)分解成兩個(gè)三角正交函數(shù)TLi(t)和TRi(t):
其中 i=0,1,2,…,m-1,h=1/m。
三角正交函數(shù)的兩個(gè)向量左三角函數(shù)TL(t)和右三角函數(shù)TR(t)為
函數(shù)f(t)可用含有m項(xiàng)的三角正交函數(shù)序列展開為
其中
TL(t)的積分可表示為
式中,矩陣PL和PR為積分運(yùn)算矩陣
其中,PL和PR為m×m維矩陣。TR(t)的積分計(jì)算與TL(t)相同。
f(t)的積分可表示為
由式(7),已知C和D便可確定f(t)的近似積分值。
尋找最優(yōu)向量 U(τ),和相應(yīng)的狀態(tài)向量X(τ),τ ∈[0,tf],使下面的性能指標(biāo)最小:
其中,X(τ)和U(τ)分別為l×1維和q×1維向量。向量函數(shù)F和標(biāo)量函數(shù)Si由一般的非線性函數(shù)組成并對(duì)X和U可微,tf為終端時(shí)間。并假設(shè)上述最優(yōu)控制問(wèn)題(8)~(10)存在唯一解。由于三角正交函數(shù)為定義在t∈[0,1]上的函數(shù)集合,引入時(shí)間轉(zhuǎn)換τ=tft,將式(8)~(10)轉(zhuǎn)化為
文獻(xiàn)[9]中僅應(yīng)用三角正交函數(shù)對(duì)無(wú)不等式約束的最優(yōu)控制問(wèn)題進(jìn)行了求解,本文中對(duì)含有不等式約束的問(wèn)題進(jìn)行求解。
將˙x(t)和u(t)用三角正交函數(shù)序列近似為
同樣,初始條件用三角正交函數(shù)展開為
將式(14)從0到t積分可得
由式(14)和(15),系統(tǒng)狀態(tài)方程可近似為
類似于式(14),同樣可以得到
將式(14)和(17)帶入式(18)中可得
引理 1[9]CL·TL(t)+CR·TR(t)=FL·
TL(t)+FR·TR(t),其中 CL,CR,F(xiàn)L,和 FR為 m 維系數(shù)向量,則有 CL=FL,CR=FR。
由引理1和式(20)可得
由式(15)和(17)可得
與式(19)同理,可得
式中,GL和GR為1×m維矩陣。
將式(25)代入式(11)可得
式(13)中的不等式約束可由如下的等式約束替換[10]:
其中 zj(t),j=1,2,…,v為輔助函數(shù)。將 z(t)用三角正交函數(shù)展開可得
其中ZLj和ZRj是m維向量,同時(shí)構(gòu)成v×m維矩陣ZL和ZR的第j行。同時(shí)可得
sj可改寫為
定義
其中 j=1,2,…,v。
將式(31)可展開為
此時(shí)式(13)中的不等式約束可轉(zhuǎn)化為一個(gè)通過(guò)求解 KLj,KRj,j=1,…,v 使如下函數(shù)值最小的問(wèn)題:
綜上,原最優(yōu)控制問(wèn)題(11)~(13)可以轉(zhuǎn)化為以下的最優(yōu)控制問(wèn)題。
計(jì)算 CL、CR、DL、Dr、ZL和 ZR,使下面的性能指標(biāo)函數(shù)值最小:
其中λ為未知的拉格朗日乘數(shù)。為計(jì)算J*的極值,求J*的偏導(dǎo)數(shù),并設(shè)其為零。
式(36)~(42)可用內(nèi)點(diǎn)法求解。
在求得未知系數(shù)CL,CR,DL和DR的最優(yōu)解后,將其代入式(15)和(17)便可得到新一輪迭代所需的x(t)和u(t)。將新得到的x(t)和u(t)代入式(11)~(13)中便可得到新一輪迭代所要求解的受限非線性最優(yōu)控制問(wèn)題。迭代計(jì)算重復(fù)進(jìn)行直到滿足終止條件為止。設(shè)定當(dāng)如下的條件滿足時(shí)計(jì)算終止:
算法流程如下。
步驟 1:設(shè)定 CL,CR,DL,DR,ZL和 ZR。
步驟2:時(shí)間區(qū)間由τ∈[0,tf]轉(zhuǎn)換為t∈[0,1]。
步驟3:用式(15)求帶有未知系數(shù)的控制變量。
步驟4:用式(17)求含有未知系數(shù)的狀態(tài)變量。
步驟5:用式(19)計(jì)算系統(tǒng)狀態(tài)方程。
步驟6:用式(26)計(jì)算性能指標(biāo)。
步驟7:用式(33)計(jì)算不等式約束。
步驟8:內(nèi)點(diǎn)法法求解最優(yōu)控制問(wèn)題(36)~(42)。
步驟9:將所求得的最優(yōu)解代入式(15)和(17)得到新一輪迭代計(jì)算所需的x(t)和u(t)。
試驗(yàn)環(huán)境為Matlab,計(jì)算芯片為酷睿2(2.4 GHz),內(nèi)存2 G。
考慮范德波爾振蕩器(Van der Pol oscillator)問(wèn)題。該例曾在文獻(xiàn)[11]中用切比雪夫法進(jìn)行求解。計(jì)算滿足約束的控制向量u(t)使如下性能指標(biāo)最小:
選取ε=1×10-7,用內(nèi)點(diǎn)法進(jìn)行迭代計(jì)算。表1給出了本文算法所得的性能指標(biāo)和計(jì)算耗時(shí),并與其他方法進(jìn)行了比較。圖1給出了狀態(tài)變量的計(jì)算結(jié)果,圖2為最優(yōu)控制軌跡。
表1 例1仿真結(jié)果比較Table 1 Results comparison of example 1
圖1 例1最優(yōu)狀態(tài)軌跡Fig.1 Optimal states of example 1
圖2 例1最優(yōu)控制軌跡Fig.2 Optimal control of example 1
考慮來(lái)自文獻(xiàn)[12]的問(wèn)題,計(jì)算控制向量u(t),使如下的性能指標(biāo)函數(shù)值最小:
狀態(tài)變量不等式約束為
選取ε=1×10-7,用內(nèi)點(diǎn)法進(jìn)行迭代計(jì)算。表2給出了本文算法所得的性能指標(biāo)和計(jì)算耗時(shí),并與其他方法進(jìn)行了比較。圖3給出了狀態(tài)變量的計(jì)算結(jié)果,圖4為最優(yōu)控制軌跡。
表2 例2仿真結(jié)果比較Table 2 Results comparison of example 2
圖3 例2最優(yōu)狀態(tài)軌跡Fig.3 Optimal states of example 2
以上兩個(gè)仿真算例表明,本算法可以應(yīng)用于求解受限最優(yōu)控制問(wèn)題。在滿足題設(shè)對(duì)控制或狀態(tài)限制的情況下,本算法可較切比雪夫多項(xiàng)式法得到更佳的性能指標(biāo),并且計(jì)算耗時(shí)更少。這樣結(jié)果的出現(xiàn),得益于三角正交函數(shù)簡(jiǎn)單的結(jié)構(gòu),對(duì)函數(shù)的近似性能好,這樣的特性使得三角正交函數(shù)有較快的收斂速度和對(duì)函數(shù)較好的近似性。
圖4 例2最優(yōu)控制軌跡Fig.4 Optimal control of example 2
針對(duì)帶有終端狀態(tài)約束、不等式約束的非線性最優(yōu)控制問(wèn)題,提出了一種基于三角正交函數(shù)的直接計(jì)算方法。該方法用系數(shù)待定的三角正交函數(shù)將控制變量和系統(tǒng)狀態(tài)進(jìn)行展開,進(jìn)而將性能指標(biāo)函數(shù)、狀態(tài)方程和不等式約束等進(jìn)行近似,從而將非線性最優(yōu)控制問(wèn)題轉(zhuǎn)化為一系列代數(shù)方程進(jìn)行求解。這樣簡(jiǎn)化了求解問(wèn)題的復(fù)雜性,將原非線性受限最優(yōu)控制問(wèn)題轉(zhuǎn)化為代數(shù)方程,借助求解代數(shù)方程,實(shí)現(xiàn)了對(duì)原最優(yōu)控制問(wèn)題的直接求解。試驗(yàn)結(jié)果驗(yàn)證了該算法求解最優(yōu)控制問(wèn)題的有效性;該算法在滿足題設(shè)限制的情況下,可得到較切比雪夫多項(xiàng)式算法更快的計(jì)算速度和更好的性能指標(biāo),驗(yàn)證了該算法在求解此類最優(yōu)控制問(wèn)題上有較好的收斂性和計(jì)算精度。
[1] 雷陽(yáng),李樹榮,張強(qiáng),等.一種求解最優(yōu)控制問(wèn)題的非均勻控制向量參數(shù)化方法[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2011,35(5):180-184.
LEI Yang,LI Shu-rong,ZHANG Qiang,et al.A non-uniform control vector parameterization approach for optimal control problems[J].Journal of China University of Petroleum(Edition of Natural Science),2011,35(5):180-184.
[2] 王峰,李樹榮.多目標(biāo)產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化最優(yōu)控制模型的改進(jìn)及求解[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2011,35(2):182-187.
WANG Feng,LI Shu-rong.Improvement on a multi-objective optimal control model of industrial structure optimization and its solution[J].Journal of China University of Petroleum(Edition of Natural Science),2011,35(2):182-187.
[3] CHEN C F,HSIAO C H.A Walsh series direct method for solving variational problems[J].Journal of the Franklin Institute,1975,30:265-280.
[4] RAZZAGHI M,YOUSEFI S.Legendre wavelets direct method for variational problems[J].Mathematics and Computers in Simulation,2000,53:185-192.
[5] HORNG I R,CHOU J H.Shifted Chebyshev direct method for solving variational problems[J].International Journal of Systems Science,1985,16:855-861.
[6] MOHSEN R,MEHDI R,ADBOLLAH A.Solutions of convolution integral and Fredholm integral equations via double Fourier series[J].Applied Mathematics and Computation,1990,40:215-224.
[7] 李樹榮,韓振宇,于光金.基于高斯偽譜的最優(yōu)控制求解及其應(yīng)用[J].系統(tǒng)科學(xué)與數(shù)學(xué),2010,30(8):1031-1043.
LI Shu-rong,HAN Zhen-yu,YU Guang-jin.Numerical algorithm of optimal control based on a gauss pseudospectral method and its application[J].Journal of System Science and Mathematical Science Chinese Series,2010,30(8):1031-1043.
[8] ANISH D,ANINDITA D,GAUTAM S.A new set of orthogonal functions and its application to the analysis of dynamic systems[J].Journal of the Franklin Institute,2006,343:1-26.
[9] ANISH D,GAUTAM S,SUNIT K S.Block pulse functions,the most fundamental of all piecewise constant basis functions[J].International Journal of Systems Science,1994,25:351-363.
[10] MARZBAN H R,RAZZAGHI M.Hybrid functions approach for linearly constrained quadratic optimal control problems[J].Applied Mathematical Modelling,2003,27:471-485.
[11] KLEINMAN D L,F(xiàn)ORTMANN T,ATHANS M.On the design of linear systems with piecewise-constant feedback gains[J].Automatic Control,IEEE Transactions on,1968,13:354-361.
[12] HUSSEIN J.Direct solution of nonlinear optimal control problems using quasilinearization and chebyshev polynomials[J].Journal of the Franklin Institute,2002,339:479-498.