0和U?Rm,定義"/>
計(jì) 偉
(貴州建設(shè)職業(yè)技術(shù)學(xué)院信息管理學(xué)院,貴州 貴陽 551400)
我們從線性二次最優(yōu)控制問題的敘述開始。設(shè)T>0和U?Rm,定義
D[0,T]={(s,t)∈[0,T]×[0,T]│0≤s≤t≤T}
和
u[t,s]=L2([t,s];Rm)≡{u:[t,s]→
對(duì)固定y0∈Rn,考慮以下線性控制系統(tǒng):
(0.1)
其中,C(·)∈L∞([0,T];Rn×n),D(·)∈L∞([0,T];Rn×m),顯然,對(duì)?u(·)∈u[0,T],控制系統(tǒng)存在唯一解:
性能指標(biāo)為:
〈M(s,s)u(s),u(s)〉]ds
(0.2)
其中,L∈L∞(D[0,T];Sn),M∈L∞(D[0,T];Sm)。這里Sn表示n×n階實(shí)值對(duì)稱矩陣全體。最優(yōu)控制問題為:
問題(LQ)。對(duì)于系統(tǒng)(0.1),在控制集u[0,T]中求控制函數(shù),使得性能指標(biāo)(0.2)最小化。即:
問題(LQ)最顯著的特征是時(shí)間一致性,也就是對(duì)固定的初始對(duì)(0,y0),求得最優(yōu)解后,沿著最優(yōu)軌道,在任意時(shí)刻對(duì)應(yīng)的控制都是最優(yōu)控制。但是,由于社會(huì)環(huán)境的復(fù)雜變化和決策者決策心態(tài)的改變,現(xiàn)實(shí)問題并不是如此簡(jiǎn)單和完美,往往表現(xiàn)為時(shí)間不一致性。事實(shí)上,時(shí)間不一致問題遠(yuǎn)多于時(shí)間一致問題,并且時(shí)間一致問題可以看著是時(shí)間不一致問題的一個(gè)特例[1]。時(shí)間不一致控制問題的例子可見文獻(xiàn)[2,3]。
關(guān)于時(shí)間不一致控制問題里程碑似的研究工作是Strotz[4]于1955年對(duì)時(shí)間不一致控制問題的數(shù)學(xué)公式化。在這之后,由于時(shí)間不一致控制問題具有重要的理論價(jià)值和應(yīng)用價(jià)值,大量數(shù)學(xué)家和金融學(xué)家對(duì)其展開研究,尤其是近年來,取得了豐碩的研究成果[5-15]。但是,正如著名行為金融學(xué)家周迅宇教授指出:關(guān)于時(shí)間不一致問題的研究遠(yuǎn)未成熟,現(xiàn)尚處于初期探索階段。
對(duì)?(t,y)∈[0,T]×Rn,考慮以下線性控制系統(tǒng):
(1.1)
以及如下性能指標(biāo):
(1.2)
考慮如下的控制問題:
問題(TILQ)。對(duì)于系統(tǒng)(1.1),在控制集u[0,T]中求控制函數(shù),使得性能指標(biāo)(1.2)最小化,即:
因?yàn)閱栴}(TILQ)對(duì)初始時(shí)間t的依賴性,這意味著隨著控制的進(jìn)行,問題(TILQ)的性能指標(biāo)甚至控制系統(tǒng)會(huì)因?yàn)闀r(shí)間t的變化而變化。因此,對(duì)問題(TILQ)的優(yōu)化問題并不是簡(jiǎn)單地優(yōu)化一個(gè)問題,而是優(yōu)化一族問題,顯然,問題(TILQ)不同于經(jīng)典問題(LQ)。
對(duì)?t∈[0,T],ε>0和v∈U。其中,
我們引入如下假設(shè)條件:
(L1):設(shè)L:D[0,T]→Sn和M:D[0,T]→Sm連續(xù),并且對(duì)某個(gè)常數(shù)δ>0有:
L(t,s)≥0,M(t,s)≥δI,(t,s)∈D[0,T]
存在一個(gè)常數(shù)l>0,使得:
|L(t1,s)-L(t2,s)|+|M(t1,s)-M(t2,s)|≤l|t1-t2|,?t1,t2,s∈[0,T]
命題2.1 設(shè)(L1)成立,對(duì)任意給定的初始對(duì)(t,y)∈[0,T]×Rn,則方程組:
(2.1)
存在解φ∈C([0,T];Rn)。
(2.2)
(2.3)
因?yàn)閠固定,方程組(2.3)顯然可解(文獻(xiàn)[16]),這意味著方程組(2.1)至少存在一個(gè)解,不妨記為:
其中,
定理2.2 設(shè)(L1)成立,設(shè)y0∈Rn固定,則問題(LQ)的最優(yōu)控制是問題(TILQ)的均衡控制。
(2.4)
由(2.1)式,我們有:
又因?yàn)镸是正定矩陣,所以: