王鵬飛 王安格宗恒山關(guān)宏志劉鵬徐秋實李松
(1.燕山大學(xué) 河北省土木工程綠色建造與智能運維重點實驗室,河北 秦皇島 066004;2.北京工業(yè)大學(xué) 城市與工程安全減災(zāi)教育部重點實驗室,北京 100124;3.北京工業(yè)大學(xué) 城市建設(shè)學(xué)部,北京 100124;4.中國航天系統(tǒng)科學(xué)與工程研究院,北京 100037;5.北京航空航天大學(xué) 經(jīng)濟管理學(xué)院,北京 100191;6.北京航空航天大學(xué) 復(fù)雜系統(tǒng)分析與管理決策教育部重點實驗室,北京 100191;7.石家莊鐵道大學(xué) 交通運輸學(xué)院,河北 石家莊 050043)
隨著國民經(jīng)濟的快速發(fā)展,路網(wǎng)流量的迅猛增長,交通供需矛盾日益突出。為了緩解交通擁堵所帶來的負面外部性并促進經(jīng)濟和社會發(fā)展,通過新建道路增加路網(wǎng)容量成為管理者的重要舉措。與此同時,城市道路在其服役期內(nèi)會出現(xiàn)不同程度的壞損,道路養(yǎng)護工作也亟需開展。近些年,隨著預(yù)防性養(yǎng)護概念的不斷深入,道路養(yǎng)護工作越來越受到研究人員的重視。因此,在預(yù)算有限的條件下,如何科學(xué)地制定道路新建與養(yǎng)護的最優(yōu)投資比例以最小化所有用戶的出行成本就顯得尤為重要。
道路養(yǎng)護的最優(yōu)決策問題并非一個新話題,早在20 世紀(jì)80 年代,Golabi等[1]就利用線性規(guī)劃模型建立了美國亞利桑那洲路面管理系統(tǒng)并成功地在第一年為州政府節(jié)約了1400 萬美元的財政支出。在此領(lǐng)域,利用動態(tài)規(guī)劃理論建模是比較常見的,Ouyang[2]以最小化路面養(yǎng)護和用戶總成本為目標(biāo),建立了離散時間的路面重修資金的最優(yōu)分配模型。Kuhn等[3]將不確定性納入到馬爾科夫決策模型中,并提出了魯棒優(yōu)化策略。Medury等[4]利用了值函數(shù)近似理論,構(gòu)建了近似動態(tài)規(guī)劃模型以回避在現(xiàn)實中多維精確值函數(shù)形式難以確定的問題。在聯(lián)合優(yōu)化理論方面,Hajibabai等[5]認為工廠的選址會顯著影響周邊道路的壞損程度,因此在用戶均衡理論框架下提出了貨運設(shè)施選址和道路養(yǎng)護策略的聯(lián)合優(yōu)化理論。Lee等[6]構(gòu)建了基于歷史數(shù)據(jù)退化模型的路面設(shè)計與養(yǎng)護的聯(lián)合優(yōu)化模型。此后,Lee等[7]又提出了一種道路養(yǎng)護和重建的聯(lián)合自下而上求解方法。另外,還可利用多目標(biāo)優(yōu)化理論進行建模,Saha等[8]構(gòu)建了一種最大化交通流量和現(xiàn)有路況功能指標(biāo),最小化風(fēng)險的模型。Meneses等[9]開發(fā)了一種可最小化投資總額和用戶出行成本,同時實現(xiàn)路面殘值最大化的多目標(biāo)路面養(yǎng)護決策輔助工具。在道路養(yǎng)護與環(huán)境、經(jīng)濟成本的相互關(guān)系分析方面,Ozer等[10]重點分析了現(xiàn)有各種道路養(yǎng)護技術(shù)的環(huán)境與經(jīng)濟成本,Yu等[11]和Lee等[12]也考慮了路面養(yǎng)護造成的環(huán)境污染問題。
在國內(nèi),桂濱等[13]為公路網(wǎng)改擴建決策優(yōu)化提出了雙層規(guī)劃模型以實現(xiàn)所有用戶的總出行時間最小化。王朝輝[14]等認為路面預(yù)防性養(yǎng)護對維持良好路面性能具有重要意義,因此利用重構(gòu)數(shù)據(jù)包絡(luò)分析方法提出了預(yù)防性養(yǎng)護時機與對策一體優(yōu)化模型。鄭士源等[15]在總結(jié)交通基礎(chǔ)設(shè)施特點的基礎(chǔ)上,對跨期增長模型進行了修正并建立了交通基礎(chǔ)設(shè)施投資最優(yōu)化模型。董小林等[16]基于全壽命周期理論對公路項目的環(huán)境成本進行了定量分析并得到環(huán)境成本計算公式。李弢等[17]提出了基于用戶均衡條件下的路面養(yǎng)護的最優(yōu)決策模型。張艷紅等[18]構(gòu)建了基于資金與目標(biāo)雙約束條件下的道路養(yǎng)護策略。孫強等[19]在綜合考慮投資效率和地區(qū)公平分配的基礎(chǔ)上,構(gòu)建了考慮公平約束的多階段交通基礎(chǔ)設(shè)施投資的地區(qū)結(jié)構(gòu)優(yōu)化模型。Fan等[20]建立了隨機線性規(guī)劃模型對資金預(yù)算不確定條件下的路面維護和修復(fù)項目管理進行決策優(yōu)化。彭華等[21]提出了將網(wǎng)級路面管理系統(tǒng)中的資金優(yōu)化模型詳細劃分為高、中、低三類服務(wù)水平,既有利于管理部門決策也降低了模型求解難度。鮑海君[22]基于博弈論提出了基礎(chǔ)設(shè)施BOT 項目特許權(quán)期的有效計算方法。王東波等[23]以道路建設(shè)項目為對象,將計算特許權(quán)期的既有理論擴展到了彈性交通需求條件下。趙立力等[24]又提出了在道路建設(shè)的BOT 項目中納入調(diào)節(jié)基金決策機制的構(gòu)想。
上述研究雖然取得了豐碩的成果,但還存在以下可以擴展的方面:(1)僅探討路面養(yǎng)護的方法、時機和投資策略或區(qū)域交通基礎(chǔ)設(shè)施的最優(yōu)總投資額度,并沒有同時考慮道路新建和養(yǎng)護及對兩者的最優(yōu)投資比例;(2)路網(wǎng)流量為外生給定的精確值,沒有考慮道路新建與路網(wǎng)流量之間的相互作用機理,同時也沒有對其不確定性進行建模;(3)基于用戶均衡理論構(gòu)建的雙層規(guī)劃模型難以支持大規(guī)模路網(wǎng)的決策問題。鑒于此,本研究擬構(gòu)建連續(xù)時間的隨機最優(yōu)控制模型,在路網(wǎng)流量存在不確定性和給定投資預(yù)算的約束下,從宏觀層面上尋求新建和養(yǎng)護道路的動態(tài)最優(yōu)投資比例以最小化所有用戶的總出行成本。
根據(jù)現(xiàn)實情況,本研究在如下四個方面進行場景設(shè)定:(1)投資預(yù)算與分配;(2)用戶出行成本;(3)路網(wǎng)容量;(4)路網(wǎng)流量。
投資預(yù)算與分配方面:每年對道路修建的投資總量是外生給定的,但并非定值,且年末無結(jié)余、無赤字。在此條件下,管理者只能決定新建道路與養(yǎng)護道路的資金動態(tài)使用比例。同時,對于城市建成區(qū)道路的新建與養(yǎng)護,出資主體是一致的,均為當(dāng)?shù)卣?并沒有引入民間資本。
用戶出行成本方面:除固定出行成本外,還存在以下兩種出行成本:(1)可變出行成本,其與路網(wǎng)飽和度密切相關(guān),此處的路網(wǎng)飽和度被定義為路網(wǎng)流量和路網(wǎng)容量的比值。(2)道路養(yǎng)護期間會因占用空間資源而降低其通行能力,進而使用戶出行成本暫時增加,稱為暫時增加出行成本。
路網(wǎng)容量方面:(1)路網(wǎng)容量的定義為在一定的交通狀態(tài)下,一定時間內(nèi),在道路網(wǎng)上所能實現(xiàn)的最大車公里數(shù)。(2)基于(1)中的定義,新建道路一定能夠提高路網(wǎng)容量的上限值,而養(yǎng)護道路僅能恢復(fù)路網(wǎng)容量,但不能突破其上限值。(3)路網(wǎng)容量降低的主要原因是產(chǎn)生病害,而病害則主要與路網(wǎng)流量等因素密切相關(guān)(詳見文獻[25])。(4)道路的新建和養(yǎng)護在時間t內(nèi)可完成,但道路養(yǎng)護會導(dǎo)致部分道路暫時封閉致使用戶的出行成本暫時增加。(5)只有在道路產(chǎn)生病害導(dǎo)致路網(wǎng)容量下降后,政府才會進行相應(yīng)的養(yǎng)護,即不考慮預(yù)防性養(yǎng)護。
路網(wǎng)流量方面:(1)路網(wǎng)流量的基本增長率是外生給定的,但并非定值?,F(xiàn)實中,路網(wǎng)流量由機動車保有量與交通管制政策綜合計算得出。(2) 根據(jù)湯姆森—當(dāng)斯定律(thomson-downs law),新建道路(路網(wǎng)容量上限增加)會刺激路網(wǎng)流量的增長。對此,文獻[26]已經(jīng)進行過理論和實證分析。(3)對于新建道路對路網(wǎng)流量增長的刺激,管理者可以進行非精確預(yù)測,因此存在不確定性。(4)由于本研究的目的是建立宏觀決策模型,因此不考慮具體的路網(wǎng)結(jié)構(gòu)和用戶出行規(guī)則。
道路管理者的目標(biāo)是在[0,T] 期間內(nèi)最小化交通系統(tǒng)內(nèi)所有用戶的總出行成本TC(v,r,t,λ)(為降低公式表達的繁瑣程度,下文使用(·) 代表(t,v,r,λ),使用(·) 代表(t,v,r)),可定義如下:
式(1)中,C(·) 為所有用戶時刻t的總出行成本;v(t) 為時刻t的路網(wǎng)流量,r(t) 為時刻t的路網(wǎng)容量,v(t)和r(t) 均為本模型的狀態(tài)變量;v(t)/r(t) 為路網(wǎng)飽和度;s為固定出行成本;k1為路網(wǎng)飽和度與出行成本之間的換算系數(shù);k2為道路養(yǎng)護對用戶出行成本增加的換算系數(shù);f(t) 為時刻t政府對修建道路的投資總額;λ(·) 為新建道路的投資額占總投資額的比例,同時也是模型的控制變量;pE(t) 為道路養(yǎng)護的單位費用;e為自然常數(shù);ρ為社會貼現(xiàn)率(social discount rate)。式(1)中括號內(nèi)的三項出行成本分別為固定出行成本、可變出行成本與因道路養(yǎng)護增加的出行成本。其中,第二項與路網(wǎng)飽和度有關(guān),第三項與道路養(yǎng)護的投資量有關(guān)。此外,在實際應(yīng)用中,k1和k2用于統(tǒng)一上述三種成本的量綱。同時,隨著社會經(jīng)濟的發(fā)展和通貨膨脹,相較于當(dāng)前時刻,未來用戶的出行成本會逐漸產(chǎn)生折減。為了能夠統(tǒng)一口徑分析整個期間[0,T] 內(nèi)發(fā)生在不同時刻的出行成本,均需要轉(zhuǎn)換為0 時刻的成本。為實現(xiàn)這一目標(biāo),就必須在式(1)中添加社會貼現(xiàn)率e-ρt這一項。
根據(jù)場景設(shè)定,狀態(tài)變量v(t)和r(t) 應(yīng)符合以下演變規(guī)律。其中,路網(wǎng)流量v(t)的演變受到外生增長率和新建道路刺激的影響,并且不能被管理者精確把握;路網(wǎng)容量r(t)由于新建與養(yǎng)護道路而得到提高,同時由于車輛行駛而產(chǎn)生病害,導(dǎo)致路網(wǎng)容量下降。
式(2)中,α(t) 為路網(wǎng)流量的外生動態(tài)增長率;新建道路會刺激用戶對機動車的購入和使用,以β(t)f(t)λ(·) 來表示,其中β(t) 為新建道路總投資與其刺激路網(wǎng)流量增長的換算系數(shù)。此外,基于模型假設(shè),道路管理者對路網(wǎng)流量的增長并非能夠精確把握,存在一定的偏差。其中,w為標(biāo)準(zhǔn)維納過程,σ為外生干擾系數(shù),且不確定性σf(t)λ(·)dw與政府對新建道路的投資額有關(guān)。式(3) 中,pN(t) 為新建道路的單位費用;γ和δ分別為新建道路、養(yǎng)護道路與路網(wǎng)容量的新增量、恢復(fù)量的換算系數(shù);η為因車輛行駛造成路面壞損,進而降低路網(wǎng)容量的換算系數(shù)。式(3)的右邊第一項和第二項分別代表新建道路和養(yǎng)護道路對路網(wǎng)容量的貢獻,而第三項則代表的是當(dāng)前路網(wǎng)流量對路網(wǎng)容量的影響,即:路網(wǎng)流量越高,造成的道路損壞里程越長,進而路網(wǎng)容量下降的就越多。
在現(xiàn)實中,若路網(wǎng)容量不降低,政府一般不會進行道路養(yǎng)護的投資。因此,時刻t的最大道路養(yǎng)護量不可能超過此時刻路面的損壞量,即養(yǎng)護道路不會使得路網(wǎng)容量的上限值增加。綜上所述,下述不等式(4)成立。
由不等式(4)進行等價轉(zhuǎn)換可得下式
由于不等式(5)右側(cè)一定是小于等于1 的正數(shù),若令式(5)的右側(cè)為θ(·),則控制變量λ(·) ∈[θ(·),1],即1-λ(·) ∈[0,1-θ(·)]。此外,上述分析也暗含了新建道路比例上限常為100%的假設(shè),即新建道路不受土地和上層規(guī)劃的制約。
基于上述含有不確定性的設(shè)定,定義如下動態(tài)系統(tǒng)最優(yōu)問題[DSO],以最小化[0,T] 期間內(nèi)所有用戶的總出行成本的期望值。
式(6)中,v0和vT分別表示系統(tǒng)初始和結(jié)束時的路網(wǎng)流量;r0和rT分別表示系統(tǒng)初始和結(jié)束時的路網(wǎng)容量;T為終端時刻且固定;G為終端狀態(tài)且自由;E0為[0,T] 期間的用戶總出行成本期望值。
求解上述動態(tài)最優(yōu)問題[DSO]有兩種基本方法:龐德里亞金極值原理和動態(tài)規(guī)劃原理(dynamic programming,DP)。由于問題[DSO]的狀態(tài)方程中含有不確定項σf(t)λ(·)dw,因此只有動態(tài)規(guī)劃原理適用。為了得到最優(yōu)控制策略,必須首先分析問題[DSO]的最優(yōu)性條件:哈密爾頓-雅克比-貝爾曼方程(Hamilton-Jacobi-Bellman,HJB)。為此,首先定義如下最優(yōu)值函數(shù)(optimal value function)J(·)。同時,由于函數(shù)已經(jīng)取得最優(yōu)值,因此最優(yōu)值函數(shù)只和狀態(tài)變量v(t)和r(t)有關(guān),而與控制變量λ(·) 無關(guān)。
式(7)中,Et為[t,T] 期間的用戶總出行成本期望值。
下面需要對模型合理性進行闡述,主要分析內(nèi)容為隨著路網(wǎng)流量和路網(wǎng)容量的變化,最優(yōu)值函數(shù)值的變化趨勢,以及結(jié)論是否符合交通工程學(xué)與交通規(guī)劃學(xué)中的基本理論。首先,對式(7)應(yīng)用動態(tài)規(guī)劃原理,可得式(8)
在時刻t,如式(9) 和式(10) 所示,分別給予路網(wǎng)流量和路網(wǎng)容量一個增量,此處a >1和b >1,則可得Ja(·)和Jb(·)
由于最優(yōu)值函數(shù)與控制變量λ(·) 無關(guān),因此,式(9) 和式(10) 中的λ(·) 可看作為一個常數(shù)。若分別將Ja(·)、Jb(·)與J(·)做差,則式(9)和式(10)中恒等號右側(cè)中括號中的第二項e-ρtJ(t +Δt,v +Δv,r +Δr)會被同時消除。再分別求點(av(t),Ja(·)) 與點(v(t),J(·)) 之間,點(br(t),Jb(·)) 與點(r(t),J(·)) 之間的兩條割線斜率即可得式(11)與式(12)
若函數(shù)Fa(·)再對增量a求導(dǎo),則可得式(13)
由于a >1、b >1,>0 且其他參數(shù)皆為正數(shù),因此可知式(11)恒為正,式(12)恒為負,式(13)恒為正。
綜上所述,可得以下重要結(jié)論:(1) ?J/?v >0,即最優(yōu)值函數(shù)值隨著路網(wǎng)流量的增加而上升,因此路網(wǎng)流量的邊際成本為正;(2)?J/?r <0,即路網(wǎng)容量越大,最優(yōu)值函數(shù)值越低,因此路網(wǎng)容量的邊際成本為負;(3)?2J/?v2>0,即伴隨路網(wǎng)流量的持續(xù)增加,最優(yōu)值函數(shù)值增加的速率會變快。因此,上述理論分析所得結(jié)論同現(xiàn)實世界相符,與交通工程學(xué)中的BPR(bureau of public road)函數(shù)性質(zhì)一致,由此可知本模型是合理的。
對式(8)右側(cè)括號中的J(t+Δt,v+Δv,r+Δr)進行泰勒展開,并忽略三次及以上的高次項可得式(14)。同時,為了避免符號繁瑣,在下文中,一律省略(t)、(·) 和(·) 的表示方式。
式(14)中,?J/?t表示微小時間段內(nèi)最優(yōu)值函數(shù)的值的變化量;?J/?v和?J/?r分別表示路網(wǎng)流量v和路網(wǎng)容量r的微小變化對最優(yōu)值函數(shù)值的影響。由于Δw為標(biāo)準(zhǔn)維納過程,因此可得式(15)
將式(15)代入式(2)~(3)之后,可得式(16)
同時,式(2)-(3)可以等價轉(zhuǎn)換為式(17)~(18)
如果將式(16)~(18)代入式(14),則會得到式(19)
將式(17)~(19)代入式(8),可得式(20)
最后,將式(15)、式(17)、式(18)和式(21)代入式(20),同時恒等式兩端除以Δt,可得HJB 方程(式(22)~(23))
式(22)~(23)的意義是尋找動態(tài)最優(yōu)投資策略λ*使得微小時間段內(nèi)最優(yōu)值函數(shù)值的變化?J/?t最小。式(23)中等式右邊中括號內(nèi)各項的意義如下:第一項為總出行成本;第二項為貼現(xiàn)后的最優(yōu)值函數(shù)值;第三和第四項分別代表路網(wǎng)流量的微小變化對總出行成本的影響;第五、第六和第七項分別代表路網(wǎng)容量的微小變化對總出行成本的影響;第八項代表不可控因素對總出行成本造成的影響。
式(23)是含有控制變量λ的函數(shù),因此等式兩側(cè)對λ求導(dǎo)可得到含有?J/dv、?J/dr和?2J/dv2等偏導(dǎo)數(shù)項的動態(tài)最優(yōu)投資策略λ*。
通過式(25)可知:動態(tài)最優(yōu)投資策略為一個閉環(huán)的反饋控制(closed-loop feedback control),相較只利用歷史數(shù)據(jù)的開環(huán)控制策略,動態(tài)最優(yōu)投資策略λ*為狀態(tài)變量v(隨機狀態(tài)變量)和r的函數(shù)。
在上述分析基礎(chǔ)上,對所得動態(tài)最優(yōu)投資策略的合理性解釋如下:(1)單位成本和換算系數(shù)的相對大小會影響投資分配比例,當(dāng)pE <pN或δ >γ,則說明養(yǎng)護道路比新建道路更能降低路網(wǎng)飽和度。(2) 若?J/?v和刺激系數(shù)β增大,則λ*降低,說明此時不能激發(fā)路網(wǎng)流量增加的道路養(yǎng)護策略更合適。(3)若|?J/?r|增加,則λ*降低,說明新建道路的策略更優(yōu)。(4) 隨著暫時增加出行成本的換算系數(shù)k2的增長,只有提高路網(wǎng)容量的上限值才能遏制用戶的出行成本,因此對新建道路的最優(yōu)投資比例λ*會提高。(5) 分母中的不確定項的干擾系數(shù)σ的增大也會使得投資支出傾向于養(yǎng)護道路,因為養(yǎng)護道路不會激發(fā)潛在的交通需求。(6) 若投資總額f較多,則養(yǎng)護道路會比新建道路更加容易抑制最優(yōu)值函數(shù)值的增長。
由式(20)可知,若管理者明確掌握最優(yōu)值函數(shù)J的形式,即最優(yōu)值函數(shù)值與狀態(tài)變量v、r和時間t的關(guān)系,則可直接求解得到不含有偏導(dǎo)數(shù)項?J/?t、?J/?v、?J/?r和?2J/?v2的最優(yōu)投資比例λ*的解析解,進而得到最優(yōu)值函數(shù)的軌線J*。否則,λ*將無法計算。這也是使用動態(tài)規(guī)劃原理分析最優(yōu)性條件(HJB 方程),進而求解連續(xù)系統(tǒng)最優(yōu)控制策略的主要困難之一,即必須要知道最優(yōu)值函數(shù)的形式且要求解偏微分方程。對此,文獻[27]提出了一種基于廣義互補問題且不利用具體最優(yōu)值函數(shù)形式即可求解動態(tài)最優(yōu)控制策略和系統(tǒng)最優(yōu)軌線的算法,但其應(yīng)用條件較為苛刻,必須要求最優(yōu)控制策略為“Bang-Bang”控制才行,因此不適合本研究。
此外,在機器學(xué)習(xí)的領(lǐng)域中,最優(yōu)值函數(shù)形式的確定也可以使用值函數(shù)近似(value function approximation)理論,但數(shù)據(jù)采集及訓(xùn)練的成本極高,且仍需要對值函數(shù)的形式進行提前假設(shè)。現(xiàn)實中,通過長期觀測和邏輯推導(dǎo),管理者便可大體上把握最優(yōu)值函數(shù)的形式,但其中的具體參數(shù)并不能精準(zhǔn)掌握。鑒于此,本文采用如下方法求解待估參數(shù)[28]。首先,根據(jù)一定的邏輯推理,假設(shè)非自治最優(yōu)值函數(shù)的形式如式(26)所示:
式(26)中,JA為預(yù)設(shè)最優(yōu)值函數(shù)(下角標(biāo)A 為假設(shè)的含義);h為待估參數(shù)。
此處需要對預(yù)設(shè)最優(yōu)值函數(shù)(26)的合理性進行分析,主要目的是確認預(yù)設(shè)最優(yōu)值函數(shù)JA的性質(zhì)是否與2.2 節(jié)中所得的關(guān)于最優(yōu)值函數(shù)J的結(jié)論一致。因此,需要用最優(yōu)值函數(shù)JA對路網(wǎng)流量v求一階和二階偏導(dǎo)數(shù),對路網(wǎng)容量r求一階偏導(dǎo)數(shù),進而可得式(27)~(29)
由式(26)~(29)可知:(1)預(yù)設(shè)最優(yōu)值函數(shù)JA中考慮了社會貼現(xiàn)率ρ,與最優(yōu)值函數(shù)J的形式和性質(zhì)保持一致。(2)?JA/?v >0,即在路網(wǎng)容量r保持一定的條件下,隨著路網(wǎng)流量v的增長,預(yù)設(shè)最優(yōu)值函數(shù)值呈上升的趨勢,且由?2JA/?v2>0 可知,預(yù)設(shè)最優(yōu)值函數(shù)值的上升速度將會隨著路網(wǎng)流量的增加而增加。(3)?JA/?r <0,即在路網(wǎng)流量v保持一定的前提下,隨著路網(wǎng)容量r的增加,預(yù)設(shè)最優(yōu)值函數(shù)值呈下降趨勢。綜上所述,預(yù)設(shè)最優(yōu)值函數(shù)JA與最優(yōu)值函數(shù)J擁有一致的性質(zhì)(見2.2 節(jié)),可以利用預(yù)設(shè)最優(yōu)值函數(shù)進行計算求解(不含偏導(dǎo)數(shù)項的) 動態(tài)最優(yōu)投資分配策略。
將含有偏導(dǎo)數(shù)項的動態(tài)最優(yōu)投資策略(25)帶入到HJB方程(22)~(23)中可消除掉min,因為已經(jīng)實現(xiàn)了最小化。而后將設(shè)定的帶有待估參數(shù)h的最優(yōu)值函數(shù)(26)也帶入到HJB 方程(22)~(23)中則得到下式(30)~(35)。
通過式(30)~(35)可求解得到參數(shù)h如式(36)~(43)所示,
通過上述的參數(shù)估計,動態(tài)最優(yōu)投資策略(25)變?yōu)槿缦滦问?
其中,h1和h2見式(36)~(43)。在實際應(yīng)用中需要計算待估參數(shù)h的兩個數(shù)值,并且通過比較最優(yōu)值函數(shù)J1和J2的數(shù)值大小來進行取舍,最終得到唯一最優(yōu)投資策略λ*。此外,理論上不能嚴格保證非線性時變系統(tǒng)的動態(tài)最優(yōu)投資策略的唯一性。
由上述分析可知,當(dāng)待估參數(shù)是一個常數(shù)的情況下,為了不在求偏導(dǎo)數(shù)項的時候消失,就必須要在推導(dǎo)出的HJB 方程(22)~(23)中含有最優(yōu)值函數(shù)J這一項才可以。若待估參數(shù)不為常數(shù)項時,則不必要求HJB 方程中一定要存在最優(yōu)值函數(shù)J。由上述的HJB 方程的推導(dǎo)過程可知,J的存在是以利用社會貼現(xiàn)率ρ建模為前提的(見式(21))。由于最優(yōu)控制問題必須要對時間[0,T] 積分,因而在諸多領(lǐng)域中必須要統(tǒng)一時間口徑進行計算。綜上所述,引入社會貼現(xiàn)率ρ可使建模和求解具有更廣泛的適用性。
以中國典型一線中心城市(以下簡稱此城市)2018 年的道路交通狀況為初始狀態(tài),制定2019 年至2028 年此城市的道路新建和養(yǎng)護的動態(tài)最優(yōu)投資策略,并對其效果進行定量分析。經(jīng)調(diào)研,數(shù)值試驗所使用的參數(shù)設(shè)定及其解釋說明(或設(shè)定依據(jù))歸納如下,詳見表1。
本數(shù)值試驗的目的是分析動態(tài)最優(yōu)投資策略的效率,即在節(jié)約用戶出行成本方面與此城市現(xiàn)行投資策略進行定量比較分析。首先,表2 所示為某一時間序列隨機數(shù)條件下的2019-2028 年此城市的路網(wǎng)流量、路網(wǎng)容量、動態(tài)最優(yōu)投資策略、現(xiàn)行投資策略以及兩種投資策略下的用戶總出行成本。
由表2 可知:(1)路網(wǎng)流量和路網(wǎng)容量的增長變化符合真實世界的變化規(guī)律。例如:路網(wǎng)流量的年平均增長率為2.31%,這與現(xiàn)階段此城市的機動車保有量的年平均增長率保持一致。同時,十年間交通擁堵成本(見文獻[33])平均占總出行成本的45.75%,這與文獻[29-30]中的內(nèi)容基本一致。因此,可判定上述數(shù)值設(shè)定是合理的,即在此基礎(chǔ)之上對比動態(tài)最優(yōu)投資策略與現(xiàn)行投資策略的效率性是有實際意義的。(2)由于初始狀態(tài)(見表1)中假設(shè)第一年沒有路面需要養(yǎng)護,因此,無論動態(tài)最優(yōu)投資策略還是現(xiàn)行投資策略,對新建道路的最優(yōu)投資比例都應(yīng)為100%。(3)兩種投資策略的差異并不是很大,但用戶總出行成本卻有較大的差別,十年間動態(tài)最優(yōu)投資策略共可節(jié)約出行成本556.9993億元(需要注意的是式(1)定義的為一天的出行成本,此處需要乘以365 天進行計算),約1526.0254 萬元/天。
表1 參數(shù)設(shè)定Table 1 Parameter settings
表2 動態(tài)最優(yōu)投資策略與現(xiàn)行投資策略的比較(典型例子)Table 2 Dynamic optimal investment scheme vs.current investment scheme (In a Typical Case)
為了驗證表2 所述結(jié)論的魯棒性,在不同的時間序列隨機數(shù)條件下進行了10000 次的蒙特卡洛試驗,表3 為試驗結(jié)果。由表3 可知:(1)動態(tài)最優(yōu)投資策略下的用戶總出行成本的標(biāo)準(zhǔn)差與變異系數(shù)均不大,這意味著相較現(xiàn)行投資策略,本研究提出的動態(tài)最優(yōu)投資策略具有較高的效率。(2)兩種投資策略下的用戶總出行成本的平均差值約為1414.1466 萬元/天,這也證明了表2 所述典型例子的結(jié)果不具有特殊性。(3)在隨機最優(yōu)控制理論的框架下,雖然隨機最優(yōu)控制策略不可能保證每次獨立計算出的總出行成本都一定是最小的,這是因為管理者只能把握隨機變量的特征:期望值與標(biāo)準(zhǔn)差,而并不能準(zhǔn)確地預(yù)知下一時刻(即下一年度)的隨機現(xiàn)象。但在此案例的10000 次蒙特卡洛試驗中,動態(tài)最優(yōu)投資策略占優(yōu)比例為100%,即不會有現(xiàn)行投資策略效率更高的情況出現(xiàn)。
表3 動態(tài)最優(yōu)投資策略與現(xiàn)行投資策略下的總出行成本比較(蒙特卡洛試驗,10000 次)Table 3 Comparison on total travel cost between dynamic optimal investment scheme and current investment scheme (a monte-carlo experiment,10000 samples)
本研究從宏觀層面上對城市道路新建和養(yǎng)護的最優(yōu)動態(tài)投資比例進行了研究。首先,本文構(gòu)建了含有隨機項的連續(xù)時間最優(yōu)控制模型,并利用動態(tài)規(guī)劃原理推導(dǎo)出最優(yōu)性條件HJB 方程,同時得到含有偏導(dǎo)數(shù)項的動態(tài)最優(yōu)投資策略,此動態(tài)最優(yōu)投資策略為一個閉環(huán)反饋控制。其次,本文采用一種估計最優(yōu)值函數(shù)中參數(shù)的方法求解得到(不含偏導(dǎo)數(shù)項的)動態(tài)最優(yōu)投資策略的解析解。再次,對各參數(shù)與動態(tài)最優(yōu)投資策略的關(guān)系進行了定性分析。最后,以中國典型一線中心城市的實際數(shù)據(jù)為例,以2018 年的道路交通狀況為初始狀態(tài)給出了2019 年至2028 年的城區(qū)道路新建和養(yǎng)護的動態(tài)最優(yōu)投資策略,并通過蒙特卡洛試驗得出動態(tài)最優(yōu)投資策略會比現(xiàn)行投資策略(開環(huán)控制策略)節(jié)約出行成本約1414.1466 萬元/天的結(jié)論。
另外,研究還存在以下可拓展的方向:(1)本研究只考慮了路網(wǎng)流量,沒有將被普遍執(zhí)行的限行政策納入到模型中進行優(yōu)化,畢竟車輛行駛是造成路面病害的主要原因之一。(2)需追加考慮不能行駛的機動車需要停放而導(dǎo)致路網(wǎng)容量下降和對停車子系統(tǒng)的投資優(yōu)化問題,可結(jié)合停車許可證的收益再投資等策略進行分析[34-35]。(3)進一步細化路面病害的種類和成因:路面壞損種類和程度不僅與行駛的機動車數(shù)量有關(guān),還與車速(路網(wǎng)飽和度)、車輛載重量等有關(guān),同時也不是所有種類的病害都會影響路網(wǎng)容量。(4)追加考慮以下更加實際的場景:新建道路投資量受到上層規(guī)劃限制,或?qū)⑼顿Y結(jié)余轉(zhuǎn)移支付給用戶以降低其出行成本。(5)考慮引入民間資本參與城市道路的新建與養(yǎng)護,并討論特許權(quán)期問題。