李偉梅,高雷阜
(遼寧工程技術(shù)大學(xué)a.工商管理學(xué)院,遼寧 葫蘆島 125105;b.運(yùn)籌與優(yōu)化研究院,遼寧 阜新 123000)
風(fēng)險(xiǎn)度量是反映決策者對(duì)小概率、高成本極端事件態(tài)度的方法,依賴于隨機(jī)變量的概率分布。在通常情況下,隨機(jī)變量的真實(shí)分布未知,在根據(jù)歷史數(shù)據(jù)獲得估計(jì)分布的過(guò)程中,分布尾部模型誤差造成的尾部風(fēng)險(xiǎn)偏差在實(shí)際決策問(wèn)題中會(huì)造成嚴(yán)重的后果。因此,強(qiáng)化一般風(fēng)險(xiǎn)度量方法對(duì)分布尾部不確定性的穩(wěn)健捕捉能力至關(guān)重要。
魯棒風(fēng)險(xiǎn)度量是通過(guò)在一組潛在分布中尋找最壞情況風(fēng)險(xiǎn)值來(lái)解決分布不確定的穩(wěn)健優(yōu)化方法。潛在分布逼近真實(shí)分布所需滿足的分布特征條件由其不確定集描述,矩信息是不確定集的主要內(nèi)容。Mnatsakanov(2008)[1]指出,高階矩可以獲取關(guān)于分布的進(jìn)一步信息,其在復(fù)雜優(yōu)化問(wèn)題中會(huì)存在很大的統(tǒng)計(jì)誤差。分?jǐn)?shù)階矩理論上含有大量整數(shù)階矩的信息,可以避免高階整數(shù)矩的誤差問(wèn)題。針對(duì)分?jǐn)?shù)階矩的復(fù)雜數(shù)值積分計(jì)算問(wèn)題,Alibrandi 和Mosalam(2018)[2]通過(guò)定義分?jǐn)?shù)階序列給出了解決方法,擴(kuò)展了分?jǐn)?shù)階矩的使用范圍。Zhang 等(2020)[3]在最大熵分布估計(jì)模型研究中驗(yàn)證了分?jǐn)?shù)階矩相比高階整數(shù)矩能夠更準(zhǔn)確地表示概率分布尾部。綜上,精細(xì)刻化分布尾部特征離不開(kāi)分?jǐn)?shù)階矩,但目前鮮有研究在魯棒風(fēng)險(xiǎn)度量中引入分?jǐn)?shù)階矩來(lái)優(yōu)化尾部風(fēng)險(xiǎn)度量的精準(zhǔn)性。
基于矩信息估計(jì)的分布很難完全符合真實(shí)分布,分布模型存在誤差不可避免,量化模型誤差是魯棒風(fēng)險(xiǎn)度量不可或缺的內(nèi)容,而參考分布和分布距離是其中最為重要的兩個(gè)因素。一般而言,參考分布會(huì)選擇經(jīng)驗(yàn)分布或已知的參數(shù)分布,其參數(shù)由基于3σ原理的極大似然估計(jì)得到,分布尾部估計(jì)誤差不被作為主體考慮,存在低估尾部厚度的可能。錯(cuò)誤的分布假設(shè)和不完善的估計(jì)會(huì)帶來(lái)危害性很大的尾部模型誤差,導(dǎo)致的尾部風(fēng)險(xiǎn)度量偏差在實(shí)際問(wèn)題中會(huì)引發(fā)很?chē)?yán)重的后果。因此,構(gòu)建能有效反映真實(shí)分布尾部行為的參考分布對(duì)準(zhǔn)確描述分布尾部模型誤差至關(guān)重要。分布距離度量作為定義不確定集的主要方式,決定了哪些分布可以作為潛在分布,可用于刻畫(huà)分布模型誤差。Glasserman 和Xu(2014)[4]將相對(duì)熵視為潛在分布合理的指標(biāo),量化了分布誤差對(duì)風(fēng)險(xiǎn)度量的影響。Kruse等(2019)[5]在其研究中解析說(shuō)明了相對(duì)熵的局限性,并得到其不適用于重尾分布的結(jié)論。Feng(2019)[6]在模型風(fēng)險(xiǎn)的研究中,針對(duì)相對(duì)熵的局限性,指出用Wasserstein 距離替代相對(duì)熵刻畫(huà)分布模型誤差有明顯的效果。但根據(jù)Rodríguez 等(2021)[7]的研究,Wasserstein 距離中成本函數(shù)的選擇會(huì)造成概率分布幾何結(jié)構(gòu)被忽略,得到的結(jié)果可能是次優(yōu)的,存在兩個(gè)分布整體Wasserstein距離很小但分布尾部結(jié)構(gòu)不同的可能,而尾部反映對(duì)識(shí)別真實(shí)分布十分重要。因此,基于Wasserstein距離的分布尾部模型誤差問(wèn)題仍需細(xì)化研究。
鑒于此,本文以提升一般魯棒風(fēng)險(xiǎn)度量?jī)?yōu)化模型精準(zhǔn)性為目標(biāo),克服一般參數(shù)分布不能刻畫(huà)分布尾部行為的限制,強(qiáng)化風(fēng)險(xiǎn)度量對(duì)分布尾部不確定性的精細(xì)刻畫(huà)能力,從分布尾部信息刻畫(huà)和誤差量化兩種角度改進(jìn)魯棒風(fēng)險(xiǎn)度量模型,為突發(fā)性極端風(fēng)險(xiǎn)度量提供參考。
令X={x1,…,xN}為離散型隨機(jī)變量,P={p1,…,pN}為X在支撐集Ω上的未知概率分布。令Z={z1,…,zN}為將X映射到[0,1]內(nèi)的隨機(jī)變量,其在支撐集S上的概率分布為Q={q1,…,qN}。以通常的指數(shù)分布簇為基準(zhǔn),當(dāng)Q=exp(-β(Z)),β(Z)~ρZt,t∈R 為形狀參數(shù),ρ∈R 為尺度參數(shù)時(shí),分布Q的尾部行為取決于ρ和t[5,8]。
對(duì)于隨機(jī)變量Z,一般的魯棒風(fēng)險(xiǎn)度量模型為:
其中,v(Z)表示與隨機(jī)變量Z相關(guān)的損失函數(shù),Γ 為隨機(jī)變量Z的分布不確定集。文獻(xiàn)[9]給出了幾種構(gòu)建Γ的方法,矩信息和分布距離是其中最主要的內(nèi)容。
隨機(jī)變量Z的分?jǐn)?shù)階矩[10]為:
其中,α={α1,…,αK},αk∈R,k=1,…,K。少量低階分?jǐn)?shù)階矩能捕捉分布尾部信息并保留分布的某些結(jié)構(gòu),在數(shù)值算例中具有穩(wěn)定性。
Wasserstein 距離[11]作為最優(yōu)傳輸?shù)奶乩?,可度量非絕對(duì)連續(xù)分布距離,令={,…,}為樣本數(shù)據(jù)估計(jì)的參考分布,則概率分布Q和參考分布之間的離散Wasserstein距離為:
其中,Y=(y1,…,yN)~,c(Z,Y)為傳輸成本,γ(Z,Y)是分布Q和Q^ 的聯(lián)合分布,Π 是所有可能聯(lián)合分布組成的集合,γ(Z,Y)滿足以下性質(zhì)。
Wasserstein距離克服了相對(duì)熵的局限性,可度量任意兩個(gè)概率分布之間的距離。在高維樣本數(shù)據(jù)的計(jì)算中,由于分布不能可數(shù)離散化,因此集合勢(shì)比較大,Wasserstein距離估計(jì)會(huì)遭遇維數(shù)災(zāi)難。熵正則化的Wasserstein 距離[12]簡(jiǎn)化了其計(jì)算復(fù)雜度,并將最優(yōu)傳輸問(wèn)題轉(zhuǎn)化為一個(gè)嚴(yán)格凸問(wèn)題,能更合理地表示分布的不確定性,具體表達(dá)式如下:
其中,φ∈R 為調(diào)節(jié)熵正則化懲罰力度的系數(shù)。
魯棒風(fēng)險(xiǎn)度量?jī)?yōu)化離不開(kāi)參考分布,在參考分布估計(jì)方法中,文獻(xiàn)[13]基于分?jǐn)?shù)階矩信息給出最大熵概率分布估計(jì)模型,用于提升對(duì)分布尾部不確定性的估計(jì)能力。模型如下:
最大熵分布是在已知部分信息的情況下,對(duì)未知分布不添加任何其他約束的分布估計(jì)方法,存在較大的分布模型誤差。因此,為了提高概率分布尾部的估計(jì)精度,在此模型的基礎(chǔ)上,引入Wasserstein 距離度量分布模型誤差,建立基于分?jǐn)?shù)階矩和熵正則化Wasserstein 的概率分布估計(jì)模型:
其目標(biāo)函數(shù)和約束函數(shù)關(guān)于γ(Z,ξ)可微,且一階導(dǎo)數(shù)連續(xù),滿足約束規(guī)范條件[14],Lagrange對(duì)偶問(wèn)題為:
其中,λ={λ1,…,λk},v是Lagrange 乘子。根據(jù)Lagrange對(duì)偶理論,可得模型(10)的最優(yōu)解為:
根據(jù)公式(5),模型(8)的最優(yōu)解={,…,}可以表示為:
其中,λ,v,α可通過(guò)求解以下模型得到:
在本文提出的概率分布估計(jì)模型中,分?jǐn)?shù)階矩增加了能更精細(xì)刻畫(huà)分布尾部的約束性,熵正則化Wasserstein距離解決了分布模型誤差刻畫(huà)和非凸優(yōu)化的凸松弛問(wèn)題,兩者結(jié)合有助于概率分布尾部精細(xì)化估計(jì),根據(jù)此模型可以精準(zhǔn)地確定隨機(jī)變量Z的參考分布。
基于矩約束且考慮模型誤差的一般魯棒風(fēng)險(xiǎn)度量模型為:
魯棒風(fēng)險(xiǎn)度量模型對(duì)概率分布尾部不確定性的捕捉能力依賴于矩約束E[(Z)β]=μβ,模型誤差取決于D(Q|Q^)。鑒于少量低階分?jǐn)?shù)階矩能克服高階整數(shù)矩的數(shù)值不穩(wěn)定性刻畫(huà)分布尾部,熵約束的Wasserstein距離能夠突破相對(duì)熵的局限性有效量化模型誤差,建立如下魯棒風(fēng)險(xiǎn)度量模型:
其中,Y={y1,…,yN}~,為公式(12)確定的概率分布估計(jì)結(jié)果,ε1,ε2為給定的分布模型誤差閾值。根據(jù)文獻(xiàn)[6]的研究,上述模型等價(jià)于:
將分?jǐn)?shù)階α視為參數(shù),對(duì)于γ(Z,Y)而言,上述模型滿足約束規(guī)范條件和強(qiáng)對(duì)偶性,其Lagrange對(duì)偶問(wèn)題為:
其中,η={η1,…,ηk},σ,κ,ρ是Lagrange 乘子,σ反映Wasserstein 距離約束對(duì)目標(biāo)函數(shù)的影響。根據(jù)Lagrange對(duì)偶理論,可得模型(18)的最優(yōu)解為:
其中,η,σ,κ可通過(guò)優(yōu)化以下模型得到:
在魯棒風(fēng)險(xiǎn)度量模型(15)中,由于Wasserstein距離會(huì)忽略分布幾何結(jié)構(gòu),而尾部結(jié)構(gòu)反映的信息對(duì)識(shí)別真實(shí)分布極其重要,結(jié)合最壞情況分布公式(19)可知,分布尾部結(jié)構(gòu)依賴于Wasserstein距離成本函數(shù)的選擇,適合度量整體分布模型誤差的Wasserstein距離不一定適合度量分布尾部差異,對(duì)分布尾部差異特設(shè)一種局部Wasserstein距離對(duì)于強(qiáng)化魯棒風(fēng)險(xiǎn)度量對(duì)尾部不確定性的捕捉能力是非常有必要的。
根據(jù)纖維叢理論思想[15],本文提出分片Wasserstein距離,針對(duì)分布的不同部分用不同纖維叢來(lái)度量分布的差異,從而達(dá)到對(duì)分布尾部和整體模型誤差進(jìn)行控制與優(yōu)化的目的。具體地,將隨機(jī)變量Z的分布支撐集S分割成M個(gè)子支撐集Sm,m=1,…,M,??紤]到樣本數(shù)量對(duì)參數(shù)優(yōu)化的影響,選擇有針對(duì)性的非均勻分段或者均勻分段方式,取M=1,2,…,選擇逼近效果最優(yōu)的分段數(shù)。在子支撐集上定義具有不同成本函數(shù)的Wasserstein距離:
其中,Pm=prop{Z∈Sm}可由樣本數(shù)據(jù)計(jì)算得到,Qm和分別是Z在Sm上的概率分布和參考分布。在每個(gè)支撐子集Sm上,基于分?jǐn)?shù)階矩和Wasserstein距離的魯棒風(fēng)險(xiǎn)度量模型(22)的求解方法與模型(15)類似,得到子支撐集上的魯棒風(fēng)險(xiǎn)度量最壞情況分布為:
由全概率公式可得魯棒風(fēng)險(xiǎn)度量模型(15)的最壞情況分布為:
即通過(guò)建立分片魯棒風(fēng)險(xiǎn)度量模型(22)獲得了魯棒風(fēng)險(xiǎn)度量模型(15)的最優(yōu)解。
在Lagrange 乘子和分?jǐn)?shù)階的優(yōu)化模型(13)和模型(20)中,目標(biāo)函數(shù)關(guān)于Lagrange 乘子是線性的,但關(guān)于分?jǐn)?shù)階α是非線性的,且無(wú)法保證凸性,分?jǐn)?shù)階最優(yōu)解不具有唯一性,且分?jǐn)?shù)階積分運(yùn)算復(fù)雜。針對(duì)這一問(wèn)題,定義分?jǐn)?shù)階序列{α1,…,αQ}可有效解決上述問(wèn)題。
其中,Q≥2,αmax為分?jǐn)?shù)階的最大值。參考文獻(xiàn)[10]證實(shí),隨著Q的增大,分?jǐn)?shù)階序列{αj},j=1,…,Q具有較好的收斂性。
在分片魯棒風(fēng)險(xiǎn)度量模型(22)中,分?jǐn)?shù)階矩約束和分片數(shù)M 使得需要優(yōu)化的參數(shù)增多,且分?jǐn)?shù)階積分運(yùn)算復(fù)雜。海鷗優(yōu)化算法(Seagull Optimization Algorithm,SOA)[16]是一種魯棒全局優(yōu)化算法,相比遺傳算法具有高效處理高維復(fù)雜問(wèn)題的能力。因此,本文采用SOA求解最優(yōu)分?jǐn)?shù)階矩和Lagrange乘子。
假設(shè)隨機(jī)變量Z的真實(shí)分布是Weibull(1,1.5),生成服從Weibull(1,1.5)的數(shù)量為1000的隨機(jī)樣本,作為獲取真實(shí)分布信息的歷史數(shù)據(jù),模型優(yōu)化過(guò)程在MATLAB R2019a上完成。
在基于分?jǐn)?shù)階矩和Wasserstein 距離的概率估計(jì)模型(8)中,假設(shè)分?jǐn)?shù)階矩的個(gè)數(shù)K=2,取φ=10,αmax=2,為了驗(yàn)證模型(8)的有效性,采用SOA計(jì)算以下三種模型的分布估計(jì)結(jié)果:(1)基于分?jǐn)?shù)階矩的最大熵分布估計(jì)模型(7);(2)經(jīng)驗(yàn)分布估計(jì)[17];(3)基于分?jǐn)?shù)階矩和熵正則化Wasserstein距離的概率估計(jì)模型(8)。得到的分布估計(jì)結(jié)果如圖1所示。
圖1 分布估計(jì)結(jié)果對(duì)比
由圖1 的分布估計(jì)結(jié)果可知,相比經(jīng)驗(yàn)分布估計(jì),基于分?jǐn)?shù)階矩的最大熵分布估計(jì)在分布的尾部提供了更高的估計(jì)精度。這表明引入分?jǐn)?shù)階矩提高了概率分布尾部的估計(jì)精度。相比于基于分?jǐn)?shù)階矩的最大熵分布估計(jì)模型,基于分?jǐn)?shù)階矩和熵正則化Wasserstein距離的分布估計(jì)模型(8)能夠更好地逼近理論Weibull分布的尾部,這說(shuō)明引入Wasserstein 距離能夠更精細(xì)地刻畫(huà)分布尾部的約束性。因此,當(dāng)隨機(jī)變量服從Weibull分布時(shí),本文提出的概率分布模型更適合作為參考分布來(lái)反映分布尾部的不確定性信息,該模型在分布尾部的估計(jì)精度和逼近性能上都優(yōu)于其他方法。
為了進(jìn)一步驗(yàn)證概率估計(jì)模型(8)的精確性,計(jì)算三種不同分布估計(jì)模型的最優(yōu)分布估計(jì)結(jié)果與理論Weibull分布之間的均方誤差(MSE),結(jié)果如表1所示。
表1 分布估計(jì)誤差
根據(jù)表1的分布估計(jì)誤差結(jié)果可知,基于概率估計(jì)模型(8)得到的最優(yōu)分布估計(jì)結(jié)果與理論Weibull 分布之間的MSE 較小,為0.2130;而其他兩個(gè)模型的MSE 分別為0.2212 和0.2135。較小的MSE 誤差意味著該模型能夠更準(zhǔn)確地逼近目標(biāo)分布,并提供更可靠的概率估計(jì)結(jié)果。這表明概率估計(jì)模型(8)相比于其他模型,在對(duì)理論Weibull分布的擬合精度上具有更好的表現(xiàn)。
在基于分?jǐn)?shù)階矩和Wasserstein 距離的魯棒風(fēng)險(xiǎn)度量模型(15)中,為了探究分?jǐn)?shù)階矩在提升度量極端風(fēng)險(xiǎn)精度方面的有效性,假設(shè)αmax=2,v(z)=-z,c(z,y)=‖z-y‖2,ε1=ε2=0.1,設(shè)置魯棒風(fēng)險(xiǎn)度量模型(15)的以下三種情境進(jìn)行對(duì)比分析。情境1:K=2,α∈R+。情境2:K=1,α∈R+。情境3:K=2,α={1,2}。
采用SOA分別求解不同情境下模型的最壞情況風(fēng)險(xiǎn),結(jié)果如表2所示。
表2 魯棒風(fēng)險(xiǎn)度量最壞情況風(fēng)險(xiǎn)
分析表2的結(jié)果可以發(fā)現(xiàn),當(dāng)隨機(jī)變量Z服從Weibull分布時(shí),對(duì)比情境2和情境3中最壞情況風(fēng)險(xiǎn)與實(shí)際風(fēng)險(xiǎn)之間的誤差可以發(fā)現(xiàn),情境2在單個(gè)分?jǐn)?shù)階矩約束的情況下具有更高的風(fēng)險(xiǎn)度量精確性。這說(shuō)明相較于整數(shù)階矩,分?jǐn)?shù)階矩更有助于魯棒風(fēng)險(xiǎn)度量模型(15)準(zhǔn)確刻畫(huà)風(fēng)險(xiǎn)。對(duì)比情境1和情境2,以及情境1和情境3的結(jié)果時(shí)發(fā)現(xiàn),情境1 中兩個(gè)分?jǐn)?shù)階矩約束下的風(fēng)險(xiǎn)度量誤差最小,這表明在計(jì)算魯棒風(fēng)險(xiǎn)度量模型(15)時(shí),將分?jǐn)?shù)階作為參數(shù),并選擇合適的分?jǐn)?shù)階矩是有意義的。
計(jì)算魯棒風(fēng)險(xiǎn)度量模型(15)在三種情境下的最壞情況分布,得到的結(jié)果如圖2所示。
圖2 魯棒風(fēng)險(xiǎn)度量最壞情況分布
根據(jù)圖2(a)可知,情境1中魯棒風(fēng)險(xiǎn)度量模型(15)的最壞情況分布整體上更接近隨機(jī)變量的理論Weibull 分布,說(shuō)明在模型(15)中引入合適的分?jǐn)?shù)階矩能夠有效獲取隨機(jī)變量整體分布的信息。另外,根據(jù)圖2(b)可知,分?jǐn)?shù)階矩的引入顯著提升了風(fēng)險(xiǎn)度量模型對(duì)分布尾部不確定性的捕捉能力。
為了進(jìn)一步探究魯棒風(fēng)險(xiǎn)度量模型(15)的最壞情況風(fēng)險(xiǎn)對(duì)分?jǐn)?shù)階α和Wasserstein距離約束水平σ的敏感性,給定參數(shù)η=(η1,…,ηk),κ,ρ的值,在這種情況下,最壞情況風(fēng)險(xiǎn)和α,σ之間的關(guān)系如圖3所示。
圖3 魯棒風(fēng)險(xiǎn)度量最壞情況風(fēng)險(xiǎn)敏感性分析
從圖3可以觀察到,在分?jǐn)?shù)階α和Wasserstein距離約束水平σ處于其最優(yōu)值鄰域范圍時(shí),魯棒風(fēng)險(xiǎn)度量模型(15)的最壞情況期望有顯著變化,相比于分?jǐn)?shù)階α,Wasserstein距離約束水平σ對(duì)模型的最壞情況風(fēng)險(xiǎn)具有更大的影響。這意味著選擇能進(jìn)一步精細(xì)刻畫(huà)分布誤差的Wasserstein 距離對(duì)于提高魯棒風(fēng)險(xiǎn)度量模型(15)的精確性是有意義的。
固定α={0.1875,1.875},選取均勻分段方式,令每段的Wasserstein距離的成本函數(shù)均為c(z,y)=‖z-y‖2,計(jì)算模型(22)在M取不同值時(shí)的最壞情況風(fēng)險(xiǎn),結(jié)果如表3所示。
表3 分片魯棒風(fēng)險(xiǎn)度量最壞情況風(fēng)險(xiǎn)
觀察表3 可知,隨著分片數(shù)的增加,分布魯棒風(fēng)險(xiǎn)度量模型(22)的最壞情況風(fēng)險(xiǎn)越來(lái)越接近真實(shí)風(fēng)險(xiǎn),這說(shuō)明引入分片Wasserstein 距離有助于提高魯棒風(fēng)險(xiǎn)度量模型(22)的精確性。
計(jì)算模型(22)在M取不同值時(shí)的最壞情況分布,結(jié)果如圖4所示。
圖4 分片魯棒風(fēng)險(xiǎn)度量最壞情況分布
從圖4(a)和(b)中觀察到,隨著分片數(shù)M的增加,魯棒風(fēng)險(xiǎn)度量模型(22)的最壞情況分布與真實(shí)分布的逼近程度提高,特別是在分布尾部的逼近程度顯著提升。這說(shuō)明,引入分片Wasserstein距離有助于改善模型對(duì)分布尾部的估計(jì)誤差,提供更準(zhǔn)確的風(fēng)險(xiǎn)度量結(jié)果。綜上所述,分片Wasserstein 距離有助于提高最壞情況分布與真實(shí)分布的逼近程度,尤其是分布尾部的逼近程度,這對(duì)于改進(jìn)和優(yōu)化風(fēng)險(xiǎn)度量模型具有重要意義。
本文針對(duì)已有的魯棒風(fēng)險(xiǎn)度量模型關(guān)于分布尾部不確定性的度量問(wèn)題,以一種對(duì)尾部模型誤差具有穩(wěn)健性的方式建立魯棒風(fēng)險(xiǎn)度量?jī)?yōu)化模型,在構(gòu)造模型不確定集時(shí),提出基于Wasserstein 距離的分布估計(jì)參考方法,突破了已有參數(shù)分布無(wú)法反映真實(shí)分布尾部行為的限制。鑒于分?jǐn)?shù)階矩具有對(duì)分布尾部信息的精準(zhǔn)刻畫(huà)能力,本文在解析分布估計(jì)的基礎(chǔ)上建立基于分?jǐn)?shù)階矩和Wasserstein距離的魯棒風(fēng)險(xiǎn)度量?jī)?yōu)化模型。為優(yōu)化Wasserstein 距離忽略分布幾何結(jié)構(gòu)造成的尾部模型誤差,本文基于纖維叢理論思想,引入分片Wasserstein距離解析約束的分片魯棒風(fēng)險(xiǎn)度量模型。數(shù)值實(shí)驗(yàn)的結(jié)果表明,分?jǐn)?shù)階矩能夠精細(xì)刻畫(huà)分布尾部誤差,分片Wasserstein距離能夠有效地解析約束控制整體誤差以優(yōu)化求解。相比于傳統(tǒng)的魯棒風(fēng)險(xiǎn)度量模型,分片魯棒風(fēng)險(xiǎn)度量模型更有助于風(fēng)險(xiǎn)管理者做出最優(yōu)決策。