熊芬芬,李澤賢,劉宇,夏侯唐凡
1.北京理工大學(xué) 宇航學(xué)院,北京 100081
2.電子科技大學(xué) 機械與電氣工程學(xué)院,成都 611731
為了縮短設(shè)計周期、降低開發(fā)成本、滿足產(chǎn)品不斷提升的性能需求和更新?lián)Q代頻次,計算流體力學(xué)(Computational Fluid Dynamics,CFD)、結(jié)構(gòu)有限元分析(Finite Element Analysis,F(xiàn)EA)等數(shù)值模擬技術(shù)正在成為科學(xué)研究和工程設(shè)計等許多領(lǐng)域內(nèi)解決問題的主流方法[1]。在航空航天領(lǐng)域,CFD 和FEA 已分別成為氣動和結(jié)構(gòu)分析設(shè)計中不可或缺的研究手段?!吨袊圃?025》指出,仿真技術(shù)對于發(fā)展和提高中國制造能力具有重要支撐作用,特別是2015 年12 月31 號國家出臺了智能制造標準體系建設(shè)指南,其中明確了要在制造生產(chǎn)過程中應(yīng)用仿真技術(shù)[2]。
飛行器等復(fù)雜裝備的整個壽命周期都充滿了源于仿真建模和模擬、生產(chǎn)制造(如幾何尺寸)、工作環(huán)境(如載荷環(huán)境)、儀器監(jiān)測(如測量誤差和信息處理)等的大量不確定性[3]。一般而言,根據(jù)不確定性屬性的不同,可以將不確定性分為隨機不確定性(Aleatory Uncertainty)、認知不確定性(Epistemic Uncertainty)或者是兩者兼而有之的混合不確定性[4]。其中,隨機不確定性源于物理現(xiàn)象中存在的固有隨機性,無法通過收集更多信息進行控制或減?。徽J知不確定性源于知識的缺乏、數(shù)據(jù)的不足,可通過知識增加、建模方法改進、數(shù)據(jù)搜集等達到減小甚至消除的目的。不確定性按照來源又可分為參數(shù)不確定性、模型不確定性和數(shù)據(jù)不確定性[5]。對于數(shù)值模擬,以廣泛用于飛行器空氣動力計算的CFD 仿真為例,不確定性一般可歸為模型形式不確定性、模型參數(shù)不確定性和模型數(shù)值離散不確定性[6]。模型形式不確定性屬于認知不確定性,一方面源于求解湍流流場時湍流模型的選擇,采用不同的假設(shè)構(gòu)造的湍流模型會對數(shù)值模擬結(jié)果有較大影響[7];另一方面源于數(shù)值模擬建模所作的各種假設(shè)和簡化,使得仿真結(jié)果與試驗數(shù)據(jù)存在偏差。模型參數(shù)不確定性既包含攻角、雷諾數(shù)、壓力、流量等來流和邊界條件和制造誤差、工藝波動等影響幾何尺寸的隨機不確定性,也包含湍流模型封閉系數(shù)以及卡門數(shù)、壁面普朗特數(shù)等認知不確定性[8]。對這些不確定性進行表征時,由于數(shù)據(jù)匱乏會導(dǎo)致數(shù)據(jù)不確定性,這屬于認知不確定性。模型數(shù)值離散不確定性也屬于認知不確定性,其源于對控制方程及邊界條件離散化造成的截斷誤差和迭代誤差[9]。
一方面,這些不確定性必然會導(dǎo)致數(shù)值仿真的輸出響應(yīng)也存在不可忽視的不確定性,且輸出極有可能對某些不確定性非常敏感,例如激波在翼型上表面的位置和激波后壓力對湍流模型封閉系數(shù)的變化非常敏感[10],嚴重影響CFD 結(jié)果的可信度,這對于具有高可靠性要求的航空航天裝備而言,極有可能引入潛在風險,因此開展優(yōu)化設(shè)計前必須對數(shù)值模擬進行模型確認(Model Validation)。另一方面,這些不確定性必然會導(dǎo)致飛行器系統(tǒng)性能的波動,甚至導(dǎo)致設(shè)計失效,帶來災(zāi)難性后果。例如NASA 的高超聲速飛行器X43-A 試驗失敗,究其原因是對氣動設(shè)計不確定性因素模擬不足[11]。因此,需要在飛行器等復(fù)雜裝備設(shè)計中開展不確定性下的優(yōu)化設(shè)計(Design Optimization under Uncertainty),如穩(wěn)健優(yōu)化設(shè)計[12-13]和基于可靠性的優(yōu)化設(shè)計[14-15],提升系統(tǒng)性能的同時確保系統(tǒng)的穩(wěn)健和可靠。對數(shù)值模擬模型確認和不確定性下的優(yōu)化設(shè)計,其關(guān)鍵皆為不確定性量化(Uncertainty Quantification,UQ),主要包括不確定性表征(Uncertainty Characterization)和不確定性傳播(Uncertainty Propagation,UP)2 個關(guān)鍵部分。圖1 對基于概率理論的UQ 進行了示意。
圖1 基于概率理論的不確定性量化示意Fig.1 Schematic of uncertainty quantification based on probability theory
如圖1 所示,不確定性表征是根據(jù)不確定性變量的數(shù)據(jù)(源于測量、理論或?qū)<业龋┙?shù)學(xué)模型的過程,具體指:①指定不確定性的數(shù)學(xué)結(jié)構(gòu);②確定結(jié)構(gòu)所需元素的數(shù)值。比如,隨機變量可建模為概率分布模型(見圖中隨機變量x1、x2、x3的實線概率密度曲線)。不確定性傳播包含正向和反向不確定性傳播,正向UP 研究在輸入不確定性的影響下,系統(tǒng)輸出(通常也稱為感興趣的量Quantity of Interest,QoI)的不確定性(圖1 中實線表示從輸入x=[x1,x2,x3]到輸出y的不確定性傳播過程);反向UP 研究根據(jù)y的觀測數(shù)據(jù)反向推理計算輸入不確定性(圖1 中虛線從輸出y反推輸入x的不確定性傳播過程),最終得到圖中隨機變量x1、x2、x3的虛線概率密度曲線,需在正向UP 的基礎(chǔ)上進行[16]。當然,不確定性表征不僅可以用于輸入不確定性變量,還可直接應(yīng)用于系統(tǒng)的QoI。例如,對于CFD 數(shù)值模擬可以基于湍流模型系數(shù)、來流等不確定性表征的結(jié)果,進行正向UP 得到流場壓力場的不確定性,也可根據(jù)壓力場的測量數(shù)據(jù),直接對其進行不確定性表征建模。此外,根據(jù)流場壓力場的測量數(shù)據(jù),可利用反向UP 對湍流模型系數(shù)的不確定性表征模型進行修正。本文后續(xù)提及UP,若不作特殊說明皆指正向UP。基于QoI 不確定性量化的結(jié)果,可進行設(shè)計和決策,比如確定是否接受或有多大信心接受當前的數(shù)值仿真模型或設(shè)計方案。顯然,對不確定性進行合理的表征建模至關(guān)重要[17-18],它是實施UQ 的前提。
在對數(shù)值模擬模型形式不確定性的研究中,當考慮單個數(shù)值模擬模型時,基于該模型進行不確定性傳播。比如,CFD 中考慮湍流模型系數(shù)或雷諾應(yīng)力的不確定性,比較UQ 結(jié)果與試驗數(shù)據(jù)來估計模型形式不確定度,形成了模型評價的假設(shè)檢驗統(tǒng)計量、貝葉斯因子、頻率指標、面積度量等諸多模型確認度量指標[19];當考慮多個數(shù)值模擬模型時,通過模型選擇或數(shù)據(jù)融合的方式對模型預(yù)測中的模型選擇不確定性進行量化,其中貝葉斯模型平均(Bayesian Model Averaging,BMA)是目前較為常用的方法。Chen 等[20]針對機械系統(tǒng)的疲勞裂紋問題,基于BMA 方法量化了模擬性能退化的維納過程模型、伽馬過程模型和逆高斯過程模型所引入的模型形式不確定性。Tang 等[21]基于證據(jù)理論對ZAERO 和NASTRAN 軟件所模擬的導(dǎo)彈舵面顫振仿真結(jié)果進行了融合,從數(shù)據(jù)融合的角度進行了模型形式(不同仿真平臺)的不確定性量化。由此可見,模型形式不確定性量化最終都歸結(jié)到單個模型的參數(shù)不確定性表征及傳播。
數(shù)值模擬中數(shù)值離散的不確定性主要指離散誤差的估計,Richardson 外推是較為常用的估計方法,它將數(shù)值離散不確定性表征為一個認知不確定性區(qū)間。Schaefer 等[5]基于Richardson 外推對NASA 提出的通用運輸機研究模型(CRM)的網(wǎng)格收斂誤差進行了估計,得到了其升阻力系數(shù)的認知不確定性區(qū)間。陳江濤等[22]同時考慮了數(shù)值離散不確定性和模型形式不確定性,提出了一種考慮數(shù)值離散誤差的湍流模型選擇不確定度量化方法,基于Richardson 外推計算了SA湍流模型和湍流k-ω模型真解的95%置信區(qū)間,然后將其作為認知不確定性通過二階概率框架給出了NACA0012 低速繞流和CHN-T1 跨聲速繞流中升阻力系數(shù)的概率分布上下限。對于基于數(shù)值模擬的工程設(shè)計,狹義上講,不確定性表征都可以歸為對參數(shù)的不確定性表征。因此本文主要綜述各種參數(shù)不確定性表征方法,以下提及的不確定性表征皆指參數(shù)不確定性表征。
目前關(guān)于不確定性傳播,國內(nèi)外學(xué)者從不同角度開展了大量研究以及綜述性工作。在隨機不確定性傳播方面,產(chǎn)生了蒙特卡洛模擬[23]、混沌多項式[24]、隨機配點[25]、高斯數(shù)值積分[26]、多可信度不確定性傳播[27]等諸多方法,并應(yīng)用在飛行器氣動系數(shù)[28]、火箭氣動載荷[29]、結(jié)構(gòu)形變[30]、電阻抗成像[31]、CFD 數(shù)值模擬[32]等大量不確定度量化問題中。在認知不確定性傳播方面,產(chǎn)生了基于區(qū)間、概率盒(Probability-Box,p-box)、D-S(Dempster-Shafer)證據(jù)、模糊、可能性、粗糙集等理論的方法[33],分別應(yīng)用于飛機結(jié)構(gòu)[34]、翼型氣動特性[35]、屋頂結(jié)構(gòu)形變特性[36]等諸多不確定度量化問題。關(guān)于混合不確定性傳播,大多將概率理論與區(qū)間分析、概率盒、模糊集、證據(jù)理論等其中一種認知不確定性量化方法相結(jié)合,形成外層處理認知不確定性、內(nèi)層處理隨機不確定性的雙層嵌套抽樣混合不確定性傳播框架[37]。這些研究在進行不確定性傳播時,均假設(shè)不確定輸入數(shù)學(xué)模型已知,如正態(tài)、均勻分布或區(qū)間模型,例如氣動力系數(shù)不確定性量化中將馬赫數(shù)、迎角、箭體幾何外形等直接假設(shè)建模為正態(tài)分布[28]、將湍流模型封閉系數(shù)建模為均勻分布[38];氣動彈性不確定性量化中將高超聲速舵面熱不確定性建模為正態(tài)分布[29];結(jié)構(gòu)不確定性量化中將楊氏模量、橫截面積、外部載荷不確定性建模為對數(shù)正態(tài)分布和極值分布[30]。如此假設(shè)未必合理,由此得到的不確定度量化結(jié)果對工程問題的參考價值有限,需要根據(jù)具體場景下不確定性變量信息對其建立合理的數(shù)學(xué)表征模型。Ferson 等[39]對美國Sandia 實驗室發(fā)起的認知不確定性研討會進行總結(jié),指出不確定性表征是值得進一步研究的關(guān)鍵。相比不確定性傳播,不確定性表征方面的研究明顯要少,鮮有綜述性的研究工作報道。
本文面向基于數(shù)值模擬的工程設(shè)計,主要回顧國內(nèi)外已經(jīng)開展的不確定性表征工作,總結(jié)不確定性表征的基本內(nèi)容和方法,并對表征后的不確定性傳播的基本思路進行簡要介紹,最后給出進一步開展不確定性表征研究的思考與建議。
表征不確定性的信息來源主要包括:①真實或相似條件下的試驗測量數(shù)據(jù);②理論模型生成的數(shù)據(jù);③專家意見。在這些信息來源下,可將表征不確定性的信息源分為3 類[4]:①強統(tǒng)計信息,具有大量試驗或高可信理論數(shù)據(jù),可足夠確信地構(gòu)建不確定性變量的概率統(tǒng)計模型;②稀疏統(tǒng)計信息,很多情況下僅具有不確定性變量的少量試驗或高可信理論數(shù)據(jù),無法構(gòu)建確定的統(tǒng)計模型,否則構(gòu)建的統(tǒng)計模型存在大量認知不確定性;③不精確信息,如專家判斷存在一個或多個具有上下界的區(qū)間,這多個區(qū)間可能來自不同專家或團隊。實際中,不確定變量的信息源往往是上述信息源的混合,比如某儀器的稀疏測量數(shù)據(jù)可能以區(qū)間形式存在,正態(tài)分布的均值可能位于某個區(qū)間。
不確定性表征需解決3 個關(guān)鍵問題,一是要從本質(zhì)和來源上摸清不確定性的類型,包括隨機不確定性、認知不確定性以及兩者兼而有之的混合不確定性,這需要結(jié)合具體物理對象確定;二是要建立不確定性的數(shù)學(xué)模型,包括但不限于概率框架下的概率密度函數(shù)以及非概率框架下的廣義區(qū)間表達等,通常這需要根據(jù)不確定性的信息源決定采取何種建模方法;三是要獲取數(shù)學(xué)模型中的全部參數(shù),如正態(tài)分布模型的均值、方差,或區(qū)間模型的上下界以及可信度等。
圖2 總結(jié)了目前主流的不確定性表征方法,其中隨機不確定性的概率表征方法發(fā)展相對較為成熟,但由于經(jīng)典的概率建模和參數(shù)估計方法僅能處理不確定性源的信息形式為點數(shù)據(jù)且數(shù)據(jù)足夠多的情況,具有一定局限性。針對隨機不確定性以稀疏點數(shù)據(jù)和/或區(qū)間數(shù)據(jù)、區(qū)間數(shù)據(jù)形式存在的情況,也可認為由于數(shù)據(jù)不足而導(dǎo)致的認知不確定性,目前產(chǎn)生了處理稀疏點和/或區(qū)間數(shù)據(jù)的基于似然理論的表征方法[40]、概率分布混合加權(quán)的表征方法[41]、專門處理區(qū)間數(shù)據(jù)的概率表征方法[42]。對于認知不確定性表征,目前方法較多且研究較為獨立,其共同之處是無法直接根據(jù)不確定性源的信息形式進行建模,通常需要專家信息,比如證據(jù)理論需要給定不確定性變量的證據(jù)結(jié)構(gòu),模糊理論需要給定隸屬度函數(shù)。
圖2 不確定性表征方法Fig.2 Uncertainty characterization methods
表1 對不確定性表征方法的特點進行了分類整理,不失一般性,按照概率和非概率方法兩大類展開。概率表征方法均以經(jīng)典概率統(tǒng)計為理論基礎(chǔ),將不確定性變量建模為概率分布,其最大優(yōu)勢是可便捷地應(yīng)用于各類基于概率的不確定性傳播和優(yōu)化設(shè)計理論和方法。非概率表征方法由于涉及新的理論體系,對于后續(xù)的不確定性傳播和設(shè)計,可能需要花費更多的精力進行人員培訓(xùn)[43]。一些學(xué)者認為純概率方法可完全考慮各種形式的不確定性,但更多學(xué)者認為非概率表征方法在認知不確定性處理上更加合理[39]。根據(jù)表征不確定性的信息源所屬類別,可對不確定性進行分類,在此基礎(chǔ)上再進行表征,為此第3 節(jié)介紹了一種考慮隨機、稀疏和區(qū)間變量的不確定性分類準則及相應(yīng)的不確定性建模方法。
表1 各種不確定性表征方法的特點Table 1 Characteristics of various uncertainty characterization methods
根據(jù)概率表征和非概率表征框架,第2 節(jié)介紹了經(jīng)典的概率表征方法,第3、4、5 節(jié)則按照表征不確定性的不同信息源形式,分別介紹了處理點數(shù)據(jù)、稀疏點數(shù)據(jù)和/或區(qū)間數(shù)據(jù)、區(qū)間數(shù)據(jù)的不確定性表征方法。第6 節(jié)針對場變量介紹了常用的隨機場表征方法。第7 節(jié)介紹了處理認知不確定性的非概率表征方法。
概率統(tǒng)計法具有成熟的理論基礎(chǔ),保證了它在處理隨機不確定性時的有效性。如果信息足夠估計變量的概率分布,則可通過經(jīng)典概率統(tǒng)計法將隨機不確定性建模為隨機變量。這種隨機不確定性的概率分布表征方法目前已經(jīng)在結(jié)構(gòu)優(yōu)化[44]、氣動分析[45-46]、電工電子[47]、核工業(yè)技術(shù)[48]、水利水電[49-50]、航空航天[51-52]等諸多領(lǐng)域得到廣泛應(yīng)用。
首先,根據(jù)經(jīng)驗、先驗知識或?qū)<乙庖?,以及變量的不確定性特征及其所涉及的物理背景,確定隨機變量服從的分布(如均勻、高斯、泊松、對數(shù)正態(tài)等)。然后,基于試驗觀測數(shù)據(jù)或其他可用信息,采用矩估計(Moment Estimation)[53]、極大似然估計(Maximum Likelihood Estimation,MLE)[54]、貝葉斯估計(Bayesian Estimation)和最大后驗(Maximum A Posteriori,MAP)估計[55]等參數(shù)估計方法求得分布的參數(shù)(如正態(tài)分布的均值和標準差)?;诮?jīng)典概率統(tǒng)計的不確定性表征方法最終都能根據(jù)點數(shù)據(jù)得到不確定性變量的概率分布。
張文生等[56]針對土質(zhì)邊坡可靠度分析,將巖土參數(shù)中黏聚力和內(nèi)摩擦角隨機變量表征為正態(tài)分布,利用矩估計方法估計了分布的均值和方差。Kim 等[57]針對懸臂梁撓度測量誤差的不確定性,采用極大似然估計方法估計假設(shè)的均勻分布和正態(tài)分布的分布參數(shù),為考慮測量誤差時的觀測數(shù)據(jù)的不確定性表征提供了指導(dǎo)。張諾亞[58]基于貝葉斯估計獲得了煤礦地下電性分布模型,并開展了模型參數(shù)的不確性分析和可靠度評估。Edeling 等[59]在二維分離流和三維可壓縮流等高雷諾數(shù)流動問題計算中,采用最大后驗估計對CFD 仿真中使用的k-ε、k-ω、SA 湍流模型封閉系數(shù)進行了估計,以量化湍流模型的不確定性。
本節(jié)主要介紹最為常用的極大似然估計和貝葉斯估計。
2.1.1 極大似然估計
極大似然估計是一種利用已知的樣本信息反推最具有可能(最大概率)導(dǎo)致這些樣本結(jié)果出現(xiàn)的概率模型分布參數(shù)的估計方法,即“分布已定,參數(shù)未知”。對于連續(xù)型概率分布f(x;θ),其中x為隨機變量,θ為未知參數(shù)。從總體X中取出樣本容量為n的簡單樣本和其樣本觀測值分別為(X1,X2,…,Xn)和(x1,x2,…,xn),則樣本的似然函數(shù)(即聯(lián)合概率密度)為
極大似然估計就是給定樣本觀測值(x1,x2,…,xn)下,選取未知參數(shù)θ的估計值使得似然函數(shù)最大的過程。在樣本數(shù)量較大的情況下,概率連乘會導(dǎo)致數(shù)據(jù)下溢,產(chǎn)生較大數(shù)值計算誤差,由于似然函數(shù)及其對數(shù)函數(shù)在同一點處達到最大,通常對似然函數(shù)取對數(shù)進行求解。
極大似然估計基于經(jīng)典概率統(tǒng)計理論,為獲得準確的參數(shù)估計結(jié)果,文獻[60]建議樣本數(shù)據(jù)量大于30。實際中待估計參數(shù)維數(shù)不同,對數(shù)據(jù)量的要求也會有所不同[61],但并未給出確切的參數(shù)維數(shù)和數(shù)據(jù)量間的定量關(guān)系。
2.1.2 貝葉斯估計
在數(shù)據(jù)量較少或比較稀疏的情況下,直接利用MLE 存在一定誤差,此時可利用貝葉斯估計方法,認為待估計參數(shù)也服從某種概率分布,已有數(shù)據(jù)只是在這種參數(shù)的分布下所產(chǎn)生的。該方法也被認為是一種可處理數(shù)據(jù)不足而導(dǎo)致的認知不確定性的有效方法。
在樣本觀測值x=(x1,x2,…,xn)下,待估計參數(shù)θ的條件概率密度為
式中:π(θ)為參數(shù)θ的先驗分布;f(x|θ)為總體X的條件分布;π(θ|x)為參數(shù)θ的后驗分布;分子項f(x|θ)π(θ)為參數(shù)和樣本的聯(lián)合分布,分母項∫θ f(x|θ)π(θ)dθ為樣本觀測值x的邊緣概率密度。
在貝葉斯估計中,若采用極大似然估計的思想,考慮后驗分布極大化而求解θ,則變成了最大后驗估計:
2.1.3 分布類型的選擇
上述參數(shù)估計方法的應(yīng)用前提是概率分布類型已指定,并未給出如何判定選擇最為合適的分布類型的方法,實際中極有可能缺乏指定分布類型所需要的信息。此時,可基于不確定性變量的給定數(shù)據(jù)(觀測或理論)應(yīng)用擬合優(yōu)度檢驗(Goodness of Fit,GOF)或模型選擇方法來確定分布,給出接受或拒絕一個候選分布適合表示給定數(shù)據(jù)假設(shè)的結(jié)論。
最具代表性的擬合優(yōu)度檢驗有Kolmogorov-Smirnov(K-S)、Anderson-Darling(A-D)和卡方(χ2)檢驗[62-64]。K-S 檢驗和A-D 檢驗均通過比較經(jīng)驗數(shù)據(jù)分布與候選分布的累積分布函數(shù)(Cumulative Distribution Function,CDF)間的距離,來度量2 個分布間的差異程度,但A-D 檢驗將權(quán)重應(yīng)用于尾端概率分布,這對那些要求尾端概率分布較為精確的情況比較有用。χ2檢驗則是直接比較數(shù)據(jù)頻率和候選分布的概率密度函數(shù)(Probability Density Function,PDF)之間的吻合程度。擬合優(yōu)度檢驗為候選分布是否可表征給定數(shù)據(jù)提供了有效驗證手段,但是識別出的正確分布模型通常有多個,無法對各個模型的優(yōu)劣排序,尤其當樣本數(shù)量較少時該問題廣泛存在。
模型選擇方法可有效解決上述問題,主要包括極大似然估計(MLE)、赤池信息準則(Akaike Information Criterion,AIC)、赤池信息修正準則(AICc)和貝葉斯信息準則(Bayesian Information Criterion,BIC))等[65-67]。其基本原理為:參考分布越接近不確定性變量的給定數(shù)據(jù),對應(yīng)的似然函數(shù)值越高,AIC 值、AICc 值和BIC 值的計算公式依次分別為
式中:Lmax為候選分布的似然函數(shù)最大值;k為候選分布的模型參數(shù)個數(shù);n為樣本量。
MLE 方法僅計算候選分布似然函數(shù)最大值的負對數(shù)-ln(Lmax),通常認為三參數(shù)分布比一或二參數(shù)分布更適合,因此有時會錯誤地將三參數(shù)分布識別為正確分布。如式(4)所示,相比MLE,AIC 額外考慮了參數(shù)的數(shù)量,權(quán)衡估計模型復(fù)雜度和擬合數(shù)據(jù)優(yōu)良性。
作為AIC 的修正版本,AICc 在信息損失計算中額外考慮了樣本量n,適用于小樣本下的模型選擇。BIC 又進一步考慮了參數(shù)個數(shù)的影響,相較于AIC 和AICc,BIC 所引入的與模型參數(shù)個數(shù)相關(guān)的懲罰項kln(n)所占比重更大,當樣本量較多時,可有效防止追求模型高精度所導(dǎo)致的模型復(fù)雜度過高。文獻[65-67]對3 種準則及其懲罰項和修正項的引入給出了詳細的理論推導(dǎo)。
Lim 等[68]采用AIC 準則建立了不確定變量的表征模型,對白車身及發(fā)動機車架進行了結(jié)構(gòu)有限元仿真,開展了性能可靠度分析及基于可靠性的優(yōu)化設(shè)計。Kang 等[69]比較了AIC、AICc 和BIC 3 種方法對多種概率分布類型識別的準確率,得出BIC 準則識別準確率最高。陳健等[70]在比較MLE、AIC 和BIC 時也得出了類似結(jié)論。此外,Kang 等還對K-S、A-D 和χ2檢驗在不確定性表征中的效果進行了比較,得出K-S 檢驗和A-D檢驗精度相當,但A-D 檢驗對于極值分布的識別正確率較低,而χ2檢驗在不確定性的樣本數(shù)據(jù)量較小時檢驗結(jié)果并不準確,因此K-S 檢驗被認為是相對較好的擬合優(yōu)度檢驗方法。
Kang 等[69,71]提出了一種結(jié)合擬合優(yōu)度檢驗和模型選擇的序列統(tǒng)計建模方法,首先通過擬合優(yōu)度檢驗篩選掉不符合給定樣本數(shù)據(jù)的候選分布,然后應(yīng)用模型選擇方法對接受的候選分布進行優(yōu)劣排序。當擬合優(yōu)度檢驗拒絕了全部可能的候選模型分布時,則利用核密度估計(Kernel Density Estimation,KDE)方法[72]獲得不確定性變量的概率密度分布。圖3[69]為Kang 等提出的序列統(tǒng)計建模方法的實施流程,圖中N和Ntot分別表示候選模型數(shù)量以及全部可能的模型數(shù)量。
圖3 序列統(tǒng)計建模方法[69]Fig.3 Sequential statistical modeling method[69]
Kang 等的研究表明,對于不同的分布類型和樣本數(shù)目,K-S 檢驗和BIC 方法的組合可獲得最高的估計精度。但是,由于擬合優(yōu)度檢驗和模型選擇方法都需在給定數(shù)據(jù)較充足的情況下才可精確識別分布類型,所以Kang 等提出的方法適用條件為n>30。
參數(shù)估計需基于工程經(jīng)驗或?qū)<乙庖姷刃畔Ω怕史植歼M行假設(shè),非參數(shù)法無需提前假設(shè)參數(shù)的概率分布,可直接根據(jù)數(shù)據(jù)特征進行分布擬合,避免對概率分布模型的假定不當導(dǎo)致重大錯誤。本節(jié)將介紹常用的基于最大熵原理以及基于核密度的非參數(shù)估計方法。
2.2.1 最大熵原理
基于最大熵原理的方法通過求解以下優(yōu)化問題得到連續(xù)型隨機變量x∈D的概率分布函數(shù)f(x):
式中:Mi為第i階統(tǒng)計矩。式中目標函數(shù)表示最大化信息熵[73],概率分布越準確則信息熵越大。對上式構(gòu)造聯(lián)合約束條件的拉格朗日函數(shù),通過求解拉格朗日乘子,最終可得f(x),完成不確定性表征。
黃乾坤等[74]圍繞基于Shannon 熵的最大熵原理,討論了不同約束條件下最大熵優(yōu)化問題的一般形式,并對經(jīng)典最大熵的不足給出了改進方法。陳雷等[75]針對航空發(fā)動機模擬轉(zhuǎn)子葉片,通過最大熵方法擬合了不同葉端定時傳感器布局下的測點振幅的概率密度函數(shù),而后通過ANSYS 有限元分析開展了轉(zhuǎn)子葉片動應(yīng)變重構(gòu)不確定性量化。Chen 等[76]對模型自身不確定性、模型參數(shù)估計的不確定性以及整個模型的不確定性進行了分析,證實了最大熵分布在海洋波高極值計算中的優(yōu)越性。在數(shù)據(jù)樣本量很小的情況下,樣本統(tǒng)計矩所能提供的信息不夠豐富和全面,基于最大熵原理的方法所得概率密度分布可能與實際存在較大偏差,為此呂文[77]提出了一種小樣本下采用秩來構(gòu)造約束條件的改進最大熵方法。此外,最大熵方法涉及大量積分計算,積分區(qū)間會引入截斷誤差,且當統(tǒng)計矩最高階數(shù)較大時,會面臨求解困難、概率密度積分不為1 等問題,為此李昊燃[78]和劉鈺等[79]分別提出了基于轉(zhuǎn)換函數(shù)和密度核估計的改進最大熵方法。
2.2.2 核密度估計
假設(shè)有n個樣本點數(shù)據(jù)xi(1 ≤i≤n),傳統(tǒng)的核密度估計(KDE)方法求解概率密度函數(shù)公式為[72]
式中:K為核函數(shù),常用于KDE 算法中的核函數(shù)有高斯核函數(shù)、三角核函數(shù)、Epanechnikov 核函數(shù)等[80];h為帶寬(或窗寬),其通過影響核函數(shù)中自變量的取值來控制每個樣本的相對權(quán)重,影響概率密度的光滑程度和估計精度,可根據(jù)最小化AMISE 準則和Silverman 經(jīng)驗法則計算[81]。
單德山等[82]采用核密度估計分析了橋梁構(gòu)件地震易損性,基于有限元仿真模型構(gòu)建了橋梁結(jié)構(gòu)構(gòu)件地震易損性的核密度估計算法。Kang等[83]提出了一種有界數(shù)據(jù)的核密度估計算法,并對懸臂梁楊氏模量、水平和垂直方向載荷的區(qū)間數(shù)據(jù)進行了核密度估計,發(fā)現(xiàn)相較于原始KDE 方法的估計結(jié)果更為準確,尤其是樣本數(shù)據(jù)較少時。理論上,只要提供足夠多的樣本數(shù)據(jù),KDE可收斂到任意形狀的概率密度函數(shù),即使是在小樣本下也可得到概率密度函數(shù)的光滑連續(xù)估計[84]。但KDE 易出現(xiàn)邊界偏差,無法在邊界點附近給出良好的估計結(jié)果,且擬合的概率密度函數(shù)在高密度樣本區(qū)間過于平滑,缺乏局部適應(yīng)性。針對該問題,繆鵬彬[85]提出了采用邊界核的自適應(yīng)非參數(shù)核密度估計算法。趙鐵軍[86]對傳統(tǒng)KDE 方法進行了改進,將自適應(yīng)核密度估計與基于偽數(shù)據(jù)的核密度估計相結(jié)合,將偽數(shù)據(jù)添加到邊界附近以修正偏差。
針對隨機不確定性往往依賴測量樣本數(shù)據(jù)獲取統(tǒng)計規(guī)律的特點,開展面向點數(shù)據(jù)的不確定性表征建模,Kang 等[69]、Peng 等[41]以及魏驍[87]等學(xué)者在這方面作了探索性研究。上述已提到Kang等[69]的研究為如何從隨機不確定性多種可能的概率分布中確定最佳分布模型,提供了一條解決思路。但是,當不確定性參數(shù)的信息源較少時,單一的概率分布未必能合理表征不確定性。Peng等[41]在各種單一概率分布的基礎(chǔ)上引入多種概率分布的混合加權(quán)分布作為候選分布模型之一,建立了一種基于擬合優(yōu)度檢驗的不確定性變量類型確定方法,對候選模型的擬合優(yōu)良性給出了定量評價。但該方法采用的AD 檢驗并不適用于均勻分布,且給出的檢驗統(tǒng)計量和臨界值的計算公式僅適用于正態(tài)分布,無法應(yīng)用于其他概率分布的檢驗。為此,我們對Peng 等[41]提出的不確定性分類方法進行了改進[88],采用K-S 檢驗來滿足檢驗均勻分布的需求,同時定義p值[89]作為擬合優(yōu)良性的評價指標,使得檢驗適用于多種分布。
改進的不確定性分類方法將不確定性表征為以下3 種類型的變量,如圖4 所示。
圖4 隨機變量、稀疏變量、區(qū)間變量的表征示意Fig.4 Characterization of random variable,sparse variable and interval variable
1)隨機變量:數(shù)學(xué)模型為常見的單一概率分布。
2)稀疏變量:數(shù)學(xué)模型為多種分布組成的混合加權(quán)概率分布。
3)區(qū)間變量:數(shù)學(xué)模型為上下界表達的區(qū)間形式。
以下為面向點數(shù)據(jù)的不確定性表征方法的具體實施步驟。
步驟1判斷不確定性變量觀測樣本個數(shù)n,若n<ncv(臨界樣本數(shù)),則認為不宜擬合概率分布,直接將變量表征為區(qū)間變量;否則執(zhí)行步驟2。
步驟2假設(shè)該不確定性變量為隨機變量,令變量依次滿足m種常見的概率分布,其概率密度函數(shù)分別為fi(x)(i=1,2,…,m)。對于不同的研究對象,可根據(jù)具體的物理背景選擇候選概率分布模型。
步驟3假設(shè)該不確定性變量為稀疏變量,令其概率分布為上述除均勻分布外其余m-1 種分布的加權(quán)和,其概率密度函數(shù)見式(9),根據(jù)赤池信息準則[90]為各個概率分布分配權(quán)重wi。為了降低模型復(fù)雜度,忽略權(quán)重小于0.1 的候選概率模型。
步驟 4確定上述分布的fi(x)(i=1,2,…,m)、fmix(x)以及概率分布函數(shù)F(x)?;贙-S 檢驗計算檢驗統(tǒng)計量Kn,并求解在顯著性水平α下的擬合優(yōu)度(p值),關(guān)于p值的計算如下。
1)根據(jù)不確定性變量的觀測數(shù)據(jù),得到其經(jīng)驗概率分布函數(shù)Fn(x)。
2)計算KS 距離dKS,在經(jīng)驗概率分布和假設(shè)概率分布2 條曲線相交和不相交2 種情況下,KS距離計算的如圖5 所示。
圖5 KS 距離Fig.5 KS distance
式中:當i=n時,有Fn(xn+1)=Fn(∞)=1;sup表示上確界。
3)由Kn的準確概率分布P(Kn≤dKS)求解p值,p值越大說明擬合程度越優(yōu)。
式中:tkk的計算詳見文獻[91]。
步驟5比較擬合優(yōu)度最大值pmax和顯著性水平α的大小,確定不確定性參數(shù)的最佳表征形式。若pmax≥α,pmax對應(yīng)的分布類型為單一概率分布,不確定性變量被表征為隨機變量,pmax對應(yīng)的分布類型為混合加權(quán)分布,則被表征為稀疏變量;若pmax<α,將該不確定性變量表征為區(qū)間變量。
不確定性分類表征能夠科學(xué)合理地表征不確定性變量的類型,并對分布與樣本數(shù)據(jù)之間的擬合優(yōu)良性進行定量評價,混合加權(quán)分布的構(gòu)建進一步豐富了候選模型庫,為隨機不確定性從多種可能的一般概率分布中確定最佳的分布模型給出了較為通用的解決方案。該表征方法適用于不確定性信息中僅包含點數(shù)據(jù)的情況,當點數(shù)據(jù)和區(qū)間數(shù)據(jù)同時存在時,方法應(yīng)用受限;同時在候選模型擬合優(yōu)度均較差的情況下,方法直接將不確定性表征為粗糙的區(qū)間變量,如何根據(jù)可用的樣本數(shù)據(jù)對區(qū)間模型進一步細化和優(yōu)化也是后續(xù)研究需要解決的問題。
上述不確定性表征方法都僅能處理點數(shù)據(jù),實際中受時間和經(jīng)濟成本的限制,除了稀疏點數(shù)據(jù),可用信息還可能以區(qū)間的形式存在。例如與儀器校準相關(guān)的不確定性或誤差以及試驗觀測數(shù)據(jù)的不確定性等,常用區(qū)間來描述。圖6 為某隨機變量X的不確定性信息為稀疏點數(shù)據(jù)和區(qū)間數(shù)據(jù),存在3 個點數(shù)據(jù){4.1,5.6,3.8}和3 個區(qū)間數(shù)據(jù)[3.5,4]、[3.9,4.1]和[5,6]。對此,產(chǎn)生了基于似然理論和基于加權(quán)分布的概率表征方法。
圖6 點數(shù)據(jù)和區(qū)間數(shù)據(jù)同時存在Fig.6 Point data and interval data exist at the same time
通??捎酶怕世碚撎幚睃c數(shù)據(jù),而處理區(qū)間數(shù)據(jù)則常用區(qū)間理論,難以同時用這2 種理論來描述以區(qū)間和稀疏點數(shù)據(jù)存在的隨機變量。Sankararaman 和Mahadevan 針對以點數(shù)據(jù)和/或區(qū)間數(shù)據(jù)存在的隨機變量,提出了一種基于似然理論(Likelihood-Based)的方法[40](以下簡稱LBM),將信息不充足情況下的隨機變量統(tǒng)一用概率模型表征。在該方法的基礎(chǔ)上,他們進一步分別利用貝葉斯模型平均和貝葉斯假設(shè)檢驗對分布類型選擇導(dǎo)致的不確定性進行量化,進而可在后續(xù)的不確定性傳播中同時考慮輸入?yún)?shù)的隨機性、分布參數(shù)的不確定性、分布類型的不確定性[92]。張鵬等[93]將這種包含離散數(shù)據(jù)與區(qū)間的變量稱為稀疏混合不確定性變量,針對多種候選單一概率分布,分別利用Sankararaman 和Mahadevan[40]提出的LBM 獲取不確定性變量的概率密度函數(shù),進一步根據(jù)貝葉斯信息準則確定最合適的概率分布類型。
基于LBM 的不確定性表征可分為參數(shù)法和非參數(shù)法,如圖7 所示。參數(shù)法需要提前指定不確定性變量的分布類型。然而,在很多情況下有效選擇分布類型可能非常困難,而且不同的分布類型假設(shè)將導(dǎo)致不同的不確定性表征結(jié)果。非參數(shù)法避免了對分布類型的假設(shè),且由于不必對分布類型抽樣,可顯著降低不確定性表征的計算量。接下來將分別對LBM 的2 種實現(xiàn)方法進行介紹。
圖7 分布族(有參)和單個分布(無參)Fig.7 Family of distributions(parametric method)and individual distributions(nonparametric method)
設(shè)隨機變量X存在m個稀疏點數(shù)據(jù)xi(i=1,2,…,m) 和n個區(qū)間數(shù)據(jù)[ai,bi] (i=1,2,…,n),且這些數(shù)據(jù)來源相互獨立。fX(x|P)表示X關(guān)于P的概率密度函數(shù),P為所需要估計的參數(shù)。參數(shù)P的似然函數(shù)可表示為
不同于直接采用極大似然估計的方法,Sankararaman 和Mahadevan[40]通過全似然估計,利用貝葉斯定理得到分布參數(shù)P的概率密度函數(shù)。假設(shè)fP(P)表示參數(shù)P的聯(lián)合概率密度函數(shù),選擇均勻先驗概率密度,則分布參數(shù)P的后驗分布為
根據(jù)fP(P)對P抽樣可得隨機變量X的一族PDF 曲線,導(dǎo)致后續(xù)不確定性傳播為雙層循環(huán),計算量較大。為此,可進一步對分布參數(shù)P的不確定性積分從而得到隨機變量X的平均PDF。
Sankararaman 和Mahadevan[40]詳細給出了求解上式積分的方法。需要注意的是參數(shù)法需要提前假設(shè)隨機變量X的分布類型,但經(jīng)過積分后所得隨機變量X的分布將發(fā)生改變,不再與假設(shè)相同。
非參數(shù)法直接基于已有的稀疏數(shù)據(jù)和/或區(qū)間數(shù)據(jù),確定隨機變量X的最大、最小值邊界。然后在最大、最小值形成的區(qū)間中將X離散為有限個點qi(i=1,2,…,Q)。pi表示這些離散點上X的PDF 值,即fX(x=qi)=pi。根據(jù)這些離散點上的值,利用插值技術(shù)可得到其他點上對應(yīng)的X的PDF 值。令p=(p1,p2,…,pQ),同理可將似然函數(shù)表示為
通過優(yōu)化如下問題得到p:
Sankararaman 和Mahadevan[40]對PDF 插值的3 種方法——線性插值、樣條插值、高斯過程插值進行了詳細介紹和探討,認為高斯過程插值是最為通用的方法。
Peng 等[41]針對基于CFD 數(shù)值模擬的曲柄滑塊機構(gòu)和熱交換器可靠度評估問題,采用LBM的參數(shù)法,完成了混合加權(quán)分布的不確定性表征[94-95]。魏驍[87]針對基于CFD 數(shù)值模擬的KCS船型優(yōu)化設(shè)計,根據(jù)船舶測量設(shè)備記錄的吃水數(shù)據(jù),同樣采用參數(shù)似然估計對吃水變量的不確定性進行了表征。Peng 等[96]又采用非參數(shù)法構(gòu)建了源于稀疏采樣點和區(qū)間數(shù)據(jù)的高斯過程插值模型,提出了稀疏采樣點和區(qū)間數(shù)據(jù)多源數(shù)據(jù)融合方法。
Zaman 等[97]指出,Sankararaman 和Mahadevan 提出的基于似然理論的不確定性表征方法[40]需要利用貝葉斯更新和積分來獲取隨機變量的分布,過程較為繁瑣,且所得隨機變量的分布類型不再與假設(shè)分布相同。而且,當所有區(qū)間數(shù)據(jù)均有共同重疊部分時,該方法給出的方差(二階統(tǒng)計矩)的最大似然估計為零,不再適用,Zaman等[42]認為此時Sankararaman 和Mahadevan[40]提出的方法低估了不確定性。為此,Zaman 等[97]基于似然理論,提出了一種基于最壞情況最大似然估計(Worst-Case Maximum Likelihood Estimation,WMLE)的方法,基于此建立了穩(wěn)健優(yōu)化模型,并將其應(yīng)用于兩級入軌飛行器穩(wěn)健優(yōu)化問題,對其中的分離飛行軌跡角和長細比進行了不確定性表征[97]。該方法同樣可以處理隨機變量以稀疏點和/或區(qū)間存在的混合數(shù)據(jù),也適用于任何類型的多區(qū)間數(shù)據(jù),即非重疊、重疊以及非重疊和重疊組合的混合區(qū)間。
如式(17)和式(18)所示,對于m個稀疏點數(shù)據(jù)和n個區(qū)間數(shù)據(jù),基于最壞情況最大似然的方法以外層和內(nèi)層的2 層嵌套優(yōu)化來估計分布參數(shù),內(nèi)層在固定稀疏點數(shù)據(jù)取值的情況下,對區(qū)間數(shù)據(jù)所有可能取值進行組合計算似然函數(shù)值,找到使似然函數(shù)最小的區(qū)間變量所取的數(shù)據(jù)值,也就是所謂最壞情況,即區(qū)間數(shù)據(jù)的不確定性所導(dǎo)致的似然下限;外層再通過最大化似然函數(shù),估計分布參數(shù),找到不確定性變量最優(yōu)的分布參數(shù)p。
式中:p為分布參數(shù);x為點數(shù)據(jù)和區(qū)間數(shù)據(jù);xlow、xup分別為區(qū)間數(shù)據(jù)的下限和上限。
似然函數(shù)值代表概率分布支持現(xiàn)有樣本數(shù)據(jù)的好壞程度,而對于區(qū)間數(shù)據(jù),觀測樣本不再是固定的一組值,而是各個區(qū)間上所有可能取值的一系列組合。Zaman 等[42]通過搜尋使似然函數(shù)最小的這些區(qū)間上形成的某組取值,得到概率分布擬合的最壞情況,在該最壞情況下再通過最大化似然函數(shù)值來估計參數(shù)p的值,這就是基于最壞情況的最大似然的內(nèi)涵。
上述已經(jīng)提及,LBM 不適用于所有區(qū)間數(shù)據(jù)均有共同重疊部分的特殊情況,而且無法在僅有一個區(qū)間數(shù)據(jù)的情況下進行不確定性表征,因為此時無論什么形式的概率分布,在該區(qū)間上的似然函數(shù)值都為1。對此,Zaman 等提出了一種專門應(yīng)對區(qū)間數(shù)據(jù)的概率表征方法[42]。
當不確定性變量以區(qū)間和稀疏點數(shù)據(jù)混合的形式存在時,除了上述多種基于似然理論的表征方法以外,也有研究直接認定該變量為第3 節(jié)不確定性分類中所提到的稀疏變量[41,96],將其建模為多種單一概率分布混合加權(quán)和的形式,見式(9)。
實際上,不確定性變量的不確定信息源可能為單個或多個區(qū)間,多個區(qū)間為互不重疊或有重疊的區(qū)間。針對單個區(qū)間的情況,過去較為常用的做法是直接將區(qū)間數(shù)據(jù)形式的不確定性變量表征為該區(qū)間上的均勻分布,相當于認為變量在區(qū)間上任意位置出現(xiàn)的可能性是相等的,事實上變量會在區(qū)間上的哪個位置出現(xiàn)并不知道,很多研究也指出該處理方式并非合理[98-99]。此外,對于僅存在一個區(qū)間信息的不確定性表征問題,上一節(jié)中介紹的基于似然理論的方法無法適用。為此,Zaman 等提出了一種專門應(yīng)對區(qū)間數(shù)據(jù)的概率表征方法[42],該方法針對單個區(qū)間數(shù)據(jù)、多個互不重疊或有重疊的區(qū)間數(shù)據(jù)的情況,分別給出了統(tǒng)計矩邊界計算以及分布擬合的解決辦法。
首先建立單個區(qū)間的前四階統(tǒng)計矩的計算方法,在區(qū)間上下界的約束范圍內(nèi)進行抽樣,并對每個樣本點分配概率質(zhì)量函數(shù)(PMF)值,計算各階中心距E(xk)。前四階統(tǒng)計矩為
不同的概率質(zhì)量分配方式對應(yīng)著前四階統(tǒng)計矩的無數(shù)種可能組合,通過優(yōu)化即可估計單個區(qū)間數(shù)據(jù)的前四階統(tǒng)計矩的上下界,找到使單個區(qū)間數(shù)據(jù)的矩最小或最大的區(qū)間端點的PMF 值:
Zaman 等[42]研究發(fā)現(xiàn),對于單個區(qū)間數(shù)據(jù)的各階統(tǒng)計矩的最小值和最大值,PMF 只集中在區(qū)間的2 個端點。單個區(qū)間數(shù)據(jù)的統(tǒng)計矩邊界隨區(qū)間下端點處PMF 變化的估計結(jié)果曲線,如圖8 所示[42]。從圖8 中可以看出,當2 個端點的PMF 均為0.5 時,二階統(tǒng)計矩達到最大值;對于三階統(tǒng)計矩,估計結(jié)果曲線呈對稱;對于四階統(tǒng)計矩,曲線呈雙峰形狀。
圖8 單個區(qū)間數(shù)據(jù)的統(tǒng)計矩邊界估計[42]Fig.8 Boundary estimation of statistical moments for single interval data[42]
Zaman 等[42]將單個區(qū)間的前四階統(tǒng)計矩的計算方法擴展到適用于多個重疊或非重疊區(qū)間數(shù)據(jù)的二階、三階和四階統(tǒng)計邊界的優(yōu)化,建立了適用于單個、多個區(qū)間數(shù)據(jù)的統(tǒng)計矩邊界計算方法,如式(21)~式(23)所示:
式中:n為區(qū)間個數(shù);ai、bi分別表示多個區(qū)間數(shù)據(jù)的下上界端點;xi為在區(qū)間中抽取的樣本點,即ai≤xi≤bi且i=1,2,…,n。
得到統(tǒng)計矩上下邊界后,作者認為每個邊界內(nèi)的各階統(tǒng)計矩均服從均勻分布,進行抽樣,每一組前四階統(tǒng)計矩的組合都能擬合出有界約翰遜分布,通過大量抽樣或基于優(yōu)化的方式得到所有可能的有界約翰遜分布的分布包絡(luò),形成Jonson 概率盒,完成對區(qū)間數(shù)據(jù)的概率表征。圖9[42]針對式(24)(多個非重疊區(qū)間)和式(25)(多個重疊區(qū)間)給出的2 組區(qū)間數(shù)據(jù),分別展示了所得的Jonson 概率盒,圖中粗實線為Jonson 概率盒,階梯狀細實線為數(shù)據(jù)的經(jīng)驗概率盒,細點線族為前4 階統(tǒng)計矩的每一組可能組合對應(yīng)的有界約翰遜分布曲線族。
圖9 Jonson 概率盒[42]Fig.9 Jonson p-box[42]
上述介紹的都是關(guān)于單個不確定性參數(shù)的表征方法。由于不確定性參數(shù)的分散性,不確定性可能隨空間的變化而波動,比如隨機有限元中的力學(xué)空間可變材料特性為輸入隨機場[100]以及CFD 中雷諾應(yīng)力的輸入隨機場[16],此時單個不確定性參數(shù)已無法完整描述整個結(jié)構(gòu)性能的分布。如何準確地描述不確定性參數(shù)隨空間位置變化的特性,是建立不確定性模型重要的考量。隨機場是處理具有空間變異性的不確定性參數(shù)的一種表征模型,是解決參數(shù)空間分散問題的重要手段。
隨機場在其場域內(nèi)的每個位置均為隨機變量,即包含無限個空間相關(guān)的隨機變量。處理隨機場問題要通過點離散、平均離散或級數(shù)展開法等離散方法[101]將連續(xù)隨機場離散為若干個相互獨立的隨機變量。級數(shù)展開法中的Karhunen-Loève(K-L)展開是處理隨機場實現(xiàn)維度縮減較為有效的方法[102]。以下對較為常用的K-L 方法進行簡要介紹。
設(shè)H(x,ω)表示一個隨機場,其中x是有界域D ?Rd(d∈{1,2,3})中的空間變量,代表一維/二維/三維空間位置坐標;ω為概率空間中的隨機事件。假設(shè)隨機場H(x,ω)平方可積,具有均值μ、標準差σ和協(xié)方差矩陣CH(x,x′),x和x′為場內(nèi)兩點的空間位置坐標??墒褂肒-L 展開將H(x,ω)進行如下離散:
式中:μ和分別為隨機場的確定性部分和隨機部分;n為K-L 截斷階數(shù)(級數(shù)展開項數(shù));λi和φi(x)為隨機場協(xié)方差矩陣CH(x,x′)的特征值和相應(yīng)的特征函數(shù),滿足
隨機場表征的核心是如何進行隨機場離散,即確定均值μ、標準差σ、協(xié)方差矩陣CH(x,x′)的特征值和特征函數(shù),本質(zhì)上仍然是參數(shù)的不確定性表征。不確定性參數(shù)μ和σ可基于工程經(jīng)驗給出,也可通過試驗測量數(shù)據(jù)的參數(shù)估計得出,CH(x,x′)定義在規(guī)則幾何空間域上,與場內(nèi)兩點的相關(guān)距離有關(guān),而這種相關(guān)距離由相關(guān)函數(shù)體現(xiàn),常用的相關(guān)函數(shù)有高斯型、指數(shù)型、三角型、指數(shù)余弦型、二階自回歸型等[103]。蔣水華對這幾種相關(guān)函數(shù)下的隨機場進行了研究,發(fā)現(xiàn)高斯型生成隨機場連續(xù)性較好、效率較高[104],采用高斯型相關(guān)函數(shù)計算協(xié)方差矩陣的公式為
式中:1 ≤i,j≤n;δk為有界空間域D 的相關(guān)距離。
通過上述步驟,將輸入隨機場離散為了一系列有限個不相關(guān)、零均值、單位方差的隨機變量ξi(ω),如果隨機場H(x,ω)是高斯隨機場,則ξi(ω)形成一組獨立的標準高斯隨機變量,實現(xiàn)對隨機場的不確定性表征,在此基礎(chǔ)上就可以進行不確定性傳播。
賈超等[105]在地下水力學(xué)滲流耦合過程的數(shù)值模擬中,考慮到滲透系數(shù)作為隨機變量的空間變異性,將其不確定性表征為隨機場,并根據(jù)庫區(qū)鉆孔水位觀測資料及庫區(qū)外圍水文地質(zhì)調(diào)查資料確定了隨機場模型參數(shù),對地下洞室涌水量進行了預(yù)測。Gravanis 等[106]建立了表征巖石邊坡穩(wěn)定問題中巖石材料屬性的二維隨機場模型,探討了巖石材料屬性的空間變異性對巖石邊坡失效概率的影響。牛燚煒等[107]在此基礎(chǔ)上提出了三維隨機場的建立方法,并把底面摩擦系數(shù)和粘聚力視為高斯隨機變量,分析了巖石邊坡的三維穩(wěn)定性問題。Feng 等[108]采用均勻隨機場表征了各有限元單元彈性模量的不確定性,研究了簡支梁和層流板的動力學(xué)特性。
上述不確定性表征方法在建模中主要按照不確定性變量存在的數(shù)據(jù)形式及數(shù)量進行不確定性分類和建模。若將不確定性分為隨機和認知兩大類,非概率表征方法則為認知不確定性的表征提供了有效建模手段。非概率表征方法往往需要基于專家信息去建立不確定性表征的數(shù)學(xué)模型,基于不同的數(shù)學(xué)理論基礎(chǔ)形成了如證據(jù)理論、區(qū)間理論、模糊理論以及凸模型等眾多非概率表征方法,呈現(xiàn)出“百花齊放”的局面。
對于許多實際問題,獲得不確定參數(shù)可能的取值范圍要比獲取精確概率分布容易得多。當認知水平有限,只清楚參數(shù)位于哪個區(qū)間,但是不清楚在區(qū)間內(nèi)哪個部分或位置取值的可信度更高時(參數(shù)的真值可能取區(qū)間中的任意一個值,沒有證據(jù)或信息表明區(qū)間內(nèi)的任一值比其他值更有可能),可采用區(qū)間模型對該參數(shù)進行不確定性建模。區(qū)間(Interval)模型一般定義為[109]
在區(qū)間數(shù)學(xué)方法中,不確定參數(shù)被認為是“未知但有界”,每個不確定性參數(shù)都有上限和下限,由一個區(qū)間描述,而不具有概率形式。區(qū)間AI包含了不確定性參數(shù)所有可能的結(jié)果,可以包含參數(shù)的所有不確定性信息,其中區(qū)間中點Ac=(AL+AU)/2 是區(qū)間表達的確定性部分,區(qū)間半徑Ar=(AU-AL)/2 和[-Ar,Ar]構(gòu)成了區(qū)間表達的不確定性部分。區(qū)間的不確定性水平γ由區(qū)間半徑與區(qū)間中點比值確定,即γ=Ar/Ac。當不確定性輸入包含多個參數(shù)時,每個參數(shù)對應(yīng)一個區(qū)間數(shù)AI,各個區(qū)間數(shù)組合形成區(qū)間向量,對應(yīng)了不確定性問題的區(qū)間模型。
將認知不確定性表征為區(qū)間的方式在工程機械、金融經(jīng)濟、環(huán)境科學(xué)等領(lǐng)域都得到了諸多應(yīng)用[110-112]。Wong 等[113]采用一階泰勒展開對損傷結(jié)構(gòu)前后的剛度參數(shù)不確定性進行了區(qū)間表征,開展了不確定性下的結(jié)構(gòu)損傷判定。劉剛等[114]采用區(qū)間數(shù)對風力發(fā)電系統(tǒng)出力的不確定性進行描述與分析,建立了風電注入功率不確定性的配電網(wǎng)三相區(qū)間潮流模擬模型。
基于區(qū)間理論的非概率表征方法只需給出確定的上下邊界,很大程度降低了對原始數(shù)據(jù)的要求[115]。區(qū)間表征包含了不確定性所有可能出現(xiàn)的情況,經(jīng)過區(qū)間分析后得到的輸出響應(yīng)的區(qū)間可能要遠大于實際區(qū)間,存在“區(qū)間擴張”現(xiàn)象[116],失去工程參考價值。
20 世紀90 年代,Williamson 和Downs 在累積分布函數(shù)的基礎(chǔ)上引入了區(qū)間型邊界[117],稱之為概率盒(p-box),也稱p盒。概率盒定義為一組包含不確定性變量所有可能的累積分布函數(shù)曲線的上下邊界或概率包絡(luò),可以表示為
如圖10 所示[118],概率盒同時適用于隨機、認知以及混合不確定性的表征。對于隨機不確定性以及單一區(qū)間認知不確定性的表征很容易理解,當不確定性變量以多個區(qū)間數(shù)據(jù)存在時,文獻[119]提出了“經(jīng)驗概率盒”的概念,定義為給定區(qū)間數(shù)據(jù)集的所有可能的經(jīng)驗分布的集合。由于缺乏對區(qū)間數(shù)據(jù)可信度的分配,經(jīng)驗概率盒認為每個區(qū)間數(shù)據(jù)都是等可能的,因此如果有N個區(qū)間數(shù)據(jù)的話,經(jīng)驗概率盒是2 條具有1/N的恒定垂直步長的遞增函數(shù)形式的階梯曲線所構(gòu)成的不確定區(qū)域。圖11 和圖12 分別展示了文獻[119]針對6 個非重疊區(qū)間和9 個重疊區(qū)間2 種情況下的區(qū)間數(shù)據(jù)集以及相應(yīng)的經(jīng)驗概率盒,可見每個數(shù)據(jù)點處的階梯高度相等,反映了每個區(qū)間均被同等加權(quán)的假設(shè)。
圖10 各種形式下的概率盒[118]Fig.10 p-box in various forms[118]
圖11 非重疊(左)/重疊(右)區(qū)間數(shù)據(jù)集Fig.11 Non-overlapping(left)/overlapping(right)interval datasets
圖12 非重疊(左)/重疊(右)區(qū)間數(shù)據(jù)集的經(jīng)驗概率盒Fig.12 Empirical p-box for non-overlapping(left)/overlapping(right)interval datasets
在某些參數(shù)的概率分布類型已知,但其分布參數(shù)卻在一定范圍波動的情況下,隨機不確定性和認知不確定性耦合在同一個變量中,變量表現(xiàn)出混合不確定性,其數(shù)學(xué)模型為一族概率分布所形成的概率包絡(luò),即給定區(qū)間集上所有可能的概率分布的集合,為典型的概率盒。式(31)和式(32)分別以正態(tài)分布和均勻分布為例,給出了2 個混合不確定性變量x1和x2的數(shù)學(xué)模型。如圖13所示,隨機生成μ以及a和b的80 組值,繪制了變量x1和x2的CDF 函數(shù)曲線族。
圖13 混合不確定性的概率盒表征Fig.13 Characterization p-box-based of mixed uncertainty
概率盒還分為參數(shù)化概率盒和非參數(shù)化概率盒。參數(shù)化概率盒由一族同類型的累積分布函數(shù)組成,例如上述所舉的混合不確定性表征實例就是典型的參數(shù)化概率盒;而非參數(shù)化概率盒由邊界分布包絡(luò)的不同類型CDF 曲線組成,其包絡(luò)的分布函數(shù)的形式任意,并不局限于經(jīng)典的分布函數(shù)類型[120]。Zhu 等[121]將汽車客艙復(fù)合材料的楊氏模量和密度表征為參數(shù)化概率盒,對聲壓振幅響應(yīng)進行了不確定性量化。吳沐宸等[120]針對NACA0012 翼型繞流CFD 模擬的不確定性量化問題,根據(jù)來流和湍流模型系數(shù)的邊界分布及其取值范圍指定了非參數(shù)概率盒變量。
概率盒理論作為一種區(qū)間和概率的混合模型,兼顧了區(qū)間和概率的特性,現(xiàn)有的區(qū)間、概率分布和證據(jù)結(jié)構(gòu)都可以轉(zhuǎn)化為概率盒形式,同時適用于隨機、認知以及混合不確定性的表征,是一種相對較為通用的不確定性表征方法。但概率盒表征無法直接對來自多個渠道或?qū)<业男畔⑦M行融合,證據(jù)理論則提供了解決方案。
證據(jù)理論起源于1967 Dempster 提出的上下概率理論,他的學(xué)生Shafer 對其進行了發(fā)展和完善[122]。證據(jù)理論通過辨識框架(Frame of Discernment,F(xiàn)D)、基本可信度分配(Basic Probability Assignment,BPA)、信任函數(shù)(Belief Function,Bel)和似然函數(shù)(Plausibility Function,Pl)的基本概念構(gòu)成了一個不確定性建模架構(gòu)。
證據(jù)理論下證據(jù)變量是表征認知不確定性的最基本變量,證據(jù)變量需給定變量的區(qū)間描述(通常稱為焦元)和相應(yīng)的BPA(或概率權(quán)值),BPA 往往根據(jù)工程經(jīng)驗或?qū)<翌A(yù)測確定。以Ai和m(Ai)(i=1,2,…,n)分別表示同一個識別框架上的n個焦元及其BPA。例如證據(jù)變量x可以取區(qū)間[0,3]上的任意值,但取值落在不同區(qū)間[0,1]、[1,2]和[2,3]上的概率不同,分別是0.1、0.6 和0.3,一共有3 個焦元,其對應(yīng)的BPA 分別為m(x(1))=0.1,m(x(2))=0.6,m(x(3))=0.3。
基于專家意見、仿真數(shù)據(jù)、測量結(jié)果等手段給出的證據(jù)是一個非常寬泛的概念,并且各條證據(jù)之間相互獨立,因此證據(jù)理論的基本可信度分配相較于概率滿足更弱的公理。根據(jù)證據(jù)的數(shù)學(xué)表現(xiàn)形式,基本可信度分配主要有3 種類型:貝葉斯結(jié)構(gòu)(概率結(jié)構(gòu))、一致性結(jié)構(gòu)(嵌套結(jié)構(gòu))和一般性結(jié)構(gòu),如圖14 所示[123]。在貝葉斯結(jié)構(gòu)中,辨識框架的每個焦元都會被賦予BPA;在一致性結(jié)構(gòu)中,賦予BPA 的焦元之間有著相互包含的關(guān)系;一般性結(jié)構(gòu)是證據(jù)最常見的一種形式,顧名思義,BPA 的分配具有一般性和任意性,焦元之間可能存在獨立、相交、嵌套等多種關(guān)系。形成哪種BPA 結(jié)構(gòu)取決于可用的證據(jù)信息。
圖14 3 種常見的BPA 結(jié)構(gòu)[123]Fig.14 Three common BPA structures[123]
同一個變量的認知不確定性信息可能來自于不同的專家,而不同專家給出的變量區(qū)間描述和相應(yīng)的概率取值往往不同,在證據(jù)理論下認為其為多源信息變量,可以按照Dempster 證據(jù)合成法則進行多源信息融合,轉(zhuǎn)化為以區(qū)間和概率權(quán)值描述的證據(jù)變量[124],從而實現(xiàn)多源信息的證據(jù)表征。
式中:Bi和Cj分別是來自2 條信息源的證據(jù)命題;Ak為合成后的命題;K為沖突系數(shù),表示不同專家給出的證據(jù)間的沖突程度,K越大則沖突程度越大。
當存在多個信息源的證據(jù)時,需要證據(jù)兩兩之間依次融合,對N條證據(jù)重復(fù)進行N-1 次操作即可得到最終的融合結(jié)果。Dempster 證據(jù)合成法則是最經(jīng)典的證據(jù)合成規(guī)則,但其不適用于高沖突的證據(jù),因此眾多學(xué)者又提出了一些改進的證據(jù)合成規(guī)則,最具代表性的是Yager[125]和Inagakill[126]提出的證據(jù)合成公式,它將證據(jù)中的沖突部分和未知部分都重新進行了分配,引入比例系數(shù)來決定分配的權(quán)重。
證據(jù)理論使用信任函數(shù)Bel 和似然函數(shù)Pl 作為不確定性度量的下界和上界。Bel 定義為完全支持命題A成立的所有子集ξ的BPA 加和,Pl 則定義為完全以及部分支持命題A成立的所有子集ξ的BPA 加和。圖15 表示信任函數(shù)、似然函數(shù)、不確定性三者之間的關(guān)系,Bel(A)和Pl(A)2 個測度之間的間隔度量了不確定性。
圖15 證據(jù)理論下的不確定性區(qū)間Fig.15 Uncertainty interval based on evidence theory
類似概率理論中的累積概率分布函數(shù)(CDF),在證據(jù)理論中定義累積信任函數(shù)(Cumulative Belief Function,CBF)和累積似然函數(shù)(Cumulative Plausibility Function,CPF)分別為Bel 和Pl 構(gòu)成的概率邊界的點集,設(shè)不確定性變量x的取值空間為D,有
式中:Θ為不確定性變量x的辨識框架;D為取值空間。
姜潮等[127]在研究汽車側(cè)面碰撞的結(jié)構(gòu)可靠性分析問題時,考慮了某型轎車門梁和B 柱加強板的厚度和材料屈服極限的認知不確定性,通過證據(jù)理論進行表征。類似地,范松等[128]在汽車正面碰撞的輕量化設(shè)計中,給出了保險杠厚度以及外板厚度等幾何認知不確定性的貝葉斯BPA 結(jié)構(gòu),進行了證據(jù)理論下基于有限元仿真的可靠性優(yōu)化。除了可以直接表征認知不確定性,證據(jù)理論也能實現(xiàn)對隨機不確定性的表征,胡盛勇等[129]和Shah 等[35]分別將隨機不確定變量的概率分布進行離散,得到區(qū)間+可信度形式的證據(jù)結(jié)構(gòu),從而在證據(jù)理論下進行隨機和認知不確定性的統(tǒng)一量化,分別實現(xiàn)了某測試系統(tǒng)的穩(wěn)健優(yōu)化設(shè)計和RAE 2822 翼型的氣動特性分析。
CBF 和CPF 分別是不確定性變量x概率分布的下界與上界,這與上一節(jié)中基于概率盒理論的不確定性表征是相通的。文獻[130]和[131]也指出,Dempster-Shafer 結(jié)構(gòu)形成的CBF 和CPF 與概率盒二者等價。FULVIO 提出通過平均離散法或外離散法[132],也可將以概率包絡(luò)表示的概率盒變量轉(zhuǎn)化為證據(jù)結(jié)構(gòu),將概率盒上下邊界的縱向值域[0,1]等離散化為n個子區(qū)間,則相應(yīng)的焦元和BPA 可表示為
基本可信度分配不必滿足概率可加性和單調(diào)性,因此證據(jù)理論滿足比概率理論更弱的公理,使得證據(jù)理論具備直接表達知識或信息缺乏造成的“不確定”和“不知道”的能力。同時,證據(jù)理論中的證據(jù)合成公式可以綜合不同專家或數(shù)據(jù)源的知識或數(shù)據(jù),能夠處理不確定信息、不完備信息、不可靠信息甚至沖突信息,這是證據(jù)理論的顯著優(yōu)勢。但證據(jù)理論要求各條證據(jù)之間相互獨立,有時這不易滿足;并且當變量維數(shù)較高時,通過證據(jù)理論對不確定性進行傳播,焦元上的極值分析計算面臨著嚴重的“維數(shù)災(zāi)難”。
模糊理論[133]由Zadeh 教授首次提出。一個經(jīng)典集合清楚地區(qū)分了集合元素和非集合元素,模糊集可看作經(jīng)典集合的擴展,通過引入隸屬度函數(shù)來表示域內(nèi)元素隸屬于模糊集的程度,將普通集合的特征函數(shù)從{0,1}推廣到閉區(qū)間[0,1],得到了模糊集合的定義為[134]
p(x)的大小反映了元素x對集合X的隸屬程度,p(x)的值越接近1,說明x隸屬于X的程度更高。由上述可知,隸屬度函數(shù)是常規(guī)實數(shù)的一般化,隸屬度函數(shù)不單獨引用一個值,而是引用一組可能的值,其中每個可能的值都有自己的權(quán)重,其范圍為0~1。模糊集合中的每個元素對模糊集合的隸屬程度都需要通過隸屬度函數(shù)來刻畫,因此正確合理地建立隸屬度函數(shù)是表達該模糊集合模糊度和模糊性的關(guān)鍵[135]。常用的隸屬度函數(shù)的類型主要有高斯型、梯形型和三角型等,關(guān)于模糊變量的隸屬度函數(shù)的確定方法可以參考Medasani 和Kim 等的相關(guān)研究[136]。在各種形狀的隸屬度函數(shù)中,三角模糊數(shù)(TFN)最流行,其隸屬度函數(shù)為
式中:a和c分別用于確定三角隸屬度函數(shù)左右邊界;b確定頂峰位置。
如圖16 所示,三角隸屬度函數(shù)的縱軸表示隸屬度函數(shù)p(x)的取值,α∈[0,1]表示α截集水平,通過特定的隸屬度α可以將輸入變量截成一系列水平截集,水平截集定義為
圖16 三角隸屬函數(shù)多水平截集示意Fig.16 Schematic of multi-level cut-sets for triangular membership function
當確定了隸屬度函數(shù)的類型和參數(shù),即完成了基于模糊理論的不確定性表征,然后在[0,1]上生成不同的截集水平,后續(xù)的不確定性傳播則相當于一系列的區(qū)間分析。徐靜等[137]用模糊集概念表征洪水過程模擬中雨量量級的不確定性,運用遺傳算法對時段雨量在時間上進行隨機解集,并通過在各子流域上采用不同的時間解集模式以同時考慮降雨時程分配和空間分布的不確定性。Mohammadi 等[138]深入研究含能源集線器的電-氣聯(lián)合系統(tǒng)優(yōu)化調(diào)度問題,在計及負荷和風電出力的模糊不確定性的基礎(chǔ),采用梯形隸屬度函數(shù)建立了預(yù)測電價的模糊模型。
不同于經(jīng)典集合表達的清晰概念,模糊理論通過隸屬度函數(shù)對模糊現(xiàn)象進行科學(xué)描述,使得類似“年輕”“多數(shù)”這樣的模糊定性問題定量化。隸屬度函數(shù)的確定類似經(jīng)典概率統(tǒng)計里分布類型的假設(shè),雖然目前對隸屬度函數(shù)如何確定有了一些相關(guān)研究,但總體來說,仍然相對依賴主觀而缺少客觀的標準或方法,這也直接影響了基于模糊理論對不確定性表征和傳播的準確性。
20 世紀90 年代初,Ben Haim 和Elishakoff[139]提出了處理不確定性的非概率凸模型方法,將參數(shù)的不確定性表征為一個凸集合,不像概率表征需要其精確的概率分布,凸模型表征通過較少的樣本即可獲得不確定參數(shù)的邊界,因此其在很多復(fù)雜工程問題的不確定性分析中展現(xiàn)出很強的適用性。在現(xiàn)有非概率凸模型不確定性表征中,區(qū)間模型和橢球凸模型的使用最為廣泛。在此基礎(chǔ)上,近年來還出現(xiàn)了平行多面體模型、一般多面體凸集模型和超參數(shù)凸模型等新型的凸集模型[140-143]。
構(gòu)造凸模型時只需要確定不確定性參數(shù)的邊界,而無需考慮內(nèi)部的概率分布,因此在樣本數(shù)量有限情況下的不確定性表征建模優(yōu)勢明顯[144]。上述提到的區(qū)間模型僅通過上下邊界描述單個變量的波動,假定所有的不確定參數(shù)之間相互獨立,其不確定域為超立方體,相關(guān)性的忽略使得整個不確定區(qū)域和問題解區(qū)間變大,導(dǎo)致計算結(jié)果精度下降。橢球凸模型將參數(shù)不確定性表征為多維橢球,通過橢球的大小和形狀描述不確定性的大小以及變量的相關(guān)程度[145],能夠很好地處理各不確定參數(shù)之間相關(guān)的問題。圖17為考慮3 個不確定性參數(shù)的區(qū)間模型和橢球凸模型,可以直觀地看出,區(qū)間模型不考慮不確定參數(shù)的相關(guān)性,參數(shù)之間相互獨立;橢球凸模型考慮參數(shù)的相關(guān)性,并且邊界光滑可導(dǎo);橢球凸模型避免了一些極端的不確定性參數(shù)組合情況的出現(xiàn),比如出現(xiàn)在三維區(qū)間模型角落附近的不確定性參數(shù)組合[146]。
圖17 考慮3 個不確定參數(shù)的區(qū)間模型和橢球凸模型Fig.17 Interval model and ellipsoid convex model considering three uncertain parameters
對任意有界不確定參數(shù)x=[x1,x2,…,xn]T,有,橢球凸模型可表示為[147]
已知xi不確定性邊界的情況下,基于經(jīng)驗通常取為不確定性的默認值或名義值,可用區(qū)間中值替代,ei則為區(qū)間邊界半徑。在已有少量數(shù)據(jù)樣本可用的情況下,還可以采用最小體積橢球法或NATAF 法確定最佳的橢球凸模型參數(shù),關(guān)于該方法的具體原理可參考文獻[145]和[148]。
Zhu 等[148]提出了一種基于坐標系旋轉(zhuǎn)變換的橢球模型構(gòu)造方法,該方法遍歷基于樣本的橢球主軸組合,以此尋找包絡(luò)樣本的最小體積橢球。Jiang 等[145]提出了不確定性多維橢球體的有效建模方法,并建立了非概率凸模型的相關(guān)分析技術(shù)。Bai 等[149]提出了基于非概率可靠性分析的響應(yīng)面法,高效地構(gòu)造了多維橢球體來表征不確定性參數(shù)。Kang 等[150]系統(tǒng)地研究構(gòu)建了在給定一組樣本數(shù)據(jù)的情況下構(gòu)造最小體積橢球凸模型的數(shù)學(xué)公式,很好地表征了參數(shù)認知不確定性,并展示了它在現(xiàn)有的有界不確定結(jié)構(gòu)非概率可靠性分析和優(yōu)化設(shè)計中的應(yīng)用。邱志平等提出了多種能高效求解結(jié)構(gòu)在凸模型不確定域上的響應(yīng)邊界的快速算法,形成了眾多的研究成果[151-153]。
目前多數(shù)文獻研究中的橢球模型仍然是基于經(jīng)驗和假設(shè),但對于基于試驗數(shù)據(jù)樣本建立橢球模型的研究也逐漸為學(xué)術(shù)界所關(guān)注的重點,使得基于橢球凸模型的參數(shù)認知不確定性表征理論也日趨完備。
為了表征和量化工程實踐中廣泛存在的隨機和認知不確定性,國內(nèi)外學(xué)者進行了很多嘗試和研究,發(fā)展了上述一些相對比較成熟的理論和方法。清華大學(xué)劉寶碇教授近20 年來開創(chuàng)了一種新的研究不確定現(xiàn)象的公理化數(shù)學(xué)分支,稱為不確定理論(Uncertainty Theory),并致力于不確定理論的研究、應(yīng)用和推廣。2007 年德國Springer 出版的《Uncertainty Theory》一書標志著這一理論的正式提出[154],劉寶碇教授認為:“事件發(fā)生的頻率已知稱為隨機,否則稱為不確定”,例如擲硬幣正面朝上的頻率已知,因此是隨機的;墜落的蛋糕奶油哪一面著地的頻率未知,因此是不確定的。又或,當沒有足夠樣本來估計概率分布時,需要依靠專家的主觀信度去評估事件發(fā)生的可能性,不確定理論中提出的不確定測度(即信度)成為了解決工具。因此類似于研究隨機現(xiàn)象的概率理論,書中提到不確定理論是研究不確定現(xiàn)象的公理化數(shù)學(xué)系統(tǒng)。
劉寶碇教授發(fā)表的多項關(guān)于不確定理論的研究成果中,討論了“不確定理論是什么”“為什么要用不確定理論而不是概率理論”“隨機性和模糊性以及不確定之間的關(guān)系”等關(guān)鍵問題,給出了不確定理論關(guān)于規(guī)范性、單調(diào)性、對偶性、次可加性的4 條基本公理,定義了不確定空間和變量、不確定測度和分布以及不確定的數(shù)學(xué)特征、運算法則、基本性質(zhì)等等,并派生出了不確定統(tǒng)計、不確定規(guī)劃、不確定過程、不確定集、不確定微分方程、不確定金融等數(shù)學(xué)分支和研究領(lǐng)域。如圖18 所示[155],劉寶碇教授認為,不確定理論是建立在概率論、可信性理論、信賴性理論3 個公理化體系基礎(chǔ)上的數(shù)學(xué)理論,廣義上還包括圖中所列的模糊隨機理論、隨機模糊理論等,即機會理論[156]。
圖18 不確定理論樹形圖[155]Fig.18 Tree chart of uncertainty theory[155]
《Uncertainty Theory》在定義不確定測度(即信度)時提到:不確定測度取決于個人對事件的認識,隨著認識狀態(tài)的變化,不確定測度也會發(fā)生變化,因此不確定測度是不確定理論能夠表征認知不確定性的關(guān)鍵。為了在實踐中應(yīng)用不確定理論,首先根據(jù)不確定測度必須生成不確定分布函數(shù)。不確定變量ξ的不確定分布Φ定義為實數(shù)集上的函數(shù),對于任意的實數(shù)x:
式中:M為件ξ≤x發(fā)生的不確定測度。
有了不確定分布的概念,即可通過不確定理論對不確定性進行表征。不確定理論定義了3 種不確定變量及其分布,分別為線性不確定變量L(a,b)、“之”字型不確定變量Z(a,b,c)、正態(tài)不確定變量N(e,σ),對應(yīng)的不確定分布函數(shù)分別見式(44)~式(46)。
在不確定理論中,不確定變量所滿足的不確定分布主要由經(jīng)驗和已有的數(shù)據(jù)規(guī)律進行選擇,體現(xiàn)了由于認知能力有限對客觀規(guī)律認識不足所造成的認知不確定性。對不確定分布參數(shù)來說,除了可通過少量試驗數(shù)據(jù)進行不確定分布參數(shù)a/b/c/e/σ的估計以外(例如不確定極大似然估計方法[157],將不確定分布函數(shù)導(dǎo)數(shù)取?。?,還可以通過專家和經(jīng)驗進行分布參數(shù)的主觀確定,給出事件發(fā)生的信度。因此,不同的不確定分布中的未知參數(shù)可通過不確定估計、經(jīng)驗確定和專家指定來獲得,從而實現(xiàn)不確定性表征[158]。
楊晗等[158]將不確定理論應(yīng)用于某牌號Cr-Mo 鋼蠕變持久壽命的評估,根據(jù)工況經(jīng)驗、手冊數(shù)據(jù)擬合、不確定極大似然估計分別表征了所考慮的4 個蠕變參數(shù)的正態(tài)不確定分布模型。王瑛等[159]在復(fù)雜裝備系統(tǒng)風險傳遞的圖形評審技術(shù)研究中,基于機會理論對某型戰(zhàn)機眼鏡蛇機動時飛行員處置不當?shù)牟淮_定性進行了表征,根據(jù)部隊專家針對飛行員處置不當對飛行安全影響的評價結(jié)果,將該不確定性表征為“之”字型不確定分布,通過專家信度確定了分布參數(shù)a/b/c。整體來看,不確定理論目前仍處于發(fā)展完善之中,研究成果以及工程上的應(yīng)用主要集中在國內(nèi)的一些研究人員,較于其它的非概率表征方法而言,不確定理論的工程實踐應(yīng)用仍處于探索階段。
完成輸入量的不確定性表征之后就可進行不確定性傳播。對于概率表征方法,由于被表征為概率分布或若干已知分布的加權(quán)和,根據(jù)該概率分布、加權(quán)和分布可非常方便地進行抽樣,因此可直接采用基于概率理論的蒙特卡洛仿真或混沌多項式等方法進行不確定性傳播[23-24]。
對于區(qū)間變量,可單獨采用區(qū)間、證據(jù)、模糊集等諸多認知不確定性處理方法進行不確定性建模和傳播,也可采用概率表征方法。采用非概率表征,則要根據(jù)選擇的方法,基于區(qū)間分析、概率盒、證據(jù)理論、模糊集、凸模型等各自的理論來解決認知不確定性傳播的問題。若同時存在隨機和認知混合不確定性,可采用外層概率理論表征隨機不確定性、內(nèi)層非概率方法表征認知不確定性的雙層嵌套的方式傳播混合不確定性,也可以將不確定性處理到同一個理論框架下進行傳播[88]。為了避免雙層循環(huán)計算量大的問題,文獻[41]提出了一種可同時處理隨機、稀疏和區(qū)間變量的數(shù)據(jù)驅(qū)動混沌多項式方法。Chen 和Qiu 針對隨機和區(qū)間變量,采用類似的思路構(gòu)建混沌多項式模型,對復(fù)合材料結(jié)構(gòu)進行不確定性分析[160]。Shah 等[35]提出了一種結(jié)合證據(jù)理論和混沌多項式展開的混合不確定性傳播方法,研究了攻角、馬赫數(shù)、SA 湍流模型系數(shù)不確定性對翼型RAE 2822 氣動特性的影響。屈小章等[161]基于概率理論和區(qū)間分析理論對混合不確定性系統(tǒng)進行可靠性分析,完成了葉片設(shè)計參數(shù)和葉輪轉(zhuǎn)速對風機氣動性能的影響評估。梁霄等[162]結(jié)合了概率盒理論和非嵌入混沌多項式方法,分別處理Sod 問題中多方指數(shù)的認知不確定性和炸藥密度的隨機不確定性,并將其應(yīng)用于流體力學(xué)方程組迎風格式數(shù)值求解可信度評價的混合不確定性傳播。
本文面向基于數(shù)值模擬的工程設(shè)計,綜述了參數(shù)不確定性表征方法,概述了不確定性表征的研究目的和關(guān)鍵問題。根據(jù)不確定性因素的表現(xiàn)形式和可用信息,按照概率表征和非概率表征兩大類總結(jié)了目前主流的不確定性表征方法,介紹了各種不確定性表征方法的基本原理、適用范圍及其在工程實踐中的研究、發(fā)展和應(yīng)用現(xiàn)狀。
1)不確定性表征的統(tǒng)一和共識
不確定性表征的概率方法均以經(jīng)典概率統(tǒng)計為理論基礎(chǔ),將不確定性變量建模為概率分布,后續(xù)進行不確定性傳播時可避免形成非概率表征下的嵌套雙重循環(huán)而導(dǎo)致的計算量大的問題,同時可非常方便地集成于現(xiàn)有的概率不確定性設(shè)計框架,這是其相比于非概率方法的最大優(yōu)勢。但是,當不確定性變量信息非常少時,純概率表征方法顯然會導(dǎo)致較大誤差,包含的認知不確定性越大,就越不能用精確的概率分布來描述該量。此時,基于貝葉斯定理的概率表征方法提供了一條有效途徑。非概率表征方法在認知不確定性建模上更加合理,尤其當變量信息非常有限時。工程中尤其是航空航天領(lǐng)域由于裝備復(fù)雜昂貴、工作環(huán)境復(fù)雜,往往數(shù)據(jù)量非常少、專家信息也非常有限,小樣本下的不確定性表征是長期以來需要攻克的難題。為保證產(chǎn)品性能足夠可靠,往往指定不確定變量的上下界,因此區(qū)間理論特別適合工程不確定性表征和傳播,但后續(xù)區(qū)間擴張問題比較普遍。各種非概率表征方法基于不同的數(shù)學(xué)理論,都有其各自優(yōu)勢,難以評價其在認知不確定性表征上的好壞。小樣本下,概率和非概率表征方法的合理性以及何種情況下應(yīng)該用何類、何種方法,尚無廣泛認可的評判準則,應(yīng)該用概率還是非概率表征尚未達成共識。
2)稀疏數(shù)據(jù)的數(shù)據(jù)增強
本文綜述的不確定性表征方法皆需根據(jù)不確定性變量的數(shù)據(jù)或?qū)<倚畔ζ溥M行建模。但數(shù)據(jù)缺乏導(dǎo)致的認知不確定性廣泛存在,實際中由于成本限制不可能任意增加物理觀測數(shù)據(jù),數(shù)據(jù)增強技術(shù)為此提供了一條可借鑒的思路,利用生成對抗網(wǎng)絡(luò)等深度學(xué)習(xí)技術(shù)或仿真手段來生成不確定性變量的偽數(shù)據(jù),從而提高數(shù)據(jù)量,最終實現(xiàn)較為精確的不確定性概率表征。但是,這類偽數(shù)據(jù)的可信度如何評價,以及如何有效考慮偽數(shù)據(jù)的可信度對不確定性表征的影響,是面臨的首要難題。
3)認知不確定性的降低
對認知不確定性進行表征和量化的目的是為了降低甚至消除它。很多認知不確定性變量,其并無實際物理意義,比如CFD 數(shù)值模擬的湍流模型系數(shù),無法對其進行觀測,僅能根據(jù)專家經(jīng)驗對其進行不確定性表征,復(fù)雜流動問題往往誤差很大。此時,可結(jié)合貝葉斯推理等統(tǒng)計推斷[163]或反向不確定性傳播方法[164],基于輸出的流場速度或壓力觀測數(shù)據(jù),對湍流模型系數(shù)的不確定性表征模型進行修正,逐步提高參數(shù)不確定性表征的合理性,降低認知不確定性,進而更加有效地評估系統(tǒng)輸出的不確定性以供設(shè)計決策。開發(fā)高效的反向不確定性傳播方法,尤其是針對高維、強非線性、多不確定性輸入且具有不同形式表征的情況,尤為重要。
4)工程基準數(shù)據(jù)庫構(gòu)建
目前不確定性表征理論和方法研究較為豐富,但多從數(shù)理統(tǒng)計領(lǐng)域出發(fā),皆需根據(jù)不確定性變量的數(shù)據(jù)或?qū)<倚畔ζ溥M行建模,基本都應(yīng)用于缺乏物理背景的數(shù)學(xué)問題,距離真正應(yīng)用于工程還存在很大差距,學(xué)術(shù)和工業(yè)界研究較為脫節(jié)。在二者的合作下,可以結(jié)合工程問題和專家經(jīng)驗建立若干類型(結(jié)構(gòu)、氣動、熱等)的不確定性表征基準算例,隨著產(chǎn)品生命周期的推進逐步更新不確定性變量的數(shù)據(jù)信息,以供學(xué)術(shù)界發(fā)展和完善新理論和新方法。比如,美國國家跨聲速設(shè)施(National Transonic Facility,NTF)建立的不確定性模型,旨在研究氣動力/力矩和來流特性等的不確定性[165]。工程基準算例庫的構(gòu)建,可極大促進不確定性表征以及后續(xù)傳播理論和方法的研究發(fā)展,更容易在新舊不確定性表征方法之間達成共識。