鐘 麟,佟明安,張 健,樊慶強
(1.西京學(xué)院理學(xué)院,西安 710123;2.西北工業(yè)大學(xué),西安 710072)
由于飛機型號、老化程度以及工作環(huán)境的不同,大批飛機的維護是一項復(fù)雜的系統(tǒng)工程[1]。飛機的維護活動是費時的,維護資源也是受限的。通常情況下,為了確保飛機的安全和高可用性,需要合理安排維護活動。文獻[2]利用預(yù)測信息對維護計劃進行優(yōu)化。文獻[3-4]在有限資源條件下利用遺傳算法處理民用飛機的維護問題。文獻[5]利用增強學(xué)習(xí)求解飛機維護排程問題。不過它們都沒有涉及實際維護工作中的不確定性以及多個目標(biāo)優(yōu)化情況。文獻[6]用模擬退火算法和蟻群算法求解飛機維護排程問題,但效率和精度都不高。針對這個問題,本文將多目標(biāo)模擬預(yù)算最優(yōu)分配算法和偏好規(guī)劃引入到飛機維護研究中。
制定飛機的維護計劃,就是排程問題。在排程問題中,根據(jù)飛機的狀態(tài)分別安排一些飛機執(zhí)行飛行任務(wù)、日常維護或修理。在排程過程中,每架飛機都賦予一個優(yōu)先權(quán),優(yōu)先權(quán)可以根據(jù)剩余的飛行小時數(shù)和距離下一次維護行動的時間計算獲得,而賦予最高優(yōu)先權(quán)的飛機將承擔(dān)飛行任務(wù)。如果飛機飛行小時數(shù)滿足如下兩個條件之一,就需要進行日常維護:1)飛機的飛行小時數(shù)達到維護區(qū)間的上限;2)飛機的飛行小時數(shù)達到維護區(qū)間的下限,維護規(guī)定開始時間到達,所需維護資源夠用。另外,如果飛機在執(zhí)行任務(wù)中損傷,則立即進行維修。假定有3種不同類型的維護、維修的設(shè)施,根據(jù)維護或維修需求不同,將飛機送往不同設(shè)施進行排隊,整個隊列順序遵從先進先出的模式。維護時機、維護的持續(xù)時間以及任務(wù)的持續(xù)時間概率分布可以從歷史數(shù)據(jù)中獲得。
圖1 基本思路的示意圖
本文所提出方法的基本思路如圖1所示。整個模型分為優(yōu)化階段和決策階段。在優(yōu)化階段中,決策者確定問題的仿真參數(shù),并形成輸入提供給隨機模擬模型。隨機模擬模型主要作用是產(chǎn)生候選解的目標(biāo)函數(shù)樣本,并把它作為輸出提供給偏好多目標(biāo)模擬預(yù)算最優(yōu)分配模型。偏好多目標(biāo)模擬預(yù)算最優(yōu)分配模型根據(jù)決策者提供的偏好信息和目標(biāo)函數(shù)樣本,計算出模擬預(yù)算,并將其傳輸給隨機模擬模型,同時每一次操作后都要將候選解傳輸給隨機模擬模型,用于判斷是否為可行解。偏好多目標(biāo)最優(yōu)模擬預(yù)算分配算法最終目標(biāo)是獲得成對非支配解,并將其作為偏好規(guī)劃模型的輸入用于決策。在決策階段中,偏好由決策者提供給偏好規(guī)劃模型,偏好規(guī)劃利用偏好信息和成對非支配集確定偏好成對非支配解,并將其作為輸出提供給決策者選擇。模型中偏好不確定性和目標(biāo)函數(shù)值用區(qū)間分析方法進行建模。
在大機群作戰(zhàn)飛機的維護排程問題中,決策變量、性能指標(biāo)和可行區(qū)域表示如下:
決策變量xi,j表示飛機i第j項維護活動的開始時間,則M架飛機的維護安排可以用X=(x1,1,…,x1,n1,…,xM,1,…,xM,nM)表示,這里 ni是維護計劃中飛機i所能安排最大維護行動數(shù)目。飛機的平均可用度和計劃維護行動與實際維護行動時間的平均偏差作為評價維護計劃優(yōu)劣兩個指標(biāo),分別用YA(X,ω)和YD(X,ω)表示,其中ω表示系統(tǒng)隨機因素。
在T天內(nèi)M架飛機的平均可用度可以用下面的公式計算:
在定義 YD(X,ω)時,假設(shè) B(X,ω)表示在規(guī)劃周期內(nèi)飛機i實際開始維護活動j所對應(yīng)的指數(shù)(i,j)可行集合,為飛機i計劃開始維護活動j的時間,則為不可行集合。則YD(X,ω)可以由下面的公式計算:
其中,nk為k架飛機在T天內(nèi)所需要維護的次數(shù),公式的第1項表示計劃維護時間與實際維護時間的偏差,公式第2項是未在可行時間內(nèi)實施維護活動情況下加入的懲罰項,C為決策者設(shè)定的時間常量。
飛機的維護排程問題為
可行排程受限于3個約束集合:
式(4)的第1個約束表示維護時間應(yīng)該為正整數(shù),第2個約束表示維護行動按特定順序進行,第3個約束表示維護決策者因?qū)嶋H的需要,希望在特定時間窗(time window)安排某些行動,比如為了在特定的某段時間內(nèi)需要保證飛機可用,因此,上界ui,j和下界li,j也要考慮到模型中。
利用隨機仿真的方法可以容易獲得各方案的期望效用,常規(guī)方法是將其轉(zhuǎn)化為排序和選擇問題,采用模擬預(yù)算最優(yōu)分配算法確定絕對非支配的方案[7]。為了提高效率和精度,在本文中所涉及的模型中,在優(yōu)化階段就引入不完全偏好信息,改進多目標(biāo)模擬預(yù)算最優(yōu)分配算法,提出了偏好多目標(biāo)模擬預(yù)算最優(yōu)分配算法。
假定排序和選擇問題的最優(yōu)方案或包含最優(yōu)方案的子集可以通過若干個相互沖突的期望指標(biāo)確定,即
發(fā)展部以與呈示部相同的主題材料展開。進入C大調(diào),然后是沿著五度循環(huán)的一系列轉(zhuǎn)調(diào):F大調(diào)(第116小節(jié))、降B大調(diào)(第124小節(jié))、降E大調(diào)(第126小節(jié))、降A(chǔ)大調(diào)(第128小節(jié))。到達降A(chǔ)大調(diào)之后,通過左手的還原E音轉(zhuǎn)入f小調(diào),而這個和弦正是樂章開頭的調(diào)式音階的Ⅱ級,它堅持不懈地重復(fù)了七個小節(jié)之后,水到渠成地進入再現(xiàn)部。
其中,ul為第l個單屬性效用函數(shù),wl為權(quán)重。在這種情況下,成對支配的定義如下:
假設(shè)方案i在可行權(quán)重集合W極值點wm(m∈{1,…,M})上的期望效用 Uim可表示為:
則R&S問題可以表示為:
定理1 假定方案的效用可以根據(jù)式(6)獲得,可行權(quán)重通過線性等式和不等式定義。如果方案i是問題式(7)的Pareto非支配方案,則方案i也是成對非支配方案。
證明:如果方案i是問題式(7)的Pareto非支配解,則不存在方案j滿足
則這使下面公式成立
也就是方案i是成對非支配方案。
方差計算公式為:
下面給出偏好多目標(biāo)模擬預(yù)算最優(yōu)分配具體算法:
1)確定每一個單屬性函數(shù) ui,i=1,…,n,確定權(quán)重w的可行區(qū)域以及它的極值點{w1,…,wn}(計算方法見文獻[6]);確定計算資源T,也就是可行仿真次數(shù);確定每一次迭代增加最大仿真總量Δ,單個方案一次迭代所分配最大仿真次數(shù)δ,每一方案最初分配的仿真次數(shù)m0,迭代計數(shù)j→0。用表示第j次迭代后k方案實施仿真的總次數(shù),每個方案實施 m0次仿真,即,…,n,用 ak表示分配給第k個方案的計算預(yù)算;
5)對于每一方案k判斷是否滿足成對非支配方案的條件,選擇出成對非支配方案組成成對非支配方案集合。
在優(yōu)化階段往往獲得多個成對非支配解。在實際應(yīng)用中,決策者希望解越少越好,最簡單的方式是將各個目標(biāo)函數(shù)進行加權(quán)求和,然后對此進行單目標(biāo)優(yōu)化??墒窃趹?yīng)用中,經(jīng)常只有少量偏好信息。針對這種情況,本文在決策階段采用偏好規(guī)劃方法,優(yōu)化階段獲得的非成對支配解的目標(biāo)函數(shù)和偏好的不確定性用區(qū)間形式表示,運用決策準(zhǔn)則獲得最優(yōu)方案,具體算法見文獻[8]。
假設(shè)有18架同型號的飛機,可行維護窗口為[40,60](飛行小時),飛行任務(wù)間隔時間服從Expo(0.8)的指數(shù)分布,飛行任務(wù)周期服從 Norm(0.8,0.2)的正態(tài)分布,維護周期服從Gamma(2.5,40)的伽馬分布,故障間隔時間服從Expo(12)的指數(shù)分布,故障修復(fù)時間服從Gamma(2,4.5)的伽馬分布,維護容量為3架飛機,維護期望周期為2.5 h。系統(tǒng)采樣次數(shù)為L=50,成對非支配集合最大規(guī)模N=20。假定決策者認(rèn)為日期偏差不如飛機可用度重要,即w1≥w2,而且權(quán)重的下界不低于1/3n=1/6(n為目標(biāo)的數(shù)量)。
圖2 正確選擇的概率與模擬預(yù)算關(guān)系
算法的性能可以通過正確選擇非支配組合或成對非支配組合的概率來評估,而非支配組合和成對非支配排程組合通過大數(shù)量的仿真獲得。圖2描述了多目標(biāo)模擬預(yù)算最優(yōu)分配算法、偏好多目標(biāo)模擬預(yù)算最優(yōu)分配算法以及模擬預(yù)算平均分配算法的正確選擇概率與仿真預(yù)算的關(guān)系。從圖2中可以看出,偏好多目標(biāo)模擬預(yù)算最優(yōu)分配算法在大多數(shù)情況下優(yōu)于多目標(biāo)模擬預(yù)算最優(yōu)分配算法,也優(yōu)于模擬預(yù)算平均分配算法。如果在多目標(biāo)模擬預(yù)算最優(yōu)分配算法中直接使用成對支配的概念,從圖2可以看出正確選擇的概率隨著仿真資源增加,仍然保持在低位,性能不理想。圖3描述了偏好多目標(biāo)模擬預(yù)算最優(yōu)分配算法分配給每一組合的仿真次數(shù),整個模型共有124個可行組合解,其中有8個成對非支配解(序號分別是 17,34,55,59,61,97,101,119)。從圖3中可以看出最大仿真次數(shù)分配給組合34,而一些成對非支配組合分配的數(shù)量非常少,這與模型的不確定性以及算法為了最大化正確選擇的概率有關(guān)。偏好多目標(biāo)模擬預(yù)算最優(yōu)分配算法獲得成對非支配組合是8個,而多目標(biāo)模擬預(yù)算最優(yōu)分配算法獲得非支配組合是18個。在相同計算資源情況下,采用本文提出方法用于決策的組合數(shù)目減少了一半,如果組合數(shù)量很大的情況下,本文提出的方法優(yōu)勢更加明顯。
圖3 分配給每一組合仿真次數(shù)的平均值
圖4 多目標(biāo)決策結(jié)果
多目標(biāo)決策仿真結(jié)果見圖4。圖4描述了8個成對非支配解,兩個目標(biāo)的平均值的取值范圍分別為,。如果單獨一個目標(biāo)進行優(yōu)化,可用度可以達到0.823 9,而日期偏差可以達到3.43 h。假設(shè)決策者認(rèn)為飛機可用度比日期偏差更重要,同時權(quán)重的下限不低于1/3n=1/6(n為目標(biāo)的數(shù)量)。從圖4可以看出,采用樂觀準(zhǔn)則和中間值準(zhǔn)則,決策結(jié)果選擇第2個組合,采用悲觀準(zhǔn)則,則選擇第3個組合,實際應(yīng)用則根據(jù)決策者的偏好決定。分別要求5個不同的維護決策者手工制定維護計劃,它們總指標(biāo)分別為[0.458,0.571],[0.482,0.554],[0.313,0.507],[0.381,0.538],[0.349,0.494],都不如本文所制定的計劃。
本文提出的模型是用于解決多目標(biāo)排程問題。模型分為優(yōu)化階段和決策階段。在優(yōu)化階段,引入決策者的偏好信息,采用偏好多目標(biāo)模擬預(yù)算最優(yōu)分配算法產(chǎn)生成對非支配解,決策階段采用多屬性決策模型和偏好規(guī)劃模型從成對非支配解中確定偏好非支配解。仿真結(jié)果說明了該方法的有效性。