陸寧云 陳 闖 姜 斌 邢 尹
隨著信息技術(shù)和自動化技術(shù)的快速發(fā)展,如飛行器、高速列車、核電站、智能電網(wǎng)、流程工業(yè)設(shè)備等現(xiàn)代工程系統(tǒng)的集成度和復(fù)雜度越來越高,系統(tǒng)的安全運營和維護保障問題日益突出[1?4].對于可修復(fù)的復(fù)雜工程系統(tǒng),及時恰當?shù)脑O(shè)備維護是確保系統(tǒng)安全性、可靠性、可用性的重要手段之一.
系統(tǒng)維護策略已經(jīng)歷修復(fù)性維護、定時維護、視情維護等多種維護策略[5?7].修復(fù)性維護(Corrective maintenance,CM),又稱事后維護(Breakdown maintenance,BM),是在故障發(fā)生后進行系統(tǒng)修復(fù)的維護方式.它以系統(tǒng)是否完好或是否能用為依據(jù),故障后通過維修或更換手段恢復(fù)其原始狀態(tài),屬于典型的非計劃性維護[8].顯然,這種維護策略的停機時間損失高,安全性差,僅適用于對安全性、可靠性要求不高的系統(tǒng).定時維護(Time-based maintenance,TBM),也稱計劃維護(Scheduled maintenance,SM),它根據(jù)生產(chǎn)計劃和經(jīng)驗,按規(guī)定的時間間隔進行停機檢查、解體、更換零部件,以期預(yù)防設(shè)備損壞、繼發(fā)性毀壞及生產(chǎn)損失[9].這種維護方式是現(xiàn)階段被普遍采用的一種維護策略.按照時間間隔的長短,維護策略一般包括大修、中修和小修等具體操作.然而,為了確保系統(tǒng)安全可靠運行,計劃維護的策略制定往往較為保守,從而造成過度維護,導(dǎo)致其經(jīng)濟性較差.視情維護(Condition-based maintenance,CBM) 是以系統(tǒng)實際運行狀態(tài)為依據(jù)的維護策略,通過對主要的(或有需要的)部位進行定期(或連續(xù))的狀態(tài)監(jiān)測,當有證據(jù)表明系統(tǒng)需要進行維護時才實施維護活動[10].
CBM 是當前頗受關(guān)注并已經(jīng)逐漸走向工程應(yīng)用的維護策略,它能夠有效減少不必要的維護行動,其經(jīng)濟性和安全性好于修復(fù)性維護策略和定時維護策略.基于信息的決策支持技術(shù)是CBM 維護策略的核心.基于隨機退化模型的狀態(tài)監(jiān)控和健康評估是CBM 中常用的決策支持技術(shù).隨機退化模型又分為連續(xù)型模型和離散型模型.如果利用有限狀態(tài)來表征系統(tǒng)的實際運行狀態(tài),譬如,將系統(tǒng)運行狀態(tài)劃分為健康、退化、失效三種狀態(tài),則可實現(xiàn)系統(tǒng)退化過程的離散型建模.若系統(tǒng)狀態(tài)具有連續(xù)變化特性,則通常用連續(xù)的分布函數(shù)對系統(tǒng)運行退化過程進行建模,進而得到連續(xù)型退化模型.工程系統(tǒng)中應(yīng)用CBM 維護策略時,通過采集系統(tǒng)當前狀態(tài)信息,由退化模型得到系統(tǒng)的退化程度(或健康狀態(tài)),并根據(jù)該信息進行維護決策.
近年來,隨著物聯(lián)網(wǎng)技術(shù)、信息技術(shù)和人工智能的快速發(fā)展,一種更新穎的CBM 策略--預(yù)測性維護(Predictive maintenance,PdM)逐漸成為領(lǐng)域研究熱點[11?14].PdM 最大的價值在于,它利用系統(tǒng)剩余使用壽命(Remaining useful life,RUL)的預(yù)測信息,在維護機會窗口內(nèi)選擇成本最低的維護策略和生產(chǎn)調(diào)度計劃,達到降低成本、提高效率、最大化生產(chǎn)利潤的目的.和CBM 相比,PdM 更關(guān)注于對系統(tǒng)未來狀態(tài)的預(yù)測和利用,其關(guān)鍵在于如何處理與系統(tǒng)健康狀態(tài)相關(guān)的各類大數(shù)據(jù)的知識挖掘以及如何降低信息不確定性對預(yù)測模型的影響.數(shù)據(jù)驅(qū)動的預(yù)測模型是PdM 決策的核心.其中,機器學習(Machine learning,ML)和深度學習(Deep learning,DL)是近年來最受關(guān)注的預(yù)測建模技術(shù),它們不需要系統(tǒng)退化原理性知識,可通過系統(tǒng)實時收集的相關(guān)監(jiān)測數(shù)據(jù)來估計系統(tǒng)健康狀態(tài)或剩余壽命,具有方法通用性好、實施成本低等優(yōu)點.
圖1 概要描述了系統(tǒng)維護決策系統(tǒng)中從實時數(shù)據(jù)獲取到最終維護活動安排的全過程,從中可以看出CBM 向PdM 轉(zhuǎn)變的主要原因在于決策支持技術(shù)的進步.CBM 依賴于狀態(tài)監(jiān)測數(shù)據(jù)的使用,以期建立能夠精確描述系統(tǒng)性能退化的退化過程模型;而PdM 則利用數(shù)據(jù)驅(qū)動的學習理論處理與系統(tǒng)健康狀態(tài)相關(guān)的各類大數(shù)據(jù),準確評估與預(yù)測未來可能發(fā)生的失效概率以及設(shè)備的剩余使用壽命.
圖1 系統(tǒng)維護決策的全過程Fig.1 Overall process of system maintenance decision-making
本文內(nèi)容的組織結(jié)構(gòu)如下:首先,簡要回顧了系統(tǒng)維護策略的發(fā)展歷程;然后,根據(jù)決策支持技術(shù)的不同,重點介紹了基于隨機退化模型的CBM策略和基于數(shù)據(jù)驅(qū)動的PdM 策略,對每類技術(shù)的發(fā)展分支與研究現(xiàn)狀進行了疏理、分析和總結(jié);最后,探討了當前復(fù)雜系統(tǒng)維護策略面臨的挑戰(zhàn)性問題和可能的未來研究方向.
系統(tǒng)在實際運行過程中由于受到內(nèi)部因素(如磨損、疲勞等)與外部環(huán)境(如振動、沖擊等)的綜合影響,系統(tǒng)健康狀態(tài)不可避免地逐漸衰退,學術(shù)界通常將這類衰退現(xiàn)象稱為退化過程[15?18].退化現(xiàn)象,可視為系統(tǒng)設(shè)備對系統(tǒng)性能的損害,隨著時間推移而累積,當累積損害達到一定的故障閾值時,將大概率導(dǎo)致系統(tǒng)級故障[19].圖2 給出了退化失效過程與退化閾值的示意圖.退化閾值失效機制在退化和系統(tǒng)失效之間提供了密切的聯(lián)系.通過對失效機理和數(shù)據(jù)的分析,可以確定失效時間分布及其參數(shù).因此,如果能夠為退化過程軌跡找到一個合適的退化模型,那么該模型就可以用于后續(xù)的壽命預(yù)測和維護決策.基于隨機退化模型的CBM 是指利用數(shù)理統(tǒng)計以及隨機過程的相關(guān)知識,建立隨機過程模型來描述系統(tǒng)性能退化軌跡,并通過收集和評估系統(tǒng)實時狀態(tài)信息進行維護決策[20].該策略中,只要能采集到當前可用的相關(guān)設(shè)備健康狀態(tài)數(shù)據(jù),就進行退化建模,并實時評估系統(tǒng)的運行狀態(tài).通過與預(yù)設(shè)的失效閾值進行比較,如果系統(tǒng)退化指標達到或超過閾值,將要求對系統(tǒng)進行及時維護;否則,認為系統(tǒng)狀態(tài)良好,仍可繼續(xù)使用,無需進行系統(tǒng)維護.
圖2 退化過程及失效閾值失效示意圖Fig.2 Illustration of a degradation process with failure threshold
圖3 基于隨機退化模型的CBM 策略的一般步驟Fig.3 General steps of CBM strategy based on stochastic degradation model
由此可見,基于隨機退化模型的CBM 策略的主要包含狀態(tài)監(jiān)測、退化建模、維護活動安排和維護策略優(yōu)化4 個步驟,如圖3 所示.前兩步旨在基于狀態(tài)監(jiān)測結(jié)果建立合適的隨機退化模型,其中,隨機退化模型又分為連續(xù)型模型和離散型模型;后兩步是應(yīng)用系統(tǒng)退化模型進行系統(tǒng)維護和決策優(yōu)化.決策優(yōu)化過程需要選擇合適的維護策略代價函數(shù).如果系統(tǒng)對安全性和任務(wù)完成度有較高的要求,通常將平均可用度作為代價函數(shù)[21];而對于可靠性高、任務(wù)失敗后風險小的系統(tǒng),一般將平均維護費用作為代價函數(shù)[22].最優(yōu)維護決策就是在此基礎(chǔ)上研究費用最小或可用度最大的優(yōu)化問題.根據(jù)現(xiàn)有CBM 相關(guān)文獻,不同維護策略的主要區(qū)別在于隨機退化模型,而決策優(yōu)化過程基本相似,其主要差異在于代價函數(shù)和優(yōu)化方法的不同.
當無法獲得系統(tǒng)退化狀態(tài)的精確測量值時,通常采用離散狀態(tài)建模手段,如馬爾科夫(Markov)過程模型.離散狀態(tài)表述具有天然的合理性,因為從工程實踐的角度來看,將系統(tǒng)退化狀態(tài)劃分為有限幾個退化等級是可行且有效的技術(shù)手段[23].馬爾科夫過程描述的是空間狀態(tài)經(jīng)過一個狀態(tài)到另一個狀態(tài)轉(zhuǎn)換的隨機過程.設(shè){X(t),t ∈T}是取值于狀態(tài)空間E中的隨機過程,如果對任意的正整數(shù)n,t1 則稱過程{X(t),t ∈T}為馬爾科夫過程.馬爾科夫模型有許多變體,如半馬爾科夫模型和隱馬爾科夫模型.其中,半馬爾科夫模型具有更為寬松的建模條件;而當系統(tǒng)的可用信息僅能部分觀測時,可使用隱馬爾科夫模型.關(guān)于馬爾科夫模型的退化建模已有大量文獻報道[24?30],本文不再贅述.下文主要介紹基于馬爾科夫模型及其變體模型的CBM 策略. 在周期檢測條件下,文獻[31]研究了一類可控環(huán)境下服從馬爾科夫退化系統(tǒng)的最優(yōu)更換問題.在有限狀態(tài)空間內(nèi),將系統(tǒng)退化狀態(tài)建模為離散時間馬爾科夫鏈(Discrete-time Markov chain,DTMC),其狀態(tài)空間結(jié)構(gòu)依據(jù)退化程度遞增順序而排列;DTMC 的轉(zhuǎn)移概率矩陣由環(huán)境過程控制,而環(huán)境過程也可作為DTMC 在有限狀態(tài)空間上演化.如果檢查時發(fā)現(xiàn)系統(tǒng)出現(xiàn)故障,則必須更換故障設(shè)備;否則,系統(tǒng)繼續(xù)運行或?qū)ο到y(tǒng)進行一定維護后運行.最優(yōu)更換問題最終被描述為一個離散的、無限時間馬爾科夫決策過程.需要指出的是,該最優(yōu)更換策略假設(shè)系統(tǒng)狀態(tài)和環(huán)境方面具有控制受限特性.在非恒定周期檢測條件下,文獻[32]在馬爾科夫過程退化中考慮了使用時間和維護次數(shù)等要素,重點分析了武器裝備的幾個主要部件,通過預(yù)測各部件故障時間并結(jié)合判定規(guī)則確定了最優(yōu)維護策略.在恒定和非恒定周期檢測條件下,文獻[33]分別建立了基于半馬爾科夫決策過程的風電機狀態(tài)維護模型,通過對兩種檢測條件下檢測間隔時間和維護成本的分析,得到優(yōu)化的維護決策,該模型綜合考慮了風速、備件物流、停機損失等因素對風電場維護的影響,并成功將部件退化過程離散成了有限退化狀態(tài),實現(xiàn)了風力機維護優(yōu)化. 在實際工程系統(tǒng)中,系統(tǒng)某些重要的物理量不能被直接測量,但可以根據(jù)其他狀態(tài)監(jiān)測傳感器信號進行估計.由于測量噪聲、外部干擾等原因,此估計通常不能完全地揭示系統(tǒng)狀態(tài),因此需要研究基于不確定性信息的維護決策問題.概率論是描述不確定性信息的重要手段.文獻[34]運用概率分布定義了系統(tǒng)狀態(tài),并在部分觀測馬爾科夫決策過程框架下開發(fā)了決策模型.所提出的維護決策模型能夠根據(jù)每個部件的內(nèi)部條件和外部運行環(huán)境動態(tài)地安排相關(guān)維護活動,其內(nèi)部條件不僅包括退化狀態(tài)的程度,還包括與單個部件相關(guān)的不同失效模式;而外部運行條件包含可能對系統(tǒng)維護成本和可用性產(chǎn)生重大影響的環(huán)境因素和維護資源準備時間等.另外,不完全的狀態(tài)監(jiān)測往往會造成模型參數(shù)的不確定性,這種不確定性會顯著影響維護決策的可靠性.為了獲得準確可靠的設(shè)備狀態(tài)轉(zhuǎn)移率參數(shù),文獻[35]將模糊集理論引入馬爾科夫過程模型,給出了考慮不確定性的設(shè)備狀態(tài)轉(zhuǎn)移參數(shù)的模糊表達,并依據(jù)模糊數(shù)的擴張原則求取了設(shè)備的模糊可用度,最后以設(shè)備的最大可用度為目標,確立了設(shè)備狀態(tài)檢查頻率優(yōu)化決策的方法.文獻[36]認為隱馬爾科夫模型理論也是解決模型參數(shù)估計問題的一種有效方法,該方法優(yōu)勢在于可有效辨別由于運行條件變化而引起的系統(tǒng)測量變化以及由于測量儀器或測量精度變化而引起的狀態(tài)測量變化.該文通過將優(yōu)化模型與源于經(jīng)驗數(shù)據(jù)的輸入?yún)?shù)估計方法相結(jié)合,提出了基于離散狀態(tài)馬爾科夫過程的最優(yōu)維護策略.為了描述一類部分可觀測系統(tǒng)退化,文獻[37]將系統(tǒng)退化過程建模為三態(tài)連續(xù)時間的隱馬爾科夫過程:狀態(tài)1 和狀態(tài)2 分別描述系統(tǒng)的良好和預(yù)警狀態(tài),是不可觀測的;而狀態(tài)3 描述系統(tǒng)的失效狀態(tài),被認為是可觀測的.基于此,在部分觀測馬爾科夫決策過程框架下,文獻[37]提出了易于實現(xiàn)的最優(yōu)采樣與維護策略;實驗分析表明,所提出的策略能夠顯著降低系統(tǒng)長期維護費用. 基于馬爾科夫過程的退化建模具有如下幾個特點:1)馬爾科夫模型能夠模擬許多系統(tǒng)的設(shè)計及其故障場景;2) 馬爾科夫模型開發(fā)時計算效率高;3)馬爾科夫模型適用于不完整的數(shù)據(jù)集,決策中能夠很好地處理不確定因素.然而,馬爾科夫模型的訓(xùn)練仍然需要較大的數(shù)據(jù)量,且在退化建模時多假設(shè)單一的、非暫時的失效退化模式. 如果系統(tǒng)狀態(tài)隨著時間的不斷推移具有連續(xù)退化特性,且系統(tǒng)具有實時可觀測的狀態(tài)量,則應(yīng)使用連續(xù)狀態(tài)退化模型描述其退化過程[38?40].現(xiàn)有文獻中主要涉及三種連續(xù)狀態(tài)退化模型:伽瑪(Gamma)過程、維納(Wiener)過程和逆高斯(Inverse Gaussian)過程. 1.2.1 伽瑪過程 伽瑪過程模型于1975 年被引入可靠性領(lǐng)域[41],當退化過程具有不確定、非遞減特征時,可將其視為伽瑪過程.伽瑪過程是具有獨立非負增量的隨機過程,其中,增量具有相同尺度參數(shù)的伽瑪分布.設(shè)隨機過程{Y(t),t ≥0} 為伽瑪過程,其概率密度函數(shù)為: 其中,α>0 和β >0 分別為形狀參數(shù)和尺度參數(shù);exp(·)指的是以e 為底的指數(shù)函數(shù).Y(t) 的均值和方差分別為α/β和α/β2. 目前,越來越多的CBM 退化建模中使用伽瑪過程模型.文獻[42]指出,當系統(tǒng)退化過程具有較大的不確定性時,基于伽瑪過程的CBM 策略優(yōu)于基于役齡的定期更換策略.文獻[43]進一步考慮了系統(tǒng)中存在多個退化過程的CBM 決策問題.當某一個退化過程的退化水平超過對應(yīng)閾值時,執(zhí)行非停機預(yù)防性維護;如果系統(tǒng)在檢查時停機,則執(zhí)行修復(fù)性維護任務(wù).為了提高維護決策精度、避免過度維護和欠缺維護問題,文獻[44]提出非完美預(yù)防性視情維修、小修與故障更換相結(jié)合的維護策略,通過最小化總加權(quán)期望完成時間,得到了優(yōu)化的加工作業(yè)次序和預(yù)防維修閾值.需要指出的是,該文所提出的維護策略僅適用于單機調(diào)度問題,對于更復(fù)雜的調(diào)度與維護決策的集成問題還需要進一步研究.文獻[45]分別考慮了經(jīng)濟性和可用性兩個準則,給出了兩個通用的CBM 決策優(yōu)化模型.其主要思想是利用歷史維護信息和狀態(tài)數(shù)據(jù)確定模型參數(shù),建模分析了維護效果和維護時間這兩個重要因素.得出的主要結(jié)論有:不同研究對象的維護決策模型差異性巨大;不準確的維護效果和維護時間建模將可能導(dǎo)致錯誤的決策.以上研究主要針對單部件系統(tǒng)的最優(yōu)維護決策問題,對于多部件系統(tǒng),文獻[46]將風電機組視為一個同類多設(shè)備系統(tǒng),提出了基于退化狀態(tài)空間劃分的多設(shè)備系統(tǒng)狀態(tài)維護決策建模方法,并建立最優(yōu)解析模型,以最優(yōu)檢測周期和維護閾值為決策變量,實現(xiàn)長期維護費用率最小的目標. 事實上,維護后的系統(tǒng)很難達到"修復(fù)如新"狀態(tài),而通常是處于"修復(fù)如新"與"修復(fù)如舊"之間的狀態(tài).換句話說,維護活動是不完全或非完美的,只是部分修復(fù)了系統(tǒng).近年來,不完全維護條件下的維護決策問題已成為CBM 領(lǐng)域的一個研究熱點.文獻[47?49]認為貝塔(Beta)分布能夠較好模擬不完全維護后的系統(tǒng)退化水平.Beta 分布的優(yōu)勢在于,它是定義在(0,1)區(qū)間的連續(xù)概率分布,而不完全維護后的系統(tǒng)退化水平也處于有限區(qū)間范圍內(nèi),這兩者之間具有定義域上的相似性,且Beta 分布具有良好的數(shù)學計算性質(zhì).另外,不完全維護活動甚至可能加速系統(tǒng)的退化過程.譬如,焊接可以減少裂紋長度,但可能破壞材料的某些物理行為;更換系統(tǒng)多個部件以進行維護操作可能會加速其他部件的惡化;備件可能是可重復(fù)使用的組件,也可能是質(zhì)量低下的組件.因此,在維護之后,系統(tǒng)的退化速率有可能高于維護前的水平,即維護加速了系統(tǒng)的退化速率.基于此觀點,興起了對系統(tǒng)加速退化的研究.比如,文獻[50]利用一個服從指數(shù)分布的非負隨機變量來刻畫退化速度增量,而考慮到退化速度的變化能夠體現(xiàn)在伽瑪過程參數(shù)的更新上,進一步開發(fā)了一種自適應(yīng)維護策略,使得每次設(shè)備檢查時可獲得最佳的維護操作.文獻[51]利用具有隨機單調(diào)性質(zhì)的幾何過程構(gòu)建了一種加速退化模型,研究了加速退化系統(tǒng)下的最優(yōu)CBM 策略.文獻[52]考慮了系統(tǒng)工況變化對退化率的影響,將退化速度描述為應(yīng)力分布,提出了一種基于狀態(tài)的自適應(yīng)維護策略,該策略可根據(jù)可用度最大化準則確定最優(yōu)的維護成本分配和維護閾值.文獻[53]則針對系統(tǒng)維護數(shù)據(jù)的稀疏特性,提出了適合小樣本建模的灰色模型理論,建立了系統(tǒng)加速退化模型,進一步結(jié)合偏最小二乘回歸和改進灰狼算法實現(xiàn)了系統(tǒng)CBM策略優(yōu)化. 通過以上文獻回顧可以看出,伽瑪過程在CBM 領(lǐng)域得到廣泛青睞,其主要優(yōu)勢在于:1)伽瑪過程便于數(shù)學上的分析和計算;2)伽瑪過程適用于建模隨時間逐漸累積的漸進式損傷,例如,磨損、疲勞、腐蝕、裂紋增長、蠕變和膨脹等;3)伽瑪過程模型的包容性較好,可與灰色模型、極大似然估計、矩估計、貝葉斯理論以及專家知識等多種方法結(jié)合使用.盡管基于伽瑪過程的退化建模方法具有諸多優(yōu)勢,但同時也存在一定的不足,譬如,伽瑪過程模型通常無法描述非單調(diào)退化過程,如陀螺儀的漂移數(shù)據(jù)、電池容量的大小等.另外,伽瑪過程模型參數(shù)復(fù)雜,難以實時更新. 1.2.2 維納過程 維納過程是一種重要的獨立增量過程模型,適合描述系統(tǒng)性能隨時間推移非單調(diào)退化的過程.由于維納過程模型能夠描述多種典型產(chǎn)品的退化過程,并且具有良好的計算性質(zhì),因而逐漸成為CBM領(lǐng)域最常用的退化模型之一.對于維納過程{Z(t),t ≥0},一般表示為: 其中,Z(0) 表示系統(tǒng)在初始時刻的退化量,ρ是漂移系數(shù),σ是擴散系數(shù),B(t) 表示標準布朗運動,且滿足B(t)~N(0,t) .通常情況下,Z(0)=0,在實際中,若Z(0)≠0,可通過數(shù)學中的平移變換將其轉(zhuǎn)化為Z(0)=0 . 隨著維納過程理論的快速發(fā)展,維納過程已被廣泛應(yīng)用于工程設(shè)備的退化建模、剩余壽命預(yù)測以及可靠性評估中.但以維納過程模型為基礎(chǔ)的CBM策略仍處于起步階段,相關(guān)研究成果并不多見.文獻[54]研究了微電子機械系統(tǒng),系統(tǒng)總體由多數(shù)的正常器件單元和一小部分孱弱器件單元組成,而這兩類器件單元又分別遵循具有不同線性漂移系數(shù)的維納過程.通過構(gòu)建并優(yōu)化在線使用期間的平均成本決策函數(shù),可確定最優(yōu)老化選擇設(shè)置和預(yù)防性更換間隔.類似地,文獻[55]也建立了包括兩個相同模型結(jié)構(gòu)但參數(shù)不同的雙維納過程退化模型,有效刻畫了系統(tǒng)運行的兩種狀態(tài),通過一種五場景概率模型描述一個檢測間隔內(nèi)的狀態(tài)演化,并考慮離散檢測的非平穩(wěn)性和狀態(tài)檢測延遲對長期運行成本的影響,開發(fā)了三態(tài)機械部件在競爭故障模式下的最優(yōu)維護策略.為了提升系統(tǒng)維護決策精度,文獻[56]分析了帶正漂移的維納過程和奧恩斯坦-烏倫貝克(Ornstein-Uhlenbeck)過程的具體特性,利用這兩個過程對系統(tǒng)運行時間和日歷時間進行建模,該建模能夠準確判斷出系統(tǒng)危險率,并精確預(yù)測出系統(tǒng)平均剩余壽命,為CBM 決策構(gòu)建了基本準則.但以上研究,并沒有考慮到不完全維護的情況.文獻[57]考慮了不完全維護對系統(tǒng)退化量和退化率的雙重影響,通過采用維納過程建立起一種考慮不完全維護活動影響的維護決策模型.該方法在首達時間意義下推導(dǎo)出系統(tǒng)剩余壽命的解析概率分布,并依據(jù)剩余壽命的預(yù)測結(jié)果,建立起以檢測間隔和預(yù)防性維護閾值為決策變量的維護決策模型,最終通過決策模型優(yōu)化達到了降低系統(tǒng)維護費用的目的.不過,這里需要指出的是,該維護決策模型僅適用于線性退化系統(tǒng),對不完全維護干預(yù)下的非線性退化系統(tǒng)構(gòu)建維護決策模型仍是空白方向. 對于執(zhí)行安全關(guān)鍵任務(wù)的任務(wù)導(dǎo)向型系統(tǒng),維護操作通常需要滿足一系列約束條件,如可用性、可靠性、維護時間和維護機會.此外,在實踐中,面向任務(wù)的系統(tǒng)允許實施一些預(yù)防性維護活動,在這樣的預(yù)防性維護之后,系統(tǒng)可恢復(fù)到一個“修復(fù)如新”和“修復(fù)如舊”之間的某一狀態(tài).面向這一類任務(wù)導(dǎo)向型系統(tǒng),文獻[58]在維護成本代價函數(shù)中加入了可用度約束條件,通過引入殘余退化量的概念刻畫出了不完全維護對退化水平的影響,并在此基礎(chǔ)上構(gòu)建了一種以維護成本為目標的預(yù)防性維護優(yōu)化模型,通過優(yōu)化決策函數(shù)獲得了最佳預(yù)防性維護閾值.文獻[59]在維護決策中考慮了由操作環(huán)境變化引起的外部沖擊影響,將隨機沖擊波的到達過程建模為齊次泊松(Poisson)過程,而將由老化和磨損引起的自然退化過程建模為維納過程.根據(jù)累積沖擊模型,沖擊造成的損傷將會整合到退化過程中,并利用改進因子模型描述維護措施對系統(tǒng)恢復(fù)的影響,最終建立了以長期維護費用率最小化為目標的CBM 決策優(yōu)化模型,最后通過對水下防噴器系統(tǒng)的實驗分析,驗證了該模型的有效性. 通過上述文獻分析,總結(jié)基于維納過程的退化建模優(yōu)勢在于:1)維納過程源于帶有線性漂移項的布朗運動,能夠描述非單調(diào)的退化過程,以及實際退化中的“自愈”現(xiàn)象;2)維納過程的增量服從高斯分布,不僅有利于模型參數(shù)的估計,而且為剩余壽命解析概率分布的推導(dǎo)提供了有力保證;3)維納過程也便于數(shù)學上的分析和計算.雖然基于維納過程建模方法具有多方面優(yōu)勢,但同時也暴露出一些問題,例如,實際工程中疲勞裂紋的退化速率會隨外界環(huán)境發(fā)生變化,對于這類非時齊的退化過程,維納過程模型很難處理;另外,維納過程在模擬單調(diào)的退化過程時效果不佳[60]. 1.2.3 逆高斯過程 和伽瑪過程相類似,逆高斯過程也適合對具有單調(diào)退化軌跡的系統(tǒng)進行建模.然而,由于逆高斯過程不像伽瑪過程那樣有直觀的物理可解釋性,并未在系統(tǒng)退化建模領(lǐng)域得到廣泛研究與應(yīng)用.文獻[61]首次從物理的角度深入研究了逆高斯過程,同時指出其物理意義與維納過程具有一定相似性,即均為極限狀態(tài)下的復(fù)合泊松過程.因而,在工程實際中,對于不能用伽瑪過程或維納過程等模型進行良好擬合的退化數(shù)據(jù),逆高斯過程是一個可考慮的選擇[62].對于逆高斯過程{H(t),t ≥0},其增量之間相互獨立且服從一個逆高斯分布,即?H(t)~IG(μΛ(t),λ(Λ(t))2),其中 Λ(t) 是非負單調(diào)遞增函數(shù),μ和λ是常數(shù),用來調(diào)節(jié)退化速度和波動性.逆高斯分布IG(a,b)的概率密度函數(shù)為: 其中,a和b分別是逆高斯分布的形狀和尺度參數(shù). 逆高斯過程最近頗受關(guān)注[63?67],但基于逆高斯過程的退化建模和CBM 策略仍然是全新研究方向.有限的幾篇文獻中,文獻[68]針對產(chǎn)品退化符合具有隨機效應(yīng)的逆高斯過程,研究了一種具有最優(yōu)檢測間隔的最優(yōu)視情更換策略.該策略利用逆高斯過程的隨機效應(yīng)參數(shù)刻畫了產(chǎn)品群體中常見的異質(zhì)性特征,通過不斷獲得可用的退化觀測值實時更新其概率分布,并聯(lián)合考慮了產(chǎn)品役齡和退化情況,制定了相應(yīng)的更換策略.另外,文獻[68]也從理論上證明了單調(diào)控制極限策略是最優(yōu)的.文獻[69]進一步將逆高斯隨機過程理論引入到油氣管道的腐蝕評估中,提出了一種逆高斯-狀態(tài)空間油氣管道腐蝕退化過程模型和維護決策優(yōu)化模型.該策略首先根據(jù)其腐蝕機理建立逆高斯-狀態(tài)空間退化過程模型,然后運用經(jīng)驗最大化與粒子濾波融合的算法估計模型參數(shù),進而得出腐蝕油氣管道的剩余壽命分布函數(shù)和概率密度函數(shù),最后以更換時間為決策變量構(gòu)建了維護決策優(yōu)化模型. 迄今為止,基于逆高斯過程的退化建模與CBM策略的聯(lián)合研究相對比較匱乏,還沒有形成系統(tǒng)的理論體系,有待進一步地深入研究.另外,由于逆高斯過程無法描述非單調(diào)退化過程,阻礙了其在退化建模領(lǐng)域的發(fā)展進程. 早期的PdM 策略通常預(yù)先假定系統(tǒng)的退化模型是已知的,然后根據(jù)確定的退化模型估計或預(yù)測系統(tǒng)的平均剩余壽命或推導(dǎo)出解析的剩余壽命概率分布,進而規(guī)劃后續(xù)的維護活動.在實際工程系統(tǒng)中,退化模型往往是未知的且建模成本高昂,不同類型系統(tǒng)的退化模型也不盡相同.另外,構(gòu)建系統(tǒng)退化模型的輸入也僅局限于系統(tǒng)的狀態(tài)監(jiān)測數(shù)據(jù),而與系統(tǒng)健康狀態(tài)相關(guān)的“大數(shù)據(jù)”,比如系統(tǒng)使用狀況、當前工作環(huán)境和條件、早先實驗和歷史經(jīng)驗等數(shù)據(jù),并未得到有效利用.因而,近年來,系統(tǒng)維護策略的研究逐漸轉(zhuǎn)向于基于數(shù)據(jù)驅(qū)動的PdM. 基于數(shù)據(jù)驅(qū)動的PdM 策略可以不依賴于系統(tǒng)的退化機理模型,其決策信息也不局限于系統(tǒng)的狀態(tài)監(jiān)測數(shù)據(jù),而是通過挖掘系統(tǒng)健康狀態(tài)相關(guān)的“大數(shù)據(jù)”,獲得設(shè)備剩余使用壽命等更準確的系統(tǒng)維護決策信息,從而實現(xiàn)更為行之有效的維護策略,以減少機器停機時間,改善生產(chǎn)流程.基于數(shù)據(jù)驅(qū)動的PdM 流程主要包括數(shù)據(jù)采集、數(shù)據(jù)處理、預(yù)測建模和維護決策4 個步驟,如圖4 所示.從中可知,如能獲得系統(tǒng)運行的各種數(shù)據(jù),就可以開展基于數(shù)據(jù)的預(yù)測建模和維護決策研究.其整體思路是,基于傳感器采集到的系統(tǒng)運行數(shù)據(jù) 進行數(shù)據(jù)選擇、降噪、標準化等預(yù)處理操作,提取能反映系統(tǒng)性能退化的特征參數(shù);然后,利用機器學習、深度學習等智能算法,實時預(yù)測系統(tǒng)未來健康狀態(tài)和剩余壽命;最后,基于預(yù)測的健康狀態(tài)和壽命數(shù)據(jù),以維護代價最小化為目標進行維護決策.在維護決策過程中,需要處理好維護活動安排(如維修類型和時機等)和相應(yīng)資源投入(如維修人員與備件等)之間的配置關(guān)系,通過統(tǒng)籌規(guī)劃得到最佳健康管理措施. 圖4 數(shù)據(jù)驅(qū)動PdM 的一般步驟Fig.4 General steps for data-driven PdM 從數(shù)據(jù)驅(qū)動PdM 的一般步驟可知,預(yù)測建模是整個過程的關(guān)鍵步驟,它為維護決策提供了重要輸入信息,預(yù)測信息的準確與否直接影響到維護策略的制定效果[70?75].圖5 描繪了在線壽命預(yù)測與維護決策之間的關(guān)系.維護人員可根據(jù)剩余壽命預(yù)測信息在失效前的合適時間實施維護,避免重大事故發(fā)生的同時,減少維護與備件存儲的損失并延長系統(tǒng)的使用壽命[76?78].而對于數(shù)據(jù)驅(qū)動的預(yù)測建模,機器學習及其在此基礎(chǔ)上發(fā)展而來的深度學習是主流的技術(shù),下面分別闡述其主要思想和在PdM 中的應(yīng)用情況. 圖5 在線壽命預(yù)測與維護決策之間的關(guān)系Fig.5 Relationship between online life prediction and maintenance decision-making 目前,基于機器學習的故障預(yù)測和設(shè)備剩余壽命預(yù)測方法的研究成果十分豐富,如基于邏輯回歸(Logistic regression,LR)的方法[79?82]、基于人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)的方法[83?86]、基于支持向量機(Support vector machine,SVM) 的方法[87?91]、基于決策樹(Decision tree,DR)的方法[92?94]和基于隨機森林(Random forest,RF)的方法[95?97]等.文獻[98]詳細介紹了幾種常用的神經(jīng)網(wǎng)絡(luò)(多層感知器神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)、極限學習機)以及SVM 算法在設(shè)備剩余壽命預(yù)測中的研究現(xiàn)狀,分析了每種方法的優(yōu)劣勢.文獻[99]則從具體的工業(yè)應(yīng)用角度,深入討論了LR、ANN、DR 和RF 這4 種機器學習算法的適用性情況.盡管諸多機器學習算法已成功應(yīng)用于工業(yè)系統(tǒng),但大多數(shù)的研究僅為了預(yù)測而預(yù)測,而忽略了預(yù)測的最終目的.預(yù)測與維護決策是一個過程整體,只有將數(shù)據(jù)驅(qū)動的故障/剩余壽命預(yù)測與維護決策聯(lián)合考慮,才可從工程應(yīng)用角度保證系統(tǒng)的安全性與可靠性. 最近,一些學者開始關(guān)注于基于機器學習的故障/剩余壽命預(yù)測與維護決策的集成方法研究,并取得了一些研究成果.這些研究成果主要以ANN和SVM 這兩種機器學習算法為技術(shù)基礎(chǔ),將預(yù)測結(jié)果應(yīng)用于故障件替換、備件訂購、生產(chǎn)運營規(guī)劃等維護決策活動,在維護成本、資源損耗與生產(chǎn)效益之間計算最優(yōu)平衡點,達到減少損失、提高可靠性等目的.以下將重點闡述ANN 和SVM 在PdM中的應(yīng)用情況. ANN 模型具有并行分布的處理能力、高容錯性、智能化和自學習等能力[100],在各個領(lǐng)域均有廣泛應(yīng)用.在PdM 領(lǐng)域,文獻[101]針對旋轉(zhuǎn)設(shè)備的預(yù)測維護問題,提出一種以ANN 為技術(shù)基礎(chǔ)的綜合決策支持系統(tǒng).該系統(tǒng)由三部分組成:第一部分通過對滾動軸承的狀態(tài)監(jiān)測,建立了基于振動的退化數(shù)據(jù)庫;第二部分開發(fā)了一個ANN 模型來估計滾動軸承的壽命百分比和失效時間,并構(gòu)造了一個邊際分布;第三部分構(gòu)建了成本矩陣以及概率更換優(yōu)化模型.另外,文獻[101]通過一個啟發(fā)式管理決策規(guī)則,處理了預(yù)測性成本和修復(fù)性成本構(gòu)成的各種情形.跟隨此研究,文獻[102]開發(fā)了一種集成故障診斷與維護決策的智能操作系統(tǒng),其智能診斷子系統(tǒng)利用ANN 評估系統(tǒng)在線的健康狀況信息,而智能維護子系統(tǒng)則借助于專家系統(tǒng)將診斷信息轉(zhuǎn)換為所需形式的維護信息.為了進一步提升ANN 的故障預(yù)測精度,文獻[103]引入了模糊系統(tǒng)和元啟發(fā)式算法,提出了一種混合模型以對煉油廠檢修相關(guān)的事故進行預(yù)測.該混合模型能夠?qū)崿F(xiàn)煉油行業(yè)維護作業(yè)事故的早期預(yù)測,降低了決策不確定性. 另外,文獻[104]深入探討了ANN 的不同結(jié)構(gòu)特性,分別利用自組織映射神經(jīng)網(wǎng)絡(luò)和標準反向傳播神經(jīng)網(wǎng)絡(luò)獲得風力渦輪機陣列之間的行為相似性,然后預(yù)測風電機組的期望功率,并基于獲得的分類和預(yù)測信息,實現(xiàn)海上風力渦輪機的維護策略優(yōu)化.同樣針對海上風力渦輪機,文獻[105]提出了一種最優(yōu)機會狀態(tài)維護策略,該策略通過ANN 預(yù)測風力渦輪機的壽命百分比,并從預(yù)測的失效時間分布中導(dǎo)出條件失效概率值,以刻畫風力渦輪機的退化程度;基于此,定義具有兩級故障概率閾值確定相應(yīng)的維護策略,并通過優(yōu)化成本決策函數(shù)確定最優(yōu)閾值.相比于文獻[104],該最優(yōu)機會PdM 決策方案便于實施,且解決了不同部件之間的經(jīng)濟依賴性.為了避免風電機組檢修資源管理中可能存在的"個人主義"和"片面性"問題,文獻[106]提出了一種基于優(yōu)勢粗糙集和誤差反饋神經(jīng)網(wǎng)絡(luò)的檢修決策方法.該方法采用優(yōu)勢粗糙集理論對知識進行約簡,獲得檢修決策規(guī)則集,并將提取的規(guī)則集作為神經(jīng)網(wǎng)絡(luò)輸入樣本進行模型訓(xùn)練,試驗分析表明,優(yōu)勢粗糙集和神經(jīng)網(wǎng)絡(luò)的組合方法優(yōu)于單一的優(yōu)勢粗糙集方法. 上述基于ANN 的PdM 文獻,其預(yù)測模型僅是簡單給出了壽命預(yù)測值,而沒有考慮到預(yù)測問題中不可忽視的不確定性.在實際工程中,系統(tǒng)中存在著各種各樣的不確定性,比如測量誤差、內(nèi)在隨機性、模型不確定性等[107],這些不確定性會使得基于ANN 的點預(yù)測結(jié)果的可信度顯著下降.針對不確定性問題,文獻[108]給出了一種解決方案,利用ANN 在訓(xùn)練和測試過程中的壽命預(yù)測誤差估計系統(tǒng)的不確定性程度,并利用失效概率閾值定義維護策略.在此基礎(chǔ)上,文獻[109]進一步研究了系統(tǒng)壽命預(yù)測精度不斷提升下的不確定估算問題,通過建立預(yù)測誤差均值、標準差與壽命百分比的關(guān)系模型量化預(yù)測不確定,之后同樣利用失效概率閾值定義維護策略. 和ANN 相比,SVM 集合了最大間隔超平面、凸二次規(guī)劃、核分析等多種技術(shù)[110],是一種更為高效的機器學習算法.它能夠在高維特征空間中得到優(yōu)化的泛化界超平面,可以利用核技術(shù)來避免局部最小值,并通過間隔和限制支持向量的數(shù)量來防止過擬合.考慮到SVM 配置參數(shù)對模型性能的較大影響,文獻[111]提出利用粒子群算法對最小二乘SVM 模型進行優(yōu)化,并將優(yōu)化后的模型應(yīng)用于建立設(shè)備狀態(tài)風險評估指標體系,解決了真空斷路器的狀態(tài)檢修問題.為了進一步提升最小二乘SVM的預(yù)測精度,文獻[112]改用雙層算法替代粒子群算法優(yōu)化SVM 模型配置參數(shù),在考慮成本效益的約束下,利用歷史運行數(shù)據(jù)構(gòu)建了斷路器缺陷樹,并預(yù)測方案優(yōu)化前后的缺陷分布,通過對缺陷損失的量化,采用成本效益度量法確定最佳維護方案. 上述文獻均是從參數(shù)微調(diào)角度增強SVM 的預(yù)測性能,以進一步提升PdM 的決策精度.除此之外,文獻[113]深入考慮了SVM 中的決策邊界距離以及工具變量在每個迭代過程中的知識,認為它們也為PdM 決策提供了重要信息.于是,針對半導(dǎo)體制造業(yè)中離子注入工具離子源中燈絲頻繁斷裂的問題,文獻[113]提出利用SVM 區(qū)分燈絲的故障和非故障運行,并將決策邊界距離考慮為與燈絲剩余壽命相關(guān)的信息,通過構(gòu)建總的維護費用函數(shù)并基于蒙特卡洛(Monte Carlo)交叉驗證方法確定了最優(yōu)維護方案.文獻[114]指出傳統(tǒng)SVM 模型構(gòu)建中每個樣本點都被確定性分配給每一類的這種思想在實際工程中的應(yīng)用效果并不理想,因此提出將模糊隸屬度函數(shù)引入SVM,并基于層次思想構(gòu)建了一種層次修正的模糊SVM.所提出的改進模型在聯(lián)網(wǎng)車隊運營管理與維護中得到了有效驗證,在對車輛里程、年齡、車型等重要屬性方面的變化趨勢預(yù)測中,獲得的預(yù)測精度顯著高于傳統(tǒng)SVM、邏輯回歸(LR)和隨機森林(RF)等機器學習算法. 機器學習為PdM 策略的制定和優(yōu)化提供了重要技術(shù)支持.總結(jié)以上機器學習在PdM 中的研究,具備如下特點:1)機器學習模型較為簡單,容易根據(jù)實際設(shè)計要求進行更改;2)機器學習模型對計算機硬件要求不高,計算成本低;3)機器學習模型的超參數(shù)調(diào)整技術(shù)較為成熟;4)機器學習算法中涉及直接的特征工程技術(shù),而這些特征提取算法很容易解釋和理解. 隨著大數(shù)據(jù)時代的來臨,系統(tǒng)裝備運行狀態(tài)的監(jiān)測數(shù)據(jù)呈現(xiàn)出容量大、多樣性強、產(chǎn)生速度快等特點[115].傳統(tǒng)的淺層機器學習算法很大程度上依賴于專家經(jīng)驗知識和信號處理技術(shù),難以處理這些海量監(jiān)測數(shù)據(jù).而最近發(fā)展起來的深度學習技術(shù)能夠在沒有信號處理專業(yè)知識的情況下自動提取和構(gòu)造有用信息,為海量監(jiān)測數(shù)據(jù)的處理提供了一種解決思路.圖6 描繪了傳統(tǒng)機器學習和深度學習的數(shù)據(jù)處理流程.可以看出,深度學習避免了傳統(tǒng)機器學習對原始數(shù)據(jù)的復(fù)雜特征工程(特征構(gòu)建、提取與選擇),它可以直接采用端到端的方式來學習,而這種對系統(tǒng)運行狀況的表征學習可通過在原始數(shù)據(jù)和預(yù)測目標之間添加深層網(wǎng)絡(luò)結(jié)構(gòu)來實現(xiàn). 深度神經(jīng)網(wǎng)絡(luò)是實現(xiàn)深度學習的一個載體,而它本身并非是一個全新的概念,可視為包含多個隱含層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).為了提高深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果,人們對神經(jīng)元的連接方式以及激活函數(shù)等方面做出了調(diào)整[116].依據(jù)深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的不同,目前常用的深度學習模型主要包括以下三種:深度置信網(wǎng)絡(luò)(Deep belief network,DBN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN). DBN 是一種典型的深度學習模型,它由多個受限波爾茲曼機(Restricted Boltzman machine,RBM)和單層反向傳播(Back propagation,BP)神經(jīng)網(wǎng)絡(luò)組成,通過采用逐層訓(xùn)練方式,可為整個網(wǎng)絡(luò)賦予較好的初始權(quán)值,并經(jīng)過微調(diào)操作能夠使網(wǎng)絡(luò)達到最優(yōu)解,從而解決了深層次神經(jīng)網(wǎng)絡(luò)的優(yōu)化問題[117].DBN 依據(jù)堆疊RBM 能夠完成對輸入數(shù)據(jù)的特征提取,有效解決了人工特征提取與選擇所引起的不確定性問題,實現(xiàn)了智能特征提取的目標,同時該方法下的時域信號無需滿足周期性要求,因而在剩余壽命預(yù)測領(lǐng)域具有廣闊的應(yīng)用空間.文獻[118]借助于DBN 的自動特征提取和預(yù)測能力,將其直接應(yīng)用于軸承的剩余壽命預(yù)測上,但預(yù)測精度并不理想,遠低于粒子濾波算法.在此基礎(chǔ)上,文獻[119]提出對傳統(tǒng)DBN 進行改進,開發(fā)了一種多目標DBN 集成方法,每個深度置信網(wǎng)絡(luò)的輸出對網(wǎng)絡(luò)集合的輸出均占有一定權(quán)重,顯著提升了DBN 的剩余壽命預(yù)測精度.另外,DBN 與其他算法的融合模型也相繼被提出,它們均有效彌補了單一DBN預(yù)測模型的不足,代表性的融合模型有:DBN-前饋神經(jīng)網(wǎng)絡(luò)[120]、DBN-粒子濾波[121]、DBN-相關(guān)支持向量機[122].由以上文獻分析可知,DBN 能夠有效提取系統(tǒng)的退化特征,并能夠應(yīng)用于剩余壽命預(yù)測中,但它一般需要與其他方法進行結(jié)合或?qū)ζ涓倪M以達到預(yù)期的壽命預(yù)測精度.另外,基于DBN 的剩余壽命預(yù)測與維護決策的集成方法研究尚未見有相關(guān)報道,有待后續(xù)研究. CNN 是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學習的代表算法之一.它一般包括卷積層、池化層和全連接層,具有表征學習能力,能夠按其階層結(jié)構(gòu)對輸入信息進行平移不變分類,早期主要被用于解決圖形處理問題[123].由于其特殊的網(wǎng)絡(luò)結(jié)構(gòu),CNN 不僅能夠處理網(wǎng)格化數(shù)據(jù),還可以輸入序列數(shù)據(jù).特別地,CNN 具有稀疏交互、參數(shù)共享、空間池化等諸多優(yōu)良特性,能夠為處理海量監(jiān)測數(shù)據(jù)創(chuàng)造十分有利的條件.2016 年,文獻[124]首次將CNN 應(yīng)用于設(shè)備剩余壽命預(yù)測上,該方法通過利用兩個卷積層和兩個池化層提取原始信號特征,同時結(jié)合多層感知器神經(jīng)網(wǎng)絡(luò)實現(xiàn)了剩余壽命估計.緊接著,一些改進的CNN 相繼被開發(fā),它們進一步提升了壽命預(yù)測精度,比如,文獻[125]為了保存更多有效信息,在CNN 構(gòu)建中忽略了池化層;文獻[126]將CNN 中的全連接層全部更換為卷積層與池化層,以減少神經(jīng)網(wǎng)絡(luò)需訓(xùn)練的參數(shù).由以上文獻分析可以看出,基于CNN 的剩余壽命預(yù)測研究已取得了一定突破,但由于起步較晚,當前基于CNN 方法的研究仍處于初步探索階段. 圖6 傳統(tǒng)機器學習和深度學習流程Fig.6 Flow of traditional machine learning and deep learning RNN 為一類包含前饋連接與內(nèi)部反饋連接的前饋神經(jīng)網(wǎng)絡(luò),主要用于處理具有相互依賴特性的監(jiān)測向量序列.由于其特殊的網(wǎng)絡(luò)結(jié)構(gòu),能夠保留隱含層上一時刻的狀態(tài)信息,因而對復(fù)雜動態(tài)系統(tǒng)建模表現(xiàn)出了強大優(yōu)勢[127].借助于RNN 的建模優(yōu)勢,文獻[128]搭建了一種以RNN 為技術(shù)核心的智能預(yù)測決策支持系統(tǒng),用于實現(xiàn)對復(fù)雜動態(tài)系統(tǒng)的故障診斷與劣化趨勢預(yù)測.通過將這些有價值的結(jié)果作為集成維護管理系統(tǒng)的輸入,以預(yù)先計劃和安排維護工作,在某電廠關(guān)鍵設(shè)備上的測試和運行結(jié)果表明,該決策支持及管理系統(tǒng)能夠降低備件庫存成本,減少計劃外強制停機,并將災(zāi)難性故障的風險降到最低.考慮到單一使用RNN 預(yù)測上的不足,文獻[129]構(gòu)建了一種RNN 和隨機森林(RF)的融合模型用于鐵路鋼軌及幾何缺陷的預(yù)測,該融合模型預(yù)測結(jié)果通過兩個基準模型的加權(quán)運算得出,而權(quán)值系數(shù)則通過優(yōu)化一個具有風險規(guī)避特性的目標函數(shù)確定,基于融合模型的預(yù)測結(jié)果,利用帶折扣因子的馬爾科夫決策過程模型確定最優(yōu)檢查和維護計劃. 作為RNN 的重要分支之一,長短時記憶(Longshort term memory,LSTM)網(wǎng)絡(luò)解決了由于重復(fù)使用遞歸權(quán)矩陣而引起的消失梯度問題[130].LSTM網(wǎng)絡(luò)由多個單元塊連接而成,而每個單元塊內(nèi)包含了輸入門、輸出門和遺忘門三個組件.輸入門控制著外部信息的輸入,輸出門負責將單元塊內(nèi)重要信息進行輸出,而遺忘門則決定著單元塊內(nèi)一些信息的保留或舍棄.在這三個門組件的相互協(xié)作下,LSTM 網(wǎng)絡(luò)能夠?qū)W習到長時間序列間的依存關(guān)系.借助于LSTM 網(wǎng)絡(luò)在時間序列處理上的優(yōu)勢,文獻[131]首次提出了一種基于LSTM 網(wǎng)絡(luò)進行失效預(yù)測的動態(tài)PdM 框架:在數(shù)據(jù)驅(qū)動預(yù)測階段,利用LSTM 網(wǎng)絡(luò)來估計系統(tǒng)在未來不同時間窗內(nèi)發(fā)生故障的概率;在維護決策階段,通過快速評估維護成本和備件管理成本,實時決策是否采取維護活動或訂購備件.為了解決了LSTM 模型預(yù)測中存在的不確定性問題,文獻[132]引入了概率估計理論,將基于LSTM 網(wǎng)絡(luò)的確定性壽命預(yù)測推廣至概率性壽命預(yù)測,該方法首先分析LSTM 網(wǎng)絡(luò)輸入、輸出變量之間的統(tǒng)計關(guān)系,然后利用概率估計理論推導(dǎo)出具有一定置信水平的壽命預(yù)測區(qū)間,基于獲得的預(yù)測信息,構(gòu)建了預(yù)防性和修復(fù)性維護成本模型,通過成本模型的優(yōu)化與比較,最終確定了采取維護活動的類型和時間.為了解決現(xiàn)代高速鐵路動力設(shè)備的維護問題,文獻[133]創(chuàng)造性地將數(shù)據(jù)驅(qū)動的方法和基于模型的方法結(jié)合在了一起,提出了一種預(yù)測維護與主動維護相協(xié)作的方式,該方法搭建一種長短時記憶遞歸神經(jīng)網(wǎng)絡(luò)(LSTM-RNN)用于實現(xiàn)設(shè)備的預(yù)測;而對于主動維護問題,則設(shè)計了一種以設(shè)備物理退化和故障模型為基礎(chǔ)的樣本發(fā)生器,在氣體絕緣開關(guān)設(shè)備上的實驗結(jié)果表明,樣本發(fā)生器與維護預(yù)測器之間的強力協(xié)作,不僅可以根據(jù)歷史樣本數(shù)據(jù)準確預(yù)測出開關(guān)設(shè)備的未來維護時間,而且可以主動豐富數(shù)據(jù)供應(yīng)以應(yīng)對潛在數(shù)據(jù)不足的問題. 通過以上基于RNN 以及變體LSTM 的PdM文獻分析可知,RNN 在對復(fù)雜動態(tài)系統(tǒng)的建模表現(xiàn)出了強大優(yōu)勢,能夠有效提升系統(tǒng)剩余壽命預(yù)測精度,并且具備較快的收斂速度和較高的穩(wěn)定性.值得指出的是,以上關(guān)于RNN 在PdM 中的應(yīng)用情況大多數(shù)是以構(gòu)建維護成本函數(shù)為目標,并通過優(yōu)化決策函數(shù)確定最佳維護方案,而對安全性和任務(wù)完成度有較高要求的系統(tǒng)而言,其剩余壽命預(yù)測與維護決策的研究仍有待更多關(guān)注. 航空發(fā)動機是一種高度復(fù)雜、精密的熱力機械,作為飛機的心臟,不僅為飛機提供動力,同時也為航空事業(yè)的發(fā)展注入強大動力.為了研究航空發(fā)動機的退化建模和壽命預(yù)測,美國航空航天局使用CMAPSS 工具對發(fā)動機主要部件(如圖7 所示)進行一系列運行到失效的性能退化仿真模擬,并公開了發(fā)動機性能退化數(shù)據(jù)集[134],以便學術(shù)界研究PdM相關(guān)技術(shù). 圖7 航空發(fā)動機主要部件簡圖[135]Fig.7 Sketch of main components of aero engine[135] 該數(shù)據(jù)集記錄了航空發(fā)動機在每個飛行周期的24 個維度性能參數(shù),包括3 個操作條件變量和21 個傳感器測量變量.數(shù)據(jù)集可進一步分為訓(xùn)練集和測試集.訓(xùn)練集包括100 組運行到故障狀態(tài)的單元,可用于建立壽命預(yù)測模型.測試集包括100 組停止于系統(tǒng)故障之前具有一定周期次數(shù)的單元,用于剩余壽命預(yù)測,還提供了測試單元的真實壽命,可用于預(yù)測模型性能評估. 圖8 描述了航空發(fā)動機PdM 的基本框架,它包含了信號采集、信號處理、故障預(yù)測和維護決策4 個模塊.從中可以看出,為實現(xiàn)航空發(fā)動機的PdM,需要解決兩個核心問題:第一個是數(shù)據(jù)驅(qū)動的預(yù)測建模,它為維護決策提供了重要輸入信息;第二個是基于預(yù)測信息的維護策略制定,它旨在給出實施維護和備件訂購的最佳時機. 對于預(yù)測建模,C-MAPSS 數(shù)據(jù)集已被用于與預(yù)測相關(guān)的各個方面研究.文獻[136?142]利用大量可用的運行故障數(shù)據(jù),通過使用人工智能技術(shù)學習特征向量和剩余壽命之間的關(guān)系.文獻[143?148]充分利用豐富的訓(xùn)練單元,開發(fā)了基于單元間相似性的預(yù)測方法.文獻[149?151]利用特征的多樣性,并基于多特征融合進行預(yù)測.文獻[152]提出了一種考慮數(shù)據(jù)集時變操作條件的預(yù)測方法.文獻[153]從降低預(yù)測風險方面,提出了一種混合模型預(yù)測方法.對于維護策略制定,文獻[131]提出了一種動態(tài)PdM 框架,通過快速評估維護成本和備件管理成本,實時決策是否采取維護活動或訂購備件.文獻[132]構(gòu)建了預(yù)防性和修復(fù)性維護成本模型,通過成本模型優(yōu)化與比較,最終確定了采取維護活動的類型和時間.進一步地,以文獻[131]為例,簡要說明航空發(fā)動機的PdM 過程. 首先,在故障預(yù)測模塊,21 個傳感器測量值輸入到LSTM 網(wǎng)絡(luò),網(wǎng)絡(luò)輸出發(fā)動機剩余壽命在未來不同時間窗口內(nèi)的概率,如表1 所示.表中時間窗口1~ 3 分別表示發(fā)動機狀態(tài)不同的退化程度:窗口1 表示輕微退化,窗口2 表示中度退化,窗口3 表示重度退化.其次,在維護決策模塊,基于獲得的預(yù)測信息,將做出是否訂購備件和是否實施維護決策,見表2. 綜合表1 和表2 可以看出,在運行周期為180 時(對應(yīng)于第18 個決策周期),發(fā)動機剩余壽命落入時間窗口1 的概率比較高,表明發(fā)動機仍然能夠正常工作,故此時刻并不需要訂購備件也不需要維護系統(tǒng).接下來,新監(jiān)測的傳感器數(shù)據(jù)輸入到LSTM網(wǎng)絡(luò),更新相應(yīng)的預(yù)測信息.在第19 個決策周期,最優(yōu)維護建議是訂購備件但并不需要維護系統(tǒng),而可用備件將在兩個決策周期后到達.同樣地,在第20 個決策周期,也不需要維護系統(tǒng).最終,當?shù)?1 個決策周期到來時,所訂購的備件已經(jīng)交付,同時考慮到發(fā)動機失效概率為100%,于是,最優(yōu)決策是預(yù)防性更換發(fā)動機. 視情維護在保障系統(tǒng)安全性、可靠性和經(jīng)濟性方面具有十分重要的意義.本文對復(fù)雜工程系統(tǒng)視情維護決策的研究進展做了綜述和總結(jié).依據(jù)維護決策支持技術(shù)類型,將其分為基于隨機退化模型的視情維護和基于數(shù)據(jù)驅(qū)動的預(yù)測性維護.在這兩種研究分支下,分別梳理了現(xiàn)有模型和算法在視情維護中的應(yīng)用情況.從現(xiàn)有文獻回顧中,CBM 和PdM 仍然屬于戰(zhàn)略新興方法,仍然存在一些明顯的挑戰(zhàn)性問題亟待解決.從工程實踐的角度,當前視情維護決策面臨著數(shù)據(jù)的有效性判定和面向視情維護的友好實用的計算機程序開發(fā)等挑戰(zhàn)性問題,這兩個方面深刻制約著視情維護決策理論方法向工程實踐的轉(zhuǎn)化.從理論研究的角度,當前視情維護決策研究需要進一步加強考慮相互影響的多部件系統(tǒng)的視情維護決策研究、考慮人為因素的視情維護決策優(yōu)化研究、基于深度學習和退化過程模型的融合技術(shù)研究以及狀態(tài)監(jiān)測、壽命預(yù)測和維護決策的聯(lián)合研究,這4 個方面則制約著所提出的視情維護決策方法在電氣、電子、機電產(chǎn)品等復(fù)雜、敏感系統(tǒng)中的適用性情況.對于這6 個挑戰(zhàn)性的問題,具體描述如下: 1)數(shù)據(jù)有效性.眾所周知,數(shù)據(jù)對算法性能的重要性不言而喻.當前視情維護決策研究大多采用數(shù)值案例或某些平臺提供的公共數(shù)據(jù)集進行方法驗證,而來自實際運行設(shè)備的數(shù)據(jù)集較少.此外,數(shù)據(jù)采集系統(tǒng)的建設(shè)將是昂貴的,并且傳感器本身也有可能發(fā)生故障.基于這些原因,需要可靠的信息物理系統(tǒng)和物聯(lián)網(wǎng)技術(shù)來為視情維護決策研究提供低購置成本和高利用價值.此類措施將有助于研究人員充分利用實際運行設(shè)備而不是實驗平臺的數(shù)據(jù),因而能夠更好地解決工業(yè)過程中的實際問題. 圖8 航空發(fā)動機PdM 的基本框架Fig.8 Basic framework of PdM for aero engines 表1 預(yù)測信息Table 1 Prognostic information 表2 動態(tài)預(yù)測性維護方案Table 2 Dynamic predictive maintenance scenarios 2)面向視情維護的友好實用的計算機程序開發(fā).開發(fā)友好實用的計算機化視情維護程序是在實際工業(yè)案例中如何充分應(yīng)用和實施視情維護的最后階段.友好實用的計算機程序能夠即時給出系統(tǒng)當前的運行狀態(tài)和提供未來的故障信息,并引導(dǎo)用戶采取相應(yīng)的維護策略,從而保障系統(tǒng)安全可靠地運行.一個典型的例子是加拿大多倫多大學開發(fā)的EXAKT 軟件[154],它能夠?qū)崿F(xiàn)旋轉(zhuǎn)設(shè)備的監(jiān)測和決策;隨后,由中國香港城市大學開發(fā)的IPDSS 系統(tǒng)[128]、西班牙卡米亞斯大主教大學開發(fā)的SIMAP 系統(tǒng)[155]和美國紐約州立大學賓漢姆頓分校開發(fā)的PCBM系統(tǒng)[156]等也相繼被應(yīng)用于設(shè)備的視情維護. 3)考慮相互影響的多部件系統(tǒng)的視情維護決策研究.當前復(fù)雜工程系統(tǒng)往往是由多個機械單元或部件按照一定的連接方式所組成,而這些元部件之間的退化過程和失效模式往往是相互影響的.現(xiàn)有視情維護研究大多集中于單部件系統(tǒng),而針對多部件系統(tǒng)的視情維護決策還沒有得到充分解決.一個潛在方向是為具有不同部件類型(而不是相同類型)的多部件系統(tǒng)制定最優(yōu)視情維護策略,并考慮部件之間的退化依賴性. 4)考慮人為因素的視情維護決策優(yōu)化研究.在視情維護中,人為錯誤通常影響到系統(tǒng)的狀態(tài)監(jiān)測、維護活動等環(huán)節(jié)而降低維護策略的有效性.例如,實際維護實施中,因為維護人員技術(shù)技能、心理狀態(tài)等因素,維護往往難以達到理想狀態(tài),可能存在維護沒有效果,甚至損壞設(shè)備的情形發(fā)生;用于維護的資源包括了人員與備件等多種組成,那么考慮維護人員在內(nèi)的資源調(diào)度問題必將對維護策略產(chǎn)生影響.因而,需要將人的可靠性集成到視情維護優(yōu)化模型中,以研究存在人為干擾情況下視情維護策略的有效性. 5)基于深度學習和退化過程模型的融合技術(shù)研究.深度學習能夠自動提取系統(tǒng)監(jiān)測數(shù)據(jù)中的特征信息,進而刻畫出特征信息與剩余壽命之間的非線性關(guān)系,在剩余壽命預(yù)測領(lǐng)域具有一定的普適性,但無法得到剩余壽命的解析概率分布,難以應(yīng)用于維護策略的制定與安排;而以伽瑪過程和維納過程為代表的退化過程模型可根據(jù)系統(tǒng)退化軌跡估計出退化模型參數(shù),推導(dǎo)出剩余壽命的解析概率分布,便于后續(xù)的維護決策,但剩余壽命預(yù)測精度受到所選退化模型的影響較大.因而在后續(xù)研究中,需要探索如何融合深度學習對復(fù)雜系統(tǒng)建模上的優(yōu)勢以及退化過程模型對剩余壽命預(yù)測表達上的優(yōu)勢,以做出精準可靠的維護決策. 6)狀態(tài)監(jiān)測、壽命預(yù)測和維護決策的聯(lián)合研究.狀態(tài)監(jiān)測、壽命預(yù)測和維護決策是一個過程整體,這三個部分共同影響著復(fù)雜系統(tǒng)的安全運行,其聯(lián)合研究具有十分重要的工程應(yīng)用價值.由于綜合考慮安全運行全過程的研究是一項非常龐大而復(fù)雜的工作,且在現(xiàn)有的研究成果中較少定量分析各階段輸入及輸出之間的相互影響,使得關(guān)于狀態(tài)監(jiān)測、壽命預(yù)測和維護決策的整體聯(lián)合研究進展極為緩慢.因而在后續(xù)研究中,需要準確刻畫它們之間的定量關(guān)系,并充分考慮多目標、多決策變量的優(yōu)化問題.1.2 連續(xù)狀態(tài)退化模型
2 基于數(shù)據(jù)驅(qū)動的預(yù)測性維護(PdM)
2.1 基于機器學習的PdM
2.2 基于深度學習的PdM
2.3 一個面向PdM 研究的典型案例
3 總結(jié)與展望