楊 青,薛 輝
(沈陽理工大學(xué) 自動化與電氣工程學(xué)院,沈陽 110159)
隨著現(xiàn)代化工業(yè)生產(chǎn)的迅速發(fā)展,在生產(chǎn)過程智能化和安全化的同時,工業(yè)系統(tǒng)的集成化和信息化程度也得到增長,每一個微小的故障都會導(dǎo)致重大的事故發(fā)生。為避免由微小故障而導(dǎo)致后續(xù)的重大事故的發(fā)生,故障檢測與診斷技術(shù)[1]被廣泛的應(yīng)用在工業(yè)生產(chǎn)過程中。如何更加高效快速的對故障問題進(jìn)行精確診斷,受到了越來越多的國內(nèi)外研究學(xué)者的關(guān)注。
目前大多的機(jī)器學(xué)習(xí)算法,依賴于數(shù)據(jù)的生成機(jī)制不隨環(huán)境改變這一基本假設(shè)。假設(shè)訓(xùn)練和測試數(shù)據(jù)是獨(dú)立同分布的,然而,這種假設(shè)在實(shí)際工業(yè)生產(chǎn)中很少成立,因?yàn)閿?shù)據(jù)會隨著時間和空間的變化而改變,從而導(dǎo)致診斷模型的泛化誤差難以達(dá)到實(shí)際生產(chǎn)的故障診斷要求。
遷移學(xué)習(xí)[2-4]放寬了傳統(tǒng)機(jī)器學(xué)習(xí)中訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)必須服從獨(dú)立同分布的約束,能夠在彼此不同但又相互關(guān)聯(lián)的兩個領(lǐng)域間挖掘不變的本質(zhì)特征和結(jié)構(gòu),還可以有效解決目標(biāo)樣本數(shù)據(jù)量小、數(shù)據(jù)不均衡等問題,更加體現(xiàn)了歷史知識和信息的重用性。其中領(lǐng)域作為進(jìn)行學(xué)習(xí)的主題,針對領(lǐng)域研究的領(lǐng)域自適應(yīng)方法就變成了目前遷移學(xué)習(xí)的研究熱點(diǎn)和重點(diǎn)。本文對遷移學(xué)習(xí)領(lǐng)域自適應(yīng)在故障診斷領(lǐng)域中的應(yīng)用進(jìn)行綜述。
根據(jù)領(lǐng)域自適應(yīng)方面的假設(shè)基礎(chǔ),將其分為數(shù)據(jù)分布、特征選擇和特征變換自適應(yīng)三種,如圖1所示。
假設(shè)數(shù)據(jù)的特征空間相同,并且類別空間也一致,但域之間的邊緣分布或條件分布不同的情況下,通過減小域之間的距離,達(dá)到自適應(yīng)要求。根據(jù)數(shù)據(jù)分布的性質(zhì),分為邊緣分布自適應(yīng)、條件分布自適應(yīng)及聯(lián)合分布自適應(yīng)。
圖1 領(lǐng)域自適應(yīng)方法分類
邊緣分布自適應(yīng)方法的目標(biāo)是減小域之間的邊緣概率分布距離,從而達(dá)到自適應(yīng)。邊緣分布自適應(yīng)的方法最早由Pan S J等[5]提出,方法名稱為遷移成分分析(Transfer Component Analysis,TCA)。通過找到合適的φ,盡可能的使兩個領(lǐng)域的條件分布P(ys|φ(xs))≈P(yt|φ(xt))。而領(lǐng)域之間的距離通過引入最大均值差異(Maximum Mean Discrepancy,MMD)來計算。在此之后的許多研究工作都以TCA為基礎(chǔ)。Long M等[6]在TCA方法的基礎(chǔ)上,將MMD擴(kuò)展到多核,并且進(jìn)行多層適配的計算。
條件分布自適應(yīng)方法是減小源域和目標(biāo)域的條件概率分布距離。中科院計算所的Wang J等[7]融入了類內(nèi)遷移思想,指出現(xiàn)有的絕大多數(shù)方法都只是學(xué)習(xí)一個全局的特征變換,而忽略了類內(nèi)的相似性;類內(nèi)遷移可以利用類內(nèi)特征,實(shí)現(xiàn)更好的遷移效果。
聯(lián)合分布自適應(yīng)方法主要是減小源域和目標(biāo)域的聯(lián)合概率分布距離。Tahmoresnezhad J等[8]在聯(lián)合分布適配的優(yōu)化目標(biāo)中加入了類內(nèi)距和類間距的計算,提出了基于視覺的領(lǐng)域自適應(yīng)方法(Visual Domain Adaptation,VDA,)。Long M等[9]又提出了聯(lián)合分布度量(Joint Adaptation Network,JAN)方法,優(yōu)化了在深層網(wǎng)絡(luò)中進(jìn)行聯(lián)合分布適配。
如果兩個域之間的類別空間一致,說明域之間的特征空間也相同,通過機(jī)器學(xué)習(xí)的方法,選擇源域和目標(biāo)域中均含有的公共特征,在這部分公共特征上構(gòu)建學(xué)習(xí)模型,這就是基于特征選擇的領(lǐng)域自適應(yīng)。Blitzer J等[10]作提出了結(jié)構(gòu)公共特征學(xué)習(xí)(Structural Correspondence Learning,SCL)方法,通過找到兩個領(lǐng)域公共的特征,完成遷移學(xué)習(xí)任務(wù)。Long M等[11]提出了在優(yōu)化目標(biāo)中同時進(jìn)行邊緣分布自適應(yīng)和源域樣本選擇的遷移聯(lián)合匹配(Transfer Joint Matching,TJM)的方法,并取得不錯的效果。Nannan L等[12]提出了通過共享源域和目標(biāo)域特征的方法,實(shí)現(xiàn)無監(jiān)督的領(lǐng)域自適應(yīng)。
通常假設(shè)源域和目標(biāo)域數(shù)據(jù)在變換后的子空間中會有相似的分布。按照特征變換的形式,將子空間學(xué)習(xí)法分為:基于統(tǒng)計特征變換的統(tǒng)計特征對齊方法,以及基于流形變換的流形學(xué)習(xí)方法。
Sun B等[13]提出了子空間分布對齊(Subspace Distribution Alignment,SDA)方法,該方法在子空間學(xué)習(xí)(Subspace Alignment,SA)的基礎(chǔ)上,加入了概率分布自適應(yīng);同年又提出二階特征對齊的方法,對兩個領(lǐng)域進(jìn)行二階特征對齊,通過學(xué)習(xí)二階特征變換矩陣,使得源域和目標(biāo)域的特征距離最小。Ghifary M等[14]從增量學(xué)習(xí)中獲得啟發(fā):把源域和目標(biāo)域看成高維空間(即格拉斯曼流形)中的兩個點(diǎn),在這兩個點(diǎn)的測地線距離上取d個中間點(diǎn),然后依次連接。這樣,源域和目標(biāo)域就構(gòu)成了一條測地線的路徑。只需找到每一步中合適的變換函數(shù),就能從源域變換到目標(biāo)域。Gong B等[15]提出了一種基于核學(xué)習(xí)的測地線流式核(Geodesic Flow Kernel,GFK)的方法,利用路徑上無窮個點(diǎn)的積分,解決了如何確定中間點(diǎn)的個數(shù)問題;又提出根據(jù)領(lǐng)域秩的度量,解決了多源域與目標(biāo)域的距離。
隨著遷移學(xué)習(xí)的價值不斷得到挖掘,機(jī)械設(shè)備故障診斷的研究主要集中在復(fù)雜工況下和數(shù)據(jù)不平衡條件下的診斷預(yù)測問題。
目前,針對變工況下機(jī)械設(shè)備的故障診斷預(yù)測研究主要集中于如何消除或優(yōu)化變工況情況下的數(shù)據(jù)分布不一致的問題。
在復(fù)雜工況下,機(jī)械設(shè)備的特征空間和類別空間一致的基礎(chǔ)上,沈飛等[16-17]提出一種基于自相關(guān)矩陣奇異值分解的特征提取和遷移學(xué)習(xí)分類器相結(jié)合的方法,用于變轉(zhuǎn)速、變負(fù)載條件下的電機(jī)故障診斷。陳超等[18]針對復(fù)雜工況環(huán)境導(dǎo)致的目標(biāo)診斷數(shù)據(jù)無法直接獲取、訓(xùn)練與測試數(shù)據(jù)分布特性存在差異的問題,提出基于地柜定量分析和改進(jìn)最小二乘支持向量機(jī)相結(jié)合的方法。譚俊杰等[19]以無監(jiān)督遷移成分和深度信念網(wǎng)絡(luò)結(jié)合的方法,提高樣本識別精度。顧濤勇等[20]針對航空維修保障的故障概率預(yù)測領(lǐng)域提出自適應(yīng)權(quán)重的插值擬合遷移學(xué)習(xí)算法,自適應(yīng)的調(diào)整插值、擬合各部分的比例,規(guī)避了數(shù)據(jù)貧化所帶來的預(yù)測風(fēng)險,同時減少了負(fù)遷移現(xiàn)象。Ding Z等[21]提出了一種魯棒度量學(xué)習(xí)框架,消除了樣本空間中兩域的分布差異。Long M等[22]提出一種深度遷移學(xué)習(xí)與自編碼結(jié)合的診斷方法,實(shí)現(xiàn)領(lǐng)域自適應(yīng)。Wen L等[23]建立了一種新的深度遷移學(xué)習(xí)故障診斷方法,提出的方法通過不同工況條件下的軸承數(shù)據(jù)進(jìn)行驗(yàn)證。Zhang X S等[24]提出了一種魯棒轉(zhuǎn)移度量學(xué)習(xí)方法(RTML)框架,消除了樣本空間中兩個域的邊界分布和條件分布差異。
在域類別空間一致的基礎(chǔ)上,將采集到的機(jī)械設(shè)備的特征數(shù)據(jù)遷移到工業(yè)現(xiàn)場設(shè)備所部署的智能模型中,完成不同機(jī)械設(shè)備之間監(jiān)測數(shù)據(jù)的特征知識遷移。
Lu W等[25]采用了最大均值差異法進(jìn)行域自適應(yīng)訓(xùn)練,建立了相應(yīng)的特征遷移模型,提升模型在不同域間的泛化能力。郭亮等[26]提出基于特征知識遷移的故障診斷方法,在所采集的足量的特征基礎(chǔ)上,構(gòu)建工業(yè)現(xiàn)場的特征模型,達(dá)到故障監(jiān)測的效果。
基于統(tǒng)計特征變換的統(tǒng)計特征對齊方法作為特征變換的故障診斷領(lǐng)域中的主要方法之一,在預(yù)測性維護(hù)領(lǐng)域中,得到廣泛使用。由于設(shè)備處于故障狀態(tài)的時間較少導(dǎo)致故障樣本數(shù)量稀缺,以至于收集到的故障樣本數(shù)量遠(yuǎn)小于正常樣本數(shù)量。同時,同類或相似設(shè)備的結(jié)構(gòu)差異、運(yùn)行條件差異等因素導(dǎo)致某設(shè)備故障樣本很難適用于其他設(shè)備,造成行業(yè)內(nèi)故障數(shù)據(jù)的稀缺。遷移學(xué)習(xí)通過構(gòu)建輔助故障分類器或利用特征空間映射來訓(xùn)練半監(jiān)督或無監(jiān)督模型。
康守強(qiáng)等[27-28]針對滾動軸承變工況條件下較難獲取大量帶標(biāo)簽的振動數(shù)據(jù),以致診斷準(zhǔn)確率低的問題,提出基于變分模態(tài)分解及多特征構(gòu)造和半監(jiān)督遷移成分分析方法相結(jié)合的滾動軸承故障診斷方法。張根保等[29]提出基于棧式稀疏自動編碼器和高階相對熵結(jié)合的故障診斷模型,利用少量的數(shù)據(jù)就可以適應(yīng)新的工況。張振良等[30]針對航空發(fā)動機(jī)軸承故障診斷過程中預(yù)測精度不足以及過擬合的問題,提出了基于遷移學(xué)習(xí)的半監(jiān)督集成學(xué)習(xí)。
由此可見,遷移學(xué)習(xí)在故障診斷數(shù)據(jù)分析和制定決策的過程中作用顯著,最主要的是可有效解決變工況和數(shù)據(jù)量少的問題,為故障診斷領(lǐng)域的研究提供了新的思路。
針對遷移學(xué)習(xí)的特點(diǎn)和目前在預(yù)測性故障診斷領(lǐng)域的研究現(xiàn)狀,未來可能的研究方向有
(1)遷移強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)可以通過邊獲得樣例邊學(xué)習(xí)的方式,利用特定的反饋函數(shù)決定最優(yōu)決策。遷移學(xué)習(xí)則可以利用其他數(shù)據(jù)上訓(xùn)練好的模型幫助訓(xùn)練。將遷移學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合,可以進(jìn)一步利用小規(guī)模數(shù)據(jù),訓(xùn)練出同數(shù)據(jù)量下其他方法所不能達(dá)到的更好的模型。目前遷移強(qiáng)化學(xué)習(xí)已經(jīng)有了一定的進(jìn)展,如何將二者更好結(jié)合,并應(yīng)用在故障診斷領(lǐng)域中,大大減少故障數(shù)據(jù)不足所引發(fā)的模型準(zhǔn)確率下降的問題,是下一步研究的重點(diǎn)。
(2)在線遷移學(xué)習(xí)
目前大多數(shù)遷移學(xué)習(xí)都采用離線方式進(jìn)行,既源域和目標(biāo)域數(shù)據(jù)都已經(jīng)獲取完成,但真實(shí)的場景往往是數(shù)據(jù)(目標(biāo)域)會以數(shù)據(jù)流的形式不間斷的輸入。目前來說,在線遷移學(xué)習(xí)在多源域和目標(biāo)域上自適應(yīng)及在線特征選擇上有一定的研究,但應(yīng)用在故障診斷領(lǐng)域方面的研究工作總體較少。與深度網(wǎng)絡(luò)結(jié)合在線遷移學(xué)習(xí),如果可以應(yīng)用在工業(yè)現(xiàn)場的故障預(yù)測方向,會大大提高機(jī)械設(shè)備的實(shí)時穩(wěn)定性,更早更快的發(fā)現(xiàn)問題,降低工業(yè)事故的風(fēng)險。
遷移學(xué)習(xí)在近幾年的發(fā)展中,已經(jīng)發(fā)展成一種分類詳細(xì)、方法眾多的學(xué)習(xí)方法,可極大的提高模型的泛化能力,并能改善小樣本下模型的訓(xùn)練精度。將遷移學(xué)習(xí)應(yīng)用到故障診斷領(lǐng)域,通過數(shù)據(jù)分布、特征選擇和特征變換等方法,克服了傳統(tǒng)機(jī)器學(xué)習(xí)變工況或小樣本數(shù)據(jù)下精度過低的弊端,可有效提高復(fù)雜工況下的設(shè)備診斷精度,并能一定程度上加快在線故障診斷的訓(xùn)練過程,減少模型訓(xùn)練時打標(biāo)簽等過程消耗的人力物力,可以更及時的反應(yīng)工業(yè)現(xiàn)場中的故障問題。但目前在故障診斷領(lǐng)域的應(yīng)用仍處于探索階段,在不同工況或復(fù)雜工況下模型的適應(yīng)能力及實(shí)時數(shù)據(jù)實(shí)時診斷或故障預(yù)測上還有很大的空間丞需研究和解決。