劉 晶,唐 震,王曉茜,竇潤(rùn)亮,季海鵬
(1.河北工業(yè)大學(xué) 人工智能與數(shù)據(jù)科學(xué)學(xué)院,天津 300400;2.河北省數(shù)據(jù)驅(qū)動(dòng)工業(yè)智能工程研究中心,天津 300400;3.天津開發(fā)區(qū)精諾瀚海數(shù)據(jù)科技有限公司,天津 300400;4.天津大學(xué) 管理與經(jīng)濟(jì)學(xué)部,天津 300072;5.河北工業(yè)大學(xué) 材料科學(xué)與工程學(xué)院,天津 300400)
工業(yè)4.0背景下,設(shè)備運(yùn)行過程越來越復(fù)雜,某些關(guān)鍵部件的故障可能導(dǎo)致整個(gè)生產(chǎn)系統(tǒng)停機(jī),因此設(shè)備故障的早期診斷和預(yù)測(cè)成為研究熱點(diǎn)[1]。近年來,數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法[2]解決了因機(jī)理復(fù)雜難以建立精確數(shù)學(xué)模型的問題,在理論上大幅提高了故障診斷的準(zhǔn)確率,受到廣泛關(guān)注。在實(shí)際應(yīng)用中,由于生產(chǎn)現(xiàn)場(chǎng)的不穩(wěn)定導(dǎo)致設(shè)備運(yùn)行數(shù)據(jù)具有強(qiáng)噪聲和復(fù)雜性,運(yùn)用數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法的實(shí)際故障診斷正確率遠(yuǎn)低于實(shí)驗(yàn)室結(jié)果,為了進(jìn)一步提高生產(chǎn)現(xiàn)場(chǎng)的準(zhǔn)確率,需要人機(jī)交互的智能輔助決策方法。
2012年谷歌公司提出知識(shí)圖譜技術(shù)[3],通過構(gòu)建結(jié)構(gòu)化的知識(shí)庫(kù),推理算法求解故障成因,實(shí)現(xiàn)由知識(shí)圖譜引導(dǎo)的設(shè)備故障診斷?;谥R(shí)圖譜的知識(shí)推理算法主要包括基于距離向量的TransE模型[4]及其衍生的模型,以及基于語(yǔ)義匹配的RESCAL模型[5]、ComplEx模型[6]、DistMult模型[7]等,目前已有學(xué)者將知識(shí)推理算法應(yīng)用于設(shè)備故障診斷。喬驥等[8]將電網(wǎng)調(diào)度中大量文本規(guī)程記錄組織為知識(shí)圖網(wǎng)絡(luò),構(gòu)建了面向電網(wǎng)故障處理輔助決策的知識(shí)圖譜應(yīng)用框架,實(shí)現(xiàn)了電網(wǎng)故障處置的解析判別、輔助決策和多維人機(jī)交互。為進(jìn)一步實(shí)現(xiàn)故障數(shù)據(jù)和知識(shí)輔助之間的聯(lián)動(dòng),周彬等[9]提出一種面向設(shè)備點(diǎn)檢故障根因分析的因果知識(shí)建模方法,該方法通過提取設(shè)備故障運(yùn)維因果知識(shí)圖,結(jié)合故障知識(shí)中混雜影響因素,實(shí)現(xiàn)設(shè)備故障語(yǔ)義關(guān)系發(fā)掘,并實(shí)現(xiàn)圖譜節(jié)點(diǎn)間隱含的因果性語(yǔ)義鏈路補(bǔ)全。為了實(shí)現(xiàn)知識(shí)庫(kù)的擴(kuò)展,劉華一等[10]提出一種基于語(yǔ)義網(wǎng)的機(jī)床故障診斷知識(shí)擴(kuò)展方法和一種應(yīng)用該方法的知識(shí)擴(kuò)展平臺(tái)體系結(jié)構(gòu),該方法利用語(yǔ)義網(wǎng)技術(shù)實(shí)現(xiàn)了對(duì)機(jī)床故障知識(shí)收集效率的提升,驗(yàn)證了故障診斷知識(shí)庫(kù)在實(shí)例擴(kuò)展方面的有效性。上述方法從故障文本中提取結(jié)構(gòu)化數(shù)據(jù),構(gòu)建設(shè)備故障知識(shí)圖譜,均取得了較好的效果。但上述方法需要依賴于大量的故障樣本作為訓(xùn)練數(shù)據(jù),由于設(shè)備的高可靠性,故障數(shù)據(jù)較難獲得,如何在小樣本情況下由知識(shí)圖譜實(shí)現(xiàn)設(shè)備故障的推理非常重要。
為實(shí)現(xiàn)小樣本情況下知識(shí)圖譜的故障推理,需要知識(shí)圖譜推理算法擁有元學(xué)習(xí)的能力。元學(xué)習(xí)[11]的目標(biāo)是使算法適應(yīng)當(dāng)前任務(wù),且能夠在新任務(wù)上利用較少的訓(xùn)練樣本取得更好的泛化表現(xiàn)?;谧罹叽硇缘脑獙W(xué)習(xí)MAML(model-agnostic meta-learning)算法[12]模型無(wú)關(guān)的思想,目前已有可在小樣本情況下實(shí)現(xiàn)知識(shí)推理的模型,包括MetaKGR(meta-based multi-hop reasoning method)[13]模型、FSRL(few-shot relation learning model)[14]模型、GANA(gated and attentive neighbor aggregator)[15]模型等,而對(duì)于非高頻三元組如何實(shí)現(xiàn)有效預(yù)測(cè),CHEN等[16]通過模型無(wú)關(guān)元學(xué)習(xí)對(duì)實(shí)體嵌入過程中的參數(shù)進(jìn)行訓(xùn)練,可以在小樣本情況下取得有價(jià)值的實(shí)體信息,實(shí)現(xiàn)了在稀疏數(shù)據(jù)集中的鏈接預(yù)測(cè)。
由上述研究可知,目前由知識(shí)圖譜引導(dǎo)的設(shè)備故障診斷算法缺乏元學(xué)習(xí)的能力,難以在在小樣本情況下推理故障成因,且在進(jìn)行知識(shí)實(shí)體的推理時(shí),未考慮知識(shí)圖譜推理算法的負(fù)樣本生成策略,導(dǎo)致隨機(jī)生成的負(fù)樣本帶來了不必要的模型訓(xùn)練開銷。通識(shí)領(lǐng)域常采用隨機(jī)替換頭尾節(jié)點(diǎn)的方法生成負(fù)樣本,但隨機(jī)替換產(chǎn)生的負(fù)樣本對(duì)于設(shè)備故障診斷并無(wú)實(shí)際意義,反而會(huì)導(dǎo)致可能相關(guān)聯(lián)的故障間因?yàn)閷?duì)負(fù)例的學(xué)習(xí)而失去聯(lián)系,或是故障診斷模型在負(fù)例中學(xué)習(xí)不到任何有價(jià)值的信息。針對(duì)上述問題,本文提出一種基于元學(xué)習(xí)的設(shè)備故障知識(shí)圖譜構(gòu)建及推理方法,該方法通過提取設(shè)備時(shí)序信號(hào)和文本規(guī)則等多源信息構(gòu)建知識(shí)圖譜,實(shí)現(xiàn)了同一故障簇可視化及相似故障查詢,提供對(duì)故障診斷決策的輔助。并通過基于元學(xué)習(xí)的故障鏈接預(yù)測(cè)算法(Meta-Fault link prediction algorithm,MetaF),實(shí)現(xiàn)在小樣本情況下故障類型的鏈接預(yù)測(cè)和設(shè)備故障診斷的推理,為實(shí)現(xiàn)更精確的模型訓(xùn)練,采用在同一故障簇鄰域的負(fù)樣本生成策略,避免了隨機(jī)替換頭尾實(shí)體導(dǎo)致預(yù)測(cè)算法無(wú)法在負(fù)例中學(xué)習(xí)到有用的知識(shí)。最后在公開數(shù)據(jù)集上驗(yàn)證了模型故障診斷能力,證明了本文故障診斷提供輔助決策的有效性。
基于元學(xué)習(xí)的設(shè)備故障知識(shí)圖譜構(gòu)建及推理方法框架如圖1所示。該方法包括基于設(shè)備故障信息知識(shí)圖譜構(gòu)建和基于元學(xué)習(xí)的故障鏈接預(yù)測(cè)算法MetaF兩個(gè)模塊。其中,基于設(shè)備故障信息知識(shí)圖譜構(gòu)建實(shí)現(xiàn)對(duì)設(shè)備文本數(shù)據(jù)的分類提取和設(shè)備時(shí)序數(shù)據(jù)的特征提取,得到設(shè)備故障規(guī)則鏈的描述和故障特征信息,結(jié)合故障規(guī)則和信號(hào)特征后實(shí)現(xiàn)知識(shí)圖譜的構(gòu)建?;谠獙W(xué)習(xí)的故障鏈接預(yù)測(cè)算法MetaF分別接收支持集和查詢集的任務(wù)實(shí)現(xiàn)小樣本情況下的故障診斷,支持集訓(xùn)練數(shù)據(jù)通過元學(xué)習(xí)N-way、K-shot的方式劃分得到多組任務(wù),輸入MetaF訓(xùn)練算法,查詢集則驗(yàn)證模型在新鏈接預(yù)測(cè)任務(wù)上的泛化效果。在MetaF中采用同一故障簇鄰域的負(fù)樣本生成策略進(jìn)行負(fù)樣本的生成,通過TransE算法進(jìn)行故障實(shí)體的鏈接預(yù)測(cè),最終輸出對(duì)故障類型的診斷推理結(jié)果,并提供相似故障列表查詢,為故障診斷提供輔助決策。
針對(duì)傳統(tǒng)故障診斷方法缺乏故障信息結(jié)構(gòu)化管理能力的問題,提出一種構(gòu)建基于設(shè)備故障信息知識(shí)圖譜方法,并將其數(shù)據(jù)進(jìn)行劃分以適應(yīng)于元學(xué)習(xí)訓(xùn)練。構(gòu)建知識(shí)圖譜的方法如圖2所示,對(duì)于設(shè)備運(yùn)行生成的故障信息,首先從設(shè)備數(shù)據(jù)的文本描述中提取知識(shí)圖譜的故障規(guī)則鏈,其次從設(shè)備運(yùn)行數(shù)據(jù)中提取信號(hào)特征信息,最后將信號(hào)特征和故障規(guī)則鏈結(jié)合,生成統(tǒng)一描述形式的節(jié)點(diǎn)信息,完成知識(shí)圖譜的構(gòu)建。
對(duì)于設(shè)備故障信息知識(shí)圖譜的定義如式(1)所示:
(1)
式中:E={e1,e2,…,en}(n<|E|)為n個(gè)實(shí)體集合,R={r1,r2,…,rm}(m<|R|)為實(shí)體間關(guān)系集合。構(gòu)建知識(shí)圖譜,需要從設(shè)備故障數(shù)據(jù)的文本數(shù)據(jù)中抽取故障規(guī)則,為不同故障類型定義分類標(biāo)準(zhǔn)。設(shè)備文本數(shù)據(jù)可以總結(jié)出多種工況特征,而設(shè)備運(yùn)行數(shù)據(jù)是在多種工況特征疊加下產(chǎn)生的結(jié)果,因此定義圖譜中的兩類節(jié)點(diǎn),分別為故障類型節(jié)點(diǎn)和故障時(shí)序片段節(jié)點(diǎn)。故障類型節(jié)點(diǎn)為某一工況下的實(shí)體表示,故障時(shí)序片段節(jié)點(diǎn)為多種工況疊加下,設(shè)備運(yùn)行時(shí)序信號(hào)采樣片段的實(shí)體表示。以某一工況下設(shè)備運(yùn)行記錄文件為例,將文本抽取為故障規(guī)則的方法如圖3所示。假設(shè)取得一個(gè)由“外圈故障”“014深度損傷”“風(fēng)扇端”這3種類型工況疊加得到的混合工況記錄文件,則分別定義“故障點(diǎn)位置”“損傷深度”“檢測(cè)位置”3種故障類型節(jié)點(diǎn)與3種工況類型對(duì)應(yīng),并定義一個(gè)故障時(shí)序片段節(jié)點(diǎn)與該混合工況記錄對(duì)應(yīng),且存在<故障時(shí)序片段節(jié)點(diǎn),belong_to,故障類型節(jié)點(diǎn)>的三元組關(guān)系。
由此得到知識(shí)圖譜中三元組的定義,如式(2)所示。對(duì)于圖譜中的所有故障規(guī)則鏈s=(h,r,t),均有s?S,r為實(shí)體節(jié)點(diǎn)間關(guān)系描述。
S={(h,r,t)|h,t∈E,r∈R}。
(2)
進(jìn)一步的,為獲得圖譜節(jié)點(diǎn)的嵌入向量形式描述,需要對(duì)設(shè)備時(shí)序數(shù)據(jù)進(jìn)行信號(hào)分解并提取特征值,將其存儲(chǔ)為知識(shí)圖譜的形式化表達(dá)結(jié)構(gòu),便于知識(shí)圖譜鏈接預(yù)測(cè)算法直接處理。對(duì)選定的時(shí)序片段序列,對(duì)其進(jìn)行變分模態(tài)分解(Variational Mode Decomposition,VMD),VMD分解通過求變分模型最優(yōu)解確定信號(hào)的各本征模態(tài)函數(shù)(Intrinsic Mode Functions,IMFs)分量,最終實(shí)現(xiàn)信號(hào)頻譜劃分和各本征模態(tài)函數(shù)分量的分離。求解模態(tài)分量方法如式(3)~式(5)所示。求解約束變分問題如公式(3)所示:
s.t.
(3)
式中:{uk}為分解得到的IMFs分量,{ωk}為IMFs分量的中心頻率,K為分解的IMFs數(shù)量。采用二次懲罰因子β和拉格朗日乘數(shù)λ將約束問題轉(zhuǎn)化為非約束問題,如式(4)所示:
L({uk},{ωk},λ)=
(4)
最后將上述問題通過交替方向乘子法求解,uk和ωk的最小值求解方法如式(5)所示:
(5)
其中:n為迭代次數(shù),當(dāng)?shù)綕M足收斂條件(6)時(shí)停止;ε為給定的判定精度,
(6)
根據(jù)VMD分解得到K個(gè)模態(tài)分量IMFs={IMFs1,IMFs2,…,IMFsK}后,為使知識(shí)圖譜鏈接預(yù)測(cè)算法獲取時(shí)序信號(hào)特征數(shù)據(jù),需要對(duì)IMFs分量求解其波形因子得其一維信號(hào)特征。波形因子是訊號(hào)的均方根值和整流平均值的比值,常用于時(shí)序信號(hào)的故障診斷任務(wù),其計(jì)算如式(7)所示:
(7)
由IMFs提取的{form1,form2,…,formk}波形因子矩陣為故障特征向量矩陣,矩陣每列為L(zhǎng)維的向量,例如formk={line1,line2,…,lineL},對(duì)應(yīng)在第k維模態(tài)分解的向量上L個(gè)知識(shí)圖譜節(jié)點(diǎn)數(shù)據(jù)。
綜上,完成設(shè)備故障信息知識(shí)圖譜的構(gòu)建,故障規(guī)則鏈和故障特征值分別存儲(chǔ)于故障圖譜規(guī)則層和故障圖譜數(shù)據(jù)層。在圖譜的兩個(gè)層級(jí)間定義模式映射<故障時(shí)序片段節(jié)點(diǎn),故障特征節(jié)點(diǎn)>,映射表示同一故障時(shí)序片段在兩個(gè)不同層級(jí)之間的不同存儲(chǔ)方式。
根據(jù)設(shè)備故障信息知識(shí)圖譜的數(shù)據(jù)形式,需要將其三元組劃分為元學(xué)習(xí)任務(wù)的形式。因?yàn)樵O(shè)備故障信息構(gòu)建的圖譜中,實(shí)體數(shù)量遠(yuǎn)遠(yuǎn)多于實(shí)體間關(guān)系的數(shù)量,由此設(shè)置關(guān)系為任務(wù)的劃分依據(jù)。此外,故障實(shí)體間的語(yǔ)義信息是由關(guān)系進(jìn)行連接的,由此通過關(guān)系進(jìn)行元學(xué)習(xí)任務(wù)參數(shù)訓(xùn)練是合理的。根據(jù)N-way,K-shot的原則,對(duì)元學(xué)習(xí)訓(xùn)練任務(wù)的三元組劃分方法如圖4所示。對(duì)于三元組數(shù)據(jù)集D,劃分為支持集訓(xùn)練數(shù)據(jù)Dtrain和查詢集驗(yàn)證數(shù)據(jù)Dtest,并對(duì)Dtrain進(jìn)一步分為n個(gè)任務(wù)組:Task1、Task2、…、Taskn。對(duì)于每一個(gè)任務(wù)組,其內(nèi)部均選取同一種關(guān)系的三元組,分別作為該組任務(wù)的訓(xùn)練支持集Strain和訓(xùn)練查詢集Qtrain。
如圖4中的任務(wù)劃分方式,即使某一類的故障樣本數(shù)量較稀少,也可通過在任務(wù)中重復(fù)使用該樣本以實(shí)現(xiàn)數(shù)據(jù)增強(qiáng),解決了樣本數(shù)量少和稀缺故障難提取的問題。
針對(duì)實(shí)際工況下故障數(shù)據(jù)稀缺的問題提出MetaF算法,該算法基于元學(xué)習(xí)的鏈接預(yù)測(cè)算法融入了同一故障簇鄰域的負(fù)樣本生成策略。對(duì)于知識(shí)圖譜算法而言,生成負(fù)樣本的目標(biāo)是提供高質(zhì)量的負(fù)三元組樣本,隨機(jī)生成的負(fù)樣本對(duì)于故障診斷鏈接預(yù)測(cè)算法的訓(xùn)練并無(wú)實(shí)際意義,會(huì)對(duì)最終訓(xùn)練結(jié)果產(chǎn)生影響。受知識(shí)圖譜推理算法RippleNet[17]啟發(fā),同一故障簇鄰域的負(fù)樣本生成策略模擬了水波紋的傳播方式,在知識(shí)圖譜中以需要替換的頭實(shí)體或尾實(shí)體為種子,在限定范圍的區(qū)域內(nèi)以種子為中心向外逐層查詢其他節(jié)點(diǎn)與待替換節(jié)點(diǎn)的相似度,其擴(kuò)散查詢方式如圖5所示。
(8)
(9)
(10)
(11)
(12)
當(dāng)替換頭實(shí)體時(shí),生成的負(fù)樣本三元組S如式(13)所示,當(dāng)替換尾實(shí)體時(shí),生成的負(fù)樣本三元組S如式(14)所示。因?yàn)樘鎿Q的節(jié)點(diǎn)是與起始節(jié)點(diǎn)相似度最小的,所以對(duì)應(yīng)的三元組應(yīng)被作為故障推理模型訓(xùn)練時(shí)的負(fù)例學(xué)習(xí),以獲得較高質(zhì)量的故障關(guān)聯(lián)信息學(xué)習(xí)。
(13)
(14)
MetaF算法結(jié)構(gòu)如圖6所示。設(shè)置MetaF為兩層結(jié)構(gòu),通過鄰域負(fù)樣本生成策略構(gòu)建三元組負(fù)例,分別實(shí)現(xiàn)在支持集中關(guān)系元信息的學(xué)習(xí),以及查詢集中新實(shí)例的任務(wù)學(xué)習(xí)。MetaF在每一輪任務(wù)學(xué)習(xí)中進(jìn)行關(guān)系元的更新和故障類型的鏈接預(yù)測(cè),即通過訓(xùn)練數(shù)據(jù)更新關(guān)系元和梯度元,預(yù)測(cè)與給定缺失三元組具有關(guān)系的故障實(shí)體節(jié)點(diǎn),預(yù)測(cè)結(jié)果為故障診斷的結(jié)果。
MetaF在小樣本情況下的故障診斷主要步驟如下:
在支持集中,對(duì)輸入的三元組(hi,ti,ri),通過關(guān)系元學(xué)習(xí)器計(jì)算其關(guān)系元信息RTr,在關(guān)系元學(xué)習(xí)器中L層的神經(jīng)網(wǎng)絡(luò)計(jì)算對(duì)應(yīng)輸入三元組的關(guān)系元信息R(hi,ti),如式(15)~式(17)所示,其中L為神經(jīng)網(wǎng)絡(luò)層數(shù)且l∈(1,2,…,L-1),Wl為第l層權(quán)重,bl為第l層偏置項(xiàng)。
(15)
(16)
(17)
對(duì)于提取到的多個(gè)關(guān)系元信息,使用求平均的方法計(jì)算該趟任務(wù)的關(guān)系元信息RTr,如式(18)所示,其中K表示該趟任務(wù)參與訓(xùn)練的關(guān)系元數(shù)量。
(18)
依據(jù)知識(shí)圖譜鏈接預(yù)測(cè)算法TransE,計(jì)算當(dāng)前關(guān)系元RTr對(duì)于三元組的尾節(jié)點(diǎn)S(hi,ti),此處使用的評(píng)分函數(shù)如式(19)所示,其中‖x‖表示計(jì)算向量x的L-2范數(shù),且S(hi,ti)取值越低表示三元組計(jì)算結(jié)果越準(zhǔn)確,反之則表示該三元組為負(fù)樣本。
(19)
(20)
依據(jù)損失函數(shù)L(Sr)的計(jì)算,可以計(jì)算該關(guān)系元的梯度以指導(dǎo)參數(shù)變化。梯度元GTr的計(jì)算如式(21)所示:
(21)
(22)
實(shí)現(xiàn)關(guān)系元的更新后,即可在查詢集中鏈接預(yù)測(cè)未知三元組(hj,tj,rj)′的對(duì)應(yīng)故障尾節(jié)點(diǎn)S(hj,tj),且在查詢集中的得分函數(shù)和損傷分別如式(23)和式(24)所示:
(23)
(24)
為驗(yàn)證MetaF在知識(shí)圖譜網(wǎng)絡(luò)中的鏈接預(yù)測(cè)能力,以及小樣本情況下算法的有效性,選擇公開數(shù)據(jù)集NELL-One作為實(shí)驗(yàn)的基準(zhǔn)數(shù)據(jù)集。NELL數(shù)據(jù)集是在互聯(lián)網(wǎng)信息中自動(dòng)抽取新知識(shí)的知識(shí)庫(kù),NELL-One是NELL知識(shí)圖譜數(shù)據(jù)集的子集,其根據(jù)關(guān)系出現(xiàn)的次數(shù),選擇小于500次且大于50次的三元組,提取并重新組合為數(shù)據(jù)集,常用于驗(yàn)證算法在小樣本情況下知識(shí)圖譜的鏈接預(yù)測(cè)能力。
為評(píng)估模型效果,根據(jù)關(guān)系出現(xiàn)的頻率確定三元組出現(xiàn)的頻率,定義出現(xiàn)頻率較低的關(guān)系為目標(biāo)關(guān)系,用于評(píng)估小樣本情況下的效果,非低頻關(guān)系為背景關(guān)系。采用Pre-Train和In-Train兩種模型訓(xùn)練方法分別評(píng)估其效果,Pre-Train在模型訓(xùn)練前結(jié)合背景關(guān)系進(jìn)行模型預(yù)訓(xùn)練,In-Train為直接使用背景關(guān)系和目標(biāo)關(guān)系直接訓(xùn)練模型。選擇MRR、Hits@10、Hits@5、Hits@1作為實(shí)驗(yàn)評(píng)估指標(biāo),MRR為測(cè)試集數(shù)據(jù)上的平均排名,Hits@10、Hits@5、Hits@1分別為正確結(jié)果在預(yù)測(cè)結(jié)果中排名前10、前5、前1的比例。對(duì)比試驗(yàn)選擇的模型為FSRL[14]、GANA[15]、MetaR[16]算法,分別在1-shot和5-shot兩種情況下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表1和表2所示。
表1 1-shot實(shí)驗(yàn)結(jié)果 %
表2 5-shot實(shí)驗(yàn)結(jié)果 %
根據(jù)實(shí)驗(yàn)結(jié)果可看出,由MetaR優(yōu)化得到的MetaF在1-shot和5-shot兩種情況下,于In-Train的模型訓(xùn)練中均取得了優(yōu)于原始模型的效果。對(duì)于FSRL模型,MetaF在MRR上獲得了3.7%(1-shot)和2.5%(5-shot)的提升,在Hits@10上獲得了2.1%(1-shot)和3.2%(5-shot)的提升;而對(duì)于GANA模型,MetaF在MRR上獲得了2.5%(1-shot)和0.8%(5-shot)的提升,在Hits@10上獲得了1.9%(1-shot)和0.9%(5-shot)的提升,說明MetaF在鏈接預(yù)測(cè)的性能上與當(dāng)前主流方法基本一致。在Pre-Train訓(xùn)練中,MetaF與MetaR相比并未取得明顯的進(jìn)步,由于Pre-Trian過程會(huì)對(duì)實(shí)體嵌入進(jìn)行預(yù)訓(xùn)練,且根據(jù)負(fù)樣本生成策略增加了數(shù)據(jù)集中僅出現(xiàn)一次的三元組數(shù)量,因此影響了MetaF在知識(shí)圖譜中鏈接預(yù)測(cè)的表現(xiàn)。對(duì)于In-Train訓(xùn)練,MetaF較MetaR在MRR上取得了5.2%(1-shot)和2.2%(5-shot)的進(jìn)步,而對(duì)于發(fā)現(xiàn)相似故障列表最有評(píng)估價(jià)值的Hits@10,MetaF較MetaR取得了7.7%(1-shot)和2.9%(5-shot)的進(jìn)步。說明MetaF可有效在包含背景知識(shí)的訓(xùn)練過程In-Trian中進(jìn)行鏈接預(yù)測(cè)任務(wù)。
故障診斷實(shí)驗(yàn)分為設(shè)備故障信息知識(shí)圖譜的構(gòu)建和MetaF故障推理兩個(gè)部分,首先抽取故障數(shù)據(jù)集特征信息并構(gòu)建知識(shí)圖譜,將圖譜以三元組的形式存儲(chǔ)于txt文本文檔和csv文件中,并將圖譜導(dǎo)入Neo4j數(shù)據(jù)庫(kù),MetaF模型使用PyTorch包構(gòu)建模型進(jìn)行訓(xùn)練。
2.2.1 數(shù)據(jù)集介紹
實(shí)驗(yàn)選取設(shè)備故障診斷領(lǐng)域常用的美國(guó)凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)滾動(dòng)軸承故障數(shù)據(jù)集,已有多篇文獻(xiàn)使用該數(shù)據(jù)集驗(yàn)證算法[18-19]。CWRU數(shù)據(jù)集包含由加速度傳感器采集的軸承振動(dòng)信號(hào)數(shù)據(jù)和對(duì)應(yīng)的機(jī)理說明文檔。CWRU數(shù)據(jù)包括在軸承試驗(yàn)臺(tái)驅(qū)動(dòng)端(Drive)、風(fēng)扇端(Fan)和基座端(Base)采集的振動(dòng)信號(hào)。采用電火花加工單點(diǎn)損傷,損傷直徑有0.007英寸、0.014英寸、0.021英寸3種,損傷部位有內(nèi)圈、外圈和滾動(dòng)體3種,其中外圈損傷點(diǎn)分別在3點(diǎn)鐘、6點(diǎn)鐘、12點(diǎn)鐘的方位設(shè)置。
2.2.2 設(shè)備故障信息知識(shí)圖譜的構(gòu)建
實(shí)驗(yàn)選取了CWRU數(shù)據(jù)集中所有12 kHz數(shù)據(jù),根據(jù)數(shù)據(jù)集的文本規(guī)則描述,對(duì)數(shù)據(jù)進(jìn)行分類提取,總結(jié)出5種分類可以為數(shù)據(jù)進(jìn)行劃分,具體為:端點(diǎn)、故障點(diǎn)位置、損傷深度、載荷和檢測(cè)位置,如表3所示。
表3 CWRU數(shù)據(jù)集分類規(guī)則
根據(jù)以上分類規(guī)則,可得圖譜中節(jié)點(diǎn)間的對(duì)應(yīng)關(guān)系,如表4所示。根據(jù)每一個(gè)故障采樣片段在5個(gè)維度上的屬性值,得到故障時(shí)序片段節(jié)點(diǎn)和故障類型節(jié)點(diǎn)間的連接關(guān)系。
表4 節(jié)點(diǎn)間對(duì)應(yīng)關(guān)系
根據(jù)設(shè)備故障信息知識(shí)圖譜的節(jié)點(diǎn)定義和數(shù)據(jù)關(guān)系,對(duì)軸承故障信號(hào)劃分片段并進(jìn)行變分模態(tài)分解,生成的特征向量與節(jié)點(diǎn)結(jié)合構(gòu)建知識(shí)圖譜,提取到1 196個(gè)實(shí)體和6種關(guān)系,構(gòu)建得到的知識(shí)圖譜局部結(jié)構(gòu)如圖7所示,其描述了CWRU軸承故障數(shù)據(jù)在端點(diǎn)、故障點(diǎn)位置、損傷深度、載荷和檢測(cè)位置這5種維度下的關(guān)聯(lián)方式,并實(shí)現(xiàn)了不同類型故障下的故障片段間的知識(shí)鏈接。知識(shí)圖譜中任意兩個(gè)故障時(shí)序片段節(jié)點(diǎn)間的距離均為兩跳,中間由與其相關(guān)聯(lián)的故障類型節(jié)點(diǎn)連接,這樣的結(jié)構(gòu)便于在某一區(qū)域內(nèi)鏈接預(yù)測(cè)故障片段真正的故障類型。
2.2.3 故障推理實(shí)驗(yàn)和分析
為驗(yàn)證在小樣本條件下,MetaF可以較好地完成故障推理任務(wù),選取4種不同工況下的設(shè)備正常運(yùn)行數(shù)據(jù)為基準(zhǔn),并以9:1的比例將正常數(shù)據(jù)與故障數(shù)據(jù)混合,構(gòu)建小樣本故障數(shù)據(jù)集,數(shù)據(jù)集的劃分如表5所示。
表5 小樣本故障數(shù)據(jù)集劃分方法
分別測(cè)試4組小樣本數(shù)據(jù)集在MetaF數(shù)據(jù)集上的表現(xiàn)效果,以平均排名MRR和精確率Precision為評(píng)價(jià)指標(biāo),驗(yàn)證算法推理故障實(shí)體的能力。MetaF由鄰域負(fù)樣本生成模塊和故障鏈接預(yù)測(cè)模塊組成,因此設(shè)置移除鄰域負(fù)樣本生成模塊作為消融實(shí)驗(yàn)對(duì)照組,記為模型M_min,該組實(shí)驗(yàn)僅使用隨機(jī)生成的負(fù)樣本,以驗(yàn)證負(fù)樣本生成策略的有效性,故障診斷實(shí)驗(yàn)和消融實(shí)驗(yàn)如表6所示。
表6 故障診斷實(shí)驗(yàn)和消融實(shí)驗(yàn) %
由表6的故障診斷實(shí)驗(yàn)結(jié)果可以看出,MetaF在4組故障樣本稀疏的數(shù)據(jù)集上均表現(xiàn)出較為均衡的效果,并未因?yàn)楣收项愋偷牟煌瑢?dǎo)致模型性能的變化。對(duì)于表6中作為對(duì)照的消融實(shí)驗(yàn)結(jié)果,MetaF比作為對(duì)照的M_min,在MRR和Precision上均有提升,對(duì)于4個(gè)數(shù)據(jù)集,MetaF在MRR上的提升分別為6.8%、6.4%、7.3%和7.2%,并且MetaF在Precision上的提升分別為14.1%、14.0%、13.6%和13.2%,說明鄰域負(fù)樣本生成模塊的加入有效提高了MetaF推理故障實(shí)體的能力,同時(shí)表明MetaF在小樣本數(shù)據(jù)的故障診斷中表現(xiàn)良好。
由于傳統(tǒng)基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法無(wú)法結(jié)構(gòu)化管理故障特征信息,在故障數(shù)據(jù)內(nèi)容發(fā)生變化時(shí),需要重新訓(xùn)練模型。而基于知識(shí)圖譜的方法因?yàn)橐延袑?duì)故障信息的描述,在理論上具有一定程度的優(yōu)勢(shì),選取DS_01小樣本數(shù)據(jù)集為實(shí)驗(yàn)數(shù)據(jù),驗(yàn)證知識(shí)圖譜方法對(duì)比數(shù)據(jù)驅(qū)動(dòng)方法,在模型收斂速度和運(yùn)行時(shí)間上的優(yōu)勢(shì)。選取故障診斷領(lǐng)域常用的LSTM算法[20]與MetaF算法對(duì)比,模型的損失值曲線對(duì)比如圖8所示,平均運(yùn)行時(shí)間對(duì)比如圖9所示。
根據(jù)實(shí)驗(yàn)結(jié)果顯示,MetaF獲得了比數(shù)據(jù)驅(qū)動(dòng)的LSTM算法更快的模型收斂速度和更短的平均運(yùn)行時(shí)間,說明基于知識(shí)圖譜的方法在模型的運(yùn)行速度和運(yùn)行時(shí)間上優(yōu)于基于數(shù)據(jù)的方法,MetaF依賴結(jié)構(gòu)化的故障信息存儲(chǔ),有效利用了已知信息加快故障樣本向量計(jì)算的速度,實(shí)現(xiàn)故障診斷的效率提升。
2.2.4 相似故障查詢結(jié)果和分析
MetaF實(shí)現(xiàn)相似故障查詢的流程如圖10所示,在輸入故障采樣片段后,MetaF通過知識(shí)圖譜中已有故障信息確定樣本故障類型并更新模型,得到故障類型后更新知識(shí)圖譜,最后在更新的節(jié)點(diǎn)鄰域內(nèi)進(jìn)行可視化的相似故障查詢。
實(shí)驗(yàn)隨機(jī)選取CWRU數(shù)據(jù)驗(yàn)證集中的一段采樣片段作為輸入,采樣長(zhǎng)度為1 600,將該采樣片段進(jìn)行模態(tài)分解后輸入MetaF模型進(jìn)行故障類型的診斷,并根據(jù)診斷結(jié)果進(jìn)行相似故障查詢,查詢結(jié)果如圖11所示。根據(jù)輸入的故障片段,可查詢出一組目標(biāo)相似故障簇,以及3組其他相似故障簇。
對(duì)于查詢得到的相似故障列表,根據(jù)故障向量間的歐式距離進(jìn)行故障相似度的評(píng)分,對(duì)于任一組故障向量P={p1,p2,…,pk}和Q={q1,q2,…,qk},其故障相似度Fault_Similarity計(jì)算方法如式(25)所示,式中k表示向量的維數(shù)。
(25)
根據(jù)輸入的故障片段,分別與求得的相似故障列表中每一項(xiàng)計(jì)算其故障相似度,得到評(píng)分結(jié)果統(tǒng)計(jì)如圖12所示。
根據(jù)評(píng)分結(jié)果,可得片段141130020、片段141230070、片段141230040、片段141230010這4組數(shù)據(jù)與輸入故障最相似,進(jìn)一步查表可得這4組數(shù)據(jù)與輸入故障均為故障類型faultType = {point:Drive,located:B,deepth:007,load:1}。在推理的14個(gè)相似故障中發(fā)現(xiàn)4個(gè)故障樣本與輸入故障相似,則稱目標(biāo)相似故障簇的樣本檢出率為28.6%。通過該組相似故障查詢實(shí)驗(yàn),可說明本文提出的方法在故障診斷應(yīng)用上的有效性。為進(jìn)一步說明MetaF的故障推理能力較于MetaR有提升,分別對(duì)比兩種模型在相似故障查詢中目標(biāo)相似故障簇的樣本檢出率。設(shè)置實(shí)驗(yàn)分別在相似故障列表長(zhǎng)度為10、15、20的情況下進(jìn)行,每組實(shí)驗(yàn)進(jìn)行10次取其結(jié)果的平均值,實(shí)驗(yàn)結(jié)果如表7所示。
表7 目標(biāo)相似故障簇的樣本檢出率 %
由表7的實(shí)驗(yàn)結(jié)果可看出,MetaF在相似故障列表長(zhǎng)度分別為10、15、20時(shí),MetaF相較于MetaR提升了11.1%、6.4%、8.5%,說明同一故障簇鄰域負(fù)樣本生成策略的加入提升了模型故障診斷的能力,并通過相似故障查詢有效輔助了故障決策。
2.2.5 實(shí)際工程應(yīng)用案例分析
以電力變壓器故障數(shù)據(jù)診斷為例,驗(yàn)證MetaF發(fā)現(xiàn)設(shè)備故障和相似故障查詢的有效性。電力變壓器運(yùn)行數(shù)據(jù)包括正常運(yùn)行以及低能放電、低溫過熱、高能放電、高溫過熱、中低溫過熱和中溫過熱這6種故障。依據(jù)5種變壓器綜合故障特征,定義變壓器數(shù)據(jù)標(biāo)簽為fault_tag={feature01,feature02,feature03,feature04,feature05},5種特征分別對(duì)應(yīng)變壓器五種油中溶解氣體含量計(jì)算得到的特征值,將已有數(shù)據(jù)劃分為DGA_01={正常運(yùn)行,低能放電,低溫過熱},DGA_02={正常運(yùn)行,高能放電,高溫過熱},DGA_03={正常運(yùn)行,中低溫過熱、中溫過熱}3組實(shí)驗(yàn)數(shù)據(jù),將正常數(shù)據(jù)和故障數(shù)據(jù)以9:1的比例混合,分別在3個(gè)數(shù)據(jù)集上進(jìn)行知識(shí)圖譜構(gòu)建,并在圖譜基礎(chǔ)上完成故障診斷任務(wù)。變壓器故障圖譜的構(gòu)建及其故障診斷結(jié)果分別如圖13和圖14所示。
圖14分別是MetaF在3組變壓器故障數(shù)據(jù)的精確率和相似故障的樣本檢出率,可看出相較于CWRU數(shù)據(jù)集,變壓器數(shù)據(jù)獲得了更高的相似故障樣本檢出率,這是由于變壓器數(shù)據(jù)構(gòu)建的知識(shí)圖譜結(jié)構(gòu)相對(duì)簡(jiǎn)單,因此獲得了更高的相似故障命中。根據(jù)實(shí)驗(yàn)驗(yàn)證了MetaF在完成較高準(zhǔn)確度的故障診斷時(shí),還可提供較好的相似故障查詢,有效輔助了設(shè)備故障診斷決策。
針對(duì)小樣本情況下難以構(gòu)建故障數(shù)據(jù)知識(shí)圖譜,從而導(dǎo)致推理算法無(wú)法準(zhǔn)確實(shí)現(xiàn)故障診斷的問題,本文提出一種基于元學(xué)習(xí)的設(shè)備故障知識(shí)圖譜構(gòu)建及推理方法。該方法包括兩部分:第一部分為根據(jù)故障數(shù)據(jù)文本描述提取數(shù)據(jù)的分類規(guī)則,構(gòu)建本體模型的故障規(guī)則鏈,并提取故障數(shù)據(jù)中的特征信息作為故障規(guī)則鏈的數(shù)據(jù)信息,實(shí)現(xiàn)設(shè)備故障信息知識(shí)圖譜的構(gòu)建;第二部分利用同一故障簇鄰域范圍內(nèi)的負(fù)樣本生成策略,通過MetaF模型進(jìn)行小樣本情況下的故障診斷和相似故障列表查詢,實(shí)現(xiàn)對(duì)設(shè)備運(yùn)行數(shù)據(jù)的故障診斷決策輔助。實(shí)驗(yàn)結(jié)果表明,MetaF有效提高了在知識(shí)圖譜上推理的準(zhǔn)確率,并能有效利用設(shè)備運(yùn)行數(shù)據(jù)構(gòu)建故障診斷領(lǐng)域知識(shí)圖譜,提供相似故障列表和可視化的相似故障簇,為故障診斷提供了有效的知識(shí)支撐。