閆 浩 王福利 , 孫鈺灃 何大闊 ,
電熔鎂砂又稱電熔氧化鎂,是優(yōu)質(zhì)菱鎂礦石在電熔鎂爐中經(jīng)高溫熔融后形成的高純氧化物.作為重要的耐火材料,電熔鎂砂已被廣泛應(yīng)用于電子器件、陶瓷、化工及航空航天等領(lǐng)域.在電熔鎂砂的熔煉過程中,由于各種原材料可能來自不同地域,質(zhì)量會有很大差異.電熔鎂爐通過控制系統(tǒng),根據(jù)不同條件跟蹤不同的電流設(shè)定點來完成熔煉過程.當(dāng)原料的顆粒大小或成分發(fā)生變化時,如果電流的設(shè)定點未被及時合理地調(diào)整,則會發(fā)生異常.異常工況的發(fā)生將導(dǎo)致高能耗、產(chǎn)品性能下降甚至安全威脅.因此,有必要對異常工況進(jìn)行準(zhǔn)確的識別,以避免造成嚴(yán)重后果.異常工況的發(fā)生具有一定隨機(jī)性,這取決于原材料的質(zhì)量和操作條件.隨著控制算法的改進(jìn),異常工況的發(fā)生率不斷降低.這種情況有利于生產(chǎn)合格的電熔鎂砂,卻也導(dǎo)致異常工況數(shù)據(jù)的收集變得更加困難.尤其是單個電熔鎂爐的異常工況數(shù)據(jù)非常有限.如果僅依靠少量的異常工況數(shù)據(jù)來建立異常工況識別模型,準(zhǔn)確性將無法滿足實際要求.
目前,一些針對電熔鎂爐熔煉過程的異常工況識別和安全控制的研究成果已被相繼提出[1?11].在文獻(xiàn)[7]中,一種基于核主成分分析和核偏最小二乘模型的故障診斷方法被應(yīng)用于電熔鎂爐熔煉過程中,但是該方法無法識別異常工況的類型.在文獻(xiàn)[8]中,基于操作人員判斷和消除異常工況的經(jīng)驗,一種數(shù)據(jù)驅(qū)動的異常工況識別及自愈控制方法被提出.但是,文獻(xiàn)[8]僅利用了電流特征進(jìn)行異常工況識別,而沒有融合多源信息,并且不能區(qū)分異常工況的嚴(yán)重程度.在文獻(xiàn)[9?10]中,通過融合電流、圖像和聲音等多源信息,提出了一種基于貝葉斯網(wǎng)絡(luò)(Bayesian network,BN)的電熔鎂爐熔煉過程異常工況識別方法.但是,文獻(xiàn)[9?10]所建立的BN 模型假設(shè)是基于足夠多的異常工況數(shù)據(jù),當(dāng)收集到的異常工況數(shù)據(jù)很少時,很難建立有效的異常工況識別模型.遷移學(xué)習(xí)能有效地解決這一問題,它旨在通過使用來自相關(guān)源域的數(shù)據(jù)及其他信息解決目標(biāo)域問題.文獻(xiàn)[11]基于文獻(xiàn)[9?10]建立的BN 模型,考慮了來自同一工廠或其他工廠的電熔鎂爐的異常工況數(shù)據(jù),提出一種基于BN 參數(shù)遷移學(xué)習(xí)的異常工況識別方法,提高了目標(biāo)域異常工況識別的準(zhǔn)確率.然而,文獻(xiàn)[11]所提出的方法僅適用于源域BN 與目標(biāo)域BN 結(jié)構(gòu)一致情況下的參數(shù)遷移學(xué)習(xí).在實際情況中,很多工廠僅通過電流特征建立模型對異常工況進(jìn)行識別,此時源域BN 與目標(biāo)域BN 結(jié)構(gòu)不一致,文獻(xiàn)[11]提出的方法無法利用這些源域信息.因此,如何進(jìn)一步有效地利用這一部分源域信息,提出適用范圍更廣泛的BN 參數(shù)遷移學(xué)習(xí)方法,成為亟待解決的問題.
遷移學(xué)習(xí)已成功應(yīng)用于分類[12]、濾波[13]、識別[14]、故障診斷[15]、預(yù)測[16]以及優(yōu)化控制[17]等各種領(lǐng)域.文獻(xiàn)[18]表明使用計算智能的遷移學(xué)習(xí)方法是一項極具意義的研究工作,包括基于BN 的遷移學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)和模糊遷移學(xué)習(xí).然而,針對BN 遷移學(xué)習(xí)的研究十分有限,現(xiàn)有的成果主要包括結(jié)構(gòu)遷移學(xué)習(xí)和參數(shù)遷移學(xué)習(xí)兩個方面[19?26].針對BN 結(jié)構(gòu)遷移學(xué)習(xí),文獻(xiàn)[19]提出一種基于條件獨(dú)立性測試的BN 結(jié)構(gòu)遷移學(xué)習(xí)方法;文獻(xiàn)[20?21]基于評分搜索提出一種針對相關(guān)任務(wù)的BN 結(jié)構(gòu)遷移學(xué)習(xí)算法.針對BN 參數(shù)遷移學(xué)習(xí),文獻(xiàn)[22]提出基于網(wǎng)絡(luò)和片段(子圖)相關(guān)性的BN 參數(shù)遷移學(xué)習(xí)算法;文獻(xiàn)[19]提出基于距離的線性池和局部線性池概率加權(quán)方法,但是該方法僅考慮了條件概率表(Conditional probability table,CPT)大小和數(shù)據(jù)集大小的影響,忽略了源域與目標(biāo)域的適應(yīng)度.此外,專家知識在BN 學(xué)習(xí)過程中起著重要作用[23?24,27?28].文獻(xiàn)[23]為了評估多任務(wù)BN 結(jié)構(gòu)學(xué)習(xí)中的相關(guān)性,結(jié)合領(lǐng)域知識放松假設(shè)條件.文獻(xiàn)[24]通過整合知識遷移和專家約束,提出一種新的BN 參數(shù)遷移學(xué)習(xí)方法.
本文旨在目標(biāo)電熔鎂爐異常工況數(shù)據(jù)稀缺的情況下,應(yīng)用遷移學(xué)習(xí)的思想來建立目標(biāo)域異常工況識別的BN 模型.與文獻(xiàn)[11]相比,本文放松了源域與目標(biāo)域結(jié)構(gòu)一致的前提假設(shè),提出了適用范圍更加廣泛的源域與目標(biāo)域結(jié)構(gòu)不一致情況下的BN 參數(shù)遷移學(xué)習(xí)方法.首先,將目標(biāo)域BN 分解成以單一節(jié)點及其父節(jié)點為單位的子BN.然后,針對目標(biāo)域的每一個子BN,在源域中進(jìn)行搜索,將具有相同結(jié)構(gòu)關(guān)系的源域作為備選源域.在確定備選源域后,為避免負(fù)遷移,本文進(jìn)一步提出了評價目標(biāo)域與備選源域相似性的度量指標(biāo),該指標(biāo)由整體結(jié)構(gòu)相似度和參數(shù)相似度兩部分構(gòu)成.其中,整體結(jié)構(gòu)相似度通過本文提出的基于語義相似度的評價標(biāo)準(zhǔn)來計算;參數(shù)相似度通過提取目標(biāo)域的專家知識作為約束條件來計算.根據(jù)計算得到的相似度得分,可以確定備選源域的遷移權(quán)重.最后,最終的目標(biāo)域參數(shù)由備選源域參數(shù)和目標(biāo)域參數(shù)加權(quán)獲得.為了評價提出的方法,首先在著名的Asia 網(wǎng)絡(luò)上比較并說明了遷移學(xué)習(xí)前后的效果,然后將所提出的方法應(yīng)用于建立電熔鎂爐熔煉過程排氣異常工況識別模型.實驗結(jié)果表明,與目標(biāo)電熔鎂爐缺少異常工況數(shù)據(jù)的建模方法相比,本文提出的方法具有更好的異常工況識別性能.
本文的創(chuàng)新點及貢獻(xiàn)主要體現(xiàn)在以下三個方面:1) 本文提出了源域與目標(biāo)域結(jié)構(gòu)不一致情況下的BN 參數(shù)遷移學(xué)習(xí)方法,其優(yōu)點在于源域的選擇范圍更加廣泛,可利用的源域信息更加充分;2) 本文提出了一種新的評價源域BN 與目標(biāo)域BN 相似度的方法,以避免負(fù)遷移的影響;3) 本文提出的方法被用來解決目標(biāo)電熔鎂爐異常工況數(shù)據(jù)不夠充分的情況下,異常工況識別的建模問題.
本文章節(jié)安排如下:第1 節(jié)介紹了BN基礎(chǔ);第2 節(jié)描述了電熔鎂爐熔煉過程和本文要解決的問題;第3 節(jié)提出了新的BN 參數(shù)遷移學(xué)習(xí)方法;第4 節(jié)先通過著名的Asia 網(wǎng)絡(luò)驗證了本文方法的有效性,然后將本文方法應(yīng)用于電熔鎂爐熔煉過程排氣異常工況識別模型的建立以及在線識別;結(jié)論展示在第5 節(jié).
一般地,一個BN 可以定義為{V,A,θ}.其中,V表示系統(tǒng)變量,即BN 的節(jié)點集,并且Xi ∈V表示一個節(jié)點;A表示有向邊的集合,并且aij ∈A表示變量Xi與Xj之間的關(guān)系是Xj →Xi,即Xj是Xi的因(父),Xi是Xj的果(子);G={V,A}表示由節(jié)點構(gòu)成的有向無環(huán)圖,并且圖中每個節(jié)點都有一個父節(jié)點集pa(Xi),pa(Xi)={Xj ∈V|Xj →Xi ∈A};θ表示BN 參數(shù),并且θXi ∈θ表示與變量Xi相關(guān)的CPT,即變量Xi與其父節(jié)點之間依賴關(guān)系的定量表示.所有變量的聯(lián)合概率分布P(X1,X2,···,XN)可以用BN 的鏈規(guī)則分解為
P(Xi|pa(Xi))表示變量Xi在給定父節(jié)點集pa(Xi)下的條件概率.一旦父節(jié)點被分配,每個節(jié)點都是獨(dú)立的,這可以極大地降低結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)的計算復(fù)雜度,并且簡化BN 推理過程,該準(zhǔn)則稱為D 分離準(zhǔn)則[29].
一個域D={V,G,Da}包含三個部分:BN 節(jié)點,BN 結(jié)構(gòu)和相關(guān)的數(shù)據(jù).BN 參數(shù)學(xué)習(xí)的目的就是確定每個節(jié)點的CPT,可以通過最大似然估計(Maximum likelihood estimation,MLE) 方法來獲得.本文有一個目標(biāo)域Dt和一組相關(guān)源域L ≥1.目標(biāo)域變量V t={X1,···,Xn},1≤n ≤N,N表示目標(biāo)域BN 的節(jié)點數(shù)量;源域變量Xm,Y1,···,Yk},1≤m ≤M ≤N,1≤k ≤K,L表示第L個源域,M表示該源域與目標(biāo)域相同節(jié)點的數(shù)量,K表示該源域與目標(biāo)域不同節(jié)點的數(shù)量.目標(biāo)域有小數(shù)據(jù)集源域數(shù)據(jù),i ≥1.本文提出的BN 參數(shù)遷移學(xué)習(xí)定義為:給定一組源域L ≥1和一個目標(biāo)域Dt,通過式(2)來估計目標(biāo)域參數(shù)
其中,假設(shè)V t V s,Gt Gs,并且Dt具有不同的參數(shù)分布.
由第1.1 節(jié)的BN 定義可知,BN 結(jié)構(gòu)G由節(jié)點和有向邊組成.因此,可以將BN 劃分為一組子圖,定義為片段.每一個片段是原始BN 中的單個根節(jié)點或者是節(jié)點Xi及其直接父節(jié)點pa(Xi),并且從原始BN 中匹配對應(yīng)的CPT.可以說,BN 是由以節(jié)點為單位的BN 片段組成的,片段數(shù)即是原始BN 中的節(jié)點(變量)數(shù)[22].BN 分解的示意圖如圖1 所示.由于目標(biāo)域BN 與源域BN 結(jié)構(gòu)不一致,目標(biāo)域中不同的節(jié)點可能與不同的源域相關(guān).因此,本文以BN 片段的方式進(jìn)行參數(shù)遷移學(xué)習(xí),一旦目標(biāo)域每個節(jié)點的參數(shù)都被確定,完整的目標(biāo)域BN 參數(shù)即被獲得.
圖1 BN 分解示意圖Fig.1 Schematic diagram of BN decomposition
圖2 為電熔鎂爐熔煉過程的簡化示意圖.一般包括三個主要的熔煉狀態(tài):加熱熔煉、加料和排氣.操作人員通常根據(jù)經(jīng)驗確定不同狀態(tài)下的電流設(shè)定點.控制系統(tǒng)通過跟蹤不同的電流設(shè)定點來完成熔煉過程.在生產(chǎn)過程中,由于不同產(chǎn)地的礦石原料包含的雜質(zhì)種類及含量有所不同,熔點就會不同,電弧電阻也會不斷發(fā)生改變,進(jìn)而引起電弧電流的頻繁波動.如果控制系統(tǒng)的電流設(shè)定點不能得到及時調(diào)整,就會發(fā)生異常工況,包括:半熔化異常工況、過加熱異常工況和排氣異常工況.
圖2 電熔鎂爐熔煉過程示意圖Fig.2 Schematic diagram of the electro-fused magnesia furnace smelting process
BN 是對不確定性問題進(jìn)行建模和決策的有效工具[30],能有效建立電熔鎂爐熔煉過程的異常工況識別模型.文獻(xiàn)[9?10]已對電熔鎂爐熔煉過程的三種異常工況進(jìn)行了深入分析,并且根據(jù)專家知識建立了相應(yīng)的BN 模型結(jié)構(gòu).本文主要考慮排氣異常工況,其BN 模型結(jié)構(gòu)如圖3 所示,各節(jié)點物理意義如表1 所示.
圖3 電熔鎂爐排氣異常工況的BN 模型結(jié)構(gòu)Fig.3 BN model structure for the abnormal exhausting condition of the electro-fused magnesia furnace
表1 各節(jié)點物理意義Table 1 Physical meaning of the nodes
當(dāng)?shù)V石原料的顆粒大小發(fā)生改變時,原料與電極之間的縫隙會發(fā)生變化,二氧化碳?xì)怏w從不合適的縫隙中排出爐外,容易導(dǎo)致爐中氣壓失衡.此時,三相電極會在不平衡的氣壓下劇烈晃動,造成電弧電阻的劇烈波動,進(jìn)而導(dǎo)致電流的劇烈波動.若這種狀況持續(xù)的時間超過設(shè)定閾值,會造成高溫熔液從爐中噴出,出現(xiàn)“噴爐”現(xiàn)象,該工況即為排氣異常工況.由于噴出的熔液內(nèi)部溫度高達(dá)2 800 ℃,異常工況的發(fā)生會給現(xiàn)場熔煉設(shè)備和工人的安全造成極大威脅.排氣異常工況在圖像上的表現(xiàn)是有大量熔液噴出爐外,在聲音上的表現(xiàn)是“噴爐”發(fā)生的一段時間內(nèi),聲音變化明顯.因此,聲音信息(飛濺特征頻率下的短時能量及幅值)、圖像信息(平均灰度、灰度方差及灰度豐度)以及電流信息(電流變化率及跟蹤誤差)多源特征被用來辨別排氣異常工況是否發(fā)生,即根據(jù)節(jié)點E~ K 推理節(jié)點A 的狀態(tài).
本文要解決的問題描述如下:目標(biāo)域電熔鎂爐具有稀少的異常工況數(shù)據(jù),無法準(zhǔn)確學(xué)習(xí)異常工況識別BN 模型的參數(shù).源域為同一工廠或其他工廠的電熔鎂爐,既包含僅通過電流特征進(jìn)行異常工況識別的數(shù)據(jù),也包含通過電流、圖像和聲音多源特征進(jìn)行異常工況識別的數(shù)據(jù).由此可見,目標(biāo)域和源域的任務(wù)是相同的,都是解決電熔鎂爐異常工況識別的問題.目標(biāo)域和源域BN 模型結(jié)構(gòu)不一定相同,參數(shù)也具有不同的分布.本文參數(shù)遷移學(xué)習(xí)的目的就是利用多個相關(guān)源域來改進(jìn)目標(biāo)域BN 模型的參數(shù)學(xué)習(xí).
本文提出一種新的BN 參數(shù)遷移學(xué)習(xí)算法,流程圖如圖4 所示.具體步驟描述如下.
1)確定目標(biāo)域節(jié)點的備選源域.
根據(jù)第1.3 節(jié)所述,可以將目標(biāo)域BN 分解成以節(jié)點為單位的BN 片段,以片段的方式進(jìn)行遷移學(xué)習(xí).選擇目標(biāo)域的一個節(jié)點分別在每個源域中進(jìn)行搜索,如果某一個源域中存在該節(jié)點,且具有相同父節(jié)點集,則對于節(jié)點目標(biāo)域與該源域具備相同結(jié)構(gòu)關(guān)系,并且將該源域作為備選源域.目標(biāo)域的每一個節(jié)點都需要執(zhí)行上述操作,該過程的示意圖如圖5 所示.
針對節(jié)點在確定備選源域后,需要進(jìn)一步評價備選源域與目標(biāo)域的相似性,進(jìn)而確定遷移權(quán)重,以避免負(fù)遷移的影響.本文提出的相似性評價指標(biāo)由整體結(jié)構(gòu)相似度和參數(shù)相似度兩部分組成.
2)計算該節(jié)點備選源域與目標(biāo)域的整體結(jié)構(gòu)相似度.
基于語義相似度的方法[31],本文提出備選源域與目標(biāo)域整體結(jié)構(gòu)相似性的評價標(biāo)準(zhǔn),如式(3)所示
其中,Sim(V t,)∈[0,1],1≤l ≤L′ ≤L,表示第l個備選源域,L′表示備選源域的數(shù)量.備選源域與目標(biāo)域整體結(jié)構(gòu)越相似,則此值越高,完全一致時值為1.
3)計算該節(jié)點備選源域與目標(biāo)域的參數(shù)相似度.
本文利用專家知識約束的方法來計算節(jié)點備選源域與目標(biāo)域的參數(shù)相似性.提出的目標(biāo)域?qū)<抑R約束包括兩種形式:形式一是定性形式,即同一節(jié)點在不同狀態(tài)下的概率關(guān)系;形式二是定量形式,即參數(shù)的取值范圍.具體形式表示如下:
圖4 提出的BN 參數(shù)遷移學(xué)習(xí)方法流程圖Fig.4 Flow diagram of the proposed BN parameter transfer learning method
圖5 確定備選源域示意圖Fig.5 Schematic diagram for determining alternative source domain
形式一.同一節(jié)點在不同狀態(tài)下的概率關(guān)系表示為
其中,1≤i ≤n,n表示BN 模型中的節(jié)點數(shù);1≤j ≤qi,qi表示第i個節(jié)點的父節(jié)點的狀態(tài)組合數(shù);是第i個節(jié)點的不同狀態(tài),并且ri表示第i個節(jié)點的狀態(tài)數(shù);表示目標(biāo)域的實際參數(shù),滿足第i個節(jié)點處于第k′個狀態(tài),其父節(jié)點集處于第j個狀態(tài);表示目標(biāo)域的實際參數(shù),滿足第i個節(jié)點處于第k′′個狀態(tài),其父節(jié)點集處于第j個狀態(tài).
形式二.參數(shù)的取值范圍表示為
形式一的專家知識適合判斷備選源域的參數(shù)是否可以被遷移,而形式二的專家知識適合確定備選源域在遷移學(xué)習(xí)中的作用.因此,本文首先由形式一確定備選源域的參數(shù)是否可用于遷移學(xué)習(xí),然后由形式二計算遷移的備選源域與目標(biāo)域的相似性.如果該節(jié)點滿足更多的形式二,則更有可能擁有與目標(biāo)域相似的概率分布.當(dāng)備選源域的該節(jié)點的參數(shù)滿足一個形式二時,此備選源域的相似性得分將加1.對于更重要的約束,可以設(shè)置更高的相似性得分.通過這種評分的方式,可以評價備選源域與目標(biāo)域的參數(shù)相似性.
4)計算備選源域的遷移權(quán)重.
首先,根據(jù)步驟2)中整體結(jié)構(gòu)相似度確定備選源域遷移的結(jié)構(gòu)權(quán)重,如式(6)所示
最后,備選源域的最終遷移權(quán)重如式(8)所示
5)根據(jù)步驟3)中的專家知識形式一判斷該節(jié)點目標(biāo)域的參數(shù)是否可用于遷移學(xué)習(xí),如果答案為“是”,則轉(zhuǎn)到步驟6);如果答案為“否”,則轉(zhuǎn)到步驟7).
6)計算該節(jié)點目標(biāo)域的最終參數(shù).
根據(jù)式(9)計算目標(biāo)域的最終參數(shù)
其中,η(0≤η <1) 表示備選源域的權(quán)重,由專家知識根據(jù)實際情況確定;表示通過MLE 方法獲得的目標(biāo)域參數(shù);表示通過MLE 方法獲得的第l個備選源域的參數(shù);表示由備選源域和目標(biāo)域加權(quán)獲得的最終的目標(biāo)域參數(shù).轉(zhuǎn)到步驟8).
7)計算該節(jié)點目標(biāo)域的最終參數(shù).
根據(jù)式(10)計算目標(biāo)域的最終參數(shù)
8)判斷該節(jié)點是否為目標(biāo)域的最后一個節(jié)點,如果答案為“是”,則結(jié)束;如果答案為“否”,則轉(zhuǎn)到步驟1).
本節(jié)在著名的Asia 網(wǎng)絡(luò)上評估本文提出的BN 參數(shù)遷移學(xué)習(xí)方法.Asia 網(wǎng)絡(luò)是一個驗證性BN[32],用于表示與呼吸急促有關(guān)的變量之間的因果關(guān)系,網(wǎng)絡(luò)結(jié)構(gòu)如圖6 所示,各節(jié)點的CPT 如表2~表8 所示.
圖6 Asia 網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 Structure of the Asia network
表2 節(jié)點 和 的CPTsTable 2 The CPTs of nodes and
表2 節(jié)點 和 的CPTsTable 2 The CPTs of nodes and
表3 節(jié)點 的CPTTable 3 The CPT of node
表3 節(jié)點 的CPTTable 3 The CPT of node
表4 節(jié)點 的CPTTable 4 The CPT of node
表4 節(jié)點 的CPTTable 4 The CPT of node
表5 節(jié)點 的CPTTable 5 The CPT of node
表5 節(jié)點 的CPTTable 5 The CPT of node
表6 節(jié)點 的CPTTable 6 The CPT of node
表6 節(jié)點 的CPTTable 6 The CPT of node
表7 節(jié)點 的CPTTable 7 The CPT of node
表7 節(jié)點 的CPTTable 7 The CPT of node
表8 節(jié)點 的CPTTable 8 The CPT of node
表8 節(jié)點 的CPTTable 8 The CPT of node
從真實的Asia 網(wǎng)絡(luò)采集300 個樣本作為目標(biāo)域數(shù)據(jù),并且構(gòu)建具有不同結(jié)構(gòu)和不同概率分布特征的8 個相關(guān)的源域BN,如圖7 所示,從每個相關(guān)源域BN 分別采集1 500 個樣本作為源域數(shù)據(jù).針對Asia 網(wǎng)絡(luò)的專家知識形式一為和專家知識形式二如表9 所示.
圖7 相關(guān)的源域BNFig.7 Related source domain BN
表9 Asia 網(wǎng)絡(luò)專家知識形式二Table 9 The expert knowledge form two for the Asia network
為了評估參數(shù)學(xué)習(xí)的效果,本文使用KL(Kullback-Leibler)散度來度量學(xué)習(xí)到的參數(shù)與真實參數(shù)的接近程度.KL 散度的表達(dá)形式如式(11)所示,KL 散度的值越小,說明參數(shù)學(xué)習(xí)的性能越好[11].
首先,不進(jìn)行遷移學(xué)習(xí),僅使用目標(biāo)域小數(shù)據(jù)集學(xué)習(xí)目標(biāo)域網(wǎng)絡(luò)的參數(shù),即式(9)中η=0.在這種情況下,KL 散度值為44.504,參數(shù)學(xué)習(xí)的性能較差.然后,使用本文提出的BN 參數(shù)遷移學(xué)習(xí)方法來學(xué)習(xí)目標(biāo)域網(wǎng)絡(luò)參數(shù),圖8 顯示了不同權(quán)重η下的KL 散度值.從圖8 中可以看出,隨著權(quán)重η的增加,遷移來的源域作用增加,KL 散度值變小,即學(xué)習(xí)到的參數(shù)更接近真實的網(wǎng)絡(luò)參數(shù).因此,本文提出的方法比僅使用目標(biāo)域小數(shù)據(jù)集進(jìn)行參數(shù)學(xué)習(xí)具有更好的性能.為進(jìn)一步驗證本文在提出的備選源域與目標(biāo)域相似度評價指標(biāo)中考慮備選源域與目標(biāo)域結(jié)構(gòu)差異的必要性,與僅使用專家知識而不考慮整體結(jié)構(gòu)相似度的BN 參數(shù)遷移學(xué)習(xí)方法進(jìn)行對比,不同權(quán)重η下的KL 散度值同樣顯示在圖8中.通過比較可以發(fā)現(xiàn),對于所有權(quán)重η,不考慮二者的結(jié)構(gòu)相似度時所獲得的KL 散度值均大于考慮結(jié)構(gòu)相似度時所獲得的KL 散度值.由此可見,本文提出的衡量備選源域與目標(biāo)域相似度的方法可以避免負(fù)遷移的影響.
圖8 不同權(quán)重 η 下的KL 散度值Fig.8 The values of KL divergence under the different weightsη
在本節(jié)中,將提出的方法應(yīng)用于電熔鎂爐熔煉過程排氣異常工況識別.本文的實驗在電熔鎂爐仿真平臺上進(jìn)行,該平臺由本文作者所在的研究團(tuán)隊設(shè)計和構(gòu)建,如圖9 所示.仿真平臺可以根據(jù)機(jī)理分析和實際數(shù)據(jù)對電熔鎂爐熔煉過程進(jìn)行仿真,從而完成對該過程的最優(yōu)控制、異常工況識別和自愈控制.該平臺包括以下設(shè)備:具備不同功能的計算機(jī)、嵌入式過程控制系統(tǒng)、數(shù)據(jù)服務(wù)器、傳感設(shè)備和傳輸設(shè)備.傳感設(shè)備包括電流測量儀、圖像測量儀和聲音測量儀.在工業(yè)現(xiàn)場,多源信息由傳感設(shè)備收集并存儲于數(shù)據(jù)服務(wù)器中,傳輸設(shè)備在一定時間間隔內(nèi)通過以太網(wǎng)將信息傳輸?shù)侥M區(qū)域.
電熔鎂爐熔煉過程排氣異常工況識別的BN 模型結(jié)構(gòu)已經(jīng)在第2.1 節(jié)描述.以節(jié)點A 和節(jié)點B 為例,表10 和表11 分別表示它們的參數(shù)表達(dá)形式.其他節(jié)點的參數(shù)表達(dá)形式與節(jié)點A 和節(jié)點B 類似,故省略.針對電熔鎂爐熔煉過程排氣異常工況識別模型,專家知識形式一和專家知識形式二分別如表12 和表13 所示.
圖9 電熔鎂爐仿真平臺Fig.9 Construction of simulation platform for electric-fused magnesium furnace
表10 節(jié)點A 的參數(shù)表達(dá)形式Table 10 The parameters expression of node A
表11 節(jié)點B 的參數(shù)表達(dá)形式Table 11 The parameters expression of node B
表12 排氣異常工況識別模型的專家知識形式一Table 12 The expert knowledge form one for the abnormal exhausting condition model
表13 排氣異常工況識別模型的專家知識形式二Table 13 The expert knowledge form two for the abnormal exhausting condition model
為說明本文方法的有效性和優(yōu)越性,設(shè)計三組實驗進(jìn)行對比.首先,按照文獻(xiàn)[9?10]提出的方法,不進(jìn)行遷移,僅使用目標(biāo)域電熔鎂爐的500 條稀缺數(shù)據(jù)學(xué)習(xí)目標(biāo)域排氣異常工況識別BN 模型的參數(shù),并將其表示為模型一.然后,從同一工廠其他兩組僅利用電流特征進(jìn)行排氣異常工況識別的熔煉過程以及兩組利用多源特征進(jìn)行排氣異常工況識別的熔煉過程中,分別收集2 000 條排氣異常數(shù)據(jù)作為源域數(shù)據(jù),通過本文提出的BN 參數(shù)遷移學(xué)習(xí)方法來學(xué)習(xí)目標(biāo)域排氣異常工況識別BN 模型的參數(shù),并將該模型表示為模型二.最后,按照文獻(xiàn)[11]提出的方法,僅考慮結(jié)構(gòu)一致情況下的源域,不使用結(jié)構(gòu)不完全一致的相關(guān)源域信息,即只從兩組使用多源特征進(jìn)行排氣異常工況識別的熔煉過程分別收集2 000 條排氣異常數(shù)據(jù)作為源域數(shù)據(jù),來學(xué)習(xí)目標(biāo)域排氣異常工況識別BN 模型的參數(shù),并將該模型表示為模型三.綜上所述,三種模型的建模方法描述如表14 所示.
表14 三種模型描述Table 14 Descriptions of the three models
本文選取一些排氣異常工況的典型事件進(jìn)行分析,如表15 所示.異常工況體現(xiàn)為7 個不同的特征,即節(jié)點E~ K.每個特征分為3 個或4 個等級,由數(shù)字1~ 3 或1~ 4 表示.其中,節(jié)點E~ J 分為3 個等級,分別為:小、中、大;節(jié)點K 分為4 個等級,分別為:非常小、小、大、非常大.以事件編號18 為例,其物理意義是節(jié)點E、F 的狀態(tài)等級為小;節(jié)點G~ I 的狀態(tài)等級為中;節(jié)點J 的狀態(tài)等級為大;節(jié)點K 的狀態(tài)等級為非常大.節(jié)點A 分為4 個等級,分別為:正常、輕度異常、中度異常、嚴(yán)重異常,由數(shù)字1~ 4 表示.
表15 排氣異常工況的典型事件Table 15 The typical scenarios for the abnormal exhausting condition
將表15 中典型事件的特征作為證據(jù)輸入到已經(jīng)建立的模型一、模型二和模型三,并且進(jìn)行BN 推理.本文使用聯(lián)結(jié)樹推理算法[33].推理結(jié)果分別展示在表16~ 表18 中,將具有最大后驗概率的等級視為識別結(jié)果,并以粗體顯示.
根據(jù)實際操作經(jīng)驗,與表16~ 表18 的識別結(jié)果進(jìn)行比較,可以得到三種模型的異常工況識別準(zhǔn)確率,分別為72.2%、100%和94.4%.模型一由于僅使用了目標(biāo)域稀缺數(shù)據(jù)學(xué)習(xí)目標(biāo)域BN 模型參數(shù),無法完全學(xué)習(xí)到數(shù)據(jù)真實的分布特性,建立的BN 模型不準(zhǔn)確,因此異常工況識別準(zhǔn)確率較低,為72.2%.模型三由于使用了兩組結(jié)構(gòu)一致的源域來輔助學(xué)習(xí)目標(biāo)域BN 模型參數(shù),異常工況識別準(zhǔn)確率得到了有效的提升,為94.4%.而模型二除了使用兩組結(jié)構(gòu)一致的源域,還使用了兩組結(jié)構(gòu)不完全一致的相關(guān)源域,使用的源域信息更加充分,建立的BN 模型更加準(zhǔn)確,因此比模型三有更高的識別準(zhǔn)確率,為100%.實驗結(jié)果說明了本文提出方法的有效性和優(yōu)越性.
表16 排氣異常工況識別模型一的識別結(jié)果Table 16 The identification results of abnormal scenarios for model one
表17 排氣異常工況識別模型二的識別結(jié)果Table 17 The identification results of abnormal scenarios for model two
表18 排氣異常工況識別模型三的識別結(jié)果Table 18 The identification results of abnormal scenarios for model three
本文針對電熔鎂爐熔煉過程中異常工況數(shù)據(jù)不夠充分的情況,提出了一種新的BN 參數(shù)遷移學(xué)習(xí)方法,解決了源域與目標(biāo)域結(jié)構(gòu)不一致情形下的參數(shù)遷移學(xué)習(xí)問題.目標(biāo)域BN 被分解成以單一節(jié)點及其父節(jié)點為單位的子BN.針對每一個子BN,在源域中進(jìn)行搜索,將具有相同結(jié)構(gòu)關(guān)系的源域作為備選源域.在確定備選源域后,為避免負(fù)遷移影響,本文進(jìn)一步提出了評價備選源域與目標(biāo)域相似性的指標(biāo).通過計算整體結(jié)構(gòu)相似度和該節(jié)點的參數(shù)相似度,確定了備選源域的遷移權(quán)重.最后,將備選源域參數(shù)和目標(biāo)域參數(shù)進(jìn)行加權(quán),獲得了最終的目標(biāo)域參數(shù).在Asia 網(wǎng)絡(luò)以及電熔鎂爐熔煉過程排氣異常工況識別的實驗,說明了本文提出方法的有效性和優(yōu)越性.