張 鑫, 胡瑾秋, 張來斌, 王倩琳
(中國石油大學(xué) 機(jī)械與儲(chǔ)運(yùn)工程學(xué)院, 北京 102249)
基于RS和SVM的化工過程高精度故障診斷方法
張 鑫, 胡瑾秋, 張來斌, 王倩琳
(中國石油大學(xué) 機(jī)械與儲(chǔ)運(yùn)工程學(xué)院, 北京 102249)
化工過程長時(shí)間處于正常運(yùn)行狀態(tài)而積累的故障樣本有限,且含有冗余信息,降低了傳統(tǒng)故障分類器的準(zhǔn)確率。為了提高化工過程故障診斷的準(zhǔn)確率,提出了一種基于RS和SVM的化工過程高精度故障診斷方法。首先,在不損失信息的情況下,采用RS約簡故障指標(biāo)體系,去除冗余特征;然后,根據(jù)最小約簡指標(biāo)集構(gòu)建故障數(shù)據(jù)集,建立優(yōu)化的SVM故障分類器。將RS-SVM和標(biāo)準(zhǔn)SVM同時(shí)應(yīng)用到預(yù)加氫過程的故障分類中,RS不同程度的提高了SVM準(zhǔn)確率,當(dāng)采用RBF核函數(shù)且訓(xùn)練樣本集容量為60時(shí),準(zhǔn)確率提高幅度最大值為11.84%。比較結(jié)果表明,剔除數(shù)據(jù)中的冗余信息有助于提高故障診斷的準(zhǔn)確率。
化工過程; 故障診斷; 冗余信息; 粗糙集; 支持向量機(jī)
化工過程是一個(gè)將危險(xiǎn)物質(zhì)流,高密度能量流和眾多信息流匯集于一體的復(fù)雜生產(chǎn)系統(tǒng)。其故障問題具有3大特征:(1)由于系統(tǒng)復(fù)雜的非線性特性,描述故障模式的信息具有某種程度的不確定性[1];(2)描述故障狀態(tài)的特征眾多,相關(guān)性特征帶來大量冗余信息(冗余信息是指一些不必要或不重要的特征,刪除它并不影響原始特征的完整性),干擾故障模式的辨識(shí);(3)化工過程長時(shí)間處于正常運(yùn)行狀態(tài),積累的故障樣本非常有限?;み^程中一旦發(fā)生故障,輕微故障會(huì)引起生產(chǎn)系統(tǒng)癱瘓,嚴(yán)重故障會(huì)造成有毒物質(zhì)泄漏,火災(zāi)和爆炸等災(zāi)難性事故[2]。因此,在保證不損失信息的前提下從故障特征中剔除冗余信息,利用較少故障樣本建立高精度的故障診斷方法,對(duì)于提高異常工況管理水平,保證化工過程安全平穩(wěn)運(yùn)行具有重要意義。
目前,為了減小特征數(shù)據(jù)中冗余信息對(duì)故障診斷效果的影響,國內(nèi)外通過特征提取和選擇方法獲取重要的特征。文獻(xiàn)[3-6]所采用的方法雖然解除了特征間相關(guān)性,突出有用的信息,但只能用于線性問題,不適用于非線性系統(tǒng)。文獻(xiàn)[7]是在PCA基礎(chǔ)上,引入核函數(shù)提取數(shù)據(jù)的非線性特征,但是其核參數(shù)的選取需要人為設(shè)定,并且需要大量訓(xùn)練樣本才能提取出合理特征。文獻(xiàn)[8]將RELIEFF加權(quán)特征選擇方法和特征相關(guān)度算法相結(jié)合去除無效特征,該方法突出權(quán)值高于特定值的特征,但是權(quán)重閾值需要根據(jù)經(jīng)驗(yàn)知識(shí)給出,具有一定主觀性。上述方法均有利于提高故障診斷模型的精度。近年來,智能診斷方法,如模糊推理[9]、神經(jīng)網(wǎng)絡(luò)(BP)[10]、專家系統(tǒng)[11]、支持向量機(jī)(SVM)[12]在故障診斷領(lǐng)域得到普遍應(yīng)用。然而,模糊隸屬函數(shù)需要根據(jù)經(jīng)驗(yàn)給出;BP只有當(dāng)數(shù)據(jù)樣本充分的時(shí)候才能進(jìn)行工作;專家系統(tǒng)不利于深層知識(shí)的挖掘;SVM在樣本較少情況下具有優(yōu)越的建模能力和泛化性能,但是SVM并不能從高維特征數(shù)據(jù)中去除冗余信息,影響了故障診斷模型的建模效率和分類性能。而粗糙集(RS)是一種無需任何先驗(yàn)知識(shí),在保證分類精度不變的情況下約簡特征,剔除冗余信息的方法,但是其本身泛化能力(推廣性能)有限[13]。因此,利用RS和SVM的各自優(yōu)勢,將RS和SVM相結(jié)合的方法(簡稱RS-SVM),既能約簡冗余特征,提高分類器的建模效率和分類性能,又能保證分類模型的泛化性能。RS-SVM已經(jīng)成功應(yīng)用到水質(zhì)評(píng)估[14]、貸款違約判別[15]、核設(shè)備故障識(shí)別[16]等領(lǐng)域。然而,與上述領(lǐng)域的研究對(duì)象相比,化工過程的特征變量眾多,帶有大量冗余信息,且故障樣本非常有限,若利用單一的智能診斷方法勢必帶來建模效率低,診斷精度低的問題。
為了建立適用于化工過程的高精度故障診斷方法,在本研究中提出一種基于RS和SVM的化工過程高精度故障診斷方法。首先應(yīng)用RS理論對(duì)化工過程高維的故障指標(biāo)進(jìn)行簡化,刪除冗余指標(biāo);然后采用優(yōu)化的SVM對(duì)RS約簡后的故障樣本數(shù)據(jù)進(jìn)行訓(xùn)練和分類。并以預(yù)加氫過程為例進(jìn)行案例分析,以實(shí)現(xiàn)對(duì)故障的高精度診斷。
1.1 故障診斷決策表
粗糙集在數(shù)據(jù)預(yù)處理和知識(shí)約簡方面表現(xiàn)出優(yōu)越的性能,成為了故障診斷領(lǐng)域知識(shí)獲取的有力工具。知識(shí)約簡是粗糙集理論應(yīng)用的核心步驟,所謂知識(shí)約簡,就是在保持知識(shí)分類能力不變的條件下,刪除其中的不相關(guān)或多余的知識(shí)(冗余信息)[17]。故障診斷決策表(Fault diagnostic decision table,F(xiàn)DDT)是粗糙集中對(duì)知識(shí)進(jìn)行表達(dá)和處理的基本工具,通過對(duì)FDDT中故障指標(biāo)體系及其指標(biāo)值的化簡,可以得到具有更少故障指標(biāo)的決策表,經(jīng)過簡化的故障指標(biāo)體系稱之為最小故障指標(biāo)集。FDDT(如表1所示)定義為S=(U,C∪D,V,f),其中U={x1,x2,…,xn}為診斷對(duì)象集,xi(1≤i≤n)為1個(gè)診斷實(shí)例;C={c1,c2,…,ch}為故障指標(biāo)體系,tnh為診斷實(shí)例xn的ch指標(biāo)的指標(biāo)值;D={d1,d2,…,dk}為故障類型集合;且C∩D=?,E=C∪D,信息函數(shù)f表示U與E的關(guān)系集,f={fj|1≤j≤(n+k)},其中信息函數(shù)fj=U→Vj(1≤j≤n+k),Vj是故障指標(biāo)ej的值域,ej是指標(biāo)集合E的1個(gè)元素;V是所有指標(biāo)值域的并集。
表1 故障診斷決策表Table 1 Fault diagnostic decision table
粗糙集理論約簡FDDT中故障指標(biāo)體系的步驟為:
(a) 根據(jù)故障指標(biāo)的閾值區(qū)間,將FDDT中連續(xù)指標(biāo)值作離散化處理,得到離散化FDDT。設(shè)第h個(gè)故障指標(biāo)的閾值區(qū)間和指標(biāo)值分別為[Lh,Hh]和th,離散值為tH,則離散規(guī)則為式(1):
(1)
(b) 采用刪除算法[18]約簡離散化的FDDT中冗余指標(biāo),得到最小故障指標(biāo)集。
ROSETTA軟件是1個(gè)基于粗糙集理論框架的表格邏輯數(shù)據(jù)分析工具包,提供多種約簡屬性的算法,由于Johnson’salgorithm偏向于搜索到具有最小長度的單一約簡指標(biāo)集,故在本文中以下內(nèi)容選用ROSETTA軟件的Johnson’salgorithm對(duì)FDDT中指標(biāo)體系進(jìn)行約簡。
1.2 支持向量機(jī)
SVM在解決少樣本的故障診斷問題時(shí)具有較強(qiáng)的泛化性能,而化工過程故障診斷的瓶頸之一是故障樣本的缺乏,因此,SVM在化工過程的故障診斷中有很好的應(yīng)用前景[19]。
SVM是通過核函數(shù),將非線性數(shù)據(jù)空間映射到線性可分的高維空間進(jìn)行線性分類或回歸,因此,SVM分類器模型可以表示為式(2)。
y=f(φ,γ,g,k(φ,φ*))
(2)
其中φ是輸入項(xiàng)(訓(xùn)練數(shù)據(jù)集),φ可以看成由故障指標(biāo)值和故障類型組成的矩陣,如式(3)所示,dk含義見表1,φnh是tnh的離散化值,訓(xùn)練數(shù)據(jù)集的實(shí)例數(shù)n≥20。
(3)
γ是懲罰參數(shù),k(φ,φ*)是核函數(shù),主要包括多項(xiàng)式(Polynomial)核函數(shù)、徑向基(RBF)核函數(shù)和多層感知器(Sigmoid),g是核參數(shù)。其中參數(shù)γ和g會(huì)影響SVM的分類性能,為避免人為設(shè)置SVM參數(shù)而導(dǎo)致不必要的時(shí)間花費(fèi)和對(duì)模型精度的影響,采用基于全局優(yōu)化的粒子群智能算法[20]尋找最優(yōu)的γ和g。
2 基于RS和SVM的化工過程高精度故障診斷方法
基于RS理論和SVM方法,適用于化工過程的高精度故障診斷方法的流程圖如圖1所示,具體的步驟描述如下:
圖1 所提出方法的流程圖Fig.1 Procedure of the proposed method
步驟1:建立故障診斷決策表
在化工工藝未變更的情況下,調(diào)研化工過程的異常工況記錄,確定典型的故障類型作為診斷對(duì)象;并根據(jù)化工過程PI&D圖,選取能夠描述相應(yīng)故障的過程變量構(gòu)建故障指標(biāo)體系;再從歷史數(shù)據(jù)庫(包括異常和正常的工況記錄)中選取N(N≥20)個(gè)診斷實(shí)例,建立如表1所示的故障診斷決策表FDDT。
步驟2:約簡故障指標(biāo)體系
根據(jù)1.1節(jié)步驟(a),得到離散化的FDDT;然后采用Johnson’s algorithm約簡算法得到最小故障指標(biāo)集。
步驟3:訓(xùn)練故障分類器
根據(jù)步驟2得到的最小故障指標(biāo)集,建立如公式(3)所示的訓(xùn)練數(shù)據(jù)集,作為SVM故障分類器的輸入項(xiàng),并采用粒子群算法優(yōu)化懲罰參數(shù)γ和核參數(shù)g,最終建立RS-SVM故障分類器。
步驟4:故障診斷
按照步驟2中最小故障指標(biāo)集和公式(3),建立樣本容量為T的測試數(shù)據(jù)集,將測試樣本集輸入到已經(jīng)建立的RS-SVM故障分類器中,對(duì)故障類型進(jìn)行分類,并將結(jié)果列于混淆矩陣(如表2所示),進(jìn)一步用于方法性能的評(píng)估。根據(jù)公式(4)、(5)、(6)可以得到準(zhǔn)確率(Accuracy)、漏警率(Missing alarm rate,MAR)和虛警率(False alarm rate,F(xiàn)AR)。
表2 混淆矩陣Table 2 Confusion matrix
Whereais the number of samples assigned to fault mode and correctly diagnosed;bis the number of samples not happened but diagnosed as fault;cis the number of samples happened really but diagnosed as non-fault;dis the number of samples corresponding to non-fault situation and properly diagnosed.
(4)
(5)
(6)
預(yù)加氫過程是處理重整原料的最重要環(huán)節(jié),預(yù)加氫作用是除去原料油中的雜質(zhì)以保護(hù)重整催化劑。預(yù)加氫的過程是在催化劑和氫氣的作用下,使原料中的硫、氮、氧等化合物進(jìn)行預(yù)加氫反應(yīng),生成易于除去的H2S、NH3和H2O。典型的預(yù)加氫過程如圖2所示。預(yù)加氫過程積累的故障樣本較少,監(jiān)測數(shù)據(jù)具有非線性和冗余性的特點(diǎn),比如,分離罐D(zhuǎn)-101 調(diào)壓系統(tǒng)出現(xiàn)故障,現(xiàn)場監(jiān)測指標(biāo)包括D-101 入口溫度(TI1114)、D-101液位(LIC1109)、D-101壓力(PIC1102)和循環(huán)氫分液罐D(zhuǎn)-102壓力(PI1112),其中LIC1109對(duì)于描述故障并不重要,因此該變量屬于冗余特征。本節(jié)針對(duì)預(yù)加氫過程的異常工況,采用HYSYS軟件建立預(yù)加氫過程的動(dòng)態(tài)仿真平臺(tái),得到不同工況下的仿真數(shù)據(jù),驗(yàn)證所提出方法的準(zhǔn)確性和有效性。
圖2 預(yù)加氫過程流程圖Fig.2 Pre-hydrogenation process flow sheet
步驟1:通過調(diào)研預(yù)加氫過程的異常工況記錄,選取對(duì)預(yù)加氫過程具有直接影響的4種故障和無故障作為診斷對(duì)象,如表3所示,相應(yīng)的故障指標(biāo)體系描述如表4所示。通過動(dòng)態(tài)仿真平臺(tái)模擬表3中故障類型,得到30個(gè)實(shí)例(包括23個(gè)故障實(shí)例和7個(gè)非故障實(shí)例),建立如表5所示的故障診斷決策表。
步驟2:根據(jù)表3中各故障指標(biāo)閾值區(qū)間,得到離散化決策表,如表6所示;約簡得到的最小故障指標(biāo)集包括7個(gè)故障指標(biāo),分別為:C_1,C_3,C_4,C_5,C_9,C_11,C_12。
步驟3:為了評(píng)估所提出方法的性能,通過仿真平臺(tái)進(jìn)一步建立樣本容量為45、60、75的訓(xùn)練數(shù)據(jù)集,同時(shí)應(yīng)用3種核函數(shù)(即Polynomial、RBF和Sigmoid核函數(shù))建立RS-SVM故障分類器,每種RS-SVM分類器的關(guān)鍵參數(shù)如表7所示。
步驟4:建立包含76個(gè)實(shí)例的測試數(shù)據(jù)集(包含故障實(shí)例58個(gè),無故障實(shí)例18個(gè)),采用步驟3建立的12種RS-SVM分類器對(duì)每個(gè)實(shí)例進(jìn)行故障分類,每種分類器的分類準(zhǔn)確率見表8。
表3 故障類型Table 3 Fault type
表4 故障指標(biāo)體系描述Table 4 Description of the fault index system
表5 故障診斷決策表(部分)Table 5 Fault diagnostic decision table (part)
為檢驗(yàn)RS對(duì)SVM分類器準(zhǔn)確率的影響,表8對(duì)比了使用RS-SVM方法和標(biāo)準(zhǔn)SVM方法所建立的故障分類器對(duì)測試樣本的判定情況。由表8可以看出,(1) 無論采取哪種訓(xùn)練模式,RS-SVM的準(zhǔn)確率均高于標(biāo)準(zhǔn)SVM(其最優(yōu)參數(shù)和g是通過粒子群算法優(yōu)化得到)的準(zhǔn)確率。當(dāng)采用RBF核函數(shù)且訓(xùn)練集樣本容量為60時(shí),RS最大幅度的提高了SVM的準(zhǔn)確率,提高幅值為11.84百分點(diǎn)。這是因?yàn)橥ㄟ^刪除冗余指標(biāo)而減少了噪聲源影響,最小故障指標(biāo)集比原來的故障指標(biāo)體系更具有代表性,從而有效地提高SVM分類器準(zhǔn)確率。(2) 隨著訓(xùn)練數(shù)據(jù)集樣本容量增加,整體準(zhǔn)確率也逐步增大,說明訓(xùn)練數(shù)據(jù)集樣本容量影響分類器準(zhǔn)確率,這種現(xiàn)象可以解釋為:訓(xùn)練數(shù)據(jù)集容量越大,捕捉到的基本問題特征(支持向量)越多,并沒有引入誤導(dǎo)SVM分類的多余噪聲。其中采用RBF的RS-SVM的整體準(zhǔn)確率最高,當(dāng)樣本容量為75時(shí),準(zhǔn)確率取得最大值,為90.79%。
表6 離散化的故障診斷決策表(部分)Table 6 Discrete fault diagnostic decision table (part)
表7 每種RS-SVM分類器的最優(yōu)懲罰參數(shù)γ和最優(yōu)核函數(shù)gTable 7 The optimal penalty factors γ and kernel parameters g of each RS-SVM classifier
表8 RS-SVM和SVM對(duì)測試數(shù)據(jù)集的分類情況Table 8 Classification results of RS-SVM and SVM on test dataset
(3) 在同一種核函數(shù)下,RS-SVM方法的準(zhǔn)確率隨著訓(xùn)練數(shù)據(jù)集樣本容量增加而增大,為了量化這種影響,建立靈敏度指標(biāo)。靈敏度定義為:同一種核函數(shù)類型下,診斷方法因數(shù)據(jù)集容量變化所致的準(zhǔn)確率變化程度,計(jì)算式如(7)所示:
Sensitivity=AccuracyMAX-AccuracyMIN
(7)
式中,AccuracyMAX和AccuracyMIN分別表示在同一種核函數(shù)下,當(dāng)訓(xùn)練數(shù)據(jù)集樣本數(shù)分別為75和30時(shí),RS-SVM分類器對(duì)應(yīng)的準(zhǔn)確率。3種核函數(shù)下RS-SVM對(duì)訓(xùn)練數(shù)據(jù)集樣本容量的靈敏度如表9所示,Polynomial對(duì)訓(xùn)練數(shù)據(jù)集的樣本容量最靈敏,Sigmoid對(duì)訓(xùn)練數(shù)據(jù)集的樣本容量最不靈敏,表明采用Polynomial的RS-SVM和Sigmoid的RS-SVM的準(zhǔn)確率分別受訓(xùn)練數(shù)據(jù)集樣本數(shù)的影響最大和最小。
表9 3種核函數(shù)下RS-SVM的靈敏度Table 9 Sensitivity of RS-SVM under three kinds of kernel functions
(4) 當(dāng)訓(xùn)練數(shù)據(jù)集樣本容量保持不變時(shí),核函數(shù)類型對(duì)RS-SVM的準(zhǔn)確率也有影響,為了量化這種影響,建立魯棒性指標(biāo)。魯棒性定義為:同一種數(shù)據(jù)類型下,診斷方法因核函數(shù)類型不同而導(dǎo)致診斷準(zhǔn)確率波動(dòng)的程度,計(jì)算式如(8)所示:
(8)
式中:AccuracyMAX和AccuracyMIN分別表示同一個(gè)訓(xùn)練數(shù)據(jù)集下,使用3種核函數(shù)建立的RS-SVM分類器的最大準(zhǔn)確率和最小準(zhǔn)確率。表10列出了RS-SVM 的魯棒性指標(biāo),在任何一個(gè)訓(xùn)練樣本集下,魯棒性指標(biāo)值均接近1,表明在預(yù)加氫過程的故障診斷研究中,RS-SVM對(duì)核函數(shù)類型具有較強(qiáng)的魯棒性。
表10 RS-SVM對(duì)核函數(shù)的魯棒性Table 10 Robustness of RS-SVM to kernel function
每種故障分類器的漏警率和虛警率如表11所示,隨著訓(xùn)練數(shù)據(jù)集樣本數(shù)增加,無論采取哪種核函數(shù),故障分類器的漏報(bào)警和虛報(bào)警的概率均減小。其中采用Polynomial的RS-SVM具有最小的漏警率,表明該分類器能夠捕捉更多具有故障特征的支持向量;采用RBF的RS-SVM具有最小的虛警率,表明該方法對(duì)非故障的預(yù)測效果最優(yōu)。
5 結(jié) 論
(1) 提出了一種基于RS和SVM的化工過程高精度故障診斷方法,解決了故障樣本較少且含有冗余信息而影響故障分類器性能的問題。
(2) 所提出方法首先在不損失故障樣本信息的前提下,約簡故障指標(biāo)體系,繼而在較少的故障數(shù)據(jù)下,采用粒子群優(yōu)化的支持向量機(jī)建立了高精度的故障診斷器。
(3) 通過將預(yù)加氫過程作為應(yīng)用對(duì)象,驗(yàn)證了RS-SVM的有效性和適用性。仿真結(jié)果表明,RS-SVM 通過約簡故障指標(biāo)體系,不同程度地提高了故障診斷的準(zhǔn)確率,提高幅度最大值為11.84百分點(diǎn)。采用Polynomial的RS-SVM對(duì)訓(xùn)練數(shù)據(jù)集的靈敏度為7.89%,當(dāng)訓(xùn)練樣本容量為75時(shí),采用RBF的RS-SVM虛警率為5.26%。
[1] 馬曦, 張來斌, 胡瑾秋, 等. 基于IRML的油氣加工系統(tǒng)多層次故障傳播模型研究[J].石油學(xué)報(bào)(石油加工), 2015, 31(5): 1193-1202. (MA Xi, ZHANG Laibin, HU Jinqiu, et al. Hierarchical fault propagation model for petroleum refining system based on IRML[J].Acta Petrolei Sinica(Petroleum Processing Section), 2015, 31(5): 1193-1202.)
[2] HU J Q, ZHANG L B, MA L, et al. An integrated safety prognosis model for complex system based on dynamic Bayesian network and ant colony algorithm[J].Expert Systems with Applications, 2011, 38(3): 1431-1446.
[3] SHAMS M A B, BUDMAN H M, DUEVER T A. Fault detection, identification and diagnosis using CUSUM based PCA[J].Chemical Engineering Science, 2011, 66(20): 4488-4498.
[4] AJAMI A, DANESHVAR M. Data driven approach for fault detection and diagnosis of turbine in thermal power plant using independent component analysis (ICA)[J].International Journal of Electrical Power & Energy Systems, 2012, 43(1): 728-735.
[5] LI J, LU B L. An adaptive image Euclidean distance[J].Pattern Recognition, 2009, 42(3): 349-357.
[6] TOKKOLA K. Feature extraction by non-parametric mutual information maximization[J].Journal of Machine Learning Research, 2003, 3(7): 1415-1438.
[7] 高緒偉. 核PCA特征提取方法及其應(yīng)用研究[D].江蘇: 南京航空航天大學(xué), 2009.
[8] 王友榮. Relief F加權(quán)特征選擇方法在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究[D].河北: 燕山大學(xué), 2014.
[9] HOU T H, HUANG C C. Application of fuzzy logic and variable precision rough set approach in a remote monitoring manufacturing process for diagnosis rule induction[J].Journal of Intelligent Manufacturing, 2004, 15(3): 395-408.
[10] 趙勁松, 陳丙珍, 沈靜珠. 人工神經(jīng)網(wǎng)絡(luò)在動(dòng)態(tài)過程故障診斷中的應(yīng)用[J].石油學(xué)報(bào)(石油加工), 1996, 12(1): 88-97. (ZHAO Jinsong, CHEN Bingzhen, SHEN Jingzhu. Artificial neural networks in dynamic process fault diagnosis[J].Acta Petrolei Sinica(Petroleum Processing Section), 1996, 12(1): 88-97.)
[11] 呂翠英, 徐亦方, 沈復(fù), 等. 石油精餾系統(tǒng)故障診斷專家系統(tǒng)中基于深層知識(shí)的學(xué)習(xí)模型——一種不完善理論問題的處理方法[J].石油學(xué)報(bào)(石油加工), 1993, 9(4): 28-34. (Lü Cuiying, XU Yifang, SHEN Fu, et al. Petroleum distillation system fault diagnosis expert system based on deep knowledge learning model——A kind of imperfect theory approach problem[J].Acta Petrolei Sinica(Petroleum Processing Section), 1993, 9(4): 28-34.)
[12] 袁勝發(fā), 褚福磊. 支持向量機(jī)及其在機(jī)械故障診斷中的應(yīng)用[J].振動(dòng)與沖擊, 2007, 26(11): 29-35, 58. (YUAN Shengfa, CHU Fulei. Support vector machine and its application in machine fault diagnosis[J].Journal of Vibration and Shock, 2007, 26(11): 29-35, 58.)
[13] 張騰飛, 王錫淮, 葉銀忠, 等. 粗糙集理論在故障診斷中的應(yīng)用綜述[J].上海海事大學(xué)學(xué)報(bào), 2005, 26(4): 20-25. (ZHANG Tengfei, WANG Xihuai, YE Yinzhong, et al. Survey on application of rough set theory in fault diagnosis[J].Journal of Shanghai Maritime University, 2005, 26(4): 20-25.)
[14] 黃鶴, 梁秀娟, 肖霄, 等. 基于粗糙集的支持向量機(jī)地下水質(zhì)量評(píng)價(jià)模型[J].中國環(huán)境科學(xué), 2016, 36(2): 619-625. (HUANG He, LIANG Xiujuan, XIAO Xiao, et al. Model of groundwater quality assessment with support vector machine based on rough set[J].China Environmental Science, 2016, 36(2): 619-625.)
[15] 柯孔林. 基于粗糙集與支持向量機(jī)的企業(yè)短期貸款違約判別[J].控制理論與應(yīng)用, 2009, 26(12): 1365-1370. (KE Konglin. Default prediction of short-term loan based on integration of rough sets and support-vector-machines[J].Control Theory & Applications, 2009, 26(12): 1365-1370.)
[16] 徐金良, 陳五星, 唐耀陽. 基于粗糙集理論和支持向量機(jī)算法的核電廠故障診斷方法[J].核動(dòng)力工程, 2009, 30(4): 52-54, 85. (XU Jinliang, CHEN Wuxing, TANG Yaoyang. Study on fault diagnosis in nuclear power plant based on rough sets and support vector machine[J].Nuclear Power Engineering, 2009, 30(4): 52-54, 85.)
[17] 汪文鋒. 基于粗糙集理論的裝載機(jī)故障診斷研究[D].湖北: 華中科技大學(xué), 2005.
[18] 楊雨時(shí), 張麗娜, 周靜. 粗糙集理論在農(nóng)業(yè)機(jī)械故障診斷中的應(yīng)用[J].農(nóng)機(jī)化研究, 2013, 33(4): 249-252. (YANG Yushi, ZHANG Lina, ZHOU Jing. Application for agricultural mechanical fault diagnosis with rough set theory[J].Journal of Agricultural Mechanization Research, 2013, 33(4): 249-252.)
[19] 陳念貽, 陸文聰. 支持向量機(jī)算法在化學(xué)化工中的應(yīng)用[J].計(jì)算機(jī)與應(yīng)用化學(xué), 2002, 19(6): 673-676. (CHEN Nianyi, LU Wencong. Support vector machine applied to chemistry and chemical technology[J].Computers and Applied Chemistry, 2002, 19(6): 673-676.)
[20] NIETO P J G, GONZALO E G, LASHERAS F S, et al. Hybrid PSO-SVM-based method for forecasting of the remaining useful life for aircraft engines and evaluation of its reliability[J].Reliability Engineering & System Safety, 2015, 138: 219-231.
High-Accuracy Fault Diagnosis of Chemical Processes Based on RS and SVM
ZHANG Xin, HU Jinqiu, ZHANG Laibin, WANG Qianlin
(CollegeofMechanicalandTransportationEngineering,ChinaUniversityofPetroleum,Beijing102249,China)
Fault diagnosis plays an important role to prevent accidents in chemical processes that are in the normal operation for a long time. However, the limited number of fault samples with redundant information reduces the accuracy of traditional fault classifiers. In order to improve the accuracy of fault diagnosis in chemical processes, a novel fault diagnosis method for chemical processes with redundant information, which integrates the rough set theory (RS) with a support vector machine (SVM), named RS-SVM, is proposed in this paper. In the first stage, RS is utilized to eliminate redundant features by reducing fault index system with no information loss. In the second stage, fault dataset based on minimal reduction index set obtained by RS is employed to establish the optimized SVM classifier. The effectiveness of the proposed method is verified by simultaneously applying RS-SVM and standard SVM to a pre-hydrogenation process. Results reveal that based on the simplicity attribute of RS, the accuracy of SVM is increased in various degrees. When the RBF kernel function is used and the fault sample capacity is 60, the accuracy of SVM is increased by the largest margin, 11.84%. In this aspect, eliminating redundant information is helpful to improve the accuracy of fault diagnosis.
chemical process; fault diagnosis; redundant information; rough set; support vector machine
2016-09-08
國家自然科學(xué)基金項(xiàng)目(51574263)、中國石油大學(xué)(北京)青年創(chuàng)新團(tuán)隊(duì)C計(jì)劃(C201602)和中國石油大學(xué)(北京)科研基金項(xiàng)目(2462015YQ0403)資助
張鑫,男,博士研究生,從事油氣生產(chǎn)系統(tǒng)故障診斷及預(yù)警研究;E-mail:mofansheng1999@126.com
胡瑾秋,女,教授,博士,主要從事油氣生產(chǎn)復(fù)雜系統(tǒng)可靠性、故障診斷及預(yù)警等研究;Tel:010-89733406;E-mail:hujq@cup.edu.cn
1001-8719(2017)04-0777-08
X937
A
10.3969/j.issn.1001-8719.2017.04.024