王靜虹,李晨陽(yáng),支有冉,王志榮
(1.南京工業(yè)大學(xué) 安全科學(xué)與工程學(xué)院,江蘇 南京 210009;2.江蘇省危險(xiǎn)化學(xué)品本質(zhì)安全與控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210009;3.南京工程學(xué)院 機(jī)械工程學(xué)院,江蘇 南京 210009)
數(shù)字出版日期: 2017-07-19
化工生產(chǎn)過(guò)程往往具有易燃易爆、高溫高壓、有毒有害等特點(diǎn),一旦在安全方面出現(xiàn)問(wèn)題,極易引發(fā)重大的人員傷亡和財(cái)產(chǎn)損失事故。當(dāng)化工生產(chǎn)過(guò)程中的人、機(jī)、環(huán)、管等主體發(fā)生或即將發(fā)生某些事件時(shí),化工企業(yè)應(yīng)能夠?qū)σ恍┊惓_M(jìn)行快速反應(yīng),在事件造成后果前或者事件發(fā)生前,就對(duì)異常情況進(jìn)行控制,從生產(chǎn)的不安全狀態(tài)迅速恢復(fù)到安全狀態(tài)。這種能力必須依賴(lài)于在嚴(yán)格的時(shí)間限制內(nèi)對(duì)這些主體釋放的信息進(jìn)行監(jiān)測(cè)、捕獲、分析、預(yù)警以及調(diào)控。而這種功能與自然界生物體的免疫系統(tǒng)具有很強(qiáng)的相似性。
免疫系統(tǒng)能夠保護(hù)機(jī)體不受外部細(xì)菌、病毒的感染?;谏锩庖呦到y(tǒng)中蘊(yùn)含豐富的信息處理機(jī)制,人工免疫系統(tǒng)(Artificial Immune system, AIS)的概念自20世紀(jì)七八十年代被提出以來(lái),在故障診斷、網(wǎng)絡(luò)監(jiān)測(cè)等領(lǐng)域都獲得了迅猛的發(fā)展[1-2]。在化工過(guò)程異常診斷方面,繼傳統(tǒng)的基于歷史數(shù)據(jù)[3]、基于動(dòng)態(tài)模型[4]和不依賴(lài)動(dòng)態(tài)模型的診斷方法[5]之后,利用人工免疫進(jìn)行異常診斷的研究也逐漸開(kāi)展,如清華大學(xué)的趙勁松團(tuán)隊(duì)在國(guó)內(nèi)率先基于人工免疫原理對(duì)間歇化工過(guò)程開(kāi)展故障診斷研究,取得了一系列進(jìn)展[6-8]。但大多數(shù)的過(guò)程異常檢測(cè)都存在一個(gè)很突出的問(wèn)題,即過(guò)程參數(shù)數(shù)量眾多且關(guān)聯(lián)關(guān)系極其復(fù)雜,傳統(tǒng)的人工免疫算法如克隆選擇算法、陰性選擇算法、人工免疫網(wǎng)絡(luò)算法等直接應(yīng)用于過(guò)程異常檢測(cè)時(shí)并不一定有顯著的效果,而且現(xiàn)有研究也多是基于特定的化工過(guò)程,其檢測(cè)方法的適用性仍有待提高。
此外,針對(duì)過(guò)程參數(shù)進(jìn)行特征提取可以有效改善故障診斷的效率,其中應(yīng)用最為廣泛的1種方法就是主成分分析法[9],如孟程程等人[10]提出利用核主成分分析方法對(duì)高爐冶煉過(guò)程中的故障進(jìn)行檢測(cè),以適應(yīng)高爐的非線(xiàn)性特征;吳卓卓[11]建立了1種基于主成分分析和支持向量數(shù)據(jù)描述的故障檢測(cè)模型,并通過(guò)TE數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn);陳果[12]提出基于主成分分析的轉(zhuǎn)靜碰摩故障特征提取方法并與支持向量機(jī)相結(jié)合,驗(yàn)證了方法的有效性。但在化工過(guò)程異常檢測(cè)中,人工免疫算法與主成分分析方法的結(jié)合效果、適用范圍及具體技術(shù)方案仍有待深入的研究。
以下利用人工免疫系統(tǒng)的識(shí)別、學(xué)習(xí)、記憶、自適應(yīng)等特點(diǎn),基于人工免疫算法中經(jīng)典的克隆選擇分類(lèi)算法CSCA (Clonal Selection Classification Algorithm) 和主成分分析方法PCA(Principal Component Analysis),構(gòu)建適用于多參數(shù)多模式的化工過(guò)程異常檢測(cè)方案,采用國(guó)際通用的TE過(guò)程數(shù)據(jù)集開(kāi)展數(shù)值實(shí)驗(yàn),測(cè)試并驗(yàn)證經(jīng)PCA方法改進(jìn)后的CSCA對(duì)化工過(guò)程異常檢測(cè)的效果,從而為化工過(guò)程異常檢測(cè)提供1種具有較廣泛適用性和較高準(zhǔn)確性的科學(xué)技術(shù)手段。
Brownlee[13]在2005年基于克隆選擇算法提出了克隆選擇分類(lèi)算法CSCA,并在機(jī)器學(xué)習(xí)領(lǐng)域獲得了廣泛認(rèn)可和應(yīng)用。該算法的流程如圖1所示。已有研究指出[14],CSCA算法相對(duì)一般的克隆算法,在準(zhǔn)確率上有明顯提高,而在平均絕對(duì)誤差和均方根誤差中,CSCA算法均要低于一般克隆算法。另外,由于CSCA采用了更為復(fù)雜的克隆選擇和迭代策略,因此,系統(tǒng)構(gòu)建時(shí)間會(huì)比一般克隆算法明顯增多。
圖1 CSCA算法流程Fig.1 The flowchart of CSCA algorithm
根據(jù)這一算法的思想,構(gòu)建基于克隆選擇分類(lèi)算法(CSCA)針對(duì)化工過(guò)程異常檢測(cè)分類(lèi)的主要步驟,如圖2所示。在這過(guò)程中,免疫系統(tǒng)概念與過(guò)程異常檢測(cè)算法的對(duì)應(yīng)關(guān)系如表1所示。
圖2 基于CSCA的過(guò)程異常檢測(cè)分類(lèi)步驟Fig.2 The procedure of anomaly detection and classification of chemical process by CSCA
考慮通用的具有代表性的TE過(guò)程(田納西一伊斯曼過(guò)程)數(shù)據(jù)對(duì)所建立的CSCA化工過(guò)程異常檢測(cè)技術(shù)進(jìn)行驗(yàn)證,通過(guò)TE過(guò)程數(shù)據(jù)調(diào)試該檢測(cè)技術(shù)的性能。TE過(guò)程數(shù)據(jù)包含訓(xùn)練集和測(cè)試集,訓(xùn)練集和測(cè)試集各自含有22種異常模式,每個(gè)異常模式下的數(shù)據(jù)均包含53個(gè)屬性[15],能夠?yàn)楫惓z測(cè)研究提供所需的基礎(chǔ)數(shù)據(jù)。
表1 免疫系統(tǒng)概念與CSCA過(guò)程異常檢測(cè)分類(lèi)算法的對(duì)應(yīng)關(guān)系
表2所示是采用機(jī)器學(xué)習(xí)領(lǐng)域2個(gè)標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)“Iris Plants Database”和“Large Soybean Database”對(duì)CSCA算法進(jìn)行驗(yàn)證以及進(jìn)一步采用TE過(guò)程數(shù)據(jù)中的訓(xùn)練集和測(cè)試集分別進(jìn)行檢測(cè)之后的結(jié)果。可以看到,CSCA對(duì)Iris和Soybean 2個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集的分類(lèi)效果都比較好,因此CSCA檢測(cè)技術(shù)本身是準(zhǔn)確的、有效的。而采用TE過(guò)程數(shù)據(jù)進(jìn)行分類(lèi)時(shí),發(fā)現(xiàn),當(dāng)數(shù)據(jù)樣本很大、屬性很多的情況下,分類(lèi)效果很不理想。
現(xiàn)實(shí)情況是,化工過(guò)程異常需要考慮很多種類(lèi),且依靠單一屬性參數(shù)(如溫度、壓力、濃度等)往往無(wú)法及時(shí)檢出早期微小異常,因此基于大樣本多屬性的過(guò)程數(shù)據(jù)進(jìn)行異常檢測(cè),是更符合過(guò)程安全現(xiàn)實(shí)需求的。這就提出一個(gè)問(wèn)題:如何對(duì)過(guò)程數(shù)據(jù)進(jìn)行可靠的預(yù)處理,尋求在數(shù)據(jù)樣本規(guī)模、樣本結(jié)構(gòu)和異常檢測(cè)效果之間的最優(yōu)匹配,以實(shí)現(xiàn)基于CSCA的過(guò)程早期微小異常的準(zhǔn)確、高效檢測(cè)和識(shí)別。
表2 基于CSCA的異常分類(lèi)效果
考慮到TE訓(xùn)練集包含53個(gè)屬性,22種異常模式,先采用主成分分析(PCA)方法對(duì)其屬性進(jìn)行降維處理;再將降維之后的樣本作為CSCA的檢測(cè)樣本,對(duì)其進(jìn)行異常檢測(cè)分類(lèi)。PCA分析的結(jié)果如圖3所示。由圖可知,前11個(gè)主成份的貢獻(xiàn)率累積達(dá)85.37%(≥85%),所對(duì)應(yīng)的屬性為att01,att09,att13,att18,att19,att21,att34,att38,att39,att45和att51。運(yùn)用CSCA對(duì)經(jīng)過(guò)主成分分析篩選出的樣本再次進(jìn)行異常檢測(cè)分類(lèi),此時(shí)的數(shù)據(jù)樣本總數(shù)仍為10 580,針對(duì)每一類(lèi)屬生成的記憶細(xì)胞數(shù)目如圖4所示。最終結(jié)果顯示,同樣在22種異常模式情況下,進(jìn)行PCA處理之后的樣本正確分類(lèi)比例為39.8%,未正確分類(lèi)比例為60.2%。由此可知,盡管采用PCA方法進(jìn)行了屬性降維,但由于總的樣本數(shù)仍十分龐大,分類(lèi)準(zhǔn)確率雖有所提高,但仍無(wú)法令人滿(mǎn)意。
圖3 主成分的貢獻(xiàn)率累積百分比Fig.3 The cumulative percentage of the contributionrate of principal components
圖4 生成的記憶細(xì)胞數(shù)目Fig.4 Number of memory cells
在此基礎(chǔ)上進(jìn)一步考慮縮減樣本規(guī)模。由于TE過(guò)程異常數(shù)據(jù)是從第8 h后開(kāi)始引入不同類(lèi)型的異常,前8 h均為穩(wěn)態(tài)無(wú)異常數(shù)據(jù),因此,考慮到異常檢測(cè)效果應(yīng)該在異常情況一出現(xiàn)即盡快將其檢出,因此選擇10 h的數(shù)據(jù)樣本(前8h為穩(wěn)態(tài)正常數(shù)據(jù),后2 h為異常數(shù)據(jù)),樣本總數(shù)為4 399??紤]到如果基于這10h的數(shù)據(jù)能夠獲得好的異常檢測(cè)效果,那么也就意味著在過(guò)程異常出現(xiàn)2 h內(nèi),CSCA即能檢測(cè)并識(shí)別出異常情況的類(lèi)型。首先,對(duì)數(shù)據(jù)進(jìn)行PCA處理,獲取4個(gè)主成分,對(duì)應(yīng)屬性att05,att38,att45和att51,運(yùn)用CSCA分類(lèi)正確率為30.2%。而未進(jìn)行PCA處理時(shí),正確率為26.5%。如果仍采用之前的11個(gè)主成分時(shí),正確率40.9%。具體結(jié)果整理見(jiàn)表3所示。從中可以看到,過(guò)程異常數(shù)據(jù)的規(guī)模、屬性的數(shù)目對(duì)CSCA異常檢測(cè)效果具有明顯的影響。盡管CSCA可以對(duì)大多數(shù)通用數(shù)據(jù)集有不錯(cuò)的檢測(cè)分類(lèi)效果,但對(duì)于化工過(guò)程數(shù)據(jù)來(lái)說(shuō),由于樣本規(guī)模過(guò)大以及異常類(lèi)別過(guò)多等現(xiàn)實(shí)情況的存在,還需要進(jìn)一步探討更為有效的數(shù)據(jù)降維或重構(gòu)方案,才能使異常檢測(cè)正確率提高到滿(mǎn)意的程度。
表3 基于CSCA+PCA的異常檢測(cè)分類(lèi)效果(未數(shù)據(jù)重整)
基于主成分分析的結(jié)果,在TE數(shù)據(jù)中選擇4個(gè)主成分的主要構(gòu)成參數(shù)作為監(jiān)測(cè)對(duì)象。選取異常模式class01,class02,class03和class04的數(shù)據(jù)作為試驗(yàn)數(shù)據(jù)。數(shù)據(jù)重整中重點(diǎn)關(guān)注異常引入的時(shí)間,即:考慮到每個(gè)異常模式下的前160個(gè)數(shù)據(jù)是引入異常模式之前的,在異常檢測(cè)中有可能形成干擾,因此只采用引入異常模式之后1h的數(shù)據(jù),組織成樣本集1,共80組數(shù)據(jù)。采用引入異常模式之后2 h的數(shù)據(jù),組織成樣本集2,共160組數(shù)據(jù)。將異常發(fā)生后第3 h的數(shù)據(jù)單獨(dú)提取,組織成樣本集3,共80組數(shù)據(jù)。仍然采用CSCA算法對(duì)重整后的異常樣本進(jìn)行檢測(cè)分類(lèi),分類(lèi)結(jié)果如表4所示??梢钥吹?,控制分類(lèi)樣本數(shù)之后,CSCA對(duì)4種異常模式具有較好的檢測(cè)效果。
在此基礎(chǔ)上,對(duì)樣本集3的異常模式進(jìn)行預(yù)測(cè),詳細(xì)預(yù)測(cè)結(jié)果列于表5,其中下劃線(xiàn)顯示的是預(yù)測(cè)錯(cuò)誤的樣本。共計(jì)85%的樣本被準(zhǔn)確定位為class03異常模式,與實(shí)際情況相符。
表5 樣本集3的預(yù)測(cè)結(jié)果
注:表格中的預(yù)測(cè)值通過(guò)四位二進(jìn)制表示所屬的異常類(lèi)型,例如“0001”表示歸屬為故障模式class04。
1)基于人工免疫原理的克隆選擇分類(lèi)算法(CSCA)面對(duì)大樣本多屬性的化工過(guò)程數(shù)據(jù)時(shí),在異常檢測(cè)效果方面存在局限性,即過(guò)程異常數(shù)據(jù)的規(guī)模、屬性的數(shù)目對(duì)CSCA異常檢測(cè)效果具有明顯的負(fù)面影響。
2)基于TE過(guò)程數(shù)據(jù)的異常檢測(cè)和分類(lèi)實(shí)驗(yàn)表明,通過(guò)主成分分析(PCA)方法進(jìn)行數(shù)據(jù)降維及數(shù)據(jù)重整之后,CSCA對(duì)過(guò)程異常分類(lèi)辨識(shí)的準(zhǔn)確率可提升到85%以上,從而適應(yīng)化工過(guò)程異常檢測(cè)的實(shí)際需求。
3)研究提出的CSCA+PCA的化工過(guò)程異常檢測(cè)技術(shù)方案,可以應(yīng)用于多參數(shù)多異常模式的化工過(guò)程;為進(jìn)一步提高異常檢測(cè)分類(lèi)的準(zhǔn)確性和可靠性,今后將進(jìn)一步研究過(guò)程數(shù)據(jù)的樣本規(guī)模、樣本結(jié)構(gòu)及其復(fù)雜非線(xiàn)性關(guān)系對(duì)于異常檢測(cè)效果的影響。
[1] González F A. A study of artificial immune systems applied to anomaly detection[M]. The University of Memphis, 2003.
[2] Morteza J, Hossein M, Kasra M, et al. A Method in Security of Wireless Sensor Network based on Optimized Artificial immune system in Multi-Agent Environments[J]. Research Journal of Recent Sciences, 2013,2(10):99-106.
[3] Venkatasubramanian V, Rengaswamy R, Kavuri S N, et al. A review of process fault detection and diagnosis: Part III: Process history based methods [J]. Computers and Chemical Engineering, 2003, 27(3): 327-346.
[4] Tian W D, Sun S L, Liu J Q. Fault diagnosis in chemical processes based on dynamic simulation[J]. Journal of System Simulation, 2007, 19(12):2831-2835.
[5] 黃啟明, 錢(qián)宇, 林偉璐,等. 化工過(guò)程故障診斷研究進(jìn)展[J]. 化工自動(dòng)化及儀表, 2000, 27(3):1-5.
HUANG Qiming, QIAN Yu,LIN Weilu,et al. Advances of fault diagnosis for chemical process[J]. Control and Instruments in Chemical Industry, 2000, 27(3):1-5.
[6] 魏巧玲, 趙勁松, 鐘本和. 基于模擬疫苗的人工免疫系統(tǒng)在氯乙烯聚合間歇過(guò)程故障診斷中的應(yīng)用[J]. 化工學(xué)報(bào), 2015, 66(2):635-639.
WEI Qiaolin, ZHAO Jinsong,ZHONG Benhe . Application of AIS based on SV for fault diagnosis of vinyl chloride polymerization batch process[J]. CIESC Journal, 2015, 66(2):635-639.
[7] 戴一陽(yáng),趙勁松,陳丙珍. 化工過(guò)程混合故障診斷系統(tǒng)的應(yīng)用[J]. 化工學(xué)報(bào),2010,61(2):342-346.
DAI Yiyang, ZHAO Jinsong ,CHEN BingZhen. Application of hybrid diagnostic system for chemical processes[J]. CIESC Journal, 2010,61(2):342-346.
[8] 戴一陽(yáng), 陳寧, 趙勁松,等. 人工免疫系統(tǒng)在間歇化工過(guò)程故障診斷中的應(yīng)用[J]. 化工學(xué)報(bào), 2009, 60(1):172-176.
DAI Yiyang,CHEN Ning,ZHAO Jinsong,et al. Application of AIS to batch chemical process fault diagnosis[J]. CIESC Journal , 2009, 60(1):172-176.
[9] 陸寧云, 楊英華, 王福利. 基于迭代主成分分析的過(guò)程監(jiān)測(cè)方法的研究與實(shí)現(xiàn)[J]. 控制與決策, 2002, 17(2):215-218.
LU Ningyun, YANG Yinghua,WANG Fuli. Research and implementation of process monitoring based on iterative principal component analysis( PCA)[J]. Contr ol and Decision, 2002, 17(2):215-218.
[10] 孟程程,曾九孫,李文軍. 核主成分分析的高爐故障檢測(cè)研究[J]. 中國(guó)計(jì)量學(xué)院學(xué)報(bào),2012,23(4):332-337.
MENG Chengcheng,ZENG Jiusun,LI Wenjun. Blast furnace fault detection based on KPCA[J]. Journal of China University of Metrology, 2012,23(4): 332-337.
[11] 吳卓卓. 基于田納西—伊斯曼過(guò)程故障檢測(cè)方法研究[D]. 上海:華東交通大學(xué), 2016.
[12] 陳果. 基于一類(lèi)支持向量機(jī)與主成分分析的轉(zhuǎn)靜碰摩故障檢測(cè)技術(shù)[J]. 振動(dòng)與沖擊,2012,31(22):29-33,38.
CHEN Guo. Rotor-stator rubbing fault testing technique based on one-class support vector machine and primary component analysis[J]. 2012,31(22):29-33,38.
[13] Brownlee J. Clonal Selection Theory & Clonalg: The Clonal Selection Classification Algorithm (CSCA)[J]. Cheminform, 2005, 36(14):341.
[14] 黃黎黎. 人工免疫算法研究及其在癌癥診斷中的應(yīng)用[D]. 北京:北京郵電大學(xué), 2010.
[15] 齊向娟, 李士雨, 孫靈棟. ChemCAD在精餾塔動(dòng)態(tài)模擬中的應(yīng)用[J]. 計(jì)算機(jī)與應(yīng)用化學(xué), 2008, 25(6):752-756.
QI Xiangjuan, LI Shiyu, SUN Lingdong. Applied of ChemCAD in distillation column dynamic simulation [J]. Computers and Applied Chemistry, 2008, 25(6):752-756.
中國(guó)安全生產(chǎn)科學(xué)技術(shù)2017年7期