王國柱,路 通,池曉航,周 強,杜志勇
(1.衛(wèi)華集團有限公司,河南 長垣 453400;2.河南工學(xué)院 電氣工程與自動化學(xué)院,河南 新鄉(xiāng) 453003;3.鄭州大學(xué) 電氣工程學(xué)院,河南 鄭州 450001)
工業(yè)過程的平穩(wěn)性、安全性與可靠性是企業(yè)關(guān)注的重點問題,也是提高企業(yè)生產(chǎn)效率和產(chǎn)品質(zhì)量的關(guān)鍵因素。當(dāng)工業(yè)過程中出現(xiàn)異常時,如果沒有及時發(fā)現(xiàn)并處理,很有可能導(dǎo)致生產(chǎn)線停工、企業(yè)生產(chǎn)效率下降、環(huán)境污染,甚至是更加重大的經(jīng)濟損失和人員傷亡,并且當(dāng)異常逐漸發(fā)展為較大的故障后,造成的破壞大多數(shù)是不可逆的[1-2]。因此,過程監(jiān)測成為工業(yè)安全穩(wěn)定領(lǐng)域的研究重點,并得到國內(nèi)外專家學(xué)者的廣泛關(guān)注[3-5]。
工業(yè)過程監(jiān)測經(jīng)過多年的發(fā)展,其分類方法也在不斷完善,現(xiàn)大致分為基于解析模型的方法、基于知識的方法和基于數(shù)據(jù)驅(qū)動的方法[6-8]。但隨著工業(yè)控制領(lǐng)域自動化、信息化、智能化水平的不斷提高和計算機技術(shù)的飛速發(fā)展,集散控制系統(tǒng)和智能儀表得到廣泛使用,生產(chǎn)過程中的數(shù)據(jù)已經(jīng)可以被采集并長期存儲起來,這些數(shù)據(jù)中包含了系統(tǒng)運行的大量信息,對分析過程的歷史、現(xiàn)狀以及預(yù)測過程未來的運行情況都是不可缺少的寶貴資源。充分的數(shù)據(jù)分析和應(yīng)用,也能夠避免所謂的“數(shù)據(jù)豐富,信息缺乏”現(xiàn)象。傳統(tǒng)的基于數(shù)據(jù)驅(qū)動的過程監(jiān)測方法在建模時通常會做出一定的假設(shè),很難滿足工業(yè)過程的實際要求[9]。因此,基于統(tǒng)計理論過程監(jiān)測方法受到了國內(nèi)外研究人員的廣泛關(guān)注并得到了較快的發(fā)展,該方法具有不需要建立系統(tǒng)精確數(shù)學(xué)模型的優(yōu)勢,主要依賴正常過程數(shù)據(jù)建立統(tǒng)計學(xué)模型,從統(tǒng)計學(xué)角度對生產(chǎn)過程的安全性進行描述。
神經(jīng)網(wǎng)絡(luò)作為基于統(tǒng)計理論的經(jīng)典方法,具有自學(xué)習(xí)、自適應(yīng)、自組織、良好容錯性、高度并行性及非線性逼近能力,能夠較好地處理非線性、高度不確定性和無規(guī)律問題,將神經(jīng)網(wǎng)絡(luò)思想應(yīng)用于工業(yè)過程監(jiān)測具有一定的研究價值。本文首先應(yīng)用BP神經(jīng)網(wǎng)絡(luò)建立過程監(jiān)測模型,然后通過仿真驗證方法的可行性;但當(dāng)輸入數(shù)據(jù)的樣本過多時,計算將變得復(fù)雜,計算速度比較緩慢,因此本文引入主元分析對數(shù)據(jù)樣本進行處理,在降低數(shù)據(jù)樣本的維度后對網(wǎng)絡(luò)進行訓(xùn)練,以達到減少訓(xùn)練時間、提高故障檢測精度的目的。
由于現(xiàn)代工業(yè)過程的復(fù)雜程度日益提高,過程數(shù)據(jù)中的變量不斷增加,且很多變量都具有一定的相關(guān)性和冗余性,如果對所有變量進行分析,無疑會做大量的重復(fù)性工作。主元分析作為一種統(tǒng)計學(xué)方法,適用于多元數(shù)據(jù),能夠?qū)Χ嘧兞繑?shù)據(jù)進行降維,將高維數(shù)據(jù)轉(zhuǎn)化為能夠代表絕大多數(shù)數(shù)據(jù)信息的低維數(shù)據(jù)。其主要思想是通過坐標(biāo)變換將n維數(shù)據(jù)投影到相互正交的k維空間(k (1) (2) 計算協(xié)方差矩陣S。計算可得: (2) (3) 特征值分解。求解協(xié)方差矩陣S的特征值,并按照從大到小的順序進行排列,得到[λ1,λ2,…,λm],同時,計算特征值對應(yīng)的特征向量矩陣p=[p1,p2,…,pm]。 (4) 獲取主成分。設(shè)求解的第h個主成分為th,求解過程如式(3)所示: (3) (5) 確定主元個數(shù)。采用累計方差貢獻法(Cumulative percent variance, CPV)通過特征值方差的累計和百分比來選取主元,如式(4)所示: (4) 其中,m為變量數(shù),λi為過程數(shù)據(jù)矩陣特征值,CPV表示累計特征值方差貢獻和百分比,k表示保留的主元個數(shù)。通常情況下,CPV值大于85%即認(rèn)為前k個主元包含了足夠多的原始數(shù)據(jù)信息,近似能夠代表原始數(shù)據(jù)[10]。 BP神經(jīng)網(wǎng)絡(luò)又稱誤差反向傳播神經(jīng)網(wǎng)絡(luò),是誤差反向傳播的多層前饋網(wǎng)絡(luò),由Rumelhart等人于1986年提出[11],網(wǎng)絡(luò)模型如圖1所示:網(wǎng)絡(luò)為三層結(jié)構(gòu),包含輸入層、隱含層和輸出層,x1~xn為網(wǎng)絡(luò)的輸入數(shù)據(jù),n和m分別為輸入、輸出樣本個數(shù),wij,wjt分別為三層結(jié)構(gòu)之間的權(quán)值。 神經(jīng)網(wǎng)絡(luò)的運行過程分為訓(xùn)練和測試兩個部分,訓(xùn)練過程首先將輸入數(shù)據(jù)從前到后進行處理,然后根據(jù)實際輸出與期望輸出的誤差修改權(quán)值,最后反復(fù)進行以上過程直到誤差收斂。測試過程是將測試數(shù)據(jù)輸入網(wǎng)絡(luò),通過對比實際輸出與期望輸出得到誤差,進而測試網(wǎng)絡(luò)性能。 圖1 BP神經(jīng)網(wǎng)絡(luò)模型 BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法步驟如下: (1) 設(shè)定權(quán)值的初始值,使其初始化; (2) 對神經(jīng)網(wǎng)絡(luò)的一些參數(shù)進行定義,設(shè)三層BP神經(jīng)網(wǎng)絡(luò)輸入層、隱含層、輸出層神經(jīng)元分別為n、l、m,輸入矩陣X=[x1,x2,…,xn],網(wǎng)絡(luò)有n個訓(xùn)練樣本,經(jīng)過q次迭代后的輸出矩陣Y=[y1(q),y2(q),…,ym(q)],期望輸出矩陣d=[d1,d2,…,dm]; (3) 將X輸入網(wǎng)絡(luò),通過式(5)和(6)分析輸入數(shù)據(jù)并確定實際網(wǎng)絡(luò)輸出,得到 (5) (6) 式(5)和(6)中,Hj為隱含層輸出,j為隱含層節(jié)點數(shù),wij為輸入層與隱含層間的連接權(quán)值,ai為隱含層的閾值,Ot為網(wǎng)絡(luò)的輸出,wjt為隱含層與輸出層之間的連接權(quán)值,bt為輸出層閾值,f()為激勵函數(shù); (4) 根據(jù)式(7)對比期望與實際網(wǎng)絡(luò)輸出,并計算誤差et: (7) (5) BP神經(jīng)網(wǎng)絡(luò)的反向傳播過程目標(biāo)是使誤差et趨近最小值,通過式(8)使用梯度下降法修正權(quán)值: (8) 式中,δ為權(quán)重偏差,η為學(xué)習(xí)速率; (6)根據(jù)誤差的大小確定網(wǎng)絡(luò)參數(shù),通過式(9)計算新的連接權(quán)值和閾值: (9) (7) 重復(fù)以上步驟,直至誤差滿足要求。 基于主元分析和BP神經(jīng)網(wǎng)絡(luò)的過程監(jiān)測建模流程如圖2所示,主要分為以下三個步驟: 圖2 基于主元分析和BP神經(jīng)網(wǎng)絡(luò)的過程監(jiān)測流程圖 (1) 數(shù)據(jù)降維。首先對過程數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,避免因變量量綱不同引起誤差;其次對過程數(shù)據(jù)進行主元分析,通過CPV確定主元個數(shù),最后根據(jù)主元個數(shù)確定神經(jīng)網(wǎng)絡(luò)參數(shù)。 (2) 使用BP神經(jīng)網(wǎng)絡(luò)對過程進行監(jiān)測。根據(jù)步驟(1)確定的主元個數(shù)設(shè)置神經(jīng)網(wǎng)絡(luò)輸入層和隱含層參數(shù),k個主元對應(yīng)k個輸入層節(jié)點和2k+1個隱含層節(jié)點,輸出節(jié)點個數(shù)對應(yīng)監(jiān)測結(jié)果。采用L-M算法對網(wǎng)絡(luò)進行訓(xùn)練,隱含層和輸出層神經(jīng)元激活函數(shù)分別采用S型正切函數(shù)tansig和S型對數(shù)函數(shù)logsig。 (3) 網(wǎng)絡(luò)測試。將測試數(shù)據(jù)輸入網(wǎng)絡(luò),對網(wǎng)絡(luò)的訓(xùn)練時間、誤差收斂情況和監(jiān)測結(jié)果進行分析,評價網(wǎng)絡(luò)性能。 本節(jié)首先使用BP神經(jīng)網(wǎng)絡(luò)方法對田納西-伊斯曼(Tennessee-Eastman, TE)過程數(shù)據(jù)進行訓(xùn)練,并測試網(wǎng)絡(luò);然后引入主元分析方法對過程數(shù)據(jù)降維,進而對網(wǎng)絡(luò)進行訓(xùn)練并測試;最后根據(jù)過程預(yù)設(shè)故障類型分析、比較兩種算法的仿真結(jié)果,驗證所提算法的有效性。 TE過程是由美國田納西-伊斯曼化學(xué)公司開發(fā)的具有開放性和挑戰(zhàn)性的化工模型仿真平臺,該過程共包含52個變量,能夠產(chǎn)生正常數(shù)據(jù)和21種故障類型數(shù)據(jù),故障類型如表1所示,其中已知故障16個,其他為未知故障。本文選取IDV(8)故障進行仿真,設(shè)定CPV為85%,得到主元個數(shù)為28時CPV約為87.2%;選取480組正常樣本、480組故障樣本對網(wǎng)絡(luò)進行訓(xùn)練;選取960組樣本用于測試,其中包括正常樣本160組、故障樣本800組。將得到的28個主元作為網(wǎng)絡(luò)的輸入,確定輸入層的節(jié)點數(shù)為28個,根據(jù)經(jīng)驗確定隱含層節(jié)點數(shù)為57個,設(shè)定輸入是正常數(shù)據(jù)樣本時,輸出結(jié)果為0,故障時為1。 表1 TE過程21種故障類型 對網(wǎng)絡(luò)訓(xùn)練過程參數(shù)進行設(shè)置,設(shè)置迭代次數(shù)為100,學(xué)習(xí)速率為0.01,期望誤差為0.01。圖(3)給出了兩種方法的訓(xùn)練結(jié)果,由圖3(a)BP神經(jīng)網(wǎng)絡(luò)方法的訓(xùn)練結(jié)果得到:經(jīng)過40次迭代訓(xùn)練,訓(xùn)練誤差基本穩(wěn)定在0.5附近,誤差較大;圖3(b)為引入主元分析后的網(wǎng)絡(luò)訓(xùn)練誤差變化情況,可以看出網(wǎng)絡(luò)經(jīng)過20次迭代訓(xùn)練后誤差小于0.1,引入主元分析后的網(wǎng)絡(luò)迭代次數(shù)減少,訓(xùn)練效率更高,誤差更低。 圖4分別給出了兩種方法的監(jiān)測結(jié)果,從圖4(a)可以看出BP神經(jīng)網(wǎng)絡(luò)方法在第160組樣本后能夠監(jiān)測到故障存在,但漏報較多,實際監(jiān)測結(jié)果并不理想;圖4(b)為引入主元分析后的監(jiān)測結(jié)果,可以看出在第160組樣本后基本能夠監(jiān)測到所有故障的存在,相比BP神經(jīng)網(wǎng)絡(luò)方法,提高了故障檢測的準(zhǔn)確率。 (a) BP神經(jīng)網(wǎng)絡(luò)方法的訓(xùn)練結(jié)果 (a) BP神經(jīng)網(wǎng)絡(luò)方法監(jiān)測結(jié)果 表2給出了兩種方法的訓(xùn)練時間與故障檢測準(zhǔn)確率,通過對比可以看出:對經(jīng)過主元分析降維后的數(shù)據(jù)采用BP神經(jīng)網(wǎng)絡(luò)方法進行訓(xùn)練,訓(xùn)練時間更短,故障檢測準(zhǔn)確率更高,驗證了所提方法的有效性。 表2 兩種方法的訓(xùn)練時間與故障檢測準(zhǔn)確率 本文將主元分析與BP神經(jīng)網(wǎng)絡(luò)兩種方法相結(jié)合,通過主元分析理論對過程數(shù)據(jù)進行降維,建立了基于主元分析與BP神經(jīng)網(wǎng)絡(luò)的過程監(jiān)測模型并將其應(yīng)用于TE過程,得到以下結(jié)論:該方法訓(xùn)練時間短,故障檢測準(zhǔn)確率高,具有更好的過程監(jiān)測效果。1.2 BP神經(jīng)網(wǎng)絡(luò)
2 基于主元分析和BP神經(jīng)網(wǎng)絡(luò)的過程監(jiān)測模型
3 應(yīng)用研究
4 結(jié)束語