劉鴻斌, 張 昊, 景 宜, 張鳳山
(1. 南京林業(yè)大學 江蘇省林業(yè)資源高效加工利用協(xié)同創(chuàng)新中心, 江蘇 南京 210037; 2. 山東華泰紙業(yè)股份有限公司, 山東 東營 257335)
隨著制漿造紙工業(yè)過程的日趨復雜化及生產(chǎn)規(guī)模的大型化,造紙過程中產(chǎn)生的廢水問題也愈發(fā)凸顯.造紙廢水主要來自于黑液、白水等,其特點是水量大、濃度高、泡沫多及溫度高,且非溶解性COD又為COD的主導成分,造成了水體的可生化性較差.此外,在造紙廢水處理過程中存在諸如廢液中殘留的纖維、木質素及填料等較多干擾因素,造成Mg2+、Ca2+等離子與硫酸根、碳酸根及磷酸根離子形成鈣化顆粒污泥,從而降低了廢水處理反應器的處理能力.
在造紙廢水處理過程中,集散控制系統(tǒng)(distri-buted control system, DCS)作為現(xiàn)代工業(yè)過程的控制平臺被廣泛運用.DCS系統(tǒng)使得過程中數(shù)據(jù)的采集量大幅增加,且DCS系統(tǒng)具有多閉環(huán)、強干擾及高耦合的特點,使得過程數(shù)據(jù)與故障信息之間無法得到清晰的邏輯關系[1].此外,過程中存在的耦合性、時變性等特征導致所采集的數(shù)據(jù)具有較強的非線性及動態(tài)特征,這為過程故障檢測帶來較大困難.廢水處理過程的復雜性不僅造成故障檢測難度的提升,而且使得整個系統(tǒng)中更加頻發(fā)故障,極大地降低了污水處理效率及可靠性[2].這對于化工、石油等連續(xù)生產(chǎn)領域帶來很大挑戰(zhàn),同時也對過程故障的及時發(fā)現(xiàn)提出更高要求.
針對以上問題,工業(yè)過程模型在過程監(jiān)測等領域受到了廣泛關注.過程建模方法主要分為基于數(shù)學模型的方法、基于知識的方法及基于數(shù)據(jù)驅動的方法.基于數(shù)學模型的方法針對復雜的工業(yè)過程往往難以建立準確的數(shù)學模型,使得該方法無法很好地應用于工業(yè)廢水處理過程.此外,造紙廢水處理過程的復雜性,也導致基于知識的方法在專家知識獲取、自適應能力提高及實時性更新等方面存在較大缺陷,因此在實際運用中的通用性較差.相較于基于數(shù)學模型和基于知識的方法,基于數(shù)據(jù)驅動的方法不需要建立精確的模型,對于專家系統(tǒng)也無較強的依賴性,僅僅根據(jù)工業(yè)過程的歷史數(shù)據(jù),對數(shù)據(jù)中的信息進行深度挖掘,從而進行過程建模分析,以此實現(xiàn)過程故障檢測的目的.因此基于數(shù)據(jù)驅動的方法被廣泛用于復雜過程的故障檢測及診斷.
傳統(tǒng)的統(tǒng)計過程監(jiān)測包括單變量和多變量統(tǒng)計監(jiān)測.單變量過程統(tǒng)計主要包括Shewhart控制圖和指數(shù)加權移動平均控制(exponentially weighted mo-ving average, EWMA)圖等[3].然而單變量過程統(tǒng)計監(jiān)測只考慮了過程中單一變量的變化,不能對多變量之間的相關性進行準確描述,在實際應用中無法滿足現(xiàn)代造紙廢水處理過程的監(jiān)測要求.為了克服單變量在過程監(jiān)測中存在的缺陷,多變量統(tǒng)計過程監(jiān)測方法在20世紀90年代初運用于過程監(jiān)測及故障診斷.多變量統(tǒng)計過程檢測方法主要包括多元線性回歸(multiple linear regression, MLR)[4]、主成分分析(principal component analysis, PCA)[5]及偏最小二乘(partial least squares, PLS)[6].然而傳統(tǒng)的線性方法以滿足線性關系為前提,且變量之間需以互相獨立為條件[7],因此傳統(tǒng)的多變量故障檢測方法無法較好適應非線性動態(tài)系統(tǒng),易出現(xiàn)過程故障信息誤報,甚至發(fā)生事故[8].針對過程中普遍存在的時變性,文獻[9]首次提出動態(tài)PCA方法,該方法在建模過程中考慮了過程的相關性,提高了動態(tài)過程描述的準確性,但該方法在處理非線性過程變量時,不能進行非線性投影,造成故障檢測過程中出現(xiàn)誤報率較高的情況.為了克服變量之間存在的非線性問題,文獻[10]提出核PCA方法,但該方法未考慮實際工業(yè)過程普遍存在的動態(tài)特性,導致對故障檢測靈敏度不高,因此在運用中存在一定局限性.
為此,筆者將PCA方法與核函數(shù)相結合,利用高斯核函數(shù)的非線性映射來解決數(shù)據(jù)非線性問題,并通過構造增廣矩陣及引入時滯系數(shù)的方法來嵌入動態(tài)模型,以此更好地描述過程的動態(tài)特征.在偏移、漂移及精度下降3種故障下,分別采用PCA、核主成分分析(kernel principal component analysis, KPCA)及動態(tài)核主成分分析方法(DKPCA)進行對比分析,以此來探究DKPCA方法在復雜造紙廢水處理過程中的有效性.
主成分分析(PCA)作為一種多變量統(tǒng)計分析方法,其基本思想是將高維數(shù)據(jù)投影至低維數(shù)據(jù)[11].PCA模型通過建立主元子空間和殘差子空間,將數(shù)據(jù)樣本投影到子空間上,并在兩個子空間上分別建立T2統(tǒng)計量及平方預測誤差(squared prediction error,SPE)統(tǒng)計量.
假設數(shù)據(jù)樣本為X=[x1,x2,…,xn]T∈Rn×m,n為樣本數(shù),m為變量數(shù),其協(xié)方差矩陣定義為Σ=XTX/(n-1),利用PCA方法建立統(tǒng)計分析模型:
(1)
(2)
對式(1)兩邊同乘負載向量pi,可以得出主元向量ti為數(shù)據(jù)樣本X在負載向量pi上的投影,即
ti=Xpi.
(3)
由式(3)可得主元向量,即為原始數(shù)據(jù)樣本X在負載向量pi上的投影,投影越大,則表明所包含樣本數(shù)據(jù)中的原始信息越多.通過PCA方法分解后,原始數(shù)據(jù)X變量空間維度由m降至k,且變量之間互不相關[12],實現(xiàn)了低維度的多元統(tǒng)計分析.
在實際工業(yè)過程中,數(shù)據(jù)普遍存在較強的非線性特征,使得傳統(tǒng)PCA在解決該類問題時存在較大的局限性,因此相關學者提出核主成分分析(KPCA).KPCA方法用非線性映射將數(shù)據(jù)從原始數(shù)據(jù)空間映射到特征空間,從而在特征空間進行PCA統(tǒng)計方法的分析,利用統(tǒng)計量指標衡量故障檢測率.KPCA方法關于核函數(shù)的選擇主要包括線性核函數(shù)、多項式核函數(shù)及高斯核函數(shù)等,其中,由于高斯核函數(shù)具有所需要調(diào)整的參數(shù)較少等優(yōu)點被廣泛使用.筆者利用高斯函數(shù)K(xi,xj)=exp(-‖xi-xj‖2/c)作為核函數(shù),‖·‖為l2范數(shù),c為高斯函數(shù)帶寬.假設數(shù)據(jù)樣本為X=[x1,x2,…,xn]T∈Rn×m,通過非線性映射函數(shù)將原始數(shù)據(jù)進行投影,非線性映射關系為
x∈Rm→Φ(x)∈Rh,
(4)
式中:Φ(·)為非線性映射函數(shù);m為原始空間數(shù)據(jù)維度;h為特征空間數(shù)據(jù)維度,且h通常較大.
首先計算特征空間中數(shù)據(jù)的協(xié)方差矩陣:
(5)
協(xié)方差矩陣Σφ對應的特征方程為
λv=Σφv,
(6)
(7)
(8)
(9)
將式(7)進一步化簡為
(10)
特征空間中的新樣本xnew對應得分向量計算式:
(11)
式中:k=1,2,…,p,p為KPCA中所選擇的主元個數(shù).
利用非線性映射將原始空間數(shù)據(jù)映射到特征空間,并在特征空間中利用PCA建立統(tǒng)計分析模型,一定程度上優(yōu)化了PCA無法克服非線性數(shù)據(jù)的問題.然而實際造紙廢水處理過程普遍具有時變性等特征,使得不同變量之間存在序列相關性[13].因此在KPCA算法基礎上通過構建動態(tài)模型,提出動態(tài)核主成分分析(DKPCA)方法,以此提高動態(tài)過程中故障檢測的準確性.動態(tài)模型如下:
數(shù)據(jù)樣本X的原始矩陣為
(12)
增廣矩陣定義為
X(l)=
(13)
式中:t為時間序列中某一時刻;d為時滯變量.
通過引入動態(tài)方法,使得故障檢測模型對數(shù)據(jù)的動態(tài)結構有更強的捕捉性能,對模型的過程監(jiān)測性能有一定的改善.統(tǒng)計量指標用來實現(xiàn)故障檢測準確率的分析,常用的統(tǒng)計量指標是平方預測誤差(SPE)[14],其控制線為過程檢測臨界值,當檢測值超過控制線,則系統(tǒng)會將超過控制線的檢測點認為是故障.SPE統(tǒng)計量控制線定義為
(14)
2.1.1 廢水數(shù)據(jù)
數(shù)據(jù)取自廣東東莞造紙廠好氧段廢水處理工況[15].圖1為造紙廢水處理過程數(shù)據(jù).共170組數(shù)據(jù),分別為流量(Q)、進水化學需氧量(w(COD)in)、出水化學需氧量(w(COD)eff)、進水懸浮固形物(w(SS)in)、出水懸浮固形物(w(SSeff))、溶解氧量(w(DO))、溫度(t′)及pH值.
圖1 造紙廢水處理過程數(shù)據(jù)
2.1.2 廢水處理過程
造紙廢水處理工藝采用活性污泥法,利用懸浮生長的微生物絮體處理有機廢水,其處理流程如圖2所示.該系統(tǒng)由沉淀池、曝氣池及污泥回流系統(tǒng)組成.制漿造紙生產(chǎn)過程中產(chǎn)生的廢水首先進入初沉池過濾掉部分雜質,由初沉池處理后的上層廢液進入曝氣池,發(fā)生氧化反應,通過活性污泥與廢水進行充分接觸與混合,使得水體中可溶性有機物被吸附,并被水體中微生物群所分解.處理后廢水進入二沉池,將活性污泥與廢水進行分離,并將一部分污泥回流至曝氣池.
圖2 好氧廢水處理過程
針對造紙廢水處理過程的復雜性,筆者構建了偏移故障、漂移故障及精度下降故障3類故障模型.偏移故障是基于正常工況數(shù)據(jù)加上原始變量數(shù)據(jù)均值的20%來構建故障(w(COD)in(t)+418);漂移故障是以原始數(shù)據(jù)加上時間乘以0.05得到的數(shù)據(jù)來構建故障(pH(t)+0.05t);精度下降故障是在原始變量的基礎上加入均值為30、方差為1的正態(tài)隨機噪聲的方式構建故障數(shù)據(jù)(w(SS)eff(t)+N(30,12));將樣本數(shù)據(jù)的前110組樣本點作為訓練集,后60組樣本點作為測試集.故障構建圖如圖3所示.
圖3 3類故障數(shù)據(jù)
基于PCA、KPCA及DKPCA等3種過程監(jiān)測方法,對造紙廢水處理過程進行故障檢測分析.不同方法的故障檢測率如表1所示.基于PCA、KPCA及DKPCA等3種方法的故障檢測圖如圖4-6所示.紅色虛線為置信度為95%的控制線,超過紅線則表示故障被準確檢出,本研究采用SPE統(tǒng)計量來表征故障檢測的準確性.
由表1可知:在SPE統(tǒng)計量指標下,相較于PCA及KPCA,在偏移故障中,DKPCA方法的故障檢測率分別提升了96.96%及87.87%;在漂移故障中,KPCA未檢測出故障,DKPCA的故障檢測率相較于PCA提升了5.12%;在精度下降故障中,PCA及KPCA方法故障檢測率均為100%,但DKPCA方法下降至68.33%.
表1 SPE指標下3種方法的故障檢測率比較 %
由圖4-6可知:漂移故障中,相較于PCA方法,DKPCA方法故障檢測率僅提升了5.12%,但DKPCA通過動態(tài)方法的引入,對于復雜過程的動態(tài)特性有著更強的捕捉能力,對故障檢測的靈敏度也更高;DKPCA在初始出現(xiàn)故障時就可立即檢測出故障,而PCA方法在第16個樣本點處才檢測出故障,因此動態(tài)方法對于在線故障檢測的靈敏度有一定的改善;PCA及KPCA在精度下降故障下檢測率均為100.00%,而DKPCA檢測率為68.33%,得出DKPCA對于精度下降等此類微小故障的檢測有一定的局限性.
圖4 基于SPE指標的PCA故障檢測結果
圖5 基于SPE指標的KPCA故障檢測結果
圖6 基于SPE指標的DKPCA故障檢測結果
1) 將動態(tài)技術與傳統(tǒng)靜態(tài)故障監(jiān)測方法結合,表明了動態(tài)模型在故障監(jiān)測中的有效性.
2) 在傳統(tǒng)PCA和KPCA基礎上提出了動態(tài)核主成分分析(DKPCA)方法,有效克服了過程數(shù)據(jù)存在的非線性及動態(tài)特性.
3) DKPCA方法在偏移故障下相較于傳統(tǒng)的PCA及KPCA方法,其故障檢測率分別提升了96.96%及87.87%,有效地提高了故障檢測率.
4) DKPCA方法對于故障檢測更為迅速,提高了在線檢測的靈敏度及可靠性.通過動態(tài)技術及核函數(shù)的引用,有效解決了傳統(tǒng)方法無法克服過程的非線性及時變性的問題,提高了實際工業(yè)過程檢測的準確性及靈敏度.