肖紅軍,劉乙奇,伍 俊
(1.佛山科學(xué)技術(shù)學(xué)院 機(jī)械與電氣工程學(xué)院, 廣東 佛山 528000;2.華南理工大學(xué) 自動化科學(xué)與工程學(xué)院, 廣東 廣州 510640)
在過程控制中,常規(guī)儀表常常會遇到購買及維護(hù)費(fèi)用過高,延遲過大甚至工作條件過于惡劣等問題,因此,軟測量技術(shù)廣泛應(yīng)用于代替或部分代替儀表的功能以達(dá)到系統(tǒng)進(jìn)行監(jiān)控的目的[1-3]。軟測量是依據(jù)可測或易測變量(輔助變量)建立模型對難以直接測量變量(主導(dǎo)變量)進(jìn)行測量和估計(jì)的方法[4]。但是,軟測量是通過輸入傳感器的輸入變量和模型進(jìn)行預(yù)測的,如果某一個傳感器發(fā)生故障,將直接導(dǎo)致軟測量預(yù)測的偏離甚至失效。因此,在軟測量進(jìn)行模型預(yù)測之前,有必要對其輸入傳感器進(jìn)行有效的校驗(yàn)。盡管大量學(xué)者對傳感器的故障診斷和辨識進(jìn)行了大量研究[5-6],但是,鮮有學(xué)者研究專門針對軟測量的輸入傳感器的故障診斷和辨識,故障重構(gòu)更是少之又少。Martin和羅中良等提出了經(jīng)網(wǎng)絡(luò)對輸入傳感器進(jìn)行校驗(yàn)[7-8],在他們的方法中,如果輸入測量數(shù)據(jù)超過某一限值,操作員則利用經(jīng)驗(yàn)知識手動的替代故障的數(shù)據(jù)??墒?,這在過程工業(yè)中顯得不切合實(shí)際。通過最小化SPE故障檢測的原理,Qin等提出了基于SPE和T2的故障辨識和重構(gòu)方法[9]。但是,單純的SPE或T2故障檢測方法容易產(chǎn)生誤報(bào)警。Yue和Qin等[6]混合了SPE和T2指標(biāo)進(jìn)行故障檢測,并獲得了不錯的效果。但由于重構(gòu)算法比較復(fù)雜和耗時,在實(shí)際中不易實(shí)現(xiàn),同時混合指標(biāo)的限值不容易確定。
SEVA(自確認(rèn))儀表是自帶自檢測參數(shù)的一種新型儀表,由牛津大學(xué)和Foxboro提出的標(biāo)準(zhǔn),并在熱電偶和溶解氧傳感器中得到了應(yīng)用[10]。本文在此基礎(chǔ)上研究預(yù)測模型的綜合輸出機(jī)制,模型的輸出將不是單個預(yù)測值的輸出,而是同時輸出五種信息:帶概率區(qū)間的輸出、模型的狀態(tài)(故障狀態(tài),重構(gòu)狀態(tài)和迷失狀態(tài)等等)、不確定性、故障信息和校驗(yàn)輸出值,并對發(fā)生故障的輸入傳感器進(jìn)行數(shù)據(jù)重構(gòu)和修復(fù)以達(dá)到模型自校驗(yàn)和自診斷的目的。特別需要指出的是本文創(chuàng)新性的運(yùn)用魯棒統(tǒng)計(jì)學(xué)中的CP(Confidence Predictor)技術(shù)對預(yù)測模型的不確定進(jìn)行定性的描述。此外,可以將輸入傳感器的狀態(tài)也作為模型的輸出,從而達(dá)到對預(yù)測模型從輸入、模型和輸出的三方位檢測,使得模型的輸出不再只是單純的預(yù)測值,還有不確定區(qū)間和輸入傳感器的輸入狀態(tài)。
PCA根據(jù)保留最大數(shù)據(jù)方差的條件下對輸入變量進(jìn)行降維約簡[11]。假設(shè)X是n×m的數(shù)據(jù)矩陣,PCA將多變量的輸入數(shù)據(jù)矩陣進(jìn)行奇異值分解后得到主元和特征向量:
(1)
其中ti∈Rn被稱為得分向量,即矩陣X的主元,pi∈Rm被稱為負(fù)荷向量,是殘差矩陣,它包含了系統(tǒng)的數(shù)據(jù)的主要噪聲。T=[t1,t2,…,tn]和P=[p1,p2,…,pm]分別是得分向量矩陣和負(fù)荷向量矩陣。給定一個新的采樣向量,PCA的得分向量,預(yù)測和殘差向量的關(guān)系如下:
ti=xpi
(2)
(3)
(4)
(5)
統(tǒng)計(jì)量SPE主要用于測量殘差數(shù)據(jù)的變化
(6)
正常情況下,SPE是可以忽略不計(jì)的。但是,如果某一個傳感器發(fā)生故障SPE將急劇變大,可用于傳感器故障的診斷。但是SPE對噪聲過度敏感從而極易導(dǎo)致誤報(bào)警?;谏鲜龇治?,本文將通過最小化SPE改進(jìn)傳感器故障診斷指標(biāo),并提出SVI指標(biāo)。在軟測量預(yù)測之前,SVI可以用來確認(rèn)軟測量的輸入數(shù)據(jù)的正常與否。與此同時,故障的傳感器數(shù)據(jù)能被PCA模型的估計(jì)值進(jìn)行重構(gòu)。另外,PCA還能用于軟測量建模過程中JIT算法的數(shù)據(jù)選擇。
PLS方法將高維數(shù)據(jù)空間投影到低維特征空間,得到相互正交的特征向量,再建立特征向量間的一元線性回歸關(guān)系[12]。假定一個輸入輸出組成的矩陣數(shù)組{XY}, 輸入輸出矩陣可表達(dá)為
X=TPT+E
(7)
Y=UQT+F
(8)
其中T∈Rn×d和U∈Rn×d分別是X和Y的得分向量矩陣,d是負(fù)載向量的個數(shù)。而P∈Rm×d和U∈Rm×d分別是相關(guān)的負(fù)載向量矩陣,E和F分別是X和Y的殘差。T和U的內(nèi)部關(guān)系則由公式(9)表示
U=TB+R
(9)
其中B∈Rd×d是通過最小化殘差R其中包含回歸權(quán)值的對角矩陣。{TUPQB}是{XY}經(jīng)過偏最小二乘法處理后獲得的參數(shù),即
(10)
而回歸系數(shù)由式(11)表示:
CPLS=(XTX)++XTY=W*BQT
(11)
其中
(12)
(13)
0+是右逆,Im表示m行的單位陣,wi是PLS的權(quán)向量,Q是PLS的負(fù)載向量,p是Q的列向量,h表示PLS提取出來的主元個數(shù),而CPLS是PLS算法的回歸系數(shù)。當(dāng)新數(shù)據(jù)到來時,偏最小二乘模型據(jù)式(14)進(jìn)行更新。
(14)
其中,xnew是新的數(shù)據(jù)輸入點(diǎn),ynew是新的數(shù)據(jù)輸出點(diǎn)。XNEW和YNEW則分別表示輸入X的負(fù)載向量矩陣和輸出Y的負(fù)載向量矩陣在新數(shù)據(jù)更新后的新矩陣。由上式可以看出,隨著新數(shù)據(jù)不斷的到來,矩陣的維數(shù)并沒有發(fā)生變化,也因此大大加快了數(shù)據(jù)的處理速度和加快模型的處理速度。
不同于傳統(tǒng)的基于PCA模型的SPE或T2的故障診斷方法,本文結(jié)合了SPE因子和SVI因子,并將它們用于故障的診斷。此外,利用方差分析方法URV(unreconstructed variance)在PCA模型建立之初對數(shù)據(jù)進(jìn)行了主元個數(shù)進(jìn)行合理的分析。具體如圖1所示。
圖1 自確認(rèn)軟測量框架Fig.1 Schematic of self-validating a soft sensor
(15)
(16)
實(shí)際上,PCA模型主元個數(shù)的確定是相對主觀的。如果故障傳感器輸入數(shù)據(jù)通過大量主元重構(gòu)所得,則重構(gòu)輸入數(shù)據(jù)極大可能會包含大量主元所帶來的噪聲。相反,如果所確定的主元過少,所建立模型可能會由于故障數(shù)據(jù)得不到充分的重構(gòu)而產(chǎn)生病態(tài)。此外,在PCA用于數(shù)據(jù)重構(gòu)的過程中,主元的個數(shù)會進(jìn)一步影響傳感器的校驗(yàn),如檢測小故障的能力,故障辨識的自由度和重構(gòu)的精確度。
Dunia等[13]發(fā)現(xiàn)當(dāng)PCA模型用于重構(gòu)故障傳感器時,方差分析方法URV是可以在分析方差的同時,計(jì)算最優(yōu)的主元個數(shù),并且對重構(gòu)效果有一定的指示作用。例如,變量i的重構(gòu)方差ui表示,即xi-zi的方差計(jì)算如下:
(17)
2.1.2 故障檢測和辨識 因?yàn)槎鄠鞲衅魍瑫r發(fā)生故障的可能性比較小,因此,此方法很容易能推廣到多個不同時發(fā)生故障傳感器的故障診斷。當(dāng)某個傳感器發(fā)生故障的時候,采樣向量x可以表示為
x=x*+fεi
(18)
其中x*代表正常數(shù)據(jù)的部分,εi是故障傳感器的單位向量,而f是故障的大小,可以為正值也可以為負(fù)值。為了說明方法的效果,重構(gòu)數(shù)據(jù)表示為:
(19)
被重構(gòu)的向量能被映射到模型和殘差空間,從而計(jì)算出SPE如下:
(20)
如果第i個傳感器發(fā)生故障同時j≠i,SPE(xj)不會發(fā)生明顯變化。然而,如果選到真正的故障傳感器,即i=j,SPE(xj)則會明顯減小。同時,故障SPE(x)會急劇的變大,因此,本文設(shè)計(jì)的SVI因子如下:
(21)
其中1≤η≤0。從以上式子中可以看出,當(dāng)發(fā)生故障時,SPE(xj)急劇減小,而SPE (x)會急劇的變大,因此SVI會近乎接近于0,即ηj近乎于0,同時比單純的SPE(x)更加敏感。Dunia等[13]在他的文中給出了具體的討論。此外,基于輸入傳感器彼此間的相關(guān)性,其它正常的相關(guān)傳感器將被用來重構(gòu)故障變量,從而使得軟測量的預(yù)測更加穩(wěn)定。
從傳統(tǒng)角度來說,軟測量一般僅僅是作為未知信號的發(fā)生器。區(qū)別于傳統(tǒng)的軟測量,本文的自確認(rèn)軟測量不僅如上述描述的能輸入傳感器數(shù)據(jù)進(jìn)行自校驗(yàn),同時能產(chǎn)生多種信號:PV,ISS,OSS,VM和VU。
2.2.1 預(yù)測值(PV) 預(yù)測值與傳統(tǒng)傳感器的輸出并無差異,即給定易測量傳感器的輸入在模型的基礎(chǔ)上預(yù)測輸出值。
2.2.2 輸入傳感器的狀態(tài)(ISS) 輸入傳感器的狀態(tài)表示了輸入傳感器在系統(tǒng)的運(yùn)行當(dāng)中所呈現(xiàn)的故障或正常運(yùn)行狀態(tài)。狀態(tài)類別如表1所示。ISS能為現(xiàn)場操作人員提供現(xiàn)場儀表運(yùn)行的直接決策依據(jù)。
表1 輸入傳感器的狀態(tài)值Table 1 Input sensor status values
2.2.3 輸出傳感器狀態(tài)(OSS) 由于污水廠現(xiàn)場條件的惡劣,在線儀表很容易偏離正常狀態(tài)。另外,由于軟測量模型獨(dú)立于在線儀表,因此,本文提出了PV值,其可對在線分析儀表進(jìn)行在線校驗(yàn)。和表1類似,共有5種狀態(tài)對在線分析儀表進(jìn)行故障顯示。
2.2.4 不確定性校驗(yàn) 不確定,即UV值,能為真實(shí)的預(yù)測值提供可靠的置信空間,可以用于衡量模型和過程的噪聲以及故障的影響。為了便于置信區(qū)間的描述,同時也是基于ICP(Inductive Confidence Predictor)算法的高效性,本文中利用ICP算法對軟測量模型的不確定性進(jìn)行了闡述。ICP算法,是主動的(Inductive)不確定性描述算法,較之于被動算法(Transductive)有更高的計(jì)算效率,具體可參見文獻(xiàn)[14]。對于ICP算法,給定l個采樣點(diǎn)的集合{(x1,y1),…,(x1,y1),(xl+g,yl+g)},其中i=1, …,l, 和一個新的輸入點(diǎn)xl+g∈Rm。ICP假定輸入點(diǎn)xl+g的可能輸出值是yl+g,檢驗(yàn)其拓展樣本集合是獨(dú)立同分布的,集合如下:
{(x1,y1),…,(xl,yl),(xl+g,yl+g)}
(22)
p(yl+g)=p((x1,y1),…,(xl,yl),(x1g,yl+g))=
(23)
其中# A代表了集合A中元素個數(shù)。假定可以計(jì)算校驗(yàn)集合中每個可能輸出的p值,所有輸出的p值在置信度以內(nèi)則其至少有概率發(fā)生故障。因此,給定置信度1-δ,ICP算法的輸出為:
{yl+g:p(yl+g)?δ}
(24)
公式在文獻(xiàn)[13]中得到了有效的證明。
為了使ICP算法和RPLS算法能夠有效的結(jié)合,一致性測量指標(biāo)是必不可少的。因?yàn)橐恢滦詼y量指標(biāo)是用來衡量真實(shí)輸出值和預(yù)測值相對于采樣點(diǎn)的重要指標(biāo),因此,其被定義為真實(shí)值和預(yù)測值的絕對誤差:
(25)
ICP算法所產(chǎn)生的置信區(qū)間可為RPLS算法提供有效的置信空間。如果在線分析儀輸出超出置信區(qū)間,現(xiàn)場操作人員需要多次確認(rèn)從而確保儀表的可靠性。因此,RPLS軟測量模型輸出提供的不再是單調(diào)的預(yù)測值輸出,而是包含了輸出的校驗(yàn)的輸出值。在軟測量模型建模的過程中,數(shù)據(jù)選擇算法選出來的數(shù)據(jù)被放入數(shù)據(jù)空間S中,無論是RPLS算法或ICP算法每次建模都是以這個數(shù)據(jù)空間的數(shù)據(jù)為基礎(chǔ)的。具體RPLS算法和ICP算法的計(jì)算如表2所示。
表2 RPLS算法和ICP算法的結(jié)合Table 2 RPLS algorithm coupled with ICP Algorithm
2.2.5 校驗(yàn)測量值 鑒于現(xiàn)場復(fù)雜和惡劣的條件,在線分析儀表有極大的可能發(fā)生極端的或故障的情況。同時,即使儀表工作正常,儀表定期檢測也是不可避免的。因此,有必要為儀表提供定時在線測量。在本文的軟測量的建模過程中,在線分析儀表的輸出和模型的更新是獨(dú)立的。同時,由于軟測量模型輸出帶有不確定上下限檢驗(yàn),因此,當(dāng)其在線分析儀表發(fā)生故障時,能為其提供可替代的信息。
污水處理是一個復(fù)雜的生化處理過程,特別是污水廠的輸入流量隨著晴天雨天發(fā)生劇烈的變化,同時,其生物種群更是實(shí)時的發(fā)生變化,且工藝知識也不盡完善,加之現(xiàn)場條件惡劣,儀表發(fā)生故障的概率也隨之增加。BOD5是測量有機(jī)物重要的出水指標(biāo),也是重要的檢測參數(shù)。目前BOD5的測量無法進(jìn)行實(shí)時在線檢測,而市場上現(xiàn)有的實(shí)時在線5 d BOD 測量儀表造價(jià)很高,實(shí)用性和通用性差。因此,實(shí)現(xiàn)BOD5的實(shí)時在線測量顯得至關(guān)重要。校驗(yàn)數(shù)據(jù)來源于巴塞羅那的一個污水廠,將近2年400組數(shù)據(jù)。每組數(shù)據(jù)有38個變量。本文中利用Kohomen的自組織神經(jīng)網(wǎng)絡(luò) (SOM)檢測和選擇相關(guān)向量[15],因此,經(jīng)過選擇輔助變量如表3所示。其中200組數(shù)據(jù)用來訓(xùn)練模型,另外200組數(shù)據(jù)用來校驗(yàn)?zāi)P?,而輸出是BOD5,輸入變量是19個輔助變量。
表3 輔助變量表Table 3 Auxiliary variables
為了得到最佳的主元個數(shù),通過相關(guān)性進(jìn)行彼此檢測URV的計(jì)算,URV達(dá)到了最小值,PC為9時被用來作為PCA模型的主元個數(shù)。傳感器儀表都處于正常狀況下,200組數(shù)據(jù)被用來訓(xùn)練PCA模型,而其他200組數(shù)據(jù)用來校驗(yàn)PCA模型,從而得到了PCA模型和正常狀態(tài)的閾值。為了確認(rèn)PCA模型對軟測量的校驗(yàn)作用,我們假定二沉池的pH值發(fā)生階躍性的傳感器故障,如圖2(a)所示從第120天到170天有8左右的偏差。而從圖2(b)中可以看出SPE和SVI能很輕易的檢測出傳感器的故障,SPE值明顯超出了控制限,經(jīng)過數(shù)據(jù)重構(gòu)以后,SPE能很快的回復(fù)正常,但是仍然發(fā)生誤報(bào)警現(xiàn)象,如圖2(d)而SVI比較穩(wěn)定,很快定位出了是pH傳感器發(fā)生故障,其SVI值幾乎接近于0(其他傳感器的SVI值則都近乎于1,圖中沒顯示),并且沒有誤報(bào)警現(xiàn)象。同時,傳感器在數(shù)據(jù)重構(gòu)以后,很快的轉(zhuǎn)入了正常狀態(tài)。另外,圖2(a)顯示了重構(gòu)值和實(shí)際值能夠很好的吻合,說明了重構(gòu)的精確性。同時,SEVA軟測量不僅能辨識和重構(gòu)故障,而且能進(jìn)一步顯示輸入傳感器的狀態(tài),正如圖2(c)所示,如果二沉池的pH值發(fā)生8左右的偏差從第120天到170天,由于故障的發(fā)生,ISS CLEAR 狀態(tài)轉(zhuǎn)變到了BLURRED狀態(tài),同時沒有顯示是不是永久性故障。但是由于PCA模型對故障的檢測和重構(gòu),pH傳感器跳到了DAZZLED狀態(tài),并保持這個狀態(tài)直到儀表恢復(fù),并使得ISS在第170后跳到了CLEAR狀態(tài)。
為了顯示預(yù)測模型的預(yù)測誤差,文中引入的均方差(RMSE)和相關(guān)系數(shù)是準(zhǔn)確的評估軟測量模型的重要指標(biāo)。因?yàn)槲鬯畯S的復(fù)雜性,不僅受到季節(jié)變化、晴雨變化以及污水中微生物變化的影響,單純的預(yù)測值輸出的軟測量模型不能很好的確定其模型以及外部的不確定性,因此,我們利用ICP算法來計(jì)量預(yù)測輸出值的置信區(qū)間,從而來描述模型的不確定性。從圖3顯示,由于在過渡過程中過程變量偏離原本的穩(wěn)定狀態(tài),UV會相對應(yīng)的放大以及對相應(yīng)的不確定性作出指示。
在工業(yè)現(xiàn)場中,在儀表校驗(yàn)或運(yùn)行的時候,遭遇噪聲的概率極高,因此,對軟測量輸出或在線儀表的輸出的校驗(yàn)是必不可少的。由于RPLS軟測量模型的輸出是獨(dú)立于在線儀表輸出的,因此,軟測量的輸出及其置信區(qū)間能用來校驗(yàn)在線儀表。正如圖4(a)和(b)分別分析儀表發(fā)生突變和輸出值漂移兩種故障,在90%的置信度下,都能夠準(zhǔn)確的檢測出來。此外,SEVA軟測量能夠很好的校驗(yàn)軟測量在線儀表能否發(fā)生故障并且指示出在線儀表當(dāng)前的狀態(tài),從而進(jìn)一步確認(rèn)UV的有效性和其應(yīng)用于獲取VM(此處即軟測量的輸出值)。
圖4 突變和漂移兩種故障狀態(tài)下的故障診斷以及狀態(tài)預(yù)警Fig.4 Fault detection, diagnosis and status alarm under the bias and drift scenario
本文解決了傳統(tǒng)軟測量的不可靠性問題,并提出了SEVA軟測量模型的概念。SEVA軟測量不僅能實(shí)現(xiàn)模型的自診斷和數(shù)據(jù)的自重構(gòu),而且能夠提供多種輸出,包括預(yù)測值(PV),軟測量輸入傳感器狀態(tài)(ISS),輸出傳感器狀態(tài)(OSS),校驗(yàn)輸出(VM)和能描述軟測量輸出可信度的不確定性值(UV)。算法在污水廠的BOD5預(yù)測中得到了廣泛的應(yīng)用。基于PCA模型的SPE和SVI指標(biāo)能很好的辨識和重構(gòu)軟測量某個輸入傳感器發(fā)生故障時候的數(shù)據(jù),而且RPLS算法能在出現(xiàn)故障的情況下預(yù)測污水廠的出水指標(biāo)。此外,SEVA軟測量還能用于校驗(yàn)在線儀表,這些在污水廠的出水指標(biāo)預(yù)測中得到了進(jìn)一步的驗(yàn)證。所提出方法能推廣到其他類似的大延遲生化處理過程。
[1] 黃道平,劉乙奇,李艷.軟測量在污水處理過程中的研究與應(yīng)用[J].化工學(xué)報(bào),2012,62(1):1-9.
[2] 李戰(zhàn)明,王云峰, 袁占亭.基于流量特性的調(diào)節(jié)閥閥芯曲線智能擬合[J].中山大學(xué)學(xué)報(bào):自然科學(xué)版,2009,48(1):22-25.
[3] 湯儀平,金福江.低濃度混合染料間歇式染色過程色澤軟測量[J].儀器儀表學(xué)報(bào),2011,32(3):690-694.
[4] YAN W, SHAO H, Wang X. Soft sensing modeling based on support vector machine and Bayesian model selection [J]. Computers & Chemical Engineering, 2004, 28(8): 1489- 1498.
[5] KADLEC P, GABRYS B, STRANDT S. Data-driven Soft Sensors in the process industry [J]. Computers and Chemical Engineering, 2009, 33(1): 795-814.
[6] YUE H H, QIN S J. Reconstruction-Based Fault Identi-fication Using a Combined Index [J]. Industrial & Engi-neering Chemistry Research,2001, 40(20): 4403-4414.
[7] MARTIN E B, MORRIS A J. Non-parametric confidence bounds for process performance monitoring charts [J]. Journal of Process Control, 1996, 6(6): 349-358.
[8] 羅中良, 麥宜佳, 余劍峰. 基于多傳感器的神經(jīng)網(wǎng)絡(luò)模式識別方法 [J]. 中山大學(xué)學(xué)報(bào):自然科學(xué)版,2001,40(5):21-24.
[9] QIN S J, YUE H, DUNIA R. Self-Validating Inferential Sensors with Application to Air Emission Monitoring [J]. Industrial & Engineering Chemistry Research, 1997, 36(5): 1675-1685.
[10] HENRY M P, CLARKE D W. The self-validating sensor: rationale, definitions and examples [J]. Control Enginee-ring Practice, 1993, 1(4): 585-610.
[11] LIU X, KRUGER U, LITTLER T, et al. Moving window kernel PCA for adaptive monitoring of nonlinear processes [J]. Chemometrics and Intelligent Laboratory Systems, 2009, 96(2): 132-143.
[12] JOE Q S. Recursive PLS algorithms for adaptive data modeling[J].Computers & Chemical Engineering, 1998. 22(4/5): 503-514.
[13] DUNIA R, QIN S J, EDGAR T F, et al. Identification of faulty sensors using principal component analysis [J]. Aiche Journal, 1996, 42(10): 2797-2812.
[14] PAPADOPOULOS H, PROEDROU K, VOVK V, et al. Inductive confidence mach-ines for regression [C]∥ECML 2002 in Machine Learning ,Berlin: Springer, 2002:185-194.
[15] RALLO R, GIRALT F. Best feature selection and data completion for the design of soft neural sensors [C]∥ Proceedings of AIChE 2003, 2nd Topical Conference on Sensors ,San Francisco: ACS, 2003.