常 鵬喬俊飛張祥宇王 普
(1.北京工業(yè)大學信息學部,北京 100124;2.北京工業(yè)大學計算智能和智能系統(tǒng)北京市重點實驗室,北京 100124;3.北京工業(yè)大學數(shù)字社區(qū)教育部工程研究中心,北京 100124)
多元統(tǒng)計技術已經(jīng)廣泛應用到間歇過程的過程監(jiān)測中,因其只需要生產(chǎn)過程數(shù)據(jù)進行統(tǒng)計建模,無需考慮間歇生產(chǎn)過程復雜的機理特性,在工業(yè)界和學術界得到了卓有成效的應用,其中針對非線性問題具有代表性的就是多向核主成分分析[1–4](multiway kernel principal component analysis,MKPCA),多項核偏最小二乘方法[5–10](multiway kernel partial least square,MKPLS).盡管MKPCA/MKPLS及其擴展方法在過程故障檢測得到了廣泛應用,但其要達到好的監(jiān)測的效果必須是假設生產(chǎn)過程屬于高斯分布,在進行過程特征提取時,僅僅考慮低階統(tǒng)計信息,未考慮過程數(shù)據(jù)的高階統(tǒng)計量信息,會造成特征提取的不充分[10–12].這是因為高斯過程的二階以上統(tǒng)計信息為零,而實際的間歇工業(yè)過程往往同時具有非線性和非高斯性,用以上方法對非高斯過程進行監(jiān)測勢必導致監(jiān)測模型存在大量的報警問題,甚至導致失效性.針對間歇生產(chǎn)過程數(shù)據(jù)普遍具有非線性和非高斯性共存的問題,近些年來,基于多向核獨立元分析[10–18](multiway kernle independent component analysis,MKICA)的監(jiān)測方法逐漸發(fā)展了起來.其具體核心算法是將原始數(shù)據(jù)用KPCA進行白化處理,解決數(shù)據(jù)的非線性,得到不相關的得分矩陣后進行ICA分解提取過程的獨立成分.但是KPCA在進行白化處理時其實質(zhì)是在特征提取,而其特征提取的依據(jù)是方差.然而間歇過程具有明顯的階段簇結(jié)構特征[19],以本文采用的對象,工業(yè)重組大腸桿菌制備白介素–2為例,其生產(chǎn)過程按照微生物機理分為無補料菌種培養(yǎng)階段、菌種的補料快速生長階段、誘導產(chǎn)物合成階段,具有明顯的多階段特性[20].為解決上述問題,常鵬等人[20]提出了一種基于MKECA[21–22]白化的MKEICA方法.該方法利用MKECA進行特征提取時能夠保留數(shù)據(jù)的簇結(jié)構的階段特征,之后在核熵空間建立ICA監(jiān)測模型用于生產(chǎn)過程的監(jiān)控.但是以上MKICA/MKEICA監(jiān)測方法在進行過程監(jiān)測時,所使用的監(jiān)測統(tǒng)計量I2和SPE是低階統(tǒng)計量,只能監(jiān)測生產(chǎn)過程的低階統(tǒng)計信息,不能監(jiān)測生產(chǎn)過程的高階統(tǒng)計的信息,如生產(chǎn)過程中產(chǎn)生的故障具有明顯的高階統(tǒng)計信息時其將無能為力,而實際的生產(chǎn)過程往往具有高階統(tǒng)計信息[23–25].而文獻[24–30]指出,非高斯信息需要高階矩(大于二階矩)來分析,并強調(diào)第四階矩含有明顯的非高斯信息.為此本文將MKEICA[20]作為基礎的建模監(jiān)測模型,構建四階累積監(jiān)控統(tǒng)計量用于過程監(jiān)控,當監(jiān)測到故障時采用本文提出的故障診斷方法對故障變量進行追溯.采用高階累積分析建模時具有以下3點優(yōu)勢:
1)高斯過程的高階累積量為零,而非高斯過程的高階累積量不全為零.因此,高階累積量可用于高斯噪聲中非高斯信號的提取.
2)高階累積量不僅具有信號的幅值信息,同時具有相位信息.
3)高階累積量可用于監(jiān)測和描述系統(tǒng)的非線性.
綜上本文提出的方法與傳統(tǒng)MKICA方法同時用于工業(yè)大腸桿菌制備現(xiàn)場驗證其算法的有效性,當監(jiān)測到生產(chǎn)過程出現(xiàn)故障時,對故障變量進行追溯,定位故障源,驗證該故障診斷方法的實用性.
四階累積量(forth-order cumulants analysis,FCA)是隨機非高斯特性的參數(shù)矩估計[23–25],對于一個零均值變量k維隨機向量X=[x1x2··· xk],若其聯(lián)合概率密度函數(shù)為f(x1,x2,···,xk),則其第一特征函數(shù)定義為
式中:ω=[ω1ω2··· ωk],E{·}表示數(shù)學期望,j=X的第2特征函數(shù)又稱為累積量生成函數(shù)定義為
式中l(wèi)n表示自然對數(shù).分別對?x和ψx(ω)求關于ω的r=r1+r2+···+rk階偏導,同時令[ω1=ω2=···=ωk=0],即可得到X的r階矩mr1···rk與r階累積量cr1···rk
式中mom{·},cum{·}分別是矩和累積量的符號.實際應用中常取r1=r2=···=rk=1,對于零均值的k階平穩(wěn)隨機信號x(h),令x1=x(h),x2=x(t+h1),···,xk=x(t+hk?1),h為時間滯后.則該信號的k階矩和k階累積量分別定義為
其中k階矩mkx(h1,h2,···,hk?1)可由式(2)求得,結(jié)果為
k階累積量ckx(h1,h2,···,hk?1)由矩與累積量轉(zhuǎn)換關系求出,首先引入符號集的概念,對于k個隨機變量的集合{x1,x2,···,xk},其符號集合為I={1,2,···,k}對I進行無連接的非空分割得到q個子集合記作Ip,要求I=∪Ip,Ip非空且是無序組合,各Ip無交集.累積量–矩轉(zhuǎn)換公式(C–M公式)為
對于均值為零的隨機信號xk,其四階累積量為
其中:E表示期望;Rx表示信號x(t)自相關系數(shù);令h1=1,h2=2,h3=3是滯后時間.本文的數(shù)據(jù)經(jīng)ICA處理后具有獨立性,這里Rx恒為零,故四階累積量可改寫為
核函數(shù)選擇間歇過程監(jiān)測領域最常見的徑向基函數(shù)(radial basis function,RBF)核[1–23],具體如下式所示:
本文利用核熵值的累積貢獻率來進行核熵個數(shù)的選擇,累積核熵貢獻率定義如下所示[20]:
則MKECA負載矩陣為
白化矩陣為
MKECA得分為
對于一個新時刻的數(shù)據(jù)向量xnew,其對應的核熵向量為
則新的KECA得分為
新的白化得分為
根據(jù)s的非高斯性大小這里采用獨立元得分累積貢獻最大的幾個獨立成分sd,與其對應的B矩陣的列組成矩陣Bd,其獨立成分為.
定義新的監(jiān)測統(tǒng)計量HS和HE并計算其控制線,將整個過程分為主導獨立成分和模型預測誤差兩部分,在采樣i處,第p個主導獨立成分sd的樣本四階累積量為
其中:wp是解混矩陣Wd的第p個向量,p=1,2,···,d.為了監(jiān)測全部主導獨立成分的四階累積量,第1個監(jiān)測指標定義為
在采樣i處,非高斯模型對第q個變量的預測誤差的樣本三階累積量為
其中l(wèi)q是L的第q行,q=1,2,···,m,HCA的第2個監(jiān)測指標定義為
至此,離線階段的模型建立完畢,這里需要用核密度估計[26–28]分別計算監(jiān)測統(tǒng)計量HS和HE的置信區(qū)間用于在線監(jiān)測.
對于在線監(jiān)測,新時刻數(shù)據(jù)的監(jiān)測統(tǒng)計量定義如下式所示:
采用RBF核函數(shù)計算核矩陣[1–25],假設存在向量v=[v1v2··· vm]T,i=1,2,···,m,核函數(shù)對于第i個變量vi的偏導可用下式計算:
其中xj,i為第j個樣本的第i個變量.因此,第i個變量對核向量第j個元素的貢獻為求兩個核函數(shù)乘積的偏導
對于在線監(jiān)測,根據(jù)變量對角貢獻[11],核向量的第j個元素對HS的貢獻為
進一步,hsnew,p中第i個變量對HS的貢獻為
按照上述方法求出核向量第j個元素對HE的貢獻.可以采用變量貢獻分析進行故障診斷.對于一個監(jiān)測指標,變量對該指標的貢獻由下式定義:
式中:
表示第j個變量對HS的貢獻,cmhsp,j為第j個變量對hsp的貢獻為
進一步,henew,p中第i個變量對HE的貢獻為按照HS的分解方法
表示第j個變量對HE的貢獻.cmheq,j為第j個變量對heq的貢獻,如下式所示:
以上推導了基于核的四階累積量監(jiān)測統(tǒng)計量貢獻值,當過程監(jiān)測模型發(fā)現(xiàn)有異常情況時,可用此故障診斷方法對故障變量進行追溯.
這里實驗的主要目的是證明下列觀點:1)基于階段的過程數(shù)據(jù)是非線性、非高斯性、多階段共存的,不是單一存在的;2)基于四階累積監(jiān)測統(tǒng)計量的故障監(jiān)測方法具備有效的故障監(jiān)測能力;3)基于四階累積監(jiān)測統(tǒng)計量的故障診斷方法具備故障定位的能力.本文實驗的數(shù)據(jù)取自北京某微生物制藥公司的基因重組大腸桿菌外源蛋白表達制備白介素–2.生產(chǎn)發(fā)酵過程采用Sartorius BIOSTAT BDL 15L發(fā)酵罐,如圖1所示.選擇6個主要過程變量來綜合表征菌體生長及外源蛋白表達的狀況,如表1所示.選取35個正常批次作為離線建模數(shù)據(jù).對過程變量數(shù)據(jù)進行正態(tài)檢驗結(jié)果如圖2所示,如果數(shù)據(jù)服從正態(tài)分布,則圖2中數(shù)據(jù)點擊圖中藍色‘+’應該近似為一條直線,即圖中紅線附近,變量1至變量6都具有非高斯特性.此外,為了驗證模型的有效性,引入兩種類型的故障如表2所示.
表1 大腸桿菌發(fā)酵過程可檢測變量Table 1 The measuring parameters in Escherichia coli fermentation processes
表2 工廠過程故障類型Table 2 Fault types introduced in process
針對表2中的故障1的監(jiān)測結(jié)果如圖3所示,兩種方法的監(jiān)測統(tǒng)計量在故障發(fā)生的時刻第一時間都超出控制限,但是從圖3(a)可以看出,I2監(jiān)測圖在正常階段存在故障的錯誤報警現(xiàn)象,如采樣點2附近、采樣點15附近,SPE監(jiān)測圖存在故障的誤報警,如采樣點1到3附近,采樣點6附近、采樣點11附近,從圖3(b)可以看出本文所提監(jiān)控方法的統(tǒng)計量HS和HE監(jiān)測圖不存在故障的漏報警和誤報警現(xiàn)象,表現(xiàn)出可靠的過程監(jiān)測能力,當監(jiān)測到生產(chǎn)過程存在異常情況時,采用本文所提的故障診斷方法對其進行故障診斷,這里選擇25 h進行故障診斷.
圖1 大腸桿菌發(fā)酵制備系統(tǒng)原理示意圖Fig.1 Schematic of fermentation equipment and control system
圖2 6個過程變量正態(tài)分布檢驗Fig.2 6 process variables of normal distribution test
針對表2中的故障2的監(jiān)測結(jié)果如圖4所示,MKICA的I2監(jiān)測圖在28采樣點附近超出控制限,SPE監(jiān)測統(tǒng)計量在36采樣點附近超出監(jiān)測控制限,基本失去了對此故障的發(fā)現(xiàn)能力.而本文所提監(jiān)控方法的統(tǒng)計量HS在16采樣點附近超出控制限,HE監(jiān)測圖在18采樣點附近超出控制限,體現(xiàn)了高效的故障監(jiān)測識別能力,并且不存在故障的誤報警和漏報警.
圖3 比較兩種方法在工業(yè)發(fā)酵過程故障批次1的監(jiān)測結(jié)果Fig.3 Monitoring results using two methods for industry fault batch 1
采用本文故障診斷方法,選擇發(fā)現(xiàn)故障后的穩(wěn)定采樣點對其進行故障診斷,選擇了第26個采樣點.
圖4 比較兩種方法在工業(yè)發(fā)酵過程故障批次2的監(jiān)測結(jié)果Fig.4 Monitoring results using two methods for industry fault batch 2
針對故障1的故障診斷如圖5(a)所示,變量3為故障變量,結(jié)合表1–2進行分析可知,可以準確識別故障源.如圖5(b)所示,變量5對監(jiān)測統(tǒng)計量的貢獻最大,結(jié)合由表1–2進行分析可知,該方法可以準確識別該故障.
圖5 故障診斷Fig.5 Fault diagnosis
通過以上分析,得出FCA監(jiān)測模型優(yōu)于MKICA的監(jiān)測模型.
針對工業(yè)重組大腸桿菌外源蛋白表達制備白介素-2的數(shù)據(jù)同時具有非線性、多階段、非高斯性的特點,同時為了解決傳統(tǒng)監(jiān)測模型難于進行故障監(jiān)測以及故障源定位的難題,提出基于FCA的過程監(jiān)測方法.該方法首先利用MKEICA代替?zhèn)鹘y(tǒng)MKICA監(jiān)測模型在進行數(shù)據(jù)特征提取時可以更好保持原始的數(shù)據(jù)的簇結(jié)構階段信息,其次針對傳統(tǒng)MKICA監(jiān)測方法所構建的監(jiān)測統(tǒng)計量為二階統(tǒng)計量的不足,提出了四階累積量的監(jiān)測統(tǒng)計量用于過程監(jiān)測,旨在克服傳統(tǒng)統(tǒng)計量在監(jiān)測時存在較高誤報和漏報的問題,此外,本文還推導了基于FCA方法的故障源定位.通過對工業(yè)制備大腸桿菌發(fā)酵過程的實際應用,表明本文方法與傳統(tǒng)MKICA方法相比,不僅能有效提高監(jiān)控系統(tǒng)發(fā)現(xiàn)故障的能力,并且還可以利用本文提出的故障診斷方法準確識別故障源,為間歇過程監(jiān)測提供一種可行的解決方案,具有一定的實用價值.