鄒涵
(南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇 南京 211816)
非線性動(dòng)態(tài)WPLS航煤干點(diǎn)軟測量
鄒涵
(南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇 南京 211816)
針對(duì)煉油工業(yè)過程存在的多變量、非線性和數(shù)據(jù)動(dòng)態(tài)性問題,提出一種自回歸移動(dòng)平均模型與徑向基函數(shù)-加權(quán)偏最小二乘相結(jié)合的非線性動(dòng)態(tài)建模方法。首先建立基于徑向基函數(shù)-加權(quán)偏最小二乘方法的軟測量模型,然后利用自回歸移動(dòng)平均模型對(duì)數(shù)據(jù)進(jìn)行時(shí)序分析校正,將動(dòng)態(tài)誤差信息加入到模型中去,實(shí)現(xiàn)模型的動(dòng)態(tài)裝換。將該方法應(yīng)用到加氫裂化航煤干點(diǎn)的軟測量建模中,從而獲得比徑向基函數(shù)-加權(quán)偏最小二乘算法更高的預(yù)測精度。
徑向基函數(shù);自回歸移動(dòng)平均模型;偏最小二乘;干點(diǎn);軟測量
在煉油工業(yè)的生產(chǎn)過程中,干點(diǎn)是衡量分餾產(chǎn)品質(zhì)量的一個(gè)關(guān)鍵指標(biāo),直接影響到其質(zhì)量和收率的高低。但是,該指標(biāo)是規(guī)格參數(shù),無合適的在線分析儀進(jìn)行測量,只能離線分析且時(shí)間長。因此,建立性能優(yōu)良的干點(diǎn)軟測量模型,可以實(shí)現(xiàn)干點(diǎn)質(zhì)量指標(biāo)的預(yù)測,并為生產(chǎn)操作提供指導(dǎo)。目前,軟測量已提出很多方法,有多種全局多元線性回歸方法[1-3],具有簡潔明確的表達(dá)形式,但難以描述非線性系統(tǒng)。為了處理非線性問題,又提出了多種非線性軟測量方法[3-4],然而由于過程生產(chǎn)中自身控制要求的改變、本身特性的變化以及現(xiàn)場環(huán)境對(duì)其影響,使得過程生產(chǎn)通常處于動(dòng)態(tài),利用靜態(tài)建模方法難以體現(xiàn)動(dòng)態(tài)特性,造成模型預(yù)測精度低且不能持續(xù)使用。所以僅僅考慮非線性特性是不夠的,需要將對(duì)象的動(dòng)態(tài)信息融合到模型中去。
本文提出一種自回歸移動(dòng)平均(autoregressionmnving average,ARMA)模型與徑向基函數(shù)-加權(quán)偏最小二乘(Radial basis function-Weighted partial least regression,RBF-WPLS)相結(jié)合的軟測量方法。該方法首先建立基于RBF-WPLS的軟測量模型,即將具有非線性樣本數(shù)據(jù)映射到高維特征空間中,在高維特征空間中建立WPLS線性回歸模型;然后,利用ARMA模型對(duì)數(shù)據(jù)進(jìn)行動(dòng)態(tài)估計(jì),通過增加動(dòng)態(tài)校正環(huán)節(jié),實(shí)現(xiàn)了對(duì)靜態(tài)模型的動(dòng)態(tài)校正。
1.1 加權(quán)偏最小二乘回歸
加權(quán)偏最小二乘回歸方法是對(duì)偏最小二乘回歸方法的改進(jìn)算法。下面對(duì)PLS原理[5]做簡單描述:
設(shè)樣本容量為n,自變量數(shù)據(jù)矩陣X為n×p(n>p)維,因變量數(shù)據(jù)矩陣Y為n×q(n>q)維,提取PLS主元采用NIPALS算法[6]。設(shè)T是前t個(gè)PLS成分組成的n×t維隱變量矩陣,且有T=XU,則PLSR模型
式中:U——p×t維轉(zhuǎn)換矩陣;
C——t×q維回歸系數(shù)矩陣;
E——n×q維的殘差矩陣。
在NIPALS算法中可同時(shí)計(jì)算出C與U,則q個(gè)因變量的預(yù)測值可以如下回歸方程計(jì)算:
現(xiàn)實(shí)情況中,由于每個(gè)樣本貢獻(xiàn)率不同,導(dǎo)致其權(quán)重也不同。為了體現(xiàn)這種情況,可以采用加權(quán)回歸方法[7],即對(duì)各個(gè)樣本賦予不同的權(quán)值,權(quán)值回歸模型為
式中:W——權(quán)值系數(shù)。
權(quán)值大小需根據(jù)樣本和預(yù)測對(duì)象之間的歐氏距離來分配大小。歐式距離與預(yù)測能力呈負(fù)相關(guān)關(guān)系[7]。即樣本與預(yù)測對(duì)象的歐式距離越大,所分配的權(quán)值將越小。確認(rèn)權(quán)值系數(shù)有很多種方法,本文采用一種較簡單的方法。設(shè)權(quán)值分配參數(shù)為m(m為正整數(shù)),則與預(yù)測對(duì)象歐式距離最近的前m個(gè)樣本權(quán)值為1,其余樣本權(quán)值為0。
1.2 徑向基函數(shù)-加權(quán)偏最小二乘回歸
徑向基函數(shù)-加權(quán)偏最小二乘回歸算法是在加權(quán)偏最小二乘算法之前進(jìn)行徑向基函數(shù)的非線性變換。通過輸入空間映射到一個(gè)新的空間,輸出層在新的空間中進(jìn)行線性組合,從而將線性不可分問題轉(zhuǎn)化為線性可分[8]。本文采用最常用的高斯徑向基函數(shù)做為隱含層節(jié)點(diǎn)的徑向基函數(shù)。其隱含層節(jié)點(diǎn)的加權(quán)輸出為
式中:λi——隱含層輸出的權(quán)值系數(shù);
m——徑基個(gè)數(shù);
ci,σi——第i個(gè)是高斯函數(shù)的中心和寬度參數(shù);
‖·‖——?dú)W式范數(shù)。
RBF網(wǎng)絡(luò)中需要學(xué)習(xí)3個(gè)參數(shù),即高斯函數(shù)的中心ci、寬度σi以及隱含層輸出的權(quán)值系數(shù)λi。高斯函數(shù)的中心ci和寬度σi可以采用K-均值聚類方法[9]確定,權(quán)值系數(shù)λi可以采用偏最小二乘方法算出。
ARMA模型[10]是研究時(shí)間序列、用于平穩(wěn)時(shí)間的重要方法。即序列的當(dāng)前值除了與自身的過去值存在關(guān)系,并且還與其以前進(jìn)入系統(tǒng)的外部干擾存在一定的依賴關(guān)系,則該模型在表現(xiàn)刻動(dòng)態(tài)特性時(shí),模型中既包括自身的滯后項(xiàng),也包括過去的外部干擾誤差項(xiàng)。通常ARMA模型可表示為
對(duì)其引入后向算子B有:Bxt=xt-1,B2Xt=Xt-2,(c為常數(shù))。對(duì)于上述ARMA模型表達(dá)式,分別令:
則式(5)轉(zhuǎn)變?yōu)槿缦卤磉_(dá)式:
式中:xt——正態(tài)、平穩(wěn)的時(shí)間序列;
at——隨機(jī)干擾誤差項(xiàng);
B——延遲算子;
φ(B),θ(B)——算子多項(xiàng)式。
模型稱為p階自回歸、q階滑動(dòng)平均模型,記作ARMA(p,q)。
ARMA(n,n-1)模型具有將隨機(jī)平穩(wěn)系統(tǒng)逼近到任意精度的功能,通過遞增法逐步逼近,需找適合的n值,確定模型階數(shù)n。同時(shí),n以2為遞增量,不需要對(duì)ARMA(n,n-1)((q≠p-1))模型的討論,從而降低復(fù)雜度[11]。
對(duì)于ARMA(n,n-1)模型階次的確定,利用F校驗(yàn)方法來判定。從n取1開始逐漸增大取值,直到獲得滿意的模型階次。設(shè)H0:φ2n+2=0,θ2n+1=0,Q0為ARMA(2n+2,2n+1)模型殘差平方和,Q1為ARMA(2n,2n-1)模型殘差平方和,則:
式中:s——被校驗(yàn)參數(shù)的個(gè)數(shù);
r——模型參數(shù)的總個(gè)數(shù);
n——樣本長度。
若F>Fa,則H0不成立,模型將繼續(xù)增加階次;否則,ARMA(2n,2n-1)是合適的模型。而Fa的值可由F分布表和預(yù)先給定的置信度a來確定。
首先利用RBF-WPLS算法建立軟測量預(yù)測模型,將該模型訓(xùn)練輸出值y?m與真實(shí)測量ym值相減,
得到一個(gè)關(guān)于輸出值誤差Δym的時(shí)間序列值,利用ARMA(n,n-1)模型對(duì)該時(shí)間序列進(jìn)行建模,得到關(guān)于預(yù)測誤差的ARMA模型。將以上兩個(gè)模型相結(jié)合進(jìn)行模型預(yù)測時(shí),RBF-WPLS模型輸出值減去ARMA模型的誤差值,即得到輸出變量的預(yù)測結(jié)果。該模型結(jié)構(gòu)框圖見圖1。
圖1 基于RBF-WPLS和ARMA的軟測量模型結(jié)構(gòu)
其實(shí)現(xiàn)過程步驟如下:
(1)將每個(gè)訓(xùn)練樣本作為RBF的基向量(ci=xi,i=1,2,…,n),使得隱含層節(jié)點(diǎn)個(gè)數(shù)等于樣本數(shù)。對(duì)輸入矢量x執(zhí)行非線性變換,得到隱含層輸出矢量Ri(x)(i=1,2,…,n),即
式中:e——大于0的常數(shù)。
將得到的輸出矢量Ri(x)組成n×n維的隱含層輸出矩陣Ri(x)。
(2)采用WPLS回歸方法,假定提取的主元個(gè)數(shù)為t(t=1,2,…,p);權(quán)值分配參數(shù)為m(m=t+1,t+2,…,n-1)。
(3)利用舍一交叉驗(yàn)證的思想,在所有樣本n中選出一個(gè)樣本來,設(shè)為xi(i=1,2,…,n)。將其作為測試樣本,剩余n-1個(gè)樣本均作為訓(xùn)練樣本。并且在訓(xùn)練集中,將與測試樣本距離最近的m個(gè)樣本權(quán)值設(shè)為1,其余樣本權(quán)值設(shè)為0。構(gòu)建權(quán)值矩陣W。
(4)分別對(duì)自變量矩陣X和因變量矩陣進(jìn)行加權(quán)處理,得到m×p維的自變量矩陣Xm=WX和m×q維的因變量矩陣Ym=WY。
(5)通過NIPALS算法,從自變量矩陣Xm中提取t個(gè)主元,構(gòu)建m×t維隱變量數(shù)據(jù)矩陣Tm,t同時(shí)計(jì)算對(duì)應(yīng)的p×t維轉(zhuǎn)換矩陣Um,t和t×q維回歸系數(shù)矩陣Cm,t。
(6)采用相對(duì)誤差平方和Em,t來確定m和t的值對(duì)于1到n記錄每個(gè)Em,t的值。其中y?j為測試樣本xj的預(yù)測矢量為其第l個(gè)分量;yjl為第j個(gè)實(shí)際測量值。
(7)構(gòu)建相對(duì)誤差矩陣R,將每個(gè)Em,t值對(duì)應(yīng)輸入其中,并在矩陣其他沒有對(duì)應(yīng)的位置添入+∞。當(dāng)誤差矩陣中Em,t取最小值時(shí),即為Em,t的最優(yōu)目標(biāo)值,對(duì)應(yīng)行列分別記為m0和t0。
(8)對(duì)于預(yù)測對(duì)象,將權(quán)值分配參數(shù)取為m0,提取的主元個(gè)數(shù)取為t0,按(2)~(6)步驟建立回歸模型。
(9)將訓(xùn)練樣本集經(jīng)過WPLS模型處理后,得到一組模型輸出值y?m,將其與真實(shí)測量值ym相減,得到關(guān)于訓(xùn)練輸出值誤差時(shí)間序列值Δym,對(duì)該時(shí)間序列進(jìn)行ARMA建模,確定ARMA(n,n-1)模型階數(shù)。模型階數(shù)n的確定采用遞增系列法逐步逼近,找到最合適的n值。
(10)利用上述兩個(gè)模型對(duì)測試樣本進(jìn)行仿真,軟測量模型最終的輸出值即為
以某石化公司加氫裂化裝置為研究背景,經(jīng)現(xiàn)場了解工藝情況及相關(guān)性分析后發(fā)現(xiàn):航煤干點(diǎn)主要受10個(gè)變量的影響:航煤抽出量x1,回流溫度x2,回流量x3,輕石腦油抽出量x4,重石腦油抽出點(diǎn)溫度x5,重石腦油抽出量x6,進(jìn)料量x7,進(jìn)料溫度x8,塔釜溫度x9,塔頂壓力x10?,F(xiàn)將10個(gè)變量作為模型的輸入變量,以分餾塔的航煤干點(diǎn)作為輸出變量,對(duì)現(xiàn)場數(shù)據(jù)進(jìn)行采集,并剔除病態(tài)數(shù)據(jù),共采集了174組數(shù)據(jù)。將其中的124組作為訓(xùn)練數(shù)據(jù),其余的50組作為測試數(shù)據(jù),采用ARMA-RBF-WPLS方法建立航煤干點(diǎn)軟測量模型。根據(jù)上述ARMA-RBF-WPLS建模步驟,需要尋找Em,t的最小值來確定權(quán)值分配參數(shù)和主要個(gè)數(shù)。由趨勢性分析得到Em,t取最小值時(shí),分別對(duì)應(yīng)的權(quán)值分配參數(shù)m為93,主元個(gè)數(shù)t為8,并選出與預(yù)測對(duì)象之間歐氏距離最小的93個(gè)樣本,其權(quán)值分配為1,剩余樣本權(quán)值分配為0,得到加權(quán)樣本。
ARMA模型參數(shù)階數(shù)的確定,從ARMA(2,1)模型開始,以2為步長,建模ARMA模型,每當(dāng)n增加時(shí),通過F準(zhǔn)則去檢驗(yàn)判定。當(dāng)模型增加到ARMA(5,4)時(shí),與ARMA(4,3)對(duì)比發(fā)現(xiàn)在預(yù)定的顯著誤
差水平上F值下降不顯著,所以模型階數(shù)應(yīng)停止增加,選擇ARMA(4,3)為航煤干點(diǎn)的軟測量模型。
圖2 ARMA-RBF-WPLS模型預(yù)測結(jié)果與實(shí)際值對(duì)比
圖2給出了ARMA-RBF-WPLS模型預(yù)測值與工廠實(shí)際值對(duì)比曲線。
為做對(duì)比,采用相同數(shù)據(jù)用RBF-WPLS方法建立干點(diǎn)預(yù)測模型。圖3給出了RBF-WPLS模型預(yù)測值與工廠實(shí)際值對(duì)比曲線。從表1和圖2~圖3可以看出,ARMA-RBF-WPLS模型與RBF-WPLS模型相比,結(jié)構(gòu)更加精確,誤差更小,更好地反映了航煤干點(diǎn)的變化趨勢。在50組檢驗(yàn)樣本中,采用ARMA-RBF-WPLS模型的均方差為1.2268℃,82%的樣本誤差小于±1℃,98%的樣本誤差小于±2℃;采用RBF-WPLS模型的均方差為1.6514℃,70%的樣本誤差小于±1℃,90%的樣本誤差小于±2℃。ARMARBF-WPLS模型與RBF-WPLS模型對(duì)比,顯示出更高的擬合精度。
圖3 RBF-WPLS模型預(yù)測結(jié)果與實(shí)際值對(duì)比
表1 ARMA-RBF-WPL模型和RBF-WPLS模型的結(jié)果比較
通過利用RBF-WPLS和AMRA相結(jié)合的方法實(shí)現(xiàn)了系統(tǒng)動(dòng)態(tài)過程的非線性軟測量建模,利用AMRA模型克服了RBF-WPLS算法難以描述動(dòng)態(tài)特性的缺點(diǎn),利用歷史輸出值對(duì)當(dāng)前時(shí)刻的影響實(shí)現(xiàn)了預(yù)測誤差的動(dòng)態(tài)估計(jì),體現(xiàn)了系統(tǒng)的動(dòng)態(tài)特性。將該方法應(yīng)用于加氫裂化第一分餾塔航煤干點(diǎn)的預(yù)測,仿真結(jié)果驗(yàn)證了該方法與RBF-WPLS軟測量模型相比具有更高的預(yù)測精度。
[1]Bastion P,Esposito V V,Michel T.PLS generalized linear regression[J].Computational Statistics and Data Analysis,2005,48(1):17-46.
[2]石琳,湯佳佳,于濤,等.基于樣條變換的非線性PLS的反應(yīng)高爐爐溫的參數(shù)預(yù)測[J].鋼鐵研究學(xué)報(bào),2013,25(2):22-25.
[3]蔡華斌.基于神經(jīng)網(wǎng)絡(luò)的電機(jī)轉(zhuǎn)矩軟測量研究[J].中國測試技術(shù),2007,33(2):50-52.
[4]Nicolai B M,Theron K I,Lammertyn J.Kernel PLS regerssion on waveler transformed NIR spectra for prediction of sugar content of apple[J].Chemoertrics and Intelligent Laboratory Systems,2007,85(2):243-252.
[5]顏學(xué)峰.基于徑基函數(shù)-加權(quán)偏最小二乘回歸的干點(diǎn)軟測量[J].自動(dòng)化學(xué)報(bào),2007,33(2):193-196.
[6]計(jì)智偉,吳耿鋒.基于層次聚類算法和偏最小二乘的特征選擇[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(21):4931-4935.
[7]劉海濤,魏汝禪,蔣國萍.基于加權(quán)偏最小二乘回歸的軟件成本估算方法[J].計(jì)算機(jī)工程,2012,38(21):36-39.
[8]賈明興,趙春暉,王福利,等.基于RBF神經(jīng)網(wǎng)絡(luò)的非線性主元分析方法[J].儀器儀表學(xué)報(bào),2008,29(3):453-457.
[9]韓敏,劉曉欣.基于互信息的分布式輸入變量選擇多元序列預(yù)測研究[J].自動(dòng)化學(xué)報(bào),2012,38(6):999-1006.
[10]閻平凡,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進(jìn)化計(jì)算[M].北京:清華大學(xué)出版社,2000:46-48.
[11]Ives A,Abbott K C,Ziebarth N L.Analysis of ecological time series with ARMA(p,q)model[J].Ecology,2010,91(3):858-871.
Soft sensing for dry point of jet fuel based on nonlinear dynamic WPLS
ZOU Han
(College of Electronics and Information Engineering,Nanjing Technology University,Nanjing 211816,China)
A nonlinear dynamic modeling method combining auto-regressive and moving average and radial basis function-weighted partial least squares regression is presented to solve the problem according to the requirements for refining industrialprocesses with multivariable,nonlinear and dynamic data.Firstly,this approach built RBF-WPLS model.Then,ARMA models use the data correction timing analysis,and dynamic error message will be added to the model to achieve a dynamic model.Finally,the proposed ARMA-RBF-WPLS was used to predict the dry point of jet fuel in hydrocracking unit,and it obtained highly precise prediction results compared with RBF-WPLS methods.
radial basis function;ARMA model;partial least square;dry point;soft sensor
TP273;TE62;O224;O241.5
:A
:1674-5124(2014)03-0121-04
10.11857/j.issn.1674-5124.2014.03.032
2013-11-16;
:2014-01-22
鄒 涵(1990-),男,江西豐城市人,碩士研究生,專業(yè)方向?yàn)閺?fù)雜過程的先進(jìn)控制。