,,,
(江蘇大學(xué) 電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 212013)
發(fā)酵過(guò)程涉及微生物生長(zhǎng)繁殖,過(guò)程呈現(xiàn)高度非線性和不確定性;同時(shí)隨著發(fā)酵進(jìn)行,發(fā)酵最適條件參數(shù)隨時(shí)間發(fā)生改變,使得傳統(tǒng)的傳感器方法難以實(shí)時(shí)在線檢測(cè)發(fā)酵過(guò)程關(guān)鍵參數(shù),從而造成無(wú)法對(duì)發(fā)酵過(guò)程進(jìn)行優(yōu)化控制,自動(dòng)化水平遠(yuǎn)低于其他工業(yè)生產(chǎn)過(guò)程。因此“軟測(cè)量”建模被提出和廣泛應(yīng)用在發(fā)酵工業(yè)中[1]。
最小二乘支持向量機(jī)(LS-SVM)建模方法采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則和核參數(shù)技術(shù),同時(shí)建模速度較快,在解決小樣本的建模過(guò)程中有很好的表現(xiàn)[2-5]。實(shí)踐表明,LS-SVM模型過(guò)程中徑向基寬度和懲罰系數(shù)對(duì)建模性能影響很大。LU 等[6]采用量子粒子群算法來(lái)完成支持向量機(jī)參數(shù)選擇,并運(yùn)用在發(fā)酵過(guò)程成中,取得很好測(cè)量效果;劉瑞蘭等[7]提出用遺傳算法對(duì)模型進(jìn)行稀疏化以及參數(shù)尋優(yōu)。這些算法不僅縮短了計(jì)算時(shí)間,而且降低了對(duì)初值選取的依賴(lài)度,但算法都比較復(fù)雜。差分進(jìn)化(DE)算法利用隨機(jī)選擇的不同個(gè)體進(jìn)行差分矢量運(yùn)算對(duì)原始個(gè)體進(jìn)行迭代優(yōu)化,它是優(yōu)化LS-SVM模型參數(shù)的一種合適的方法,它在收斂性和穩(wěn)定性上都比其他算法有優(yōu)勢(shì)。隨著差分進(jìn)化算法迭代的進(jìn)行,最優(yōu)解容易陷入局部最優(yōu)[8-10]。為了克服差分進(jìn)化的缺陷,增加種群的規(guī)模是常用手段,該方法沒(méi)有從根本上解決早熟收斂的問(wèn)題,增加種群規(guī)模同時(shí)增加算法了的運(yùn)算時(shí)間。為了跳出局部收斂,改善DE算法的性能,本文針對(duì)差分進(jìn)化中的局部最優(yōu)解和交叉概率因子進(jìn)行了優(yōu)化。
在發(fā)酵過(guò)程中,隨著發(fā)酵過(guò)程的進(jìn)行,發(fā)酵參數(shù)隨之改變,單一回歸模型不再適應(yīng)新的工況,因此采用模糊C均值聚類(lèi)(FCM)將數(shù)據(jù)劃分,再建立多個(gè)模型的多模型軟測(cè)量建模則顯得更加合理。梅從立等[11]將FCM與高斯過(guò)程回歸相結(jié)合,運(yùn)用在紅霉素的生產(chǎn)發(fā)酵中,取得很好的效果。由于傳統(tǒng)FCM方法會(huì)導(dǎo)致某一聚類(lèi)樣本過(guò)多,而另一類(lèi)過(guò)少,從而分類(lèi)的有效性下降。引入正定核函數(shù),將輸入樣本數(shù)據(jù)映射到高維特征空間,得到基于核的模糊C均值聚類(lèi)方法解決這一問(wèn)題[12]。錢(qián)曉山等[13]將KFCM和LS-SVM相結(jié)合得出一種多模型軟測(cè)量建模方法,運(yùn)用在蒸發(fā)過(guò)程的軟測(cè)量中,證明了KFCM對(duì)數(shù)據(jù)分類(lèi)的有效性。陳貴華等[14]將多模型軟測(cè)量方法運(yùn)用在乙烯裂解過(guò)程中,證明了多模型方法具有更好的精度和泛化能力。
本文將核模糊C均值聚類(lèi)算法與AMDE-LSSVM相結(jié)合,提出的方法應(yīng)用于秸稈發(fā)酵生產(chǎn)燃料乙醇過(guò)程中關(guān)鍵參量的測(cè)量,建立一種多模型(KFCM-AMDE-LSSVM)秸稈發(fā)酵過(guò)程軟測(cè)量模型,通過(guò)實(shí)際發(fā)酵工廠進(jìn)行離線采集的數(shù)據(jù),進(jìn)行了軟測(cè)量仿真實(shí)驗(yàn)。
假設(shè)存在樣本集:X={x1,x2,…,xn},創(chuàng)建聚類(lèi)c,對(duì)于數(shù)據(jù)中與樣本集X相似的為一組;不相似的盡可能不在一組。通過(guò)求目標(biāo)函數(shù)的最小值J來(lái)對(duì)數(shù)據(jù)進(jìn)行分類(lèi)[15-16]。
(1)
(2)
其中:c為聚類(lèi)個(gè)數(shù),vj為聚類(lèi)中心,uij為數(shù)據(jù)xi對(duì)第j個(gè)聚類(lèi)中心的隸屬度值,m為加權(quán)數(shù)。
引入非線性映射φ:x→φ(x),特征空間的樣本距離定義為:
‖φ(xi)-φ(xj)‖2=K(xi,xj)+K(vj,vj)-2K(xi,vj)
(3)
其中:K為核函數(shù)。這里討論一種條件正定核:
K(x,y)=-(‖x-y‖2+b2)1/2,b∈R
(4)
令b=1,將正定核引入式(3),可得目標(biāo)函為:
(5)
構(gòu)造拉格朗日函數(shù),分別對(duì)v,u求偏導(dǎo),得到的vj和U的更新公式如下:
(6)
1.2.1 最小二乘支持向量機(jī)
給定數(shù)據(jù)集{(xi,yi)|i=1,2,3....l},xi∈Rn為n維樣本輸入,yi∈R為樣本輸出。通過(guò)對(duì)樣本數(shù)據(jù)逼近,函數(shù)擬合問(wèn)題可以描述為最優(yōu)化問(wèn)題[17-18]:
(7)
式中,C為懲罰系數(shù),e為允許誤差。引入拉格朗日算子對(duì)上式求解,得到
(8)
根據(jù)KKT條件,式(8)的一階導(dǎo)數(shù)為:
(9)
式(9)消去變量w、e,得線性方程組:
(10)
Q=[1,…,1]T,a=[a1,a2,…,al]T,y=[y1,y2,…,yl]T,
K為核函數(shù)矩陣。根據(jù)Mercer條件可以得核函數(shù)為:
K(xi,xj)=φ(xi)Tφ(xj)
(11)
綜上可以得到最終輸出為:
(12)
采用徑向基函數(shù)(RBF):
(13)
其中:σ為徑向基寬度。
1.2.2 差分進(jìn)化算法
差分進(jìn)化算法是一種保留最優(yōu)的貪婪算法,它由變異、交叉和選擇操作組成[19-20]。
(14)
其中:F為縮放因子。h1,h2,h3∈(1,2,…,NP)是互不相同且與i不同的隨機(jī)數(shù)。
(15)
其中:CR為范圍在[0,1]之間的交叉算子,rand(j)為[0,1]之間的隨機(jī)數(shù)。
3)在選擇操作中,按式(16)選擇新的種群個(gè)體。
(16)
其中:f(·)為目標(biāo)函數(shù)。
1.2.3 自適應(yīng)變異差分進(jìn)化
本文選擇DE/best/2/bin策略。個(gè)體變異操作的方程為:
(17)
1.2.3.1 自適應(yīng)二次變異思想
定義1 群體適應(yīng)度方差為:
(18)
fi為第i個(gè)個(gè)體的適應(yīng)度,favg顯示適應(yīng)的程度,式中,f中是歸一化定標(biāo)因子,其作用是限制群體適應(yīng)度方差的大小,具體公式如下:
(19)
(20)
1.2.3.2 時(shí)變交叉概率因子CR。
由DE交叉操作可知,在搜索初期需要保持全局搜索能力,從而需要較小的CR,保持種群的多樣性;搜索的后期因已確定最優(yōu)范圍,需要對(duì)局部進(jìn)行精確搜索,從而需要較大的CR以保證搜索后期的搜索速度[9]?;谶@種思想,在前期設(shè)定較小交叉概率因子CR,隨著搜索時(shí)間的增加而加大交叉概率因子CR。本文時(shí)變交叉概率因子CR由下式得到:
(21)
在算法設(shè)定初始交叉概率CRmin和最大交叉概率CRmax
1.2.4 基于AMDE-LSSVM建模
在LS-SVM中,懲罰系數(shù)C和徑向基寬度σ對(duì)模型的泛化能力有著很大的影響,因此尋求模型最佳懲罰系數(shù)與徑向基寬度是十分重要的。本文利用AMDE對(duì)LS-SVM建模中的參數(shù)進(jìn)行選擇。
AMDE-LSSVM軟測(cè)量建模步驟如下:
2)初始化種群NP、變異算子F、最大迭代次數(shù)Gmax、初始交叉率CRmin、最大交叉概率CRmax、終止閾值、懲罰系數(shù)C和徑向基寬度σ的上、下值。令G=0,根據(jù)C和σ的上、下限產(chǎn)生一組隨機(jī)的[C1,σ1]。
5)G=G+1。
6)對(duì)[C,σ]進(jìn)行變異、交叉、選擇操作。產(chǎn)生新的[C,σ],返回步驟3)。
7)得到最優(yōu)懲罰系數(shù)C和徑向基寬度σ作為建模參數(shù),進(jìn)行軟測(cè)量建模。
基于KFCM和AMDE-LSSVM軟測(cè)量建模思想在于:利用核模糊C均值聚類(lèi)算法的有效分類(lèi),將采集的樣本數(shù)據(jù)集X分成{Xi|i=1,2,…,c},c個(gè)聚類(lèi)。對(duì)每一個(gè)Xi分別采用AMDE-LSSVM進(jìn)行訓(xùn)練,得到每一類(lèi)的輸出為:
(22)
采用模糊隸屬度來(lái)綜合最后的結(jié)果:
(23)
式中uik為第k個(gè)樣本對(duì)應(yīng)的第i類(lèi)模糊隸屬度,fi(x)為第i個(gè)子模型。
秸稈發(fā)酵關(guān)鍵參量的多模型軟測(cè)量建模如圖1,步驟可如下描述:
步驟1:對(duì)采集數(shù)據(jù)進(jìn)行預(yù)處理。
步驟2:將處理后的樣本用核模糊C均值聚類(lèi)進(jìn)行劃分為c個(gè)不同的子集。
步驟3:對(duì)每個(gè)聚類(lèi)的樣本運(yùn)用AMDE-LSSVM進(jìn)行建模,得到c個(gè)秸稈發(fā)酵關(guān)鍵參量軟測(cè)量子模型。
步驟4:求得各個(gè)隸屬度,由式(19)得到最終的多模型軟測(cè)量輸出。
圖1 建模過(guò)程
我國(guó)是世界上農(nóng)作物秸稈類(lèi)資源最多的國(guó)家,2015達(dá)到10.4億噸,其中20%為二次利用,而剩余大部分以堆積焚燒的方式處理。就地焚燒的處理方法,不僅給環(huán)境帶來(lái)極大污染,而且浪費(fèi)了秸稈類(lèi)資源的生物質(zhì)能量。通過(guò)發(fā)酵的方式得到可保存的氣體或液體燃料,例如酒精、氫氣、柴油等,熱效率提升20%以上[22-23]。這樣不僅解決了污染問(wèn)題,而且使農(nóng)民得到了創(chuàng)收。近年來(lái),秸稈發(fā)酵制取燃料乙醇規(guī)?;蔀檠芯康臒狳c(diǎn)。乙醇濃度、總糖濃度、菌體濃度是觀察秸稈發(fā)酵過(guò)程的重要參數(shù),但是無(wú)法通過(guò)物理傳感器檢測(cè),制約了自動(dòng)化水平的提升。因此將本文設(shè)計(jì)的多模型軟測(cè)量方法用于秸稈發(fā)酵的關(guān)鍵參量的測(cè)量中。
在建立秸稈發(fā)酵關(guān)鍵參量軟測(cè)量之前,必須對(duì)發(fā)酵機(jī)理進(jìn)行分析,選取合適的輔助變量。秸稈發(fā)酵過(guò)程如圖2所示。根據(jù)課題組已有的成果選?。喝芙庋?、發(fā)酵液酸堿度、電機(jī)攪拌速度、空氣流量作為輔助變量。按照工藝要求,過(guò)程中罐溫控制在36 ℃±1 ℃,攪拌機(jī)轉(zhuǎn)速控制在120~180 r/min,通氣量為0.2 L/min,發(fā)酵罐壓控制在0.2 MPa±0.01 MPa。每隔1 h取樣并離線采集化驗(yàn)乙醇濃度、總糖含量、菌體濃度??偣膊杉?0批數(shù)據(jù),其中前9批數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),另外1批數(shù)據(jù)作為測(cè)試數(shù)據(jù)。軟測(cè)量模型建立完畢后,利用C語(yǔ)言編程實(shí)現(xiàn),并嵌入到計(jì)算機(jī)中,當(dāng)待預(yù)測(cè)罐批的輸入向量,經(jīng)測(cè)量?jī)x表讀入計(jì)算機(jī)后,利用軟測(cè)量程序計(jì)算得到關(guān)鍵狀態(tài)變量的預(yù)測(cè)值,并將預(yù)測(cè)結(jié)果經(jīng)數(shù)據(jù)通道傳送到計(jì)算機(jī)上顯示,供操作人員進(jìn)行觀察和控制發(fā)酵過(guò)程。
圖2 秸稈發(fā)酵過(guò)程
設(shè)定分類(lèi)個(gè)數(shù)c=3,加權(quán)數(shù)m=2,求出不同類(lèi)相應(yīng)的聚類(lèi)中心v和隸屬度矩陣U。應(yīng)用AMDE-LSSVM建立3個(gè)子模型。模型1的懲罰系數(shù)C=101.56,徑向基寬度σ=5.65;模型2的懲罰系數(shù)C=45.88,徑向基寬度σ=18.467;模型3的懲罰系數(shù)C=78.19,徑向基寬度σ=2.678。多模型輸出采用隸屬度加權(quán)策略。表1為幾種優(yōu)化算法對(duì)比,表中的數(shù)據(jù)可見(jiàn),AMDE算法在選擇LS-SVM的核參數(shù)優(yōu)于交叉驗(yàn)證和傳統(tǒng)DE算法,證明了AMDE算法的全局尋優(yōu)能力。對(duì)比3種尋優(yōu)方法的運(yùn)行時(shí)間,AMDE和DE算法明顯要優(yōu)于交叉驗(yàn)證的方法。由于AMDE在結(jié)構(gòu)上引入了時(shí)變的交叉概率因子,在算法搜索期間有不同的交叉概率因子,前期提高全局搜索能力后期提高局部搜索能力,從而加快了搜索時(shí)間。對(duì)于不同結(jié)果的標(biāo)準(zhǔn)差分析可以發(fā)現(xiàn),AMDE的標(biāo)準(zhǔn)差最低,反映出設(shè)計(jì)的自適應(yīng)二次變異思想有效地跳出傳統(tǒng)DE算法的早熟收斂。
基于KFCM和AMDE-LSSVM軟測(cè)量仿真結(jié)果如圖5所示,圖中顯示了離線化驗(yàn)值、多模型軟測(cè)量預(yù)測(cè)值和DE-LSSVM軟測(cè)量預(yù)測(cè)值。從圖中可以明顯看出,DE-LSSVM軟測(cè)量方法預(yù)測(cè)值雖然在趨勢(shì)上接近離線化驗(yàn)值,但是在發(fā)酵前期和后期有很大的誤差,這是因?yàn)樵诎l(fā)酵秸稈發(fā)酵各個(gè)時(shí)期所表現(xiàn)的發(fā)酵最適條件不同,導(dǎo)致單一的模型失效。多模型軟測(cè)量方法預(yù)測(cè)值在發(fā)酵各個(gè)階段都表現(xiàn)出了良好的擬合精度,誤差更小,這是因?yàn)槎嗄P头椒ㄊ菍?duì)秸稈發(fā)酵過(guò)程進(jìn)行劃分得到多個(gè)模型,使得預(yù)測(cè)模型更加精確。發(fā)酵實(shí)際值與軟測(cè)量值的誤差如圖6所示,該圖進(jìn)一步顯示了優(yōu)化后的多模型軟測(cè)量方法在秸稈發(fā)酵關(guān)鍵參量的預(yù)測(cè)中表現(xiàn)更好。
表1 優(yōu)化方法對(duì)比
圖5 軟測(cè)量結(jié)果比較圖
圖6 相對(duì)誤差比較曲線
表2和表3是幾種不同算法下的性能比較。與BP、SVM、DE-LSSVM相比,改進(jìn)后的多模型軟測(cè)量方法在乙醇濃度、總糖含量、菌體濃度的預(yù)測(cè)上標(biāo)準(zhǔn)誤差分別只有0.64%、1.85%、0.75%,與其他單一預(yù)測(cè)方法有了明顯的提高,并且訓(xùn)練時(shí)間大幅度降低。詳細(xì)分析表2和表3中的DE-LSSVM建模和多模型建模,可以看出單一LS-SVM建模需要10.7 s,而本研究中建立3個(gè)子LS-SVM模型得到多模型雖然在時(shí)間上稍稍多于單個(gè)LS-SVM建模,但是在測(cè)量精度上要遠(yuǎn)遠(yuǎn)由于DE-LSSVM建模,可以滿足實(shí)際秸稈發(fā)酵過(guò)程關(guān)鍵參數(shù)測(cè)量的需要。
表2 不同算法的性能比較 %
表3 不同算法的訓(xùn)練速度
針對(duì)發(fā)酵過(guò)程的復(fù)雜性、時(shí)變性,本文提出了發(fā)酵關(guān)鍵參量的多模型軟測(cè)量建模,運(yùn)用KFCM將數(shù)據(jù)劃分為三類(lèi),分別建立LS-SVM模型,對(duì)于LS-SVM建立軟測(cè)量模型的不精確和常規(guī)交叉方法對(duì)選擇LS-SVM建模中懲罰系數(shù)C和徑向基寬度σ的盲目性和耗時(shí)性問(wèn)題,本文引入DE算法對(duì)LS-SVM的參數(shù)進(jìn)行尋優(yōu);同時(shí)針對(duì)DE算法存在易陷入局部最優(yōu)和早熟收斂問(wèn)題,提出一種自適應(yīng)變異差分進(jìn)化(AMDE)算法,該方法采用自適應(yīng)變異操作和時(shí)變交叉概率因子對(duì)DE算法進(jìn)行改進(jìn)優(yōu)化。通過(guò)仿真實(shí)驗(yàn)顯示可以得到合適的懲罰系數(shù)C和徑向基寬度σ,并且提高了訓(xùn)練的速度,最終得到的預(yù)測(cè)值的準(zhǔn)確率有了明顯的提高。然而,本文算法的一個(gè)局限性就是使用的傳統(tǒng)KFCM算法對(duì)初始聚類(lèi)中心初始值的設(shè)定的過(guò)分依賴(lài)性,通常的聚類(lèi)算法往往對(duì)于不同的初始聚類(lèi)中心會(huì)得到不同的聚類(lèi)結(jié)果;二是需要預(yù)先設(shè)定聚類(lèi)數(shù)目,這增加了算法的不確定性。因此下一步的研究方向可以針對(duì)這兩個(gè)問(wèn)題進(jìn)行開(kāi)展。