嵇小輔,張翔
(江蘇大學 電氣信息工程學院,江蘇 鎮(zhèn)江 212013)
?
基于FCM與集成高斯過程回歸的賴氨酸發(fā)酵軟測量
嵇小輔,張翔
(江蘇大學 電氣信息工程學院,江蘇 鎮(zhèn)江 212013)
為解決賴氨酸發(fā)酵過程中菌體濃度難以在線檢測的難題,提出一種基于模糊C均值聚類(FCM)與集成高斯過程回歸(GPR)的軟測量建模方法。針對典型生物發(fā)酵過程可分為延滯期、指數(shù)生長期、穩(wěn)定期、死亡期4個反應(yīng)周期的特點,采用模糊C均值聚類算法對樣本集進行聚類分析以形成若干子樣本集;對每個子樣本集分別采用高斯過程回歸訓練時,為提高GPR模型的泛化能力,利用Adaboost算法提升GPR模型,分別在各子集建立集成GPR軟測量子模型;采用歐氏距離計算新樣本點對應(yīng)于每一子模型的隸屬度;加權(quán)求和獲得最終的軟測量模型的預測輸出?;诎被犷惖湫途NL-賴氨酸反應(yīng)過程菌體濃度參數(shù)預測的試驗研究表明:與全局單一GPR模型、集成GPR模型和基于FCM與多GPR模型相比,所建立的基于FCM與集成GPR軟測量模型擬合精度高,泛化能力強,較好地滿足了賴氨酸發(fā)酵過程的控制要求。
高斯過程回歸(GPR);模糊C均值聚類(FCM);Adaboost算法;L-賴氨酸;軟測量;歐氏距離;隸屬度;加權(quán)求和
Soft measurement of lysine fermentation based on FCM and
生物發(fā)酵過程是一個具有高度非線性與不確定性和兼有生物、化學、物理和熱力變化的復雜生化反應(yīng)過程。一些反映發(fā)酵過程品質(zhì)的重要參量,如菌體濃度、基質(zhì)濃度、產(chǎn)物濃度等,目前還缺乏在線測量的儀器與手段,影響了在線優(yōu)化控制的實施。對于這些重要過程參量的測量,目前主要采取在線取樣、離線分析的方法,但這種方法時間間隔長、數(shù)據(jù)滯后大,難以滿足生物反應(yīng)過程在線控制的要求,同時在線取樣容易造成反應(yīng)過程菌體污染,降低反應(yīng)過程的質(zhì)量。為了解決這一難題,人們提出軟測量的理論與方法。
軟測量技術(shù)起源于20世紀70年代Brosillow提出的推斷控制思想[1],其基本原理是構(gòu)造以直接可測的輔助變量為輸入的數(shù)學模型來估計難以直接測量的主導變量。軟測量建模方法可分為機理建模、數(shù)據(jù)驅(qū)動建模、混合建模3種,其中數(shù)據(jù)驅(qū)動建模是從大量過程數(shù)據(jù)中提取過程信息從而建立軟測量模型,不需要獲得對象過程的精確數(shù)學模型,它尤其適用于生物反應(yīng)過程這一類內(nèi)部機理尚不明確的復雜過程。數(shù)據(jù)驅(qū)動建模主要有神經(jīng)網(wǎng)絡(luò)、支持向量機、高斯過程回歸(GPR)等方法,其中高斯過程回歸將高斯先驗分布運用于非參數(shù)回歸函數(shù)空間,通過推導預測目標的后驗分布建立統(tǒng)計模型,高斯過程回歸可以同時獲得預測輸出與預測精度,顯著提高軟測量模型的性能。與神經(jīng)網(wǎng)絡(luò)、支持向量機等回歸方法相比,高斯過程回歸具有優(yōu)化參數(shù)少、收斂速度快、模型精度高、泛化能力強等優(yōu)點,在實際生物發(fā)酵工業(yè)中具有較好的應(yīng)用效果[2-6]。
文中給出一種生物反應(yīng)過程關(guān)鍵參量的基于模糊C均值聚類(FCM)與集成高斯過程回歸建模方法。針對生物發(fā)酵過程可分為延滯期、指數(shù)生長期、穩(wěn)定期、死亡期4個反應(yīng)周期的特點,采用模糊C均值聚類方法將過程數(shù)據(jù)樣本分成4個子類,分別對每個子樣本集采用高斯過程回歸訓練,訓練過程采用Adaboost算法以進一步提高軟測量模型的泛化能力。對于新樣本,通過計算樣本點到各聚類中心的距離確定新樣本點對每個GPR模型的隸屬度,通過加權(quán)綜合給出軟測量模型的預測輸出。針對氨基酸類典型菌種L-賴氨酸反應(yīng)過程的菌體濃度參量,建立軟測量模型并開展相關(guān)的仿真實驗研究。仿真結(jié)果表明,與單一高斯過程模型、集成GPR模型和基于FCM與多GPR模型方法相比,基于FCM與集成GPR的軟測量模型具有更好地逼近精度與泛化能力,較好地滿足了賴氨酸發(fā)酵過程軟測量的要求。
1.1 高斯過程原理
高斯過程(GP)是在高斯隨機過程與貝葉斯學習理論基礎(chǔ)上發(fā)展起來的一種新型機器學習方法,它描述了一類隨機過程:其任意有限變量集合的分布都是高斯過程,即對任意整數(shù)n≥1及任意一族隨機變量X,與其對應(yīng)的t時刻過程狀態(tài)f(X)的聯(lián)合概率分布服從n維高斯分布。GP的全部統(tǒng)計特征完全由其均值m(t)與協(xié)方差函數(shù)k(t,t′)確定,定義表示如下:
f(X)~GP(m(t),k(t,t′))
式中:t為時間變量。為了符號描述方便起見,通常對數(shù)據(jù)作預處理,使其均值函數(shù)等于0。
1.2 高斯過程回歸
給定樣本訓練集D={(xi,yi)|i=1,2,…,n},其中xi∈Rd是d維輸入向量,yi∈R是相應(yīng)的輸出量。為了符號描述方便,用X表示輸入向量構(gòu)成的d×n維輸入矩陣,y表示輸出標量構(gòu)成的輸入矢量,那么訓練集可表示為D=(X,y)。對于新樣本x*,GP模型根據(jù)先驗知識預測與x*相對應(yīng)的輸出值y*。
假設(shè)觀察目標值y被噪聲腐蝕,它與真實輸出值t相差ε,即
y=t+ε
觀測目標值y的先驗分布為
式中:K=K(X,X)=(Kij)n×n為對稱正定的協(xié)方差矩陣,元素Kij度量了xi和xj的相關(guān)度。
由此,n個訓練樣本輸出y和1個新樣本輸出y*構(gòu)成的聯(lián)合高斯先驗分布為
式中:K(X,x*)是新樣本x*與訓練集樣本X的n×1階協(xié)方差矩陣,k(x*,x*)是新樣本x*的自協(xié)方差。
GP的協(xié)方差函數(shù)需要滿足對任一點集都能夠保證產(chǎn)生一個非負正定協(xié)方差矩陣。常用的協(xié)方差函數(shù)為
式中:超參數(shù)l、σf、σn對預測效果的影響很大。最優(yōu)超參數(shù)可通過極大似然法獲得,即通過建立訓練樣本條件概率的對數(shù)似然函數(shù)對超參數(shù)求偏導,再采用共軛梯度優(yōu)化方法搜索出超參數(shù)的最優(yōu)解。該對數(shù)似然函數(shù)可以表示為
L=lnp(y|X)=
對于新的輸入樣本x*,根據(jù)貝葉斯原理可以獲得對應(yīng)的預測值y*,其預測分布是高斯型:
FCM算法[7-11]是由Dunn提出,經(jīng)由Bezdek應(yīng)用發(fā)展起來的一種模糊聚類算法,其原理是通過最小化基于范數(shù)與聚類原型的目標函數(shù)將無標簽的數(shù)據(jù)進行分類。對于給定的樣本集合X={x1,x2,…,xn}?Rs,其中s是樣本空間的維數(shù),n是樣本個數(shù),令c(c>1)是對X進行劃分的聚類個數(shù),則FCM算法的優(yōu)化目標為
約束條件為
uij≥0, 1≤i≤c, 1≤j≤n
式中:m>1是模糊系數(shù),U=(uij)c×n是模糊劃分矩陣,uij是樣本xj屬于第i類的隸屬度值,V=[v1v2… vc]是由c個聚類中心向量構(gòu)成的矩陣;dij=||xj-vi||表示樣本點xj到中心vi的歐式距離。本質(zhì)而言,F(xiàn)CM算法是一個關(guān)于自變量(U,V)的約束優(yōu)化問題,利用極值點的KT必要條件可以得到對應(yīng)的迭代方程為
若Ij≠?,則uij是滿足如下條件的任意非負實數(shù):
關(guān)于隸屬度的迭代公式是一個從點到集合的映射,在實際計算中通常采用如下的隸屬度更新公式:
FCM算法先初始化類中心或隸屬度矩陣,然后利用式(1)和式(2)進行迭代直至滿足設(shè)定的終止條件,其具體實現(xiàn)步驟如下:
1)設(shè)定聚類個數(shù)c和模糊指數(shù)m;初始化類中心V(0);設(shè)置收斂精度ε>0;令迭代次數(shù)k=0。
2)利用式(2)計算U(k+1)。
3)利用式(1)計算V(k+1),令k=k+1。
4)重復2)和3),直到滿足如下的終止條件:
‖V(k)-V(k-1)‖≤ε,k≥1
Adaboost(Adaptive boost)算法[12-14]是Boosting算法的一種,這種思想源于Valiant提出的PAC[15](probably approximately correct)學習模型。其主要內(nèi)容是獲取各學習樣本的權(quán)重分布,所有權(quán)重被賦予相等的初始數(shù)值,但在訓練過程中,這些樣本權(quán)重被不斷調(diào)整,預測精度低的樣本權(quán)重得到加強,預測精度高的樣本權(quán)重則被減弱。最終,弱預測器加強了對難以預測的樣本的學習。這樣以后,達到一定預測精度的弱預測器,經(jīng)組合后形成的強預測器就具有很高的預測精度。文中利用此算法對高斯過程回歸模型的學習能力進行提升,以提高模型的泛化能力和預測性能。
這里以氨基酸類典型菌種L-賴氨酸反應(yīng)過程的菌體濃度軟測量為例,闡述基于FCM與集成GPR的軟測量模型構(gòu)建步驟。考慮到賴氨酸反應(yīng)過程中微生物生長可分為延滯期、指數(shù)生長期、穩(wěn)定期和死亡期4個階段,將預處理后的樣本集依據(jù)FCM算法分成4個子類,即c=4,根據(jù)經(jīng)驗取m=2[16],然后采用基于Adaboost算法的集成GPR方法對每個子集建立軟測量模型。具體建模步驟為
1)根據(jù)賴氨酸反應(yīng)實驗過程的實測值建立訓練樣本(xi,yi),i=1,2,…,k,其中xi∈Rd是d維輸入矢量,表示反應(yīng)過程中影響菌體濃度的主要因素;相應(yīng)的輸出標量yi∈R,為菌體濃度值。
3)構(gòu)造模糊關(guān)系矩陣R=(riq), 其中riq為描述樣本i和q之間相似程度的系數(shù), 采用歐式距離表示:
4)計算模糊關(guān)系等價矩陣R′。利用平方法對模糊關(guān)系矩陣R進行2,4,…,2k冪次計算,直到R2k=R2k-1,則得到R′=R2k。
6)用式(3)計算樣本與初始聚類中心的近似程度。
8)利用FCM聚類算法進行迭代,直至達到收斂精度。
9)樣本聚類完成后,針對每個子類的樣本數(shù)據(jù)分別訓練子模型,結(jié)構(gòu)如圖1所示。
圖1 基于FCM與多集成GPR軟測量模型結(jié)構(gòu)
10)針對訓練子模型,采用基于Adaboost算法的集成高斯過程回歸模型,給定子學習樣本為
(x1,y1),…,(xp,yp),xu∈xi,yu∈yi,u=1,2,…,p
從子類的樣本空間中隨機選擇d組訓練數(shù)據(jù),初始化測試數(shù)據(jù)的分布權(quán)值Dt(u)=1/d、GPR模型的最大迭代次數(shù)t=1,2,…,T。
11)利用樣本權(quán)重Dt訓練弱GPR學習器。
12)獲取弱GPR學習器的預測函數(shù)ht:X→Y, 并用εt=Pru-Dt[ht(xu)≠yu]用來表示對應(yīng)的預測誤差。
14)輸出最終的預測函數(shù)為
其結(jié)構(gòu)如圖2所示。
圖2 基于Adaboost的GPR軟測量模型結(jié)構(gòu)
15)確定輸入數(shù)據(jù)對于每個子模型的隸屬度ui,根據(jù)隸屬度將每個子模型的輸出為ffin(x),最后得到賴氨酸發(fā)酵過程的菌體濃度預測值Y為
5.1 實驗數(shù)據(jù)說明
實驗采用WKT-30L型液態(tài)發(fā)酵裝備及其控制系統(tǒng)。根據(jù)賴氨酸發(fā)酵過程的工藝要求,發(fā)酵過程中的罐壓保持在0.11 MPa,溫度控制在31 ℃,攪拌電機轉(zhuǎn)速為330 r/min。根據(jù)前期對賴氨酸反應(yīng)過程的機理和數(shù)據(jù)分析[17-20],賴氨酸反應(yīng)過程的菌體濃度值與溶解氧值、發(fā)酵液pH值、空氣流等參量緊密相關(guān)。因此,本實驗選取發(fā)酵液pH值、溶解氧Do與空氣流量F3個參量作為輔助變量;關(guān)鍵生物參量菌體濃度Y作為主導變量,則賴氨酸發(fā)酵過程中菌體濃度軟測量模型可描述為
Y=f(pH,Do,F)
式中:f(·)表示主導變量與輔助變量之間的復雜非線性關(guān)系。
每批次反應(yīng)周期為72 h,采樣周期為15 min,通過測試儀器對發(fā)酵液pH值、溶解氧值、空氣流量參量進行實時采集,每2 min取樣并離線化驗得到菌體濃度。菌體濃度采用細胞干重法計算得到,即取10 mL發(fā)酵液于離心管中,在3 000 r·min-1下離心5 min,棄上清,蒸餾水洗滌2次,在105 ℃干燥至恒質(zhì)量后稱量。
考慮5個批次培養(yǎng)數(shù)據(jù)以檢驗賴氨酸反應(yīng)過程的基于FCM與集成GPR軟測量模型。為增強各批次間的差異性,每批次間初始條件不同,補料策略亦有相應(yīng)變化。采用WKT-30 L自動控制系統(tǒng),將發(fā)酵罐溫度控制在(0~50±0.5) ℃。獲得批次數(shù)據(jù)的前4批次作為訓練樣本集,離線訓練獲得基于FCM與集成GPR軟測量模型,第5個批次用于測試樣本集,檢驗基于FCM與集成GPR軟測量模型的泛化能力。
數(shù)據(jù)樣本的3D聚類效果如圖3所示,訓練樣本集被分成4類,分別用4個橢圓標記。目標函數(shù)值的變化曲線如圖4所示。結(jié)果分析可知,整體分類經(jīng)過44次迭代,達到預設(shè)收斂精度,得到最終的目標函數(shù)值。
圖3 樣本的3D聚類結(jié)果
圖 4 目標函數(shù)值變化曲線
5.2 實驗結(jié)果分析及討論
基于FCM與集成GPR的軟測量算法是在GPstuff- 4.1基礎(chǔ)上用MATLAB語言編寫。為了驗證該種方法的性能,將其與傳統(tǒng)的單一GPR、集成GPR軟測量模型和基于FCM與多GPR軟測量模型相比,其中選取菌體濃度參量為預測目標,樣本數(shù)據(jù)經(jīng)過FCM聚類以后,分別建立采用Adaboost算法的集成GPR子模型,式中:設(shè)定算法的最大迭代次數(shù)t為10,初始誤差為εt=0,針對測試樣本集檢驗軟測量模型的泛化能力。圖5所示為基于FCM與集成GPR軟測量模型的預測值與樣本真實值。
圖 5 基于FCM-Adaboost-GPR的軟測量模型預測值與真實值
圖6顯示了弱高斯過程回歸模型(傳統(tǒng)的單一高斯過程回歸模型)與強高斯過程回歸模型(集成高斯過程回歸模型)針對測試樣本集的泛化能力,經(jīng)過Adaboost算法,弱高斯過程回歸模型提升為強高斯過程回歸模型,誤差明顯減小,泛化能力也大幅度提高。
圖6 強GPR預測器與弱GPR預測器的預測值與真實值
為了與其他軟測量方法作對比研究,同時建立基于FCM與多GPR模型和單一GPR模型,模型對測試樣本集的預測效果如圖7所示。單一GPR模型的預測輸出誤差大,基于FCM與多GPR模型的預測輸出誤差比單一GPR模型的預測輸出誤差小。
通過圖5~7仿真結(jié)果對比發(fā)現(xiàn),基于FCM與集成GPR模型輸出的預測值誤差較小,預測精度高且較為平滑。
圖7 多GPR和單一GPR軟測量模型預測值與真實值
基于FCM與集成GPR軟測量模型、集成GPR軟測量模型、單一GPR軟測量模型和多GPR軟測量模型的相對誤差對比如圖8所示。分析表明,多GPR軟測量模型、集成GPR模型和基于FCM與集成GPR軟測量模型總體上相對誤差比較小,單一GPR軟測量模型的相對誤差則比較大,同時基于FCM與集成GPR模型誤差明顯小于集成GPR模型和多GPR模型。
圖8 多GPR軟測量模型、基于Adaboost-GPR軟測量模型、單一GPR軟測量模型和FCM-Adaboost-GPR軟測量模型的相對誤差
5.3 算法評價
為了進一步比較分析4種模型的預測效果,分別定義平均相對誤差σARE、均方根誤差σRMSE與最大絕對誤差 σMAXE如下:
ARE用來表示回歸值符合真實值的平均程度,RMSE用來表示回歸值和真實值的均方差大小,MAXE用來表示回歸值偏離真實值的最大幅度。這3個性能指標參數(shù)的值越小,回歸估計的效果就越好。表1所示為4種模型分別對應(yīng)的3種誤差值,誤差值表明,基于FCM與集成GPR的軟測量模型預測效果優(yōu)于單一GPR軟測量模型、集成GPR軟測量模型和多GPR軟測量模型。對于3個性能指標,基于FCM與集成GPR的軟測量模型比單一GPR軟測量模型、集成GPR軟測量模型和多GPR軟測量模型都要小,由此可見,基于FCM與集成GPR軟測量模型預測精度更高,泛化能力更好。
表 1 軟測量模型誤差對比Table 1 The error comparison of soft measurement model
針對氨基酸類典型菌種L-賴氨酸發(fā)酵過程中菌體濃度參量難以在線測量的難題,提出一種基于FCM與集成GPR的生物發(fā)酵關(guān)鍵參量軟測量方法,該方法既有效克服了全局建模模型方法學習時間長,過程特性匹配不佳、預測精度低、外推和自適應(yīng)能力差等缺點,又利用了Adaboost算法提升了高斯過程回歸機的學習能力,增強了泛化能力。仿真結(jié)果表明,與多GPR軟測量模型、集成GPR軟測量模型和單一GPR軟測量相比,基于FCM與集成GPR軟測量模型具有較高的測量精度和較強的泛化能力,可應(yīng)用于賴氨酸發(fā)酵過程菌體濃度關(guān)鍵參量的在線估計。
[1] BROSILLOW C B. Inferential control of process[J]. Automatica,1978,24(3):485-509.
[2] RASMUSSEN C E, WILLIAMS C K. Gaussian processes for machine learning[M]. Boston: MIT Press,2006: 7- 31.
[3] KOCIJAN J. Control algorithms based on Gaussian process models:a state-of-the-art survey[C]//Proc of the Special International Conference on Complex Systems:Synergy of Control,Communications and Computing. Ohrid, 2011:69-80.
[4] PETELIN D,KOCIJAN J,GRANCHAROVA A. Online Gaussian process model for the prediction of the ozone concentration in the air[J]. Comptes Rendus del Academie Bulgare des Sciences,2011,64(1):117-124.
[5] HE Z K,LIU G B,ZHAO X J, et al. Temperature model for FOG zero-bias using Gaussian process regression[J].Advances in Intelligent Systems and Computing,2012,180:37-45.
[6]孫斌,姚海濤,劉婷.基于高斯過程回歸的短期風速預測[J]. 中國電機工程學報, 2012,32(29):104-108. SUN Bin,YAO Haitao,LIU Ting. Short-term wind speed forecasting based on gaussian process regression[J]. Proceedings of the CSEE, 2012,32(29):104-108.
[7]BEZDEK J C. Pattern recognition with fuzzy objective function algorithms[M]. New York:Plenum Press,1981:15-28.
[8]曲福恒,胡雅婷,馬駟良,等.基于核的模糊C均值聚類算法的收斂性定理[J].吉林大學學報:理學版,2011,49(6): 1079-1086. QU Fuheng,HU Yating,MA Siliang, et al.A convergence theorem of kernel based fuzzy C-means clustering algorithm[J].Journal of Jilin University: Science Edition,2011,49(6): 1079-1086.
[9]MOHAMMAD T K,MOHAMMAD H B.A powerful hybrid clustering method based on modified stem cells and fuzzy C-means algorithms[J]. Engineering Applications of Artificial Intelligence,2013,26,1493-1502.
[10]XIAO Fengyin,LI P K,YIH T C. A fuzzy C-means based hybrid evolutionary approach to the clusering of supply chain[J]. Computers & Industrial Engineering,2013,66(4): 768-780.
[11]BENAICHOUCHE A N,OULHADJ H,SIARRY P. Improved spatial fuzzy C-means clustering for image segmentation using PSO initialization,Mahalanobis distance and post-segmentation correction[J]. Digital Signal Processing,2013,23(5): 1390-1400.
[12]PENG X J,SETLUR S,GOVINDARAJU V,et al.Using a boosted tree classifier for text segmentation in hand-annotated documents[J]. Pattern Recognition Letters, 2012,33(7): 943-950.
[13]曹瑩,苗啟廣,劉家辰,等. Adaboost算法研究進展與展望[J]. 自動化學報,2013,39(6):745-758. CAO Ying,MIAO Qiguang,LIU Jiachen, et al.Advance and Prospects of AdaBoost Algorithm[J]. Acta Automatica Sinica,2013,39(6):745-758.
[14]CHENG Wenchang, DING M J. A self-constructing cascade classifier with AdaBoost and SVM for pedestrian detection[J]. Engineering Applications of Artificial Intelligence,2013,26(3): 1016-1028.
[15]VALIANT L G. A theory of the learnable[J] . Communications of the ACM,1984,27(11):1134-1142.
[16]仲蔚,俞金壽.基于模糊C均值聚類的多模型軟測量[J]. 華東理工大學學報, 2000,26(1): 83-87. ZHONG Wei,YU Jinshou.Study on soft sensing modeling via FCM based multiple models[J]. Journal of East China University of Science and Technology,2000,26(1): 83-87.
[17]黃永紅,孫玉坤,王博,等. 賴氨酸發(fā)酵過程關(guān)鍵參數(shù)的模糊神經(jīng)網(wǎng)絡(luò)逆軟測量研究[J]. 儀器儀表學報,2010,31(4): 862-867. HUANG Yonghong,SUN Yukun,WANG Bo, et al.Research of soft sensor based on fuzzy neural network inverse system for lysine fermentation process[J]. Chinese Journal of Scientific Instrument,2010,31(4): 862-867.
[18]王博,孫玉坤,嵇小輔. 基于PSO-SVM逆的賴氨酸發(fā)酵過程軟測量[J].化工學報,2012,63(9):3000-3007. WANG Bo,SUN Yukun,Ji Xiaofu, et al. Soft-sensor modeling for lysine fermentation processes based on PSO-SVM inversion[J]. CIESC Journal,2012,63(9):3000-3007.
[19]孫玉坤,王博,黃永紅.基于聚類動態(tài)LS-SVM的L-賴氨酸發(fā)酵過程軟測量方法[J].儀器儀表學報,2010,31(2): 404-409. SUN Yukun,WANG Bo,HUANG Yonghong,et al.Soft-sensing method for L-lysine fermentation process based on FDLS-SVM[J]. Chinese Journal of Scientific Instrument,2010,31(2): 404-409.
[20]黃麗,孫玉坤,嵇小輔,等. 基于tPSO-BPNN的賴氨酸發(fā)酵軟測量[J]. 儀器儀表學報,2010,31(10):2317-2321. HUANG Li,SUN Yukun,JI Xiaofu, et al. Soft sensor of lysine fermentation based on tPSO-BPNN[J]. Chinese Journal of Scientific Instrument,2010,31(10):2317-2321.
嵇小輔,男,1979年生,副教授,博士,主要研究方向為生物反應(yīng)過程軟測量與優(yōu)化控制、魯棒控制。
張翔,男,1988年生,碩士研究生,主要研究方向為生物反應(yīng)過程軟測量與優(yōu)化控制。
integrated Gaussian process regression
JI Xiaofu, ZHANG Xiang
(School of Electrical and Information Engineering,Jiangsu University, Zhenjiang 212013, China)
In order to solve the problem that cell concentration is difficult to directly measure in the lysine fermentation process, a kind of soft measurement modeling method is proposed on the basis of fuzzy C-mean clustering (FCM) and integrated Gaussian process regression (GPR) . The characteristics of typical biological fermentation process can be divided into 4 reaction cycles, including lag phase, exponential growth phase, stable phase, and dead phase. The cluster analysis is conducted for a sample set by applying fuzzy C-mean clustering algorithm, so as to form several sub-sample sets. In order to improve the generalization performance of the GPR, each group is trained through Gaussian Process Regression based on Adaboost and the corresponding integrated sub-models are established. The memberships between each new sample and each group are set as the weights through Euclidean distance and the predicted result is obtained by weighted sum by using typical bacterium of amino acid—L-lysine fermentation as an example. The simulation results showed that compared with the global single GPR model, integrated GPR model and the model based on FCM and multiple GPR, the soft measurement model based on integrated GPR and FCM has high fitting precision. It also had strong generalization ability, which meets the control requirements of lysine fermentation process
Gaussian process regression(GPR); fuzzy C-mean clustering (FCM); Adaboost algorithm; L-lysine; soft measurement; Euclidean distance; membership; weighted sum
2013-10-27.
日期:2015-01-13.
國家 863 計劃資助項目 (2011AA09070301); 江蘇高校建設(shè)優(yōu)勢學科工程資助項目(蘇政辦發(fā)[2011]6 號); 江蘇省科技支撐計劃資助項目 (BE2010354); 江蘇省自然科學基金資助項目(BK2011465).
張翔.E-mail: zhangxiang_mail@126.com.
10.3969/j.issn.1673-4785.201310070
http://www.cnki.net/kcms/detail/23.1538.TP.20150113.1130.002.html
TP274
A
1673-4785(2015)01-0156-07
嵇小輔,張翔.基于FCM與集成高斯過程回歸的賴氨酸發(fā)酵軟測量[J]. 智能系統(tǒng)學報, 2015, 10(1):156-162.
英文引用格式:JI Xiaofu,ZHANG Xiang. Soft measurement of lysine fermentation based on FCM and integrated Gaussian process regression [J]. CAAI Transactions on Intelligent Systems, 2015, 10(1): 156-162.