孫麗娜, 黃永紅, 丁慎平, 劉 駿
(1.蘇州工業(yè)園區(qū)職業(yè)技術(shù)學(xué)院 機電工程系,江蘇 蘇州 215123; 2.江蘇大學(xué) 電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 212013)
海洋生物酶[1~3]發(fā)酵過程具有非線性、時變性、強耦合和不確定性等特點。許多關(guān)鍵生物參數(shù),如菌體濃度、基質(zhì)濃度及產(chǎn)物濃度等,還沒有成熟實用的在線測量儀器,給整個發(fā)酵過程的在線控制和實時優(yōu)化帶來很大困難,軟測量技術(shù)是解決上述難題的有效方法[4~6]。目前應(yīng)用最廣泛的誤差反向傳播算法神經(jīng)網(wǎng)絡(luò)存在過擬合和預(yù)測推廣性不強的缺點,基于其他算法如動量法、共軛梯度學(xué)習(xí)算法以及Levenberg-Marquardt(LM)優(yōu)化算法等[7~9]的神經(jīng)網(wǎng)絡(luò)的泛化能力在海洋生物酶發(fā)酵過程關(guān)鍵生物參數(shù)軟測量中并沒有達到理想效果。
針對以上算法的神經(jīng)網(wǎng)絡(luò)不足之處,本文提出了利用貝葉斯正則化神經(jīng)網(wǎng)絡(luò)[10,11]對海洋蛋白酶(典型的海洋生物酶)發(fā)酵過程關(guān)鍵生物參數(shù)進行軟測量。結(jié)果表明:相同條件下,采用貝葉斯正則化算法比其他改進算法網(wǎng)絡(luò)泛化能力好,預(yù)測精度高。
一般情況下,神經(jīng)網(wǎng)絡(luò)的性能函數(shù)取誤差平方和
(1)
式中n為訓(xùn)練樣本總數(shù),ti為樣本輸出,ai為神經(jīng)網(wǎng)絡(luò)的輸出。為了克服網(wǎng)絡(luò)學(xué)習(xí)過程中的過擬合問題,以正則化方法改進式(1),性能函數(shù)變?yōu)镕=βED+αEW,其中,EW為網(wǎng)絡(luò)權(quán)值的平方和;α和β的大小決定著網(wǎng)絡(luò)訓(xùn)練目標(biāo),本文采用貝葉斯方法選擇α和β。
在貝葉斯框架中,認(rèn)為網(wǎng)絡(luò)的權(quán)值是隨機變量,給定數(shù)據(jù)集后,根據(jù)貝葉斯規(guī)則調(diào)整密度函數(shù)的權(quán)值有
(2)
式中D為數(shù)據(jù)集,M為神經(jīng)網(wǎng)絡(luò)模型,w為網(wǎng)絡(luò)權(quán)向量,ZD(β)=(π/β)n/2,ZW(α)=(π/α)N/2,N為網(wǎng)絡(luò)中參數(shù)的總數(shù)目。
在貝葉斯框架下,最優(yōu)權(quán)值應(yīng)該極大化后驗概率P(w|D,α,β,M),并等價極小化目標(biāo)函數(shù)F(w)=βED+αEW,F(xiàn)(w)取最小值時,對應(yīng)的權(quán)值wMP處的α和β的最優(yōu)值為
(3)
貝葉斯優(yōu)化正則化參數(shù)時需要計算F(w)在最小點wMP處的Hessian矩陣。為了提高計算速度,采用LM優(yōu)化算法來定位最小點, Gauss-Newton近似計算Hessian矩陣。
1)初始化α,β和權(quán)值,設(shè)置α=0,β=1,并用Nguyen-Widrow方法初始化權(quán)值;
2)用LM算法訓(xùn)練網(wǎng)絡(luò)使F(w)=βED+αEW達到最小;
4)由式(3)計算α和β的新估計值;
5)重復(fù)步驟(2)~步驟(4)直至收斂。
以海洋蛋白酶發(fā)酵過程為例,其發(fā)酵過程中,菌體濃度、基質(zhì)濃度、以及酶活還不能實時在線測量(菌絲濃度采用菌絲干重法測定,基質(zhì)濃度采用斐林試劑法測定;酶活采用Folin-酚試劑法測定)給整個發(fā)酵過程的在線控制和實時優(yōu)化帶來很大影響。為此,本文建立了基于貝葉斯正則化神經(jīng)網(wǎng)絡(luò)的軟測量模型,在建模過程中,菌體濃度X、基質(zhì)濃度S、相對酶活P(為了更好地顯示酶活的變化幅度)作為軟測量模型的輸出變量。通過對海洋蛋白酶發(fā)酵過程進行機理分析,利用一致關(guān)聯(lián)度算法[12]確定軟測量模型的輸入變量為基質(zhì)進給速率u、溶解氧濃度(DO),CO2濃度,pH值。
在海洋蛋白酶發(fā)酵過程中,共采集10個發(fā)酵批次的數(shù)據(jù),每個發(fā)酵批次時間跨度為50 h,其中,前9個批次用于軟測量模型誤差的最小訓(xùn)練,第10個批次的數(shù)據(jù)作為測試樣本集對軟測量模型進行驗證。另外,由于采集到的樣本數(shù)據(jù)變化范圍較大,歸一化采用MATLAB中的premnmx函數(shù)進行[-1,1]歸一化。
本文建立的神經(jīng)網(wǎng)絡(luò)模型包含1個輸入層、1個隱含層和1個輸出層。在MATLAB環(huán)境下,用newff函數(shù)建立網(wǎng)絡(luò)。主要參數(shù)設(shè)置:隱含層神經(jīng)元傳遞函數(shù)設(shè)置為S型正切函數(shù)tansig,輸出層神經(jīng)元傳遞函數(shù)設(shè)置為線性函數(shù)purelin,訓(xùn)練函數(shù)采用貝葉斯正則化算法trainbr函數(shù)。設(shè)置最大訓(xùn)練次數(shù)為1 000,訓(xùn)練誤差為0.000 1。通過結(jié)合隱含層節(jié)點選擇的原則以及試驗湊試法,尋找最佳隱含層節(jié)點數(shù),最終確定隱含層節(jié)點數(shù)為20,網(wǎng)絡(luò)結(jié)構(gòu)為4—20—3。
圖1為網(wǎng)絡(luò)訓(xùn)練過程誤差變化曲線,可以看出當(dāng)訓(xùn)練迭代至517步時,達到設(shè)定訓(xùn)練誤差(網(wǎng)絡(luò)輸出與期望輸出的均方誤差能得到10-4精度),網(wǎng)絡(luò)訓(xùn)練收斂。
圖1 網(wǎng)絡(luò)訓(xùn)練誤差變化
利用plotregression函數(shù)對訓(xùn)練樣本和測試樣本的神經(jīng)網(wǎng)絡(luò)輸出與期望輸出進行線性回歸(包含基質(zhì)濃度(g/L)、菌體濃度(g/L)、相對酶活(%)),如圖2和圖3所示。由圖2可以看出,相關(guān)系數(shù)R=1,所有輸出點均處于斜線以上,說明期望輸出和神經(jīng)網(wǎng)絡(luò)輸出值完全重合,網(wǎng)絡(luò)訓(xùn)練比較充分,訓(xùn)練效果很好。
圖2 訓(xùn)練樣本期望輸出和神經(jīng)網(wǎng)絡(luò)輸出的線性回歸
圖3 測試樣本期望輸出和神經(jīng)網(wǎng)絡(luò)輸出的線性回歸
為了驗證模型的有效性,利用測試樣本集對建好的模型進行測試,實驗結(jié)果如圖3、圖4所示。由圖3可以看出相關(guān)系數(shù)R=0.999 99。結(jié)合圖2和圖3可以說明貝葉斯正則化很好地平衡了神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)的擬合程度和模型的復(fù)雜度,從而顯著地提高了網(wǎng)絡(luò)模型的泛化能力。
圖4為軟測量值(預(yù)測值)和離線化驗值(實際值)曲線,可以看出,對于基質(zhì)濃度、菌體濃度和相對酶活,基于貝葉斯正則化神經(jīng)網(wǎng)絡(luò)的軟測量建模輸出的預(yù)測值均能夠很好跟蹤實際值。
圖4 實際值與預(yù)測值曲線
為了更直觀地說明貝葉斯正則化神經(jīng)網(wǎng)絡(luò)的預(yù)測性能,文中將貝葉斯正則化神經(jīng)網(wǎng)絡(luò)與LM算法[13,14]的神經(jīng)網(wǎng)絡(luò)進行了對比,采用平均絕對誤差和均方根誤差和最大絕對誤差3個預(yù)測性能的評價指標(biāo)反映模型的預(yù)測效果,結(jié)果如表1所示。表中2種算法的神經(jīng)網(wǎng)絡(luò)采用了相同的訓(xùn)練數(shù)據(jù)、測試數(shù)據(jù)和網(wǎng)絡(luò)參數(shù)??梢钥闯鯨M算法的神經(jīng)網(wǎng)絡(luò)預(yù)測誤差要比前者大得多。結(jié)合圖4和表1可以看出貝葉斯正則化神經(jīng)網(wǎng)絡(luò)具有較高的預(yù)測精度。
本文針對海洋生物酶發(fā)酵過程關(guān)鍵生物參數(shù)在線測量問題,提出一種貝葉斯正則化神經(jīng)網(wǎng)絡(luò)軟測量建模方法,將該方法應(yīng)用于海洋蛋白酶發(fā)酵過程中,分別驗證了其泛化能力和預(yù)測精度,并與LM算法的神經(jīng)網(wǎng)絡(luò)進行了比較。結(jié)果說明貝葉斯正則化神經(jīng)網(wǎng)絡(luò)在海洋生物酶發(fā)酵樣本軟測量中作用顯著。
表1 軟測量誤差對比