李 慧 , ?;i, 董 博, 秦 偉
(1.長春工業(yè)大學 電氣與電子工程學院, 吉林 長春 130012;2.長春工業(yè)大學 汽車工程研究院, 吉林 長春 130012;3.吉林大學 通信工程學院, 吉林 長春 130012)
隨著人們對天然物質(zhì)的青睞以及全球回歸自然潮流的興起,特別是中藥現(xiàn)代化、國際化進程的迫近,分子蒸餾技術在高沸點、熱敏性天然物質(zhì)的分離方面得到了迅速發(fā)展[1]。但是分子蒸餾過程強耦合、非線性和大滯后的特點很難對其進行優(yōu)化控制,1978年Brosillow.C B提出可以通過過程中容易直接測量的變量(控制變量)建立軟測量數(shù)學模型推導出所需的主導變量(狀態(tài)變量)[2],并在化工過程中得到了廣泛應用。刮膜式分子蒸餾作為一種應用最廣的分子蒸餾方式,利用高速轉(zhuǎn)動的刮板在蒸發(fā)面上形成并更新既均勻又薄的液膜,加強了蒸發(fā)效果,但也使蒸發(fā)過程變得更加復雜,雖然Cvengro?等[3-4]利用Navier-Stokes方程、Boltzmann方程和熱量衡算關系式對氣相中的重力下的液膜流動的傳熱傳質(zhì)過程進行了建模,Mckenna等[5]也通過將流體的物性參數(shù)以及設備的結構參數(shù)聯(lián)系起來建立了液膜非穩(wěn)態(tài)的數(shù)學模型,但是蒸發(fā)過程機理的復雜性以及隨著工況以及環(huán)境的改變發(fā)生變化,預測性能也大大降低,普適性較差,軟測量神經(jīng)網(wǎng)絡模型非線性擬合能力強,且不需要對象的先驗知識,對處理復雜過程的建模問題具有獨到的優(yōu)勢[2],但是存在預測精度差、收斂速度慢、穩(wěn)定性差等問題,基于此,Huang提出了序貫極限學習機[6-7](Onlin Sequential Extreme Learning Machine, OS-ELM),其具有以下特點:用于實現(xiàn)學習算法的訓練數(shù)據(jù)是順序的,可以是一個基于時間的數(shù)據(jù),也可以是固定長度的批量數(shù)據(jù),還可以是變化長度的批量數(shù)據(jù),任何時刻只對新來的數(shù)據(jù)進行學習,一旦對新的數(shù)據(jù)學習結束,就丟棄掉這些數(shù)據(jù),不需要先驗知識來確定這種算法需要多少訓練樣本。大大提高了軟測量模型的可靠性和預測精度。
文中通過建立基于數(shù)據(jù)的OS-ELM軟測量模型,并采用ADHDP對各影響蒸發(fā)效率的控制變量進行學習尋優(yōu),得到了最優(yōu)的狀態(tài)變量,實現(xiàn)了對刮膜式分子蒸餾系統(tǒng)的優(yōu)化控制。
刮膜式分子蒸餾器的旋轉(zhuǎn)軸和安裝在旋轉(zhuǎn)軸上的輥筒共同組成刮膜器,物料沿壁面從頂部進入,蒸發(fā)液膜在刮板的旋轉(zhuǎn)作用下不斷更新,當旋轉(zhuǎn)軸轉(zhuǎn)動時,輥筒在離心力的作用下緊貼在蒸發(fā)器表面,物料在輥筒與蒸發(fā)面共同的作用下在蒸發(fā)器表面形成一層液膜。頭波與之前形成的液膜不斷地進行混合更新,這種不斷混合更新有利于液膜內(nèi)濃度分布均勻,增加了傳熱和傳質(zhì)效果[8-9]。刮膜式分子蒸餾器的結構如圖1所示。
圖1 刮膜式分子蒸餾器的內(nèi)部結構
在蒸發(fā)工藝工程中,提純物純度是一個很重要的指標,在刮膜蒸發(fā)過程穩(wěn)定的情況下,與狀態(tài)變量純度存在強耦合關系,并可以直接獲得的控制變量主要有以下幾個[8-12]:
1)進料速度。進料速度直接影響著液膜的更新及其薄厚,以及在蒸發(fā)面上停留的時間,合適的進料速率能使蒸發(fā)面積得到充分利用,有效提高蒸發(fā)速率。
2)刮膜電機轉(zhuǎn)速。刮膜電機的轉(zhuǎn)速決定了液膜更新速度的快慢以及液體的平均停留時間,進而影響到狀態(tài)量純度。
3)真空度。合理增大系統(tǒng)的真空度能夠減少分子間的碰撞,降低輕分子因碰撞而發(fā)生的氧化可能性,保證了被提純物的原有屬性。
4)蒸發(fā)溫度。如果蒸發(fā)溫度過高,液膜就容易發(fā)生氧化、聚合等現(xiàn)象,而溫度低的情況下會降低分子活躍度,影響蒸發(fā)速率與分離效率,還會影響產(chǎn)品的純度。
OS-ELM原理:
一個標準的具有N個任意不同樣本(xj,tj)的單隱層前饋網(wǎng)絡,其中xj=[xj1,xj2,…,xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,激活函數(shù)為g(·),假設具有L個隱層神經(jīng)元,可記為:
(1)
βi——隱層第i個神經(jīng)元和輸出層神經(jīng)元之間的輸出權值;
bi——隱層第i個神經(jīng)元的閾值;
wi·xj——wi和xj的內(nèi)積。
單隱層神經(jīng)網(wǎng)絡學習的目標是使輸出的誤差最小,可以表示為:
(2)
即存在wi、xj和bi使得:
(3)
i=1,2,…,L
這等價于最小化損失函數(shù)
(4)
H-1=(HTH-1)HT
(5)
(6)
(7)
(8)
(9)
所以
其中
(11)
由此可知:
(12)
由此可以得到遞推公式
(13)
(14)
(15)
由上面的推導可知,OS-ELM在建立軟測量模型時,輸入的數(shù)據(jù)數(shù)量可以變化,在隨著工況不斷變化的同時,新的輸入數(shù)據(jù)也會及時修正模型,并且在舍棄了舊的輸入數(shù)據(jù)的情況下,提高了運行速度,軟測量模型的準確性和可靠性得到顯著提高[13]。
設刮膜蒸發(fā)過程的離散時間非線性動態(tài)系統(tǒng)
x(k+1)=f[x(k),u(k),k]
k=0,1,…
(16)
式中:x∈Rn——系統(tǒng)的狀態(tài)向量;
x∈Rm——控制動作;
f——系統(tǒng)函數(shù)。
系統(tǒng)性能指標函數(shù)為:
(17)
式中:U——效用函數(shù);
γ——折扣因子,0<γ≤1;
J——依賴于初始時間k和初始狀態(tài)x(k)的性能指標函數(shù)。
ADHDP的目標是選出最優(yōu)的控制序列u(i),i=k,k+1,…,使得式(17)定義的函數(shù)最小化。
ADHDP控制器結構包含3個典型網(wǎng)絡。模型網(wǎng)絡(Model Network)用來估計下一時刻的系統(tǒng)狀態(tài);評價網(wǎng)絡(Critic Network)用來近似最優(yōu)性能指標函數(shù);執(zhí)行網(wǎng)絡(Action Network)為狀態(tài)變量到控制變量之間的映射[14]。ADHDP學習控制器結構如圖2所示。
圖2 ADHDP學習控制器結構
圖2中Q函數(shù)是對性能指標函數(shù)的預估,可以寫成如下表達式
Q(x(k))=U(x(k),u(x(k)))+Q(x(k+1))
(18)
式中:u(x(k))——反饋控制變量;
Q(x(k)),Q(x(k+1))——性能指標函數(shù),評價網(wǎng)絡的輸出。
如果評價網(wǎng)絡的權值設為Wc,可以令式的右式為:
D(x(k),Wc)=U(x(k),u(x(k)))+Q(x(k+1),Wc)
(19)
同時,式(19)的左式可以寫為Q(x(k),Wc),因此可以通過調(diào)節(jié)評價神經(jīng)網(wǎng)絡權值最小化均方誤差函數(shù)
(20)
獲得最優(yōu)性能指標函數(shù)根據(jù)最優(yōu)性原理,最優(yōu)控制應滿足一階微分必要條件,所以有
(21)
因此得到最優(yōu)控制
(22)
ADHDP控制器包含由BP神經(jīng)網(wǎng)絡實現(xiàn)的執(zhí)行網(wǎng)絡和評價網(wǎng)絡,以及刮膜蒸發(fā)過程的OS-ELM軟測量模型。執(zhí)行網(wǎng)絡和評價網(wǎng)絡的隱藏層采用雙極性sigmoidal函數(shù),輸出層采用線性函數(shù)purelin,推導評價網(wǎng)絡和執(zhí)行網(wǎng)絡的具體實現(xiàn)方法。
評價網(wǎng)絡輸出為性能指標函數(shù)Q(k),應滿足式(18),其訓練最小化誤差為:
(23)
ec(k)=Q(k)-U(k+1)-Q(k+1)
(24)
為了獲得較快的收斂速度,將效用函數(shù)U(k)定義為二次型形式,定義如下:
U(k)=x(k)Ax(k)T+u(k)Bu(k)T
(25)
式中:A、B——分別為2維與4維的單位矩陣。
權值更新過程推導如下:
(26)
Wc2(k+1)=Wc2(k)+ΔWc2(k)
(27)
式中:lc——評價網(wǎng)絡的學習率;
ch2(k)——隱含層的輸出值。
(28)
式中:C(k)——評價網(wǎng)路的輸入矩陣;
ch1(k)——隱含層的輸入值。
Wc1(k+1)=Wc1(k)+ΔWc1(k)
(29)
執(zhí)行網(wǎng)絡用于計算控制量,以使Q(k)最小為目標。
Ea(k)=Q(k)=γQ(k+1)+U(k+1)
(30)
權值更新過程推導如下:
?
(31)
式中,Wa為執(zhí)行網(wǎng)絡權值,Wc1u=Wc1(1:m,:),即Wc1的前m行,這里m=4,即與控制量對應的部分權值,la為執(zhí)行網(wǎng)絡的學習率。
Wa2(k+1)=Wa2(k)+ΔWa2(k)
(32)
(33)
Wa1(k+1)=Wa1(k)+ΔWa1(k)
(34)
綜上,ADHDP控制器的實現(xiàn)步驟如圖3所示。
文中訓練OS-ELM軟測量模型的數(shù)據(jù)來源于刮膜式分子蒸餾裝置針對東北地道藥材五味子分離提純過程的數(shù)據(jù)。刮膜式三級分子蒸餾裝置由前級脫氣、分子蒸餾1和分子蒸餾2三大部分組成,控制和監(jiān)控各級工藝參數(shù)分別由PID儀表和計算機實現(xiàn),第一、第二兩級用于除去五味子原料油中水分和雜質(zhì)且相關工藝參數(shù)固定,采集第三級的控制量、狀態(tài)量的離線和在線數(shù)據(jù)。
圖3 ADHDP訓練流程圖
選擇系統(tǒng)壓力、溫度、進料流量和刮膜電機轉(zhuǎn)速作為控制變量,純度作為狀態(tài)變量,設定網(wǎng)絡輸入為6,輸出為2,選取600組作為訓練數(shù)據(jù),150組數(shù)據(jù)用來進行預測,OS-ELM網(wǎng)絡與BP網(wǎng)絡的仿真結果對比如圖4所示。
.
(a) OS-ELM純度預測
(b) BP純度預測
具體性能參數(shù)對比見表1。
表1 OS-ELM與BP模型網(wǎng)絡性能對比
從表1可以看出,OS-ELM軟測量模型的誤差和訓練時間都遠遠小于BP軟測量模型,并且隨著數(shù)據(jù)的更新持續(xù)地對模型進行修正,證明了OS-ELM模型的優(yōu)越性。
參數(shù)設置會在一定程度上影響算法的收斂速度。經(jīng)過實驗選取BP-ADHDP與OSELM-ADHDP的評價網(wǎng)絡和執(zhí)行網(wǎng)絡的結構均為6-14-2和2-5-4,學習率為0.1,折扣因子為0.5,迭代步數(shù)為50,在刮膜蒸發(fā)過程中對系統(tǒng)壓力、溫度、進料流量、刮膜電機轉(zhuǎn)速和純度參數(shù)的尋優(yōu)結果對比分別如圖5~圖9所示。
圖5 控制量溫度變化曲線圖
圖6 控制量進料速度變化曲線圖
圖7 控制量刮膜電機轉(zhuǎn)速變化曲線
圖8 控制量壓力變化曲線圖
由仿真結果可以看出,BP-ADHDP與OSELM-ADHDP大約都在13時步左右趨于穩(wěn)定,但是,OSELM-ADHDP最優(yōu)狀態(tài)量純度為95.58%,要遠大于BP-ADHDP的89.93%,優(yōu)化的狀態(tài)量純度得到了顯著提高,并且OSELM-ADHDP模型網(wǎng)絡更加準確可靠,能夠?qū)崿F(xiàn)更好的控制優(yōu)化效果。
BP-ADHDP與OSELM-ADHDP最優(yōu)控制量與狀態(tài)量對比見表2。
分子蒸餾系統(tǒng)本身的多參數(shù)、強耦合、非線性決定其難以獲得精確數(shù)學模型,在刮膜蒸發(fā)過程中的重要參數(shù)只能依賴于人工經(jīng)驗,以致難以實現(xiàn)穩(wěn)定有效的控制,采用基于數(shù)據(jù)驅(qū)動的OS-ELM軟測量模型,可以根據(jù)實際工況對模型進行調(diào)整,運用ADHDP對刮膜蒸發(fā)過程進行優(yōu)化控制,仿真結果表明,系統(tǒng)訓練時間短、超調(diào)量小,能夠快速達到穩(wěn)定狀態(tài),對提高刮膜蒸發(fā)過程的穩(wěn)定性和高效性具有一定的指導意義。
表2 BP-ADHDP與OSELM-ADHDP最優(yōu)控制量與狀態(tài)量對比
參考文獻:
[1] 連錦花,孫果宋,雷福厚.分子蒸餾技術及其應用[J].化工技術與開發(fā),2010,39(7):32-38.
[2] 曹鵬飛,羅雄麟.化工過程軟測量建模方法研究進展[J].化工學報,2013,64(3):788-800.
[3] Cvengro? J, Badin V, Pollák S. Residence time distribution in a wiped liquid film [J]. Chemical Engineering Journal and the Biochemistry Engineering Journal,1995(5):259-263.
[4] Cvengro J, Pollá K, Micov M. Film wiping in the molecular evaporator [J]. Chemical Engineering Journal,2001(1/2/3):9-14.
[5] Mckenna Timothy F. Design model of a wiped film evaporator applications to the devolatilisation of polymer melts [J]. Chemical Engineering Science,1995(3):453-467.
[6] Rong H J, Huang G B, Sundararajan N. Online sequential fuzzy extreme learning machine for function approximation and classification problems [J]. IEEE Transactions on Systems Man and Cybernetics Part B,2009,39(4):1067-1072.
[7] Liang N Y, Huang G B, Paramasivan S, et al. A fast and accurate online sequential learning algorithm for feedforward netwroks[J]. IEEE Transactionson Neural Networks,2006,17(6):1411-1423.
[8] 徐暢,許松林.刮膜式分子蒸餾停留時間分布的CFD模擬研究[J].安徽師范大學學報,2013,36(2):141-145.
[9] 王燕飛.刮膜式分子蒸餾過程流體流動的模擬與驗證[D].天津:天津大學,2007.
[10] 王玲.刮膜式分子蒸餾器液膜停留時間分布及傳熱研究[D].天津:天津大學,2012.
[11] 李慧,王珂鑫.刮膜式分子蒸餾傳質(zhì)模型及其仿真[J].化工學報,2015,66(3):1026-1034.
[12] 李慧,李秀歌,王佳增.負壓低溫蒸餾裝置的溫度控制[J].長春工業(yè)大學學報:自然科學版,2014,35(5):516-523.
[13] 楊易旻.基于極限學習的系統(tǒng)辨識方法及應用研究[D].長沙:湖南大學,2013.
[14] 林小峰,宋紹劍,宋春寧.基于自適應動態(tài)規(guī)劃的智能優(yōu)化控制[M].北京:科學出版社,2013.
[15] 羅艷紅.基于神經(jīng)網(wǎng)絡的非線性系統(tǒng)自適應優(yōu)化控制研究[D].沈陽:東北大學,2008.