陳 琳,周 利,吉 旭
(四川大學(xué) 化學(xué)工程學(xué)院,四川 成都 610065)
石油煉化具有重要的戰(zhàn)略及現(xiàn)實(shí)意義,是許多國(guó)家的支柱產(chǎn)業(yè)之一。近年來(lái),輕質(zhì)和綠色燃料市場(chǎng)的不斷增長(zhǎng)、環(huán)保法規(guī)的日益嚴(yán)格以及原油質(zhì)量的低劣化發(fā)展趨勢(shì),正迫使石油煉化產(chǎn)業(yè)進(jìn)一步升級(jí),特別是在建設(shè)和改進(jìn)石油深加工技術(shù)方面[1-2]。催化裂化(Fluid Catalytic Cracking,FCC)將劣質(zhì)重油轉(zhuǎn)化為高價(jià)值的輕質(zhì)油和化學(xué)品(例如汽油和丙烯),已成為煉油行業(yè)最關(guān)鍵的重油轉(zhuǎn)化技術(shù)之一[3]。自1940年代以來(lái),學(xué)術(shù)界和工業(yè)界對(duì)催化裂化的過(guò)程建模進(jìn)行了大量的研究,以期達(dá)到快速準(zhǔn)確的產(chǎn)品收率預(yù)測(cè),為實(shí)現(xiàn)過(guò)程控制、故障診斷以及操作優(yōu)化奠定基礎(chǔ)。近年來(lái),伴隨著工業(yè)4.0和中國(guó)制造2025的浪潮,催化裂化逐漸趨于互聯(lián)化和信息驅(qū)動(dòng),對(duì)催化裂化的過(guò)程建模研究也從傳統(tǒng)的機(jī)理建模發(fā)展為數(shù)據(jù)驅(qū)動(dòng)建模[4-5]。
機(jī)理模型是基于催化裂化過(guò)程反應(yīng)及傳遞機(jī)理所建立的精確數(shù)學(xué)模型[6],可分為集總動(dòng)力學(xué)模型[7-9]和分子尺度動(dòng)力學(xué)模型[10]。由于催化裂化的原料和產(chǎn)物都是烴類(lèi)和非烴類(lèi)組成的復(fù)雜混合物,難以進(jìn)行表征和描述,集總動(dòng)力學(xué)模型將具有相似動(dòng)力學(xué)規(guī)則的化合物集中成一個(gè)虛擬組分,稱之為“集總”,以此來(lái)簡(jiǎn)化反應(yīng)體系。如果能夠獲得準(zhǔn)確的動(dòng)力學(xué)參數(shù),則集總動(dòng)力學(xué)模型可以取得不錯(cuò)的預(yù)測(cè)結(jié)果,但其受原料波動(dòng)的影響較大,且針對(duì)不同的原料或產(chǎn)品,必須重新調(diào)整參數(shù)構(gòu)建模型。隨著分子表征技術(shù)的發(fā)展以及計(jì)算水平的提高,以更高的分辨率來(lái)描述催化裂化反應(yīng)過(guò)程的分子尺度動(dòng)力學(xué)模型得以發(fā)展,這也導(dǎo)致了更加復(fù)雜的模型表現(xiàn)形式,例如結(jié)構(gòu)導(dǎo)向集總模型[11-12]、蒙特卡羅模型[13-14]和單事件動(dòng)力學(xué)模型[15-16]等。
盡管機(jī)理模型能夠揭示反應(yīng)過(guò)程本質(zhì),幫助我們理解過(guò)程現(xiàn)象,但由于催化裂化是一個(gè)高度復(fù)雜的工業(yè)系統(tǒng),其過(guò)程伴隨著非線性、強(qiáng)耦合、大時(shí)滯、強(qiáng)干擾等復(fù)雜的時(shí)空特性[17],這一方面要求研究人員具有很深的知識(shí)背景,另一方面,為了簡(jiǎn)化過(guò)程機(jī)理而作出的許多理想化假設(shè)會(huì)影響模型性能。相比之下,數(shù)據(jù)驅(qū)動(dòng)模型對(duì)領(lǐng)域知識(shí)的要求不高,且具有更好的自適應(yīng)性和可遷移性。此外,煉油廠生產(chǎn)過(guò)程中積累的海量過(guò)程數(shù)據(jù),也為數(shù)據(jù)驅(qū)動(dòng)模型的構(gòu)建提供了基礎(chǔ)條件。傳統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)模型以支持向量機(jī)(Support Vector Machine,SVM)[18-19]、反向傳播網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)[20-21]、隨機(jī)森林(Random Forest,RF)[22-23]等傳統(tǒng)機(jī)器學(xué)習(xí)算法為主。由于傳統(tǒng)機(jī)器學(xué)習(xí)算法的表達(dá)能力有限,通常還需要結(jié)合細(xì)致而繁瑣的特征工程來(lái)提高模型性能[24]。隨著人工智能技術(shù)的不斷發(fā)展,深度學(xué)習(xí)被提出并應(yīng)用到了化學(xué)工業(yè)之中[25-27]。深度學(xué)習(xí)具有強(qiáng)大的數(shù)據(jù)處理和特征映射能力,與傳統(tǒng)機(jī)器學(xué)習(xí)算法中人工構(gòu)造特征相比,深度學(xué)習(xí)利用大量數(shù)據(jù)來(lái)學(xué)習(xí)和挖掘特征,更能刻畫(huà)數(shù)據(jù)中豐富的內(nèi)在信息和物理意義。
催化裂化是一個(gè)典型的動(dòng)態(tài)連續(xù)過(guò)程,充分利用其過(guò)程數(shù)據(jù)的時(shí)序性對(duì)建模具有重要意義[28]。長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)作為專(zhuān)門(mén)處理時(shí)間序列問(wèn)題的深度學(xué)習(xí)算法,在催化裂化過(guò)程建模中得到了應(yīng)用[29-31]。Zhang等基于LSTM提出了一種加權(quán)自回歸長(zhǎng)短期記憶(WAR-LSTM)結(jié)構(gòu)單元,將多個(gè)WAR-LSTM疊加為深度WAR-LSTM,從多變量中提取高層特征表示,從而充分利用催化裂化過(guò)程中的時(shí)空信息。雖然LSTM通過(guò)其門(mén)控單元在一定程度上改善了長(zhǎng)序列訓(xùn)練過(guò)程中的梯度消失和梯度爆炸問(wèn)題,但其本質(zhì)還是串行結(jié)構(gòu),仍無(wú)法完全避免此問(wèn)題[32]。2018年,Bai等提出了時(shí)間卷積網(wǎng)絡(luò)(Temporal Convolutional Network,TCN),其本質(zhì)是卷積神經(jīng)網(wǎng)絡(luò)(CNN)針對(duì)時(shí)間序列問(wèn)題的優(yōu)化和改造,其并行結(jié)構(gòu)提高了模型計(jì)算效率,也避免了梯度消失和梯度爆炸問(wèn)題,從而使TCN具有更長(zhǎng)的記憶能力,在多個(gè)數(shù)據(jù)集的測(cè)試結(jié)果中表明,TCN的表現(xiàn)優(yōu)于LSTM和GRU等一般循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。然而,目前尚未在催化裂化過(guò)程建模領(lǐng)域中見(jiàn)到有關(guān)TCN的報(bào)道。
此外,在催化裂化的生產(chǎn)過(guò)程中,原料波動(dòng)、設(shè)備故障、環(huán)境干擾等狀況的出現(xiàn)會(huì)使得其過(guò)程的時(shí)滯性發(fā)生變化,即序列在時(shí)間維度上的相關(guān)性發(fā)生了改變,導(dǎo)致模型精度下降。注意力機(jī)制(Attention Mechanism)通過(guò)構(gòu)建注意力矩陣,使模型自適應(yīng)地對(duì)不同關(guān)注部分賦予不同的權(quán)重,并抽取出更加重要和關(guān)鍵的信息,從而增強(qiáng)模型的信息提取能力。在序列的時(shí)間維度上引入注意力機(jī)制,可使模型對(duì)每個(gè)特定時(shí)間步的重要性進(jìn)行定量賦值,以此來(lái)捕捉并減小序列時(shí)滯性變化帶來(lái)的影響,進(jìn)而提升模型的自適應(yīng)能力及魯棒性。Han等[33]在LSTM的基礎(chǔ)上引入了注意力機(jī)制,改善了傳統(tǒng)LSTM的注意力分散問(wèn)題,并將該模型應(yīng)用于分析某復(fù)雜化工系統(tǒng)的生產(chǎn)能力和節(jié)能潛力,取得了較好效果。
綜合以上分析,本文提出了一種基于深度學(xué)習(xí)的催化裂化過(guò)程建模方法,該方法結(jié)合了TCN、注意力機(jī)制和BPNN 3種網(wǎng)絡(luò)結(jié)構(gòu),以充分利用催化裂化過(guò)程的時(shí)空信息。首先,利用TCN對(duì)過(guò)程時(shí)序數(shù)據(jù)進(jìn)行深度信息提取;其次,利用注意力機(jī)制來(lái)自適應(yīng)地捕捉時(shí)序過(guò)程中的時(shí)間權(quán)重;再者,利用BPNN作為網(wǎng)絡(luò)最后的回歸器,將經(jīng)過(guò)TCN和注意力機(jī)制提取后的信息與產(chǎn)品收率進(jìn)行關(guān)聯(lián);最后,將所提方法應(yīng)用于實(shí)際的催化裂化生產(chǎn)過(guò)程來(lái)驗(yàn)證其有效性和實(shí)用性。
自1940年代發(fā)展至今,催化裂化已形成相對(duì)完整的流程體系,圖1給出了典型催化裂化工藝的簡(jiǎn)化流程圖。催化裂化分為3個(gè)子系統(tǒng),分別是反應(yīng)-再生系統(tǒng)、分餾系統(tǒng)以及吸收-穩(wěn)定系統(tǒng)。反應(yīng)-再生系統(tǒng)作為催化裂化的核心系統(tǒng),提供了原油裂解所需的高溫催化環(huán)境。原料油從提升管底部進(jìn)入反應(yīng)器,在此處與高溫再生催化劑接觸而立即汽化,并隨著預(yù)提升氣一起加速上升。在上升過(guò)程中,原料油在高溫和催化劑的作用下,發(fā)生裂化、異構(gòu)化、氫轉(zhuǎn)移等一系列復(fù)雜的化學(xué)反應(yīng),生成包含輕質(zhì)油產(chǎn)品在內(nèi)的油氣混合物,與此同時(shí),催化劑因積碳而逐漸失活。失活催化劑通過(guò)反應(yīng)器頂部的分離器與油氣進(jìn)行分離,然后進(jìn)入再生器通過(guò)空氣燃燒去除積碳,從而恢復(fù)活性成為再生催化劑,并攜帶著燃燒所產(chǎn)生的高溫重新進(jìn)入提升管底部參與反應(yīng)。從反應(yīng)器頂部出來(lái)的油氣混合物進(jìn)入分餾系統(tǒng)被切割成富氣、粗汽油、輕柴油、重柴油以及副產(chǎn)物油漿。富氣和粗汽油作為中間產(chǎn)物進(jìn)入吸收-穩(wěn)定系統(tǒng),通過(guò)吸收和精餾操作最終分離成干氣、液化氣和汽油。
圖1 典型催化裂化工藝的簡(jiǎn)化流程Fig.1 Simplified diagram of typical FCC process
催化裂化過(guò)程復(fù)雜,影響因素眾多,其各產(chǎn)品的收率很大程度上取決于各裝置的控制與優(yōu)化水平,而這又進(jìn)一步依賴于模型性能,因此,建立一個(gè)準(zhǔn)確的產(chǎn)品收率預(yù)測(cè)模型至關(guān)重要。
本節(jié)介紹所提出的深度學(xué)習(xí)建模方法,用于構(gòu)建催化裂化過(guò)程信息與產(chǎn)品收率之間的映射關(guān)系,主要包括以下3個(gè)步驟:
(1)數(shù)據(jù)收集與預(yù)處理。從煉油廠的數(shù)據(jù)系統(tǒng)中收集有關(guān)催化裂化的過(guò)程信息,并進(jìn)行數(shù)據(jù)預(yù)處理及數(shù)據(jù)集劃分。
(2)模型構(gòu)建。基于TCN、注意力機(jī)制和BPNN構(gòu)建深度學(xué)習(xí)預(yù)測(cè)模型,如圖2所示。
圖2 所提建模方法示意圖Fig.2 Schematic diagram of proposed modeling method
(3)模型訓(xùn)練與評(píng)價(jià)?;谔荻认陆邓惴ㄓ?xùn)練模型參數(shù),訓(xùn)練完成后使用相關(guān)評(píng)價(jià)指標(biāo)對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)價(jià)。
首先,從煉油廠的數(shù)據(jù)系統(tǒng)(如DSC系統(tǒng)和LIMS系統(tǒng))中收集有關(guān)催化裂化的過(guò)程信息,主要包括工藝變量(如溫度、壓力、流量、液位等)和物料性質(zhì)(如初餾點(diǎn)、含碳量、密度等)。由于過(guò)程信息包含多個(gè)變量且均按照一定的時(shí)間間隔進(jìn)行采樣,即具有時(shí)間上的先后順序,因此過(guò)程信息可視為多元時(shí)間序列。由于模型目標(biāo)為預(yù)測(cè)產(chǎn)品收率,故將產(chǎn)品收率視為目標(biāo)序列(Target Series),將除產(chǎn)品收率之外的過(guò)程信息視為驅(qū)動(dòng)序列(Driving Series)。其中,驅(qū)動(dòng)序列可表示為矩陣X:
(1)
目標(biāo)序列可表示為向量y:
y=[y1,y2,…,yt]。
(2)
其次,為了確保數(shù)據(jù)的可用性,在數(shù)據(jù)收集完成后需進(jìn)行數(shù)據(jù)的預(yù)處理,例如去除離群點(diǎn)、填補(bǔ)缺失值、數(shù)據(jù)降噪等。根據(jù)數(shù)據(jù)集情況的不同,可選擇不同的預(yù)處理方法[34],例如采用三西格瑪規(guī)則去除離群點(diǎn)、采用線性插值法填補(bǔ)缺失值等。此外,由于不同序列具有不同的物理意義和數(shù)量級(jí),為了避免對(duì)模型性能造成影響,使用如下歸一化方法將數(shù)據(jù)映射到同一尺度:
(3)
最后,采用滑動(dòng)窗口法構(gòu)造多元時(shí)間序列的監(jiān)督數(shù)據(jù)集,如圖2(a)所示,并按照合適的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。其中,訓(xùn)練集用于訓(xùn)練模型參數(shù),驗(yàn)證集用于初步評(píng)價(jià)模型并優(yōu)化模型超參數(shù),測(cè)試集用于模型的最終評(píng)價(jià)。
所提建模方法旨在解決催化裂化產(chǎn)品收率預(yù)測(cè)的回歸問(wèn)題,具體而言,給定當(dāng)前驅(qū)動(dòng)序列[x1,x2,…,xt]和歷史目標(biāo)序列[y1,y2,…,yt-1],模型任務(wù)為學(xué)習(xí)以下非線性映射關(guān)系:
(4)
2.2.1 時(shí)間卷積網(wǎng)絡(luò)
TCN的本質(zhì)是一維CNN針對(duì)時(shí)間序列問(wèn)題的優(yōu)化和改造,能夠?qū)⑷我忾L(zhǎng)度的輸入序列映射到相同長(zhǎng)度的輸出,并且保證上下文信息的因果性。如圖2(b)所示,TCN采用多層膨脹因果卷積(Dilated Causal Convolutions)進(jìn)行信息提取。其中,因果卷積可表述為時(shí)間步t上的輸出,只依賴于時(shí)間步t及其之前的卷積操作,而與時(shí)間步t之后的數(shù)據(jù)無(wú)關(guān),這保證了層與層的因果性,即不存在未來(lái)信息的泄露。膨脹卷積則通過(guò)跳過(guò)特定步數(shù)的輸入,使卷積核可以應(yīng)用于大于其長(zhǎng)度的區(qū)域,以此觀測(cè)更長(zhǎng)的輸入序列。對(duì)于一個(gè)一維輸入序列x∈Rn以及一個(gè)卷積核f:{0,…,k-1}→R,在序列成分s上的膨脹卷積操作F可由下式進(jìn)行計(jì)算:
(5)
式中:*表示卷積運(yùn)算,d表示膨脹因子,k表示卷積核的大小,s-d·i表示過(guò)去的方向。因此,膨脹卷積相當(dāng)于在卷積核的每?jī)蓚€(gè)相鄰引腳之間引入d-1個(gè)固定步數(shù)。d越大,輸出所能觀測(cè)的輸入范圍越大,當(dāng)d=1時(shí),膨脹卷積就等效為普通的卷積操作。在TCN中,d隨著網(wǎng)絡(luò)層數(shù)的增加呈指數(shù)增長(zhǎng),即d=O(2i),i表示網(wǎng)絡(luò)層數(shù)。
此外,為避免隨著網(wǎng)絡(luò)深度的增加而出現(xiàn)網(wǎng)絡(luò)退化問(wèn)題,TCN采用殘差模塊作為基本單元來(lái)構(gòu)建網(wǎng)絡(luò),即圖2(b)中每層網(wǎng)絡(luò)之間的卷積操作都用殘差模塊代替。一個(gè)殘差模塊可表述為輸入x經(jīng)過(guò)一系列非線性變換F,其結(jié)果直接與輸入x線性疊加,再經(jīng)過(guò)激活函數(shù),得到整個(gè)模塊的輸出o,其計(jì)算公式如下[35]:
o=Activation(x+F(x))。
(6)
這種跳層連接的方式,使信息的前后向傳播更加順暢,進(jìn)而使網(wǎng)絡(luò)學(xué)習(xí)到恒等映射,避免網(wǎng)絡(luò)退化。如圖2(c)所示,在TCN的一個(gè)殘差模塊內(nèi),包含兩層膨脹因果卷積層和非線性激活函數(shù)層(ReLU),以及與之配套的權(quán)值歸一化層(Weight Norm)和隨機(jī)失活層(Dropout)。
TCN綜合膨脹因果卷積和殘差連接,實(shí)現(xiàn)了對(duì)序列數(shù)據(jù)從局部到整體的感知。驅(qū)動(dòng)序列經(jīng)過(guò)TCN提取后得到抽象的高層特征表示H=[h1,h2,…,hi,…,ht],作為后續(xù)注意力層的輸入。
2.2.2 注意力機(jī)制
在序列的時(shí)間維度上,并非每個(gè)時(shí)間步對(duì)產(chǎn)品收率都具有相同的貢獻(xiàn),因此采用注意力機(jī)制來(lái)對(duì)每個(gè)時(shí)間步的重要性進(jìn)行定量賦值。這里將注意力機(jī)制作用于經(jīng)TCN提取后的高層特征表示H。將hi輸入一個(gè)單層MLP(多層感知機(jī))得到ut,其中,引入了權(quán)重參數(shù)Ws和偏置參數(shù)bs,再通過(guò)softmax函數(shù)計(jì)算得到標(biāo)準(zhǔn)化的注意力權(quán)重αi,最后計(jì)算注意力權(quán)重αi和高層特征表示H的加權(quán)和,得到處理后的過(guò)程信息M。計(jì)算公式如下:
ut=tanh(Wshi+bs)。
(7)
(8)
(9)
式中:us,Ws,bs均為隨機(jī)初始化,并將隨著模型的訓(xùn)練不斷學(xué)習(xí)優(yōu)化。
2.2.3 BPNN回歸器
基于構(gòu)建好的深度網(wǎng)絡(luò)模型,使用訓(xùn)練集訓(xùn)練模型參數(shù),使用驗(yàn)證集對(duì)模型進(jìn)行初步評(píng)價(jià)并優(yōu)化模型超參數(shù),最后使用測(cè)試集對(duì)模型進(jìn)行最終評(píng)價(jià)。
在模型的訓(xùn)練和驗(yàn)證階段,以均方根誤差(MSE)作為模型損失函數(shù)L,計(jì)算公式如下:
(10)
使用基于梯度下降算法的Adam優(yōu)化器不斷更新和優(yōu)化模型參數(shù),以減小模型的損失函數(shù)值。此外,使用提前停止(Early Stopping)防止模型過(guò)擬合,即當(dāng)驗(yàn)證集的損失函數(shù)不再減小時(shí),則停止訓(xùn)練。
在模型測(cè)試階段,使用平均絕對(duì)誤差(MAE)、均方根誤差(MSE)和決定系數(shù)(R2)作為模型的評(píng)價(jià)指標(biāo),其中MAE和MSE越小以及R2越大則表明模型性能越好,計(jì)算公式如下:
(11)
(12)
(13)
本案例以中國(guó)西北地區(qū)某煉化廠的催化裂化裝置為建模對(duì)象,驗(yàn)證所提建模方法的有效性和實(shí)用性。該裝置的年生產(chǎn)能力為3×106t,其工藝流程如圖1所示?;?016年10月到2017年4月期間的實(shí)際運(yùn)行情況收集數(shù)據(jù)。從煉化廠的DCS系統(tǒng)中收集了51個(gè)工藝變量信息,包括溫度、壓力、流量、液位等信息,以及5個(gè)產(chǎn)品的流量信息,分別是干氣、液化氣、汽油、輕柴油和重柴油。由于建模目標(biāo)為預(yù)測(cè)產(chǎn)品收率,故通過(guò)以下計(jì)算公式將產(chǎn)品流量轉(zhuǎn)化為產(chǎn)品收率:
(14)
式中:yi表示第i個(gè)產(chǎn)品的收率,Fi表示第i個(gè)產(chǎn)品的流量,∑Ffeed表示總的原料流量。
此外,考慮到物料性質(zhì)對(duì)產(chǎn)品收率的重要性,從煉化廠的LIMS系統(tǒng)中收集了11個(gè)性質(zhì)變量,包括了原料性質(zhì)和催化劑性質(zhì)。因此,5個(gè)產(chǎn)品收率信息對(duì)應(yīng)于本次建模任務(wù)的目標(biāo)序列,其余62個(gè)變量信息則對(duì)應(yīng)于驅(qū)動(dòng)序列,數(shù)據(jù)收集情況見(jiàn)表1。
表1 數(shù)據(jù)收集情況統(tǒng)計(jì)Tab.1 Data collection statistics
由于DCS系統(tǒng)的分析頻次是10 min,而LIMS系統(tǒng)的分析頻次是24 h,存在數(shù)據(jù)不對(duì)齊問(wèn)題,此外還存在著數(shù)據(jù)缺失、離群點(diǎn)和噪聲等問(wèn)題,因此有必要進(jìn)行數(shù)據(jù)的預(yù)處理,其主要步驟為:(1)使用線性插值法對(duì)LIMS數(shù)據(jù)進(jìn)行擴(kuò)充,使之與DSC數(shù)據(jù)對(duì)齊;(2)使用三西格瑪規(guī)則檢測(cè)離群點(diǎn),檢測(cè)出的離群點(diǎn)標(biāo)記為新的缺失值,所有缺失值均使用線性插值法進(jìn)行填補(bǔ);(3)使用移動(dòng)平均法對(duì)數(shù)據(jù)進(jìn)行降噪;(4)對(duì)數(shù)據(jù)進(jìn)行歸一化處理;(5)使用滑動(dòng)窗口法構(gòu)造多元時(shí)間序列的監(jiān)督數(shù)據(jù)集,并按照時(shí)間先后順序進(jìn)行數(shù)據(jù)集劃分。
經(jīng)過(guò)以上步驟,共得到26 000條樣本,其中,22 000條作為訓(xùn)練集,2 000條作為驗(yàn)證集,2 000條作為測(cè)試集。為了進(jìn)一步觀察數(shù)據(jù)集之間的關(guān)系和差異,使用主成分分析法(PCA)[25]將數(shù)據(jù)集維度降低至二維,即PC-1和PC-2,并繪制出如圖3所示的數(shù)據(jù)分布圖。圖中訓(xùn)練集和驗(yàn)證集存在部分重疊,而測(cè)試集與前兩者幾乎沒(méi)有重疊,說(shuō)明數(shù)據(jù)集樣本間的差異隨時(shí)間推移越變?cè)酱?進(jìn)一步反映出催化裂化過(guò)程的時(shí)變性,即其運(yùn)行狀態(tài)隨著時(shí)間不斷發(fā)生變化。因此,按照時(shí)間先后順序劃分的數(shù)據(jù)集,有利于測(cè)試模型的外推能力。
圖3 經(jīng)PCA降維后的數(shù)據(jù)分布圖Fig.3 Data distribution after PCA dimensionality reduction
模型的超參數(shù)設(shè)置由網(wǎng)格搜索法確定,其中,時(shí)間步t為24,卷積核大小k為2,TCN網(wǎng)絡(luò)層數(shù)為4,TCN隱藏層單元數(shù)為48,BPNN隱藏層單元數(shù)為32,隨機(jī)失活率dropout為0.02,學(xué)習(xí)率為0.000 2,最大訓(xùn)練代數(shù)為5 000。以上工作中,所有程序均使用Python語(yǔ)言編寫(xiě)完成,并在macOS和Linux平臺(tái)上部署。其中,深度學(xué)習(xí)算法使用開(kāi)源深度學(xué)習(xí)框架Pytorch[36]實(shí)現(xiàn),并通過(guò)1個(gè)RTX-2080Ti GPU進(jìn)行訓(xùn)練。
3.2.1 模型預(yù)測(cè)結(jié)果
基于上述真實(shí)的催化裂化工業(yè)數(shù)據(jù),將所提建模方法分別應(yīng)用于干氣、液化氣、汽油、輕柴油和重柴油共5種產(chǎn)品的收率預(yù)測(cè)場(chǎng)景。圖4分別給出了模型訓(xùn)練與驗(yàn)證的損失函數(shù)值隨訓(xùn)練代數(shù)的變化趨勢(shì),可以觀察到,隨著訓(xùn)練代數(shù)的增加,每個(gè)場(chǎng)景下的模型訓(xùn)練與驗(yàn)證損失函數(shù)曲線均呈現(xiàn)出平穩(wěn)下降趨勢(shì),并最終收斂于0附近,說(shuō)明模型訓(xùn)練過(guò)程是穩(wěn)定且充分的,同時(shí)也證明不存在模型過(guò)擬合問(wèn)題。
圖4 模型訓(xùn)練與驗(yàn)證的損失函數(shù)值隨訓(xùn)練代數(shù)的變化Fig.4 Variation of loss function value of model training and validation with training times
模型預(yù)測(cè)值與實(shí)際工業(yè)值的對(duì)比如圖5所示,每一個(gè)場(chǎng)景都包含3個(gè)子圖,分別從不同的角度來(lái)進(jìn)行對(duì)比。在中間的時(shí)序圖中,預(yù)測(cè)值曲線和工業(yè)實(shí)測(cè)值曲線均保持緊密貼合,并且具有一致的發(fā)展趨勢(shì);在左上角的奇偶圖中,預(yù)測(cè)值和工業(yè)值均沿著對(duì)角線均勻分布,并且?guī)缀醵悸湓凇?%的誤差范圍內(nèi);在底部的殘差圖中,殘差沿著水平軸上下隨機(jī)分布,并且具有較小的震蕩幅度。3種子圖均說(shuō)明所提建模方法具有不錯(cuò)的預(yù)測(cè)表現(xiàn)。表2給出了模型的評(píng)價(jià)結(jié)果,對(duì)于5個(gè)不同的產(chǎn)品收率預(yù)測(cè)場(chǎng)景,模型評(píng)價(jià)指標(biāo)MAE均小于0.1,MSE均小于0.02,并且R2均超過(guò)了0.95,其中干氣、液化氣、輕柴油和重柴油的R2超過(guò)了0.98,說(shuō)明所提建模方法具有較高的預(yù)測(cè)準(zhǔn)確度。以上分析表明所提建模方法能充分挖掘催化裂化的過(guò)程信息,并將其準(zhǔn)確地映射到產(chǎn)品收率,同時(shí)也能很好地適應(yīng)于不同產(chǎn)品收率的預(yù)測(cè)場(chǎng)景。
表2 模型評(píng)價(jià)結(jié)果Tab.2 Model evaluation results
圖5 模型預(yù)測(cè)值與實(shí)際值的對(duì)比Fig.5 Comparison between predicted value of model and actual value
3.2.2 注意力機(jī)制的作用
注意力權(quán)重的高低與對(duì)應(yīng)位置信息的重要程度呈正相關(guān),高權(quán)重的輸入單元對(duì)于輸出結(jié)果具有決定性作用,因此可以通過(guò)時(shí)間注意力權(quán)重來(lái)表征輸入序列上每個(gè)時(shí)間步的重要性。考慮到汽油是催化裂化最重要的產(chǎn)品之一,本文以其收率預(yù)測(cè)場(chǎng)景為例,來(lái)說(shuō)明注意力機(jī)制在模型中的作用。圖6給出了基于訓(xùn)練集獲得的汽油注意力權(quán)重?zé)崃D,圖中每3天計(jì)算一次注意力權(quán)重的平均值,其數(shù)值的高低表現(xiàn)為熱力圖顏色的深淺。從該圖中可以觀察到,注意力權(quán)重從左至右呈現(xiàn)出遞增的趨勢(shì),并且高注意力權(quán)重主要集中在時(shí)間步17到24之間,說(shuō)明0到80 min內(nèi)的過(guò)程信息(1個(gè)時(shí)間步為10 min)對(duì)汽油收率預(yù)測(cè)的貢獻(xiàn)程度最大。這與現(xiàn)實(shí)中的經(jīng)驗(yàn)保持一致,即與預(yù)測(cè)目標(biāo)離得越近,特征的重要度會(huì)越高。然而,這種時(shí)間上的滯后性并不是保持固定不變的,從2016年10月到2017年3月中旬,注意力權(quán)重分布由向左集中逐漸變得分散,說(shuō)明在這段期間內(nèi)對(duì)汽油收率預(yù)測(cè)有重要影響的時(shí)間窗拉長(zhǎng)了。這種現(xiàn)象僅憑經(jīng)驗(yàn)是難以觀察到的,并且造成這種現(xiàn)象的原因可能非常復(fù)雜。一方面,催化裂化是動(dòng)態(tài)連續(xù)過(guò)程,其運(yùn)行狀態(tài)和操作模式本身就處于動(dòng)態(tài)變化之中,另一方面,原料波動(dòng)、設(shè)備故障、環(huán)境干擾等因素也可能會(huì)造成序列時(shí)滯性的變化。因此,注意力機(jī)制通過(guò)對(duì)不同時(shí)間步的重要性進(jìn)行定量分配,使模型在進(jìn)行信息提取過(guò)程中有效地捕捉到了序列時(shí)滯性的變化,進(jìn)而使得所提建模方法更加適用于復(fù)雜動(dòng)態(tài)系統(tǒng)的過(guò)程建模。
圖6 汽油收率預(yù)測(cè)場(chǎng)景的注意力權(quán)重?zé)崃DFig.6 Heat map of attention weight for gasoline yield prediction scenario
3.2.3 模型的競(jìng)爭(zhēng)性
為了進(jìn)一步驗(yàn)證所提建模方法(Attention-TCN)的合理性和可靠性,進(jìn)行了不同模型的對(duì)比試驗(yàn),對(duì)比模型包括Attention-TCN、TCN、Attention-LSTM和LSTM。所有模型均基于同一數(shù)據(jù)集,并且除模型搭建部分更換為對(duì)應(yīng)模型外,其余步驟均與第二部分介紹的研究方法保持一致。表3給出了不同模型的評(píng)價(jià)結(jié)果對(duì)比,可以看出,就MAE、MSE和R2表征的模型準(zhǔn)確性而言,Attention-TCN在5種產(chǎn)品收率預(yù)測(cè)場(chǎng)景下均優(yōu)于其他模型。從模型主體結(jié)構(gòu)來(lái)看,每個(gè)產(chǎn)品收率預(yù)測(cè)場(chǎng)景下的Attention-TCN均優(yōu)于Attention-LSTM,TCN均優(yōu)于LSTM,這種優(yōu)勢(shì)來(lái)源于TCN采用了先進(jìn)的并行卷積結(jié)構(gòu),從而具有更為強(qiáng)大的局部感知能力和記憶能力,而LSTM受限于其串行結(jié)構(gòu),在信息傳播過(guò)程更容易造成信息丟失。從是否應(yīng)用注意力機(jī)制來(lái)看,每個(gè)產(chǎn)品收率預(yù)測(cè)場(chǎng)景下的Attention-TCN均優(yōu)于TCN,Attention-LSTM均優(yōu)于LSTM,說(shuō)明注意力機(jī)制對(duì)于序列時(shí)滯性變化的捕捉,有效地增強(qiáng)了模型的預(yù)測(cè)性能。
表3 不同模型的評(píng)價(jià)結(jié)果對(duì)比Tab.3 Evaluation results of different models
本文提出了一種結(jié)合時(shí)間卷積網(wǎng)絡(luò)(TCN)、注意力機(jī)制和反向傳播網(wǎng)絡(luò)(BPNN)的催化裂化過(guò)程建模方法。利用某實(shí)際催化裂化裝置7個(gè)月的生產(chǎn)數(shù)據(jù)進(jìn)行案例研究,分別預(yù)測(cè)干氣、液化氣、汽油、輕柴油和重柴油的收率,研究結(jié)果證明了所提建模方法的有效性和實(shí)用性。與其他建模方法的對(duì)比表明,采用并行結(jié)構(gòu)的TCN比采用串行結(jié)構(gòu)的LSTM更加適用于催化裂化的時(shí)序建模,此外,注意力機(jī)制通過(guò)對(duì)不同時(shí)間步的重要性進(jìn)行定量分配,進(jìn)一步提升了模型的預(yù)測(cè)性能。綜上,本文所提出的建模方法具有較高的預(yù)測(cè)精度和競(jìng)爭(zhēng)性,并且能適應(yīng)于不同產(chǎn)品收率的預(yù)測(cè)場(chǎng)景。在未來(lái)的工作中,需要進(jìn)一步提高模型的敏捷性和計(jì)算效率,并將其應(yīng)用于催化裂化工藝的在線控制與優(yōu)化,從而進(jìn)一步提升催化裂化裝置的經(jīng)濟(jì)效益。