黃 超,李 航,周 利,畢可鑫,戴一陽(yáng),李汶穎
(1.四川大學(xué)化工學(xué)院, 成都 610000;2.清華四川能源互聯(lián)網(wǎng)研究院, 成都 610000)
氫氣是石化工業(yè)的關(guān)鍵原料之一。近年來(lái),由于新的燃料電池的應(yīng)用,氫變得更加重要。現(xiàn)階段化工工業(yè)制氫主要依靠化石能源的重整,方法有水蒸氣重整、部分氧化、煤氣化和氨解等[1]。隨著我國(guó)提出2060 年達(dá)到碳中和的目標(biāo),綠氫技術(shù)開(kāi)始在國(guó)內(nèi)發(fā)展[2]。所謂綠氫,是指利用可再生的清潔能源產(chǎn)生電,再通過(guò)電解水得到氫氣。綠氫技術(shù)將間歇性、不穩(wěn)定性的清潔能源轉(zhuǎn)化成為具有能量和物質(zhì)雙重屬性的氫。
綠氫技術(shù)由于其在脫碳領(lǐng)域的優(yōu)勢(shì)[3-6],也會(huì)在未來(lái)的化工領(lǐng)域成為氫氣生產(chǎn)的主要手段。一方面,隨著天然氣、煤等能源價(jià)格逐年上升,會(huì)造成化工原料制造成本的上升。而隨著可再生能源發(fā)電價(jià)格持續(xù)降低,在未來(lái)原料氫的選擇上,綠氫比其他氫更具有成本優(yōu)勢(shì)。另一方面,電解水的生產(chǎn)規(guī)模已經(jīng)逐步擴(kuò)大,現(xiàn)有堿性(AEL)、陰離子交換膜(AEM)、質(zhì)子交換膜(PEM)和固體氧化物(SOEC)這4 種電解水技術(shù)[7-8]也愈加成熟。
對(duì)于化工工藝而言,用于化工生產(chǎn)的氫的產(chǎn)量必須達(dá)到噸級(jí)甚至萬(wàn)噸級(jí)以上,對(duì)應(yīng)到電解氫的商業(yè)化規(guī)模要達(dá)到MW 級(jí)甚至GW 級(jí)。目前只有堿性電解水技術(shù)可以通過(guò)集群的方式達(dá)到該規(guī)模,并且該技術(shù)成本最低,設(shè)備壽命更長(zhǎng),無(wú)疑是化工領(lǐng)域制氫技術(shù)最好的選擇。然而由于氫氣的爆炸極限廣(體積分?jǐn)?shù)范圍為4.0%~75.6%),堿性電解水技術(shù)操作彈性較低。在電解槽內(nèi),氣體很容易發(fā)生擴(kuò)散,尤其是氫側(cè)的氫氣更容易擴(kuò)散。氧中氫(HTO)為氧氣中氫氣所占體積比,其決定了設(shè)備安全操作的邊界。一般來(lái)說(shuō)當(dāng)HTO 值超過(guò)2%時(shí),設(shè)備強(qiáng)制停機(jī)[8]。因此對(duì)于AEL 水解中HTO 值的預(yù)測(cè)是工藝生產(chǎn)的關(guān)鍵。
許多學(xué)者提出了用氣體純度模型去預(yù)測(cè)HTO值。Haug 等[9-10]將電解槽視為兩個(gè)連續(xù)操作釜式反應(yīng)器(CSTR),考慮了操作條件,如電流密度、電解液流速、濃度、溫度以及工藝管理對(duì)于HTO的影響,提出了一個(gè)基于溶解度模型的堿水電解生產(chǎn)氣體純度預(yù)測(cè)模型,并通過(guò)自制的電解槽實(shí)驗(yàn)對(duì)模型進(jìn)行了評(píng)價(jià)。Kirati 等[11]在溫度(0~90 ℃)、壓力(0~3 MPa)、電流密度(24~600 mA/cm2)等操作條件下,提出了氣體純度的經(jīng)驗(yàn)公式。Sánchez 等[12]根據(jù)極化曲線、法拉第效率與電流密度的關(guān)系,在不同的溫度、壓力等操作條件下,以15 kW 堿性試驗(yàn)臺(tái)的數(shù)據(jù)為基礎(chǔ),采用非線性回歸的方法,用MATLAB 進(jìn)行參數(shù)非線性擬合,建立了預(yù)測(cè)堿水電解系統(tǒng)電化學(xué)行為的半經(jīng)驗(yàn)數(shù)學(xué)模型。
目前存在的氣體純度預(yù)測(cè)模型是經(jīng)驗(yàn)或半經(jīng)驗(yàn)的電解槽模型,沒(méi)有考慮系統(tǒng)層面的影響(整個(gè)制氫工藝除了電解槽外還包括輔助設(shè)備)。對(duì)于綠氫裝置還存在電源供給端功率變化幅度大、不穩(wěn)定的問(wèn)題,現(xiàn)階段的模型不能描述在功率波動(dòng)時(shí)系統(tǒng)的表現(xiàn)。在多變量耦合的電解水系統(tǒng)中,一個(gè)波動(dòng)的影響往往伴隨著多個(gè)參數(shù)變化,且對(duì)于不同電解槽設(shè)備,設(shè)備參數(shù)一旦發(fā)生變化,原有的模型很難反映真實(shí)的氣體純度。
HYSYS 模型[13]能夠?qū)崿F(xiàn)特定電解槽參數(shù)下的氣體純度預(yù)測(cè),但模型的遷移能力較差,且建立HYSYS 模型步驟繁瑣。為實(shí)現(xiàn)不同電解系統(tǒng)的氣體純度預(yù)測(cè),本文在HYSYS 工藝系統(tǒng)生產(chǎn)數(shù)據(jù)的基礎(chǔ)上,進(jìn)一步發(fā)展了基于主成分分析-人工神經(jīng)網(wǎng)絡(luò)(PCA-ANN)的氣體純度預(yù)測(cè)模型。該方法使用數(shù)據(jù)驅(qū)動(dòng)的方式,通過(guò)電解裝置運(yùn)行數(shù)據(jù)即可完成預(yù)測(cè),可普遍適用于各種電解槽設(shè)備氣體純度預(yù)測(cè)建模。
圖1 示出了一個(gè)典型的堿性電解水裝置。堿性電解水制氫技術(shù)采用堿性電解質(zhì)(KOH、NaOH)作為循環(huán)水,從電解槽陰陽(yáng)兩極出來(lái)的氣液混合相通過(guò)分離器分離氣體后經(jīng)堿液循環(huán)泵混合回流到電解槽中。氫氧分離器氣相出口處各有氣體檢測(cè)裝置。
圖1 堿性電解水裝置Fig.1 Alkaline water electrolysis system
在堿性水電解中,OH-負(fù)責(zé)電荷交換,當(dāng)電子轉(zhuǎn)移系數(shù)為2 時(shí),在電解槽陰陽(yáng)極發(fā)生的反應(yīng)如下:
根據(jù)實(shí)際堿性水電解裝置流程搭建的Aspen HYSYS 模型如圖2 所示。電解槽建模采用Aspen Custom Modeler (ACM)[14]工具搭建,其他裝置如泵(PUMP)、分離器(SEP)、換熱器(EXCHANGER)、混合器(MIXER)等均采用HYSYS 提供的內(nèi)置模塊單元。
圖2 堿性電解水系統(tǒng)Aspen HYSYS 模型Fig.2 Aspen HYSYS model of alkaline water electrolysis system
全流程模擬中,電解液(STACK-IN)進(jìn)入電解槽發(fā)生電解反應(yīng),從電解槽(STACK)出口的陰極物流(H2-STACK)和陽(yáng)極物流(O2-STACK)分別進(jìn)入氣液分離器SEP-H2和SEP-O2中并分離出其中的氣相產(chǎn)品后,將剩余液相部分經(jīng)混合器(MIX-100)混合后再經(jīng)循環(huán)泵(P-RCY)回流?;亓饕簻囟韧ㄟ^(guò)E-100 換熱器進(jìn)行控制。電解消耗的水由補(bǔ)水泵(PUMPH2O)提供,以保證系統(tǒng)質(zhì)量平衡。
由于Aspen HYSYS 不包括用于堿性水電解池堆棧建模的操作單元,因此本文使用ACM 將堿性水電解池堆棧模型作為子程序集成到Aspen HYSYS中,ACM 允許創(chuàng)建自定義操作單元,再將單元堆棧模型合并到整個(gè)流程,如圖3 所示。本文參考Sánchez[15]建立的電解槽模型,該模型包含了堿性電解小室的電化學(xué)模型和所有與堆棧中發(fā)生的質(zhì)量和能量平衡有關(guān)的方程,能夠預(yù)測(cè)堿水電解堆在不同操作條件(溫度T和壓力p)下的電化學(xué)行為。
圖3 使用ACM 搭建的電解槽操作單元模型Fig.3 Operating unit model of electrolytic cell built by ACM
電解槽模型的必要輸入?yún)?shù)包括電力輸入、電池?cái)?shù)量、電極的活性面積、堆棧溫度和操作壓力等。該堿性電解槽模型是半機(jī)理模型,基于與電解原理和一部分?jǐn)?shù)據(jù)擬合的質(zhì)量和能量平衡方程,以運(yùn)行工況參數(shù)為因變量,計(jì)算出電解過(guò)程的極化曲線、法拉第效率以及氫氣擴(kuò)散量,得到最終輸出陰陽(yáng)兩極氣體的產(chǎn)量與純度、電解過(guò)程中水的消耗量以及電解過(guò)程產(chǎn)熱量與熱損失量。
HYSYS 的輸入包含物流和設(shè)備的輸入。設(shè)備包括電解槽和其他輔助設(shè)備。ACM 模型電解堆棧由12 個(gè)表面積為1 000 cm2的雙極堿性電解電池組成,電解液循環(huán)流速固定為15 L/min。電解槽的基本參數(shù)見(jiàn)表1。其他輔助設(shè)備參數(shù)見(jiàn)表2。電解液參數(shù)見(jiàn)表3。溫度與壓力均隨設(shè)置的系統(tǒng)溫度、壓力變化。
表1 電解槽參數(shù)Table 1 Electrolytic cell parameters
表2 輔助設(shè)備參數(shù)Table 2 Auxiliary equipment parameters
通過(guò)HYSYS 模型運(yùn)行,輸出氫氣產(chǎn)品和氧氣產(chǎn)品的流量和組成(氧氣產(chǎn)品組成中,HTO 為后續(xù)模型訓(xùn)練的關(guān)鍵指標(biāo)值)。
設(shè)計(jì)裝置工作壓力為0.7 MPa,在模擬變工況生產(chǎn)時(shí),為保證操作區(qū)間盡可能大,本文將操作范圍適當(dāng)擴(kuò)大。電解水系統(tǒng)操作范圍如表4 所示。
表4 電解水系統(tǒng)操作范圍Table 4 Operating range of electrolytic water system
為保證模型產(chǎn)生的數(shù)據(jù)均勻覆蓋工作點(diǎn),本文通過(guò)Python Interface 操作HYSYS 模型,在恒定的工作功率下,調(diào)整系統(tǒng)的工作壓力和溫度產(chǎn)生數(shù)據(jù),再變功率采集不同工作點(diǎn)位數(shù)據(jù)。
本文使用Sánchez[15]電解水裝置生產(chǎn)的實(shí)驗(yàn)數(shù)據(jù)對(duì)模型進(jìn)行評(píng)價(jià),圖4 所示為HYSHS 模型驗(yàn)證。如圖所示,在55~75 ℃和0.5~0.9 MPa 下,HTO 隨電流密度的變化符合實(shí)驗(yàn)測(cè)量數(shù)據(jù)點(diǎn)的變化趨勢(shì),可以得出該HYSYS 模型數(shù)據(jù)具有一定的準(zhǔn)確性。
圖4 HYSYS 模型驗(yàn)證Fig.4 HYSYS model validation
PCA 是一種數(shù)據(jù)線性降維算法[16],最開(kāi)始應(yīng)用于人臉識(shí)別領(lǐng)域[17]。目前已經(jīng)廣泛應(yīng)用于化學(xué)計(jì)量學(xué)和化學(xué)信息學(xué)[18-19]。它可以將高維的數(shù)據(jù)映射到低維空間中,以方差最大為信息量保留的標(biāo)準(zhǔn),在降維的同時(shí)能夠比較好地保證原始數(shù)據(jù)的信息量。
堿性電解水工藝是電-熱-化學(xué)多變量耦合的系統(tǒng),從HYSYS 模擬中提取的數(shù)據(jù)維度較高,許多變量之間存在耦合關(guān)系。因此使用PCA 先處理數(shù)據(jù)集,保證信息量的同時(shí)可以減輕模型的負(fù)擔(dān)。
ANN 是對(duì)人腦或自然神經(jīng)網(wǎng)絡(luò)若干基本特性的抽象和模擬[20],通過(guò)神經(jīng)元的簡(jiǎn)單連接計(jì)算,模擬人類大腦中神經(jīng)系統(tǒng)的信息交互方式。目前ANN及其各種改進(jìn)網(wǎng)絡(luò)已經(jīng)廣泛用于工業(yè)、社科、分子研究等各種領(lǐng)域,可以用于策略優(yōu)化、裝置模擬、值預(yù)測(cè)等[21-26]。ANN 有強(qiáng)大的數(shù)據(jù)學(xué)習(xí)能力,本文將其應(yīng)用于堿性電解水裝置中HTO 值的預(yù)測(cè),建立了氣體純度預(yù)測(cè)模型。
ANN 的結(jié)構(gòu)如圖5 所示。人工神經(jīng)網(wǎng)絡(luò)擁有輸入層、隱藏層和輸出層。輸入的M個(gè)變量構(gòu)成向量后輸入隱藏層神經(jīng)元進(jìn)行計(jì)算并輸出。對(duì)于輸入的變量x∈R1×M,經(jīng)過(guò)人工神經(jīng)網(wǎng)絡(luò)計(jì)算后輸出變量Y∈R1×1。
圖5 人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Artificial neural network structure
本文輸入變量為各種變化操作參數(shù),如壓力、溫度、功率等。隱藏層含有N個(gè)神經(jīng)元。對(duì)于一個(gè)輸入向量x,在經(jīng)過(guò)隱藏層時(shí)乘以矩陣w,w∈RN×M,再加上偏置單元b0,b0∈R1×N。
權(quán)重矩陣W(W=wT)連接輸入層與隱藏層。在隱藏層的神經(jīng)元接收到了向量z后,神經(jīng)元進(jìn)行激活函數(shù)的計(jì)算。
激活函數(shù)將非線性特性引入到ANN 網(wǎng)絡(luò)中,讓ANN 能夠?qū)W習(xí)到非線性的數(shù)據(jù)特征。神經(jīng)元激活后的向量z',同樣需要乘以系數(shù)矩陣θ,再加上一個(gè)偏置單元b1,得到輸出層y。本文中輸出為電解水的HTO 值。
最終通過(guò)ANN 建立輸入和輸出的關(guān)系。
對(duì)于W、b0、b1、θ等參數(shù)則通過(guò)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練得到。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式為BP(Back Propagation)反向傳播[27]。BP 反向傳播首先通過(guò)ANN 的正向計(jì)算得到損失函數(shù)L,對(duì)損失函數(shù)反向求導(dǎo),用梯度下降來(lái)調(diào)整參數(shù)。對(duì)于k組訓(xùn)練數(shù)據(jù)(xi,yi)i=1,2···k,以常用的平方和作為損失函數(shù)L來(lái)介紹反向傳播過(guò)程。
其中:f代表ANN 正向計(jì)算函數(shù)。首先,需要對(duì)模型參數(shù)進(jìn)行初始化,通過(guò)正向計(jì)算得到損失函數(shù)值。然后,求出誤差函數(shù)關(guān)于神經(jīng)網(wǎng)絡(luò)自身變量(w,b0,b1,θ)的偏導(dǎo)數(shù),反向更新模型參數(shù),即梯度下降法[28]。
以上公式中的點(diǎn)表示矩陣點(diǎn)乘。當(dāng)偏導(dǎo)數(shù)求出后通過(guò)式(11)更新模型參數(shù)。
其中:r為模型訓(xùn)練設(shè)置的參數(shù)學(xué)習(xí)率,其決定了ANN 的訓(xùn)練速度和質(zhì)量。
如圖6 所示,本文模型主體部分是PCA-ANN 網(wǎng)絡(luò),它圍繞PCA-ANN 模型迭代過(guò)程,涉及了數(shù)據(jù)傳輸、數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型評(píng)價(jià)這4 個(gè)步驟。模型的原始數(shù)據(jù)來(lái)源于堿性電解水工藝模擬裝置,通過(guò)Python與HYSYS 服務(wù)器建立連接,將數(shù)據(jù)傳輸?shù)絇ython。由HYSYS 模型模擬產(chǎn)生的原始數(shù)據(jù)經(jīng)預(yù)處理后,將數(shù)據(jù)集劃分為80%訓(xùn)練集和20%測(cè)試集,用于后續(xù)模型訓(xùn)練。訓(xùn)練后的PCA-ANN 模型使用模型評(píng)價(jià)指標(biāo)對(duì)比分析,通過(guò)不斷地更新數(shù)據(jù)評(píng)估模型性能,以此更新線上預(yù)測(cè)模型。
圖6 PCA-ANN 模型框架Fig.6 Framework of PCA-ANN model
(1)評(píng)價(jià)指標(biāo)。PCA-ANN 模型為數(shù)值類預(yù)測(cè)模型,屬于回歸模型,用于對(duì)連續(xù)的實(shí)數(shù)值進(jìn)行預(yù)測(cè),并且使用平均絕對(duì)誤差(MAE)、均方差(MSE)、平方根誤差(RMSE)、決定系數(shù)(R2)作為評(píng)價(jià)標(biāo)準(zhǔn)。
(2)模型訓(xùn)練。人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)多樣,增加隱藏層和神經(jīng)元數(shù)量會(huì)影響網(wǎng)絡(luò)估計(jì)數(shù)據(jù)的精度。本文通過(guò)PCA 前后訓(xùn)練效果和不同結(jié)構(gòu)的ANN 對(duì)比分析,依據(jù)R2和MAE 值判斷模型預(yù)測(cè)效果,同時(shí)結(jié)合學(xué)習(xí)曲線分析模型是否出現(xiàn)過(guò)擬合現(xiàn)象,最終篩選出用于建模預(yù)測(cè)HTO 人工神經(jīng)網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)。
由于實(shí)際裝置在運(yùn)行的過(guò)程中HTO 不會(huì)超過(guò)4%,某些工作點(diǎn)位產(chǎn)生的數(shù)據(jù)會(huì)與實(shí)際數(shù)據(jù)存在差異,同時(shí)考慮到電解槽設(shè)計(jì)運(yùn)行工況區(qū)間較小,而操作范圍設(shè)置較廣,在操作邊界處可能會(huì)出現(xiàn)異常點(diǎn)和噪聲數(shù)據(jù),且當(dāng)工業(yè)數(shù)據(jù)作為輸入時(shí)預(yù)處理更加重要,因此需對(duì)HYSYS 生成的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理。
(1)對(duì)于真實(shí)的輸入數(shù)據(jù),采用箱線圖分析離群點(diǎn)數(shù)據(jù),篩除整體HTO 分布中的異常數(shù)據(jù)(離群點(diǎn)數(shù)據(jù)在HTO 分布箱線圖(圖7)中以綠色方塊表示)。
圖7 HTO 分布箱線圖Fig.7 Box plot of HTO distribution
(2)針對(duì)邊界處的數(shù)據(jù)趨勢(shì)進(jìn)行分析并篩除邊界異常點(diǎn)數(shù)據(jù)。選取邊界條件p=0.1 MPa 時(shí)HTO 隨溫度的變化趨勢(shì)進(jìn)行異常點(diǎn)位分析,如圖8 所示(圖中TSTACK為裝置運(yùn)行溫度),可以看到,當(dāng)裝置運(yùn)行溫度(TSTACK)為40 ℃時(shí)出現(xiàn)了HTO 異常值。采用邊界條件趨勢(shì)分析方法可以對(duì)邊界條件數(shù)據(jù)進(jìn)行數(shù)據(jù)清理。通過(guò)預(yù)處理后的數(shù)據(jù)再進(jìn)入模型進(jìn)行訓(xùn)練,能使模型具有更好的魯棒性。
圖8 HTO 隨溫度變化趨勢(shì)Fig.8 HTO changing trend with temperature
從HYSYS 流程中選取了12 個(gè)參數(shù)作為待輸入的預(yù)選參數(shù),主要包括:電解槽功率(PSTACK)、電解槽產(chǎn)熱(QGEN)、電池電壓(VCELL)、電解過(guò)程可逆電壓(VREV)、電流密度(I)、裝置運(yùn)行溫度(TSTACK)、循環(huán)泵功率(PRCY)、加水泵功率(PH2O)、裝置運(yùn)行壓力(pSTACK)、氫氣產(chǎn)量(FH2)、氧氣產(chǎn)量(FO2)、換熱器能耗(E100)。
用選取的12 個(gè)參數(shù)對(duì)HTO 進(jìn)行皮爾遜相關(guān)性分析[29],分析結(jié)果如圖9 所示。結(jié)果表明:(1)VREV、PH2O、QGEN對(duì)于HTO 的相關(guān)度為0,因此都可以忽略。(2)有兩組變量(FH2和FO2,PRCY和TSTACK)相關(guān)性較高,存在多重共線性,為避免模型過(guò)擬合,每組中剔除一個(gè)變量。
圖9 變量相關(guān)度分析熱力圖Fig.9 Variable correlation analysis of heat map
根據(jù)相關(guān)性分析結(jié)果,最終選取裝置運(yùn)行溫度、裝置運(yùn)行壓力、電解槽功率、電池電壓、電流密度、氫氣產(chǎn)量、換熱器能耗作為PCA-ANN 模型的輸入?yún)?shù)。
選取HYSYS 運(yùn)行過(guò)程的12 870 條數(shù)據(jù)訓(xùn)練模型。將篩選出的變量作為輸入,HTO 值作為輸出。由于HTO值為連續(xù)的數(shù)值,采用Python 機(jī)器學(xué)習(xí)庫(kù)Sklearn 提供的ANN 神經(jīng)網(wǎng)絡(luò)MLPRegression 進(jìn)行回歸訓(xùn)練。學(xué)習(xí)率選擇為0.000 6,優(yōu)化器選擇SGD(隨機(jī)梯度下降),正則化參數(shù)為0.001,損失函數(shù)為平方誤差損失函數(shù)。
首先對(duì)數(shù)據(jù)進(jìn)行PCA 降維處理。原始數(shù)據(jù)為7 維的數(shù)據(jù),采用PCA 算法進(jìn)行特征累積貢獻(xiàn)度計(jì)算,結(jié)果如圖10 所示。當(dāng)原始數(shù)據(jù)通過(guò)PCA將維度降低到4 維時(shí),累積特征貢獻(xiàn)度已經(jīng)達(dá)到了99%。這表明通過(guò)PCA 將維度降到4 維已經(jīng)能夠最大程度保留數(shù)據(jù)特征,并減少訓(xùn)練參數(shù)量。
圖10 PCA 特征累積貢獻(xiàn)度曲線Fig.10 PCA feature cumulative contribution curve
對(duì)比分析了增加PCA 頭部處理對(duì)神經(jīng)網(wǎng)絡(luò)性能的影響,結(jié)果如圖11 所示。隨機(jī)選擇5 組訓(xùn)練數(shù)據(jù)進(jìn)行對(duì)比,可以看到,增加PCA 頭部后,R2有明顯提升,說(shuō)明PCA頭部提取了有效特征,提升了模型的性能。
圖11 PCA-ANN 與ANN 效果對(duì)比圖Fig.11 Comparison of PCA-ANN and ANN effect
首先對(duì)比分析了不同隱藏層下,不同結(jié)構(gòu)PCAANN 模型的表現(xiàn),其評(píng)價(jià)指標(biāo)如表5 所示。
表5 不同隱藏層PCA-ANN 性能對(duì)比Table 5 PCA-ANN performance comparison of different hidden layers
對(duì)比模型深度對(duì)預(yù)測(cè)結(jié)果的影響,分別從隱藏層數(shù)為1、2、3、4 的PCA-ANN 網(wǎng)絡(luò)中選出3 個(gè)不同網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn),為防止隨機(jī)性造成的影響,每個(gè)模型訓(xùn)練10 次取最優(yōu)值。PCA-ANN 模型在只有1 層隱藏層時(shí),R2僅為0.500 0 左右。當(dāng)ANN 為2 層隱藏層時(shí),R2明顯提升,范圍大約為0.600 0~0.660 0,MAE、MSE 值也有所降低。當(dāng)模型深度加深為3 層時(shí),模型的預(yù)測(cè)效果進(jìn)一步提升,[6,6,6]網(wǎng)絡(luò)的R2更接近于1.000 0。模型深度為4 層時(shí)模型整體表現(xiàn)依然穩(wěn)定,但是與3 層模型相比,R2提升不夠明顯。綜合以上的數(shù)據(jù),選擇參數(shù)較少且表現(xiàn)最好的[6,6,6]為預(yù)測(cè)模型。
模型的損失曲線與交叉驗(yàn)證如圖12 所示。模型的損失曲線表明在樣本量達(dá)到7 000,訓(xùn)練批次epoch 為70 輪左右時(shí),模型已經(jīng)收斂,MSE 值穩(wěn)定在0.1 左右。交叉驗(yàn)證曲線中,訓(xùn)練集和交叉驗(yàn)證集Loss 值穩(wěn)步下降,表明模型沒(méi)有出現(xiàn)欠擬合和過(guò)擬合的情況。
圖12 模型的損失曲線與交叉驗(yàn)證Fig.12 Loss curve and cross validation of the model
當(dāng)不進(jìn)行數(shù)據(jù)清洗而直接預(yù)測(cè)時(shí),隨機(jī)選取了模型預(yù)測(cè)的2 574 個(gè)點(diǎn)與HYSYS 工藝數(shù)據(jù)進(jìn)行對(duì)比,結(jié)果見(jiàn)圖13。圖中越靠近黃色直線的點(diǎn)表明模型的預(yù)測(cè)結(jié)果越準(zhǔn)確。模型的預(yù)測(cè)結(jié)果表明,基于PCA-ANN 的氣體純度預(yù)測(cè)模型在大多數(shù)情況下可能會(huì)高估HTO 值,但誤差不超過(guò)0.2%。這樣的高估有助于避免安全問(wèn)題的發(fā)生,因此使用PCA-ANN 進(jìn)行預(yù)測(cè)的值是可以被采納的。
圖13 HYSYS HTO 與PCA-ANN HTO 對(duì)比圖Fig.13 Comparison of HYSYS HTO and PCA-ANN HTO
對(duì)邊界處進(jìn)行分析,在HTO 為2.2%~2.8%時(shí),會(huì)有少數(shù)點(diǎn)位的HTO 值被PCA-ANN 低估,選擇其中10 個(gè)預(yù)測(cè)較差點(diǎn)位進(jìn)行分析,結(jié)果見(jiàn)表6。從表中可以看出,PCA-ANN 與HYSYS 模型產(chǎn)值誤差較大時(shí)的點(diǎn)位均為壓力等于 0.1 MPa 的邊界工作點(diǎn),而沒(méi)有發(fā)現(xiàn)非邊界壓力條件下的異常預(yù)測(cè)點(diǎn)。分析結(jié)果表明,若不對(duì)HYSYS 模型在邊界處產(chǎn)生的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,會(huì)導(dǎo)致PCA-ANN 在邊界條件處預(yù)測(cè)效果差。篩除壓力邊界工作點(diǎn)的異常數(shù)據(jù)再次進(jìn)行訓(xùn)練,預(yù)測(cè)結(jié)果如圖14 所示,可以看出,模型的R2為0.950 7,較之前有明顯提升。
表6 預(yù)測(cè)較差點(diǎn)位的運(yùn)行工況Table 6 Operation conditions with poor prediction effect
圖14 數(shù)據(jù)清洗后HTO 對(duì)比圖Fig.14 Comparison of HTO after data cleaning
通過(guò)建立基于PCA-ANN 的氣體純度預(yù)測(cè)模型,預(yù)測(cè)了堿性電解水制氫過(guò)程中的關(guān)鍵指標(biāo)HTO,模型實(shí)驗(yàn)結(jié)果表明,機(jī)器學(xué)習(xí)算法對(duì)于堿性電解水系統(tǒng)氣體純度的預(yù)測(cè)結(jié)果比較準(zhǔn)確,MAE、MSE 值小,因此,以機(jī)器學(xué)習(xí)模型去預(yù)測(cè)制氫過(guò)程中氣體純度是可行的。用PCA-ANN 對(duì)電解水制氫過(guò)程中HTO進(jìn)行預(yù)測(cè),若不進(jìn)行數(shù)據(jù)清洗,則模型最佳決定系數(shù)R2大概介于0.490 0~0.720 0 之間,經(jīng)過(guò)數(shù)據(jù)集數(shù)據(jù)預(yù)處理后能夠達(dá)到0.950 7,模型表現(xiàn)良好。原始數(shù)據(jù)集質(zhì)量決定了模型的上限。綜上,對(duì)邊界操作條件處的數(shù)據(jù)清洗極為重要。
原始訓(xùn)練數(shù)據(jù)的7 個(gè)變量與HTO 值為強(qiáng)相關(guān)關(guān)系,但HTO 值還受堿液循環(huán)量、分離器分離效率、操作策略等因素的影響,在本模型中沒(méi)有對(duì)其他參數(shù)進(jìn)行參數(shù)調(diào)整和研究。