孫 瑋
中國石油華北油田分公司檢驗(yàn)檢測中心,河北任丘 062552
天然氣作為清潔能源,在我國實(shí)現(xiàn)“碳達(dá)峰”“碳中和”的目標(biāo)中占有重要地位[1]。在管輸氣貿(mào)易結(jié)算的過程中,常使用的計量方式有:體積計量、能量計量和質(zhì)量計量[2-3]。雖然能量計量是國際貿(mào)易中天然氣現(xiàn)貨和期權(quán)交易的通行手段,但受我國計量標(biāo)準(zhǔn)、計量技術(shù)、配套檢測技術(shù)和溯源性的影響,我國仍以體積計量為主,即計量單位時間內(nèi)流過標(biāo)準(zhǔn)孔板的天然氣流量。其中,天然氣壓縮因子計算結(jié)果的準(zhǔn)確性是影響貿(mào)易交接完備性的重要因素之一。
目前,關(guān)于壓縮因子的計算有實(shí)驗(yàn)法、圖版法和狀態(tài)方程法等3種。實(shí)驗(yàn)法的結(jié)果最為準(zhǔn)確[4],但存在測試周期長、實(shí)驗(yàn)費(fèi)用高的缺點(diǎn),現(xiàn)場天然氣組分多變,實(shí)驗(yàn)不可能覆蓋所有的工況條件;圖版法大多基于Standing-Katz 的標(biāo)準(zhǔn)圖版進(jìn)行回歸擬合[5],但當(dāng)混合氣體中含有重?zé)N組分或較多非烴組分時,誤差明顯增大,無法滿足工程需求;狀態(tài)方程法以GB/T 17747.2—2011 中推薦的AGA8-92DC 方程[6]和ISO 20765-2:2015 中推薦的GERG-2008方程為主[7],但在計算時需要已知天然氣的組分、溫度和壓力,天然氣組分需要通過在線或離線的氣相色譜分析儀獲取,這對于大多數(shù)的中間壓氣站而言,存在設(shè)備費(fèi)用昂貴的問題,通常壓氣站并不具備條件。隨著機(jī)器學(xué)習(xí)和計算機(jī)技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)已被廣泛應(yīng)用于持液率預(yù)測、兩相流流型預(yù)測和腐蝕速率預(yù)測等領(lǐng)域,但在壓縮因子計算上還鮮有報道。基于此,通過拉丁超立方抽樣獲取虛擬天然氣組分樣本,隨后以準(zhǔn)確度較高的GERG-2008 方程為基礎(chǔ),計算天然氣密度、熱值和壓縮因子,形成具有熱力學(xué)性質(zhì)的天然氣數(shù)據(jù)庫,最后搭建概率神經(jīng)網(wǎng)絡(luò)(PNN)模型用于數(shù)據(jù)的訓(xùn)練、驗(yàn)證和預(yù)測,并采用改進(jìn)的阿基米德優(yōu)化算法(IAOA)調(diào)整預(yù)測效果。研究結(jié)果可為未設(shè)置氣相色譜分析站點(diǎn)的壓縮因子計算提供新的思路和方法。
PNN 模型屬于前饋性神經(jīng)網(wǎng)絡(luò)的一種,其泛化和學(xué)習(xí)能力較強(qiáng),可用于非線性函數(shù)的回歸和固定模式的分類識別等領(lǐng)域。不同于其余神經(jīng)網(wǎng)絡(luò),PNN 的求和層采用群體競爭的方式,神經(jīng)元通過估計不同類別的概率,從而獲得競爭輸出的機(jī)會,最后一次迭代中僅有一個神經(jīng)元可以輸出。對于模式層,可通過式(1)計算特征向量與訓(xùn)練集中天然氣壓縮因子的相互關(guān)系。
式中:K為輸入特征向量;Wi為輸入層與模式層的權(quán)重;δ為光滑因子,是影響PNN 模型預(yù)測結(jié)果的重要參數(shù)。
優(yōu)化PNN 模型的重點(diǎn)在于尋找最優(yōu)的光滑因子,確保模型預(yù)測結(jié)果符合預(yù)期。
AOA 算法是由Hashim 等在2020 年提出[8],與其他元啟式優(yōu)化算法相似,該算法將流體中的物體視為種群,通過不斷調(diào)整個體的密度、體積和加速度,實(shí)現(xiàn)個體的狀態(tài)平衡,從而完成尋優(yōu)過程。雖然AOA 算法的設(shè)置參數(shù)少、模型簡單,但仍存在局部搜索能力較弱、尋優(yōu)精度較低的缺陷。AOA 算法的原理見文獻(xiàn)[9]。
在初始化種群階段,AOA 算法容易受到隨機(jī)分配的影響,發(fā)生群體聚集現(xiàn)象,這種形式不利于提高算法在解空間上的遍歷性。文獻(xiàn)[10]采用佳點(diǎn)集的方式獲得點(diǎn)分布序列,并將解序列映射到歐式空間。該方法的構(gòu)造與AOA 算法的維度無關(guān)。采用隨機(jī)法和佳點(diǎn)集法在二維種群上的初始化結(jié)果見圖1。在同樣生成100 個種群的條件下,采用佳點(diǎn)集方法產(chǎn)生的初始種群分布更為均勻,可提高搜索效率。
圖1 不同方法在二維種群上的初始化結(jié)果
在全局搜索和局部搜索階段,密度因子d對位置信息的更新起到關(guān)鍵作用,原始算法見式(2)。
式中:dt+1為t+1 次迭代時的密度因子,t為當(dāng)前迭代次數(shù),tmax為最大迭代次數(shù)。d隨迭代次數(shù)的增加近似呈線性遞減趨勢,這不利于算法的全局搜索和局部開發(fā)。因此,引入tan 函數(shù)進(jìn)行修正,見式(3)。對比兩種密度因子的變化趨勢,見圖2。改進(jìn)后密度因子先緩慢減小后快速降低,形成了動態(tài)自適應(yīng)調(diào)節(jié)極值,有利于保留更多的自身信息,平衡尋優(yōu)能力。
圖2 密度因子優(yōu)化對比
式中:dstart、dend分別為迭代開始、迭代結(jié)束時的初值,通過實(shí)驗(yàn)驗(yàn)證,得到dstart=2.7、dend=0.01 的效果較好;ω為控制曲線平滑程度的權(quán)值,取ω=4。
首先,調(diào)研目前國內(nèi)管輸氣的組成(見表1),利用拉丁超立方抽樣的采樣方式獲取10 000 個虛擬天然氣組分樣本,部分?jǐn)?shù)據(jù)見表2。以甲烷為例,具體步驟如下:其一,將(60,100)的區(qū)間分成10 000 段,在每一段中隨機(jī)抽取一個數(shù)值;其二,將抽取的數(shù)值通過標(biāo)準(zhǔn)正態(tài)分布反函數(shù)映射到標(biāo)準(zhǔn)正態(tài)分布;其三,利用Matlab 軟件中的sort函數(shù),打亂抽取樣本,形成數(shù)據(jù)集,同時保證所有組分的摩爾分?jǐn)?shù)之和為100%。此外,根據(jù)壓氣站的實(shí)際運(yùn)行情況,通過抽樣方式生成工況溫度和壓力,溫度范圍250~400 K,壓力小于等于20 MPa。
表1 管輸天然氣組成
表2 虛擬天然氣組分樣本數(shù)據(jù)
王國云等[10]、張鐠等[11]、王輝等[12]均證明了GERG-2008 狀態(tài)方程在計算天然氣物性上的優(yōu)越性,故后續(xù)采用該狀態(tài)方程計算壓縮因子、密度和熱值等熱力學(xué)參數(shù)。參照ISO 20765.2:2015 的公式、方法和流程編制計算程序,求解熱力學(xué)參數(shù)的迭代過程即為求解一階非線性方程,常用的方法有二分法、簡單迭代法、迭代加速法和Newton迭代法。以ISO 20765.2:2015 附錄G 中的Gas1、Gas2、Gas3 作為標(biāo)準(zhǔn)氣樣,通過對比附錄中的實(shí)驗(yàn)數(shù)據(jù)(以壓縮因子為例)驗(yàn)證不同求解方法的準(zhǔn)確性,見圖3。其中,二分法的計算結(jié)果與實(shí)驗(yàn)數(shù)據(jù)的吻合性較好,其余方法在某些溫度和壓力條件下出現(xiàn)了較大偏離,故后續(xù)采用該方法計算相關(guān)參數(shù)。
圖3 不同求解方法對比
將3.1 節(jié)得到的數(shù)據(jù)集按照8∶1∶1 的比例分為訓(xùn)練集、驗(yàn)證集和測試集。訓(xùn)練集用于訓(xùn)練模型超參數(shù),驗(yàn)證集用于預(yù)估模型性能和微調(diào)模型超參數(shù),測試集用于評估模型的泛化能力和最終性能。將溫度、壓力、密度和熱值等現(xiàn)場可測量參數(shù)作為PNN 模型的輸入,將壓縮因子作為PNN模型的輸出,并通過IAOA 算法對光滑因子進(jìn)行尋優(yōu)。在數(shù)據(jù)訓(xùn)練前,為消除量綱和數(shù)據(jù)取值范圍對預(yù)測結(jié)果的影響,先對數(shù)據(jù)進(jìn)行離散標(biāo)準(zhǔn)化處理,將其映射到[0,1]區(qū)間。
為驗(yàn)證IAOA 算法的優(yōu)越性,將其與AOA 算法、PSO(粒子群)算法和GWO(灰狼)算法進(jìn)行對比,以均方根誤差(RMSE)為適應(yīng)度函數(shù),對比不同算法在訓(xùn)練過程中的適應(yīng)度曲線變化情況,見圖4。其中,各算法的種群規(guī)模為30,空間維度為1,最大迭代次數(shù)為100,各算法的基本參數(shù)取值參照文獻(xiàn)[9]。IAOA 算法在迭代至25 次時即達(dá)到收斂狀態(tài),適應(yīng)度值最小為0.002 58;PSO 算法的適應(yīng)度值呈先降低后上下波動的趨勢,說明該算法已陷入局部最優(yōu)解的困擾,增加迭代次數(shù)才有收斂的可能;AOA算法和GWO算法分別在59次和61次時達(dá)到收斂狀態(tài),但適應(yīng)度值較IAOA 算法相比明顯偏大。綜上,IAOA 算法在收斂速度、訓(xùn)練精度和穩(wěn)定性上優(yōu)于其余算法,證明了算法改進(jìn)的必要性和合理性,此時的光滑因子取值為0.652 18。
圖4 不同算法的適應(yīng)度曲線
模型的訓(xùn)練、驗(yàn)證及預(yù)測結(jié)果見圖5。壓縮因子在訓(xùn)練集、驗(yàn)證集和測試集上的決定系數(shù)分別為0.999 7、0.998 9、0.998 4,RMSE 分別為0.002 58、0.007 56、0.008 51,所有數(shù)據(jù)均在回歸線附近分布,只有少量壓縮因子較低的數(shù)據(jù)發(fā)生了偏移,但偏移量較小,這種現(xiàn)象可能與虛擬組分中重?zé)N含量較高或溫度接近臨界凝析溫度等因素有關(guān)。
圖5 模型的訓(xùn)練、驗(yàn)證和預(yù)測結(jié)果
選取某輸氣管道上的3 個壓氣站為例進(jìn)行模型校驗(yàn),溫度測量采用Rosemount 214C 型傳感器,不確定度±0.1 ℃;壓力和流量測量采用Rosemount 2051CFP 型一體化孔板流量計,不確定度最高0.9%;密度測量采用橫河GD402G 型密度分析儀,當(dāng)溫度波動不超過10 ℃時,不確定度最高0.001 kg/m3;天然氣熱值通過SIEMENS SITRANS-CV型熱值分析儀獲取。將以上可測量參數(shù)輸入訓(xùn)練好的IAOA-PNN 模型獲得工況下的壓縮因子,同時結(jié)合工況流量QL,計算標(biāo)況流量Qb,以獲取實(shí)時在線的天然氣流量,現(xiàn)場布置的天然氣測量系統(tǒng)見圖6。
圖6 天然氣測量系統(tǒng)示意
將氣相色譜分析儀得到的天然氣組分和溫度、壓力作為已知參數(shù),代入GERG-2008 狀態(tài)方程求解壓縮因子,將該值作為實(shí)際值,與模型值進(jìn)行對比,結(jié)果見圖7(只標(biāo)出了前三個最大的組分含量)。實(shí)際值與模型值的曲線一致性較好,兩者的吻合程度較高;隨著壓力的增加,壓縮因子先減小后增大,在增大區(qū)間,壓縮因子與壓力呈線性關(guān)系,壓縮因子隨溫度的增加逐漸增大,但增大趨勢變緩,預(yù)測結(jié)果與Standing-Katz 標(biāo)準(zhǔn)圖版描繪的變化趨勢相符,再次證明了本文算法的有效性。此外,1#、2#、3#壓氣站的分子量分別為16.356、17.793 和19.091,雖然分子量逐漸增大,組分中除C1以外的重?zé)N含量逐漸增多,但從箱線圖(見圖8)中可知,相對誤差并沒有明顯增大,不同組分和溫度下的相對誤差始終維持在-1%~2%之間,說明IAOA-PNN 模型對于組分含量和工況的變化不敏感,可適用于大部分管輸氣的工況條件。
圖7 不同壓氣站上的現(xiàn)場校驗(yàn)結(jié)果
圖8 不同壓氣站的壓縮因子相對誤差箱線圖
考慮到現(xiàn)場實(shí)際工況中的溫度、壓力數(shù)據(jù)已并入SCADA 系統(tǒng)中,而密度和熱值并非必要測試項目,存在一定的數(shù)據(jù)缺失風(fēng)險。將本文模型定為IAOA-PNN-1 模型,將包含溫度、壓力和熱值數(shù)據(jù)的模型定為IAOA-PNN-2 模型,將包含溫度、壓力和密度數(shù)據(jù)的模型定為IAOA-PNN-3 模型。以1#壓氣站為例,觀察不同溫度下的相對誤差變化,見圖9。
圖9 不同參數(shù)模型下的壓縮因子相對誤差箱線圖
IAOA-PNN-2 模型的相對誤差范圍與IAOAPNN-1 模型相比略微增大,IAOA-PNN-3 模型的相對誤差范圍較其余模型有大幅增加,說明密度是影響算法精度和穩(wěn)定性的重要參數(shù)。在參數(shù)缺失的情況下,應(yīng)優(yōu)先保證現(xiàn)場具有監(jiān)測溫度、壓力和密度的儀器設(shè)備。
1)針對部分壓氣站未設(shè)置氣相色譜分析儀,無法獲取天然氣壓縮因子的現(xiàn)狀,以溫度、壓力、密度和熱值為可測量參數(shù),以壓縮因子作為未知參數(shù),通過拉丁超立方抽樣方式構(gòu)建虛擬天然氣組分樣本,將樣本代入IAOA-PNN 模型進(jìn)行訓(xùn)練和預(yù)測,得到一種簡便易行的壓縮因子計算方法。
2)IAOA算法在收斂速度、訓(xùn)練精度和穩(wěn)定性上優(yōu)于AOA 算法、PSO 算法和GWO 算法,證明了算法改進(jìn)的有效性和科學(xué)性。
3)通過在壓氣站進(jìn)行現(xiàn)場校驗(yàn),本文模型的相對誤差維持在-1%~2%之間,且對于組分含量和工況的變化不敏感,可適用于大部分管輸氣的工況條件。當(dāng)參數(shù)缺失時,應(yīng)優(yōu)先保證現(xiàn)場具有監(jiān)測溫度、壓力和密度的儀器設(shè)備。