• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      智慧煉油廠生產(chǎn)數(shù)據(jù)處理算法及其在催化重整數(shù)據(jù)處理上的應(yīng)用

      2022-05-05 10:55:30王鑫磊
      石油煉制與化工 2022年5期
      關(guān)鍵詞:煉油廠重整芳烴

      苗 準(zhǔn),王鑫磊,張 蕾

      (中國石化石油化工科學(xué)研究院,北京 100083)

      隨著信息技術(shù)的發(fā)展應(yīng)用,現(xiàn)代煉油化工企業(yè)基本實現(xiàn)了生產(chǎn)裝置運行數(shù)據(jù)的實時采集、記錄與監(jiān)控,積累了海量數(shù)據(jù)。如何充分處理好、利用好生產(chǎn)大數(shù)據(jù),對優(yōu)化生產(chǎn)、提質(zhì)增效、建設(shè)智慧煉油廠具有重大意義,但也面臨不小的挑戰(zhàn)。每個煉油廠的生產(chǎn)數(shù)據(jù)采集位點數(shù)量各不相同,少則數(shù)千,多則數(shù)萬乃至數(shù)十萬;數(shù)據(jù)采集時間間隔也隨煉油廠、裝置和采集位點有所不同,多在數(shù)秒至數(shù)分鐘,對同一位點,其采集間隔有時也會有所波動;煉油廠生產(chǎn)裝置年均運行時間在8 000 h以上,總體上煉油廠生產(chǎn)大數(shù)據(jù)具有多位點、高頻率、長時間的特點,具備一定的復(fù)雜性。

      因此,工業(yè)數(shù)據(jù)處理是一項高度專業(yè)化、流程化、自動化的系統(tǒng)工程,面對如此海量的煉油廠生產(chǎn)大數(shù)據(jù),必須形成一套高效、專業(yè)、各裝置通用的處理方法。本課題針對煉油廠生產(chǎn)數(shù)據(jù)特點,研發(fā)設(shè)計智慧煉油廠生產(chǎn)數(shù)據(jù)處理分析通用標(biāo)準(zhǔn)流程,并將其形成SmartPec軟件工具包。通過其在催化重整裝置生產(chǎn)數(shù)據(jù)上的應(yīng)用,解決目前生產(chǎn)數(shù)據(jù)模型準(zhǔn)確性低、影響收率的關(guān)鍵要素難以確定、最優(yōu)化目標(biāo)難以實現(xiàn)等難題。

      1 數(shù)據(jù)處理分析總流程簡介

      針對煉油廠特點研發(fā)設(shè)計的數(shù)據(jù)處理分析通用標(biāo)準(zhǔn)流程,并形成SmartPec軟件工具包,如圖1所示。主要包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析、數(shù)據(jù)仿真、數(shù)據(jù)建模4大模塊。數(shù)據(jù)預(yù)處理模塊依次對煉油廠生產(chǎn)數(shù)據(jù)進行數(shù)據(jù)校驗、缺失值填補(可選)、數(shù)據(jù)清洗、離群點識別與去除。預(yù)處理后的數(shù)據(jù)可在數(shù)據(jù)分析模塊進行數(shù)據(jù)挖掘,該模塊集成了包括相關(guān)性分析、降維與可視化分析、聚類分析、差異特征分析等在內(nèi)的數(shù)據(jù)分析方法,既可以獨立運行,又可以按次序依次運行。此外,軟件包還具備數(shù)據(jù)仿真功能,當(dāng)數(shù)據(jù)樣本量不足時,該模塊可對差異特征分析的輸出結(jié)果進行數(shù)據(jù)分組仿真,實現(xiàn)數(shù)據(jù)的補充。另外,在數(shù)據(jù)建模模塊,SmartPec提供了廣義線性(GLM)模型和神經(jīng)網(wǎng)絡(luò)(NN)模型的構(gòu)建方法供選擇,并囊括了兩種模型的比較及應(yīng)用。

      圖1 SmartPec數(shù)據(jù)處理流程

      2 SmartPec各模塊介紹

      2.1 數(shù)據(jù)預(yù)處理

      SmartPec采用數(shù)據(jù)矩陣作為輸入,行是特征,即各數(shù)據(jù)采集位點或各種物化性質(zhì);列是樣本,一般是采集數(shù)據(jù)的時間點,各時間點可等間隔也可不等間隔。由于各煉油廠所用數(shù)據(jù)庫不同、數(shù)據(jù)格式各異,準(zhǔn)備工作難以編寫統(tǒng)一的處理程序,但其基本步驟都包括讀入數(shù)據(jù)、對齊(或平滑)時間點、統(tǒng)一缺失值格式。其目的是按照SmartPec對輸入數(shù)據(jù)的要求將數(shù)據(jù)規(guī)范化,建立統(tǒng)一的數(shù)據(jù)格式。

      2.1.1數(shù)據(jù)校驗

      數(shù)據(jù)校驗主要包括校驗數(shù)據(jù)中的常數(shù)行數(shù)與列數(shù)、缺失值數(shù)量、負數(shù)值數(shù)量等。該模塊的目的是在數(shù)據(jù)處理前,及時發(fā)現(xiàn)數(shù)據(jù)中的冗余數(shù)據(jù)、缺失數(shù)據(jù)與異常數(shù)據(jù),并提前進行處理。

      2.1.2缺失值填補

      處理缺失值的一種方法是缺失值填補,即依據(jù)已有數(shù)據(jù),按一定規(guī)則對缺失值進行預(yù)測和插補。其優(yōu)點是保持矩陣行列數(shù)不變,不會帶來額外的數(shù)據(jù)和信息損失;缺點是填補數(shù)據(jù)質(zhì)量存在未知性。SmartPec根據(jù)數(shù)據(jù)是否是等間隔時間序列數(shù)據(jù),采取線性插值法或鏈?zhǔn)椒匠潭嘣逖a法[1]兩種策略進行缺失值填補。

      2.1.3數(shù)據(jù)清洗

      處理缺失值的另一種方法是數(shù)據(jù)清洗,即按一定準(zhǔn)則刪除包含缺失值的行或列,從而達到消除缺失值的目的。其優(yōu)點是簡單快捷,且不會引入錯誤數(shù)據(jù)給后續(xù)分析帶來不利影響;缺點是需刪除整行整列數(shù)據(jù),會帶來額外的數(shù)據(jù)和信息損失。SmartPec包含一套專門設(shè)計的數(shù)據(jù)清洗算法,以窮舉打分的方式確定最優(yōu)的行列刪除方式,從而在刪除所有缺失值的同時盡可能多地保留矩陣中的數(shù)據(jù)。

      2.1.4離群點識別與去除

      離群點又叫歧異值或野值,是指顯著偏離總體均值的數(shù)據(jù)點。采樣誤差、記錄錯誤等原因都會產(chǎn)生離群點,它不僅直接影響模型擬合精度,甚至?xí)狗治龅贸鲥e誤結(jié)論。SmartPec包含一套專門設(shè)計的算法,通過計算每個樣本與其他樣本間距離來識別和去除數(shù)據(jù)中的離群點,并經(jīng)過多個煉油廠多套裝置的數(shù)據(jù)校合,有力保障了數(shù)據(jù)的正確性和后續(xù)分析的準(zhǔn)確性。

      2.2 數(shù)據(jù)分析

      2.2.1相關(guān)性分析

      特征間相關(guān)系數(shù)是相關(guān)性分析中最常用的量,SmartPec可計算所有特征對間相關(guān)系數(shù),并篩選出相關(guān)系數(shù)大于0.5和小于-0.5的強相關(guān)特征對,然后畫出相關(guān)系數(shù)熱圖。

      2.2.2降維與可視化分析

      煉油廠數(shù)據(jù)特征多、維度高,需降維以進行可視化和下游分析。SmartPec集成了常用的降維與可視化方法PCA[2](Principal Component Analysis,主成分分析)和t-SNE[3](t-distributed Stochastic Neighbor Embedding,t-分布隨機鄰域嵌入算法)。t-SNE是采用非線性隨機鄰域嵌入的一種機器學(xué)習(xí)算法,其主要思想是通過將高維空間中點與點間的歐氏距離轉(zhuǎn)換為條件概率來表征其相似性,進而使用這些概率分布在低維空間中進行點重構(gòu),因而更適合數(shù)據(jù)分類可視化,而PCA更多作為下游分析的輸入。

      2.2.3聚類分析

      SmartPec采用Elbow法確定聚類數(shù),以類內(nèi)平方和隨聚類數(shù)變化曲線的拐點作為最優(yōu)聚類數(shù)。為去除無關(guān)成分的干擾,SmartPec采用PCA主成分作為層次聚類法的輸入,并將t-SNE圖按聚類結(jié)果染色作為可視化輸出。聚類結(jié)果可用于對數(shù)據(jù)進行分類建模,有助于提高模型的擬合度和準(zhǔn)確性。

      2.2.4差異特征分析

      刻畫聚類結(jié)果各子類間差異的本質(zhì)是探測在各類間存在差異的特征,可定義為差異特征分析問題。SmartPec采用ANOVA[4](Analysis of Variance,方差分析)對每個特征進行多類樣本均值檢驗,當(dāng)結(jié)果顯著時,再多次使用T檢驗刻畫該特征在每對子類間均值的差異情況。最后,輸出差異特征分析匯總表,按差異由強到弱給出所有特征及其顯著性,并給出所有顯著差異特征的箱線圖。

      2.3 數(shù)據(jù)仿真

      數(shù)據(jù)建模一般需要較多樣本量,當(dāng)原始數(shù)據(jù)或子類樣本數(shù)較少時,建模效果難以保證。為解決這一問題,需依據(jù)已有樣本進行數(shù)據(jù)仿真產(chǎn)生更多樣本。整體來講,同類數(shù)據(jù)具有同一性,不同類數(shù)據(jù)具有差異性。進行仿真的前提是被仿真數(shù)據(jù)具有相似性或同一性,即一次仿真只能針對一個子類進行。在該前提下,可假設(shè)同類數(shù)據(jù)的同一特征在大量樣本中近似服從正態(tài)分布,不同特征服從不同參數(shù)的正態(tài)分布。此外,針對煉油廠數(shù)據(jù)可能存在的約束,例如百分比特征取值在0~100%之間、族組成數(shù)據(jù)(PONA)之和為100%等,SmartPec采用了截尾正態(tài)分布來控制每個特征的上下限,并設(shè)計了歸一化方法來確保多個特征之和為指定常數(shù)。

      2.4 數(shù)據(jù)建模

      數(shù)據(jù)建模廣泛用于目標(biāo)特征預(yù)測,例如,根據(jù)原料性質(zhì)、操作條件預(yù)測產(chǎn)品性質(zhì)。通常,先用訓(xùn)練數(shù)據(jù)建模和訓(xùn)練模型,再用測試數(shù)據(jù)測試準(zhǔn)確率達標(biāo)后,所建模型即可用于實際數(shù)據(jù)。廣義線性模型[5](Generalized Linear Model,GLM)是指用自變量對因變量進行廣義線性回歸訓(xùn)練出的預(yù)測模型。神經(jīng)網(wǎng)絡(luò)[6-7](Neural Networks,NN)模型是人工智能領(lǐng)域近年來的研究熱點。SmartPec實現(xiàn)了兩種方法在生產(chǎn)數(shù)據(jù)上的建模、訓(xùn)練、測試與應(yīng)用,并集成了模型比較功能。由于一次隨機劃分訓(xùn)練、測試樣本其結(jié)果難免有一定隨機性,為減小隨機性、反映真實情況,SmartPec中的模型比較功能采用K折交叉驗證。K折交叉驗證是指將所有樣本隨機等分為K份,用其中K-1份樣本作訓(xùn)練集、1份樣本作測試集得出預(yù)測結(jié)果和真實值的均方誤差(Mean-Square Error,MSE),循環(huán)K次,每次依次將1份樣本作測試集,其余K-1份樣本作訓(xùn)練集,最終MSE等于K個MSE的平均值,MSE均值越小代表模型準(zhǔn)確性越好。

      3 SmartPec在催化重整數(shù)據(jù)處理上的應(yīng)用

      3.1 大幅提高重整裝置數(shù)據(jù)建模預(yù)測準(zhǔn)確性

      芳烴收率是催化重整裝置的關(guān)鍵優(yōu)化目標(biāo)之一,要最大化芳烴收率,首先要對重整生產(chǎn)數(shù)據(jù)進行建模。使用某煉油廠2016—2019年催化重整裝置的運行數(shù)據(jù),用SmartPec數(shù)據(jù)處理流程對其進行數(shù)據(jù)預(yù)處理、降維和聚類分析,并分類建模。以重整進料性質(zhì)和操作條件為自變量、產(chǎn)品芳烴收率為因變量,SmartPec對聚類各子類隨機抽取90%樣本作為訓(xùn)練數(shù)據(jù)分別訓(xùn)練GLM和NN模型,其余10%樣本作為測試數(shù)據(jù),計算芳烴收率的建模預(yù)測結(jié)果和真實值的MSE,并進行10折交叉驗證來減小樣本抽取的隨機性,10折交叉驗證可參考2.4節(jié)中K折交叉驗證的定義。在不使用SmartPec流程進行數(shù)據(jù)預(yù)處理,直接全樣本建模時,GLM模型和NN模型的10折交叉驗證MSE分別為3.887和4.168,如圖2中實線所示。使用SmartPec流程進行數(shù)據(jù)預(yù)處理后,GLM模型的10折交叉驗證MSE均值為0.897,NN模型的10折交叉驗證MSE均值為0.489,如圖2中虛線所示。結(jié)果證明使用SmartPec流程建模可將GLM模型的MSE減小76.9%、NN模型的MSE減小88.3%,大幅提高了數(shù)據(jù)建模的準(zhǔn)確性。

      圖2 使用NN模型和GLM模型對催化重整數(shù)據(jù)建模的10折交叉驗證MSE●—NN; ▲—GLM

      此外,由于SmartPec的開發(fā)不針對單一裝置或煉油廠,這使得它的適用范圍非常廣,對于不同的數(shù)據(jù)類型及裝置類型,都可用SmartPec建立的標(biāo)準(zhǔn)流程處理分析進而提高數(shù)據(jù)建模準(zhǔn)確性。因此SmartPec不僅可以對催化重整裝置進行建模,還可以對其他各類煉化裝置具有廣泛的適用性與非常好的建模效果。

      3.2 準(zhǔn)確識別影響重整芳烴收率的關(guān)鍵要素

      催化重整裝置的芳烴收率與重整進料性質(zhì)和裝置操作條件密切相關(guān),找出影響重整芳烴收率的關(guān)鍵要素并按其重要性進行排序,不僅可以方便裝置操作人員對裝置整體運行狀況進行監(jiān)測,也可以通過對各項主要影響參數(shù)的分析和調(diào)節(jié),實現(xiàn)裝置的故障清除或優(yōu)化運行。圖3是某煉油廠2016—2019年催化重整裝置運行數(shù)據(jù)中芳烴收率的直方圖,為了劃分高低收率樣本,圖中給出了25%和75%分位數(shù)線,如圖3中紅色虛線所示,25%分位數(shù)線左側(cè)的305個樣本是低收率樣本,75%分位數(shù)線右側(cè)的305個樣本是高收率樣本。使用SmartPec的差異特征分析功能,對低收率樣本和高收率樣本進行分析,識別并給出了校正后p值小于0.01的差異特征排序,即為影響重整芳烴收率的關(guān)鍵要素。通過對數(shù)據(jù)進行分析,給出了影響芳烴收率的4個關(guān)鍵要素,分別是重整進料終餾點、平均相對分子質(zhì)量、C8環(huán)烷烴(C8N)含量以及脫丁烷塔回流量。圖4為芳烴收率和4個關(guān)鍵要素的關(guān)系,由圖4可見,重整進料終餾點、平均相對分子質(zhì)量、脫丁烷塔回流量與芳烴收率呈現(xiàn)負相關(guān),C8N含量與芳烴收率呈現(xiàn)正相關(guān),由此可指導(dǎo)工藝人員對重整芳烴收率進行優(yōu)化。

      圖3 某煉油廠催化重整裝置運行數(shù)據(jù)中芳烴收率

      圖4 SmartPec識別出的影響催化重整芳烴收率的4個關(guān)鍵要素

      此外,SmartPec不僅可以識別兩類樣本間的關(guān)鍵差異特征,更可以準(zhǔn)確識別多類樣本間的關(guān)鍵差異特征,應(yīng)用方式靈活多變;SmartPec在開發(fā)時充分考慮到各種異常輸入與提示,且在做好輸入控制的同時盡量包容各種可能的數(shù)據(jù)情況,能夠適應(yīng)煉油廠數(shù)據(jù)特點,穩(wěn)定性強。

      3.3 最大化重整芳烴收率

      SmartPec的數(shù)據(jù)仿真功能提供了最大化重整芳烴收率的計算方案。將本文3.2小節(jié)中,差異特征分析結(jié)果高芳烴收率組的參數(shù)作為輸入變量,使用SmartPec對高芳烴收率樣本進行仿真,仿真樣本量為10 000個;再將10 000個仿真樣本作為3.1小節(jié)中所建立的NN模型的輸入變量進行計算,結(jié)果表明,10 000個仿真樣本中最大預(yù)測芳烴收率為83.61%。此樣本對應(yīng)的原料性質(zhì)與主要操作條件參數(shù)即為重整最優(yōu)芳烴收率工況。

      研究結(jié)果表明,將數(shù)據(jù)仿真功能與數(shù)據(jù)建模功能相結(jié)合,實現(xiàn)了建模數(shù)據(jù)的快速獲取,提高了數(shù)據(jù)模型的適用性和準(zhǔn)確性。隨后利用所建立的模型篩選最優(yōu)化目標(biāo)變量或目標(biāo)函數(shù)的樣本參數(shù),給出的最優(yōu)化結(jié)果可作為煉油廠實際運行調(diào)參的依據(jù)之一。SmartPec軟件工具包對復(fù)雜的數(shù)據(jù)處理分析過程進行模塊化設(shè)計和實現(xiàn),用戶只需根據(jù)需求“搭積木”進行組合,簡單易用。此外,SmartPec還專門開發(fā)了對多線程并行計算的支持系統(tǒng),且支持Windows,Mac,Linux等多個平臺,方便快捷。

      4 結(jié) 論

      介紹了專用于處理煉油廠生產(chǎn)數(shù)據(jù)的通用標(biāo)準(zhǔn)流程程序包SmartPec,并測試了該軟件工具在催化重整數(shù)據(jù)處理上的應(yīng)用。SmartPec可將基于重整裝置運行數(shù)據(jù)建立的GLM模型的MSE減小76.9%、NN模型的MSE減小88.3%,大幅提高了重整裝置及煉油廠各類裝置數(shù)據(jù)建模預(yù)測準(zhǔn)確性,且具有適用范圍廣,通用性強的特點;SmartPec還具備一系列適用于煉油廠數(shù)據(jù)特點的數(shù)據(jù)挖掘和分析功能,準(zhǔn)確識別出了影響催化重整芳烴收率的4個關(guān)鍵要素,并可用于探測多類樣本間差異特征,應(yīng)用方式靈活,穩(wěn)定性強;SmartPec通過對某煉油廠催化重整裝置運行數(shù)據(jù)的數(shù)據(jù)分析、數(shù)據(jù)處理、模型訓(xùn)練和模擬計算,提供了芳烴收率最大化方案;最后,SmartPec軟件包可用于多種優(yōu)化任務(wù),簡單易用,方便快捷。

      猜你喜歡
      煉油廠重整芳烴
      信托公司在破產(chǎn)重整實務(wù)中的機會
      銀行家(2022年5期)2022-05-24 12:54:58
      關(guān)于重芳烴輕質(zhì)化與分離的若干思考
      ExxonMobil公司宣布將在2025年底投資更多的基礎(chǔ)油項目
      自動點火系統(tǒng)FCS在煉油廠火炬系統(tǒng)中的應(yīng)用
      電子測試(2017年15期)2017-12-18 07:19:00
      煉油廠節(jié)能減排儲氣柜設(shè)計及安裝
      輪胎填充油中8種多環(huán)芳烴的檢測
      高芳烴環(huán)保橡膠填充油量產(chǎn)
      環(huán)保型橡膠填充油中芳烴及多環(huán)芳烴組成研究
      中國石油工程建設(shè)公司承建的蘇丹煉油廠
      石油知識(2015年6期)2015-02-28 16:19:12
      醫(yī)患關(guān)系需重整“程序”
      贵州省| 马山县| 故城县| 来安县| 壶关县| 乌兰察布市| 南乐县| 张家港市| 崇州市| 长丰县| 湟源县| 铅山县| 延庆县| 南乐县| 简阳市| 建宁县| 米泉市| 泽州县| 渝北区| 招远市| 唐海县| 淮阳县| 库尔勒市| 东港市| 长垣县| 新和县| 海晏县| 贵南县| 榆树市| 双辽市| 白山市| 海城市| 宣城市| 焦作市| 织金县| 临湘市| 启东市| 普兰县| 田东县| 东兰县| 嘉黎县|