• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于開源技術(shù)的FCC裝置產(chǎn)品收率預(yù)測BP神經(jīng)網(wǎng)絡(luò)模型

      2021-03-23 06:28:08苑丹丹高雪穎
      石油煉制與化工 2021年3期
      關(guān)鍵詞:個數(shù)收率神經(jīng)元

      劉 洋,苑丹丹,李 浩,高雪穎

      (中國石化工程建設(shè)有限公司,北京 100101)

      石化項目設(shè)計前期階段是從項目的立項到確認項目可行性并得到批準所做的工作。前期階段主要由工廠設(shè)計、技術(shù)經(jīng)濟、市場分析等專業(yè)的專家對業(yè)主提出的工程項目進行研究,根據(jù)進展深度可以分為機會研究、方案研究和可行性研究等,對裝置收率的估算是其中重要的一環(huán)。裝置收率估算需要專家的經(jīng)驗和專業(yè)科室的配合,但這種靠人工計算和經(jīng)驗推斷的傳統(tǒng)方法難以應(yīng)對信息時代石化項目設(shè)計前期階段越來越快的工作節(jié)奏和對方案變化、多方案比選、快速反應(yīng)、快速決策等越來越高的工作要求[1]。研究表明,在相對穩(wěn)定的情況下基于機器學習的數(shù)學模型對裝置收率的預(yù)測準確度超過人的經(jīng)驗推算[2]。因此,為了應(yīng)對時代發(fā)展的要求,項目設(shè)計前期階段可以利用BP神經(jīng)網(wǎng)絡(luò)模型等機器學習技術(shù)實現(xiàn)對裝置收率的快速估算,以便設(shè)計人員能夠快速地制定或修改方案,提高工作效率和工作質(zhì)量。本研究使用開源語言Python和PHP構(gòu)建一個適用于石化設(shè)計前期階段的BS架構(gòu)神經(jīng)網(wǎng)絡(luò)系統(tǒng),并開發(fā)針對MIP工藝流化床催化裂化裝置收率預(yù)測的組合BP模型。

      1 BP神經(jīng)網(wǎng)絡(luò)

      BP神經(jīng)網(wǎng)絡(luò)是由Rumelhar和McClelland[3-4]于1986年提出的以網(wǎng)絡(luò)誤差平方為目標函數(shù),并采用梯度下降法對目標函數(shù)進行優(yōu)化的多層前饋神經(jīng)網(wǎng)絡(luò)。因其具有自學習性、自組織性和推理能力強的特點,同時具備良好的非線性映射能力和柔性網(wǎng)絡(luò)結(jié)構(gòu),因而被廣泛應(yīng)用[5-6]。而在石化設(shè)計領(lǐng)域,BP神經(jīng)網(wǎng)絡(luò)與徑向基函數(shù)(RBF)、支持向量機(SVM)等機器學習模型也已被證明確實可以提高設(shè)計的效率和準確度[7-12]。

      BP算法在神經(jīng)網(wǎng)絡(luò)學習算法中具有十分重要的作用。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層3部分組成,每層由一個或多個神經(jīng)元構(gòu)成,其中輸入層神經(jīng)元個數(shù)與樣本數(shù)據(jù)中的特征變量個數(shù)一致,輸出層神經(jīng)元個數(shù)與預(yù)測目標個數(shù)一致。以流化床催化裂化(FCC)裝置為例,本研究使用中國石油化工股份有限公司(簡稱中國石化)2007—2019年MIP工藝裝置的193組工業(yè)匯編數(shù)據(jù),按照6∶2∶2分為訓練數(shù)據(jù)集、交叉驗證數(shù)據(jù)集(調(diào)整和選擇模型參數(shù))和測試數(shù)據(jù)集(模型性能評估)[8],經(jīng)過綜合考慮歐陽福生和趙媛媛等學者的研究中對FCC裝置主要特征變量的劃分[8-10]、中國石化內(nèi)部專家意見以及現(xiàn)階段所能取得的數(shù)據(jù)樣本的實際情況后,將與FCC裝置6個主要產(chǎn)品收率(干氣、液化氣、汽油、柴油、油漿、焦炭)相關(guān)的13個主要特征變量定為:4個原料性質(zhì)(密度、殘?zhí)?、Ni含量、V含量)、再生劑的微反應(yīng)活性指數(shù)、沉降器頂部壓力、提升管溫度、原料預(yù)熱溫度、預(yù)提升蒸汽量、汽提蒸汽量、再生器頂部壓力、密相段溫度、再生劑定碳。則FCC裝置產(chǎn)品收率模型中的特征變量個數(shù)為13,目標個數(shù)為6,即BP多層前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由13個輸入神經(jīng)元、6個輸出神經(jīng)元、q個隱藏層神經(jīng)元構(gòu)成,如圖1所示。

      圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

      (1)

      式中:bh表示隱藏層中第h個神經(jīng)元的輸出。由于石化裝置收率預(yù)測屬于回歸預(yù)測問題,本研究激活函數(shù)f使用ReLU分段線性函數(shù),ReLU函數(shù)屬于半線性、半非線性函數(shù),有助于網(wǎng)絡(luò)訓練,同時模型收斂較快,ReLU計算如式(2)所示。

      ReLU(x)=max(x,0)

      (2)

      進而計算網(wǎng)絡(luò)在(xk,yk)上的均方誤差(MSEk),如式(3)所示。

      (3)

      之后將誤差逆向傳播回到隱藏層,根據(jù)誤差調(diào)整隱藏層神經(jīng)元的連接權(quán)重和閾值。BP算法屬于迭代算法,直到達到預(yù)先設(shè)置的迭代次數(shù)或是最小誤差,模型停止訓練,得到訓練好的FCC裝置產(chǎn)品收率BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型。

      2 開發(fā)技術(shù)選擇和系統(tǒng)架構(gòu)

      2.1 開發(fā)技術(shù)選擇

      目前用于神經(jīng)網(wǎng)絡(luò)開發(fā)的主流工具包括MATLAB(矩陣實驗室)和以Python為代表的開源工具[13-18]。MATLAB是由美國Mathworks公司發(fā)布的針對科學計算、數(shù)據(jù)可視化、系統(tǒng)仿真,和交互程序設(shè)計的集成計算環(huán)境[19]。Python是誕生于20世紀90年代的開源腳本語言,多年來被廣泛應(yīng)用于機器學習等人工智能相關(guān)領(lǐng)域,已有Scikit-learn,Theano,TensorFlow,Keras等機器學習框架,為機器學習系統(tǒng)的開發(fā)提供了便利[20-22]。

      目前國內(nèi)石油化工領(lǐng)域利用神經(jīng)網(wǎng)絡(luò)進行裝置收率預(yù)測的研究主要采用MATLAB來實現(xiàn)[23-30],但工程公司在進行前期項目設(shè)計時需要考慮更多的客觀因素來選擇神經(jīng)網(wǎng)絡(luò)的實現(xiàn)工具。相對于裝置模擬等以研究為主導(dǎo)的開發(fā),前期項目的裝置產(chǎn)品收率預(yù)測更重視操作的簡便性,對后臺程序的高度封裝性,以及能夠快速地得到一組能夠直接用于輔助方案設(shè)計、可行性研究等前期工作的產(chǎn)品收率數(shù)值。因此使用MATLAB作為神經(jīng)網(wǎng)絡(luò)模塊的主要實現(xiàn)工具在前期項目裝置產(chǎn)品收率預(yù)測上會有一些不便之處[31-32]:①MATLAB軟件較大,而且較昂貴;②運行MATLAB模型必須安裝MATLAB運行環(huán)境,運行環(huán)境為免費,但如果服務(wù)器端僅安裝運行環(huán)境的話,則無法在服務(wù)器端進行模型修改后的重新生成和調(diào)試,增加了開發(fā)流程的步驟和復(fù)雜性;③MATLAB功能較為定項化,在應(yīng)用開發(fā)上不如Python等通用型語言靈活。

      基于以上原因,本研究選擇使用Python語言作為實現(xiàn)神經(jīng)網(wǎng)絡(luò)預(yù)測單元的主要實現(xiàn)工具。與MATLAB相比,Python可操作性更強,能夠靈活地調(diào)用模型并能與服務(wù)器端其他模塊實現(xiàn)快捷的數(shù)據(jù)交互傳輸,且開源免費,在服務(wù)器端部署開發(fā)環(huán)境較為方便,開發(fā)人員可以在同一開發(fā)語言環(huán)境內(nèi)完成模型的創(chuàng)建、修改和測試的全部流程。

      需要指出的是,利用Python語言可節(jié)約開發(fā)時間,具備一定的編程基礎(chǔ)和開發(fā)經(jīng)驗的開發(fā)人員可快速上手;而對于無編程背景者,使用Python或是R等純編程語言的開發(fā)成本可能會比使用MATLAB更高。

      2.2 整體平臺構(gòu)架

      基于兼顧方便性和易用性,本研究選擇使用Web開發(fā)領(lǐng)域的主流開源語言PHP搭建服務(wù)器端的系統(tǒng)平臺構(gòu)架,使用Python作為服務(wù)器端神經(jīng)網(wǎng)絡(luò)模塊的開發(fā)語言,充分發(fā)揮兩種語言各自的優(yōu)勢,節(jié)約配置及調(diào)試等步驟上所花費的時間。圖2為系統(tǒng)實現(xiàn)框架。

      圖2 系統(tǒng)實現(xiàn)架構(gòu)

      開發(fā)使用Python的Scikit-learn開源工具包[22],主要是基于Scikit-learn的以下特點:①涵蓋絕大部分主流機器學習算法,包括BP(MLP),RBF,Lasso等常用回歸算法;②為所有算法提供一致化的調(diào)用接口,便于開發(fā);③文檔齊全且更新及時。

      3 模型構(gòu)建

      3.1 整體設(shè)計思路

      BP神經(jīng)網(wǎng)絡(luò)在理論研究和技術(shù)實現(xiàn)上均較成熟,并有較強的非線性映射能力,而對于MIP工藝裝置收率預(yù)測,由于各特征變量與各主要產(chǎn)品收率的關(guān)聯(lián)度不同,部分特征變量對產(chǎn)品收率預(yù)測結(jié)果的影響存在著模糊界限,所以本研究通過對特定產(chǎn)品收率組(每個產(chǎn)品收率組包括6個主要產(chǎn)品收率中的一個到多個)所對應(yīng)的特征變量中進行特征選取和特征組合來獲得更理想的預(yù)測結(jié)果。同時,對于指定類型的裝置,與全廠設(shè)計相關(guān)的主要產(chǎn)品收率和與主要產(chǎn)品收率相關(guān)的特征變量經(jīng)過分析確認后就是相對固定的,變化的只是輸入的特征變量和輸出的裝置產(chǎn)品收率數(shù)值?;谝陨蠗l件,可以認為對于已確定主要產(chǎn)品收率的特定煉化裝置,對其確定的特征變量在理論上存在著最優(yōu)組合方案。

      3.2 網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)設(shè)置

      構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型的關(guān)鍵是隱藏層的層數(shù)以及神經(jīng)元個數(shù)的設(shè)置。隱藏層用于提取數(shù)據(jù)抽象特征,不與外界發(fā)生直接數(shù)據(jù)傳輸。隱藏層層數(shù)或神經(jīng)元個數(shù)多,訓練時間會長,同時容易出現(xiàn)過擬合現(xiàn)象;隱藏層層數(shù)或神經(jīng)元個數(shù)少,訓練時間短,但容易出現(xiàn)欠擬合、學習效果不佳等問題。本研究為找到最佳的隱藏層層數(shù)以及神經(jīng)元個數(shù)進行了多次試驗,比較網(wǎng)絡(luò)結(jié)構(gòu)含有單一隱藏層和兩層隱藏層以及不同隱藏層神經(jīng)元個數(shù)下的學習效果。對兩層隱藏層網(wǎng)絡(luò)中每層神經(jīng)元個數(shù)分別選擇(6,2),(7,2),(8,2)進行均方誤差(MSE)比較,結(jié)果見圖3(1)。單一隱藏層神經(jīng)元個數(shù)范圍為20~120,每次按照遞增10個神經(jīng)元進行試驗并比較MSE,結(jié)果見圖3(2)。從圖3可知:兩層隱藏層(7,2)的MSE較小;單層隱藏層神經(jīng)元個數(shù)為100時的MSE較小,且優(yōu)于兩層隱藏層情況。因此,本研究BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)按照13-100-6結(jié)構(gòu)進行搭建。

      圖3 隱藏層與MSE的關(guān)系

      BP網(wǎng)絡(luò)結(jié)構(gòu)中激活函數(shù)‘Identity’,‘Logistic’,‘Tanh’,‘ReLU’的MSE分別為1.43,1.39,1.31,0.68。根據(jù)測試結(jié)果,本研究選擇MSE最小的激活函數(shù)‘ReLU’。其他參數(shù)設(shè)置為:最大迭代次數(shù)5 000,學習率0.001,動量0.9。

      3.3 組合模型

      利用全部13個特征變量進行BP神經(jīng)網(wǎng)絡(luò)訓練生成的模型在此稱為原始BP模型。根據(jù)不同產(chǎn)品收率與各特征變量的相關(guān)性不同,針對每個產(chǎn)品收率,對特征變量進行選擇,分別對每個產(chǎn)品收率進行BP建模,并對這些對應(yīng)單項產(chǎn)品收率的BP模型進行組合得到組合BP模型[33]。研究表明[33-39],通過組合多個預(yù)測模型確實可以達到提高預(yù)測精度,取得比單一模型更好預(yù)測效果的目的。所以,本研究嘗試將FCC裝置的13個主要特征變量分為不同的特征組,構(gòu)建分別以這些特征組為輸入變量的神經(jīng)網(wǎng)絡(luò)模型,并根據(jù)這些模型的預(yù)測結(jié)果統(tǒng)計出針對具體產(chǎn)品收率的最佳特征模型。

      BP模型對特征縮放敏感,所以對輸入的特征變量進行了歸一化處理,采用離差標準化處理方式,將特征變量歸一化到0~1之間。歸一化采用式(4)計算。

      (4)

      式中:max表示某個特征變量最大值;min表示某個特征變量最小值;x表示原始特征變量值;x*表示歸一化后的特征變量值。

      利用Pyohon語言Scikit-learn模塊自帶的Preprocessing.minmax_scale方法對所有樣本中的特征數(shù)據(jù)進行歸一化。結(jié)果表明,歸一化后,神經(jīng)網(wǎng)絡(luò)模型的MSE、整體平均絕對值誤差、整體平均可釋方差、整體中值絕對誤差均有所降低,見表1。

      表1 特征歸一化前后誤差對比

      分析特征變量與收率之間的關(guān)系以及特征變量之間的關(guān)系,并由此對特征-目標收率進行分組,首先計算特征變量之間的Pearson相關(guān)系數(shù)[40-41],計算見式(5)。

      (5)

      式中:n表示樣本數(shù);xi和yi為樣本值;x′和y′為樣本均值。觀察計算結(jié)果,得到Ni含量和V含量的Pearson相關(guān)系數(shù)為0.626 2。

      根據(jù)Cohen的相關(guān)性強度判別規(guī)范[42],Ni含量和V含量之間的Pearson系數(shù)大于0.5屬于強相關(guān)屬性,存在多重共線性。如果Ni含量、V含量是否與預(yù)測目標的一個或幾個產(chǎn)品收率存在較強的關(guān)聯(lián)性,則Ni含量、V含量可能對構(gòu)建這幾個特定產(chǎn)品收率的預(yù)測模型有較大的作用,而對于組合模型中其他產(chǎn)品收率對應(yīng)的預(yù)測模型,Ni含量和V含量可以根據(jù)具體情況作出取舍和保留。

      對于特征變量與產(chǎn)品收率之間的關(guān)系,本研究采用Scikit-learn minepy包的最大信息系數(shù)(MIC)[43]表示。MIC采用尋找最優(yōu)離散化的方法,將最大互信息轉(zhuǎn)化為0~1的度量值,MIC比Person相關(guān)系數(shù)法更適合尋找變量間的非線性關(guān)系。以Ni含量、V含量為例,通過分析結(jié)果可以得到兩者在FCC裝置13個特征變量中對于每個特定產(chǎn)品收率的最大信息系數(shù)排名,結(jié)果見表2。

      表2 Ni含量、V含量對應(yīng)FCC裝置各主要產(chǎn)品收率的MIC排名

      基于多次試驗的結(jié)果篩選出每個輸出目標的特征變量如表3所示。由于干氣收率、油漿收率和焦炭收率對應(yīng)的特征變量相同,液化氣收率和柴油收率對應(yīng)的特征變量也相同,因此,本研究僅需訓練3個BP模型,并將模型進行組合實現(xiàn)對6個輸出目標的預(yù)測。表3為對應(yīng)每個輸出目標根據(jù)篩選出的特征變量需要建立的BP模型。組合模型 = [干氣(模型1),液化氣(模型2),汽油(模型3),柴油(模型2),油漿(模型3),焦炭(模型3)]。

      表3 特征篩選后輸出目標與特征變量對應(yīng)關(guān)系

      4 模型預(yù)測效果

      為了衡量模型的預(yù)測效果,分別比較了原始BP模型和組合BP模型的測試數(shù)據(jù)集預(yù)測結(jié)果的MSE,結(jié)果見表4。由表4可知,組合BP模型的整體MSE比原始BP模型小,說明組合BP模型預(yù)測的FCC裝置產(chǎn)品收率與真實值的偏差更小,預(yù)測結(jié)果更準確。

      表4 原始BP模型和組合BP模型的MSE對比

      雖然組合模型預(yù)測速率比獨立模型略低,但對于前期設(shè)計階段的決策支持而言這種速度上的差異(2 s以內(nèi))可以忽略不計。

      5 結(jié)論和建議

      使用神經(jīng)網(wǎng)絡(luò)模型等機器學習技術(shù)進行裝置產(chǎn)品收率預(yù)測具有成本低、反應(yīng)速度快的特點,對工程公司進行項目前期設(shè)計實現(xiàn)快速反應(yīng)、快速決策具有很強的現(xiàn)實意義。在操作條件基本不變的情況下,神經(jīng)網(wǎng)絡(luò)模型對裝置產(chǎn)品收率的預(yù)測準確度高于人為的經(jīng)驗判斷。同時,裝置產(chǎn)品收率預(yù)測機器學習模型的開發(fā),對于以業(yè)務(wù)為先導(dǎo)的設(shè)計機構(gòu)而言可以用相對較少的投入實現(xiàn)自主開發(fā),指導(dǎo)生產(chǎn)實踐,提高工程設(shè)計特別是項目前期設(shè)計人員的工作效率。

      通過計算特征變量之間Pearson相關(guān)系數(shù)、以及特征變量與主要產(chǎn)品收率間的最大信息系數(shù),可以對特征變量之間的關(guān)聯(lián)性及特征變量與收率之間的非線性關(guān)系進行統(tǒng)計分析,并以此為基礎(chǔ)構(gòu)建組合BP模型。測試結(jié)果表明,組合BP模型的預(yù)測效果優(yōu)于原始BP模型。

      機器學習模型的基礎(chǔ)是數(shù)據(jù)的積累,將預(yù)測模型部署在內(nèi)網(wǎng)服務(wù)器上可以保證模型的安全性、保密性和穩(wěn)定性,也便于對模型進行統(tǒng)一升級和更新。

      Python語言在人工智能領(lǐng)域有長期的發(fā)展歷史,對于機器學習的相關(guān)開發(fā)有各種已成型的方法庫;同時,相對于MATLAB而言,Python開源免費,而且更加靈活,更易于開發(fā)與系統(tǒng)其他模塊的相關(guān)接口,適合于迅捷的開發(fā)部署。

      后續(xù)研究將對RBF等更多的機器學習技術(shù)應(yīng)用于FCC裝置產(chǎn)品收率預(yù)測進行進一步的探索,并對其他煉化裝置進行產(chǎn)品收率預(yù)測研究,構(gòu)建以裝置為單元的模塊化全煉油廠裝置產(chǎn)品收率預(yù)測分析系統(tǒng)。

      猜你喜歡
      個數(shù)收率神經(jīng)元
      甲醇制芳烴的催化劑及其制備方法
      能源化工(2021年2期)2021-12-30 18:31:06
      《從光子到神經(jīng)元》書評
      自然雜志(2021年6期)2021-12-23 08:24:46
      怎樣數(shù)出小正方體的個數(shù)
      等腰三角形個數(shù)探索
      怎樣數(shù)出小木塊的個數(shù)
      怎樣數(shù)出小正方體的個數(shù)
      躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
      大數(shù)據(jù)分析技術(shù)在提高重整汽油收率方面的應(yīng)用
      基于二次型單神經(jīng)元PID的MPPT控制
      新型N-取代苯基-9-烷基-3-咔唑磺酰脲類化合物的合成及其抗腫瘤活性
      合成化學(2015年5期)2015-03-26 06:02:22
      霍邱县| 江西省| 都兰县| 郎溪县| 吴旗县| 青冈县| 兴隆县| 同仁县| 齐齐哈尔市| 东海县| 京山县| 星子县| 富民县| 柳河县| 上林县| 宜君县| 新化县| 牡丹江市| 洛宁县| 德格县| 交城县| 长乐市| 利川市| 岑巩县| 沽源县| 合山市| 宜良县| 获嘉县| 北京市| 东乌珠穆沁旗| 丰原市| 天水市| 丹凤县| 青岛市| 武宣县| 松阳县| 敦化市| 会理县| 闻喜县| 永吉县| 乌拉特后旗|