李玉春 李治東 李越 孟嵐 姚毅立 孫巍 成慶林 孫海英
1大慶油田設(shè)計(jì)院有限公司
2東北石油大學(xué)
3大慶油田有限責(zé)任公司第五采油廠
隨著信息技術(shù)的高速發(fā)展,工程上獲得數(shù)據(jù)的難度越來越低、手段越來越多、效率越來越高,從而導(dǎo)致信息數(shù)據(jù)庫的規(guī)模不斷增大,其復(fù)雜程度也持續(xù)增大,演變成為龐大復(fù)雜的信息數(shù)據(jù)體系[1-3]。因此有必要基于大數(shù)據(jù)平臺(tái),針對(duì)雙管摻水流程建立水力熱力回歸預(yù)測(cè)模型[4-6]。
目前,很多學(xué)者在管道預(yù)測(cè)方面進(jìn)行了大量研究。張青松利用人工神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性映射能力,建立了人工神經(jīng)網(wǎng)絡(luò)混油黏度預(yù)測(cè)模型,該方法誤差小,并能夠同時(shí)考慮溫度變化等因素的影響[7];高山卜利用BP神經(jīng)網(wǎng)絡(luò)建立輸油管道的能耗預(yù)測(cè)模型,其預(yù)測(cè)誤差不超過4.06%,為管輸能耗提供了新的預(yù)測(cè)方法[8];李建松建立灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)輸油管道運(yùn)行費(fèi)用進(jìn)行預(yù)測(cè),結(jié)果表明預(yù)測(cè)模型精度高,計(jì)算量小,收斂速度快[9];林冉用人工神經(jīng)網(wǎng)絡(luò)建立了管道耗能的預(yù)測(cè)模型,該模型的計(jì)算結(jié)果相對(duì)偏差在±5%以內(nèi),滿足工程實(shí)際需要,為預(yù)測(cè)管道的能耗總量提供了便利[10];李樹杉根據(jù)大數(shù)據(jù)思想,基于管道SCADA 系統(tǒng)提供的大量管道運(yùn)行歷史數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)構(gòu)建了管道預(yù)測(cè)模型,并用其替代傳統(tǒng)的管道數(shù)學(xué)模型,計(jì)算油品的溫度和壓力,求解能耗優(yōu)化的目標(biāo)函數(shù),得出優(yōu)化方案,提高了方案的準(zhǔn)確性和實(shí)用性[11]。
通過調(diào)研發(fā)現(xiàn),采用傳統(tǒng)理論公式計(jì)算得到的管道傳熱系數(shù)以及水力摩阻系數(shù)通常與現(xiàn)場(chǎng)實(shí)際情況不符[12-13],因此構(gòu)建了雙管摻水流程大數(shù)據(jù)平臺(tái)。運(yùn)用水力熱力基礎(chǔ)運(yùn)行參數(shù),通過python語言編程,分別建立了BP 神經(jīng)網(wǎng)絡(luò)管線傳熱系數(shù)和水力摩阻系數(shù)的預(yù)測(cè)模型,并通過迭代自修正權(quán)重和偏置,經(jīng)過參數(shù)的降維處理校正了傳統(tǒng)的計(jì)算公式,最終對(duì)所得出的預(yù)測(cè)模型進(jìn)行了驗(yàn)證,其滿足實(shí)際工程標(biāo)準(zhǔn),可以用來計(jì)算管線的節(jié)點(diǎn)參數(shù),為計(jì)算管線節(jié)點(diǎn)參數(shù)奠定了基礎(chǔ),也為后續(xù)的預(yù)測(cè)管線能耗提供了數(shù)據(jù)保障。
大數(shù)據(jù)平臺(tái)由三個(gè)數(shù)據(jù)集構(gòu)成:初始數(shù)據(jù)集、存儲(chǔ)數(shù)據(jù)集和應(yīng)用數(shù)據(jù)集。雙管摻水流程大數(shù)據(jù)平臺(tái)的特點(diǎn)是數(shù)量大、種類多、更新快、季節(jié)性明顯。數(shù)量大:數(shù)據(jù)“量的大小”是直接影響所建立預(yù)測(cè)模型準(zhǔn)確程度的主要因素之一,數(shù)據(jù)越多,預(yù)測(cè)模型的精度越高;種類多:如管道起點(diǎn)和終點(diǎn)壓力、起點(diǎn)和終點(diǎn)溫度、環(huán)境溫度、管線輸量等,通過多個(gè)參數(shù)得到多元預(yù)測(cè)模型,并向水力熱力理論公式靠攏,增強(qiáng)了預(yù)測(cè)模型的理論性;更新快:各基礎(chǔ)參數(shù)的采集采用數(shù)字化技術(shù),按設(shè)定頻次定時(shí)采集,不間斷更新;季節(jié)性明顯:管線各基礎(chǔ)參數(shù),尤其是熱力參數(shù)受季節(jié)變化影響較大,由于冬夏氣溫差異較大,管線運(yùn)行參數(shù)的變化也較為明顯。雙管摻水流程大數(shù)據(jù)平臺(tái)的結(jié)構(gòu)與特點(diǎn)如圖1所示。
圖1 大數(shù)據(jù)平臺(tái)結(jié)構(gòu)特點(diǎn)Fig.1 Structural characteristics of big data platform
基于傳統(tǒng)傳熱系數(shù)的計(jì)算方法,即軸向溫降基本公式,也稱作舒霍夫溫降公式[14],可以看出采出液溫度的變化受土壤環(huán)境溫度、管徑、管道長度、流量、采出液比熱容等參數(shù)的影響。舒霍夫溫降公式表達(dá)式為
式中:T2為管線終點(diǎn)溫度,℃;T0為環(huán)境溫度,℃;T1為管線起點(diǎn)溫度,℃;L為管道長度,m;a為參數(shù),無量綱;G為油井產(chǎn)液量,kg/s;C為井口采出液比熱容,J/(kg·℃);D為管道直徑,m;K為管道傳熱系數(shù)實(shí)際值,W/(m2·℃)。
由上式得出管線傳熱系數(shù)的基本公式(3)。
但在現(xiàn)場(chǎng)實(shí)際運(yùn)行過程中,不同管道的傳熱系數(shù)還與管道內(nèi)結(jié)蠟厚度、保溫層完整性、管道直徑、土壤溫度等數(shù)據(jù)相關(guān)。因此,僅通過理論公式的計(jì)算難以滿足現(xiàn)場(chǎng)的實(shí)際應(yīng)用,需要建立以油田數(shù)字系統(tǒng)為基礎(chǔ)的大數(shù)據(jù)平臺(tái),將難以直接測(cè)量的多組固定參數(shù)降維處理[15]。對(duì)于同一條管道來說,C、π、D、L等參數(shù)是固定不變的,因此將這些參數(shù)全部融合到新的參數(shù)A中,同時(shí),由于擬合管道傳熱系數(shù)的目的是計(jì)算管道終點(diǎn)的溫度,因此利用參數(shù)A、B將模型中的T2隱去,用新的回歸關(guān)系式的形式來表示簡化后的熱力模型為
式中:A、B均為待回歸參數(shù),無量綱。
在水力參數(shù)方面,主要針對(duì)水力摩阻系數(shù)進(jìn)行研究,水力摩阻系數(shù)是與起終點(diǎn)壓力、混輸流量、管道外徑和管道長度相關(guān)的參數(shù),將混輸水力模型簡化為與起點(diǎn)和終點(diǎn)壓力、流量相關(guān)的數(shù)學(xué)模型,如式(5),得到水力摩阻系數(shù)的理論公式,從而對(duì)此理論公式進(jìn)行修正,最后得出實(shí)際管線水力摩阻系數(shù)的回歸模型。
聯(lián)立式(5)與式(6)得
式中:λ為管線水力摩阻系數(shù);L為管道長度,m;D為管道內(nèi)徑,m;V為混合物平均流速,m/s;p1、p2分別為管線起點(diǎn)和終點(diǎn)壓力,MPa;Q為井口產(chǎn)液量,m3/s;g為重力加速度,m/s2;ρ為井口采出液密度,kg/m3。
同管道傳熱系數(shù),對(duì)于同一條管道來說,ρ、π、D、L等參數(shù)是固定不變的,因此將這些參數(shù)全部融合到新的參數(shù)A′中。同時(shí),由于擬合水力摩阻系數(shù)的目的是計(jì)算管道終點(diǎn)的壓力,因此利用參數(shù)A′、B′將模型中的p2隱去,用新的回歸關(guān)系式的形式來表示簡化后的水力模型為
式中:A′、B′均為待回歸參數(shù),無量綱。
由于Q的數(shù)量級(jí)較小,擬合后系數(shù)的數(shù)量級(jí)極小,因此將Q的單位改為m3/h后再進(jìn)行擬合。
雙管摻水流程水力熱力運(yùn)行參數(shù)的BP 神經(jīng)網(wǎng)絡(luò)模型具體搭建過程如下:
(1)建立大數(shù)據(jù)平臺(tái)。進(jìn)行收集數(shù)據(jù),數(shù)據(jù)預(yù)處理,大數(shù)據(jù)清洗、分類與儲(chǔ)存等。
(2)數(shù)據(jù)集劃分。從建立好的大數(shù)據(jù)庫中提取待預(yù)測(cè)的數(shù)據(jù)集,將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集。先用訓(xùn)練集訓(xùn)練模型,再通過測(cè)試集對(duì)訓(xùn)練的模型進(jìn)行測(cè)試,導(dǎo)入訓(xùn)練集數(shù)據(jù),檢驗(yàn)?zāi)P褪欠窈侠怼?/p>
(3)確定隱含層數(shù)及神經(jīng)元數(shù)。本項(xiàng)目在以往的BP 神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上進(jìn)行簡化,建立三層神經(jīng)網(wǎng)絡(luò)模型,設(shè)置單隱層,且該隱層僅設(shè)置一個(gè)神經(jīng)元,輸入層和輸出層也各含一個(gè)神經(jīng)元。
(4)設(shè)置超參數(shù)。設(shè)置神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)的學(xué)習(xí)率、迭代的總次數(shù)和輸出預(yù)測(cè)結(jié)果的步長。這些超參數(shù)決定了預(yù)測(cè)速度及結(jié)果的準(zhǔn)確度。
(5)構(gòu)造損失函數(shù)。以訓(xùn)練集中數(shù)據(jù)的預(yù)測(cè)值和實(shí)際值的二維歐式距離之和,即總誤差和最小構(gòu)造損失函數(shù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練模型。
(6)訓(xùn)練模型。根據(jù)初始設(shè)置超參數(shù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,通過BP 神經(jīng)網(wǎng)絡(luò)中的誤差反向傳播算法修正權(quán)重w和偏置b,直至損失函數(shù)達(dá)到最小值,認(rèn)為此時(shí)的w和b為該組數(shù)據(jù)集下最右的權(quán)重與偏置。
(7)得到預(yù)測(cè)模型。根據(jù)步驟(6)中預(yù)測(cè)得到的w和b,建立轉(zhuǎn)油站系統(tǒng)管線運(yùn)行水力熱力參數(shù)—管線傳熱系數(shù)和水力摩阻系數(shù)的預(yù)測(cè)模型。
(8)檢驗(yàn)?zāi)P汀?dǎo)入測(cè)試集數(shù)據(jù),通過預(yù)測(cè)的模型計(jì)算得出計(jì)算值,再與實(shí)際值進(jìn)行比較,檢驗(yàn)誤差結(jié)果是否在設(shè)置的運(yùn)行范圍內(nèi)。
模型具體搭建過程如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡(luò)模型流程Fig.2 BP neural network model flow
對(duì)大慶油田某計(jì)量間及其所轄6口采油井運(yùn)用上述搭建的BP 神經(jīng)網(wǎng)絡(luò)模型,采集超過700 組現(xiàn)場(chǎng)運(yùn)行數(shù)據(jù),訓(xùn)練管線傳熱系數(shù)和水力摩阻系數(shù),計(jì)算方程中的權(quán)重、偏置等參數(shù)。各管線傳熱系數(shù)與水力摩阻系數(shù)計(jì)算模型的訓(xùn)練結(jié)果見表1。
表1 各管線計(jì)算模型訓(xùn)練結(jié)果Tab.1 Training results of each pipeline calculation model
經(jīng)過以上步驟可以得出管線傳熱系數(shù)和水力摩阻系數(shù)的計(jì)算方程。為檢驗(yàn)計(jì)算方程的準(zhǔn)確性,通過計(jì)算預(yù)測(cè)值與實(shí)際值之間的偏差,從客觀數(shù)字的角度上分析預(yù)測(cè)結(jié)果的準(zhǔn)確性。引入平均相對(duì)誤差概念,平均相對(duì)誤差=,根據(jù)平均相對(duì)誤差的計(jì)算值是否在工程允許的范圍內(nèi)來判斷預(yù)測(cè)方程的可行性。通過實(shí)際值和預(yù)測(cè)方程得出的計(jì)算值來計(jì)算該組數(shù)據(jù)的平均相對(duì)誤差,繪制各訓(xùn)練結(jié)果的誤差曲線,來判斷預(yù)測(cè)方程的準(zhǔn)確程度。各管線傳熱系數(shù)與水力摩阻系數(shù)的相對(duì)誤差如表2所示,誤差曲線如圖3與圖4所示。
表2 各管線計(jì)算模型相對(duì)誤差Tab.2 Relative error of each pipeline calculation model
圖3 傳熱系數(shù)誤差曲線Fig.3 Error curve of heat transfer coefficient
圖4 水力摩阻系數(shù)誤差曲線Fig.4 Error curve of hydraulic friction coefficient
通過分析管線傳熱系數(shù)誤差曲線可以看出,存在一個(gè)新參數(shù)?=Gln(T1-T0),使得管線傳熱系數(shù)隨之變化。6口采油井的管線傳熱系數(shù)K*均隨著的?的增大而增大,呈線性關(guān)系。管線傳熱系數(shù)相對(duì)誤差最小的是井4,為2.186%,而相對(duì)誤差最大的是井1,為3.344%,均滿足工程計(jì)算所需的精度。
通過分析水力摩阻系數(shù)誤差曲線可以看出,存在一個(gè)新參數(shù)σ=,使得水力摩阻系數(shù)隨之變化。6口采油井集輸管線的水力摩阻系數(shù)λ*均隨著σ的增大而增大,呈線性關(guān)系。水力摩阻系數(shù)相對(duì)誤差最小的是井3,為3.564%,而水力摩阻系數(shù)相對(duì)誤差最大的是井4,為4.716%,均滿足工程計(jì)算所需的精度。
經(jīng)計(jì)算,各集輸管道的管線傳熱系數(shù)和水力摩阻系數(shù)的平均相對(duì)誤差均在工程允許的誤差范圍內(nèi),因此認(rèn)為此BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)于管線傳熱系數(shù)以及水力摩阻系數(shù)計(jì)算方程的預(yù)測(cè)準(zhǔn)確性高,回歸后的方程可以用于該計(jì)量間集輸管線的實(shí)際運(yùn)行參數(shù)計(jì)算。
構(gòu)建了雙管摻水流程大數(shù)據(jù)平臺(tái),通過python語言編程,建立了BP 神經(jīng)網(wǎng)絡(luò)管線傳熱系數(shù)和水力摩阻系數(shù)的回歸預(yù)測(cè)模型,并通過迭代自修正權(quán)重和偏置,經(jīng)過參數(shù)的降維處理校正了傳統(tǒng)的計(jì)算公式。對(duì)所建立的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行驗(yàn)證,發(fā)現(xiàn)大慶油田某計(jì)量間所轄6口井集輸管道的管線傳熱系數(shù)和水力摩阻系數(shù)的平均相對(duì)誤差均小于5%,滿足實(shí)際工程計(jì)算的精度,因此所建立的模型可以用來計(jì)算現(xiàn)場(chǎng)管道實(shí)際運(yùn)行參數(shù),也為各管段的節(jié)點(diǎn)計(jì)算以及后期的能耗預(yù)測(cè)分析打下了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。