中國石油西南油氣田公司通信與信息技術(shù)中心 姚渝琪 杜 強(qiáng)
中國石油集團(tuán)安全環(huán)保技術(shù)研究院有限公司HSE信息中心 王志達(dá)
中國石油西南油氣田公司通信與信息技術(shù)中心 孫 韻 劉 新 胡顯成
隨著智能油氣田建設(shè)潮流和大數(shù)據(jù)時(shí)代的到來,某油氣田在勘探開發(fā)和日常生產(chǎn)運(yùn)行管控領(lǐng)域也開始迎來重要的發(fā)展契機(jī)與挑戰(zhàn)。大數(shù)據(jù)技術(shù)促進(jìn)了我國各個(gè)行業(yè)的發(fā)展,天然氣生產(chǎn)行業(yè)也面臨來自生產(chǎn)模式、數(shù)據(jù)分析及經(jīng)營決策等各方面的挑戰(zhàn)。本文結(jié)合天然氣生產(chǎn)信息化在某油氣田的應(yīng)用實(shí)例,展望大數(shù)據(jù)技術(shù)在油氣生產(chǎn)行業(yè)的應(yīng)用前景。
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,傳統(tǒng)油氣生產(chǎn)單井產(chǎn)量管理模式已逐漸落伍,為滿足油氣田高質(zhì)量生產(chǎn)和高質(zhì)量發(fā)展的目標(biāo),利用大數(shù)據(jù)技術(shù)促進(jìn)智能油氣田的建設(shè)。
某油氣田基于DCS數(shù)據(jù)和時(shí)間標(biāo)簽,成功實(shí)現(xiàn)了天然氣凈化廠脫硫溶液異常發(fā)泡工況的預(yù)警,并形成了一套不同于以往傳統(tǒng)思維的新解決方案,可為類似研究或項(xiàng)目的開展提供借鑒。
Baker Hughes公司利用油氣生產(chǎn)大數(shù)據(jù)技術(shù),結(jié)合英偉達(dá)公司高性能GPU技術(shù),實(shí)現(xiàn)對油氣行業(yè)海量數(shù)據(jù)的實(shí)時(shí)、快速提取,大大減少石油勘探、開發(fā)、運(yùn)輸、加工和銷售的成本。
常規(guī)方法:從現(xiàn)有理論方法中尋找解決問題的途徑,依賴于理論水平的認(rèn)識,通過不斷完善理論假設(shè)來提高實(shí)際應(yīng)用效果,其暴露出來的缺點(diǎn)是對方程運(yùn)算只能取用有限次項(xiàng),會(huì)湮滅數(shù)據(jù)中蘊(yùn)含的信息。如圖1所示。
圖1 常規(guī)方法解決問題思路圖
大數(shù)據(jù)方法:建立數(shù)據(jù)閉環(huán),隨著數(shù)據(jù)量與維度的增加,模型的水平與認(rèn)識會(huì)隨之提升。又因?yàn)槟P偷慕⑹且揽繑?shù)據(jù)中蘊(yùn)含的各種信息,所以模型可以不斷根據(jù)實(shí)際情況充分升級迭代。如圖2所示。
圖2 大數(shù)據(jù)方法解決問題思路圖
精確、合理地預(yù)測油氣田產(chǎn)量是油氣田開發(fā)規(guī)劃最主要工作,目的是保障氣藏在較為科學(xué)的生產(chǎn)運(yùn)行狀態(tài)下進(jìn)行生產(chǎn),減緩氣藏生產(chǎn)遞減趨勢,提升最終采收率。目前現(xiàn)場技術(shù)人員主要使用遞減曲線分析法、水驅(qū)曲線法和數(shù)值模擬法等產(chǎn)量預(yù)測方法來完成單井的配產(chǎn)工作,主要是利用物理實(shí)體特性以及相關(guān)理論研究?;诖髷?shù)據(jù)的遞減趨勢預(yù)測則是借助業(yè)務(wù)理論本身,更多的從數(shù)學(xué)統(tǒng)計(jì)學(xué)原理出發(fā),發(fā)現(xiàn)一個(gè)具體業(yè)務(wù)場景的客觀規(guī)律。
ARPS遞減模型:將生產(chǎn)井的產(chǎn)量遞減通過雙曲遞減、調(diào)和遞減及指數(shù)遞減等三種模式,估算出地質(zhì)可采儲(chǔ)量和產(chǎn)能預(yù)測結(jié)果。
FETKOVICH遞減模型:模型利用圖版擬合,分析產(chǎn)量遞減趨勢。
HSIEH遞減模型:該模型通過對各相滲透率的變化分析,通過利用時(shí)間—達(dá)西方程來計(jì)算儲(chǔ)層屬性的變化得出遞減率。
目前某油氣田公司在用的開發(fā)生產(chǎn)管理平臺(tái)以內(nèi)置ARPS算法模型的方式,作產(chǎn)量遞減分析,如圖3所示。
圖3 在用平臺(tái)產(chǎn)量遞減曲線擬合
目前主流的大數(shù)據(jù)分析算法主要有如下幾種:
(1)基于多層感知器(MLP):多層感知器是一種由多個(gè)的節(jié)點(diǎn)層所組成,前向結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)。
(2)卷積神經(jīng)網(wǎng)絡(luò)(CNN):卷積神經(jīng)網(wǎng)絡(luò)因?yàn)槠淠軌虬雌潆A層結(jié)構(gòu)對輸入信息進(jìn)行平移不變分類的能力,是用在圖像分類處理的主要算法之一。
(3)基于LSTM的序列分類:長短期記憶(Long short-term memory,LSTM)是一種為了解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題而衍生出來的特殊RNN算法,適合從歷史數(shù)據(jù)中尋找數(shù)據(jù)規(guī)律。
因?yàn)闅獠厣a(chǎn)過程有大量的時(shí)序歷史數(shù)據(jù),所以本次研究選擇LSTM算法作為預(yù)測算法。
2.3.1 數(shù)據(jù)準(zhǔn)備和清洗(1)數(shù)據(jù)收集:根據(jù)某油氣公司是有的油氣水井生產(chǎn)數(shù)據(jù)管理系統(tǒng),收集某生產(chǎn)區(qū)塊160口同生產(chǎn)層位的產(chǎn)出井歷史日數(shù)據(jù)。
(2)數(shù)據(jù)整理:篩選出每口井自噴生產(chǎn)時(shí)間段內(nèi)的連續(xù)數(shù)據(jù),并充分考慮在自噴生產(chǎn)過程中認(rèn)為調(diào)產(chǎn)的影響,共歸納出生產(chǎn)時(shí)長、最高油壓、平均油壓、最低油壓、最高套壓、平均套壓、最低套壓、日產(chǎn)氣量、日產(chǎn)水量以及針閥開度等10個(gè)維度的數(shù)據(jù)。
表1 維度分布表
(3)數(shù)據(jù)正規(guī)化:現(xiàn)實(shí)中的數(shù)據(jù)總是存在或多或少的缺失值現(xiàn)象,將數(shù)據(jù)集中的0或null等異常數(shù)據(jù)直接移除。
(4)數(shù)據(jù)歸一化:把數(shù)據(jù)統(tǒng)一變?yōu)?至1之間的小數(shù),消除數(shù)據(jù)量綱,使在梯度下降時(shí),模型可以更快收斂,同時(shí)防止數(shù)據(jù)梯度爆炸。
表2 部分?jǐn)?shù)據(jù)歸一化結(jié)果
2.3.2 基于滑動(dòng)窗口的LSTM分析
為解決LSTM對長時(shí)間序列預(yù)測誤差較大的問題,在測試集的數(shù)據(jù)輸入階段加入滑窗算法。
在經(jīng)過處理的數(shù)據(jù)基礎(chǔ)上,利用深度學(xué)習(xí)框架,如圖4所示,可見模型的準(zhǔn)確率和損失率隨迭代次數(shù)的增加有明顯的收斂過程,算法適應(yīng)性較好,如圖5和圖6所示。
圖4 基于滑動(dòng)窗口的LSTM分析模式
圖5 隨訓(xùn)練次數(shù)增加準(zhǔn)確率升高
圖6 隨訓(xùn)練次數(shù)增加損失率下降
利用訓(xùn)練好的模型,以三天為時(shí)間步長對某單井后十天的數(shù)據(jù)進(jìn)行了趨勢預(yù)測,得出預(yù)測值與真實(shí)值曲線對比如圖7所示,可看出紅色預(yù)測曲線基本與實(shí)際曲線的變化趨勢基本一致,都呈先增后減的形態(tài)。
圖7 預(yù)測值與真實(shí)值變化趨勢對比
利用大數(shù)據(jù)算法預(yù)測特定條件下的天然氣產(chǎn)量自然遞減趨勢相較于傳統(tǒng)方案的優(yōu)勢在用可以通過選取的數(shù)據(jù)范圍、數(shù)據(jù)維度等,有針對性的用歷史數(shù)據(jù)來描述預(yù)測對象,比用傳統(tǒng)工程經(jīng)驗(yàn)公式具有更好的適應(yīng)性。本次研究主要是針對特定區(qū)塊的特定生產(chǎn)層位,其儲(chǔ)層情況、產(chǎn)水特征等關(guān)鍵指標(biāo)都當(dāng)做靜態(tài)常量,無法在其他生產(chǎn)單元直接應(yīng)用。且基礎(chǔ)數(shù)據(jù)以日數(shù)據(jù)為主,模型描述精度還有較大可提升空間。