耿黎東
(中國石化石油工程技術(shù)研究院,北京102206)
隨著物聯(lián)網(wǎng)、云計(jì)算的快速興起和智能終端的快速普及,數(shù)據(jù)已經(jīng)滲透到各個(gè)行業(yè)和領(lǐng)域,逐漸成為重要的生產(chǎn)因素。數(shù)據(jù)特性逐漸向更大、更快和更復(fù)雜的方向演變和發(fā)展,催生了一個(gè)全新的概念——大數(shù)據(jù)。2011年,J. Mckinsey等人發(fā)布了《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個(gè)新領(lǐng)域》,對大數(shù)據(jù)的關(guān)注程度達(dá)到歷史新高[1]。
石油工程比以往更快的速度獲取了更大的數(shù)據(jù)量和更加多樣化的數(shù)據(jù),這些數(shù)據(jù)除了基于數(shù)以萬計(jì)的傳感器采集得到的數(shù)據(jù)外,還包含大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。鉆井、測井、錄井資料,生產(chǎn)數(shù)據(jù)和作業(yè)日志都可以快速添加為TB級甚至PB級的信息。油氣勘探開發(fā)的對象是不可見的地下巖石和流體,因此石油工程對數(shù)據(jù)的依賴性更強(qiáng)。與傳統(tǒng)信息技術(shù)相比,大數(shù)據(jù)技術(shù)對海量數(shù)據(jù)的分析和處理更為迅速和高效,可以提高決策的準(zhǔn)確性、及時(shí)性和全面性,對油氣的增儲上產(chǎn)和降本增效起到重要的推動作用。為此,筆者介紹了大數(shù)據(jù)的定義和特點(diǎn),分析了大數(shù)據(jù)技術(shù)在石油工程領(lǐng)域的應(yīng)用現(xiàn)狀,并提出石油工程大數(shù)據(jù)技術(shù)發(fā)展建議,以加速大數(shù)據(jù)技術(shù)在石油工程中的研究和應(yīng)用。
大數(shù)據(jù)技術(shù)目前并沒有教科書式的明確定義,互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)將其定義為基于高速的捕獲、發(fā)現(xiàn)和分析技術(shù),以經(jīng)濟(jì)的方式從超大規(guī)模數(shù)據(jù)中提取有價(jià)值信息的、一種全新的技術(shù)和構(gòu)架。大數(shù)據(jù)的核心意義不在于掌握龐大的數(shù)據(jù)量,而在于從海量的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)中提取出有效的數(shù)據(jù),經(jīng)過專業(yè)化處理獲取有價(jià)值的信息。以數(shù)據(jù)為本質(zhì)的大數(shù)據(jù)技術(shù)不僅是技術(shù)變革,更是理念、模式和應(yīng)用實(shí)踐的創(chuàng)新變革。
隨著油氣勘探開發(fā)的深入和石油工程技術(shù)的發(fā)展,石油公司已經(jīng)在勘探、地質(zhì)、測井、鉆井完井和開發(fā)等各個(gè)環(huán)節(jié)積累了海量數(shù)據(jù),為大數(shù)據(jù)技術(shù)的應(yīng)用奠定了良好的數(shù)據(jù)基礎(chǔ)。石油工程大數(shù)據(jù)除了具有大體量(vo lum e)、多樣性(variety)、時(shí)效性(velocity)、準(zhǔn)確性(veracity)和低密度價(jià)值(value)的5 V特點(diǎn)外[2],還具有獨(dú)特的特點(diǎn)。例如,鉆井完井過程產(chǎn)生的數(shù)據(jù)種類很多,包括鉆前工程數(shù)據(jù)、工程設(shè)計(jì)數(shù)據(jù)、施工記錄數(shù)據(jù)、工程參數(shù)測量數(shù)據(jù)、測井?dāng)?shù)據(jù)和工程管理數(shù)據(jù)等;數(shù)據(jù)形態(tài)各異,包括各類靜態(tài)結(jié)構(gòu)化表格、非結(jié)構(gòu)化的視頻和圖片以及各類工業(yè)數(shù)據(jù)格式標(biāo)準(zhǔn);數(shù)據(jù)體量變化幅度大,傳統(tǒng)測井方法的8項(xiàng)測井?dāng)?shù)據(jù)量約為1Mb/m,而聲波測井、成像測井等新型測井方法中的一項(xiàng)測井參數(shù)數(shù)據(jù)量就可達(dá)到1Gb/m以上;數(shù)據(jù)可管理性差,各類鉆井完井?dāng)?shù)據(jù)生成周期不同、采集方式各異,難以用統(tǒng)一的數(shù)據(jù)模型容納所有的鉆井完井?dāng)?shù)據(jù)。數(shù)據(jù)采集、傳輸?shù)钠款i問題突出,目前油田現(xiàn)場采集設(shè)備還無法達(dá)到高精度、快速采集的要求,常用的井下數(shù)據(jù)無線傳輸方式傳輸速率低、可靠性差,有線傳輸方式雖然傳輸速度快,但存在設(shè)備開發(fā)成本高、制造工藝復(fù)雜等缺點(diǎn)。
近年來,國際油價(jià)低迷已成為新常態(tài),石油企業(yè)利潤大幅降低,如何利用大數(shù)據(jù)技術(shù)降低油氣勘探開發(fā)成本和提高勘探開發(fā)效率已成為油公司和油服公司發(fā)展的新突破點(diǎn)。相比互聯(lián)網(wǎng)、航空和電子商務(wù)等行業(yè),石油和天然氣行業(yè)大數(shù)據(jù)技術(shù)的研究、應(yīng)用起步較晚,目前國內(nèi)外公司正在嘗試將大數(shù)據(jù)技術(shù)應(yīng)用于石油工程中,并取得了一定進(jìn)展。
2.1.1 國外
為了促進(jìn)多部門協(xié)同工作和生產(chǎn)運(yùn)營的一體化,國外大型油公司紛紛推出大數(shù)據(jù)分析平臺。康菲公司經(jīng)過近20年的發(fā)展,形成了IDW(integrated data warehouse)大數(shù)據(jù)分析平臺(見圖1)。
圖1 康菲公司IDW大數(shù)據(jù)平臺發(fā)展歷史Fig.1 The development history of IDW big data p latform of ConocoPhillips
IDW是一個(gè)涉及多學(xué)科的集中式大數(shù)據(jù)存儲中心,可存儲分析包括地球科學(xué)、鉆完井、油藏工程、生產(chǎn)、運(yùn)營、財(cái)務(wù)等方面的數(shù)據(jù)(見圖2)[3]。其精髓在于將具有不同功能的數(shù)據(jù)倉庫整合起來,實(shí)現(xiàn)跨功能集成。不同業(yè)務(wù)部門的數(shù)據(jù)真正實(shí)現(xiàn)一體化存儲、管理和分析,數(shù)據(jù)的體量、多樣性、傳輸速度和質(zhì)量均有了大幅提升,顯著提高了獲取有效信息的效率。此外,IDW要求每個(gè)業(yè)務(wù)部門都采用一體化的運(yùn)營方法來組建業(yè)務(wù)和信息技術(shù)多學(xué)科團(tuán)隊(duì),建立了新的工作方式。IDW主要采用Teradata數(shù)據(jù)庫技術(shù)和PPDM數(shù)據(jù)模型,以Spotfire為數(shù)據(jù)分析工具,Informatica為ETL工具??捣乒疽舱趪L試將認(rèn)知分析和人工智能等新興數(shù)據(jù)分析方法應(yīng)用到IDW中。美國Eagle Ford頁巖氣開發(fā)過程中,采用IDW大數(shù)據(jù)平臺進(jìn)行數(shù)據(jù)分析后,每臺鉆機(jī)平均鉆探量增加了80%,每口井的平均鉆井時(shí)間從一個(gè)月縮短至12 d。
圖2 IDW集中式數(shù)據(jù)存儲中心Fig.2 IDW centralized data storage center
科威特國家石油公司構(gòu)建了基于數(shù)據(jù)分析和人工智能的地面地下一體化油田智能工作平臺,用于油田中長期產(chǎn)量預(yù)測、注水優(yōu)化及生產(chǎn)參數(shù)優(yōu)化。其工作流程為:1)采用節(jié)點(diǎn)分析、虛擬計(jì)量等方法,利用數(shù)字化工具記錄生產(chǎn)歷史;2)采用蒙特卡洛、線性回歸等方法,利用統(tǒng)計(jì)分析工具監(jiān)測實(shí)時(shí)生產(chǎn)狀況;3)采用神經(jīng)網(wǎng)絡(luò)、模糊邏輯等人工智能方法進(jìn)行短期產(chǎn)量預(yù)測;4)應(yīng)用數(shù)值模擬進(jìn)行中長期產(chǎn)量預(yù)測??仆貒沂凸竟緫?yīng)用該系統(tǒng)后油氣產(chǎn)量明顯提高,支撐了該公司至2030年日產(chǎn)油量400×104bbl的戰(zhàn)略目標(biāo)[4–5]。
國外大型油服公司通過建立大數(shù)據(jù)平臺,旨在增強(qiáng)多學(xué)科互通,實(shí)現(xiàn)工程技術(shù)一體化。2003年開始,斯倫貝謝公司著手整合勘探開發(fā)生產(chǎn)的16個(gè)數(shù)字化應(yīng)用程序,將大數(shù)據(jù)分析、人工智能和物聯(lián)網(wǎng)等多個(gè)技術(shù)領(lǐng)域的優(yōu)勢集中,在微軟Azure云平臺上開發(fā)了DELFI勘探開發(fā)認(rèn)知環(huán)境信息平臺(見圖3)[6]。DELFI整合了各類計(jì)劃、作業(yè)程序和軟件,存儲全部歷史數(shù)據(jù)資料,為各類專業(yè)操作系統(tǒng)和程序提供接口,目的是實(shí)現(xiàn)斯倫貝謝公司業(yè)務(wù)的數(shù)字化轉(zhuǎn)型,為油氣勘探開發(fā)生產(chǎn)提供低成本、高效率的專業(yè)化生態(tài)系統(tǒng)。通過利用大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和物聯(lián)網(wǎng)等最新的數(shù)字化技術(shù),DELFI將地球物理、油藏工程、鉆井完井工程和采油工程等多學(xué)科知識交互融合,真正實(shí)現(xiàn)了技術(shù)一體化。
圖3 斯倫貝謝DELFI大數(shù)據(jù)平臺發(fā)展歷史Fig.3 The development history of Schlumberger’s DELFI big data p latform
貝克休斯公司依托通用電氣的Predix工業(yè)互聯(lián)網(wǎng)平臺,借助先進(jìn)的數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)分析算法和云計(jì)算技術(shù),對海量的工程作業(yè)和生產(chǎn)運(yùn)營數(shù)據(jù)進(jìn)行統(tǒng)一分析和優(yōu)化,打破了數(shù)據(jù)信息之間的壁壘,并通過應(yīng)用程序?qū)F(xiàn)場情況和決策方案進(jìn)行可視化展現(xiàn)[7]。哈里伯頓與微軟合作推出DecisionSpace 365云平臺,將地質(zhì)、鉆井、油藏和生產(chǎn)等數(shù)據(jù)資料有效存儲起來,實(shí)現(xiàn)了不同工作流程數(shù)據(jù)的快速更新和一體化分析,提高了油藏模擬結(jié)果的準(zhǔn)確性[8]。
除了大型石油公司、油服公司之外,部分小型技術(shù)服務(wù)公司也開展了大數(shù)據(jù)平臺的相關(guān)研究。美國AKW Analytics公司是一家成立于2013年、員工不超過10人的小型公司,專注于提供油氣行業(yè)大數(shù)據(jù)分析服務(wù)。該公司利用自主知識產(chǎn)權(quán)技術(shù)將大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和優(yōu)化結(jié)合到PALMTM(petroleum analytics learning machine)平臺中[9]。
PALMTM平臺以數(shù)據(jù)為中心,具有預(yù)測和指導(dǎo)功能,可以對來自不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)行實(shí)時(shí)多元分析,數(shù)據(jù)源包括地球物理、巖石物理、油藏工程、鉆井、壓裂、生產(chǎn)和管線輸送等,利用大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)分析歷史產(chǎn)量的特征屬性和重要性的權(quán)重,實(shí)現(xiàn)了從鉆井完井到油氣生產(chǎn)再到提高采收率全過程準(zhǔn)確的預(yù)測。
PALMTM平臺包含多種分析工具、算法和模型:有MAPGEORES(油藏模型)、MAPDRILL(鉆井?dāng)?shù)據(jù)集成)、MAPFRAC(水力壓裂)、MAPPROD(產(chǎn)能優(yōu)化)、MAPGATHER(管線維護(hù))和MAPPORTFOLIO(資本支出優(yōu)先順序)等分析工具;有邏輯回歸、支持向量機(jī)、k-最鄰近、決策樹和神經(jīng)網(wǎng)絡(luò)/深度學(xué)習(xí)等算法;利用mongo DB處理非結(jié)構(gòu)化數(shù)據(jù),采用P ostgreSQL和MySQL處理結(jié)構(gòu)化數(shù)據(jù)。
2.1.2國內(nèi)
國內(nèi)大型石油公司在大數(shù)據(jù)平臺建設(shè)方面也取得了一定進(jìn)展。中國石油歷經(jīng)30余年的探索發(fā)展,推出了國內(nèi)油氣行業(yè)首個(gè)智能云平臺——勘探開發(fā)夢想云平臺[10]?;赑aaS云平臺和勘探湖技術(shù),建立了通用的協(xié)同工作環(huán)境,實(shí)現(xiàn)了勘探開發(fā)經(jīng)營、管理、決策的一體化,大幅提高了協(xié)同工作效率和決策水平。目前,夢想云平臺的數(shù)據(jù)湖中包含了超過48萬口井、600個(gè)油氣藏和7000個(gè)地震工區(qū)的鉆井、生產(chǎn)數(shù)據(jù)。中國石油內(nèi)部應(yīng)用夢想云平臺后,在線協(xié)同效率提高20百分點(diǎn)以上,研究工作效率提高20%以上,硬件成本節(jié)約50%以上。
中國石化正在逐步打造統(tǒng)一的、規(guī)范的、覆蓋公司內(nèi)各油田勘探開發(fā)業(yè)務(wù)的協(xié)同平臺——EPBP(Sinopec E&P business cooperation platform)。EPBP的核心是實(shí)現(xiàn)崗位業(yè)務(wù)信息化,由崗位工作人員在線填報(bào)本崗位的關(guān)鍵業(yè)務(wù)數(shù)據(jù),并由相關(guān)責(zé)任部門進(jìn)行數(shù)據(jù)審核。填報(bào)的數(shù)據(jù)在該系統(tǒng)中統(tǒng)一匯總管理和應(yīng)用。在數(shù)據(jù)模型方面,石油工程部分涵蓋了鉆井管理、錄井管理和測井管理3個(gè)一級專業(yè)目錄,包含119個(gè)數(shù)據(jù)表,基本上能夠滿足石油工程關(guān)鍵業(yè)務(wù)數(shù)據(jù)管理的要求。在數(shù)據(jù)錄入和管理方式方面,具有較為嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)審核管理流程。但是,由于僅提供了網(wǎng)頁版的數(shù)據(jù)錄入工具,在少數(shù)網(wǎng)絡(luò)條件較差的井場,存在著因網(wǎng)絡(luò)不穩(wěn)定造成填寫數(shù)據(jù)丟失,需要反復(fù)錄入的問題。在數(shù)據(jù)共享與應(yīng)用方面,該平臺具有便利的數(shù)據(jù)授權(quán)共享機(jī)制,且性能良好。
2.2.1 鉆井工程
1)鉆井設(shè)計(jì)優(yōu)化。道達(dá)爾公司提出一種基于大數(shù)據(jù)分析的工作流程,基于地質(zhì)特征的啟發(fā)式定義,實(shí)現(xiàn)不確定性條件下復(fù)雜井況井位設(shè)計(jì)的優(yōu)化[11]。該方法首先利用搜索方法生成井眼軌跡,然后篩選和計(jì)算每個(gè)井眼軌跡的特征,不同的特征采用不同的模型表征,最后將聚類算法應(yīng)用于井身結(jié)構(gòu)參數(shù)特征矩陣,利用機(jī)器學(xué)習(xí)算法得到最優(yōu)特征參數(shù),并預(yù)測新井眼軌跡的最終累計(jì)產(chǎn)量。NOV公司建立了包含地質(zhì)數(shù)據(jù)、巖石力學(xué)數(shù)據(jù)、鉆井?dāng)?shù)據(jù)及地理數(shù)據(jù)的鉆頭選型大數(shù)據(jù)庫,并利用ANN方法對數(shù)據(jù)進(jìn)行訓(xùn)練,形成了基于大數(shù)據(jù)技術(shù)的鉆頭優(yōu)化選型新方法[12];侯凱等人[13]利用聚類方法得到了測井?dāng)?shù)據(jù)和地層特性間的相似性關(guān)系,使用K-means模型評價(jià)了相似地層中鉆頭的使用效果,并采用k-最近鄰算法得到最優(yōu)的鉆頭選型方案。
2)機(jī)械鉆速預(yù)測。為了確定不同動態(tài)鉆井特征參數(shù)相互作用的影響程度,提高機(jī)械鉆速預(yù)測的準(zhǔn)確性,德州農(nóng)工大學(xué)提出一種基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的鉆速預(yù)測方法[14]。該方法首先建立了包括層間厚度、鉆井液密度、鉆壓和轉(zhuǎn)速等參數(shù)的鉆速特征集合,通過繪制不同特征參數(shù)隨時(shí)間的變化曲線直觀地檢查是否有特定參數(shù)控制響應(yīng);然后利用主成分分析法對特征數(shù)量進(jìn)行降維,以此來提高模型的預(yù)測精度和計(jì)算簡便度;最后通過特征分析推導(dǎo)出每個(gè)特征屬性的相對權(quán)重和貢獻(xiàn)。此外,采用確定系數(shù)R2和均方誤差度量不同預(yù)測模型的預(yù)測精度,發(fā)現(xiàn)采用隨機(jī)森林模型預(yù)測的鉆速與實(shí)際鉆速的誤差最小,預(yù)測效果最好。左迪一等人[15]利用大數(shù)據(jù)分析方法分析了塔里木油田克深區(qū)塊鉆井的提速技術(shù):利用相關(guān)系數(shù)法分析了影響機(jī)械鉆速的主控因素;采用隨機(jī)森林和梯度提升樹方法建立了針對不同類型井特點(diǎn)的機(jī)械鉆速預(yù)測模型,并通過局部依賴分析獲得最優(yōu)鉆井參數(shù)。中國石油集團(tuán)長慶鉆井公司將各區(qū)塊的地層地質(zhì)信息進(jìn)行整合,將神經(jīng)網(wǎng)絡(luò)技術(shù)與專家頭腦風(fēng)暴相結(jié)合構(gòu)建出機(jī)械鉆速預(yù)測模型,并采用歷史數(shù)據(jù)進(jìn)行了有效測試[16]。
3)地層巖性預(yù)測。鉆井過程要鉆遇不同巖性的地層,實(shí)時(shí)了解鉆頭周圍巖石的物理、力學(xué)性質(zhì),對于提高鉆井效率、控制井眼軌跡具有重要作用。俄克拉荷馬大學(xué)以鉆頭與鉆柱性能大數(shù)據(jù)為基礎(chǔ),采用機(jī)器學(xué)習(xí)算法建立了隨鉆預(yù)測鉆頭周圍巖性的方法[17]:首先建立油田現(xiàn)場的公共大數(shù)據(jù)集,并分析測井?dāng)?shù)據(jù)的主成分,用不相關(guān)成分代替相關(guān)變量;再利用k-均值、層次聚類和自組織映射神經(jīng)網(wǎng)絡(luò)等3種聚類方法對巖性變化進(jìn)行分離,通過觀察3個(gè)巖性群的測井?dāng)?shù)據(jù)和巖心特征來確定巖性群的巖石物理意義;最后采用隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)和梯度增強(qiáng)等分類技術(shù)預(yù)測不同巖性群的巖性。該方法在Volve油田現(xiàn)場進(jìn)行了測試,巖性預(yù)測準(zhǔn)確率達(dá)到了75%。
4)鉆井風(fēng)險(xiǎn)預(yù)測。李維校等人[18]采用支持向量機(jī)方法,對鉆壓、轉(zhuǎn)速、鉆速、扭矩、泵壓和排量等參數(shù)進(jìn)行實(shí)時(shí)監(jiān)測和分析,建立了考慮鉆井過程狀態(tài)的鉆井風(fēng)險(xiǎn)識別模型;BP公司建立了鉆井過程中的套管卡管預(yù)測模型,通過分析過去發(fā)生的與靜摩擦事件相關(guān)的230個(gè)屬性特征,以近實(shí)時(shí)狀態(tài)預(yù)測可能發(fā)生的靜摩擦事件,幫助司鉆提前校正管柱下入方法。CGG公司將大數(shù)據(jù)分析技術(shù)應(yīng)用于英國大陸架復(fù)雜井段鉆井中,采用趨勢分析和相關(guān)性分析方法識別鉆井風(fēng)險(xiǎn),優(yōu)化鉆井參數(shù)[19]。在Terada Aster平臺構(gòu)建了包含約350口井的鉆井參數(shù)、測井資料、地質(zhì)和井位數(shù)據(jù)的數(shù)據(jù)庫,建立了鉆井參數(shù)(鉆壓、機(jī)械鉆速、扭矩等)與井筒條件之間的聯(lián)系。通過單井、地層、地層地理位置以及任何組合形式,可以將影響鉆井質(zhì)量的鉆井參數(shù)顯示出來。通過分析不同鉆井參數(shù)關(guān)系曲線上的異常點(diǎn)來識別鉆井過程中的異常情況,并提前采取預(yù)防措施。沙特阿美公司開發(fā)了大數(shù)據(jù)井涌監(jiān)測自動化系統(tǒng)[20],該系統(tǒng)采集壓力、流量、懸重、泵速和鉆壓等參數(shù)后,將每個(gè)參數(shù)組標(biāo)注“有井涌”或“無井涌”(見圖4),并采用決策樹、k-最近鄰和人工神經(jīng)網(wǎng)絡(luò)等5種模型對樣本進(jìn)行學(xué)習(xí),最后針對每個(gè)參數(shù)組進(jìn)行井涌預(yù)測。結(jié)果表明,最理想的模型是決策樹和k-最近鄰,精度達(dá)到90%。k-最近鄰比決策樹模型更精確,但計(jì)算時(shí)間長。
圖4 用于井涌監(jiān)測的人工神經(jīng)網(wǎng)絡(luò)模型Fig.4 The artificial neural network m odel for kick monitoring
2.2.2 儲層壓裂
低油價(jià)背景下,利用大數(shù)據(jù)分析技術(shù)優(yōu)化水力壓裂參數(shù)、設(shè)計(jì)水力壓裂方案,是獲得最大水力壓裂價(jià)值、降本增效的有效手段。斯倫貝謝公司提出利用云進(jìn)行裂縫和儲層并行模擬,結(jié)合大數(shù)據(jù)分析和人工智能算法建立代理模型,以實(shí)現(xiàn)快速、有效的壓裂設(shè)計(jì)[21]。建立代理模型的過程主要包括數(shù)據(jù)創(chuàng)建和數(shù)據(jù)分析2部分(見圖5)。首先建立目標(biāo)區(qū)域的靜態(tài)地球數(shù)值模型,通過調(diào)整儲層滲透率、相對滲透率和裂縫滲透率,使模型的計(jì)算結(jié)果與歷史產(chǎn)能擬合;然后利用標(biāo)準(zhǔn)抽樣方法對參數(shù)空間內(nèi)的敏感參數(shù)(井距、壓裂段數(shù)、簇?cái)?shù)等)進(jìn)行隨機(jī)抽樣,通過對多個(gè)參數(shù)排列組合,得到多個(gè)參數(shù)的影響;最后利用隨機(jī)森林、梯度提升、線性回歸和決策樹等預(yù)測分析技術(shù)尋找輸入數(shù)據(jù)與輸出數(shù)據(jù)之間最好的擬合關(guān)系,建立代理模型,并利用鉆井完井過程中獲得的新數(shù)據(jù)對代理模型進(jìn)行訓(xùn)練,以提高模型的準(zhǔn)確性。
圖5 代理模型建立流程Fig.5 The flow chart of establishing an agent model
2.2.3 油氣開發(fā)
1)采收率預(yù)測。美國奧斯汀大學(xué)與中國石化石油工程技術(shù)研究院聯(lián)合研究了一種基于大數(shù)據(jù)挖掘和數(shù)學(xué)回歸算法的頁巖油氣藏的最終采收率(簡稱EUR)預(yù)測新方法[22]。該方法首先利用敏感性測試方法選取與巖性和工程參數(shù)相關(guān)的主控影響因素,然后利用非線性回歸和多元線性回歸方法評估EUR與工程和生產(chǎn)參數(shù)的相關(guān)性,再在原有模型的基礎(chǔ)上加入巖性參數(shù)因子,最后利用優(yōu)化后的數(shù)據(jù)模型測算頁巖油氣藏的最終采收率。A.W ilson建立了基于無因次數(shù)和大數(shù)據(jù)挖掘技術(shù)的油田采收率預(yù)測方法,并將其應(yīng)用于墨西哥灣油田[23]。該方法主要包含以下步驟:首先收集包括地質(zhì)參數(shù)、儲量及產(chǎn)量參數(shù)、油層物理參數(shù)、壓力、體積和溫度等84種油田屬性參數(shù);然后利用無因次數(shù)完成油田數(shù)據(jù)集的聚類和降維;再利用無因次數(shù)分析流體流動驅(qū)動力的相對重要性;最后利用偏最小二乘回歸法提取潛在的因數(shù),實(shí)現(xiàn)數(shù)據(jù)降維,將油田聚類并計(jì)算采收率。
2)產(chǎn)量分配。Devon公司綜合大數(shù)據(jù)分析方法、地理信息系統(tǒng)和IT技術(shù),研發(fā)了適用于北美非常規(guī)頁巖油氣區(qū)塊的簡易產(chǎn)量分配平臺[24]。該平臺根據(jù)復(fù)雜的頁巖油氣井生產(chǎn)歷史數(shù)據(jù),快速計(jì)算和評估各產(chǎn)區(qū)中各區(qū)域的油氣生產(chǎn)情況,甚至可以精確計(jì)算出單井各層射孔段的產(chǎn)量分配。該平臺的地理信息系統(tǒng)自帶的制圖工具可提供產(chǎn)能分配圖,用戶可以直接在地圖上做出選擇并使之?dāng)?shù)據(jù)化。該平臺應(yīng)用于試驗(yàn)井Parkins22-20N-13W井的Chester目標(biāo)產(chǎn)層,5m in內(nèi)生成以目標(biāo)井為中心、半徑19.2 km區(qū)域油氣累計(jì)產(chǎn)量分布圖,評估顯示該井周圍1.6 km區(qū)域內(nèi)已生產(chǎn)約13.8×103m3當(dāng)量油氣,已產(chǎn)油氣量較高,說明該區(qū)域內(nèi)Chester層的枯竭風(fēng)險(xiǎn)較高,可據(jù)此指導(dǎo)布井。
3)生產(chǎn)設(shè)備性能優(yōu)化。殼牌公司利用大數(shù)據(jù)技術(shù)分析了大量的歷史生產(chǎn)數(shù)據(jù)、自動化監(jiān)測數(shù)據(jù)、故障維修日志和測試數(shù)據(jù)等,建立了電潛泵故障預(yù)測模型,與采油專家經(jīng)驗(yàn)結(jié)合,對預(yù)測模型進(jìn)行實(shí)時(shí)修正,識別并去除因傳感器等故障導(dǎo)致的偽劣數(shù)據(jù),進(jìn)一步提高了預(yù)測精度(超過80%),大大減少了故障停機(jī)次數(shù)。挪威國家石油公司將大數(shù)據(jù)分析技術(shù)應(yīng)用于設(shè)備維護(hù)作業(yè)系統(tǒng),基于實(shí)時(shí)采集的設(shè)備運(yùn)行數(shù)據(jù),利用智能算法計(jì)算了設(shè)備的最佳維修保養(yǎng)周期,優(yōu)化了維修保養(yǎng)停機(jī)的計(jì)劃,達(dá)到了設(shè)備維修保養(yǎng)周期最大化的目的。此外,基于歷史數(shù)據(jù)建立了設(shè)備的失效模型,并優(yōu)化了設(shè)備檢測策略和方案,利用大數(shù)據(jù)技術(shù)實(shí)時(shí)監(jiān)測設(shè)備運(yùn)轉(zhuǎn),一旦設(shè)備運(yùn)行達(dá)到方案預(yù)設(shè)的條件,系統(tǒng)將預(yù)警并給出維修保養(yǎng)建議,從而避免了設(shè)備嚴(yán)重故障造成的停機(jī)大修事故。
目前,國內(nèi)外能源公司在油氣勘探、開發(fā)業(yè)務(wù)中嘗試使用大數(shù)據(jù)分析技術(shù),并取得了良好的實(shí)施效果,主要具備以下特征:1)國際大型石油公司正在或基本已建成大數(shù)據(jù)分析平臺。通過建立大數(shù)據(jù)分析平臺,將人、過程和技術(shù)聯(lián)系起來,以實(shí)現(xiàn)價(jià)值的最大化;2)小場景產(chǎn)生大價(jià)值。針對鉆井、壓裂、生產(chǎn)中具體的應(yīng)用場景,以解決具體業(yè)務(wù)問題為目標(biāo),通過大數(shù)據(jù)發(fā)現(xiàn)各相關(guān)因素的變化情況并預(yù)測其變化帶來的結(jié)果,提高業(yè)務(wù)預(yù)見性,實(shí)現(xiàn)業(yè)務(wù)的自動優(yōu)化;3)云化趨勢降低技術(shù)使用門檻,與互聯(lián)網(wǎng)公司跨界聯(lián)姻趨勢明顯。各大能源公司均與數(shù)字巨頭公司合作構(gòu)建云上數(shù)據(jù)平臺,向云化解決方案的演進(jìn)使石油公司能夠更專注于數(shù)據(jù)和業(yè)務(wù)邏輯,不需要維護(hù)底層的硬件和網(wǎng)絡(luò);4)引入了智能算法。通過引入機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等智能算法,進(jìn)一步提高了大數(shù)據(jù)分析的準(zhǔn)確性和實(shí)時(shí)性。
利用大數(shù)據(jù)技術(shù)優(yōu)化石油工程作業(yè)流程、實(shí)現(xiàn)降本增效目的已成為各大石油公司的廣泛共識。在大數(shù)據(jù)技術(shù)應(yīng)用日益廣泛和深入的趨勢下,石油行業(yè)應(yīng)借助互聯(lián)網(wǎng)、電子商務(wù)等行業(yè)的大數(shù)據(jù)應(yīng)用經(jīng)驗(yàn),明確各領(lǐng)域的應(yīng)用需求,積極推動大數(shù)據(jù)技術(shù)的推廣應(yīng)用。具體建議如下:
1)建立統(tǒng)一的石油工程大數(shù)據(jù)平臺,實(shí)現(xiàn)數(shù)據(jù)互通、信息分享。數(shù)據(jù)是石油公司智能化轉(zhuǎn)型的基礎(chǔ),建立統(tǒng)一的大數(shù)據(jù)平臺需要油田分公司、油田服務(wù)公司和科研機(jī)構(gòu)的共同參與,只有加強(qiáng)石油工程各環(huán)節(jié)的數(shù)據(jù)共享,打破數(shù)據(jù)孤立分散、相互隔絕的局面,通過共享不同專業(yè)和部門之間的信息數(shù)據(jù),規(guī)范數(shù)據(jù)的采集、傳輸、存儲、轉(zhuǎn)換、集成和應(yīng)用,提升數(shù)據(jù)的一致性和可靠性,才可能實(shí)現(xiàn)一體化的數(shù)據(jù)融合。
2)緊密聯(lián)合數(shù)字化巨頭,自主創(chuàng)新與合作研發(fā)并重。與互聯(lián)網(wǎng)、電子商務(wù)等行業(yè)相比,石油行業(yè)在信息通信技術(shù)方面的技術(shù)積累和人才積累明顯薄弱,通過自主創(chuàng)新獲得大數(shù)據(jù)技術(shù)成功將是一個(gè)非常漫長的過程。加強(qiáng)與數(shù)字化巨頭公司的合作,探索以石油公司為主體,與阿里巴巴、華為等國內(nèi)頂尖信息企業(yè)、高等院校聯(lián)合籌建石油工程大數(shù)據(jù)技術(shù)重點(diǎn)實(shí)驗(yàn)室,提供專項(xiàng)資金支撐石油工程大數(shù)據(jù)技術(shù)的研發(fā)。
3)完善大數(shù)據(jù)管理機(jī)制和技術(shù)標(biāo)準(zhǔn)。建立針對石油工程的大數(shù)據(jù)標(biāo)準(zhǔn)體系,推進(jìn)油田現(xiàn)場數(shù)據(jù)采集、指標(biāo)口徑、交換接口、訪問接口、數(shù)據(jù)質(zhì)量和數(shù)據(jù)交換等關(guān)鍵標(biāo)準(zhǔn)的制定和實(shí)施。推進(jìn)數(shù)據(jù)管控制度建設(shè),明確業(yè)務(wù)職能責(zé)任部門、專業(yè)分公司石油工程數(shù)據(jù)管理及共享的義務(wù)和權(quán)利,形成石油工程大數(shù)據(jù)治理長效機(jī)制。
4)強(qiáng)化基礎(chǔ)技術(shù)、前瞻技術(shù)研究。針對傳統(tǒng)的大數(shù)據(jù)優(yōu)化算法在處理高維石油工程大數(shù)據(jù)時(shí)性能急劇下降的問題,結(jié)合石油工程大數(shù)據(jù)特點(diǎn),強(qiáng)化機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等智能算法的基礎(chǔ)研究,開展鉆井井筒數(shù)字孿生系統(tǒng)、鉆完井機(jī)器人、井場虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)和認(rèn)知計(jì)算等前瞻技術(shù)的研究,以提高石油工程大數(shù)據(jù)分析的速度和準(zhǔn)確度,為下一代石油工程智能化的發(fā)展奠定技術(shù)基礎(chǔ)。
5)堅(jiān)持“以點(diǎn)帶面”和“先易后難”原則,逐步構(gòu)建石油工程大數(shù)據(jù)生態(tài)系統(tǒng)。研究石油工程大數(shù)據(jù)技術(shù)發(fā)展戰(zhàn)略,制定石油工程與大數(shù)據(jù)技術(shù)融合發(fā)展的技術(shù)路線,先針對容易實(shí)現(xiàn)的具體應(yīng)用場景部署實(shí)施相關(guān)項(xiàng)目,再集成各單項(xiàng)技術(shù)形成石油工程人工智能生態(tài)系統(tǒng)。建議近期重點(diǎn)攻關(guān)鉆井參數(shù)優(yōu)化、鉆井風(fēng)險(xiǎn)預(yù)警、油藏智能導(dǎo)向鉆井、完井參數(shù)優(yōu)化和地質(zhì)工程一體化等單項(xiàng)技術(shù)。
海量數(shù)據(jù)是石油工程多學(xué)科交叉融合一體化的基礎(chǔ),從海量數(shù)據(jù)中快速分析、挖掘得到有價(jià)值信息的核心就是大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)的進(jìn)步為石油工程的信息化、智能化發(fā)展提供了新的機(jī)遇,建立統(tǒng)一的、一體化的大數(shù)據(jù)平臺,結(jié)合石油工程專業(yè)的特點(diǎn),借助機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能算法,形成石油工程領(lǐng)域大數(shù)據(jù)生態(tài)系統(tǒng),對于優(yōu)化工程作業(yè)參數(shù)、提高作業(yè)效率和降低作業(yè)成本具有重要意義。
致謝:論文撰寫過程中,孫旭東專家給予了幫助和指導(dǎo),李丹丹、廖璐璐、陳曾偉等同事幫助完成了資料的收集工作,在此表示感謝!