張旭亮 王乃建 蔣永祥 王海立 唐 虎 焦文龍 楊海申 馬 潔郭 敏 肖永新 趙薇薇 李紅遠 魏振輝 雷云山 皮紅梅
( 1 中國石油集團東方地球物理公司采集技術中心;2 河北省地震勘探數據采集技術創(chuàng)新中心;3 中國石油玉門油田公司勘探事業(yè)部;4 中國石油集團東方地球物理公司青海物探處 )
目前,全球數據庫技術逐漸走向成熟,在一些國外油田公司的勘探領域得到很好的應用,并取得了巨大的經濟效益。阿爾及利亞國家石油公司在對測量數據、地震剖面、地質成果,以及鉆井、測井等信息進行分類分析的基礎上,建立了數據銀行,實現了油田數據資料共享。挪威、俄羅斯、巴西等國家也已建成了地球物理和地質數據銀行。加拿大地質調查局早已廣泛應用數據庫管理海洋調查勘探等地學數據[1]。國外油田大公司獨立性、專業(yè)性較強,所以數據的專業(yè)性和獨立性要求也相對較高,數據建設相對比較規(guī)范、統一,且大力發(fā)揮數據的作用與價值。這些國外公司在數據應用方面均有100多年的歷史,在油田數據應用方面比國內早且先進,但對數據治理的認識和提出均比較晚。數據治理的目的主要是發(fā)現數據在建設中存在多期次、多數據庫和數據標準不統一的現象。2010年左右,當國內油田專家提出數據治理時,國外才開始關注對數據治理的研究。例如中國石油集團慶新油田開發(fā)有限責任公司引入數據治理技術后,過去跨庫提取動態(tài)數據需要煩瑣的半自動化操作,數據治理之后獲取數據的便利度和速度均有了大幅度的提升。此外,中國石油集團長城鉆探工程公司等多個公司均進行了多種方式的治理,效果明顯,工作效率均有大幅度提高[2]。
2012年,中國石油勘探與生產分公司在新疆油田組織召開了上游業(yè)務物探基礎工作現場會,會議強調了面向復雜地質目標必須抓好物探基礎工作的重要性和緊迫性,明確了物探基礎數據庫的建設目標。隨著勘探開發(fā)的不斷深入并依據現場會的要求,各油田不同程度地開展了測量與SPS、表層成果、靜校正數據、高精度衛(wèi)星圖片、速度和文檔管理等數據庫的建設。目前新疆油田公司[3]、西南油氣田公司[4]、大慶油田公司[5]、華北油田公司[6]等基本建齊了物探基礎數據庫[7],其他油田公司也建設了部分數據庫[8-9],但仍需補充完善。東方物探公司經過調研發(fā)現,上述數據庫的建設時間較早,基本都是依托中國石油的外部公司協助,技術容易受限,并且在云共享、數據標準化管理和數據應用等方面存在一些問題和不足。
東方物探公司作為中國石油物探領域的先鋒,在數據庫技術和云共享等方面進行了大量研究,積極與玉門油田公司合作并建設符合中國石油標準的盆地級物探基礎數據庫平臺。在建設初期,玉門油田的物探基礎數據基本以文檔的形式存放,存在數據格式不統一、數據類型不全、數據存儲分散、難以適應盆地級的大數據量管理等問題,沒有真正地實現集團公司提倡的數字化轉型[10-11]要求。
盆地級物探基礎數據庫(GeoContainer)系統是東方物探公司自主研發(fā)、覆蓋物探多業(yè)務、全過程和大數據量的專業(yè)管理平臺。該系統具有兼容中國石油勘探開發(fā)夢想云[12-13]、微服務分布式架構[14]、開發(fā)高擴展性、操作方便等特點。GeoContainer系統采用中國石油油氣勘探開發(fā)數據模型(EPDM)[15-16],該模型已在中國石油各油田得到廣泛應用[17],明顯強于國外油田數據庫的數據建設和數據治理,其在橫向上能夠將各個專業(yè)的數據整合在一起,使數據之間的聯系更加密切,更好地滿足研究人員的使用。2021年,東方物探公司首次將GeoContainer系統部署在玉門油田公司進行實際應用,并取得了顯著成效[18-19]。
GeoContainer系統由服務端和客戶端兩大部分組成(圖1),該系統供管理人員和從事石油勘探的專業(yè)技術人員使用。基于客戶端/服務器(C/S)架構,在服務端以Linux為操作系統平臺,以PostgreSQL作為數據庫引擎[20],采用微服務的分布式存儲[21-22],其服務器云端架構[23]與中國石油夢想云[24]兼容;以油田公司局域網為通信載體,在客戶端以Windows操作系統為應用平臺,實現了基于PC客戶端的數據錄入、修改、查詢和刪除;以EPDM模型為基礎,能夠滿足勘探開發(fā)動、靜態(tài)數據一體化管理;運用插件式二次開發(fā)技術,便于快速擴充應用功能,能夠完成物探基礎數據的數字化管理、規(guī)范化存儲、正確性驗證和專業(yè)化應用等工作。
圖1 GeoContainer系統簡圖Fig.1 Schematic diagram of GeoContainer system
GeoContainer系統服務端主要由高性能服務器組、微服務查詢平臺和API(Application Programming Interface,即應用程序編程接口)在線文檔管理平臺三大部分組成。
高性能服務器組是由4臺企業(yè)機架式服務器和1臺企業(yè)級交換機組成的硬件系統(圖2)。企業(yè)機架式服務器技術規(guī)格見表1,設備具有兩個及以上第二代英特爾可擴展處理器,每個處理器多達20個核心,容量可擴展至168TB的企業(yè)級存儲能力。
表1 企業(yè)機架式服務器技術規(guī)格表Table 1 Technical specifications of enterprise rack server
圖2 高性能服務器組硬件系統組成圖Fig.2 Hardware system composition of high performance server group
(1)系統能滿足各種應用程序的需求,均衡地結合資源、可擴展性和經濟性,適應現代數據處理不斷變化的需求。通過一鍵式調整優(yōu)化應用程序性能。
(2)采用Dell EMC OpenManage智能自動化功能,有助于減少花費在例行維護上的時間,從而提高工作效率。
(3)具有網絡彈性的全面架構,在每臺服務器中嵌入全新配置鎖定功能和本地存儲的系統擦除功能,能夠確保數據安全和數據隱私。
1.1.2 微服務查詢平臺
微服務查詢平臺采用微服務分布式架構,各服務能夠獨立部署,服務之間通過Feign進行遠程調用(圖3)。以觀測系統數據上傳為例,首先調用文件服務上傳接口,上傳臨時文件,并返回文件ID;再通過觀測系統服務,調用上傳數據信息接口(附帶文件ID),遠程調用文件服務,進行文件校驗、獲取文件信息;最后調用MinIO文件存儲服務器,獲取臨時文件內容,解析入數據庫。用戶通過網頁端授權即可操作應用,安全性高。
圖3 微服務查詢平臺界面示意圖Fig.3 Interface sketch of micro-service query platform
1.1.3 API在線文檔管理平臺
API在線文檔管理平臺是為Java MVC框架集成Swagger生成API文檔的增強解決方案,前端UI界面改善增強(圖4)。在微服務架構下,該平臺使用更加靈活,從導航下拉窗口能夠切換到任意模塊,查看相應接口說明,測試環(huán)境下也可以對接口進行調試,提升前后端模式開發(fā)效率。
兩組比較,學生對OSCE模式滿意度較高,認為OSCE模式更符合教學大綱,在評分標準、難易程度、時間安排均比傳統考核方式更合理,差異具有統計學意義(P<0.05)(見表2)。
圖4 API在線文檔管理平臺界面示意圖Fig.4 Interface sketch of API online document management platform
GeoContainer系統客戶端由數據管理平臺和應用軟件兩部分組成,兩者功能獨立,其可擴展性高,操作簡單便捷,具有良好的交互性,易于操作人員掌握(圖5)。
圖5 GeoContainer系統客戶端組成圖Fig.5 Client composition of GeoContainer system
1.2.1 數據管理平臺
數據管理平臺由用戶交互模塊、數據操作模塊和網絡請求模塊三大部分組成。采用PostgreSQL數據庫技術,能夠對一系列數據交互流程進行統一安全管理,支撐數據操作和網絡請求等業(yè)務的實施[25]。
(1)能夠對用戶實現角色管理,主要分為系統管理員、數據錄入員和應用人員;對項目進行分類管理,能夠快速查詢項目基本信息。
(2)實現對數據的錄入、更新、轉換和請求等功能;能完成文件的上傳與下載;支持項目的新建、更新和刪除等功能。
(3)通過對數據請求進行網絡格式解析,使用POST請求和GET請求,保證數據管理平臺與應用軟件之間的通信。
1.2.2 應用軟件
應用軟件主要由測量與SPS、表層成果、靜校正數據、高精度衛(wèi)星圖片、速度文件和文檔管理等多個功能插件組成,軟件開發(fā)人員可通過插件的方式進行開發(fā)應用,能夠實現對物探基礎數據的規(guī)范化管理和高效應用(圖6)。
圖6 應用軟件主頁面示意圖Fig.6 Interface sketch of main page of application software
GeoContainer系統在正式發(fā)布之前進行了大量的系統試驗及軟件測試,在玉門油田的應用,是該系統在油田推廣實施的典型案例。玉門油田坐落于戈壁腹地,祁連山下,這里誕生了新中國第一口油井、第一個油田、第一個石化基地,為中國石油工業(yè)的發(fā)展做出了重大貢獻。20多年來,數字地震勘探采集的大量數據已成為玉門油田極為寶貴的財富,是制定勘探、開發(fā)決策的重要基礎。截至2021年底,應用該系統已經完成盆地級別的測量與SPS、表層成果數據、靜校正數據、高精度衛(wèi)星圖片、速度相關數據和文檔信息的加載入庫,并利用該系統進行數據歸檔管理和數據應用支持服務。
測量與SPS庫主要用于管理測量相關的基礎成 果信息,能夠展示項目部署情況和采集狀況等,其數據類型主要包括SPS信息、施工邊界、地表地理信息等。目前該數據庫已錄入玉門油田相關盆地44個項目的生產數據,其中激發(fā)點128多萬行,檢波點238多萬行。軟件應用功能包括億行級別炮檢點顯示、點位篩選等(圖7、圖8)。
圖7 觀測系統平面顯示圖Fig.7 Plane display of observation system
圖8 觀測系統表格顯示圖Fig.8 Diagram of observation system data table
表層成果庫主要用來描述近地表的地震地質情況,并用于靜校正計算和指導生產,其數據類型包括表層成果、巖性錄井、表層施工參數等。目前該數據庫已錄入玉門油田的盆地表層調查點6200多個。軟件應用功能包括表層建模、Q值應用等(圖9)。
圖9 表層沿線切面模型圖Fig.9 Section of surface data modeling
靜校正數據庫主要是連接采集和處理的紐帶,能夠提高復雜地表區(qū)的疊加成像精度,其數據類型包括近地表模型、靜校正計算參數、靜校正量等。目前該數據庫已錄入玉門油田相關盆地靜校正數據量達2GB。軟件應用功能包括近地表建模、連片靜校正計算等(圖10、圖11)。
圖10 近地表建模示意圖Fig.10 Schematic diagram of near-surface modeling(a) 近地表模型沿線剖面圖;(b)近地表模型平面顯示圖
圖11 連片靜校正計算示意圖Fig.11 Schematic diagram of continuous static correction calculation
高精度衛(wèi)星圖片庫主要用于展示工區(qū)實際地表狀況,可以指導生產,其數據類型包括衛(wèi)星圖片、航拍照片、矢量圖片等。軟件應用功能包括TB級衛(wèi)星圖片的分級分塊、快速縮放及拖拽疊加顯示等,如圖12所示。
圖12 某研究區(qū)高精度衛(wèi)星圖片Fig.12 High resolution satellite image of a study area
速度庫主要用于野外現場處理和室內成果處理等,其數據類型包括疊加速度、偏移速度、疊前偏移速度、測井速度等。軟件應用可以支持多類型的速度格式,能實現對速度文件的數字化管理和共享。
文檔管理庫主要用于管理采集項目相關的輔助文檔,如項目總結報告、典型單炮記錄、初至文件等,可設置不同的文件類型和關鍵字,便于查找。該數據庫可以支持多類型的文件格式,能夠實現對文件的管理和共享。目前該數據庫已錄入玉門油田的高精度衛(wèi)星圖片、地質圖和各類報告文檔等非結構化數據達1.3TB(圖13)。
圖13 文檔管理中心界面示意圖Fig.13 Interface sketch of document management center
目前GeoContainer系統6個數據庫的實施,能直觀地顯示盆地內各項目的觀測系統、管理盆地級別的測量與SPS、表層成果、靜校正數據、速度數據和高精度衛(wèi)星圖片等。在數據錄入方面,能夠進行自定義格式數據解析;能夠實現TB級別的超大文件上傳、下載及斷點續(xù)傳;支持上億行記錄高效、穩(wěn)定傳輸。在數據治理方面,數據錄入需要經過雙重質控,數據加載時系統進行有效性檢查,加載完成后進行數值范圍檢查、各種質控平面圖檢查,可快速發(fā)現異常數值,保證錄入數據的正確性和有效性。以往科研人員查找和整理相關項目信息,需要從檔案館和存儲設備中等待調用,往往花費至少幾天或一周以上的時間,使用該系統后,僅僅幾個小時的時間,就可以快速地從數據庫系統下載所需資料,這極大地提高了科研人員的工作效率。
GeoContainer系統是能夠基于云架構平臺在中國石油內部網實現管理人員和質控部門對項目的異地督促指導、前后方一體化異地協同的組織新模式。尤其在物探基礎數據的共享、管理和應用方面,該系統能夠使科研人員初步實現快速從中國石油數據主湖中獲取研究所需的物探基礎數據,并將數據推送至系統客戶端開展作圖等工作;同時物探基礎數據相關成果圖件等資料也可歸檔至夢想云平臺,這為中國石油各油田之間實現成果繼承與跨區(qū)域云共享提供了全面支撐。
物探基礎數據庫系統是實現油田數據科學管理、科學決策、降低成本的重要手段。依托EPDM模型的GeoContainer系統的研發(fā)及項目成功落地,充分地契合了中國石油油氣勘探開發(fā)的需要,以及中國石油勘探與生產分公司的物探業(yè)務需求,實現了對物探數據數字化管理的基本目標,符合中國石油“十四五”規(guī)劃中關于數字化轉型的戰(zhàn)略選擇。通過該系統的實際應用,實現了玉門油田歷史勘探數據的數據挖掘和重復利用,為指導下一步油氣勘探開發(fā)和生產部署提供依據。