王晶昕
(大慶油田有限責任公司第九采油廠信息中心,黑龍江 大慶 163853)
隨著油田的不斷發(fā)展,數(shù)據(jù)庫開發(fā)也在不斷發(fā)生變化。不同時期、不同合作商開發(fā)多個應用系統(tǒng),并采用不同的數(shù)據(jù)格式開發(fā)語言和數(shù)據(jù)庫系統(tǒng),導致油田企業(yè)數(shù)據(jù)管理與數(shù)據(jù)庫五花八門,產(chǎn)生“數(shù)據(jù)孤島”。數(shù)據(jù)缺少統(tǒng)一標準,數(shù)據(jù)集成應用困難;數(shù)據(jù)產(chǎn)生部門多、數(shù)據(jù)使用部門廣,數(shù)據(jù)管理部門因為管理機制等問題導致數(shù)據(jù)應用困難,應用效率低下。多個部門的業(yè)務數(shù)據(jù)使得數(shù)據(jù)呈現(xiàn)方式較為碎片化。油田行業(yè)雖應用了大數(shù)據(jù),但數(shù)據(jù)共享應用有難度,尤其還存在數(shù)據(jù)基礎工作不完善,無法支撐高級應用等問題,因此有必要開展大規(guī)模的數(shù)據(jù)質量評估研究。
近年來,中石油相繼建成了油氣水井生產(chǎn)數(shù)據(jù)管理系統(tǒng)、采油與地面工程運行管理系統(tǒng),涵蓋生產(chǎn)數(shù)據(jù)、作業(yè)數(shù)據(jù)、工藝數(shù)據(jù)、油田監(jiān)測數(shù)據(jù)、地面工程數(shù)據(jù)、勘探開發(fā)地質數(shù)據(jù)等,底層數(shù)據(jù)采集基本完善。
數(shù)據(jù)庫遵循“分布存儲、集中共享”的原則,在應用過程中發(fā)現(xiàn)已建數(shù)據(jù)庫還不能很好地滿足科研、生產(chǎn)的需要,數(shù)據(jù)統(tǒng)計管理情況參差不齊,缺乏統(tǒng)一標準,還在采用Excel 方法統(tǒng)計與分析,導致統(tǒng)計分析周期長,分析結果準確性和共享性差,效率低,并且很難發(fā)現(xiàn)數(shù)據(jù)中隱藏的規(guī)律,一定程度上制約了油田生產(chǎn)管理水平的提高,未能全面實現(xiàn)信息資源共享。
數(shù)據(jù)質量研究以油田開發(fā)數(shù)據(jù)庫為核心,基于EPDM 模型進行突破,支持質量控制標準管理,部署質量控制服務,實施節(jié)點質量控制,進行質量分析評估;支持問題跟蹤反饋,以全方位、多維度監(jiān)控數(shù)據(jù)資源、質量、管理現(xiàn)狀與進展;支持大慶油田在數(shù)據(jù)庫設計、開發(fā)、部署、實施、建設、應用、監(jiān)控、管理、反饋全過程的數(shù)據(jù)質量管理工作,實現(xiàn)油田開發(fā)數(shù)據(jù)質量的全面管理和精細控制。
數(shù)據(jù)池內的數(shù)據(jù)紛繁復雜,每一類、每一項數(shù)據(jù)都應該有其相應的數(shù)據(jù)標準。只有建立相應的標準,才能判斷數(shù)據(jù)質量是否符合要求。對數(shù)據(jù)質量的評估可以從數(shù)據(jù)標準一致性、數(shù)據(jù)及時性、數(shù)據(jù)完整性和數(shù)據(jù)準確性四方面著手。
數(shù)據(jù)標準的變更和數(shù)據(jù)質量標準的缺失是大慶油田數(shù)據(jù)庫建設歷史中普遍存在的問題。部署全面的數(shù)據(jù)質量管理,實施精細數(shù)據(jù)質量控制,是解決數(shù)據(jù)質量問題的有效途徑。
大慶油田應制定統(tǒng)一的數(shù)據(jù)質量評估標準庫,通過數(shù)據(jù)質量報告、報告推送功能來完成數(shù)據(jù)質量的評估。核心是數(shù)據(jù)質量標準,與業(yè)務相關的標準需要技術人員和業(yè)務人員共同確定檢查規(guī)則,然后編寫規(guī)則腳本。要定時批量執(zhí)行檢查規(guī)則,及時發(fā)現(xiàn)數(shù)據(jù)質量問題,將數(shù)據(jù)質量報告第一時間推送給業(yè)務人員,以及時糾正問題數(shù)據(jù)。
在大慶油田開展的開發(fā)數(shù)據(jù)庫建設及應用調研工作的基礎上,針對不同數(shù)據(jù)表,建立個性化的檢查規(guī)則,進行靜態(tài)數(shù)據(jù)檢查。在動態(tài)數(shù)據(jù)檢查方面,主要涉及油水井日數(shù)據(jù)、月井史數(shù)據(jù)以及相關衍生數(shù)據(jù)。數(shù)據(jù)標準一致性檢查算法如表1 所示。
表1 數(shù)據(jù)標準一致性檢查算法
要保障數(shù)據(jù)的及時性需要保證同源或跨源的數(shù)據(jù)一致。數(shù)據(jù)在回遷過程中,存在回遷程序已執(zhí)行,但是當日數(shù)據(jù)并未成功回遷的情況。如果數(shù)據(jù)未能及時回遷,會影響油田企業(yè)自建項目的應用效果。大慶油田需要根據(jù)動態(tài)數(shù)據(jù)回遷時間表,設定觸發(fā)器定時檢查數(shù)據(jù)回遷情況和及時率,用于監(jiān)控每天數(shù)據(jù)的回遷情況,及時發(fā)現(xiàn)回遷問題。根據(jù)動態(tài)數(shù)據(jù)回遷時間表,生成檢查公報,記錄數(shù)據(jù)的變化情況?;剡w情況匯總如表2所示。
表2 回遷情況匯總
要保障數(shù)據(jù)完整性,重點是檢查單井地質數(shù)據(jù),要求已投產(chǎn)的井地質數(shù)據(jù)齊全,各表關鍵數(shù)據(jù)項不空。例如,已經(jīng)投產(chǎn)的單井需要與單井基礎信息對比井號一致性和完整性,相應的衍生數(shù)據(jù)如單井小層數(shù)據(jù)、鉆井數(shù)據(jù)以及射孔數(shù)據(jù)等需要及時入庫。完整性檢查表如表3 所示。
表3 完整性檢查
要保障數(shù)據(jù)準確性,數(shù)據(jù)填寫方式應嚴格按照《開發(fā)數(shù)據(jù)應用結構規(guī)范》要求,規(guī)范填寫油層組名稱、砂巖組名稱、小層名稱、沉積單元名稱等,還要符合《大慶油田小層命名規(guī)則及其代碼》要求,保證各類深度數(shù)據(jù)合理,無異常數(shù)值。區(qū)域地質部分,由于數(shù)據(jù)量較少,不做硬性要求,但方案資料中的滲透率、密度、黏度、壓縮因子等一些關鍵參數(shù)及其他已有數(shù)據(jù)要求準確。射孔井段數(shù)據(jù)的準確性檢查表如表4 所示。
表4 射孔井段數(shù)據(jù)的準確性檢查
大慶油田通過建立數(shù)據(jù)質量標準,根據(jù)評估結果進行相關整改,有效解決了一定范圍內的數(shù)據(jù)共享和集成問題,使數(shù)據(jù)的錄入、同步、查詢等效率大幅提升,取得了顯著效果,提高了數(shù)據(jù)庫的可用性和共享程度。數(shù)據(jù)質量評估的目的是保持開發(fā)數(shù)據(jù)庫平穩(wěn)運行,保證企業(yè)級數(shù)據(jù)共享,促進數(shù)據(jù)標準化建設,為下一步數(shù)據(jù)治理作準備,為實現(xiàn)油田管理智能化提供助力,推動油田企業(yè)的發(fā)展。