吳堯 楊立根
摘 要:隨著地震勘探技術(shù)的發(fā)展和渤海油田勘探要求的提高,帶來了地震采集數(shù)據(jù)量大幅增長,對數(shù)據(jù)存儲、數(shù)據(jù)安全和數(shù)據(jù)轉(zhuǎn)儲提出了更高的要求。本文主要對地震數(shù)據(jù)存儲介質(zhì)、轉(zhuǎn)儲方案進(jìn)行分析,提出一套轉(zhuǎn)儲體系方法,通過實際生產(chǎn)項目的應(yīng)用,表示該方法能夠滿足海量地震數(shù)據(jù)轉(zhuǎn)儲質(zhì)控的要求。
關(guān)鍵詞:地震數(shù)據(jù);高效轉(zhuǎn)儲;MD5
中圖分類號:P631.44 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-2064(2019)06-0159-02
0 引言
隨著渤海油田勘探技術(shù)的進(jìn)步,尤其是“兩寬一高”采集技術(shù)的應(yīng)用,地震數(shù)據(jù)呈指數(shù)級的快速增長。目前野外采集儀器記錄的原始單炮數(shù)據(jù)一般為SEGD或SEGY格式,選擇的存儲介質(zhì)一般為磁帶。就渤海油田1995年~2009年的采集工區(qū)來舉例,均使用3590磁帶作為存儲介質(zhì)。目前3590磁帶機(jī)已經(jīng)停產(chǎn),磁帶在使用過程中也發(fā)現(xiàn)粘連等問題,無法滿足目前勘探研究的需要。因此,必須對其記錄的地震數(shù)據(jù)進(jìn)行轉(zhuǎn)儲。
1 問題的提出與應(yīng)對
野外地震數(shù)據(jù)轉(zhuǎn)儲有其特殊性,一是地震數(shù)據(jù)容量非常大,面對海量地震數(shù)據(jù)的轉(zhuǎn)儲和質(zhì)控要求所采用的程序、方法高效;二是要求數(shù)據(jù)準(zhǔn)確,轉(zhuǎn)儲存檔后幾乎無法返工;三是兼容性,可以滿足各種處理軟件后期再使用的要求。
本文介紹一種行之有效的轉(zhuǎn)儲方案和質(zhì)控流程,能高效完成海量地震數(shù)據(jù)的轉(zhuǎn)儲工作,主要包括以下幾個方面:
1.1 轉(zhuǎn)儲介質(zhì)的選擇
參考國內(nèi)外各大石油公司的經(jīng)驗,優(yōu)選出兩種介質(zhì)。藍(lán)光光盤,優(yōu)點是保存時間長,理論上可以100年;缺點是使用中易產(chǎn)生劃痕,重復(fù)利用率低。移動磁盤,優(yōu)點是方便使用,可反復(fù)讀取;缺點是保存年限短。綜合考慮地震數(shù)據(jù)的保存屬性和利用屬性,最終選取藍(lán)光光盤作為轉(zhuǎn)儲介質(zhì)。
1.2 轉(zhuǎn)儲的方案
為了與渤海油田數(shù)據(jù)處理軟件緊密結(jié)合,方便處理軟件的使用,選用tape2cgg拷貝軟件,該軟件能夠?qū)崿F(xiàn)磁帶數(shù)據(jù)的轉(zhuǎn)儲拷貝,輸出數(shù)據(jù)與原始磁帶數(shù)據(jù)保持完全一致(圖1、2)。軟件操作快捷高效,數(shù)據(jù)檢查方便準(zhǔn)確,適合大規(guī)模的原始磁帶轉(zhuǎn)儲質(zhì)控。
轉(zhuǎn)錄后數(shù)據(jù)本體沒有發(fā)生任何改變,為適應(yīng)不同處理軟件需要,也可以轉(zhuǎn)儲為“無間隔的磁盤文件”,即有效數(shù)據(jù)連續(xù)存放,沒有EOR和EOF標(biāo)記,用tpf索引文件描述有效數(shù)據(jù)的結(jié)構(gòu)。使用nerolinux12,主流的win7平臺下的刻錄軟件,圖形化界面操作,方便快捷,并支持刻錄數(shù)據(jù)驗證。光盤刻錄兩份,同時生成MD5校驗文件(圖3)。
1.3 質(zhì)量控制
1.3.1 MD5值校驗
MD5即Message-Digest Algorithm 5(信息-摘要算法5),用于確保信息傳輸完整一致。是計算機(jī)廣泛使用的雜湊算法之一。其具備具有以下特點:
(1)壓縮性:任意長度的數(shù)據(jù),算出的MD5值長度都是固定的;
(2)容易計算:從原數(shù)據(jù)計算出MD5值很容易;
(3)抗修改性:對原數(shù)據(jù)進(jìn)行任何改動,哪怕只修改1個字節(jié),所得到的MD5值都有很大區(qū)別;
(4)強(qiáng)抗碰撞:已知原數(shù)據(jù)和其MD5值,想找到一個具有相同MD5值的數(shù)據(jù)(即偽造數(shù)據(jù))是非常困難的。
通過比對原始磁帶介質(zhì)中數(shù)據(jù)和刻錄光盤中數(shù)據(jù)的MD5值,可以高速、有效的對轉(zhuǎn)儲數(shù)據(jù)的一致性進(jìn)行驗證。
1.3.2 數(shù)據(jù)抽查
對抽查測線用第三方商業(yè)化處理系統(tǒng)軟件對3590原始磁帶和轉(zhuǎn)儲拷貝磁盤數(shù)據(jù)分別解編并進(jìn)行數(shù)據(jù)對比(圖4)。
2 應(yīng)用實例
基于以上的技術(shù)和方法,通過自主知識產(chǎn)權(quán)的海量數(shù)據(jù)轉(zhuǎn)儲軟件,對渤海油田1995年至2009年采集工區(qū)所記錄的3590磁帶轉(zhuǎn)儲,涉及磁帶2萬7千余盤,數(shù)據(jù)量接近400T。通過一年的轉(zhuǎn)儲和質(zhì)控,該項目通過隨機(jī)抽查藍(lán)光光盤數(shù)據(jù)并和原始磁帶數(shù)據(jù)比對沒有發(fā)現(xiàn)任何問題和錯誤,刻錄藍(lán)光光盤數(shù)據(jù)與原始磁帶數(shù)據(jù)MD5值對比完全一致。
3 結(jié)語
(1)地震數(shù)據(jù)的容量很大,實現(xiàn)高效轉(zhuǎn)儲需要分布式錄入集中存儲的并行工作方式。
(2)MD5值一致性比較作為地震數(shù)據(jù)轉(zhuǎn)儲的驗證方式十分高效。
(3)本套轉(zhuǎn)儲體系方法,通過實際生產(chǎn)項目的應(yīng)用,能夠滿足海量地震數(shù)據(jù)轉(zhuǎn)儲以及質(zhì)控的要求。
參考文獻(xiàn)
[1] 朱偉林,米立軍,鐘鍇,等.油氣并舉 再攀高峰——中國近海2010年勘探回顧及“十二五”勘探展望[J].中國海上油氣,2011(1):1-6.
[2] 李振春.地震數(shù)據(jù)規(guī)則化重構(gòu)方法策略[J].中國石油大學(xué)學(xué)報(自然科學(xué)版),2018(01).
[3] 丁寧,李為沖,侯明雨,等. Geoframe地震工區(qū)備份技術(shù)研究與應(yīng)用標(biāo)準(zhǔn)[J].中國石油和化工標(biāo)準(zhǔn)與質(zhì)量,2017,37(22):14-15.
[4] 喻兵良,劉玉紅,劉戀.復(fù)雜勘探區(qū)地震資料處理的關(guān)鍵技術(shù)[J].山東煤炭科技,2017 (11):144-146.
[5] 張良,韓立國,劉爭光,等.基于壓縮感知和Contourlet變換的地震數(shù)據(jù)重建方法[J].石油物探,2017,56(06):804-811.