彭佳琦,王海起,朱 錦,董倩楠,車 磊
(1.中國(guó)石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院,山東 青島 266580;2.中油國(guó)際(阿聯(lián)酋)公司,阿聯(lián)酋 阿布扎比 93785)
油田地理信息和勘探開發(fā)數(shù)據(jù)解析及標(biāo)準(zhǔn)化
彭佳琦1,王海起1,朱 錦2,董倩楠1,車 磊1
(1.中國(guó)石油大學(xué)(華東)地球科學(xué)與技術(shù)學(xué)院,山東 青島 266580;2.中油國(guó)際(阿聯(lián)酋)公司,阿聯(lián)酋 阿布扎比 93785)
建立油田公司地理信息數(shù)據(jù)庫(kù)并創(chuàng)建空間數(shù)據(jù)模型,通常需要解決新老數(shù)據(jù)空間基準(zhǔn)不一致和原始紙質(zhì)、文本文件或其他格式數(shù)據(jù)與面向?qū)ο蟮臄?shù)據(jù)模型格式不兼容兩方面問(wèn)題。以阿聯(lián)酋地區(qū)的油氣田為研究對(duì)象,分析確定了區(qū)域空間參考系統(tǒng),對(duì)油田多源數(shù)據(jù)結(jié)構(gòu)進(jìn)行了分類、解析和歸化,并對(duì)空間數(shù)據(jù)模型進(jìn)行了分類總結(jié),為建立油田地理信息數(shù)據(jù)庫(kù)奠定了數(shù)據(jù)基礎(chǔ)。
數(shù)據(jù)庫(kù);數(shù)據(jù)模型;數(shù)據(jù)解析;數(shù)據(jù)標(biāo)準(zhǔn)化;數(shù)據(jù)管理
該研究區(qū)數(shù)據(jù)源于不同公司在不同年代產(chǎn)生的多種數(shù)據(jù)資料,存在數(shù)據(jù)格式不統(tǒng)一,類型多樣化、空間參考信息和基準(zhǔn)轉(zhuǎn)換參數(shù)不相同或空間參考信息丟失等情況。
1.1 數(shù)據(jù)分類
為了便于數(shù)據(jù)的解析和歸化,首先需要把搜集到的數(shù)據(jù)信息分類列表,歸納為地震采集數(shù)據(jù)、處理解釋數(shù)據(jù)、油田和井位數(shù)據(jù)、陸地地理信息數(shù)據(jù)、海上地理信息數(shù)據(jù)、模型數(shù)據(jù)6大類,其中包括測(cè)量控制點(diǎn)、水系、居民地、交通、油氣管線、各種邊界、地形和油田設(shè)施等所有地面地理信息,以及二維和三維地震采集數(shù)據(jù)、油井錄井?dāng)?shù)據(jù)、油藏構(gòu)造等油田勘探開發(fā)數(shù)據(jù)和地下信息,具體分類如表1??梢?jiàn),數(shù)據(jù)資料包含的格式主要有text、shapefile、dwg、矢量數(shù)據(jù)模型、柵格數(shù)據(jù)模型和紙質(zhì)文件。其中shapefile文件可直接被地理信息數(shù)據(jù)庫(kù)識(shí)別和使用,其他格式的文件需進(jìn)行解析及歸化才能錄入數(shù)據(jù)庫(kù)。
表1 油田多源數(shù)據(jù)分類
1.2 數(shù)據(jù)歸化
針對(duì)需要解析、歸化、規(guī)范、內(nèi)插和轉(zhuǎn)換的數(shù)據(jù),本文制定了標(biāo)準(zhǔn)化改造流程,如圖1所示。
2.1 基準(zhǔn)轉(zhuǎn)換
Nahawan 1967是適合中東地區(qū)的區(qū)域基準(zhǔn),也是本研究很多數(shù)據(jù)的應(yīng)用基準(zhǔn)。由于衛(wèi)星定位技術(shù)的應(yīng)用和發(fā)展,最近十幾年開發(fā)和應(yīng)用的WGS84基準(zhǔn)定義了能與地球完美吻合的橢球,且坐標(biāo)系原點(diǎn)位于地球質(zhì)心(中心),目前被世界各地包括中東地區(qū)廣泛引用。
圖1 數(shù)據(jù)分類、解析、規(guī)范和和建模流程圖
由于各公司技術(shù)要求和工作區(qū)域地理位置均不同,因此遞交的數(shù)據(jù)資料是基于不同基準(zhǔn)和基準(zhǔn)轉(zhuǎn)換參數(shù)的,這會(huì)造成相鄰數(shù)據(jù)重疊區(qū)地理信息不匹配,影響施工生產(chǎn)和勘探開發(fā)設(shè)計(jì)。對(duì)于基準(zhǔn)不同問(wèn)題,本文的解決方案是確認(rèn)原始數(shù)據(jù)應(yīng)用的基準(zhǔn)和基準(zhǔn)轉(zhuǎn)換參數(shù),把所有空間數(shù)據(jù)都轉(zhuǎn)換到WGS84(ITRF 2000.0)基準(zhǔn)面上,這樣在保證地理信息數(shù)據(jù)準(zhǔn)確性的同時(shí),也保證了其共享性,能夠和阿聯(lián)酋境內(nèi)的其他公司以及市政部門應(yīng)用的基準(zhǔn)保持一致。
根據(jù)不同公司不同年代或不同地域應(yīng)用的基準(zhǔn),本文整理計(jì)算了基準(zhǔn)轉(zhuǎn)換參數(shù)表,如表2所示。如果原始數(shù)據(jù)保存有WGS84(ITRF2000.00)坐標(biāo)數(shù)據(jù),則不轉(zhuǎn)換;如果原始數(shù)據(jù)沒(méi)有保留WGS84基準(zhǔn)下的坐標(biāo)數(shù)據(jù)或根本不是通過(guò)WGS84轉(zhuǎn)換過(guò)來(lái)的數(shù)據(jù),將根據(jù)相應(yīng)的基準(zhǔn)轉(zhuǎn)換參數(shù)轉(zhuǎn)換到WGS84(ITRF 2000.0)基準(zhǔn)面上。
2.2 紙質(zhì)文件數(shù)字化及地理配準(zhǔn)
原始資料中大多數(shù)地形圖和海圖以紙質(zhì)形式存在,掃描到電腦后,需要對(duì)其進(jìn)行地理配準(zhǔn)和數(shù)字化處理,使有用信息能夠錄入到地理信息數(shù)據(jù)庫(kù)中。具體的處理流程如圖2所示。
圖2 紙質(zhì)資料數(shù)字化入庫(kù)流程圖
地理配準(zhǔn)是地圖掃描和矢量化至關(guān)重要的環(huán)節(jié),其精度直接影響后期矢量化的精度,從而影響數(shù)據(jù)應(yīng)用的正確性[5]。應(yīng)用ArcGIS提供的創(chuàng)建數(shù)據(jù)、數(shù)據(jù)集合程序、拓?fù)浜透呒?jí)編輯4種工具實(shí)現(xiàn)地形圖和海圖的數(shù)字化。首先對(duì)地形圖和海圖進(jìn)行地理定位,選取柵格圖像控制點(diǎn)進(jìn)行坐標(biāo)匹配和幾何校正[6],賦予空間參考信息和地理坐標(biāo);再創(chuàng)建數(shù)據(jù)文件或數(shù)據(jù)模型;最后通過(guò)編輯幾何圖形和屬性表完成地形圖和海圖的數(shù)字化工作,獲取地理信息。
2.3 補(bǔ)充空間參考信息
矢量數(shù)據(jù)在應(yīng)用和存儲(chǔ)過(guò)程中也有丟失空間參考信息的可能,這些數(shù)據(jù)可以用ArcCatalog重新賦值。柵格數(shù)據(jù)的配準(zhǔn)改變了原來(lái)的坐標(biāo)屬性并賦予了空間參考,而矢量數(shù)據(jù)重新配置空間參考信息只是找回丟失了的空間參考信息,并沒(méi)有改變矢量數(shù)據(jù)原有的幾何文件和幾何屬性,如圖3所示。
圖3 柵格數(shù)據(jù)地理配準(zhǔn)原理
表2 基準(zhǔn)轉(zhuǎn)換參數(shù)表
2.4 數(shù)據(jù)格式轉(zhuǎn)換
早期的油田數(shù)據(jù)多為text文本格式或CAD軟件產(chǎn)生的dwg格式,如井位等坐標(biāo)數(shù)據(jù),多以text文本格式存在;路網(wǎng)、建筑等測(cè)繪信息,多以dwg格式存在。為了統(tǒng)一標(biāo)準(zhǔn)和規(guī)范油田原始數(shù)據(jù),使其能夠被地理信息數(shù)據(jù)庫(kù)所使用,需要對(duì)這些數(shù)據(jù)進(jìn)行轉(zhuǎn)換。
1) text文件的轉(zhuǎn)換。對(duì)于text文件(ASCII碼文本)坐標(biāo)數(shù)據(jù),可以應(yīng)用ArcMap實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換,相當(dāng)于批量導(dǎo)入X、Y坐標(biāo),可將其導(dǎo)出為shapefile文件或其他需求的數(shù)據(jù)格式。通過(guò)編輯功能設(shè)置其屬性信息,并在ArcCatalog編輯元數(shù)據(jù)信息,完成數(shù)據(jù)文件的轉(zhuǎn)換,需注意的是在導(dǎo)入過(guò)程中要配置空間參考。
2)CAD文件的轉(zhuǎn)換。CAD數(shù)據(jù)也是目前建立地理信息數(shù)據(jù)庫(kù)較多的數(shù)據(jù)源,在ArcGIS流行之前的測(cè)量繪圖、土木工程、工業(yè)設(shè)計(jì)都是由CAD相關(guān)產(chǎn)品完成的,因此產(chǎn)生了大量的不同版本不同數(shù)據(jù)格式的dwg或dxf文件。雖然ArcGIS能夠識(shí)別和應(yīng)用,但由于其坐標(biāo)系概念及數(shù)據(jù)存在的形式與本文建立的地理信息數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)化要求有差異,所以需要把CAD數(shù)據(jù)看作原始數(shù)據(jù),做必要的歸化和處理,轉(zhuǎn)換成標(biāo)準(zhǔn)的柵格或矢量數(shù)據(jù)模型。
基于GIS系統(tǒng)的空間參考坐標(biāo)系與CAD數(shù)據(jù)的坐標(biāo)系有根本區(qū)別,CAD只是針對(duì)實(shí)際物體建立模型,使用固定坐標(biāo)系定位數(shù)據(jù)的2D和3D笛卡爾右手坐標(biāo)系,其X、Y、Z坐標(biāo)是相對(duì)于某一個(gè)幾何原點(diǎn)(0,0,0)的位置,且X指向東,Y指向北,通常情況下其坐標(biāo)系的存在形式不能做到直角坐標(biāo)和大地坐標(biāo)或不同基準(zhǔn)之間的正確轉(zhuǎn)換,其坐標(biāo)概念不是地理意義上的坐標(biāo)系。本文是基于地理信息系統(tǒng)和地球信息科學(xué)理論,研究的是地球及地球上所有地物的數(shù)據(jù)模型,某一獨(dú)立個(gè)體針對(duì)特定坐標(biāo)系具有唯一性,所以需對(duì)CAD文件進(jìn)行轉(zhuǎn)換和空間參考信息改造。
CAD數(shù)據(jù)文件轉(zhuǎn)換為地理數(shù)據(jù)庫(kù)數(shù)據(jù)模型,可以在讀取CAD數(shù)據(jù)集的同時(shí)創(chuàng)建相應(yīng)的新的工程圖要素?cái)?shù)據(jù)集,并配置空間坐標(biāo)參考信息。本文應(yīng)用ArcMap模塊CAD到地理數(shù)據(jù)庫(kù)轉(zhuǎn)換工具實(shí)現(xiàn)CAD文件的轉(zhuǎn)換。
2.5 高程數(shù)據(jù)插值
本文研究區(qū)域地震采集資料比較久遠(yuǎn),最早可追溯到1969年的二維資料,在對(duì)這些資料的分析過(guò)程中發(fā)現(xiàn),測(cè)量數(shù)據(jù)大多是常規(guī)測(cè)量資料,由于當(dāng)時(shí)技術(shù)原因,部分物理點(diǎn)高程未實(shí)測(cè)或因存儲(chǔ)設(shè)備問(wèn)題造成部分高程數(shù)據(jù)丟失,對(duì)目前高精度的地震資料處理精度影響較大。由于年代久遠(yuǎn),如果再次通過(guò)野外測(cè)量或衛(wèi)星影像拾取高程數(shù)據(jù),獲取的數(shù)據(jù)并不一定是當(dāng)時(shí)高程的真實(shí)體現(xiàn),因此通過(guò)當(dāng)時(shí)區(qū)域內(nèi)的高程數(shù)據(jù),建立高程模型,在相關(guān)點(diǎn)位提取出當(dāng)時(shí)相應(yīng)物理點(diǎn)的高程數(shù)值并為高程缺失的物理點(diǎn)賦值,才是比較科學(xué)和合理的方法。
本文選取了不規(guī)則三角網(wǎng)(TIN)、反距離權(quán)重法、克里金插值法和樣條函數(shù)插值法進(jìn)行了對(duì)比分析。
通過(guò)高程擬合插值方法,本文針對(duì)研究區(qū)進(jìn)行了局部地震采集數(shù)據(jù)23 377 個(gè)物理點(diǎn)的實(shí)例計(jì)算,建立25 m分辨率的高程模型。通過(guò)ArcGIS提供的數(shù)據(jù)分析提取工具為各個(gè)物理點(diǎn)賦值高程數(shù)據(jù),得到高程精度統(tǒng)計(jì)分析結(jié)果如表3。可以看出,TIN方法存在較多點(diǎn)提取不出高程,而其他3種情況相差不大,相比之下,反距離權(quán)重法效果更好一些。
表3 精度統(tǒng)計(jì)分析表
對(duì)誤差大的點(diǎn)作進(jìn)一步分析,通過(guò)作等值線檢查誤差大于1 m物理點(diǎn)分布情況,等高線和誤差較大的點(diǎn)位分布如圖4所示。對(duì)比發(fā)現(xiàn),兩種方法誤差較大的點(diǎn)多數(shù)分布在等值線變化較大或坡度變化較大的區(qū)域。圖4a的顯著特征是誤差大或提取不出高程的位置基本都在TIN的邊緣地區(qū),可通過(guò)邊緣裁剪或用其他方法建立的高程模型進(jìn)行擬合來(lái)彌補(bǔ)。
圖4 點(diǎn)位精度分布對(duì)比分析圖
雖然表3中的數(shù)據(jù)顯示反距離權(quán)重法結(jié)果最好,但從圖4誤差較大點(diǎn)的分布情況來(lái)看,對(duì)于研究區(qū)域,反距離權(quán)重法并不適合,每一種內(nèi)插擬合方法都有其針對(duì)性和優(yōu)缺點(diǎn)。油田地震采集數(shù)據(jù)物理點(diǎn)具有分布較均勻、地形起伏不大、距離和方向差異不大的特點(diǎn),樣條法可以通過(guò)每一個(gè)取樣點(diǎn),綜合考慮,使用樣條法對(duì)本地區(qū)數(shù)據(jù)高程缺失的點(diǎn)進(jìn)行擬合更加合理。
根據(jù)地理信息數(shù)據(jù)庫(kù)的建設(shè)和數(shù)據(jù)庫(kù)管理的需要,經(jīng)過(guò)數(shù)據(jù)解析、歸化和轉(zhuǎn)換后的數(shù)據(jù)模型將會(huì)以多種格式、種類、層級(jí)存在于不同的地理數(shù)據(jù)庫(kù)中,本文對(duì)矢量數(shù)據(jù)、柵格數(shù)據(jù)和屬性數(shù)據(jù)三大類空間地理數(shù)據(jù)模型進(jìn)行了歸納和分類。
通常情況下,矢量數(shù)據(jù)模型主要是shapefile、地理關(guān)系模型Coverage和地理對(duì)象關(guān)系模型Geodatabase;柵格數(shù)據(jù)模型主要是tiff、jpeg、DEM等文件;屬性數(shù)據(jù)主要為屬性表,包括Access、dBase、Oracle等。圖5為各種空間數(shù)據(jù)模型的全貌圖。
圖5 地理數(shù)據(jù)模型全貌圖
shapefile、Coverage和Geodatabase是矢量數(shù)據(jù)模型發(fā)展3個(gè)階段的代表產(chǎn)品[7](以ESRI公司產(chǎn)品為例),shapefile是ESRI公司推出的沒(méi)有拓?fù)浣Y(jié)構(gòu)的第一代矢量數(shù)據(jù)模型,是一種由若干個(gè)文件組成、空間信息和屬性信息分開存儲(chǔ)的非關(guān)系型數(shù)據(jù)模型;Coverage是第二代矢量數(shù)據(jù)模型,是一種以文件夾形式存在的地理關(guān)系混合數(shù)據(jù)模型;Geodatabase是第三代矢量數(shù)據(jù)模型,是一種將空間對(duì)象的屬性和行為結(jié)合起來(lái)的面向?qū)ο蟮闹悄芑乩韺?duì)象關(guān)系數(shù)據(jù)模型,通常也稱作地理數(shù)據(jù)庫(kù),是為了更好地管理和使用地理要素,按照一定的數(shù)據(jù)模型和規(guī)則組合起來(lái)的存儲(chǔ)空間數(shù)據(jù)和屬性數(shù)據(jù)的數(shù)據(jù)庫(kù)系統(tǒng)[8]。
shapefile、Coverage、Geodatabase的創(chuàng)建、編輯、修改、刪除、重命名和轉(zhuǎn)移等活動(dòng)均可通過(guò)ArcCatalog或ArcTools來(lái)實(shí)現(xiàn)。在用ArcMap模塊對(duì)其修改時(shí),ArcCatalog將自動(dòng)修復(fù)相應(yīng)文件保證其完整性。
地理信息數(shù)據(jù)庫(kù)是建設(shè)數(shù)字油田的基礎(chǔ),而在石油勘探開發(fā)和生產(chǎn)過(guò)程中產(chǎn)生的地震、地質(zhì)和解釋圖件數(shù)據(jù)存在復(fù)雜性、多源性和數(shù)據(jù)量大的特點(diǎn),本文基于ArcGIS平臺(tái),闡述了數(shù)據(jù)資料的整理、分類及標(biāo)準(zhǔn)化過(guò)程;具體介紹了基準(zhǔn)轉(zhuǎn)換、紙質(zhì)文件地理配準(zhǔn)及數(shù)字化、不同文件格式的轉(zhuǎn)換、高程數(shù)據(jù)擬合方法和創(chuàng)建數(shù)據(jù)模型的方法,為油田公司建立地理信息數(shù)據(jù)庫(kù)和創(chuàng)建數(shù)據(jù)庫(kù)模型提供了具體解決方案。
[1] 劉穎, 李樹軍. GIS數(shù)據(jù)庫(kù)與普通地理數(shù)據(jù)庫(kù)[J].海洋測(cè)繪, 2001(3)∶52-54
[2] 梁世友.油氣勘探項(xiàng)目信息系統(tǒng)的分析與設(shè)計(jì)[J]. 地理空間信息, 2009,7(3)∶56-58
[3] 萬(wàn)劍華,陶為翔.現(xiàn)代測(cè)繪技術(shù)在油氣田生產(chǎn)與管理中的應(yīng)用[J].測(cè)繪與空間地理信息,2007,30(6)∶9-11
[4] 胡玲.城市規(guī)劃管理信息系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].成都∶電子科技大學(xué), 2006
[5] 李晶,王耀強(qiáng),包亮,等.運(yùn)用ArcGIS9.0 ArcMap進(jìn)行內(nèi)蒙古地質(zhì)圖柵格數(shù)據(jù)矢量化[J].中國(guó)科技信息,2010(9)∶118-119
[6] 李崢.基于ArcEngine的柵格數(shù)據(jù)批量配準(zhǔn)、坐標(biāo)系轉(zhuǎn)換及裁切功能的研發(fā)[J].林業(yè)勘察設(shè)計(jì),2011(2)∶58-63
[7] 張佐幫,尚穎娟.基于Geodatabase的面向?qū)ο罂臻g數(shù)據(jù)庫(kù)設(shè)計(jì)[J].地理空間信息,2005,3(2)∶33-35
[8] 張耀波,張遷.基于Geodatabase海量地理信息數(shù)據(jù)的組織與管理[J].地理空間信息,2011,9(3)∶44-46
P208
B
1672-4623(2016)09-0019-04
10.3969/j.issn.1672-4623.2016.09.006在現(xiàn)代化工業(yè)大生產(chǎn)背景下,油田公司的管理早已從傳統(tǒng)的召開會(huì)議制定解決方案、下達(dá)文件、決策執(zhí)行向即時(shí)獲取信息、自動(dòng)化科學(xué)決策和快速反應(yīng)方向發(fā)展。建立油氣田地理數(shù)據(jù)庫(kù)是油田數(shù)字化和智能化的基礎(chǔ),也是有效應(yīng)用空間數(shù)據(jù)和屬性數(shù)據(jù)進(jìn)行分析、模擬和決策的依據(jù)[1]。石油勘探成果多以紙質(zhì)形式保存,也存在一些計(jì)算機(jī)資料處理系統(tǒng),但這些系統(tǒng)相對(duì)獨(dú)立,存在“信息孤島”現(xiàn)象,現(xiàn)有的管理方式不利于資料共享與利用[2]。數(shù)據(jù)資料存在空間基準(zhǔn)不一致,以及紙質(zhì)、文本文件或其他格式數(shù)據(jù)與面向?qū)ο蟮臄?shù)據(jù)模型不兼容問(wèn)題,因此在建立地理信息數(shù)據(jù)庫(kù)前,需將數(shù)據(jù)資料進(jìn)行分類、解析和歸化,篩選出正確的數(shù)據(jù)信息,改正錯(cuò)誤的數(shù)據(jù)資料,且要對(duì)數(shù)據(jù)結(jié)構(gòu)和模型進(jìn)行標(biāo)準(zhǔn)化改造[3-4]。本文以阿聯(lián)酋地區(qū)油氣田為例,論述了油氣田地理信息數(shù)據(jù)資料的整理分類、解析、歸化及空間數(shù)據(jù)模型的創(chuàng)建方法。
彭佳琦,碩士研究生,研究方向?yàn)閿?shù)字油田。
2016-01-05。
項(xiàng)目來(lái)源:國(guó)家自然科學(xué)基金資助項(xiàng)目(41471322);山東省自然科學(xué)基金資助項(xiàng)目(ZR2012DM010)。