崔海福,何貞銘,王寧
(長(zhǎng)江大學(xué) 地球科學(xué)學(xué)院,武漢 430100)
?
大數(shù)據(jù)在石油行業(yè)中的應(yīng)用
崔海福,何貞銘,王寧
(長(zhǎng)江大學(xué) 地球科學(xué)學(xué)院,武漢 430100)
摘要:隨著石油勘探與開發(fā)難度的日益增大,信息化的成熟度成為影響石油行業(yè)提高出產(chǎn)量的關(guān)鍵因素,而信息化則是有效利用大數(shù)據(jù)技術(shù)把大量的數(shù)據(jù)有效地管理起來。總結(jié)了大數(shù)據(jù)在地震勘探、地質(zhì)研究、生產(chǎn)開發(fā)和安全管理等方面的應(yīng)用,指出基于大數(shù)據(jù)的并行處理技術(shù)、神經(jīng)網(wǎng)絡(luò)算法、聚類分析等方法可以用來提高石油勘探效率、降低生產(chǎn)與開發(fā)成本,并以Hadoop框架為例介紹了海量數(shù)據(jù)并行處理的技術(shù)。
關(guān)鍵詞:大數(shù)據(jù)石油行業(yè)信息化數(shù)據(jù)處理
油氣的勘探、生產(chǎn)、運(yùn)輸和安全管理等過程都需要有數(shù)據(jù)作為實(shí)踐的支撐,這些數(shù)據(jù)不僅量大,而且類型復(fù)雜,稱得上是大數(shù)據(jù)。它同樣涵蓋了大數(shù)據(jù)的 “5V”(Volume, Velocity, Variety, Veracity, Value)特征[1]: 1) 數(shù)據(jù)體量大,海量的數(shù)據(jù)以TB, PB, EB為單位;2) 數(shù)據(jù)的快速流轉(zhuǎn),伴隨著油田設(shè)置的更新、傳感器網(wǎng)絡(luò)的安裝,數(shù)據(jù)的產(chǎn)生、更新和處理速度變快;3) 數(shù)據(jù)的多樣性,由于數(shù)據(jù)來源與數(shù)據(jù)類型變多,產(chǎn)生如文本、圖片、視頻等結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);4) 數(shù)據(jù)的不確定性,由于數(shù)據(jù)的噪音、缺失、不一致性、歧義等因素,易對(duì)數(shù)據(jù)的真實(shí)性造成影響;5) 巨大的數(shù)據(jù)價(jià)值,大數(shù)據(jù)的終極目標(biāo)在于從數(shù)據(jù)中挖掘價(jià)值。這與石油行業(yè)利用數(shù)據(jù)準(zhǔn)確地找到更多的石油目標(biāo)是一致的,因而大數(shù)據(jù)技術(shù)可以貫穿石油行業(yè)從上游到下游的整個(gè)領(lǐng)域。具體而言,油田大數(shù)據(jù)涵蓋了地震、鉆井、測(cè)井、錄井、試油試采、分析化驗(yàn)、油層改造和開發(fā)生產(chǎn)的動(dòng)態(tài)數(shù)據(jù)[2-4],包括現(xiàn)場(chǎng)的原始采集數(shù)據(jù)、經(jīng)過專業(yè)人員處理的數(shù)據(jù)以及最終形成的知識(shí)成果。而數(shù)據(jù)格式也很多樣,包括數(shù)據(jù)表、文本、圖件、報(bào)表和例如地震數(shù)據(jù)等的大數(shù)據(jù)體。下文將詳細(xì)闡述大數(shù)據(jù)在地震勘探、地質(zhì)研究、生產(chǎn)開發(fā)、油氣輸送和安全管理等領(lǐng)域的具體應(yīng)用。
1地震勘探
大數(shù)據(jù)在勘探領(lǐng)域的應(yīng)用主要體現(xiàn)在地震勘探數(shù)據(jù)的存儲(chǔ)、綜合處理和成像等方面。地球物理勘探包括地球物理數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)分析解釋三個(gè)環(huán)節(jié)[5-6]。地震資料的內(nèi)涵就是數(shù)據(jù),通過數(shù)據(jù)可以反映地質(zhì)結(jié)構(gòu)、地層變化,通過數(shù)據(jù)可以為油氣勘探開發(fā)提供重要依據(jù)。新的地震數(shù)據(jù)采集方法可以使采集覆蓋次數(shù)由幾十次增至幾千次,數(shù)據(jù)體會(huì)成幾何倍數(shù)增長(zhǎng)。同時(shí),物探裝備技術(shù)的不斷進(jìn)步,實(shí)現(xiàn)了高效采集和施工方法的巨大跨越,一定程度上使得數(shù)據(jù)量快速膨脹。海量數(shù)據(jù)形成之后,對(duì)處理方法要求很高,且針對(duì)不同的區(qū)塊和數(shù)據(jù),需要不同的參數(shù)和流程組合,這就要求對(duì)于海量數(shù)據(jù)需要反復(fù)試驗(yàn),一個(gè)參數(shù)的試驗(yàn)可能需要耗費(fèi)幾天甚至更久。因此,傳統(tǒng)的數(shù)據(jù)處理環(huán)境已不能滿足海量數(shù)據(jù)的處理要求。
面對(duì)大量數(shù)據(jù)的管理與處理的問題,大數(shù)據(jù)的模式識(shí)別分析方法、數(shù)據(jù)的并行處理技術(shù)等都可為石油勘探所用。大數(shù)據(jù)時(shí)代的地震勘探的發(fā)展方向表現(xiàn)在如下四個(gè)方面: 對(duì)地震儀器的嚴(yán)格要求,因?yàn)槠涫窍拗凭蘖康卣饠?shù)據(jù)采集的關(guān)鍵,也關(guān)系到野外生產(chǎn)組織管理方式、數(shù)據(jù)質(zhì)量、施工效率、生產(chǎn)成本等,應(yīng)選擇輕便的網(wǎng)絡(luò)化地震采集儀器來適應(yīng)大數(shù)據(jù)時(shí)代;對(duì)可控震源有效采集技術(shù)的推廣,同樣有利于在大數(shù)據(jù)環(huán)境下提高工作效率并降低成本;采用量化的質(zhì)量監(jiān)控軟件,可大幅提升數(shù)據(jù)質(zhì)量評(píng)價(jià)的可靠性;高速發(fā)展的計(jì)算機(jī)技術(shù)也可為巨量地震數(shù)據(jù)的處理與解釋提供重要保障。總之,要重視大數(shù)據(jù)處理與解釋的環(huán)境建設(shè),提高海量地震數(shù)據(jù)的處理能力,并不斷開展大數(shù)據(jù)下的信息挖掘技術(shù)研究,以提高油氣識(shí)別的精度,最終達(dá)到提高石油勘探準(zhǔn)確性的目的。
2地質(zhì)研究
在對(duì)某一區(qū)塊進(jìn)行地質(zhì)研究之前,要首先了解該地區(qū)的地貌特質(zhì)和地質(zhì)狀況,查看條件是否適合布井、是否存在發(fā)生自然災(zāi)害的可能性,同時(shí)還要對(duì)該區(qū)塊目的層位的勘探資料進(jìn)行了解,這其中包括地震層位和斷層的解釋。其次要對(duì)研究區(qū)的井位資料進(jìn)行收集,包括鉆井、錄井、測(cè)井曲線、試油等[7-9],這些有助于認(rèn)識(shí)研究區(qū)目的層位的沉積相特征、物性特征以及電性特征等。除此之外,還要對(duì)研究區(qū)的產(chǎn)能狀況進(jìn)行了解,包括注水等生產(chǎn)動(dòng)態(tài)以及儲(chǔ)量數(shù)據(jù)。以上這些數(shù)據(jù)涵蓋了幾十類甚至上百類的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)。因此,要針對(duì)這些數(shù)據(jù)的存儲(chǔ)與管理,從它們的類別、類型、訪問方式等考慮,構(gòu)建一體化的數(shù)據(jù)管理模型,保證大數(shù)據(jù)的高質(zhì)量、高性能、高可用性,充分發(fā)揮大數(shù)據(jù)的價(jià)值。
特別在地質(zhì)儲(chǔ)層研究中,大數(shù)據(jù)技術(shù)中的一些分析方法可以作為儲(chǔ)層研究的手段。例如可以采用聚類分析的算法,選取平均喉道半徑、啟動(dòng)壓力梯度、可動(dòng)流體飽和度等參數(shù)對(duì)儲(chǔ)層多孔介質(zhì)進(jìn)行分類;同時(shí)可對(duì)地震的屬性進(jìn)行聚類分析,通過總結(jié)已知含油區(qū)的相似屬性特征來劃分有利的含油區(qū),以達(dá)到預(yù)測(cè)未知的含油區(qū)的目的。
3生產(chǎn)開發(fā)
油田數(shù)字化進(jìn)程極大程度上提高了油田的產(chǎn)量,且隨著數(shù)字化程度的提高,更多“隱藏”的數(shù)據(jù)被利用起來。據(jù)了解,數(shù)字油田被完全優(yōu)化后至少可提高6%的采收率和8%的油氣產(chǎn)量。在油氣生產(chǎn)領(lǐng)域,通過對(duì)大量歷史數(shù)據(jù)的分析,預(yù)測(cè)未來數(shù)據(jù)的走向,可以極大限度地提高采收率、油氣產(chǎn)量;同時(shí),通過綜合分析地震、鉆井和生產(chǎn)數(shù)據(jù),可以使得生產(chǎn)服務(wù)更加智能。例如,通過分析油田生產(chǎn)中的各種大數(shù)據(jù),可以得出產(chǎn)量、壓力等參數(shù)隨時(shí)間變化的趨勢(shì),據(jù)此作為改變開發(fā)方法的決策支持。還有學(xué)者在數(shù)據(jù)倉庫的基礎(chǔ)之上,采用決策樹分析方法、聚類分析法、神經(jīng)網(wǎng)絡(luò)等算法建立起油氣數(shù)據(jù)的挖掘模型,對(duì)大量的、多維的、多源的數(shù)據(jù)進(jìn)行了關(guān)聯(lián)分析與預(yù)測(cè)工作[10-11]。例如,用戶可以挖掘滲透率、有效厚度、生產(chǎn)壓差、含氣飽和度等各參數(shù)與油井產(chǎn)能的關(guān)聯(lián)度,并建立一個(gè)有關(guān)油井產(chǎn)能的模型。之后根據(jù)模型將自己感興趣的參數(shù)作為輸入值,油井產(chǎn)量作為預(yù)測(cè)值,進(jìn)一步預(yù)測(cè)油井產(chǎn)量在某些特定因素下的發(fā)展趨勢(shì)。這些預(yù)測(cè)結(jié)果可以用曲線、數(shù)據(jù)表等形式進(jìn)行展示,從而為油氣的生產(chǎn)和決策提供重要的依據(jù)。
4油氣輸送
油氣管道在設(shè)計(jì)、建設(shè)和運(yùn)營(yíng)過程中會(huì)積累大量數(shù)據(jù),從而可為管道安全分析、評(píng)價(jià)與管理提供數(shù)據(jù)支持。而目前國(guó)內(nèi)管道數(shù)據(jù)庫及信息管理系統(tǒng)存在一定問題,直接影響到數(shù)據(jù)高效、全面的應(yīng)用[12-13],主要表現(xiàn): 數(shù)據(jù)的記錄形式多樣,標(biāo)準(zhǔn)不一;缺乏綜合統(tǒng)一的信息管理平臺(tái),各環(huán)節(jié)的數(shù)據(jù)比較孤立,難以整合;數(shù)據(jù)采集環(huán)節(jié)標(biāo)準(zhǔn)不一,難以確保數(shù)據(jù)的高質(zhì)量。面對(duì)管道大數(shù)據(jù)存在的這些問題,筆者認(rèn)為應(yīng)充分利用大數(shù)據(jù)技術(shù),來解決管道管理中的問題。大數(shù)據(jù)在油氣管道行業(yè)的應(yīng)用及發(fā)展方向應(yīng)該是通過對(duì)大數(shù)據(jù)挖掘分析得出的結(jié)論,對(duì)管道進(jìn)行風(fēng)險(xiǎn)判定和預(yù)控,并有計(jì)劃地修復(fù)管道缺陷,為其生產(chǎn)決策服務(wù)。
以大數(shù)據(jù)在管道腐蝕調(diào)查和處理中的應(yīng)用為例,傳統(tǒng)的風(fēng)險(xiǎn)評(píng)估方法通常會(huì)基于管道內(nèi)外監(jiān)測(cè)數(shù)據(jù)對(duì)所有的疑似腐蝕點(diǎn)進(jìn)行開挖施工,造成工作量巨大、不能全面排查所有的腐蝕點(diǎn)的后果?;诖髷?shù)據(jù)的管道監(jiān)控,則可以在管道數(shù)據(jù)庫建立的基礎(chǔ)之上統(tǒng)計(jì),將與管道腐蝕相關(guān)的數(shù)據(jù)進(jìn)行篩查分析,按其對(duì)腐蝕的影響程度進(jìn)行權(quán)重排序,這其中可能包括建設(shè)公司施工條件、管道地下應(yīng)力狀態(tài)、材質(zhì)、地質(zhì)條件、天氣狀況以及土壤腐蝕性等因素。當(dāng)某段管道材質(zhì)差、土壤腐蝕性強(qiáng)、地下應(yīng)力水平高、施工時(shí)管道有損傷時(shí),其發(fā)生腐蝕的幾率更大。因此,根據(jù)以上影響因素,可以按照不同管段發(fā)生腐蝕的概率進(jìn)行排序,對(duì)其進(jìn)行劃分等級(jí),篩選出可能導(dǎo)致事故發(fā)生的腐蝕點(diǎn)。通過對(duì)這些腐蝕點(diǎn)的開挖驗(yàn)證,確定腐蝕點(diǎn)的腐蝕情況,并根據(jù)開挖結(jié)果修正之前的判定模型,制訂相應(yīng)的維修方案。綜上所述,根據(jù)基于大數(shù)據(jù)分析的管道安全管理的過程,結(jié)合管道大數(shù)據(jù)的挖掘應(yīng)用,可全面識(shí)別管道風(fēng)險(xiǎn),減少開挖數(shù)量,從而達(dá)到提升工作效率、節(jié)約成本、提高管道安全管理水平的目的。
5安全管理
安全管理涉及對(duì)油氣生產(chǎn)中各種參數(shù)的分析,可以預(yù)知可能出現(xiàn)的問題,及早做出防范舉措。石油產(chǎn)業(yè)的下游要解決輸送、轉(zhuǎn)運(yùn)、銷售和管理等環(huán)節(jié),隨著生產(chǎn)能力和規(guī)模的逐年擴(kuò)大,生產(chǎn)存儲(chǔ)設(shè)備向大型化和規(guī)?;茏儯瑢?dǎo)致危險(xiǎn)因素也逐漸變多,無論是制度缺陷、設(shè)備隱患、程序遺漏、工作疏忽或者個(gè)人的違章操作都有可能造成重大事故。目前,在安全管理領(lǐng)域?qū)?shù)據(jù)的挖掘和利用還很匱乏,因而有必要從海量數(shù)據(jù)中挖掘出人的不安全行為、物的不安全狀態(tài)、管理的漏洞等有用的信息,從而找出事故發(fā)生的規(guī)律,來提高安全生產(chǎn)的管理水平。
先見性修復(fù)是海洋油氣建造管理當(dāng)中的一項(xiàng)重要任務(wù)。由于鉆井平臺(tái)距離陸地的距離較遠(yuǎn),人員及設(shè)備的運(yùn)輸比較耗時(shí)。因此,在深海設(shè)備發(fā)生損壞之前,必須留足時(shí)間進(jìn)行修復(fù)工作的準(zhǔn)備。如果時(shí)間提前太早,會(huì)釀成資源浪費(fèi);若等到設(shè)備發(fā)生故障之后再進(jìn)行處理,則會(huì)耗費(fèi)時(shí)間耽誤工程進(jìn)度。隨著設(shè)施的運(yùn)行,系統(tǒng)輸出的數(shù)據(jù)質(zhì)量也會(huì)隨著時(shí)間降低。因此,可以利用數(shù)學(xué)分析方法,根據(jù)監(jiān)測(cè)設(shè)備反饋的數(shù)據(jù)來獲知系統(tǒng)的運(yùn)行情況[14]。例如,大數(shù)據(jù)監(jiān)測(cè)技術(shù)可以對(duì)平臺(tái)的上千個(gè)零部件的振幅、溫度、轉(zhuǎn)速和油壓等進(jìn)行實(shí)時(shí)監(jiān)測(cè),并推測(cè)其運(yùn)行狀態(tài),據(jù)此設(shè)計(jì)維修計(jì)劃。
6結(jié)論
無論是在油氣的勘探、生產(chǎn),還是運(yùn)輸、管理中,都會(huì)產(chǎn)生海量的數(shù)據(jù),并且需要對(duì)這些數(shù)據(jù)進(jìn)行快速有效地處理。而大數(shù)據(jù)技術(shù)恰恰可以提供這種功能,比如現(xiàn)在比較流行的Hadoop就是一個(gè)分布式系統(tǒng)的基礎(chǔ)架構(gòu),石油行業(yè)可以充分利用Hadoop框架來構(gòu)建符合自己需求的數(shù)據(jù)處理系統(tǒng)。主要包括HDFS,MapReduce,HBase,其中HDFS和MapReduce是其核心設(shè)計(jì)。HDFS是對(duì)海量的數(shù)據(jù)提供了存儲(chǔ),而MapReduce為海量的數(shù)據(jù)提供了計(jì)算,它們之間相互獨(dú)立,工作時(shí)互不影響,這就極大地提高了數(shù)據(jù)的存儲(chǔ)與處理的速度。MapReduce將所有針對(duì)海量異構(gòu)數(shù)據(jù)的操作
抽象為兩種操作,即Map和Reduce。Map就是一個(gè)映射過程,它是對(duì)列表中的每一個(gè)相對(duì)獨(dú)立元素進(jìn)行一定條件的操作,比如對(duì)一個(gè)成績(jī)列表中的每一項(xiàng)數(shù)據(jù)都加1,在這個(gè)運(yùn)算過程中數(shù)據(jù)表的每一個(gè)元素都是獨(dú)立進(jìn)行操作的,原來的列表并沒有被修改,原因是這里新建了一個(gè)表來保存修改后的結(jié)果。因此,Map高度并行的操作特點(diǎn)可以滿足高性能要求的應(yīng)用,并且會(huì)極大地提高并行計(jì)算的效率。Reduce是一個(gè)化簡(jiǎn)的過程,它是對(duì)列表中的元素進(jìn)行適當(dāng)?shù)睾喜?,例如?dāng)對(duì)成績(jī)列表求平均分時(shí),通過定義求和函數(shù)使每一個(gè)元素與相鄰的元素進(jìn)行相加,這樣遞歸運(yùn)算直到剩最后一個(gè)總數(shù),最后用這個(gè)數(shù)除以總?cè)藬?shù)就得到了平均分?jǐn)?shù)。雖然Reduce在并行運(yùn)算上不及Map函數(shù),但由于其答案相對(duì)簡(jiǎn)單并且具有運(yùn)算的獨(dú)立性,使Reduce函數(shù)在大規(guī)模高度并行環(huán)境下是非常有用的??傊€有很多的大數(shù)據(jù)技術(shù)可以應(yīng)用在石油領(lǐng)域,將會(huì)帶來一定的經(jīng)濟(jì)效益,未來可以發(fā)掘更多的技術(shù)算法,為國(guó)內(nèi)的石油工業(yè)服務(wù)。
參考文獻(xiàn):
[1]李清泉,李德仁.大數(shù)據(jù)GIS[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2014,39(06): 641-644.
[2]曾慶猛,王冬梅,姚子修,等.中石油A1系統(tǒng)PCEDM數(shù)據(jù)模型基本實(shí)體初步研究[J].勘探地球物理進(jìn)展,2008,31(06): 464-466.
[3]文必龍,肖波,陳新榮,等.石油勘探開發(fā)數(shù)據(jù)元管理技術(shù)[J].大慶石油學(xué)院學(xué)報(bào),2012,36(01): 83-87.
[4]李明巖.大數(shù)據(jù)技術(shù)在油氣上游領(lǐng)域廣泛應(yīng)用[J].中國(guó)石化,2014(12): 66-68.
[5]王喜雙,趙邦六,董世泰,等.油氣工業(yè)地震勘探大數(shù)據(jù)面臨的挑戰(zhàn)及對(duì)策[J].中國(guó)石油勘探,2014,19(04): 43-47.
[6]王曉麗,孟祥龍,時(shí)玉龍,等.地震大數(shù)據(jù)的管理與應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2014(01): 205-206.
[7]李偉,趙春宇.油田勘探開發(fā)“大數(shù)據(jù)”管理及應(yīng)用[J].信息技術(shù),2013(04): 197-198.
[8]王兵,張文生.地質(zhì)油藏?cái)?shù)據(jù)信息化管理思路[J].中國(guó)石油和化工,2013(09): 57-59.
[9]趙貴菊,王彥春,崔其山,等.石油勘探開發(fā)一體化數(shù)據(jù)倉的建立和應(yīng)用[J].物探與化探,2010,34(01): 108-110.
[10]檀朝東,岳晶晶,吳麗烽,等.數(shù)據(jù)挖掘技術(shù)在油藏挖掘者軟件中的應(yīng)用[J].中國(guó)石油和化工,2010(10): 66-67.
[11]檀朝東,陳見成,劉志海,等.大數(shù)據(jù)挖掘技術(shù)在石油工程的應(yīng)用前景展望[J].中國(guó)石油和化工,2015(01): 49-51.
[12]崔濤,馮慶善,楊祖佩,等.新建管道完整性管理理念探索[J].油氣儲(chǔ)運(yùn),2008,27(10): 4-8.
[13]王維斌.長(zhǎng)輸油氣管道大數(shù)據(jù)管理架構(gòu)及應(yīng)用[J].油氣儲(chǔ)運(yùn),2015(03): 229-232.
[14]王兵.談大數(shù)據(jù)監(jiān)測(cè)在海洋油氣設(shè)備管理中的應(yīng)用[J].電子測(cè)試,2014(03): 139-141.
Application of Big Data in Petroleum Industry
Cui Haifu, He Zhenming, Wang Ning
(College of Geosciences, Yangtze University, Wuhan, 430100, China)
Abstract:With difficulty increasing of exploration and development in petroleum industry, maturity of information technology has become primary factor affecting output growth rate of petroleum industry. Big data is an important technology which is used to manage data efficiently. Application of big data in seismic exploration, geological research, production development, safety management and so on is summarized parallel processing technology, neural network algorithm and cluster analysis based on big data can be used to improve petroleum exploration efficiency and reduce production and development cost.Massive data parallel processing technology is introduced by taking Hadoop framework as example.
Key words:big data; petroleum industry; informatization; data processing
作者簡(jiǎn)介:崔海福(1987—),女,吉林琿春人,長(zhǎng)江大學(xué)在讀碩士研究生,主要從事油田GIS技術(shù)的應(yīng)用研究。
中圖分類號(hào):TP311
文獻(xiàn)標(biāo)志碼:B
文章編號(hào):1007-7324(2016)02-0043-03
稿件收到日期: 2005-12-01。