劉陽 曾鵬 于海斌
摘要:認(rèn)為工業(yè)物聯(lián)網(wǎng)技術(shù)在油田生產(chǎn)信息的實(shí)時獲取和即時分析等方面具有重要作用。建議引入語義技術(shù),構(gòu)建覆蓋油田勘探、開發(fā)、生產(chǎn)、運(yùn)營等全流程的語義集成平臺,實(shí)現(xiàn)對智慧油田的實(shí)時分析,為油田生產(chǎn)運(yùn)行參數(shù)實(shí)時優(yōu)化調(diào)整提供支持。此外,還詳細(xì)介紹了工業(yè)物聯(lián)網(wǎng)語義集成平臺的架構(gòu)及關(guān)鍵技術(shù),指出其將是未來智慧油田信息集成的重要發(fā)展方向。
關(guān)鍵詞:智慧油田;語義技術(shù);工業(yè)物聯(lián)網(wǎng);信息檢索;數(shù)據(jù)優(yōu)化;數(shù)據(jù)分析
Abstract: Industrial Internet of things plays an important role in real time getting and analysis of the production information for the oil filed. By inducing the semantic technology, a semantic-based integrated platform can be built, including exploring, developing, producing and operating of the oil field. In this way, real time analytics of the smart oil field and real time optimization of the production parameters can be realized. Moreover, the framework and key technologies for industrial Internet of things semantic integration are detailed, and an important developing direction for information integration of the smart oil field is provided.
Key words: smart oil field; semantic technology; industrial Internet of things; information retrieval; data analysis; data optimization
工業(yè)物聯(lián)網(wǎng)可以實(shí)現(xiàn)對工業(yè)生產(chǎn)制造全流程的泛在感知與控制,已經(jīng)成為企業(yè)降低人工成本,減少生產(chǎn)消耗,保證設(shè)備可靠性,提高產(chǎn)品質(zhì)量,以及增強(qiáng)核心競爭力的主要手段。
智慧油田是工業(yè)物聯(lián)網(wǎng)技術(shù)在油田領(lǐng)域的延伸與應(yīng)用,其在數(shù)字油田的信息化和互聯(lián)化等基礎(chǔ)上,進(jìn)一步實(shí)現(xiàn)了信息管理的物聯(lián)化以及智能化。
進(jìn)入高含水后期開采階段后,中國油田產(chǎn)液量大幅度上升,面臨著液油比急劇增高,地面工程難以適應(yīng),維持油田穩(wěn)產(chǎn)的措施工作量和費(fèi)用明顯增加等諸多困難。因此,中國智慧油田的目標(biāo)是依據(jù)油井工況、地下油藏變化及國際油價形勢實(shí)時修正注采井作業(yè)參數(shù),優(yōu)化調(diào)整采油過程,實(shí)現(xiàn)節(jié)能運(yùn)行,提升油田采收率與經(jīng)濟(jì)效益。
智慧油田的發(fā)展需要依托工業(yè)物聯(lián)網(wǎng)對油田生產(chǎn)信息全面控制,對覆蓋油田勘探、開發(fā)、生產(chǎn)、運(yùn)營及外部環(huán)境因素等全流程的各類信息系統(tǒng)進(jìn)行集成,并統(tǒng)一分析與反饋,形成閉環(huán)式智慧油田運(yùn)行模式,如圖1所示。
當(dāng)前,各類油田信息系統(tǒng)中的數(shù)據(jù)以不同形式存儲。而語義作為數(shù)據(jù)含義和關(guān)聯(lián)關(guān)系的表征技術(shù),可實(shí)現(xiàn)對異構(gòu)系統(tǒng)中數(shù)據(jù)的統(tǒng)一理解及深層關(guān)聯(lián)的建立。因此,基于工業(yè)物聯(lián)網(wǎng)的智慧油田數(shù)據(jù)語義集成具有廣闊的研究前景。
1 語義集成架構(gòu)
1.1 語義集成概念
語義集成,又稱為語義互操作,強(qiáng)調(diào)在一定語義下實(shí)現(xiàn)信息的互操作。文獻(xiàn)[1]提出了一種語義集成的定義:系統(tǒng)之間能夠消除來自于不同信息源的語義異構(gòu),從而實(shí)現(xiàn)信息的共享與集成的機(jī)制。從語義集成的定義可知語義集成具有以下3個特點(diǎn):(1)信息源多樣性,互操作的信息可能會來自于兩個或以上的信息源;(2)系統(tǒng)之間可以相互理解來自對方信息的含義;(3)系統(tǒng)之間可以共享和交換信息。語義集成的關(guān)鍵在于系統(tǒng)之間可以理解信息的含義。而信息源之間產(chǎn)生的異構(gòu)可以分為語法異構(gòu)(數(shù)據(jù)格式不同),結(jié)構(gòu)異構(gòu)(不同的信息源存儲數(shù)據(jù)的結(jié)構(gòu)不同),以及語義異構(gòu)(同一概念在不同系統(tǒng)中有不同的語義,不同的概念在不同的系統(tǒng)中有相同的語義)。采用XML和Web Service可以很好的解決語法異構(gòu)和結(jié)構(gòu)異構(gòu)的問題,至于語義異構(gòu)的問題則可以通過本體來解決[2]。
本體是一個領(lǐng)域中概念顯示的形式化規(guī)約。本體主要是由類、屬性、實(shí)例以及公理組成[3],為不同實(shí)體之間信息的共享、重用和交互提供共同的理解。本體部署有3種不同的結(jié)構(gòu)方法:單本體結(jié)構(gòu)、多本體結(jié)構(gòu)和混合本體結(jié)構(gòu)[4]。單本體結(jié)構(gòu)方法只使用一個全局本體提供可共享的詞匯表。不同來源的信息源都使用這個共同的全局本體獲得信息的語義描述,從而解決了不同信息源語義異構(gòu)的問題,實(shí)現(xiàn)了不同系統(tǒng)之間的語義集成。利用該本體結(jié)構(gòu)的一個比較顯著的實(shí)例是多源單接口(SIMS)[5],SIMS模型采用一個分層的術(shù)語知識庫,用節(jié)點(diǎn)表示對象、動作和狀態(tài)。但是單本體結(jié)構(gòu)在使用時有很大的局限性,由于要使用同一個全局本體,這些信息源要提供相似領(lǐng)域的信息,并且不適合信息源動態(tài)變化的情況;多本體結(jié)構(gòu)中,每個信息源的語義都是由自己本地的局部本體描述的,這些局部本體之間不一定共享相同的詞匯表,信息源之間的語義異構(gòu)是通過不同局部本體的映射解決的。如OBSERVER系統(tǒng)就是由多個局部本體描述系統(tǒng)內(nèi)不同信息源的語義。對于多本體結(jié)構(gòu)而言,本體間的映射是一項很繁瑣的工作,尤其是在不同局部本體之間語義異構(gòu)很嚴(yán)重的情況下。針對語義集成中單本體結(jié)構(gòu)和多本體結(jié)構(gòu)方法存在的缺點(diǎn),又提出了混合本體結(jié)構(gòu)的方法。與多本體結(jié)構(gòu)相類似,混合本體結(jié)構(gòu)中每個信息源的語義信息都是由他們局部本體描述的,為解決不同本體間語義異構(gòu)的問題,混合本體結(jié)構(gòu)又在局部本體上層構(gòu)建了全局共享詞匯表,共享詞匯表也可以是一個本體[6]。
1.2 面向智慧油田的語義集成架構(gòu)
隨著智慧油田的發(fā)展,油田開發(fā)的數(shù)據(jù)資源越來越豐富,已經(jīng)成為一個巨大的信息倉庫,各不同系統(tǒng)內(nèi)數(shù)據(jù)具有半結(jié)構(gòu)性、異構(gòu)性以及分布性等特點(diǎn),需要將數(shù)據(jù)提供統(tǒng)一的模式進(jìn)行集成管理。為此,本文提出了面向智慧油田的語義集成的3層架構(gòu),如圖2所示。
現(xiàn)場數(shù)據(jù)采集層是智慧油田中數(shù)據(jù)的來源,其綜合考慮了國際油價、開采成本等外部因素,以及油藏結(jié)構(gòu)、測井?dāng)?shù)據(jù)、注采工況等物理因素的影響。采集的數(shù)據(jù)包括了實(shí)時數(shù)據(jù)以及歷史數(shù)據(jù),數(shù)據(jù)類型上有文件數(shù)據(jù)以及關(guān)系型數(shù)據(jù)等?,F(xiàn)場數(shù)據(jù)采集層是該架構(gòu)的基礎(chǔ),為語義集成提供了數(shù)據(jù)源。
語義集成層是實(shí)現(xiàn)智慧油田的關(guān)鍵技術(shù),主要包括數(shù)據(jù)語義轉(zhuǎn)換、語義關(guān)聯(lián)檢索引擎以及油田領(lǐng)域知識庫這3個部分。其中,數(shù)據(jù)語義轉(zhuǎn)換需要對異構(gòu)的油田全流程信息進(jìn)行統(tǒng)一語義建模,對數(shù)據(jù)的統(tǒng)一使用模式提供支持;語義關(guān)聯(lián)檢索引擎實(shí)現(xiàn)對具有關(guān)聯(lián)關(guān)系的油田各系統(tǒng)數(shù)據(jù)進(jìn)行統(tǒng)一檢索功能,降低數(shù)據(jù)集成難度;油田領(lǐng)域知識庫對油田既有工藝流程、設(shè)備關(guān)聯(lián)、分析關(guān)系進(jìn)行形式化描述,為語義關(guān)聯(lián)檢索以及后續(xù)應(yīng)用提供支持。
應(yīng)用層實(shí)現(xiàn)對覆蓋油田勘探生產(chǎn)分析全流程的跨層跨域信息的綜合應(yīng)用。
2 智慧油田語義集成關(guān)鍵
技術(shù)
2.1 異構(gòu)數(shù)據(jù)語義建模
目前,針對物聯(lián)網(wǎng)數(shù)據(jù)描述的語義模型主要有開放地理空間聯(lián)盟(OGC)提出的SensorML、萬維網(wǎng)聯(lián)盟(W3C)提出的傳感器網(wǎng)絡(luò)接入(SWE)[7]體系,又以SWE的應(yīng)用范圍最廣泛。SWE對傳感Web的語義描述僅包含時間、空間和主題3大類要素,其中主題涵蓋范圍較模糊,而對于工藝流程明確的工業(yè)生產(chǎn)全過程,對主題進(jìn)行更明確的劃分將有利于對數(shù)據(jù)的精準(zhǔn)提取與使用。因此,可通過工業(yè)數(shù)據(jù)流使用模式與習(xí)慣的分析,結(jié)合熱點(diǎn)挖掘技術(shù),提取出互聯(lián)生產(chǎn)元數(shù)據(jù)關(guān)鍵因素,具體包括時間、地點(diǎn)、使用者、操作對象、功能、操作類型以及操作描述(映射為when、where、who、which、what、how、do what)等7大類因素,實(shí)現(xiàn)全局生產(chǎn)異構(gòu)元數(shù)據(jù)的語義封裝。
2.2 油田領(lǐng)域知識庫
針對油田數(shù)據(jù)海量、異構(gòu)以及元數(shù)據(jù)信息語義不一致問題,在語義建?;A(chǔ)上,需要解決各系統(tǒng)信息語義歧義的問題。通過對工業(yè)處理過程的抽象,構(gòu)建層次化語義本體庫,構(gòu)建異構(gòu)數(shù)據(jù)與生產(chǎn)設(shè)備之間的時空與業(yè)務(wù)聯(lián)系,并針對領(lǐng)域構(gòu)建基于模型與經(jīng)驗的領(lǐng)域知識庫,實(shí)現(xiàn)全局信息的共享與推理功能。
(1)層次化語義本體庫
層次化語義本體庫采用手工、半自動和自動的方法進(jìn)行,可以根據(jù)具體情況有所裁剪,層次化語義本體庫的架構(gòu)如圖3所示。
其中,頂層是跨領(lǐng)域詞匯表,作為各領(lǐng)域表達(dá)基準(zhǔn)表;域?qū)訛檎Z義域本體,在工業(yè)領(lǐng)域按照終端使用模式進(jìn)行配置;設(shè)備層是面向應(yīng)用的核心本體庫,包括向上與應(yīng)用的關(guān)聯(lián)和向下與語義描述的映射;語義模型為語義描述標(biāo)準(zhǔn)化框架;消歧本體庫則用以完成各層次各實(shí)體的語義歧義消除工作。
(2)領(lǐng)域知識庫
領(lǐng)域知識庫主要實(shí)現(xiàn)各工業(yè)裝備領(lǐng)域內(nèi)模式知識與經(jīng)驗知識基于本體的形式化表示。以油田油井注采狀態(tài)的計算模型為例,其注采知識庫主要包括基于功圖的單井產(chǎn)量計算模型、動液面計算模型、產(chǎn)液量計算模型、泵效計算模型、平衡度計算模型等,經(jīng)驗知識方面主要包括油藏地質(zhì)狀態(tài)判斷知識庫。通過對全局中各不同領(lǐng)域知識庫的建立,基于層次化本體實(shí)現(xiàn)生產(chǎn)全流程全局優(yōu)化的推理能力。
2.3 時空數(shù)據(jù)流關(guān)聯(lián)檢索
典型工業(yè)應(yīng)用場景主要面向生產(chǎn)過程控制與分析人員,當(dāng)出現(xiàn)特定生產(chǎn)場景時,需要綜合各系統(tǒng)內(nèi)相關(guān)信息作出相應(yīng)反饋。以油田抽油井優(yōu)化方案制定為例,當(dāng)前的油田油井方案制定工程師需要分別到不同系統(tǒng)中手動調(diào)取油藏地質(zhì)文件數(shù)據(jù)、數(shù)值模擬數(shù)據(jù)、單井小層數(shù)據(jù)以及單井實(shí)時動液面、示功圖等信息,效率低下。因此,針對這類典型的具有業(yè)務(wù)關(guān)聯(lián)的使用流程,需要開展面向關(guān)聯(lián)的快速數(shù)據(jù)檢索技術(shù)的研究。對于工業(yè)生產(chǎn)過程,主要表現(xiàn)為針對由于時空關(guān)系導(dǎo)致的具有上下游業(yè)務(wù)流程因果關(guān)系的關(guān)聯(lián),通過關(guān)聯(lián)檢索的實(shí)現(xiàn),解決高效獲取相關(guān)數(shù)據(jù)信息的問題。
關(guān)聯(lián)模型的構(gòu)建需要綜合時間與空間視角。如圖4所示,在時空轉(zhuǎn)換關(guān)系中,傳感器可作為連接兩個空間的橋梁,通過構(gòu)建基于傳感器連接點(diǎn)的層次劃分來實(shí)現(xiàn)兩個空間之間的關(guān)聯(lián)。
在圖4中,對應(yīng)用系統(tǒng)在時間、空間以及功能域上逐級劃分形成語義關(guān)聯(lián)索引樹,通過生產(chǎn)過程信息匯聚節(jié)點(diǎn)的連接實(shí)現(xiàn)時空聯(lián)合檢索,并以元數(shù)據(jù)能力發(fā)布作為檢索入口,實(shí)現(xiàn)時空關(guān)聯(lián)檢索。以油田注采互聯(lián)生產(chǎn)過程為例,通過建立油田應(yīng)用實(shí)體多層次本體命名體系來顯式標(biāo)明時空與應(yīng)用的關(guān)聯(lián),包括空間檢索命名、時間檢索命名和應(yīng)用檢索命名體系等,繼而提供了數(shù)據(jù)的查詢與管理機(jī)制。
基于時空語義檢索樹的語義檢索過程如圖5所示。
數(shù)據(jù)的語義檢索,需要首先對檢索請求進(jìn)行解析,可支持Web本體語言(OWL)、詞網(wǎng)(WN)和Web服務(wù)建模本體(WSMO)解析,形成檢索解析結(jié)果,與時空關(guān)聯(lián)索引樹進(jìn)行匹配,最終從標(biāo)準(zhǔn)化的語義數(shù)據(jù)中進(jìn)行檢索并返回檢索結(jié)果。以油田注采裝備檢索為例,當(dāng)作業(yè)井中某節(jié)點(diǎn)壓力值發(fā)生突變后,可以通過時空關(guān)聯(lián)檢索對相同/臨近作業(yè)區(qū)塊同期抽油井、注水井的相關(guān)壓力、溫度等信息進(jìn)行關(guān)聯(lián)檢索分析,進(jìn)而為判斷當(dāng)前作業(yè)井壓力突變的原因分析提供依據(jù)和解決方案支持。
3 展望
當(dāng)前,中國相繼推出了“工業(yè)化信息化兩化融合”、“中國制造2025”等一系列頂層設(shè)計方案,工業(yè)物聯(lián)網(wǎng)的發(fā)展日益成為人們關(guān)注的焦點(diǎn)。同時智慧油田概念的提出將數(shù)字油田逐漸向智慧化、高效化的開發(fā)中轉(zhuǎn)變。在工業(yè)物聯(lián)網(wǎng)發(fā)展的基礎(chǔ)上,通過語義技術(shù),將跨層跨域的數(shù)據(jù)集成變成了可能,而將語義集成技術(shù)廣泛應(yīng)用在智慧油田的建設(shè)與推進(jìn)中,又能夠進(jìn)一步促進(jìn)油田的數(shù)據(jù)信息利用更加高效、更加合理。因此,對基于工業(yè)物聯(lián)網(wǎng)的智慧油田語義集成技術(shù)體系進(jìn)行更加全面與深入的研究,將促進(jìn)油田生產(chǎn)運(yùn)行新模式的實(shí)現(xiàn)與發(fā)展。
參考文獻(xiàn)
[1] TERRASA A N. Semantic Integration of Thematic Geographic Information in a Multimedia Context[D]. Barcelona: Pompeu Fabra University, 2006
[2] ZHOU J, YANG H, WANG M, et al. A Survey of Semantic Enterprise Information Integration[C]// International Conference on Information Sciences and Interaction Sciences. USA, IEEE:234-239, 2010. DOI:10.1109/ICICIS.2010.5534744
[3] GRUNINGER M, USCHOLD M. Ontologies: Principles, Methods and Applications[J]. Knowledge Engineering Review, 1996, 11(2):93-136. DOI:http://dx.doi.org/10.1017/S0269888900007797
[4] WACHE H, VISSER U, STUCKENSCHMIDT H, et al. Ontology-Based Integration of Information-A Survey of Existing Approaches[C]// Ijcai01 Workshop on Ontologies & Information Sharing, USA, IJCAI: 108-117, 2001
[5] ARENS Y, HSU C N, KNOBLOCK C A. Query Processing in the SIMS Information Mediator[M]// Tate A Advanced Planning Technology Aaai Press Menlo Park Ca, 1997: 82-90
[6] STUCKENSCHMIDT H, WACHE H, VISSER U, et al. Enabling Technologies for Interoperability[C]// Information Sharing: Methods and Applications at the 14th International Symposium of Computer Science for Environmental Protection, Bonn, TZI: 35-46, 2000
[7] SHETH A, HENSON C. Semantic Sensor Web[J]. IEEE Internet Computing. 2008, 12(4):78-83. DOI:10.1109/MIC.2008.87