Research on Digital Transformation and Application Pathwaysof Standards Documents in the Oil and Gas Industry
HAN Yiping WANG Yongjun SUN ZuoxingHUANG ChaoXu WANG Meng (Research Institute ofPetroleumExplorationamp;Development)
Abstract:As informationtechnology integrates deplywiththeoilandgasindustry,thetraditional modelof standards managementfaceschalengessuchasloweciency,laggingversionupdates,andlackofknowledgeassociation,andailing to meet the industry’s neds for data sharing,inteligent analysis,and quick decision-making.This paper focuses on the digital transformationoftheoilandgasindustry.Using thereservoirstimulationfieldasanentrypoint,itproposesa“dataknowledge-application”thre-tierpromotionframeworktoconstructadigitalmodelandimplementationpathforstandardsin the oilandgasindustry,andbuildastandards knowledgegraphcovering theentireprocesofreservoirstimulationItuesa “busine-standard’dual-driven strategytobuilda knowledgesystemwhile exploring the applicationscenariosofstandards digitalization.Research shows that standards documents digitalizationcan significantly improve the appicationeffciency andmanagementlevelofreservoirstimulationstandards,injectnewvitalityintothedigitaltransformationofthepetroleum industry,whichareofimportantthoreticalandpracticalsigniicancefopromotingthedigitalandintellgent transfration of standards in the oil and gas industry.
Keywords: oil and gas industry; standards digitalization;reservoir stimulation; knowledge graph
0 引言
在新一代信息技術與數(shù)字經(jīng)濟融合發(fā)展的浪潮下,油氣行業(yè)正經(jīng)歷系統(tǒng)性變革。傳統(tǒng)紙質(zhì)或PDF載體的標準已無法滿足油氣行業(yè)對數(shù)據(jù)共享、智能分析和快速決策的迫切需求,標準管理模式面臨協(xié)同效率低下、版本更新滯后、知識關聯(lián)缺失等嚴峻挑戰(zhàn)。標準數(shù)字化轉(zhuǎn)型成為構(gòu)建新型標準生態(tài)體系的關鍵。
國際標準化組織(ISO)、國際電工委員會(IEC)等在標準數(shù)字化領域起步較早,ISO/IEC聯(lián)合提出的SMART(StandardsMachineApplicable,ReadableandTransferable)標準成熟度模型,將機器可讀標準分為0\~4共5個等級。0級表示紙質(zhì)文本;1級表示傳統(tǒng)數(shù)字格式標準,例如PDF;2級表示機器可讀文檔(特征是轉(zhuǎn)為XML、HTML2-3]等數(shù)據(jù)形態(tài));3 級表示機器可讀和可執(zhí)行內(nèi)容的標準(特征是具備語義算法[4-5]),具體是指機器能簡單地理解標準內(nèi)涵,實現(xiàn)標準關鍵指標深層揭示、技術指標提取、相似指標分析和相似段落比對。4級表示機器可解釋內(nèi)容的標準(特征是具備復雜的信息模型[3-5]),是加人更為復雜的人工智能技術,不同機器可以跨平臺、跨系統(tǒng)協(xié)作、數(shù)據(jù)傳輸、信息交互。當前,國際領先領域已實現(xiàn)L3\~4級應用,而我國油氣行業(yè)仍處于L1階段,與航空、智能制造等行業(yè)存在差距。
本文選取儲層改造領域作為研究載體。儲層改造領域業(yè)務流程完整,涵蓋設計、材料優(yōu)選、裝備工具優(yōu)選、現(xiàn)場施工及改造后評估等全鏈條,且其標準體系構(gòu)成與油氣行業(yè)整體類似,涉及20個專業(yè)大類,覆蓋油氣行業(yè) 80% 以上專業(yè)類別,具有高度的典型性與代表性。本研究旨在通過構(gòu)建“數(shù)據(jù)-知識-應用”3級推進框架,實現(xiàn)儲層改造領域標準文件的數(shù)字化轉(zhuǎn)型與智能化應用。
1標準數(shù)字化總體思路
油氣行業(yè)標準數(shù)字化的核心在于構(gòu)建“標準數(shù)據(jù)-標準知識-業(yè)務場景-智能應用”的數(shù)字化閉環(huán)體系。通過自然語言理解(NLU)與知識工程技術的融合,實現(xiàn)標準內(nèi)容結(jié)構(gòu)化、標準數(shù)據(jù)知識化、應用服務智能化三大目標(見圖1)。具體而言,標準內(nèi)容結(jié)構(gòu)化即將非結(jié)構(gòu)化文本轉(zhuǎn)化為機器可處理的信息單元;標準數(shù)據(jù)知識化是建立標準條款與業(yè)務間的多維度關聯(lián)關系;應用服務智能化則是基于業(yè)務實現(xiàn)標準知識的精準觸達。
為確保標準數(shù)字化的有效實施,應達到以下4個目標:一是促進標準質(zhì)量提升,通過基于BERT的跨標準相似度分析,減少標準間的交叉、重復,提高標準一致性;二是實現(xiàn)標準內(nèi)容與業(yè)務場景的深度融合,應用工作流引擎嵌入標準條款,實現(xiàn)標準自動推送及設計方案的自動合規(guī)檢查;三是助力決策支持,依托知識圖譜推理引擎,實現(xiàn)基于標準知識的輔助決策;四是為大模型提供知識底座,構(gòu)建標準語料庫,助力大模型的訓練和迭代升級。
標準數(shù)字化技術實施路徑分為“數(shù)據(jù)-知識-應用”3階段遞進式推進:數(shù)據(jù)階段,采用BiLSTM-CRF模型進行標準要素抽取,建立標準基礎數(shù)據(jù);知識階段,建立儲層改造知識模型,構(gòu)建儲層改造領域本體,并對關系進行定義;應用階段,開發(fā)標準智能服務平臺,實現(xiàn)智能化應用。
2 儲層改造標準數(shù)字化實踐
2.1建立儲層改造核心標準體系
為確定儲層改造標準范圍,收集整理儲層改造核心技術相關的標準,經(jīng)過梳理分析歸類,保留核心139項標準,形成了儲層改造核心標準體系。該體系覆蓋儲層改造核心業(yè)務全過程,按照業(yè)務流程特點,設置基礎通用、改造前評估、方案優(yōu)化設計、儲層改造材料評價、裝備及工具、現(xiàn)場施工及控制、測試與改造后評估分析等7大核心模塊(見圖2),包含國家標準、石油行業(yè)標準、能源行業(yè)標準、集團企業(yè)標準等,標準全部現(xiàn)行有效。
儲層改造核心標準涉及23個專業(yè),分屬25個標準化技術機構(gòu)歸口管理。標準分布特征顯示,過程類標準數(shù)量多,占全部標準的 68% ,且不可量化的描述性要求較多;標準間技術內(nèi)容存在交叉和一致性問題;同一標準面向多組使用者,界面不清晰;規(guī)范性引用文件眾多,查閱、使用較為困難。
2.2標準數(shù)據(jù)化
通過建立統(tǒng)一的標準數(shù)字化表示模型(見圖3),對標準進行結(jié)構(gòu)化處理,使標準內(nèi)容可以結(jié)構(gòu)化數(shù)據(jù)表示,完成標準數(shù)據(jù)原始數(shù)據(jù)采集,從而實現(xiàn)對標準內(nèi)容的標準化和規(guī)范化表示。在此基礎上,應用標簽集技術對標準內(nèi)容進行層次結(jié)構(gòu)和要素類別等的標注定義,形成儲層改造核心標準數(shù)據(jù)庫,其中涵蓋了標準索引表庫、技術要素庫、規(guī)范性引用關系庫、術語知識庫、多媒體資源庫等基礎數(shù)據(jù)庫。這些數(shù)據(jù)庫共同構(gòu)成了儲層改造核心標準的數(shù)字化基礎,為后續(xù)的數(shù)據(jù)分析和知識提取提供了豐富的數(shù)據(jù)資源。儲層改造核心標準結(jié)構(gòu)化數(shù)據(jù)的詳細統(tǒng)計情況見表1。需要說明的是,本研究中結(jié)構(gòu)化標簽集與數(shù)據(jù)庫的構(gòu)建以及索引信息提取工作,均嚴格遵循GB/T1.1—2020《標準化工作導則》和GB/T20001《標準編寫規(guī)則》系列國家標準的技術要求。
為了確保所采集數(shù)據(jù)的準確性,對這些數(shù)據(jù)庫進行了完整性和引用閉環(huán)校驗。這一過程能夠驗證數(shù)據(jù)的準確性和一致性,確保數(shù)字化后的標準數(shù)據(jù)在結(jié)構(gòu)和要素位置上能夠被計算機準確識別,從而為后續(xù)的智能分析和應用提供可靠的數(shù)據(jù)支持。
2.3標準知識模型構(gòu)建
2.3.1技術要素分析
對數(shù)字化的標準數(shù)據(jù)進行技術要素的提取,結(jié)合儲層改造流程,將儲層改造核心標準分為方案優(yōu)化設計標準、儲層改造材料標準、裝備及工具標準、現(xiàn)場施工作業(yè)標準、返排液處理標準及其他標準等6類標準。
2.3.2標準知識體系框架構(gòu)建
儲層改造標準知識體系框架緊密圍繞儲層改造業(yè)務流程構(gòu)建,并融合標準化對象,打造多維標準知識模型。其中,標準業(yè)務知識體系框架作為核心主模型,共分為4個層級(見圖4)。第一層級依據(jù)業(yè)務階段進行劃分,全面覆蓋資料準備、方案設計、施工作業(yè)、實施效果評估以及QHSE(質(zhì)量、健康、安全與環(huán)境)要求等關鍵階段。第二層級則按照模塊進一步細化,例如,在資料準備模塊中,詳細包含地質(zhì)油藏資料、鉆完井資料等眾多子模塊內(nèi)容。
該體系框架的實際應用價值顯著,可使計算機憑借既定規(guī)則精準理解標準內(nèi)容所適用的具體業(yè)務場景,并借助人工智能語義識別技術,將標準內(nèi)容轉(zhuǎn)化為計算機可讀的形式,從而實現(xiàn)標準內(nèi)容與業(yè)務場景的精準匹配,高效地為業(yè)務人員推送貼合當前工作需求的標準內(nèi)容,助力業(yè)務流程的規(guī)范化與標準化推進。
儲層改造材料標準專項知識模型:主要囊括壓裂液、酸液、支撐劑等關鍵品類,其相關標準主要由產(chǎn)品標準與試驗標準構(gòu)成,且各類技術指標均有嚴格的量化要求。鑒于材料類標準在儲層改造標準體系中占比高達 21% ,具有特殊的重要地位與專業(yè)特性,故而專門構(gòu)建“產(chǎn)品-指標-檢測”三位一體的知識模型,通過這種模型架構(gòu),能夠精準關聯(lián)產(chǎn)品各項技術指標與對應的試驗檢測方法,確保材料從標準設定到實際檢測應用的全流程標準化管控,為儲層改造業(yè)務提供堅實、可靠且質(zhì)量合格的材料基礎保障,而其與主模型的交集相對較小,更多是從材料這一特定維度對儲層改造標準進行深度拓展與細化,是對主模型在材料領域的有力補充。
儲層改造裝備及工具專項知識模型:儲層改造過程中,裝備及工具同樣是不可或缺的關鍵要素,廣泛涉及壓裂車、混砂車、儀表車等專業(yè)性較強的專用裝備以及通用性裝備及其配套設備,其對應的標準同樣由產(chǎn)品標準與使用維修標準構(gòu)成,且各類技術參數(shù)具備明確的量化要求?;谘b備及工具在儲層改造業(yè)務中的重要作用及其獨特的標準化需求,構(gòu)建“產(chǎn)品-參數(shù)-安全-檢測”四位一體知識模型,這一模型能夠有效關聯(lián)產(chǎn)品性能參數(shù)、安全標準要求以及相應的測試檢測方法,保障裝備及工具在儲層改造作業(yè)中的安全、穩(wěn)定且高效運行,其與主模型在業(yè)務流程關聯(lián)層面相對有限,主要聚焦于裝備及工具自身的技術規(guī)范與應用標準,是針對儲層改造裝備及工具這一專業(yè)領域進行深度標準知識挖掘與整合,為儲層改造作業(yè)的順利開展提供全面、精準且專業(yè)的裝備及工具標準支撐。
儲層改造標準知識體系框架中的主模型與兩個專項知識模型相互補充、協(xié)同作用,共同構(gòu)建起完善的儲層改造標準知識體系。主模型著重于梳理業(yè)務流程的邏輯架構(gòu),兩個專項模型則深入挖掘材料與裝備工具這兩個關鍵項的專業(yè)特性與技術細節(jié),從而達到機器對標準的精準理解與高效應用。
2.4儲層改造標準知識圖譜模型構(gòu)建
數(shù)字標準數(shù)據(jù)因其內(nèi)在的結(jié)構(gòu)化特征,與知識圖譜技術展現(xiàn)出天然的契合性,能夠高效支持知識的多維度關聯(lián)與智能化服務。通過構(gòu)建標準知識圖譜(見圖5),該圖譜運用先進的知識表示方法,系統(tǒng)性地揭示標準要素之間的復雜關聯(lián),包括但不限于標準之間、標準內(nèi)容條目之間、標準知識與業(yè)務場景等方面的關聯(lián)關系。這不僅為知識的可視化展示提供了直觀的框架,更為深度知識挖掘和智能服務奠定了基礎。其核心子圖譜結(jié)構(gòu)涵蓋標準基本屬性圖譜、儲層改造流程圖譜、應用場景圖譜、儲層改造材料圖譜及裝備工具圖譜,這些子圖譜共同構(gòu)成了儲層改造領域標準知識的完整圖景,全面呈現(xiàn)了該領域內(nèi)標準知識的系統(tǒng)性和關聯(lián)性,為多模態(tài)知識融合與深度挖掘提供了強大的支持。
2.5智能服務應用
基于知識圖譜構(gòu)建的智能服務體系可實現(xiàn)智能搜索、智能問答、智能推送、相似度比對、結(jié)果自動判定、決策支持、輔助編寫、大模型訓練等一系列智能化服務。智能搜索、問答及推送,見表2。
3 結(jié)論與展望
標準數(shù)字化不僅是標準化高質(zhì)量發(fā)展的基石,更是驅(qū)動油氣行業(yè)數(shù)字化轉(zhuǎn)型與智能化升級的關鍵賦能要素。本研究通過構(gòu)建“數(shù)據(jù)-知識-應用”3級框架,在儲層改造領域成功實踐了標準數(shù)字化轉(zhuǎn)型。創(chuàng)新性地提出了油氣行業(yè)標準數(shù)字化模型與實施路徑,構(gòu)建了覆蓋全流程的標準知識圖譜,提出了“業(yè)務-標準”雙驅(qū)動的知識體系方法,探索了多樣化的智能應用場景。實踐證明,該方案有效提升了儲層改造方案設計、材料評價的效率與規(guī)范性,為優(yōu)化標準體系、提升標準質(zhì)量提供了有力工具,奠定了油氣行業(yè)標準數(shù)字化研究的重要基礎。
當前油氣行業(yè)標準數(shù)字化整體仍處于探索與試點階段。未來應強化頂層設計,構(gòu)建覆蓋油氣全產(chǎn)業(yè)鏈的標準數(shù)據(jù)化頂層架構(gòu),統(tǒng)籌規(guī)劃標準全生命周期智能化管理與協(xié)同工作,協(xié)調(diào)存量改造與增量建設;深化技術融合,持續(xù)探索人工智能(如:大模型)、區(qū)塊鏈等技術在標準智能解析、動態(tài)更新、可信存證等方面的應用;拓展應用場景,將經(jīng)儲層改造驗證的數(shù)字化路徑與知識圖譜模型,推廣至鉆井、采油、集輸?shù)群诵臉I(yè)務領域,實現(xiàn)全產(chǎn)業(yè)鏈標準業(yè)務知識體系的貫通與智能化應用;構(gòu)建生態(tài)體系,推動標準數(shù)字化平臺與業(yè)務系統(tǒng)(如:設計軟件、ERP、MES)的深度集成,形成“標準驅(qū)動業(yè)務,業(yè)務反饋標準’的閉環(huán)生態(tài),最終助推油氣行業(yè)整體的數(shù)字化轉(zhuǎn)型升級。
參考文獻
[1]宋杰,李永,陸啟宇,等.電力企業(yè)機器可讀標準等級評估及能力需求研究[J].中國標準化,2024(19):72-77.
[2] 馬超.面向機器可讀標準的電力標準數(shù)字化述評與展望[J].中國電力,2023(8):216-229.
[3] 馬超,鄧桃,周勤勇,等.面向電力領域的標準數(shù)字化轉(zhuǎn)型工作研究:需求分析、轉(zhuǎn)型路徑與應用場景[J]中國標準化,2022(23):87-92.
[4]汪爍,盧鐵林,尚羽佳.機器可讀標準:標準數(shù)字化轉(zhuǎn)型的核心[J].標準科學,2021(S1):6-16.
[5]陳心怡,張華,賈君君,等.數(shù)字經(jīng)濟下工業(yè)生產(chǎn)標準數(shù)字化轉(zhuǎn)型探索研究[J].中國標準化,2023(1):48-52.
[6] 國家標準化管理委員會.標準化工作導則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則:GB/T1.1—2020[S].
[7]國家標準化管理委員會.標準編寫規(guī)則系列標準:GB/T20001[S].