姚衛(wèi)華, 葛悅, 鄧兵兵, 葉雯靜, 徐亞博
(北京市科學(xué)技術(shù)研究院城市安全與環(huán)境科學(xué)研究所, 北京 100054)
中國城市化進(jìn)程的深入推進(jìn)使得能源供給的策略不斷向清潔能源傾斜,在低碳生活和節(jié)能減排的態(tài)勢下,城鎮(zhèn)燃?xì)庑袠I(yè)發(fā)展迅速。據(jù)《城鄉(xiāng)建設(shè)統(tǒng)計(jì)年鑒》顯示,2022年全國燃?xì)庥脩艄灿?jì)約3.18億戶,普及率已超98%。隨著燃?xì)馐褂昧恳约坝脩襞c日俱增,全國各地燃?xì)馐鹿蕰r(shí)有發(fā)生,據(jù)《全國燃?xì)馐鹿史治鰣?bào)告(2022年·全年綜述)》顯示,僅在2022年間,全國共收集到媒體報(bào)道的國內(nèi)(不含港澳臺)燃?xì)馐鹿?02起,造成66人死亡,487人受傷,其中較大事故10起。針對各類燃?xì)馐鹿?實(shí)施標(biāo)準(zhǔn)化、規(guī)范化的應(yīng)急處置流程和措施,提升事件處置效能,盡可能減少事故損失有賴于標(biāo)準(zhǔn)知識的科學(xué)運(yùn)用。
標(biāo)準(zhǔn)文獻(xiàn)作為法規(guī)的量化和延伸,在燃?xì)夤芫W(wǎng)安全管理中的作用日漸突出。目前,城鎮(zhèn)燃?xì)夤芫W(wǎng)標(biāo)準(zhǔn)文獻(xiàn)的傳播和存儲形式以電子版、紙質(zhì)版為主,無法實(shí)現(xiàn)標(biāo)準(zhǔn)文獻(xiàn)間知識交叉關(guān)聯(lián),以及標(biāo)準(zhǔn)文獻(xiàn)知識的快速檢索和精確匹配?!秶覙?biāo)準(zhǔn)化發(fā)展綱要》中明確提出要不斷提升標(biāo)準(zhǔn)的數(shù)字化水平。標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型既是數(shù)字技術(shù)變革的必然結(jié)果,也是行業(yè)領(lǐng)域標(biāo)準(zhǔn)應(yīng)用的突破口,這為圖譜化標(biāo)準(zhǔn)運(yùn)用于燃?xì)夤芫W(wǎng)事故應(yīng)急輔助決策提供了重要前提。現(xiàn)通過建立燃?xì)夤芫W(wǎng)災(zāi)害情景應(yīng)對標(biāo)準(zhǔn)要素知識圖譜,以提升事故分析效率,提高事故標(biāo)準(zhǔn)化、規(guī)范化處理水平,從而控制城市燃?xì)夤芫W(wǎng)事故的事態(tài)發(fā)展。
標(biāo)準(zhǔn)作為一種規(guī)范性程度相對較高的信息資源,具有圖譜化的先天條件。選擇圖譜作為標(biāo)準(zhǔn)的語義化組織基礎(chǔ),能夠較好地規(guī)范標(biāo)準(zhǔn)文件解構(gòu),表達(dá)標(biāo)準(zhǔn)內(nèi)容的知識邏輯。Ren等[1]搭建了以標(biāo)準(zhǔn)知識圖譜結(jié)構(gòu)和應(yīng)用為內(nèi)容的框架;張慧等[2]以標(biāo)準(zhǔn)前言及規(guī)范性引用文件為切入點(diǎn),編制出以標(biāo)準(zhǔn)文獻(xiàn)描述與組織機(jī)構(gòu)的關(guān)聯(lián)關(guān)系為內(nèi)容的圖譜;楊躍翔等[3]建立了標(biāo)準(zhǔn)文獻(xiàn)的通用框架以及標(biāo)簽集,利用可擴(kuò)展標(biāo)記語言(eXtensible markup language,XML)標(biāo)注實(shí)施知識抽取,闡釋出通用型標(biāo)準(zhǔn)文獻(xiàn)知識圖譜的建立方法;尤薇佳等[4]利用機(jī)器學(xué)習(xí)和模板匹配等方法進(jìn)行知識抽取,構(gòu)建知識圖譜以實(shí)現(xiàn)對突發(fā)事件標(biāo)準(zhǔn)中知識的跨標(biāo)準(zhǔn)協(xié)同查詢。在專業(yè)標(biāo)準(zhǔn)文獻(xiàn)方面,知識圖譜技術(shù)已在食品安全[5]、綠色標(biāo)準(zhǔn)[6]、建筑安全[7]等方面進(jìn)行了應(yīng)用。
在事故應(yīng)急輔助決策方面,學(xué)術(shù)界利用知識圖譜方法在對事故案例、應(yīng)急預(yù)案、管理規(guī)程等分析的基礎(chǔ)上,在電力、煤礦、鐵路、自然災(zāi)害等事故應(yīng)急中進(jìn)行應(yīng)用。周義棋等[8]采取基于規(guī)則和深度學(xué)習(xí)的知識抽取方式對應(yīng)急預(yù)案進(jìn)行知識抽取,提出電網(wǎng)應(yīng)急預(yù)案知識圖譜的構(gòu)建方法;王群弼[9]使用了基于依存句法分析方法抽取了電力調(diào)度管理規(guī)程的三元組,構(gòu)建了電力調(diào)度管理規(guī)程知識圖譜;姜磊等[10]從歷史數(shù)據(jù)中提取源荷狀態(tài),構(gòu)建以調(diào)壓裝置狀態(tài)、系統(tǒng)數(shù)據(jù)與控制策略為核心實(shí)體的配電網(wǎng)電壓控制知識圖譜;葉帥[11]針對煤礦領(lǐng)域文獻(xiàn)、安全事故案例等信息進(jìn)行分析,根據(jù)煤礦知識體系劃分實(shí)體和關(guān)系的類型形成知識網(wǎng)絡(luò),構(gòu)建了煤礦領(lǐng)域知識圖譜;朱慶等[12]圍繞鐵路隧道鉆爆法施工事件,以安全、質(zhì)量、進(jìn)程三維度建立對應(yīng)領(lǐng)域的知識圖譜;李鈺[13]面向自然災(zāi)害應(yīng)急領(lǐng)域,分別構(gòu)建知識圖譜的數(shù)據(jù)層和模式層,設(shè)計(jì)了自頂向下與自底向上相結(jié)合的知識圖譜構(gòu)建方法;杜志強(qiáng)等[14]將自然災(zāi)害、應(yīng)急任務(wù)、數(shù)據(jù)分析、模型方法等四要素融入洪澇災(zāi)害應(yīng)急的知識圖譜之中;陶坤旺等[15]總結(jié)了面向一體化綜合減災(zāi)的知識圖譜關(guān)鍵技術(shù),包括知識抽取、信息融合、知識建模和知識存儲;李聰?shù)萚16]從人-物-環(huán)-管的角度對燃?xì)庑孤┻^程進(jìn)行梳理,分析火災(zāi)爆炸等次生事故包含的實(shí)體、屬性和關(guān)系,建立燃?xì)夤芫W(wǎng)泄漏事件圖譜。李思潔等[17]以燃?xì)馔话l(fā)事件應(yīng)急處置案例為研究對象,對燃?xì)馔话l(fā)事件及其應(yīng)急處置信息進(jìn)行知識抽取、知識表示,建立了相應(yīng)的知識圖譜。
綜上所述,當(dāng)前基于標(biāo)準(zhǔn)文獻(xiàn)構(gòu)建知識圖譜的研究停留在通用型標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容拆解、信息抽取以及實(shí)現(xiàn)方法;用于應(yīng)急決策的知識圖譜研究停留在事故案例、管理規(guī)程、應(yīng)急預(yù)案等方面的知識抽取和構(gòu)建。針對燃?xì)夤芫W(wǎng)應(yīng)急標(biāo)準(zhǔn)的圖譜化系統(tǒng)性不強(qiáng)?,F(xiàn)運(yùn)用知識圖譜對城鎮(zhèn)燃?xì)夤芫W(wǎng)應(yīng)急標(biāo)準(zhǔn)體系進(jìn)行分析,利用Neo4j實(shí)現(xiàn)對燃?xì)夤芫W(wǎng)應(yīng)急處置環(huán)節(jié)的知識可視化。研究結(jié)果力求從海量標(biāo)準(zhǔn)文獻(xiàn)中獲取關(guān)聯(lián)知識,更好地服務(wù)于由散亂的舊有應(yīng)急知識獲取到智聯(lián)的新型知識服務(wù)的轉(zhuǎn)化,提升標(biāo)準(zhǔn)文獻(xiàn)知識在應(yīng)急處置環(huán)節(jié)的工具效能,提供符合應(yīng)急響應(yīng)實(shí)踐需求的知識脈絡(luò)。
2012年谷歌公司提出了用于知識表達(dá)的方法——知識圖譜,這種結(jié)構(gòu)化語義的知識庫,是以三元組的形式對實(shí)體及其關(guān)聯(lián)關(guān)系進(jìn)行建模,以建立基于實(shí)體或?qū)傩韵嗷ミB接的網(wǎng)狀結(jié)構(gòu)[18-19]。目前,知識圖譜廣泛應(yīng)用于智能問答、數(shù)據(jù)分析、數(shù)據(jù)推薦、輔助決策等領(lǐng)域。知識圖譜通過命名實(shí)體識別、實(shí)體間關(guān)系抽取等技術(shù),將真實(shí)世界中的廣闊自然語言文本中的實(shí)體、關(guān)系以節(jié)點(diǎn)和邊的形式,以<頭實(shí)體-關(guān)系-尾實(shí)體>的三元組形式構(gòu)建結(jié)構(gòu)化的語義知識網(wǎng)絡(luò),并可以憑借圖的形式展現(xiàn)出來,賦予了機(jī)器理解世界知識的能力。
知識圖譜的構(gòu)建方式主要包括自頂向下、自底向上以及混合3類。自頂向下是通過提出要素、實(shí)體、關(guān)系和屬性的類型,建立知識要素框架,形成基本知識系統(tǒng),即模式層;與之相反,自底向上的數(shù)據(jù)層構(gòu)建是從標(biāo)準(zhǔn)文獻(xiàn)等數(shù)據(jù)源途徑進(jìn)行知識抽取,逐步形成并不斷更新概念與概念間關(guān)系的組織架構(gòu),所依賴的數(shù)據(jù)源數(shù)據(jù)量龐大。而混合方式是在具備預(yù)定義模式層的條件下,隨著不斷地知識抽取,對模式層實(shí)施修正,提升知識組織架構(gòu)的置信度。
由于標(biāo)準(zhǔn)文本結(jié)構(gòu)規(guī)范、特征明顯,但應(yīng)急處置核心要素專業(yè)性需求高,且重視數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。因此,本文研究中采用自頂向下與自底向上相結(jié)合的方式構(gòu)建燃?xì)夤芫W(wǎng)應(yīng)急處置知識圖譜。首先,通過專家分析法分析標(biāo)準(zhǔn)文本的內(nèi)容,采用自頂向下的方式構(gòu)建模式層。之后,在模式層的指導(dǎo)下,采用自底向上的方式構(gòu)建數(shù)據(jù)層,進(jìn)行實(shí)體、關(guān)系以及屬性的知識抽取,建立知識圖譜,相關(guān)流程展示如圖1所示。
圖1 燃?xì)夤芫W(wǎng)應(yīng)急處置知識圖譜的構(gòu)建Fig.1 Construction of knowledge graph for emergencyresponse of gas pipeline network
知識圖譜構(gòu)建的關(guān)鍵技術(shù)主要包括知識抽取、知識融合、知識更新等。知識抽取是指面向非結(jié)構(gòu)化的數(shù)據(jù),通過自動化的技術(shù),抽取出結(jié)構(gòu)化的信息和可用的知識單元。在早期知識抽取主要通過啟發(fā)式算法與規(guī)則相結(jié)合的方式來實(shí)現(xiàn),現(xiàn)在常用的方法有借助本體與詞匯集,借助多層神經(jīng)網(wǎng)絡(luò)和自然語言處理等。實(shí)體是知識圖譜中的最基本元素,其抽取的完整性、準(zhǔn)確率、召回率等將直接影響到知識庫的質(zhì)量。
知識融合是指將信息融合到一起進(jìn)行統(tǒng)一,以消除矛盾和歧義。來自不同數(shù)據(jù)源的概念可能在含義、指代粒度上有所不同,存在的問題主要有:命名相同概念可能指代不同的實(shí)體;命名不同的概念可能指代相同的實(shí)體;概念指代的粒度不同。
知識更新是指在已有的知識庫和數(shù)據(jù)的基礎(chǔ)上進(jìn)一步對知識進(jìn)行推理,或?qū)⑿轮R代替已有知識,從而豐富、擴(kuò)展和補(bǔ)充知識庫。
采用國家標(biāo)準(zhǔn)全文公開系統(tǒng)、中華人民共和國住房和城鄉(xiāng)建設(shè)部官網(wǎng)等資源,以燃?xì)?、管道、?yīng)急等為關(guān)鍵詞,下載獲取燃?xì)鈶?yīng)急標(biāo)準(zhǔn)文獻(xiàn)PDF格式共400余份,涵蓋突發(fā)事件預(yù)防準(zhǔn)備、監(jiān)測預(yù)警、處置救援和恢復(fù)重建等應(yīng)急管理全流程。部分燃?xì)夤芫W(wǎng)應(yīng)急標(biāo)準(zhǔn)如表1所示。為了彌補(bǔ)標(biāo)準(zhǔn)在職責(zé)分工、工作流程等方面約束內(nèi)容的缺失,同時(shí)下載整理燃?xì)鈶?yīng)急相關(guān)的法律法規(guī)、應(yīng)急預(yù)案等文件。因此,本文提及的應(yīng)急標(biāo)準(zhǔn)文件涵蓋標(biāo)準(zhǔn)、法律法規(guī)、應(yīng)急預(yù)案等。
表1 部分燃?xì)夤芫W(wǎng)應(yīng)急標(biāo)準(zhǔn)文獻(xiàn)Table 1 Part of gas pipeline network emergency standard literatures
相較于法規(guī)、規(guī)范性文件以及其他文獻(xiàn),標(biāo)準(zhǔn)具有以下顯著特征。
(1)標(biāo)準(zhǔn)的版權(quán)規(guī)定客觀上造成了其全文獲取的便利性不佳。以圖像掃描并存儲為主要傳播方式導(dǎo)致計(jì)算機(jī)無法直接讀入標(biāo)準(zhǔn)信息。以文字識別技術(shù)作為輔助手段實(shí)施文字轉(zhuǎn)化,雖然間接上解決了數(shù)據(jù)可讀性問題,但信息的傳播效率沒有顯著提升。
(2)標(biāo)準(zhǔn)具有規(guī)范、明確的構(gòu)成要素,其包含封面、目次、前言、引言、范圍、規(guī)范性引用文件、術(shù)語和定義、核心技術(shù)要素等。其中,標(biāo)準(zhǔn)核心技術(shù)要素文本的專業(yè)性強(qiáng),內(nèi)容復(fù)雜,且包含了大量燃?xì)忸I(lǐng)域的專有名詞和專業(yè)術(shù)語,如管道非開挖修復(fù)更新、帶壓開孔、對開三通、犧牲陽極陰極保護(hù)、強(qiáng)制電流陰極保護(hù)等。這些專業(yè)詞匯無法利用通用的語言處理技術(shù)應(yīng)用于標(biāo)準(zhǔn)文本中。
(3)標(biāo)準(zhǔn)文獻(xiàn)的實(shí)體往往由多個(gè)詞語嵌套構(gòu)成,實(shí)體的界限模糊。例如,鋼質(zhì)管道搶修作業(yè),地下泄漏點(diǎn)開挖作業(yè)等。應(yīng)急處置有一定的工作流程,各種動作之間有時(shí)序關(guān)系,如燃?xì)庑孤屝抟嗽诮祲夯蛲夂筮M(jìn)行等。而且,每種施工工藝均有適用的工藝條件和施工過程等,施工工藝復(fù)雜。
充分考慮上述特點(diǎn),對燃?xì)鈶?yīng)急標(biāo)準(zhǔn)文本內(nèi)容實(shí)施解析和歸納,提出燃?xì)夤芫W(wǎng)應(yīng)急處置環(huán)節(jié)的主要概念及屬性,明確關(guān)聯(lián)性,以建立針對性的知識圖譜。
作為知識圖譜的組織架構(gòu),模式層描述了特定領(lǐng)域內(nèi)的實(shí)體、關(guān)系以及屬性。其明確了概念、屬性,定義了概念間的關(guān)系,劃定數(shù)據(jù)層的實(shí)體、關(guān)系和屬性的抽取機(jī)語義關(guān)聯(lián)的范圍。
城鎮(zhèn)燃?xì)夤芫W(wǎng)突發(fā)事件應(yīng)對是指在突發(fā)事件發(fā)生之前、期間以及之后,突發(fā)事件應(yīng)對主體,按照相關(guān)規(guī)定和經(jīng)驗(yàn),合理調(diào)用應(yīng)急物資,開展預(yù)防、準(zhǔn)備、響應(yīng)及恢復(fù)的工作?;谶@一定義,城鎮(zhèn)燃?xì)夤芫W(wǎng)突發(fā)事件處置知識圖譜的模式層由應(yīng)對主體、應(yīng)對客體、應(yīng)急物資、應(yīng)急管理、參考依據(jù)5個(gè)核心要素以及它們之間的相互關(guān)系構(gòu)成。 知識圖譜的模式層如圖2所示。
圖2 燃?xì)夤芫W(wǎng)應(yīng)急處置知識圖譜模式層Fig.2 Scheme layer of gas pipeline network emergency rescue knowledge graph
(1)應(yīng)急主體要素分類。在燃?xì)夤芫W(wǎng)突發(fā)事件應(yīng)急處置過程中,參與應(yīng)急救援的核心要素為“應(yīng)急主體”,是指在突發(fā)事件處理中對客體有認(rèn)識和實(shí)踐能力的人或組織。參與救援的人或組織作為應(yīng)急處置過程中的中堅(jiān)力量,其人員素養(yǎng)和能力水平等因素決定了應(yīng)急處置的工作質(zhì)量和效率。應(yīng)急主體要素可分為政府機(jī)構(gòu)、非政府組織、個(gè)體或群體3類。其中,非政府組織可進(jìn)一步細(xì)分為燃?xì)夤?、燃?xì)馐褂脝挝?、電力公司、專業(yè)應(yīng)急救援隊(duì)伍、社會應(yīng)急力量等;燃?xì)夤居挚蛇M(jìn)一步細(xì)化為現(xiàn)場指揮、新聞組、協(xié)調(diào)組、控壓小組等。
(2)應(yīng)急客體要素分類。應(yīng)急客體是指突發(fā)事件應(yīng)對過程中需要應(yīng)對、救援的對象,包括突發(fā)事件以及需要救助、重建或恢復(fù)的承災(zāi)載體。突發(fā)事件細(xì)分類事故類型、事故等級、燃?xì)鈿赓|(zhì)、發(fā)生地點(diǎn)、發(fā)生部位、發(fā)生時(shí)間等。其中,事故類型細(xì)分泄漏、火災(zāi)、爆炸、中毒和窒息等。事故等級細(xì)分類特別重大、重大、較大、一般;燃?xì)鈿赓|(zhì)細(xì)分為人工煤氣、天然氣、液化石油氣等;發(fā)生地點(diǎn)細(xì)分為戶外、戶內(nèi)、廠站等。發(fā)生部位細(xì)分為管段、閥門、連接附件等;參照GB/T 32572—2016《自然災(zāi)害承災(zāi)體分類與代碼》中規(guī)定,承災(zāi)載體細(xì)化為傷亡情況、財(cái)產(chǎn)損失、周邊環(huán)境、管道破壞等。
(3)應(yīng)急物資要素分類。應(yīng)急物資是指為突發(fā)事件應(yīng)對全過程中所需的物資保障。參照GB/T 38565—2020《應(yīng)急物資分類及編碼》、DB11/T 1913—2021《專業(yè)應(yīng)急救援隊(duì)伍能力建設(shè)規(guī)范 燃?xì)狻返纫?guī)定,應(yīng)急物資細(xì)分為基本生活物資、工程材料與機(jī)械加工設(shè)備、應(yīng)急裝備及配套物資;其中應(yīng)急裝備及配套物資又細(xì)分為個(gè)體防護(hù)類、搶險(xiǎn)救援類、綜合保障類;個(gè)體防護(hù)類又細(xì)分為頭部防護(hù)、眼面防護(hù)、呼吸防護(hù)、軀干防護(hù)、手部防護(hù)、足部防護(hù)、墜落防護(hù)等;搶險(xiǎn)救援類細(xì)分為檢測/監(jiān)測裝備、搶修作業(yè)裝備、破拆裝備、有限空間作業(yè)裝備、備件;綜合保障類細(xì)分類車輛、通信、照明、警戒等。
(4)應(yīng)急管理要素分類。應(yīng)急管理是指在突發(fā)事件發(fā)生之前、期間以及之后高效開展預(yù)防、準(zhǔn)備、響應(yīng)及恢復(fù)工作。參照《突發(fā)事件應(yīng)對法》,應(yīng)急管理細(xì)分為預(yù)防準(zhǔn)備、監(jiān)測預(yù)警、處置救援、恢復(fù)重建4個(gè)階段。預(yù)防準(zhǔn)備又細(xì)分為風(fēng)險(xiǎn)管理、應(yīng)急預(yù)案體系建設(shè)、應(yīng)急物資儲備、應(yīng)急演練、培訓(xùn)等;監(jiān)測預(yù)警細(xì)分為監(jiān)測、預(yù)警;處置救援細(xì)分為信息報(bào)送、指揮研判、行動救援、信息發(fā)布、救援結(jié)束;恢復(fù)重建細(xì)分為調(diào)查評估、恢復(fù)、重建、救援。部分三級要素還可以進(jìn)行進(jìn)一步細(xì)分,比如,行動救援根據(jù)燃?xì)馐鹿暑愋图?xì)分為濃度檢測及環(huán)境監(jiān)測、控邊及疏散、自救互救、查漏定位、管道控壓、開挖亮管、制定方案、作業(yè)修復(fù)、收尾恢復(fù)等。
(5)參考依據(jù)要素分類。參考依據(jù)是指支撐突發(fā)事件應(yīng)對領(lǐng)域各要素的規(guī)范性文件,包括法律法規(guī)、政策文件、應(yīng)急預(yù)案、各級標(biāo)準(zhǔn)。這些依據(jù)從理論和實(shí)踐經(jīng)驗(yàn)兩個(gè)層面為應(yīng)急處置提供工作條件,能夠有效規(guī)范、約束應(yīng)急救援的科學(xué)性,或者為應(yīng)急處置工作提供支撐。參考依據(jù)細(xì)化為依據(jù)層級和依據(jù)內(nèi)容,其中依據(jù)層級細(xì)分為法律法規(guī)、政策文件、應(yīng)急預(yù)案、各級標(biāo)準(zhǔn);依據(jù)內(nèi)容細(xì)分為標(biāo)準(zhǔn)號、標(biāo)準(zhǔn)中文名稱、適用條款號、適用內(nèi)容等。
基于模式層輸出的關(guān)于燃?xì)夤芫W(wǎng)應(yīng)急領(lǐng)域的概念,要進(jìn)一步挖掘概念間的關(guān)聯(lián),其對構(gòu)建本體模型具有重要意義。標(biāo)準(zhǔn)系統(tǒng)內(nèi)的概念關(guān)系定義參考了楊躍翔等[3]給出的標(biāo)準(zhǔn)文獻(xiàn)本體概念間的關(guān)系。除此之外,結(jié)合燃?xì)夤芫W(wǎng)事故應(yīng)急領(lǐng)域的關(guān)鍵環(huán)節(jié)和步驟,得到燃?xì)夤芫W(wǎng)應(yīng)急處置本體概念間的關(guān)系。一級概念層部分關(guān)系描述如圖3所示。
圖3 燃?xì)夤芫W(wǎng)應(yīng)急處置核心要素及關(guān)系Fig.3 Core elements and relationships of emergency response forgas pipeline networks
參考依據(jù)明確了應(yīng)急管理的流程,應(yīng)急主體的職責(zé)與分工,以及應(yīng)急客體、應(yīng)急物資的概念和范疇。應(yīng)急物資為應(yīng)急主體提供保障,應(yīng)急主體遵守或者利用參考依據(jù)的指導(dǎo),對應(yīng)急客體進(jìn)行全流程應(yīng)急管理工作。燃?xì)庑孤┬袆泳仍M(jìn)行檢測孔內(nèi)燃?xì)鉂舛葯z測時(shí),需遵守CJJ/T 215—2014《城鎮(zhèn)燃?xì)夤芫W(wǎng)泄漏檢測技術(shù)規(guī)程》3.2.6的有關(guān)要求,比如,檢測孔位于管道上方;其數(shù)量與間距應(yīng)符合找出泄漏燃?xì)鉂舛确逯档囊蟮?CJJ/T 215—2014行業(yè)標(biāo)準(zhǔn)為應(yīng)急管理中的行動救援提供約束要求。燃?xì)鈶?yīng)急預(yù)案約束了應(yīng)急主體的職責(zé)與分工。GB/T 38565—2020《應(yīng)急物資分類及編碼》、DB11/T 1913—2021《專業(yè)應(yīng)急救援隊(duì)伍能力建設(shè)規(guī)范 燃?xì)狻返纫?guī)定了應(yīng)急物資的分類等,為應(yīng)急主體提供保障。
構(gòu)建數(shù)據(jù)層需要對知識實(shí)施抽取、融合及更新3個(gè)主要步驟。
(1)知識抽取。模式層的知識架構(gòu)為知識抽取的實(shí)施提供基本指導(dǎo),在海量的非(半)構(gòu)化數(shù)據(jù)中利用特定的抽取方法,獲取以實(shí)體、關(guān)系及屬性為內(nèi)容的結(jié)構(gòu)化信息。對于標(biāo)準(zhǔn)的數(shù)據(jù)層構(gòu)建而言,其核心工作在于標(biāo)準(zhǔn)化文獻(xiàn)的語義處理,就是將原始標(biāo)準(zhǔn)素材通過文件轉(zhuǎn)化工具,轉(zhuǎn)化為標(biāo)準(zhǔn)文獻(xiàn)XML文件,借助XML的語言為標(biāo)準(zhǔn)文獻(xiàn)供給可操作性原始數(shù)據(jù)。
楊躍翔等[3]在國家標(biāo)準(zhǔn)《基于XML的國家標(biāo)準(zhǔn)結(jié)構(gòu)化置標(biāo)框架》的基礎(chǔ)上,參照美國國家信息標(biāo)準(zhǔn)協(xié)會(National Information Standards Organization,NISO)標(biāo)準(zhǔn)標(biāo)簽集,將標(biāo)準(zhǔn)標(biāo)簽集進(jìn)行了拓展和細(xì)化,標(biāo)簽集涵蓋75個(gè)元素,包括標(biāo)準(zhǔn)文獻(xiàn)的封面信息、前言部分信息等基本要素以及各個(gè)段落中文本的標(biāo)簽?;谕卣购蟮臉?biāo)簽集,對相關(guān)的標(biāo)準(zhǔn)文獻(xiàn)采用光學(xué)字符識別(optical character recognition,OCR)文字識別技術(shù),利用XMLSPY進(jìn)行標(biāo)準(zhǔn)文獻(xiàn)XML轉(zhuǎn)化,實(shí)現(xiàn)標(biāo)準(zhǔn)文獻(xiàn)的結(jié)構(gòu)化處理。結(jié)果樣例如圖4所示。
圖4 標(biāo)準(zhǔn)文獻(xiàn)XML格式轉(zhuǎn)化示例圖(部分)Fig.4 XML format conversion example diagram of standard document(part)
由于燃?xì)馔话l(fā)事件應(yīng)急處置專業(yè)性較強(qiáng),領(lǐng)域詞典的構(gòu)建研究較少。伊然等[20]提出了一種基于Word2Vec的事故災(zāi)難領(lǐng)域詞典構(gòu)建方法,運(yùn)用TF-IDF算法,使用Word2Vec模型,通過人工識別的方法辨析出事故災(zāi)難詞典。本文研究采用該領(lǐng)域詞典構(gòu)建方法和流程,以燃?xì)夤芫W(wǎng)應(yīng)急標(biāo)準(zhǔn)文獻(xiàn)為語料庫,構(gòu)建出燃?xì)馔话l(fā)事件應(yīng)急領(lǐng)域詞典。構(gòu)建流程如圖5所示。
圖5 燃?xì)夤芫W(wǎng)應(yīng)急處置領(lǐng)域詞典構(gòu)建流程Fig.5 The process of building gas pipeline network emergency rescue domain dictionary
根據(jù)400余份燃?xì)夤芫W(wǎng)應(yīng)急領(lǐng)域的標(biāo)準(zhǔn)文獻(xiàn)凝練術(shù)語4 088個(gè),將其納入領(lǐng)域詞典(表2),對上一階段的種子詞、候選詞比對去重,最終獲得燃?xì)夤芫W(wǎng)應(yīng)急處置領(lǐng)域的詞典總計(jì)包含7 023個(gè)詞。
表2 燃?xì)夤芫W(wǎng)應(yīng)急處置術(shù)語(部分)Table 2 Terms of gas pipeline network emergency rescue(part)
(2)融合與更新。融合是知識再加工的關(guān)鍵環(huán)節(jié),通過實(shí)體消歧和共指消解兩種方式對知識體進(jìn)行提純。在實(shí)體的表達(dá)中可能會存在多種語義模糊實(shí)體界限,由于燃?xì)庑袠I(yè)有明確的術(shù)語規(guī)范,而且標(biāo)準(zhǔn)文本有嚴(yán)格的要求,相對規(guī)范且實(shí)體詞義僅限于燃?xì)忸I(lǐng)域,實(shí)體歧義和共指消解的問題基本不存在。
隨著燃?xì)夤に嚨募夹g(shù)演進(jìn)、標(biāo)準(zhǔn)文獻(xiàn)的動態(tài)更新,知識圖譜的自我完善機(jī)制的建立和運(yùn)行具有現(xiàn)實(shí)性。燃?xì)夤芫W(wǎng)應(yīng)急處置知識圖譜的動態(tài)更新機(jī)制可分為模式層和數(shù)據(jù)層,模式更新的主要內(nèi)容在于根據(jù)新興概念的特征,對實(shí)體的類型以及關(guān)系的類型進(jìn)行更新;而數(shù)據(jù)更新關(guān)注于標(biāo)準(zhǔn)自身的迭代,注重對知識質(zhì)量及有效性的評估,根據(jù)評估結(jié)果及時(shí)修正無用知識,或增加新的概念數(shù)據(jù)。
Neo4j圖數(shù)據(jù)庫具有高性能、擴(kuò)展便利、支持海量數(shù)據(jù)儲存以及易于維護(hù)等特征。采用該數(shù)據(jù)庫作為數(shù)據(jù)存儲的數(shù)據(jù)庫。由第三方破壞及腐蝕導(dǎo)致的泄漏事故占燃?xì)夤芫W(wǎng)事故的82.1%,因此,以燃?xì)夤芫W(wǎng)泄漏突發(fā)事件應(yīng)急處置救援為例,通過對燃?xì)馔话l(fā)事件相關(guān)法律法規(guī)、應(yīng)急救援預(yù)案、技術(shù)標(biāo)準(zhǔn)等文本資源通過知識抽取,形成不同節(jié)點(diǎn)與實(shí)體之間的關(guān)聯(lián)關(guān)系。將相關(guān)數(shù)據(jù)導(dǎo)人數(shù)據(jù)庫進(jìn)行存儲與表示,從而實(shí)現(xiàn)燃?xì)夤芫W(wǎng)應(yīng)急處置知識圖譜的可視化。
知識圖譜本身具有Cypher語句查詢的功能,作為一個(gè)數(shù)據(jù)庫,燃?xì)夤芫W(wǎng)應(yīng)急處置知識圖譜具有指導(dǎo)操作和標(biāo)準(zhǔn)糾錯(cuò)兩方面的應(yīng)用前景。
(1)知識圖譜是標(biāo)簽與圖形的結(jié)合,利用知識脈絡(luò)展現(xiàn)不同知識之間的邏輯連接。一般而言燃?xì)獍踩录奶幹檬乾F(xiàn)場應(yīng)急人員根據(jù)專業(yè)知識結(jié)合事故經(jīng)驗(yàn)制定處置方案,方案的好壞依賴于救援個(gè)體的能力水平,而應(yīng)急處置的知識圖譜則提供了一種基于知識系統(tǒng)的科學(xué)研判機(jī)制,運(yùn)用邏輯關(guān)聯(lián)以點(diǎn)觸發(fā)不斷拓展和深化知識范圍和層次,協(xié)助現(xiàn)場人員制定處置策略。通過知識圖譜化的過程及成果,對零散的知識源進(jìn)行體系化、標(biāo)準(zhǔn)化和規(guī)范化處理,實(shí)現(xiàn)了知識驅(qū)動型的事件處置機(jī)制,提升現(xiàn)場處置的科學(xué)性。
(2)通過分析知識圖譜,可以檢測不同標(biāo)準(zhǔn)文獻(xiàn)之間是否存在不一致等知識沖突現(xiàn)象。比如,GB50028《城鎮(zhèn)燃?xì)庠O(shè)計(jì)規(guī)范》第10.2.39條,放散管管口應(yīng)高出屋脊(或平屋頂)1 m以上或設(shè)置在地面上安全處;GB50041《鍋爐房設(shè)計(jì)標(biāo)準(zhǔn)》第13.3.4條,放散管的排出口應(yīng)高出鍋爐房屋脊2 m以上;針對放散管的安裝高度存在不一致。GB50028《城鎮(zhèn)燃?xì)庠O(shè)計(jì)規(guī)范》附錄E.0.6,鍋爐房等可劃為非爆炸危險(xiǎn)區(qū)域;GB50041《鍋爐房設(shè)計(jì)標(biāo)準(zhǔn)》第15.2.2條,燃油、燃?xì)忮仩t房的鍋爐間等有爆炸危險(xiǎn)場所的等級劃分,應(yīng)符合GB50058《爆炸危險(xiǎn)環(huán)境電力裝置設(shè)計(jì)規(guī)范》的有關(guān)規(guī)定。針對鍋爐房是否防爆的規(guī)定存在不一致現(xiàn)象。另外,術(shù)語相同,定義不同也是較為典型的現(xiàn)象之一。例如爆炸下限在不同標(biāo)準(zhǔn)的具體表述上存在細(xì)微差別,如圖6所示。
借助知識圖譜技術(shù)對燃?xì)鈶?yīng)急標(biāo)準(zhǔn)文獻(xiàn)進(jìn)行知識組織,搜集整理了400余份相關(guān)燃?xì)獾膰?、行業(yè)、地方和團(tuán)體標(biāo)準(zhǔn),以及對應(yīng)的法律法規(guī)和應(yīng)急救援預(yù)案等文件,提出了一種自頂向下與自底向上相結(jié)合,適用于燃?xì)夤芫W(wǎng)應(yīng)急處置環(huán)節(jié)的知識圖譜構(gòu)建方法,形成了知識圖譜的模式層;針對燃?xì)夤芫W(wǎng)應(yīng)對標(biāo)準(zhǔn)文本的特性,梳理出燃?xì)鈶?yīng)急領(lǐng)域?qū)S迷~典,綜合使用多種深度學(xué)習(xí)模型進(jìn)行知識抽取,構(gòu)建知識圖譜的數(shù)據(jù)層。最后,應(yīng)用Neo4j對燃?xì)夤芫W(wǎng)應(yīng)急處置知識進(jìn)行了可視化,可以較好地展示標(biāo)準(zhǔn)的知識語義關(guān)聯(lián)。
通過知識圖譜構(gòu)建的手段打通燃?xì)夤芫W(wǎng)領(lǐng)域標(biāo)準(zhǔn)數(shù)字化的技術(shù)路徑,將研究成果應(yīng)用到城市燃?xì)夤芫W(wǎng)事故應(yīng)急處置現(xiàn)場,可以提高突發(fā)事件應(yīng)對標(biāo)準(zhǔn)在實(shí)際應(yīng)用中的使用效率,充分發(fā)揮標(biāo)準(zhǔn)的支撐作用,實(shí)現(xiàn)燃?xì)夤芫W(wǎng)突發(fā)事件應(yīng)急處置標(biāo)準(zhǔn)快速化應(yīng)用的效果,提升實(shí)際過程中城市燃?xì)夤芫W(wǎng)事故應(yīng)急處置過程的科學(xué)性、標(biāo)準(zhǔn)化程度和專業(yè)化水平。建立燃?xì)馔话l(fā)事件應(yīng)對標(biāo)準(zhǔn)要素知識圖譜,助力推動快速利用現(xiàn)有燃?xì)忸I(lǐng)域標(biāo)準(zhǔn)文件信息輔助進(jìn)行科學(xué)精準(zhǔn)應(yīng)急決策。