王 曉 爽,李 吉 東,徐 海 紅,諸 云 強(qiáng),代 小 亮,周 天 墨,6
(1.中國科學(xué)院地理科學(xué)與資源研究所/資源與環(huán)境信息系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,北京 100101;2.中國科學(xué)院大學(xué),北京 100049;3.北京市生態(tài)環(huán)境局綜合事務(wù)中心,北京 100048;4.東營市生態(tài)環(huán)境局,山東 東營 257091;5.生態(tài)環(huán)境部環(huán)境工程評(píng)估中心,北京 100012;6.應(yīng)急管理部信息研究院,北京 100029)
大氣污染執(zhí)法是大氣環(huán)境防治以及實(shí)現(xiàn)我國碳達(dá)峰、碳中和目標(biāo)的有效監(jiān)管措施,其包含大氣污染發(fā)現(xiàn)、現(xiàn)場調(diào)查取證、處罰決定和整改監(jiān)督等階段,由不同生態(tài)環(huán)境部門負(fù)責(zé)實(shí)施。由于不同執(zhí)法階段的負(fù)責(zé)人對(duì)執(zhí)法相關(guān)知識(shí)的認(rèn)知角度和理解存在差異,致使出現(xiàn)執(zhí)法尺度不一和量裁不準(zhǔn)情況。因此需要建立統(tǒng)一的知識(shí)語義基礎(chǔ),實(shí)現(xiàn)大氣污染執(zhí)法知識(shí)有效組織和規(guī)范表達(dá),促進(jìn)大氣污染執(zhí)法數(shù)據(jù)資源有效整合集成和知識(shí)的一致性理解,推動(dòng)智能化執(zhí)法發(fā)展。大氣污染執(zhí)法各階段可視為多個(gè)事件銜接而成,每個(gè)事件發(fā)生在大氣執(zhí)法不同階段的特定時(shí)間、空間和語義環(huán)境下,由若干個(gè)角色參與,表現(xiàn)為若干動(dòng)作特征[1]。由于大氣污染執(zhí)法的事件性特征,需要一種基于事件的知識(shí)組織方法實(shí)現(xiàn)對(duì)領(lǐng)域內(nèi)知識(shí)的組織和規(guī)范表達(dá)。事理圖譜從認(rèn)知智能角度出發(fā),以事件為中心能有效描述大氣污染執(zhí)法事件信息、事件關(guān)系和事理邏輯[2]。在特定研究領(lǐng)域的事理圖譜構(gòu)建中主要采用自頂向下的方式[3]構(gòu)建事件本體,在本體的指導(dǎo)下利用自下而上的抽取方法挖掘形成事理圖譜,其中事件本體是針對(duì)研究領(lǐng)域事件類系統(tǒng)模型明確的形式化規(guī)范說明。
目前事件本體的構(gòu)建具體可歸納為3個(gè)階段:1)依據(jù)傳統(tǒng)領(lǐng)域本體建模理論,描述具有動(dòng)態(tài)過程特征的對(duì)象領(lǐng)域知識(shí),定義領(lǐng)域事件并對(duì)事件及事件關(guān)系進(jìn)行定義和分類,形成事件表示模型。例如:ABC模型[4]以事件為驅(qū)動(dòng),通過事件、情景、動(dòng)作和Agent等概念及其關(guān)系描述事件,從而構(gòu)建共享概念模型;簡單事件模型(Simple Event Model,SEM)[5]將事件類型定義為個(gè)體或類,采用事件、參與者、地點(diǎn)和時(shí)間描述事件實(shí)例,可實(shí)現(xiàn)事件概念的重用;Lode模型[6]重點(diǎn)針對(duì)某個(gè)特定時(shí)間和動(dòng)作定義發(fā)生的事件,可從關(guān)聯(lián)數(shù)據(jù)集中收集實(shí)體,發(fā)現(xiàn)數(shù)據(jù)間的復(fù)雜關(guān)系;EO(Event Ontology)模型[7]采用事件演算的思想,通過地點(diǎn)、時(shí)間、產(chǎn)品、要素和Agent等概念描述事件。上述模型注重對(duì)事件及相關(guān)概念的規(guī)范表述,具有完備的事件概念層結(jié)構(gòu),但不具備事件層結(jié)構(gòu),難以對(duì)事件的關(guān)系和演變規(guī)律進(jìn)行描述,特別是難以實(shí)現(xiàn)時(shí)空的動(dòng)態(tài)表示和事件推理。2)基于基本事理邏輯構(gòu)建事件本體模型。例如:OSL_EO模型[8]構(gòu)建了關(guān)于事件和事件關(guān)系的上層本體模型,該模型能描述事件間邏輯關(guān)系,但對(duì)事件的表示闡述不完善且缺乏實(shí)證;H_EO模型是基于歷史事件建立的模型[9],建模時(shí)考慮了事件的基本要素(事件的原因、結(jié)果),定義了事件表示的語義邏輯,但未明確區(qū)分事件和動(dòng)作,也未定義事件非結(jié)構(gòu)關(guān)系。3)基于事件類層次結(jié)構(gòu)構(gòu)建事件本體模型。以事件為研究單元,通過事件要素完成對(duì)事件的定義,描述事件分類和事件關(guān)系,從而設(shè)計(jì)事件本體結(jié)構(gòu)模型。劉宗田等[1]提出了較完善的事件定義,規(guī)定事件由動(dòng)作、對(duì)象、時(shí)間、環(huán)境、斷言和語言表現(xiàn)六要素組成,將事件本體結(jié)構(gòu)定義為事件類集合、關(guān)系集合和推理規(guī)則三元組,通過提取事件間關(guān)系形成事件本體建模理論。基于該理論,學(xué)者們提出了不同領(lǐng)域的事件本體模型。例如:劉菲京等[10]結(jié)合大氣污染突發(fā)事件特征,抽象出大氣污染突發(fā)事件定義、類別和相關(guān)事件要素,建立大氣污染突發(fā)事件關(guān)系和突發(fā)事件本體模型;朱文躍等[11]結(jié)合突發(fā)事件領(lǐng)域特征,將事件類六要素定義為觸發(fā)詞、對(duì)象、時(shí)間、地點(diǎn)、狀態(tài)和語言表現(xiàn),從而將事件本體結(jié)構(gòu)定義為描述事件分類體系的上層事件類、以事件關(guān)系組成的事件格結(jié)構(gòu)的下層事件類、事件關(guān)系、事件推理規(guī)則和事件實(shí)例的五元組,完整、準(zhǔn)確地描述突發(fā)事件,具有較強(qiáng)的可擴(kuò)展性;朱宇倩等[12,13]結(jié)合領(lǐng)域特征,構(gòu)建了安全信息認(rèn)知事故本體模型和煤炭安全事件本體模型。
上述事件本體模型通過事件要素描述事件,采用事件動(dòng)作描述事件發(fā)生機(jī)理,建立事件間層次結(jié)構(gòu)和關(guān)系,可更完整地描述研究對(duì)象;但該類模型主要通過時(shí)間、地點(diǎn)描述事件內(nèi)容,通過建立事件間的語義關(guān)系表現(xiàn)事理發(fā)展規(guī)律,并未通過事件的時(shí)空間要素構(gòu)建事件之間復(fù)雜的時(shí)空變化關(guān)系。由于大氣污染執(zhí)法由各執(zhí)法事件銜接而成,執(zhí)法者需要在各執(zhí)法事件發(fā)生發(fā)展過程中通過追蹤大氣污染行為的時(shí)空變化規(guī)律,精準(zhǔn)定位污染源所在位置并對(duì)污染行為進(jìn)行取證。因此,在構(gòu)建大氣污染執(zhí)法事件本體時(shí),需要顧及各執(zhí)法事件間的時(shí)空關(guān)系和語義關(guān)系,準(zhǔn)確、規(guī)范化描述執(zhí)法過程,建立顧及時(shí)空特征的大氣污染執(zhí)法事理圖譜。
本文結(jié)合大氣污染執(zhí)法特點(diǎn),對(duì)已有事件本體模型進(jìn)行改進(jìn),采用時(shí)間、空間位置、執(zhí)法參與對(duì)象、動(dòng)作、狀態(tài)5類事件要素對(duì)執(zhí)法事件進(jìn)行描述,并對(duì)各執(zhí)法事件間的時(shí)間關(guān)系、空間關(guān)系和語義關(guān)系進(jìn)行規(guī)范化定義,形成充分考慮時(shí)空特性的大氣污染執(zhí)法事件本體表示模型,進(jìn)而構(gòu)建大氣污染執(zhí)法知識(shí)體系和事件本體,實(shí)現(xiàn)大氣污染執(zhí)法事件知識(shí)的組織和管理;以某熱力生產(chǎn)公司經(jīng)營的燃?xì)忮仩t超標(biāo)排放執(zhí)法案件為例,抽取案例事件要素和事件時(shí)間、空間、語義關(guān)系,構(gòu)建大氣污染執(zhí)法事理圖譜實(shí)例,采用Neo4j圖數(shù)據(jù)庫對(duì)大氣污染執(zhí)法知識(shí)圖譜進(jìn)行存儲(chǔ)管理和可視化展示,并深入分析大氣污染執(zhí)法事件間的時(shí)空演化規(guī)律和邏輯演變規(guī)律。
由于大氣污染執(zhí)法是以執(zhí)法事件為核心,包含多個(gè)執(zhí)法階段的動(dòng)態(tài)過程,其中每個(gè)執(zhí)法階段均由多個(gè)事件組成[14],因此,大氣污染執(zhí)法事件本體表示模型(Air Pollution Law Enforcement Event Ontology Presentation Model,APLEEOPM)采用四元組結(jié)構(gòu),對(duì)大氣污染執(zhí)法事件(APLE_Event)、事件關(guān)系(APLE_Relations)、事件實(shí)例(APLE_Individuals)以及事件間推理規(guī)則(APLE_Rules)進(jìn)行規(guī)范化表達(dá)(式(1))。其中,最為核心的是大氣污染執(zhí)法事件(APLE_Event),其是對(duì)特定時(shí)空范圍下污染大氣行為的行政管理活動(dòng),具有動(dòng)態(tài)性和規(guī)律性等特征,可進(jìn)一步通過大氣污染執(zhí)法事件發(fā)生的時(shí)間(APLE_Time)、空間位置(APLE_Location)、參與對(duì)象(APLE_Object)、事件動(dòng)作(APLE_Action)、事件狀態(tài)(APLE_Status)進(jìn)行定義(式(2))[15]。1)APLE_Time包括瞬時(shí)時(shí)間和時(shí)間段[10],前者通常為一個(gè)時(shí)間點(diǎn)(如執(zhí)法調(diào)查時(shí)間、投訴舉報(bào)時(shí)間等),后者表示事件持續(xù)時(shí)間(如超標(biāo)排放時(shí)長、整改時(shí)限等)。2)APLE_Location包括事件發(fā)生地點(diǎn)(污染發(fā)生地點(diǎn)、調(diào)查地點(diǎn))或受影響空間區(qū)域(環(huán)境功能區(qū)劃、行政區(qū)劃等),可由區(qū)域名稱、經(jīng)緯度、地址、四至范圍等描述。3)APLE_Object包括執(zhí)法者、違法者、法規(guī)標(biāo)準(zhǔn)、大氣污染物、大氣環(huán)境對(duì)象和罰沒財(cái)物6類:執(zhí)法者是對(duì)污染事件進(jìn)行調(diào)查取證,依據(jù)相關(guān)法規(guī)對(duì)違法企業(yè)下達(dá)處罰的執(zhí)法人員,具有名稱、所屬機(jī)構(gòu)、證件編號(hào)等屬性;違法者指違規(guī)排放大氣污染物的企業(yè),包括固定污染源和移動(dòng)污染源,具有行業(yè)類別、企業(yè)名稱、注冊(cè)地址、生產(chǎn)環(huán)節(jié)、生產(chǎn)工藝、環(huán)保設(shè)施、排放源編號(hào)、企業(yè)名稱、注冊(cè)地址、車牌號(hào)、車架號(hào)等屬性;法規(guī)標(biāo)準(zhǔn)指在執(zhí)法過程中依據(jù)的大氣污染治理方面相關(guān)的法規(guī)和技術(shù)標(biāo)準(zhǔn)(如《北京市大氣污染防治條例》《鍋爐大氣污染物排放標(biāo)準(zhǔn)》(DB11/139-2015)等);大氣污染物根據(jù)形態(tài)可分為氣態(tài)污染物(氮氧化物、揮發(fā)性有機(jī)物等)和顆粒狀污染物(揚(yáng)塵、粉塵、砂石等),具有類別、體積/濃度、含量等屬性;大氣環(huán)境對(duì)象指受污染的大氣環(huán)境要素,通過國控空氣質(zhì)量監(jiān)測站點(diǎn)主要監(jiān)測指標(biāo)(二氧化硫、二氧化氮、可吸入顆粒物和細(xì)顆粒物等)表征;罰沒財(cái)物指執(zhí)法人員判處違法企業(yè)繳納一定數(shù)額罰金或查封、扣押相關(guān)財(cái)物等。4)APLE_Action指大氣污染執(zhí)法事件全過程各參與對(duì)象的行為,如執(zhí)法人員處罰違法企業(yè)、違法企業(yè)排放大氣污染物等。5)APLE_Status指大氣污染執(zhí)法事件發(fā)生后的狀態(tài)描述。
APLEEOPM::=(APLE_Event,APLE_Relations,
APLE_Individuals,APLE_Rules)
(1)
APLE_Event::= (APLE_Time,APLE_Location,
APLE_Object,APLE_Action,APLE_Status)
(2)
1.2.1 大氣污染執(zhí)法事件概念體系 根據(jù)大氣污染執(zhí)法階段,在頂層可將執(zhí)法事件分為(圖1):1)大氣污染事件,根據(jù)污染行為進(jìn)一步劃分為大氣污染物泄露事件(包括工業(yè)生產(chǎn)和服務(wù)活動(dòng)泄露污染物、餐飲油煙排放、工業(yè)揚(yáng)塵和油氣泄露4類事件)和大氣污染物超標(biāo)排放事件(包括固定污染源、移動(dòng)污染源超標(biāo)排放事件)。2)執(zhí)法調(diào)查事件,包括污染發(fā)現(xiàn)(可分為環(huán)境監(jiān)測結(jié)果異常、重點(diǎn)行業(yè)巡檢、投訴舉報(bào)發(fā)現(xiàn))和現(xiàn)場調(diào)查兩類子事件。3)現(xiàn)場檢測取證事件,包括檢測取證(污染檢測和違規(guī)現(xiàn)象取證)、獲得檢測取證結(jié)果(獲得檢測結(jié)果和獲得取證結(jié)果)和判斷檢測取證結(jié)果(判斷依據(jù)標(biāo)準(zhǔn)和判別檢測結(jié)果性質(zhì))3類子事件。4)處罰決定事件,由判斷違法行為性質(zhì)事件和作出處罰決定事件組成(判斷判罰依據(jù)法規(guī)事件、限期整改事件及罰款處罰事件)。5)整改監(jiān)督事件,根據(jù)處罰方式分為繳納罰款、設(shè)施整改和停產(chǎn)整改3類子事件。
圖1 大氣污染執(zhí)法事件體系Fig.1 Air pollution law enforcement event system
1.2.2 大氣污染執(zhí)法事件關(guān)系確定 大氣污染執(zhí)法事件關(guān)系主要有時(shí)間關(guān)系、空間關(guān)系和語義關(guān)系。
(1)大氣污染執(zhí)法事件時(shí)間關(guān)系指各事件時(shí)間要素間的相互關(guān)系,體現(xiàn)事件間時(shí)間變化特征,通常用時(shí)間拓?fù)潢P(guān)系(Event Temporal Topological Relation,ETTR)表達(dá),包括包含(include)、早于/晚于(earlier/later)、部分重疊(partial overlap)和相等(equal)關(guān)系等。大氣環(huán)境監(jiān)測指標(biāo)易受氣象氣候條件等因素影響,因此大氣污染源污染時(shí)間段與指標(biāo)變化時(shí)間段為包含關(guān)系或部分重疊關(guān)系。
(2)大氣污染執(zhí)法事件空間關(guān)系可定義為執(zhí)法事件中地理實(shí)體對(duì)象之間的空間關(guān)系。根據(jù)位置形狀和屬性不同,大氣污染相關(guān)地理實(shí)體對(duì)象可表述為點(diǎn)對(duì)象(煙筒、加油站等大氣污染固定排放源)和面對(duì)象(行政區(qū)域、住宅小區(qū)等大氣污染受影響范圍)[16],其空間關(guān)系包括:1)空間拓?fù)潢P(guān)系(Event Spatial Topological Relation,ESTR),表示大氣污染執(zhí)法事件中地理實(shí)體之間的鄰近和關(guān)聯(lián)程度[17],包括包含(include)/被包含(included)、相鄰(adjacent)、相離(separate)、重疊(overlap)和部分重疊(partial overlap)等。本文采用基于維數(shù)擴(kuò)展的9-交模型(Dimensionally Extended nine-Intersection Model,DE-9IM)(式(3))[18],通過事件中兩個(gè)地理實(shí)體的內(nèi)部(interior)、邊界(boundary)、外部(exterior)構(gòu)建矩陣以描述空間拓?fù)潢P(guān)系。2)空間方位關(guān)系(Event Spatial Orientation Relation,ESOR),包括方位定性表達(dá)和方位定量表達(dá)。3)空間距離關(guān)系(Event Spatial Distance Relation,ESDR),包括距離定性表達(dá)和距離定量表達(dá)。空間方位關(guān)系和空間距離關(guān)系通常在大氣污染執(zhí)法中描述違法者經(jīng)營的污染源和受大氣污染影響區(qū)域之間、違法者與執(zhí)法者之間等的相對(duì)空間位置關(guān)系,據(jù)此可以確定違法者或污染對(duì)象的位置。例如:某投訴舉報(bào)信息為“舉報(bào)距離本村西南300米或距離本村較近煙筒排放黑煙,味道刺鼻。”其中,“西南”為方向定性表達(dá)詞,“300米”為方向定量表達(dá)詞,“較近”為距離定性表達(dá)詞,描述了舉報(bào)人所在位置與污染源之間空間方位關(guān)系和空間距離關(guān)系。執(zhí)法者需根據(jù)這些信息在現(xiàn)場調(diào)查事件中進(jìn)一步明確污染源調(diào)查的具體地點(diǎn)。
(3)
式中:RDE-9IM(a,b)代表DE-9IM模型描述的地理實(shí)體間的空間拓?fù)潢P(guān)系;a、b代表不同大氣污染執(zhí)法事件中的地理實(shí)體;I、B、E分別代表地理實(shí)體的內(nèi)部、邊界和外部。對(duì)地理實(shí)體a、b內(nèi)部、邊界和外部進(jìn)行求交計(jì)算,結(jié)果可分為空集、點(diǎn)、線和面4類,分別取值-1、0、1、2,將-1定義為F,0、1、2定義為T,其他情況為*,則可將9類相交情況用字符串組織表示拓?fù)潢P(guān)系,如字符“T*****FF*”表示包含關(guān)系。
(3)大氣污染執(zhí)法事件語義關(guān)系(Event Semantic Relation,ESR)指執(zhí)法相關(guān)行為發(fā)生的事理邏輯關(guān)系,包括:1)包含關(guān)系,指大氣污染執(zhí)法事件之間的層次關(guān)系或父子關(guān)系,如大氣污染事件包含大氣污染物超標(biāo)排放事件和大氣污染物泄露事件;2)組成關(guān)系,指事件由幾個(gè)子事件類組成或某事件的實(shí)例由另幾個(gè)子事件的實(shí)例組成,如執(zhí)法調(diào)查事件由污染發(fā)現(xiàn)事件和現(xiàn)場調(diào)查事件組成;3)因果關(guān)系,指因某事件的發(fā)生導(dǎo)致另一事件的發(fā)生,如檢測取證事件導(dǎo)致獲得檢測取證結(jié)果事件;4)順承關(guān)系,指某事件發(fā)生后,另一事件以一定概率伴隨發(fā)生[13],如現(xiàn)場調(diào)查事件之后伴隨污染檢測事件發(fā)生;5)并發(fā)關(guān)系,指在一定時(shí)間范圍內(nèi),兩個(gè)事件可能同時(shí)發(fā)生,如責(zé)令違法者限期整改事件和對(duì)其罰款處罰事件幾乎同時(shí)發(fā)生。具體事件關(guān)系[19]如圖2所示。
圖2 大氣污染執(zhí)法事件關(guān)系分類Fig.2 Relation classes of air pollution law enforcement events
1.3.1 大氣污染執(zhí)法事理圖譜案例知識(shí)抽取 利用構(gòu)建的大氣污染執(zhí)法事件本體模型可從多模態(tài)數(shù)據(jù)資料中抽取大氣污染執(zhí)法事件的要素、要素屬性和事件關(guān)系。大氣污染執(zhí)法案件原始語料數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)(污染源相關(guān)關(guān)系型數(shù)據(jù)庫)和非結(jié)構(gòu)化文本數(shù)據(jù)(執(zhí)法文本數(shù)據(jù),如處罰決定書、現(xiàn)場調(diào)查單和投訴舉報(bào)單等)。針對(duì)結(jié)構(gòu)化數(shù)據(jù),可通過結(jié)構(gòu)化數(shù)據(jù)表直接映射的方式獲取案件中的事件要素和屬性知識(shí);對(duì)于非結(jié)構(gòu)化文本數(shù)據(jù),則需利用基于規(guī)則或深度學(xué)習(xí)的自動(dòng)抽取方法[20,21],進(jìn)行事件要素和要素屬性的抽取,如從處罰決定書文本中抽取現(xiàn)場調(diào)查事件和處罰決定事件中時(shí)間、空間位置、參與對(duì)象(執(zhí)法者、違法企業(yè)等)、行為(調(diào)查、處罰等)、狀態(tài)等事件要素的實(shí)例信息。通過對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)中抽取事件的時(shí)間要素進(jìn)行判別和排序可獲得時(shí)間關(guān)系;采用Geos開源庫的空間操作算子[22,23]可抽取地理實(shí)體對(duì)象間的空間關(guān)系[22]。本文利用DE-9IM模型描述大氣污染執(zhí)法事件地理實(shí)體間的拓?fù)潢P(guān)系,由不同字符串表示不同拓?fù)潢P(guān)系情況。將字符串與自然語言描述建立對(duì)應(yīng)關(guān)聯(lián)[24],實(shí)現(xiàn)“拓?fù)潢P(guān)系—矩陣字符串—自然語言描述”的映射關(guān)系[25](表1)。以某案件污染發(fā)現(xiàn)事件與現(xiàn)場調(diào)查事件間的空間關(guān)系為例,執(zhí)法者以某鄉(xiāng)鎮(zhèn)區(qū)域大氣質(zhì)量指標(biāo)變化為依據(jù),現(xiàn)場調(diào)查發(fā)現(xiàn)區(qū)域內(nèi)污染企業(yè)排放源超標(biāo)排放。在完成非結(jié)構(gòu)化文本中鄉(xiāng)鎮(zhèn)區(qū)域和污染源地址的相關(guān)信息提取后,通過DE-9IM模型描述拓?fù)潢P(guān)系與自然語言描述的對(duì)應(yīng)關(guān)聯(lián),利用Geos開源庫提取該鄉(xiāng)鎮(zhèn)區(qū)域與污染企業(yè)排放源的空間包含關(guān)系,并建立與自然語言描述的對(duì)應(yīng)關(guān)系;通過獲取案件文本中空間方位和距離的表達(dá)詞可提取事件中地理實(shí)體間的相對(duì)位置關(guān)系,也可采用Geos庫提取地理實(shí)體間的方位關(guān)系和定量距離,實(shí)現(xiàn)事件間空間關(guān)系提??;通過提取事件要素和要素屬性后獲得案例具體事件知識(shí),通過構(gòu)建事件本體模型中的事件語義關(guān)系確定案例中具體事件間語義關(guān)系。
表1 事件空間拓?fù)潢P(guān)系與自然語言描述對(duì)應(yīng)關(guān)系Table 1 Corresponding relation of event spatial topology and natural language description
1.3.2 大氣污染執(zhí)法事理圖譜案例知識(shí)存儲(chǔ) 抽取大氣污染執(zhí)法事件案例信息后,需將事件及其要素、屬性和關(guān)系等進(jìn)行統(tǒng)一表達(dá)和存儲(chǔ)。首先,基于資源描述框架(Resource Description Framework,RDF)三元組,對(duì)大氣污染執(zhí)法事件及事件要素、要素屬性等進(jìn)行表達(dá);然后利用Neo4j、JanusGraph、OrientDB圖數(shù)據(jù)庫等對(duì)其進(jìn)行儲(chǔ)存管理,在圖數(shù)據(jù)庫中,基于帶標(biāo)簽的屬性圖模型特點(diǎn),將大氣污染執(zhí)法具體案例事件、事件要素實(shí)例、要素屬性存儲(chǔ)為節(jié)點(diǎn),進(jìn)而支撐后續(xù)的基于圖查詢語言、圖挖掘算法的大氣污染執(zhí)法知識(shí)推理計(jì)算[26]。大氣污染執(zhí)法案例知識(shí)存儲(chǔ)策略如表2所示。
表2 圖數(shù)據(jù)庫具體案例知識(shí)存儲(chǔ)策略示例Table 2 Example of case knowledge storage strategy in graph database
本文選擇固定污染源超標(biāo)排放執(zhí)法案件中某熱力生產(chǎn)公司經(jīng)營的燃?xì)忮仩t超標(biāo)排放執(zhí)法案件,實(shí)現(xiàn)大氣污染執(zhí)法事理圖譜構(gòu)建,案例數(shù)據(jù)包括案例的處罰決定書、污染發(fā)生同時(shí)期和污染源所在同區(qū)域的大氣質(zhì)量監(jiān)測數(shù)據(jù)以及大氣污染相關(guān)法規(guī)標(biāo)準(zhǔn)文獻(xiàn)資料。案件污染源—燃?xì)忮仩t位于北京市大興區(qū)榆垡鎮(zhèn)規(guī)劃區(qū)盛平街9號(hào),大興區(qū)生態(tài)環(huán)境監(jiān)察執(zhí)法人員通過2018年12月17-23日北京市大氣污染粗顆粒度(TSP)濃度排名,分析大興區(qū)榆垡鎮(zhèn)TSP濃度值為218,在北京市所有鄉(xiāng)鎮(zhèn)(街道)中位居第一??紤]污染發(fā)生時(shí)間為秋冬季,北京市大氣污染現(xiàn)象常見原因?yàn)榍锒竟┡瘯r(shí)期鍋爐超標(biāo)排放污染物。因此,執(zhí)法人員重點(diǎn)對(duì)榆垡鎮(zhèn)區(qū)域內(nèi)運(yùn)營的鍋爐房進(jìn)行排查,發(fā)現(xiàn)某燃?xì)忮仩t超標(biāo)排放氮氧化物,通過現(xiàn)場調(diào)查和檢測確定污染事實(shí),依法對(duì)其進(jìn)行處罰。根據(jù)前述提出的大氣污染執(zhí)法事理圖譜構(gòu)建方法,系統(tǒng)建立了案件中具體事件的實(shí)例以及事件要素和事件關(guān)系(表3)。
表3 鍋爐超標(biāo)排放案件實(shí)例Table 3 Case of excessive emission of boiler
(1)根據(jù)已構(gòu)建的大氣污染執(zhí)法事理圖譜案例知識(shí)存儲(chǔ)策略,構(gòu)建具體執(zhí)法事件節(jié)點(diǎn)以及具體事件中時(shí)間、空間位置、參與對(duì)象、狀態(tài)等要素節(jié)點(diǎn),建立事件要素在事件中的角色關(guān)聯(lián)和事件參與對(duì)象間動(dòng)作關(guān)聯(lián),并在已構(gòu)建具體執(zhí)法事件基礎(chǔ)上建立事件語義關(guān)系。創(chuàng)建該燃?xì)忮仩t超標(biāo)排放執(zhí)法案件具體事件節(jié)點(diǎn)、事件要素節(jié)點(diǎn)和事件語義關(guān)系的Cypher語句如下:
create(e1:Event{name:”鍋爐超標(biāo)排放事件”})
create(t1:time{name:"2018年12月預(yù)估"})
create(l1:location{name:"北京市大興區(qū)榆垡鎮(zhèn)規(guī)劃區(qū)盛平街9號(hào)"})
create(em1:emission{name:”燃?xì)忮仩t”,number:”WNS-1.25-YQ”,volume:”1蒸噸”})
create(p1:pollutant{name:”氮氧化物”})
create(s1:status{name:”鍋爐超標(biāo)排放氮氧化物狀態(tài)”})
match(em1:emission{name:"燃?xì)忮仩t",number:"WNS-1.25-YQ",volume:"1蒸噸"}),(p1:pollutant{name:"氮氧化物"})
create(em1)-[er15:APLE_Action_emit]->(p1)
return er15
構(gòu)建事件語義關(guān)系Cypher語句如下:
match(e1:Event{name:"鍋爐超標(biāo)排放事件"}),(e2:Event{name:"污染發(fā)現(xiàn)事件"})
create(e1)-[r:ESR_cause]->(e2)
return r
本文創(chuàng)建鍋爐超標(biāo)排放事件要素和要素關(guān)系,并建立6個(gè)事件實(shí)例和事件間語義邏輯關(guān)系關(guān)聯(lián),形成鏈狀事件演化規(guī)律(圖3),能為不同執(zhí)法階段提供知識(shí)關(guān)聯(lián)推理和自動(dòng)推薦案件處理環(huán)節(jié)中所需信息。
圖3 鍋爐超標(biāo)排放案件事件語義關(guān)系和部分事件要素Fig.3 Event semantic relation and part of event factors of boiler excessive emission case
(2)基于大氣污染執(zhí)法事理圖譜抽取各事件時(shí)間要素,并進(jìn)行判別和排序,通過事件間時(shí)間要素的關(guān)聯(lián)展現(xiàn)事件發(fā)生的時(shí)間關(guān)系。創(chuàng)建時(shí)間關(guān)系的Cypher語句如下:
match(t1:time{name:"2018年12月(預(yù)估)"}),(t2:time{name:"2018年12月17日至23日"})
create(t1)-[tr1:ETTR_include]->(t2)
return tr1
隨著大氣污染執(zhí)法事件發(fā)展,能發(fā)現(xiàn)其時(shí)間變化特征。執(zhí)法者通過確定區(qū)域大氣TSP濃度變化的時(shí)間段,進(jìn)而排查在該時(shí)間段可能致使大氣污染的潛在污染源,通過現(xiàn)場調(diào)查和現(xiàn)場檢測取證確定污染源排放事實(shí)。圖4展示了大氣污染執(zhí)法案件調(diào)查和檢測過程的時(shí)間變化特征,鍋爐超標(biāo)排放事件的時(shí)間段(2018年12月)包含(ETTR_include)污染發(fā)生事件中區(qū)域TSP濃度指標(biāo)變化時(shí)間段(2018年12月17-23日),在區(qū)域TSP濃度指標(biāo)變化時(shí),執(zhí)法者現(xiàn)場調(diào)查和檢測污染源。因此,TSP濃度指標(biāo)變化時(shí)間段與現(xiàn)場調(diào)查事件時(shí)間點(diǎn)(2018年12月19日)之間為包含關(guān)系(ETTR_include),現(xiàn)場調(diào)查時(shí)間點(diǎn)早于(ETTR_earlier)現(xiàn)場檢測取證時(shí)間點(diǎn)(2018年12月27日)。
圖4 鍋爐超標(biāo)排放案件中事件間時(shí)間關(guān)系Fig.4 Event time relation in boiler excessive emission case
執(zhí)法者通過確定大氣TSP濃度較高區(qū)域,進(jìn)而排查區(qū)域內(nèi)有污染貢獻(xiàn)的污染源,準(zhǔn)確查證污染源所在位置,并在污染源周邊取樣檢測取證污染行為。
在執(zhí)法過程各事件中逐步精準(zhǔn)定位污染源位置,形成事件間空間關(guān)系。采用DE-9IM模型描述污染源所在行政區(qū)域(大興區(qū)榆垡鎮(zhèn))和污染源(地理點(diǎn)實(shí)體)、污染源檢測樣點(diǎn)(地理點(diǎn)實(shí)體)之間的拓?fù)潢P(guān)系,采用Geos空間操作算子構(gòu)建地理實(shí)體對(duì)象,提取地理實(shí)體之間的空間拓?fù)潢P(guān)系,形成大氣污染執(zhí)法事件之間的空間拓?fù)潢P(guān)系。如圖5所示,通過大興區(qū)榆垡鎮(zhèn)的經(jīng)緯度范圍建立面狀對(duì)象;利用污染源經(jīng)緯度坐標(biāo)、檢測樣點(diǎn)經(jīng)緯度坐標(biāo)建立點(diǎn)狀對(duì)象,提取空間拓?fù)潢P(guān)系。其中大興區(qū)榆垡鎮(zhèn)為污染源所在行政區(qū)域,與污染源是空間包含關(guān)系(ESTR_include),污染源與該區(qū)域是空間被包含關(guān)系(ESTR_included),污染源與其他檢測樣點(diǎn)是空間相鄰關(guān)系(ESTR_adjacent),該關(guān)系具有對(duì)稱性。
大氣污染執(zhí)法事理圖譜通過抽取案例各事件相關(guān)地理實(shí)體對(duì)象間空間關(guān)系作為事件間空間關(guān)系,展現(xiàn)各事件發(fā)生的空間變化情況,創(chuàng)建事件空間關(guān)系的Cypher語句如下:
match(l1:location{name:"北京市大興區(qū)榆垡鎮(zhèn)規(guī)劃區(qū)盛平街9號(hào)"}),(l2:location{name:"北京市大興區(qū)榆垡鎮(zhèn)"})
create(l1)-[sr1:ESTR_included]->(l2)
return sr1
剖析大氣污染執(zhí)法過程中的時(shí)空變化特征和事理發(fā)展規(guī)律,是準(zhǔn)確描述大氣污染執(zhí)法過程、實(shí)現(xiàn)執(zhí)法案件有效溯源的關(guān)鍵。本文通過改進(jìn)現(xiàn)有事件本體模型,提出大氣污染執(zhí)法事件本體模型并梳理大氣污染執(zhí)法事件知識(shí)體系,形成顧及時(shí)空特征的大氣污染執(zhí)法事件本體;在本體的指導(dǎo)下提出大氣污染執(zhí)法案例知識(shí)抽取和存儲(chǔ)方法,完成大氣污染執(zhí)法事理圖譜的構(gòu)建;通過事理圖譜實(shí)例可視化展現(xiàn),描述了大氣污染執(zhí)法事件的時(shí)空變化特征,進(jìn)而分析事件邏輯演化規(guī)律。
通過構(gòu)建顧及時(shí)空特征的大氣污染執(zhí)法事理圖譜能彌補(bǔ)事理圖譜研究中較少關(guān)注事件間時(shí)空演變關(guān)系的不足,助推事理圖譜構(gòu)建理論發(fā)展。在實(shí)踐層面上,大氣污染執(zhí)法事理圖譜對(duì)于促進(jìn)大氣污染執(zhí)法不同階段數(shù)據(jù)資源整合與共享、大氣污染執(zhí)法案件全程關(guān)聯(lián)和跟蹤監(jiān)督等方面具有重要意義。針對(duì)目前實(shí)例較少的問題,未來將采用更多的大氣污染執(zhí)法案件數(shù)據(jù)創(chuàng)建實(shí)例,完善現(xiàn)有事理圖譜,并從大量的案件實(shí)例中分析和挖掘事件間的時(shí)空關(guān)系信息,為大氣污染執(zhí)法提供智能輔助解決方案。