郭 成,徐成現(xiàn),蔣 維,王 波
(1. 云南電網(wǎng)有限責(zé)任公司 電力科學(xué)研究院,云南 昆明 650217;2. 昆明理工大學(xué) 機(jī)電工程學(xué)院,云南 昆明 650500;3. 成都國(guó)龍信息工程有限責(zé)任公司,四川 成都 610031)
隨著人工智能技術(shù)的不斷發(fā)展,以知識(shí)圖譜為基礎(chǔ)的智能檢索分析方法逐漸運(yùn)用于搜索引擎、電商、醫(yī)療、智能電網(wǎng)等領(lǐng)域[1]。通過抽取技術(shù)從各個(gè)領(lǐng)域的數(shù)據(jù)中抽取實(shí)體、屬性、關(guān)系等語(yǔ)義信息,并通過知識(shí)融合、知識(shí)加工等技術(shù)構(gòu)建知識(shí)庫(kù)。通過實(shí)體間的匹配分析實(shí)現(xiàn)用戶所需的檢索分析服務(wù)。另外,知識(shí)圖譜以數(shù)據(jù)結(jié)構(gòu)為基礎(chǔ),采用本體術(shù)語(yǔ)和語(yǔ)義表達(dá)的格式[2],有規(guī)范且標(biāo)準(zhǔn)的概念模型。能很好地解決電網(wǎng)系統(tǒng)積累的大量多源異構(gòu)的運(yùn)行數(shù)據(jù),包括數(shù)字、文字、圖像等;而且,知識(shí)圖譜通過語(yǔ)義鏈接功能增強(qiáng)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,可使數(shù)據(jù)表達(dá)更加規(guī)范,結(jié)構(gòu)化更強(qiáng),能很好地適應(yīng)智能問答、智能檢索、輔助決策等技術(shù)的運(yùn)用場(chǎng)景[3],同時(shí)對(duì)電網(wǎng)知識(shí)的檢索分析也適用。
近年來,國(guó)內(nèi)外學(xué)者主要將知識(shí)圖譜運(yùn)用于電網(wǎng)調(diào)度、電力設(shè)備檢修等方面。文獻(xiàn)[4]在調(diào)度故障處理領(lǐng)域提出了基于知識(shí)圖譜的電網(wǎng)故障處理輔助決策方法,分析了各個(gè)環(huán)節(jié)的關(guān)鍵技術(shù),最后實(shí)現(xiàn)了基于知識(shí)圖譜的故障信息解析判別、智能輔助決策及多維度的人機(jī)交互。文獻(xiàn)[5]在電網(wǎng)調(diào)度領(lǐng)域提出基于知識(shí)圖譜的智能輔助決策技術(shù),給出了電網(wǎng)調(diào)控知識(shí)圖譜的構(gòu)建步驟,并以故障處置預(yù)案知識(shí)圖譜為例給出了智能輔助決策運(yùn)行機(jī)制。針對(duì)電力設(shè)備檢修,文獻(xiàn)[6]在電氣信息采集系統(tǒng)的基礎(chǔ)上建立了故障運(yùn)維知識(shí)圖譜,利用知識(shí)圖譜高效的語(yǔ)義處理能力和快速分析能力,實(shí)現(xiàn)物聯(lián)網(wǎng)新形勢(shì)下電氣信息采集的高效運(yùn)營(yíng)。文獻(xiàn)[7]提出了輸變電設(shè)備運(yùn)維檢修框架,梳理了輸變電設(shè)備的數(shù)據(jù)現(xiàn)狀,構(gòu)建了基于電力設(shè)備運(yùn)維檢修領(lǐng)域的知識(shí)圖譜檢修策略智能推薦系統(tǒng)。
上述研究為本文知識(shí)圖譜構(gòu)建和檢索分析方法提供了重要的參考和依據(jù)。然而,目前的研究尚未形成電網(wǎng)故障處理檢索分析領(lǐng)域知識(shí)圖譜的構(gòu)建方法和實(shí)現(xiàn)方案。本文基于電網(wǎng)告警故障檢索分析的需求,設(shè)計(jì)了面向低壓配電網(wǎng)絡(luò)拓?fù)漕I(lǐng)域的知識(shí)圖譜,并通過子圖匹配的方法實(shí)現(xiàn)電網(wǎng)知識(shí)的檢索分析。
知識(shí)圖譜是將實(shí)體和實(shí)體或?qū)嶓w和屬性通過相互關(guān)系鏈接的一個(gè)知識(shí)網(wǎng)絡(luò),可以對(duì)世間萬(wàn)物之間的關(guān)系進(jìn)行一種形式化描述,其本質(zhì)上是一個(gè)知識(shí)庫(kù)。知識(shí)圖譜的通用表示形式是三元組:(實(shí)體–關(guān)系–屬性)或(實(shí)體–關(guān)系–實(shí)體),如(示范醫(yī)院–應(yīng)用類別為–專變),(某供電所–包含– 62個(gè)用戶)等。三元組是知識(shí)圖譜中的最基本的單元,實(shí)體和屬性在知識(shí)圖譜中以節(jié)點(diǎn)的形式存在,兩者的關(guān)系以節(jié)點(diǎn)之間的連線存在。不同的實(shí)體或?qū)傩灾g存在不同的關(guān)系,通過結(jié)合可形成網(wǎng)狀的知識(shí)圖譜。
圖譜分為通用圖譜和行業(yè)圖譜,對(duì)于通用圖譜而言,其知識(shí)覆蓋面很廣且可應(yīng)用于任何領(lǐng)域,強(qiáng)調(diào)融合實(shí)體越多越好,主要用在智能搜索領(lǐng)域。通用知識(shí)圖譜專業(yè)性不強(qiáng),干擾大且會(huì)有一詞多義和多詞一義的現(xiàn)象存在,關(guān)系較多而無(wú)法列舉。行業(yè)知識(shí)圖譜則具有一定的行業(yè)意義,以一定的行業(yè)資料進(jìn)行構(gòu)建,可用于特定的行業(yè)。行業(yè)知識(shí)圖譜有很強(qiáng)的專業(yè)性,干擾小且實(shí)體大多是特定的專業(yè)用語(yǔ),一般不會(huì)存在一詞多義或者多詞一義現(xiàn)象,數(shù)據(jù)模式與實(shí)體屬性比較豐富,應(yīng)用程度廣且針對(duì)性強(qiáng)。
本文所提的基于知識(shí)圖譜的電壓合格率檢索方法主要為低壓電網(wǎng)知識(shí)圖譜的構(gòu)建、基于子圖匹配的檢索方法,以及基于評(píng)價(jià)模型的檢索結(jié)果評(píng)價(jià),其基本框架如圖1所示。
圖1 基于知識(shí)圖譜的低壓配電網(wǎng)電壓合格率檢索框架Fig. 1 Retrieval framework of voltage qualification rate of low-voltage distribution network based on knowledge graph
構(gòu)建低壓配電網(wǎng)電壓合格率檢索知識(shí)圖譜。在電力企業(yè)中低壓配電網(wǎng)缺陷記錄業(yè)務(wù)中的知識(shí)類型主要以非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)存在。本文知識(shí)圖譜是利用圖數(shù)據(jù)庫(kù)NEO4J進(jìn)行構(gòu)建,圖數(shù)據(jù)庫(kù)的模型數(shù)據(jù)能夠直觀地表示電網(wǎng)系統(tǒng)的拓?fù)鋵傩裕鐖D2所示。該拓?fù)浣Y(jié)構(gòu)含有3個(gè)廠站,每個(gè)場(chǎng)站由發(fā)電機(jī)(G)、斷路器(開關(guān))、母線(BusBar)、負(fù)荷(LD)、刀閘(隔離開關(guān))等設(shè)備組成,各個(gè)場(chǎng)站間用交流線路(LN)進(jìn)行鏈接。
圖2 低壓配電網(wǎng)拓?fù)浣Y(jié)構(gòu)Fig. 2 Low-voltage distribution network topology
實(shí)體/屬性抽取是指從低壓配電網(wǎng)缺陷記錄原始語(yǔ)料中自動(dòng)識(shí)別出實(shí)體或?qū)傩?。?shí)體抽取的常用方法有神經(jīng)網(wǎng)絡(luò)方法和基于規(guī)則與詞典的方法。前者可以自動(dòng)地從記錄語(yǔ)料中對(duì)有效特征進(jìn)行捕獲和表示,從而完成實(shí)體的識(shí)別;而規(guī)則與詞典是用預(yù)先定義好的規(guī)則庫(kù),然后從語(yǔ)料中抽取出電力設(shè)備實(shí)體名稱,設(shè)備所屬機(jī)構(gòu)名,電壓變化范圍及變化時(shí)間。典型的實(shí)體/屬性抽取方法有條件隨機(jī)場(chǎng)[8],隱馬爾可夫模型[9]和BILSTM模型[10]等。在電壓合格率檢索中,大部分實(shí)體和屬性可在電網(wǎng)公司積累的缺陷記錄語(yǔ)料中抽取獲得。
本次實(shí)體抽取的主要內(nèi)容是針對(duì)10 kV花橋線及其臺(tái)區(qū)–電壓合格率記錄語(yǔ)料來抽取實(shí)體和屬性,首先標(biāo)注要抽取的詞性。由于電力行業(yè)的實(shí)體和屬性有限,結(jié)合電力工程專業(yè)詞典對(duì)其進(jìn)行相似度計(jì)算和匹配抽取[11],步驟如下:
步驟1:分詞。先對(duì)10 kV花橋線及其臺(tái)區(qū)–電壓合格率語(yǔ)料進(jìn)行分詞處理。用隱馬爾可夫模型以及常用詞典進(jìn)行分詞,為了提高分詞的準(zhǔn)確率,導(dǎo)入了輔助工具[12]—電力專業(yè)詞典。
步驟 2:詞抽取。將分詞后文本中的實(shí)體/屬性與專業(yè)詞典中的實(shí)體進(jìn)行對(duì)比檢索,通過計(jì)算實(shí)體/屬性的相似度匹配到相對(duì)應(yīng)的那一項(xiàng),若匹配成功,則抽取出來的實(shí)體或?qū)傩跃涂梢杂脕順?gòu)建知識(shí)圖譜。
步驟3:注釋詞性。用電力工程詞典和常規(guī)語(yǔ)料中的詞性對(duì)文本中的各種詞進(jìn)行詞性注釋[13],可把對(duì)10 kV花橋線及其臺(tái)區(qū)–電壓合格率語(yǔ)料中的詞分成5類:(1)形如電網(wǎng)公司和設(shè)備的名詞,“Ent”作為其詞性,代表實(shí)體;(2)形如10 kV花橋線及其臺(tái)區(qū)電壓值的量詞,“Pq”作為其詞性,代表屬性;(3)形如電網(wǎng)故障程度的副詞,“Pad”作為其詞性,代表屬性;(4)形如低壓配電網(wǎng)電壓合格率的動(dòng)詞,“Pv”作為其詞性,代表屬性;(5)在以上沒有注釋的詞被抽取出來,可按原來的詞性進(jìn)行再注釋,因其并不表示屬性或?qū)嶓w。
文本語(yǔ)料在進(jìn)行實(shí)體/屬性抽取后,形成離散的實(shí)體/屬性,若得到具體的語(yǔ)義信息,需要從電網(wǎng)公司記錄文本語(yǔ)料中抽取出關(guān)系,包括實(shí)體與實(shí)體之間的關(guān)系和實(shí)體與屬性之間的關(guān)系,用關(guān)系將實(shí)體/屬性聯(lián)系,形成網(wǎng)狀的知識(shí)庫(kù)。低壓配電網(wǎng)電壓合格率檢索的知識(shí)圖譜還可以用抽取出的實(shí)體或?qū)傩缘脑~性來約束關(guān)系,如表1所示。
表1 關(guān)系的類型Tab. 1 Types of relationships
抽取關(guān)系的問題可以轉(zhuǎn)化為實(shí)體和屬性的分類,由于監(jiān)督學(xué)習(xí)方法的分類結(jié)果不理想,所以采用半監(jiān)督協(xié)同訓(xùn)練的方法進(jìn)行分類。在分類前,先形成兩兩結(jié)合的待分類詞對(duì),接著匹配出和表1中某行組成的詞類型,最后對(duì)組成的每一組詞對(duì)進(jìn)行關(guān)系分類。
構(gòu)建知識(shí)圖譜主要分為數(shù)據(jù)獲取、信息抽取、知識(shí)融合和知識(shí)加工[14]4步。構(gòu)建圖譜的數(shù)據(jù)的來源可分為兩種:一種在網(wǎng)站上可以獲取,這些在網(wǎng)頁(yè)上存在的數(shù)據(jù),屬于非結(jié)構(gòu)化數(shù)據(jù);一種是行業(yè)內(nèi)部的數(shù)據(jù),這些數(shù)據(jù)大多屬于結(jié)構(gòu)化數(shù)據(jù)。
信息抽取是在所需電力行業(yè)的文本語(yǔ)料中抽取實(shí)體和屬性以及關(guān)系并以三元組的形式進(jìn)行儲(chǔ)存。信息抽取后的實(shí)體、屬性和關(guān)系之間的關(guān)系是扁平化的,缺乏邏輯性,所以需要進(jìn)行知識(shí)融合。知識(shí)融合是將多個(gè)知識(shí)庫(kù)的信息進(jìn)行融合,形成知識(shí)庫(kù)的過程,該過程用到的主要技術(shù)有實(shí)體消歧義、共指消解和實(shí)體鏈接等技術(shù)。
許多數(shù)據(jù)在經(jīng)過抽取和融合以后得到一些基本事實(shí),但這并不是想要的知識(shí),要獲得網(wǎng)絡(luò)化、結(jié)構(gòu)化的知識(shí)體系,還需經(jīng)質(zhì)量評(píng)估后,把合格的知識(shí)歸入知識(shí)體系中保證知識(shí)庫(kù)的質(zhì)量,這是知識(shí)加工過程。該過程是一個(gè)動(dòng)態(tài)過程,在不斷應(yīng)用知識(shí)圖譜的過程中,評(píng)價(jià)其應(yīng)用效果和數(shù)據(jù)質(zhì)量,并根據(jù)知識(shí)的不斷更新與發(fā)展,還要對(duì)知識(shí)圖譜進(jìn)行更正和實(shí)時(shí)更新。構(gòu)建知識(shí)圖譜的流程如圖3所示。
圖3 知識(shí)圖譜構(gòu)建技術(shù)流程圖Fig. 3 Technical flow chart of knowledge graph construction
低壓配電網(wǎng)知識(shí)圖譜的構(gòu)建可以把電網(wǎng)設(shè)備和臺(tái)區(qū)這些實(shí)體作為節(jié)點(diǎn),并且把臺(tái)區(qū)和設(shè)備及設(shè)備的一些屬性信息在構(gòu)建知識(shí)圖譜中以拓?fù)潢P(guān)系鏈接。比如設(shè)備的ID、用戶編號(hào)、用戶類別、設(shè)備故障信息、各相電壓合格率或不合格率、各相的最值以及平均值等(如圖4)作為節(jié)點(diǎn),把節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系,如“上/下級(jí)”、“電壓值為”、“信息有”、“屬性是”等關(guān)系作為連接節(jié)點(diǎn)與節(jié)點(diǎn)之間的邊。基于知識(shí)圖譜的儲(chǔ)存方式,能夠構(gòu)建全面并且易用的低壓配電網(wǎng)故障處理措施檢索知識(shí)庫(kù)。
圖4 低壓配電網(wǎng)知識(shí)圖譜的構(gòu)建設(shè)計(jì)Fig. 4 Construction and design of knowledge graph of low-voltage distribution network
提出一種基于子圖匹配的電網(wǎng)故障處置措施檢索算法。首先,針對(duì)電網(wǎng)知識(shí)定義了子圖匹配的相關(guān)概念,提出了檢索子圖構(gòu)建—拆分子檢索—并行子檢索—連接子檢索結(jié)果4個(gè)步驟的檢索算法。
算法包括:
步驟1:由檢索條件生成檢索圖。
步驟2:將原始查詢圖劃分為多個(gè)子檢索。
步驟 3:在圖數(shù)據(jù)庫(kù)中執(zhí)行步驟 2中的子檢索,獲得所有子檢索的結(jié)果。
步驟4:連接子檢索的結(jié)果,生成最終檢索結(jié)果。其次,提出一種基于物理距離與鄰近影響的檢索結(jié)果評(píng)價(jià)體系,能夠?qū)z索結(jié)果進(jìn)行重要性評(píng)價(jià),讓檢索結(jié)果給予查詢?nèi)藛T更多參考價(jià)值。最后,通過算例分析驗(yàn)證了本方法的可行性。
(1)檢索圖
檢索圖Q=(EQ,RQ)。包含點(diǎn)集合EQ和邊集合RQ。每一個(gè)檢索點(diǎn)都對(duì)應(yīng)一個(gè)具體的實(shí)體描述,邊表示連接任意兩個(gè)點(diǎn)之間的關(guān)系。
(2)匹配子圖
給定圖譜G=(EG,RG,EG)和檢索子圖Q=(EQ,RQ),匹配的目的是在圖譜G中找到檢索子圖Q的匹配子圖φ(Q)。即將圖譜G中滿足映射函數(shù)M的子圖定義為匹配子圖φ(Q)。φ將Q中的點(diǎn)EQ映射到G中的點(diǎn)φ(EG),將Q中的邊RQ映射到G中的邊φ(RG)。
當(dāng)檢索圖的頂點(diǎn)和邊的數(shù)目過多,無(wú)論采用深度優(yōu)先檢索還是廣度優(yōu)先檢索,都會(huì)導(dǎo)致檢索的約束條件過多,從而增加檢索難度甚至使檢索無(wú)法完成。將檢索圖劃分為多個(gè)子檢索圖,使單一的子檢索圖具有頂點(diǎn)數(shù)目少、邊特征單一的特點(diǎn),進(jìn)而達(dá)到降低檢索難度的目的。因此,將子圖檢索劃分為兩層樹結(jié)構(gòu),每個(gè)檢索圖包含一個(gè)根節(jié)點(diǎn)、一層子節(jié)點(diǎn)和邊。
如圖5所示,采用上述規(guī)則將檢索子圖Q劃分為子檢索圖Q1、Q2、Q3,Q3,包含節(jié)點(diǎn)c、e、f、h和邊(c,e)、邊(c,f)和邊(c,h)。
圖5 檢索劃分示例Fig. 5 Example of search partition
通過節(jié)點(diǎn)、邊的匹配就能得到檢索Q3的檢索結(jié)果。得到Q2、Q3檢索結(jié)果就能得到Q1檢索結(jié)果,進(jìn)而得到Q的檢索結(jié)果。
首先,把子檢索圖分解成最小生成樹,在對(duì)邊進(jìn)行匹配時(shí)應(yīng)優(yōu)先匹配最小生成樹的邊;然后選擇根節(jié)點(diǎn)作為優(yōu)先匹配過濾能力強(qiáng)的頂點(diǎn);接著在傳統(tǒng)VF2[15]算法的基礎(chǔ)上,結(jié)合圖的標(biāo)簽特征進(jìn)行子檢索執(zhí)行。其具體步驟如下:
步驟1:輸入數(shù)據(jù)圖與劃分后的子檢索圖,初始化子檢索結(jié)果集Ci與匹配點(diǎn)對(duì)集合T為空。
步驟2:由根節(jié)點(diǎn)可生成備選匹配點(diǎn)對(duì)集合CT。
步驟3:備選匹配點(diǎn)對(duì)的匹配,如果CT中包含子檢索圖Qi的所有節(jié)點(diǎn),接著計(jì)算圖的邊是否符合標(biāo)準(zhǔn),符合標(biāo)準(zhǔn)判斷的結(jié)果存入子檢索結(jié)果集Ci;如果CT中包含子檢索圖Qi的部分頂點(diǎn),則判斷圖是否數(shù)據(jù)信息錯(cuò)誤,并將信息錯(cuò)誤反饋給數(shù)據(jù)圖。
步驟4:判斷是否完成所有候選匹配點(diǎn)對(duì)的匹配,若沒有完成匹配返回上一步,否則直接進(jìn)行下一步驟。
步驟5:返回結(jié)果集Ci。
子檢索結(jié)果的連接是該算法的最后一步,其目標(biāo)是把所有子檢索的結(jié)果鏈接到一起,生成匹配子圖。包括連接子檢索結(jié)果和檢索結(jié)果評(píng)價(jià)兩個(gè)部分。以檢索電壓是否合格為例,首先按照子檢索劃分方法將檢索Q劃分為Q1(a,b,c)、Q2(b,e,f,g)和Q3(c,e,f,h),再分別執(zhí)行Q2(b,e,f,g)和Q3(c,e,f,h)子檢索;此后連接所有二級(jí)子檢索結(jié)果,得到Q2、Q3兩個(gè)一級(jí)子檢索的結(jié)果;最后來執(zhí)行Q1(a,b,c)的子檢索,得到Q的檢索結(jié)果。如圖6所示,檢索某個(gè)Q(a,b,c,d,e,f,g,h)的評(píng)分結(jié)果為14.2,則表示該節(jié)點(diǎn)需要重點(diǎn)關(guān)注。
圖6 子檢索結(jié)果的連接Fig. 6 Connection of subretrieval results
由圖6可知,子檢索結(jié)果的連接有兩個(gè)部分,分別是檢索結(jié)果評(píng)價(jià)和子檢索結(jié)果。檢索結(jié)果連接是圖譜檢索的基礎(chǔ)操作,常用的哈希連接可用于本文的數(shù)據(jù)庫(kù)中,當(dāng)且僅當(dāng)Qi和Qj兩個(gè)子檢索有共同的頂點(diǎn)時(shí)才能夠?qū)崿F(xiàn)Qi和Qj的檢索結(jié)果連接。子檢索結(jié)果連接的基本過程如下。
步驟1:將子檢索結(jié)果集C初始化,對(duì)子檢索劃分的檢索集Qi∈(Q1,Q2,…,Qn)按照子檢索執(zhí)行方法執(zhí)行所有的Qi,得到所有子檢索的結(jié)果。
步驟2:對(duì)n各子檢索的檢索結(jié)果進(jìn)行哈希連接,保存匹配度滿足閾值γ的結(jié)果到C中,并將結(jié)果按匹配度排序處理。
步驟3:對(duì)檢索結(jié)果的電壓特性進(jìn)行合格率評(píng)估,得出電壓合格率H。
步驟4:對(duì)存儲(chǔ)在C中的檢索結(jié)果運(yùn)用評(píng)價(jià)模型進(jìn)行評(píng)價(jià),得出檢索結(jié)果重要度f(wàn)。
步驟5:返回檢索結(jié)果集C,完成檢索。
為了驗(yàn)證基于知識(shí)圖譜的低壓配電網(wǎng)故障處理措施檢索方法的有效性,本文以某電網(wǎng) 35 kV變電站實(shí)際數(shù)據(jù)進(jìn)行試驗(yàn),算例基本情況如下:
該變電站包含10 kV花橋線,長(zhǎng)41.07 km,共有配變62臺(tái),其中公變29臺(tái),專變33臺(tái),容量共計(jì)6 051 kVA,低壓無(wú)功補(bǔ)償電容器情況不明確,柱上開關(guān)10臺(tái),圖7是臺(tái)區(qū)分布網(wǎng)絡(luò)結(jié)構(gòu)局部圖。
黃宏斌等 (2018)認(rèn)為企業(yè)的現(xiàn)金流可以真實(shí)反映企業(yè)處于不同生命周期時(shí)的經(jīng)營(yíng)狀況,基于此,按照企業(yè)的現(xiàn)金流特征,可將企業(yè)劃分為初創(chuàng)期、成長(zhǎng)期、成熟期和衰退期。處于不同生命周期下的企業(yè)現(xiàn)金流情況見表2。
圖7 臺(tái)區(qū)分布網(wǎng)絡(luò)結(jié)構(gòu)局部圖Fig. 7 Partial diagram of distribution network structure in zone area
實(shí)驗(yàn)選取某電力企業(yè)20 000條電網(wǎng)故障記錄作為基礎(chǔ)數(shù)據(jù),構(gòu)建低壓配電網(wǎng)處置措施知識(shí)圖譜如圖8所示,涵蓋了16類超過300臺(tái)設(shè)備的基本信息與日常運(yùn)行數(shù)據(jù)信息,知識(shí)圖譜數(shù)據(jù)庫(kù)中節(jié)點(diǎn)個(gè)數(shù)超過10萬(wàn)個(gè),能精確地檢索到某臺(tái)區(qū)某裝備的故障。
圖8 低壓配電網(wǎng)知識(shí)圖譜Fig. 8 Knowledge map of low voltage distribution network
根據(jù)前述基于子圖匹配的電壓合格率檢索方法完成電網(wǎng)故障處理措施檢索與分析。以線路跳閘為例,將其作為電網(wǎng)故障關(guān)鍵詞進(jìn)行檢索,利用知識(shí)圖譜技術(shù)和子圖匹配算法,通過對(duì)關(guān)鍵信息進(jìn)行分析,可以得出發(fā)生該故障的原因以及維修建議等,能減少排查故障的時(shí)間,提高故障維修效率,對(duì)快速搶修電網(wǎng)故障有十分重要的意義。
由知識(shí)圖譜的語(yǔ)義特性可知,通過語(yǔ)義特征描述,檢索時(shí)對(duì)圖譜之間的語(yǔ)義信息進(jìn)行語(yǔ)義相似度計(jì)算,可以得到更準(zhǔn)確的查詢結(jié)果。查詢圖譜與結(jié)果子圖之間的相似度計(jì)算包括基于圖結(jié)構(gòu)和語(yǔ)義信息的相似度計(jì)算兩部分。
(1)基于圖結(jié)構(gòu)的相似度計(jì)算
為實(shí)現(xiàn)圖結(jié)構(gòu)的相似度度量,需要對(duì)查詢圖譜與結(jié)果子圖的結(jié)構(gòu)進(jìn)行定量化分析。根據(jù)圖譜相似度度量的基本理論可知,若存在兩個(gè)圖譜G1中節(jié)點(diǎn)a和圖譜G2中節(jié)點(diǎn)b,若兩圖譜中鄰居結(jié)點(diǎn)相似,則節(jié)點(diǎn)a與節(jié)點(diǎn)b相似;同理,邊的相似度度量為:如果圖譜G1中邊c與圖譜G2中邊d的起點(diǎn)和終點(diǎn)相似,則邊c與邊d相似。本文提到的查詢圖譜與結(jié)果子圖的結(jié)構(gòu)相似度主要通過兩圖節(jié)點(diǎn)相似度和邊相似度構(gòu)成的矩陣來度量,任意節(jié)點(diǎn)或任意邊之間相似度的取值總在[0,1]區(qū)間內(nèi),若相似度值越接近1,則表示任意節(jié)點(diǎn)或任意邊之間的相似度越高,其子圖匹配的程度越高。
若圖譜G1中有e個(gè)節(jié)點(diǎn),圖譜G2有f個(gè)節(jié)點(diǎn),則節(jié)點(diǎn)相似度的矩陣規(guī)模e×f,用xab表示圖譜G1中點(diǎn)a與圖譜G2中點(diǎn)b的相似度,ycd表示圖譜G1與圖譜G2中邊c與d的相似度。其節(jié)點(diǎn)與邊的得分求解公式如下:
式中:SSimX表示圖譜G1與圖譜G2節(jié)點(diǎn)相似度得分矩陣;x1(k),x2(k),…表示經(jīng)過K次迭代后兩圖譜中各點(diǎn)的相似度;SSimY表示圖譜G1與圖譜G2邊相似度得分矩陣;y1(k),y2(k),…表示經(jīng)過K次迭代后兩圖譜中各邊的相似度。
式中:AveSSim表示查詢圖譜與結(jié)果子圖的結(jié)構(gòu)相似度得分;n1表示圖譜G1中節(jié)點(diǎn)數(shù);n2表示圖譜G2中節(jié)點(diǎn)數(shù);m1表示圖譜G1中邊的個(gè)數(shù);m2表示圖譜G2中邊的個(gè)數(shù)。
(2)基于統(tǒng)計(jì)語(yǔ)義信息的相似度計(jì)算
給出查詢圖譜G1=(e1,e2,…,en),其中ei為查詢圖譜中的詞,結(jié)果子圖G2=(f1,f2,…,fm),其中fj為三元組,本文利用統(tǒng)計(jì)語(yǔ)義模型將查詢圖譜與結(jié)果子圖的語(yǔ)義信息相似度用似然估計(jì)概率p(G1|G2)表示,并根據(jù)概率值的大小判斷語(yǔ)義相似程度,并對(duì)結(jié)果子圖進(jìn)行排序。其中似然估計(jì)概率p(G1|G2)計(jì)算公式如下:
式中:p(ei|G2)是表示圖譜G1的統(tǒng)計(jì)語(yǔ)言模型能產(chǎn)生詞ei的概率,用ei在多個(gè)三元組模型產(chǎn)生概率p(ei|fj)的平均值表示。
查詢圖譜與結(jié)果子圖的相似度靠單一的圖結(jié)構(gòu)或語(yǔ)義相似度不能準(zhǔn)確地度量,因此本文綜合考慮圖結(jié)構(gòu)和語(yǔ)義相似度的計(jì)算,將結(jié)構(gòu)相似度得分ScoreSSim與語(yǔ)義相似度得分Scorep(G|1G2)進(jìn)行線性聯(lián)合,公式如下:
式中:α是一個(gè)可變參數(shù),取值為[0,1],主要用來調(diào)節(jié)兩個(gè)相似度得分在結(jié)果得分中所占比重。通過綜合得分Score的計(jì)算,得到各個(gè)結(jié)果子圖的得分,并對(duì)結(jié)果子圖進(jìn)行排序,得到最優(yōu)的查詢結(jié)果,從而完成基于子圖匹配的電網(wǎng)故障檢索。
采用基于物理距離與鄰近關(guān)系的檢索結(jié)果評(píng)價(jià)模型對(duì)子檢索結(jié)果進(jìn)行分析評(píng)價(jià)。評(píng)價(jià)模型以臺(tái)變?yōu)閱挝贿M(jìn)行實(shí)驗(yàn)。為直觀地展示檢索結(jié)果的重要程度,結(jié)合物理距離與鄰近關(guān)系構(gòu)建檢索結(jié)果評(píng)價(jià)模型。
式中:f[φi(Q)]表示節(jié)點(diǎn)電網(wǎng)故障率的重要程度;G1[φi(Q)]和G2[φi(Q)]表示節(jié)點(diǎn)故障在u和l兩種情況下的物理距離影響函數(shù);u表示電網(wǎng)故障是由某一現(xiàn)象導(dǎo)致;l表示電網(wǎng)故障是由另一現(xiàn)象導(dǎo)致;T[φi(Q)]表示該節(jié)點(diǎn)的鄰近關(guān)系函數(shù)。式(2)(3)中,L[φi(Q)]表示該節(jié)點(diǎn)的物理距離影響因數(shù),取值范圍為[0, 1];H[φi(Q)]表示該節(jié)點(diǎn)的電網(wǎng)的非故障率。
根據(jù)臺(tái)區(qū)物理距離構(gòu)建距離影響因數(shù)L,其取值范圍為[0, 1],部分臺(tái)區(qū)距離影響因數(shù)如表2所示。
表2 部分臺(tái)區(qū)距離影響因數(shù)Tab. 2 Influence factors of some zone area distance
根據(jù)相鄰臺(tái)變電網(wǎng)故障檢索結(jié)果構(gòu)建鄰近函數(shù),部分臺(tái)區(qū)鄰近函數(shù)值如表3所示。
表3 部分臺(tái)區(qū)鄰近函數(shù)值Tab. 3 Values of neighbor functions in some zones
構(gòu)建物理距離影響函數(shù)與鄰近函數(shù)構(gòu)建電網(wǎng)故障處理措施檢索結(jié)果重要程度評(píng)價(jià)模型,部分臺(tái)區(qū)電網(wǎng)故障處理措施檢索結(jié)果重要程度評(píng)價(jià)結(jié)果如表4所示。
表4 部分臺(tái)區(qū)評(píng)價(jià)模型數(shù)值Tab. 4 Evaluation model values of some zones
通過重要程度分析,知識(shí)圖譜可以精確地識(shí)別輸入的關(guān)鍵詞,通過計(jì)算相似度進(jìn)行電網(wǎng)故障查詢匹配,但又不局限于關(guān)鍵字符的相似度,并很好地結(jié)合了電網(wǎng)領(lǐng)域的信息,具有較好的針對(duì)性,用傳統(tǒng)的語(yǔ)義解析方法較難實(shí)現(xiàn)。例如,在檢索電壓合格率時(shí),導(dǎo)致合格率低的原因在很大程度上是其內(nèi)部原因,根據(jù)檢索結(jié)果可以從供電半徑過大、負(fù)載過大、線徑過細(xì)等原因來排查;在對(duì)示范醫(yī)院和武定榮豐石材廠的電網(wǎng)故障處理措施檢索時(shí)其正確率分別達(dá)到85.342%和87.938%,但是其重要程度評(píng)價(jià)值偏高,導(dǎo)致電壓不合格原因在很大程度上是其外部原因,由檢索結(jié)果可以從三相不平衡、無(wú)功不足、功率因數(shù)過低等因素來排查。
基于低壓配電網(wǎng)的故障記錄語(yǔ)料,結(jié)合了知識(shí)圖譜的理念,提出了面向低壓配電網(wǎng)絡(luò)拓?fù)涞闹R(shí)圖譜的構(gòu)建方法和基于知識(shí)圖譜的低壓配電網(wǎng)絡(luò)知識(shí)檢索分析方法。詳細(xì)闡述了低壓配電網(wǎng)知識(shí)類型分析及拓?fù)浣Y(jié)構(gòu)、知識(shí)圖譜的基本步驟實(shí)體/屬性、關(guān)系抽取過程和最終構(gòu)建過程。在構(gòu)建了知識(shí)圖譜的基礎(chǔ)上,采用子圖匹配的方法完成了基于知識(shí)圖譜的低壓配電網(wǎng)故障處理措施檢索分析。最后通過電網(wǎng)公司實(shí)際運(yùn)行數(shù)據(jù)驗(yàn)證了圖譜構(gòu)建方法的可行性及在電網(wǎng)知識(shí)檢索分析的優(yōu)越性。
如果在本文構(gòu)建的知識(shí)圖譜中增加更多電網(wǎng)的運(yùn)行數(shù)據(jù),如故障數(shù)據(jù)、調(diào)度控制數(shù)據(jù)等,則能進(jìn)一步增加知識(shí)圖譜的運(yùn)用領(lǐng)域,如智能調(diào)控,負(fù)荷預(yù)測(cè)等,這也是電網(wǎng)知識(shí)圖譜的后續(xù)研究重點(diǎn)方向。