任政, 祁建, 陸晨亮
(江蘇電力信息技術(shù)有限公司, 江蘇,南京 210029)
當前供電服務中心日常工作的關(guān)鍵為配網(wǎng)運行監(jiān)測、搶修指揮、用戶客服問題解答,難以對數(shù)據(jù)實施綜合統(tǒng)計分析,致使多類數(shù)據(jù)之間不能完成交互共享,各項工作的展開狀態(tài)十分被動[1-2]。在此背景下,供電企業(yè)為供應更優(yōu)質(zhì)的供電服務質(zhì)量,在國網(wǎng)公司號召下設(shè)置了獨立的集調(diào)控監(jiān)測、配網(wǎng)搶修、調(diào)度服務為一體的供電服務指揮中心,盡可能地整合資源,讓供電服務指揮變成數(shù)據(jù)樞紐,令供電服務更為精準化、人性化與便捷化[3]。
為此,相關(guān)學者采用余弦相似度權(quán)衡簇的凝聚度,運用N-game統(tǒng)計語言模型呈現(xiàn)供電信息間的轉(zhuǎn)移關(guān)聯(lián),從而判斷不同類型的供電信息。也有學者將營配調(diào)相互融合的過程當作平臺建設(shè)基礎(chǔ),利用硬件層、平臺支撐軟件層、數(shù)據(jù)儲存層、數(shù)據(jù)處理層及數(shù)據(jù)可視化展示層搭建供電服務指揮平臺。本研究在大數(shù)據(jù)分析可視化平臺關(guān)鍵技術(shù)的基礎(chǔ)上,創(chuàng)建供電服務指揮平臺。
由于供電服務指揮中包含配網(wǎng)檢修、配網(wǎng)檢測運行、供電服務集中管控等諸多內(nèi)容,利用大數(shù)據(jù)分析可視化平臺完成供電信息精準聚類,確保指揮平臺運作準確性。聚類分析是大數(shù)據(jù)分析的關(guān)鍵手段,可明確數(shù)據(jù)內(nèi)不同類別和數(shù)據(jù)內(nèi)的獨有分布特征[4]。本文使用余弦相似度權(quán)衡簇的凝聚度,計算過程為
(1)
式中,Ck表示第k個簇,uij是Ck類第i個對象與第j個對象的余弦相似度?;诖?,本文相似度定義使用余弦相似度,倘若2個矢量相似度是1,證明2個矢量完全相等,0代表2個矢量沒有共同點。將余弦相似度計算式描述成:
(2)
式中,uij是ui與uj的相似度,di是數(shù)據(jù)簇,|di|代表樣本點di處于歐氏空間的長度。
在聚類分析供電信息時,首先采用N-game統(tǒng)計語言模型呈現(xiàn)不同供電信息之間的轉(zhuǎn)移關(guān)聯(lián)[5]。按照最大似然估計,獲得供電信息詞匯參數(shù)為:
(3)
式中,C(w1w2…wi)是樣本w1w2…wi-1在訓練數(shù)據(jù)內(nèi)出現(xiàn)的次數(shù)。然后將信息的切分詞依次當作候選結(jié)果引入相同概率空間,計算聯(lián)合概率空間最高概率下的切分路徑,獲取最終的切分結(jié)果聯(lián)合概率分布:
(4)
式中,Pci是供電數(shù)據(jù)內(nèi)每個字的信息概率,Pwj是各個詞的信息概率,字與詞的概率使用最大熵模型進行決策。假如輸入結(jié)果是k,則融合式(4)得到:
(5)
針對供電大數(shù)據(jù)文本的分詞集合,一般要推算其對于全部可能輸出k的條件概率,擇取最高概率的過程即為解碼。按照式(4)、式(5)對聯(lián)合空間字詞的解碼過程為
(6)
字詞的聯(lián)合概率模型能根據(jù)前部概率模型共同作用挑選最終的輸出結(jié)果[6]。將字詞聯(lián)合概率模型表示成:
(7)
如果大數(shù)據(jù)分析環(huán)境內(nèi)具備一組相似目標集合D及目標內(nèi)的關(guān)鍵字集合W,且同時存在一組擁有某種特征的集合Z。若目標內(nèi)的關(guān)鍵字為勻稱分布,則供電信息內(nèi)詞語的聯(lián)合分布概率是:
p(wi,di)=p(di)p(wj|di)=
(8)
其中,p(di)是第j個供電數(shù)據(jù)目標概率,p(wj|di)是特征語義基礎(chǔ)上關(guān)鍵字發(fā)生的條件概率,p(zk|dj)是數(shù)據(jù)目標內(nèi)具備某種特征的條件概率。
將臨界值L的最優(yōu)解計算公式記作:
(9)
對于抽取后的小數(shù)據(jù)集,利用式(10)評估其樣本大小。
(10)
如果大數(shù)據(jù)分析過程中擁有數(shù)據(jù)集X,把數(shù)據(jù)集X的樣本矩陣定義為:
(11)
通過歐式距離的運算,獲取其對應矩陣:
(12)
設(shè)定Di,j是數(shù)據(jù)類內(nèi)Ni全部樣本與Nj類內(nèi)全部樣本之間的最小距離,得到:
Di,j=min(di,j)
(13)
使用歐式距離的兩點間距離解析式獲得:
(14)
(xn,yn)與(xm,ym)依次為2個連通范圍m、n邊緣點的坐標。若2個坐標間的距離低于設(shè)定值時,就把兩個范圍采取融合,反之搜索下一個坐標。設(shè)置g(ci,cj)是全部可能的X聚類對函數(shù),該函數(shù)可以明確兩個聚類間的相鄰性,t是目前聚類的層級等級,將聚類計算過程描寫為式(15):
Rt=(Rt-1-{ci,cj})∪{cq}
(15)
利用式(15)獲得數(shù)據(jù)密度中心點,完成高精度供電信息聚類目標,對供電服務指揮的高效運行提供可靠基礎(chǔ)。
本文將圖1中的“一個融合兩個轉(zhuǎn)變”當作發(fā)展目標,并推進3個建設(shè)過程:建設(shè)實體化運轉(zhuǎn)的組織機構(gòu)、建設(shè)貼合“五位一體”需求的操作制度,建設(shè)功能實用性強的技術(shù)支持平臺。
圖1 營配調(diào)融合示意圖
可視化智能供電服務指揮平臺包含平臺硬件層、平臺支撐軟件層、數(shù)據(jù)儲存層、數(shù)據(jù)處理層及數(shù)據(jù)可視化展示層如圖2所示。
數(shù)據(jù)庫集成過程詳情如圖3所示。
數(shù)據(jù)處理層是對電網(wǎng)生成的大數(shù)據(jù)實施加工、分析等功能,加工處理、分析和統(tǒng)計運轉(zhuǎn)事件信息。數(shù)據(jù)可視化展示層內(nèi)有報表組件、圖形組件、服務組件、數(shù)據(jù)組件等多功能展示模塊,為運維檢修的輔助決策功能提供技術(shù)支撐。
圖2 供電服務指揮平臺全局結(jié)構(gòu)圖
圖3 數(shù)據(jù)集成示意圖
在原始數(shù)據(jù)、生數(shù)據(jù)、熟數(shù)據(jù)變換過程中,過濾挖掘臟數(shù)據(jù),同時采取數(shù)據(jù)溯源,有效查詢臟數(shù)據(jù)源頭,采取告警與整理,確保數(shù)據(jù)唯一性、完備性、關(guān)聯(lián)性與合法性等質(zhì)量需求。數(shù)據(jù)質(zhì)量管理包含數(shù)據(jù)標準化管理、數(shù)據(jù)辨識校準、數(shù)據(jù)修正補償、質(zhì)量分析等內(nèi)容,如圖4所示。
圖4 數(shù)據(jù)質(zhì)量管理結(jié)構(gòu)圖
供電服務指揮平臺遵照配電網(wǎng)全部數(shù)據(jù)規(guī)劃分層架構(gòu),利用大數(shù)據(jù)可視化平臺,滿足配電管理人員與供電服務指揮人員的不同需要,將其劃分成5個融合功能,平臺功能結(jié)構(gòu)如圖5所示。
圖5 平臺功能結(jié)構(gòu)
為準確掌握平臺運行實際成效,提升供電服務指揮效率與質(zhì)量,將本文供電服務指揮平臺應用于某省電力公司中,自運行以來獲得如表1所示的總體運行結(jié)果。
表1 使用前后運行統(tǒng)計結(jié)果
從表1可知,使用本文平臺后,受理故障報修工單數(shù)量明顯增多,且派單及時率高達99.99%,到達現(xiàn)場及時率為100%,客服中心退單個數(shù)為0,停電信息發(fā)布不準確、不規(guī)范、不完整數(shù)量為0。
這是因為本文采用了大數(shù)據(jù)分析可視化平臺中的聚類技術(shù),精準判別海量數(shù)據(jù)內(nèi)不同供電派單內(nèi)容,讓供電服務指揮具備更優(yōu)的操作效率與精確率。
對平臺處理配電故障方面進行深入研究。通過用電收集系統(tǒng)監(jiān)測的配電變壓器低壓側(cè)電壓值、線路供電網(wǎng)絡(luò)拓撲圖等數(shù)據(jù),創(chuàng)建基于大數(shù)據(jù)分析可視化平臺下的故障研判規(guī)則,規(guī)則詳情如表2所示。
自運行以來,平臺已發(fā)掘饋線斷線故障1530次,主動推送搶修工單1530件,通過現(xiàn)場核查,精確率是100%。證明所建平臺運用“五位一體”協(xié)同機制的有效性,充分滿足供電服務指揮人員的工作需求。
本文構(gòu)建了基于大數(shù)據(jù)分析可視化平臺下的供電服務指揮平臺,該平臺在配網(wǎng)故障判斷、配電設(shè)備監(jiān)測等方面可有效推進配網(wǎng)智能分析和輔助決策,完成配網(wǎng)故障搶修指揮工作模式向主動化診斷、可視化展示、智能化指揮管理等方向改變,增強用戶用電服務質(zhì)量,明確更多供電信息,為配電網(wǎng)的高效運轉(zhuǎn)提供可靠支持。
表2 斷線研判規(guī)則表