劉文君,董明,徐元孚,韓強(qiáng),王鑫,許雷,杜明
(1.西安交通大學(xué) 電力設(shè)備電氣絕緣國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710049;2.國(guó)網(wǎng)天津市電力公司電力科學(xué)研究院,天津 300384;3.國(guó)網(wǎng)天津市電力公司,天津 300143)
電力能源作為能源互聯(lián)網(wǎng)中重要環(huán)節(jié),電網(wǎng)已成為多種能源的共享網(wǎng)絡(luò)[1]。近年來(lái),國(guó)內(nèi)外發(fā)生的多起因設(shè)備故障引起電網(wǎng)停電都與缺乏有效設(shè)備狀態(tài)感知有關(guān),主要由各調(diào)控機(jī)構(gòu)之間沒(méi)有信息共享導(dǎo)致的無(wú)法高效整合電力系統(tǒng)數(shù)據(jù)引起。實(shí)現(xiàn)電網(wǎng)的全局協(xié)調(diào)控制,是智能調(diào)度建設(shè)的基本要求。
在電力設(shè)備狀態(tài)感知方面,國(guó)內(nèi)外研究機(jī)構(gòu)進(jìn)行了大量研究,集中于通過(guò)設(shè)備試驗(yàn)基于“電、聲、光、化、熱”物理量的監(jiān)測(cè)獲取設(shè)備狀態(tài)量,進(jìn)而對(duì)設(shè)備狀態(tài)進(jìn)行評(píng)估[2]。但通過(guò)長(zhǎng)期的實(shí)踐發(fā)現(xiàn)此種監(jiān)測(cè)方法存在如下不足:(1)通過(guò)試驗(yàn)結(jié)果統(tǒng)計(jì)的方法有一定的相似性,無(wú)法真實(shí)反映實(shí)際設(shè)備故障產(chǎn)生機(jī)理,導(dǎo)致?tīng)顟B(tài)評(píng)估、風(fēng)險(xiǎn)預(yù)測(cè)等應(yīng)用的計(jì)算準(zhǔn)確率低、誤差偏大;(2)由于設(shè)備狀態(tài)參量眾多,調(diào)度員確定有效反映不同設(shè)備故障的特征量困難且需要較多人工干預(yù),無(wú)法保證設(shè)備狀態(tài)評(píng)估結(jié)果的準(zhǔn)確性;(3)各級(jí)調(diào)度間、調(diào)度中心內(nèi)部之間無(wú)法實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)共享,且存在多源、高維、異構(gòu)等問(wèn)題,客觀上增加了數(shù)據(jù)分析工作量。針對(duì)電網(wǎng)數(shù)據(jù)海量且離散的特點(diǎn),在能源與電力系統(tǒng)調(diào)度優(yōu)化和控制決策等方面提出引入機(jī)器學(xué)習(xí)算法的應(yīng)用[3-4]。文獻(xiàn)[5]應(yīng)用多元時(shí)間序列展開數(shù)據(jù)挖掘以建立數(shù)據(jù)時(shí)間維度上的關(guān)聯(lián),但并未探究空間維度上的設(shè)備數(shù)據(jù)關(guān)聯(lián)處理。因此,亟待建立完整的面向大數(shù)據(jù)的數(shù)據(jù)處理方式與體系以提升電網(wǎng)及設(shè)備狀態(tài)監(jiān)控智能分析的效率,從而實(shí)現(xiàn)電網(wǎng)設(shè)備監(jiān)控與管理業(yè)務(wù)更新與變革。
本文提出構(gòu)建面向電網(wǎng)調(diào)控的電力設(shè)備大數(shù)據(jù)標(biāo)簽化體系框架,實(shí)現(xiàn)數(shù)據(jù)標(biāo)簽分類器和基于標(biāo)簽化數(shù)據(jù)的設(shè)備狀態(tài)挖掘,提升電網(wǎng)調(diào)控人員對(duì)設(shè)備整體感知和風(fēng)險(xiǎn)管控能力。
數(shù)據(jù)標(biāo)簽是利用簡(jiǎn)明扼要的數(shù)據(jù)內(nèi)容描述對(duì)象的技術(shù)手段。從本質(zhì)上來(lái)說(shuō),是在將長(zhǎng)文本內(nèi)容提取成精煉、有效信息的基礎(chǔ)上,增添了對(duì)數(shù)據(jù)分析、統(tǒng)計(jì)、抽象的一種方法,具有短文本、語(yǔ)義化、可重復(fù)標(biāo)記等特點(diǎn)。
數(shù)據(jù)標(biāo)簽發(fā)展至今,衍生出更多高級(jí)應(yīng)用,如銷售領(lǐng)域用于客戶信用評(píng)級(jí)[6-7]、用戶行為分析與個(gè)性化營(yíng)銷服務(wù)[8-9]、電力設(shè)備畫像技術(shù)[10]、電網(wǎng)調(diào)度領(lǐng)域的運(yùn)行監(jiān)控分析[11]等。數(shù)據(jù)標(biāo)簽的應(yīng)用,不僅能夠幫助人們從海量數(shù)據(jù)中快速獲取有效信息,而且還能在獲取的數(shù)據(jù)基礎(chǔ)上實(shí)現(xiàn)數(shù)據(jù)分析,為后續(xù)數(shù)據(jù)挖掘工作提供可靠基礎(chǔ)。
目前,一些特定領(lǐng)域數(shù)據(jù)標(biāo)簽已經(jīng)具備元數(shù)據(jù)標(biāo)準(zhǔn)和明確的描述規(guī)范,以便于更科學(xué)的描述和更高效的管理[6],但其在電力能源領(lǐng)域的應(yīng)用和規(guī)范仍處于初級(jí)階段,有待進(jìn)一步推廣應(yīng)用。
隨著電網(wǎng)調(diào)控智能化的逐步推進(jìn),電網(wǎng)數(shù)據(jù)多源化、離散化的問(wèn)題日益凸顯。其中,設(shè)備臺(tái)賬、設(shè)備試驗(yàn)報(bào)告、設(shè)備缺陷記錄等均為文本類數(shù)據(jù),而數(shù)值類數(shù)據(jù)主要有設(shè)備量測(cè)數(shù)據(jù)、油色譜以及局放數(shù)據(jù)。本文按照基本信息、運(yùn)行信息和狀態(tài)信息對(duì)目前常見(jiàn)的電力設(shè)備相關(guān)數(shù)據(jù)進(jìn)行分類,如圖1所示。
圖1 電力設(shè)備數(shù)據(jù)維度分析Fig.1 Power equipment data dimension analysis
電力設(shè)備形成電力大數(shù)據(jù)標(biāo)簽化的維度包括:電力設(shè)備基本臺(tái)賬信息、多源系統(tǒng)設(shè)備身份標(biāo)識(shí)號(hào)(ID)關(guān)聯(lián)錄入、設(shè)備試驗(yàn)數(shù)據(jù)定期更新、設(shè)備不合格時(shí)間記錄、設(shè)備故障類型標(biāo)注、設(shè)備缺陷頻次統(tǒng)計(jì)、歷史設(shè)備狀態(tài)評(píng)價(jià)信息等。針對(duì)某一電力設(shè)備的多源數(shù)據(jù)進(jìn)行大數(shù)據(jù)標(biāo)簽化,形成精確適配的電力設(shè)備標(biāo)簽體系,當(dāng)此設(shè)備發(fā)生異常告警信息時(shí),大數(shù)據(jù)標(biāo)簽中心進(jìn)行主動(dòng)推薦,為調(diào)控操作人員實(shí)現(xiàn)靈活的信息關(guān)聯(lián)并提供歷史數(shù)據(jù)參考。
本文將電力數(shù)據(jù)生成的電力設(shè)備數(shù)據(jù)標(biāo)簽設(shè)定為基礎(chǔ)標(biāo)簽和深度標(biāo)簽兩類。基礎(chǔ)標(biāo)簽是以電力設(shè)備ID為核心進(jìn)行基礎(chǔ)信息、運(yùn)行信息、狀態(tài)信息關(guān)聯(lián)后獲取的數(shù)據(jù)標(biāo)簽,而深度標(biāo)簽是以基礎(chǔ)標(biāo)簽為依據(jù)的拓展應(yīng)用?;陔娏υO(shè)備基礎(chǔ)標(biāo)簽的聚類分析、模糊推理以及概率計(jì)算,利用機(jī)器學(xué)習(xí)方法得到統(tǒng)計(jì)結(jié)論,獲得深度標(biāo)簽,為監(jiān)控人員提供參考。
電力設(shè)備標(biāo)簽體系架構(gòu)包含電網(wǎng)調(diào)控領(lǐng)域的數(shù)據(jù)源采集、數(shù)據(jù)預(yù)處理、標(biāo)簽分類和形成數(shù)據(jù)標(biāo)簽中心4個(gè)層次,如圖2所示。其中,電力系統(tǒng)運(yùn)行所產(chǎn)生的數(shù)據(jù)分散在電網(wǎng)不同的業(yè)務(wù)系統(tǒng)中[10],需要將電力系統(tǒng)中的監(jiān)控系統(tǒng)、調(diào)度管理系統(tǒng)和輸變電在線監(jiān)測(cè)中的數(shù)據(jù)實(shí)現(xiàn)統(tǒng)一接入和不同系統(tǒng)間的編碼ID邏輯關(guān)聯(lián),針對(duì)電力設(shè)備基本信息、狀態(tài)信息、運(yùn)行信息3個(gè)維度的特征進(jìn)行分析形成基礎(chǔ)數(shù)據(jù)標(biāo)簽,對(duì)這些離散的多維標(biāo)簽匯總并存儲(chǔ)至數(shù)據(jù)標(biāo)簽中心。
圖2 電力設(shè)備大數(shù)據(jù)標(biāo)簽體系框架Fig.2 System framework of big data labeling for power equipment
多源電力數(shù)據(jù)根據(jù)屬性可分為文本類數(shù)據(jù)和數(shù)值類數(shù)據(jù),本文使用2種數(shù)據(jù)處理方法。
(1)文本數(shù)據(jù)規(guī)范化。電網(wǎng)缺陷、檢修記錄中通常由人工進(jìn)行記錄,會(huì)出現(xiàn)電力設(shè)備名稱不規(guī)范的情況,將其進(jìn)行規(guī)范化處理,如表1所示。
表1 電力設(shè)備名稱規(guī)范化Table 1 Normalization of power equipment term
(2)數(shù)值類數(shù)據(jù)處理。數(shù)值類數(shù)據(jù)主要有運(yùn)行數(shù)據(jù)和輸變電在線監(jiān)測(cè)數(shù)據(jù)類等,均可以經(jīng)過(guò)孤立森林算法對(duì)異常值進(jìn)行清洗,利用線性插值填補(bǔ)缺失值。
電網(wǎng)中不同業(yè)務(wù)系統(tǒng)中對(duì)同一個(gè)電力設(shè)備ID編碼方式不同,導(dǎo)致系統(tǒng)之間的信息無(wú)法通過(guò)計(jì)算機(jī)實(shí)現(xiàn)互聯(lián),仍需要人工關(guān)聯(lián)匹配。因此,數(shù)據(jù)接入經(jīng)過(guò)預(yù)處理后的首要工作是通過(guò)建立表結(jié)構(gòu)進(jìn)行匹配后統(tǒng)一各系統(tǒng)中的電力設(shè)備ID。
首先,建立不同系統(tǒng)中對(duì)不同廠站、設(shè)備類型的編碼表結(jié)構(gòu),基于對(duì)應(yīng)表進(jìn)行機(jī)器學(xué)習(xí),將多源系統(tǒng)接入的數(shù)據(jù)中檢索到的設(shè)備ID實(shí)現(xiàn)統(tǒng)一的編碼替換。電力設(shè)備基礎(chǔ)數(shù)據(jù)標(biāo)簽可以分為基本信息、運(yùn)行信息和狀態(tài)信息,具體如表2所示。
表2 電力設(shè)備基礎(chǔ)數(shù)據(jù)標(biāo)簽Table 2 Power equipment basic data label
其次,針對(duì)數(shù)值類數(shù)據(jù)將故障數(shù)據(jù)作為數(shù)據(jù)標(biāo)簽按照時(shí)序關(guān)系進(jìn)行存儲(chǔ)。本文利用基于統(tǒng)計(jì)模型的詞典分詞算法中的逆向最大匹配法算法對(duì)接入的電力文本數(shù)據(jù)進(jìn)行了關(guān)鍵詞提取處理,過(guò)程如圖3所示。
圖3 文本數(shù)據(jù)標(biāo)簽構(gòu)建算法流程Fig.3 Text data label construction algorithm flow chart
3.3.1 基于聚類分析的共性特征標(biāo)簽
針對(duì)設(shè)備某一段時(shí)間的運(yùn)行數(shù)據(jù),從告警次數(shù)、告警時(shí)間間隔、告警或故障嚴(yán)重程度以及設(shè)備的一些基本信息出發(fā)(時(shí)間和故障維度),對(duì)設(shè)備進(jìn)行聚類,通過(guò)聚類可以很好地對(duì)設(shè)備進(jìn)行劃分,并深度研究各聚類類別的特點(diǎn)和聯(lián)系。根據(jù)電力數(shù)據(jù)的特點(diǎn),使用具有噪聲的基于密度的聚類方法(DBSCAN)。針對(duì)不同類別的設(shè)備采取不同的維護(hù)措施來(lái)提高運(yùn)行效率,減少報(bào)警和故障次數(shù)。該設(shè)備所屬的聚類類別和所屬類別對(duì)應(yīng)的維護(hù)措施都可以作為該設(shè)備的共性標(biāo)簽。
3.3.2 故障預(yù)測(cè)標(biāo)簽
基礎(chǔ)標(biāo)簽中的各特征參量對(duì)不同缺陷情況下的累計(jì)故障概率的影響程度不同[13-16]。將多維特征參量采用加權(quán)的方法進(jìn)行綜合,得到不同故障類型發(fā)生的概率,以此獲得故障預(yù)測(cè)標(biāo)簽。故障預(yù)測(cè)標(biāo)簽生成步驟,如圖4所示。
圖4 故障預(yù)測(cè)標(biāo)簽生成流程Fig.4 Flowchart of power equipment fault prediction label generation
本文對(duì)電力設(shè)備標(biāo)簽化數(shù)據(jù)進(jìn)行進(jìn)一步的深度挖掘。通過(guò)對(duì)電力設(shè)備運(yùn)行數(shù)據(jù)標(biāo)簽進(jìn)行深度的特征挖掘,并將此挖掘過(guò)程中提取到的關(guān)聯(lián)規(guī)則生成模糊推理標(biāo)簽存儲(chǔ)至大數(shù)據(jù)標(biāo)簽中心。
開展電力變壓器的基礎(chǔ)標(biāo)簽之間的模糊關(guān)聯(lián)規(guī)則分析,旨在挖掘出確立的基礎(chǔ)數(shù)據(jù)特征標(biāo)簽集X和推理得到的深度特征集Y之間的內(nèi)在聯(lián)系,比傳統(tǒng)關(guān)聯(lián)規(guī)則更能反映出電力設(shè)備與深層次狀態(tài)特征量之間的實(shí)際關(guān)聯(lián)關(guān)系[17-18]。
通常使用支持度Dsupp及置信度Dconf來(lái)度量所提取的模糊關(guān)聯(lián)規(guī)則。最小支持度DMin-supp和最小置信度DMin-conf是根據(jù)具體的數(shù)據(jù)挖掘需要人為定義的閾值[19-20]。模糊關(guān)聯(lián)規(guī)則挖掘的目標(biāo)就是從模糊屬性案例庫(kù)中獲取大于設(shè)定的DMin-supp和DMin-conf的全部模糊關(guān)聯(lián)規(guī)則。
為了減少掃描次數(shù),提高關(guān)聯(lián)規(guī)則的生成效率,本文采用Apriori算法進(jìn)行模糊關(guān)聯(lián)規(guī)則的挖掘,Apriori算法采用遞歸的方法來(lái)發(fā)現(xiàn)頻繁項(xiàng)集,并計(jì)算每一頻繁項(xiàng)集的支持度和置信度。
模糊推理系統(tǒng)由模糊規(guī)則集和模糊推理算法組成,其中,模糊推理算法對(duì)系統(tǒng)的整體性能影響不大,其性能主要取決于關(guān)聯(lián)規(guī)則的質(zhì)量[22-25]。
本文將模糊關(guān)聯(lián)規(guī)則應(yīng)用于模糊推理系統(tǒng)中以提高數(shù)據(jù)挖掘質(zhì)量,以獲得更好的效果,如圖5所示。
圖5 模糊推理系統(tǒng)框圖Fig.5 Block diagram of a fuzzy reasoning system
本文選擇梯形函數(shù)作為隸屬度函數(shù),以衡量標(biāo)簽屬性,即
式中:A(x)為數(shù)據(jù)標(biāo)簽屬性“正?!钡碾`屬度函數(shù)值;x為數(shù)值類數(shù)據(jù)的值;a1為正常閾值的90%;a2為正常閾值的110%。
數(shù)據(jù)標(biāo)簽屬性為“異?!钡碾`屬度函數(shù)為
式中:B(x)為數(shù)據(jù)標(biāo)簽屬性“異?!钡碾`屬度函數(shù)值。
首先,將模糊離散后的基礎(chǔ)數(shù)據(jù)標(biāo)簽,按7∶3的比例隨機(jī)劃分為訓(xùn)練集及測(cè)試集,并基于訓(xùn)練集進(jìn)行模糊關(guān)聯(lián)規(guī)則挖掘,之后利用挖掘出的模糊規(guī)則為模糊推理系統(tǒng)提供支持,對(duì)測(cè)試樣本集進(jìn)行模糊推理,最后形成深度標(biāo)簽。若需要對(duì)推理結(jié)果得到的深度標(biāo)簽進(jìn)行優(yōu)化,則可對(duì)規(guī)則挖掘過(guò)程中人為設(shè)置的最小置信度及最小支持度進(jìn)行調(diào)整,或者更改訓(xùn)練集與測(cè)試集的比例。
大數(shù)據(jù)標(biāo)簽體系是一套位于大數(shù)據(jù)中心和調(diào)控業(yè)務(wù)平臺(tái)之間的“中間層”組件,用于實(shí)現(xiàn)大數(shù)據(jù)標(biāo)簽體系的業(yè)務(wù)化應(yīng)用。大數(shù)據(jù)標(biāo)簽體系的應(yīng)用模式,如圖6所示。
圖6 大數(shù)據(jù)標(biāo)簽體系的應(yīng)用模式Fig.6 Application model diagram of big data label system
在多源數(shù)據(jù)計(jì)算平臺(tái)與調(diào)控業(yè)務(wù)應(yīng)用平臺(tái)之間設(shè)立的是以數(shù)據(jù)標(biāo)簽中心為核心分層建立的電力大數(shù)據(jù)處理模塊。模塊1實(shí)現(xiàn)大數(shù)據(jù)標(biāo)簽體系的可視化展示功能,為數(shù)據(jù)標(biāo)簽提供人工配置、修改的功能;模塊2用于實(shí)時(shí)統(tǒng)計(jì)數(shù)據(jù)標(biāo)簽被上層(即調(diào)控業(yè)務(wù)應(yīng)用層)引用的頻次與關(guān)注需求,反饋給下面的計(jì)算層,增加此類數(shù)據(jù)標(biāo)簽的權(quán)重,實(shí)現(xiàn)數(shù)據(jù)處理順序的優(yōu)化與標(biāo)簽可視化位置的搬遷。模塊3提供標(biāo)簽聚類計(jì)算平臺(tái),而后提供給模塊4進(jìn)行各類數(shù)據(jù)標(biāo)簽的關(guān)聯(lián)性分析,形成深度標(biāo)簽。
為進(jìn)一步說(shuō)明電力設(shè)備大數(shù)據(jù)標(biāo)簽體系在調(diào)控領(lǐng)域中的實(shí)用性能,以某市某站2號(hào)主變壓器的相關(guān)電力數(shù)據(jù)接入為例,實(shí)現(xiàn)了最近一次告警信息為主的大數(shù)據(jù)標(biāo)簽體系構(gòu)建,具體如圖7所示。
圖7 2號(hào)變壓器大數(shù)據(jù)標(biāo)簽體系Fig.7 Big data labeling system of 2# power transformer
設(shè)備于2020年6月8日發(fā)生油溫高告警,告警發(fā)生前油泵出現(xiàn)反復(fù)動(dòng)作復(fù)歸6次、負(fù)載率最高激增至最高72%,負(fù)載率平均值正常值2倍但未達(dá)到重載標(biāo)準(zhǔn)的情況,經(jīng)查驗(yàn)得知由于同站另一臺(tái)變壓器停電檢修導(dǎo)致,而檢修周期結(jié)束后又出現(xiàn)了油溫異常升高但未達(dá)到報(bào)警值的情況。
經(jīng)深度標(biāo)簽化數(shù)據(jù)挖掘可知,該設(shè)備日后發(fā)生油溫異常升高類型的故障概率為0.013%,負(fù)載率增加15% ~20%時(shí),易引發(fā)缺陷暴露,但經(jīng)機(jī)器學(xué)習(xí)統(tǒng)計(jì)發(fā)現(xiàn)不是所有變壓器發(fā)生油溫異常情況時(shí)都會(huì)出現(xiàn)油泵反復(fù)動(dòng)作的情況。可見(jiàn)大數(shù)據(jù)標(biāo)簽體系可隨時(shí)間推移不斷擴(kuò)充豐富。
面向電網(wǎng)調(diào)控的電力設(shè)備大數(shù)據(jù)標(biāo)簽體系以數(shù)據(jù)關(guān)聯(lián)為核心,提供了基礎(chǔ)及深度的應(yīng)用模型的組織和融合,實(shí)現(xiàn)電力數(shù)據(jù)的高效存儲(chǔ)與利用。具體得到了如下結(jié)論。
(1)針對(duì)基本信息、運(yùn)行數(shù)據(jù)和狀態(tài)數(shù)據(jù)實(shí)現(xiàn)針對(duì)性處理和有效調(diào)用,電力設(shè)備大數(shù)據(jù)標(biāo)簽體系實(shí)現(xiàn)多源數(shù)據(jù)的互聯(lián)互通與分配管理。
(2)通過(guò)構(gòu)建多源系統(tǒng)中設(shè)備編碼對(duì)應(yīng)表的方式,統(tǒng)一電力設(shè)備ID,提出多源設(shè)備信息核心標(biāo)簽的構(gòu)建,圍繞統(tǒng)一的設(shè)備核心標(biāo)簽,可以消除電力系統(tǒng)中的“信息孤島”問(wèn)題,更輕松地實(shí)現(xiàn)在多源系統(tǒng)中對(duì)同一電力設(shè)備的信息檢索與數(shù)據(jù)關(guān)聯(lián)。
(3)基于模糊推理系統(tǒng)的關(guān)聯(lián)規(guī)則挖掘,相較于其他關(guān)聯(lián)規(guī)則能更好反映設(shè)備與狀態(tài)之間的實(shí)際聯(lián)系,可將基礎(chǔ)數(shù)據(jù)標(biāo)簽庫(kù)中的標(biāo)簽經(jīng)過(guò)模糊離散后生成具有模糊屬性的數(shù)據(jù)標(biāo)簽庫(kù),對(duì)其進(jìn)行組合分析,從中提取的模糊關(guān)聯(lián)規(guī)則衍生出深層標(biāo)簽。
(4)搭建大數(shù)據(jù)標(biāo)簽體系的深度應(yīng)用框架,將電力設(shè)備數(shù)據(jù)標(biāo)簽體系置于大數(shù)據(jù)中心和調(diào)控業(yè)務(wù)平臺(tái)之間,規(guī)劃其基本功能和業(yè)務(wù)應(yīng)用,加強(qiáng)業(yè)務(wù)架構(gòu)和數(shù)據(jù)架構(gòu)間的聯(lián)系,有利于進(jìn)一步發(fā)揮數(shù)據(jù)標(biāo)簽體系的應(yīng)用價(jià)值。