王立建,祝文瀾,宣弈,曹張潔
(國(guó)網(wǎng)浙江杭州供電公司,浙江 杭州 315600)
隨著電網(wǎng)規(guī)模不斷擴(kuò)大,電網(wǎng)故障復(fù)雜性增強(qiáng)且容易伴有衍生故障,對(duì)電力調(diào)度快速故障處置提出了更高的要求,目前存在以下兩方面問(wèn)題。復(fù)雜故障判別精準(zhǔn)性不高。電力調(diào)控員在電網(wǎng)運(yùn)行監(jiān)控過(guò)程中通過(guò)主站SCADA 系統(tǒng)實(shí)時(shí)上送的大量告警信息來(lái)進(jìn)行判斷,信息量大、關(guān)聯(lián)衍生信號(hào)的疊加以及核心告警信息的丟失,無(wú)疑加大了故障判斷的難度。以某變母差保護(hù)導(dǎo)致副母失電為例,10 s 內(nèi)上送告警信息達(dá)到218 條,且丟失了最重要的失靈保護(hù)動(dòng)作信號(hào),監(jiān)控員短時(shí)內(nèi)無(wú)法判斷為母差保護(hù)動(dòng)作,影響后續(xù)故障處置。故障原因無(wú)法快速甄別。變電站發(fā)生故障后,純粹依靠調(diào)度、檢修人員的經(jīng)驗(yàn),難以從故錄波形分析出具體原因。比如220 kV 線路事故跳閘,引起事故的原因可能是雷擊、鳥(niǎo)害、覆冰、外力破壞等。若為雷擊,則可對(duì)故障線路進(jìn)行一次試送;若為外力破壞,則不能對(duì)故障線路進(jìn)行試送,否則存在人身傷亡風(fēng)險(xiǎn)。
為解決上述問(wèn)題,本文提出了一種圖文融合的電網(wǎng)故障綜合研判方法[1-4]。針對(duì)告警信息,采用文本機(jī)器學(xué)習(xí),與歷史案例庫(kù)進(jìn)行向量化比對(duì),實(shí)現(xiàn)故障類別精準(zhǔn)判斷;針對(duì)故障錄波系統(tǒng),采用波形機(jī)器學(xué)習(xí),獲得雷擊、鳥(niǎo)害等歷史樣本庫(kù)庫(kù),通過(guò)特征值對(duì)比快速識(shí)別故障原因。
圖1 是電網(wǎng)故障診斷的總體流程框圖。通過(guò)電網(wǎng)典型歷史故障案例文本、波形文件進(jìn)行機(jī)器學(xué)習(xí)、規(guī)則挖掘,獲得所需詞典庫(kù)。D5000 實(shí)時(shí)告警信息通過(guò)數(shù)據(jù)接口處理成文本格式,在圖文融合故障診斷系統(tǒng)中與告警文本庫(kù)向量化對(duì)比,實(shí)現(xiàn)故障類別精準(zhǔn)判別。四方故障錄波系統(tǒng)通過(guò)數(shù)據(jù)接口提取特征值,在圖文融合故障診斷系統(tǒng)中與波形特征庫(kù)比對(duì),實(shí)現(xiàn)故障原因快速識(shí)別。最終實(shí)現(xiàn)全路徑告警溯源。
圖1 圖文融合故障診斷總體架構(gòu)
數(shù)據(jù)來(lái)源于智能電網(wǎng)調(diào)度控制系統(tǒng)(D5000),其告警信息數(shù)據(jù)類型為短文本,由告警時(shí)間、所屬變電站、告警內(nèi)容、狀態(tài)信息組成,其告警內(nèi)容為非結(jié)構(gòu)化中文短文本。首先進(jìn)行數(shù)據(jù)預(yù)處理??紤]原始數(shù)據(jù)的多維性,通過(guò)pandas函數(shù)進(jìn)行數(shù)據(jù)清洗,去掉變電站、線路名稱等標(biāo)簽,實(shí)現(xiàn)多維數(shù)據(jù)降維至一維。
本文故障對(duì)象以220 kV線路事故跳閘為例,故障類別可歸納為5類,分別是線路第一套保護(hù)動(dòng)作、線路三相不一致跳閘、線路失靈保護(hù)、對(duì)側(cè)開(kāi)關(guān)遠(yuǎn)跳保護(hù)動(dòng)作、母差保護(hù)動(dòng)作引起。表1 表示母差保護(hù)動(dòng)作引起線路事故跳閘的典型案例庫(kù)。
表1 母差保護(hù)引起線路跳閘的故障樣本案例
圖2是文本機(jī)器學(xué)習(xí)流程圖,如圖2所示。
圖2 文本機(jī)器學(xué)習(xí)流程圖
在數(shù)據(jù)預(yù)處理完的基礎(chǔ)上,利用結(jié)巴分詞詞典推導(dǎo)出分詞結(jié)果,利用詞頻統(tǒng)計(jì)篩選出詞頻較高的詞語(yǔ),并構(gòu)建樣本告警文本詞庫(kù)。
對(duì)歷史故障樣本模板進(jìn)行分詞預(yù)處理,利用詞袋模型doc2bow 轉(zhuǎn)換為稀疏向量,稀疏向量進(jìn)行進(jìn)一步處理,得到新語(yǔ)料庫(kù)。
通過(guò)支持向量機(jī)進(jìn)行文本分類,增加類別關(guān)鍵字的權(quán)重,使得文本向量化之后的結(jié)果更好的反應(yīng)文本信息,充分考慮詞語(yǔ)在文本中的級(jí)別。
新語(yǔ)料庫(kù)經(jīng)過(guò)TF-IDF 算法處理后得到TF-IDF值,通過(guò)token2id得到特征數(shù)。
基于TF-IDF的稀疏矩陣對(duì)故障文本進(jìn)行相似度比對(duì),建立索引,推算結(jié)果。
TF-IDF 算法(詞頻-逆文檔頻次算法)是一種統(tǒng)計(jì)方法,可以高效準(zhǔn)確的提取關(guān)鍵詞的特性,從而評(píng)估一個(gè)詞在一個(gè)文檔集中的重要程度。從算法名稱可以看出,TF-IDF算法由TF和IDF算法兩部分組成。TF算法是統(tǒng)計(jì)一個(gè)詞在一篇文檔中出現(xiàn)的頻次,即一個(gè)詞在一篇文檔中出現(xiàn)的次數(shù)越多,則其對(duì)文檔的表達(dá)能力就越強(qiáng)。IDF 算法統(tǒng)計(jì)一個(gè)詞在文檔集的多少文檔中出現(xiàn),即如果一個(gè)詞在越少的文檔中出現(xiàn),則其對(duì)文檔的區(qū)分能力就越強(qiáng)。
通過(guò)TF-IDF算法對(duì)詞頻統(tǒng)計(jì)計(jì)算的高頻詞來(lái)建立TF-IDF模型,然后進(jìn)行向量化處理,生成稀疏矩陣進(jìn)行相似度比對(duì)。
所需數(shù)據(jù)來(lái)源為II 區(qū)四方故障錄波系統(tǒng)的波形文件,離線導(dǎo)出已標(biāo)定原因的260 組故障錄波器波形數(shù)據(jù),包含故障線路三相電壓電流(包括零序)8個(gè)維度的時(shí)域波形,作為原始樣本數(shù)據(jù)。
圖3 波形機(jī)器學(xué)習(xí)流程圖
故錄波形學(xué)習(xí)流程圖如圖3 所示,將故障錄波轉(zhuǎn)為便于處理的格式文件;利用小波分析將時(shí)域的故障波形處理為頻域細(xì)節(jié),結(jié)合信息熵算法得到波形的頻域特征;提取每個(gè)頻段的小波能量熵、能量均值以及能量方差,用作判別模型的識(shí)別特征,使用onehot 編碼技術(shù)加入時(shí)間特征,如季節(jié)、月份;通過(guò)SVM建立機(jī)器學(xué)習(xí)模型,在統(tǒng)計(jì)樣本量較少的情況下,尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來(lái)提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化;對(duì)訓(xùn)練集之外的波形進(jìn)行故障預(yù)測(cè)。
信息熵理論對(duì)于一個(gè)不確定性系統(tǒng),若用一個(gè)取有限值的隨機(jī)變量X表示其狀態(tài)特征,取值xj的概率pj=p{X=xj},j=1,2,…,L,且X的結(jié)果信息用Ij=log(1/pj)表示,則X的信息熵如式3.4所示。
當(dāng)pj=0 時(shí),pjlog(pj)=0。小波熵H是在一定的狀態(tài)下定位系統(tǒng)的一種信息測(cè)度。它是對(duì)序列未知程度的一種度量,可以用來(lái)估計(jì)隨機(jī)信號(hào)的復(fù)雜性。本文將每個(gè)波形三相電流、電壓的五層頻域范圍的能量方差、均值、熵作為特征,總共90維度的向量作為數(shù)據(jù)預(yù)處理結(jié)果。圖4 表示故障相電流在125~250 Hz 時(shí)小波細(xì)節(jié)系數(shù)的能量熵分布特征圖,5種故障原因的能量熵分布具有明顯差異。
圖4 不同故障原因的小波熵分布
國(guó)網(wǎng)浙江電力云平臺(tái)數(shù)據(jù)挖掘開(kāi)發(fā)環(huán)境Kube-Flow平臺(tái),集成了整套Jupyter開(kāi)發(fā)環(huán)境,本文通過(guò)該平臺(tái)Python語(yǔ)言編制程序進(jìn)行結(jié)果驗(yàn)證。
圖5 核心信號(hào)丟失時(shí)文本比對(duì)結(jié)果
站端信號(hào)全上送。從D5000 系統(tǒng)提取潮江4430線事故跳閘前后30 s 內(nèi)的所有告警信息,基于TDIDF 算法獲得該故障文本與文本庫(kù)“母差保護(hù)動(dòng)作引起”相似度結(jié)果為0.9209。
站端核心信號(hào)未上送。在故障文本中刪除一條核心信號(hào),如220 kV第二套母線保護(hù)差動(dòng)動(dòng)作,再次運(yùn)行程序發(fā)現(xiàn)相似度為0.8409,驗(yàn)證了該算法在站端核心信號(hào)丟失時(shí)的可行性。
表2 表示基于小波熵特征值提取算法推算各類故障原因的準(zhǔn)確率。本文以2019年4月26日220 kV甘露變電站甘群1237線鳥(niǎo)害引起故障的原始波形為例,如圖6 所示,包含故障三相電壓電流及零序波形。通過(guò)波形識(shí)別算法推算故障原因?yàn)轼B(niǎo)害引起,如圖7所示,以混淆矩陣表示。
表2 基于波形機(jī)器學(xué)習(xí)的故障原因識(shí)別準(zhǔn)確率
圖6 鳥(niǎo)害故障錄波波形
圖7 混淆矩陣結(jié)果
電網(wǎng)運(yùn)行數(shù)據(jù)資源是電力行業(yè)的潛在核心資產(chǎn)和創(chuàng)新創(chuàng)效源泉,遵循“價(jià)值驅(qū)動(dòng)、迭代推進(jìn)”兩大原則,定位于數(shù)據(jù)服務(wù)業(yè)務(wù),用數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)。本文研究了一種圖文融合的電網(wǎng)故障綜合研判方法,深度融合多專業(yè)系統(tǒng)數(shù)據(jù),主動(dòng)感知電網(wǎng)運(yùn)行數(shù)據(jù),實(shí)現(xiàn)從調(diào)度端到設(shè)備端的全路徑故障智能診斷,為調(diào)控員快速故障處置提供強(qiáng)大的支撐,提升智慧調(diào)度的人工智能化水準(zhǔn)。