鐘琦,楊 波,朱 莎,潘行健,陸非凡
(國網(wǎng)浙江德清縣供電有限公司,浙江湖州 313200)
近年來,隨著國內經(jīng)濟的快速發(fā)展,配網(wǎng)工程數(shù)據(jù)呈現(xiàn)出了爆炸式的增長,給數(shù)據(jù)的處理與分析帶來了新的挑戰(zhàn)[1-3]。與此同時,大數(shù)據(jù)處理技術、深度學習等人工智能技術的應用,也給電網(wǎng)配網(wǎng)工程數(shù)據(jù)的處理與分析帶來了新的研究方向[4-5]。在配網(wǎng)工程數(shù)據(jù)領域,國內外專家學者對海量視頻與數(shù)據(jù)庫的自動化融合分析研究較少,仍處于研究起步階段。如何充分利用現(xiàn)有數(shù)據(jù)資料,總結歸納采集數(shù)據(jù)的特征與規(guī)律,并將其應用于目標檢測是目前研究的熱點[6]。深度學習算法可用于特征提取,這些特征能夠刻畫出數(shù)據(jù)庫的豐富內涵。其本質是通過神經(jīng)網(wǎng)絡,訓練得到數(shù)據(jù)特征,并建立輸出信號與輸入信號的映射關系,為數(shù)據(jù)處理提供理論基礎[7-8]。應用深度學習進行數(shù)據(jù)融合,可對多個來源的數(shù)據(jù)進行數(shù)據(jù)處理,具有準確性高、實時性強的特點[9]。有國外學者提出了關聯(lián)分析的數(shù)據(jù)融合框架,以改善數(shù)據(jù)決策的魯棒性,并將其應用于更廣泛的交叉領域[10-12]。隨著信息量的持續(xù)增加,配網(wǎng)工程數(shù)據(jù)來源更加多維,亟需應用更加精確的智能算法進行數(shù)據(jù)分析與處理。
該文以深度學習基礎模型為理論基礎,克服小規(guī)模數(shù)據(jù)特征提取較難的問題,并建立改進的FPFRCNN 檢測模型。針對配網(wǎng)工程數(shù)據(jù)產生的異構大數(shù)據(jù),分析配網(wǎng)數(shù)據(jù)的關聯(lián)性與可靠性,將預處理結果作為數(shù)據(jù)源輸入,進行電壓和電流的采集,完成降噪處理和數(shù)據(jù)融合后,最終基于采集到的現(xiàn)場數(shù)據(jù),實現(xiàn)數(shù)據(jù)挖掘和可視化分析。
深度學習是通過模擬大腦機理解決機器學習問題,因其強大的魯棒性而被廣泛關注[13-14]。在表達目標函數(shù)能力上,用深度結構的ANN 能較好地表示高維函數(shù),但在優(yōu)化參數(shù)過程中需要訓練大量樣本數(shù)據(jù)[15]。在模型訓練方面,樣本輸入數(shù)據(jù)從一個模型遷移到另一個數(shù)據(jù)集,采用無監(jiān)督方式獲取更多的信息,其模型示意圖如圖1 所示。
圖1 深度學習神經(jīng)網(wǎng)絡模型
在可視層內,可以將輸入信號看作特征節(jié)點,并認為所有節(jié)點均為獨立的。因此,根據(jù)輸入節(jié)點參數(shù)得到神經(jīng)元參數(shù),經(jīng)處理后得到輸出信號。
為克服小規(guī)模數(shù)據(jù)特征提取較難的問題,建立改進的FP-FRCNN 檢測模型,以提高檢測精度。建立FP-FRCNN 模型首先需要壓縮連接金字塔結構,該過程包括壓縮激勵密集與主干網(wǎng)絡,同時修改Dense Net 網(wǎng)絡結構。通過壓縮操作對過渡層進行信息壓縮,應用連接層構成激勵操作,形成兩個神經(jīng)元單元之間的依賴關系[16]。最終,通過上述依賴關系對數(shù)據(jù)集進行重新校準。為了防止參數(shù)過程帶來的影響,采用通道因子減少通道數(shù)量,直至恢復正常水平。構建金字塔網(wǎng)絡結構的基本流程,如圖2 所示。從圖中可以看出,先對SE-Dense Net 的每個特征圖進行卷積操作,并進行采樣分析,自上而下重復上述操作,最終建立金字塔型網(wǎng)絡結構。
圖2 金字塔網(wǎng)絡結構構建過程
建立金字塔網(wǎng)絡結構之后,需要將RPN 模塊連接到預測層,然后將各個模塊連接到RoIAlign 層,最后建立改進的FP-FRCNN模型,具體操作如圖3所示。
圖3 改進FP-FRCNN模型的整體結構
配網(wǎng)工程數(shù)據(jù)呈現(xiàn)數(shù)據(jù)冗余、多維度等特征,如何高效利用該數(shù)據(jù)尤為重要。數(shù)據(jù)預處理是進行數(shù)據(jù)融合的前提,是決定數(shù)據(jù)智能決策與分析的關鍵步驟。針對配網(wǎng)工程產生的異構大數(shù)據(jù),首先需要分析配網(wǎng)數(shù)據(jù)的關聯(lián)性與可靠性,將預處理結果作為數(shù)據(jù)源輸入。由于配網(wǎng)數(shù)據(jù)采集系統(tǒng)采用智能終端進行電壓、電流的采集,并利用全智能分析技術進行降噪處理,因此還需要對原始數(shù)據(jù)樣本集剔除異常數(shù)值,以提高配網(wǎng)工程的真實性。
為進行配網(wǎng)工程數(shù)據(jù)融合,設共有N個訓練集樣本,其子樣本數(shù)據(jù)集分別為A1,A2,…,AN、B1,B2,…,BN和W1,W2,…,WN;關聯(lián)訓練子集為Y1,Y2,…,YN;則第i個樣本可表示為:
將式(2)和式(3)分別擴展到式(1)中,可得到Yi為:
配網(wǎng)工程數(shù)據(jù)不存在明顯的分界,為標記工程數(shù)據(jù)的類別情況,采用基于聚類分析的稀疏自編碼數(shù)據(jù)融合算法。該算法基于無監(jiān)督學習,通過分類得到最終結果,可使輸出數(shù)據(jù)盡量保存原有特征,其是一種強化的稀疏算法,且該方法的解碼器變換可自動提取樣本數(shù)據(jù)信息并進行深度學習。在損失函數(shù)方面,通過增加稀疏約束項,增加配網(wǎng)工程數(shù)據(jù)的特征提取能力,以提高數(shù)據(jù)提取的精確度。
稀疏自編碼器數(shù)據(jù)融合算法流程如圖4 所示,其主要步驟有三步:1)通過SAE 編碼器建立稀疏自編碼器,并對配網(wǎng)工程數(shù)據(jù)進行重構;2)通過神經(jīng)網(wǎng)絡設置初始參數(shù),調用均方損失函數(shù),采用Adam 優(yōu)化器優(yōu)化數(shù)據(jù),防止過擬合現(xiàn)象;3)將SAE 輸入,確定樣本數(shù)據(jù)的中心點,通過計算確定數(shù)據(jù)核心與類別,經(jīng)過多次迭代得到數(shù)據(jù)的分類結果。
圖4 稀疏自編碼器數(shù)據(jù)融合算法
獲取配網(wǎng)工程數(shù)據(jù)信息后,可以對數(shù)據(jù)信息做自適應增強處理,首先應保證局部數(shù)據(jù)信息的一致性,定義為:
式(6)中,gout(x,y)、gave(x,y)分別表示經(jīng)過二次泰勒級數(shù)展開卷積之后,配網(wǎng)工程數(shù)據(jù)在(x,y)位置的輸出值與局部均值。
為保護邊緣數(shù)據(jù)信息,將公式修改為:
式(7)中,gout1、gout2、gout3分別是gout(x,y)的3個分量,若gout3>0,則可提高數(shù)據(jù)邊緣信息,且的數(shù)值范圍為[0,1]。
將處理后的數(shù)據(jù)信息還原為原始信息,還原公式為:
式(8)中,Pin為輸入數(shù)據(jù)信息的分量值,Pout是指數(shù)據(jù)信息增強處理后得到的數(shù)據(jù)分量值,β(x,y)的定義為:
配網(wǎng)工程數(shù)據(jù)可視化主要基于配網(wǎng)終端采集到的現(xiàn)場數(shù)據(jù),進行儲存、分析以及管理,實現(xiàn)數(shù)據(jù)挖掘、生產可視化界面。原始數(shù)據(jù)的可視化不僅給配網(wǎng)工程提供優(yōu)質的計算服務,且為電力工程的推進提供有力支撐。根據(jù)可視化需求以及功能,生成用戶賬戶,跳轉到可視化界面,顯示上傳的配網(wǎng)工程原始數(shù)據(jù),創(chuàng)建項目數(shù)據(jù)及模板,便于結構化管理。
通過Python 編程工具實現(xiàn)數(shù)據(jù)圖像的呈現(xiàn),直觀顯示配網(wǎng)工程數(shù)據(jù)的分布特征,將大部分數(shù)據(jù)顯示在零點附近,使得數(shù)據(jù)排列呈現(xiàn)時間性,體現(xiàn)數(shù)據(jù)的電壓、電流數(shù)值。
配網(wǎng)工程數(shù)據(jù)分析一般有兩種方法,即參數(shù)分析與波形分析。參數(shù)分析主要通過獲取配網(wǎng)終端采集的數(shù)據(jù)特征進行數(shù)據(jù)分析,數(shù)據(jù)特征包括數(shù)據(jù)幅值、頻率、持續(xù)時間等;波形分析是采用智能算法對波形信號進行處理分析頻域特點,反映輸入信號的規(guī)律,從而更好地應用波形信息。傅里葉譜分析方法是處理頻域分析的常用方法,其分析結果可以用于全局信息處理。為避免數(shù)據(jù)丟失情況,并遏制數(shù)據(jù)混亂,運用Tfrsp 函數(shù)進行分析計算,得到二維頻譜為:
數(shù)據(jù)分析檢測常用的精度檢測指標平均精度(AP),通過計算預測值的準確率和召回率繪制P-R曲線,進而評價分析結果的效果。
分類精確率是針對給定數(shù)據(jù)集,分類數(shù)據(jù)量與總數(shù)據(jù)量的比值,若用M代表數(shù)據(jù)樣本數(shù),N代表數(shù)據(jù)集總量,則精確值可表示為:
一般來說,準確率與召回率為一對矛盾的度量方式,兩者呈現(xiàn)負相關的關系。在選擇評價指標時,需要考慮不同的場景與適用范圍。為提高檢測精度,需采用綜合評價指標進行衡量。
以浙江省某區(qū)域配電網(wǎng)的實際工程數(shù)據(jù)進行算例分析,驗證該文所提方法的有效性。數(shù)據(jù)分析實驗均在帶有GPU 的服務器上運行,CPU 為Intel Core i7 7800,顯卡NVDIDA GTX1080,軟件環(huán)境為Cuda 8.0/Python3.6/OpenCV。通過對比分析各種不同方法的配網(wǎng)工程數(shù)據(jù)處理結果,驗證該文所提方法的識別精度與誤差率。
實驗過程使用的配網(wǎng)工程樣本數(shù)據(jù)庫較大,采用該文所述深度學習模型,首先將樣本數(shù)據(jù)進行分析與處理,利用差值算法分析數(shù)據(jù)集的損失。為驗證數(shù)據(jù)縮放對檢測精度的影響,在不同分辨率下分析檢測精度,同時比較不同算法在不同分辨率情形下的效果。相應的計算結果,如表1 所示。從表中可以看出,幾種方法均可以提升檢測效果。且采用該文所述的深度學習方法時,AP 值達到了95.6%,具有良好的檢測效果。
表1 幾種方法的AP值
為進一步體現(xiàn)該文所述方法對配網(wǎng)工程數(shù)據(jù)融合的精度與誤差,選取三種方法對該區(qū)域內的配網(wǎng)工程數(shù)據(jù)進行融合與分析,對比分析幾種方法的有效性。三種方法的結果,如表2 所示。從表2 中可以看出,當采用深度學習對配網(wǎng)工程數(shù)據(jù)進行訓練、融合、分析時,其結果的平均誤差最小,處理精度更高。
表2 三種算法對比分析
針對配網(wǎng)工程數(shù)據(jù)分析與處理存在的問題,開展基于深度學習的配網(wǎng)工程數(shù)據(jù)融合與智能分析方法研究。通過建立改進的FP-FRCNN 檢測模型、壓縮連接金字塔結構,對配網(wǎng)異構數(shù)據(jù)進行融合分析;將預處理結果作為數(shù)據(jù)源輸入,采用全智能分析技術進行降噪處理,基于聚類分析的稀疏自編碼數(shù)據(jù)融合算法進行數(shù)據(jù)融合;利用配網(wǎng)終端采集到的現(xiàn)場數(shù)據(jù),實現(xiàn)數(shù)據(jù)挖掘和可視化分析與處理;采用智能算法對波形信號處理分析頻域特點,反映輸入信號的規(guī)律與波形信息。最后,以某區(qū)域配網(wǎng)工程數(shù)據(jù)進行算例分析,驗證了該文所述方法在不同分辨率下均具有良好的檢測效果,且誤差小、精度高,具有廣闊的應用價值。下一步將研究改進的卷積神經(jīng)網(wǎng)絡與隨機森林的識別算法,以更好地反映配網(wǎng)工程數(shù)據(jù)的數(shù)據(jù)特征,提高檢測精度。