馬占海,嚴嘉正,張俊超
(國網(wǎng)青海省電力公司信息通信公司,青海西寧 810008)
電力系統(tǒng)不斷向數(shù)字化、信息化的方向發(fā)展,智能電網(wǎng)在建設過程中產生了各種不同種類的電力大數(shù)據(jù),如時間數(shù)據(jù)、溫度數(shù)據(jù),人們對電力大數(shù)據(jù)的處理要求也在不斷增高,如何及時獲取電力大數(shù)據(jù),并完成有效處理,是當今大數(shù)據(jù)時代電網(wǎng)處理的重要難題。數(shù)據(jù)識別一直是數(shù)據(jù)管理的關鍵性技術,對于數(shù)據(jù)處理質量有著重要影響。由于電力大數(shù)據(jù)類型復雜,因此表現(xiàn)方式也不一致,針對電力大數(shù)據(jù)識別問題相關學者進行了深入的研究。
低占用率電力大數(shù)據(jù)會明顯降低電力系統(tǒng)的工作效率,系統(tǒng)內部不同流的處理器線程無法得到很好地應用,電力系統(tǒng)的占用率過低,使整體性能受到嚴重影響,因此必須要及時識別低占用率電力大數(shù)據(jù)。文獻[1]利用智能電表提出了一種工業(yè)設備的大數(shù)據(jù)識別方法,在設計過程中,同時引用了低壓智能電表和長短期記憶神經(jīng)網(wǎng)絡,通過智能識別建立系統(tǒng),同時處理電力負載數(shù)據(jù),識別各種標識,完成智能識別,該系統(tǒng)能夠有效提高識別效率,針對連續(xù)數(shù)據(jù)識別能力較好,但在低占用率電力大數(shù)據(jù)上顯示出局限性。文獻[2]針對電網(wǎng)薄弱環(huán)節(jié)在線辨識及分級預警技術進行了深入的研究,從縱向和橫向兩方面考慮,分析電網(wǎng)的薄弱點,并實現(xiàn)電網(wǎng)規(guī)劃,通過多方面優(yōu)化確保了電網(wǎng)薄弱點的處理,降低處理風險,但是識別過程需要進行大量的數(shù)據(jù)排查,耗時過長。
多源異構技術能夠在電網(wǎng)運行的各個階段,針對電力系統(tǒng)運行狀態(tài)和管理階段性,積累不同存儲方式的數(shù)據(jù)組成數(shù)據(jù)庫,從而從簡單的數(shù)據(jù)組成復雜的數(shù)據(jù),形成多源異構數(shù)據(jù)源。該文引入多源異構設計了一種新的低占用率電力大數(shù)據(jù)識別系統(tǒng),在傳統(tǒng)硬件基礎上加以優(yōu)化,并針對硬件設計了系統(tǒng)軟件,通過實驗驗證了識別系統(tǒng)的可行性。
低占用率電力大數(shù)據(jù)識別系統(tǒng)硬件由數(shù)據(jù)采集模塊、數(shù)據(jù)分析模塊和數(shù)據(jù)管理模塊三部分組成,系統(tǒng)硬件結構如圖1 所示。
圖1 系統(tǒng)硬件結構
系統(tǒng)在獲得低占用率電力大數(shù)據(jù)后,會傳遞給分析模塊,由分析模塊進行統(tǒng)一處理,并將處理結果轉移到管理模塊。
通過數(shù)據(jù)采集模塊采集電力系統(tǒng)內部的各項數(shù)據(jù),低占用率數(shù)據(jù)為靜態(tài)數(shù)據(jù),可以通過CMS 平臺完成分類管理,同時利用動態(tài)處理器分析[3-4]。數(shù)據(jù)采集模塊如圖2 所示。
圖2 數(shù)據(jù)采集模塊
觀察圖2 可知,數(shù)據(jù)采集模塊選取復雜可編程邏輯器件/現(xiàn)場可編程門陣列(Complex Programmable Logic Device/Field Progra-mmable Gate Array,CPLD/FPGA)數(shù)據(jù)采集控制器為核心,同時配合模數(shù)轉換器ADC 和數(shù)模轉換器DAC,在采集過程中,同時實現(xiàn)A/D 轉換、數(shù)據(jù)運算和D/A 轉換,能夠完成數(shù)據(jù)顯示。當采集輸入的電力數(shù)據(jù)后,會通過ADC 轉換成數(shù)字量,所有的輸入數(shù)據(jù)會配合按鍵,確保輸入的數(shù)據(jù)為標準數(shù)據(jù),帶極性值判別共同輸出,由控制器處理有序輸出各種數(shù)據(jù),采集模塊內部的CLK 控制采集速率[5-6]。
數(shù)據(jù)分析模塊對采集模塊內部的各種數(shù)據(jù)進行分析處理,確定低占用率電力數(shù)據(jù)特征,分析數(shù)據(jù)的實際值,與閾值進行比較,判斷數(shù)據(jù)是否為低占用率電力數(shù)據(jù),在完成過濾處理后,分析電力大數(shù)據(jù)的模擬量,針對低占用率進行分析,如果確定占用率過低,需要進行額外統(tǒng)計補償[7]。在完成數(shù)據(jù)的全部循環(huán)后,利用參數(shù)配對確定指標特征,從而分析電力大數(shù)據(jù)占用率,通過軟件程序對數(shù)據(jù)進行電力計算,得出時間序列,根據(jù)時間序列隨時間的變化特征,顯示電力大數(shù)據(jù)識別的各項重要指標,并在顯示器顯示電力大數(shù)據(jù)的運行周期,完成信息更新。數(shù)據(jù)分析模塊能夠對基本的電力大數(shù)據(jù)占用率進行分析,在計算到存在異常后,根據(jù)供電范圍進一步分析,利用PMS 判斷數(shù)據(jù)是否存在異常變化,在確定異常因素和損失率后進行數(shù)據(jù)變化,確定指標異常,輸出低占用率結果[8-9]。
數(shù)據(jù)管理模塊是采集模塊和分析模塊的深化,能夠在前兩個模塊的基礎上進行多維度的組織和顯示,以針對化的方式處理低占用率電力大數(shù)據(jù)。管理器結構如圖3 所示。
圖3 管理器結構
根據(jù)圖3 可知,管理器通過譯碼電路連接多個隨機存儲器(Random-Access Memory,RAM),能夠同時完成各種信息分析,例如電力大數(shù)據(jù)域名、運行時間、數(shù)據(jù)量等。通過數(shù)據(jù)分析對信息進行全方位管理,并將管理結果存儲到數(shù)據(jù)庫中,方便工作人員更全面地了解電力大數(shù)據(jù)的運行狀態(tài)。管理模塊為用戶提供了詳細的查詢功能,用戶可以在管理模塊上對數(shù)據(jù)進行查詢和統(tǒng)計,并將得到的信息備案,整個過程都會在嚴格的監(jiān)控下進行,降低了識別系統(tǒng)工作風險。管理模塊以周期性的方式對電力數(shù)據(jù)進行計算,記錄數(shù)據(jù)的波動狀況、波動范圍和變化情況,并對變化結果進行統(tǒng)計,實現(xiàn)更好的數(shù)據(jù)分析[10]。
引用多源異構理論完成電力大數(shù)據(jù)識別系統(tǒng)軟件設計,通過知識的表達確定數(shù)據(jù)處理方式,方便后期集成處理,從而打破傳統(tǒng)識別系統(tǒng)效率低這一局限性。系統(tǒng)軟件識別工作流程如圖4 所示。
圖4 系統(tǒng)軟件識別工作流程
根據(jù)圖4 可知,通過離散化處理、來源及特點分析、準確率定義、信息識別完成軟件識別。
步驟1:離散化處理。利用列聯(lián)表的方式更好地定義電力大數(shù)據(jù),從而得到不同數(shù)據(jù)的屬性模式,建立屬性集合,如式(1)所示:
式中,U表示非空有限集合,為屬性集合;V表示有效信息函數(shù)集合;C表示屬性域集合;f表示信息函數(shù)集合。根據(jù)元素的特性建立關系列表,定義數(shù)據(jù)量,根據(jù)定義結果分析數(shù)據(jù)關系,由于每一個數(shù)據(jù)都存在一種離散性方案,所以可以將數(shù)據(jù)的屬性閾分成不同的離散區(qū)間,按照離散方案分析結果,將數(shù)據(jù)排列成相應的斷點集,利用斷點集和離散化方案對應,實現(xiàn)對屬性的統(tǒng)一表述[11-12]。
利用離散化算法實現(xiàn)電力大數(shù)據(jù)占用率的統(tǒng)一識別,從本質來看,就是分析數(shù)據(jù)的尖端區(qū)間,確定數(shù)據(jù)的屬性集,通過屬性劃分,衡量數(shù)據(jù)之間的關聯(lián)性,從而完成信息篩選。
步驟2:來源及特點分析。電力數(shù)據(jù)的分布范圍很廣,數(shù)據(jù)具有很強的通信能力,且通信結果十分可靠,由于數(shù)據(jù)量過于龐大,因此需要對電力數(shù)據(jù)的來源和特點進行分析,判斷數(shù)據(jù)屬性,利用監(jiān)測器分析數(shù)據(jù)在運行過程中是否存在問題,從而提高決策效率。
步驟3:準確率定義。通過離散化處理將不同屬性的數(shù)據(jù)劃分在不同區(qū)間,確定劃分結果的屬性值。設定信息準確率計算公式為:
式中,Qi表示屬性ai所對應的信息準確率;li表示當屬性的取值為i時,能夠達到的目的值。Qi與ai呈現(xiàn)正相關,即Qi數(shù)值越大,選取的低占用率電力大數(shù)據(jù)信息越準確[13-14]。
步驟4:信息識別。在確定信息準確率后,利用多源異構的方式建立離散化指標,實現(xiàn)信息識別,從而確定電力大數(shù)據(jù)是否為低占用率電力大數(shù)據(jù)。根據(jù)異構原則,對電力數(shù)據(jù)的信息熵進行計算,計算公式為:
式中,H(X)表示得到的信息熵;d表示離散點;X表示采集器采集的數(shù)據(jù)子集;根據(jù)數(shù)據(jù)分布方式將子集分為Xd-x、Xd+x。根據(jù)式(3)的識別結果可知,隨著H(X)數(shù)值的增加,電力大數(shù)據(jù)的識別準確率越高,識別的數(shù)據(jù)為低占用率電力大數(shù)據(jù)[15-16]。log2(n)在識別過程中發(fā)揮著調節(jié)作用,作為調節(jié)因子,多源異構區(qū)間應該在一個合理的范圍內,從而防止識別過程出現(xiàn)不理想的狀態(tài)。
為更好地驗證多源異構的低占用率電力大數(shù)據(jù)識別系統(tǒng)的有效性,進行實驗研究,設置實驗過程中選用的PC 機為Intel Core i3.3,CPU 的工作頻率50 GHz,硬盤為500 GB,選用的操作系統(tǒng)為Windows7。設定實驗環(huán)境如圖5 所示。
圖5 實驗環(huán)境
觀察圖5 可知,在進行實驗過程中,同時配備了多個TUG,設置了TU。選用該文識別系統(tǒng)、使用智能電表實現(xiàn)工業(yè)設備大數(shù)據(jù)識別的系統(tǒng)和電網(wǎng)薄弱環(huán)節(jié)在線辨識方法進行對比,三種系統(tǒng)識別過程的融合效果如圖6 所示。
圖6 融合效果實驗結果
由圖6 可知,使用傳統(tǒng)的智能電表實現(xiàn)工業(yè)設備識別系統(tǒng)和電網(wǎng)薄弱環(huán)節(jié)在線辨識方法的融合誤差較高,而該文識別系統(tǒng)隨著迭代次數(shù)的增加,融合誤差逐漸減小,且始終在閾值附近上下波動,具有較好的融合效果。其原因是該文識別系統(tǒng)設計由采集模塊、分析模塊和管理模塊組成的低占用率電力大數(shù)據(jù)識別系統(tǒng)硬件結構,同時引用多源異構理論設計軟件結構,方便融合處理,從而打破傳統(tǒng)識別系統(tǒng)融合誤差較高的局限性。
三種系統(tǒng)的識別效果如圖7 所示。
圖7 識別系統(tǒng)效果實驗結果
根據(jù)圖7 可知,當識別的低占用率電力大數(shù)據(jù)規(guī)模較小時,三種系統(tǒng)的識別效率雖然有一定的差異,但是差異較小,且識別的數(shù)據(jù)量與實際數(shù)據(jù)量差距較大。而隨著識別數(shù)據(jù)量的增加,三種系統(tǒng)產生了識別差異,使用智能電表實現(xiàn)工業(yè)設備大數(shù)據(jù)識別的系統(tǒng)在識別過程中能夠通過迭代與鄰居節(jié)點進行通信,因此在數(shù)據(jù)量較小的情況下識別效果較好,但是隨著識別數(shù)據(jù)量的增加,節(jié)點之間需要進行數(shù)據(jù)共享,消耗了大量資源,數(shù)據(jù)的冗余量也相對較高。電網(wǎng)薄弱環(huán)節(jié)在線辨識方法僅對50%的節(jié)點進行共享,因此消耗的資源相對較少,數(shù)據(jù)之間產生的屬性沖突也有所下降,但是在處理過程中,仍然存在較多的通信鏈接。該文提出的識別系統(tǒng)利用多源異構分析,能夠直接解決數(shù)據(jù)沖突,減少冗余的數(shù)據(jù)信息,分析數(shù)據(jù)屬性之間的沖突,并解決數(shù)據(jù)之間的空域問題,確保識別結果的準確性。
通過完善青海公司和政務平臺的數(shù)據(jù)共享,開展基于“一證辦電”的營銷業(yè)務應用系統(tǒng)以及網(wǎng)上國網(wǎng)營銷業(yè)務的適應性調整實施,提高電力業(yè)務辦理效率,實現(xiàn)電力接入工程線上并聯(lián)審批機制;打通電力營銷業(yè)務應用系統(tǒng)與政務平臺的數(shù)據(jù)壁壘,豐富電力企業(yè)數(shù)據(jù)種類,為數(shù)據(jù)挖據(jù)提供了更準確、更完整、更有價值的數(shù)據(jù)來源;實現(xiàn)行政許可申請表卡單據(jù)的電子化;實現(xiàn)與辦電業(yè)務相關的互聯(lián)網(wǎng)渠道賬號信息的完全互通。為政府新舊動能轉換提供基礎保證,開展“獲得電力”指標提升工作,為國家經(jīng)濟發(fā)展作出電力企業(yè)應有的貢獻。