張艷麗,孫志杰,牛任愷,張?chǎng)卫冢鶄?/p>
(國(guó)網(wǎng)冀北電力有限公司計(jì)量中心,北京 100045)
隨著電網(wǎng)行業(yè)逐漸融入新媒體信息技術(shù),電力行業(yè)在實(shí)際運(yùn)行過(guò)程中會(huì)產(chǎn)生大量電力信息數(shù)據(jù),對(duì)電力營(yíng)銷數(shù)據(jù)的處理成為當(dāng)前急需妥善處理的重要問(wèn)題[1]。經(jīng)濟(jì)社會(huì)的發(fā)展帶來(lái)技術(shù)革命的變化,可以有效提高電力信息數(shù)據(jù)處理能力,完善用戶數(shù)據(jù)緩存服務(wù)[2]。是電力公司和電力用戶之間達(dá)成的一種重要合作形式,企業(yè)根據(jù)用戶需求,提供符合用戶需要且能夠保證其安全性、可靠性的電力商品,為后續(xù)的服務(wù)提供保障[3-4]。
電力營(yíng)銷環(huán)節(jié)是電力企業(yè)中非常重要的一環(huán),解決好該環(huán)節(jié)的開(kāi)發(fā)與服務(wù),將會(huì)極大地提高電網(wǎng)企業(yè)的運(yùn)營(yíng)效率,服務(wù)水平也將會(huì)有效提升。數(shù)據(jù)集成技術(shù)能夠?qū)Σ煌N類分散的數(shù)據(jù)來(lái)源進(jìn)行統(tǒng)一處理,根據(jù)不同的處理需求實(shí)現(xiàn)分類處理,打破數(shù)據(jù)之間的邏輯差異,傳統(tǒng)的數(shù)據(jù)集成技術(shù)包括多數(shù)據(jù)庫(kù)系統(tǒng)[5]和物聯(lián)網(wǎng)技術(shù)的數(shù)據(jù)庫(kù)系統(tǒng)[6],隨著技術(shù)的發(fā)展,數(shù)據(jù)集成技術(shù)也隨之精進(jìn),在電網(wǎng)企業(yè)中,這項(xiàng)先進(jìn)技術(shù)得到了較為廣泛的應(yīng)用。
綜上所述,利用數(shù)據(jù)集成技術(shù)設(shè)計(jì)了電力營(yíng)銷數(shù)據(jù)分析系統(tǒng),通過(guò)優(yōu)化硬件設(shè)計(jì)提高系統(tǒng)操作效果,利用軟件強(qiáng)化系統(tǒng)可編程功能,確保系統(tǒng)的經(jīng)濟(jì)實(shí)用性和安全性。
為了實(shí)現(xiàn)系統(tǒng)架構(gòu)的設(shè)計(jì),滿足兼容要求,系統(tǒng)硬件設(shè)計(jì)了多個(gè)模塊,如圖1 所示。
圖1 電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)硬件結(jié)構(gòu)
數(shù)據(jù)采集模塊主要是采集和挖掘各個(gè)部分的數(shù)據(jù)資源,用于實(shí)現(xiàn)數(shù)據(jù)維護(hù)、選擇特定數(shù)據(jù)集、查看數(shù)據(jù)屬性等功能。為了選擇特定的目標(biāo)數(shù)據(jù),工作人員對(duì)該部分的數(shù)據(jù)擁有管理和維護(hù)權(quán)限,而對(duì)于數(shù)據(jù)分析模塊的要求則更加嚴(yán)格,只能讓部分具有管理分析權(quán)限的工作人員擁有這一權(quán)限。在硬件系統(tǒng)中,數(shù)據(jù)預(yù)處理非常必要,其可以使數(shù)據(jù)具有不同屬性和更分散的數(shù)據(jù)[7]。
數(shù)據(jù)采集模塊結(jié)構(gòu)如圖2 所示。
圖2 數(shù)據(jù)采集模塊結(jié)構(gòu)
在數(shù)據(jù)采集模塊中,微控制單元能夠區(qū)分來(lái)源復(fù)雜的數(shù)據(jù),遇到重復(fù)數(shù)據(jù)、不正常數(shù)據(jù)以及有可能危害系統(tǒng)安全的入侵?jǐn)?shù)據(jù)要立即篩選,將符合要求的數(shù)據(jù)放入數(shù)據(jù)庫(kù)中,確保數(shù)據(jù)采集的準(zhǔn)確性,這樣才能在挖掘和結(jié)果分析模塊中更清晰地輸入不同類型的數(shù)據(jù)[8]。數(shù)據(jù)采集模塊內(nèi)部的異步收發(fā)傳輸器對(duì)采集的數(shù)據(jù)進(jìn)行檢索、查詢、輸出,使工作人員能夠?qū)?shù)據(jù)實(shí)現(xiàn)多類查詢和輸出,確保整個(gè)過(guò)程更加流暢、方便。
在整個(gè)硬件系統(tǒng)設(shè)計(jì)中,數(shù)據(jù)挖掘模塊是一個(gè)重要組成部分[9]。數(shù)據(jù)挖掘模塊是數(shù)據(jù)采集模塊完成后對(duì)用戶數(shù)據(jù)資源進(jìn)行二次處理的重要步驟,在整個(gè)硬件系統(tǒng)處理過(guò)程中起到承上啟下的銜接作用。
數(shù)據(jù)挖掘模塊能夠按照不同類別的用戶作進(jìn)一步劃分,根據(jù)以往統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析,預(yù)測(cè)電費(fèi)欠費(fèi)高風(fēng)險(xiǎn)用戶。在數(shù)據(jù)采集的基礎(chǔ)上進(jìn)行二次分析與處理,是整個(gè)模塊的重點(diǎn)。在數(shù)據(jù)挖掘中,將數(shù)據(jù)分析和管理兩個(gè)部分連接起來(lái),通過(guò)聚類分析技術(shù)對(duì)用戶進(jìn)行細(xì)分[10-12]。數(shù)據(jù)挖掘模塊內(nèi)部的數(shù)據(jù)庫(kù)能夠提供相應(yīng)的端口,供其他子程序訪問(wèn)和讀取數(shù)據(jù),確保這些端口具有足夠的硬件接口。數(shù)據(jù)挖掘模塊電路圖如圖3 所示。
圖3 數(shù)據(jù)挖掘模塊電路圖
在數(shù)據(jù)提取、數(shù)據(jù)校驗(yàn)、數(shù)據(jù)融合、對(duì)比分析等方面,數(shù)據(jù)結(jié)果分析模塊具有多方面的需求。數(shù)據(jù)結(jié)果分析模塊主要對(duì)系統(tǒng)數(shù)據(jù)集進(jìn)行采集評(píng)估、生成報(bào)表及對(duì)比處理,對(duì)硬件系統(tǒng)中不同情況所產(chǎn)生的數(shù)據(jù)進(jìn)行高標(biāo)準(zhǔn)的數(shù)據(jù)分析,將在不同條件下獲得的數(shù)據(jù)進(jìn)行輸出和整理,并將完整的信息呈現(xiàn)給用戶[13]。數(shù)據(jù)結(jié)果分析模塊結(jié)構(gòu)如圖4 所示。
圖4 數(shù)據(jù)結(jié)果分析模塊結(jié)構(gòu)
當(dāng)用戶輸入相應(yīng)的關(guān)鍵字和數(shù)據(jù)時(shí),系統(tǒng)可以根據(jù)用戶的需要整合數(shù)據(jù),以一種更加直觀的方式對(duì)數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)統(tǒng)計(jì)信息的輸出,并向用戶展示。在目前的系統(tǒng)實(shí)驗(yàn)過(guò)程中,輸入相應(yīng)的名稱和關(guān)鍵詞后,系統(tǒng)可以生成相應(yīng)的數(shù)據(jù)分布圖,然后啟動(dòng)具體的數(shù)據(jù)分析模型,通過(guò)瀏覽器向用戶展示分析結(jié)果,并且可以通過(guò)柱狀圖、條形圖等多種形式,對(duì)數(shù)據(jù)進(jìn)行對(duì)比分析,并且將結(jié)果呈現(xiàn)給用戶[14-15]。
在設(shè)計(jì)系統(tǒng)軟件時(shí),數(shù)據(jù)庫(kù)將現(xiàn)代網(wǎng)絡(luò)與信息安全、C 語(yǔ)言編程等軟件程序相結(jié)合,實(shí)現(xiàn)整個(gè)軟件系統(tǒng)運(yùn)行的高效率和低成本性,在該系統(tǒng)中,開(kāi)發(fā)工具采用了Power-Builer 6.5/8.0,語(yǔ)音查詢和觸摸查詢采用Delphi 6.0、VB 6.0 等開(kāi)發(fā)工具,利用Mapinfo 5.1與PowerBuilder 6.5/8.0 相結(jié)合的方法來(lái)進(jìn)行信息數(shù)據(jù)分析[16]。電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)軟件流程如圖5所示。
圖5 電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)軟件流程
在數(shù)據(jù)庫(kù)的基礎(chǔ)上,由于使用了先進(jìn)的設(shè)備,能夠?qū)崿F(xiàn)不同數(shù)據(jù)的高度共享;在軟件設(shè)計(jì)中,能夠保證從上至下多個(gè)層級(jí)單位的數(shù)據(jù)檢測(cè)。軟件設(shè)計(jì)平臺(tái)將以計(jì)算機(jī)語(yǔ)言為核心技術(shù),保證整個(gè)算法分析可以應(yīng)用于各種平臺(tái),提高自適應(yīng)能力。
在對(duì)電費(fèi)進(jìn)行核算時(shí),把整個(gè)計(jì)算流程放到大型數(shù)據(jù)庫(kù)中進(jìn)行計(jì)算,采用k-means 算法進(jìn)行挖掘分析能夠大大提高供電公司的用電管理水平,提高整體的經(jīng)濟(jì)運(yùn)行收益。
電力營(yíng)銷數(shù)據(jù)挖掘步驟如下:
步驟一:在電力營(yíng)銷管理數(shù)據(jù)庫(kù)中確定一個(gè)k值,計(jì)算得出電力營(yíng)銷管理數(shù)據(jù)k的集合;
步驟二:從這些集合中隨機(jī)選擇幾個(gè)營(yíng)銷數(shù)據(jù)點(diǎn)作為中心,和其他參數(shù)進(jìn)行比較;
步驟三:對(duì)于集合中的每一個(gè)數(shù)據(jù)類型,利用歐式距離計(jì)算出與質(zhì)心點(diǎn)最相近的點(diǎn),將電力營(yíng)銷管理數(shù)據(jù)集合劃分至所屬的集合類型中;
步驟四:整理好所有的集合數(shù)據(jù)類型,重新計(jì)算電力營(yíng)銷系統(tǒng)每個(gè)管理數(shù)據(jù)集合類型的質(zhì)心;
步驟五:重新計(jì)算電力營(yíng)銷管理的距離比,若數(shù)值較小,則滿足計(jì)算需求,算法結(jié)束。
使用聯(lián)機(jī)分析算法處理技術(shù)對(duì)電力營(yíng)銷數(shù)據(jù)作進(jìn)一步的處理分析。這一方法可以使電力營(yíng)銷人員、分析人員、技術(shù)人員從不同角度分析思考宏觀數(shù)據(jù),從整體上把握數(shù)據(jù)間的關(guān)系,從而更深刻地掌握數(shù)據(jù)。
在聯(lián)機(jī)分析算法中,主要是對(duì)算法進(jìn)行多角度分析、應(yīng)用和檢索。這些不同數(shù)據(jù)類型維度指標(biāo)可以用來(lái)判斷數(shù)據(jù)產(chǎn)生的時(shí)間等信息,多維的數(shù)據(jù)管理分析結(jié)果可以構(gòu)建不同的信息類型,以便進(jìn)行剖析,對(duì)電力進(jìn)行分析,使用戶能夠從不同的側(cè)面直接地觀察電力營(yíng)銷的信息數(shù)據(jù),獲得更加深刻直觀的認(rèn)識(shí)。
分析結(jié)果顯示,該算法具有較高的安全性和穩(wěn)定性。經(jīng)過(guò)整體系統(tǒng)運(yùn)行,用戶將賬號(hào)和密碼輸入后,能夠進(jìn)入到系統(tǒng)主界面,用戶可以選擇查看并根據(jù)屬性進(jìn)行維護(hù),實(shí)踐表明,該系統(tǒng)設(shè)計(jì)具有較好的運(yùn)行能力。
為了驗(yàn)證該文設(shè)計(jì)的基于數(shù)據(jù)集成技術(shù)的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)的實(shí)際使用效果,將傳統(tǒng)系統(tǒng)與該文系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)的操作系統(tǒng)為Microsoft Windows 2010,主頻為6.4 GHz,內(nèi)存為16 GB,采用硬件系統(tǒng)中的存儲(chǔ)器來(lái)存儲(chǔ)采集的電力營(yíng)銷數(shù)據(jù),在Matlab 背景下,采用數(shù)據(jù)集成技術(shù)對(duì)電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)的相關(guān)性能進(jìn)行仿真分析。
首先將該文系統(tǒng)與文獻(xiàn)[5]系統(tǒng)、文獻(xiàn)[6]系統(tǒng)的電力營(yíng)銷數(shù)據(jù)分析能力進(jìn)行對(duì)比實(shí)驗(yàn)。在實(shí)驗(yàn)中,利用硬件系統(tǒng)中的采集模塊采集電網(wǎng)中的電力營(yíng)銷數(shù)據(jù),電力營(yíng)銷數(shù)據(jù)中包含電能表電量數(shù)據(jù)以及電力營(yíng)銷管理數(shù)據(jù),記錄采集的電力營(yíng)銷數(shù)據(jù)的種類數(shù)量,利用該文系統(tǒng)與文獻(xiàn)[5]系統(tǒng)、文獻(xiàn)[6]系統(tǒng)對(duì)各類電力營(yíng)銷數(shù)據(jù)進(jìn)行分析,分析過(guò)程中,將電網(wǎng)調(diào)制信號(hào)經(jīng)調(diào)制解調(diào)器由240 V 解調(diào)至120 V,把采集的電力營(yíng)銷數(shù)據(jù)與電網(wǎng)調(diào)制信號(hào)一并傳輸?shù)?5 kV 的母線上,以方便母線中的分析模塊對(duì)電力營(yíng)銷數(shù)據(jù)進(jìn)行二次分析,統(tǒng)計(jì)兩次分析實(shí)驗(yàn)情況,包括不同系統(tǒng)分析的電力營(yíng)銷數(shù)據(jù)的母線電壓變化以及權(quán)重指數(shù)變化情況。其中母線電壓越低,分析的電力營(yíng)銷數(shù)據(jù)種類越多,證明系統(tǒng)的數(shù)據(jù)分析能力越強(qiáng),分析實(shí)驗(yàn)統(tǒng)計(jì)的母線電壓變化情況實(shí)驗(yàn)結(jié)果如圖6所示。
圖6 母線電壓變化情況實(shí)驗(yàn)結(jié)果
在該文設(shè)計(jì)的分析系統(tǒng)中,隨著電力營(yíng)銷數(shù)據(jù)種類的增加,達(dá)到300種時(shí)母線電壓由原來(lái)的15 kV降低至10 kV。而在文獻(xiàn)[5]系統(tǒng)和文獻(xiàn)[6]系統(tǒng)中,隨著電力營(yíng)銷數(shù)據(jù)的增加,母線的電壓逐漸升高,最高分別達(dá)到了20 kV 和17 kV。由此可見(jiàn),該文系統(tǒng)得到的電力營(yíng)銷數(shù)據(jù)種類明顯高于其他系統(tǒng)的數(shù)據(jù)種類,進(jìn)而可證明該文系統(tǒng)的數(shù)據(jù)分析能力優(yōu)于其他系統(tǒng)。
針對(duì)該文系統(tǒng)與文獻(xiàn)[5]系統(tǒng)、文獻(xiàn)[6]系統(tǒng)的數(shù)據(jù)挖掘效率進(jìn)行實(shí)驗(yàn),挖掘速度的評(píng)估指標(biāo)為權(quán)重指數(shù),權(quán)重指數(shù)為分析電力營(yíng)銷數(shù)據(jù)的參數(shù),參數(shù)越大,系統(tǒng)挖掘電力營(yíng)銷數(shù)據(jù)的效率越低,提取采集模塊采集的電力營(yíng)銷數(shù)據(jù)中的10 組數(shù)據(jù),分別利用該文系統(tǒng)與文獻(xiàn)[5]系統(tǒng)、文獻(xiàn)[6]系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行挖掘和分析,挖掘過(guò)程中需要采用數(shù)據(jù)集成技術(shù)將多個(gè)電力營(yíng)銷數(shù)據(jù)源集成在一起,根據(jù)集成后的電力營(yíng)銷數(shù)據(jù)源篩選出10 組數(shù)據(jù)中不一致的數(shù)據(jù),統(tǒng)計(jì)篩選后的電力營(yíng)銷數(shù)據(jù),將其作為權(quán)重指數(shù),10 組電力營(yíng)銷數(shù)據(jù)的權(quán)重指數(shù)變化如圖7 所示。
圖7 電力營(yíng)銷數(shù)據(jù)的權(quán)重指數(shù)變化
由圖7 實(shí)驗(yàn)結(jié)果可知,在該文設(shè)計(jì)的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)中,權(quán)重指數(shù)呈現(xiàn)逐漸降低趨勢(shì),最后趨于穩(wěn)定,說(shuō)明該文系統(tǒng)挖掘電力營(yíng)銷數(shù)據(jù)的效率較高,且系統(tǒng)較為穩(wěn)定,而在文獻(xiàn)[5]系統(tǒng)和文獻(xiàn)[6]系統(tǒng)中,權(quán)重指數(shù)呈現(xiàn)波動(dòng)升高趨勢(shì),且權(quán)重大小波動(dòng)范圍較大。由此可證明該文系統(tǒng)挖掘電力營(yíng)銷數(shù)據(jù)的效率高于文獻(xiàn)[5]系統(tǒng)和文獻(xiàn)[6]系統(tǒng)。
綜上所述,通過(guò)實(shí)驗(yàn)驗(yàn)證了該文設(shè)計(jì)的基于數(shù)據(jù)集成技術(shù)的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)優(yōu)于傳統(tǒng)系統(tǒng),該系統(tǒng)的數(shù)據(jù)分析能力更強(qiáng),數(shù)據(jù)挖掘效率更高。
通過(guò)該文的研究發(fā)現(xiàn),基于數(shù)據(jù)集成技術(shù)的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)在時(shí)代發(fā)展背景下顯得十分重要,其作用愈加凸顯,結(jié)合以上實(shí)驗(yàn)結(jié)果,基于數(shù)據(jù)采集、挖掘、結(jié)果分析構(gòu)成的硬件部分,與基于k-means 的電力數(shù)據(jù)挖掘模型和聯(lián)機(jī)分析算法的軟件部分,共同構(gòu)成了該文所設(shè)計(jì)系統(tǒng),研究表明,該文系統(tǒng)能夠滿足當(dāng)前實(shí)踐和現(xiàn)實(shí)發(fā)展需要,數(shù)據(jù)分析能力較高,數(shù)據(jù)挖掘效率較高,為創(chuàng)建營(yíng)銷系統(tǒng)提供相應(yīng)的參考與借鑒。