程慧 張瑞 張世科 史冬妮 付鳳平
摘 要:當(dāng)重要用戶或敏感用戶發(fā)生停電事件時(shí),電網(wǎng)企業(yè)將面臨較大壓力,所以對(duì)用電敏感用戶進(jìn)行準(zhǔn)確辨識(shí),降低停電對(duì)其帶來的損失具有重要意義。提出了采用蟻群算法優(yōu)化決策樹算法,主要從屬性離散化,啟發(fā)信息,信息素更新等方面進(jìn)行優(yōu)化。通過UCI數(shù)據(jù)庫的分類數(shù)據(jù)建立仿真對(duì)比實(shí)驗(yàn),與傳統(tǒng)的SVM和決策樹方法進(jìn)行實(shí)驗(yàn)對(duì)比,驗(yàn)證了本文所提方法具有更高的分類準(zhǔn)確性。將所提方法與傳統(tǒng)的SVM和Logistic算法進(jìn)行仿真對(duì)比,驗(yàn)證所提方法更適用于用戶停電敏感度的分析。
關(guān)鍵詞:蟻群算法; 決策樹; 停電敏感度; 分類
中圖分類號(hào): TM7
文獻(xiàn)標(biāo)志碼: A
Abstract:If the power failure happens to important or sensitive users, the power grid enterprises will face on great pressure. Therefore, it is of great significance to accurately identify sensitive users and reduce the loss caused by power failure. An ant colony optimization decision tree algorithm is proposed, which is mainly optimized from the aspects of attribute discretization, heuristic information and pheromone updating. The simulation comparison experiment was established through the classification data of UCI database, and compared with the traditional SVM and decision tree methods, which verifies the higher classification accuracy of the proposed method in this paper. The proposed method in this paper is compared with the traditional SVM and Logistic algorithm to verify that it is more suitable for the analysis of user's power failure sensitivity.
Key words:Ant colony algorithm; Decision tree; Power failure sensitivity; Classification
0 引言
降低由停電導(dǎo)致的投訴可以大大壓縮工單受理次數(shù),對(duì)供電質(zhì)量提升影響比較大[1-2]。因此基于當(dāng)前工單信息,深入建模挖掘停電敏感的規(guī)律和影響因素,評(píng)估停電敏感性,從而確定計(jì)劃停電的重要因素,實(shí)現(xiàn)每條線路停電計(jì)劃的安排有科學(xué)理論支撐可遵循,具有重大意義[3-4]。
敏感客戶的研究不同于一般的定性分類問題,目前研究比較少,并沒有明確的模型和可借鑒的方法。現(xiàn)有的停電敏感度研究,基本都是選中影響指標(biāo),通過測(cè)試數(shù)據(jù)建立測(cè)試模型,確定指標(biāo)權(quán)重,計(jì)算得到是否屬于敏感情況[5]。文獻(xiàn)[6]從電力公司提取客戶的用電數(shù)據(jù),確定對(duì)用戶影響較大的屬性,采用邏輯回歸方法建立客戶用電敏感度的分析模型,仿真結(jié)果驗(yàn)證了該方法能夠準(zhǔn)確的對(duì)用戶停電敏感度進(jìn)行預(yù)測(cè)[6]。文獻(xiàn)[7]從電網(wǎng)企業(yè)采集影響用戶停電的相關(guān)數(shù)據(jù),采用優(yōu)勢(shì)分析法確定主要影響因素,建立基于k-support稀疏邏輯回歸的停電敏感性預(yù)測(cè)模型[7]。文獻(xiàn)[8]對(duì)數(shù)據(jù)進(jìn)行預(yù)處理之后,確定每隔屬性的權(quán)重,提出了一種改進(jìn)的隨機(jī)森林算法,用于辨別停電用戶的敏感程度[8]。文獻(xiàn)[9]根據(jù)客戶的用電數(shù)據(jù)信息,采用熵值法對(duì)客戶敏感度進(jìn)行分析,并將敏感用戶做標(biāo)簽識(shí)別,提高電力企業(yè)服務(wù)質(zhì)量[9]。
為了對(duì)客戶停電敏感程度進(jìn)行分析,本文提出了一種改進(jìn)的決策樹方法,建立用戶停電敏感度分析模型,以提高電力企業(yè)的服務(wù)水平。
1 停電敏感度數(shù)據(jù)預(yù)處理
采用改進(jìn)的決策樹方法對(duì)用戶進(jìn)行停電敏感度分析的時(shí)候,主要包括數(shù)據(jù)預(yù)處理,特征選取,建立停電敏感度分析模型。停電敏感度的流程圖如圖1所示。
3 算例仿真
3.1 算法驗(yàn)證
為了驗(yàn)證本文所提的蟻群算法優(yōu)化決策樹算法的有效性,選取UCI數(shù)據(jù)庫10組數(shù)據(jù)進(jìn)行仿真對(duì)比實(shí)驗(yàn),UCI數(shù)據(jù)庫的數(shù)據(jù)集如表1所示,ACO-C4.5, C4.5和SVM算法的分類結(jié)果如圖3所示。
3.2 基于改進(jìn)決策樹的用電敏感度分析
采用本文所提方法對(duì)居民用戶進(jìn)行停電敏感用戶分類。選取某地區(qū)電力公司的供電數(shù)據(jù)作為樣本數(shù)據(jù)。停電敏感度的分類結(jié)果如圖4所示。
當(dāng)蟻群優(yōu)化的決策樹選擇6分支,7層決策層的時(shí)候,與SVM和Logistic算法進(jìn)行分類效果對(duì)比,對(duì)比結(jié)果如表2所示。
4.3 結(jié)果分析
從圖3可以看出,在處理相同的數(shù)據(jù)時(shí),本文所提的蟻群算法優(yōu)化的決策樹模型,比傳統(tǒng)的決策樹和SVM算法具有更高的分類準(zhǔn)確度,驗(yàn)證了本文所提方法的有效性。
如圖4所示為當(dāng)分支數(shù)為固定值的時(shí)候,決策層數(shù)量從2到9時(shí)的各個(gè)指標(biāo)所占百分比。圖4中的a,b,c的R值不能確定停電敏感用戶。圖4中的f,g,h層數(shù)到達(dá)6,7的時(shí)候,P,R,A能夠達(dá)到準(zhǔn)確率。通過對(duì)比圖4中的決策層數(shù)和分支數(shù)可以發(fā)現(xiàn),當(dāng)調(diào)和平均數(shù)大于80%的時(shí)候,能夠達(dá)到?jīng)Q策樹分類的準(zhǔn)確度。通過計(jì)算調(diào)和平均數(shù)F,可以知道,滿足條件的決策樹結(jié)構(gòu)為:決策層數(shù)為6的時(shí)候,分支數(shù)為7,8,9;當(dāng)決策層數(shù)為7的時(shí)候,分支數(shù)為6,7,8,9;當(dāng)決策層數(shù)為8的時(shí)候,分支數(shù)為6,7,8,9;當(dāng)決策層數(shù)為9的時(shí)候,分支數(shù)為4,5,6,7,8,9。
從表2可以看出,ACO-C4.5比SVM和Logistic具有更好的識(shí)別精度召回率,且FPR和FNR較小,更適用于停電敏感用戶的判定。
5 總結(jié)
為了提高停電敏感度預(yù)測(cè)精度,提出了采用蟻群算法優(yōu)化決策樹模型的方法,經(jīng)過UCI數(shù)據(jù)庫的仿真實(shí)驗(yàn),驗(yàn)證了本文所提的改進(jìn)的決策樹方法比傳統(tǒng)的SVM和決策樹算法具有更高的分類準(zhǔn)確度。在采用ACO-C4.5建立停電用戶敏感度分析模型的時(shí)候,通過實(shí)驗(yàn)可得分支數(shù)與決策層數(shù)和準(zhǔn)確度之間的關(guān)系。對(duì)比實(shí)驗(yàn),驗(yàn)證了ACO-C4.5更適合停電敏感用戶的判定。
參考文獻(xiàn)
[1]
盧恩,魯曉軍,龍?chǎng)?,?電力系統(tǒng)停電風(fēng)險(xiǎn)評(píng)估指標(biāo)及方法[J].電力自動(dòng)化設(shè)備,2015,35(3):68-74.
[2] 郭賢,郭賀,程浩忠,等.考慮用戶停電損失的微網(wǎng)網(wǎng)架規(guī)劃[J].電工技術(shù)學(xué)報(bào),2014,29(8):301-308.
[3] 劉自發(fā),張?jiān)趯?,楊濱,等.電網(wǎng)大停電社會(huì)綜合損失評(píng)估[J].電網(wǎng)技術(shù),2017,41(9):2928-2940.
[4] 曹一家,曹麗華,黎燦兵,等.考慮大停電風(fēng)險(xiǎn)的輸電網(wǎng)擴(kuò)展規(guī)劃模型和算法[J].中國電機(jī)工程學(xué)報(bào),2014,34(1):138-145.
[5] 于群,石良,曹娜,等.廣義極值理論在大停電事故損失負(fù)荷預(yù)測(cè)中的應(yīng)用[J].電力系統(tǒng)自動(dòng)化,2016,40(8):71-77.
[6] 耿俊成,張小斐,袁少光,等.基于邏輯回歸模型的電力客戶停電敏感度評(píng)分卡研究與實(shí)現(xiàn)[J].電力需求側(cè)管理,2018,20(3):46-50.
[7] 耿俊成,張小斐,孫玉寶,等.基于K-support稀疏邏輯回歸的停電敏感度預(yù)測(cè)[J].計(jì)算機(jī)與現(xiàn)代化,2018(4):68-73.
[8] 謝國榮,鄭宏,林偉圻,等.基于改進(jìn)隨機(jī)森林算法的停電敏感用戶分類[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(3):104-110.
[9] 蔡麗華.基于機(jī)器學(xué)習(xí)技術(shù)的電力停電敏感客戶標(biāo)簽體系[J].農(nóng)村電氣化,2018(5):40-43.
[10] 王道明,魯昌華,蔣薇薇,等.基于粒子群算法的決策樹SVM多分類方法研究[J].電子測(cè)量與儀器學(xué)報(bào),2015,29(4):611-615.
[11] 劉曉娜,封志明,姜魯光.基于決策樹分類的橡膠林地遙感識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(24):163-172.
[12] 張棪,曹健.面向大數(shù)據(jù)分析的決策樹算法[J].計(jì)算機(jī)科學(xué),2016,43(S1):374-379.
[13] 李擎,張超,陳鵬,等.一種基于粒子群參數(shù)優(yōu)化的改進(jìn)蟻群算法[J].控制與決策,2013,28(6):873-878.
[14] 張成,凌有鑄,陳孟元.改進(jìn)蟻群算法求解移動(dòng)機(jī)器人路徑規(guī)劃[J].電子測(cè)量與儀器學(xué)報(bào),2016,30(11):1758-1764.
[15] 游曉明,劉升,呂金秋.一種動(dòng)態(tài)搜索策略的蟻群算法及其在機(jī)器人路徑規(guī)劃中的應(yīng)用[J].控制與決策,2017,32(3):552-556.
(收稿日期: 2019.10.16)