余 輝,屈喜龍,謝京力
(1.湖南工程學(xué)院 電氣信息學(xué)院,湘潭 411004;2.湖南財(cái)政經(jīng)濟(jì)學(xué)院 信息技術(shù)與管理學(xué)院,長沙 410205)
基于支持向量機(jī)的電力云故障診斷方法研究*
余 輝1,屈喜龍1,謝京力2
(1.湖南工程學(xué)院 電氣信息學(xué)院,湘潭 411004;2.湖南財(cái)政經(jīng)濟(jì)學(xué)院 信息技術(shù)與管理學(xué)院,長沙 410205)
電力云計(jì)算將虛擬化與分布式技術(shù)代替?zhèn)鹘y(tǒng)的服務(wù)器+SAN/NAS信息計(jì)算模式,虛擬池對(duì)數(shù)據(jù)的整合與管理在提高資源利用率和降低建設(shè)成本的同時(shí),由于電力云穩(wěn)定和可靠工作的前提很大程度上依賴于良好的網(wǎng)絡(luò)狀態(tài),由此也帶來故障診斷更加復(fù)雜的新挑戰(zhàn).為了實(shí)現(xiàn)電力云網(wǎng)絡(luò)故障的診斷,針對(duì)網(wǎng)絡(luò)故障本身具有的小樣本和非線性特征,采用支持向量機(jī)SVM算法,在二分類無法解決多分類的基礎(chǔ)上進(jìn)行改進(jìn),選擇了一對(duì)一SVM,借助實(shí)驗(yàn)數(shù)據(jù)和MATLAB仿真結(jié)果驗(yàn)證了其可行性.
虛擬池;電力云;支持向量機(jī);故障診斷
云計(jì)算作為一種信息化時(shí)代的新興技術(shù)產(chǎn)物,備受信息通信研究者的關(guān)注,它是從互聯(lián)網(wǎng)領(lǐng)域演變發(fā)展而來的,云計(jì)算實(shí)質(zhì)是借用網(wǎng)絡(luò)渠道將計(jì)算力進(jìn)行集中,并且通過網(wǎng)絡(luò)提供企業(yè)用戶所需的服務(wù)[2],并借助虛擬化技術(shù)的伸縮性和靈活性[3],達(dá)到提高資源利用率的目的,還可實(shí)現(xiàn)節(jié)省人力物力財(cái)力和降低建設(shè)成本.
本文根據(jù)電力云研究的綜合分析和虛擬化網(wǎng)絡(luò)及業(yè)務(wù)服務(wù)的特點(diǎn),在分析現(xiàn)有網(wǎng)絡(luò)故障診斷方法的基礎(chǔ)上,提出支持向量機(jī)故障診斷算法,且在此基礎(chǔ)上改進(jìn)為一對(duì)一SVM方法,并借助實(shí)驗(yàn)數(shù)據(jù)和仿真結(jié)果說明其有效性.
電力云是結(jié)合電力企業(yè)應(yīng)用實(shí)踐提出的云計(jì)算與電力系統(tǒng)相結(jié)合的產(chǎn)物,它隸屬于交叉學(xué)科的研究課題,相比于電力系統(tǒng)領(lǐng)域的其他研究,電力云的研究起步較晚.自2010年四川大學(xué)的楊旭昕等學(xué)者發(fā)表了電力系統(tǒng)云計(jì)算初探以來,有關(guān)電力云的探討開始逐漸進(jìn)入電力行業(yè)相關(guān)機(jī)構(gòu)和研究者的視野,并受到廣泛關(guān)注,尤其是中國電力科學(xué)研究院、華北電力大學(xué)和王利賽、楊明玉、王德文以及龐松濤等.面向發(fā)展,國網(wǎng)信息化規(guī)劃以建設(shè)國網(wǎng)云為目標(biāo).
電力云作為云計(jì)算技術(shù)在電力系統(tǒng)和電力行業(yè)中一項(xiàng)具體實(shí)踐應(yīng)用,它將虛擬化與分布式技術(shù)代替?zhèn)鹘y(tǒng)的服務(wù)器+SAN/NAS信息計(jì)算模式,通過硬件資源、平臺(tái)組件、應(yīng)用軟件的集中服務(wù),完成電力營銷用戶個(gè)人信息管理等系統(tǒng)運(yùn)行和電力數(shù)據(jù)仿真、用戶信息及智能儀表數(shù)據(jù)處理等應(yīng)用的開發(fā),為電力企業(yè)及電力客戶、合作伙伴提供集中統(tǒng)一、按需服務(wù)、彈性擴(kuò)展和安全可控的云計(jì)算服務(wù)模式[5],在提升資源應(yīng)用效率的同時(shí),也可提高信息處理能力并增強(qiáng)集約化管理水平,降低電力系統(tǒng)建設(shè)運(yùn)營成本.
資源池是電力系統(tǒng)云計(jì)算得以實(shí)現(xiàn)的重要組成部分[6],其概念經(jīng)過幾年的推演與發(fā)展,已成為云計(jì)算基礎(chǔ)設(shè)施即服務(wù)IaaS層面得以實(shí)現(xiàn)的基礎(chǔ)架構(gòu)新型應(yīng)用方式.資源池是將電力云計(jì)算數(shù)據(jù)中心的虛擬化硬件資源和軟件資源等進(jìn)行整合與管理,當(dāng)有業(yè)務(wù)應(yīng)用需要相應(yīng)資源時(shí),只需向資源池提出申請(qǐng)即可獲得,使用完成后資源被釋放回池中[7-9].資源池完全圍繞業(yè)務(wù)系統(tǒng)開展信息流調(diào)度與管理,實(shí)現(xiàn)了信息化從以前的服務(wù)于內(nèi)部管理向服務(wù)于用戶的轉(zhuǎn)變.虛擬池整合資源及業(yè)務(wù)服務(wù)示意圖如圖1所示.
圖1 虛擬池整合資源及業(yè)務(wù)服務(wù)示意圖
目前研究表明,電力云的管理和計(jì)算的實(shí)現(xiàn)方式主要通過開源云資源管理平臺(tái)Openstack和Hadoop軟件.Openstack系統(tǒng)在基礎(chǔ)設(shè)施即服務(wù)Iaas層完成云操作系統(tǒng),將物理機(jī)虛擬化到資源池以提高安全可控、利潤以及效率并降低成本.Hadoop軟件則工作于平臺(tái)即服務(wù)Paas層,對(duì)云數(shù)據(jù)中心具有數(shù)據(jù)分析和整理功能,可運(yùn)行在Openstack系統(tǒng)之上實(shí)現(xiàn)分布式計(jì)算和存儲(chǔ),滿足電力數(shù)據(jù)中心的需要.
電力云作為綜合云計(jì)算平臺(tái),其兼?zhèn)溆?jì)算和存儲(chǔ)處理能力,按照所提供的服務(wù)類型進(jìn)行層次劃分,各層次均對(duì)應(yīng)著不同的子服務(wù)集合,根據(jù)用戶請(qǐng)求即服務(wù)類型的不同,各層次既相互關(guān)聯(lián)又相互獨(dú)立.網(wǎng)絡(luò)則是云計(jì)算基礎(chǔ)架構(gòu)和服務(wù)提供的重要組成部分[10].對(duì)于云環(huán)境下的故障診斷來說,分為服務(wù)故障診斷、數(shù)據(jù)中心的故障診斷和網(wǎng)絡(luò)環(huán)境的故障診斷[11].文中主要研究網(wǎng)絡(luò)環(huán)境的故障診斷問題.
2.1 網(wǎng)絡(luò)故障診斷方法
國內(nèi)外已經(jīng)廣泛使用的網(wǎng)絡(luò)故障診斷方法主要包括減法聚類-ANFIS、人工智能、RS-CSA、模糊關(guān)聯(lián)規(guī)則挖掘和BP神經(jīng)網(wǎng)絡(luò)等.云環(huán)境下的異常檢測(cè)的方法主要有基于分類方法、基于最近鄰居、基于聚類和基于統(tǒng)計(jì)方法,雖有各自的優(yōu)勢(shì),但也有其缺點(diǎn).例如,基于神經(jīng)網(wǎng)絡(luò)分類診斷需要大量的參數(shù),輸出結(jié)果難以解釋,學(xué)習(xí)時(shí)間過長或根本達(dá)不到學(xué)習(xí)目的;基于貝葉斯網(wǎng)絡(luò)分類診斷需要知道先驗(yàn)概率;基于規(guī)則的異常診斷要依靠人的經(jīng)驗(yàn),無法自動(dòng)地從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律.
文中借助支持向量機(jī)方法,它是傳統(tǒng)學(xué)習(xí)理論的具體表現(xiàn),與以神經(jīng)網(wǎng)絡(luò)為代表的傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,其主要優(yōu)點(diǎn)體現(xiàn)在可以解決小樣本情況下的機(jī)器學(xué)習(xí)問題,能夠提高泛化性能,并能解決高維、非線性和局部極值問題以及結(jié)構(gòu)選擇的難題.
2.2 支持向量機(jī)
當(dāng)前,支持向量機(jī)算法在電力領(lǐng)域的應(yīng)用范圍還比較廣泛,主要涉及到變壓器故障診斷、網(wǎng)絡(luò)控制系統(tǒng)故障診斷、液壓系統(tǒng)故障診斷、風(fēng)機(jī)齒輪故障診斷和軸承傳動(dòng)系統(tǒng)故障診斷.
支持向量機(jī)算法主要是在事先獲取的訓(xùn)練樣本集合中,通過求解二次規(guī)劃QP問題尋找最優(yōu)分類超平面ω·x+b=0,從而實(shí)現(xiàn)線性可分問題的分類,最后將測(cè)試樣本在訓(xùn)練好的支持向量機(jī)上進(jìn)行分類,達(dá)到分類識(shí)別的目的.對(duì)線性不可分(有噪聲)問題通過引入核空間、核函數(shù)以及映射等理論,達(dá)到將分類問題轉(zhuǎn)化求解的目的.經(jīng)一系列推導(dǎo)可得,線性可分和線性不可分問題的的最優(yōu)分類函數(shù)如公式(1)、(2)所示.
f(x)=sgn{(ω*·x)+b*}
(1)
f(x)=sgn{(ω*·x)+b*}
(2)
其中,sgn()為符號(hào)函數(shù),αi>0為與各個(gè)樣本對(duì)應(yīng)的Lagrange乘子,yi∈1,-1樣本標(biāo)簽集合,Kxi,x為核函數(shù).判別函數(shù)(2)中根據(jù)選擇合適的核函數(shù)及參數(shù)就能構(gòu)造出符合具體問題的支持向量機(jī).
然而,上述求解機(jī)理僅是對(duì)二分類問題的解決,針對(duì)文中需要解決的網(wǎng)絡(luò)故障多分類問題,需要對(duì)支持向量機(jī)SVM進(jìn)行改進(jìn).
電力系統(tǒng)云計(jì)算主要依靠虛擬化資源和網(wǎng)絡(luò)進(jìn)行業(yè)務(wù)服務(wù),云計(jì)算故障產(chǎn)生可能是網(wǎng)絡(luò)基礎(chǔ)設(shè)施的問題、存儲(chǔ)發(fā)生問題、出站流量中斷、DNS錯(cuò)誤和系統(tǒng)日常刷新等原因造成的.因此,對(duì)電力云網(wǎng)絡(luò)故障診斷的多分類問題就需要對(duì)SVM進(jìn)行改進(jìn),在一對(duì)多、一對(duì)一和有向非循環(huán)圖向量機(jī)(DAGSVM)以及修改目標(biāo)函數(shù)等方法中,由于一對(duì)多SVM分類訓(xùn)練速度和分類速度較低,DAGSVM對(duì)大規(guī)模的多類分類問題簡單易行且具有理想的訓(xùn)練速度與精度,而修改目標(biāo)函數(shù)代價(jià)過高,故文中采用一對(duì)一SVM方法.
一對(duì)一SVM方法求解思路是將k種待分類問題模式識(shí)別的每兩類進(jìn)行組合,在MATLAB軟件的幫助下,利用libsvm工具將已知訓(xùn)練樣本構(gòu)造出k(k-1)/2個(gè)二分類器模型,利用該分類模型對(duì)未知輸入數(shù)據(jù)進(jìn)行類別判定,從而達(dá)到對(duì)網(wǎng)絡(luò)故障診斷問題的多分類識(shí)別.電力云網(wǎng)絡(luò)仿真環(huán)境大致如圖2所示,路由器連接各自局域網(wǎng)絡(luò)內(nèi)的計(jì)算機(jī),交換機(jī)將兩個(gè)局域網(wǎng)絡(luò)互聯(lián)以便網(wǎng)絡(luò)管理工作站對(duì)網(wǎng)絡(luò)運(yùn)行狀態(tài)進(jìn)行收集與管理.
圖2 電力云網(wǎng)絡(luò)仿真環(huán)境
由于實(shí)驗(yàn)環(huán)境和條件的限制,為滿足網(wǎng)絡(luò)數(shù)據(jù)的真實(shí)可靠性,文中選用的網(wǎng)絡(luò)數(shù)據(jù)樣本全部取自于加州大學(xué)信息與計(jì)算科學(xué)UCI KDD歸檔的用于與第三國際知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘工具大賽和KDD-99第五屆知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘國際會(huì)議的10%數(shù)據(jù)子集.
對(duì)網(wǎng)絡(luò)攻擊樣本數(shù)據(jù)進(jìn)行初步整理分析,將入侵攻擊類型進(jìn)行簡單歸類,將back、land、neptune、pod、smurf、teardrop標(biāo)記為dos類型,ipsweep、nmap、portsweep、satan標(biāo)記為probe類型,ftp_write、guess_passwd、imap、multihop、phf、spy、warezclient、warezmaster標(biāo)記為r2l類型,buffer_overflow、loadmodule、perl、rootkit標(biāo)記為u2r類型,得到樣本數(shù)據(jù)匯總表如表1所示.
表1 樣本數(shù)據(jù)匯總表
鑒于樣本數(shù)量較多,且數(shù)據(jù)結(jié)構(gòu)比較復(fù)雜,若選擇n個(gè)樣本作為訓(xùn)練樣本,則訓(xùn)練樣本數(shù)據(jù)為n×41的數(shù)據(jù)矩陣加上n×1的類別標(biāo)簽列向量,其中由于樣本數(shù)據(jù)矩陣有三列為字符型非數(shù)字樣本,在支持向量機(jī)訓(xùn)練過程難以識(shí)別,因此簡化訓(xùn)練樣本數(shù)據(jù)為n×38的矩陣,測(cè)試樣本數(shù)據(jù)結(jié)構(gòu)類似.為進(jìn)一步驗(yàn)證一對(duì)一SVM方法的有效性,文中選用dos、probe、r2l、u2r四種故障類型與正常normal狀態(tài)的樣本集各10個(gè)樣本為訓(xùn)練集,測(cè)試樣本集也在每種故障類型和正常數(shù)據(jù)中各選2個(gè)樣本,即訓(xùn)練樣本xlyb為50×38的數(shù)據(jù)集加上50×1的標(biāo)簽列向量xlbq1,測(cè)試樣本csyb為10×38的數(shù)據(jù)集加上10×1的標(biāo)簽列向量csbq1,工作空間數(shù)據(jù)變量大致如圖3所示,具體數(shù)據(jù)限于篇幅在此不詳細(xì)列出.
圖3 工作空間數(shù)據(jù)變量
將所選樣本加載到MATLAB中,用svmtrain函數(shù)訓(xùn)練訓(xùn)練樣本xlyb得出一對(duì)一SVM模型svmStruct,然后運(yùn)用所得模型,調(diào)用分類函數(shù)svmclassify和預(yù)測(cè)評(píng)估函數(shù)svmpredict對(duì)測(cè)試樣本數(shù)據(jù)進(jìn)行測(cè)試,部分測(cè)試結(jié)果如圖4所示,比對(duì)所得測(cè)試樣本分類結(jié)果是否與已知測(cè)試樣本類別標(biāo)簽一致,仿真實(shí)驗(yàn)表明測(cè)試樣本與仿真結(jié)果一致,即一對(duì)一SVM方法對(duì)于網(wǎng)絡(luò)故障診斷具有一定的有效性.
圖4 部分測(cè)試結(jié)果
本文對(duì)電力云計(jì)算及相關(guān)技術(shù)進(jìn)行了簡單分析,明確電力云網(wǎng)絡(luò)故障診斷的重要性和網(wǎng)絡(luò)故障特征后,提出了采用支持向量機(jī)SVM算法并在此基礎(chǔ)之上改進(jìn),選擇了一對(duì)一SVM,借助實(shí)驗(yàn)數(shù)據(jù)和MATLAB仿真結(jié)果驗(yàn)證了其可行性.然而,電力云環(huán)境工作網(wǎng)絡(luò)更加復(fù)雜,在電力云中網(wǎng)絡(luò)故障診斷的實(shí)踐必須得到大型復(fù)雜網(wǎng)絡(luò)中的故障日志,收集管理信息庫數(shù)據(jù)進(jìn)而做更加深入的實(shí)驗(yàn)和研究.
[1] 張曉亮. 基于虛擬化與分布式技術(shù)的電力云計(jì)算數(shù)據(jù)中心[A]. 中國電機(jī)工程學(xué)會(huì)電力信息化專業(yè)委員會(huì)、國家電網(wǎng)公司信息通信分公司.2016電力行業(yè)信息化年會(huì)論文集[C].中國電機(jī)工程學(xué)會(huì)電力信息化專業(yè)委員會(huì)、國家電網(wǎng)公司信息通信分公司,2016:4.
[2] 王海濤,劉 波. 云計(jì)算和關(guān)鍵技術(shù)問題的分析研究[J]. 電力系統(tǒng)通信,2011(10):6-11.
[3] 嚴(yán)金瑤. 基于虛擬化技術(shù)的云計(jì)算框架設(shè)計(jì)研究[D].南京郵電大學(xué)碩士學(xué)位論文,2013.
[4] 王 棟,陳傳鵬,顏 佳,等. 新一代電力信息網(wǎng)絡(luò)安全架構(gòu)的思考[J]. 電力系統(tǒng)自動(dòng)化,2016(2):6-11.
[5] 龐思睿,許鴻飛,于 然,等. 云計(jì)算技術(shù)及其在電網(wǎng)中的應(yīng)用[J]. 電子技術(shù)應(yīng)用,2015,41(S1):221-223.
[6] 趙瀟瀟,白曉民. 云計(jì)算資源池在電力信息化中的應(yīng)用[J]. 華北電力技術(shù),2014(8):62-65+70.
[7] 王健偉. 一種全新的IT建設(shè)架構(gòu)——統(tǒng)一資源池[J]. 數(shù)據(jù)通信,2011(5):10-12.
[8] 百云川, 錢敏謹(jǐn). 利用虛擬化技術(shù)構(gòu)建資源池是實(shí)現(xiàn)云計(jì)算的第一步[J]. 中國制造業(yè)信息化,2010(12):34.
[9] 張 科,董 亮,鄒澄澄. 利用云計(jì)算技術(shù)建立電力信息系統(tǒng)硬件資源池[J]. 湖北電力,2014,38(6):1-3.
[10] 李璐穎,張?jiān)朴?房秉毅. 云計(jì)算在網(wǎng)絡(luò)中的應(yīng)用[J]. 電信技術(shù),2011(10):35-38.
[11] 顧海林,李 威. 云計(jì)算環(huán)境下業(yè)務(wù)服務(wù)模型及故障檢測(cè)方法[J]. 電信技術(shù),2015(10):66-69.
ResearchonFaultDiagnosisMethodofPowerCloudBasedonSupportVectorMachine
YU Hui1, QU Xi-long2, XIE Jing-li2
(College of Electrical and Information Engineering, Hunan Institute of Engineering, Xiangtan 411004, China)
Power cloud computing replaces traditional server+SAN/NAS information computing model with virtualization and distribution technology, and virtual pool with the ability of data integration and management improves resource utilization and reduces construction costs at the same time. Because the premise of the stability and reliability work of the power cloud depends heavily on the good network state, it also brings more complex new challenges of fault diagnosis. In order to realize the fault diagnosis of the power cloud network, a support vector machine (SVM) algorithm is proposed for the small sample and non-linear feature of the network fault itself. Based on the two categories which not can solve the multi-classfication, the one-to-one SVM is selected for the improvement, and experimental data and MATLAB simulation results verify its feasibility.
virtual pool; power cloud; support vector machine; fault diagnosis
2017-05-20
湖南省自科基金項(xiàng)目(2016JJ2040);湖南省研究生科技創(chuàng)新項(xiàng)目(CX2016B681);湖南省教育廳科研項(xiàng)目(17K015).
余 輝(1992-),女,碩士研究生,研究方向:新能源技術(shù)及應(yīng)用.
屈喜龍(1978-),男,博士,教授,研究方向:支持向量機(jī)理論與應(yīng)用.
TP393.0
A
1671-119X(2017)04-0039-04