吳米佳,盧錦玲
(華北電力大學電氣與電子工程學院,河北 保定 071003)
基于改進粒子群算法與支持向量機的變壓器狀態(tài)評估
吳米佳,盧錦玲
(華北電力大學電氣與電子工程學院,河北 保定 071003)
支持向量機 (SVM)能較好地解決小樣本、非線性特征的多分類問題,適用于電力變壓器運行狀態(tài)評估,但參數(shù)選擇對分類效果有著顯著影響。利用改進的粒子群算法 (PSO)對支持向量機 (SVM)參數(shù)進行尋優(yōu),通過引入收斂因子、慣性因子動態(tài)化和自適應粒子變異三種方法對傳統(tǒng)的PSO算法進行改進,從而獲得最佳的分類模型。該模型以變壓器油中溶解氣體濃度為評估指標,將變壓器分成優(yōu)秀、一般、良好、注意、故障等5個等級,其中故障又分為低溫過熱、中溫過熱、高溫過熱、低能放電、高能放電、局部放電6個類別。通過實例數(shù)據(jù)分析得出,用改進后的PSO算法優(yōu)化得到的SVM分類器能對變壓器的各種狀態(tài)進行較準確的評估。
電力變壓器;狀態(tài)評估;粒子群算法;支持向量機;參數(shù)尋優(yōu)
在電力變壓器的運行及維護中,及時了解變壓器的運行狀態(tài)并對故障進行處理,對提高電力系統(tǒng)安全和運行可靠性具有重要意義。
支持向量機 (SVM)是建立在統(tǒng)計學習理論和結構風險最小原理基礎上的,根據(jù)有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折衷。能較好地解決小樣本、非線性、高維數(shù)情況下的分類問題,具有很強的泛化能力。然而支持向量機的參數(shù)選擇的恰當與否會對數(shù)據(jù)的訓練和收斂性帶來很大影響[2,3]。傳統(tǒng)的粒子群算法是一種進化的計算技術,通過追隨當前搜索到的最優(yōu)值來尋找全局最優(yōu)。粒子群算法具有原理簡單、所需參數(shù)少、收斂速度快等優(yōu)點,但也存在容易陷入局部最小的缺點[4]。因此本文提出了一種改進的PSO算法對支持向量機的參數(shù)進行尋優(yōu),利用優(yōu)化得到的支持向量機模型進行變壓器狀態(tài)評估,并與傳統(tǒng)的PSO優(yōu)化算法結果進行了比較。
SVM的基本思想是建立一個最優(yōu)超平面為決策曲面,使得正例和反例之間的隔離邊緣被最大化。在線性可分的情況下,在原空間尋找兩類樣本的最優(yōu)分類超平面;在線性不可分情況下,引入非負的松弛變量ξi,允許錯分樣本的存在,超平面的約束調(diào)節(jié)變?yōu)?
廣義的最優(yōu)分類面變?yōu)?
式中:C為懲罰參數(shù),用來平衡最大間隔和最小的分類誤差。對于非線性問題,可以通過非線性變化將n維樣本 (xi,yi)轉化為某個高維空間中的線性問題,然后在此高維空間中求最優(yōu)分類面。因此需要引入一種適當?shù)膬?nèi)積核函數(shù)K(xi,x),由于徑向基核函數(shù) (RBF)可逼近任意的非線性函數(shù)[1],因此本文采用RBF核函數(shù)對SVM進行研究。RBF核函數(shù)為:
相應的分類決策函數(shù)表示為:
其中ai為支持向量,b是分類的閾值。研究表明,C用于控制模型復雜度和逼近誤差,C越大,則對數(shù)據(jù)擬合程度越高,但算法泛化能力下降;δ2值過大會造成過學習現(xiàn)象。本文將采用改進的粒子群算法對C和δ2進行尋優(yōu),從而得出實際情況中分類模型最優(yōu)的C和δ。
環(huán)磷酰胺聯(lián)合糖皮質(zhì)激素對原發(fā)性腎病綜合征患者腎功能和血脂的影響………………………………………………………………………… 朱 莉,等(11):1336
粒子群算法和遺傳算法相似,也是從隨機解出發(fā),通過迭代尋找最優(yōu)解,通過適應度來評價解的優(yōu)劣。
粒子群算法中每個粒子就是解空間中的一個解,根據(jù)自己移動的路徑和同伴移動的經(jīng)驗來調(diào)整自己的移動路徑。每個粒子的速度決定它們移動的方向和距離[5]。
假設由N個粒子組成的種群為:X=(x1,x2,…xn),其中,第i個粒子表示一個D維的向量:xi=(xi1,xi2,…xiD)T,其速度為: vi=(vi1,vi2,…viD)T。每個粒子都有一個由目標函數(shù)決定的適應度值f(i),粒子通過自身的個體極值pi=(pi1,pi2,…piD)T以及全局極值 pg=(pg1,pg2,…pgD)T這兩項來更新自己的位置xi和速度vi,公式如下:
式中:r1,r2是在 (0,1)上的隨機數(shù);C1,C2是正數(shù),ω是慣性因子。
2.2.1 引入收斂因子
Suganthan的實驗表明,C1,C2為常數(shù)時可以得到較好的解。為了使粒子跳出局部最優(yōu)之后能更快收斂到全局最優(yōu)值,可以引入收斂因子K[6,7],公式 (8) 變?yōu)?
這是對傳統(tǒng)的粒子群算法的一種特殊參數(shù)的改進。其 中,C1=Kφ1,C2=Kφ2,φ = φ1+φ2,φ >4。
2.2.2 基于動態(tài)慣性因子的改進
慣性因子對粒子群算法影響較大。當ω較大時算法具有較強的全局搜索能力;較小時算法有利于局部搜索[8,9]。有學者提出了自適應調(diào)整的粒子群算法,然而自適應調(diào)整的粒子群算法有一定的缺陷,不能很好地適應那些帶有復雜的非線性變化特征的優(yōu)化問題。為此,引入了動態(tài)變化的慣性因子,先引入兩個變量:
式中:e代表了粒子群的進化速度;a代表了粒子的聚散程度;pgk-1和 pgk分別為前一次迭代的全局最優(yōu)值和當前的全局最優(yōu)值。該算法考慮了粒子以前的運行狀態(tài),反映了粒子群在速度上的進化程度。若e值較小,進化速度快;當e較大時則相反。早期可以適當增大ω,使得粒子在較大的范圍內(nèi)搜索。搜索的后期可以適當減小ω。同理,當a較小則說明粒子群中粒子的分布較為分散,粒子不易陷入局部最優(yōu);當a變大時,則應該相應增加ω,使得在更大的搜索空間中搜索,避免陷入局部最優(yōu)。當所有的粒子都達到全局最優(yōu)值時,粒子就聚到了一起,即a=1。由此可得ω應該隨著粒子群的進化速度和粒子的聚散程度變化而變化,有式 (12):
式中: ω0是 ω 初值,建議取0.9[5]。
2.2.3 自適應粒子變異 (C和δ自身的變異)
由于r1,r2是在 (0,1)上的隨機數(shù),因此選取不同的值會使粒子速度的更新隨機性增加,會增加結果的收斂時間。為了降低隨意性,在粒子更新自己的速度和位置時,若r1,r2至少有一個大于m(m=0.5),則在x的基礎上進行自身變異,如式 (13):
(1)初始化。a.初始化粒子x為n×2矩陣,n為迭代次數(shù),x1和x2分別為參數(shù)C和δ的值;b.初始化每個粒子的速度;c.用每個粒子初始的C和δ帶入計算K折交叉驗證值作為其初始適應度值;d.初始化全局極值和局部極值,局部極值即為每個粒子的初始適應度值,全局極值即為所有粒子初始適應度中最小的值。
(2)迭代尋優(yōu)。a.用公式 (10)、(11)引入收斂因子,并更新粒子的速度,若速度值超出范圍,則取邊界值;b.用公式 (8)、(9)、(14)更新粒子的C和δ;c.用公式 (15)、(16) 對粒子進行自適應變異處理;d.用新得到的C和δ更新粒子的適應度fitness;e.若新得到的適應度fitness優(yōu)于上一代局部最優(yōu)的粒子,則用新粒子代替局部最優(yōu)粒子,并記下C和δ;若新的粒子優(yōu)于上一代全局最優(yōu)粒子,則用此粒子代替全局最優(yōu)粒子,同時記下C和δ;f.返回全局最優(yōu)的C和δ;
(3)計算最優(yōu)適應度,若不滿足循環(huán)退出條件,轉至步驟 (2)。
采用油中分解氣體分析法 (DGA)作為狀態(tài)評估的依據(jù)。目前收集到的5種氣體數(shù)據(jù)為H2,CH4,C2H6,C2H4,C2H5。將變壓器的運行狀態(tài)分為:優(yōu)秀、良好、一般、注意、故障5個級別,根據(jù)IEC60599規(guī)定,變壓器故障又可分為低能放電、高能放電、中低溫過熱、高溫過熱和局部放電6種故障。因此可以通過現(xiàn)有的氣體成分與相對應的故障數(shù)據(jù),利用優(yōu)化的SVM分類器進行變壓器狀態(tài)評估[7]。
對SVM分類器而言,考慮到各種氣體成分在不同區(qū)間內(nèi)變化,為保證SVM處理數(shù)據(jù)時收斂性及分類的準確性,有必要對氣體數(shù)據(jù)進行歸一化處理。歸一化有多種方法,經(jīng)過試驗,歸一化至[-1,1]區(qū)間準確率更高,其公式為:
xmax,xmin分別為樣本的最大值和最小值。將歸一化之后的數(shù)據(jù)作為SVM分類器的訓練樣本以及測試樣本。
在本文中,對變壓器的5種狀態(tài)進行分析,因此采用1-v-1的分類法,將變壓器的5個狀態(tài) (5個類別)進行兩兩組合,同時再對變壓器的6種故障狀態(tài)進行兩兩組合,最終所構造的分類器數(shù)量為45個。
考慮到變壓器型號、容量以及運行環(huán)境等因素的影響,筆者收集了大量具有明確結論的變壓器數(shù)據(jù),整理了458例樣本。其中優(yōu)秀狀態(tài)數(shù)據(jù)有245例、良好狀態(tài)數(shù)據(jù)60例、一般狀態(tài)數(shù)據(jù)50例、注意狀態(tài)數(shù)據(jù)17例、故障數(shù)據(jù)86例。在故障數(shù)據(jù)中,低能放電2例、高能放電21例、低溫過熱4例、中溫過熱1例、高溫過熱98例、局部放電2例。詳細分類情況見表1。
表1 訓練數(shù)據(jù)測試數(shù)據(jù)集的劃分Tab.1 Compartmentalization of training data and testing data
(1)將氣體樣本數(shù)據(jù)分為訓練集 (305條)和測試集 (153條)。訓練集用于訓練SVM分類器的模型,測試集用于測試SVM分類器的最終分類效果。
(2)對各個樣本的5種變壓器溶解氣體濃度用式 (17)進行歸一化處理,使訓練集和測試集的所有樣本數(shù)據(jù)都在 [-1,1]之間。
(3)利用改進的PSO粒子群算法對SVM的C和δ參數(shù)進行尋優(yōu),其中PSO改進算法的粒子種群規(guī)模為50,迭代次數(shù)為200。
(4)將訓練樣本輸入SVM,并用優(yōu)化得到的C和δ來訓練SVM,得到相應的SVM分類器模型。
(5)利用得到的SVM分類器模型對測試樣本數(shù)據(jù)進行變壓器狀態(tài)評估。
圖1 粒子適應度曲線Fig.1 Curve of particles fitness
由圖1可見,粒子的適應度隨著迭代次數(shù)的增大逐漸增加,并最終達到最大值98.864%,途中最高點所對應的C和δ即為全局最優(yōu)的解,優(yōu)化后的SVM分類器模型正確率達93.464%,其中C為512,δ為9.765 6e-003,此時153個測試樣本,正確分類的有143類,誤分類樣本有10例。而傳統(tǒng)的PSO算法優(yōu)化SVM參數(shù)后進行狀態(tài)評估,得到的正確率只有90.277 8%,153個測試樣本中,正確分類的樣本有138個,比優(yōu)化PSO算法多出的6例錯分情況主要集中在故障狀態(tài)。改進的PSO算法優(yōu)化SVM分類器模型得到的誤分類狀態(tài)如表2所示。
從表中可以看出,錯判情況主要集中在故障狀態(tài),利用改進的PSO優(yōu)化SVM分類器參數(shù),所得到的分類模型在原有的PSO算法基礎上,分類的準確度有了提高,尤其是對故障狀態(tài)的區(qū)分[10]。
表2 改進的PSO算法優(yōu)化SVM模型評估結果誤分類狀態(tài)Tab.2 Misclassification status of improved PSO algorithm for optimization of SVM model assessments
本文引入收斂因子和動態(tài)慣性因子以及自適應變異粒子三種方法對傳統(tǒng)的PSO算法進行改進,改進的PSO算法能更快收斂到全局最優(yōu)值,對支持向量機的C和δ參數(shù)進行尋優(yōu)更有效。實例表明,C不能設置過大,雖然過大的懲罰參數(shù)能使得粒子適應度提高,但易造成過學習狀態(tài),導致測試數(shù)據(jù)集的準確率下降。變壓器狀態(tài)評估實例分析結果表明,改進的PSO算法提高了變壓器狀態(tài)評估的準確率。
[1]肖燕彩,陳秀海,朱衡君.遺傳支持向量機在電力變壓器故障診斷中的應用[J].上海交通大學學報,2007,41(11):1878-1882.
Xiao Yancai,Chen Xiuhai,Zhu Hengjun.The application of genetic SVM in power transformer fault diagnosis[J].Journal of Shang Hai University,2007,41(11):1878-1882.
[2]成洪靜,陳立潮,張英俊,等.基于SVM的多分類器構造算法的研究[J].計算機技術與發(fā)展,2008,18(12):109-112.
Cheng Hongjing,Chen Lichao,Zhang Yingjun,et al.On research of algorithm about structuring multi-classifier based on SVM [J].Computer Technology and Development,2008,18(12):109 -112.
[3]王靈,俞金壽.基于離散粒子群和支持向量機的故障診斷方法 [J].華東理工大學學報,2005,31(5):697-700.
Wang Ling,Yu Jinshou.Fault diagnosis based on discrete particle swarm optimization and support vector machine[J].Journal of East China University of Science and Technology,2005,31(5):697-700.
[4]王曉霞,王濤,谷根代.基于改進粒子群優(yōu)化的神經(jīng)網(wǎng)絡及應用 [J].華北電力大學學報,2009,36(5):99-102.
Wang Xiaoxia,Wang Tao,Gu Gendai.Neural network based on modified particle swarm optimization and its application[J].Journal of North China Electric Power U-niversity,2009,36(5):99-102.
[5]向國齊,黃大貴,嚴志堅.支持向量機和粒子群算法在結構優(yōu)化中的應用研究[J].計算機應用研究,2009,26(6):2059-2061.
Xiang Guoqi,Huang Dagui,Yan Zhijian.Study and application of support vector machines and particles swarm algorithm in optimization design[J].Application Research of Computers,2009,26(6):2059-2061.
[6]李然,盛四清,王瑩.基于改進粒子群算法的電壓薄弱區(qū)域恢復 [J].電力系統(tǒng)保護與控制,2009,37(24):109-113.
Li Ran,Sheng Siqing,Wang Ying.Weak voltage areas recovery based on improved particle swarm optimization algorithm [J].Power System Protection and Control,2009,37(24):109-113.
[7]吳曉輝,劉炯,梁永春.支持向量機在電力變壓器故障診斷中的應用[J].西安交通大學學報,2007,41(6):722-726.
Wu Xiaohui,Liu Jiong,Liang Yongchun.Application of support vector machine in transformer fault diagnosis[J].Journal of Xi'an University,2007,41(6):722- 726.
[8]王東,吳湘濱.利用粒子群算法優(yōu)化SVM分類器的超參數(shù) [J].計算機應用,2008,28(1):134-135,139.
Wang Dong,Wu Xiangbin.Utilizing particle swarm optimization to optimize hyper-parameters of SVM classifier[J].Journal of Computer Applications,2008,28(1):134 -135,139.
[9]徐以山,曾碧,尹秀文,等.基于改進粒子群算法的BP神經(jīng)網(wǎng)絡及其應用 [J].計算機工程與應用,2009,45(35):233-235.
Xu Yishan,Zeng Bi,Yin Xiuwen,et al.BP neural network and its applications based on improved PSO [J].Computer Engineering and Application, 2009, 45(35):233-235.
[10]申濤,朱永利,李強,等.基于支持向量機和DGA的變壓器狀態(tài)評估方法 [J].電力科學與工程,2008,24(2):47-50.
Shen Tao,Zhu Yongli,Li Qiang,et al.Power transformer condition evaluation based on support vector machine and DGA [J].Electric Power Science and Engineering,2008,24(2):47-50.
Condition Assessment for Power Transformer Based on Improved Particle Swarm Optimization and Support Vector Machine
Wu Mijia,Lu Jinling
(Schooling of Electrical and Electronic Engineering,North China Electric Power University,Baoding 071003,China)
The Support Vector Machine(SVM)have a better solution in small sample problem and nonlinear characteristics of the multi-classification.As a result SVM is suitable for condition assessment of power transformer operation;however the parameters of Support Vector Machine(SVM)have significant implications on the classification results.In order to obtain the best classification model,an improved particle swarm optimization(PSO)algorithm is introduced to optimize the parameters of the support vector machine(SVM).The model is based on transformer dissolved gas analysis(DGA)technique as evaluation method,the running states of transformer are divided into excellent,good,normal,attention and fault five levels,where the fault level is divided into low-temperature failure of overheating,medium-temperature failure of overheating,high-temperature failure of overheating,low energy discharge,high energy discharge and partial discharge six categories.By the analysis of sample data,we prove that using the improved PSO algorithm to optimize the SVM classifier can increase the state assessment accuracy of transformer.
power transformer;state assessment;PSO;SVM;parameter optimization
TM407
A
2010-09-17。
吳米佳 (1985-),男,碩士研究生,主要研究方向為人工智能技術在電力系統(tǒng)中的應用,E-mail:wumijia123@126.com。