王學(xué)淵 陳志剛 鐘新榮 盧寧
摘 要: 供水管道泄漏會(huì)造成水資源浪費(fèi)和經(jīng)濟(jì)損失,傳統(tǒng)支持向量機(jī)泄漏診斷模型中存在參數(shù)選擇不確定的問題,導(dǎo)致其分類結(jié)果不穩(wěn)定。提出將粒子群進(jìn)化算法應(yīng)用于泄漏診斷支持向量機(jī)模型中的參數(shù)優(yōu)化選擇,利用粒子群群體智能優(yōu)化搜索從全局迅速地迭代出合理的支持向量機(jī)的懲罰參數(shù)以及核參數(shù),使建立的PSO?SVM管道泄漏診斷模型達(dá)到最優(yōu)。實(shí)驗(yàn)測(cè)試表明,通過(guò)結(jié)合粒子群算法全局搜索收斂速度快的優(yōu)點(diǎn),有效地解決了支持向量機(jī)模型中兩個(gè)重要參數(shù)優(yōu)化選擇的問題,提升了支持向量機(jī)分類的準(zhǔn)確率和效率。
關(guān)鍵詞: 供水管道; 泄漏診斷; 支持向量機(jī); 粒子群算法; 參數(shù)優(yōu)化; PSO?SVM
中圖分類號(hào): TN911.1?34; TP274.2 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)07?0156?04
PSO?SVM based leakage diagnosis method of water supply pipeline
WANG Xueyuan1, 2, CHEN Zhigang1, 2, ZHONG Xinrong3, LU Ning1, 2
(1. School of Mechanical?electronic and Vehicle Engineering, Beijing University of Civil Engineering and Architecture, Beijing 100044, China;
2. Beijing Engineering Research Center of Monitoring for Construction Safety, Beijing 100044, China;
3. Changqing Downhole Technology Company, Xian 710000, China)
Abstract: The leakage of water supply pipeline will cause the water resource waste and economic losses. The traditional leakage diagnosis model based on support vector machine (SVM) has the problem of uncertain parameter selection, which may cause the unstable classification result. The particle swarm optimization (PSO) algorithm is proposed for parameter optimization selection in leakage diagnosis model based on SVM. The particle swarm intelligent optimization search is used to quickly iterate the reasonable penalty parameter and kernel parameter of SVM in the overall situation, so as to make the pipeline leakage diagnosis model based on PSO?SVM optimal. The experimental results show that, in combination with the fast convergence speed of PSO global search, the method can solve the two important parameters optimization selection problem in SVM model, and improve the accuracy and efficiency of SVM classification.
Keywords: water supply pipeline; leakage diagnosis; SVM; PSO; parameter optimization; PSO?SVM
0 引 言
隨著我國(guó)城市化水平不斷提高,供水管道長(zhǎng)度呈現(xiàn)加速增長(zhǎng)趨勢(shì),但供水管網(wǎng)道的漏損現(xiàn)象卻十分普遍。對(duì)于城市供水管道的漏失診斷,如何從復(fù)雜干擾中識(shí)別泄漏是整個(gè)技術(shù)的關(guān)鍵難點(diǎn)[1]。針對(duì)這一關(guān)鍵點(diǎn),文獻(xiàn)[2]提出基于神經(jīng)網(wǎng)絡(luò)的管道泄漏檢測(cè)識(shí)別方法,很大程度上提升了泄漏檢測(cè)的準(zhǔn)確率。但是,神經(jīng)網(wǎng)絡(luò)存在訓(xùn)練樣本需求多、收斂速度慢等問題,文獻(xiàn)[3]提出基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的SVM理論應(yīng)用于管道泄漏診斷領(lǐng)域,它在小樣本及非線性的情形下有獨(dú)特優(yōu)勢(shì),可以實(shí)現(xiàn)對(duì)管道泄漏進(jìn)行比較精確的診斷。但有研究表明,在成熟的條件下核函數(shù)對(duì)SVM識(shí)別性能的影響不大,其中對(duì)SVM性能起到關(guān)鍵作用的因素[4]是核參數(shù)和懲罰因子[C。]常規(guī)支持向量機(jī)核參數(shù)和懲罰因子的選擇一般采用試湊法、經(jīng)驗(yàn)法或單目標(biāo)優(yōu)化法,上述方法不能達(dá)到全局優(yōu)化的效果,而且耗費(fèi)時(shí)間。
本文提出將粒子群進(jìn)化算法應(yīng)用于支持向量機(jī)的核參數(shù)和懲罰因子的選擇中。粒子群優(yōu)化算法在每次迭代中都考慮了全局搜索和局部搜索,與支持向量機(jī)結(jié)合后可獲得診斷效果更佳的PSO?SVM模型,提高了供水管道工況識(shí)別的準(zhǔn)確率。
1 支持向量機(jī)
1.1 支持向量機(jī)的基本原理
支持向量機(jī)是一種實(shí)現(xiàn)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的分類學(xué)習(xí)算法,它利用核函數(shù)把樣本映射到高維特征空間,然后在此空間中構(gòu)造分類間隔最大的線性分類超平面,因而向量機(jī)比較適合于小樣本數(shù)據(jù)的分類[5]。
支持向量機(jī)方法的最優(yōu)分類面是在線性可分的情況下提出的。圖1為最優(yōu)分類界限,圖中的[H]為兩種樣本的分類線,[H1,H2]分別為各類中離分類線最近且平行的直線,[H1,H2]之間的距離稱為分類間隔。最優(yōu)分類線即為分類間隔最大的分類線,使兩類樣本正確分離。
在線性不可分的情況下,圖1所示的最優(yōu)分類面在實(shí)際應(yīng)用中可能存在某些樣本不能被超平面正確分類的情況,超平面約束條件為:
式中:[b]為閾值;[ω]為分類面的法向量。對(duì)于非線性最優(yōu)分類面的求解需要引入拉格朗日乘子,廣義最優(yōu)分類面問題可以轉(zhuǎn)化為在約束條件下的最小化[iaii,jaiajxixjyiyj,]其中約束為[0≤ai≤C;][iaiyi=0;]懲罰參數(shù)[C]為非負(fù)常數(shù)。
對(duì)于支持向量機(jī)的非線性劃分,可通過(guò)非線性變換將其轉(zhuǎn)換為高維空間中的線性劃分。這里只需要將原來(lái)空間的函數(shù)在高維特征空間通過(guò)內(nèi)積運(yùn)算的方式引入核函數(shù),并且采用適當(dāng)?shù)膬?nèi)積核函數(shù)[Kxi,yi]使核函數(shù)滿足Mercer條件,就可實(shí)現(xiàn)此非線性變換,并且算法的復(fù)雜程度也不會(huì)有所增加,此時(shí)分類函數(shù)為:
其中,影響識(shí)別準(zhǔn)確率的兩個(gè)重要因素為:
1) 核參數(shù)
核參數(shù)的改變本質(zhì)上是映射函數(shù)的改變,從而改變了空間樣本集分布的復(fù)雜程度。所以,只有使用適合的核函數(shù)以及核參數(shù)才能夠?qū)颖緮?shù)據(jù)映射到適合的特征空間。即選擇機(jī)器學(xué)習(xí)實(shí)際風(fēng)險(xiǎn)最小的特征空間,才可以獲得泛化能力優(yōu)秀的支持向量機(jī)分類器。
常用的核函數(shù)有徑向基函數(shù)(其中函數(shù)寬度為核參數(shù))、多項(xiàng)式核函數(shù)(其中多項(xiàng)式系數(shù)為核參數(shù))以及Sigmoid核函數(shù)(其中尺度和衰減系數(shù)為核參數(shù))。
2) 懲罰因子
懲罰因子[C]的數(shù)值表示對(duì)經(jīng)驗(yàn)誤差的敏感程度,懲罰因子與SVM的復(fù)雜度成正比,而與經(jīng)驗(yàn)風(fēng)險(xiǎn)成反比。在確定的數(shù)據(jù)子空間內(nèi)至少存在一個(gè)適合的懲罰因子使得SVM的泛化能力達(dá)到最好。
1.2 多元支持向量機(jī)
支持向量機(jī)是兩類分類器,而現(xiàn)實(shí)中管道泄漏診斷結(jié)果的分類通常是多個(gè)種類,如正常輸送、調(diào)閥、停泵和泄漏。常用構(gòu)建多元支持向量機(jī)的方法有一對(duì)一、一對(duì)多以及采用決策樹的支持向量機(jī)。
在少量的工況分類情況下,三種方法效果相當(dāng),但考慮到擴(kuò)增工況識(shí)別的可能,本文采用文獻(xiàn)[6]中的決策樹方法構(gòu)建多元支持向量機(jī)用以判別管道泄漏和各種工況操作。其訓(xùn)練效果與一對(duì)一多元支持向量機(jī)相當(dāng),但學(xué)習(xí)訓(xùn)練和測(cè)試用時(shí)方面比常規(guī)支持向量機(jī)更短,隨著分類數(shù)量的增加,效果更加明顯,效率更高。多元支持向量機(jī)分類器的構(gòu)建如圖2所示。
2 粒子群算法優(yōu)化支持向量機(jī)
2.1 粒子群優(yōu)化算法
粒子群優(yōu)化算法的基本思想為:需要被優(yōu)化問題的潛在解就是在空間中搜索最優(yōu)粒子,將PSO算法隨機(jī)初始化為隨機(jī)粒子群,每個(gè)單獨(dú)粒子都有一個(gè)函數(shù)決定它所對(duì)應(yīng)的適應(yīng)度,并且還有一個(gè)決定它們運(yùn)行軌跡的速度向量,然后粒子群會(huì)依據(jù)當(dāng)前的最優(yōu)粒子在空間中進(jìn)行搜索,直到通過(guò)迭代尋優(yōu)找到最優(yōu)解[7]。
粒子群優(yōu)化算法核心迭代公式如下:
式中:[vk+1i]表示第[i]個(gè)粒子在第[k+1]代時(shí)的飛行速度;[xk+1i]表示第[i]個(gè)粒子在第[k+1]代時(shí)的位置;[pki]表示第[i]個(gè)粒子到第[k]代為止所找到的最優(yōu)位置;[pkg]表示當(dāng)前種群到目前為止所找到的最優(yōu)位置;[pki-xki]表示個(gè)體認(rèn)知;[pkg-xki]表示社會(huì)認(rèn)知;[ω]為慣性系數(shù),表示相信自己的程度;學(xué)習(xí)因子[c1,c2]為非負(fù)常數(shù),前者表示對(duì)經(jīng)驗(yàn)的信服程度,后者表示對(duì)周圍個(gè)體的信服程度;[r1,r2]表示[(0,1)]的隨機(jī)數(shù)。
在整個(gè)粒子群的迭代中體現(xiàn)了粒子群優(yōu)化在尋找最優(yōu)解的過(guò)程中既保持了粒子自身的慣性,又利用個(gè)性以及社會(huì)性不斷修改和移動(dòng)自身方向,最終使群體朝著最優(yōu)解靠近,并且避免了復(fù)雜的遺傳操作。
2.2 基于粒子群優(yōu)化的支持向量機(jī)
根據(jù)粒子群優(yōu)化算法的全局搜索優(yōu)勢(shì)進(jìn)行支持向量機(jī)的改進(jìn),其步驟如下:
步驟1:初始化。對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理并讀取樣本數(shù)據(jù)。設(shè)定參數(shù)運(yùn)動(dòng)范圍,設(shè)定學(xué)習(xí)因子[c1,c2、]進(jìn)化代數(shù)[(E)、]懲罰因子[C]和核參數(shù)[g](本文采用徑向基核函數(shù),其核參數(shù)為函數(shù)寬度[σ])。
步驟2:適應(yīng)度評(píng)價(jià)。計(jì)算個(gè)體的適應(yīng)度值,初始化個(gè)體和全局最優(yōu)位置。
步驟3:比較尋優(yōu)。根據(jù)式(3)更新粒子的速度和位置產(chǎn)生新種群,計(jì)算新種群的個(gè)體適應(yīng)度值。分別比較當(dāng)前參數(shù)[C]和[σ]的適應(yīng)值和自身歷史最優(yōu)值及種群最優(yōu)值,更新種群參數(shù)[C]和[σ]的全局最優(yōu)值。
步驟4:檢查結(jié)束條件。尋優(yōu)達(dá)到最大進(jìn)化代數(shù),結(jié)束尋優(yōu),否則返回步驟2,輸出最佳參數(shù)[C]和[σ]。
隨后將優(yōu)化的參數(shù)[C]和[σ]代入SVM模型并檢測(cè)SVM的建模精度。PSO?SVM工作流程如圖3所示。
3 應(yīng) 用
3.1 實(shí)驗(yàn)預(yù)處理
在實(shí)際生產(chǎn)中,除了泄漏可能引起壓力波動(dòng)外,其他的一些工況操作,如啟停泵、調(diào)泵、閥門切換、調(diào)閥等同樣也會(huì)引起壓力波動(dòng)信號(hào),而且某些工況下的波動(dòng)信號(hào)與泄漏引發(fā)的波動(dòng)信號(hào)非常相似。
從圖4中可以看出,信號(hào)中的背景十分嘈雜,波動(dòng)的特征被淹沒在噪聲中,不便于后期的機(jī)器學(xué)習(xí)分類。管道泄漏分析中必須對(duì)泄漏、停泵、調(diào)泵、調(diào)閥等引起的壓力波動(dòng)信號(hào)加以準(zhǔn)確區(qū)別。首先要對(duì)采集的信號(hào)進(jìn)行濾波,本文采用小波降噪方法進(jìn)行降噪處理,得到比較純凈的波形,以便于管道的泄漏診斷。
其次,泄漏波形特征參數(shù)的選擇對(duì)泄漏診斷的準(zhǔn)確率和可靠性有一定的影響。文獻(xiàn)[8]中數(shù)據(jù)挖掘方法從描述供水管道壓力波動(dòng)的特征參數(shù)中選擇平均幅值、均方根、方根幅值、裕度因子和峭度作為支持向量機(jī)的輸入特征。輸入特征值如表1所示。
3.2 參數(shù)的確定
本文采用Matlab進(jìn)行模型的建造,其中核函數(shù)選擇在泄漏檢測(cè)領(lǐng)域支持向量機(jī)常用的RBF徑向基[9?10]核函數(shù):[K(x,y)=exp-x-y2σ2]。
按照本文2.2節(jié)步驟建立PSO?SVM模型,核參數(shù)及懲罰參數(shù)的迭代如圖5所示。得出最優(yōu)參數(shù)為:函數(shù)寬度[σ=30,]懲罰參數(shù)[C=1.5。]
由圖5可以看出,隨著粒子群算法迭代的進(jìn)行,模型的準(zhǔn)確率在87%~98%的區(qū)間內(nèi)震蕩,粒子群記錄下最優(yōu)的參數(shù)組合。相比以往的交叉驗(yàn)證和網(wǎng)格搜索,粒子群算法在搜索范圍及速度方面都有比較明顯的優(yōu)勢(shì)。
3.3 測(cè)試結(jié)果
為了驗(yàn)證本文PSO?SVM分類模型的泛化能力,用經(jīng)過(guò)訓(xùn)練的PSO?SVM分類器對(duì)4種運(yùn)行工況下不同的樣本波形進(jìn)行識(shí)別分類的檢測(cè)實(shí)驗(yàn)。將待測(cè)試樣本的特征值列表按照規(guī)定的輸入格式輸入經(jīng)過(guò)PSO?SVM訓(xùn)練的模型進(jìn)行工況識(shí)別。為了體現(xiàn)基于粒子群算法的支持向量機(jī)的優(yōu)缺點(diǎn),建立BP神經(jīng)網(wǎng)絡(luò)以及傳統(tǒng)的SVM模型,并將他們與PSO?SVM進(jìn)行性能比較。測(cè)試結(jié)果如表2所示。
由表2可以看出,PSO?SVM相對(duì)于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)和SVM不僅識(shí)別的準(zhǔn)確率有所提升,而且訓(xùn)練用時(shí)相對(duì)較少,并且管道工況識(shí)別準(zhǔn)確率分別提高了12%和3.5%。
為了降低常規(guī)操作導(dǎo)致的供水管道泄漏檢測(cè)的錯(cuò)誤識(shí)別,采用SVM分類器從不同的工作環(huán)境中識(shí)別出泄漏的存在;采用PSO算法對(duì)模型參數(shù)進(jìn)行優(yōu)化,提高了SVM分類器的泄漏識(shí)別準(zhǔn)確率。試驗(yàn)結(jié)果表明,PSO比較適用于優(yōu)化SVM,PSO?SVM算法對(duì)供水管道工況識(shí)別具有很高的辨識(shí)精度,可以很好地應(yīng)用于相關(guān)的管道泄漏診斷中。
4 結(jié) 論
本文使用粒子群優(yōu)化算法的全局優(yōu)化特性優(yōu)化支持向量機(jī)的核參數(shù)和懲罰參數(shù),建立供水管道泄漏診斷模型。通過(guò)粒子群優(yōu)化算法的全局搜索優(yōu)勢(shì)對(duì)支持向量機(jī)進(jìn)行改進(jìn),使得支持向量機(jī)的參數(shù)選擇更加合理。實(shí)驗(yàn)表明,基于改進(jìn)的支持向量機(jī)的管道泄漏診斷模型在測(cè)試中準(zhǔn)確率相對(duì)于以往的支持向量機(jī)以及神經(jīng)網(wǎng)絡(luò)模型有較明顯提升,有效地解決了傳統(tǒng)支持向量機(jī)中參數(shù)選擇對(duì)檢測(cè)準(zhǔn)確率的影響,提升了對(duì)管道工況的辨識(shí)程度,同時(shí)也避免了復(fù)雜的遺傳操作,在訓(xùn)練時(shí)間上有可觀的改進(jìn)。
注:本文通訊作者為陳志剛。
參考文獻(xiàn)
[1] 文玉梅,張雪園,文靜,等.依據(jù)聲信號(hào)頻率分布和復(fù)雜度的供水管道泄漏辨識(shí)[J].儀器儀表學(xué)報(bào),2014,35(6):1223?1229.
WEN Y M, ZHANG X Y, WEN J, et al. Identification of water pipeline leakage based on acoustic signal frequency distribution and complexity [J]. Chinese journal of scientific instrument, 2014, 35(6): 1223?1229.
[2] 唐秀家.管道系統(tǒng)泄漏檢測(cè)神經(jīng)網(wǎng)絡(luò)與模式識(shí)別方法[J].核科學(xué)與工程,1998(3):33?40.
TANG X J. Fluid pipeline system leak detection based on neural network and pattern recognition [J]. Chinese journal of nuclearence & engineering, 1998(3): 33?40.
[3] 陳志剛,張來(lái)斌,梁偉,等.復(fù)雜工況下熱油管道泄漏識(shí)別與定位方法研究[J].西南石油大學(xué)學(xué)報(bào),2008,30(6):157?160.
CHEN Z G, ZHANG L B, LIANG W, et al. Leak detection and positioning for hot oil pipeline under complicated conditions [J]. Journal of Southwest Petroleum University, 2008, 30(6): 157?160.
[4] VAPNIK V N. The nature of statistical learning theory [M]. 2nd ed. New York: Springer, 2000.
[5] CHEN Peng, YUAN Lifen, HE Yigang, et al. An improved SVM classifier based on double chains quantum genetic algorithm and its application in analogue circuit diagnosis [J]. Neurocomputing, 2015, 211: 202?211.
[6] 張亮,陳志剛,楊建偉,等.基于決策樹與多元支持向量機(jī)的齒輪箱早期故障診斷方法[J].計(jì)算機(jī)測(cè)量與控制,2016(1):12?15.
ZHANG L, CHEN Z G, YANG J W, et al. Early fault diagnosis of gearbox based on multiclass support vector machine and decision tree [J]. Computer measurement & control, 2016(1): 12?15.
[7] TUNGADIO D H, JORDAAN J A, SITI M W. Power system state estimation solution using modified models of PSO algorithm: comparative study [J]. Measurement, 2016, 92: 508?523.
[8] 梁偉,張來(lái)斌,王朝暉.基于數(shù)據(jù)挖掘的負(fù)壓波特征參數(shù)優(yōu)化方法[J].石油機(jī)械,2008,36(12):38?42.
LIANG W, ZHANG L B, WANG Z H. Study of optimization method of characteristic parameters of negative pressure wave based on data mining [J]. China petroleum machinery, 2008, 36(12): 38?42.
[9] YIN Shen, YIN Jiapeng. Tuning kernel parameters for SVM based on expected square distance ratio [J]. Information sciences, 2016(2): 370?371.
[10] LIU Chao, YIN Shiqun, ZHANG Miao, et al. An improved grid search algorithm for parameters optimization on SVM [J]. Applied mechanics and materials, 2014, 644: 2216?2219.