張 華,曲海旭
(吉林建筑大學(xué)城建學(xué)院,吉林長(zhǎng)春130011)
ZHANG Hua,QU Hai-xu(The City College of Jilin Architectural And Civil Engineering Institute,Changchun,Jilin 130011,China)
基于偏二叉樹支持向量機(jī)的ERT系統(tǒng)流型識(shí)別研究*
張 華,曲海旭
(吉林建筑大學(xué)城建學(xué)院,吉林長(zhǎng)春130011)
兩相流在工業(yè)中應(yīng)用廣泛,它具有非常復(fù)雜的流動(dòng)性和隨機(jī)性,準(zhǔn)確識(shí)別流型是兩相流參數(shù)準(zhǔn)確測(cè)量的基礎(chǔ).該文首先用小波包分解方法提取ERT系統(tǒng)測(cè)量的壓差波動(dòng)信號(hào)特征,然后構(gòu)建偏二叉樹支持向量機(jī)多類分類模型,最后向分類模型中輸入特征數(shù)據(jù)進(jìn)行流型識(shí)別.實(shí)驗(yàn)結(jié)果表明偏二叉樹支持向量機(jī)多類分類算法較大提高了流型識(shí)別的準(zhǔn)確度,是一種有效的流型識(shí)別方法.
電阻層析成像;流型識(shí)別;小波包;偏二叉樹支持向量機(jī)
廣泛存在于工業(yè)生產(chǎn)中的兩相流具有復(fù)雜的流動(dòng)特性,其參數(shù)檢測(cè)難度很大.流型在影響兩相流的流動(dòng)特性和傳熱性能的同時(shí)還會(huì)影響對(duì)兩相流的測(cè)量準(zhǔn)確性.因此流型識(shí)別是兩相流參數(shù)檢測(cè)的一個(gè)重要研究方向.本文針對(duì)ERT系統(tǒng)和油/水兩相流的四種流型,提出一種基于小波包分解和偏二叉樹支持向量機(jī)的流型識(shí)別方法.該方法利用小波包分解提取ERT系統(tǒng)測(cè)量的壓差波動(dòng)信號(hào)的特征數(shù)據(jù),提高了支持向量機(jī)的訓(xùn)練和測(cè)試效率.并利用偏二叉樹支持向量機(jī)算法解決了以往一對(duì)一和一對(duì)多支持向量機(jī)算法可能存在的不可分區(qū)域問(wèn)題,提高了流型識(shí)別的準(zhǔn)確率.
圖1 ERT系統(tǒng)組成結(jié)構(gòu)圖
ERT系統(tǒng)主要組成部分是電阻傳感器陣列、數(shù)據(jù)采集系統(tǒng)、圖像重建計(jì)算機(jī)[1].系統(tǒng)組成結(jié)構(gòu)如圖1所示.ERT系統(tǒng)采用電流激勵(lì)、電壓測(cè)量的工作原理,本文針對(duì)12電極ERT系統(tǒng)采集到的電導(dǎo)率波動(dòng)信號(hào)進(jìn)行處理,采用相鄰電極的激勵(lì)模式,一幅圖像共采集到12*(12-3)=108個(gè)測(cè)量數(shù)據(jù).ERT系統(tǒng)工作原理圖如圖2所示.
圖2 ERT系統(tǒng)工作原理圖
2.1 小波包分解原理
小波包分解是一種較好的、針對(duì)非平穩(wěn)信號(hào)進(jìn)行特征提取的工具,它為信號(hào)提供了一種更加精密的分解方法.它以小波分析為基礎(chǔ),將頻帶進(jìn)行多層次劃分,進(jìn)一步分解多分辨率分析沒(méi)有細(xì)分的高頻部分,并能依據(jù)被分析信號(hào)的特征,自動(dòng)地選擇對(duì)應(yīng)的頻帶,以匹配相應(yīng)的信號(hào)頻譜,從而進(jìn)一步提高時(shí)頻分辨率[2].
2.2 小波包特征提取過(guò)程
①對(duì)輸入信號(hào)S,進(jìn)行三層小波包分解,其中采用db6小波濾波器和shanon熵值.提取第三層中從低頻到高頻的8個(gè)信號(hào)特征[3].
②獲得小波包的系數(shù),即幅值,通過(guò)公式E3 j=|2計(jì)算出各個(gè)頻段的能量(其中E3 j是信號(hào)S3j所對(duì)應(yīng)的能量,Xjk表示重構(gòu)信號(hào)Sij離散點(diǎn)的幅值).
③通過(guò)公式T=?E3 j/E」 j=0,1,…,7 其中E滿足公式:
對(duì)第2步所求能量值做歸一化處理.
④構(gòu)造以各頻段能量為特征值的特征向量,即T=[E30,E31,E32,E33,E34,E35,E36,E37]T.
3.1 支持向量機(jī)原理
支持向量機(jī)基于VC(Vapnik-Chervonenkis)理論[4]和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,能兼顧訓(xùn)練錯(cuò)誤和泛化性能,是適用于小樣本學(xué)習(xí)的通用學(xué)習(xí)算法,它為機(jī)器學(xué)習(xí)算法開辟了新天地.
根據(jù)支持向量機(jī)的定義,非線性最優(yōu)超平面的構(gòu)造問(wèn)題轉(zhuǎn)化為一個(gè)二次規(guī)劃[5]:
訓(xùn)練完成后,計(jì)算下列函數(shù)的符號(hào):
3.2 建立偏二叉樹支持向量機(jī)多類分類模型
上述支持向量機(jī)原理僅限于解決兩類分類問(wèn)題.而實(shí)際應(yīng)用中通常是多類分類問(wèn)題[6].常見的多類分類方法有一對(duì)一、一對(duì)多和二叉樹,其中一對(duì)一和一對(duì)多存在不可分區(qū)域.二叉樹多類支持向量機(jī)首先將所有的類別劃分成兩個(gè)大子類,再將每個(gè)大子類進(jìn)一步劃分成兩個(gè)次級(jí)子類,以此類推,直到所有的葉子節(jié)點(diǎn)都只包含一個(gè)單獨(dú)的類別.二叉樹多類分類方法將原來(lái)的多類分類問(wèn)題分解成了一系列的兩類分類問(wèn)題,而兩類分類問(wèn)題就可以用傳統(tǒng)的SVM解決.這種方法為K種類別分類,在訓(xùn)練時(shí)只需要構(gòu)造K-1個(gè)SVM兩類分類器,在測(cè)試時(shí)根據(jù)實(shí)際情況不一定需要計(jì)算所有的分類器判斷函數(shù),可以大大節(jié)省訓(xùn)練和測(cè)試的時(shí)間.并且可以有效避免一對(duì)一和一對(duì)多方法中存在不可分區(qū)域的情況.
二叉樹的拓?fù)浣Y(jié)構(gòu)分為兩種:偏二叉樹[7]和完全二叉樹,本文選用偏二叉樹構(gòu)造SVM多類分類模型.過(guò)程分為兩個(gè)階段進(jìn)行,分別是訓(xùn)練階段和測(cè)試階段.
訓(xùn)練階段:針對(duì)ERT系統(tǒng)中的四種流型,根據(jù)二叉樹算法需要訓(xùn)練4-1=3個(gè)SVM兩類分類器.構(gòu)造區(qū)分1類和2、3、4類的SVM1時(shí),將屬于第1類的樣本標(biāo)記為正類,屬于第2、3、4類的樣本標(biāo)記為負(fù)類,訓(xùn)練SVM1,即構(gòu)造并求解上文提到的二次規(guī)劃,得到區(qū)分1類和2、3、4類的超平面H1:f(x)1+b.以此類推,依次構(gòu)造區(qū)分2類和3、4類的SVM2,得到超平面 H2:f(x)2=+b,區(qū)分3、4類的SVM3,得到超平面H3:
測(cè)試階段步驟如下:
第一步:設(shè)給定的訓(xùn)練集為 {(x1,y1),(x2,y2),…,(xl,yl)},l代表用l組樣本數(shù)據(jù)進(jìn)行訓(xùn)練.其中xi∈Rn,yi∈{1,2,3,4},i=1,2,…,l.
第二步:對(duì)于待求樣本X,求超平面H1:f1(x) =sgn(g(x)),其中g(shù)(x)yiaiK(x,xi)+b的值,若是1,則樣本X屬于第1類,此次判斷結(jié)束;若是-1,則樣本X屬于(2、3、4)類,進(jìn)入右節(jié)點(diǎn),繼續(xù)判斷.
第三步:重復(fù)第二步,直到到達(dá)葉子節(jié)點(diǎn),此葉子節(jié)點(diǎn)所屬的類別就是待分樣本X所屬的類別.
圖3 偏二叉樹支持向量機(jī)多類分類模型
本實(shí)驗(yàn)采用MATLAB進(jìn)行仿真.實(shí)驗(yàn)步驟如下:第一步,訓(xùn)練:隨機(jī)選取已知流型的樣本:點(diǎn)滴流180個(gè),核心流225個(gè),層流270個(gè),環(huán)狀流315個(gè).根據(jù)ERT系統(tǒng)工作原理,測(cè)量到的每種流型是一個(gè)108維向量,經(jīng)過(guò)特征提取降為8維向量.構(gòu)造多類分類模型過(guò)程中,支持向量機(jī)算法采用最小二乘法[8],二次規(guī)劃的核函數(shù)采用徑向基核函數(shù),選擇控制錯(cuò)分樣本懲罰程度參數(shù)和徑向基核函數(shù)參數(shù)時(shí),采用網(wǎng)格搜索法,找到最佳組合.第二步,測(cè)試:隨機(jī)選取每種流型,其中,點(diǎn)滴流20個(gè),核心流25個(gè),層流30個(gè),環(huán)狀流35個(gè).先提取樣本特征,然后選擇各個(gè)參數(shù)構(gòu)造多類分類模型,最后將樣本輸入偏二叉樹支持向量機(jī)多類模型進(jìn)行分類.第三步,比較:重復(fù)以上訓(xùn)練步和測(cè)試步,在以往構(gòu)造的一對(duì)多類、一對(duì)一類支持向量機(jī)多類模型上進(jìn)行實(shí)驗(yàn)對(duì)比.表1顯示各種分類模型下的測(cè)試精度和訓(xùn)練時(shí)間.
表1 實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)分析
本文針對(duì)ERT系統(tǒng)中的油水兩相流流型識(shí)別,提出一種基于偏二叉樹支持向量機(jī)的流型識(shí)別方法.構(gòu)造偏二叉樹支持向量機(jī)多類分類模型需要的支持向量機(jī)數(shù)量較少,提高了訓(xùn)練速度,同時(shí)偏二叉樹策略避免了一對(duì)一和一對(duì)多策略的不可分區(qū)域.經(jīng)過(guò)實(shí)驗(yàn)結(jié)果對(duì)比,在同樣使用小波包分解進(jìn)行特征提取的前提下,偏二叉樹支持向量機(jī)多類分類模型的識(shí)別精度和訓(xùn)練時(shí)間要優(yōu)于一對(duì)一模型和一對(duì)多模型.
[1]DICKIN F..J.,WANG M.Electrical Resistance Tomography for Process Application.Measurement Science and Technology[J].1996,7 (3):247-260.
[2]ELPERIN T,KLOCHKO M.Flow Regime Identification in a Two -Phase Flow Using Wavelet Transform[J].Springer-Verlag,2002,32: 674-682.
[3]WU M M,DONG F,QI G H.Feature Extraction Method for Gas/ Liquid Two-Phase Flow Based on Wavelets Transform[C].5th International Conference on Machine Learning and Cybernetics,2006:1422-1427.
[4]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000.
[5]VAPNIK V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[6]Guo-h(huán)ua Qi,F(xiàn)eng Dong,Yan-bin Xu,et al.Gas/Liquid Two -Phase Flow Regime Identification In Horizontal Pipe Using Support Vector Machines[C]//.Proceedings of the Fourth International Conference on Machine Learing and Cybernetics,2005:1746-1751.
[7]謝娟英,張兵權(quán),汪萬(wàn)紫.基于雙支持向量機(jī)的偏二叉樹多類分類算法[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)),2011,47(4):354-363.
[8]Zhenrui Peng,Gensuo Mi.Voidage Measurement of Two-Phase Flow Based on Least Squares Support Vector Machine[C]//.Proceeding of the 6th World Congress on Intelligent Control and Automation,2006: 4900-4903.
(責(zé)任編輯:王前)
Study on Flow Regime Identification of Electrical Resistance Tomography System Based on Binary Tree Support Vector Machine
Two-phase fluid,which has complex flow characteristic and randomness,has been applied widely in the industrial production.The accurate identification of flow regime is the foundation of accurate measurement on two-phase flow's parameter.Firstly,the feature of differential pressure fluctuation signal,which is measured by electrical resistance tomography system,is extracted by wavelet packet analysis.Then,the multiclass model of binary SVM is constructed.Finally,the data about extracted feature is inputted into the multi-class SVM of binary.The experimental results show that the accuracy of twophase flow regime identification has been improved remarkably.Binary SVM is an effective method for regime identification.
electrical resistance tomography,flow regime identification,wavelet packet,Binary Tree Support vector machine
ZHANG Hua,QU Hai-xu
(The City College of Jilin Architectural And Civil Engineering Institute,Changchun,Jilin 130011,China)
TP391.4
A
1008-7974(2016)06-0063-03
10.13877/j.cnki.cn22-1284.2016.12.020
2016-10-09
張華,女,吉林龍井人,講師.
通化師范學(xué)院學(xué)報(bào)2016年12期