荊園園,田 源
?
基于支持向量機核函數(shù)算法的圖像分割研究
荊園園,田 源
(河南牧業(yè)經(jīng)濟學院計算機應用系,河南 鄭州 450044)
為了提高圖像分割的質量,采用支持向量機核函數(shù)算法。首先尋找像素分類間隔最大的最優(yōu)分類面,將非線性輸入空間的樣本映射到高維特征空間進行求解;然后局部核函數(shù)選擇高斯徑向基核函數(shù),全局核函數(shù)選擇多項式核函數(shù),為了滿足訓練集中支持向量取值帶來的連續(xù)性要求,通過組合系數(shù)平衡高斯核函數(shù)和多項式核函數(shù)的權重;接著選擇像素的鄰域灰度均值作為用于分割的特征,利用不規(guī)則度統(tǒng)計圖像鄰域灰度均值連通區(qū)域的離散程度;最后給出了算法流程。實驗仿真顯示本文算法分割圖像清晰,目標區(qū)域十分突出,定性分析中指標歸一化互相關系數(shù)為0.9946,分割時間為0.7512,誤割率為0.0237。
向量機;核函數(shù);圖像分割
圖像分割是計算機視覺以及數(shù)字圖像處理領域的研究熱點和難點之一,是模式識別、圖像理解等領域中最重要的基礎環(huán)節(jié)[1-2],其目的在于將圖像劃分成各具特性的區(qū)域并提取出感興趣的區(qū)域[3]。
傳統(tǒng)的圖像分割算法一般基于區(qū)域的信息或者基于邊界的信息[4],但是由于這些圖像分割算法只能利用圖像信息中的部分特征分割區(qū)域,易出現(xiàn)維數(shù)災難、易陷入極小點、函數(shù)逼近能力不強等問題;基于亮度閾值分割(brightness threshold,BT)算法只能在不同對象具有不同亮度的情況下才能得到正確的分割結果[5];梯度算法(gradient algorithm,GA)只能在對象相當光滑(在對象內(nèi)部的像素的梯度很?。┑那闆r下,才能獲得好的分割結果[6];自適應區(qū)域增長的圖像分割算法(adaptive region growth,ARG),把待分割區(qū)域像素值看作一個正態(tài)分布,先用原始區(qū)域生長算法估算出分布參數(shù),再將該參數(shù)應用到第二遍生長過程中實現(xiàn)分割[7],但是存在對初始種子點的選取順序和位置敏感的問題;基于模糊均值聚類法的圖像分割(fuzzy means cluster,F(xiàn)MC),像素灰度等性質映射到根據(jù)一定的規(guī)則分為幾個區(qū)域的特征空間,然后根據(jù)像素的性質判定其所屬的區(qū)域算法具有較好的收斂性,結果受初值的設置影響不大[8],但是魯棒性較差,對圖像的分割效果不令人滿意;分水嶺算法(watershed algorithm,WA)將圖像預分割為很多小區(qū)域,然后將每個小區(qū)域作為一個節(jié)點,再利用Graph Cuts方法得到最后分割[9],雖然該算法將圖像預分割后構造出來的圖節(jié)點數(shù)明顯減少,但是,以一定的時間開銷為代價,預分割后的區(qū)域大小和數(shù)目都是不定的。
本文在支持向量機(support vector machine,SVM)的基礎上采用核函數(shù)算法對圖像分割研究,支持向量機是由統(tǒng)計學習理論發(fā)展的一種智能算法[10],但是自身核函數(shù)的選擇是研究和應用支持向量機的關鍵問題,通過高斯徑向基核函數(shù)和多項式核函數(shù)組合為新的核函數(shù)來對圖像分割,實現(xiàn)了將樣本信息從低維空間映射到高維空間,這樣就可以有效處理維數(shù)災難問題。
通過尋找像素分類間隔最大的分類面稱為像素最優(yōu)分類超平面,最大間隔超平面只與離超平面較近的像素點有關,與其它像素點無關。最優(yōu)超平面把圖像數(shù)據(jù)集合中的全部點分開,要求像素點與超平面距離最遠[11]。輸入數(shù)據(jù)集為={1,2,…,x+},前個已標記樣本:(x,y),x?R,y?(-1,1),緊接著是個未標記樣本,其中<<,+=,線性函數(shù)為:
=w()+(1)
式中:w為法向量的轉置;為超平面偏移向量。
圖1為支持向量機超平面劃分不同的像素。
圖像數(shù)據(jù)集合間隔最大分類超平面約束優(yōu)化為:
即:y=wx+-1≥0。
拉格朗日函數(shù)對求解:
式中:為拉格朗日乘子。
由Karush-Kuhn-Tucher(KKT)最優(yōu)條件可得[12]:
式中:S=[1,1,…,1],K=jT(xk)j(xl)=k(xk, xl)是滿足Mercer條件的核函數(shù)。
使用核函數(shù)是為了將低維不可分問題轉化為高維可分問題,同時避免了因為維數(shù)災難而造成的計算上的問題。
回歸函數(shù)為:
式中:a*是a對偶函數(shù)。
將最優(yōu)分類面的求解問題轉化為求解二次規(guī)劃的對偶問題:
約束條件為:
過松弛因子對不能完全分開的線性分類問題求解:
約束條件:
y((x)+)≥1-≥0,=1,2,…,
式中:為懲罰因子,用于調整算法的復雜度,能在分類間隔最大與誤差最小之間尋求最佳折衷,它的選取決定了最優(yōu)分類超平面的位置[13]。
將非線性輸入空間的樣本映射到高維特征空間進行求解[14]:
則向量機的決策函數(shù)為:
核函數(shù)中的參數(shù)的選擇決定了從數(shù)據(jù)空間到高維特征空間之間的非線性映射,如果選擇不合適會導致極差的分類性能[15]。當需要詳細區(qū)分離較遠的像素樣本點時,采用全局核函數(shù);相反的,需分析距離較近的點時,采用局部核函數(shù)。局部核函數(shù)的學習能力要高于全局核函數(shù),但是局部核函數(shù)泛化能力不如全局核。
1.2.1 高斯徑向基核函數(shù)
局部核函數(shù)采用高斯徑向基核函數(shù):
高斯徑向基核參數(shù)s越大,顯著影響核函數(shù)的樣本范圍越大,學習能力越強[16]。圖2給出了高斯徑向基核函數(shù)。
從圖2中可以看出它擴大了相近像素點的差異,降低了距離較遠的樣本點之間的影響。
1.2.2 多項式核函數(shù)
全局核函數(shù)采用多項式核函數(shù):(x,0.2)=[(0.2x)+1],對于多項式核參數(shù)越大,算法的復雜性越高,學習能力越強[17]。圖3給出了變維數(shù)為1,函數(shù)值的變化,從多項式核函數(shù)的圖形結構看出,擴大了樣本的差異性,函數(shù)值趨于0的速度較慢,全局(絕大部分的點)對于核函數(shù)都有影響。
1.2.3 組合過程
由于全局核函數(shù)使決策函數(shù)有良好的泛化能力,局部核函數(shù)的作用是改善支持向量附近點的決策函數(shù)值,為了滿足訓練集中支持向量取值帶來的連續(xù)性要求,通過組合系數(shù)平衡高斯核函數(shù)和多項式核函數(shù)的權重:
(x, x)=global(x, x)+(1-)global(x, x) (11)
式中:組合系數(shù)=1+1/x。
這樣全局核函數(shù)的影響來自所有的支持向量,局部核函數(shù)的影響只為支持向量本身,同時采取分步訓練的方法[18],對1-賦值為小于1;通過-折交叉驗證,訓練集平均分為個兩兩互不相交的子集,進行步迭代訓練和測試,每次把一個子集作為測試集,其余的樣本作為訓練集,在得出決策函數(shù)后計算其判斷錯誤點的個數(shù),最后匯總算出所有的錯誤點個數(shù)與總訓練集個數(shù)之比,只有當?shù)陀?0才進行訓練;否則修正1-的值,再重新訓練樣本。
圖3 多項式全局核函數(shù)
()為支持向量機的輸出:
輸出集合為{-1,1},代表圖像分割中非邊緣像素和邊緣像素。如果人工標記像素為個,則{1,2,…,y}為人工標記的像素類別,像素取值為1,被標記為非邊緣的像素取值為-1。
={1,2,…,x}為像素在特征集中的取值,在圖像分割中選擇像素的鄰域灰度均值作為用于分割的特征[19]。利用不規(guī)則度IRGL統(tǒng)計圖像鄰域灰度均值連通區(qū)域的離散程度,不規(guī)則度的定義:
不規(guī)則度反映了連通區(qū)域的形狀,通過對每個連通區(qū)域中像素點偏離質心的程度計算得到,分割誤差要求為:
算法流程:
①輸入圖像,提取圖像像素灰度值特征,構建訓練樣本集;
②特征歸一化,使特征向量歸一化至[-1,1]區(qū)間;
③SVM訓練集隨機均分子集,每個像素點的特征帶入到分類器中預測每個像素的類別,獲得最優(yōu)分類面;
④選擇核函數(shù)進行像素區(qū)域的分割,滿足分割誤差要求轉至步驟⑤,否則進行步驟③;
⑤輸出圖像。
為了對比分析本文算法與其它算法的分割效果,仿真實驗參數(shù)為:內(nèi)存DDR3,主頻1600MHz,容量4GB,732位操作系統(tǒng)WIN,CPU為3.5GHz的硬件環(huán)境,通過調用編程工具MATLAB2012實現(xiàn)算法。
采用2幅不同的圖片,把圖像像素的灰度特征作為分割的特征,輸入到支持向量機進行學習,分類模型的最優(yōu)參數(shù)=150,=4.15,=0.5456,=1.85,=6,采用最優(yōu)參數(shù)建立最優(yōu)圖像分割模型,對待分割圖像進行分割,其分割效果如圖4和圖5所示。
圖4(a)和圖5(a)為待分割圖像,圖4(b)和圖5(b)為BT分割效果,圖4(c)和圖5(c)為GA分割效果,圖4(d)和圖5(d)為ARG分割效果,圖4(e)和圖5(e)為FMC分割效果,圖4(f)和圖5(f)為訓練后支持向量分布效果圖,圖4(g)和圖5(g)為SVM分割效果。從分割效果中可以看出,本文算法的分割圖像清晰,目標區(qū)域十分突出,其它算法的結果分割結果差,目標區(qū)域不能很好地突出,出現(xiàn)欠、過分割現(xiàn)象。這是因為支持向量機組合核函數(shù)算法滿足訓練集中支持向量圖像像素取值帶來的連續(xù)性要求。
用歸一化互相關系數(shù)(NC)來評價本文算法分割圖像:
圖5 圖像2不同算法分割效果
式中:×為圖像大??;(,)、¢(,)表示源圖像與分割后圖像在位置(,)處的灰度值。NC值越接近于1越好。
對于圖像進行分割來說,分割速度十分重要,為了衡量各算法的分割效率,對每幅圖像進行多次重復分割,取它們平均分割時間作為評價標準。圖像1和圖像2定性分析結果如表1和表2所示。
從表1和表2的分析可以看到,本文算法NC值較接近于1,分割時間的消耗較少,誤割率較低。這是因為在分割過程中利用不規(guī)則度統(tǒng)計圖像鄰域灰度均值連通區(qū)域的離散程度,每個像素點的特征帶入到分類器中預測每個像素的類別,獲得最優(yōu)分類面。
表1 圖像1定性分析
表2 圖像2定性分析
尋找像素分類間隔最大的最優(yōu)分類面,將非線性輸入空間的樣本映射到高維特征空間進行求解;局部核函數(shù)選擇高斯徑向基核函數(shù),全局核函數(shù)選擇多項式核函數(shù),為了滿足訓練集中支持向量取值帶來的連續(xù)性要求,通過組合系數(shù)平衡高斯核函數(shù)和多項式核函數(shù)的權重;接著選擇像素的鄰域灰度均值作為用于分割的特征,利用不規(guī)則度統(tǒng)計圖像鄰域灰度均值連通區(qū)域的離散程度;實驗仿真顯示本文算法分割圖像清晰,目標區(qū)域十分突出,定性分析中指標歸一化互相關系數(shù)為0.9946,分割時間為0.7512,誤割率為0.0237,進一步的研究將集中在核函數(shù)優(yōu)化方面。
[1] 徐曄燁, 王敬東, 朱晨雨, 等. 基于Otsu算法和分形維數(shù)相結合的紅外云圖分割[J]. 紅外技術, 2014, 36(6): 496-502.
Xu Ye ye, Wang Jing dong, Zhu Chen yu, et al. Segmentation of infrared cloud image based on otsu algorithm and fractal dimension [J].,2014, 36(6): 496-502.
[2] 李曉冰. 基于自適應模糊加權指數(shù)的FCM聚類測量圖像分割方法[J].紅外技術, 2013, 35(3): 146-149.
Li Xiao bing. FCM segmentation method of measurement of image based on adaptive coefficient of fuzzy weight[J]., 2013, 35(3): 146-149.
[3] 楊名宇, 李剛. 利用區(qū)域信息的航拍圖像分割[J]. 中國光學, 2014, 7(5): 779-785.
Yang Ming yu, Li Gang. Aerial image segmentation with region information[J]., 2014, 7(5): 779-785.
[4] 楊名宇. 基于改進Chan-Vese模型的圖像分割[J]. 液晶與顯示, 2014, 29(3): 473-478.
Yang Ming Yu. An infrared image segmentation approach based on improved Chan-Vese model[J]., 2014, 29(3): 473-478.
[5] Wu Hui, Shangguan Xu-ming. Regional logistics information resources integration patterns and countermeasures[J]., 2012, 25(2): 1610-1615
[6] Kwon Hyuk Ju, Lee Sung Hak, Lee Geun Young. Luminance adaptation transform based on brightness functions for LDR image reproduction[J]., 2014, 30(7): 74-85.
[7] 王琳, 胡翠英, 龐其昌, 等. 基于自適應圖像分割的中藥光譜圖像檢測[J]. 激光與光電子學進展, 2013, 50(12): 66-72.
Wang Lin, Hu Cui ying, Pang Qi chang, et al. TCM spectral imaging detection based on self-adaptive region segmentation method[J]., 2013, 50(12): 66-72.
[8] 郭艾俠, 肖德琴. 基于探索性分析的荔枝串與結果母枝圖像識別[J]. 實驗室研究與探索, 2014, 33(2): 4-9, 30.
Guo Ai Xia, Xiao De Qin. Image recognition of litchi cluster and their main fruit bearing based on exploratory analysis[J]., 2014, 33(2): 4-9, 30.
[9] 伊力哈木·亞爾買買提. 基于改進的自適應分水嶺圖像分割方法研究[J]. 計算機仿真, 2013, 30(2): 373-377.
Yi li ha mu·Ya er mai mai ti. Based on the improved adaptive watershed image segmentation method research[J]., 2013, 30(2): 373-377.
[10] Xing Yan, Nurul A. Chowdhury Mid-term electricity market clearing price forecasting: A multiple SVM approach[J]., 2014, 58(6): 206-214.
[11] 杜娟, 孫君頂. 基于特征加權和支持向量機的圖像分類研究[J]. 激光與紅外, 2013, 43(3): 315-308.
Du Juan, Sun Jun Ding. Image classification based on feature weighting and support vector machine[J]., 2013, 43(3): 315-308.
[12] 劉繼業(yè), 陳西宏, 劉強, 等. 基于改進粒子群優(yōu)化LS-SVM的衛(wèi)星鐘差預報研究[J]. 宇航學報, 2013, 34(11): 1509-1515.
Liu Ji Ye, Chen Xi Hong, Liu Qiang, et al. LS-SVM based on improved PSO for prediction of satellite clock error[J]., 2013, 34(11): 1509-1515.
[13] 胡慶輝, 丁立新, 何進榮. 范數(shù)約束的多核半監(jiān)督支持向量機學習方法[J]. 軟件學報, 2013, 24(11): 2522-2534.
Hu Qing Hui, Ding Li Xin, He Jin Rong. Lp norm constraint multi-Kernel learning method for semi-supervised support vector machine[J]., 2013, 24(11): 2522-2534.
[14] 張德發(fā), 何亮. 基于粗糙集和支持向量機的圖像分割技術研究[J]. 計算機應用與軟件, 2013, 30(6): 111-113.
Zhang De fa, He Liang. Research on image segmentation technology based on rough set and support vector machine[J]., 2013, 30(6): 111-113.
[15] 楊雯斌. 支持向量機在大規(guī)模數(shù)據(jù)中的應用研究[D]. 上海: 華東理工大學, 2013: 15-30.
Yang Wei Bin. Research and Application of the Support Vector Machine on Large-scale Datas[D]. Shanghai: East China University of Science and Technology, 2013: 15-30.
[16] 吳鵬, 宋文龍. 一種基于支持向量機的植物根系圖像邊緣檢測算法[J]. 浙江農(nóng)業(yè)學報, 2012, 24(4): 721-726.
Wu Peng, Song Wen Long. An image edge detection algorithm of plant roots based on support vector machine[J]., 2012, 24(4): 721-726.
[17] 樓俊鋼, 蔣云良, 申情, 等. 軟件可靠性預測中不同核函數(shù)的預測能力評估[J]. 計算機學報, 2013, 36(6): 1303-1311.
Lou Jun Gang, Jiang Yun Liang, Shen Qing, et al. Valuating the prediction performance of different Kernal functions in Kernel based software reliability models[J]., 2013, 36(6): 1303-1311.
[18] Victor Wilcox Jr, Ted Trus, Nilson Salas, et al. A proficiency-based skills training curriculum for the SAGES surgical training for endoscopic proficiency (STEP) program[J]., 2014, 71(3): 282-288.
[19] 朱艷麗, 張寶劍, 黃勇. 一種紋理分析方法在皮革圖像分類中的應用[J]. 安徽農(nóng)業(yè)科學, 2010, 38(12): 6515-6516.
Zhu Yan li, Zhang Bao jian, Huang Yong. Application of texture analysis method in leather classification[J]., 2010, 38(12): 6515-6516.
Image Segmentation Research Based on Kernel Function of Support Vector Machine Algorithm
JING Yuan-yuan,TIAN Yuan
(,,450044,)
To improve the quality of image segmentation, this paper proposed a kernel function of support vector machine algorithm. Firstly, pixel classification intervals were searched through optimal classification, and sample nonlinear space was mapped into high dimensional one; Secondly, Gauss radial basis kernel function was selected as local kernel function, polynomial kernel function was selected as global kernel function , then,combination coefficient was used to balance weight of Gauss kernel function and polynomial kernel function in order to satisfy continuity requirements for training support vector value. Thirdly, neighborhood gray mean pixel was used as features of segmentation, irregularity was used to collect statistics of discrete degree of image gray mean connected region. Finally, the algorithm flow was given. Simulation shows that this algorithm for image segmentation is clear, the target area is very outstanding, the qualitative analysis index normalized cross correlation coefficient is 0.9946, time is 0.7512, and false rate is 0.0237.
vector machine,kernel function,image segmentation
TP393
A
1001-8891(2015)03-0234-06
2014-11-07;
2014-11-20.
荊園園(1981-),女,漢族,河南鄭州人,碩士,講師,研究方向:軟件工程。
河南省社科聯(lián)項目,編號:SKL-2013-506;鄭州市社科聯(lián)項目,編號:JX20130297。