荊園園,田 源
?
基于支持向量機(jī)核函數(shù)算法的圖像分割研究
荊園園,田 源
(河南牧業(yè)經(jīng)濟(jì)學(xué)院計(jì)算機(jī)應(yīng)用系,河南 鄭州 450044)
為了提高圖像分割的質(zhì)量,采用支持向量機(jī)核函數(shù)算法。首先尋找像素分類間隔最大的最優(yōu)分類面,將非線性輸入空間的樣本映射到高維特征空間進(jìn)行求解;然后局部核函數(shù)選擇高斯徑向基核函數(shù),全局核函數(shù)選擇多項(xiàng)式核函數(shù),為了滿足訓(xùn)練集中支持向量取值帶來的連續(xù)性要求,通過組合系數(shù)平衡高斯核函數(shù)和多項(xiàng)式核函數(shù)的權(quán)重;接著選擇像素的鄰域灰度均值作為用于分割的特征,利用不規(guī)則度統(tǒng)計(jì)圖像鄰域灰度均值連通區(qū)域的離散程度;最后給出了算法流程。實(shí)驗(yàn)仿真顯示本文算法分割圖像清晰,目標(biāo)區(qū)域十分突出,定性分析中指標(biāo)歸一化互相關(guān)系數(shù)為0.9946,分割時(shí)間為0.7512,誤割率為0.0237。
向量機(jī);核函數(shù);圖像分割
圖像分割是計(jì)算機(jī)視覺以及數(shù)字圖像處理領(lǐng)域的研究熱點(diǎn)和難點(diǎn)之一,是模式識(shí)別、圖像理解等領(lǐng)域中最重要的基礎(chǔ)環(huán)節(jié)[1-2],其目的在于將圖像劃分成各具特性的區(qū)域并提取出感興趣的區(qū)域[3]。
傳統(tǒng)的圖像分割算法一般基于區(qū)域的信息或者基于邊界的信息[4],但是由于這些圖像分割算法只能利用圖像信息中的部分特征分割區(qū)域,易出現(xiàn)維數(shù)災(zāi)難、易陷入極小點(diǎn)、函數(shù)逼近能力不強(qiáng)等問題;基于亮度閾值分割(brightness threshold,BT)算法只能在不同對象具有不同亮度的情況下才能得到正確的分割結(jié)果[5];梯度算法(gradient algorithm,GA)只能在對象相當(dāng)光滑(在對象內(nèi)部的像素的梯度很?。┑那闆r下,才能獲得好的分割結(jié)果[6];自適應(yīng)區(qū)域增長的圖像分割算法(adaptive region growth,ARG),把待分割區(qū)域像素值看作一個(gè)正態(tài)分布,先用原始區(qū)域生長算法估算出分布參數(shù),再將該參數(shù)應(yīng)用到第二遍生長過程中實(shí)現(xiàn)分割[7],但是存在對初始種子點(diǎn)的選取順序和位置敏感的問題;基于模糊均值聚類法的圖像分割(fuzzy means cluster,F(xiàn)MC),像素灰度等性質(zhì)映射到根據(jù)一定的規(guī)則分為幾個(gè)區(qū)域的特征空間,然后根據(jù)像素的性質(zhì)判定其所屬的區(qū)域算法具有較好的收斂性,結(jié)果受初值的設(shè)置影響不大[8],但是魯棒性較差,對圖像的分割效果不令人滿意;分水嶺算法(watershed algorithm,WA)將圖像預(yù)分割為很多小區(qū)域,然后將每個(gè)小區(qū)域作為一個(gè)節(jié)點(diǎn),再利用Graph Cuts方法得到最后分割[9],雖然該算法將圖像預(yù)分割后構(gòu)造出來的圖節(jié)點(diǎn)數(shù)明顯減少,但是,以一定的時(shí)間開銷為代價(jià),預(yù)分割后的區(qū)域大小和數(shù)目都是不定的。
本文在支持向量機(jī)(support vector machine,SVM)的基礎(chǔ)上采用核函數(shù)算法對圖像分割研究,支持向量機(jī)是由統(tǒng)計(jì)學(xué)習(xí)理論發(fā)展的一種智能算法[10],但是自身核函數(shù)的選擇是研究和應(yīng)用支持向量機(jī)的關(guān)鍵問題,通過高斯徑向基核函數(shù)和多項(xiàng)式核函數(shù)組合為新的核函數(shù)來對圖像分割,實(shí)現(xiàn)了將樣本信息從低維空間映射到高維空間,這樣就可以有效處理維數(shù)災(zāi)難問題。
通過尋找像素分類間隔最大的分類面稱為像素最優(yōu)分類超平面,最大間隔超平面只與離超平面較近的像素點(diǎn)有關(guān),與其它像素點(diǎn)無關(guān)。最優(yōu)超平面把圖像數(shù)據(jù)集合中的全部點(diǎn)分開,要求像素點(diǎn)與超平面距離最遠(yuǎn)[11]。輸入數(shù)據(jù)集為={1,2,…,x+},前個(gè)已標(biāo)記樣本:(x,y),x?R,y?(-1,1),緊接著是個(gè)未標(biāo)記樣本,其中<<,+=,線性函數(shù)為:
=w()+(1)
式中:w為法向量的轉(zhuǎn)置;為超平面偏移向量。
圖1為支持向量機(jī)超平面劃分不同的像素。
圖像數(shù)據(jù)集合間隔最大分類超平面約束優(yōu)化為:
即:y=wx+-1≥0。
拉格朗日函數(shù)對求解:
式中:為拉格朗日乘子。
由Karush-Kuhn-Tucher(KKT)最優(yōu)條件可得[12]:
式中:S=[1,1,…,1],K=j(luò)T(xk)j(xl)=k(xk, xl)是滿足Mercer條件的核函數(shù)。
使用核函數(shù)是為了將低維不可分問題轉(zhuǎn)化為高維可分問題,同時(shí)避免了因?yàn)榫S數(shù)災(zāi)難而造成的計(jì)算上的問題。
回歸函數(shù)為:
式中:a*是a對偶函數(shù)。
將最優(yōu)分類面的求解問題轉(zhuǎn)化為求解二次規(guī)劃的對偶問題:
約束條件為:
過松弛因子對不能完全分開的線性分類問題求解:
約束條件:
y((x)+)≥1-≥0,=1,2,…,
式中:為懲罰因子,用于調(diào)整算法的復(fù)雜度,能在分類間隔最大與誤差最小之間尋求最佳折衷,它的選取決定了最優(yōu)分類超平面的位置[13]。
將非線性輸入空間的樣本映射到高維特征空間進(jìn)行求解[14]:
則向量機(jī)的決策函數(shù)為:
核函數(shù)中的參數(shù)的選擇決定了從數(shù)據(jù)空間到高維特征空間之間的非線性映射,如果選擇不合適會(huì)導(dǎo)致極差的分類性能[15]。當(dāng)需要詳細(xì)區(qū)分離較遠(yuǎn)的像素樣本點(diǎn)時(shí),采用全局核函數(shù);相反的,需分析距離較近的點(diǎn)時(shí),采用局部核函數(shù)。局部核函數(shù)的學(xué)習(xí)能力要高于全局核函數(shù),但是局部核函數(shù)泛化能力不如全局核。
1.2.1 高斯徑向基核函數(shù)
局部核函數(shù)采用高斯徑向基核函數(shù):
高斯徑向基核參數(shù)s越大,顯著影響核函數(shù)的樣本范圍越大,學(xué)習(xí)能力越強(qiáng)[16]。圖2給出了高斯徑向基核函數(shù)。
從圖2中可以看出它擴(kuò)大了相近像素點(diǎn)的差異,降低了距離較遠(yuǎn)的樣本點(diǎn)之間的影響。
1.2.2 多項(xiàng)式核函數(shù)
全局核函數(shù)采用多項(xiàng)式核函數(shù):(x,0.2)=[(0.2x)+1],對于多項(xiàng)式核參數(shù)越大,算法的復(fù)雜性越高,學(xué)習(xí)能力越強(qiáng)[17]。圖3給出了變維數(shù)為1,函數(shù)值的變化,從多項(xiàng)式核函數(shù)的圖形結(jié)構(gòu)看出,擴(kuò)大了樣本的差異性,函數(shù)值趨于0的速度較慢,全局(絕大部分的點(diǎn))對于核函數(shù)都有影響。
1.2.3 組合過程
由于全局核函數(shù)使決策函數(shù)有良好的泛化能力,局部核函數(shù)的作用是改善支持向量附近點(diǎn)的決策函數(shù)值,為了滿足訓(xùn)練集中支持向量取值帶來的連續(xù)性要求,通過組合系數(shù)平衡高斯核函數(shù)和多項(xiàng)式核函數(shù)的權(quán)重:
(x, x)=global(x, x)+(1-)global(x, x) (11)
式中:組合系數(shù)=1+1/x。
這樣全局核函數(shù)的影響來自所有的支持向量,局部核函數(shù)的影響只為支持向量本身,同時(shí)采取分步訓(xùn)練的方法[18],對1-賦值為小于1;通過-折交叉驗(yàn)證,訓(xùn)練集平均分為個(gè)兩兩互不相交的子集,進(jìn)行步迭代訓(xùn)練和測試,每次把一個(gè)子集作為測試集,其余的樣本作為訓(xùn)練集,在得出決策函數(shù)后計(jì)算其判斷錯(cuò)誤點(diǎn)的個(gè)數(shù),最后匯總算出所有的錯(cuò)誤點(diǎn)個(gè)數(shù)與總訓(xùn)練集個(gè)數(shù)之比,只有當(dāng)?shù)陀?0才進(jìn)行訓(xùn)練;否則修正1-的值,再重新訓(xùn)練樣本。
圖3 多項(xiàng)式全局核函數(shù)
()為支持向量機(jī)的輸出:
輸出集合為{-1,1},代表圖像分割中非邊緣像素和邊緣像素。如果人工標(biāo)記像素為個(gè),則{1,2,…,y}為人工標(biāo)記的像素類別,像素取值為1,被標(biāo)記為非邊緣的像素取值為-1。
={1,2,…,x}為像素在特征集中的取值,在圖像分割中選擇像素的鄰域灰度均值作為用于分割的特征[19]。利用不規(guī)則度IRGL統(tǒng)計(jì)圖像鄰域灰度均值連通區(qū)域的離散程度,不規(guī)則度的定義:
不規(guī)則度反映了連通區(qū)域的形狀,通過對每個(gè)連通區(qū)域中像素點(diǎn)偏離質(zhì)心的程度計(jì)算得到,分割誤差要求為:
算法流程:
①輸入圖像,提取圖像像素灰度值特征,構(gòu)建訓(xùn)練樣本集;
②特征歸一化,使特征向量歸一化至[-1,1]區(qū)間;
③SVM訓(xùn)練集隨機(jī)均分子集,每個(gè)像素點(diǎn)的特征帶入到分類器中預(yù)測每個(gè)像素的類別,獲得最優(yōu)分類面;
④選擇核函數(shù)進(jìn)行像素區(qū)域的分割,滿足分割誤差要求轉(zhuǎn)至步驟⑤,否則進(jìn)行步驟③;
⑤輸出圖像。
為了對比分析本文算法與其它算法的分割效果,仿真實(shí)驗(yàn)參數(shù)為:內(nèi)存DDR3,主頻1600MHz,容量4GB,732位操作系統(tǒng)WIN,CPU為3.5GHz的硬件環(huán)境,通過調(diào)用編程工具M(jìn)ATLAB2012實(shí)現(xiàn)算法。
采用2幅不同的圖片,把圖像像素的灰度特征作為分割的特征,輸入到支持向量機(jī)進(jìn)行學(xué)習(xí),分類模型的最優(yōu)參數(shù)=150,=4.15,=0.5456,=1.85,=6,采用最優(yōu)參數(shù)建立最優(yōu)圖像分割模型,對待分割圖像進(jìn)行分割,其分割效果如圖4和圖5所示。
圖4(a)和圖5(a)為待分割圖像,圖4(b)和圖5(b)為BT分割效果,圖4(c)和圖5(c)為GA分割效果,圖4(d)和圖5(d)為ARG分割效果,圖4(e)和圖5(e)為FMC分割效果,圖4(f)和圖5(f)為訓(xùn)練后支持向量分布效果圖,圖4(g)和圖5(g)為SVM分割效果。從分割效果中可以看出,本文算法的分割圖像清晰,目標(biāo)區(qū)域十分突出,其它算法的結(jié)果分割結(jié)果差,目標(biāo)區(qū)域不能很好地突出,出現(xiàn)欠、過分割現(xiàn)象。這是因?yàn)橹С窒蛄繖C(jī)組合核函數(shù)算法滿足訓(xùn)練集中支持向量圖像像素取值帶來的連續(xù)性要求。
用歸一化互相關(guān)系數(shù)(NC)來評(píng)價(jià)本文算法分割圖像:
圖5 圖像2不同算法分割效果
式中:×為圖像大??;(,)、¢(,)表示源圖像與分割后圖像在位置(,)處的灰度值。NC值越接近于1越好。
對于圖像進(jìn)行分割來說,分割速度十分重要,為了衡量各算法的分割效率,對每幅圖像進(jìn)行多次重復(fù)分割,取它們平均分割時(shí)間作為評(píng)價(jià)標(biāo)準(zhǔn)。圖像1和圖像2定性分析結(jié)果如表1和表2所示。
從表1和表2的分析可以看到,本文算法NC值較接近于1,分割時(shí)間的消耗較少,誤割率較低。這是因?yàn)樵诜指钸^程中利用不規(guī)則度統(tǒng)計(jì)圖像鄰域灰度均值連通區(qū)域的離散程度,每個(gè)像素點(diǎn)的特征帶入到分類器中預(yù)測每個(gè)像素的類別,獲得最優(yōu)分類面。
表1 圖像1定性分析
表2 圖像2定性分析
尋找像素分類間隔最大的最優(yōu)分類面,將非線性輸入空間的樣本映射到高維特征空間進(jìn)行求解;局部核函數(shù)選擇高斯徑向基核函數(shù),全局核函數(shù)選擇多項(xiàng)式核函數(shù),為了滿足訓(xùn)練集中支持向量取值帶來的連續(xù)性要求,通過組合系數(shù)平衡高斯核函數(shù)和多項(xiàng)式核函數(shù)的權(quán)重;接著選擇像素的鄰域灰度均值作為用于分割的特征,利用不規(guī)則度統(tǒng)計(jì)圖像鄰域灰度均值連通區(qū)域的離散程度;實(shí)驗(yàn)仿真顯示本文算法分割圖像清晰,目標(biāo)區(qū)域十分突出,定性分析中指標(biāo)歸一化互相關(guān)系數(shù)為0.9946,分割時(shí)間為0.7512,誤割率為0.0237,進(jìn)一步的研究將集中在核函數(shù)優(yōu)化方面。
[1] 徐曄燁, 王敬東, 朱晨雨, 等. 基于Otsu算法和分形維數(shù)相結(jié)合的紅外云圖分割[J]. 紅外技術(shù), 2014, 36(6): 496-502.
Xu Ye ye, Wang Jing dong, Zhu Chen yu, et al. Segmentation of infrared cloud image based on otsu algorithm and fractal dimension [J].,2014, 36(6): 496-502.
[2] 李曉冰. 基于自適應(yīng)模糊加權(quán)指數(shù)的FCM聚類測量圖像分割方法[J].紅外技術(shù), 2013, 35(3): 146-149.
Li Xiao bing. FCM segmentation method of measurement of image based on adaptive coefficient of fuzzy weight[J]., 2013, 35(3): 146-149.
[3] 楊名宇, 李剛. 利用區(qū)域信息的航拍圖像分割[J]. 中國光學(xué), 2014, 7(5): 779-785.
Yang Ming yu, Li Gang. Aerial image segmentation with region information[J]., 2014, 7(5): 779-785.
[4] 楊名宇. 基于改進(jìn)Chan-Vese模型的圖像分割[J]. 液晶與顯示, 2014, 29(3): 473-478.
Yang Ming Yu. An infrared image segmentation approach based on improved Chan-Vese model[J]., 2014, 29(3): 473-478.
[5] Wu Hui, Shangguan Xu-ming. Regional logistics information resources integration patterns and countermeasures[J]., 2012, 25(2): 1610-1615
[6] Kwon Hyuk Ju, Lee Sung Hak, Lee Geun Young. Luminance adaptation transform based on brightness functions for LDR image reproduction[J]., 2014, 30(7): 74-85.
[7] 王琳, 胡翠英, 龐其昌, 等. 基于自適應(yīng)圖像分割的中藥光譜圖像檢測[J]. 激光與光電子學(xué)進(jìn)展, 2013, 50(12): 66-72.
Wang Lin, Hu Cui ying, Pang Qi chang, et al. TCM spectral imaging detection based on self-adaptive region segmentation method[J]., 2013, 50(12): 66-72.
[8] 郭艾俠, 肖德琴. 基于探索性分析的荔枝串與結(jié)果母枝圖像識(shí)別[J]. 實(shí)驗(yàn)室研究與探索, 2014, 33(2): 4-9, 30.
Guo Ai Xia, Xiao De Qin. Image recognition of litchi cluster and their main fruit bearing based on exploratory analysis[J]., 2014, 33(2): 4-9, 30.
[9] 伊力哈木·亞爾買買提. 基于改進(jìn)的自適應(yīng)分水嶺圖像分割方法研究[J]. 計(jì)算機(jī)仿真, 2013, 30(2): 373-377.
Yi li ha mu·Ya er mai mai ti. Based on the improved adaptive watershed image segmentation method research[J]., 2013, 30(2): 373-377.
[10] Xing Yan, Nurul A. Chowdhury Mid-term electricity market clearing price forecasting: A multiple SVM approach[J]., 2014, 58(6): 206-214.
[11] 杜娟, 孫君頂. 基于特征加權(quán)和支持向量機(jī)的圖像分類研究[J]. 激光與紅外, 2013, 43(3): 315-308.
Du Juan, Sun Jun Ding. Image classification based on feature weighting and support vector machine[J]., 2013, 43(3): 315-308.
[12] 劉繼業(yè), 陳西宏, 劉強(qiáng), 等. 基于改進(jìn)粒子群優(yōu)化LS-SVM的衛(wèi)星鐘差預(yù)報(bào)研究[J]. 宇航學(xué)報(bào), 2013, 34(11): 1509-1515.
Liu Ji Ye, Chen Xi Hong, Liu Qiang, et al. LS-SVM based on improved PSO for prediction of satellite clock error[J]., 2013, 34(11): 1509-1515.
[13] 胡慶輝, 丁立新, 何進(jìn)榮. 范數(shù)約束的多核半監(jiān)督支持向量機(jī)學(xué)習(xí)方法[J]. 軟件學(xué)報(bào), 2013, 24(11): 2522-2534.
Hu Qing Hui, Ding Li Xin, He Jin Rong. Lp norm constraint multi-Kernel learning method for semi-supervised support vector machine[J]., 2013, 24(11): 2522-2534.
[14] 張德發(fā), 何亮. 基于粗糙集和支持向量機(jī)的圖像分割技術(shù)研究[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2013, 30(6): 111-113.
Zhang De fa, He Liang. Research on image segmentation technology based on rough set and support vector machine[J]., 2013, 30(6): 111-113.
[15] 楊雯斌. 支持向量機(jī)在大規(guī)模數(shù)據(jù)中的應(yīng)用研究[D]. 上海: 華東理工大學(xué), 2013: 15-30.
Yang Wei Bin. Research and Application of the Support Vector Machine on Large-scale Datas[D]. Shanghai: East China University of Science and Technology, 2013: 15-30.
[16] 吳鵬, 宋文龍. 一種基于支持向量機(jī)的植物根系圖像邊緣檢測算法[J]. 浙江農(nóng)業(yè)學(xué)報(bào), 2012, 24(4): 721-726.
Wu Peng, Song Wen Long. An image edge detection algorithm of plant roots based on support vector machine[J]., 2012, 24(4): 721-726.
[17] 樓俊鋼, 蔣云良, 申情, 等. 軟件可靠性預(yù)測中不同核函數(shù)的預(yù)測能力評(píng)估[J]. 計(jì)算機(jī)學(xué)報(bào), 2013, 36(6): 1303-1311.
Lou Jun Gang, Jiang Yun Liang, Shen Qing, et al. Valuating the prediction performance of different Kernal functions in Kernel based software reliability models[J]., 2013, 36(6): 1303-1311.
[18] Victor Wilcox Jr, Ted Trus, Nilson Salas, et al. A proficiency-based skills training curriculum for the SAGES surgical training for endoscopic proficiency (STEP) program[J]., 2014, 71(3): 282-288.
[19] 朱艷麗, 張寶劍, 黃勇. 一種紋理分析方法在皮革圖像分類中的應(yīng)用[J]. 安徽農(nóng)業(yè)科學(xué), 2010, 38(12): 6515-6516.
Zhu Yan li, Zhang Bao jian, Huang Yong. Application of texture analysis method in leather classification[J]., 2010, 38(12): 6515-6516.
Image Segmentation Research Based on Kernel Function of Support Vector Machine Algorithm
JING Yuan-yuan,TIAN Yuan
(,,450044,)
To improve the quality of image segmentation, this paper proposed a kernel function of support vector machine algorithm. Firstly, pixel classification intervals were searched through optimal classification, and sample nonlinear space was mapped into high dimensional one; Secondly, Gauss radial basis kernel function was selected as local kernel function, polynomial kernel function was selected as global kernel function , then,combination coefficient was used to balance weight of Gauss kernel function and polynomial kernel function in order to satisfy continuity requirements for training support vector value. Thirdly, neighborhood gray mean pixel was used as features of segmentation, irregularity was used to collect statistics of discrete degree of image gray mean connected region. Finally, the algorithm flow was given. Simulation shows that this algorithm for image segmentation is clear, the target area is very outstanding, the qualitative analysis index normalized cross correlation coefficient is 0.9946, time is 0.7512, and false rate is 0.0237.
vector machine,kernel function,image segmentation
TP393
A
1001-8891(2015)03-0234-06
2014-11-07;
2014-11-20.
荊園園(1981-),女,漢族,河南鄭州人,碩士,講師,研究方向:軟件工程。
河南省社科聯(lián)項(xiàng)目,編號(hào):SKL-2013-506;鄭州市社科聯(lián)項(xiàng)目,編號(hào):JX20130297。