葉夢婕
摘要:就輪廓線上某一點,距離其較近的點對識別分類比距離較遠的點的貢獻更大,因而,描述子應增強細節(jié)描述能力。該文采用一種稀疏策略,提出了基于輪廓線形狀的多尺度稀疏描述子(SSM)。該描述子不僅滿足平移、旋轉、尺度變換的不變性,而且雙邊對稱。同時,在一定程度上克服了時空復雜度這一經(jīng)典矛盾問題。將該文提出的算子應用于我們自己采集的葉形數(shù)據(jù)庫中。并與相關的描述子進行對比,實驗結果表明,SSM的性能更優(yōu)。
關鍵詞:輪廓線形狀;多尺度稀疏描述子
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)29-6942-03
1 概述
計算機視覺與模式識別的重點是形狀描述。形狀描述方法主要分為兩種,一種是基于區(qū)域的描述方法,另一種是基于輪廓線形狀的描述方法[1]?;趨^(qū)域的方法需要獲取形狀區(qū)域中所有的像素點,計算復雜度高且存儲量大?;谳喞姆椒ㄍǔH需獲取輪廓線形狀的像素點[2],易于提取、易于保存[4];輪廓線形狀的辨識度最高[5]、往往僅通過輪廓線形狀就能對目標進行識別。
多尺度描述子是輪廓線形狀描述方法中是最具潛力的方法[6]。隨著對形狀特征地逐級提取,多尺度描述子實現(xiàn)了對輪廓線形狀由局部細節(jié)到全局概貌的描述[7],這一優(yōu)勢恰與當前將形狀的整體特性與局部特性有效地結合起來的主流思路相符。其次,通過對輪廓線形狀的逐級描述,獲取不同級別上輪廓信息,這些信息的結合,大大增強了其描述能力。輪廓線形狀的主特征在不同級別上保持不變,所以多尺度的描述子具有很好的抗噪性和魯棒性[8]。
有關的研究工作可以概括如下:(1) 構造多尺度描述子。經(jīng)典的描述子有曲率尺度空間(CSS)[9]、凹凸性[4]、三角形區(qū)域[10]。近年來,也有學者對這些經(jīng)典算子進行改進,文獻[11]對輪廓線的淺凹處進行考慮,擴展了曲率尺度空間圖,創(chuàng)建不同類型的形狀凹部。文獻[12]研究了四種多尺度的三角形描述,除了基于三角形面積的TAR,還包括基于三角形邊長的TSL、基于角度的TOA、基于頂角和邊長的TSLA。(2) 與其他輪廓線表示方法結合,構造多尺度描述子。文獻[8、13]將多尺度與變換域方法融合,對傅立葉變換后的輪廓描述子進行高斯濾波,通過調節(jié)高斯濾波器的寬度獲取多尺度傅立葉描述子。文獻[14]與輪廓點空間位置關系方法結合,利用矩陣表示多尺度的空間位置關系,并將其進行旋轉排序,該描述子形式簡單,計算效率高,滿足幾何不變性和雙邊對稱性。通過與多尺度結合,這些描述子的性能都得到了顯著的提高,因此多尺度是形狀描述的有力工具。然而,多個尺度上的分析工作,必然增加運算復雜度;尺度級難以定義,需要通過參數(shù)來控制,選取多少個尺度級,每個尺度等級如何定義,穩(wěn)定解尚無定論 [7],通常依靠經(jīng)驗,存在一定程度的任意性。
一個有效的形狀描述子應滿足如下特性[15-16]:(1) 平移、旋轉和尺度伸縮不變性;(2) 較高的形狀區(qū)分能力;(3) 全局和局部信息都得到描述;(4) 緊致性;(5)計算復雜度低。該文的主要貢獻在于提出一種新的多尺度稀疏描述子。該描述子獲取不同尺度級輪廓線形狀特征,通過稀疏策略,提高對細節(jié)信息的描述能力。該描述子滿足以上特性且在一定程度上克服了時空復雜度這一經(jīng)典矛盾問題。將本文提出的算子應用于我們自己采集的葉形數(shù)據(jù)庫中,并與相關的描述子進行對比,實驗結果表明,稀疏描述子的性能更優(yōu)。
2 多尺度稀疏描述子
整體輪廓不同的物體易于識別分類,整體輪廓相同而細節(jié)不同的葉片難以識別分類。同時,對于輪廓線上一點而言,距離其較近的點對識別分類貢獻比距離遠的作用更大;但是,較遠的點也能起到一定作用,所以不能完全拋棄。因此,識別分類中,形狀描述子在對目標物體全局和局部信息刻畫地同時,應更傾向于局部細節(jié)地描述。該文采用一種稀疏策略,提出了稀疏多尺度描述子,旨在提高其細節(jié)信息的描述能力。
2.1 多尺度稀疏描述子定義
2.2 多尺度稀疏描述子的分析
目標輪廓形狀不受平移、旋轉和尺度縮放的影響,所以一個好的形狀描述子應該滿足這些幾何變換的不變性[15-18]。
平移不會改變輪廓線形狀點集之間的相對距離,所以不會改變弦長,SSM滿足平移不變性。旋轉改變了輪廓點集順序,構造SSM時排序操作消除了旋轉的影響,使得我們所構造的稀疏描述子滿足旋轉不變性與雙邊對稱性。為使形狀描述子滿足縮放不變性,通常對其進行標準化。方法是,選取矩陣SSM每一行的平均值,并與對應行的元素相除。
矩陣SSM的大小為[k×n],[k=log2n]。顯然,[k]與[n]不在一個數(shù)量級上。而文獻[14]所提出的方法所構造的矩陣MDM大小為[n2×n]。以128為例,矩陣SSM的大小為[7×128],矩陣MDM大小為[64×128]。矩陣[SSM]所占的存儲空間僅為矩陣MDM的1/9,而運算速率卻提高了9倍。在降低空間復雜度的同時也降低了時間復雜,在一定程度上克服了時空復雜度的經(jīng)典矛盾。同時,輪廓線形狀易于提取,弦長計算方便,矩陣表示形式簡單,運算復雜度低。
下一階段的研究重點是在保證描述能力的前提下降低描述子的特征維度,顯然,該文所提出的SSM描述子滿足緊致性。
3 實驗結果和討論
為了研究[SSM]在植物葉片輪廓分類識別中的性能,我們利用數(shù)碼相機,從野外采集了100種植物的葉片,每種采集12個樣本,總共采集了1200幅植物彩色葉片圖像。對這些圖片進行二值化處理,構成了一個葉片形狀的二值數(shù)據(jù)庫,該文所采用的數(shù)據(jù)庫中共有100這種植物葉形,每種葉形有12個樣本,共1200幅圖像。
提取出每一個葉片的輪廓線形狀,分別均勻地取32、64、128、256和512個點。
4 結論
本文提出一種新的基于葉片輪廓線的稀疏多尺度描述子。該描述子不僅滿足平移、旋轉、尺度伸縮不變性和雙邊對稱,而且存儲空間小、計算效率高。[SSM]描述子抓住了當前研究的主流思想,符合下一階段的研究重點。將本文提出的方法應用于我們自己的葉片數(shù)據(jù)集上進行測試,并與[MDM]進行比較,該文提出的方法匹配率更優(yōu)。endprint
稀疏多尺度描述子的關鍵在于所采用的稀疏策略。下一階段的研究方向在于采取不同的稀疏策略構造不同的稀疏多尺度描述子,對實驗結果進行比較,分析細節(jié)和粗糙程度對匹配率的影響程度。
參考文獻:
[1] Wang,Xiao-Feng, Huang De-Shuang,Laurent Heutte.Classification of plant leaf images with complicated background[J].Applied Mathematics and Computation,2008,205(2):916-926.
[2] 張婉婷,王斌.應用分數(shù)階傅里葉變換的形狀描述方法研究[J].計算機工程與應用,2011, 47(27):185-198.
[3] Hamid Laga,Sebastian Kurtek, Anuj Srivastava.A riemannian elastic metric for shape-based leaf classification[C].DICTA,2012 .
[4] Adamek T,O Connor N E.A multisacle representation method for nonrigid shapes with a single closed contour[J].IEEE Transactions on Circuits and Systems for Video Technology,2004,14(5):742-753.
[5] Cem Dorekoglu,Mark S.Nixon.Shape classification via image-based multiscale description[J]. Pattern Recognition,2011,44 (9):2134-3146.
[6] 王斌.一種基于多級弦長函數(shù)的傅立葉形狀描述子[J].計算機學報,2012,33(12):2387-2396.
[7] 周瑜,劉俊濤.形狀匹配方法研究與展望[J].自動化學報,2012,38(6):889-910.
[8] Cem Direkoglu,Mark S Nixon. Image-based multiscale shape description using Gaussian Filter [J].Sixth Indian Conference on Computer Vision Graphics & Image Processing,2008,12: 673-678.
[9] Mokhtarian F,Abbasi S,Kittler J.Efficient and robust retrieval by shape content through Curvature Scale Space[C].Proceedings of the International Workshop on Image Databases and Multi-Media Search. Amsterdam, The Netherlands: IAPR,1996:35-42.
[10] Alajlan N,EI Rube I,Kamel M S.Shape retrieval using triangle-area representation and dynamic space warping[J].Pattern Recognition, 2007, 40(7): 1911-1920.
[11] Abbasi S, Mokhtarian F, Kittler J.Enhancing CSS-based shape retrieval for objects with shallow concavities[J].Image and Vision Computing,2000,18(3):199-211.
[12] Sofiene Mouine,Itheri Yahiaoui,Anne Verroust-Blondet.A shape-based approach for leaf classification using multiscale triangle representation[C].Proceedings of the 3rd ACM Conference on Multimedia Retrieval,2013:127-1334.
[13] Cem Direkoglu,Mark S Nixon.Shape classification via image-based multiscale description[J]. Pattern Recognition,44(9): 2134-3146.
[14] Rongxiang Hu,Wei Jia,Haibin Ling,Deshuang Huang.Multiscale distance matrix for fast plant leaf recognition[J].IEEE Transactions on Image Processing,2012,21(11): 4667-4672.
[15] 王斌,舒華忠,施朝健.一種基于輪廓線的形狀描述與匹配方法[J].電子信息學報,2008,30 (4): 949-952.
[16] Martinez J M. MPEG-7 overview (Version 9). Internatioal Organization for Standardization, Coding of Moving Pictures and Audio: Technical report ISO/IEC/JTC1/SC29/WG11N5525, ISO/IEC JTC1/SC29/WG11, 2003.
[17] 王濤,劉文印,孫家廣.傅立葉描述子識別物體的形狀[J].2002,39(12):1714-1719.
[18] Mohammad Reza Daliri,Vincent Torre.Robust symbolic representation for shape recognition and retrieval[J].Pattern Recognition,2008,41(5):1782-1798.
[19] Serge Belongie,Jitendra Malik,Jan Puzicha.Shape matching and object recognition using shape contexts[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2002, 24(4):509-522.
[20] Du Ji-Xiang,Wang Xiao-Feng,Guo-Jun Zhang.Leaf shape based plant species recognition[J]. Applied Mathematics and Computation,2007,185(2):883-893.endprint
稀疏多尺度描述子的關鍵在于所采用的稀疏策略。下一階段的研究方向在于采取不同的稀疏策略構造不同的稀疏多尺度描述子,對實驗結果進行比較,分析細節(jié)和粗糙程度對匹配率的影響程度。
參考文獻:
[1] Wang,Xiao-Feng, Huang De-Shuang,Laurent Heutte.Classification of plant leaf images with complicated background[J].Applied Mathematics and Computation,2008,205(2):916-926.
[2] 張婉婷,王斌.應用分數(shù)階傅里葉變換的形狀描述方法研究[J].計算機工程與應用,2011, 47(27):185-198.
[3] Hamid Laga,Sebastian Kurtek, Anuj Srivastava.A riemannian elastic metric for shape-based leaf classification[C].DICTA,2012 .
[4] Adamek T,O Connor N E.A multisacle representation method for nonrigid shapes with a single closed contour[J].IEEE Transactions on Circuits and Systems for Video Technology,2004,14(5):742-753.
[5] Cem Dorekoglu,Mark S.Nixon.Shape classification via image-based multiscale description[J]. Pattern Recognition,2011,44 (9):2134-3146.
[6] 王斌.一種基于多級弦長函數(shù)的傅立葉形狀描述子[J].計算機學報,2012,33(12):2387-2396.
[7] 周瑜,劉俊濤.形狀匹配方法研究與展望[J].自動化學報,2012,38(6):889-910.
[8] Cem Direkoglu,Mark S Nixon. Image-based multiscale shape description using Gaussian Filter [J].Sixth Indian Conference on Computer Vision Graphics & Image Processing,2008,12: 673-678.
[9] Mokhtarian F,Abbasi S,Kittler J.Efficient and robust retrieval by shape content through Curvature Scale Space[C].Proceedings of the International Workshop on Image Databases and Multi-Media Search. Amsterdam, The Netherlands: IAPR,1996:35-42.
[10] Alajlan N,EI Rube I,Kamel M S.Shape retrieval using triangle-area representation and dynamic space warping[J].Pattern Recognition, 2007, 40(7): 1911-1920.
[11] Abbasi S, Mokhtarian F, Kittler J.Enhancing CSS-based shape retrieval for objects with shallow concavities[J].Image and Vision Computing,2000,18(3):199-211.
[12] Sofiene Mouine,Itheri Yahiaoui,Anne Verroust-Blondet.A shape-based approach for leaf classification using multiscale triangle representation[C].Proceedings of the 3rd ACM Conference on Multimedia Retrieval,2013:127-1334.
[13] Cem Direkoglu,Mark S Nixon.Shape classification via image-based multiscale description[J]. Pattern Recognition,44(9): 2134-3146.
[14] Rongxiang Hu,Wei Jia,Haibin Ling,Deshuang Huang.Multiscale distance matrix for fast plant leaf recognition[J].IEEE Transactions on Image Processing,2012,21(11): 4667-4672.
[15] 王斌,舒華忠,施朝健.一種基于輪廓線的形狀描述與匹配方法[J].電子信息學報,2008,30 (4): 949-952.
[16] Martinez J M. MPEG-7 overview (Version 9). Internatioal Organization for Standardization, Coding of Moving Pictures and Audio: Technical report ISO/IEC/JTC1/SC29/WG11N5525, ISO/IEC JTC1/SC29/WG11, 2003.
[17] 王濤,劉文印,孫家廣.傅立葉描述子識別物體的形狀[J].2002,39(12):1714-1719.
[18] Mohammad Reza Daliri,Vincent Torre.Robust symbolic representation for shape recognition and retrieval[J].Pattern Recognition,2008,41(5):1782-1798.
[19] Serge Belongie,Jitendra Malik,Jan Puzicha.Shape matching and object recognition using shape contexts[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2002, 24(4):509-522.
[20] Du Ji-Xiang,Wang Xiao-Feng,Guo-Jun Zhang.Leaf shape based plant species recognition[J]. Applied Mathematics and Computation,2007,185(2):883-893.endprint
稀疏多尺度描述子的關鍵在于所采用的稀疏策略。下一階段的研究方向在于采取不同的稀疏策略構造不同的稀疏多尺度描述子,對實驗結果進行比較,分析細節(jié)和粗糙程度對匹配率的影響程度。
參考文獻:
[1] Wang,Xiao-Feng, Huang De-Shuang,Laurent Heutte.Classification of plant leaf images with complicated background[J].Applied Mathematics and Computation,2008,205(2):916-926.
[2] 張婉婷,王斌.應用分數(shù)階傅里葉變換的形狀描述方法研究[J].計算機工程與應用,2011, 47(27):185-198.
[3] Hamid Laga,Sebastian Kurtek, Anuj Srivastava.A riemannian elastic metric for shape-based leaf classification[C].DICTA,2012 .
[4] Adamek T,O Connor N E.A multisacle representation method for nonrigid shapes with a single closed contour[J].IEEE Transactions on Circuits and Systems for Video Technology,2004,14(5):742-753.
[5] Cem Dorekoglu,Mark S.Nixon.Shape classification via image-based multiscale description[J]. Pattern Recognition,2011,44 (9):2134-3146.
[6] 王斌.一種基于多級弦長函數(shù)的傅立葉形狀描述子[J].計算機學報,2012,33(12):2387-2396.
[7] 周瑜,劉俊濤.形狀匹配方法研究與展望[J].自動化學報,2012,38(6):889-910.
[8] Cem Direkoglu,Mark S Nixon. Image-based multiscale shape description using Gaussian Filter [J].Sixth Indian Conference on Computer Vision Graphics & Image Processing,2008,12: 673-678.
[9] Mokhtarian F,Abbasi S,Kittler J.Efficient and robust retrieval by shape content through Curvature Scale Space[C].Proceedings of the International Workshop on Image Databases and Multi-Media Search. Amsterdam, The Netherlands: IAPR,1996:35-42.
[10] Alajlan N,EI Rube I,Kamel M S.Shape retrieval using triangle-area representation and dynamic space warping[J].Pattern Recognition, 2007, 40(7): 1911-1920.
[11] Abbasi S, Mokhtarian F, Kittler J.Enhancing CSS-based shape retrieval for objects with shallow concavities[J].Image and Vision Computing,2000,18(3):199-211.
[12] Sofiene Mouine,Itheri Yahiaoui,Anne Verroust-Blondet.A shape-based approach for leaf classification using multiscale triangle representation[C].Proceedings of the 3rd ACM Conference on Multimedia Retrieval,2013:127-1334.
[13] Cem Direkoglu,Mark S Nixon.Shape classification via image-based multiscale description[J]. Pattern Recognition,44(9): 2134-3146.
[14] Rongxiang Hu,Wei Jia,Haibin Ling,Deshuang Huang.Multiscale distance matrix for fast plant leaf recognition[J].IEEE Transactions on Image Processing,2012,21(11): 4667-4672.
[15] 王斌,舒華忠,施朝健.一種基于輪廓線的形狀描述與匹配方法[J].電子信息學報,2008,30 (4): 949-952.
[16] Martinez J M. MPEG-7 overview (Version 9). Internatioal Organization for Standardization, Coding of Moving Pictures and Audio: Technical report ISO/IEC/JTC1/SC29/WG11N5525, ISO/IEC JTC1/SC29/WG11, 2003.
[17] 王濤,劉文印,孫家廣.傅立葉描述子識別物體的形狀[J].2002,39(12):1714-1719.
[18] Mohammad Reza Daliri,Vincent Torre.Robust symbolic representation for shape recognition and retrieval[J].Pattern Recognition,2008,41(5):1782-1798.
[19] Serge Belongie,Jitendra Malik,Jan Puzicha.Shape matching and object recognition using shape contexts[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2002, 24(4):509-522.
[20] Du Ji-Xiang,Wang Xiao-Feng,Guo-Jun Zhang.Leaf shape based plant species recognition[J]. Applied Mathematics and Computation,2007,185(2):883-893.endprint