陳海燕,陳剛琦,張華清
基于SegNet模型的高原鼠兔的圖像分割
陳海燕,陳剛琦,張華清
(蘭州理工大學計算機與通信學院,甘肅 蘭州 730050)
針對高原鼠兔圖像目標尺寸小、背景復雜、特征不顯著、基于活動輪廓的圖像分割模型無法有效分割的問題,采用基于卷積神經網(wǎng)絡的SegNet語義模型對高原鼠兔圖像進行分割:首先將采集的高原鼠兔圖像進行預處理,尺度歸一化后制作成與Pascal VOC數(shù)據(jù)集格式一致的數(shù)據(jù)集;然后將數(shù)據(jù)集分為訓練集與測試集,采用訓練集對SegNet模型訓練,測試集對模型進行分割測試。對高原鼠兔圖像分割的試驗結果表明:與基于活動輪廓的Chan_Vese模型相比,基于卷積神經網(wǎng)絡的SegNet模型對高原鼠兔圖像分割時的交并比、平均像素精度、Dice相似性指數(shù)和Jaccard指數(shù)分別提高了68.33%、9.35%、30.61%和47.98%,過分割率和欠分割率分別降低了87.20%、16.52%。
高原鼠兔;卷積神經網(wǎng)絡;圖像分割;SegNet;語義分割
高原鼠兔是青藏高原的優(yōu)勢鼠種之一[1],對維持高原草地的生態(tài)多樣性和生態(tài)平衡起著重要作用。但當高原鼠兔過度增加時,又會對草地生態(tài)的平衡造成破壞[2-3]。對高原鼠兔進行長期監(jiān)測,掌握鼠兔種群的動態(tài)變化規(guī)律,可以有效地對鼠兔進行掌控,對高原草地生態(tài)環(huán)境的保護具有重要意義。
傳統(tǒng)的高原鼠兔監(jiān)測是通過建立野外觀測站、人工觀測記錄來統(tǒng)計高原鼠兔種群信息,不僅耗費大量人力、物力,而且不能對鼠兔進行長期連續(xù)的監(jiān)測,采集到的數(shù)據(jù)還會受到人為因素的干擾[1,4]。智能監(jiān)控則不僅節(jié)省人力、物力,而且可實現(xiàn)對高原鼠兔長期、連續(xù)的監(jiān)測。
自然場景下高原鼠兔圖像目標尺寸小,特征不顯著,背景復雜,同時由于圖像在拍攝和傳輸過程中產生的大量噪聲,使得高原鼠兔圖像分割十分困難。對高原鼠兔種群進行智能監(jiān)測的關鍵是對高原鼠兔圖像進行分割[5]。張愛華等[5]采用一種改進的Chan-Vese(CV)模型對高原鼠兔進行圖像分割,與CHAN等[6]的CV模型相比,改進的模型采用了全局灰度信息引導曲線向目標邊緣逼近,對前景灰度不均的圖像具有更強的分割適應性,但該模型基于抽象程度較低的圖像低層梯度特征,沒有抽象出更高層的語義特征并用于圖像分割,因此,在目標尺寸小、背景復雜、特征不顯著的情況下,圖像分割效果仍然欠佳。
相比較基于活動輪廓模型的圖像分割方法,基于卷積神經網(wǎng)絡的圖像分割方法是利用卷積神經網(wǎng)絡提取目標的語義特征,在獲得高度抽象的語義特征的基礎上,在原圖像尺寸空間上對圖像進行像素分類,進而獲得圖像分割結果[7],其中卷積神經網(wǎng)絡提取的目標語義特征對于前景目標的辨識以及分割有著重要作用[8-9]。因此,筆者利用基于卷積神經網(wǎng)絡的SegNet語義模型對高原鼠兔圖像進行分割。
使用佳能EOS70D單反相機,采用固定角度、固定高度拍攝的方法采集青藏高原東北部(東經101°35′36″~102°58′15″,北緯33°58′21″~34°48′48″)甘南草原的高原鼠兔圖像。
對采集的高原鼠兔圖像進行尺度統(tǒng)一處理,并制作與Pascal VOC數(shù)據(jù)集格式一致的數(shù)據(jù)集。數(shù)據(jù)集中共有1 100張高原鼠兔圖像,其中800張圖像作為訓練集及驗證集,300張圖像作為測試集。
用于高原鼠兔圖像分割的SegNet模型共有4個編碼器和4個解碼器。每個編碼器由1個卷積層、1個正則化層和1個下采樣層構成;每個解碼器由1個上采樣層、1個卷積層、1個正則化層構成。每個編碼器中使用下采樣窗口尺寸為2、步長為2的最大池化進行下采樣,解碼器中采樣參數(shù)與編碼器中的采樣參數(shù)相同;編碼器以及解碼器中的卷積核尺寸為7、步長為1、填充為3。每層的初始化參數(shù)來自經過預訓練的VGG16網(wǎng)絡。解碼器以及編碼器中的模型所用的損失函數(shù)為交叉熵損失。
模型訓練過程(圖1):首先將圖像輸入網(wǎng)絡中,圖像進入編碼器中,經過若干編碼單元下采樣以及提取特征之后獲得編碼后的語義特征,然后將該結果送入解碼器中進行特征恢復,每個解碼器都將進行上采樣以恢復尺寸,最后輸出的最終語義特征圖的尺寸空間與原圖像一致。在該特征的基礎上進行像素分類,即可獲得最終的分割結果。在計算出損失之后,采用反向傳播進行參數(shù)調整,直到損失降低到一定程度,即網(wǎng)絡收斂。
圖1 高原鼠兔圖像分割的SegNet模型的訓練過程
為了綜合評估所建立的SegNet圖像分割模型的分割效果,與文獻[5]中方法的分割性能進行對比。試驗在搭載NVIDIA Titan V 顯卡的工作站上進行,該工作站內存64G,操作系統(tǒng)為Ubuntu desktop LTS 16.04,實現(xiàn)模型所用的計算框架為Chainer[10]。采用定性和定量的方法評價模型的分割性能,定量指標為交并比(IOU)、平均像素精度(PA)、相似性指數(shù)(DSC)、過分割率(FPVF)、欠分割率(FNVF)和Jaccard指數(shù)。
模型訓練完畢后,將訓練集中的圖像分別送入SegNet模型和文獻[5]中的模型中進行分割。隨機選取8張不同季節(jié)的高原鼠兔圖像,分割結果如圖2所示??梢钥闯?,SegNet模型分割效果要優(yōu)于文獻[5]中模型的分割性能。
1~8 為SegNet模型分割結果;9 ~16 為文獻[5]模型分割結果;17 ~24 人工手動標記輪廓。
在測試集上采用6個評價指標對2個模型的分割性能進行對比,結果列于表1??梢钥闯觯琒egNet模型的并交比比改進CV模型的提高了68.33%;平均像素精度提高了9.35%;相似性指數(shù)提高了30.61%,且相似性指數(shù)大于0.7;SegNet模型的Jaccard指數(shù)提高了47.98%;過分割率與欠分割率分別減小了87.20%與16.52%。SegNet模型性能均優(yōu)于改進CV模型方法,且可對目標進行精準分割。這是因為基于SegNet的模型利用深度卷積神經網(wǎng)絡提取了各個層次的語義特征,而語義特征的提取對前景目標的辨識以及分割有著重要作用。由于卷積神經網(wǎng)絡多層次抽象的語義特征對背景變化魯棒性強于低層特征,因此SegNet模型對背景復雜、目標特征不顯著的高原鼠兔圖像能取得更好的分割效果。
表1 定量的SegNet模型分割結果
高原鼠兔的圖像分割是對高原鼠兔進行數(shù)量統(tǒng)計和形態(tài)學研究的基礎。針對傳統(tǒng)基于低層特征的活動輪廓模型難以有效對背景復雜、目標特征不顯著的高原鼠兔圖像進行精確分割的問題,采用基于深度神經網(wǎng)絡的SegNet模型提取不同層次的語義特征,在此基礎上對高原鼠兔的圖像進行分割,結果表明,所采用SegNet模型在對高原鼠兔的圖像分割時,分割精度要優(yōu)于以改進CV模型為代表的活動輪廓模型的圖像分割方法。
[1] 張愛華,王帆,陳海燕.基于時空域聯(lián)合信息的高原鼠兔運動目標檢測[J].農業(yè)工程學報,2018,34(9):197-203.ZHANG A H,WANG F,CHEN H Y.Moving object detection ofbased on spatio- temporal imformation[J].Transactions of the Chinese Society of Agricultural Engineering,2018,34(9):197-203.
[2] 雷聲.中國西部草原生態(tài)環(huán)境問題及其控制措施[J]. 中國資源綜合利用,2019,37(9):140-142.LEI S.Grassland eco-environmental problems and control measures in western China[J].China Resources Comprehensive Utilization,2019,37(9):140-142.
[3] 曾鸝,趙燕蘭,彭云煦,等.高原鼠兔擾動作用下高寒沙化草地土壤特性變化特征[J].草原與草業(yè),2018,30(1):50-53. ZENG L,ZHAO Y L,PENG Y X,et al.Soil properties variety of alpine sandy grassland under perturbation of[J].Grassland and Prataculture,2018,30(1):50-53.
[4] 李苗,馬玉壽,李世雄,等.控制高原鼠兔對不同退化高寒草甸植物群落特征的影響[J].青海大學學報(自然科學版),2016,34(3):41-47. LI M,MA Y S,LI S X,et al.Effect of controlling theon plants community characteristics in different degraded alpine meadow[J].Journal of Qinghai University(Natural Science),2016,34(3):41-47.
[5] 張愛華,王帆,陳海燕.基于改進CV模型的高原鼠兔圖像分割[J].華中科技大學學報(自然科學版),2017,45(8):32-37. ZHANG A H,WANG F,CHEN H Y.image segmentation based on the improved CV model[J].Journal of Huazhong University of Science and Technology(Nature Science Edition),2017,45(8):32-37.
[6] CHAN T F,VESE L A.Active contours without edges[J]. IEEE Transactions on Image Processing,2001,10(2):266-277.
[7] 熊煒,童磊,金靖熠,等.基于卷積神經網(wǎng)絡的語義分割算法研究[J].計算機應用研究,2019,38(3):1-5.XIONG W,TONG L,JIN J Y,et al.Research on semantic segmentation algorithm based on convolutional neural network[J].Application Research of Computers,2019,38(3):1-5.
[8] ZOU Z,SHI Z,GUO Y,et al Object detection in 20 years:a survey[J/OL].ar Xiv preprint(2019-05-13) [2019-09-15].https://arxiv.org/abs/1905.05241.
[9] 魏晗,李弼程,張瑞杰,等.圖像語義提取方法研究[J].現(xiàn)代電子技術,2011,34(24):103-106.WEI H,LI B C,ZHANG R J,et al.Research on image semantic extraction[J].Modern Electronics Technique,2011,34(24):103-106.
[10] TOKUI S,OONO K,HIDO S,et al.Chainer:a next- generation open source framework for deep learning[C]// Proceedings of workshop on machine learning systems (LearningSys) in the twenty-ninth annual conference on neural information processing systems(NIPS),2015:1-6.
Image segmentation ofbased on SegNet model
CHEN Haiyan, CHEN Gangqi, ZHANG Huaqing
(Department of Computer and Communication, Lanzhou University of Technology, Lanzhou, Gansu 730050, China)
To solving the problem that the image segmentation algorithm based on active contour cannot effectively segment the images ofwith small target, complex background and insignificant features,the SegNet semantic model based on convolution neural network was used to segment the images of. Firstly, the images ofwere preprocessed to make data set consistent with Pascal VOC data set format after scale normalization. Then, the data set was divided into training set and testing set. The training set was used to train the SegNet model, and the testing set was used to estimate the performance of SegNet model. The experimental results of images segmentation forshow that compared with the CV model based on active contour, the intersection over union, mean average precision, similarity index, and jaccard index of the SegNet semantic model based on convolution neural network improved 68.33%, 9.35%, 30.61% and 47.98%, respectively. The false positive volume function and false negative volume function of the SegNet semantic model based on convolution neural network decreased 87.20% and 16.52%, respectively.
; convolutional neural network; image segmentation; SegNet; semantic segmentation
TP391
A
1007-1032(2020)06-0749-04
陳海燕,陳剛琦,張華清.基于SegNet模型的高原鼠兔的圖像分割[J].湖南農業(yè)大學學報(自然科學版),2020,46(6):749-752.
CHEN H Y, CHEN G Q, ZHANG H Q. Image segmentation ofbased on SegNet model[J]. Journal of Hunan Agricultural University(Natural Sciences), 2020, 46(6): 749-752.
http://xb.hunau.edu.cn
2019-11-06
2020-01-10
國家自然科學基金項目(61362034、62061024)
陳海燕(1978—),女,甘肅隴西人,博士,副教授,主要從事圖像處理研究,chenhaiyan@sina.com
10.13331/j.cnki.jhau.2020.06.017
責任編輯:羅慧敏
英文編輯:吳志立