馮 曉,張 輝,馬中杰,喬 璐,靳 薇,魏 東,臧賀藏
(1.河南省農(nóng)業(yè)科學院 農(nóng)業(yè)經(jīng)濟與信息研究所,河南 鄭州 450002; 2.北京市科學技術研究院,北京 100094)
采用數(shù)字圖像處理技術進行作物生長過程信息監(jiān)測的研究及應用日益廣泛,在作物長勢及營養(yǎng)監(jiān)測[1-4]、病蟲害識別[5-8]、農(nóng)產(chǎn)品品質(zhì)檢測[9-12]等方面取得了許多進展。將作物從復雜背景中分割出來,是進行作物圖像處理與分析的重要環(huán)節(jié)。對于綠色作物圖像分割,常采用顏色特征和聚類分析、閾值等算法相結(jié)合來實現(xiàn)。時雷等[13]在RGB彩色模型中基于顏色特征利用馬氏距離實現(xiàn)對小麥彩色圖像的分割。張志斌等[14]基于作物綠色“恒量”的存在性構建了綠色作物圖像分割方法。翟瑞芳等[15]在HSI彩色模型下建立了油菜作物色調(diào)強度查找表,基于閾值實現(xiàn)油菜圖像的分割。張小虎等[16]考慮到光照不均對分割的干擾,將增強處理后的小麥圖像在Lab顏色模型下,基于α 角度模型進行K-means聚類實現(xiàn)小麥圖像分割。伍艷蓮等[17]將RGB彩色模型下提取的顏色指數(shù)ExG、CIVE和空間特征結(jié)合,采用均值漂移算法及Otsu方法實現(xiàn)對綠色作物圖像的分割。目前,小麥圖像分割算法大多僅考慮到小麥具有的綠色特征,把小麥的綠色部分作為提取目標,未考慮到小麥植株普遍存在的葉片發(fā)黃這一現(xiàn)實情況,因而提取小麥黃色葉片的性能不足。葉色是判別小麥生長情況的重要依據(jù),倒春寒、肥水不足、病蟲害等均會導致小麥葉片偏黃,因此,在利用圖像處理技術指導小麥生產(chǎn)中提取出發(fā)黃葉片具有重要意義。
為有效提高小麥圖像分割時黃色葉片的提取性能,本研究提出采用基于顏色命名算法,通過提取小麥圖像中綠色和黃色像素點對應區(qū)域的方法實現(xiàn)小麥和背景的分割。當前主流的顏色命名算法之一是WEIJER等[18-19]提出的基于概率潛在語義分析(Probabilistic latent semantic analysis,PLSA)模型對顏色進行的建模。PLSA模型于1999年由HOFMANN[20]提出,原本用于文本分類、信息檢索,后來逐步拓展到圖像分析領域[21-22]。作為一種無監(jiān)督模型,PLSA模型避免了人工對圖像進行標注的繁瑣,同時也解決了對于未知樣本的分類問題,并提高了分類性能。王拴[23]、徐少飛等[24]分別將基于PLSA模型和顏色命名的分割方法用于車牌定位及車輛陰影去除,獲得了比較好的效果。針對大田環(huán)境下小麥圖像的分割問題,本研究分析白平衡調(diào)整、對光照不足圖像進行局部同態(tài)濾波這2種圖像預處理方法在提高小麥圖像分割性能上的貢獻,以K-means聚類算法為參照,分析基于PLSA模型和顏色命名方法分割綠色、葉片偏黃及光照不足3類小麥圖像的效果,以期為作物圖像預處理以及顏色命名方法在作物圖像分割中的應用提供參考。
采用佳能60D(鏡頭18-135 mm IS)數(shù)碼相機采集大田小麥圖像。將數(shù)碼相機固定在距小麥冠層頂部1 m處與地面垂直進行拍攝,同時將灰色校正板作為參照置于小麥冠層同一平面。相機設置為程序自動曝光模式,采用多點自動對焦,圖像分辨率設定為450 萬像素(5 760×3 840),圖像以RAW格式存儲。分別選取綠色、葉片偏黃及光照不足3類共9幅小麥圖像,截取1 000×1 000像素的子圖像進行分割性能分析。
1.2.1 白平衡調(diào)整 大田環(huán)境下,日光在不同地域、季節(jié)、環(huán)境、天氣、時間段色溫不同,圖像采集設備不具有人類視覺系統(tǒng)特有的顏色恒常性,會受大田日光變化、作物反射以及采集設備感光系數(shù)等的影響,導致色偏現(xiàn)象。因此,本研究首先將采集的RAW格式圖像依據(jù)灰色校正板顏色,利用相機附帶軟件進行白平衡調(diào)整后以JPG格式保存,以得到準確無偏色的圖像。
1.2.2 局部同態(tài)濾波 部分大田環(huán)境下采集的小麥圖像存在光照不足的現(xiàn)象,導致對圖像分割結(jié)果產(chǎn)生一定影響。HSI彩色模型中亮度分量I與彩色信息(色調(diào)分量H和飽和度分量S)無關,保持H和S分量不變,僅對I分量進行同態(tài)濾波[25]可將光照不足的圖像進行對比度增強和亮度范圍壓縮,從而減少光照對圖像的影響。本研究在HSI彩色模型下采用同態(tài)濾波技術對光照不足的小麥圖像進行增強處理。
常采用的濾波器有高斯高通濾波器和布特沃斯高通濾波器,本研究選擇采用高斯高通濾波器構造同態(tài)濾波函數(shù)H(u,v):
(1)
式中,γL<1且γH>1,用于衰減低頻(照射)的貢獻,增強高頻(照射)的貢獻。常數(shù)c控制濾波器從低頻到高頻過渡段的銳利度,值越大,過渡段越銳利,其在γL和γH之間過渡。D0為截止頻率,是一個正常數(shù),D(u,v)是點(u,v)到傅里葉變換中心的距離。
(2)
式中,M、N分別為圖像的行數(shù)和列數(shù)。本研究中同態(tài)濾波參數(shù)γH=1.2,γL=0.5,c=1,D0=50??紤]到同態(tài)濾波后圖像有些部分過增強的情況,將圖像分割成一系列子圖像(子圖像大小為10像素×10像素)分別進行同態(tài)濾波[26],合并后再對相鄰子圖像邊界像素進行均值濾波,去除分塊同態(tài)濾波產(chǎn)生的塊效應的影響,最終得到增強后的小麥圖像。
BERLIN等[27]提出語言學里11種基本顏色(黑、藍、褐、灰、綠、橙、粉紅、紫、紅、白、黃)能夠很好地表示現(xiàn)實世界中的各種顏色。WEIJER等[18-19]基于BERLIN等提出的這一理論,采用PLSA模型從圖像數(shù)據(jù)集中學習顏色名,建立了顏色名概率字典和顏色名RGB值字典。具體學習方法如下:
將RGB顏色空間下每個顏色通道中8個步長設定為1個單元,由于每個通道取值范圍是0~255,則3個顏色通道共有32×32×32,即32 768個空間單元。
以給定的1組圖像集D={d1,d2,…,dN}為圖像文件,使用RGB空間劃分成的32 768個空間單元的集合W={w1,w2,…,w32 768}表示顏色低層特征,11種基本顏色名的集合Z={z1,z2,…,z11}表示顏色語義隱藏變量。在PLSA模型中,空間單元w在圖像d中條件概率可表示為:
(3)
p(w|d)和p(z|d)的分布通過使用最大期望(EM)算法求對數(shù)似然函數(shù)的極大值計算。
(4)
式中,p(d,w)=p(d)p(w|d),n(d,w)是檢索詞頻率,即圖像d中每個空間單元w出現(xiàn)的頻度。
通過使用Google檢索的數(shù)據(jù)集訓練模型得到每個空間單元屬于各顏色名的概率p(w|z),得到1個大小為32 768×11的顏色名概率字典。
為減少計算復雜度,記下每個字典單元屬于各個顏色名的概率值最大的那個顏色名,得到1個大小為32 768×1的顏色名RGB值字典。
通過3次樣條插值的方法建立待分割圖像每個像素點到對應顏色名RGB值的映射,映射方程如下:
index_im=1+R1/8+32×G1/8+32×32×B1/8
(5)
式中,index_im為顏色名RGB值字典的行數(shù),R1、G1、B1分別對應RGB空間下待分割圖像像素點的R、G和B值。
本研究中,利用公式(5)中的映射方程,基于WEIJER等[18-19]建立的顏色名RGB值字典,將待分割小麥圖像中映射為綠色和黃色的區(qū)域進行提取,實現(xiàn)小麥圖像的分割。
本研究首先對圖像進行白平衡調(diào)整,然后對光照不足的圖像進行局部同態(tài)濾波處理,最后再采用基于PLSA和顏色命名的方法通過提取圖像中映射為綠色和黃色的區(qū)域?qū)崿F(xiàn)分割。算法代碼在MATLAB2015環(huán)境下實現(xiàn),具體算法流程如圖1所示。
圖1 算法流程Fig.1 Algorithm flow
為驗證基于PLSA和顏色命名分割方法的有效性,采用K-means聚類算法進行分割效果對比,算法選取3個聚類中心進行迭代,然后把含有綠色較多的2個聚類區(qū)域合并后作為目標區(qū)域。
采用精確率(Precision)、召回率(Recall)和F1值3個評價指標對分割效果進行定量評價。精確率針對預測結(jié)果而言,表示的是預測為正的樣本中真正的正樣本的占比;召回率針對樣本而言,表示的是樣本中的正例被預測正確的占比。F1值是精確率和召回率的加權平均,用于綜合反映算法整體性能,數(shù)值介于0和1之間,越大性能越好。
(6)
本研究將用Photoshop軟件對小麥圖像進行人工分割的結(jié)果作為標準圖像。
小麥原始圖像圖2a經(jīng)白平衡調(diào)整后,得到色彩準確的圖像圖2b(偏藍色的灰色校正板經(jīng)調(diào)整后顏色顯示為標準灰色)。分別用基于K-means聚類算法及基于PLSA和顏色命名方法對原始圖像和白平衡調(diào)整后的圖像(其中,光照不足的小麥圖像進行局部同態(tài)濾波處理)進行分割。結(jié)果表明,原始圖像經(jīng)白平衡調(diào)整后2種方法的分割性能都得到了提升,尤其是基于PLSA和顏色命名方法的F1值提升了1.61個百分點(表1)。由此可見,白平衡調(diào)整是小麥圖像處理中的一項很有必要的預處理步驟,為后期進一步圖像分析提供準確的顏色信息。
圖2 小麥圖像白平衡調(diào)整效果比較Fig.2 Comparison of white balance adjustment effect of wheat image
表1 小麥圖像分割性能
圖3a為經(jīng)白平衡調(diào)整后的光照不足的小麥圖像。經(jīng)過全局同態(tài)濾波后的圖3b中部分小麥依然光照增強不足,而部分小麥卻過增強而變亮。采用局部同態(tài)濾波得到的圖3c增強效果均勻,基本將陰影遮擋部分的小麥清晰展現(xiàn)出來。采用基于K-means聚類算法以及基于PLSA和顏色命名方法對白平衡調(diào)整后圖像直接分割和局部同態(tài)濾波后分割F1值分別提升了7.11百分點及12.43百分點(表1),分割性能均得到較大提升。
圖3 小麥圖像同態(tài)濾波增強效果比較Fig.3 Comparison of homomorphic filtering enhancement effect of wheat image
從表1來看,基于K-means聚類算法對綠色、葉片偏黃及光照不足3類小麥圖像進行分割的F1值分別為96.73%、92.87%和97.20%;基于PLSA和顏色命名方法對應的F1值分別為96.39%、97.29%和96.22%。2種分割方法均獲得了比較好的分割性能。從圖4中紅框內(nèi)細節(jié)以及圖4j、圖4k中可以看出,基于K-means聚類算法分割的優(yōu)點是產(chǎn)生的點狀噪音和細小孔洞較少,不足是當小麥圖像葉片出現(xiàn)偏黃或者葉色綠度差異較大時,分割效果明顯下降?;赑LSA和顏色命名分割方法在小麥葉片發(fā)黃或葉色綠度差異較大時也能達到較高的分割性能,但不足是由于該方法是基于像素點的分割,分割結(jié)果中點狀噪音和細小孔洞相對基于K-means聚類算法較多。
圖4 小麥圖像不同方法分割結(jié)果Fig.4 Segmentation results by different methods of wheat image
前人建立的大田作物圖像分割方法大多是基于綠色特征進行分割[13-15,17,28],未考慮方法對偏黃小麥的分割性能。本研究基于PLSA和顏色命名算法,通過提取小麥圖像中綠色和黃色像素對應區(qū)域?qū)崿F(xiàn)小麥分割。本方法和K-means聚類方法對綠色、葉片偏黃及光照不足的小麥圖像分割的F1值均在p2%以上,其中分割葉片偏黃小麥的F1值比K-means聚類算法高4.42百分點,效果明顯優(yōu)于K-means聚類算法,表明本方法能夠有效提取小麥圖像中的黃色葉片,在分割上具有較強的穩(wěn)定性?;赑LSA和顏色命名的方法能夠便捷提取指定顏色的作物目標,對于顏色特征和背景差異明顯的分割任務具有一定的適用性。但是,該方法基于像素分割,點狀噪音和細小孔洞相對較多,且無法將相同顏色的雜草分割成背景,下一步可通過結(jié)合紋理、形狀等特征來提升作物分割性能。另外,本研究通過白平衡調(diào)整、光照不足圖像局部同態(tài)濾波預處理有效提升了最終分割性能,這與前人在色偏校正算法[29]、光線補償算法[16]等研究中結(jié)果一致,去除或減弱光照的影響是當前大田作物圖像分割中的關鍵,也是下一步需要重點研究的問題。