官 飛,許 韜
(福建林業(yè)職業(yè)技術(shù)學(xué)院智能制造系,福建 南平 353000)
食用菌具有重要的經(jīng)濟(jì)價(jià)值和食用價(jià)值,準(zhǔn)確快速地識(shí)別和分類食用菌對(duì)于保證食品安全和推動(dòng)產(chǎn)業(yè)發(fā)展具有重要意義。但由于食用菌種類繁多,且很多有毒菌與無(wú)毒菌形態(tài)相似,傳統(tǒng)的提取特征圖像識(shí)別分類方法主要依賴人工觀察和鑒別,不僅耗時(shí)、耗力,而且準(zhǔn)確性受限于專家經(jīng)驗(yàn)。因此,對(duì)食用菌進(jìn)行準(zhǔn)確的分類至關(guān)重要。近年來(lái),隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,深度學(xué)習(xí)方法在圖像識(shí)別等領(lǐng)域取得了顯著進(jìn)展,為食用菌的自動(dòng)分類提供了新的思路。本文將結(jié)合深度學(xué)習(xí)方法來(lái)進(jìn)一步探討食用菌分類新方法,并與食用菌傳統(tǒng)分類法進(jìn)行對(duì)比,以使人們能快速準(zhǔn)確地對(duì)食用菌進(jìn)行分類。
基于傳統(tǒng)提取特征的食用菌分類方法主要是在對(duì)已有特征進(jìn)行分析的基礎(chǔ)上,提出的一種基于圖像特征的提取方法。目前的傳統(tǒng)提取特征分類法只是利用局部二值模式LBP(Local Binary Patterns)[1]特征和支持向量機(jī)SVM(Support Vector Machin)分類器的方法[2],在食用菌分類任務(wù)中實(shí)現(xiàn)一定程度的分類。但這種方法[3]仍然受限于手動(dòng)特征提取的局限性,無(wú)法充分利用圖像中的信息。本文以選擇局部二值模式LBP 作為特征提取方法[4]為例,介紹傳統(tǒng)的提取特征圖像識(shí)別分類方法。具體步驟如下。
圖像預(yù)處理需要對(duì)圖像進(jìn)行預(yù)處理,以提高圖像質(zhì)量并減少計(jì)算復(fù)雜度。建立如式(1)所示的擴(kuò)散函數(shù)式。
式中,k1、k2和k3為不同的梯度閾值;ut為圖像噪聲估計(jì)參數(shù),?ut為圖像梯度。
函數(shù)g( |?ut|)是一個(gè)擴(kuò)散函數(shù),函數(shù)求解結(jié)果即為擴(kuò)散強(qiáng)度,一般情況下g( | ?ut|)是非負(fù)光滑單調(diào)下降函數(shù)其中,k1、k2和k3表示不同的梯度閾值。
本項(xiàng)目擬采用LBP 對(duì)可食用真菌進(jìn)行特征提取。LBP特征提取是一種紋理特征提取方法,通過(guò)將食用菌像素點(diǎn)的鄰域像素值與該像素點(diǎn)的值進(jìn)行比較,來(lái)構(gòu)建新的二值圖像。對(duì)整個(gè)圖像重復(fù)此過(guò)程,計(jì)算直方圖作為食用菌的特征。
在提取了食用菌圖像中的LBP 特征之后,利用支持向量機(jī)SVM(Support Vector Machin)作為分類器來(lái)對(duì)特征進(jìn)行分類。SVM 是一種監(jiān)督學(xué)習(xí)模型,通過(guò)尋找最大間隔超平面對(duì)數(shù)據(jù)進(jìn)行分類。
深度學(xué)習(xí)是一種基于多層網(wǎng)絡(luò)的食用菌圖像特征的自動(dòng)學(xué)習(xí)方法[5],克服了傳統(tǒng)的基于人工特征提取方法的局限。本項(xiàng)目擬利用卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Networks)對(duì)食用菌進(jìn)行深度分類[6]。
卷積神經(jīng)網(wǎng)絡(luò)的局部特征提取、權(quán)重共享特性以及池特性使其能夠從圖像中有效地提取局部特征。CNN 由多個(gè)卷積層、池化層和全連接層組成,用正向傳播和反向傳播算法來(lái)訓(xùn)練[7]。為了適應(yīng)食用菌分類任務(wù),使用VGG16 的網(wǎng)絡(luò)結(jié)構(gòu),食用菌圖像采用ReLU 激活函數(shù)和交叉熵?fù)p失函數(shù)優(yōu)化模型[8]。激活函數(shù)見(jiàn)圖1。
圖1 激活函數(shù)Fig.1 Activation function
在本研究中,采用CNN作為基于深度學(xué)習(xí)的食用菌分類方法。CNN 特別適用于圖像分類任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以自動(dòng)學(xué)習(xí)圖像特征并進(jìn)行分類。以下是具體步驟。
式中:N為圖像中像素的個(gè)數(shù);p為像素塊的中間像素值。
與傳統(tǒng)方法相似,本文提出的新的食用菌圖像檢測(cè)方法主要包括圖像的縮放、歸一化和數(shù)據(jù)增強(qiáng)。首先,對(duì)蘑菇圖像進(jìn)行尺度調(diào)整,使其與CNN模型輸入尺度相匹配;其次,通過(guò)歸一化助于加快模型的收斂速度;最后,通過(guò)旋轉(zhuǎn)、翻轉(zhuǎn)、剪切等數(shù)據(jù)增強(qiáng)方式增加模型的泛化能力。
CNN 模型構(gòu)建包括構(gòu)造卷積層、激活函數(shù)、池化層、完全連接層、輸出層、輸出層。其中,卷積層主要完成對(duì)蘑菇圖像局部特征的提取。在激勵(lì)函數(shù)中引入了非線性項(xiàng),提高了模型的表現(xiàn)力,在此基礎(chǔ)上,提出了一種基于稀疏表示的稀疏表示方法。完全連接層將前一種特征向輸出空間映射,然后在輸出層中給出最后的類別概率分布。一個(gè)典型的卷積層、激活函數(shù)、池化層,最終與整個(gè)連接層和輸出層相連。
在訓(xùn)練與驗(yàn)證過(guò)程完成后,使用測(cè)試集評(píng)估模型的最終性能。通過(guò)準(zhǔn)確率指標(biāo),可以對(duì)模型在食用菌分類任務(wù)上的性能進(jìn)行定量評(píng)估。
為了評(píng)估新舊兩種分類法在食用菌分類上的性能,收集了一個(gè)包含來(lái)自不同環(huán)境和光照條件下(以增加試驗(yàn)的泛化能力)多個(gè)食用菌種類(如香菇、金針菇、平菇、杏鮑菇、黑木耳等)的圖像數(shù)據(jù)集。為了保證數(shù)據(jù)集的質(zhì)量,通過(guò)裁剪、縮放和旋轉(zhuǎn)等對(duì)圖像進(jìn)行了預(yù)處理,使圖像具有相同的尺寸和分辨率。數(shù)據(jù)集包含3 000張食用菌圖像,每種食用菌各300張。將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,其中驗(yàn)證數(shù)據(jù)集包含300 張食用菌圖像,用于調(diào)整模型參數(shù)和防止過(guò)擬合;測(cè)試集包含600張食用菌圖像,用于評(píng)估模型在未知數(shù)據(jù)上的性能;訓(xùn)練集包含2 100 張食用菌圖像,用于訓(xùn)練模型。食用菌數(shù)據(jù)集檢測(cè)結(jié)果見(jiàn)圖2。
圖2 食用菌數(shù)據(jù)集檢測(cè)結(jié)果Fig.2 Results of edible fungi data set
在傳統(tǒng)的提取特征圖像識(shí)別分類方法中,對(duì)圖像進(jìn)行預(yù)處理后,先利用LBP 提取圖像的特征,然后利用SVM 對(duì)其進(jìn)行分類。
在深度學(xué)習(xí)方法中,采用一種經(jīng)典的CNN 結(jié)構(gòu)(見(jiàn)圖3)進(jìn)行操作。該網(wǎng)絡(luò)先通過(guò)一個(gè)訓(xùn)練集合來(lái)訓(xùn)練,再通過(guò)另一個(gè)驗(yàn)證集合來(lái)評(píng)價(jià)該網(wǎng)絡(luò)的性能。使用隨機(jī)梯度下降算法進(jìn)行學(xué)習(xí),在訓(xùn)練過(guò)程中,通過(guò)監(jiān)控驗(yàn)證集上的性能來(lái)調(diào)整學(xué)習(xí)率、正則化項(xiàng)等超參數(shù)優(yōu)化模型。
圖3 網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Network structure
實(shí)驗(yàn)結(jié)果表明:深度學(xué)習(xí)方法在食用菌分類任務(wù)上取得了較高的準(zhǔn)確率,明顯優(yōu)于傳統(tǒng)的提取特征圖像識(shí)別分類方法。
傳統(tǒng)方法和深度學(xué)習(xí)方法在總體準(zhǔn)確率以及各個(gè)類別(如類別A、類別B等)準(zhǔn)確率上的情況見(jiàn)表1。
表1 傳統(tǒng)方法和深度學(xué)習(xí)方法在食用菌分類任務(wù)上的性能對(duì)比Tab.1 The performance of LBP feature extraction and SVM classifier comparedwith deep learning method in edible fungi classification task單位:%
由表1可知,傳統(tǒng)方法在測(cè)試集上的準(zhǔn)確率為78%,而深度學(xué)習(xí)方法的準(zhǔn)確率達(dá)到了95%;深度學(xué)習(xí)方法在各個(gè)類別上的分類性能也均優(yōu)于傳統(tǒng)方法。試驗(yàn)結(jié)果表明:深度學(xué)習(xí)方法在食用菌分類任務(wù)上有較高的準(zhǔn)確率、更強(qiáng)的泛化能力,明顯優(yōu)于傳統(tǒng)的提取特征圖像識(shí)別分類方法。
綜上所述,利用深度學(xué)習(xí)技術(shù)對(duì)食用菌進(jìn)行分類,具有更高的精度和更強(qiáng)的泛化能力,可以在一定程度上克服傳統(tǒng)方法中手動(dòng)特征提取的局限性,有助于提高食用菌產(chǎn)業(yè)的技術(shù)水平和安全性。但深度學(xué)習(xí)方法的訓(xùn)練通常需要大量的計(jì)算資源和數(shù)據(jù)集,這也是需要在實(shí)際應(yīng)用中權(quán)衡的一個(gè)因素,未來(lái)可以嘗試更多的深度學(xué)習(xí)模型和技術(shù),進(jìn)一步提高食用菌分類的準(zhǔn)確性和魯棒性。