吳薇,王宜懷,程曦,鄭慕蓉
(1.武夷學(xué)院 數(shù)學(xué)與計算機學(xué)院,福建 武夷山 354300;2.認知計算與智能信息處理福建省高校重點實驗室,福建 武夷山 354300;3.蘇州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006;4.武夷學(xué)院 茶與食品學(xué)院,福建 武夷山 354300;5.中國烏龍茶產(chǎn)業(yè)協(xié)同創(chuàng)新中心, 福建 武夷山 354300)
武夷巖茶屬于烏龍茶,其加工制作工藝分初制和精制2大部分。初制主要包括采摘、萎凋、做青、殺青、揉捻、烘干等6道工藝。其中的做青工藝包括交替進行的搖青和靜置,是制作武夷巖茶的獨特工藝,也是形成武夷巖茶品質(zhì)和風格的關(guān)鍵技術(shù)。
目前做青程度判斷主要依靠人工感官經(jīng)驗,即通過查看青葉的表面物理變化來決定下一步做青的具體實施[1~3]。萎凋葉在做青過程中,葉片由綠色變成黃綠色,葉片邊緣再慢慢出現(xiàn)紅褐色,這是因為葉片中的茶多酚在做青過程中被部分氧化成明黃色的茶黃素,茶黃素進一步氧化成紅褐色的茶紅素[4~5],若長時間過重做青則會生成顏色更暗的茶褐素,故在做青過程中,主要看葉片的顏色變化[6~8]。
雖然可以通過色澤檢測研究青葉顏色變化,但Gagandeep[9]指出,傳統(tǒng)的檢測手段如理化測定或使用色差計等方法,不僅損害了茶葉的質(zhì)量,而且擾亂了茶葉的加工環(huán)境,對茶葉品質(zhì)會帶來不利影響。而機器視覺技術(shù)能實現(xiàn)顏色的無損、實時檢測。Gurpreet[10]探討了通過數(shù)碼相機獲得彩色圖像并利用RGB模型來檢測茶葉發(fā)酵過程的可能性,提出了一種能評估發(fā)酵茶葉顏色的算法。Laddi[11]對10個分級茶葉樣品進行分析、探討光照在茶葉樣品鑒別中的作用。通過對獲得的紋理特征進行主成分分析。結(jié)果表明,暗場光照下的判別效果最好。Wang[12]提出了利用茶葉圖像彩色直方圖和小波包熵的方法設(shè)計兩個茶葉分類器來增加茶葉分類的精度。Tang[13]結(jié)合局部二進制模式和灰度共生矩陣提出一種新的紋理識別方法來區(qū)分不同的綠茶鮮葉。Zhu[14]利用BP-MLP和RBF神經(jīng)網(wǎng)絡(luò)建立了2個模型,一個是用加工過程中測得的11個參數(shù)作為變量,如葉片溫度,水分含量等建立感官質(zhì)量預(yù)測模型,另一個是用14個與綠茶有關(guān)的參數(shù)作為變量,如圖像信息等建立感官質(zhì)量評估模型。研究結(jié)果表明,生產(chǎn)過程中測得的葉片溫度和含水量能有效地預(yù)測綠茶的感官品質(zhì),而以綠茶的圖像信息為參數(shù)也能夠有效地評價其感官品質(zhì)。
因此,本研究通過探索使用機器視覺技術(shù)結(jié)合人工神經(jīng)網(wǎng)絡(luò)的方法,旨在為實現(xiàn)武夷巖茶做青無損檢測和做青自動生產(chǎn)線的連續(xù)在線監(jiān)測提供理論依據(jù)。
茶鮮葉樣本來自武夷山燕子窠產(chǎn)區(qū),為當年5月初采摘的肉桂品種,采摘當日天晴且采摘時間為當日下午14:00~15:00點,采摘的鮮葉均為1芽3~4葉,葉為中開面。該鮮葉經(jīng)日光萎凋后做青。
基于機器視覺的圖像采集系統(tǒng)如圖1所示[15]。位于頂部的CMOS數(shù)碼攝像機有效像素1 800萬,鏡頭選用Teledyne DALSA的Genie Nano C4900工業(yè)鏡頭,最大分辨率4 912×3 684,像元尺寸1.25 μm,工作距離50 cm,光源選用PHILIPS公司的色溫為4 100 K的白熾燈且離測試樣品高度40 cm,茶葉樣本隨機選取,堆積并平攤在測試臺上,厚度約9 cm。
圖1 圖像采集系統(tǒng)Fig.1 Image acquisition system
采用武夷山方明茶機械公司生產(chǎn)的型號FM-6CZQ-110滾筒式做青機進行機械搖青。該滾筒式做青機長300 cm,直徑110 cm,轉(zhuǎn)速3.3 r·min-1。做青過程步驟見表1。整個過程按吹風→搖動→靜置的程序重復(fù)進行。先將萎凋葉搖動2 min,靜置于做青機內(nèi)。靜置1 h后,進行第2次搖青,搖青時間5 min,靜置1.5 h后,進行第3次搖青,方法同前,這樣反復(fù)6次直到做青達到成熟標準,整個做青歷時8.5 h。每一輪搖青、靜置結(jié)束后拍攝一組圖像,每組圖像20張,拍攝從投料到結(jié)束共7組圖像。
表1 做青過程步驟表Table 1 Steps of the green processing
為了加快圖像處理速度,將獲取到的彩色圖像的分辨率采用雙線性插值法降低至512*341[16]。
采用RGB和HSI顏色模型[16]來觀察做青圖像色彩的變化過程。2種顏色模型如圖2所示。RGB顏色模型是一種描述人眼對紅、藍、綠光敏感度的基礎(chǔ)彩色模式,R、G、B 分別為圖像紅、綠、藍的亮度值,值范圍為0~255。HSI顏色模型以色調(diào)、飽和度和亮度3種基本特征量來感知顏色。H是色調(diào),是描述顏色的屬性;S是飽和度,是純度的度量;I是亮度,反映了人眼對視覺刺激的程度。在HSI模型中,H分量值用弧度表示,變化范圍在0到2π之間;S分量值由距離中心軸的半徑長度表示,離中心軸越近,S值越小,顏色越淺,H值越不穩(wěn)定;I分量用沿中心軸方向上的高度表示,反映顏色亮度和灰度級[17,18]。
圖2 RGB和HSI顏色空間模型Fig.2 RGB and HSI color space model
利用公式(1)~(3)將圖像的RGB值轉(zhuǎn)換為HSI值[19]。
(1)
(2)
(3)
其中
為了能更好地考察做青程度與各顏色分量值之間的關(guān)系,試驗選擇自組織競爭人工神經(jīng)網(wǎng)絡(luò)對做青程度進行識別。
自組織競爭神經(jīng)網(wǎng)絡(luò)是一種無導(dǎo)師監(jiān)督的人工神經(jīng)網(wǎng)絡(luò),可以對具有共同特征的數(shù)據(jù)進行正確的分類,其原理是反復(fù)觀察、分析和比較給定的樣本數(shù)據(jù),發(fā)現(xiàn)其內(nèi)在規(guī)律。該網(wǎng)絡(luò)分為輸入層和競爭層,其基本思想是競爭層的各神經(jīng)元通過競爭來獲得對輸入模式的響應(yīng)機會[20](圖3)。
圖3 自組織競爭人工神經(jīng)網(wǎng)絡(luò)Fig.3 Self-organized competition artificial neural network
假定輸入層由N個神經(jīng)元構(gòu)成,競爭層有M個神經(jīng)元,則網(wǎng)絡(luò)的連接權(quán)值為
網(wǎng)絡(luò)經(jīng)過Hebb規(guī)則學(xué)習后得到權(quán)值,并按照“贏者全得”的思想組織競爭過程。在競爭結(jié)束后,獲勝的神經(jīng)元只有一個,代表當前輸入樣本的分類模式,其值為二值向量,狀態(tài)按式(4)計算。
(4)
若神經(jīng)元k獲勝則其輸出值ak=1,若神經(jīng)元k競爭失敗,則其輸出值為0,如式(5)所示[21]。
(5)
權(quán)值則在競爭后修改為如式(6)所示。
(6)
利用Matlab(2015)軟件建立自組織競爭型人工神經(jīng)網(wǎng)絡(luò)模型。為加快學(xué)習速度,將學(xué)習速率設(shè)置為0.1,競爭層神經(jīng)元數(shù)目設(shè)置為2,調(diào)節(jié)收斂次數(shù)。對140個樣本隨機選擇其中的98個樣本(70%)為訓(xùn)練樣本,42個樣本(30%)為預(yù)測樣本,每個樣本有3個輸入顏色分量值,R、G、B或H、S、I值。
采集到的部分原始圖像如圖4所示。
圖4 每一輪搖青和靜置后的彩色圖像Fig.4 Images after each round of tossing and long staying
經(jīng)過每一次搖青和靜置后的彩色圖像的RGB和HSI分量值如圖5所示。
圖5 經(jīng)過每一輪搖青和靜置后圖像的RGB和HSI各分量值Fig.5 Component values after each round of tossing and staying in RGB and HSI model
圖4是經(jīng)日光萎凋后的青葉在做青階段的變化過程圖像。從圖4中可看出,青葉呈現(xiàn)堆積狀,葉片顏色由幾乎都是綠色逐漸變化到開始在葉緣處出現(xiàn)紅變直到最后更大面積的紅變出現(xiàn)而形成綠葉紅鑲邊,說明顏色是茶葉內(nèi)含物質(zhì)在做青過程中發(fā)生不同程度降解和氧化聚合的總反映,是茶葉做青過程的重要依據(jù)。做青環(huán)節(jié)的搖青對萎凋葉葉緣造成損傷,導(dǎo)致多酚類物質(zhì)氧化和縮合形成茶黃素、茶紅素和茶褐素。整個做青過程就是茶青葉中的部分茶多酚轉(zhuǎn)化成明黃色的茶黃素,再由茶黃素轉(zhuǎn)化成紅褐色的茶紅素,最后有極少部分茶紅素變成更深的茶褐素的過程。
圖5是將圖4中的色彩變化用RGB和HSI分量值表示出來。圖5(a)和(b)中各有3條曲線,每條曲線中間的標記點是每一輪圖像單個顏色分量的均值,標記點的上下界是該輪所有圖像顏色分量的最大值和最小值。
圖5(a)中R值從較低的狀態(tài)一直在不斷地增加,呈上升的趨勢,這表明在這期間茶紅素不斷生成。但最后一輪做青后,R分量卻出現(xiàn)下降,這表明茶紅素有少部分轉(zhuǎn)化為茶褐素而使R分量降低。G值在下降一段時間后又顯著上升,原因是部分葉綠素轉(zhuǎn)化茶黃素后又轉(zhuǎn)化為茶紅素和茶褐素。B值先是上升后下降,然后又上升再下降,不斷波動,直到最后做青結(jié)束后與剛開始相比,值是下降的。這表明葉片由剛開始較綠,到中間變成黃綠色,然后在葉緣慢慢開始出現(xiàn)紅褐色,直到最后更深的紅褐色出現(xiàn),整個圖像的顏色到做青結(jié)束時最深。
圖5(b)中的H值,開始時緩緩上升,這是因為茶黃素的出現(xiàn),其亮黃色使整個圖像的顏色變淺。最后做青結(jié)束時,H值突然迅速下降,這表明圖像的色相更靠近紅色。S值從開始一直下降,直到第5輪時降到最低,但到最后做青結(jié)束時卻突然上升,這表明圖像顏色加深了,與最后一輪做青結(jié)束后R值輕微下降和B值迅速下降行程呼應(yīng)。I值在整個做青過程中波動較小,這表明圖像采集時的光源穩(wěn)定不變且整個過程灰度值變化不大。
采用前述的自組織競爭人工神經(jīng)網(wǎng)絡(luò)建模并對數(shù)據(jù)集的分類結(jié)果如圖6和圖7所示。
圖6 采用RGB顏色分量表示的分類結(jié)果Fig.6 Classification results represented by RGB color components
圖7 采用HSI顏色分量表示的分類結(jié)果Fig.7 Classification results represented by HSI color components
由圖6和圖7可知,自競爭網(wǎng)絡(luò)成功地對140個樣本進行了聚類。圖6中對采用RGB顏色分量表示的訓(xùn)練數(shù)據(jù)進行分類的錯誤率為18/98=18.36%,同時可以判斷出:做青完成的輸入樣本的激活神經(jīng)元編號為1,做青未完成的輸入為樣本的激活神經(jīng)元編號為2。也就是說,激活了編號為1的神經(jīng)元的樣本屬于做青完成的樣本,而激活了編號為2的神經(jīng)元的樣本屬于做青未完成的樣本。在42個測試樣本中,117、118、130、131、135、140號樣本被錯誤劃分為已完成樣本,105、121、126號樣本被錯誤劃分為未完成樣本,其余33個測試樣本都聚類正確,對數(shù)據(jù)的分類錯誤率為9/42=21.4%。
同樣地,圖7中對采用HSI顏色分量值表示的訓(xùn)練數(shù)據(jù)進行分類的錯誤率為23/98=23.5%,同時也可以判斷出:做青完成的輸入樣本的激活神經(jīng)元編號為1,做青未完成的輸入為樣本的激活神經(jīng)元編號為2。在42個測試樣本中,106、109、115、122、124、126號樣本被錯誤劃分為已完成樣本,112、120、130、138、139號樣本被錯誤劃分為未完成樣本,其余31個測試樣本都聚類正確,對數(shù)據(jù)的分類錯誤率為11/42=26.2%。
試驗取得的140個樣本以RGB分量值和HSI分量值表示的訓(xùn)練集、測試集分類的正確率分別為81.64%、78.6%和76.5%、73.8%,不同階段顏色分量值和做青程度的相關(guān)系數(shù)R2及均方誤差MSE值如表2所示。結(jié)果表明武夷巖茶萎凋葉在做青過程中獲得的彩色圖像顏色分量和做青程度高度相關(guān)。
表2不同階段顏色分量值和做青程度的統(tǒng)計表現(xiàn)
Table2 Statistical performance of color components and degree of achievement at different stages
顏色分量Color component訓(xùn)練樣本Training set預(yù)測樣本Prediction setMSER2MSER2運行時間Running timeR、G、B1.472E-20.9291.037E-20.9032.882H、S、I1.765E-10.9001.874E-10.8792.660
對于分類結(jié)果存在的誤判率,原因討論如下:
(1)利用自組織競爭人工神經(jīng)網(wǎng)絡(luò)進行分類的方法雖然簡單易用,但在訓(xùn)練樣本數(shù)量不夠多的情況下,會存在較高的誤判率。
(2)可以根據(jù)反復(fù)測試的結(jié)果和已有的先驗知識調(diào)節(jié)網(wǎng)絡(luò)的訓(xùn)練參數(shù)來提高分類的精度與分類的效率。
(3)后續(xù)研究可以嘗試采用其他的分類方法或考慮圖像的光譜特征差異來提高分類結(jié)果的精度。
本文研究的目的是通過機器視覺的手段來分析武夷巖茶日光萎凋葉經(jīng)做青工序后做青的程度與葉面顏色變化之間的關(guān)系,試驗原理是用2種顏色參數(shù)模型RGB和HSI來表達茶鮮葉表面顏色的變化值,建立自組織競爭人工神經(jīng)網(wǎng)絡(luò)來預(yù)測做青程度,為今后利用機器視覺來監(jiān)測烏龍茶做青過程提供參考。