江億平,卞貝,張兆同,潘磊慶,汪小旵
1(南京農業(yè)大學 信息管理學院,江蘇 南京,210095)2(南京農業(yè)大學 食品科學技術學院,江蘇 南京,210095)3(南京農業(yè)大學 工學院,江蘇 南京,210031)
我國是水蜜桃生產大國,種植面積和產量均為世界第一[1]。水蜜桃屬于呼吸躍變型果實,集中在高溫多雨的夏季成熟上市,采后迅速后熟軟化、腐爛變質,損耗率高達25%~50%[2],嚴重影響其食用和商業(yè)價值。確定最佳采收時期、選擇合適的加工技術成為延長水蜜桃貨架期、提高產品附加值的重要途徑。然而,考慮到不同成熟階段的水蜜桃質地、口感差異較大,所適合的產品類型和加工工藝也相應有所不同[3]。因此,設計精準高效的水蜜桃成熟度判別方法應用于生產加工預處理階段,對確定加工工藝,保障加工產品品質具有重要意義。
水蜜桃采后成熟是一個受多因素影響,連續(xù)且復雜的過程。一方面,水蜜桃后熟期較短,輕微機械損傷會加速部分理化特征變化速率,導致果實內部已經軟化褐變,而表皮顏色變化較小或幾乎無變化[4]。另一方面,水蜜桃成熟是個模糊信息,成熟指標和成熟等級之間的映射關系是區(qū)間對區(qū)間[5-6],無法劃分各成熟階段的清晰界限。相較于后熟周期較長且表皮特征明顯的鮮果,水蜜桃成熟度判別的模糊性和不確定性更為突出,不僅要選擇全面的成熟度評價指標,更要解決成熟階段間的模糊劃分。
目前,有關鮮果成熟度判別的研究大多利用圖像技術[7-8]或高光譜技術[9-10],提取果實成熟過程中表皮顏色、紋理等特征,通過樣本數(shù)據(jù)建立嚴格的成熟等級閾值參數(shù),訓練得出特征指標和成熟度嚴格值映射的分類模型[11-12]??紤]到水蜜桃成熟度無法完全由外部特征(如形狀、顏色)決定,監(jiān)測果實成熟過程中重要物質的變化趨勢[13-14],如可溶性固形物[15]、硬度[16]、失重率[17]等,成為評價水蜜桃品質和貨架期的重要手段?,F(xiàn)有依靠表皮特征或單一指標的研究方案,忽視了與成熟狀態(tài)最相關的內部理化指標,給成熟度判別帶來較大的局限性;同時,未考慮成熟階段間的模糊性,利用嚴格值映射建立的分類模型不僅容易導致成熟度判別結果的不可靠,也會造成指標信息和成熟度之間過擬合,帶來樣本不可分類性[18]。
本研究以“陽山蜜露”水蜜桃作為試驗對象,擬選擇多個成熟相關指標建立多維指標數(shù)據(jù)集,引入模糊區(qū)間重疊度調整隸屬度函數(shù)參數(shù),建立半梯半嶺型隸屬度模型,并結合熵值法和聚核權,建立基于聚核模糊分類(fuzzy classification with kernel clustering,FCKC)多維指標水蜜桃成熟度判別模型,實現(xiàn)水蜜桃成熟度準確判別,旨在為水蜜桃食品加工提供成熟度判別的科學方法。
選取江蘇省無錫市陽山鎮(zhèn)“陽山蜜露”水蜜桃作為試驗對象,試驗于2019年7月在南京農業(yè)大學進行。按不同成熟期(表1)采摘水蜜桃樣本[19],所選水蜜桃樣本形狀相似、大小均勻、表面圓潤、無病蟲害、無擠壓痕跡、無機械損傷。選留120個有效樣本,其中七成熟、八成熟、九成熟和十成熟的水蜜桃各30個,采后水蜜桃樣本不做任何化學處理,立即進行相關指標測量。
表1 水蜜桃成熟度劃分標準Table 1 Maturity division standard of peaches
1.2.1 出汁率
量取50 g水蜜桃樣本果肉,以2 000 r/min的速度離心樣本果肉,并以2層紗布過濾,稱取過濾后果汁的質量記為m,重復3次取平均值定義為該水蜜桃樣本的出汁率,按公式(1)計算:
(1)
1.2.2 糖度
采用WYT型系列手持糖度計測量。用滴管吸取出汁率實驗中的過濾液作為測量對象,每個水蜜桃樣本重復實驗3次,取平均值定義為該樣本糖度。
1.2.3 硬度
硬度是與水蜜桃耐儲運能力最相關的指標,通常定義為使果實發(fā)生定量形變所需要最大的力[20]。采用美國FTC TMS-Pro專業(yè)食品物性質構分析儀,選用圓柱形探針來測量水蜜桃的硬度,設置傳感器為400 N,位移為0 mm,觸發(fā)力為0.2 N,檢測速度為5 mm/min,形變量為20%??紤]到水蜜桃體積較大,在果實縫合線兩側各測量1次,取兩側平均值作為該水蜜桃樣本的硬度值。
1.2.4 失重率
稱重測量[21]。稱量實驗組水蜜桃樣本原始質量m0,并分別在貯藏后連續(xù)稱重第i天的果實質量mi,按公式(2)計算失重率(ω):
(2)
將水蜜桃樣本數(shù)據(jù)分為訓練集和測試集:訓練集由60%的水蜜桃樣本提供數(shù)據(jù),各成熟階段選擇特征較明顯且果實表面大致相同的18個有效樣本;測試集由40%的水蜜桃樣本提供數(shù)據(jù),各階段選擇余下的12個有效樣本?;谟柧毤瘮?shù)據(jù)建立FCKC模型來判別水蜜桃成熟度(圖1)。首先根據(jù)模糊區(qū)域重疊度,設計水蜜桃成熟指標隸屬度函數(shù)參數(shù)調整規(guī)則。然后,通過分析訓練集隸屬度離散程度,建立成熟指標權重集。再根據(jù)相鄰成熟等級的模糊性,提出基于聚核權的去模糊化規(guī)則,計算調整后的隸屬度向量。最后輸入測試集樣本數(shù)據(jù),輸出水蜜桃成熟度判別結果。
圖1 基于FCKC的多維指標水蜜桃成熟度判別方法Fig.1 Peach maturity discrimination method with multi-dimensional indexes based on FCKC
1.3.1 考慮重疊度的成熟指標隸屬度函數(shù)建立
偏小型半梯半嶺分布函數(shù):
(3)
中間型半梯半嶺分布函數(shù):
(4)
偏大型半梯半嶺分布函數(shù):
(5)
根據(jù)訓練集數(shù)據(jù)分布,確定單個指標論域范圍,引入成熟指標的初始模糊區(qū)域間隔:
(6)
式中:xmin為該指標測量最小值,xmax為該指標測量最大值;N為訓練集樣本量;γ為間隔數(shù)量調整參數(shù)。
(7)
(1)情況1:Lap(MSk,MSk+1)=0
若MSk和MSk+1模糊區(qū)域間不存在相同的成熟度等級,則保持MSk和MSk+1的初始邊緣屬性參數(shù)。
(2)情況2:Lap(MSk,MSk+1)=?
若MSk和MSk+1模糊區(qū)域存在部分重疊的成熟度等級,則根據(jù)重疊度來調整MSk和MSk+1的初始邊緣屬性參數(shù),計算公式如(8)(9):
(8)
(9)
(3)情況3:Lap(MSk,MSk+1)=1
1.3.2 基于熵值法的水蜜桃成熟多指標權重集
考慮到不同指標提供成熟度信息的差別,利用熵值來測量各指標的信息量,同時確定多指標權重集[23-24]。
(10)
然后,對隸屬度矩陣Mi進行歸一化處理:
(11)
再計算各水蜜桃成熟指標的信息熵Eindex和各成熟指標權重:
(12)
(13)
(14)
Bi=[EW1×FS1,EW2×FS2,…,EWk×FSk]=
(15)
1.3.3 基于聚核權的去模糊化規(guī)則
(16)
步驟3:確定閾值θ;
水蜜桃成熟指標的分布情況可以描述不同階段的果實生長差異、平均值和標準差描述成熟指標隨時間的變化趨勢[26],變異系數(shù)解釋各成熟階段數(shù)據(jù)的相似性和差異性[27],所有實驗和統(tǒng)計分析均在MATLAB 2017a和SPSS 22.0上進行,顯著性水平設為0.05。
如表2所示,出汁率和糖度指標在各成熟階段變化幅度較小,相鄰成熟階段之間數(shù)據(jù)范圍重疊較多,且變異系數(shù)較小,分別為7.24%和11.61%,各階段差異性較小。出汁率和糖度指標區(qū)間界限不清晰,僅根據(jù)這2個指標來細化4個成熟度,容易帶來較多噪聲和較大難度。而硬度和失重率指標在水蜜桃成熟過程中變化幅度較大,相鄰成熟階段間數(shù)據(jù)幾乎無重疊,且變異系數(shù)分別為39.22%和41.20%,遠大于出汁率和糖度。
表2 水蜜桃各成熟階段指標數(shù)據(jù)分析Table 2 Data analysis of indexes of peaches at each maturity stage
為了進一步確定隸屬度函數(shù),利用模糊統(tǒng)計法研究水蜜桃成熟指標各階段的頻率分布。以出汁率為例,選取中間型成熟階段(八、九成熟),根據(jù)訓練集數(shù)據(jù)繪制頻率分布直方圖。如圖2所示,對于八、九成熟水蜜桃出汁率而言,論域兩端樣本較少,而論域中間區(qū)域樣本較多且集中,呈現(xiàn)越靠近中間區(qū)域樣本
a-八成熟;b-九成熟圖2 水蜜桃出汁率指標中間型階段頻率分布Fig.2 Frequency distribution of peach juice yield index at intermediate stages
數(shù)增長越快的趨勢。因此,選擇半梯半嶺型分布隸屬度函數(shù)來描述水蜜桃成熟指標分布,更符合水蜜桃生長特征。
表3 出汁率指標隸屬度函數(shù)參數(shù)調整Table 3 Parameter adjustment of membership functions of juicy peach fruit yield index
表4 水蜜桃成熟指標隸屬度函數(shù)屬性參數(shù)Table 4 Attribute parameters of membership functions of peach maturity indices
a-出汁率;b-糖度;c-硬度;d-失重率圖3 水蜜桃各成熟指標隸屬度函數(shù)表示Fig.3 Membership functions of each peach maturity index
將測試集48個水蜜桃樣本用于成熟度模型的正確率檢驗,訓練結果如表5所示,基于FCKC模型的水蜜桃成熟度判別模型整體正確率為93.75%。在七成熟階段,由于果實相對偏硬,且口感欠佳,糖度指標較低,階段特征較明顯,因此該階段模型判斷正確率較高。在八、九成熟階段,果實處于呼吸躍變階段,呼吸速率增長較快且易達到高峰,受環(huán)境和果實生物特征的影響,不同果實之間指標變化速率不一致,給模型判別帶來難度。而對于十成熟階段,其硬度降到最低,且果實含水率達到頂峰,給水蜜桃成熟度識別提供了較強依據(jù)。
表5 水蜜桃成熟度FCKC判別模型正確率Table 5 Accuracies of peach maturity FCKC discrimination model
為了分析聚核權去模糊化規(guī)則的判別性能,選擇常見的三角分布、梯形分布隸屬度函數(shù),分別與最大隸屬度法、聚核權模糊化規(guī)則相組合進行對比。保持輸入的訓練集和測試集樣本數(shù)據(jù)不變,選擇半梯半嶺分布隸屬度函數(shù)邊緣屬性參數(shù)和訓練集樣本平均值,定義其為三角分布隸屬度函數(shù)屬性參數(shù),梯形分布隸屬度函數(shù)屬性參數(shù)與表4參數(shù)保持一致,建立相對應的水蜜桃成熟度分類模型。
表6 不同水蜜桃成熟度判別模型對比Table 6 Comparison of different peach maturity discrimination models
表6所示,對比三角分布和梯形分布隸屬度函數(shù),采用平滑且具有區(qū)間性的半梯半嶺分布隸屬度函數(shù)能夠提高水蜜桃成熟度判別正確率2.08%~12.50%。對比常見的最大隸屬度法,采用聚核權規(guī)則能夠減少相鄰成熟階段之前的混淆信息,平均提高各成熟階段判別正確率9.91%。舉例而言,當輸入某七成熟的水蜜桃樣本指標值:出汁率74.86%,糖度8.16%,硬度24.70N,失重率4.45%,計算得出原始隸屬度向量組B=[0.57,0.64,0.31,0.04],若根據(jù)最大隸屬度法,輸出該水蜜桃樣本為八成熟。根據(jù)聚核權規(guī)則,由于p′-p″<0.1,引入聚核權向量,調整后隸屬度向量組B1=[0.49,0.44,0.37,0.29],則正確輸出該水蜜桃樣本為七成熟。此外,對水蜜桃不同成熟階段而言,七成熟和十成熟判別準確率較高。成熟等級較低的水蜜桃,根據(jù)其隸屬度可以較為容易的判別為七成熟;而一些成熟等級較高的水蜜桃,較大的果實生理指標變化能夠提高該階段的判別準確率。因此,F(xiàn)CKC模型更好地考慮了水蜜桃成熟度的模糊性和不確定性,更符合其生長成熟趨勢。
為了對比FCKC模型與其他常見分類器的判別效果,選擇廣義神經網(wǎng)絡(GRNN)和多分類支持向量機(MSVM)[28],固定訓練集和測試集樣本數(shù)據(jù),設置最優(yōu)參數(shù)獲取最佳判別結果,如表7所示。MSVM模型正確判別了44個水蜜桃樣本(七成熟樣本11個,八成熟樣本10個,九成熟樣本11個,十成熟樣本12個);GRNN模型正確判別了42個水蜜桃樣本(七成熟樣本10個,八成熟樣本10個,九成熟樣本10個,十成熟樣本12個)。模型各階段判別正確率如圖4所示,MSVM和GRNN對水蜜桃成熟度判別整體正確率分別為91.67%和87.50%,基本實現(xiàn)水蜜桃成熟度的判斷,但正確率略低于FCKC方法。尤其是對于八成熟和九成熟的水蜜桃而言,傳統(tǒng)的分類方法因其成熟度界限量化的明確性,出現(xiàn)模糊區(qū)間信息時,誤判的可能性會增大??紤]到成熟階段間模糊信息較多,利用FCKC方法能夠提供更科學合理、包容性更強的判斷依據(jù),對水蜜桃等模糊成熟度判別更有效。
表7 水蜜桃成熟度MSVM和GRNN模型判別結果Table 7 Peach maturity discrimination results of MSVM and GRNN models
圖4 FCKC模型與常見分類器判別方法正確率對比Fig.4 Comparisons of discrimination accuracy between FCKC model and classifiers
本研究以提高水蜜桃成熟度判別精度為目的,選擇與水蜜桃成熟相關的出汁率、糖度、硬度和失重率指標構建多維指標數(shù)據(jù)集,建立基于FCKC的水蜜桃成熟度判別方法。該方法能夠融合評價水蜜桃成熟等級的多個指標信息,考慮了成熟度的模糊性和區(qū)間性,極大程度減少指標數(shù)據(jù)映射成熟度過程的不確定性和相鄰成熟階段的混淆性,判別正確率達到93.75%。結果發(fā)現(xiàn),影響水蜜桃成熟的指標綜合權重由大到小依次為糖度、出汁率、硬度和失重率。此外,對比傳統(tǒng)的三角分布隸屬度函數(shù)和最大隸屬度去模糊化規(guī)則,所提的FCKC模型提高了測試集正確率2.08%~12.50%;對比GRNN和MSVM分類器,FCKC模型能夠提高各成熟階段的判別精度,證明了本研究提出的水蜜桃成熟度判別方法有效性,能夠更精確地識別水蜜桃成熟狀態(tài),為水蜜桃食品加工提供科學精準的品質劃分依據(jù)。
本研究圍繞水蜜桃成熟度識別做了初步探索,未來仍有改進空間和更多應用場景。一方面,考慮到水蜜桃品種差異,通過增加成熟評價指標,設計符合多品種的模糊分類方法,提高判別模型的精確度和普適性。另一方面,結合水蜜桃成熟度判別方法,區(qū)分出不同成熟狀態(tài)的水蜜桃,匹配最佳的儲運條件;同時,根據(jù)成熟度變化規(guī)律,提前制定科學的定價和銷售策略,以降低水蜜桃腐爛滯銷的風險,提高水蜜桃產業(yè)的經濟效益。