江 輝 劉良源 陳全勝
(1.江蘇大學(xué)電氣信息工程學(xué)院, 鎮(zhèn)江 212013; 2.江蘇大學(xué)食品與生物工程學(xué)院, 鎮(zhèn)江 212013)
收獲后花生在流通和儲(chǔ)藏過程中,容易受到霉菌的污染而發(fā)生霉變。其中,黃曲霉毒素在霉變花生中常被檢出[1]。而黃曲霉毒素B1(Aflatoxin B1, AFB1)毒性最大,是目前已知霉菌中毒性最強(qiáng)的。長期少量攝入該物質(zhì)會(huì)引起慢性中毒,進(jìn)而促使肝臟發(fā)生慢性損傷[2]。因此,AFB1被國際癌癥研究機(jī)構(gòu)劃定為Ⅰ類致癌物,我國對(duì)花生及其制品中的AFB1限量指標(biāo)為20 μg/kg。花生受到AFB1污染后不僅會(huì)降低花生的營養(yǎng)和商業(yè)價(jià)值,更重要的是影響花生及其制品的可食性和安全性[3]。因此,實(shí)現(xiàn)對(duì)花生AFB1的準(zhǔn)確檢測具有現(xiàn)實(shí)意義。
糧食中AFB1的傳統(tǒng)檢測方法主要有薄層色譜法、高效液相色譜法、免疫學(xué)方法等[4]。目前,高效液相色譜法已經(jīng)成為檢測糧食中AFB1的主要方法[5]。盡管該方法檢測精度高,但是其樣品檢測的前處理較為復(fù)雜且檢測時(shí)間長。此外,上述其他傳統(tǒng)檢測方法均屬于實(shí)驗(yàn)室理化分析法,耗時(shí)費(fèi)力、檢測成本高,難以滿足現(xiàn)代糧食中AFB1現(xiàn)場分析檢測的需求。因此,開發(fā)一種高效、綠色的檢測方法實(shí)現(xiàn)對(duì)花生AFB1的定量檢測十分必要。
嗅覺可視化技術(shù)是近年來發(fā)展迅速的無損檢測技術(shù)之一,它是一種新型嗅覺傳感器檢測方法[6]。該方法通過分析特定化學(xué)染料和待測物散發(fā)出的揮發(fā)性氣體反應(yīng)前后的顏色差值來實(shí)現(xiàn)待測物的屬性分析[7]。近年來,該技術(shù)已經(jīng)成功應(yīng)用于食品和農(nóng)產(chǎn)品品質(zhì)分析領(lǐng)域[8-17]。在谷物霉變程度的定性識(shí)別方面也有成功應(yīng)用[18-20]。但關(guān)于谷物真菌毒素的定量檢測方面相關(guān)報(bào)道甚少。此外,嗅覺可視化技術(shù)的核心是特異性強(qiáng)的色敏傳感器陣列的制備。但在傳感器的制備上,目前還沒有統(tǒng)一的理論來指導(dǎo)材料選型和制作流程?,F(xiàn)有大多研究都是根據(jù)經(jīng)驗(yàn)或者通過嘗試來選擇化學(xué)染料制備色敏傳感器陣列。
鑒于此,本文首先利用頂空固相微萃取氣相色譜-質(zhì)譜聯(lián)用技術(shù)(HS-SPEM-GC-MS)對(duì)不同霉變程度的花生樣本進(jìn)行分析,然后根據(jù)分析結(jié)果選擇合適的化學(xué)染料來制備特異性色敏傳感器陣列。利用化學(xué)計(jì)量學(xué)方法挖掘傳感器圖像數(shù)據(jù)特征,構(gòu)建非線性檢測模型以實(shí)現(xiàn)花生AFB1含量的嗅覺可視化技術(shù)定量檢測。
實(shí)驗(yàn)所用花生樣本從當(dāng)?shù)卮笮褪袌鲑徺I,共10 kg。將所有花生均勻放置在兩個(gè)金屬托盤上并放入溫度28℃、相對(duì)濕度80%恒溫恒濕箱(天津宏諾儀器有限公司)中,每天取適量樣本進(jìn)行理化實(shí)驗(yàn)測定AFB1含量。結(jié)果發(fā)現(xiàn),第5天取樣的花生樣本中檢出了AFB1,于是,此后每間隔一天從兩個(gè)托盤的不同位置取花生樣本20個(gè),每個(gè)樣本10 g。第8天以后,花生樣本的霉變情況已肉眼可見,終止取樣。共采集了不同霉變程度的花生樣本100個(gè)。
1.2 黃曲霉毒素B1含量測定
對(duì)采集的花生樣本,按照GB 5009.22—2016中規(guī)定的第2種方法(高效液相色譜-柱前衍生法)對(duì)花生樣本中的AFB1含量進(jìn)行檢測。
根據(jù)不同霉變程度花生樣本的HS-SPEM-GC-MS分析結(jié)果發(fā)現(xiàn),花生在霉變過程中,醛類物質(zhì)占比比較高且變化明顯,其中以己醛和壬醛為主;此外,2-正戊呋喃在花生霉變過程有增加的趨勢。因此,將己醛、壬醛和2-正戊呋喃作為花生霉變過程中產(chǎn)生的主要指示性特征揮發(fā)物。前期研究表明,大米、小麥等谷物劣變或霉變過程產(chǎn)生的揮發(fā)性物質(zhì)中同樣也是醛類和呋喃類物質(zhì)發(fā)生明顯變化[16,18-20],這與花生霉變過程中所產(chǎn)生的主要揮發(fā)性物質(zhì)類似。因此,基于課題組前期研究基礎(chǔ),選用同樣的化學(xué)染料(以卟啉類為主)來制備特異性強(qiáng)的色敏傳感器陣列,用于獲取不同霉變程度花生樣本的氣味信息。最終,色敏傳感器陣列制備所選用的化學(xué)染料分別為5,10,15,20-四苯基卟啉、四對(duì)甲氧苯基卟啉鐵、四苯基卟啉鐵、5,10,15,20-四苯基-21H,23H-卟吩銅(Ⅱ)、卟啉鈷、四苯基卟啉鋅、四苯基卟啉、2,3,7,8,12,13,17,18-八乙基-21H,23H-卟吩銅(Ⅱ)、八乙基卟吩、四苯基卟吩氧化釩、5,10,15,20-四苯基-21H,23H-卟吩羰基釕(Ⅱ)和2,3,7,8,12,13,17,18-辛乙基-21H,23H-卟吩釕(Ⅱ)羰基。
以聚偏二氟乙烯膜(Polyvinylidene fluoride, PVDF)(密理博公司,美國)作為基底來制備比色傳感器陣列,具體制備流程如下:① 將PVDF裁剪成4 cm×3 cm的長方形基底材料備用。② 將12種色敏材料各稱取8 mg分別溶于4 mL的二氯甲烷中,超聲10 min后即可得到2 mg/mL的溶液置于陰涼黑暗處備用。③ 用100 mm×0.3 mm的毛細(xì)管吸取1 μL溶液并利用陣列模板輔助點(diǎn)樣于疏水的PVDF上。靜置后即可得到色敏傳感器陣列。
利用平板掃描儀獲取色敏傳感器原始圖像數(shù)據(jù)。然后,取8 g經(jīng)多功能粉碎機(jī)(德清拜杰電器有限公司)粉碎的花生樣本粉末置于直徑60 mm的培養(yǎng)皿中,色敏傳感器利用雙面膠固定在保鮮膜上(正面朝上),并用該保鮮膜將培養(yǎng)皿密封后靜置反應(yīng)16 min后取出。最后,利用平板掃描儀獲取色敏傳感器反應(yīng)后的圖像數(shù)據(jù)。
利用Matlab軟件對(duì)得到的色敏傳感器陣列的原始圖像和反應(yīng)后的圖像分別進(jìn)行中值濾波、閾值分割,再分別提取各色敏點(diǎn)周圍12個(gè)像素半徑內(nèi)的R、G、B分量的灰度均值,并標(biāo)準(zhǔn)化到0~255之間。然后,利用反應(yīng)后傳感器陣列上各色敏點(diǎn)的顏色數(shù)值減去原始傳感器陣列上各對(duì)應(yīng)色敏點(diǎn)的顏色數(shù)值,這樣,就可獲取各對(duì)應(yīng)色敏點(diǎn)的3個(gè)顏色差值分量ΔR、ΔG、ΔB。最后,對(duì)獲得的ΔR、ΔG、ΔB進(jìn)行歸一化,疊加灰度圖像生成色敏傳感器特征圖像。在本文中,每個(gè)色敏傳感器陣列有12個(gè)色敏點(diǎn),每個(gè)色敏點(diǎn)可以得到3個(gè)顏色特征分量。因此,每個(gè)花生樣本的色敏傳感器特征值有36個(gè)顏色分量。
反向傳播神經(jīng)網(wǎng)絡(luò)(Back-propagation neural networks, BPNN)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[21]。BPNN網(wǎng)絡(luò)的主要特點(diǎn)是信號(hào)前向傳遞,誤差反向傳播,通過迭代優(yōu)化網(wǎng)絡(luò)的權(quán)值,使BPNN預(yù)測輸出與期望輸出盡可能一致。BPNN的學(xué)習(xí)過程是一個(gè)權(quán)值不斷修正的過程,過程不斷重復(fù)直到達(dá)到設(shè)定的學(xué)習(xí)次數(shù)或者輸出誤差達(dá)到預(yù)設(shè)值。本文BPNN作為回歸器被用于遺傳算法(Genetic algorithm, GA)優(yōu)化色敏傳感器陣列特征顏色分量。BPNN的參數(shù)設(shè)置如下:隱含層神經(jīng)元節(jié)點(diǎn)數(shù)設(shè)為10,學(xué)習(xí)率為0.1,動(dòng)量因子為0.95,初始權(quán)值為0.3,最小均方根誤差為0.001,最大訓(xùn)練次數(shù)為100。
GA是一類借鑒生物界的進(jìn)化規(guī)律演化形成的隨機(jī)化搜索方法[22-23]。本文利用GA對(duì)色敏傳感器陣列特征顏色分量組合進(jìn)行優(yōu)化。考慮到GA的隨機(jī)性,將GA獨(dú)立運(yùn)行50次,并對(duì)50次獨(dú)立運(yùn)行結(jié)果進(jìn)行統(tǒng)計(jì)分析,以消除隨機(jī)性對(duì)優(yōu)化結(jié)果的影響。GA參數(shù)設(shè)置如下:種群大小設(shè)置為20,交叉概率和變異概率分別設(shè)置為0.7和0.1,最大迭代次數(shù)設(shè)為100。
將GA嵌入到BPNN中用于優(yōu)化傳感器的最佳特征顏色分量組合。在此過程中,每次GA迭代后得到的顏色分量組合分別作為BPNN的輸入,花生AFB1含量作為BPNN的輸出。100次迭代結(jié)束后,根據(jù)各GA-BPNN模型對(duì)花生AFB1含量(質(zhì)量比)的預(yù)測值與參考值之間的平均誤差加權(quán)和最小原則來確定最佳顏色分量組合。GA的目標(biāo)函數(shù)Y定義為
(1)
式中Nt——訓(xùn)練集樣本數(shù)目
ei——訓(xùn)練集中第i個(gè)樣本的AFB1含量與BPNN模型中預(yù)測值之間的差值
Np——預(yù)測集樣本數(shù)目
ej——預(yù)測集中第j個(gè)樣本的AFB1含量與BPNN模型中預(yù)測值之間的差值
支持向量回歸(Support vector regression, SVR)是屬于支持向量機(jī)(Support vector machine, SVM)的一種推廣,專門用于處理回歸分析問題[24]。SVR的主要思想是引入核函數(shù)將樣本空間中非線性回歸映射為高維空間中的線性回歸問題,即尋找一個(gè)最優(yōu)分類超平面,使得所有訓(xùn)練樣本離該最優(yōu)超平面的誤差最小。回歸的目的是得到一個(gè)能夠盡量擬合訓(xùn)練集樣本的模型,通常用的方法是構(gòu)建一個(gè)樣本標(biāo)簽與模型預(yù)測值的損失函數(shù),使損失函數(shù)最小化,從而確定模型[25]。本文將徑向基函數(shù)(Radial basis function, RBF)作為核函數(shù)。
網(wǎng)格搜索(Grid search, GS)是最簡單、應(yīng)用最廣泛的超參數(shù)搜索算法,它是指定參數(shù)值的一種窮舉搜索方法,該方法是將估計(jì)函數(shù)參數(shù)通過交叉驗(yàn)證的方法進(jìn)行優(yōu)化以達(dá)到最優(yōu)的學(xué)習(xí)算法[26]。麻雀搜索算法(Sparrow search algorithm, SSA)是2020年提出的一種新型群智能優(yōu)化算法,SSA主要是受麻雀的覓食行為和反捕食行為的啟發(fā)[27],具有尋優(yōu)能力強(qiáng)、收斂速度快、穩(wěn)定性好、魯棒性強(qiáng)等特點(diǎn)[28]。利用GS和SSA優(yōu)化的SVR的懲罰參數(shù)C和核參數(shù)g以獲取最佳性能的SVR模型,并對(duì)模型結(jié)果進(jìn)行比較。在利用GS優(yōu)化SVR參數(shù)C和g時(shí),它們的取值范圍為[2-10, 2-9.5, …, 29.5, 210]。在利用SSA優(yōu)化SVR參數(shù)C和g時(shí),C的取值范圍設(shè)置為0.001~100,g取值范圍設(shè)置為 0.001~1 000,種群數(shù)量為20,最大迭代次數(shù)為100。
將訓(xùn)練集和預(yù)測集的樣本劃分成兩部分。第1部分用于色敏傳感器特征組合的優(yōu)化。為了消除各種隨機(jī)結(jié)果對(duì)優(yōu)化結(jié)果的影響,對(duì)GA-BPNN算法獨(dú)立運(yùn)行了50次。在優(yōu)化過程中,采用隨機(jī)抽樣,將訓(xùn)練集和預(yù)測集樣本按照3∶1的比例進(jìn)行劃分。這樣,訓(xùn)練集有75個(gè)樣本,預(yù)測集有25個(gè)樣本。第2部分用于SVR檢測模型的構(gòu)建。為了使模型獲得更好的泛化性能,將所有樣本根據(jù)AFB1含量從小到大排列,然后依次將每4個(gè)樣本中間的任意一個(gè)放入預(yù)測集,另外3個(gè)放入訓(xùn)練集。這就可以保證訓(xùn)練集的樣本特征包含預(yù)測集的樣本特征。同樣,訓(xùn)練集中有75個(gè)樣本,預(yù)測集中有25個(gè)樣本。表1為SVR構(gòu)建時(shí)的樣本劃分情況。從表1可以看出,訓(xùn)練集和預(yù)測集中花生樣本的AFB1含量平均值和標(biāo)準(zhǔn)差沒有明顯差異。
表1 訓(xùn)練集和預(yù)測集中AFB1含量統(tǒng)計(jì)結(jié)果Tab.1 Statistical distribution of AFB1 values in training set and prediction set μg/kg
圖1為預(yù)處理后的不同AFB1含量花生樣本的色敏傳感器陣列特征圖像。從圖1可以看出,不同AFB1含量花生樣本的傳感器特征圖像是有明顯差異的。因此可以推斷出,花生在霉變過程中產(chǎn)生的揮發(fā)性物質(zhì)成分發(fā)生了顯著變化,指示性揮發(fā)性物質(zhì)的含量也在不同階段發(fā)生了特定變化,而這些變化可以被色敏傳感器陣列捕獲,并以不同的顏色灰度呈現(xiàn)出來。從圖1中還可以觀察到,有些顏色變化較大的色敏點(diǎn)肉眼就能清晰可辨,這說明所制備的色敏傳感器陣列能夠有效地反映不同霉變花生樣本氣味信息的變化情況。但是,也有一些色敏點(diǎn)顏色飽和度之間的差異較小,這可能是鄰近霉變階段揮發(fā)性物質(zhì)變化較小導(dǎo)致了顏色反應(yīng)沒那么明顯。這也間接地表明了不同色敏點(diǎn)之間的特征數(shù)據(jù)存在一定的信息冗余。因此,在SVR檢測模型構(gòu)建前,有必要對(duì)色敏傳感器的特征顏色分量組合進(jìn)行優(yōu)化。
圖1 不同霉變程度花生樣本的差值圖像Fig.1 Difference images of peanut colorimetric sensor with different mildew degrees
圖2 50次獨(dú)立運(yùn)行GA-BPNN算法后每個(gè)顏色分量 被選擇的累積頻次Fig.2 Cumulative frequency of each color component selected after GA-BPNN algorithm ran independently for 50 times
圖2為GA-BPNN獨(dú)立運(yùn)行50次后各個(gè)顏色分量被選中的累積頻次。從圖2可以看出,所有顏色分量都有被選中,且被選中最低頻次的顏色分量都達(dá)到了10次。這間接說明了GA-BPNN在每一次的變量優(yōu)選過程中保留了比較多的變量,這可能與GA優(yōu)化準(zhǔn)則有一定的關(guān)系。從圖2還可以看出,有多個(gè)顏色分量被選中的頻次比較高,尤其是第12、23、28個(gè)這3個(gè)顏色分量,它們的累積次數(shù)均超過了40次,這說明了在每次變量優(yōu)化過程中,這3個(gè)顏色分量幾乎都被選到,這表明這3個(gè)顏色分量可能有效反映了霉變花生中AFB1含量的變化。而有些顏色分量所選次數(shù)較低,比如第6個(gè)和第26個(gè)等,這表明這些顏色分量與霉變花生AFB1含量之間的相關(guān)性較小。從圖2進(jìn)一步分析可以發(fā)現(xiàn),有13個(gè)顏色分量被選的次數(shù)超過30次,有7個(gè)顏色分量所選頻次超過35次,依次為第3、12、19、23、25、28、32個(gè)顏色分量。在7個(gè)顏色分量中,有3個(gè)分量累積頻次超過40次,依次為第12、23、28個(gè)顏色分量。因此,基于上述分析結(jié)果,將基于13、7、3個(gè)顏色分量的3種組合分別作為輸入特征來構(gòu)建SVR模型,并比較不同SVR模型的預(yù)測性能。
表2為基于不同顏色分量組合分別建立的SVR模型結(jié)果。從表2可以看出,在GS-SVR模型中,模式2模型獲得了最佳的預(yù)測性能。盡管模式3下選用的顏色分量個(gè)數(shù)最少,但是建立的GS-SVR模型性能低于模式1和模式2兩種模式下得到的GS-SVR模型性能。這說明建模選用的特征變量過少在一定程度上不能很好地保留原始數(shù)據(jù)的內(nèi)在特征,從而影響模型的預(yù)測性能。
從表2進(jìn)一步分析可以看出,相較于GS-SVR模型,SSA-SVR模型整體上獲得了更好的預(yù)測效果。這可能是因?yàn)榫W(wǎng)格搜索法一般會(huì)先使用較廣的搜索范圍和較大的步長,然后會(huì)逐漸縮小搜索范圍和步長,來尋找更精確的最優(yōu)值。這種操作方案可以降低所需的時(shí)間和計(jì)算量,但由于目標(biāo)函數(shù)一般是非凸的,所以很可能會(huì)錯(cuò)過全局最優(yōu)值。而SSA具有高性能的搜索能力,使得其能夠很好地搜索全局最優(yōu)的潛在區(qū)域,并且可以有效地避免陷入局部最優(yōu)的問題。因此,該模型整體性能優(yōu)于GS-SVR模型。
表2 基于不同顏色分量組合建立的SVR模型結(jié)果Tab.2 Results of different SVR models based on different combinations of color components
對(duì)于SSA-SVR模型,從表2可以看出,同樣是模式2下得到的SSA-SVR模型性能最佳,模式3下建立的SSA-SVR模型性能低于模式1和模式2兩種模式下建立的SSA-SVR模型性能,這與不同模式下GS-SVR模型的性能結(jié)果一致。由此可見,盡管利用更少的特征變量來建??珊喕P徒Y(jié)構(gòu),但所得到SVR模型的預(yù)測性能在一定程度上有所削弱。綜合考慮模型的性能和復(fù)雜度,認(rèn)為模式2下得到的最佳SSA-SVR模型為最優(yōu)模型。圖3 為最佳SSA-SVR模型在訓(xùn)練集和預(yù)測集中的預(yù)測值和實(shí)測值之間的散點(diǎn)圖,其RP為0.914 2、預(yù)測均方根誤差為5.683 2 μg/kg、剩余預(yù)測偏差為2.392 6。
圖3 SSA-SVR模型預(yù)測值與測量值的關(guān)系Fig.3 Interrelationship between measured and predicted values in SSA-SVR model
針對(duì)花生霉變過程中指示性特征揮發(fā)性物質(zhì)制備了特異性強(qiáng)的色敏傳感器陣列,實(shí)現(xiàn)了霉變花生AFB1的定量檢測。通過引入GA-BPNN算法對(duì)色敏傳感器的顏色分量進(jìn)行優(yōu)化,建立了基于不同優(yōu)化特征組合的SVR模型,并比較了GS和SSA兩種優(yōu)化算法對(duì)SVR參數(shù)優(yōu)化的效果。結(jié)果發(fā)現(xiàn),SSA-SVR模型性能整體上優(yōu)于GS-SVR模型性能,且基于7個(gè)特征顏色分量組合的SSA-SVR模型得到了最佳預(yù)測結(jié)果,其RP為0.914 2,預(yù)測均方根誤差為5.683 2 μg/kg,剩余預(yù)測偏差達(dá)到2.392 6。結(jié)果表明,利用嗅覺可視化技術(shù)結(jié)合適當(dāng)?shù)幕瘜W(xué)計(jì)量學(xué)方法實(shí)現(xiàn)花生中AFB1含量的定量檢測是可行的,研究結(jié)果可為儲(chǔ)藏期花生等谷物中真菌毒素的定量、現(xiàn)場檢測提供一種新的技術(shù)方法參考。
農(nóng)業(yè)機(jī)械學(xué)報(bào)2022年12期