陳 峰, 李鶴東, 王亞棋, 付海燕,,*, 鄭福平,3
(1.克萊姆森大學 食品營養(yǎng)和包裝科學系, 美國 克萊姆森 29634; 2.中南民族大學 藥學院, 湖北 武漢430074; 3.北京工商大學 北京食品營養(yǎng)與人類健康高精尖中心, 北京 100048)
?
化學計量學方法在食品分析中的應(yīng)用
陳 峰1, 李鶴東2, 王亞棋1, 付海燕1,2,*, 鄭福平1,3
(1.克萊姆森大學 食品營養(yǎng)和包裝科學系, 美國 克萊姆森 29634; 2.中南民族大學 藥學院, 湖北 武漢430074; 3.北京工商大學 北京食品營養(yǎng)與人類健康高精尖中心, 北京 100048)
化學計量學是由數(shù)學、統(tǒng)計學、化學及計算機科學交叉形成的具有獨特魅力的重要新興學科。作為其核心理論體系的模式識別和多維校正方法,在海量數(shù)據(jù)信息挖掘與處理、分析信號分辨與解析中,體現(xiàn)了突出的優(yōu)勢,并能攻克傳統(tǒng)分析方法難以處理的復(fù)雜難題,已廣泛應(yīng)用于食品分析領(lǐng)域。系統(tǒng)介紹了化學計量學核心理論方法及其在食品分析中的應(yīng)用及研究進展,詳細分析了模式識別和多維校正方法的基本原理及優(yōu)缺點,指出了目前化學計量學方法在食品分析領(lǐng)域研究中需要解決的問題并對其未來發(fā)展方向進行了展望。
化學計量學; 食品分析; 模式識別; 多維校正
食品分析的核心任務(wù)是通過對反映食品特征品質(zhì)(如食品營養(yǎng)活性成分、外源的農(nóng)藥獸藥殘留、非法添加的違禁物質(zhì)、內(nèi)源的霉菌毒素等指標,以及食品分級分類、摻偽假冒等)的量測數(shù)據(jù)性質(zhì)和信息進行甄別和定性定量分析,進而為評判食品質(zhì)量好壞和食用安全性提供依據(jù)[1]。食品種類繁多、成分復(fù)雜,各種食品安全與質(zhì)量問題屢有發(fā)生,因此,發(fā)展快速、高效、簡便的食品分析方法至關(guān)重要。目前,一些現(xiàn)代分析技術(shù),如色譜- 質(zhì)譜聯(lián)用技術(shù)[2]、近紅外光譜技術(shù)[3]、中紅外光譜技術(shù)[4]、原子光譜技術(shù)[5]、電子鼻技術(shù)[6]、電子舌技術(shù)[7]等,均已成功應(yīng)用在現(xiàn)代食品分析領(lǐng)域。但歸根結(jié)底,無論需要處理的食品問題怎么變化,各種現(xiàn)代分析儀器或檢測技術(shù)獲得的是食品中具有不同內(nèi)涵性質(zhì)的各種類型的信息數(shù)據(jù),而化學計量學針對數(shù)據(jù)信息挖掘與處理,特別是對復(fù)雜體系隱含信息的提取,能提供強大的手段,因此,化學計量學必然會在解決食品分析問題中發(fā)揮重要的作用。
化學計量學是20世紀70~80年代興起的一門交叉學科。它基于數(shù)學、統(tǒng)計學、化學及計算機科學的方法和原理,設(shè)計優(yōu)化實驗,挖掘與處理、分辨與解析實驗量測數(shù)據(jù)的信息,從而獲取復(fù)雜分析體系中隱含的有用信息[8]?;瘜W計量學包括實驗設(shè)計、信號解析、模式識別、多元分辨和多維校正等理論體系,擁有廣闊的應(yīng)用領(lǐng)域,其中,模式識別和多維校正理論及其應(yīng)用是化學計量學中最為重要并且最具發(fā)展?jié)摿Φ念I(lǐng)域之一。
本文介紹了化學計量學處理的分析對象即數(shù)據(jù)結(jié)構(gòu)類型,重點闡述用于處理相應(yīng)數(shù)據(jù)結(jié)構(gòu)類型的化學計量學中經(jīng)典的模式識別和多維校正方法的基本原理,評述各種方法間的適用性和優(yōu)缺點,詳細介紹了化學計量學方法在食品分析中的應(yīng)用,簡要分析了化學計量學方法在食品分析領(lǐng)域中還需進一步解決的問題并對其未來的發(fā)展進行展望。
化學計量學這一學科的創(chuàng)始人之一,美國化學家Kowalski教授,基于張量代數(shù)理論,對實驗過程中所獲得的各種不同量測數(shù)據(jù)進行過簡單的分類。隨著日益復(fù)雜的數(shù)據(jù)產(chǎn)生,其張量數(shù)據(jù)結(jié)構(gòu)分類也在不斷地得到總結(jié)和歸納[9-11]。圖1形象地描述了各種儀器和檢測技術(shù)所獲取的原始張量數(shù)據(jù)結(jié)構(gòu)類型,并區(qū)分了數(shù)據(jù)的“階”和“維”的概念,以及模式識別與多維校正所適應(yīng)于處理的相應(yīng)張量數(shù)據(jù)類型。這里針對于單個樣品數(shù)據(jù)的結(jié)構(gòu)類型為“階”,而針對于具有相同結(jié)構(gòu)類型的多個樣品在一個維度方向延展組合的數(shù)據(jù)集為“維”(見圖1),故“維”比“階”高1個維度,而提取不同結(jié)構(gòu)類型數(shù)據(jù)集中隱含信息的方法需要依靠不同的化學模式識別及多維校正方法。當“零階儀器”(如單波長光度計、離子選擇性電極等)量測一個實驗樣本只產(chǎn)生一個響應(yīng)值時,該數(shù)據(jù)類型為標量,即零階張量;多個實驗樣本下該結(jié)構(gòu)類型數(shù)據(jù)組合的樣本數(shù)據(jù)集為矢量,相對應(yīng)處理該數(shù)據(jù)集的化學計量學方法為零階校正方法,如標準曲線法;類似地,“一階儀器”(如紫外- 可見分光光度計、熒光分光光度計、紅外或近紅外光譜儀、拉曼光譜儀以及核磁共振等各類光譜儀、單通道HPLC、電化學掃描儀或傳感器陣列等)量測一個實驗樣本獲得的數(shù)據(jù)類型是矢量,即一階張量,多個實驗樣本下該結(jié)構(gòu)類型數(shù)據(jù)組合的樣本數(shù)據(jù)集為矩陣,相對應(yīng)處理該數(shù)據(jù)集的化學計量學方法為一階校正方法或模式識別方法;同樣地,“二階儀器”(如各種色譜HPLC/GC、液相色譜毛細管電泳分離技術(shù)(HPLC/CE)與二極管陣列檢測器聯(lián)用儀(HPLC/DAD)、激發(fā)- 發(fā)射熒光儀(EX- EM)等)量測一個實驗樣本獲得的數(shù)據(jù)類型是矩陣,即二階張量,多個實驗樣本下該結(jié)構(gòu)類型數(shù)據(jù)組合的樣本數(shù)據(jù)集為三維數(shù)陣,相對應(yīng)處理該數(shù)據(jù)集的化學計量學方法為二階校正方法。近年新發(fā)展起來的“三階儀器”(如全二維氣相色譜或全二維液相色譜與二極管陣列或質(zhì)譜聯(lián)用儀(GC- GC/LC- LC- DAD/MS)等)的使用,使量測一個實驗樣本獲得的數(shù)據(jù)類型變成一個三維響應(yīng)數(shù)陣,即三階張量,而多個實驗樣本下該結(jié)構(gòu)類型數(shù)據(jù)堆疊組合的樣本數(shù)據(jù)集為四維數(shù)陣,相應(yīng)的處理該類數(shù)據(jù)集的化學計量學方法為三階校正方法。三階校正甚至更高階校正方法的理論體系是化學計量學中的難點和盲點,目前仍處于起步階段。
圖1 化學計量學方法處理的分析數(shù)據(jù)結(jié)構(gòu)類型示意Fig.1 Schematic diagram of data structure processed by chemometric method
1.1 模式識別
模式識別是利用統(tǒng)計學、信號處理、數(shù)學算法等工具,根據(jù)量測對象的特征性質(zhì)進行數(shù)據(jù)挖掘和信息提取,進而對所研究的物質(zhì)或現(xiàn)象進行聚類和分類判斷的方法[12]。模式識別方法適用于樣品數(shù)據(jù)集為矩陣數(shù)據(jù)的處理。根據(jù)方法基本原理,可分為多類聚類方法、判別分析方法和一類分類的類模型方法。多類聚類方法是將不同類別樣品根據(jù)不同的計算依據(jù),如樣本在空間分布的距離進行相似類聚、相異分離;判別分析方法是根據(jù)訓練集樣品進行學習,將兩類或多類樣品按照訓練的目標函數(shù)進行多類樣品識別和分類,但當未知的樣品屬于訓練集之外的類別時,判別分析方法將導(dǎo)致錯誤的判別結(jié)果;一類分類的類模型方法則只需訓練集中僅包含目標類樣品,通過建立目標類的類模型,達到從非目標類樣品中的目標類樣品識別。圖2給出了判別分析方法對兩類或多類和類模型對一類分類示意圖。圖2將化學計量學方法中常用的模式識別方法基本原理和優(yōu)缺點進行了歸納,為在食品分析應(yīng)用中選擇相應(yīng)的模式識別方法分析和解決問題提供了理論支持和依據(jù)。
圖2 判別分析方法對兩類或多類和類模型對一類分類示意Fig.2 Schematic diagram of two or multi -class by discrimination analysis method and one -class classification by class -modeling techniques
1.1.1 多類聚類和判別分析方法
1) 主成分分析
主成分分析(principle component analysis, PCA),是一種基于將原始變量轉(zhuǎn)換為互不相關(guān)的新特征變量之間的線性組合,并使其包含最大樣本方差,用較少的指標和變量特征反映和描述樣本的固有變異性及原始變量的特征,從而達到簡化和降低特征空間維數(shù)的建模方法[13]。PCA方法雖然可通過較少的幾個顯著主成分,最大化地保留和表征原始變量特征,但因其降維后的新組合信息量描述的是每個樣品的矢量空間分布,因而該算法在降維這一過程中,有時會丟失有助于判別各樣品間差異信息的變量特征,導(dǎo)致類內(nèi)和類間的樣品分類出現(xiàn)混亂。
2) K最近鄰分類算法
K最近鄰(K -nearest neighbor, KNN)分類算法是一種原理最為簡單的聚類分類技術(shù)[14]。該算法原理為將樣本定義在距離特征空間里,如果一個樣本的最接近的K個“鄰居”(即相鄰樣本)中的絕大多數(shù)均屬于同一個類別,則可決策該樣本也屬于這個類別,且具有該類別中其他樣本的特性。由于KNN方法對于樣品所屬類別的判定不是通過判別類域的方法進行決策,而是通過依靠該樣品周圍少量的相鄰樣本,因而不需要估計參數(shù),不需要訓練,適合對交叉重疊、稀有事件進行分類。該方法簡單、易于理解和實現(xiàn),但該算法在分類時的主要缺點是當每類樣本數(shù)量不平衡時,如一個類的樣本數(shù)很多,而其他類樣本數(shù)很少,則可能導(dǎo)致每當輸入一個新樣本時,該樣本的K個鄰居樣本中,數(shù)量多的類的樣本將會占多數(shù);另一個缺點是在大訓練集中尋找最近鄰點時,需要對每一個待分類的樣本計算其到全體已知樣本的距離,才能求得它的K個最近鄰點。此過程所需時間可能很長,容易造成“維數(shù)災(zāi)”,導(dǎo)致分類結(jié)果精度低。
3) 偏最小二乘判別分析
偏最小二乘判別分析(partial least squares discriminant analysis, PLSDA)方法是經(jīng)典的多類判別分析方法,該方法基于同時分解預(yù)測量測矩陣X和類別矩陣Y提取因子,并將因子按它們間相關(guān)性從大到小進行排列,再通過交互驗證確定隱變量個數(shù),參與回歸建模。該方法將樣品集編碼為類別矩陣Ym×n(類別矩陣中的所有第i類樣品的第i個元素編碼均為1,其余元素編碼均為0),然后基于類別矩陣的每一列關(guān)聯(lián)預(yù)測矩陣Xm×v,進行回歸建模,求解回歸矩陣Rv×n,見式(1)。
Ym×n=Xm×vRv×n。
(1)
由求得的回歸矩陣Rv×n與所需預(yù)測的未知樣品的量測矩陣再進行回歸關(guān)聯(lián),即可計算得到未知樣品的類屬矩陣Yp,見式(2)。
Yp=XpRp×k。
(2)
最后,再根據(jù)已知類別矩陣的編碼位置,解碼類屬矩陣中最大元素所在的位置,若最大元素出現(xiàn)在第i個位置,則可將該樣品甄別為第i類[15]。
該方法在多類分類判別分析中性能穩(wěn)健,可以減少變量間多重共線性產(chǎn)生的影響,但是有時會由于樣品的組成和變量性質(zhì)間缺乏相關(guān)關(guān)系,使模型受到無用信息變量的干擾,從而導(dǎo)致判別分析精度降低甚至錯誤。
4) 移動窗口偏最小二乘判別分析法
移動窗口偏最小二乘方法(moving window partial least -squares discriminant analysis, MWPLSDA)是在偏最小二乘判別方法基礎(chǔ)上引入變量挑選的策略。該方法的原理是基于虛擬設(shè)置一個尺寸大小為包含變量數(shù)為w的窗口在量測矩陣變量區(qū)間連續(xù)移動(即移動的窗口內(nèi)所包含的建模變量數(shù)w為從窗口起點j到終點(j+w-1)個變量),基于移動窗口中的變量構(gòu)建一系列的 PLSDA子模型,并計算在不同隱變量數(shù)時,這一系列窗口中分類子模型的殘差平方和,最后將不同隱變量PLSDA子模型的殘差平方和對窗口作圖,即可依據(jù)殘差平方和最小的原則挑選出少而精的量測矩陣變量區(qū)間,重新組合構(gòu)建新的PLSDA模型[16]。該方法能最有效提取有利于分類的變量特征差異信息,從而消除一些非線性物理擾動或非成分相關(guān)等各種因素干擾,既能減小模型復(fù)雜度,又能提高模型精度,還能極大提高運算建模速度。但是,該方法不能完全避免和克服變量區(qū)間中存在變量信息重疊的問題,從而有時可能對PLSDA模型分類精度改善不明顯。
5) 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)是通過模擬人腦結(jié)構(gòu),以對大腦的生理研究成果為基礎(chǔ),并基于數(shù)理方法進行簡化抽象和模擬的一種智能仿生的自適應(yīng)運算模型和信息處理系統(tǒng)[17-20]。該算法作為分類聚類運算時可分為有監(jiān)督學習和無監(jiān)督學習兩種方式。其中,有監(jiān)督學習的原理是將訓練樣本輸入到網(wǎng)絡(luò),并將網(wǎng)絡(luò)輸出和期望的目標值相比較,獲得誤差值,據(jù)此控制連接權(quán)重值連接強度的調(diào)整,經(jīng)過多次訓練中不斷朝誤差減小的方向收斂,自適應(yīng)計算出一個確定的權(quán)重值,進而獲得滿意精度的網(wǎng)絡(luò)輸出值;無監(jiān)督學習的原理則不給輸入網(wǎng)絡(luò)訓練樣本,直接根據(jù)已建立的聚類進行自組織的權(quán)重值調(diào)整,學習規(guī)律的變化服從連接權(quán)值的演變方程。該算法不依賴于精確的數(shù)學模型,能擬合強的非線性關(guān)系,具有并行性、容錯性、非線性、自組織學習和自適應(yīng)處理能力等特點,但該算法常易陷入過擬合和局部最優(yōu),在某種程度上限制了它的實際使用。
6)支持向量機
支持向量機(support vector machine, SVM)是Vapnik等[21]于1995年首先提出的基于統(tǒng)計學理論的一種新的非常有潛力和廣闊應(yīng)用前景的分類模式識別方法[22-24]。該方法的本質(zhì)是解決一個二次規(guī)劃問題,并最終可轉(zhuǎn)化為凸優(yōu)化問題,且在運算過程中基于統(tǒng)計學習理論的VC理論和采用結(jié)構(gòu)風險最小化原理,能保證算法收斂的全局最優(yōu)性,從而使得該方法建模時基本不受到訓練樣本數(shù)的影響,即使在其訓練樣本建模數(shù)量較少時,該算法依然表現(xiàn)出良好的泛化能力。但是,該方法通常都需要計算和存儲Hessian矩陣,當數(shù)據(jù)量較大時,訓練速度極大地受到訓練集規(guī)模的影響,求解過程所需計算資源很大,有時會出現(xiàn)計算阻滯,這樣使得SVM建模求解時更適合于處理樣本數(shù)較小的實驗體系。此外,該方法性能直接受到模型中所選擇的核函數(shù)的影響,而對于選擇最佳的核函數(shù)構(gòu)建針對特定問題的SVM模型仍是一個難題。因此,作為一種新興的技術(shù),SVM目前在實際應(yīng)用中也有一定的局限性。
1.1.2 一類分類的類模型方法
模式識別方法中的多類聚類和判別分析方法通常是對兩類或幾類、多類樣品進行學習和預(yù)測。在實際分析問題中,這些方法難以對層出不窮的摻雜、假冒樣品進行完備的采樣和學習,因此對兩類、多類樣品的分類遠遠不能滿足無目標檢測的要求。特別是由于非法添加物數(shù)不勝數(shù)、層出不窮,以及受原產(chǎn)地域保護產(chǎn)品的干擾影響,也不可能對所有其他產(chǎn)地與產(chǎn)品完全采樣,很難建立全面的常規(guī)檢測體系和制度。這種食品安全檢驗中的缺陷在國內(nèi)外引發(fā)了多次嚴重的食品安全危機,引起公眾對農(nóng)產(chǎn)品和食品安全性的普遍擔憂,因此,發(fā)展“無目標”檢測方法,是幫助解決此類問題的一個有效補充手段?;瘜W計量學中的一類分類(one -class classification)的類模型方法(class -modeling techniques)[25-29]對于該類問題的解決提供了強有力的分析手段。該類方法僅對我們感興趣的一類樣品(如地理標志產(chǎn)品、純正食品)的代表性樣品進行充分采樣、檢測和表征,對測量信號建立類模型,通過對未知樣品測量信號的分析,進一步發(fā)現(xiàn)假冒、摻雜引起的(很可能是比較細微的、僅憑肉眼難以分辨的)信號差異,最終目的是盡可能全面地檢出已知或未知的各種摻雜。傳統(tǒng)的一類分類的類模型方法主要有以下幾種:1)基于軟獨立模型類簇法(soft independent modelling of class analogy, SIMCA)[30]及其變種;2)基于多元正態(tài)分布和Hotelling的TZ統(tǒng)計量的非均勻分布類(unequal dispersed classes, UNEQ)模型[31];3)基于各種勢函數(shù)和概率密度估計的類模型方法[32];4)基于人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)的類模型方法[33]。其中,傳統(tǒng)的一類分類的類模型方法中最為經(jīng)典的SIMCA算法由于其簡便性、有效的數(shù)據(jù)降維和對誤差分布的較少假定,獲得了廣泛的應(yīng)用,已被收入大多數(shù)化學計量學教科書中。但是,SIMCA在實際應(yīng)用中仍然遇到一些困難,主要在于:1)顯著主成分數(shù)對其性能影響很大,太少的主成分數(shù)不能充分描述化學成分的變化,太多的主成分數(shù)則往往導(dǎo)致模型的過擬合;2)SIMCA決策區(qū)間的估計也存在一定困難,主要原因是殘差的相關(guān)性和由此引起的自由度估算不準確;3) SIMCA的隱變量側(cè)重于解釋類內(nèi)樣品的最大方差,并未考慮同類樣品的投影應(yīng)盡可能互相接近而有效避免與類外樣品相重疊,造成了隱變量降維與分類性能優(yōu)化的脫節(jié),以及SIMCA模型性能的退化。
在傳統(tǒng)一類分類的類模型基礎(chǔ)上,近年來提出了一種基于支持向量機(SVMs)的類模型方法,即支持向量數(shù)據(jù)描述算法(SVDD)[34]。SVDD在模型參數(shù)規(guī)范化的同時,使類內(nèi)樣品的主體到類中心的距離最小化。由于SVDD立足于已獲得廣泛認可的SVMs,又有比較清晰的幾何意義,受到較多關(guān)注。但是,SVDD也存在一些問題[35]:1) SVDD中的參數(shù),如規(guī)范化參數(shù)、高斯核函數(shù)的寬度參數(shù)在很大程度上依靠經(jīng)驗選取,尚沒有客觀的估計方法;2) SVDD容易發(fā)生過擬合。此外,還提出了以經(jīng)典的PLS回歸為基礎(chǔ)的一類偏最小二乘(one -class partial least square, OCPLS)方法[36],OCPLS隱變量是類內(nèi)樣品向類中心的投影,并考慮了訓練集樣品特征數(shù)據(jù)陣的方差解釋和類內(nèi)樣品投影的緊密性,并對未知樣品在給定顯著性水平下的決策區(qū)間進行一類分類,該方法目前發(fā)展了MATLAB的OCPLS工具包[37]。但是,該方法在隱變量的構(gòu)造和回歸計算中,若存在奇異樣品,可能會導(dǎo)致模型的嚴重偏差。
1.2 多維校正
多維校正方法是化學計量學最為核心的理論部分,它立足于創(chuàng)新性地構(gòu)建定量分析的基礎(chǔ)理論,發(fā)展針對不同結(jié)構(gòu)類型量測數(shù)據(jù)的相應(yīng)校正方法,通過構(gòu)建的多維校正模型從不同結(jié)構(gòu)類型數(shù)據(jù)的海量信息中最大限度地提取隱含的有用信息進行定量表征,從而解決各種復(fù)雜的實際分析體系中的問題和難題[38]。將化學計量學方法中常用的多維校正方法基本原理和優(yōu)缺點進行歸納,為在食品分析應(yīng)用中選擇相應(yīng)的多維校正方法分析和解決問題提供理論支持和依據(jù)。
1.2.1 一階校正
一階校正方法用于處理和解析樣本集為矩陣結(jié)構(gòu)類型的量測數(shù)據(jù),是目前化學計量學理論中最為成熟且應(yīng)用最廣泛的校正方法[38]。一階校正方法的代表性算法主要有P -矩陣法、K -矩陣法、主成分回歸(PCR)和偏最小二乘回歸(PLS)等。其中P -矩陣法和K -矩陣法在求解過程中涉及到矩陣求逆,這就要保證量測矩陣與樣品性質(zhì)響應(yīng)矩陣均為滿秩矩陣這一前提,而實際量測數(shù)據(jù)變量數(shù)通常都會多于樣品中的組分數(shù),這就存在矩陣虧秩而導(dǎo)致不確定性的解析結(jié)果。針對矩陣虧秩,PCR是基于量測矩陣的奇異值分解(SVD),然后采用顯著的奇異值重構(gòu)量測矩陣,從而能獲得較為穩(wěn)健的解析結(jié)果。PLS是在PCR基礎(chǔ)上進一步發(fā)展,該方法基于量測矩陣和響應(yīng)矩陣同時進行SVD,這種求解方式能克服一些非線性擾動因素影響,從而使得模型精度更高和穩(wěn)健性更好。但是,一階校正因其在對矩陣分解時,存在矩陣雙線性分解旋轉(zhuǎn)的不確定性,其缺點是如果校正集樣品中未對預(yù)測集樣品中的其他干擾進行校正建模,則會出現(xiàn)依干擾程度的不同產(chǎn)生不同程度的預(yù)測偏差和錯誤。因此,為保證一階校正給出有物理意義的可靠解,必須要滿足校正集樣品包含預(yù)測集樣品的所有響應(yīng)組分和性質(zhì)。
1.2.2 二階校正
二階校正方法用于處理樣本集為三維數(shù)陣的結(jié)構(gòu)類型的數(shù)據(jù),是目前化學計量學理論中發(fā)展?jié)摿薮蟮男U椒?。二階校正方法針對一階校正所出現(xiàn)的不足,利用基于特殊性結(jié)構(gòu)的三維數(shù)陣分解具有唯一性的優(yōu)點,從而可以得到具有明確物理意義的唯一解,即可從未知和未校正的背景中提取目標分析物的信號。因此,二階校正方法比一階校正方法具有一個明顯的優(yōu)勢,無需要求校正集樣品包含預(yù)測集樣品中的各種未知干擾,即著名的數(shù)學分離“二階優(yōu)勢”[38]。依據(jù)三維數(shù)陣分解的不同原理,可將二階校正方法分為主要的三類:第一類是基于特征值分析的非迭代類算法,典型的代表性算法有秩消失因子分析(rank annihilation factor analysis, RAFA)算法[39]、廣義秩消失因子分析(GRAM)算法[40]和直接三線性分解算法(direct trilinear decomposition,DTLD)[41]。這類算法的優(yōu)點是對組分數(shù)估計不敏感,可以實現(xiàn)未知干擾下目標分析物的定量分析,但缺點是因該類算法對不嚴格服從三線性成分模型或包含較大噪聲的三維數(shù)陣進行三線性分解時方差較大,故對信噪比低的分析體系建模解析時,可能因復(fù)數(shù)解而出現(xiàn)嚴重偏差。第二類是基于展開形式迭代的最小二乘(ALS)擬合類算法,平行因子分析(parallel factor analysis , PARAFAC)是該類算法中的經(jīng)典代表[42]。基于嚴格意義上的最小二乘原理的PARAFAC優(yōu)點是對噪聲影響不敏感,能對三線性成分模型進行最優(yōu)擬合,模型偏差較小。缺點是該算法對初始值和組分數(shù)敏感,易陷入局部最優(yōu),且通過展開形式計算,收斂速度較慢。第三類是基于切片形式的矩陣雙廣義逆運算方式類算法,其經(jīng)典代表有交替三線性分解(alternating trilinear decomposition, ATLD)算法[43],該方法基于對切片矩陣對角元素和廣義逆求解結(jié)合的方式,充分結(jié)合了 PARAFAC 和 DTLD 的優(yōu)點,兼具對組分數(shù)不敏感和收斂速度快的雙重優(yōu)點。在該算法基礎(chǔ)上,研究者們針對不同三維數(shù)陣數(shù)據(jù)特點,發(fā)展了一系列性能優(yōu)良的基于切片形式的ATLD變種算法[44],例如:自加權(quán)交替三線性分解(self -weighted alternating trilinear decomposition,SWATLD)算法[45]、交替懲罰三線性分解(alternating penalty trilinear decomposition, APTLD)算法[46]等。
1.2.3 三階校正及高階校正
三階校正及高階校正用于處理樣本集為四維數(shù)陣甚至更高維數(shù)陣的結(jié)構(gòu)類型的數(shù)據(jù),是目前化學計量學多維校正領(lǐng)域中的前沿難點理論。三階校正方法是通過引入額外一維的維度優(yōu)勢,克服二階校正方法在解決復(fù)雜體系中存在高共線或嚴重基體效應(yīng)時會出現(xiàn)較大偏差甚至錯誤的問題[47]。目前,已報道的方法有基于數(shù)陣展開形式的四維平行因子分析(four -way parallel factor analysis, Four -way PARAFAC)法[48]、基于數(shù)陣切片形式的交替懲罰四線性分解(alternating penalty quadrilinear decomposition, APQLD)法[49]、歸一化自加權(quán)交替四線性分解(regularized self -weighted alternating quadrilinear decomposition, RSWAQLD)法[50]及基于數(shù)陣不完全展開和切片形式相結(jié)合的交替加權(quán)殘差約束四線性分解(alternating weighted residual constraint quardrilinear decomposition, WRCQLD)算法[51]等。三階校正方法在充分發(fā)揮“二階優(yōu)勢”的基礎(chǔ)上,還具有二階校正不能比擬的維度優(yōu)勢。
由于能直接產(chǎn)生四階及更高階張量數(shù)據(jù)的儀器比較少見,而通過加入時間或pH值等維度構(gòu)建更高維數(shù)據(jù)的實驗工作量很大,所以關(guān)于更高階校正方法的研究相對較少?,F(xiàn)有的高階校正大多拓展自迭代類的三階校正方法,如交替五線性分解(alternating quinquelinear decomposition, AQQLD)[52]、約束交替多線性分解(constrained alternating multilinear decomposition, CAMLD)[53]、展開的偏最小二乘結(jié)合殘差多線性(unfolded partial least -squares with residual multilinearization, U -PLS/RML)[54]等。更高維校正方法與三維校正方法一樣具有“二階優(yōu)勢”,同時也具有一些額外的其他優(yōu)勢——“高階優(yōu)勢”。由于目前研究有限,高維校正方法的更多潛能還有待在理論和實際分析應(yīng)用中進一步探索和發(fā)現(xiàn)。
2.1 多類聚類和判別分析方法在食品分類和判別分析中應(yīng)用
多類聚類和判別分析方法在解決食品品質(zhì)分級分類和判別分析問題中具有很高的應(yīng)用價值,如用于食品品質(zhì)精細分級和不同品牌分類、原產(chǎn)地溯源識別研究等;不同等級或劣質(zhì)產(chǎn)品通??筛鶕?jù)光譜、色譜、傳感等現(xiàn)代分析儀器獲得的樣品指紋譜圖或指標成分參數(shù),再利用多類聚類和判別分析方法進行聚類分析或特征提取,構(gòu)建模型來識別出不同樣品的屬性類別。Fu等[55]利用FT- NIR結(jié)合偏最小二乘判別分析(PLSDA)實現(xiàn)了不同貨架期及霉變葵花籽、大豆的判別分析,此外,還利用FT- NIR結(jié)合群聚策略的PLSDA方法實現(xiàn)了25種不同原產(chǎn)地的龍井的快速判別[56];Liu等[57]利用“Turn -off”熒光傳感結(jié)合PLSDA實現(xiàn)了29種不同物種、不同產(chǎn)區(qū)和不同等級綠茶的高靈敏識別。Wu等[58]利用HPLC結(jié)合主成分分析(PCA)和逐步線性判別分析(S- LDA)實現(xiàn)不同種類茶葉的判別分析;Lu等[59]利用UPLC- MS和FIMS指紋圖譜結(jié)合PLSDA用于判別不同產(chǎn)地的中國枸杞;Bajoub等[60]利用HPLC- ESI- IT MS結(jié)合線性判別分析(LDA)實現(xiàn)不同產(chǎn)地橄欖油的判別分析;研究者們利用FT- NIR、E -nose、UV- VIS 結(jié)合多類聚類和判別分析方法實現(xiàn)了不同產(chǎn)地松仁、藏紅花,不同種類蘋果,不同品牌的烈酒和醋的分類和判別[61-64];Xiao等[65]利用SBSE- TD- GC- MS和E -nose結(jié)合主成分分析及聚類分析(CA)實現(xiàn)不同產(chǎn)地黃酒的判別分析;Yu等[66]基于PCA和判別分析(DA)分析GC/MS、E -nose數(shù)據(jù)實現(xiàn)不同年限黃酒的判別; Chen課題組利用GC- MS結(jié)合主成分分析對不同制備方法下柚皮精油感官評價數(shù)據(jù)降維,分析原始精油組以及經(jīng)過光照作用、氧氣作用和熱處理等精油組間風味特征的差異,并通過聚類分析對各組精油的香氣值進一步分析,將各組精油中揮發(fā)性風味成分分為5類,闡釋了不同精油組成分變化與風味變化的關(guān)系[67];該課題組利用相同的化學計量學方法還成功研究了不同處理方式的柚子汁風味成分變化與風味關(guān)系[68],不同提取方式的柚子皮的香氣物質(zhì)變化特性[69]。表1列舉了模式識別中多類聚類和判別分析方法在食品分類和判別分析中的一些應(yīng)用。
表1 多類聚類和判別分析方法在食品分類和判別分析中的應(yīng)用
2.2 一類分類的類模型方法在食品摻假無目標分析中應(yīng)用
食品非法添加、摻雜與假冒的檢測是世界性難題?!坝心繕藱z測”方法,只有在預(yù)先獲知或懷疑某成分可能存在時,才能展開相關(guān)的“被動”檢測。針對“有目標”檢測的不足,發(fā)展“無目標”檢測方法是一種解決食品摻假問題的有效途徑。Xu等利用光譜技術(shù)結(jié)合OCPLS的算法對花生油[70]、芝麻油[71]、糯米粉[72]、全脂奶粉[32]、蜂膠[73]、西湖藕粉[74]、酸奶[75]、板藍根[76]、葛根粉[77]和道地香菇[78]等中的各種非法添加的摻假物進行無目標檢測,取得了較滿意的結(jié)果。Zhang等[79]應(yīng)用一類支持向量機對芝麻油進行無目標檢測。一類分類的類模型方法在食品摻假無目標分析應(yīng)用中的例子[80],見表2。
2.3 一階校正方法在食品定量分析中的應(yīng)用
一階校正方法是多維校正理論體系中最為成熟的校正方法。一階校正可以同時分析多個待分析物,并且不要求分析檢測技術(shù)對待分析物的響應(yīng)信號具有完全的選擇性。一階校正方法構(gòu)建的數(shù)學模型比較簡單,數(shù)學原理容易理解并且計算方法容易實現(xiàn),在食品定量分析中得到廣泛的應(yīng)用。表3列舉一階校正方法在食品中定量分析的一些應(yīng)用實例。Fan等[81]利用“Turn -off”熒光傳感結(jié)合基于改進的支持向量機,實現(xiàn)在綠茶和污水等復(fù)雜基質(zhì)中多種農(nóng)藥殘留的同時定量表征和分析;Yang等[82]利用傅里葉變換近紅外光譜(FT- NIR)結(jié)合偏最小二乘回歸(PLSR)測定中草藥中農(nóng)殘的含量;Hou等[83]利用表面增強拉曼光譜(SERS)結(jié)合PLSR定量分析單組分和混合的食品防腐劑含量;有文獻報道,利用NIR高光譜成像結(jié)合包括PCR和PLSR兩種多元回歸方法對加拿大小麥中的蛋白質(zhì)含量和硬度值進行建模分析,并比較兩種一階校正方法對其預(yù)測性能的差異[84],以及魚油微囊補充劑中蛋白質(zhì)含量[85];Qin等[86]利用太赫茲光譜結(jié)合PLSR對抗生素鹽酸四環(huán)素粉末和溶液進行無損預(yù)測分析;許多研究者們用高光譜成像(HSI)成功實現(xiàn)了在食品中的各種營養(yǎng)成分、色素成分等的高靈敏的定量分析[87-90];Xiao課題組利用PLSR很好地表征了甜橙精油、蔓越莓、榴蓮酒中香氣物質(zhì)與感官評價得分間的相關(guān)關(guān)系[91-93]。值得指出的是,目前一階校正在食品定量分析應(yīng)用中,共性的特點是需要有足夠代表性的樣品校正集來應(yīng)付未知待測樣本所有的預(yù)期變化。
表2 一類分類的類模型方法在食品摻假無目標分析中的應(yīng)用
表3 一階校正方法在食品定量分析中的應(yīng)用
2.4 二階及高階校正在食品復(fù)雜基質(zhì)未知干擾共存下對目標分析物的應(yīng)用
二階校正具有“數(shù)學分離”代替或簡化“物理和化學分離”的“二階優(yōu)勢”,可以實現(xiàn)食品安全檢測所要求的現(xiàn)場、快速和實時分析,因此具有廣闊的應(yīng)用前景。近年來,具有“二階優(yōu)勢”的化學計量學多維校正方法已被廣泛應(yīng)用于食品復(fù)雜基質(zhì)中目標分析物的定量研究,表4列舉了一些二階及高階校正方法在各種食品復(fù)雜基質(zhì)中多組分被分析物的同時定量分析的研究工作。例如:El -Sheikh等[94]采用紫外光譜(UV) 結(jié)合pH值變化產(chǎn)生三維數(shù)據(jù),基于平行因子分子(PARAFAC)和基于殘差雙線性的雙線性最小二乘(bilinear least squares/residual bilinearization, BLLS/RBL)方法,實現(xiàn)了在未知干擾共存下4種軟飲料中人工合成色素檸檬黃、誘惑紅、日落黃、胭脂紅和亮藍的直接同時定量分析,并與色譜分析的結(jié)果相比較,結(jié)果表明,分析所得的定量結(jié)果準確和可靠。Alarcn等[95]采用激發(fā)- 發(fā)射矩陣(excitation -emission matrix, EEM)熒光結(jié)合基于殘差雙線性的展開偏最小二乘方法(unfolded partial least squares/residual bilinearization, U -PLS/RBL)和PARAFAC方法實現(xiàn)了在未知干擾共存情況下食用橄欖油和葵花籽油中7種多環(huán)芳烴的定量分析,獲得了與液相色譜- 熒光檢測一致的定量結(jié)果,這種數(shù)學分離的方法具有簡單、快速和綠色的優(yōu)勢,與色譜分析相比,極大地縮短了分析時間,減少了有機溶劑的消耗。Boeris等[96]利用HPLC- DAD測定了果汁、水果和蔬菜等復(fù)雜食品基質(zhì)中5種農(nóng)藥的殘留量。在簡單的等度洗脫條件下,復(fù)雜食品樣品的色譜洗脫曲線中出現(xiàn)了色譜峰共流出、洗脫時間漂移、色譜峰形變化和未知背景干擾等。即便如此,利用基于二階校正的多元曲線分辨交替最小二乘(MCR- ALS)無需將食品中各種內(nèi)源干擾與目標分析物5種農(nóng)殘色譜峰進行峰的精細優(yōu)化和分離,依然得到了準確的定量結(jié)果。Lozano等[97]采用超高速高效液相色譜與激發(fā)- 發(fā)射矩陣(EEM)熒光光譜檢測器聯(lián)用(UPLC- EEM)技術(shù)對多個樣本測量并構(gòu)建四維數(shù)據(jù)陣,結(jié)合PARAFAC、基于殘差三線性的展開偏最小二乘(unfolded partial least squares/residual trilinearization, U -PLS/RTL)和基于殘差三線性的多維偏最小二乘(multi -way partial least squares/residual trilinearization,N -PLS/RTL)方法對數(shù)據(jù)進行解析,無需樣本物理和化學繁瑣的分離預(yù)處理步驟,即使在有熒光響應(yīng)的其他干擾物共存的情況下,成功實現(xiàn)了橄欖油中葉綠素a和b以及脫鎂葉綠素a和b的直接和快速同時定量分析。Rubio等[98]基于標準加入法引入實際樣品提取物不同稀釋倍數(shù)作為第四維度,構(gòu)建與三維熒光相結(jié)合的四維數(shù)據(jù)陣,采用four -way PARAFAC進行數(shù)據(jù)分析,在分析物光譜互相重疊且與基質(zhì)背景光譜也重疊的情況下,實現(xiàn)了卷心菜中氨基甲酸酯類農(nóng)藥的定量分析,同時還識別出了不同稀釋倍數(shù)下卷心菜基質(zhì)的響應(yīng)和影響情況。Yu等[99]在簡單的等度洗脫條件下,采用HPLC- DAD結(jié)合三線性分解方法測定了蜂蜜中的12種喹諾酮類物質(zhì)的含量。盡管各被分析物喹諾酮類物質(zhì)間出現(xiàn)了嚴重的峰共流出問題,同時蜂蜜基質(zhì)中也存在各種未知干擾物,借助二階校正方法的“二階優(yōu)勢”依然實現(xiàn)了對蜂蜜中12種喹諾酮類物質(zhì)的直接同時定量分析。Zhang等[100]采用HPLC- DAD結(jié)合二階校正方法的策略,極大地簡化了樣本的預(yù)處理過程,實現(xiàn)了5種蜂蜜中9種多酚類物質(zhì)的同時定量分析。Wang等[101]在不經(jīng)提取,直接稀釋植物油樣本后采用HPLC- DAD方法,在6 min內(nèi)使10種抗氧化劑全部流出,然后結(jié)合交替懲罰三線性分解(APTLD)方法對獲得的HPLC- DAD數(shù)據(jù)進行解析,在有重疊峰、未知背景干擾和基線漂移的情況下,快速實現(xiàn)了5種植物油樣本中10種抗氧化劑的同時數(shù)學分辨和定量表征。上述二階及高階校正方法在各種復(fù)雜食品分析問題中的研究表明,與傳統(tǒng)的化學分析方法相比,基于二階及高階校正的化學計量學方法應(yīng)用于復(fù)雜食品體系分析時有諸多優(yōu)勢,必將在食品化學、食品分析等學科中獲得越來越多的實際應(yīng)用。
表4 二階及高階校正方法在食品復(fù)雜基質(zhì)中多組分被分析物的同時定量分析
在食品分析研究的過程中,化學計量學方法在數(shù)據(jù)解析和分析中發(fā)揮了重要的作用,為分析復(fù)雜的食品體系提供了一個有別于傳統(tǒng)食品研究的新思路。特別是基于二階校正及更高階校正的化學計量學方法,能夠利用數(shù)學分離代替或部分代替物理及化學分離,進而直接進行食品中多個組分的同時分辨和直接定量表征和分析,為滿足食品實際生產(chǎn)過程和質(zhì)量安全監(jiān)控等要求提供了一條簡單、快速、有效的綠色節(jié)能新途徑。然而,目前采用化學計量學進行食品分析的研究和應(yīng)用還有待進一步擴大深度和空間。因此,新的檢測技術(shù)和新的化學計量學分析方法對豐富食品分析的內(nèi)容,顯得極其重要。新的檢測技術(shù)例如高光譜成像技術(shù)、納米材料傳感新技術(shù),為食品分析注入了新的活力,并在食品領(lǐng)域有著極大的潛在應(yīng)用前景。除此之外,進一步擴大各種分析儀器的“數(shù)據(jù)融合技術(shù)”,并根據(jù)分析樣品不同維度的物理和化學信息,反映出相比于單獨儀器技術(shù)更全面的樣品信息,對于深度闡釋和揭示食品的整體理化特性和作用機制等具有重要意義?;瘜W計量學將一些優(yōu)化策略如變量篩選、穩(wěn)健分析計算等引入到現(xiàn)有的經(jīng)典算法中,提出一些新的具有普適性應(yīng)用模式的化學計量學方法,可以改善現(xiàn)有方法的一些缺點,簡化分析模型、縮短分析時間、擴大模型的適用性、提高模型的準確度和精度,也將進一步推動化學計量學在食品分析中各種實際應(yīng)用的發(fā)展。
化學計量學是分析化學的前沿研究方向之一,并被成功引入食品分析領(lǐng)域,為解決食品分析中的諸多問題和難題提供了強有力的數(shù)據(jù)解析工具和分析方法。目前,化學計量學在食品分析中的應(yīng)用日趨廣泛,但由于食品種類繁多和成分復(fù)雜,仍然有待做更多和更深入的研究工作,以期在實際應(yīng)用中更好地完成食品分析的任務(wù)和目標。鑒于化學計量學方法的各種優(yōu)勢,研究者們應(yīng)充分借助化學計量學的不同方法,擴大其在食品分析中的應(yīng)用范圍,開拓新的應(yīng)用領(lǐng)域,促進食品分析方法的發(fā)展和實際應(yīng)用研究;同時,研究者們也應(yīng)發(fā)展更多適應(yīng)于處理各種現(xiàn)代新儀器分析方法和新檢測技術(shù)所產(chǎn)生的、海量的、不同結(jié)構(gòu)類型數(shù)據(jù)的化學計量學新理論,使其在食品分析領(lǐng)域中具有更為廣闊的應(yīng)用前景。
[1] DZANTIEV B B, BYZOVA N A, URUSOV A E, et al. Immunochromatographic methods in food analysis [J]. Trends in Analytical Chemistry, 2014, 55(55): 81-93.
[3] POREP J U, KAMMERER D R, CARLE R. On -line application of near infrared (NIR) spectroscopy in food production [J]. Trends in Food Science & Technology, 2015, 46(2): 211-230.
[4] KAROUI R, DOWNEY G, BLECKER C. Mid -infrared spectroscopy coupled with chemometrics: a tool for the analysis of intact food systems and the exploration of their molecular structure -quality relationships -a review [J]. Chemical Reviews,2010,110(10): 6144-6168.
[5] BUTLER O T, CLOUGH R, COOK J M, et al. Current trends: a perspective from 30 years of atomic spectrometry updates[J].Journal of Analytical Atomic Spectrometry, 2016,31:32-34.
[6] LOUTFI A, CORADESCHI S, MANI G K. Electronic noses for food quality: a review[J]. Journal of Food Engineering, 2015, 144: 103-111.
[7] KANG B S, LEE J E, PARK H J. Electronic tongue -based discrimination of Korean rice wines (makgeolli) including prediction of sensory evaluation and instrumental measurements [J]. Food Chemistry, 2014, 151: 317-323.
[8] LAVINE B, WORKMAN J. Chemometrics [J]. Analyti -cal Chemistry, 2010, 82(12): 4699-4711.
[9] SANCHEZ E, KOWALSKI B R.Tensorial calibration: I. first -order calibration [J]. Journal of Chemometrics, 1988, 2(4): 247-263.
[10] WU H L, NIE J F, YU Y J, et al. Multi -way chemometric methodologies and applications: a central summary of our research work [J]. Analytica Chimica Acta, 2009, 650(1): 131-142.
[11] OLIVIERI A C, ESCANDAR G M, GOICOECHEA H C, et al. Fundamentals and analytical applications of multi -way calibration[M]. Amsterdam: Elsevier, 2015:7-8.
[12] BRERETON R G. Multivariate pattern recognition in chemometrics [J]. Chemometrics & Intelligent Laboratory Systems, 2015, 149: 90-96.
[13] WOLD S, ESBENSEN K, GELADI P. Principal component analysis[J]. Chemometrics and Iintelligent Laboratory Systems, 1987, 2(1-3): 37-52.
[14] LUO W, HUAN S, FU H, et al. Preliminary study on the application of near infrared spectroscopy and pattern recognition methods to classify different types of apple samples [J]. Food Chemistry, 2011, 128(2): 555-561.
[15] FU H Y, HUAN S Y, XU L, et al. Moving window partial least -squares discriminant analysis for identification of different kinds of bezoar samples by near infrared spectroscopy and comparison of different pattern recognition methods [J]. Journal of Near Infrared Spectroscopy, 2007, 15(2): 291-297.
[16] FU H Y, HUAN S Y, XU L, et al. Construction of an efficacious model for nondestructive identification of traditional Chinese medicines Liuweidihuang pills from different manufacturers using near infrared spectroscopy and moving window partial least -squares discriminant analysis [J]. Analytical Sciences, 2009, 25(9): 1143-1148.
[17] BOGER Z, GUTERMAN H. Knowledge extraction from artificial neural network models[J]. Journal of Renewable and Sustainable Energy, 2015, 4(5): 3030-3035.
[19] CUBEDDU A, RAUH C, DELGADO A. Hybrid artificial neural network for prediction and control of process variables in food extrusion[J]. Innovative Food Science & Emerging Technologies, 2013, 21: 142-150.
[20] KHAJEH M, BARKHORDAR A.Modelling of solid -phase tea waste extraction for the removal of manganese from food samples by using artificial neural network approach[J]. Food Chemistry, 2013, 141(2): 712-717.
[21] VAPNIK V N. The nature of statistical learning theory [M]. New York: Springer -Verlag, 1995:267-290.
[22] BARBOSA R M, NELSON D R. The use of support vector machine to analyze food security in a region of Brazil[J]. Applied Artificial Intelligence, 2016, 30(4): 318-330.
[23] BAO Y, LIU F, KONG W, et al. Measurement of soluble solid contents and pH of white vinegars using VIS/NIR spectroscopy and least squares support vector machine[J]. Food and Bioprocess Technology, 2014, 7(1): 54-61.
[24] SOHRABI M R, DARABI G. The application of conti -nuous wavelet transform and least squares support vector machine for the simultaneous quantitative spectrophotometric determination of myricetin, kaempferol and quercetin as flavonoids in pharmaceutical plants[J]. Spectrochimica Acta Part A: Molecular & Biomolecular Spectroscopy, 2016, 152:443-52.
[25] BRERETON R G. One -class classifiers[J]. Journal of Chemometrics, 2011, 25(5):225-246.
[26] FORINA M, OLIVERI P, LANTERI S, et al. Class -modeling techniques, classic and new, for old and new problems[J]. Chemometrics & Intelligent Laboratory Systems, 2008, 93(2):132-148.
[27] FORINA M, OLIVERI P, JGER H, et al. Class modeling techniques in the control of the geographical origin of wines[J]. Chemometrics & Intelligent Laboratory Systems, 2009, 99(2): 127-137.
[28] OLIVERI P, EGIDIO V D, WOODCOCK T, et al. Application of class -modelling techniques to near infrared data for food authentication purposes[J]. Food Chemistry, 2011, 125(4): 1450-1456.
[29] MARINI F, MAGRA L, BUCCI R, et al. Class -modeling techniques in the authentication of Italian oils from Sicily with a protected denomination of origin (PDO)[J]. Chemometrics & Intelligent Laboratory Systems, 2006, 80(1): 140-149.
[30] WOLD S, SJ?STR?M M. Comments on a recent evalua -tion of the SIMCA method[J]. Journal of Chemometrics, 1987, 1(4): 243-245.
[31] FORINA M, LANTERI S, SARABIA L. Distance and class space in the UNEQ class -modeling technique[J]. Journal of Chemometrics, 1995, 9(2):69-89.
[32] FORINA M, ARMANINO C, LEARDI R, et al. A class -modelling technique based on potential functions[J]. Journal of Chemometrics, 1991(5): 435-453.
[33] POLONOVSKI M. Multilayer feed -forward artificial neural networks for class modeling[J]. Chemometrics & Intelligent Laboratory Systems, 2007, 88(1): 118-124.
[34] FORINA M, OLIVERI P, CASALE M, et al. Multivariate range modeling, a new technique for multivariate class modeling: the uncertainty of the estimates of sensitivity and specificity[J]. Analytica Chimica Acta, 2008, 622(1):85-93.
[35] SRIVASTAVA C. Support vector data description[J]. Machine Learning, 2004, 54(1):45-66.
[36] XU L, YAN S M, CAI C B, et al. One -class partial least squares (OCPLS) classifier[J]. Chemometrics & Intelligent Laboratory Systems, 2013, 126(11): 1-5.
[37] XU L, GOODARZI M, SHI W, et al. A MATLAB toolbox for class modeling using one -class partial least squares (OCPLS) classifiers[J]. Chemometrics & Intelligent Laboratory Systems, 2014, 139: 58-63.
[38] ARANCIBIA J A, DAMIANI P C, ESCANDAR G M, et al. A review on second and third -order multivariate calibration applied to chromatographic data[J]. Journal of Chromatography B, 2012, 910(23):22-30.
[39] LORBER A. Features of quantifying chemical composition from two -dimensional data array by the rank annihilation factor analysis method[J]. Analytical Chemistry, 1985, 57(12):2395-2397.
[40] SANCHEZ E, KOWALSKI B R. Generalized rank annihilation factor analysis[J]. Analytical Chemistry, 1985, 58(2):496-499.
[41] LI S, GEMPERLINE P J. Eliminating complex eigenvectors and eigenvalues in multiway analyses using the direct trilinear decomposition method [J]. Journal of Chemometrics, 1993, 7(2): 77-88
[42] FABER N M, BRO R, HOPKE P K. Recent developments in CANDECOMP/PARAFAC algorithms: a critical review[J]. Chemometrics & Intelligent Laboratory Systems, 2003, 65(1):119-137.
[43] WU H L, SHIBUKAWA M, OGUMA K. An alternating trilinear decomposition algorithm with application to calibration of HPLC- DAD for simultaneous determination of overlapped chlorinated aromatic hydrocarbons[J]. Journal of Chemometrics, 1998, 12(1): 1-26.
[44] ZHANG S, WU H, YU R. A study on the differential strategy of some iterative trilinear decomposition algorithms: PARAFAC- ALS, ATLD, SWATLD, and APTLD[J]. Journal of Chemometrics, 2015, 29(3):179-192.
[45] CHEN Z P, WU H L, YU R Q. On the self -weighted alternating trilinear decomposition algorithm -the property of being insensitive to excess factors used in calculation[J]. Journal of Chemometrics, 2001, 15(5):439-453.
[46] XIA A L, WU H L, FANG D M, et al. Alternating penalty trilinear decomposition algorithm for second -order calibration with application to interference -free analysis of excitation -emission matrix fluorescence data[J]. Journal of Chemometrics, 2005, 19(2):65-76.
[47] SMILDE A K, TAULER R, HENSHAW J M, et al. Multicomponent determination of chlorinated hydrocarbons using a reaction -based chemical sensor. 3. medium -rank second -order calibration with restricted Tucker models[J]. Analytical Chemistry, 1994, 66(20):3345-3351.
[48] RUBIO L, SARABIA L A, ORTIZ M C. Standard addition method based on four -way PARAFAC decomposition to solve the matrix interferences in the determination of carbamate pesticides in lettuce using excitation -emission fluorescence data[J]. Talanta, 2015, 138:86-99.
[49] XIA A L, WU H L, LI S F, et al. Alternating penalty quadrilinear decomposition algorithm for an analysis of four -way data arrays[J].Journal of Chemometrics, 2007, 21(3/4): 133-144.
[50] KANG C, WU H L, YU Y J, et al. An alternative quadrilinear decomposition algorithm for four -way calibration with application to analysis of four -way fluorescence excitation -emission -pH data array[J]. Analytica Chimica Acta, 2013, 758(1):45-57.
[51] FU H Y, WU H L, YU Y J, et al. A new third -order calibration method with application for analysis of four -way data arrays[J]. Journal of Chemometrics, 2011, 25(8):408-429.
[52] QING X D, WU H L, ZHANG X H, et al. A novel fourth -order calibration method based on alternating quinquelinear decomposition algorithm for processing high performance liquid chromatography -diode array detection -kinetic -pH data of naptalam hydrolysis[J]. Analytica Chimica Acta, 2015, 861: 12-24.
[53] CHAO K, WU H L, SONG J J, et al. A flexible trilinear decomposition algorithm for three -way calibration based on the trilinear component model and a theoretical extension of the algorithm to the multilinear component model[J]. Analytica Chimica Acta, 2015, 878:63-77.
[54] MAGGIO R M, PEA A M D L, OLIVIERI A C. Unfolded partial least -squares with residual quadrilineari -zation: a new multivariate algorithm for processing five -way data achieving the second -order advantage. Application to fourth -order excitation -emission -kinetic -pH fluorescence analytical data[J]. Chemometrics & Intelligent Laboratory Systems, 2011, 109(2):178-185.
[55] FU H Y, JIANG D, ZHOU R, et al. Predicting mildew contamination and shelf -life of sunflower seeds and soybeans by Fourier transform near -infrared spectroscopy and chemometric data analysis[J/OL].(2016 -11 -18)[2017 -02 -21].http:∥link.springer.com/article/10.1007/s12161-016-0726-9.
[56] FU H Y, YIN Q B, XU L, et al. Challenges of large -class -number classification (LCNC): a novel ensemble strategy (ES) and its application to discriminating the geographical origins of 25 green teas[J]. Chemometrics & Intelligent Laboratory Systems, 2016, 157:43-49.
[57] LIU L, FAN Y, FU H Y, et al. “Turn -off” fluorescent sensor for highly sensitive and specific simultaneous recognition of 29 famous green teas based on quantum dots combined with chemometrics[J/OL]. (2017 -02 -08)[2017 -02 -11].http:∥www.sciencedirect.com/science/article/pii/S000326701730123X.
[58] WU Q J, DONG Q H, SUN W J, et al. Discrimination of Chinese teas with different fermentation degrees by stepwise linear discriminant analysis (S -LDA) of the chemical compounds [J]. Journal of Agricultural & Food Chemistry, 2014, 62(38):9336-9344.
[59] LU W, JIANG Q, SHI H, et al. Partial least -squares -discriminant analysis differentiating Chinese wolfberries by UPLC -MS and flow injection mass spectrometric (FIMS) fingerprints [J]. Journal of Agricultural & Food Chemistry, 2014, 62(37):9073-9080.
[60] BAJOUB A, AJAL E A, FERNNDEZ -GUTIéRREZ A, et al. Evaluating the potential of phenolic profiles as discriminant features among extra virgin olive oils from Moroccan controlled designations of origin[J]. Food Research International, 2016, 84:41-51.
[61] LOEWE V, NAVARRO -CERRILLO R M, GARCA -OLMO J, et al. Discriminant analysis of Mediterranean pine nuts (PinuspineaL.) from Chilean plantations by near infrared spectroscopy (NIRS)[J]. Food Control, 2017, 73: 634-643.
[62] WU X, WU B, SUN J, et al. Classification of apple varieties using near infrared reflectance spectroscopy and fuzzy discriminant C -means clustering model[J/OL].(2016 -01 -12)[2017 -02 -21].http:∥onlinelibrary.wiley.com/doi/10.1111/jfpe.12355/pdf.
[63] YIN Y, HAO Y, BAI Y, et al. A Gaussian -based kernel Fisher discriminant analysis for electronic nose data and applications in spirit and vinegar classification[J]. Journal of Food Measurement & Characterization, 2017,11(1): 24-32.
[64] D’ARCHIVIO AA, MAGGI M A. Geographical identification of saffron (CrocussativusL.) by linear discriminant analysis applied to the UV -visible spectra of aqueous extracts[J]. Food Chemistry, 2017, 219:408-413.
[65] XIAO Z, DAI X, ZHU J, et al. Classification of Chinese rice wine according to geographic origin and wine age based on chemometric methods and SBSE- TD- GC- MS analysis of volatile compounds[J]. Food Science & Technology Research, 2015, 21(3):371-380.
[66] YU H, DAI X, YAO G, et al. Application of gas chromatography -based electronic nose for classification of Chinese rice wine by wine age[J]. Food Analytical Methods, 2014(7):1489-1497.
[67] SUN H, NI H, YANG Y, et al. Investigation of sunlight -induced deterioration of aroma of pummelo (Citrusmaxima) essential oil[J]. Journal of Agricultural and Food Chemistry, 2014, 62(49): 11818-11830.
[68] NI H, HONG P, JI H F, et al. Comparative analyses of aromas of fresh, naringinase -treated and resin -absorbed juices of pummelo by GC -MS and sensory evaluation[J]. Flavour and Fragrance Journal, 2015, 30(3): 245-253.
[69] SUN H, NI H, YANG Y, et al. Sensory evaluation and gas chromatography -mass spectrometry (GC- MS) analysis of the volatile extracts of pummelo (Citrusmaxima) peel[J]. Flavour and Fragrance Journal, 2014, 29(5): 305-312.
[70] XU L, CAI C, DENG D. Multivariate quality control solved by one -class partial least squares regression: identification of adulterated peanut oils by mid -infrared spectroscopy[J]. Journal of Chemometrics, 2011, 25(10):568-574.
[71] DENG D H, XU L, YE Z H, et al. FTIR spectroscopy and chemometric class modeling techniques for authentication of Chinese sesame oil[J]. Journal of the American Oil Chemists’ Society, 2012, 89(6):1003-1009.
[72] XU L, YAN S M, CAI C B, et al. Untargeted detection of illegal adulterations in Chinese glutinous rice flour (GRF) by NIR spectroscopy and chemometrics: specificity of detection improved by reducing unnecessary variations[J]. Food Analytical Methods, 2013(6):1568-1575.
[73] XU L, YAN S M, CAI C B, et al. Untargeted detection and quantitative analysis of poplar balata (PB) in Chinese propolis by FT- NIR spectroscopy and chemometrics [J]. Food Chemistry, 2013, 141(4):4132-4137.
[74] XU L, SHI P T, YE Z H, et al. Rapid analysis of adulterations in Chinese lotus root powder (LRP) by near -infrared (NIR) spectroscopy coupled with chemometric class modeling techniques [J]. Food Chemistry, 2013, 141(3): 2434-2439.
[75] XU L, YAN S M, CAI C B, et al. The feasibility of using near -infrared spectroscopy and chemometrics for untargeted detection of protein adulteration in yogurt: removing unwanted variations in pure yogurt [J/OL].(2013 -06 -01)[2018 -02 -11].https:∥www.hindawi.com/journals/jamc/2013/201873/abs/.
[76] XU L, FU X S, FU H Y, et al. Rapid detection of exogenous adulterants and species discrimination for a Chinese functional tea (banlangen) by Fourier -transform near -infrared (FT- NIR) spectroscopy and chemometrics[J]. Journal of Food Quality, 2015, 38(6):450-457.
[77] XU L, SHI W, CAI C B, et al. Rapid and nondestructive detection of multiple adulterants in kudzu starch by near infrared (NIR) spectroscopy and chemometrics[J]. LWT -Food Science and Technology, 2015, 61(2): 590-595.
[78] XU L, FU H Y, YANG T M, et al. Enhanced specificity for detection of frauds by fusion of multi -class and one -class partial least squares discriminant analysis: geographical origins of Chinese shiitake mushroom[J]. Food Analytical Methods, 2016, 9(2): 451-458.
[79] ZHANG L, LI P, NA W, et al. Multivariate adulteration detection for sesame oil[J]. Chemometrics & Intelligent Laboratory Systems, 2017,161:147-150.
[80] FU H Y, LI H D, XU L, et al. Detection of unexpected frauds: screening and quantification of maleic acid (MA) in cassava starch (CS) by Fourier transform near -infrared (FT -NIR) spectroscopy[J]. Food Chemistry, 2017, 227: 322-328.
[81] FAN Y, LIU L, SUN D, et al. “Turn -off” fluorescent data array sensor based on double quantum dots coupled with chemometrics for highly sensitive and selective detection of multicomponent pesticides[J]. Analytica Chimica Acta, 2016, 916: 84-91.
[82] YANG T M, ZHOU R, JIANG DU, et al. Rapid detection of pesticide residues in Chinese herbal medicines by Fourier transform infrared spectroscopy coupled with partial least squares regression[J/OL]. (2016 -11 -14)[2017 -02 -11]. https:∥www.hindawi.com/journals/jspec/2016/9492030/abs/.
[83] HOU M, HUANG Y, MA L, et al. Quantitative analysis of single and mix food antiseptics basing on SERS spectra with PLSR method[J]. Nanoscale Research Letters, 2016, 11(1):1-8.
[84] MAHESH S, JAYAS D S, PALIWAL J, et al. Compari -son of partial least squares regression (PLSR) and principal components regression (PCR) methods for protein and hardness predictions using the near -infrared (NIR) hyperspectral images of bulk samples of Canadian wheat[J]. Food and Bioprocess Technology, 2015, 8(1):31-40.
[85] VONGSVIVUT J, HERAUD P, ZHANG W, et al. Rapid determination of protein contents in microencapsulated fish oil supplements by ATR -FTIR spectroscopy and partial least square regression (PLSR) analysis[J]. Food and Bioprocess Technology, 2014, 7(1):265-277.
[86] QIN J, XIE L, YING Y. Determination of tetracycline hydrochloride by terahertz spectroscopy with PLSR model[J]. Food Chemistry, 2015, 170:415-422.
[87] CHENG J H, SUN D W. Partial least squares regression (PLSR) applied to NIR and HSI spectral data modeling to predict chemical properties of fish muscle[J/OL].(2016 -07 -12)[2017 -02 -11].http:∥link.springer.com/article/10.1007/s12393-016-9147-1.
[88] XIONG Z, SUN D W, XIE A, et al. Potential of hyperspectral imaging for rapid prediction of hydroxyproline content in chicken meat[J]. Food Chemistry, 2015, 175:417-422.
[89] XIONG Z, SUN D W, XIE A, et al. Quantitative determination of total pigments in red meats using hyperspectral imaging and multivariate analysis[J]. Food Chemistry, 2015, 178:339-345.
[90] CHENG J H, SUN D W, PU H B, et al. Suitability of hyperspectral imaging for rapid evaluation of thiobarbituric acid (TBA) value in grass carp (Ctenopharyngodonidella) fillet [J]. Food Chemistry, 2015, 171(4):258-265.
[91] XIAO Z, MA S, NIU Y, et al. Characterization of odour -active compounds of sweet orange essential oils of different regions by gas chromatography -mass spectrometry, gas chromatography -olfactometry and their correlation with sensory attributes[J]. Flavour and Fragrance Journal, 2016, 31(1): 41-50.
[92] ZHU J C, CHEN F, WANG L Y, et al. Characterization of the key aroma volatile compounds in cranberry (VacciniummacrocarponAit.) using gas chromatography -olfactometry (GC- O) and odor activity value (OAV)[J]. Journal of Agricultural and Food Chemistry, 2016, 64(24): 4990-4999.
[93] ZHU J C, CHEN F, WANG L Y, et al. Comparison of aroma -active compounds and sensory characteristics of durian (DuriozibethinusL.) wines using strains ofSaccharomycescerevisiaewith odor activity values and partial least -squares regression[J]. Journal of Agricultural and Food Chemistry, 2015, 63(7): 1939-1947.
[94] EL -SHEIKH A H, AL -DEGS Y S. Spectrophotometric determination of food dyes in soft drinks by second order multivariate calibration of the absorbance spectra -pH data matrices[J]. Dyes & Pigments, 2013, 97(2):330-339.
[96] BOERIS V, ARANCIBIA J A, OLIVIERI A C. Determination of five pesticides in juice, fruit and vegetable samples by means of liquid chromatography combined with multivariate curve resolution[J]. Analytica Chimica Acta, 2014, 814(9):23-30.
[97] LOZANO V A, PEA A M D L, DURN -MERS I, et al. Four -way multivariate calibration using ultra -fast high -performance liquid chromatography with fluorescence excitation -emission detection: application to the direct analysis of chlorophylls a, and b, and pheophytins a, and b, in olive oils[J]. Chemometrics & Intelligent Laboratory Systems, 2013, 125(1): 121-131.
[98] RUBIO L, SARABIA L A, ORTIZ M C. Standard addition method based on four -way PARAFAC decomposition to solve the matrix interferences in the determination of carbamate pesticides in lettuce using excitation -emission fluorescence data[J]. Talanta, 2015,138:86-99.
[99] YU Y J, WU H L, SHAO S Z, et al. Using second -order calibration method based on trilinear decomposition algorithms coupled with high performance liquid chromatography with diode array detector for determination of quinolones in honey samples[J]. Talanta, 2011, 85(3):1549-1559.
[100] ZHANG X H, WU H L, WANG J Y, et al. Fast HPLC- DAD quantification of nine polyphenols in honey by using second -order calibration method based on trilinear decomposition algorithm[J]. Food Chemistry, 2013, 138(1):62-69.
[101] WANG J Y, WU H L, CHEN Y, et al. Fast analysis of synthetic antioxidants in edible vegetable oil using trilinear component modeling of liquid chromatography -diode array detection data[J]. Journal of Chromatography A, 2012, 1264: 63-71.
(責任編輯:葉紅波)
Applications of Chemometrics in Food Analysis
CHEN Feng1, LI Hedong2, WANG Yaqi1, FU Haiyan1, 2,*, ZHENG Fuping1,3
(1.DepartmentofFood,NutritionandPackagingSciences,ClemsonUniversity,Clemson,SC29634,USA; 2.SchoolofPharmaceuticalSciences,South-CentralUniversityforNationalities,Wuhan430074,China; 3.BeijingAdvancedInnovationCenterforFoodNutritionandHumanHealth,BeijingTechnologyandBusinessUniversity,Beijing100048,China)
Chemometrics is a novel and unique interdisciplinary technique that integrates mathematics, statistics, chemistry and computer science. Pattern recognition and multivariate calibration method, as the core aspects of the technique, have exhibited overwhelming advantages in massive data mining and processing, as well as resolution and analysis of analytic signals. In addition, it is able to solve complex problems which are difficult to be solved by conventional analytic methods, resulting in the method to be widely used in many research fields, including food analysis. This paper reviews the fundamental principles of chemometrics in regards of its advantages and disadvantages,applications, and recent progresses. Furthermore, the review has pointed out problems which need to be solved in current researches, and highlighted the prospective aspects of the technique.
chemometrics; food analysis; pattern recognition; multivariate calibration
2017 -02 -02
國家自然科學基金資助項目(21576297);國家重點研發(fā)計劃項目(2016YFD0400500)。
陳 峰,男,教授,博士生導(dǎo)師,主要從事食品風味營養(yǎng)與質(zhì)量安全控制方面的研究;
10.3969/j.issn.2095 -6002.2017.03.001
2095 -6002(2017)03 -0001 -15
陳峰,李鶴東,王亞棋,等.化學計量學方法在食品分析中的應(yīng)用[J]. 食品科學技術(shù)學報,2017,35(3):1-15.
CHEN Feng, LI Hedong, WANG Yaqi, et al. Applications of chemometrics in food analysis[J]. Journal of Food Science and Technology, 2017,35(3):1-15.
TS201.2
A
*付海燕,女,副教授,主要從事化學計量學及其在復(fù)雜體系中創(chuàng)新性應(yīng)用方面的研究,通信作者。