吉鑫,樊雙喜,李宜聰,鐘其頂*,陸瑋,李安軍,劉國英,黃艷,胡心行,葉方平
1(中國食品發(fā)酵工業(yè)研究院有限公司,北京,100015)2(全國食品發(fā)酵標(biāo)準(zhǔn)化中心,北京,100015) 3(安徽古井貢酒股份有限公司,安徽 亳州,236800)
白酒作為我國傳統(tǒng)的蒸餾酒,其獨特的釀造工藝經(jīng)傳承和改良,最終形成以糧谷為主要原料,以大曲、小曲或麩曲及酒母等為糖化發(fā)酵劑,經(jīng)蒸煮、糖化、發(fā)酵、蒸餾等工序制成的飲料酒[1]。白酒的主要成分為水和乙醇,作為白酒呈香呈味物質(zhì),決定著白酒風(fēng)格和質(zhì)量的微量有機組分如有機酸、酯類、醛類和除乙醇外的醇類等僅占總體積的2%左右[2]。2019年10月公布的《產(chǎn)業(yè)結(jié)構(gòu)調(diào)整指導(dǎo)目錄(2019年本)》較先前版本,取消了對白酒生產(chǎn)線的限制,此舉將推動白酒行業(yè)的高質(zhì)量發(fā)展。隨著政策的放開,白酒生產(chǎn)的準(zhǔn)入門檻就必然隨之提升,對白酒的安全、品質(zhì),白酒生產(chǎn)、檢測技術(shù)以及人員的要求也將更嚴(yán)格。由于缺乏完善的質(zhì)量安全標(biāo)準(zhǔn)、準(zhǔn)確的食品真實性定義、精確高效的檢測技術(shù)手段、先進的生產(chǎn)設(shè)施和完整的質(zhì)量體系等原因,白酒質(zhì)量安全控制以及真實性依然存在較大提升空間[3]。
特定特征組分分析技術(shù)應(yīng)用于白酒的摻假檢測是我國目前較為常用且發(fā)展相對成熟的技術(shù)手段,如氣相色譜法[4]、氣相色譜-質(zhì)譜分析法[5-6]、近紅外光譜法[7]和液相色譜法[8]等,可以對GB/T 10345—2007中所規(guī)定的白酒微量物質(zhì)和一些常見的揮發(fā)性香氣成分實現(xiàn)定性或精確定量檢測。然而上述檢測方法都是具有針對性的,如氣相色譜法主要用于白酒中揮發(fā)性物質(zhì)的測定,液相色譜法用于不易揮發(fā)物質(zhì)和大分子的測定。在應(yīng)對當(dāng)前白酒市場變化多樣的摻假物質(zhì)和造假手段時,傳統(tǒng)的分析方法由于無法檢測未知摻假物質(zhì),存在一定的局限性,無法滿足高效、多維度的白酒快速檢測要求。
核磁共振波譜(nuclear magnetic resonance,NMR)首次作為定量分析的分析工具是在1963年由JUNGNICKEL等提出[9]。20世紀(jì)70年代初期,NMR開始在食品科學(xué)領(lǐng)域發(fā)揮其優(yōu)勢。相比于其他傳統(tǒng)的分析方法,1H NMR技術(shù)不僅能夠?qū)崿F(xiàn)白酒樣品中所有質(zhì)子的無偏檢測,反映酒體成分的全部特征,而且能夠在1次實驗中直接分析和檢測大量的樣品[10]、保持樣品的完整性,且操作簡單快速,測量精確,重復(fù)性高。該技術(shù)已成功應(yīng)用于牛奶[11]、果汁[12]、蜂蜜[13]和葡萄酒[14]的成分分析和摻假鑒別。1H NMR圖譜中囊括了大量已知和未知的有機化合物特征信息,通過統(tǒng)計分析手段對白酒1H NMR圖譜中的信息進行深入挖掘,抽取有效的數(shù)據(jù)信息,不僅有利于對于未知化合物的結(jié)構(gòu)解析,而且NMR信號能夠提供有機酸、酚類、氨基酸等高通量數(shù)據(jù)依據(jù)。在強波譜重疊的情況下,較為常用的統(tǒng)計學(xué)手段是偏最小二乘回歸(partial least squares regression,PLSR)分析模型,如NMR技術(shù)結(jié)合PLSR已成功應(yīng)用于啤酒中麥汁濃度、乙醇和有機酸的定量分析[10,15]。以上研究為白酒中微量組分的NMR定量研究提供了一定的參考依據(jù)。由于白酒基質(zhì)復(fù)雜,采用定量NMR技術(shù)直接對白酒樣品進行積分定量時,靈敏度不足、信號峰重疊和溶劑峰壓制技術(shù)造成臨近信號被隱藏等問題,導(dǎo)致無法實現(xiàn)白酒中有機酸和醛類的準(zhǔn)確定量?;谏鲜鲈?,NMR技術(shù)在白酒中的應(yīng)用研究基本上還處于空白階段。
為突破以上技術(shù)難點與不足,本研究擬采用1H NMR技術(shù)結(jié)合PLSR分析方法從復(fù)雜的波譜中提取有效的特征定量信息,建立白酒中有機酸和醛類的PLSR定量分析模型,實現(xiàn)白酒中有機酸和醛類的準(zhǔn)確測定,為非目標(biāo)1H NMR指紋圖譜技術(shù)應(yīng)用于食品質(zhì)量安全與真實性研究奠定良好的基礎(chǔ)。
實驗所用白酒樣品均由白酒企業(yè)提供,共計77個,其中濃香型白酒29個,馥郁香型白酒48個。疊氮化鈉(NaN3)(高純級),北京博奧拓達科技有限公司;3-(trimethylsilyl)-propionate acid-d 4(TSP)標(biāo)準(zhǔn)品,安諾倫(北京)生物科技有限公司;H3PO4、KH2PO4、HCl、NaOH(分析純),北京化工廠;重水(D2O)(99%)、丙酸、己酸、2-乙基丁酸、乙縮醛標(biāo)準(zhǔn)品,Sigma-Aldrich公司;緩沖液Technical(pH 2.00、4.01、7.00),瑞士Mettler-Toledo公司;無水乙醇(分析純),天津市大茂化學(xué)試劑廠;乙酸標(biāo)準(zhǔn)品,北京百靈威科技有限公司;丁酸標(biāo)準(zhǔn)品,上海安譜實驗科技有限公司;戊酸、異戊酸、異戊醛標(biāo)準(zhǔn)品,梯希愛(上海)化成工業(yè)發(fā)展有限公司;40%乙醛,福晨(天津)化學(xué)試劑有限公司。
Bruker Avance Ⅲ HD 400 MHz波譜儀、Bruker自動進樣器(SampleJet)、Bruker SampleJet 5 mm高通量核磁管,德國Bruker Biospin公司;AB204-N 萬分之一天平、S210 pH計、InLab?Science pH電極,瑞士Mettler-Toledo公司;島津GC 2010氣相色譜儀、氫火焰離子化檢測器,日本島津公司。
1.3.1 NMR樣品制備
用移液槍準(zhǔn)確吸取100 μL樣品緩沖溶液[16]于樣品管,加入900 μL白酒樣品溶液,用1 mol/L NaOH和1 mol/L HCl將樣品pH精確調(diào)節(jié)至4.0(± 0.02 pH單位),混合均勻后吸取600 μL于5 mm NMR管中,用于NMR測定。
1.3.2 基礎(chǔ)數(shù)據(jù)的獲得
1.3.2.1 氣相色譜法
采用直接進樣氣相色譜內(nèi)標(biāo)法對白酒樣品中有機酸和酯類的含量進行測定。色譜柱為聚乙二醇毛細(xì)管柱(60 m×0.25 mm,0.15 μm膜厚);升溫程序為初溫35 ℃,保持1 min,以3.0 ℃/min升到70 ℃,以3.5 ℃/min升到180 ℃,再以15 ℃/min升到210 ℃,保持15 min;檢測器溫度為300 ℃;進樣口溫度為280 ℃;載氣為He,流速1 mL/min;分流比20∶1;進樣量1.0 μL。
1.3.2.2 核磁共振波譜法
實驗所采用的1H NMR的共振頻率為400.13 MHz,配備5 mm BBI探頭;譜寬(SW)為20.552 4;采樣點數(shù)(TD)為65 536;接收增益(RG)為16;掃描次數(shù)(NS)為64,弛豫延遲(D1)為4 s;以3-(三甲基硅基)氘代丙酸鈉(TSP,δ=0)作為化學(xué)位移的零點。Bruker標(biāo)準(zhǔn)的脈沖序列(NOESYGPPS 1D)用于水(δ=4.8)和乙醇(δ=1.18和δ=3.64)的信號抑制。設(shè)定儀器檢測溫度為300 K,樣品檢測前需等待5 min以穩(wěn)定檢測溫度,調(diào)節(jié)樣品pH=4.0±0.02。
1.3.31H NMR數(shù)據(jù)質(zhì)量控制
由于采用標(biāo)準(zhǔn)的脈沖序列(NOESYGPPS 1D)用于水和乙醇的信號壓制,白酒中有機酸和醛類成分的信號強度得到了明顯的提高。將所有白酒樣品的NMR氫譜疊加,進一步檢查可能由于水和乙醇信號的抑制不當(dāng)、pH調(diào)節(jié)不準(zhǔn)確、系統(tǒng)誤差或其他原因?qū)е碌淖V圖基線偏移現(xiàn)象[17]。對每個樣品重復(fù)測定3次,以保證數(shù)據(jù)質(zhì)量的可靠性。
1.3.4 核磁共振波譜預(yù)處理
采用合適的波譜預(yù)處理方法,能夠有效地減少1H NMR圖譜峰漂移、基線不平、峰形不對稱和溶劑峰干擾等引起的數(shù)據(jù)波動問題。目前造成核磁信號偏移的原因主要包括儀器本身波動、質(zhì)量濃度、溫度以及pH大小等。白酒1H NMR圖譜中一些特征信號峰的化學(xué)位移出現(xiàn)偏移,將會導(dǎo)致PLSR模型樣本錯誤的分組,因此,采用適當(dāng)?shù)姆寤瘜W(xué)位移偏移校正對齊方法對隨后的多元變量統(tǒng)計分析相當(dāng)重要[18]。為了解決上述問題,本研究使用了MestReNova核磁共振數(shù)據(jù)分析軟件(美國 Mestrelab Research SL公司)的分段對齊方法,靈活選擇峰化學(xué)位移校正對齊的區(qū)域。圖1-a為分段對齊前,分段對齊后的圖譜如圖1-b所示。由圖1可知,分段對齊方法較好解決了1H NMR圖譜峰化學(xué)位移的偏移問題。
a-分段對齊前;b-分段對齊后圖1 白酒1H NMR圖譜特征峰化學(xué)位移分段對齊校正Fig.1 Alignment correction of chemical shift of characteristic peaks in Baijiu 1H NMR spectrum
TOMASI等[19]提出了一種改進的icoshift算法有效地解決了1H NMR信號波動的問題,能夠?qū)ξ⑿〉男盘栠M行調(diào)整。ESSLINGER等[20]認(rèn)為目前用來減小1H NMR圖譜數(shù)據(jù)波動最有效的手段是Bucket或者Bins,該方法的原理是將1H NMR圖譜切割為許多很小的一定區(qū)域的盒子(Bucket)。其優(yōu)點是能夠重新產(chǎn)生一個代表原始1H NMR的新圖譜,同時該圖譜所包含的數(shù)據(jù)點的數(shù)量有所減少,便于后續(xù)的統(tǒng)計分析。然而缺點是與原始NMR圖譜相比較會造成一定數(shù)量有效信息的缺失。
采用MestReNova核磁共振數(shù)據(jù)分析軟件對NMR原始波譜進行定標(biāo)、相位校正、基線校正、峰化學(xué)位移對齊和分段積分處理。分別選取0.01,0.015,0.02,0.025,0.03,0.035 和0.04 ppm作為每個分段積分的區(qū)域(Bins)寬度的取值,研究結(jié)果表明,0.01 ppm能夠保持足夠的數(shù)據(jù)分辨率以及能夠最大限度地減少圖譜信息的損失。因此,以每0.01 ppm作為區(qū)間對白酒1H NMR全譜的有效區(qū)域進行劃分。去除水信號和乙醇信號殘余峰所在區(qū)域,分段積分的有效區(qū)域為0.8~9.5 ppm,分段積分后大約能夠獲得700個分段積分值,這些分段積分值隨即作為統(tǒng)計分析的輸入變量。
1.3.5 偏最小二乘回歸分析
PLSR作為一種高效抽提信息的方法,在建模過程中集合了主成分回歸、多元線性回歸方法的優(yōu)點,研究多因變量對多自變量的回歸建模,尤其是對解決各變量內(nèi)部高度線性相關(guān)、樣本個數(shù)少于變量個數(shù)等問題較為有效,使得到的譜向量與分析物濃度直接相關(guān)[21]。
本研究以每0.01 ppm作為區(qū)間對白酒1H NMR全譜的有效區(qū)域進行劃分,并以此作為自變量矩陣,以GC所得白酒中微量組分含量結(jié)果為因變量矩陣,分別對矩陣和進行分解,如公式(1)、公式(2)所示:
X=TPT+EX
(1)
Y=UQT+EY
(2)
式中:T和U分別為X和Y的得分矩陣,P和Q分別為X和Y的載荷矩陣,EX和EY分別為X和Y的擬合殘差矩陣。
將T和U做線性回歸,如公式(3)所示:
U=TB+EU
(3)
式中:B是U與I的線性回歸系數(shù),即Y與X得分矩陣間的線性回歸系數(shù);EU為誤差項。
在預(yù)測時,對于未知樣品光譜陣Xpred,對應(yīng)的各成分含量陣Ypred,如公式(4)所示:
Ypred=TpredBQ
(4)
主成分?jǐn)?shù)的選擇是PLSR建模的關(guān)鍵,若選取的主成分個數(shù)過多,與響應(yīng)無關(guān)的變量產(chǎn)生的背景噪聲會導(dǎo)致模型過擬合,影響對統(tǒng)計趨勢的認(rèn)識,降低預(yù)測能力;若選取的主成分個數(shù)過少,則不能充分反映樣品信息,導(dǎo)致模型擬合不充分,預(yù)測準(zhǔn)確性降低。本研究通過主成分對各變量的累積貢獻率和留一交叉驗證中各主成分?jǐn)?shù)的校正標(biāo)準(zhǔn)差(the standard deviation of prediction,RMSECV)綜合考慮選取建立PLSR的主成分?jǐn)?shù)。以己酸為例,選取若干個主成分分別進行PLSR建模,主成分累積貢獻率和RMSECV隨主成分個數(shù)的變化規(guī)律如圖2和圖3所示。由圖2和圖3可知,隨著主成分個數(shù)的增加,RMSECV值逐漸降低,累計解釋方差逐漸增加。當(dāng)主成分個數(shù)是12時,RMSECV值相對最小,主成分對自變量和因變量的累積貢獻率均大于85%,且自變量X矩陣?yán)塾嫿忉尩姆讲罨颈3植蛔?。因此,綜合考慮主成分累積貢獻率和RMSECV,選取最佳主成分個數(shù)12進行PLSR建模。
圖2 主成分累積貢獻率隨主成分個數(shù)的變化規(guī)律Fig.2 Variation of cumulative contribution rate of principal components with the number of principal components
圖3 交叉驗證的校正標(biāo)準(zhǔn)差隨主成分個數(shù)的變化規(guī)律Fig.3 Variation of RMSECV with the number of principal components
根據(jù)上述原理分別對白酒中有機酸(乙酸、丙酸、丁酸、戊酸、己酸和異戊酸)和醛類(乙醛、乙縮醛和異戊醛)的主成分?jǐn)?shù)進行選擇,建立PLSR定量分析模型,結(jié)果如表1所示。
表1 PLSR定量分析模型主成分?jǐn)?shù)Table 1 The number of principal components of PLSR quantitative analysis model
在上述實驗方法的基礎(chǔ)上,分別建立白酒中有機酸和醛類的PLSR預(yù)測模型,模型預(yù)測效果如圖4所示,縱坐標(biāo)為白酒中各組分含量的預(yù)測值,橫坐標(biāo)為氣相色譜法所得的白酒中各組分測定值。由圖4可知,各組分的測定值與預(yù)測值點呈對角線分布,預(yù)測值與測定值線性關(guān)系良好,表明該模型的擬合效果和預(yù)測效果較好。
a-乙酸;b-丙酸;c-丁酸;d-戊酸;e-己酸;f-異戊酸;g-乙醛;h-乙縮醛;i-異戊酸圖4 白酒中有機酸和醛類的PLSR定量分析模型預(yù)測結(jié)果Fig.4 Results of PLSR quantitative analysis model of organic acids and aldehydes in Baijiu
預(yù)測模型的質(zhì)量通常需要通過建立預(yù)測值與測定值之間的關(guān)系進行評價,常用的模型評價參數(shù)為決定系數(shù)(R2)、預(yù)測標(biāo)準(zhǔn)偏差(RMSEP)和誤差范圍比(residual predictive deviation,RPD)等,計算公式(5)~公式(7)如下:
(5)
(6)
(7)
以每0.01 ppm作為區(qū)間對白酒1H NMR全譜的有效區(qū)域進行劃分,并以此作為自變量;以氣相色譜法所得白酒中組分濃度測定結(jié)果為因變量,建立白酒中有機酸和醛類的PLSR預(yù)測模型,模型計算結(jié)果如表2所示。由表2可知,白酒中乙酸、丙酸、丁酸、戊酸、己酸、異戊酸、乙醛、乙縮醛和異戊醛的R2分別為0.926 0、 0.985 8、 0.989 9、 0.993 5、 0.982 7、 0.982 5、 0.978 0、 0.994 1和 0.947 5,RMSEP范圍為0.128 7~0.633 3(<0.7),RPD 3.7,回歸效果較好,預(yù)測精度高。
表2 白酒中有機酸和醛類PLSR定量分析模型Table 2 PLSR quantitative analysis model of organic acids and aldehydes in Baijiu
由于偏最小二乘法的回歸系數(shù)方差無法得到準(zhǔn)確的無偏估計,故采用Jack-knife方法進行方差估計,通過計算βi對應(yīng)的t統(tǒng)計量(服從自由度為建模使用的成分個數(shù)的t分布),進行均值是否為零的假設(shè)檢驗,Jack-knife方法進行方差估計的表達式如公式(8)所示[23]:
(8)
對回歸系數(shù)進行相應(yīng)計算,判斷并挑選出對白酒中微量關(guān)鍵有機組分含量預(yù)測有顯著影響的變量,從而篩選出1H NMR圖譜中用于區(qū)分各微量組分的特征信號區(qū)域。表3總結(jié)了PLSR定量分析模型中與白酒中有機酸和醛類含量具有顯著相關(guān)性的1H NMR信號區(qū)域,可以看出除丙酸和己酸,各組分的PLSR最佳預(yù)測區(qū)間全部位于脂肪族區(qū)(0.25~3.00 ppm)和中場區(qū)(3.00~6.00 ppm)。結(jié)合白酒中有機酸和醛類的信號峰歸屬,由表4可知,除丙酸、異戊酸和乙醛外,各組分的PLSR最佳預(yù)測區(qū)間均包含該化合物特征峰的化學(xué)位移區(qū)段,例如對乙酸含量預(yù)測有極顯著影響的信號區(qū)域包含乙酸的甲基質(zhì)子信號(δH2.08)區(qū)域,而根據(jù)白酒釀造過程,對乙酸含量預(yù)測有極顯著影響的4.11~4.15 ppm區(qū)域可能與乙酸乙酯亞甲基質(zhì)子信號(δH4.12)相關(guān)。對丙酸含量預(yù)測有極顯著影響的信號區(qū)域共有12個,根據(jù)人類代謝組數(shù)據(jù)庫和丙酸加標(biāo)實驗可知,由于丙酸的甲基質(zhì)子信號(δH1.16)區(qū)域與乙醇甲基質(zhì)子信號區(qū)域重疊,故此區(qū)域未計入預(yù)測模型。然而,以上12個區(qū)域均未包含丙酸的亞甲基質(zhì)子共振信號,卻呈現(xiàn)了最佳的PLSR預(yù)測模型。同樣,對異戊酸含量預(yù)測有極顯著影響的5個信號區(qū)域不含異戊酸質(zhì)子信號特征峰化學(xué)位移,且其中3.02~3.09 ppm和3.20~3.27 ppm與異戊酸含量呈負(fù)相關(guān)關(guān)系。因此,根據(jù)以上結(jié)果推斷PLSR預(yù)測模型不僅僅依賴于分析物本身的結(jié)構(gòu)特征,還可能來源于其他因素,例如,通過多元統(tǒng)計學(xué)確定出與分析物含量呈共線關(guān)系的其他化合物的化學(xué)位移,可能為白酒中分析物形成機理的過渡或補充反應(yīng)產(chǎn)物的質(zhì)子信號區(qū)域[24]。
表3 回歸系數(shù)顯著性統(tǒng)計表Table 3 Table of significance of regression coefficient
續(xù)表3
表4 白酒中有機酸、醛類和酯類的信號峰歸屬Table 4 Signal peak attribution of organic acids and aldehydes in Baijiu
本研究采用1H NMR技術(shù)作為檢測手段,結(jié)合偏最小二乘回歸分析方法,建立白酒中6種有機酸(乙酸、丙酸、丁酸、戊酸、己酸和異戊酸)和3種醛類(乙醛、乙縮醛和異戊醛)PLSR定量分析預(yù)測模型。有機酸和醛類的PLSR預(yù)測模型的R2為0.93~0.99,RMSEP<0.7,RPD 3.7。將NMR PLSR模型預(yù)測結(jié)果與氣相色譜法進行對比分析,以各分析物的氣相色譜方法測定結(jié)果為橫坐標(biāo),以NMR PLSR模型預(yù)測結(jié)果為縱坐標(biāo)做線性回歸,發(fā)現(xiàn)各組分的氣相色譜方法測定值與NMR PLSR預(yù)測值點呈對角線均勻分布,線性關(guān)系良好(R2均>0.92),氣相色譜法和NMR PLSR預(yù)測結(jié)果誤差在±8%以內(nèi),滿足方法可行性對比分析驗證要求。研究表明NMR PLSR定量預(yù)測模型可用于白酒中6種有機酸(乙酸、丙酸、丁酸、戊酸、己酸和異戊酸)和3種醛類(乙醛、乙縮醛和異戊醛)的快速、準(zhǔn)確定量分析,模型擬合效果好、預(yù)測精度較高,可推廣應(yīng)用于白酒或其他重要食品中微量有機組分(酯類、糖類、氨基酸等)的定量檢測,具有廣泛的適用性。
PLSR定量分析預(yù)測模型的建立解決了當(dāng)前1H NMR定量分析方法在白酒基質(zhì)中信號靈敏度不足、信號峰重疊嚴(yán)重等問題,為白酒質(zhì)量安全控制提供了技術(shù)支撐,有利于滿足白酒企業(yè)對產(chǎn)品質(zhì)量把控和政府相關(guān)部門對市場監(jiān)管的需要,為開發(fā)基于1H NMR指紋圖譜的非目標(biāo)白酒真實性鑒別方法和模型奠定了基礎(chǔ)。