• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于FT-NlR光譜技術(shù)結(jié)合KPCA-MD-SVM對白酒基酒的快速判別

      2022-04-28 09:01:50翟雙庹先國張貴宇朱雪梅羅林高婧羅琪
      現(xiàn)代食品科技 2022年4期
      關(guān)鍵詞:基酒降維光譜

      翟雙,庹先國*,張貴宇,2*,朱雪梅,羅林,高婧,羅琪

      (1.四川輕化工大學(xué)自動化與信息工程學(xué)院,人工智能四川省重點實驗室,四川宜賓 644000)(2.西南科技大學(xué)信息工程學(xué)院,四川綿陽 621010)

      白酒在中國是一種具有獨特歷史背景和風(fēng)土人情的產(chǎn)物,其釀造工藝更是代代相傳。摘酒是釀造工藝中很重要的一個環(huán)節(jié)[1,2],基酒的準確分級是摘酒過程中最為重要的操作?;破焚|(zhì)的好壞直接影響到白酒的貯存和優(yōu)質(zhì)成品酒的產(chǎn)量。目前,摘酒主要還是靠成熟的摘酒工通過看酒花的大小和品嘗味道來對基酒的酒度和風(fēng)味進行一個評判和分段摘取,此方法會因為工人的熟練度有所不同而導(dǎo)致基酒品級良莠不齊,從而影響白酒的分級貯存和優(yōu)質(zhì)酒的產(chǎn)量。故研究一種簡單且又客觀準確的基酒分段判別技術(shù)尤為重要。

      近年來,光譜技術(shù)的發(fā)展尤為迅速,因其重現(xiàn)性好,檢測快速且無損,樣品無需處理等優(yōu)點已經(jīng)被廣泛運用于食品行業(yè)的質(zhì)量檢測以及其他行業(yè)物質(zhì)類別的快速鑒別。高暢等[3]、段飛等[4]運用近紅外光譜技術(shù)結(jié)合算法對白酒基酒總酯建立了定量分析模型。董新羅[5]運用近紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)方法對杜康基酒中五種主要風(fēng)味物質(zhì)進行了快速檢測。龔輝等[6]利用近紅外漫反射技術(shù)實現(xiàn)了對黃酒酒醅中的酒精度的快速測定。袁強等[7]使用傅里葉近紅外光譜法快速測定了養(yǎng)生酒的酒精度。孫宗保等[8]利用傅里葉變換近紅外光譜技術(shù)對白酒基酒的主要風(fēng)味物質(zhì)進行了快速定量分析以及對白酒基酒建立了定性分析模型。以上研究都表明光譜技術(shù)能對白酒進行定性和定量檢測,而目前對摘酒過程中基酒的檢測和研究還比較少,基本集中在對基酒的實驗室研究。因其FT-NIR近紅外光譜對樣品檢測速度快且對樣品無損,能滿足在生產(chǎn)過程對基酒的檢測。

      近紅外光譜技術(shù)作為一種間接的分析檢測手段,是無法直接從光譜信號中得出相關(guān)化合物的定量或定性信息,其檢測結(jié)果需要結(jié)合有效的建模方法來體現(xiàn)。光譜數(shù)據(jù)本質(zhì)上屬于非線性數(shù)據(jù),數(shù)據(jù)處理時尋找一種有效的非線性分析處理方法能夠提高建模效果。核主成分分析(Kernel Principal Component Analysis,KPCA)是一種建立在主成分分析(Principal Component Analysis,PCA)基礎(chǔ)上的非線性處理算法。PCA在處理線性數(shù)據(jù)時效果良好,但是在非線性數(shù)據(jù)處理效果上不明顯,而KPCA就能較好的解決這個問題[9,10]。異常樣品的存在會降低模型的精度和泛化能力,所以在構(gòu)建模型時需要將其異常數(shù)據(jù)剔除。馬氏距離(Mahalanobis distance,MD)適用于近紅外光譜異常數(shù)據(jù)的剔除[11],因此選擇了此方法來剔除基酒異常光譜數(shù)據(jù)。支持向量機(Support Vector Machine,SVM)主要是通過找到最大間隔的劃分超平面,使得不同類別之間的間隔最大化,在處理非線性和高維數(shù)據(jù)等問題中具有一定優(yōu)勢[12-14]。故利用KPCA+MD+SVM對白酒基酒光譜數(shù)據(jù)建立定性判別模型以實現(xiàn)對白酒基酒的快速鑒別,為近紅外在自動摘酒上提供一種理論可能。

      1 材料與方法

      1.1 樣品與數(shù)據(jù)采集

      摘取的基酒品級段數(shù)是根據(jù)發(fā)酵酒醅的質(zhì)量而具體制定。實驗所摘取的基酒樣品有四個品級的劃分,有頭段、一段、二段以及尾段。從酒甑開始流酒起,摘取頭段到尾段每個段數(shù)的基酒樣品。由于不同酒段的流酒時間不同,設(shè)置摘取基酒樣本的間隔時間也是不同的。頭段、二段以及尾酒摘取時間間隔為1~2 min,一段酒的摘取間隔為7~8 min。從頭段到尾段一共采集10個樣品,將采集好的樣品裝入事先準備好的50 mL的采集瓶,以備采集光譜數(shù)據(jù)使用。本文研究所用白酒基酒近紅外光譜樣品共400個,其中按基酒段數(shù)各取100個,樣品取自中國某白酒酒廠。

      1.2 儀器與樣品制備

      儀器設(shè)備:光譜采集設(shè)備是來自德國Bruker公司型號為Matrix-F的傅里葉變換近紅外光譜儀,光譜分析軟件采用MATLAB2020。

      樣品制備:實驗室溫度為20±2 ℃,空氣相對濕度<80% RH。先將近紅外檢測附件安裝在光譜儀上,然后啟動與儀器相連的電腦,并啟動儀器電源,待儀器穩(wěn)定后啟動光譜信號采集軟件OPUS7.8,并預(yù)熱1 h。調(diào)試儀器檢測模式,將儀器檢測模式調(diào)為液體檢測模式,液體測定采用透射模式,并且設(shè)置光譜掃描范圍:4000~12000 cm-1;分辨率:8 cm-1;掃描次數(shù):32次?;频脑脊庾V數(shù)據(jù)是取兩次光譜掃描結(jié)果的平均值。

      1.3 數(shù)據(jù)處理

      1.3.1 數(shù)據(jù)預(yù)處理

      基酒樣品光譜采集范圍是4000~12000 cm-1,因受儀器本身的原因,光譜圖的兩端的噪聲影響較大,因此截取采集在4300~9000 cm-1范圍內(nèi)的1217個光譜數(shù)據(jù)進行處理分析。光譜譜圖一般會存在噪聲、基線漂移及背景干擾,為提高建模的精度與可靠性,需對原始光譜數(shù)據(jù)進行預(yù)處理來消除其無關(guān)干擾。常用的光譜預(yù)處理方法有一階導(dǎo)數(shù),Savitzky-Golay平滑,基線校準等方法。

      1.3.2 數(shù)據(jù)降維與異常樣本剔除

      1.3.2.1 數(shù)據(jù)降維

      基酒中含有香味物質(zhì)的種類繁多,光譜數(shù)據(jù)中含有大量的特征信息及冗余信息,故對數(shù)據(jù)進行降維處理。線性降維不能很好將數(shù)據(jù)分類,故使用核主成分分析(KPCA)對基酒光譜數(shù)據(jù)進行降維處理。

      核主成分分析算法是在PCA算法的基礎(chǔ)上加入了核函數(shù),可以挖掘出數(shù)據(jù)集中隱含的非線性信息。

      假設(shè)有n個基酒樣本x={x1,x2,···,xn},xi∈RN,每個樣本有m個屬性,則xi={xi1,xi2,···,xim}。構(gòu)造初始樣本矩陣X′n×m并進行標準化,得到樣本矩陣

      Xn×m。

      首先,將樣本通過映射函數(shù)φ映射到高維特征空間RF中,對應(yīng)映射值為φ(x1),φ(x2),···,φ(xn)并使用PCA方法得到協(xié)方差矩陣為:

      通過(8)式,求得特征值λ1≥λ2≥···λn及其對應(yīng)特征向量α1,α2,···,αn。選取p(p≤n)個特征值,滿足貢獻率≥85%。新樣本φ(xj)投影后的第j(j=1,2,···,p)維坐標為:

      1.3.2.2 異常樣本剔除

      為提高建模的準確性,研究采用馬氏距離來剔除基酒光譜的異常樣品。

      馬氏距離計算公式:

      1.3.3 分類模型建立

      當數(shù)據(jù)通過KPCA降維和馬氏距離剔除異常樣本后,對訓(xùn)練集進行建模。

      本文的基酒段數(shù)有四段,采用支持向量機(SVM)建立基酒分類模型,采用的分類方式為“一對一”,每一類分別構(gòu)建與其他類的二分類器,其具體原理參考王乃芯多分類支持向量機的研究[15]。本研究采用了徑向基(RBF)核函數(shù)對基酒光譜數(shù)據(jù)建立模型,因為徑向基核函數(shù)具有比較寬的收斂域,具有較強的適應(yīng)性[16]。對于基于SVM建立的分類模型,懲罰因子和RBF參數(shù)對分類結(jié)果有重要的影響,本研究采用網(wǎng)格搜索法來尋找最優(yōu)的參數(shù)值。

      2 結(jié)果與分析

      2.1 原始光譜數(shù)據(jù)建模效果

      圖1為400個基酒樣品原始近紅外光譜圖。

      為驗證模型的準確率與泛化能力,采用SPXY對數(shù)據(jù)集進行劃分,劃分比例為4:1。將400個基酒樣品中的320個作為訓(xùn)練集用于支持向量機(SVM)進行建模,然后用所建基酒分段模型對余下的80個基酒樣品組成的測試集進行判別。其訓(xùn)練集正確率為90%,測試集判別率為87.70%,判別效果不理想。

      2.2 預(yù)處理與KPCA分析后的模型效果

      原始數(shù)據(jù)量中一個樣品具有2203個特征,計算量龐大,十分耗費時間。除此之外,12000 cm-1與4000 cm-1附近因為儀器本身和環(huán)境的噪聲對建模也有影響,故截取采集在4300~9000 cm-1范圍內(nèi)的1217個光譜數(shù)據(jù)進行分析。

      從圖2a中可看出光譜存在基線漂移和噪聲的問題,為消除噪聲和基線漂移等干擾建模效果因素,對光譜數(shù)據(jù)進行了預(yù)處理,其預(yù)處理效果如圖2b。經(jīng)過計算驗證,基線校準+SG平滑為最優(yōu)預(yù)處理方式,其中建模時間為17706.15 s且訓(xùn)練集正確率為93.02%,測試集判別率為90.08%,相比較原始光譜的建模結(jié)果,進行過最優(yōu)預(yù)處理的光譜的模型訓(xùn)練集正確率提高了3.02%,測試集判別率提高了2.38%。

      為了對基酒進行快速判別,減少運算時間,數(shù)據(jù)降維處理非常有必要。由于光譜數(shù)據(jù)呈非線性,使用主成分分析時的分類效果不好,所以使用了核主成分分析對樣品光譜數(shù)據(jù)進行降維處理,圖3是經(jīng)過最優(yōu)預(yù)處理方式后的核主成分累計貢獻率結(jié)果。

      從圖3中可以看出當核主成分數(shù)為14時,其累計貢獻率就已經(jīng)達到90%。當累計貢獻率為100%時,核主成分數(shù)為400。相比原數(shù)據(jù)的1217維數(shù)據(jù)特征,經(jīng)過核主成分分析的數(shù)據(jù)降維效果明顯。

      選取核主成分分析的部分不同累計貢獻率的降維數(shù)據(jù)進行建模,其計算結(jié)果見表1。

      表1 不同核主成分數(shù)下的基酒判別結(jié)果Table 1 Discrimination results of base liquor under different kernel principal component fractions

      從表1中可以看出隨著累計貢獻率的增加,取得的核主成分數(shù)就越多,其中當累計貢獻率達到0.9即核主成分數(shù)為14時,分類效果最好。其中訓(xùn)練集的正確率達到94.81%,測試集的判別率達到90.75%,同時模型建立時間為731.57 s。相比于未進行核主成分分析時模型訓(xùn)練集的正確率提高了1.79%,測試集的判別率提高了0.67%,同時少用24倍的建模時間。說明了核主成分分析能夠提高模型準確率的同時大大縮短了建模所需時間。

      雖然使用核主成分分析后的基酒分段模型時間遠遠少于未進行核主成分處理的模型,但是模型的判別效果還需要提升。其中訓(xùn)練集正確率還有待提高,預(yù)測集判別效果不夠理想,這可能是異常樣品的存在影響了模型的判別能力,故該對樣本做異常數(shù)據(jù)剔除。

      2.3 剔除異常樣品對判別效果的研究

      選取基線校準+SG平滑的前13個核主成分的基酒數(shù)據(jù)進行馬氏距離計算,得到馬氏距離分布圖4。從圖4中可以看出,第1、4、7號樣品的馬氏距離過大,為異常光譜數(shù)據(jù)樣品。為了探討異常樣品對模型的影響,按照1.3.2.2中所提到的方法,本研究設(shè)置了6個不同權(quán)重系數(shù)e(3,2,1.95,1.9,1.85,1.8),分別將大于該閾值的異常光譜數(shù)據(jù)剔除,然后利用剩下的樣品數(shù)據(jù)采用SVM進行訓(xùn)練集建模,用測試集檢測異常樣品剔除對建模效果的影響,其剔除樣品個數(shù)與建模效果如下表2所示,其中當閾值e為1.85時,其判別率最高。

      表2 不同權(quán)重系數(shù)下的判別結(jié)果Table 2 Discrimination results under different weight coefficients

      從表2中可以看出,當權(quán)重系數(shù)越小時,剔除的數(shù)據(jù)就越多。當權(quán)重系數(shù)e為1.85時,基酒分段模型對測試集的判別效果最好,其訓(xùn)練集判別率能達到98.72%,測試集判別率能達到98.75%,相比未進行異常數(shù)據(jù)剔除時訓(xùn)練集的正確率提高了3.91%,測試集的判別率提高了8%,說明了馬氏距離能夠有效剔除異常光譜數(shù)據(jù),提高模型的判別能力。圖5為權(quán)重系數(shù)e為1.85時,測試集的結(jié)果圖。

      3 結(jié)論

      本文利用傅里葉近紅外光譜技術(shù)對摘酒過程中的基酒樣品進行測量,借助KPCA-MD-SVM算法建立了基酒分段模型。此基酒分段模型對測試集的判別率為98.75%,證明了使用核主成分分析(KPCA)能有效對基酒的近紅外光譜進行降維處理,并且降維處理后的數(shù)據(jù)建立的分類模型能很好對基酒段數(shù)進行判別。同時馬氏距離法能有效地剔除基酒的異常光譜數(shù)據(jù),基酒的分類模型的準確性得到了明顯的提升。KPCA-MD-SVM模型對基酒段數(shù)進行判別,其穩(wěn)定性好,為近紅外光譜在實現(xiàn)自動化摘酒應(yīng)用上提供了一種理論可能。

      猜你喜歡
      基酒降維光譜
      Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
      高粱種植地、籽粒、基酒及酒糟中重金屬含量分析
      基于三維Saab變換的高光譜圖像壓縮方法
      那些外購基酒的白酒企業(yè)
      支點(2020年12期)2020-12-23 09:35:11
      2021年茅臺酒基酒生產(chǎn)目標發(fā)布
      釀酒科技(2020年11期)2020-12-18 22:49:43
      降維打擊
      海峽姐妹(2019年12期)2020-01-14 03:24:40
      貴州茅臺2017年產(chǎn)量6.38萬噸
      釀酒科技(2018年5期)2018-01-17 03:29:33
      星載近紅外高光譜CO2遙感進展
      苦味酸與牛血清蛋白相互作用的光譜研究
      拋物化Navier-Stokes方程的降維仿真模型
      計算物理(2014年1期)2014-03-11 17:00:18
      武功县| 通州市| 阿合奇县| 马鞍山市| 新丰县| 郴州市| 和林格尔县| 深圳市| 隆昌县| 合作市| 藁城市| 兰西县| 淮南市| 黄梅县| 泸水县| 贵南县| 樟树市| 芜湖县| 通州市| 泽普县| 德令哈市| 大冶市| 华安县| 高碑店市| 山丹县| 邻水| 隆回县| 青阳县| 密山市| 宕昌县| 郁南县| 牟定县| 当阳市| 乾安县| 博湖县| 成安县| 新兴县| 嵩明县| 锡林郭勒盟| 南城县| 和硕县|