• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于k-means聚類挑選特征樣品建立煙草近紅外光譜模型

    2016-12-12 10:21:42招云芳王獻(xiàn)友黃文勇米津銳尚關(guān)蘭李克強(qiáng)秦家文李瑞東孫
    關(guān)鍵詞:中國(guó)煙草校正煙草

    招云芳王獻(xiàn)友黃文勇米津銳尚關(guān)蘭李克強(qiáng)秦家文李瑞東孫 莉

    (1.云南煙葉復(fù)烤有限責(zé)任公司技術(shù)中心,云南 昆明 650031;2.美國(guó)賽默飛世爾科技(中國(guó))有限公司,北京 100007)

    基于k-means聚類挑選特征樣品建立煙草近紅外光譜模型

    招云芳1王獻(xiàn)友1黃文勇1米津銳2尚關(guān)蘭1李克強(qiáng)1秦家文1李瑞東1孫莉1

    (1.云南煙葉復(fù)烤有限責(zé)任公司技術(shù)中心,云南 昆明 650031;2.美國(guó)賽默飛世爾科技(中國(guó))有限公司,北京 100007)

    為突破建立近紅外光譜模型需要大量實(shí)驗(yàn)數(shù)據(jù)這一瓶頸,實(shí)現(xiàn)快速建立煙草近紅外光譜預(yù)測(cè)數(shù)學(xué)模型,本研究利用k-means聚類分析算法挑選出具有代表性的特征樣品光譜,采用偏最小二乘(PLS)回歸法建立了煙草6項(xiàng)常規(guī)化學(xué)指標(biāo)的近紅外光譜模型,并對(duì)模型進(jìn)行了優(yōu)化及外部驗(yàn)證。結(jié)果表明:煙草6項(xiàng)常規(guī)化學(xué)指標(biāo)預(yù)測(cè)模型的相關(guān)系數(shù)(R)較大,在0.9356以上,交叉驗(yàn)證均方差(RMSECV)在0.867以內(nèi),外部驗(yàn)證均方差(RMSEP)小于1.71,預(yù)測(cè)值和標(biāo)準(zhǔn)值沒有顯著差異。同時(shí),預(yù)測(cè)結(jié)果還與用大量樣品建立的模型的預(yù)測(cè)結(jié)果進(jìn)行了t檢驗(yàn)方式的比較,其結(jié)果無顯著性差異,說明用挑選特征樣品建立的模型和使用大量樣品建立的模型分析效果一致,可用于批量煙草樣品常規(guī)化學(xué)指標(biāo)的快速檢測(cè)。

    k-means聚類分析;近紅外光譜預(yù)測(cè)數(shù)學(xué)模型;化學(xué)指標(biāo);優(yōu)化驗(yàn)證

    目前,近紅外光譜法已被廣泛應(yīng)用于煙草成分的定量測(cè)定。但目前近紅外光譜建模的研究都是依靠大量的樣品光譜及對(duì)應(yīng)的樣品化學(xué)分析數(shù)據(jù),這給建模工作帶來了巨大的壓力,即要耗費(fèi)大量的人力和物力,更要為之付出大量的時(shí)間,使得建模周期比較長(zhǎng)。為突破建立近紅外光譜模型需要大量實(shí)驗(yàn)數(shù)據(jù)這一瓶頸,本文采用k-means聚類分析算法對(duì)采集的光譜進(jìn)行聚類分析,挑選出特征光譜進(jìn)行化學(xué)分析檢測(cè)后,應(yīng)用多元校正技術(shù)中的偏最小二乘法,建立了測(cè)定復(fù)烤行業(yè)常規(guī)化學(xué)指標(biāo):水溶性總糖、還原糖、煙堿、總氮、氯、鉀的校正模型,并對(duì)影響建模效果的光譜數(shù)據(jù)預(yù)處理方法、異常值等進(jìn)行了討論。此外,校正模型分別采用交叉驗(yàn)證和外部驗(yàn)證進(jìn)行預(yù)測(cè)評(píng)價(jià),預(yù)測(cè)效果良好。

    1.儀器與材料

    AntarisⅡ傅里葉變換NIR光譜儀(美國(guó)Thermo Nicolet公司,配有積分球漫反射采樣系統(tǒng)、Result操作軟件、TQ Analyst分析軟件);625烘箱(德國(guó)FREAS公司);AA3連續(xù)流動(dòng)分析儀(德國(guó)SEAL公司)。青州標(biāo)樣對(duì)照品(中國(guó)煙草總公司青州煙草研究所),蒸餾水,其余試劑為分析純。

    2.方法

    2.1樣品的制備

    以2014烤季云南煙葉復(fù)烤公司所屬10個(gè)復(fù)烤廠(石林廠、瀘西廠、麒麟廠、大理廠、楚雄廠、文山廠、保山廠、師宗廠、宣威廠、陸良廠)的烤煙為示范性研究對(duì)象。樣品來自云南省不同地區(qū)、不同品種、不同等級(jí)、不同部位的烤煙,樣品共計(jì)1534個(gè),用粉碎機(jī)粉碎,過40目篩,樣品裝入密封袋中,在低溫(0~4℃)條件下密封避光保存。

    2.26項(xiàng)化學(xué)指標(biāo)標(biāo)準(zhǔn)值的測(cè)定

    分別采用行業(yè)標(biāo)準(zhǔn)《煙草及煙草制品 鉀的測(cè)定 連續(xù)流動(dòng)法》YC/T 217-2007,《煙草及煙草制品 氯的測(cè)定 連續(xù)流動(dòng)法》YC/T 162-2011,《煙草及煙草制品 總氮的測(cè)定 連續(xù)流動(dòng)法》YC/T 161-2002,《煙草及煙草制品 水溶性糖的測(cè)定 連續(xù)流動(dòng)法》YC/T 159-2002,《煙草及煙草制品 總植物堿的測(cè)定 連續(xù)流動(dòng)法》YC/T 160-2002,對(duì)煙草樣品進(jìn)行6項(xiàng)指標(biāo)的檢測(cè)。

    2.3光譜采集

    取預(yù)先制備好的煙草樣品,裝入樣品杯中,利用積分球漫反射采樣系統(tǒng)采集其NIR光譜。光譜采集條件:以儀器內(nèi)置背景為參比,波數(shù)范圍10000~3800cm-1,掃描次數(shù)為64次,分辨率為8cm-1,見表1。

    2.4k-means聚類分析原理

    k-means聚類算法是一種以距離為相似性依據(jù)的聚類方法,本研究在對(duì)近紅外光譜的主成因子進(jìn)行歐氏距離計(jì)算,距離公式如式(1)所示。

    其中:d為距離,P為主成分,下標(biāo)a,b代表樣品編號(hào),下標(biāo)i代表第i維主成分因子。

    之后對(duì)距離進(jìn)行聚類,該聚類算法流程如圖1所示。

    本研究取煙草的近紅外光譜貢獻(xiàn)率超過95%的前6維主成分因子,代入k-means矩陣算法中進(jìn)行聚類計(jì)算。聚類后從每類中選取一個(gè)樣品光譜作為代表性樣品參與建模。

    本實(shí)驗(yàn)共采集樣品光譜1534條,使用k-means聚類選取的特征樣品光譜415條。

    3.1定量校正模型中檢測(cè)指標(biāo)的統(tǒng)計(jì)描述

    表2為復(fù)烤行業(yè)主要化學(xué)指標(biāo)常規(guī)方法檢測(cè)的標(biāo)準(zhǔn)值的統(tǒng)計(jì)描述。建立模型時(shí)全部樣品都用作校正集。由表2可知,校正集樣品化學(xué)指標(biāo)的含量范圍較寬,且含量分布均勻。

    3.2光譜數(shù)據(jù)的處理

    煙草是一種復(fù)雜的天然產(chǎn)物,其近紅外光譜中譜峰重疊嚴(yán)重,因此建模前通常采用導(dǎo)數(shù)處理來消除光譜基線的平衡、漂移及平緩背景的干擾,但同時(shí)導(dǎo)數(shù)處理也放大了光譜信號(hào),噪聲信號(hào)也被放大,因此在對(duì)原始光譜求導(dǎo)前,首先對(duì)光譜數(shù)據(jù)進(jìn)行平滑處理,然后分別考察原始光譜、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)光譜對(duì)所建校正模型的影響。

    從圖2和圖3對(duì)比可以看出,光譜數(shù)據(jù)經(jīng)過導(dǎo)數(shù)處理后,可消除基線偏移,扣除本底吸收,從而更為細(xì)致地反映樣品的光譜特征。

    經(jīng)過Norris導(dǎo)數(shù)平滑濾波后的光譜數(shù)據(jù)分別經(jīng)多元散射校正技術(shù)(MSC)和標(biāo)準(zhǔn)正態(tài)變量變換技術(shù)(SNV)處理后,又分別考察了原始光譜、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)光譜對(duì)所建校正模型的影響,并采用偏最小二乘(PLS)回歸法建立定量校正模型??疾旖Y(jié)果如圖4所示,圖4為RMSEC/R的比值做的折線圖。由于校正集樣品的校正標(biāo)準(zhǔn)偏差(RMSEC)越小,相關(guān)系數(shù)(R)越大,說明模型優(yōu)化的越好,所以RMSEC/R值越小,模型效果越好。從圖4看出,總糖、煙堿、總氮、鉀的預(yù)測(cè)模型采用SNV處理光譜并對(duì)光譜進(jìn)行二階導(dǎo)數(shù)后建立的模型的RMSEC/R值最小;還原糖、氯的預(yù)測(cè)模型采用SNV處理光譜并對(duì)光譜進(jìn)行一階導(dǎo)數(shù)后建立的模型RMSEC/R值最小。

    3.3定量校正模型的建立

    應(yīng)用TQ Analyst分析軟件中的偏最小二乘回歸(Partial least-square regression,PLS)算法,把采集的近紅外漫反射光譜與標(biāo)準(zhǔn)方法測(cè)定的烤煙水溶性總糖、還原糖、煙堿、總氮、氯、鉀的標(biāo)準(zhǔn)值,全部用做校正集來建立定量校正模型。由于PLS主因子數(shù)關(guān)系到模型的穩(wěn)定性,主因子選取太小會(huì)丟失有用信息,包含過多噪音,出現(xiàn)“欠擬合”,太大則會(huì)出現(xiàn)“過擬合”,因此,本研究按留一交叉驗(yàn)證的方法確定最終的偏最小二乘因子數(shù)。采用校正標(biāo)準(zhǔn)偏差(Standard error of calibration,SEC)、外部驗(yàn)證均方差即預(yù)測(cè)標(biāo)準(zhǔn)偏差(Standard error of prediction,RMSEP)、交叉驗(yàn)證均方差(RMSECV)和決定系數(shù)(R2)對(duì)PLS模型的性能進(jìn)行評(píng)價(jià)。RMSEC和RMSEP越小,R越大,表示模型的性能越好。所有參數(shù)的計(jì)算方法見文獻(xiàn)。校正模型初步建立以后,需要對(duì)模型進(jìn)一步優(yōu)化,即用不同的樣品檢驗(yàn)?zāi)P?,剔除建模樣品中的異常值,修改建模的譜區(qū)和其他參數(shù),以提高模型的穩(wěn)定性和可靠性。本研究采用最直觀、最簡(jiǎn)單的判別方法對(duì)異常值進(jìn)行剔除,即用外部驗(yàn)證樣品的真實(shí)值和擬合值(Ture/Fit)的散點(diǎn)圖進(jìn)行查看,并結(jié)合馬氏距離和杠桿值等聯(lián)合判斷,采用交叉驗(yàn)證(Cross validation)逐步剔除這些強(qiáng)影響點(diǎn)。

    3.4PLS主因子數(shù)的選擇和交叉驗(yàn)證結(jié)果

    采用PLS法建立定量校正模型時(shí),為避免出現(xiàn)“過擬合”現(xiàn)象,需要對(duì)主因子數(shù)進(jìn)行合理選擇。本研究采用留一交叉驗(yàn)證法,考察了主因子數(shù)對(duì)RMSECV的影響如圖5所示。由圖中可以看出,PLS主因子數(shù)依次為總糖17,還原糖18,煙堿18,總氮19,氯18,鉀21。

    3.5模型的外部驗(yàn)證

    模型自身的外部驗(yàn)證:將建立的定量校正模型用于對(duì)云南煙葉復(fù)烤公司所屬10個(gè)復(fù)烤廠挑選出的不同地區(qū)、不同品種、不同部位、不同等級(jí)的60個(gè)樣品進(jìn)行6項(xiàng)化學(xué)指標(biāo)的預(yù)測(cè)。預(yù)測(cè)值和標(biāo)準(zhǔn)值有較低的預(yù)測(cè)均方差和較高的相關(guān)系數(shù)(表3)。

    與用大量樣品建立的成熟模型的對(duì)比驗(yàn)證:為了進(jìn)一步驗(yàn)證模型的準(zhǔn)確性,本研究還選取一些驗(yàn)證樣品與其他單位用大量樣品建立的成熟的模型進(jìn)行預(yù)測(cè)對(duì)比,預(yù)測(cè)樣品數(shù)為40個(gè),同樣得到了較低的預(yù)測(cè)均方差和較高的相關(guān)系數(shù)(表4)。同時(shí),預(yù)測(cè)結(jié)果使用t檢驗(yàn)方式進(jìn)行檢驗(yàn)。假設(shè)兩種方法建立的預(yù)測(cè)模型檢測(cè)的6項(xiàng)化學(xué)指標(biāo)的均值在風(fēng)險(xiǎn)水平α=0.05時(shí),計(jì)算得到的t值均小于t臨界值,則說明兩種方法建立的預(yù)測(cè)模型的檢測(cè)結(jié)果無顯著差異。由表4看出,6項(xiàng)化學(xué)指標(biāo)的t檢驗(yàn)值均小于臨界值,兩種方法建立的模型檢測(cè)結(jié)果無顯著差異,說明挑選特征樣品建立的模型和使用大量樣品建立的模型分析效果一致。

    結(jié)論

    采用k-means聚類分析選擇特征樣品光譜,用PLS法建立了煙草常規(guī)化學(xué)指標(biāo)的近紅外定量預(yù)測(cè)模型,并用未參與建模的眾多樣品進(jìn)行了外部驗(yàn)證,驗(yàn)證的均方差(RMSEP)分別為總糖1.71,還原糖1.35,煙堿0.18,總氮0.28,氯0.14,鉀0.32。與用原始方法建立的成熟模型相比,驗(yàn)證均方差均在0.9403以上,兩種的檢測(cè)結(jié)果也無顯著差異。由此說明,本研究采用k-means聚類分析挑選特征樣品建立近紅外光譜模型的方法解決了實(shí)際建模過程中需要大量化學(xué)實(shí)驗(yàn)數(shù)據(jù)的這一瓶頸,所建立的煙草近紅外光譜模型可運(yùn)用于煙草化學(xué)6項(xiàng)化學(xué)指標(biāo)的快速檢測(cè)。為了使模型具有更寬的檢測(cè)范圍,本研究還在收集不在模型范圍內(nèi)的檢測(cè)數(shù)據(jù)。從而獲得更完善的模型,指導(dǎo)復(fù)烤行業(yè)生產(chǎn)過程質(zhì)量的在線監(jiān)測(cè),為實(shí)現(xiàn)復(fù)烤行業(yè)均質(zhì)化生產(chǎn)模式提供了理論依據(jù)。

    [1]滑榮,韓建國(guó),齊曉,等.近紅外漫反射光譜法預(yù)測(cè)紫花苜蓿草顆粒營(yíng)養(yǎng)價(jià)值[J]. 光譜學(xué)與光譜分析,2008(12):2826-2829.

    [2]陳昭,吳志生,史新元,等. Bagging 偏最小二乘和 Boosting 偏最小二乘算法的金銀花醇沉過程近紅外光譜定量模型預(yù)測(cè)能力研究[J].化學(xué)分析,2014(11):1679-1686.

    [3]王冬,閔順耕,曹金莉,等.溫度對(duì)煙草總植物堿近紅外定量分析模型的影響[J].中國(guó)煙草科學(xué),2013-08,34(4):103-106.

    [4]王家俊,梁逸曾,汪帆.偏最小二乘法結(jié)合傅里葉變換近紅外光譜同時(shí)測(cè)定卷煙焦油、煙堿和一氧化碳的釋放量[J].化學(xué)分析,2005(6):793-797.

    [5] Balabin R M, Safieva R Z. Biodiesel classification by base stock type (vegetable oil)using near infrared spectroscopy data[J]. Analytica Chimica Acta, 2011,689: 190-197.

    [6]梁俐俐,吳正舉,蘇明亮,等.云貴產(chǎn)區(qū)煙葉近紅外檢測(cè)分模型和總模型的對(duì)比分析[J].中國(guó)煙草科學(xué),2008,29(2):42-46.

    [7]邱軍,王允白,張懷寶,等.近紅外光譜法預(yù)測(cè)煙氣總粒相物中的煙堿含量[J].中國(guó)煙草科學(xué),2006(2):12-13.

    [8] Barbin D F, Kaminishikawahara C M, Soares A L. Prediction of chicken quality attributes by near infrared spectroscopy[J]. Food Chemistry,2015, 168: 554-560.

    [9] Haughey S A, Graham S F, Cancou?t E, et al. The application of Near-Infrared Reflectance Spectroscopy (NIRS) to detect melamine adulteration of soya bean meal[J]. Food Chemistry,2013, 136: 1557-1561.

    [10] 邱軍,張懷寶,宋巖,等.近紅外光譜分析技術(shù)在煙草行業(yè)的應(yīng)用[J].中國(guó)煙草科學(xué),2008,29(1):55-59.

    [11]董小衛(wèi),馬 強(qiáng),厲昌坤,等.近紅外檢測(cè)把煙葉片化學(xué)成分技術(shù)研究[J].中國(guó)煙草科學(xué),2008,29(4):10-14.

    [12] 付秋娟,張懷寶,邱軍,等.近紅外光譜法快速測(cè)定煙草中的總揮發(fā)堿[J].中國(guó)煙草科學(xué),2005,26(4):14.15.

    [13] 王宏鋁,王筑臨,許小雙,等.基于在線煙堿預(yù)測(cè)模型的煙葉復(fù)烤均質(zhì)化加工[J].煙草科技,2015,48(6):73-77.

    [14] 溫亞東,王毅,王能如,等.近紅外光譜的投影分析方法在工業(yè)分級(jí)與復(fù)烤模塊配方中的應(yīng)用[J].中國(guó)煙草學(xué)報(bào),2009,15(5):6-10.

    O657

    A

    中國(guó)煙草總公司云南省公司2015年度科技計(jì)劃項(xiàng)目(基于煙葉外觀與生化表征的均質(zhì)化復(fù)烤控制技術(shù)開發(fā),NO.2015YN33)。

    猜你喜歡
    中國(guó)煙草校正煙草
    《中國(guó)煙草學(xué)報(bào)》入編《中文核心期刊要目總覽》2023年版
    煙草具有輻射性?
    "中國(guó)煙草科教網(wǎng)"平臺(tái)簡(jiǎn)介
    劉光第《南旋記》校正
    基于完全壟斷體制下的中國(guó)煙草企業(yè)倫理管理淺析
    一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
    機(jī)內(nèi)校正
    煙草依賴的診斷標(biāo)準(zhǔn)
    煙草中茄酮的富集和應(yīng)用
    中國(guó)煙草博物館
    武安市| 文安县| 徐州市| 修文县| 光山县| 虎林市| 石城县| 桓台县| 凤翔县| 腾冲县| 曲水县| 尼木县| 浪卡子县| 城市| 谷城县| 西青区| 保靖县| 洪湖市| 辽阳市| 旌德县| 张家口市| 鹤峰县| 峨眉山市| 禄丰县| 稷山县| 定西市| 隆子县| 光泽县| 景洪市| 盱眙县| 马关县| 五家渠市| 罗山县| 桂东县| 满洲里市| 江安县| 武强县| 莲花县| 蚌埠市| 永登县| 宁海县|