• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器學(xué)習(xí)算法的烤煙香型分類(lèi)研究

      2016-03-24 09:15:50郭東鋒胡海洲竇玉青張忠鋒舒俊生
      關(guān)鍵詞:香型機(jī)器學(xué)習(xí)烤煙

      郭東鋒,閆 寧,胡海洲,劉 非,鄒 鵬,竇玉青,張忠鋒,舒俊生

      (1.安徽中煙工業(yè)有限責(zé)任公司 技術(shù)中心,安徽 合肥 230088;2.中國(guó)農(nóng)業(yè)科學(xué)院 煙草研究所,山東 青島 266101)

      ?

      基于機(jī)器學(xué)習(xí)算法的烤煙香型分類(lèi)研究

      郭東鋒1,閆 寧2*,胡海洲2,劉 非1,鄒 鵬1,竇玉青2,張忠鋒2,舒俊生1

      (1.安徽中煙工業(yè)有限責(zé)任公司 技術(shù)中心,安徽 合肥 230088;2.中國(guó)農(nóng)業(yè)科學(xué)院 煙草研究所,山東 青島 266101)

      摘要:為了探索烤煙香型判別分析的方法,采集了我國(guó)典型香型的烤煙樣本,運(yùn)用機(jī)器學(xué)習(xí)的方法對(duì)訓(xùn)練集和測(cè)試集的樣本進(jìn)行了模型擬合,結(jié)果表明:對(duì)于清香型、濃香型、中間香型擬合最好的機(jī)器學(xué)習(xí)算法為神經(jīng)網(wǎng)絡(luò)模型,就香型而言,該模型對(duì)于清香型、濃香型評(píng)價(jià)相對(duì)較好,中間香型整體判定效果較低;就數(shù)據(jù)集而言,在數(shù)據(jù)準(zhǔn)備中分部位進(jìn)行香型判別較為合理。在具體香型分析判別中,可首選神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法,為煙草質(zhì)量評(píng)價(jià)和卷煙產(chǎn)品研發(fā)等提供技術(shù)依據(jù)。

      關(guān)鍵詞:烤煙;香型;分類(lèi);機(jī)器學(xué)習(xí)

      烤煙香型不僅是區(qū)分煙葉風(fēng)格特征的一項(xiàng)重要指標(biāo),而且是煙葉品質(zhì)區(qū)域劃分的重要依據(jù)和中式卷煙風(fēng)格的重要構(gòu)成因素[1-2]。近年來(lái),“三縱三橫”、“特色煙開(kāi)發(fā)”等重大項(xiàng)目的開(kāi)展,促成了對(duì)烤煙香型研究和認(rèn)識(shí)進(jìn)一步加深[3]。前人在不同產(chǎn)區(qū)烤煙揮發(fā)性物質(zhì)[4-5]、潛香型物質(zhì)與評(píng)吸質(zhì)量[6-7]、香氣特征與化學(xué)成分差異[8-13]等方面開(kāi)展了研究,畢淑峰等[14]用逐步判別分析方法鑒定了我國(guó)烤煙香型,李章海[15-16]、王能如[17]等采用指數(shù)模型的方法分析了我國(guó)烤煙香型的重要因子及生態(tài)尺度差異,詹軍等[18]基于香味成分對(duì)烤煙香型進(jìn)行了判別分析[19-20],朱紅根等[21]運(yùn)用BP神經(jīng)網(wǎng)絡(luò)分析了烤煙香型。

      機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科,專門(mén)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能[22-23]。機(jī)器學(xué)習(xí)尤其在人工智能領(lǐng)域有較多的應(yīng)用和研究,但是在煙草研究相關(guān)領(lǐng)域及其學(xué)習(xí)的研究尚不多見(jiàn)?;诖耍狙芯坷脵C(jī)器學(xué)習(xí)及其方法探索烤煙香型分類(lèi)的方法與模式,以期為煙草質(zhì)量評(píng)價(jià)和卷煙生產(chǎn)等提供參考。

      1材料與方法

      1.1材料

      本研究所用樣品為2012、2013年來(lái)自全國(guó)主要烤煙區(qū)域云南、貴州、四川、湖南、河南、福建、安徽皖南等地X2F、C3F、B2F 3個(gè)標(biāo)準(zhǔn)等級(jí)的樣品,共計(jì)87套261個(gè),其中2012年63套189個(gè)作為訓(xùn)練集,2013年24套中的24個(gè)C3F作為測(cè)試樣本。

      1.2試驗(yàn)方法

      1.2.1常規(guī)化學(xué)成分檢測(cè)方法按照標(biāo)準(zhǔn)YC/T 159—2002《煙草及煙草制品 水溶性糖的測(cè)定 連續(xù)流動(dòng)法》中規(guī)定的方法測(cè)定煙葉中總糖和還原糖,按照標(biāo)準(zhǔn)YC/T 160—2002《煙草及煙草制品 總植物堿的測(cè)定 連續(xù)流動(dòng)法》、YC/T 161—2002《煙草及煙草制品 總氮的測(cè)定 連續(xù)流動(dòng)法》、YC/T 173—2003《煙草及煙草制品 鉀的測(cè)定 火焰光度法》和YC/T 162—2002《煙草及煙草制品氯的測(cè)定 連續(xù)流動(dòng)法》中規(guī)定的方法分別測(cè)定煙葉中的煙堿、總氮、總鉀和總氯。

      1.2.2煙葉感官評(píng)價(jià)方法香型確定由安徽中煙技術(shù)中心專業(yè)評(píng)吸人員按照清、中、濃香型進(jìn)行評(píng)價(jià)確定。評(píng)吸前單料煙在環(huán)境條件溫度22.2±0.5 ℃、濕度61.0±2.0%條件下平衡48 h以上。

      1.2.3機(jī)器學(xué)習(xí)算法介紹

      樸素貝葉斯(Naive Bayes)是統(tǒng)計(jì)分類(lèi)方法,其對(duì)兩種數(shù)據(jù)貝葉斯分類(lèi)有較好的分類(lèi)效果:一種是完全獨(dú)立的數(shù)據(jù),另一種是函數(shù)依賴的數(shù)據(jù)。

      決策樹(shù)(Decision Tree)是數(shù)據(jù)挖掘中的重要算法,用于分類(lèi)即是分類(lèi)樹(shù)(Classification Tree),它是描述給定預(yù)測(cè)向量值X后,變量Y(Y連續(xù)型為回歸,Y離散型為分類(lèi))條件分布的一個(gè)靈活的方法,對(duì)噪聲數(shù)據(jù)具有很好的魯棒性。

      隨機(jī)森林(Random Forest),是一種由多棵決策樹(shù)組合而成的聯(lián)合預(yù)測(cè)模型,可以作為快速且有效的分類(lèi)模型。整個(gè)Random Forest的輸出由眾多決策樹(shù)共同決定。

      支持向量機(jī)回歸(Support Vector Machine,SVM)是在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問(wèn)題中。

      人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN),簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò)(Neural Network,NN),是一種模仿生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計(jì)算模型,由大量的人工神經(jīng)元聯(lián)結(jié)進(jìn)行計(jì)算,常用來(lái)對(duì)輸入和輸出間復(fù)雜的關(guān)系進(jìn)行建模,或用來(lái)探索數(shù)據(jù)的模式。

      k最近鄰(k-Nearest Neighbor,kNN)分類(lèi)算法,是一個(gè)理論上比較成熟的方法,也是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一。由于kNN方法主要靠周?chē)邢薜泥徑臉颖荆皇强颗袆e類(lèi)域的方法來(lái)確定所屬類(lèi)別的,因此對(duì)于類(lèi)域的交叉或重疊較多的待分樣本集來(lái)說(shuō),kNN方法較其他方法更為適合。

      CN2算法結(jié)合了ID3算法處理數(shù)據(jù)的效率和處理噪音數(shù)據(jù)的能力,以及AQ算法家族的靈活性,通過(guò)改進(jìn)去除了對(duì)特定數(shù)據(jù)的依賴,且通過(guò)統(tǒng)計(jì)學(xué)類(lèi)比,可以達(dá)到與使用剪枝方法的算法相同的效果。CN2使用一種基于噪音估計(jì)的啟發(fā)式方法來(lái)終止它的搜索過(guò)程。

      1.3數(shù)據(jù)分析方法

      1.3.1數(shù)據(jù)處理用Excel 2007對(duì)數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)的統(tǒng)計(jì)及作圖均在Origin軟件中完成。數(shù)據(jù)清洗采用3S法進(jìn)行離群點(diǎn)的剔除,缺失值的填充采用最近鄰算法(kNN)進(jìn)行補(bǔ)缺。訓(xùn)練集數(shù)據(jù)采用5折交叉驗(yàn)證進(jìn)行機(jī)器學(xué)習(xí),測(cè)試集直接用訓(xùn)練集所得模型進(jìn)行機(jī)器學(xué)習(xí),模型評(píng)價(jià)參考訓(xùn)練集結(jié)果,以測(cè)試集結(jié)果進(jìn)行模型綜合比較。

      1.3.2數(shù)據(jù)分析指標(biāo)含義針對(duì)一組數(shù)據(jù)進(jìn)行分類(lèi)模型的建立,每個(gè)模型的結(jié)果評(píng)價(jià)會(huì)有一個(gè)混淆矩陣(Confusion Matrix)來(lái)匯總模型結(jié)果,就某個(gè)樣本而言,其被模型判定的結(jié)果見(jiàn)表1。

      表1 分類(lèi)模型評(píng)價(jià)結(jié)果混淆矩陣

      為了評(píng)價(jià)模型的評(píng)判效果,在混淆矩陣的基礎(chǔ)上衍生很多評(píng)價(jià)指標(biāo)。其中:

      ROC(ReceiverOperatingCharacteristicCurve):受試者工作特征曲線,簡(jiǎn)稱ROC曲線,又稱為感受性曲線(SensitivityCurve)。AUC(AreaunderROCCurve)即為ROC曲線下的面積,數(shù)值在0~1之間,越接近1模型評(píng)價(jià)效果越好。

      2結(jié)果與分析

      2.1基于機(jī)器學(xué)習(xí)的香型分類(lèi)

      通過(guò)分別對(duì)訓(xùn)練集和測(cè)試集數(shù)據(jù)進(jìn)行模型學(xué)習(xí),訓(xùn)練集、測(cè)試集混淆矩陣結(jié)果分別見(jiàn)表2、表3,從訓(xùn)練集混淆矩陣來(lái)看,7種機(jī)器學(xué)習(xí)方法準(zhǔn)確率并不全都表現(xiàn)良好,其中以神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)整體正確率達(dá)到了60%,其他幾種算法整體分類(lèi)正確率超過(guò)50%的有樸素貝葉斯(NaiveBayes)、隨機(jī)森林(RandomForest)、分類(lèi)樹(shù)(ClassificationTree)3種分類(lèi)方法,而支持向量機(jī)(SVM)、最近鄰算法(kNN)和CN2rules對(duì)于訓(xùn)練集的整體分類(lèi)正確率不足50%。

      對(duì)于測(cè)試集(全部為中部葉)而言,支持向量機(jī)(SVM)分類(lèi)正確率達(dá)到了100%,樸素貝葉斯(NaiveBayes)、隨機(jī)森林(RandomForest)、樸素貝葉斯(NeuralNetwork)測(cè)試集整體分類(lèi)正確率達(dá)到了90%以上,最近鄰算法(kNN)、分類(lèi)樹(shù)(ClassificationTree)、CN2rules整體分類(lèi)正確率僅為60%~70%,與其他算法相比明顯較低,但是測(cè)試集整體分類(lèi)正確率明顯高于訓(xùn)練集。

      分析其原因,可能與訓(xùn)練集和測(cè)試集的數(shù)據(jù)形態(tài)有關(guān),訓(xùn)練集數(shù)據(jù)包括了上、中、下3個(gè)部位不同香型的煙葉,上、中、下3個(gè)部位煙葉化學(xué)成分本身存在明顯或顯著差異,而測(cè)試集數(shù)據(jù)全部為中部葉,數(shù)據(jù)分布更為集中。因此,訓(xùn)練集分類(lèi)效果受到部位影響,整體分類(lèi)正確率相對(duì)較低。

      表2 香型分類(lèi)機(jī)器學(xué)習(xí)混淆矩陣(訓(xùn)練集)

      表3 香型分類(lèi)機(jī)器學(xué)習(xí)混淆矩陣(測(cè)試集)

      2.2訓(xùn)練集的機(jī)器學(xué)習(xí)算法性能比較

      為了進(jìn)一步評(píng)價(jià)各種機(jī)器學(xué)習(xí)分類(lèi)的效果,對(duì)機(jī)器學(xué)習(xí)的分類(lèi)整體效果和分項(xiàng)指標(biāo)進(jìn)一步分析,結(jié)果見(jiàn)表4~表7及圖1。就訓(xùn)練集而言,分類(lèi)精度(Classification Accuracy)較高的為神經(jīng)網(wǎng)絡(luò)(Neural Network)、隨機(jī)森林(Random Forest),分別達(dá)到了0.6517、0.6071其他幾種算法分類(lèi)精度依次為樸素貝葉斯>支持向量機(jī)>分類(lèi)樹(shù)>CN2算法>最近鄰算法;受試者曲線面積(AUC)也表現(xiàn)出相同的規(guī)律。

      表4 機(jī)器學(xué)習(xí)算法性能比較(訓(xùn)練集)

      就訓(xùn)練集各個(gè)香型而言,各個(gè)算法對(duì)于香型判斷的性能也有不同,由表5可知,對(duì)清香型判定正例覆蓋率(等同于召回率)最高的是支持向量機(jī)模型(SVM),其次是CN2 rules模型;清香型命中率最高的模型是決策樹(shù),其次是神經(jīng)網(wǎng)絡(luò);以加權(quán)綜合指標(biāo)F-measure來(lái)看,判定清香型效果最好的模型是神經(jīng)網(wǎng)絡(luò),其次是隨機(jī)森林;從馬修斯相關(guān)系數(shù)來(lái)看,判定清香型效果最好的模型是神經(jīng)網(wǎng)絡(luò),其次為決策樹(shù)。

      從濃香型的判定結(jié)果來(lái)看,正例覆蓋率(等同于召回率)最高的是樸素貝葉斯模型,其次為神經(jīng)網(wǎng)絡(luò);命中率最高的是支持向量機(jī)模型(SVM),其次是CN2 rules模型;以F-measure指標(biāo)判定濃香型效果最好的模型是神經(jīng)網(wǎng)絡(luò),其次是樸素貝葉斯模型;以馬修斯相關(guān)系數(shù)來(lái)評(píng)判濃香型效果最好的模型是神經(jīng)網(wǎng)絡(luò),其次為決策樹(shù)。

      從各模型評(píng)價(jià)中間香型的結(jié)果來(lái)看,中間香型整體評(píng)價(jià)效果不如清香型、濃香型,其中正例覆蓋率最高的模型為神經(jīng)網(wǎng)絡(luò),命中率最高的模型是支持向量機(jī),以F-measure、馬修斯相關(guān)系數(shù)兩項(xiàng)指標(biāo)評(píng)定均為神經(jīng)網(wǎng)絡(luò)模型。

      因此,整體來(lái)看對(duì)訓(xùn)練集的評(píng)價(jià)效果,評(píng)價(jià)清香型、濃香型和中間香型最好的模型為神經(jīng)網(wǎng)絡(luò)。

      表5 不同香型間機(jī)器學(xué)習(xí)算法性能比較(訓(xùn)練集)

      2.3測(cè)試集的機(jī)器學(xué)習(xí)算法性能比較

      就測(cè)試集而言,支持向量機(jī)(SVM)的分類(lèi)精度最高,全部分類(lèi)正確,其次為樸素貝葉斯和神經(jīng)網(wǎng)絡(luò)模型,分類(lèi)精度均達(dá)到了0.92;隨機(jī)森林算法的分類(lèi)精度達(dá)到了0.84,而最近鄰算法、CN2算法和分類(lèi)樹(shù)算法精度都未超過(guò)0.8。由AUC指標(biāo)(其值越接近于1說(shuō)明模型分類(lèi)效果越好)可以看出,神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)最高,兩者對(duì)于測(cè)試集分類(lèi)全部正確,其次表現(xiàn)較好的為樸素貝葉斯模型,AUC達(dá)到了0.9815;隨機(jī)森林算法AUC也達(dá)到了0.9741,其余模型表現(xiàn)優(yōu)劣依次為CN2 rules>Classification Tree>kNN。測(cè)試集的分類(lèi)精度和AUC普遍高于訓(xùn)練集。且分類(lèi)精度與AUC指標(biāo)基本表現(xiàn)出相同的規(guī)律,但是也略有不同,這可能是兩者的計(jì)算方法不同所致。

      從測(cè)試集評(píng)價(jià)結(jié)果來(lái)看(表7),判定清香型正例覆蓋率最高的模型為支持向量機(jī)和神經(jīng)網(wǎng)絡(luò),樣本全部分類(lèi)正確。判定濃香型正例覆蓋率最高的模型為支持向量機(jī)、樸素貝葉斯、隨機(jī)森林、CN2 rules;命中率最高的為支持向量機(jī)和神經(jīng)網(wǎng)絡(luò),F(xiàn)-measure、馬修斯相關(guān)系數(shù)評(píng)價(jià)最高的模型為支持向量機(jī)。中間香型正例覆蓋率最高的模型為支持向量機(jī),命中率最高的模型有支持向量機(jī)、樸素貝葉斯、CN2 rules 3個(gè)模型,F(xiàn)-measure、馬修斯相關(guān)系數(shù)評(píng)價(jià)最高的模型為支持向量機(jī)。因此,整體看測(cè)試集評(píng)價(jià)效果,對(duì)3個(gè)香型評(píng)價(jià)效果最好的模型是支持向量機(jī)。

      表6 機(jī)器學(xué)習(xí)算法性能比較(測(cè)試集)

      表7 不同香型間機(jī)器學(xué)習(xí)算法性能比較(測(cè)試集)

      圖1 不同香型機(jī)器學(xué)習(xí)算法ROC曲線

      3討論與結(jié)論

      對(duì)于在模型擬合訓(xùn)練中訓(xùn)練集和測(cè)試集存在的差異,經(jīng)過(guò)分析認(rèn)為訓(xùn)練集包含上、中、下3個(gè)部位的煙葉數(shù)據(jù),而煙葉3個(gè)部位的化學(xué)成分存在明顯或顯著的差異,測(cè)試集數(shù)據(jù)相對(duì)單一集中(中部葉),因此機(jī)器學(xué)習(xí)算法對(duì)于測(cè)試集擬合效果好于訓(xùn)練集。對(duì)于清香型、濃香型和中間香型擬合的效果,一方面因不同模型的算法原理、數(shù)據(jù)等因素的要求不同,結(jié)果隨之改變,另一方面可能源于不同香型在數(shù)據(jù)集表達(dá)效能的差異。本研究?jī)H針對(duì)不同香型在煙葉常規(guī)化學(xué)成分做出的不同機(jī)器學(xué)習(xí)算法的比較,煙葉的香型不僅受到常規(guī)化學(xué)的影響,還有煙葉內(nèi)的致香物質(zhì)、煙葉表面物質(zhì)、煙葉揮發(fā)性成分等諸多因素的影響,因此針對(duì)烤煙香型分類(lèi)的研究還需要進(jìn)一步深入開(kāi)展。

      對(duì)于含有上、中、下3個(gè)部位的混合數(shù)據(jù)訓(xùn)練集,判定清香型、濃香型、中間香型最高的模型為神經(jīng)網(wǎng)絡(luò)模型,對(duì)于僅含有一個(gè)部位(中部葉)的測(cè)試集,支持向量機(jī)模型性能表現(xiàn)最好。

      就各個(gè)香型而言,機(jī)器學(xué)習(xí)算法模型對(duì)清香型的訓(xùn)練效果相對(duì)最好,其次濃香型的訓(xùn)練效果也相對(duì)較佳,而中間香型的機(jī)器學(xué)習(xí)模型訓(xùn)練效果不甚理想,這可能與中間香型的認(rèn)識(shí)、內(nèi)涵、香型內(nèi)差異等諸多因素有關(guān)[1-2,24-27]。

      參考文獻(xiàn):

      [1] 唐遠(yuǎn)駒.關(guān)于烤煙香型問(wèn)題的探討[J].中國(guó)煙草科學(xué),2011,32(3):1-7.

      [2] 劉鐘祥.論卷煙產(chǎn)品風(fēng)格[J].煙草科技,1996(2):5-7.

      [3] 姜慧娟,趙銘欽,劉鵬飛,等.烤煙香型劃分及質(zhì)量特征研究進(jìn)展[J].浙江農(nóng)業(yè)科學(xué),2012(12):1628-1632.

      [4] 周冀衡,楊虹琦,林桂華,等.不同烤煙產(chǎn)區(qū)煙葉中主要揮發(fā)性香氣物質(zhì)的研究[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2004,30(1):20-23.

      [5] 許自成,秦璐,邵惠芳,等.烤煙鉀含量與多酚、有機(jī)酸含量及評(píng)吸品質(zhì)的關(guān)系[J].河南農(nóng)業(yè)大學(xué)學(xué)報(bào),2010,44(4):383-389.

      [6] 楊虹琦,周冀衡,楊述元,等.不同產(chǎn)區(qū)烤煙中主要潛香型物質(zhì)對(duì)評(píng)吸質(zhì)量的影響研究[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2005,31(1):11-14.

      [7] 邵惠芳,鄭聰,許自成,等.三門(mén)峽優(yōu)質(zhì)烤煙中性香氣物質(zhì)的特點(diǎn)及香型風(fēng)格評(píng)價(jià)[J].河南農(nóng)業(yè)大學(xué)學(xué)報(bào),2010,44(5):508-512.

      [8] 張永安,鄭湖南,周冀衡,等.不同產(chǎn)區(qū)烤煙香氣特征與化學(xué)成分的差異[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2007,33(5):568-571.

      [9] 常愛(ài)霞,張建平,杜詠梅,等.烤煙香型相關(guān)化學(xué)成分主導(dǎo)的不同產(chǎn)區(qū)煙葉聚類(lèi)分析[J].中國(guó)煙草學(xué)報(bào),2010,16(2):14-19.

      [10] 杜詠梅,張建平,王樹(shù)聲,等.主導(dǎo)烤煙香型風(fēng)格及感官質(zhì)量差異的主要化學(xué)指標(biāo)分析[J].中國(guó)煙草科學(xué),2010,31(5):7-12.

      [11] 郭靈燕,袁紅星,海洋,等.河南省不同香型煙葉香氣成分比較分析[J].河南農(nóng)業(yè)科學(xué),2010(6):40-44.

      [12] 席元肖,宋紀(jì)真,李鋒,等.不同香型烤煙香氣前體物及香味成分含量的差異分析[J].浙江農(nóng)業(yè)科學(xué),2011(2):355-361.

      [13] 席元肖,魏春陽(yáng),宋紀(jì)真,等.不同香型烤煙化學(xué)成分含量的差異[J].煙草科技,2011(5):29-33.

      [14] 畢淑峰,朱顯靈,馬成澤.逐步判別分析在中國(guó)烤煙香型鑒定中的應(yīng)用[J].熱帶作物學(xué)報(bào),2006,27(4):104-107.

      [15] 李章海,王能如,王東勝,等.烤煙香型的重要影響因子及香型指數(shù)模型的構(gòu)建初探[J].安徽農(nóng)業(yè)科學(xué),2009,37(5):2055-2057.

      [16] 李章海,王能如,王東勝,等.不同生態(tài)尺度煙區(qū)烤煙香型風(fēng)格的初步研究[J].中國(guó)煙草科學(xué),2009,30(5):67-70.

      [17] 王能如,李章海,王東勝,等.烤煙香氣成分與其評(píng)吸總分和香味特征的相關(guān)性[J].安徽農(nóng)業(yè)科學(xué),2009,37(6):2567-2569.

      [18] 詹軍,張曉龍,周芳芳,等.基于烤煙中性致香物質(zhì)的烤煙香型判別分析[J].西北農(nóng)業(yè)學(xué)報(bào),2012,21(12):80-87.

      [19] 詹軍,周芳芳,鄧國(guó)賓,等.基于化學(xué)成分和致香物質(zhì)的烤煙上部葉香型判別分析[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2013,39(3):232-241.

      [20] 詹軍,周芳芳,鄧國(guó)賓,等.基于致香物質(zhì)含量和組成比例的烤煙中上部葉香型判斷[J].西南農(nóng)業(yè)學(xué)報(bào),2013,26(6):2538-2545.

      [21] 朱紅根,段史江,李亞純,等.BP神經(jīng)網(wǎng)絡(luò)法在烤煙香型評(píng)定中的應(yīng)用[J].湖南農(nóng)業(yè)科學(xué),2013(12):35-36.

      [22] Gammerman A J. Machine learning: progress and prospects[M]. 1997.

      [23] Ethem Alpaydin. Introduction to machine learning[M]. The MIT Press, 2004.

      [24] 唐遠(yuǎn)駒,劉鐘祥,潘文杰.烤煙“中間香型”的困惑[J].中國(guó)煙草科學(xué),2014,35(2):1-6.

      [25] 史躍偉,趙杰宏,王志紅,等.烤煙主要化學(xué)成分與中間香型彰顯度的相關(guān)分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,44(1):106-109.

      [26] 吳春,王軼,蒲文宣,等.中間香型煙葉特色彰顯度與主要化學(xué)成分的相關(guān)及通徑分析[J].中國(guó)煙草科學(xué),2012,33(4):1-6.

      [27] 冉霞,牟蘭,劉仁祥,等.貴州典型植煙區(qū)煙葉揮發(fā)性香氣成分與香型風(fēng)格關(guān)系分析[J].山地農(nóng)業(yè)生物學(xué)報(bào),2013,32(6):499-505.

      (責(zé)任編輯:許晶晶)

      Study on Classification of Flue-cured Tobacco Based on Machine Learning Methods

      GUO Dong-feng1, YAN Ning2*, HU Hai-zhou2, LIU Fei1, ZOU Peng1,

      DOU Yu-qing2, ZHANG Zhong-feng2, SHU Jun-sheng1

      (1. Technology Center of Anhui Cigarette Industrial Limited Company, Hefei 230088, China;2. Tobacco Research Institute, Chinese Academy of Agricultural Sciences, Qingdao 266101, China)

      Abstract:To explore the methods for flue-cured tobacco types classification, typical tobacco samples were collected from main tobacco-planted areas in China. These samples had been trained and tested by several machine learning methods to model fitting. The results showed that Neural Network algorithm could expressed best prediction from these machine learning methods to predict the flue-cured tobacco types, the Qing and Nong types were trained and tested best by the machine learning method, but the Zhong type was trained and tested worse by such methods, discriminant by vary part tobacco leaves was reasonable in the data preparation. So Neural Network algorithm could be used to predict the flue-cured tobacco types in tobacco quality evaluation and cigarette production.

      Key words:Flue-cured tobacco; Odor type; Classification; Machine learning

      中圖分類(lèi)號(hào):TP181

      文獻(xiàn)標(biāo)志碼:A

      文章編號(hào):1001-8581(2016)02-0043-06

      作者簡(jiǎn)介:郭東鋒(1980—),男,高級(jí)農(nóng)藝師,博士,主要從事煙草生理生態(tài)及原料質(zhì)量評(píng)價(jià)工作。*通訊作者:閆寧。

      基金項(xiàng)目:中國(guó)煙草總公司科技重點(diǎn)項(xiàng)目“烤煙生產(chǎn)結(jié)構(gòu)優(yōu)化效應(yīng)及關(guān)鍵技術(shù)研究與應(yīng)用”(110201402007);安徽中煙工業(yè)有限責(zé)任公司科技計(jì)劃項(xiàng)目“皖南煙葉生產(chǎn)GAP管理模式研究”(2014124)、“皖南煙葉生產(chǎn)等級(jí)結(jié)構(gòu)優(yōu)化技術(shù)研究”(2014125)。

      收稿日期:2015-07-14

      猜你喜歡
      香型機(jī)器學(xué)習(xí)烤煙
      本期卷首
      中國(guó)白酒香型概念的提出及演化發(fā)展
      烤煙上炕機(jī)械研制
      不同追肥對(duì)烤煙品質(zhì)的影響
      活力(2019年19期)2020-01-06 07:36:04
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語(yǔ)文本情感分類(lèi)中的研究
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      陳香型鐵觀音國(guó)家標(biāo)準(zhǔn)有望2015年發(fā)布
      烤煙漂浮育苗和移栽改進(jìn)方法研究進(jìn)展
      咸宁市| 阜南县| 墨竹工卡县| 慈利县| 磐石市| 华坪县| 台南市| 丹凤县| 广昌县| 中山市| 紫云| 临汾市| 儋州市| 台东市| 罗源县| 乌苏市| 东乡| 刚察县| 托克逊县| 芷江| 延安市| 正镶白旗| 惠安县| 澜沧| 天镇县| 东辽县| 株洲县| 镶黄旗| 襄汾县| 柳州市| 长宁县| 咸阳市| 双桥区| 马龙县| 无棣县| 图们市| 濉溪县| 乌恰县| 绿春县| 永善县| 永仁县|