• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于支持向量機(jī)的鳶尾花類別預(yù)測

      2018-01-12 11:51:50孫萌月張奧麗曾進(jìn)成
      智富時(shí)代 2018年12期
      關(guān)鍵詞:支持向量機(jī)

      孫萌月 張奧麗 曾進(jìn)成

      【摘 要】支持向量機(jī)是基于統(tǒng)計(jì)學(xué)習(xí)理論發(fā)展起來的一種新的機(jī)器學(xué)習(xí)方法,應(yīng)用于解決各種小樣本分類問題。經(jīng)文獻(xiàn)報(bào)道,鳶尾花自身的固有屬性可以作為輸入指標(biāo)用來預(yù)測鳶尾花的種類。本文以鳶尾花的屬性數(shù)據(jù)建立分類模型,結(jié)果表明支持向量機(jī)分類方法具有很好的泛化性能,為自動(dòng)判定鳶尾花種類提供了一種有效的方法。

      【關(guān)鍵詞】支持向量機(jī);分類問題;核函數(shù)

      鳶尾花屬于鳶尾科,是一類具有較高觀賞價(jià)值的草本植物,其萼片是絢麗多彩的,和向上的花瓣不同,花萼是下垂的。通過鳶尾花的屬性來判斷鳶尾花的種類,可以更高效率的培育出相應(yīng)需要的鳶尾花,來滿足現(xiàn)實(shí)需求量。

      人工智能的快速發(fā)展帶動(dòng)了基于數(shù)據(jù)挖掘的人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)智能分類方法。人工神經(jīng)網(wǎng)絡(luò)具有非線性、自學(xué)習(xí)、自適應(yīng),能夠大規(guī)模并行處理等特征,同時(shí)內(nèi)部訓(xùn)練過程是在黑箱中進(jìn)行的,只要直接輸入數(shù)據(jù)即可得出結(jié)果[1]。但缺點(diǎn)也很明顯,神經(jīng)網(wǎng)絡(luò)中參數(shù)無法解釋,同時(shí)訓(xùn)練過程在黑箱中進(jìn)行,具有一定的盲目性,由于它是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,容易出現(xiàn)“過擬合”現(xiàn)象,即有可能出現(xiàn)陷入局部最優(yōu)解而無法得到全局最優(yōu)解的現(xiàn)象。而支持向量機(jī)(SVM)借助最優(yōu)化方法來解決機(jī)器學(xué)習(xí)問題[2],依賴結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,針對(duì)小樣本得到全局最優(yōu)解,解決了在神經(jīng)網(wǎng)絡(luò)方法中無法避免的局部極值問題。

      因此,本文將目標(biāo)數(shù)據(jù)集的三種鳶尾花的花萼長度、花萼寬度、花瓣長度、花瓣寬度四個(gè)屬性用來做樣本的定量分析,建立模型,通過SVM分類的方法,根據(jù)給定的訓(xùn)練集,通過大量的訓(xùn)練點(diǎn),尋找實(shí)值函數(shù),由此得到?jīng)Q策函數(shù),以便用決策函數(shù)推斷任意模式(輸入指標(biāo)向量或稱輸入)相對(duì)應(yīng)的輸出指標(biāo)。

      一、基于支持向量機(jī)的鳶尾花類別預(yù)測

      1.支持向量機(jī)

      支持向量機(jī)分類方法是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原理,針對(duì)一個(gè)給定的有限數(shù)量訓(xùn)練集樣本的學(xué)習(xí)任務(wù),通過在原空間或經(jīng)投影后的高維空間中構(gòu)造最佳分類超平面作為決策面。從線性可分模式來看,該決策面不但能夠?qū)⑺杏?xùn)練樣本正確分類,而且使訓(xùn)練樣本中離分類面最近的點(diǎn)到分類面的距離最大[3]。訓(xùn)練樣本為非線性時(shí),通過非線性函數(shù)φ( x) 將樣本 x 映射到一個(gè)高維線性特征空間,在這個(gè)維數(shù)可能為無窮大的線形空間中構(gòu)造最優(yōu)分類超平面,并得到分類器的判別函數(shù)。再根據(jù)最大間隔思想[4],引入懲罰項(xiàng) CΣ§i,建立原始最優(yōu)化問題, 通過強(qiáng)對(duì)偶定理對(duì)原問題進(jìn)行求解,利用核函數(shù)提高樣本的線性可分性,將線性分類學(xué)習(xí)機(jī)算法推廣到非線性的情況。

      2.K重交叉驗(yàn)證

      K重交叉驗(yàn)證是常用的精度測試方法[5]。驗(yàn)證方法是將數(shù)據(jù)集分成 K份,輪流將其中K-1份做訓(xùn)練,1份做測試,K次結(jié)果的最佳值作為對(duì)算法精度的估計(jì)。本文算法中采用K重交叉驗(yàn)證方法來計(jì)算準(zhǔn)確率,進(jìn)而確定合適的懲罰參數(shù)C及核函數(shù)。

      3.數(shù)據(jù)

      在UCI數(shù)據(jù)庫,下載得到初始的Iris樣本數(shù)據(jù)集共計(jì)150條。統(tǒng)計(jì)各個(gè)選項(xiàng)在不同決定指標(biāo)所占比例對(duì)比分析,從而得到合適的指標(biāo),這里主要參考各指標(biāo)的選項(xiàng)在輸出指標(biāo)鳶尾花類別中所占的比例。經(jīng)預(yù)處理,分別得到三類鳶尾花的四個(gè)屬性的平均值數(shù)據(jù),

      二、建模

      鳶尾花的種類有很多,這里我們選取山鳶尾、變色鳶尾、維吉尼亞鳶尾三種比較有名的鳶尾花類別,而鳶尾花類別受其自生屬性影響,經(jīng)文獻(xiàn)查閱,最終選取較為典型的4個(gè)指標(biāo)作為輸入,以鳶尾花類別作為輸出建立模型。該模型為多類分類問題,以鳶尾花類別作為輸出指標(biāo),分為山鳶尾、變色鳶尾、維吉尼亞鳶尾三種。而輸入指標(biāo)有花萼長度、花萼寬度、花瓣長度、花瓣寬度。

      重要指標(biāo)進(jìn)行分析:

      (1)TP Rate: 簡稱TPR(真正率),即被模型預(yù)測為正的正樣本比率。TPR = TP /(TP + FN) 正樣本預(yù)測結(jié)果數(shù) / 正樣本實(shí)際數(shù)。以第一條數(shù)據(jù)為例,TPR=28/30= 0.933。

      (2)FP Rate:簡稱FPR(假正率),即被模型預(yù)測為正的負(fù)樣本比率。FPR = FP /(FP + TN)?被預(yù)測為正的負(fù)樣本結(jié)果數(shù) /負(fù)樣本實(shí)際數(shù)。以第一條數(shù)據(jù)為例,F(xiàn)PR=2/120= 0.017。

      (3) MCC:即Matthews 相關(guān)系數(shù)。MCC=(TP*TN-FP*TN+FP)*(TN+FN)]^0.FN)/[(TP+FP)*(TP+FN)*(5,同時(shí)考慮了 FP和 FN,并適用于不平衡問題(兩個(gè)類的比例相差很大)。取值在[-1,1]之間,1 代表完美的預(yù)測,0 代表與隨機(jī)分類器效果一樣,-1 代表預(yù)測結(jié)果與實(shí)際結(jié)果完全不一致。

      可知,通過對(duì)該訓(xùn)練模型的訓(xùn)練與測試,分類準(zhǔn)確率可達(dá)到95.3%,能夠?qū)ⅧS尾花的三種類別比較好的分開,具有較高的泛化能力,且MCC均趨近于1,說明該訓(xùn)練模型的穩(wěn)定性很好。

      三、結(jié)論

      本文通過實(shí)例驗(yàn)證可以看出鳶尾花的種類受其屬性的影響,根據(jù)鳶尾花的屬性及種類分別作為輸入、輸出指標(biāo)建立模型,應(yīng)用支持向量機(jī)分類的方法進(jìn)行研究,得到合適的決策函數(shù),可以對(duì)已知相關(guān)屬性的鳶尾花做出較為準(zhǔn)確的分類。為預(yù)測鳶尾花種類提供了一種有效的方法,也為鳶尾花種植者選擇種類提升了效率,帶來了方便,同時(shí)也通過此實(shí)例體現(xiàn)了支持向量機(jī)分類應(yīng)用于解決小樣本分類問題的優(yōu)越性。

      【參考文獻(xiàn)】

      [1]蔣林利. 基于支持向量機(jī)的電子商務(wù)模式下的信用評(píng)價(jià)模型[J].現(xiàn)代計(jì)算機(jī)學(xué)報(bào),2012.

      [2]鄧乃揚(yáng),田英杰. 數(shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)出版社,2004,49-77,164-223.

      猜你喜歡
      支持向量機(jī)
      基于支持向量回歸機(jī)的電能質(zhì)量評(píng)估
      基于智能優(yōu)化算法選擇特征的網(wǎng)絡(luò)入侵檢測
      數(shù)據(jù)挖掘技術(shù)在電廠經(jīng)濟(jì)性分析系統(tǒng)中的應(yīng)用Q
      基于改進(jìn)支持向量機(jī)的船舶縱搖預(yù)報(bào)模型
      基于SVM的煙草銷售量預(yù)測
      動(dòng)態(tài)場景中的視覺目標(biāo)識(shí)別方法分析
      論提高裝備故障預(yù)測準(zhǔn)確度的方法途徑
      基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      管理類研究生支持向量機(jī)預(yù)測決策實(shí)驗(yàn)教學(xué)研究
      考試周刊(2016年53期)2016-07-15 09:08:21
      汤阴县| 白河县| 浙江省| 固阳县| 澄迈县| 内江市| 噶尔县| 连州市| 八宿县| 鱼台县| 汉阴县| 崇义县| 文登市| 开鲁县| 改则县| 桐柏县| 盐源县| 张家港市| 利津县| 池州市| 象山县| 盱眙县| 高阳县| 留坝县| 平昌县| 义乌市| 绩溪县| 三都| 滨海县| 伊宁市| 巴东县| 安远县| 岗巴县| 佳木斯市| 博客| 龙门县| 若尔盖县| 谢通门县| 聂拉木县| 昔阳县| 清远市|