• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    隨機(jī)森林和支持向量機(jī)算法在β-發(fā)夾模體預(yù)測(cè)中的比較

    2016-12-05 03:15:02賈少春

    賈少春

    (忻州師范學(xué)院數(shù)學(xué)系,山西忻州 034000)

    隨機(jī)森林和支持向量機(jī)算法在β-發(fā)夾模體預(yù)測(cè)中的比較

    賈少春

    (忻州師范學(xué)院數(shù)學(xué)系,山西忻州 034000)

    基于對(duì)β-發(fā)夾模體的預(yù)測(cè)探索,本文使用隨機(jī)森林和支持向量機(jī)兩種算法,對(duì)ArchDB40數(shù)據(jù)庫(kù)及自建數(shù)據(jù)集中的β-發(fā)夾模體進(jìn)行預(yù)測(cè).對(duì)于同一數(shù)據(jù)集,在特征參數(shù)和檢驗(yàn)方法均相同的情況下,隨機(jī)森林算法的預(yù)測(cè)精度要高于支持向量機(jī)算法.此外,由于隨機(jī)森林算法在參數(shù)維數(shù)較高的情況下不會(huì)發(fā)生過(guò)擬合現(xiàn)象,所以本文采用了將高維特征參數(shù)輸入隨機(jī)森林算法的方法來(lái)預(yù)測(cè)β-發(fā)夾,得到了較好的預(yù)測(cè)效果:對(duì)ArchDB40數(shù)據(jù)庫(kù)中的β-發(fā)夾進(jìn)行預(yù)測(cè),其5-交叉檢驗(yàn)的預(yù)測(cè)精度和相關(guān)系數(shù)分別是83.3%和0.59;對(duì)自建數(shù)據(jù)集中的β-發(fā)夾進(jìn)行預(yù)測(cè),其5-交叉檢驗(yàn)的預(yù)測(cè)精度和相關(guān)系數(shù)分別是85.2%和0.62.

    隨機(jī)森林算法;支持向量機(jī)算法;β-發(fā)夾模體;離散增量;預(yù)測(cè)的二級(jí)結(jié)構(gòu)信息

    β-發(fā)夾是一種特殊的超二級(jí)結(jié)構(gòu)模體.對(duì)于β-β超二級(jí)結(jié)構(gòu),如果兩個(gè)反平行的β-strand被連接多肽(loop)連接,而且兩個(gè)strand之間存在一個(gè)或多個(gè)氫鍵,則稱這種超二級(jí)結(jié)構(gòu)為β-發(fā)夾,否則稱為非β-發(fā)夾[1-3].前人在β-發(fā)夾模體識(shí)別的研究過(guò)程中,使用不同的算法對(duì)不同數(shù)據(jù)庫(kù)中的研究對(duì)象進(jìn)行了預(yù)測(cè),已經(jīng)取得了一系列較好的研究成果.2002年,Cruz等[4]使用人工神經(jīng)網(wǎng)絡(luò)(ANN),對(duì)序列相似性小于35%的534個(gè)蛋白質(zhì)中的β-發(fā)夾進(jìn)行識(shí)別,5-fold交叉檢驗(yàn)的預(yù)測(cè)精度是47.7%.2004年Kuhn[1]等使用ANN方法預(yù)測(cè)局域發(fā)夾和非局域diverging turn,對(duì)2 209個(gè)蛋白質(zhì)中的β-發(fā)夾預(yù)測(cè)精度是75.9%.2005年,Kumar等[5]使用兩種機(jī)器記憶技術(shù)——支持向量機(jī)和ANN模型,對(duì)EVA的序列相似性小于33%的2 880個(gè)非冗余蛋白質(zhì)中β-發(fā)夾進(jìn)行識(shí)別,5-fold交叉檢驗(yàn)的預(yù)測(cè)精度為79.2%.2007年,胡秀珍等[6]使用支持向量機(jī),對(duì)ArchDB40和EVA數(shù)據(jù)庫(kù)中的β-發(fā)夾模體進(jìn)行識(shí)別,5-fold交叉檢驗(yàn)預(yù)測(cè)精度分別是79.9%和83.3%.2008年,胡秀珍等[7]使用二次判別方法,對(duì)ArchDB40和EVA數(shù)據(jù)庫(kù)中β-發(fā)夾進(jìn)行識(shí)別,5-fold交叉檢驗(yàn)的預(yù)測(cè)精度分別達(dá)到了83.1%和80.7%.本文是對(duì)該研究的進(jìn)一步探索,具體采用的是隨機(jī)森林和支持向量機(jī)兩種分類(lèi)算法,選用的數(shù)據(jù)集一個(gè)是前人使用過(guò)的ArchDB40數(shù)據(jù)集,一個(gè)是新整理的包含4 070個(gè)非冗余蛋白質(zhì)鏈的數(shù)據(jù)集,對(duì)這兩個(gè)數(shù)據(jù)集中的β-發(fā)夾進(jìn)行預(yù)測(cè),隨機(jī)森林算法的效果均好于支持向量機(jī)算法的.

    1 數(shù)據(jù)及方法

    1.1 數(shù)據(jù)集

    1.1.1 ArchDB40數(shù)據(jù)集

    ArchDB40數(shù)據(jù)庫(kù)[8-9]是本文選用的第一個(gè)數(shù)據(jù)集.具體的研究對(duì)象是loop長(zhǎng)為2-8個(gè)氨基酸殘基的模體.固定序列模式長(zhǎng)選為12,截取規(guī)則有5位點(diǎn)法、8位點(diǎn)法和中心位點(diǎn)法[6],分別用5-12、8-12 和Lr-12來(lái)表示,具體示例見(jiàn)圖1.

    圖1 固定模式的三種截取方式

    1.1.2 自建數(shù)據(jù)集

    本文選用的第二個(gè)數(shù)據(jù)集是筆者自己構(gòu)建的數(shù)據(jù)庫(kù),即一個(gè)序列相似性小于25%、分辨率高于3?的包含4 070條蛋白質(zhì)鏈的數(shù)據(jù)庫(kù).下面是整理數(shù)據(jù)庫(kù)的具體過(guò)程:

    第一步:從SCOP數(shù)據(jù)庫(kù)的ASTRAL(1.75版)中下載序列相似性低于95%的序列;

    第二步:使用Blast軟件獲得序列相似性低于25%的序列4 174條(僅包含全β、α / β和α + β類(lèi)的蛋白質(zhì)序列),并從中篩選出分辨率高于3?的序列4 070條;

    第三步:使用DSSP[10]找出ECE模式16 917個(gè);

    第四步:使用PROMOTIF軟件[11]得到9 046個(gè)β-發(fā)夾模體,與ECE模式匹配的筆者認(rèn)為是β-發(fā)夾,共8 800個(gè),剩余的8 117個(gè)為非β-發(fā)夾模體;

    第五步:對(duì)得到的模體進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)loop長(zhǎng)為2 - 10個(gè)氨基酸殘基的β-發(fā)夾模體和非β-發(fā)夾模體分別有8 291和6 865個(gè),各占了此類(lèi)模體總數(shù)的94%和85%,故選取loop長(zhǎng)為2 -10個(gè)氨基酸殘基的模體作為具體研究對(duì)象;

    第六步:計(jì)算上述數(shù)據(jù)集中β-發(fā)夾模體和非β-發(fā)夾模體的平均長(zhǎng)度,分別是16.58和15.65,故選取固定序列模式長(zhǎng)為17,截取規(guī)則為中心位點(diǎn)法.

    1.2 特征參數(shù)

    1.2.1 位點(diǎn)分析

    使用weblogo網(wǎng)頁(yè)(http://weblogo.berkeley.edu/logo.cgi)對(duì)ArchDB40數(shù)據(jù)集中β-發(fā)夾和非β-發(fā)夾模體的固定序列片段(12個(gè)位點(diǎn))分別進(jìn)行統(tǒng)計(jì)分析,結(jié)果見(jiàn)圖2.

    圖2 β-發(fā)夾和非β-發(fā)夾固定序列片段的位點(diǎn)氨基酸保守信息 (ArchDB40數(shù)據(jù)集)

    再用weblogo網(wǎng)頁(yè)(http://weblogo.berkeley.edu/logo.cgi)對(duì)自建數(shù)據(jù)集中β-發(fā)夾和非β-發(fā)夾模體的固定序列片段(17個(gè)位點(diǎn))分別進(jìn)行統(tǒng)計(jì)分析,結(jié)果見(jiàn)圖3.

    圖3 β-發(fā)夾和非β-發(fā)夾固定序列片段的位點(diǎn)氨基酸保守信息 (自建數(shù)據(jù)集)

    1.2.2 參數(shù)選取

    通過(guò)位點(diǎn)分析發(fā)現(xiàn),ArchDB40數(shù)據(jù)庫(kù)和自建數(shù)據(jù)集中的固定序列片段的位點(diǎn)保守性都較強(qiáng),故提取了以下幾項(xiàng)作為特征參數(shù).

    1)位點(diǎn)氨基酸組分A 對(duì)ArchDB40數(shù)據(jù)集而言,由于固定序列模式長(zhǎng)是12且采用了三種固定序列片段截取方式,所以每個(gè)固定序列片段的位點(diǎn)氨基酸組分[12-13]是一個(gè)756維(21 × 12 × 3,這里21表示20種氨基酸和1個(gè)空位)的向量;對(duì)自建數(shù)據(jù)集而言,由于固定序列模式長(zhǎng)是17且僅采用了中心位點(diǎn)法一種截取方式,所以每個(gè)固定序列片段的位點(diǎn)氨基酸組分是一個(gè)357維(21 × 17)的向量.

    2)位點(diǎn)親疏水組分Q 同理,對(duì)ArchDB40數(shù)據(jù)集而言,其位點(diǎn)親疏水組分[14]是一個(gè)252維(7 × 12 × 3,這里7表示6種親疏水特性和1個(gè)空位)的向量;對(duì)自建數(shù)據(jù)集而言,位點(diǎn)親疏水組分是一個(gè)119維(7 × 17)的向量.

    3)基于位點(diǎn)氨基酸組分的離散增量值ID(A) 以位點(diǎn)氨基酸組分作為ID的輸入?yún)?shù),用訓(xùn)練集中的β-發(fā)夾序列片段和非β-發(fā)夾序列片段作標(biāo)準(zhǔn)離散源,進(jìn)而計(jì)算出檢驗(yàn)集中每條序列的2個(gè)離散增量值[15-18].對(duì)ArchDB40數(shù)據(jù)集而言,由于采用了三種截取方式,所以每條被檢片段可得6個(gè)離散增量值ID(A);對(duì)自建數(shù)據(jù)集而言,由于只有一種截取方式,所以每條被檢片段可得2個(gè)離散增量值ID(A).

    4)基于位點(diǎn)親疏水組分的離散增量值ID(Q) 類(lèi)似地,以位點(diǎn)親疏水組分作為ID的輸入?yún)?shù),對(duì)ArchDB40數(shù)據(jù)集而言,每條被檢片段可計(jì)算得6個(gè)離散增量值ID(Q);對(duì)自建數(shù)據(jù)集而言,每條被檢片段可計(jì)算得2個(gè)離散增量值ID(Q).

    5)基于位點(diǎn)氨基酸組分的打分函數(shù)值S(A) 以位點(diǎn)氨基酸組分作為打分函數(shù)S的輸入?yún)?shù),利用訓(xùn)練集中的β-發(fā)夾和非β-發(fā)夾構(gòu)造標(biāo)準(zhǔn)打分矩陣,進(jìn)而計(jì)算出檢驗(yàn)集中每條序列的2個(gè)打分值[19-22].對(duì)ArchDB40數(shù)據(jù)集而言,由于采用了三種截取方式,所以每條被檢片段可得6個(gè)打分值S12(A);對(duì)自建數(shù)據(jù)集而言,因只有一種截取方式,所以每條被檢片段可得2個(gè)打分值S17(A).

    6)預(yù)測(cè)的二級(jí)結(jié)構(gòu)信息PSS 預(yù)測(cè)的二級(jí)結(jié)構(gòu)信息由PSIPRED[5]得到,并用一個(gè)3維的向量來(lái)表示,其中的3個(gè)分量分別表示對(duì)β-發(fā)夾和非β-發(fā)夾模體序列片段進(jìn)行預(yù)測(cè)得到的α螺旋、β折疊和無(wú)規(guī)卷曲coil的頻數(shù).

    1.3 算法簡(jiǎn)介

    1.3.1 隨機(jī)森林算法(RF)

    隨機(jī)森林是Leo Breiman于2001年提出的一種新型機(jī)器學(xué)習(xí)算法[23-27],其思想是將眾多弱分類(lèi)器集成為一個(gè)強(qiáng)分類(lèi)器進(jìn)行分類(lèi).隨機(jī)森林由很多互不關(guān)聯(lián)的決策樹(shù)組成,輸入樣本時(shí)森林中的每一棵決策樹(shù)各自進(jìn)行判斷,最終的決策結(jié)果則由綜合全部決策樹(shù)的分類(lèi)結(jié)果而定.本文的隨機(jī)森林算法是通過(guò)R軟件[28-30]來(lái)實(shí)現(xiàn)的,使用的是R2.8.1版本(http://www.r-project.org/).

    1.3.2 支持向量機(jī)算法(SVM)

    支持向量機(jī)(SVM)算法是由Vapnik[31]等提出來(lái)的一種新型的機(jī)器學(xué)習(xí)方法,其基本思想是通過(guò)非線性變換把輸入向量映射到一個(gè)高維特征空間,再在高維特征空間構(gòu)造線性判別函數(shù),進(jìn)而尋找最優(yōu)超平面,使其與各類(lèi)樣本之間的距離達(dá)到最大.

    本文支持向量機(jī)(SVM)算法是通過(guò)調(diào)用libsvm-2.89程序包[32]來(lái)實(shí)現(xiàn)的(http://www.csie. ntu.edu.tw/~cjlin/libsvm).

    1.4 檢驗(yàn)方法和評(píng)價(jià)指標(biāo)

    1.4.1 檢驗(yàn)方法

    做模體預(yù)測(cè)常用的檢驗(yàn)方法有自洽檢驗(yàn)、獨(dú)立檢驗(yàn)、k-fold交叉檢驗(yàn)和Jack-knife檢驗(yàn).本文采用的是5-fold交叉檢驗(yàn)[6-7],即將數(shù)據(jù)集平均分成5份,其中4份作為訓(xùn)練集,剩余的1份作為檢驗(yàn)集,重復(fù)做5次獨(dú)立檢驗(yàn)后求其平均的檢驗(yàn)方法.

    1.4.2 評(píng)價(jià)指標(biāo)

    本文使用的評(píng)價(jià)指標(biāo)[6-7]有:Qo(H)、Qo(NH)、Qp(H)、Qp(NH)、Acc和MCC,具體計(jì)算公式如下:

    其中,p為β-發(fā)夾被正確識(shí)別的數(shù)量,r為非β-發(fā)夾被正確識(shí)別的數(shù)量,u為β-發(fā)夾被預(yù)測(cè)為非β-發(fā)夾的數(shù)量,o為非β-發(fā)夾被預(yù)測(cè)為β-發(fā)夾的數(shù)量.

    2 結(jié)果與分析

    2.1 對(duì)ArchDB40數(shù)據(jù)集的預(yù)測(cè)結(jié)果

    對(duì)ArchDB40數(shù)據(jù)庫(kù)中的β-發(fā)夾模體,用基于位點(diǎn)氨基酸組分得到的6個(gè)離散增量值ID(A)、基于位點(diǎn)親疏水組分得到的6個(gè)離散增量值ID(Q)、基于位點(diǎn)氨基酸組分得到的6個(gè)打分函數(shù)值S12(A)和3維預(yù)測(cè)的二級(jí)結(jié)構(gòu)信息PSS的組合向量作為特征參數(shù)(ID(A) + ID(Q) + S12(A) + PSS),采用支持向量機(jī)(SVM)算法進(jìn)行預(yù)測(cè),其5-fold交叉檢驗(yàn)的Acc和MCC的值分別為79.4%和0.49.采用隨機(jī)森林(RF)算法對(duì)該數(shù)據(jù)庫(kù)中的β-發(fā)夾模體進(jìn)行預(yù)測(cè),實(shí)施5-fold交叉檢驗(yàn),Acc和MCC的值均得到了提高,分別達(dá)到82.0%和0.55,具體結(jié)果見(jiàn)表1.

    2.2 對(duì)自建數(shù)據(jù)集的預(yù)測(cè)結(jié)果

    對(duì)于自建數(shù)據(jù)集中的β-發(fā)夾模體,我們也提取了ID(A) + ID(Q) + S17(A) + PSS作為特征參數(shù)進(jìn)行預(yù)測(cè),其支持向量機(jī)(SVM)算法結(jié)合5-fold交叉檢驗(yàn)的結(jié)果是:Acc和MCC的值分別為80.2%和0.51.采用隨機(jī)森林(RF)算法對(duì)該數(shù)據(jù)庫(kù)中的β-發(fā)夾模體進(jìn)行預(yù)測(cè),實(shí)施5-fold交叉檢驗(yàn),其結(jié)果也有所提高,Acc和MCC的值分別達(dá)到83.5%和0.59,具體結(jié)果見(jiàn)表2.

    表1 對(duì)ArchDB40數(shù)據(jù)庫(kù)中β-發(fā)夾預(yù)測(cè)的結(jié)果比較

    表2 對(duì)自建數(shù)據(jù)庫(kù)中β-發(fā)夾預(yù)測(cè)結(jié)果的比較

    2.3 基于高維特征參數(shù)的隨機(jī)森林算法的預(yù)測(cè)結(jié)果

    考慮到隨機(jī)森林算法所具有的特殊性能,我們也直接使用位點(diǎn)氨基酸組分(A)、位點(diǎn)親疏水組分(Q)和預(yù)測(cè)的二級(jí)結(jié)構(gòu)(PSS)的組合向量(A + Q + PSS)作為輸入?yún)?shù)進(jìn)行識(shí)別.需要指出的是對(duì)ArchDB40數(shù)據(jù)庫(kù)中的β-發(fā)夾來(lái)說(shuō),這里的位點(diǎn)氨基酸組分(A)和位點(diǎn)親疏水組分(Q)僅建立在前兩種截取方式(5-12和8-12)之上,故A + Q + PSS參數(shù)共675(21 × 12 × 2 + 7 × 12 × 2 + 3)維,將其輸入RF算法做5-fold交叉檢驗(yàn),其Acc和MCC的值分別是83.3%和0.59.對(duì)自建數(shù)據(jù)集中的β-發(fā)夾來(lái)說(shuō),由于每個(gè)片段只有一種截取方式,故A + Q + PSS參數(shù)共479維(21 × 17 + 7 × 17 + 3),將其輸入RF算法做5-交叉檢驗(yàn),其預(yù)測(cè)精度和相關(guān)系數(shù)分別是85.2%和0.62,詳細(xì)結(jié)果見(jiàn)表3.

    3 結(jié) 論

    本文對(duì)β-發(fā)夾模體的預(yù)測(cè)探索有以下幾點(diǎn)創(chuàng)新:1)整理了一個(gè)新的β-發(fā)夾數(shù)據(jù)集,這不僅豐富了β-發(fā)夾的模體數(shù),而且使得β-發(fā)夾模體包含的信息更加全面;2)對(duì)比了隨機(jī)森林(RF)和支持向量機(jī)(SVM)兩種算法的分類(lèi)效果,結(jié)果顯示RF算法要好于SVM算法;3)選取了高維特征參數(shù)(A + Q + PSS)輸入RF算法進(jìn)行預(yù)測(cè),其結(jié)果得到進(jìn)一步改善.

    [1] Kuhn M, Meiler J, Baker D. Strand-loop-strand motifs: Prediction of hairpins and diverging turns in proteins [J]. Proteins: Structure, Function, and Bioinformatics, 2004, 54(2): 282-288.

    [2] Wintjens R T, Rooman M J, Wodak S J. Automatic classification and analysis of alpha-alpha-turn motifs in proteins[J]. Journal of Molecular Biology, 1996, 255(1): 235-253.

    [3] Jones D T. Protein secondary structure prediction based on position-specific scoring matrices [J]. Journal of Molecular Biology, 1999, 292(2): 195-202.

    [4] Cruz X, Hutchinson E G, Shepherd A. Toward predicting protein topology: an approach to identifying β hairpins [J]. Proceedings of the National Academy Sciences of the USA, 2002, 99(17): 11157-11162.

    [5] Kumar M, Bhasin M, Natt N K, et al. BhairPred: prediction of β-hairpins in a protein from multiple alignment information using ANN and SVM techniques [J]. Nucleic Acids Research, 2005, 33: 154-159.

    [6] Hu X Z, Li Q Z. Prediction of the β-hairpins in proteins using support vector machine [J].Protein Journal, 2008, 27(2):115-122.

    [7] Hu X Z, Li Q Z, Wang C L. Recognition of β-hairpin motifs in proteins by using the composite vector [J]. Amino Acids, 2010, 38(3): 915-921.

    [8] Oliva A, Bates P A, Querol E, et al. An automated classification of the structure of protein loops [J]. Journal of Molecular Biology, 1997, 266(4): 814-830.

    [9] Espadaler J, Fuentes N F, Hermoso A, et al. ArchDB: automated protein loop classification as a tool for structural genomics [J]. Nucleic Acids Research, 2004(32): 185-188.

    [10] Kabsch W, Sander C. Dictionary of protein secondary structure: Pattern recognition of hydrogen-bonded and geometrical features [J]. Biopolymers, 1983, 22(12): 2577-2637.

    [11] Hutchinson E G, Thornton J M. PROMOTIF-A program to identify and analyze structural motifs in proteins [J]. Protein Science, 1996, 5(2): 212-220.

    [12] Panek J, Eidhammer I, Aasland R. A new method for identification of protein (sub) families in a set of proteins based on hydropathy distribution in proteins [J]. Proteins: Structure, Function, Bioinformatics, 2005, 58(4): 923-934.

    [13] 高蘇娟, 胡秀珍. 蛋白質(zhì)中四類(lèi)簡(jiǎn)單超二級(jí)結(jié)構(gòu)的分類(lèi)[J]. 內(nèi)蒙古工業(yè)大學(xué)學(xué)報(bào), 2013, 32(1): 21-26.

    [14] 賈少春, 胡秀珍. 基于添加功能位點(diǎn)信息的組合向量預(yù)測(cè)β-發(fā)夾模體[J]. 內(nèi)蒙古工業(yè)大學(xué)學(xué)報(bào), 2012, 31(3):1-9.

    [15] Laxton R R. The measure of diversity [J]. Journal of Theoretical Biology, 1978, 71(1): 51-67.

    [16] Zhang L R, Luo L F. Splice site prediction with quadratic discriminate analysis using diversity measure [J]. Nucleic Acids Research, 2003, 31(21): 6214-6220.

    [17] Chen Y L, Li Q Z. Prediction of the subcellular location of apoptosis proteins [J]. Journal of Theoretical Biology,2007, 245(4): 775-783.

    [18] 宋航宇, 胡秀珍, 馮振興, 等. 基于統(tǒng)計(jì)特征的酶蛋白質(zhì)中特殊模體βαβ的預(yù)測(cè)[J]. 生物物理學(xué)報(bào), 2013,29(9): 658-668.

    [19] Kel A E, Gobling E, Reuter I, et al. MATCHTM: a tool for searching transcription factor binding sites in DNA sequences [J]. Nucleic Acids Research, 2003, 31(13): 3576-3579.

    [20] 楊科利, 李前忠, 林昊. 預(yù)測(cè)酵母(Yeast)基因轉(zhuǎn)錄因子結(jié)合位點(diǎn)[J]. 內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版), 2006,37(5): 524-530.

    [21] Cartharius K, Frech K, Grote K, et al. MatInspector and beyond: promoter analysis based on transcription factor binding sites [J]. Bioinformatics, 2005, 21(13): 2933-2942.

    [22] 宋航宇, 胡秀珍. 基于矩陣打分值和化學(xué)位移值預(yù)測(cè)酶蛋白質(zhì)中β-發(fā)夾模體[J]. 內(nèi)蒙古工業(yè)大學(xué)學(xué)報(bào), 2014,33(3): 175-180.

    [23] Breiman L. Random forests [J]. Machine Learning, 2001, 45(1): 5-32.

    [24] Okun O, Priisalu H. Random forest for gene expression based cancer classification: Overlooked issues [J]. PatternRecognition and Image Analysis, 2007, 4478(partⅡ): 483-490.

    [25] 袁敏, 胡秀珍. 隨機(jī)森林方法預(yù)測(cè)膜蛋白類(lèi)型[J]. 生物物理學(xué)報(bào), 2009, 25(5): 349-355.

    [26] 王麗愛(ài), 馬昌, 周旭東, 等. 基于隨機(jī)森林回歸算法的小麥葉片SPAD值遙感估算[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015,46(1): 259-265.

    [27] 林劼, 林舒曄. 基于隨機(jī)森林算法的葡萄酒品質(zhì)預(yù)測(cè)方法[J]. 莆田學(xué)院學(xué)報(bào), 2012, 19(5): 88-92.

    [28] Liaw A, Wiener M. Classification and regression by random forest [J]. R News, 2002, 2(3): 18-22.

    [29] 張超, 孫鳳, 曾憲濤. R軟件調(diào)用JAGS軟件實(shí)現(xiàn)網(wǎng)狀Meta分析[J]. 中國(guó)循證醫(yī)學(xué)雜志, 2014, 14(2): 241-248.

    [30] 張超, 耿培亮, 郭毅, 等. 應(yīng)用R語(yǔ)言netmeta程序包實(shí)現(xiàn)網(wǎng)狀Meta分析[J]. 中國(guó)循證醫(yī)學(xué)雜志, 2014, 14(5):625-630.

    [31] Vapnik V. An overview of statistical learning theory [J]. IEEE Transactions on Neural Networks, 1999, 10(5):988-999.

    [32] Chang C C, Lin C J. LIBSVM: a library for support vector machines [J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 389-396.

    Comparison between Random Forest and Support Vector Machine Algorithm for Prediction of β-hairpin Motif

    JIA Shaochun
    (Department of Mathematics, Xinzhou Teachers College, Xinzhou, China 034000)

    Based on the prediction exploration of β-hairpin motifs in proteins, the random forest and support vector machine algorithm is applied in this paper to predict β-hairpin motifs in ArchDB40 (Specific database name) and the self-built dataset. For the same dataset, when using the same characteristic parameters and the same test method, Random Forest algorithm is more accurate than Support Vector Machine. In addition,Random Forest algorithm never results in the overfitting phenomenon under the higher dimension of characteristic parameters, so the Random Forest based on higher dimension characteristic parameters is applied to predict β-hairpin motifs. The better prediction results are obtained: 1. Prediction of β-hairpin motifs in ArchDB40 dataset, the overall accuracy and Matthew’s correlation coefficient of 5-fold cross-validation achieve 83.3% and 0.59 respectively; 2. Prediction of β-hairpin motifs in the self-built dataset, the overall accuracy and Matthew’s correlation coefficient of 5-fold cross-validation achieve 85.2% and 0.62,respectively.

    Random Forest Algorithm; Support Vector Machine(SVM) Algorithm; β-hairpin Motif;Increment of Diversity; Predicted Secondary Structure Information

    TP181

    A

    1674-3563(2016)03-0026-08

    10.3875/j.issn.1674-3563.2016.03.005 本文的PDF文件可以從xuebao.wzu.edu.cn獲得

    (編輯:王一芳)

    2016-03-15

    賈少春(1984- ),女,山西原平人,助教,碩士,研究方向:算法和模體預(yù)測(cè)

    麻豆久久精品国产亚洲av| 久久精品国产自在天天线| 国产亚洲91精品色在线| 一本久久中文字幕| 亚洲第一电影网av| 小说图片视频综合网站| 亚洲综合色惰| 97热精品久久久久久| 国产中年淑女户外野战色| 日本在线视频免费播放| 一本精品99久久精品77| 精品久久久久久久久久免费视频| 国产激情偷乱视频一区二区| 国产探花极品一区二区| 在线天堂最新版资源| 国产亚洲精品久久久久久毛片| 女同久久另类99精品国产91| 国产白丝娇喘喷水9色精品| 日本-黄色视频高清免费观看| 日韩人妻高清精品专区| 亚洲精品日韩av片在线观看| 日本 av在线| 99热网站在线观看| 亚洲内射少妇av| 在线观看美女被高潮喷水网站| 国产精品人妻久久久久久| 成人高潮视频无遮挡免费网站| 中文亚洲av片在线观看爽| 一级a爱片免费观看的视频| 激情 狠狠 欧美| 国产美女午夜福利| 久久久精品大字幕| 老熟妇仑乱视频hdxx| 十八禁网站免费在线| 日韩高清综合在线| 国产在线精品亚洲第一网站| 国内精品美女久久久久久| 国产精品一及| 国产片特级美女逼逼视频| 99久国产av精品| 国产一区二区在线av高清观看| 99视频精品全部免费 在线| 在线观看66精品国产| 日本黄色视频三级网站网址| 久久热精品热| 欧美日韩在线观看h| 日韩制服骚丝袜av| 国产国拍精品亚洲av在线观看| 欧美一区二区国产精品久久精品| 午夜亚洲福利在线播放| 久久久久国内视频| 一级黄片播放器| 亚洲国产精品久久男人天堂| 一级毛片aaaaaa免费看小| 国内精品一区二区在线观看| 亚洲一区二区三区色噜噜| 丰满人妻一区二区三区视频av| 久久天躁狠狠躁夜夜2o2o| 直男gayav资源| av福利片在线观看| 五月玫瑰六月丁香| 在线免费观看不下载黄p国产| 国产在线精品亚洲第一网站| 成人永久免费在线观看视频| 国产v大片淫在线免费观看| 岛国在线免费视频观看| 欧美成人a在线观看| 亚洲最大成人手机在线| 免费在线观看成人毛片| 99久久成人亚洲精品观看| 国产精品电影一区二区三区| 日韩,欧美,国产一区二区三区 | 99在线视频只有这里精品首页| 搡老妇女老女人老熟妇| 美女黄网站色视频| 床上黄色一级片| 少妇裸体淫交视频免费看高清| 亚洲av第一区精品v没综合| 毛片一级片免费看久久久久| 久久韩国三级中文字幕| 麻豆成人午夜福利视频| 久久草成人影院| 免费人成在线观看视频色| 成人永久免费在线观看视频| 免费观看在线日韩| 亚洲乱码一区二区免费版| 国产私拍福利视频在线观看| 亚洲最大成人av| 欧美xxxx黑人xx丫x性爽| 99热全是精品| 国产大屁股一区二区在线视频| 国产午夜精品论理片| 全区人妻精品视频| 嫩草影院精品99| 中文字幕精品亚洲无线码一区| 国产亚洲精品综合一区在线观看| 日本色播在线视频| 一级毛片我不卡| av在线老鸭窝| 亚洲真实伦在线观看| 少妇裸体淫交视频免费看高清| 午夜福利成人在线免费观看| 99热全是精品| 网址你懂的国产日韩在线| 久久精品国产亚洲av香蕉五月| 午夜福利在线观看吧| 最近最新中文字幕大全电影3| 久久精品91蜜桃| 天堂√8在线中文| 可以在线观看的亚洲视频| 亚洲人成网站在线观看播放| 少妇被粗大猛烈的视频| 在现免费观看毛片| 亚洲性久久影院| 亚洲精品日韩av片在线观看| 给我免费播放毛片高清在线观看| 国产亚洲精品综合一区在线观看| 久久婷婷人人爽人人干人人爱| 一本久久中文字幕| 亚洲国产日韩欧美精品在线观看| 国产精品av视频在线免费观看| videossex国产| av在线老鸭窝| 久久欧美精品欧美久久欧美| 18禁在线无遮挡免费观看视频 | 国产精品无大码| 最近中文字幕高清免费大全6| 欧美另类亚洲清纯唯美| 国产高清视频在线播放一区| 观看美女的网站| 最新在线观看一区二区三区| 亚洲精品一卡2卡三卡4卡5卡| 国产精品免费一区二区三区在线| 可以在线观看的亚洲视频| 亚洲性久久影院| 久久亚洲精品不卡| 国内精品宾馆在线| 伊人久久精品亚洲午夜| 欧美精品国产亚洲| 免费看日本二区| 三级经典国产精品| 91久久精品国产一区二区三区| 成人鲁丝片一二三区免费| 三级经典国产精品| 九色成人免费人妻av| 少妇熟女欧美另类| 国语自产精品视频在线第100页| 国产午夜精品久久久久久一区二区三区 | 日韩,欧美,国产一区二区三区 | 99久久成人亚洲精品观看| 日韩,欧美,国产一区二区三区 | 亚洲在线观看片| 人人妻人人澡人人爽人人夜夜 | 色综合亚洲欧美另类图片| a级毛片a级免费在线| 久久午夜亚洲精品久久| 校园春色视频在线观看| av视频在线观看入口| 观看美女的网站| 国内精品宾馆在线| 国产av一区在线观看免费| 亚洲av免费在线观看| 日日干狠狠操夜夜爽| 日本撒尿小便嘘嘘汇集6| 国产精品野战在线观看| 国产极品精品免费视频能看的| 热99在线观看视频| 天美传媒精品一区二区| 最近的中文字幕免费完整| 免费人成在线观看视频色| 免费在线观看影片大全网站| 97超视频在线观看视频| 性插视频无遮挡在线免费观看| 女人被狂操c到高潮| 国产男人的电影天堂91| 国产高清有码在线观看视频| 秋霞在线观看毛片| 91狼人影院| 国产一区二区在线观看日韩| 我要搜黄色片| 啦啦啦啦在线视频资源| 亚洲精华国产精华液的使用体验 | 国产午夜福利久久久久久| 国产私拍福利视频在线观看| 在线观看午夜福利视频| 亚洲国产精品国产精品| 色综合色国产| 少妇被粗大猛烈的视频| 免费人成视频x8x8入口观看| 亚洲欧美精品综合久久99| 天堂av国产一区二区熟女人妻| 精品熟女少妇av免费看| 国产成年人精品一区二区| 禁无遮挡网站| 国产高清三级在线| 波野结衣二区三区在线| 久久亚洲精品不卡| 美女内射精品一级片tv| 蜜桃久久精品国产亚洲av| 婷婷亚洲欧美| 成人三级黄色视频| 免费观看人在逋| 在线播放无遮挡| 国内少妇人妻偷人精品xxx网站| av在线播放精品| 亚洲在线观看片| 美女免费视频网站| 国产中年淑女户外野战色| av福利片在线观看| 日本免费a在线| 男女那种视频在线观看| 亚洲欧美成人综合另类久久久 | 99riav亚洲国产免费| 亚洲中文日韩欧美视频| 久久99热这里只有精品18| 欧美xxxx性猛交bbbb| 国语自产精品视频在线第100页| 久久精品综合一区二区三区| 精品一区二区三区av网在线观看| 尾随美女入室| 欧美bdsm另类| 国产精品美女特级片免费视频播放器| 久久久欧美国产精品| 此物有八面人人有两片| 狂野欧美激情性xxxx在线观看| 99热6这里只有精品| 欧美成人免费av一区二区三区| 99精品在免费线老司机午夜| 大香蕉久久网| 一进一出抽搐gif免费好疼| 天堂√8在线中文| 别揉我奶头~嗯~啊~动态视频| 成人欧美大片| 欧美+亚洲+日韩+国产| 听说在线观看完整版免费高清| 一级av片app| 久久鲁丝午夜福利片| www日本黄色视频网| 国产黄色小视频在线观看| 欧美成人精品欧美一级黄| 国内精品一区二区在线观看| 男女做爰动态图高潮gif福利片| 亚洲精品影视一区二区三区av| 天堂影院成人在线观看| 久久精品91蜜桃| 床上黄色一级片| 在线免费观看不下载黄p国产| 国产精品不卡视频一区二区| 精品久久久久久久久亚洲| av在线播放精品| 级片在线观看| 日韩欧美 国产精品| 日韩强制内射视频| 极品教师在线视频| 在线免费十八禁| 日韩一区二区视频免费看| 精品人妻视频免费看| 久久午夜福利片| 国产精品野战在线观看| 国产高清激情床上av| 少妇人妻精品综合一区二区 | 内地一区二区视频在线| 日本免费一区二区三区高清不卡| 一夜夜www| 国产色婷婷99| 黄片wwwwww| 亚洲欧美日韩高清专用| 成人高潮视频无遮挡免费网站| 高清日韩中文字幕在线| 色视频www国产| 99视频精品全部免费 在线| 听说在线观看完整版免费高清| 国产 一区 欧美 日韩| 自拍偷自拍亚洲精品老妇| 免费观看人在逋| 国产大屁股一区二区在线视频| 人人妻,人人澡人人爽秒播| 丝袜美腿在线中文| 啦啦啦韩国在线观看视频| 最好的美女福利视频网| 校园人妻丝袜中文字幕| 黄色欧美视频在线观看| 久久国产乱子免费精品| 亚洲精品久久国产高清桃花| 国产精品人妻久久久久久| 久久婷婷人人爽人人干人人爱| 国产美女午夜福利| 变态另类成人亚洲欧美熟女| 久久久久久久午夜电影| 免费看日本二区| 亚洲电影在线观看av| 少妇裸体淫交视频免费看高清| 成人美女网站在线观看视频| 欧美日韩在线观看h| 亚洲欧美日韩高清专用| 久久亚洲国产成人精品v| 国产成人91sexporn| 成人av在线播放网站| 老熟妇乱子伦视频在线观看| 男女边吃奶边做爰视频| 日本黄色片子视频| 国产精品久久久久久久电影| 变态另类丝袜制服| 免费在线观看成人毛片| 日韩,欧美,国产一区二区三区 | 久久久欧美国产精品| 久久精品国产亚洲av香蕉五月| 国产亚洲av嫩草精品影院| 日韩成人伦理影院| 久久99热这里只有精品18| 少妇人妻精品综合一区二区 | 欧美最黄视频在线播放免费| 久久人人精品亚洲av| 精品免费久久久久久久清纯| av在线老鸭窝| av中文乱码字幕在线| 久久久久九九精品影院| 免费看光身美女| 变态另类丝袜制服| 内地一区二区视频在线| 大型黄色视频在线免费观看| 色播亚洲综合网| 亚洲精华国产精华液的使用体验 | 国产精品,欧美在线| 亚洲四区av| 成人精品一区二区免费| www日本黄色视频网| 久久九九热精品免费| 91狼人影院| 色吧在线观看| a级毛色黄片| av福利片在线观看| 丰满乱子伦码专区| 特大巨黑吊av在线直播| 国产极品精品免费视频能看的| 中国国产av一级| av黄色大香蕉| 99国产极品粉嫩在线观看| 亚洲高清免费不卡视频| 天堂av国产一区二区熟女人妻| 久久精品久久久久久噜噜老黄 | 搡女人真爽免费视频火全软件 | 日本-黄色视频高清免费观看| 午夜福利在线观看吧| 网址你懂的国产日韩在线| 亚洲欧美日韩卡通动漫| h日本视频在线播放| 69av精品久久久久久| 国产成人freesex在线 | 不卡一级毛片| 久久久国产成人免费| 日本黄大片高清| 插阴视频在线观看视频| 国产精品久久久久久久电影| 一本一本综合久久| 亚洲电影在线观看av| 午夜福利视频1000在线观看| 国产一级毛片七仙女欲春2| 日韩成人av中文字幕在线观看 | 成年女人永久免费观看视频| 亚洲天堂国产精品一区在线| 亚洲精品一区av在线观看| 欧美一区二区亚洲| aaaaa片日本免费| 伦精品一区二区三区| 精品国产三级普通话版| 少妇人妻精品综合一区二区 | 少妇高潮的动态图| 91麻豆精品激情在线观看国产| 亚洲欧美日韩高清专用| 国产探花极品一区二区| 免费高清视频大片| 午夜福利成人在线免费观看| 成人毛片a级毛片在线播放| 欧美zozozo另类| 亚洲人成网站在线观看播放| 久久精品国产亚洲av香蕉五月| 久久精品国产亚洲网站| 小说图片视频综合网站| 日韩欧美免费精品| 欧美一级a爱片免费观看看| 亚洲欧美成人综合另类久久久 | 国产高清视频在线观看网站| 成年av动漫网址| 久久久午夜欧美精品| 久久国内精品自在自线图片| 不卡视频在线观看欧美| 搡老妇女老女人老熟妇| 亚洲av二区三区四区| 嫩草影院入口| 在线天堂最新版资源| 亚洲av免费高清在线观看| 免费在线观看影片大全网站| 非洲黑人性xxxx精品又粗又长| av天堂在线播放| 干丝袜人妻中文字幕| 搡老岳熟女国产| 午夜福利成人在线免费观看| 高清日韩中文字幕在线| 欧美最黄视频在线播放免费| 嫩草影院精品99| 内射极品少妇av片p| av在线播放精品| 看十八女毛片水多多多| 久久久久九九精品影院| 午夜福利高清视频| a级毛色黄片| 91av网一区二区| 人妻久久中文字幕网| 一区福利在线观看| 丝袜喷水一区| 成年女人永久免费观看视频| 欧美+日韩+精品| 久久6这里有精品| 黄色日韩在线| 麻豆国产av国片精品| 久久精品人妻少妇| 国产亚洲欧美98| 少妇被粗大猛烈的视频| 国产又黄又爽又无遮挡在线| 久久人人爽人人爽人人片va| 欧美日本视频| 国产成人a∨麻豆精品| 精品不卡国产一区二区三区| av女优亚洲男人天堂| 波多野结衣高清无吗| 亚洲精品456在线播放app| 搡女人真爽免费视频火全软件 | 久久亚洲精品不卡| 亚洲在线自拍视频| a级毛片免费高清观看在线播放| 国产午夜精品论理片| 欧美zozozo另类| 欧美区成人在线视频| 麻豆国产av国片精品| 欧美又色又爽又黄视频| 女的被弄到高潮叫床怎么办| 免费电影在线观看免费观看| 国产在线男女| 日本a在线网址| 欧美日韩综合久久久久久| 亚洲欧美日韩高清专用| 自拍偷自拍亚洲精品老妇| 色av中文字幕| 亚洲自偷自拍三级| 国产精品人妻久久久久久| 日本a在线网址| 女同久久另类99精品国产91| 可以在线观看的亚洲视频| 色在线成人网| 国产在视频线在精品| 哪里可以看免费的av片| 成人永久免费在线观看视频| 97热精品久久久久久| 成人av一区二区三区在线看| 国内久久婷婷六月综合欲色啪| 天美传媒精品一区二区| 国产成人a区在线观看| 久久婷婷人人爽人人干人人爱| 特大巨黑吊av在线直播| 亚洲乱码一区二区免费版| 久久久久性生活片| 色哟哟哟哟哟哟| 男插女下体视频免费在线播放| 亚洲精品一卡2卡三卡4卡5卡| 欧美在线一区亚洲| 人妻制服诱惑在线中文字幕| 国产一区二区三区在线臀色熟女| 99热精品在线国产| av在线天堂中文字幕| 欧美不卡视频在线免费观看| 精品欧美国产一区二区三| 亚洲真实伦在线观看| 内地一区二区视频在线| 变态另类丝袜制服| 国产成人freesex在线 | 黄色配什么色好看| 国产亚洲av嫩草精品影院| 国产精品久久久久久亚洲av鲁大| 亚洲人成网站在线播| 亚洲av美国av| 97超碰精品成人国产| 久久韩国三级中文字幕| 日韩欧美 国产精品| 乱系列少妇在线播放| 国产高清视频在线播放一区| 国产精品久久久久久av不卡| 51国产日韩欧美| 日韩av不卡免费在线播放| 久久午夜福利片| 国产黄片美女视频| 日韩成人av中文字幕在线观看 | 男人舔女人下体高潮全视频| 国产91av在线免费观看| 一区福利在线观看| 一卡2卡三卡四卡精品乱码亚洲| 午夜影院日韩av| 久久精品国产亚洲网站| 在线观看av片永久免费下载| 麻豆国产av国片精品| 国产一级毛片七仙女欲春2| 美女cb高潮喷水在线观看| 九九在线视频观看精品| 99riav亚洲国产免费| 成人特级黄色片久久久久久久| 最近手机中文字幕大全| 日本黄色视频三级网站网址| 午夜福利视频1000在线观看| 亚洲电影在线观看av| 国产亚洲精品久久久com| 精品一区二区三区视频在线观看免费| 免费观看的影片在线观看| 精品一区二区三区人妻视频| 亚洲av免费高清在线观看| 色哟哟哟哟哟哟| 简卡轻食公司| 在线观看av片永久免费下载| 一进一出抽搐动态| 久久久午夜欧美精品| 色视频www国产| 成人三级黄色视频| 91精品国产九色| 久久99热这里只有精品18| 小蜜桃在线观看免费完整版高清| 亚洲婷婷狠狠爱综合网| 三级国产精品欧美在线观看| 人妻少妇偷人精品九色| 国产精品久久久久久亚洲av鲁大| 日日摸夜夜添夜夜添小说| 免费av毛片视频| 在线播放国产精品三级| 99热网站在线观看| 亚洲第一电影网av| 国产蜜桃级精品一区二区三区| 亚洲av电影不卡..在线观看| 亚洲精品成人久久久久久| 欧美高清性xxxxhd video| 日韩欧美一区二区三区在线观看| 国产大屁股一区二区在线视频| 日韩三级伦理在线观看| 成人综合一区亚洲| 男女边吃奶边做爰视频| 国产精品人妻久久久久久| 免费看美女性在线毛片视频| 亚洲人成网站在线播放欧美日韩| 啦啦啦啦在线视频资源| 国产男人的电影天堂91| 少妇高潮的动态图| 午夜激情欧美在线| 久久精品国产清高在天天线| 伦精品一区二区三区| 午夜精品在线福利| 婷婷色综合大香蕉| 看片在线看免费视频| 一区二区三区免费毛片| 国产男靠女视频免费网站| 观看免费一级毛片| 日本爱情动作片www.在线观看 | 99久国产av精品国产电影| 精华霜和精华液先用哪个| 联通29元200g的流量卡| 国产精品久久久久久av不卡| 日日啪夜夜撸| 亚洲人成网站高清观看| 99国产精品一区二区蜜桃av| 亚洲激情五月婷婷啪啪| 国产大屁股一区二区在线视频| 我要搜黄色片| 99久久久亚洲精品蜜臀av| 九九爱精品视频在线观看| or卡值多少钱| 精品熟女少妇av免费看| 人妻久久中文字幕网| 一级毛片电影观看 | 亚洲在线观看片| 亚洲欧美日韩卡通动漫| 男人舔奶头视频| av黄色大香蕉| 校园人妻丝袜中文字幕| 国内少妇人妻偷人精品xxx网站| 久久久久久久久久久丰满| av在线天堂中文字幕| 色哟哟哟哟哟哟| 亚洲精品乱码久久久v下载方式| 国国产精品蜜臀av免费| 网址你懂的国产日韩在线| 国产视频内射| 久久精品影院6| 黄色日韩在线| 欧美3d第一页| 有码 亚洲区| 国产精品亚洲一级av第二区| 国产单亲对白刺激| 久久久久久国产a免费观看| 在线观看免费视频日本深夜| 国产单亲对白刺激| 国产精品日韩av在线免费观看| 九九在线视频观看精品| 欧美成人精品欧美一级黄| 欧美性猛交黑人性爽| av.在线天堂| 亚洲人成网站在线播| 成人漫画全彩无遮挡| 国产高潮美女av| 日韩欧美国产在线观看| 一区二区三区四区激情视频 | 俄罗斯特黄特色一大片| 悠悠久久av| 级片在线观看| 亚洲欧美日韩卡通动漫| 蜜臀久久99精品久久宅男| 亚洲三级黄色毛片| 在线观看午夜福利视频| www日本黄色视频网| 在线播放无遮挡|