• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    融合多視角和多標(biāo)簽學(xué)習(xí)的RNA 結(jié)合蛋白識(shí)別

    2021-11-17 08:26:26楊海濤鄧趙紅王士同
    計(jì)算機(jī)與生活 2021年11期
    關(guān)鍵詞:二肽分類器標(biāo)簽

    楊海濤,鄧趙紅,王士同

    江南大學(xué) 人工智能與計(jì)算機(jī)學(xué)院,江蘇 無錫214122

    核糖核酸(ribonucleic acid,RNA),存在于生物細(xì)胞以及部分病毒、類病毒的遺傳信息載體之中,在生命體中主要發(fā)揮調(diào)控編碼基因表達(dá)的作用,同時(shí)也擔(dān)任基因轉(zhuǎn)錄后合成蛋白質(zhì)的模板角色,是生命體中不可缺少的成分。一條RNA想要順利發(fā)揮其功能,一般需要借助RNA 結(jié)合蛋白(RNA-binding protein,RBP)進(jìn)行介導(dǎo),因此缺少某種RBP 可能會(huì)導(dǎo)致某類RNA 無法發(fā)揮其調(diào)控或翻譯的功能,使生命體的某些重要蛋白質(zhì)缺失或異常增殖,影響自身機(jī)能。

    RNA 結(jié)合蛋白(RBP)是翻譯過程的關(guān)鍵參與者,它們結(jié)構(gòu)域的多功能性與結(jié)構(gòu)靈活性使得RBP能夠控制大量轉(zhuǎn)錄物的代謝。RBP 幾乎涉及翻譯調(diào)控層的所有步驟,它們與其他蛋白質(zhì)以及編碼和非編碼RNA 建立高度動(dòng)態(tài)的相互作用,產(chǎn)生稱為核糖核蛋白復(fù)合物的功能單元,調(diào)節(jié)RNA 剪切、多腺苷酸化、穩(wěn)定性、定位、翻譯和退化[1-2]。研究發(fā)現(xiàn),某些特定RBP 具有調(diào)節(jié)RNA 合成癌蛋白和腫瘤抑制蛋白的功效,因此破譯RBP 與癌癥相關(guān)RNA 靶標(biāo)之間錯(cuò)綜復(fù)雜的結(jié)合關(guān)系網(wǎng)絡(luò)將為腫瘤生物學(xué)提供更好的研究方向,并可能發(fā)現(xiàn)治療癌癥的新方法[3-4]。

    在大數(shù)據(jù)和測(cè)序技術(shù)高度發(fā)展的背景下,醫(yī)療條件無法對(duì)每對(duì)RNA 和RBP 進(jìn)行結(jié)合性檢測(cè),因此涌現(xiàn)了很多利用機(jī)器學(xué)習(xí)模型從RNA 序列中識(shí)別RBP 結(jié)合位點(diǎn)[5]的算法。例如:Maticzka 等人提出了GraphProt[6]方法,其從高通量實(shí)驗(yàn)數(shù)據(jù)中學(xué)習(xí)RBP序列和結(jié)構(gòu)的結(jié)合偏好,設(shè)計(jì)出獨(dú)特的計(jì)算框架;Corrado 等人提出RNACommender[7],一種預(yù)測(cè)結(jié)合位點(diǎn)的方法,能夠通過可用的相互作用信息,考慮蛋白質(zhì)結(jié)構(gòu)和RNA 的模擬二級(jí)結(jié)構(gòu),向未探索的RBP推薦RNA 靶點(diǎn);由Zhang 等人提出的HOCNNLB[8]使用高階核苷酸編碼來作為初始特征,預(yù)測(cè)某段給定的RNA 是否是結(jié)合位點(diǎn)。這些方法的關(guān)注點(diǎn)在于利用原始RNA 序列的特征預(yù)測(cè)結(jié)合位點(diǎn)[9-10],忽視了RNA 與RBP 已有的結(jié)合信息對(duì)預(yù)測(cè)的助力。針對(duì)此,Pan 等人提出了iDeepM[11]方法,其利用多標(biāo)簽分類和深度學(xué)習(xí)法預(yù)測(cè)一條RNA 與多種RBP 的結(jié)合情況,成功達(dá)到多標(biāo)簽分類的預(yù)期效果。但iDeepM也存在如下的不足:其使用的RNA 序列單視角數(shù)據(jù)雖然對(duì)分類具有一定的有效性,但受限于RNA 序列的信息量不足,導(dǎo)致預(yù)測(cè)精度較低;另外該方法使用的卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)未能充分學(xué)習(xí)到標(biāo)簽之間的關(guān)聯(lián),同樣對(duì)預(yù)測(cè)精度產(chǎn)生影響。

    本文針對(duì)iDeepM方法面臨的挑戰(zhàn),在Pan等人工作的基礎(chǔ)上進(jìn)行了改進(jìn),提出了RRMVL(RNA-RBP multiview learning)方法。RRMVL 融合了多視角深度特征學(xué)習(xí)、多標(biāo)簽特征學(xué)習(xí)和最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)技術(shù)來進(jìn)行RBP 識(shí)別。首先,在最初的RNA 序列數(shù)據(jù)基礎(chǔ)上,提取了氨基酸序列視角數(shù)據(jù)、多間隙二肽成分視角數(shù)據(jù)和RNA 序列語義視角數(shù)據(jù);然后,針對(duì)不同視角的數(shù)據(jù)結(jié)構(gòu),設(shè)計(jì)各自視角的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行深度特征學(xué)習(xí);接著,融合提取到的各個(gè)視角的深度特征,使用邏輯回歸原理學(xué)習(xí)每個(gè)視角的每一維特征對(duì)每一個(gè)標(biāo)簽的貢獻(xiàn)權(quán)重;最后,將深度特征向量與各自標(biāo)簽對(duì)應(yīng)的權(quán)重系數(shù)相乘,輸入至改進(jìn)后的CC 多標(biāo)簽分類器中訓(xùn)練,實(shí)現(xiàn)最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí),進(jìn)一步提高RNA 與RBP 結(jié)合的預(yù)測(cè)精度。本文的實(shí)驗(yàn)研究表明使用基于多視角的最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)的方法在預(yù)測(cè)精度方面有了明顯的提升。

    本文主要貢獻(xiàn)可歸納如下:(1)使用Word2Vec 技術(shù)訓(xùn)練6 聚體RNA 語義模型,提取出RNA 序列的序列語義視角數(shù)據(jù)用于識(shí)別RNA 結(jié)合蛋白;(2)使用多間隙二肽成分表示法構(gòu)建RNA 序列的成分視角,其包含更豐富的成分信息;(3)設(shè)計(jì)獨(dú)立的網(wǎng)絡(luò)模型,學(xué)習(xí)本文提出的RNA 序列視角、氨基酸序列視角、多間隙二肽成分視角和RNA 序列語義視角中每一維深度特征對(duì)每個(gè)標(biāo)簽的貢獻(xiàn)權(quán)重,實(shí)現(xiàn)多標(biāo)簽特征學(xué)習(xí);(4)改進(jìn)現(xiàn)有的CC 多標(biāo)簽鏈?zhǔn)椒诸惼?,將多?biāo)簽特征學(xué)習(xí)后的加權(quán)特征向量應(yīng)用于多標(biāo)簽學(xué)習(xí)中,最大化提升了CC 多標(biāo)簽分類器對(duì)每個(gè)標(biāo)簽的學(xué)習(xí)能力,達(dá)到最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)的效果;(5)研究了類樣本不均衡對(duì)預(yù)測(cè)RNA 和RBP 結(jié)合精度的影響。

    1 相關(guān)工作

    1.1 RNA 序列與氨基酸序列的相互轉(zhuǎn)化

    自然界中存在五種堿基A、C、G、U、T,其中前四者是構(gòu)成RNA 的主要成分。RNA 序列和氨基酸序列可以通過翻譯和逆翻譯機(jī)制[12]相互轉(zhuǎn)化。因?yàn)榘被嵝蛄惺怯?0 種氨基酸構(gòu)成的蘊(yùn)含一定上下文信息的序列,其信息量遠(yuǎn)比RNA 序列豐富[13],因此在以RNA 為研究主體的生物信息學(xué)領(lǐng)域,通常將RNA 序列轉(zhuǎn)化為氨基酸序列進(jìn)行特征提取與分析。將RNA序列翻譯成氨基酸序列是單向且唯一的,但是由于一種氨基酸可對(duì)應(yīng)多種堿基組合,用普通的翻譯方法得到的氨基酸序列無法還原至原始RNA 序列,這會(huì)造成信息丟失和信息曲解的后果。例如堿基組合GCA 可翻譯得到固定的氨基酸A,但是氨基酸A 卻可以表示為GCA、GCC、GCG、GCU。為了處理這個(gè)問題,本文使用三種方式將RNA 序列翻譯為氨基酸序列:(1)從頭開始翻譯RNA 序列;(2)跳過RNA 序列第一個(gè)堿基開始翻譯;(3)跳過RNA 序列第一和第二個(gè)堿基開始翻譯。用此方法可將長(zhǎng)度為m的RNA序列轉(zhuǎn)化為3 條長(zhǎng)度為1/3m的氨基酸序列,這三種形態(tài)的氨基酸序列可以通過序列信息互補(bǔ)還原原始RNA 序列信息。如上述的堿基組合GCA,可使用三種形態(tài)序列對(duì)應(yīng)位置的氨基酸R、A、H 來唯一確定。三種形態(tài)拼接起來的長(zhǎng)度為m的氨基酸序列能夠完全繼承原始RNA 序列的序列信息,且具有更加豐富的表現(xiàn)形式。

    1.2 多間隙二肽成分表示法

    二肽是氨基酸序列特有的一種結(jié)構(gòu)[14],任意兩個(gè)氨基酸的組合稱為二肽。因?yàn)槎膶?duì)左右氨基酸的排列敏感[15-16],所以20 種天然氨基酸可以組成400 種不同的二肽。多間隙二肽成分表示法(g-gap dipeptide composition)[17]是一種描述氨基酸序列中二肽成分信息的方法。這種方法不僅包含了兩個(gè)氨基酸在序列上的相關(guān)性,還描述了由于蛋白質(zhì)二級(jí)結(jié)構(gòu)中的氫鍵作用,序列上距離遠(yuǎn)的兩個(gè)氨基酸,在三維空間上卻可能相鄰。因此使用多間隙二肽成分表示法可以為機(jī)器學(xué)習(xí)提供更多氨基酸序列和RNA 序列的成分信息,通常將氨基酸序列中多間隙二肽的種類及數(shù)量映射為一條特征向量作為初始特征使用。多間隙(g-gap)中的g表示某種中間間隔了g個(gè)氨基酸的二肽,取值范圍為0 到9。

    1.3 基于Word2Vec方法的語義模型

    在大數(shù)據(jù)為背景的信息時(shí)代,涌現(xiàn)出眾多形式的信息,其中文本信息是最傳統(tǒng)也是信息量最大的一種表現(xiàn)形式。如何將文字量化為可以提取特征的數(shù)字形式,即自然語言處理(natural language processing,NLP),成為機(jī)器學(xué)習(xí)領(lǐng)域一個(gè)重要的研究方向。Onehot 是目前較為流行的編碼技術(shù)[18-19],其原理是將由n種元素組成的長(zhǎng)度為m的文字序列構(gòu)建為n×m的矩陣,其中把每種元素轉(zhuǎn)化為n維標(biāo)準(zhǔn)正交基向量填充至m長(zhǎng)度中的對(duì)應(yīng)位置。但這種方法構(gòu)建的初始特征矩陣受限于維度過大,且使用機(jī)器學(xué)習(xí)方法提取稀疏矩陣特征的效果不理想,因此one-hot 并不適用于大型詞庫的文本處理。

    Word2Vec[20-22]是NLP 領(lǐng)域常用的方法,其原理是通過訓(xùn)練獨(dú)特的網(wǎng)絡(luò)模型,將詞庫中的每個(gè)詞映射為k維實(shí)數(shù)向量,使用詞的實(shí)數(shù)向量來構(gòu)建文本樣本的初始特征矩陣。詞向量模型的訓(xùn)練過程如下:(1)對(duì)文本樣本進(jìn)行分詞操作,構(gòu)造詞典,統(tǒng)計(jì)詞頻,依照詞語出現(xiàn)概率構(gòu)造哈夫曼樹,生成每個(gè)詞語的二進(jìn)制碼;(2)構(gòu)建一個(gè)3 層結(jié)構(gòu)的網(wǎng)絡(luò)模型,將相鄰詞語的二進(jìn)制碼分別作為特征和標(biāo)簽輸入至模型進(jìn)行訓(xùn)練;(3)獲取模型隱含層參數(shù),計(jì)算詞庫中每個(gè)單詞的詞向量?;谠~頻的哈夫曼編碼可以讓詞頻相似的詞在隱藏層激活的內(nèi)容基本一致,且單詞出現(xiàn)的頻率越高,它們激活的隱藏層節(jié)點(diǎn)數(shù)目就越少,有效通過較低的計(jì)算復(fù)雜度學(xué)習(xí)到單詞在高維空間中的距離分布。通過此方法訓(xùn)練出來的詞向量不僅具有維度低的優(yōu)點(diǎn),而且包含了其在文本樣本中的上下文信息,可以為特征提取提供良好的幫助。

    1.4 多標(biāo)簽學(xué)習(xí)

    不同于多分類問題,多標(biāo)簽分類[23]是一種更普遍且更具有挑戰(zhàn)的問題,它描述了一個(gè)樣本可以對(duì)應(yīng)多個(gè)類的情況?,F(xiàn)處理這類問題的方法有兩種:一種是問題轉(zhuǎn)化法,即把多標(biāo)簽問題中的多個(gè)標(biāo)簽通過一定形式的組合,變?yōu)槿舾蓸?biāo)簽集合,將標(biāo)簽集合看作特殊的標(biāo)簽,間接把問題轉(zhuǎn)化為普通的單標(biāo)簽學(xué)習(xí)問題。經(jīng)典的算法有BR(binary relevance)[24]、LP(label powerset)[25]和CC(classifier chains)[26]。BR 算法設(shè)計(jì)若干分類器,有效學(xué)習(xí)到每個(gè)類別的特征,卻忽略了標(biāo)簽之間的相關(guān)性;LP 算法雖然考慮到標(biāo)簽之間的聯(lián)系,但是該算法的時(shí)間和空間復(fù)雜度比較高;CC 算法利用多個(gè)分類器構(gòu)造鏈?zhǔn)浇Y(jié)構(gòu),可以有效學(xué)習(xí)到標(biāo)簽之間錯(cuò)綜復(fù)雜的關(guān)系。另一種做法是改進(jìn)現(xiàn)有的單標(biāo)簽學(xué)習(xí)法來適應(yīng)多標(biāo)簽分類,使其具有處理多標(biāo)簽問題的能力。比較常見的有基于Boosting的算法AMH(AdaBoost.MH)和AMR(AdaBoost.MR)[27],以及基于決策樹的算法。其中AMH 是以Hamming Loss作為損失函數(shù)來構(gòu)建學(xué)習(xí)模型;AMR算法以Ranking Loss 作為損失函數(shù);Clare 等人對(duì)經(jīng)典的單標(biāo)簽決策樹學(xué)習(xí)模型進(jìn)行了改進(jìn),提出算法C4.5[28],其原理是通過計(jì)算訓(xùn)練樣本的信息增益來訓(xùn)練分類器。改進(jìn)后的算法中,葉節(jié)點(diǎn)不再是一個(gè)類,而是一個(gè)標(biāo)簽集合。但這些算法沒有充分考慮標(biāo)簽間的關(guān)聯(lián)性。

    2 多視角多標(biāo)簽識(shí)別RNA 結(jié)合蛋白

    2.1 總覽

    本文把探索一條RNA 與多種RNA 結(jié)合蛋白(RBP)結(jié)合的問題轉(zhuǎn)化為機(jī)器學(xué)習(xí)中的多標(biāo)簽分類問題。RNA 序列作為研究主體,RBP 作為類別。不同于現(xiàn)有方法,本文利用分子生物學(xué)原理,把原始RNA 序列轉(zhuǎn)化為氨基酸序列,統(tǒng)計(jì)氨基酸序列的0-gap 二肽和1-gap 二肽數(shù)量,組成多間隙二肽成分,利用Word2Vec 技術(shù)構(gòu)建6 聚體RNA 詞向量,由此得到RNA 序列視角、氨基酸序列視角、多間隙二肽成分視角和RNA 序列語義視角的初始數(shù)據(jù)。然后使用深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)分別提取4 個(gè)視角的深度特征,將其拼接并投入至多標(biāo)簽特征學(xué)習(xí)模型中訓(xùn)練,通過此模型的處理,可以獲取每個(gè)標(biāo)簽相關(guān)的加權(quán)特征向量。接著將加權(quán)特征向量投入多標(biāo)簽分類器CC 模型學(xué)習(xí)標(biāo)簽之間的關(guān)聯(lián)性。最后使用上述CC 模型訓(xùn)練出來的分類器,預(yù)測(cè)一條未探索的RNA 序列與多種RBP 的結(jié)合情況。本文方法的整體框架如圖1 所示,它包含4 個(gè)部分:獲取初始多視角數(shù)據(jù)、多視角深度特征學(xué)習(xí)、多標(biāo)簽特征學(xué)習(xí)和多標(biāo)簽學(xué)習(xí)。

    Fig.1 Optimal multi-label chain learning method framework based on multi-view learning圖1 基于多視角的最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)方法框架

    2.2 多視角初始特征提取

    在大數(shù)據(jù)時(shí)代,數(shù)據(jù)量增多的同時(shí),數(shù)據(jù)的表示形式也越來越多樣化,對(duì)樣本進(jìn)行多視角數(shù)據(jù)提取成為一種趨勢(shì)。利用多視角數(shù)據(jù)間相容、互補(bǔ)的性質(zhì)對(duì)其進(jìn)行更有效的分析成為很多領(lǐng)域的必然需求。本文從4 個(gè)角度對(duì)RNA 序列進(jìn)行數(shù)據(jù)提取工作,分別為包含次序信息的RNA 序列視角、氨基酸序列視角,包含成分信息的多間隙二肽成分視角和包含語義信息的RNA 序列語義視角。

    2.2.1 RNA 序列one-hot編碼

    RNA 序列是由4 種堿基組成的文字序列。許多方法將其作為特征提取的主體,利用one-hot 編碼技術(shù)將文字序列轉(zhuǎn)化為數(shù)值矩陣,再投入至機(jī)器學(xué)習(xí)模型中去訓(xùn)練。One-hot會(huì)為一條長(zhǎng)度為m的RNA序列構(gòu)造一個(gè)4×m大小的空白矩陣,將每種堿基轉(zhuǎn)化為4維正交基向量,填充至序列的對(duì)應(yīng)位置,如圖2所示。

    Fig.2 One-hot encoding of RNA sequence圖2 RNA 序列one-hot編碼

    圖2 中行標(biāo)題為一條具體的RNA 序列,實(shí)際長(zhǎng)度為2 700。對(duì)照列中堿基所在的位置,可以把序列中的堿基A 表示為向量(1,0,0,0)T,堿基C 表示為向量(0,1,0,0)T,堿基G 表示為(0,0,1,0)T,堿基U 表示為(0,0,0,1)T,以此類推。由于數(shù)據(jù)集中RNA 序列的長(zhǎng)度不統(tǒng)一,規(guī)定了一個(gè)固定的長(zhǎng)度2 700,使用堿基B 來補(bǔ)齊每條不足2 700 位的RNA 序列,這里統(tǒng)一用向量(0.25,0.25,0.25,0.25)T來表示。

    2.2.2 氨基酸序列one-hot編碼

    上述方法構(gòu)建的初始矩陣雖然對(duì)提取特征有幫助,但缺點(diǎn)是信息量較少。氨基酸序列由20 種氨基酸構(gòu)成,其信息量遠(yuǎn)比RNA 序列豐富,因此使用氨基酸序列轉(zhuǎn)化得到的one-hot 編碼矩陣會(huì)為特征提取提供更好的效果。利用基于codon[29]的三種翻譯方式,可將長(zhǎng)度為m的RNA 序列轉(zhuǎn)化為3 條長(zhǎng)度為1/3m的氨基酸序列,拼接三種形態(tài)的氨基酸序列,能夠完全繼承原始RNA 序列的序列信息,且具有更加豐富的表現(xiàn)形式。對(duì)拼接的長(zhǎng)鏈進(jìn)行one-hot 編碼,原理同RNA 序列,可得到20×m大小的初始特征矩陣,如圖3 所示,即為本文所提出的氨基酸視角數(shù)據(jù)。圖中行標(biāo)題為一條具體的氨基酸序列,實(shí)際長(zhǎng)度為2 700。對(duì)照列標(biāo)題中氨基酸所在的位置,可以將行序列中的所有氨基酸表示為20 維的標(biāo)準(zhǔn)正交基向量,其中i表示氨基酸α在圖中列標(biāo)題所在位置,如氨基酸A 可以表示為氨基酸H 可以表示為氨基酸M可以表示為以此類推。由于RNA 序列存在終止密碼子,且部分RNA 序列含有臨時(shí)堿基B,這里使用字母O 來表示它們,向量值全部設(shè)為0.05。

    2.2.3 提取序列成分構(gòu)造多間隙二肽柱狀圖

    上述提到的RNA 視角和氨基酸視角數(shù)據(jù)偏向于對(duì)序列次序提取特征,而序列除了次序外,其組成成分同樣重要。因?yàn)?-gap 二肽偏向于二維序列的成分組成,而1-gap 二肽帶有三維結(jié)構(gòu)成分信息,所以使用0-gap 二肽和1-gap 二肽提取成分信息效果最佳,本文采用它們的組合形式構(gòu)成多間隙二肽成分視角。二肽對(duì)左右氨基酸排列是敏感的,對(duì)于本文中21 種氨基酸(20 種天然氨基酸和本文增加的臨時(shí)氨基酸O),共有21×21×2 個(gè)多間隙二肽種類,由于OO 和O*O 的組合對(duì)本文的研究無太多意義,被舍棄。統(tǒng)計(jì)這880 種二肽出現(xiàn)的次數(shù)得到特征向量,可以有效地捕獲序列成分信息和空間成分信息。由于880 維的特征向量是一維的,用于提取深度特征的效果不理想,將其轉(zhuǎn)化為二維柱狀圖,可以更有效地提取深度特征,如圖4 所示。圖中上部分表格的橫坐標(biāo)為二肽種類,其中“AA”表示左右都是丙氨酸的0-gap二肽,18 代表其在樣本序列中的數(shù)量;“A*D”表示左側(cè)為丙氨酸,中間間隔任意一個(gè)氨基酸,右側(cè)為天冬氨酸的1-gap 二肽。圖4 只列舉了12 種二肽,實(shí)際數(shù)量為880 種。下部分圖表為轉(zhuǎn)化后的柱狀圖,每種二肽數(shù)量的上限設(shè)為30,因此取30×880 大小的矩陣作為此條序列的多間隙二肽初始數(shù)據(jù)。

    2.2.4 使用RNA 詞向量構(gòu)建語義矩陣

    自然語言處理(natural language processing,NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要研究方向,從初始數(shù)據(jù)的角度來看,生物信息學(xué)與NLP的研究數(shù)據(jù)具有相同的形式[30]。因此,可以使用NLP的方法來解決生物信息學(xué)中對(duì)文本的編碼及初始特征構(gòu)建。本文使用6 聚體RNA 構(gòu)建語義詞庫,6 聚體RNA 為6 個(gè)連續(xù)堿基組成的結(jié)構(gòu),詞庫共由46種6 聚體RNA組成。本文使用現(xiàn)流行的Word2Vec技術(shù)構(gòu)建語義模型,其原理如圖5 所示?;诒疚乃脭?shù)據(jù)集中的92 102 條RNA 序列,逐條對(duì)它們進(jìn)行以下操作:(1)使用6 位堿基為大小的滑動(dòng)窗口,獲取RNA 序列中6 聚體RNA 的排列順序;(2)對(duì)每個(gè)6 聚體RNA 進(jìn)行編碼,即它在4 096種形態(tài)中的位置(以“AAAAAA”為1,“UUUUUU”為4 096 的規(guī)則);(3)將相鄰的2 個(gè)6 聚體RNA 分別作為特征X和標(biāo)簽Y,投入至語義模型中訓(xùn)練;(4)從訓(xùn)練完的語義模型中提取4 096種6 聚體RNA 的詞向量結(jié)果;(5)使用詞向量替代RNA 序列中每個(gè)6 聚體RNA,構(gòu)建RNA 序列語義矩陣。由6 聚體RNA 詞向量構(gòu)成的RNA 序列語義矩陣不僅具有較小的維度,而且包含了以6 位堿基為基序的RNA 序列次序和上下文結(jié)構(gòu)信息,可以更好地進(jìn)行深度特征學(xué)習(xí)。

    Fig.5 Process of generating RNA sequence semantic matrix圖5 RNA 序列語義矩陣生成過程

    2.3 建立深度卷積網(wǎng)絡(luò)模型提取深度特征

    基于上述4 個(gè)視角得到的初始特征數(shù)據(jù),構(gòu)建了4 個(gè)不同的深度卷積神經(jīng)網(wǎng)絡(luò)模型,來獲取這4 個(gè)視角的深度特征。深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),處理對(duì)象主要為圖像數(shù)據(jù),其具有強(qiáng)大的表征學(xué)習(xí)能力,能夠按其階層結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變分類[31-33],因此也被稱為“平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)”。4 個(gè)視角的模型很相似,輸入層之后統(tǒng)一附加卷積層,經(jīng)過池化、扁平化、dropout 后使用2 個(gè)全連通層進(jìn)行橋接。利用這樣的模型所得到的深度特征不僅比原始特征具有更小的維數(shù),而且具有更好的判別能力,增強(qiáng)了后續(xù)分類工作的泛化性。圖6 中的(1)~(4)分別是提取RNA 序列視角、氨基酸序列視角、多間隙二肽成分視角和RNA 序列語義視角深度特征的CNN 模型圖。圖中公式k@m×n表示網(wǎng)絡(luò)各層的特征圖數(shù)量及大小,k表示該層的特征圖數(shù)量,m×n表示該特征圖的大??;卷積核的大小表示為k×m×n,其中k代表卷積核的數(shù)量,m×n代表卷積核的大小,卷積步長(zhǎng)默認(rèn)為1。整個(gè)模型的輸入為上文提到的各個(gè)視角的原始數(shù)據(jù)矩陣,經(jīng)過模型處理后得到68 維的特征向量,對(duì)應(yīng)68 個(gè)類別(67 種RBP 和不屬于任何一類的負(fù)類)。CNN 網(wǎng)絡(luò)最后一層網(wǎng)絡(luò)采用的激活函數(shù)為“Sigmoid”函數(shù),該函數(shù)會(huì)將最后的全連通層數(shù)據(jù)映射到0~1 之間,因此最后的特征向量值均為小數(shù),代表RNA 序列隸屬于這68 個(gè)類的概率分布。網(wǎng)絡(luò)最后一層只是為了使本文的模型達(dá)到擬合數(shù)據(jù)的目的,深度特征數(shù)據(jù)經(jīng)過該層和Sigmoid 函數(shù)激活已經(jīng)有了明顯的分類趨勢(shì),不利于訓(xùn)練接下來的多標(biāo)簽特征學(xué)習(xí)模型,因此采用倒數(shù)第二層202 維的深度特征作為模型的輸出結(jié)果。

    Fig.6 4 views'deep feature extraction network model圖6 4 個(gè)視角深度特征提取網(wǎng)絡(luò)模型

    圖6模型中,除了最后一層全連通層使用“Sigmoid”激活函數(shù)外,其他網(wǎng)絡(luò)層的激活函數(shù)均為“ReLU”。因?yàn)椤癛eLU”函數(shù)比“Sigmoid”具有更小的計(jì)算量,且有一定的防止梯度消失的作用。由于最后一層要將特征向量與標(biāo)簽相關(guān)聯(lián),使用“Sigmoid”函數(shù)比較合適?!癛eLU”函數(shù)和“Sigmoid”函數(shù)的公式定義如下:

    因?yàn)槎鄻?biāo)簽分類問題可以看成是由若干個(gè)二分類問題所組成,所以使用二分類的損失函數(shù)來處理多分類問題。上述4 個(gè)CNN 模型均采用二進(jìn)制交叉熵(binary_crossentropy)作為損失函數(shù),定義如下:

    其中,p(xi)和q(xi)都代表序列x對(duì)于類別i的隸屬度,p代表實(shí)標(biāo)簽值,即1 或0,q代表預(yù)測(cè)值,在這里因?yàn)榻?jīng)過“Sigmoid”函數(shù)激活,所以q∈[0,1]。

    2.4 基于多視角的最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)算法

    CC 算法是一種可以高效學(xué)習(xí)標(biāo)簽之間關(guān)聯(lián)的多標(biāo)簽分類算法,其原理是構(gòu)建若干個(gè)二分類器來預(yù)測(cè)對(duì)應(yīng)的若干標(biāo)簽,每訓(xùn)練完一個(gè)二分類器,算法都會(huì)將該分類器預(yù)測(cè)的對(duì)應(yīng)標(biāo)簽結(jié)果附加到初始特征之后,作為下一個(gè)二分類器訓(xùn)練的輸入特征,直至所有分類器訓(xùn)練完畢。然而CC 算法存在三種弊端:其一,每次為新標(biāo)簽訓(xùn)練分類器時(shí),盡管加入了部分已預(yù)測(cè)的標(biāo)簽值作為新特征,然而輸入的初始特征始終不變,無法最大化利用標(biāo)簽關(guān)聯(lián)性訓(xùn)練新標(biāo)簽分類器;其二,CC 算法過于依賴標(biāo)簽排列順序,最初的標(biāo)簽分類器性能直接影響了后續(xù)新標(biāo)簽分類器的訓(xùn)練效果;其三,現(xiàn)有的CC 算法無法應(yīng)用于多視角數(shù)據(jù)場(chǎng)景下的多標(biāo)簽學(xué)習(xí)。

    鑒于此,本文改進(jìn)了現(xiàn)有CC 鏈?zhǔn)椒诸惼鳎瑢⑵鋺?yīng)用到多視角場(chǎng)景。利用多標(biāo)簽特征學(xué)習(xí)技術(shù),把多視角數(shù)據(jù)的優(yōu)勢(shì)附加到CC 算法中,同時(shí)最大化提升了分類器對(duì)每個(gè)標(biāo)簽的學(xué)習(xí)能力,使之可以更好地學(xué)習(xí)標(biāo)簽之間的關(guān)聯(lián),達(dá)到最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)的效果,具體原理如圖7 所示。

    Fig.7 Principle of optimal multi-label chain learning based on multi-view learning圖7 基于多視角的最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)原理

    算法分兩部分:多標(biāo)簽特征學(xué)習(xí)和多標(biāo)簽學(xué)習(xí)。首先從上游的CNN 模型獲取各個(gè)視角的深度特征向量,將它們拼接并投入至多標(biāo)簽特征學(xué)習(xí)網(wǎng)絡(luò)模型中訓(xùn)練。該模型的輸入為808 維特征向量,輸出為68維結(jié)果,對(duì)應(yīng)68 個(gè)標(biāo)簽。通過該模型的學(xué)習(xí),可以獲取68 組808 維的權(quán)重系數(shù),對(duì)應(yīng)輸入向量的每一維特征對(duì)預(yù)測(cè)每個(gè)標(biāo)簽的貢獻(xiàn)權(quán)重。將808 維特征向量依次與這68 組權(quán)重系數(shù)相乘,獲得68 組加權(quán)特征向量,用于訓(xùn)練下游的CC 多標(biāo)簽分類器。本實(shí)驗(yàn)的CC 多標(biāo)簽分類器由68 個(gè)二分類器組成,用于預(yù)測(cè)一條RNA 對(duì)68 個(gè)標(biāo)簽的隸屬情況。鑒于CC 多標(biāo)簽分類器對(duì)標(biāo)簽順序具有依賴性,根據(jù)訓(xùn)練集中各標(biāo)簽樣本數(shù)量的差異對(duì)標(biāo)簽分類器的訓(xùn)練進(jìn)行預(yù)排序,使得樣本數(shù)量較多的標(biāo)簽分類器始終處于優(yōu)先訓(xùn)練的狀態(tài)。根據(jù)此訓(xùn)練次序,從多標(biāo)簽特征學(xué)習(xí)模塊獲得加權(quán)特征向量x1,并將其用作輸入特征開始訓(xùn)練第一個(gè)二分類器。由它預(yù)測(cè)的第一個(gè)標(biāo)簽值被附加到加權(quán)特征向量x2末尾,用以訓(xùn)練第二個(gè)二分類器。重復(fù)該過程,直至最后一個(gè)二分類器訓(xùn)練完畢。不同于傳統(tǒng)的CC 多標(biāo)簽分類器,本文提出的最優(yōu)CC 多標(biāo)簽分類器,其特點(diǎn)在于,當(dāng)訓(xùn)練完第i個(gè)二分類器后,將目前預(yù)測(cè)的所有標(biāo)簽值附加到與下個(gè)標(biāo)簽關(guān)聯(lián)的加權(quán)特征向量xi+1的末尾,進(jìn)行第i+1 個(gè)二分類器的訓(xùn)練。這樣不僅保留了CC 算法學(xué)習(xí)標(biāo)簽關(guān)聯(lián)性的能力,而且最大化提升了CC 多標(biāo)簽分類器對(duì)每個(gè)標(biāo)簽的學(xué)習(xí)能力,把多視角和多標(biāo)簽算法的優(yōu)勢(shì)結(jié)合在一起,形成最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)。訓(xùn)練和預(yù)測(cè)算法如算法1、算法2 所示。

    算法1 最優(yōu)CC 多標(biāo)簽分類器訓(xùn)練過程(基于L個(gè)標(biāo)簽和與L個(gè)標(biāo)簽相關(guān)聯(lián)的加權(quán)特征向量數(shù)據(jù)集DL)

    算法2最優(yōu)CC 多標(biāo)簽分類器預(yù)測(cè)過程(基于樣本X的L組權(quán)重特征)

    3 實(shí)驗(yàn)研究

    3.1 數(shù)據(jù)集

    本文使用的數(shù)據(jù)來源于AURA 網(wǎng)站[34]。本文從該網(wǎng)站上獲取了137 003 條RNA 序列信息,1 264 種調(diào)控因子信息以及2 549 510 個(gè)它們之間的結(jié)合位點(diǎn)信息,如圖8 所示,紅色整圓部分代表RNA 序列庫,結(jié)合位點(diǎn)信息和調(diào)控因子信息屬于綁定關(guān)系,因此使用藍(lán)色半圓和綠色半圓分別表示它們,圖中各顏色數(shù)值代表對(duì)應(yīng)部分的信息數(shù)量。調(diào)控因子又稱反式作用因子,是轉(zhuǎn)錄模板上游基因編碼的一類蛋白調(diào)節(jié)因子,包括激活因子和阻遏因子等。常見的調(diào)控因子有RBP、miRNA、轉(zhuǎn)錄因子。因本文是研究RBP 結(jié)合關(guān)聯(lián)性問題,且上述結(jié)合位點(diǎn)信息中涉及的RNA 不全包含在137 003 條序列中,所以最終本文選取了67 種RBP,73 681 條RNA 序列信息和550 386個(gè)它們之間的結(jié)合位點(diǎn)信息,如圖8 中雙圓的交叉部分所示。除此之外,本課題加入了18 421 條沒有任何結(jié)合位點(diǎn)信息的RNA 序列并入數(shù)據(jù)集,作為負(fù)樣本使用。

    Fig.8 AURA database composition圖8 AURA 數(shù)據(jù)庫組成

    3.2 性能指標(biāo)

    本文采用AUC 面積和F1 得分兩種評(píng)價(jià)指標(biāo)來評(píng)價(jià)模型的分類性能和預(yù)測(cè)性能。AUC 被定義為ROC 曲線下面積,ROC 曲線是反映敏感性和特異性連續(xù)變化的綜合指標(biāo)[35],AUC 值越大,模型的分類性能越好。在多標(biāo)簽分類問題中,類別樣本不均衡會(huì)導(dǎo)致性能指標(biāo)偏差過大,因此本文引入常用的Macro、Micro 和Weight 約束條件。Macro-AUC通過給每個(gè)類設(shè)置相同的權(quán)重,計(jì)算各個(gè)類的AUC 求和均值得到,當(dāng)小類很重要時(shí)該數(shù)值會(huì)偏低。Micro-AUC 是將每個(gè)類的敏感性和特異性分別求和,得出的結(jié)果繪制成ROC 曲線,求得的AUC,當(dāng)大類很重要時(shí)該數(shù)值會(huì)偏低。Weighted-AUC 根據(jù)每個(gè)類的樣本數(shù)量,計(jì)算出每個(gè)類的權(quán)重,再對(duì)這些類的AUC 進(jìn)行加權(quán)求和。除了評(píng)價(jià)模型分類性能外,還將對(duì)模型的預(yù)測(cè)性能進(jìn)行F1-score 的計(jì)算,F(xiàn)1 值是準(zhǔn)確率和召回率的調(diào)和平均數(shù),和AUC 指標(biāo)相同,也為F1 增加了Macro、Micro 和Weight的約束條件。

    3.3 本文算法預(yù)測(cè)效果

    為探究一條未知RNA 與多種RBP 的結(jié)合情況,Pan 等人使用多標(biāo)簽技術(shù),利用卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)建立了iDeepM[11]預(yù)測(cè)模型,本文在相同數(shù)據(jù)集的基礎(chǔ)上對(duì)提出的方法RRMVL 以及RRMVL下各個(gè)視角的單視角模型進(jìn)行五折交叉驗(yàn)證測(cè)試。同時(shí),為了驗(yàn)證深度學(xué)習(xí)在基于長(zhǎng)樣本RNA 序列上的學(xué)習(xí)優(yōu)勢(shì),本文構(gòu)造了編碼整條RNA 序列作為特征進(jìn)行訓(xùn)練的決策樹分類模型,以此與深度學(xué)習(xí)模型進(jìn)行對(duì)比,結(jié)果如表1 所示。k折交叉驗(yàn)證在確保一致的數(shù)據(jù)分布的基礎(chǔ)上,將數(shù)據(jù)劃分為大小相同的k個(gè)子集。每次將其中一個(gè)子集作為測(cè)試集,其他子集作為訓(xùn)練集。獲取k個(gè)測(cè)試結(jié)果的平均值作為最終結(jié)果。這種驗(yàn)證方法有效避免了試驗(yàn)樣品的取樣偏差,從而獲得了更有說服力的試驗(yàn)結(jié)果。

    從表1 可以看出,使用深度學(xué)習(xí)的iDeepM 模型和RRMVL 模型效果均優(yōu)于決策樹模型,證明深度學(xué)習(xí)在提取長(zhǎng)樣本特征上的優(yōu)勢(shì)明顯。RRMVL 方法下個(gè)任意視角模型預(yù)測(cè)值均優(yōu)于iDeepM 模型,體現(xiàn)了本文方法的有效性。同時(shí),所有視角模型整合下的RRMVL 方法在AUC 數(shù)值和F1 數(shù)值上均比任意單視角模型高,體現(xiàn)了多視角數(shù)據(jù)之間的信息互補(bǔ)性,同時(shí)也說明數(shù)據(jù)的多視角化在生物信息學(xué)領(lǐng)域可以取得較好的效果。從單視角來看,多間隙二肽成分視角取得了最好的效果,這是因?yàn)槎嚅g隙二肽不僅包含序列次序信息,而且包含了序列成分和結(jié)構(gòu)信息,是信息量最豐富的視角。RNA 序列語義單視角的效果相比初始RNA 序列視角略低,這是由于通常訓(xùn)練一個(gè)好的語義模型需要百萬級(jí)的樣本數(shù)據(jù),而本文的數(shù)據(jù)集僅包含92 102 條RNA 序列,不足以訓(xùn)練出效果理想的6 聚體RNA 詞向量,因此預(yù)測(cè)性能效果不佳??傮w而言,在3 種對(duì)比算法中,本文提出的RRMVL 方法取得了3 項(xiàng)AUC 和3 項(xiàng)F1 的最佳效果,由此證明基于多視角的最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)方法在識(shí)別RNA 結(jié)合蛋白的問題上達(dá)到了預(yù)期效果。

    3.4 多標(biāo)簽特征學(xué)習(xí)和多標(biāo)簽學(xué)習(xí)有效性分析

    為檢驗(yàn)本文使用的多標(biāo)簽特征學(xué)習(xí)和最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)效果,本文在AURA 數(shù)據(jù)集上對(duì)RRMVL及其變體方法進(jìn)行了雙重對(duì)比實(shí)驗(yàn),分別為使用基于多視角投票的集成學(xué)習(xí)RRMVL 方法與使用多標(biāo)簽特征學(xué)習(xí)RRMVL 方法對(duì)比,以及未使用多標(biāo)簽學(xué)習(xí)的RRMVL 方法和使用多標(biāo)簽學(xué)習(xí)的RRMVL 方法對(duì)比。因基于多視角投票的集成學(xué)習(xí)模型不是一種分類器,所以沒有AUC 指標(biāo),其余方法的五折交叉驗(yàn)證結(jié)果如表2 所示。

    Table 1 Performance of algorithms on AURA dataset表1 各算法在AURA 數(shù)據(jù)集上的性能

    Table 2 Effect comparison of multi-label feature learning and multi-label learning表2 多標(biāo)簽特征學(xué)習(xí)、多標(biāo)簽學(xué)習(xí)效果對(duì)比

    Fig.9 Line charts of methods'performance comparison for single class dataset圖9 單個(gè)類數(shù)據(jù)集的方法性能對(duì)比折線圖

    從表2 可以看出,對(duì)于多視角數(shù)據(jù)而言,在對(duì)其使用多標(biāo)簽特征學(xué)習(xí)后,模型的預(yù)測(cè)性能始終比基于投票的集成學(xué)習(xí)突出,說明多標(biāo)簽特征學(xué)習(xí)充分利用了多視角數(shù)據(jù)的優(yōu)勢(shì)。另一方面,在處理多標(biāo)簽分類問題上,使用多標(biāo)簽分類器的方法始終優(yōu)于未使用多標(biāo)簽技術(shù)的方法,證明了標(biāo)簽之間的關(guān)聯(lián)對(duì)預(yù)測(cè)產(chǎn)生了不可忽視的作用。結(jié)合多標(biāo)簽特征學(xué)習(xí)和多標(biāo)簽學(xué)習(xí),即本文提出的最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí),其性能優(yōu)于使用集成學(xué)習(xí)的傳統(tǒng)CC 算法,證明本文對(duì)傳統(tǒng)CC 算法的改進(jìn)富有成效。值得注意的是進(jìn)行多標(biāo)簽學(xué)習(xí)后,RRMVL 的AUC 指標(biāo)有所下降,這是由于多標(biāo)簽CC 分類器的分類性能與神經(jīng)網(wǎng)絡(luò)最后一層的“Sigmoid”網(wǎng)絡(luò)分類能力略有差距。對(duì)于三項(xiàng)F1 指標(biāo),基于最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)方法RRMVL取得了最好效果,再次證明本文方法能夠較為準(zhǔn)確地判別某條未探索的RNA 與多種RBP 的結(jié)合情況。

    3.5 類樣本不均衡影響分析

    為研究類樣本數(shù)量對(duì)實(shí)驗(yàn)效果的影響,本文使用RRMVL 對(duì)68 個(gè)類數(shù)據(jù)集進(jìn)行單獨(dú)實(shí)驗(yàn),對(duì)比iDeepM 的五折交叉驗(yàn)證結(jié)果折線圖如圖9所示。圖9為準(zhǔn)確度、召回率和F1 指數(shù)的折線圖,按照類樣本數(shù)量遞增的次序進(jìn)行繪圖。

    從圖9 可以看出,兩種對(duì)比算法中,RRMVL 在大部分類的預(yù)測(cè)精度取得了最佳效果,兩個(gè)方法隨著類樣本數(shù)量的逐漸提升,各指標(biāo)都呈現(xiàn)逐漸提高并趨于平緩的趨勢(shì)。當(dāng)樣本數(shù)量低于5 000 時(shí),各項(xiàng)指標(biāo)的起伏較大,這是由于類樣本數(shù)量過少導(dǎo)致模型無法準(zhǔn)確地學(xué)習(xí)這些類樣本的深度特征。對(duì)比兩條曲線,iDeepM 方法在低樣本環(huán)境下的學(xué)習(xí)能力不如RRMVL,表現(xiàn)為動(dòng)蕩幅度更劇烈,間接體現(xiàn)多視角數(shù)據(jù)在小樣本學(xué)習(xí)下的優(yōu)勢(shì)。總體而言,本文方法在各個(gè)類數(shù)據(jù)集上達(dá)到了預(yù)期效果。

    4 結(jié)論和展望

    本文提出一種基于多視角的最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)法來對(duì)一條未探索的RNA 進(jìn)行RBP 結(jié)合性識(shí)別,通過實(shí)驗(yàn)數(shù)據(jù)可以發(fā)現(xiàn),本研究提出的多視角深度特征提取法對(duì)比傳統(tǒng)的特征提取,獲得了更好的效果。并且使用多標(biāo)簽特征學(xué)習(xí)和最優(yōu)多標(biāo)簽鏈?zhǔn)綄W(xué)習(xí)的算法進(jìn)一步提高了預(yù)測(cè)精度。可以發(fā)現(xiàn)以多間隙二肽成分視角為首的多視角數(shù)據(jù)以及多視角多標(biāo)簽的學(xué)習(xí)方法對(duì)識(shí)別RBP 具有較大的價(jià)值。

    雖然研究的效果得到了提升,但是該研究還有一些不足和值得進(jìn)一步深入研究的地方。比如RNA序列語義性視角的性能略低,沒有達(dá)到預(yù)期的效果。隨著測(cè)序工作的進(jìn)行,未來基于大數(shù)據(jù)下的語義模型能夠更好地學(xué)習(xí)到6 聚體RNA 的詞向量分布,該視角的預(yù)測(cè)精度可以得到一定的提升。此外,本文所用數(shù)據(jù)集中不同類別的樣本數(shù)量相差過大,屬于典型的類不平衡問題,對(duì)模型的學(xué)習(xí)效果和分類效果產(chǎn)生較大影響。未來如何構(gòu)造更適合類不平衡場(chǎng)景下的RBP 識(shí)別方法也將是一個(gè)重要的研究方向。

    猜你喜歡
    二肽分類器標(biāo)簽
    大型海藻中環(huán)二肽類抑藻活性化合物的分離純化
    左旋多巴與脯氨酸或谷氨酸構(gòu)成的環(huán)二肽的合成及其DPPH自由基清除活性測(cè)試
    無懼標(biāo)簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
    電化學(xué)發(fā)光分析法測(cè)定糖尿病相關(guān)二肽
    二肽的生物合成及應(yīng)用研究進(jìn)展
    加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
    結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
    標(biāo)簽化傷害了誰
    亚洲成人久久性| 免费观看精品视频网站| 校园春色视频在线观看| 欧美一级毛片孕妇| 欧美国产日韩亚洲一区| 无人区码免费观看不卡| 在线看三级毛片| 欧美3d第一页| 18禁黄网站禁片午夜丰满| 国产一区二区激情短视频| 久久久成人免费电影| 久久天堂一区二区三区四区| 久久久久亚洲av毛片大全| 老熟妇仑乱视频hdxx| 全区人妻精品视频| 欧美日韩精品网址| 又黄又爽又免费观看的视频| 一级毛片高清免费大全| 国产aⅴ精品一区二区三区波| 亚洲avbb在线观看| 午夜激情福利司机影院| 99精品久久久久人妻精品| 国产成人影院久久av| 欧美成人性av电影在线观看| 露出奶头的视频| 欧美性猛交黑人性爽| 国产黄a三级三级三级人| 97超视频在线观看视频| 1024香蕉在线观看| 91麻豆精品激情在线观看国产| 一级a爱片免费观看的视频| www日本黄色视频网| 啦啦啦免费观看视频1| 丁香欧美五月| 欧美在线黄色| 宅男免费午夜| 久久久久久久久久黄片| 久久这里只有精品中国| 最好的美女福利视频网| 亚洲乱码一区二区免费版| 人人妻,人人澡人人爽秒播| 国产av在哪里看| 久久国产乱子伦精品免费另类| 一区福利在线观看| 国产不卡一卡二| 久久99热这里只有精品18| av欧美777| 色吧在线观看| 久久欧美精品欧美久久欧美| 悠悠久久av| 精品一区二区三区视频在线观看免费| 三级国产精品欧美在线观看 | 床上黄色一级片| 亚洲国产欧美人成| 欧美日韩乱码在线| 国产伦人伦偷精品视频| 欧美zozozo另类| 久久精品91无色码中文字幕| 麻豆成人午夜福利视频| 精品无人区乱码1区二区| 久久久久国产一级毛片高清牌| 国产69精品久久久久777片 | 人人妻人人澡欧美一区二区| 少妇丰满av| 国产精品久久久久久精品电影| www.999成人在线观看| 国产一区二区在线av高清观看| 少妇裸体淫交视频免费看高清| 色播亚洲综合网| 亚洲成av人片免费观看| 亚洲成av人片免费观看| 狂野欧美激情性xxxx| 麻豆国产av国片精品| 男人和女人高潮做爰伦理| 亚洲欧美日韩高清专用| 色综合欧美亚洲国产小说| 久久人妻av系列| 午夜日韩欧美国产| 日本熟妇午夜| 无限看片的www在线观看| 特级一级黄色大片| 午夜两性在线视频| 悠悠久久av| 日韩欧美国产一区二区入口| 亚洲欧美日韩无卡精品| 婷婷六月久久综合丁香| 五月玫瑰六月丁香| av在线天堂中文字幕| 欧美黑人巨大hd| 中国美女看黄片| 亚洲成av人片免费观看| 操出白浆在线播放| 狂野欧美激情性xxxx| 午夜久久久久精精品| 9191精品国产免费久久| 大又大粗又爽又黄少妇毛片口| 欧美另类亚洲清纯唯美| 免费黄网站久久成人精品| 真实男女啪啪啪动态图| 亚洲在线观看片| 国内精品一区二区在线观看| 国产精品一区二区性色av| 自拍偷自拍亚洲精品老妇| 看非洲黑人一级黄片| 亚洲熟妇中文字幕五十中出| 欧美性猛交黑人性爽| 毛片一级片免费看久久久久| 国产真实乱freesex| 少妇熟女欧美另类| 内地一区二区视频在线| 国产精品麻豆人妻色哟哟久久 | 99热6这里只有精品| 欧美3d第一页| 亚洲在线自拍视频| 中文字幕久久专区| 久久鲁丝午夜福利片| 国产成人精品久久久久久| 精品人妻视频免费看| 我的女老师完整版在线观看| 男女边吃奶边做爰视频| 国产精品爽爽va在线观看网站| 日韩强制内射视频| 搡老妇女老女人老熟妇| 久久久久九九精品影院| 美女高潮的动态| 精品久久久噜噜| 一个人看视频在线观看www免费| 人体艺术视频欧美日本| 久久热精品热| 婷婷六月久久综合丁香| 床上黄色一级片| 18禁在线播放成人免费| 一级毛片我不卡| 国产乱来视频区| 大又大粗又爽又黄少妇毛片口| 精品酒店卫生间| 人妻夜夜爽99麻豆av| 日韩中字成人| 久久精品综合一区二区三区| 少妇猛男粗大的猛烈进出视频 | 久久久亚洲精品成人影院| 久久久成人免费电影| 一级毛片电影观看 | 亚洲不卡免费看| 夜夜爽夜夜爽视频| 国产探花极品一区二区| 国产白丝娇喘喷水9色精品| 国内少妇人妻偷人精品xxx网站| 成人国产麻豆网| 亚洲av电影在线观看一区二区三区 | 热99在线观看视频| 日本wwww免费看| 91久久精品国产一区二区三区| av国产久精品久网站免费入址| 青春草国产在线视频| 99久久人妻综合| 国产成人freesex在线| 91久久精品电影网| 最新中文字幕久久久久| 99在线人妻在线中文字幕| 美女内射精品一级片tv| 韩国av在线不卡| 日本三级黄在线观看| 成人一区二区视频在线观看| 色5月婷婷丁香| 人妻夜夜爽99麻豆av| 国产精品av视频在线免费观看| 69人妻影院| 久久久久性生活片| 国产一区有黄有色的免费视频 | 我要看日韩黄色一级片| 丰满乱子伦码专区| 深爱激情五月婷婷| 国产片特级美女逼逼视频| 成人二区视频| 啦啦啦韩国在线观看视频| 久久久久久久久久久免费av| 人人妻人人澡欧美一区二区| 日韩欧美三级三区| 99国产精品一区二区蜜桃av| 国产视频内射| 夜夜爽夜夜爽视频| 波野结衣二区三区在线| 2022亚洲国产成人精品| 亚洲精品乱久久久久久| 激情 狠狠 欧美| 亚洲欧美日韩高清专用| 又黄又爽又刺激的免费视频.| 久久久久久久久久久免费av| 亚洲成人精品中文字幕电影| 久久久久久久久久黄片| 一个人观看的视频www高清免费观看| 欧美丝袜亚洲另类| 秋霞伦理黄片| 亚洲中文字幕一区二区三区有码在线看| 久久这里只有精品中国| 校园人妻丝袜中文字幕| 久久精品国产亚洲网站| 国产精品电影一区二区三区| 精品国产一区二区三区久久久樱花 | 国产久久久一区二区三区| 日韩在线高清观看一区二区三区| 人体艺术视频欧美日本| 日韩制服骚丝袜av| 国产在视频线精品| 亚洲国产精品国产精品| 大香蕉久久网| av在线观看视频网站免费| 一级毛片电影观看 | 亚洲av成人精品一区久久| 欧美日韩综合久久久久久| 亚洲欧美成人综合另类久久久 | 中国美白少妇内射xxxbb| 永久网站在线| 久久久久久伊人网av| 欧美成人a在线观看| 久热久热在线精品观看| 一个人看视频在线观看www免费| 国产精品国产三级专区第一集| 久久精品综合一区二区三区| 日韩 亚洲 欧美在线| 久久精品熟女亚洲av麻豆精品 | 国产精品不卡视频一区二区| 亚洲av中文av极速乱| 日日撸夜夜添| 美女内射精品一级片tv| 国产精品一二三区在线看| 美女被艹到高潮喷水动态| 国产高潮美女av| 久久精品影院6| 午夜爱爱视频在线播放| 啦啦啦韩国在线观看视频| 我的老师免费观看完整版| www.色视频.com| 能在线免费看毛片的网站| 特大巨黑吊av在线直播| 麻豆成人av视频| 91av网一区二区| 亚洲欧美日韩卡通动漫| 2021少妇久久久久久久久久久| 亚洲三级黄色毛片| 久久精品人妻少妇| 午夜亚洲福利在线播放| 韩国av在线不卡| 中文资源天堂在线| 蜜臀久久99精品久久宅男| 亚洲精品国产成人久久av| 99热6这里只有精品| 欧美高清成人免费视频www| 国产av在哪里看| 国产高清有码在线观看视频| 国产精品一二三区在线看| 欧美+日韩+精品| av在线观看视频网站免费| 免费大片18禁| 麻豆av噜噜一区二区三区| kizo精华| 亚洲自拍偷在线| 日本爱情动作片www.在线观看| 国产精品蜜桃在线观看| 少妇熟女aⅴ在线视频| www日本黄色视频网| 一区二区三区四区激情视频| 蜜桃亚洲精品一区二区三区| 国产免费男女视频| 婷婷六月久久综合丁香| 观看美女的网站| 成人二区视频| 国产精品一区二区三区四区免费观看| 色噜噜av男人的天堂激情| 91精品伊人久久大香线蕉| 精品久久久久久成人av| 欧美日韩综合久久久久久| 99久久精品热视频| 亚洲高清免费不卡视频| 国产综合懂色| 国产一级毛片七仙女欲春2| 变态另类丝袜制服| 少妇人妻精品综合一区二区| 91狼人影院| 精品久久久久久久久亚洲| 丝袜美腿在线中文| 中文字幕人妻熟人妻熟丝袜美| 亚洲经典国产精华液单| 国产成人免费观看mmmm| 最近手机中文字幕大全| 天堂影院成人在线观看| 寂寞人妻少妇视频99o| 国国产精品蜜臀av免费| 成人av在线播放网站| 可以在线观看毛片的网站| 欧美精品一区二区大全| 九九热线精品视视频播放| 青春草国产在线视频| 欧美日本视频| 少妇人妻一区二区三区视频| 岛国在线免费视频观看| 18禁动态无遮挡网站| 色网站视频免费| 国产亚洲91精品色在线| 午夜激情欧美在线| 久久久久久久久久成人| 亚洲伊人久久精品综合 | 久久人妻av系列| 天天躁夜夜躁狠狠久久av| 久久久精品欧美日韩精品| 又爽又黄无遮挡网站| 夫妻性生交免费视频一级片| 爱豆传媒免费全集在线观看| 水蜜桃什么品种好| 特级一级黄色大片| 亚洲精品色激情综合| 三级国产精品片| 网址你懂的国产日韩在线| 亚洲自偷自拍三级| 午夜爱爱视频在线播放| 特级一级黄色大片| 欧美日韩在线观看h| 91在线精品国自产拍蜜月| 国产精品美女特级片免费视频播放器| 18+在线观看网站| 国产真实伦视频高清在线观看| 丝袜美腿在线中文| 老女人水多毛片| av在线观看视频网站免费| 久久精品久久精品一区二区三区| 国产精品永久免费网站| 亚洲av日韩在线播放| 日韩强制内射视频| 天堂中文最新版在线下载 | 久久韩国三级中文字幕| 午夜精品国产一区二区电影 | 日本与韩国留学比较| 国产黄片视频在线免费观看| 免费看日本二区| 你懂的网址亚洲精品在线观看 | 国产亚洲av片在线观看秒播厂 | 搞女人的毛片| 亚洲av.av天堂| 简卡轻食公司| av专区在线播放| 日本五十路高清| 久久6这里有精品| 最近最新中文字幕大全电影3| 亚洲精品自拍成人| 一区二区三区四区激情视频| 国产综合懂色| 日本五十路高清| 99久久无色码亚洲精品果冻| 国产色婷婷99| av国产免费在线观看| 国产亚洲av嫩草精品影院| 成人午夜精彩视频在线观看| 亚洲国产精品sss在线观看| 久久久久九九精品影院| 91精品一卡2卡3卡4卡| 久久精品国产自在天天线| 亚洲高清免费不卡视频| 亚洲在线观看片| 男女啪啪激烈高潮av片| 一夜夜www| 乱码一卡2卡4卡精品| 永久免费av网站大全| 久久综合国产亚洲精品| 国产大屁股一区二区在线视频| 又粗又爽又猛毛片免费看| 卡戴珊不雅视频在线播放| 日韩一区二区视频免费看| 热99在线观看视频| 麻豆乱淫一区二区| 亚洲成人av在线免费| 久久久久久大精品| 成年av动漫网址| 午夜福利网站1000一区二区三区| 视频中文字幕在线观看| 高清在线视频一区二区三区 | 国产国拍精品亚洲av在线观看| 国产亚洲一区二区精品| 伦理电影大哥的女人| 亚洲内射少妇av| 国产精品蜜桃在线观看| 国产成人精品久久久久久| 一级二级三级毛片免费看| 丝袜喷水一区| 人人妻人人澡欧美一区二区| 一级毛片我不卡| 欧美日韩国产亚洲二区| 菩萨蛮人人尽说江南好唐韦庄 | 啦啦啦韩国在线观看视频| 午夜福利在线在线| 亚洲综合精品二区| 在线播放无遮挡| 99久久精品热视频| 桃色一区二区三区在线观看| 亚洲成色77777| 麻豆国产97在线/欧美| 国产精品蜜桃在线观看| 日本免费在线观看一区| 成人漫画全彩无遮挡| 级片在线观看| 中文字幕av成人在线电影| 搡老妇女老女人老熟妇| 久久精品国产亚洲av天美| 在线a可以看的网站| 狂野欧美激情性xxxx在线观看| 久久久久久久久久久丰满| 日韩av在线免费看完整版不卡| 一区二区三区免费毛片| 国产精品电影一区二区三区| 久久国产乱子免费精品| 国产在视频线精品| 国产探花极品一区二区| 日韩三级伦理在线观看| 干丝袜人妻中文字幕| 精品一区二区三区人妻视频| 国产黄片视频在线免费观看| 真实男女啪啪啪动态图| 日本五十路高清| 春色校园在线视频观看| 赤兔流量卡办理| 我的女老师完整版在线观看| 色视频www国产| 日本黄大片高清| 免费搜索国产男女视频| 久久这里有精品视频免费| 国内揄拍国产精品人妻在线| 最近2019中文字幕mv第一页| 一级黄色大片毛片| 校园人妻丝袜中文字幕| 可以在线观看毛片的网站| 久久婷婷人人爽人人干人人爱| 一级黄片播放器| av福利片在线观看| 亚洲精品国产成人久久av| 亚洲精品乱码久久久v下载方式| 神马国产精品三级电影在线观看| 18禁在线播放成人免费| 国产色婷婷99| 亚洲欧洲国产日韩| 狂野欧美白嫩少妇大欣赏| 国产高清不卡午夜福利| 国产精品精品国产色婷婷| 日本一本二区三区精品| 久久精品国产自在天天线| 欧美xxxx性猛交bbbb| 夫妻性生交免费视频一级片| 一级二级三级毛片免费看| 欧美一级a爱片免费观看看| 久久久久精品久久久久真实原创| 欧美xxxx性猛交bbbb| 国产熟女欧美一区二区| 日日干狠狠操夜夜爽| 成人午夜精彩视频在线观看| 亚洲怡红院男人天堂| 免费看av在线观看网站| 国产精品一区二区性色av| 美女内射精品一级片tv| 亚洲国产日韩欧美精品在线观看| 亚洲av免费在线观看| 午夜精品国产一区二区电影 | 69av精品久久久久久| 午夜免费男女啪啪视频观看| 亚洲伊人久久精品综合 | 国产探花极品一区二区| 精品久久久久久久久av| 亚洲人成网站在线播| 久久99蜜桃精品久久| 毛片女人毛片| 精品不卡国产一区二区三区| 国产高清有码在线观看视频| 久久久久久久久中文| 天堂√8在线中文| av黄色大香蕉| 久久精品国产自在天天线| 韩国av在线不卡| 国产精品三级大全| 综合色丁香网| kizo精华| 欧美性猛交黑人性爽| 日韩视频在线欧美| 丰满人妻一区二区三区视频av| 蜜桃久久精品国产亚洲av| 久久国产乱子免费精品| 国产中年淑女户外野战色| 大话2 男鬼变身卡| 最近手机中文字幕大全| 三级男女做爰猛烈吃奶摸视频| 日日摸夜夜添夜夜爱| 国内精品一区二区在线观看| 免费看美女性在线毛片视频| 午夜视频国产福利| 国产亚洲午夜精品一区二区久久 | 乱人视频在线观看| 麻豆一二三区av精品| 高清av免费在线| 亚洲在线观看片| 男女下面进入的视频免费午夜| 国产一级毛片在线| 日本色播在线视频| 免费看日本二区| 哪个播放器可以免费观看大片| 又爽又黄无遮挡网站| 亚洲成人精品中文字幕电影| 日本黄色片子视频| 欧美又色又爽又黄视频| 99热6这里只有精品| 国产精品无大码| 欧美3d第一页| 久久国产乱子免费精品| 免费看av在线观看网站| 亚洲成人精品中文字幕电影| 麻豆av噜噜一区二区三区| 久久久午夜欧美精品| 国产中年淑女户外野战色| 日韩av在线免费看完整版不卡| 熟女人妻精品中文字幕| 国产女主播在线喷水免费视频网站 | 国产精品,欧美在线| 尤物成人国产欧美一区二区三区| 久久久久久伊人网av| 国产综合懂色| 在线免费观看的www视频| 国产大屁股一区二区在线视频| 亚洲av.av天堂| 精品久久久久久久久久久久久| 99热网站在线观看| 国产色爽女视频免费观看| 日韩大片免费观看网站 | 免费观看在线日韩| 老司机影院成人| 国产成人精品久久久久久| 国产淫片久久久久久久久| 男的添女的下面高潮视频| 久久久久网色| ponron亚洲| 国产中年淑女户外野战色| 亚洲真实伦在线观看| 女人被狂操c到高潮| 色噜噜av男人的天堂激情| 欧美高清性xxxxhd video| 草草在线视频免费看| 天堂影院成人在线观看| 97超视频在线观看视频| 国产日韩欧美在线精品| 亚洲av福利一区| 国产伦精品一区二区三区四那| 国产精品三级大全| 午夜免费男女啪啪视频观看| 国产高清国产精品国产三级 | 天天躁夜夜躁狠狠久久av| 在线免费观看不下载黄p国产| 日日啪夜夜撸| 蜜桃亚洲精品一区二区三区| 五月伊人婷婷丁香| 蜜桃亚洲精品一区二区三区| 国产精品av视频在线免费观看| 在线播放国产精品三级| 美女国产视频在线观看| 中文在线观看免费www的网站| av免费在线看不卡| 啦啦啦观看免费观看视频高清| 国产av不卡久久| 日韩一区二区视频免费看| or卡值多少钱| 伊人久久精品亚洲午夜| 国产精品久久久久久av不卡| 中文亚洲av片在线观看爽| 精品欧美国产一区二区三| 又粗又爽又猛毛片免费看| 日韩一区二区三区影片| 少妇人妻一区二区三区视频| 内地一区二区视频在线| 亚洲av男天堂| 啦啦啦观看免费观看视频高清| 国产亚洲午夜精品一区二区久久 | 亚洲五月天丁香| 美女脱内裤让男人舔精品视频| 国产精品嫩草影院av在线观看| ponron亚洲| 久久精品国产99精品国产亚洲性色| 哪个播放器可以免费观看大片| 亚洲久久久久久中文字幕| av免费在线看不卡| 联通29元200g的流量卡| 狂野欧美激情性xxxx在线观看| 天天一区二区日本电影三级| 深爱激情五月婷婷| 亚洲人成网站在线观看播放| 爱豆传媒免费全集在线观看| 女的被弄到高潮叫床怎么办| 亚洲电影在线观看av| 国产私拍福利视频在线观看| 欧美xxxx黑人xx丫x性爽| 赤兔流量卡办理| 亚洲精品成人久久久久久| 国模一区二区三区四区视频| 一级av片app| 久久鲁丝午夜福利片| 国产三级中文精品| 岛国在线免费视频观看| 亚洲色图av天堂| 嫩草影院入口| 全区人妻精品视频| 亚洲成人久久爱视频| 村上凉子中文字幕在线| 亚洲美女搞黄在线观看| 免费电影在线观看免费观看| 国产精品电影一区二区三区| 激情 狠狠 欧美| 少妇高潮的动态图| 春色校园在线视频观看| 久久精品人妻少妇| 欧美成人免费av一区二区三区| 国产精品久久久久久精品电影| 一级毛片aaaaaa免费看小|