• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于圖卷積神經(jīng)網(wǎng)絡的串聯(lián)質譜從頭測序

    2021-09-18 06:22:48牟長寧王海鵬周丕宇侯鑫行
    計算機應用 2021年9期
    關鍵詞:譜峰質譜氨基酸

    牟長寧,王海鵬,周丕宇,侯鑫行

    (山東理工大學計算機科學與技術學院,山東淄博 255000)

    (*通信作者電子郵箱hpwang@sdut.edu.cn)

    0 引言

    基于串聯(lián)質譜的蛋白質組學是生命科學研究的重要組成部分,近年來在探索細胞機制、疾病進程以及基因型和表型之間關系等研究上取得了巨大進展[1]?;诖?lián)質譜的蛋白質測序主流的方法是蛋白質數(shù)據(jù)庫搜索,常用工具有Mascot[2]、Comet[3]、MaxQuant[4]、pFind[5-6]等。該方法需要參考已有數(shù)據(jù)庫檢索候選肽序列,因此在未知生物蛋白、單克隆抗體測序等研究上失去優(yōu)勢。另一種鑒定方法是從頭測序,該方法能夠直接從串聯(lián)質譜中推斷出氨基酸序列,無需數(shù)據(jù)庫作為參考,在鑒定未知生物肽序列上具有不可替代的作用。過去20 年間從頭測序方法進步顯著,應用較為廣泛的方案是基于圖論的思想,將質譜轉化為譜峰關系圖(spectrum graph),譜峰作為譜圖中的頂點,如果譜峰與譜峰之間的距離等于一個或者兩個氨基酸殘基的分子量,則兩個峰之間用一條邊相連;通過搜索圖中起始點到結束點的最優(yōu)路徑得到產(chǎn)生這個質譜的候選肽序列。代表性工作包括:2003 年Ma 等[7]發(fā)表的PEAKS,通過預處理步驟(圖譜噪聲過濾和圖譜峰聚合)創(chuàng)建譜圖并用動態(tài)規(guī)劃算法來生成候選肽序列;2005年Frank等[8]發(fā)表了針對碰撞誘導裂解(Collision-Induced Dissociation,CID)質譜的PepNovo 算法,提出了一種基于概率網(wǎng)絡模型的候選肽序列評分方法;2010 年Chi 等[9]發(fā)表的pNovo,使用帶剪枝的深度優(yōu)先搜索有效提升了在高能碰撞裂解(Higher-energy Collision Dissociation,HCD)質譜數(shù)據(jù)上的從頭測序性能;隨后同一團隊,在pNovo 基礎上開發(fā)了同時使用HCD 和電子轉運裂解(Electron Transfer Dissociation,ETD)數(shù)據(jù)的從頭測序方法pNovo+[10],以及針對翻譯后修飾肽鑒定的OpenpNovo[11],并在2019年發(fā)表了pNovo3[12],將理論質譜預測用于候選肽重排序。另一類從頭測序方法則是基于機器學習和深度學習技術。2005年,NovoHMM算法[13]提出使用隱馬爾可夫模型解決從頭測序問題;2015 年,Novor[14]使用決策樹模型分別為碎片離子和氨基酸殘基進行打分,結合動態(tài)規(guī)劃推導肽序列;基于深度學習的DeepNovo[15],通過基于卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)的Ion-CNN 和Spectrum-CNN,以及長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡模型融合的方式對肽序列進行預測。隨著從頭測序方法的改進,測序精度不斷得到提升,然而由于質譜儀中肽不完全碎裂等因素,導致質譜中碎片離子的覆蓋率較低,重要b離子或y離子峰丟失,大量噪聲干擾峰難以通過約束條件徹底清除,諸多因素致使從頭測序的精度仍然較低,嚴重制約了從頭測序在蛋白質組數(shù)據(jù)分析中的應用。因此提升肽段從頭測序準確性,對蛋白質組學研究具有重要意義。

    在蛋白質組學中,深度學習方法已經(jīng)應用到了預測肽段保留時間、理論質譜預測、翻譯后修飾、從頭測序、蛋白質結構預測等多個任務中[16-17]。深度學習的蓬勃發(fā)展,為質譜數(shù)據(jù)分析不斷提供新的方案啟示。本文在經(jīng)典的譜峰關系圖方法基礎上,提出了一種基于圖卷積神經(jīng)網(wǎng)絡(Graph Convolutional neural Network,GCN)的從頭測序方法denovo-GCN。該方法直接使用質譜數(shù)據(jù)作為輸入,簡化中間數(shù)據(jù)約束處理過程,在譜峰關系圖結構上按照碎裂位點為每個譜峰構造特征表示。通過在大規(guī)模數(shù)據(jù)上的訓練優(yōu)化,能夠有效提升從頭測序的準確性。

    1 denovo-GCN模型

    1.1 圖卷積神經(jīng)網(wǎng)絡與從頭測序

    圖卷積神經(jīng)網(wǎng)絡以其在圖數(shù)據(jù)上的強大建模能力,在知識圖譜、社交網(wǎng)絡等眾多領域得到了應用[18]。Kipf 等[19]對ChebNet[20]進行了簡化,提出了一種更加簡單的模型GCN,它相當于對一階切比雪夫卷積的再近似,降低了計算復雜度,并且可以通過堆疊多個GCN 擴大圖卷積神經(jīng)網(wǎng)絡的感受野,實用性大大增強。GCN模型結構表述為式(1):

    其中:=A+I,A是圖的鄰接矩陣,包含了節(jié)點之間的連接信息;I是單位矩陣,加上I后得到的包含了自身節(jié)點和鄰接點的信息是頂點的度矩陣是激活函數(shù);H(l) ∈Rn×m是第l層的激活矩陣;H(0)=X,X是由各節(jié)點特征向量xi組成的特征矩陣。隨后注意機制、序列模型等也用于圖中節(jié)點權重的計算,圖卷積神經(jīng)網(wǎng)絡呈現(xiàn)出多樣化的發(fā)展。

    從頭測序過程可以類比為語言翻譯或者圖像描述,最終目的是得到一個映射原始數(shù)據(jù)的序列表示。不同之處在于后者的原始數(shù)據(jù)是規(guī)則歐氏空間數(shù)據(jù),而質譜數(shù)據(jù)是一組譜峰質荷比及其強度的數(shù)據(jù)對組成的集合。在基于圖論的從頭測序中,譜峰關系是由譜峰之間的距離來計算,形成譜峰連接圖。這種質譜數(shù)據(jù)圖結構化的表示方法與針對圖結構數(shù)據(jù)的圖卷積神經(jīng)網(wǎng)絡十分契合。譜峰節(jié)點的特征則可以通過枚舉碎裂位點產(chǎn)生的離子與各譜峰的距離關系表示,借助圖卷積神經(jīng)網(wǎng)絡的訓練學習能力將符合條件的譜峰點與干擾峰進行區(qū)分,預測當前位置的氨基酸身份,逐步實現(xiàn)氨基酸序列的推理。

    1.2 圖的構建

    在質譜數(shù)據(jù)上,使用圖卷積神經(jīng)網(wǎng)絡的首要任務是構建譜峰連接圖。質譜數(shù)據(jù)中的關鍵信息包括母離子的質荷比、肽所帶電荷、譜峰。譜峰是碎片離子質荷比及其強度組成的數(shù)據(jù)對,將譜峰強度值按照同一質譜中最大強度值歸一化得到相對強度,相對強度最大值為1。單個質譜可以直觀表示為質荷比和相對強度的柱狀圖,x軸代表質荷比,y軸代表強度。若譜峰與譜峰之間的距離與一個氨基酸殘基的分子量的差值在設定誤差范圍內(nèi),則兩個譜峰之間建立一條邊。在構建譜圖前,需向原始譜圖添加序列端點的譜峰,分別為一個電荷(M(proton))、一個水分子量(M(H2O))、1 電荷肽的分子量(M(peptide))、肽失去一個水的分子量(M(peptide)-M(H2O))四個譜峰點,相對強度皆設置為1。設S=為譜(npeaks為譜峰數(shù)量),SA為峰與峰之間的差值矩陣,MASS_AA=(n=23,代表20 氨基酸殘基和3 種修飾后的氨基酸殘基)為氨基酸殘基質量集合,計算鄰接矩陣的過程用式(2)~(5)表示:

    由式(2)計算譜峰差值矩陣絕對值與每個氨基酸殘基的誤差矩陣,如果誤差在給定ε內(nèi)則將相應元素標記為1,若超出范圍則標記為0,然后將所有矩陣相加得到當前譜的鄰接矩陣;加入相同維度的單位矩陣作為節(jié)點自身的信息,避免構圖時譜峰為孤立峰,即譜中沒有相鄰位點產(chǎn)生的同類型離子譜峰,導致不存在邊與之相連造成信息丟失;再計算度矩陣并對鄰接矩陣進行歸一化。

    將質譜數(shù)據(jù)處理成圖結構化數(shù)據(jù)是denovo-GCN 與DeepNovo處理質譜數(shù)據(jù)的不同之處,在DeepNovo中將串聯(lián)質譜數(shù)據(jù)對應成規(guī)則的歐氏數(shù)據(jù),質荷比維度的數(shù)據(jù)按照質量精度0.01 Da(Dalton)進行擴展:假設譜中的最大質荷比為1 500.00 Da,整個譜離散化為150 000 個刻度,再將每個譜峰相對強度填入離散化后的刻度位置,卷積提取特征。而在denovo-GCN 中,譜峰之間的關系直接計算確定,不需要通過深度學習模型來學習這種關鍵信息。

    1.3 譜峰特征構建

    denovo-GCN 的另一個關鍵在于為質譜中的每一個譜峰建立特征。由于串聯(lián)質譜數(shù)據(jù)的特殊性,很難在只使用一組離子質荷比和譜峰強度數(shù)據(jù)條件下推斷出序列信息,因此必須利用肽碎裂產(chǎn)生的離子類型設計特征。肽段在HCD 模式下常見的碎片離子類型有b、y、b2+、y2+、b-H2O、y-H2O、b-NH3、y-NH3、a、a2+、a-H2O、a-NH3等[21],在計算得到b離子或者y離子質荷比后便可根據(jù)母離子質荷比計算同一斷裂位點的其他離子質荷比。在模型中,設定了26種符號標記分別代表20種氨基酸殘基、3 種修飾后的氨基酸殘基、3 種特殊的標記(start、end、pad)。特征可以看作是當前碎裂位點產(chǎn)生的離子與譜峰的距離差值,構建過程如式(6)~(8):

    設ntoken為設定標記的個數(shù),nions為使用的離子類型的種類,計算得到的理論質荷比矩陣為Mt大小為(1,ntoken×nions),將其按第一維度復制得到Mt'(npeaks,ntoken×nions()npeaks為譜峰數(shù)量);將當前譜峰矩陣Mo(npeaks,1),按第二維度復制得到Mo'大小同樣為(npeaks,ntoken×nions),由式(6)計算譜峰與理論離子的誤差矩陣E,然后通過指數(shù)運算將誤差值縮放到區(qū)間(0,1)內(nèi),⊕代表將譜峰的相對強度Intensity(npeaks,1)拼接到E,形成了最終的特征矩陣F。

    1.4 denovo-GCN的模型構建

    denovo-GCN 的模型如圖1 所示:由質譜數(shù)據(jù)分別計算譜圖鄰接矩陣和初始特征矩陣。使用GCN 對質譜數(shù)據(jù)進行特征提取,按照譜峰的維度加和并使用Leaky ReLU 激活函數(shù)進行激活,再使用全連接層輸出,得到氨基酸類型的概率,輸出當前條件下的氨基酸身份。

    圖1 denovo-GCN模型Fig.1 denovo-GCN model

    新預測的氨基酸加入到序列后,計算下一個位點的特征矩陣,直至出現(xiàn)結束標記或者達到設定的序列最大長度。模型各層的參數(shù)大小設置如表1 所示,其中ntoken為設定標記的數(shù)目,nions為使用的離子類型的數(shù)目。訓練時標注肽序列中的每一個氨基酸作為標記,依次進行批訓練,初始學習率為0.001,根據(jù)模型訓練評價自適應調(diào)整學習率,最低學習率設置為10-5。由于肽序列中氨基酸出現(xiàn)的頻率差別很大,特別是帶有修飾的氨基酸殘基占比更少,因此在訓練時使用了Focal Loss 函數(shù)計算損失,該函數(shù)最初用于解決目標檢測中類別不平衡問題[22]。

    表1 denovo-GCN模型中各層的參數(shù)Tab.1 Parameters of each layer in denovo-GCN

    1.5 評價指標

    通常從肽水平和氨基酸水平上評價從頭測序結果[12-15]。肽水平召回率和精確率分別為完全預測正確的肽序列占測試數(shù)據(jù)中所有肽序列的比例和接受的測序結果中肽序列總數(shù)的比例,氨基酸水平召回率和精確率分別為預測正確的氨基酸總數(shù)分別占測試數(shù)據(jù)中氨基酸總數(shù)的比例和接受的測序結果中氨基酸總數(shù)的比例。在氨基酸水平上,從N 端或C 端開始對應位置預測的氨基酸與標注一致則為正確,對于分子量相同的亮氨酸(Leucine,L)和異亮氨酸(Isoleucine,I),在同一位置時認為預測正確。

    2 實驗與結果分析

    2.1 數(shù)據(jù)集和模型結構優(yōu)化

    本文在ProteomeTools1(ID:PXD004732)數(shù)據(jù)集[23]上進行了模型的訓練和測試,確定了模型的結構、離子類型組合和采用的譜峰數(shù)量。該數(shù)據(jù)集來自人工合成蛋白質數(shù)據(jù)集,從proteomeXchange 蛋白質數(shù)據(jù)庫中獲得,根據(jù)MaxQuant搜索結果以得分score≥100、PIF≥0.7(Precursor Intensity Fraction)過濾選取高質量的肽譜匹配數(shù)據(jù),最終得到204 996 條標注數(shù)據(jù),并在實驗時以8∶1∶1 的比例隨機劃分訓練集、測試集、驗證集,集合劃分時相互不存在交集。實驗中構建譜峰關系圖時使用的質量誤差ε為0.02 Da。

    不同層數(shù)的GCN 模型效果根據(jù)具體應用會有所差異。本節(jié)實驗設置最大譜峰數(shù)量為500,離子類型為12種,GCN的hidden size為256,實驗結果如表2 所示:實驗中采用2 層GCN的模型比使用1 層和3 層的模型在肽水平的召回率分別高出2.5個百分點和1.2個百分點,比直接使用全連接網(wǎng)絡高出了2.9個百分點,4層的模型與3層的模型效果基本一致;各組模型氨基酸的召回率在91.19%至92.19%。在氨基酸水平召回率相近的條件下,GCN模型明顯提高了肽水平的召回率,并在使用2 層GCN 結構時獲得最高召回率。因此,后續(xù)實驗皆采用2層的GCN結構。

    表2 不同GCN層數(shù)模型的召回率對比 單位:%Tab.2 Comparison of recall by different GCN layers’models unit:%

    2.2 碎片離子類型的選擇

    肽段在高能碰撞裂解(HCD)碎裂模式下,主要產(chǎn)生b/y離子及帶二電荷的常規(guī)離子,也會產(chǎn)生常規(guī)離子失去水分子和失去氨分子的中性丟失離子,以及a型離子。為了測試不同離子類型組合對模型的影響,以b/y離子組合為基礎,測試了加入不同離子類型后的表現(xiàn),該部分實驗譜峰數(shù)量設置為500,實驗結果如表3所示。在加入2電荷的b/y離子后肽召回率比只使用1電荷b/y離子時提升了16.0個百分點,氨基酸水平提升了7.3 個百分點。b、y、b2+、y2+在測序中起著關鍵作用,這與HCD 譜中關鍵離子為b/y離子的特性是一致的。當模型中繼續(xù)加入b/y離子的中性丟失離子(b-H2O、y-H2O、b-NH3、y-NH3)時,肽的召回率比使用4種常規(guī)離子增加了3.7個百分點,氨基酸水平增加了1.3 個百分點;在加入a型離子及其中性丟失離子(a、a2+、a-H2O、a-NH3)后模型肽水平召回率再次提升了2.1 個百分點。當離子從4 種增加到12 種時,氨基酸水平的召回率只提升了1.9個百分點,但肽的召回率提升了5.7個百分點。這說明,額外增加的8 種離子提供了更多測序信息。當譜中沒有出現(xiàn)某一碎裂位點的常規(guī)離子,但存在對應中性丟失的離子峰時,同樣可以為該處氨基酸身份的鑒定提供依據(jù)。因此豐富的離子類型組合可以提升測序的準確度。

    表3 不同離子類型組合的召回率對比 單位:%Tab.3 Comparison of recall by different combinations of ion types unit:%

    2.3 譜峰數(shù)量的影響

    除離子類型組合會影響模型,每個譜采用的譜峰數(shù)量也會對模型產(chǎn)生影響。質譜中存在大量低豐度的離子峰和噪聲峰,基于圖論等其他從頭測序方法中會先對實驗譜消除一部分同位素峰和相對強度過低的峰。在denovo-GCN 中采用簡便的方式,保留相對強度在給定排名內(nèi)的譜峰。為了驗證譜峰數(shù)量的影響,實驗以每個譜選取64 個峰為起始,每次實驗遞增64 個峰,最大峰數(shù)為640,實驗結果如圖2 所示。首先統(tǒng)計測序時使用的譜峰數(shù)量(used peaks)占全部數(shù)據(jù)的譜峰數(shù)量(total peaks)的變化曲線。當選取256 個譜峰進行實驗時,實驗中用到的譜峰數(shù)量占總數(shù)據(jù)的70.62%,此時譜中的關鍵峰基本納入到了考慮范圍內(nèi);選取譜峰數(shù)量為384 時占比達到89.63%;選取譜峰數(shù)量為512 時占比達到97.39%,接近全部數(shù)據(jù)。在譜峰數(shù)超過256 個時,肽召回率均值為77.84%,模型的準確率趨于穩(wěn)定。當使用384 個譜峰時,基本將大部分譜峰納入到測序中,且使用384 個譜峰時訓練時間比使用512 個譜峰時減少了1/3,若考慮使用全部譜峰時可選擇512個譜峰。

    圖2 肽水平的召回率隨譜峰數(shù)量的變化曲線Fig.2 Curve of peptide-level recall varying with number of spectral peaks

    2.4 不同測序方法在ProteomeTools1數(shù)據(jù)上的對比

    在確定了模型結構、離子類型組合、譜峰數(shù)量后在ProteomeTools1 數(shù)據(jù)集上對denovo-GCN(12 種離子類型,384個譜峰)、DeepNovo(version 0.0.1)、pNovo(version 3.1.3)、Novor(DeNovoGUI version 1.9.6)進行了測試。上述工具給出了預測肽序列的得分,將最終結果按照得分從小到大排序,給定分數(shù)t,計算肽水平的精確率(得分至少為t的實際正確肽數(shù)量/得分至少為t的肽數(shù)量)和召回率(得分至少為t的實際正確肽數(shù)量/數(shù)據(jù)中總的肽數(shù)量),畫出肽水平上的精確率-召回率(Precision-Recall,PR)曲線如圖3所示。

    從圖3 可看出,denovo-GCN 的曲線明顯高于DeepNovo、Novor 的曲線,召回率在區(qū)間[0,0.5]內(nèi)與pNovo 的曲線有重合的部分,召回率超過0.5時明顯高于pNovo。再分別計算各PR曲線下的面積,denovo-GCN 為0.731 8,DeepNovo 為0.613 8,pNovo為0.619 2,Novor為0.518 1。denovo-GCN 在同一數(shù)據(jù)上的測序性能要優(yōu)于其他三種工具。

    2.5 不同物種數(shù)據(jù)的交叉對比

    在實際應用中,從頭測序更多的是解決未知物種蛋白的測序。因此,為了進一步驗證denovo-GCN 的測序表現(xiàn),本節(jié)采用了DeepNovo 中的9 個HCD 數(shù)據(jù)集,進行物種間的交叉對比實驗,數(shù)據(jù)信息如表4所示。

    表4 9個HCD數(shù)據(jù)集信息Tab.4 Information of 9 HCD datasets

    每次使用其中的8 個數(shù)據(jù)集混合劃分訓練集、驗證集進行模型訓練,集合之間不存在肽序列交集,未參與模型訓練的1 個物種數(shù)據(jù)作為測試集。用相同的數(shù)據(jù)分別訓練DeepNovo和denovo-GCN(12 種離子類型,384 個譜峰),Novor 和pNovo直接使用其提供的軟件進行測序,測試結果如圖4所示。

    圖4 denovo-GCN、Novor、pNovo、DeepNovo在9個HCD數(shù)據(jù)集上的實驗結果對比Fig.4 Experimental result comparison of denovo-GCN,Novor,pNovo,DeepNovo on 9 HCD datasets

    圖4(a)是不同工具間氨基酸水平的召回率對比,denovo-GCN 比Novor 高出6.2~32.7 個百分點,比pNovo 高出7.6~14.9 個百分點,比DeepNovo 高出4.3~9.9 個百分點。圖4(b)在不同工具上氨基酸水平的精確率對比,denovo-GCN 比Novor 高出3.8~31.1 個百分點,比DeepNovo 高出4.1~10.0 個百 分 點,而pNovo 在H.sapiens 數(shù) 據(jù)、M.musculus 數(shù) 據(jù)、Candidatus 數(shù)據(jù)上比denovo-GCN 的精確率高出6.1 個百分點、3.7 個百分點、2.4 個百分點,其余數(shù)據(jù)上denovo-GCN 比pNovo 高出2.2~4.9 個百分點。圖4(c)在肽水平上不同工具的召回率對比,denovo-GCN 的肽的召回率比Novor 的高出9.8~21.1 個百分點,比pNovo 高出4.0~13.0 個百分點,比DeepNovo 高出2.1~10.7 個百分點。綜上實驗結果denovo-GCN相較于Novor、pNovo、DeepNovo,能夠測得更多的氨基酸,并且能夠轉化成更多正確的肽序列,測序能力超過了其他三種工具。相較于DeepNovo的模型結構,denovo-GCN模型更為精簡,使用圖來表達譜峰之間關系并結合圖卷積神經(jīng)網(wǎng)絡的方式比CNN和LSTM模型在串聯(lián)質譜測序上更具優(yōu)勢。

    對于表4的9個物種的測試數(shù)據(jù)在以ProteomeTools1數(shù)據(jù)訓練的denovo-GCN、DeepNovo 模型上分別進行測試,并使用ProteomeToolsV2(ID:PXD010595)[24]人工合成肽的數(shù)據(jù)作為相似物種進行對比參照,得到的結果如表5 所示。在相似物種上兩個模型表現(xiàn)都要好于非同類物種的表現(xiàn),而非同類物種上由于蛋白質差異,測序效果存在一定差距。這兩部分實驗結果表明denovo-GCN 的測序能力優(yōu)于DeepNovo、pNovo、Novor。

    表5 ProteomeTools1數(shù)據(jù)集訓練的模型在9個HCD數(shù)據(jù)集上的實驗結果 單位:%Tab.5 Experimental result on 9 HCD datasets by the models trained on ProteomeTools1 dataset unit:%

    2.6 denovo-GCN與pNovo預測結果及序列分析

    pNovo 是基于圖論的從頭測序的代表,在幾個測試數(shù)據(jù)上氨基酸召回率雖然低于DeepNovo,但肽的召回率卻與之接近。為了查看預測序列中出現(xiàn)的錯誤肽序列,在ProteomeTools1 測試數(shù)據(jù)上pNovo、denovo-GCN 測序結果和數(shù)據(jù)庫搜索結果之間的關系如圖5 所示:兩者有12 661 條數(shù)據(jù)測序結果相同,同時互有無法給出對方正確測序結果的數(shù)據(jù),但denovo-GCN較pNovo多鑒定出了1 451條。

    圖5 pNovo、denovo-GCN、數(shù)據(jù)庫搜索結果的文氏圖Fig.5 Venn diagram of pNovo,denovo-GCN,database search results

    對兩者測序均為錯誤的結果進行分析,總結了測序時出現(xiàn)頻率較高的3 種錯誤類型,示例如表6 所示:1)當串聯(lián)質譜中的低質量區(qū)域,存在較多的亞胺離子和內(nèi)部離子,而關鍵性的低質量常規(guī)離子峰與之不易區(qū)分甚至缺失,在構圖時會出現(xiàn)多條互相連接的邊,氨基酸位置難以確定;2)氨基酸殘基存在單個氨基酸分子量等于兩個小質量氨基酸之和或者兩種不同氨基酸分子量之和兩兩相等的情況,譜中兩端缺失了關鍵的b/y離子;3)在長序列譜或低質量譜中,離子峰更為復雜,譜峰可以對應多種氨基酸序列的組合,在測序時較難得出正確氨基酸組合。這也能夠解釋denovo-GCN 在不同物種數(shù)據(jù)實驗中氨基酸的召回率能夠達到60%以上,而肽序列的正確率卻在25%~48%。解決上述問題最直接的方法是提升質譜儀輸出數(shù)據(jù)的質量,而當前質譜數(shù)據(jù)條件下,解決上述問題的思路主要有兩個:1)算法模型輸出多個候選肽序列并進行再次打分,找出更優(yōu)的序列;2)不斷探索創(chuàng)新測序算法,從而提高肽序列的正確率。

    表6 pNovo與denovo-GCN結果中典型的序列錯誤示例Tab.6 Examples of typical sequence errors in pNovo and denovo-GCN results

    3 結語

    denovo-GCN 將質譜數(shù)據(jù)轉化為圖結構數(shù)據(jù),根據(jù)肽碎裂產(chǎn)生的離子類型對每個譜峰點進行特征設計,將圖卷積神經(jīng)網(wǎng)絡引入到從頭測序任務中,提升了串聯(lián)質譜測序的準確率,超過了基于圖論的從頭測序方法Novor、pNovo,以及基于CNN和LSTM 模型的DeepNovo。實驗結果表明充分利用肽碎片離子類型,選擇適當譜峰數(shù)量作為參數(shù)可以取得較為理想的效果。雖然denovo-GCN 實驗中同數(shù)據(jù)集上可以達到數(shù)據(jù)庫搜索結果70%的肽召回率,并且在不同物種測序上也好于其他工具,但不同物種數(shù)據(jù)的測試結果并未超過數(shù)據(jù)庫結果的50%。denovo-GCN 的測序效果會受到訓練數(shù)據(jù)的影響,可以通過擴大訓練數(shù)據(jù)種類來消除部分影響。提升從頭測序的準確性,仍是一項值得持續(xù)研究的課題,而另一方面,如何測定序列中修飾后的氨基酸類型也需要進一步研究。

    猜你喜歡
    譜峰質譜氨基酸
    連續(xù)波體制引信多譜峰特性目標檢測方法
    氣相色譜質譜聯(lián)用儀在農(nóng)殘檢測中的應用及維護
    X射線光電子能譜復雜譜圖的非線性最小二乘法分析案例
    基于無基底扣除的數(shù)據(jù)趨勢累積譜峰檢測算法
    色譜(2021年6期)2021-05-06 02:18:56
    巖性密度測井儀工作原理與典型故障分析
    科技資訊(2020年12期)2020-06-03 04:44:20
    月桂酰丙氨基酸鈉的抑菌性能研究
    UFLC-QTRAP-MS/MS法同時測定絞股藍中11種氨基酸
    中成藥(2018年1期)2018-02-02 07:20:05
    吹掃捕集-氣相色譜質譜聯(lián)用測定水中18種揮發(fā)性有機物
    一株Nsp2蛋白自然缺失123個氨基酸的PRRSV分離和鑒定
    棗霜化學成分的色譜質譜分析
    操出白浆在线播放| 久久久久久久久久黄片| 男女视频在线观看网站免费| 国内精品久久久久久久电影| 亚洲午夜理论影院| 好男人电影高清在线观看| 亚洲精品色激情综合| 欧美xxxx黑人xx丫x性爽| 首页视频小说图片口味搜索| 中文资源天堂在线| 午夜免费成人在线视频| 国产精品女同一区二区软件 | 亚洲精品美女久久久久99蜜臀| 免费搜索国产男女视频| 亚洲第一电影网av| 国产精品久久久久久久电影 | 国产成人av激情在线播放| 三级男女做爰猛烈吃奶摸视频| 精品久久久久久,| 一个人免费在线观看的高清视频| 国产中年淑女户外野战色| 免费在线观看日本一区| 亚洲专区中文字幕在线| or卡值多少钱| 18禁黄网站禁片午夜丰满| 天堂网av新在线| 全区人妻精品视频| 老汉色av国产亚洲站长工具| 国产美女午夜福利| 欧美乱码精品一区二区三区| 亚洲国产精品999在线| 中文字幕熟女人妻在线| 国产亚洲欧美98| 91在线观看av| 无遮挡黄片免费观看| 舔av片在线| 国产精品美女特级片免费视频播放器| 亚洲国产欧美网| 国内少妇人妻偷人精品xxx网站| 日本精品一区二区三区蜜桃| 99精品久久久久人妻精品| 亚洲人成网站高清观看| ponron亚洲| 国产av不卡久久| 日韩亚洲欧美综合| 中文字幕av在线有码专区| 国产高潮美女av| 亚洲熟妇中文字幕五十中出| 女警被强在线播放| 国产精品亚洲美女久久久| 久久久久亚洲av毛片大全| 九九热线精品视视频播放| 色精品久久人妻99蜜桃| 日本 欧美在线| 午夜影院日韩av| 99久久精品热视频| 淫秽高清视频在线观看| 久久天躁狠狠躁夜夜2o2o| 欧美日韩亚洲国产一区二区在线观看| 国产老妇女一区| 丰满的人妻完整版| 性色avwww在线观看| 午夜久久久久精精品| 欧美日韩综合久久久久久 | 亚洲午夜理论影院| 国产精品香港三级国产av潘金莲| a在线观看视频网站| 丰满人妻熟妇乱又伦精品不卡| 免费av不卡在线播放| 日韩欧美一区二区三区在线观看| 久久九九热精品免费| 国产在线精品亚洲第一网站| 精品电影一区二区在线| 国内毛片毛片毛片毛片毛片| 亚洲人成网站在线播| 成年版毛片免费区| 美女黄网站色视频| 久99久视频精品免费| 成人精品一区二区免费| 一级a爱片免费观看的视频| 亚洲欧美一区二区三区黑人| 国产精品久久久久久久久免 | 国产亚洲精品久久久久久毛片| 热99在线观看视频| 成年人黄色毛片网站| 欧美最黄视频在线播放免费| 人人妻人人澡欧美一区二区| 精品免费久久久久久久清纯| 国产高清videossex| 欧美区成人在线视频| 丰满人妻一区二区三区视频av | h日本视频在线播放| 国产免费av片在线观看野外av| 99riav亚洲国产免费| 亚洲在线自拍视频| 91久久精品电影网| 少妇裸体淫交视频免费看高清| 蜜桃亚洲精品一区二区三区| 国产精品1区2区在线观看.| 免费av毛片视频| 禁无遮挡网站| 国产欧美日韩精品一区二区| 日韩成人在线观看一区二区三区| 国模一区二区三区四区视频| 丁香六月欧美| 美女免费视频网站| a在线观看视频网站| 国产色爽女视频免费观看| 色哟哟哟哟哟哟| 99在线人妻在线中文字幕| 99在线视频只有这里精品首页| 成人精品一区二区免费| 久久精品夜夜夜夜夜久久蜜豆| 久久6这里有精品| 亚洲avbb在线观看| 亚洲中文字幕一区二区三区有码在线看| 国产成人福利小说| 成年女人毛片免费观看观看9| 色老头精品视频在线观看| 日韩欧美一区二区三区在线观看| 无人区码免费观看不卡| 久久精品国产亚洲av涩爱 | 在线观看午夜福利视频| 啦啦啦韩国在线观看视频| 亚洲av成人不卡在线观看播放网| 日韩精品中文字幕看吧| 波多野结衣高清作品| 一进一出抽搐动态| 欧美日韩精品网址| 亚洲国产欧美人成| 精品日产1卡2卡| 久久香蕉精品热| 国产av不卡久久| 99久久精品国产亚洲精品| 天天一区二区日本电影三级| 国产精品一及| av片东京热男人的天堂| 国产精品亚洲一级av第二区| 欧美性感艳星| 一本精品99久久精品77| 亚洲精品一区av在线观看| 国产精品久久久久久人妻精品电影| av黄色大香蕉| 午夜免费成人在线视频| 高清毛片免费观看视频网站| 好看av亚洲va欧美ⅴa在| 国产精品av视频在线免费观看| 久久久久九九精品影院| 国产亚洲精品综合一区在线观看| 一进一出好大好爽视频| 夜夜夜夜夜久久久久| 99久久九九国产精品国产免费| 国产91精品成人一区二区三区| 最近在线观看免费完整版| 久久精品国产综合久久久| 国产一区二区在线观看日韩 | 色老头精品视频在线观看| 国产精品,欧美在线| 亚洲成人久久爱视频| 老司机深夜福利视频在线观看| 九九久久精品国产亚洲av麻豆| 精品一区二区三区视频在线 | 日韩欧美精品免费久久 | 成人国产一区最新在线观看| 国产精品久久视频播放| 好看av亚洲va欧美ⅴa在| 99久久精品热视频| 色视频www国产| 亚洲精品一卡2卡三卡4卡5卡| 国产欧美日韩精品亚洲av| 两人在一起打扑克的视频| 精品福利观看| 久久久久久大精品| 国产又黄又爽又无遮挡在线| 精品久久久久久,| 18禁裸乳无遮挡免费网站照片| a级一级毛片免费在线观看| 国产成人系列免费观看| 精品熟女少妇八av免费久了| 国产精品98久久久久久宅男小说| av在线天堂中文字幕| 日韩欧美在线二视频| 我的老师免费观看完整版| 午夜亚洲福利在线播放| 免费人成在线观看视频色| 美女免费视频网站| 在线免费观看不下载黄p国产 | 国产伦一二天堂av在线观看| 国产国拍精品亚洲av在线观看 | 神马国产精品三级电影在线观看| 99riav亚洲国产免费| 在线国产一区二区在线| 岛国视频午夜一区免费看| 亚洲成a人片在线一区二区| 亚洲专区国产一区二区| 国产精品精品国产色婷婷| 高清在线国产一区| 亚洲国产精品999在线| 青草久久国产| 国产黄片美女视频| 欧美日韩乱码在线| 真人做人爱边吃奶动态| 宅男免费午夜| 精品久久久久久成人av| av中文乱码字幕在线| 亚洲精品久久国产高清桃花| 中文字幕高清在线视频| 99精品欧美一区二区三区四区| 性欧美人与动物交配| 亚洲精品在线美女| 亚洲黑人精品在线| 好看av亚洲va欧美ⅴa在| 黄片小视频在线播放| 首页视频小说图片口味搜索| 999久久久精品免费观看国产| 我要搜黄色片| 免费一级毛片在线播放高清视频| 香蕉av资源在线| xxxwww97欧美| 国内少妇人妻偷人精品xxx网站| 国产精品久久久久久人妻精品电影| 日日摸夜夜添夜夜添小说| 色噜噜av男人的天堂激情| 精品熟女少妇八av免费久了| 亚洲国产高清在线一区二区三| 香蕉丝袜av| 久久久精品大字幕| 久久久成人免费电影| 一级黄片播放器| 午夜两性在线视频| 精品免费久久久久久久清纯| 亚洲国产日韩欧美精品在线观看 | 午夜免费男女啪啪视频观看 | 9191精品国产免费久久| 国产高清视频在线观看网站| 欧美国产日韩亚洲一区| 在线视频色国产色| 亚洲国产色片| 午夜两性在线视频| 亚洲五月天丁香| 韩国av一区二区三区四区| 岛国视频午夜一区免费看| 老司机福利观看| 国产爱豆传媒在线观看| 久久性视频一级片| 亚洲色图av天堂| 久久久国产精品麻豆| 中文字幕人妻熟人妻熟丝袜美 | av黄色大香蕉| avwww免费| 很黄的视频免费| 国产午夜福利久久久久久| 51午夜福利影视在线观看| 国产精品野战在线观看| 欧美黄色片欧美黄色片| www.熟女人妻精品国产| 国内揄拍国产精品人妻在线| 男插女下体视频免费在线播放| 日日夜夜操网爽| 国产精品久久久久久久久免 | 日本免费a在线| 少妇的丰满在线观看| 国产探花极品一区二区| 搡老岳熟女国产| 一个人观看的视频www高清免费观看| 级片在线观看| 1000部很黄的大片| 90打野战视频偷拍视频| 日本黄色片子视频| 国产伦在线观看视频一区| 中文字幕av成人在线电影| 19禁男女啪啪无遮挡网站| 亚洲人与动物交配视频| 国产伦一二天堂av在线观看| av视频在线观看入口| 精品人妻一区二区三区麻豆 | 亚洲精品在线美女| 国产黄a三级三级三级人| 午夜激情福利司机影院| 岛国在线观看网站| 久久久久久久久久黄片| 国产成人av教育| 日韩欧美在线乱码| 97人妻精品一区二区三区麻豆| 午夜免费激情av| 色老头精品视频在线观看| 亚洲性夜色夜夜综合| 级片在线观看| 精品国产美女av久久久久小说| 91麻豆av在线| 无遮挡黄片免费观看| 黄色片一级片一级黄色片| 熟女电影av网| a在线观看视频网站| 日韩精品中文字幕看吧| 欧美日韩乱码在线| 国产成+人综合+亚洲专区| 欧美日韩中文字幕国产精品一区二区三区| 免费观看精品视频网站| 天堂动漫精品| 日本一本二区三区精品| 宅男免费午夜| 最近最新中文字幕大全电影3| av欧美777| 国产单亲对白刺激| 国产成人系列免费观看| 免费在线观看成人毛片| 国产三级中文精品| 亚洲人与动物交配视频| 97碰自拍视频| 无人区码免费观看不卡| 日韩精品青青久久久久久| 亚洲成av人片免费观看| 国产极品精品免费视频能看的| 在线观看午夜福利视频| 日本成人三级电影网站| 99riav亚洲国产免费| 岛国在线观看网站| 十八禁网站免费在线| 免费观看的影片在线观看| 欧美激情在线99| 国产精品一区二区免费欧美| 1000部很黄的大片| 国产三级黄色录像| 少妇人妻精品综合一区二区 | 一个人看视频在线观看www免费 | 亚洲精品久久国产高清桃花| 国产av一区在线观看免费| 精品一区二区三区视频在线观看免费| 一二三四社区在线视频社区8| 非洲黑人性xxxx精品又粗又长| 在线十欧美十亚洲十日本专区| 免费av毛片视频| 亚洲国产色片| 国产伦在线观看视频一区| 国产主播在线观看一区二区| 十八禁人妻一区二区| 啦啦啦观看免费观看视频高清| 99国产极品粉嫩在线观看| 久久久久久久精品吃奶| 亚洲在线观看片| 人人妻,人人澡人人爽秒播| 极品教师在线免费播放| 日本三级黄在线观看| 一级黄色大片毛片| 中文字幕人妻丝袜一区二区| 国产精品美女特级片免费视频播放器| 欧美乱色亚洲激情| 日韩欧美三级三区| 老司机午夜十八禁免费视频| 亚洲色图av天堂| 亚洲熟妇中文字幕五十中出| 又爽又黄无遮挡网站| 欧美区成人在线视频| 亚洲国产欧洲综合997久久,| 色精品久久人妻99蜜桃| www国产在线视频色| 黄色日韩在线| 成人国产一区最新在线观看| 五月玫瑰六月丁香| av女优亚洲男人天堂| 国产熟女xx| 久久亚洲精品不卡| 一本一本综合久久| 成人永久免费在线观看视频| 亚洲成人中文字幕在线播放| 高清毛片免费观看视频网站| 精品久久久久久久人妻蜜臀av| 五月伊人婷婷丁香| 嫁个100分男人电影在线观看| 人人妻人人看人人澡| 婷婷六月久久综合丁香| 99精品久久久久人妻精品| 精品福利观看| 国产精品久久久久久人妻精品电影| 国产毛片a区久久久久| 欧美成人性av电影在线观看| 国产精品1区2区在线观看.| 亚洲精华国产精华精| 欧美最新免费一区二区三区 | 成人av在线播放网站| 久久久久亚洲av毛片大全| 一边摸一边抽搐一进一小说| 夜夜看夜夜爽夜夜摸| 久9热在线精品视频| 国产精品亚洲一级av第二区| 真人一进一出gif抽搐免费| 悠悠久久av| 熟女人妻精品中文字幕| 日韩免费av在线播放| 久久天躁狠狠躁夜夜2o2o| 中文字幕精品亚洲无线码一区| 一本一本综合久久| 一个人看视频在线观看www免费 | 亚洲第一欧美日韩一区二区三区| 成人av一区二区三区在线看| 国产精品 国内视频| 欧美乱码精品一区二区三区| 亚洲精品色激情综合| 欧美另类亚洲清纯唯美| 国产三级中文精品| 日本一二三区视频观看| 日本熟妇午夜| 淫秽高清视频在线观看| 精品久久久久久久久久免费视频| 久久精品国产自在天天线| 黄色片一级片一级黄色片| 国产三级中文精品| 99久久综合精品五月天人人| 精品国产美女av久久久久小说| 国产色爽女视频免费观看| 天堂√8在线中文| 一区二区三区国产精品乱码| 天美传媒精品一区二区| 国产乱人伦免费视频| 国产欧美日韩一区二区三| 最近最新中文字幕大全电影3| 波多野结衣高清作品| 国产av麻豆久久久久久久| 国产一区二区三区在线臀色熟女| 欧美精品啪啪一区二区三区| 久久天躁狠狠躁夜夜2o2o| 久久精品91蜜桃| 99精品久久久久人妻精品| 久久久久亚洲av毛片大全| www国产在线视频色| 午夜a级毛片| 欧美大码av| 亚洲精品色激情综合| 国产伦精品一区二区三区四那| 亚洲无线在线观看| 免费看光身美女| 国产精品久久视频播放| 两个人的视频大全免费| 色视频www国产| 一a级毛片在线观看| 日韩欧美国产在线观看| 成年女人永久免费观看视频| 国产伦一二天堂av在线观看| 国产毛片a区久久久久| 丝袜美腿在线中文| 国产极品精品免费视频能看的| 日韩有码中文字幕| 亚洲精品日韩av片在线观看 | 2021天堂中文幕一二区在线观| 少妇的丰满在线观看| 婷婷六月久久综合丁香| 精品国内亚洲2022精品成人| 超碰av人人做人人爽久久 | 日本免费a在线| h日本视频在线播放| 毛片女人毛片| 国产男靠女视频免费网站| 成人亚洲精品av一区二区| 国产精品免费一区二区三区在线| 日日摸夜夜添夜夜添小说| 香蕉丝袜av| 亚洲av二区三区四区| 亚洲av免费高清在线观看| 波多野结衣高清无吗| 人妻久久中文字幕网| 黄片小视频在线播放| 真人做人爱边吃奶动态| 亚洲欧美日韩卡通动漫| 亚洲中文字幕一区二区三区有码在线看| 无人区码免费观看不卡| 一a级毛片在线观看| 日本一本二区三区精品| 极品教师在线免费播放| 亚洲专区国产一区二区| 亚洲成人久久爱视频| 成人三级黄色视频| 真实男女啪啪啪动态图| 舔av片在线| 老司机在亚洲福利影院| 国产真实乱freesex| 人人妻人人澡欧美一区二区| 国产av一区在线观看免费| 亚洲内射少妇av| 又黄又粗又硬又大视频| 亚洲五月婷婷丁香| 亚洲真实伦在线观看| 亚洲不卡免费看| 九色成人免费人妻av| 9191精品国产免费久久| 18美女黄网站色大片免费观看| 麻豆久久精品国产亚洲av| 在线看三级毛片| 草草在线视频免费看| 国产精品电影一区二区三区| 亚洲欧美一区二区三区黑人| 国产极品精品免费视频能看的| 日本撒尿小便嘘嘘汇集6| 一区福利在线观看| 国产欧美日韩精品一区二区| 亚洲七黄色美女视频| 精品国产亚洲在线| 18禁裸乳无遮挡免费网站照片| av福利片在线观看| 人人妻人人澡欧美一区二区| 欧美一区二区亚洲| 中文字幕高清在线视频| 成年女人永久免费观看视频| 亚洲av不卡在线观看| 精品人妻1区二区| 久99久视频精品免费| 精品国产超薄肉色丝袜足j| 老鸭窝网址在线观看| 国产黄片美女视频| 在线观看美女被高潮喷水网站 | 欧美性猛交╳xxx乱大交人| 搡老熟女国产l中国老女人| 90打野战视频偷拍视频| 国产亚洲精品综合一区在线观看| 日本免费a在线| 国产精品98久久久久久宅男小说| 成人无遮挡网站| 亚洲专区国产一区二区| 国产精品 国内视频| 又紧又爽又黄一区二区| 日韩欧美精品免费久久 | 亚洲乱码一区二区免费版| 中文字幕精品亚洲无线码一区| 欧美又色又爽又黄视频| 一级作爱视频免费观看| 九九在线视频观看精品| 老鸭窝网址在线观看| 日本熟妇午夜| 色综合站精品国产| 九色国产91popny在线| 99精品欧美一区二区三区四区| 天堂网av新在线| 九色成人免费人妻av| 午夜日韩欧美国产| 我要搜黄色片| 成人国产综合亚洲| 18禁裸乳无遮挡免费网站照片| 三级国产精品欧美在线观看| av女优亚洲男人天堂| 精品人妻1区二区| 熟女少妇亚洲综合色aaa.| 国产91精品成人一区二区三区| 国产精品一区二区免费欧美| 麻豆国产97在线/欧美| 欧美乱码精品一区二区三区| 91久久精品国产一区二区成人 | 国产av不卡久久| 国产亚洲精品一区二区www| 一个人观看的视频www高清免费观看| 手机成人av网站| 天天一区二区日本电影三级| 淫秽高清视频在线观看| 91九色精品人成在线观看| 性色av乱码一区二区三区2| 少妇高潮的动态图| 日韩高清综合在线| 欧美日韩黄片免| 国产成人aa在线观看| 国产三级中文精品| 美女高潮的动态| 搡老岳熟女国产| 国产精品久久电影中文字幕| 婷婷六月久久综合丁香| 国产在视频线在精品| 免费高清视频大片| 亚洲一区二区三区不卡视频| 亚洲精华国产精华精| 动漫黄色视频在线观看| 麻豆成人午夜福利视频| av欧美777| 色综合婷婷激情| 性色avwww在线观看| 亚洲欧美日韩无卡精品| 免费观看精品视频网站| 久久亚洲真实| 男女午夜视频在线观看| 国产成人av激情在线播放| 99国产精品一区二区蜜桃av| 亚洲专区中文字幕在线| 精品久久久久久久久久久久久| 国产精品女同一区二区软件 | 国产精品国产高清国产av| 欧美日韩一级在线毛片| 日本 av在线| 91在线观看av| 欧美乱妇无乱码| 国产真人三级小视频在线观看| 午夜视频国产福利| 18禁裸乳无遮挡免费网站照片| 美女大奶头视频| 国产精品野战在线观看| 成人无遮挡网站| 丁香欧美五月| av专区在线播放| 国模一区二区三区四区视频| 亚洲国产精品999在线| 日日摸夜夜添夜夜添小说| 午夜老司机福利剧场| 亚洲国产精品999在线| av专区在线播放| 高清毛片免费观看视频网站| 3wmmmm亚洲av在线观看| 成人精品一区二区免费| 青草久久国产| 天堂√8在线中文| 在线观看66精品国产| 欧美丝袜亚洲另类 | 一进一出好大好爽视频| 日韩国内少妇激情av| 无人区码免费观看不卡| 97超视频在线观看视频| 国产精品一区二区三区四区免费观看 | 国产精品98久久久久久宅男小说| 97超级碰碰碰精品色视频在线观看| 国产欧美日韩精品亚洲av|