王 勇,李水明,何曼文,鄒永東
(1.深圳大學生命科學學院,深圳市海洋生物資源與生態(tài)環(huán)境重點實驗室,廣東 深圳 518060;2.深圳大學生命科學學院,深圳市微生物基因工程重點實驗室,廣東 深圳 518060)
基于質(zhì)譜鑒定蛋白分為自下而上(bottom up)和自上而下(top down)兩種技術(shù)路線[1],前者是指將蛋白質(zhì)酶解成肽段后進行質(zhì)譜分析進而推測出整個蛋白質(zhì)結(jié)構(gòu),后者則是直接分析完整蛋白。盡管top down方法給出信息更為直接可靠并發(fā)展很快,但由于對質(zhì)譜儀的分辨率、樣品純度和離子斷裂方式等要求很高,目前大部分蛋白質(zhì)組學研究都采用bottom up技術(shù)或者將二者結(jié)合[2-6],除非基于特殊目的[7],使用的多為胰蛋白酶,它能夠特異性地酶解賴氨酸(Lys,K)和精氨酸(Arg,R)殘基的羧基端。
使用一定的算法或軟件將質(zhì)譜數(shù)據(jù)與蛋白質(zhì)數(shù)據(jù)庫匹配是蛋白質(zhì)組學的核心[8],算法編程遇到的問題之一是非特異性酶切和漏切[9]。盡管Olsen等基于高分辨率質(zhì)譜的數(shù)據(jù)認為胰蛋白酶的酶切特異性很高,之前文獻報道的大部分胰酶非特異性酶切或者半酶切很可能是因為自動搜庫導致的偽結(jié)果[10],但胰酶漏切現(xiàn)象在蛋白質(zhì)的鑒定中并不罕見。早期研究者利用104個蛋白質(zhì)組成的數(shù)據(jù)集證明當賴氨酸和精氨酸彼此或自身相鄰、或它們各自與天冬氨酸或谷氨酸相鄰、或賴氨酸/精氨酸后面(羧基端)為脯氨酸時將會發(fā)生漏切[11]。目前,只有關于脯氨酸漏切原則被廣泛接受編入許多搜庫算法,但也有工作表明這一原則在很多情況下會被違反[12]??傮w上,影響胰酶水解特異性的因素有很多,例如實驗條件和裂解位點附近的殘基等,但文獻報道中關于胰酶漏切位點的研究大多基于生物信息學和蛋白質(zhì)組學方法展開[13-14],針對單一蛋白研究胰酶漏切的工作較少。Mascot軟件的應用指南中指出漏切位點數(shù)可以為1或2,但未見更詳細的說明。本研究利用基質(zhì)輔助激光解吸電離-串聯(lián)飛行時間質(zhì)譜(MALDI-TOF/TOF)分析細胞色素C和大豆脫落脅迫成熟蛋白,為更好地了解胰酶漏切現(xiàn)象提供實驗依據(jù)。
4800MALDI TOF/TOFTMAnalyzer基質(zhì)輔助激光解吸電離-串聯(lián)飛行時間質(zhì)譜儀(MALDI-TOF/TOF):美 國 Applied Biosystems/MDX SCIEX公司產(chǎn)品;超純水處理系統(tǒng)(Milli-Q):美國 Millipore公司產(chǎn)品。
胰蛋白酶(質(zhì)譜分析級):Promega公司產(chǎn)品;α-腈基-4-羥基肉桂酸:美國Sigma公司產(chǎn)品,使用前重結(jié)晶。蛋白分子量標記物#SM0431(包括溶菌酶等7種標準蛋白質(zhì)):美國Thermo Fisher Scientific公司產(chǎn)品。
蛋白分子量標記物經(jīng)一維電泳分離后的目標條帶用移液槍槍頭切下,小心地放入PCR管,用100μL高純水振蕩洗滌10min,100μL 25 mmol/L NH4HCO3室溫振蕩平衡20min;100 μL 25mmol/L NH4HCO3/50%乙腈室溫振蕩30min;100μL 25mmol/L NH4HCO3室溫振蕩平衡20min;加入100μL 100%乙腈于膠粒中,靜置10min,重復1次;加入5μL 20mg/L質(zhì)譜測序級胰蛋白酶,4℃放置30min;加入5 μL 40mmol/L NH4HCO3/10%ACN,37 ℃水浴8h。
基質(zhì)制備:將6g/Lα-腈基-4-羥基肉桂酸和2g/L檸檬酸氫二胺溶于10mL 50%乙腈(含0.1%三氟乙酸),用V(基質(zhì)溶液)∶V(蛋白酶解液)=1∶1的溶液混合后點于不銹鋼靶版,自然干燥結(jié)晶后待測。采用正離子反射模式,一級質(zhì)譜每張譜圖累加800次,二級質(zhì)譜累加1 200次,碰撞誘導解離條件為1kV碰撞能加空氣碰撞(1kV,gas on)。
數(shù)據(jù)庫搜索條件:串聯(lián)質(zhì)譜數(shù)據(jù)搜庫,信噪比設為5,一級和二級質(zhì)譜質(zhì)量誤差均設為±0.3Da,Mascot軟件分析,搜索數(shù)據(jù)庫 NCBI2012年8月19日發(fā)布,甲硫氨酸氧化(Oxidation)和半胱氨酸烷基化(Carbamidomethyl)作為可變修飾,胰酶漏切位點數(shù)1或2。
細胞色素C胰蛋白酶水解液的一級質(zhì)譜示于圖1,一級質(zhì)譜中各[M+H]+離子做串聯(lián)質(zhì)譜分析,以串聯(lián)質(zhì)譜數(shù)據(jù)搜庫的Mascot得分是657分,證明該蛋白確為細胞色素C。但是,圖1中m/z1 478.96和m/z2 209.33離子未被數(shù)據(jù)庫匹配,為確定結(jié)構(gòu),對它們的二級譜圖進行進一步分析。
圖2和圖3的共同點是都在低質(zhì)量區(qū)觀察到了較高豐度的m/z84.09離子,在圖3中m/z129離子的相對強度也較高,而這兩個離子是賴氨酸殘基的亞胺相關離子[15],所以猜測它們有可能是細胞色素C不完全酶解的產(chǎn)物。因為應用漏切數(shù)為1的常規(guī)搜庫設置條件時沒有匹配,將漏切位點數(shù)目設為2后重新搜庫,m/z1 478.96被 鑒 定 為 KTEREDLIAYLK,m/z2 209.33離 子 的 序 列 為 GITWKEETLMEYLENPKK,它們都含有兩個胰蛋白酶酶切漏點,Mascot分數(shù)分別為82和61,鑒定結(jié)果可靠。值得注意的是,肽段TEREDLIAYLK和GITWKEETLMEYLENPK在常規(guī)條件下已被檢出,因此二次搜庫的結(jié)果只相當于多鑒定了兩個賴氨酸殘基,鑒定覆蓋率從72%提高到74%(細胞色素C由101個氨基酸組成),但是,鑒定的Mascot分數(shù)從657增至779。
圖1 細胞色素C胰蛋白酶水解液的MALDI-TOF質(zhì)譜圖Fig.1 MALDI-TOF spectrum of tryptic digest of cytochrome C
圖2 肽段[M+H]+ m/z 1 478.96離子的串聯(lián)飛行時間質(zhì)譜圖Fig.2 MALDI-TOF/TOF spectrum of peptide[M+H]+ m/z 1 478.96
類似地,將胰酶漏切位點數(shù)設為2后,在另外的一個實際樣品分析中也檢測到了多個雙酶解漏切肽段,示于圖4。在所有其他搜庫條件不變的情況下將胰酶漏切位點個數(shù)由1變?yōu)?后,鑒定蛋白的 Mascot得分由原來的1 008變?yōu)? 558,覆蓋率由46%增加至48%。Mascot分值顯著增加而覆蓋率增加較小,這與樣品蛋白的序列特性和軟件的打分算法有關,前者說明鑒定蛋白的確定性顯著提高,而覆蓋率增加較小則說明有重合肽段。
圖3 肽段[M+H]+ m/z 2 209.33離子的串聯(lián)飛行時間質(zhì)譜圖Fig.3 MALDI-TOF/TOF spectrum of peptide[M+H]+ m/z 2 209.33
圖4 大豆脫落脅迫成熟蛋白串聯(lián)質(zhì)譜數(shù)據(jù)的Mascot搜庫結(jié)果Fig.4 The database searching result of abscisic stress ripening-like protein by Mascot
大豆脫落脅迫成熟蛋白的大多數(shù)水解肽段都有漏切現(xiàn)象,實驗中將漏切數(shù)設為0,則只匹配3條肽段,搜庫分數(shù)為379,其搜庫鑒定結(jié)果列于表1。值得注意的是,發(fā)生雙位點漏切的4個肽段都有相應的單位點漏切肽段,分別是EQDEEAHGKK/EAKEQDEEAHGKK,AEKDPEHAHR/HKAEKDPEHAHR,TSGGGYDDEVDYKK/TSGGGYDDEVDYKKEEK和 HKIEEEVAAAAAVGSGGFAFHEHHEK/HKIEEEVAAAAAVGSGGFAFHEHHEKK。對漏切位點進行分析,發(fā)現(xiàn)漏切現(xiàn)象主要發(fā)生在賴氨酸殘基,很多是由于存在兩個連續(xù)的賴氨酸或者賴氨酸與天冬氨酸或谷氨酸相鄰。胰酶水解位點的漏切還可能與酶解時間有關,但是本實驗水解時間均為8h,并且細胞色素C和大豆脫落脅迫成熟蛋白不是同一批處理的樣品,在它們各自的同批次蛋白樣品中也未觀察到漏切肽段,因此推測雙位點漏切與蛋白的結(jié)構(gòu)有關。
在該例中不僅證實了文獻[11]中提及的大部分漏切現(xiàn)象,還觀察到了HKA和HKI結(jié)構(gòu)引起的漏切(表1),并呈現(xiàn)相對定量的關系。如圖5所示,肽段HKAEKDPEHAHR[M+H]+峰(m/z1 454.78)被作為基峰檢測,而對應肽段AEKDPEHAHR(m/z1 189.60)的相對強度為28.6%。此外,肽段HKIEEEVAAAAAVGSGGFAFHEHHEK的[M+H]+峰(m/z2 758)的相對強度遠高于HKIEEEVAAAAAVGSGGFAFHEHHEKK (m/z2 886)和IEEEVAAAAA VGSGGFAFHEHHEK(m/z2 493),該結(jié)果提示,即使經(jīng)過長時間的酶解過程,含有HKA和HKI結(jié)構(gòu)的肽段仍很穩(wěn)定,具體原因尚需進一步研究。此外,將漏切位點數(shù)設為2搜索沒有發(fā)現(xiàn)額外的假陽性。
表1 大豆脫落脅迫成熟蛋白的搜庫鑒定結(jié)果Table 1 Peptides of abscisic stress ripening-like protein[Glycine max]identified by Mascot
圖5 大豆脫落脅迫成熟蛋白胰蛋白酶水解液的MALDI-TOF質(zhì)譜圖Fig.5 MALDI-TOF spectrum of tryptic digest of abscisic stress ripening-like protein
在常規(guī)實驗條件下的細胞色素C和大豆脫落脅迫成熟蛋白體系中,發(fā)現(xiàn)和確認了胰蛋白酶的雙位點漏切現(xiàn)象,增加漏切位點數(shù)目搜索后覆蓋率無明顯提高,但顯著增加了搜庫分數(shù)及鑒定結(jié)果的可信度。發(fā)現(xiàn)胰酶漏切現(xiàn)象與蛋白質(zhì)結(jié)構(gòu)關系密切,具有一定的規(guī)律性。本工作表明對于某些序列特殊的蛋白質(zhì),如果漏切位點設置不當可能導致數(shù)據(jù)利用率降低。
[1] BOGDANOV B,SMITH R D.Proteomics by FTI-CR mass spectrometry:Top down and bottom up[J]. Mass Spectrom Review,2005,24(2):168-200.
[2] CHI H,SUN R X,YANG B,et al.pNovo:De novo peptide sequencing and identification using HCD spectra[J].Journal of Proteome Research,2010,9(5):2 713-2 724.
[3] MEDZIHRADSZKY K F,CAMPBELL J M,BALDWIN M A,et al.The characteristics of peptide collision-induced dissociation using a high-performance MALDI-TOF/TOF tandem mass spectrometer[J].Analtical Chemistry,2000,72(3):552-558.
[4] MA M M,CHEN R B,GE Y,et al.Combining bottom-up and top-down mass spectrometric strategies for de novo sequencing of the Crustacean hyperglycemic hormone from cancer borealis[J].Analtical Chemistry,2009,81(1):240-247.
[5] MIYASHITA M,HANAI Y,AWANE H,et al.Improving peptide fragmentation by N-terminal derivatization with high proton affinity[J].Rapid Communication Mass Spectrometry,2011,25(9):1 130-1 140.
[6] HUANG L,BALDWIN M A,MALTBY D A,et al.The identification of protein-protein interactions of the nuclear pore complex of saccharomyces cerevisiae using high throughput matrix-assisted laser desorption ionization time-of-flight tandem mass spectrometry[J]. Molecular Cell Proteomics,2002,(1):434-450.
[7] BOERSEMA P J,TAOUATAS N,MAARTEN A F,et al.Straightforward and de novo peptide sequencing by MALDI-MS/MS using a Lys-N metalloendopeptidase[J].Molecular Cell Proteomics,2009,(8):650-660.
[8] MARCOTTE E M.How do shotgun proteomics algorithms identify proteins[J].Nature Biotechnology,2007,25(7):755-757.
[9] LUBEC G,AFJEHI-SADAT L.Limitations and pitfalls in protein identification by mass spectrom-etry[J].Chem Rev,2007,107:3 568-3 584.
[10] OLSEN J V,ONGS E,MANN M.Trypsin cleaves exclusively C-terminal to arginine and lysine residues[J].Molecular Cell Proteomics,2004,(3):608-614.
[11] THIEDE B,LAMER S,MATTOW J,et al.Analysis of missed cleavage sites,tryptophan oxidation and N-terminal pyroglutamylation after in-gel tryptic digestion[J].Rapid Communication Mass Spectrometry,2000,14(6):496-502.
[12] RODRIGUEZ J,GUPTA N,RICHARD D,et al.Does trypsin cut before proline[J].J Proteome Research,2008,7(1):300-305.
[13] SIEPHENJ A,KEEVIL E J,KNIGHT D,et al.Prediction of missed cleavage sites in tryptic peptides aids protein identification in proteomics[J].J Proteome Research,2007,6(1):399-408.
[14] 劉 輝,張紀陽,孫漢昌,等.基于馬爾科夫鏈的胰蛋白酶肽段蛋白酶切位點概率預測[J].生物物理學報,2011,27(6):528-536.
[15] FALICK A M,HINES W M,MEDZIHRADSZKY K F,et al.Low-mass ions produced from peptides by high-energy collision-induced dissociation in tandem mass spectrometry[J].Journal of the American Society for Mass spectrometry,1993,4(11):882-893.