孫曉珊,路 鑫,許國旺
(1.中國科學(xué)院大連化學(xué)物理研究所,分離分析化學(xué)重點(diǎn)實(shí)驗(yàn)室,遼寧 大連 116023;2.中國科學(xué)院大學(xué),北京 100049)
代謝組學(xué)[1]是以生物體內(nèi)分子質(zhì)量小于1 500的小分子代謝物為研究對象,運(yùn)用多種分析手段,如質(zhì)譜(mass spectrometry, MS)[2]、核磁共振(nuclear magnetic resonance, NMR)[3]、色譜-質(zhì)譜聯(lián)用[4]等,從整體水平上研究胞內(nèi)代謝物組成及其與生理、病理相關(guān)的變化規(guī)律。與其他組學(xué)相比,代謝組學(xué)更接近于表型,能更準(zhǔn)確直接地反映外界環(huán)境對生命系統(tǒng)的影響[5],通過與其他組學(xué)整合可為生命科學(xué)研究提供解決方案[6]。代謝組學(xué)已廣泛應(yīng)用于生命科學(xué)的諸多領(lǐng)域,如疾病診斷、藥物安全性評價(jià)、藥理研究、營養(yǎng)科學(xué)等[7-8]。
生物體內(nèi)的代謝物數(shù)量眾多,如人類代謝組學(xué)數(shù)據(jù)庫(human metabolome database, HMDB)現(xiàn)已收錄超過10萬種代謝物[9],且代謝物的理化性質(zhì)各異、濃度范圍跨度9個(gè)數(shù)量級,代謝組全景分析具有極大挑戰(zhàn)[10]。隨著代謝組學(xué)研究領(lǐng)域的不斷拓寬,以及高分辨質(zhì)譜(high resolution mass spectrometry, HRMS)的快速發(fā)展,基于質(zhì)譜的分析技術(shù)逐漸成為組學(xué)研究不可或缺的工具。相對于NMR,質(zhì)譜技術(shù)具有檢測靈敏度更高、代謝組覆蓋范圍更廣等[11]特點(diǎn)。代謝組學(xué)研究中常用的HRMS主要包括:飛行時(shí)間質(zhì)譜(time of flight MS, TOF MS)、傅里葉變換靜電場軌道阱質(zhì)譜(Fourier transform Orbitrap MS, FT Orbitrap MS)和傅里葉變換離子回旋共振質(zhì)譜(Fourier transform ion cyclotron resonance MS, FTICR MS)[12]。相對于低分辨質(zhì)譜(如三重四極桿質(zhì)譜),HRMS具有更高的質(zhì)量分辨率和質(zhì)量精度,更有利于發(fā)現(xiàn)新的有意義的生物分子,已在非靶向代謝組學(xué)研究中得到廣泛應(yīng)用[13]。為了滿足不同層面的代謝組學(xué)研究需求,近年來不斷涌現(xiàn)了基于高分辨質(zhì)譜的代謝組學(xué)新技術(shù),如與微納尺度液相色譜、多維色譜聯(lián)用技術(shù),納噴電離(nanoelectrospray, nESI)高分辨質(zhì)譜,基質(zhì)輔助激光解吸電離(matrix-assisted laser desorption/ionization, MALDI)高分辨質(zhì)譜以及原位電離(ambient ionization, AI)高分辨質(zhì)譜技術(shù)等。此外,定性代謝組學(xué)新技術(shù)快速發(fā)展,使得更深層次的代謝組學(xué)數(shù)據(jù)利用和挖掘成為可能,極大地推動(dòng)了代謝組學(xué)研究。本文將重點(diǎn)介紹近5年來基于高分辨質(zhì)譜的代謝組學(xué)分析技術(shù)研究進(jìn)展。
色譜-高分辨質(zhì)譜聯(lián)用是代謝組學(xué)研究的主流分析技術(shù)之一。代謝物經(jīng)色譜高效分離后進(jìn)入質(zhì)譜,可顯著降低質(zhì)譜離子抑制,有利于代謝物的定性和定量分析。與氣相色譜相比,超高效液相色譜(ultrahigh performance liquid chromatography, UHPLC)具有分離速度快、分離效率高、靈敏度高、重復(fù)性好、無需衍生化處理、與高分辨質(zhì)譜兼容性好等優(yōu)勢,且具有多種分離模式,對代謝組的檢測覆蓋度更高[14],已成為與高分辨質(zhì)譜聯(lián)用的首選色譜系統(tǒng)[15]。UHPLC-HRMS是非靶向代謝組學(xué)研究中最常用的分析技術(shù)之一[16],可獲得豐富的代謝物定量、定性信息。Nature Protocols已陸續(xù)發(fā)表了以血漿[4]、組織[17]和尿液[18]為研究對象的基于UHPLC-HRMS代謝組分析范本。
當(dāng)前代謝組學(xué)研究對象面向微量化、復(fù)雜化及規(guī)?;?,因此亟待發(fā)展靈敏度更高、覆蓋度更好、檢測速度更快的分析技術(shù)[16,19]。使用亞二微米顆粒填料的超高效微柱液相色譜(Micro-UHPLC)與高分辨質(zhì)譜聯(lián)用技術(shù)得到了關(guān)注。Micro-UHPLC系統(tǒng)更接近于常規(guī)UHPLC系統(tǒng),通過結(jié)合快速梯度條件可顯著提高分析通量。如Gray等[20]發(fā)展了一種用于高通量代謝組學(xué)研究的基于快速微柱超高效液相色譜-高分辨質(zhì)譜的代謝譜方法(rapid microbore metabolic profiling,RAMMP),采用HSS T3micro-UHPLC色譜柱(1 mm×50 mm×1.8 μm)代替UHPLC色譜柱(2.1 mm×100 mm×1.8 μm),使用快梯度和0.4 mL/min柱流量將分析時(shí)間縮短至2.5 min/樣品,即分析時(shí)間縮短了近5倍。對服用2-溴苯酚和撲熱息痛的700多例小鼠尿液代謝譜分析顯示,與傳統(tǒng)的UHPLC-MS相比,雖然檢測到的質(zhì)譜特征由19 000減少至約6 000,但2種方法具有相似的重復(fù)性及組間區(qū)分能力。與分析時(shí)間相近的直接進(jìn)樣質(zhì)譜法相比,RAMMP法具有更好的選擇性,更適合大批量樣本分析。
為了改善快速micro-UHPLC-HRMS法由于分析物共洗脫導(dǎo)致質(zhì)譜特征數(shù)減少的問題,研究人員將micro-UHPLC與離子淌度質(zhì)譜(ion mobility spectrometry-MS,IMS-MS)聯(lián)用,用來增加質(zhì)譜特征的檢出數(shù)量,并提高圖譜質(zhì)量。離子淌度質(zhì)譜是將IMS與質(zhì)譜聯(lián)用的二維質(zhì)譜技術(shù),可提高系統(tǒng)峰容量。通過增加淌度分離維度,提供代謝物分子碰撞截面積(collision cross-section, CCS)信息,實(shí)現(xiàn)異構(gòu)體分辨[21]。如King等[22]使HILIC色譜系統(tǒng)(1 mm×50 mm×1.7 μm)與IMS-HRMS聯(lián)用,建立了適用于極性代謝物分析的micro-HILIC-IMS-HRMS高通量分析方法。采用0.2 μL進(jìn)樣量,檢測到的質(zhì)譜特征數(shù)由micro-HILIC-HRMS法的3 007個(gè)增至6 711個(gè)。與常規(guī)HILIC-HRMS(2.1 mm×150 mm×1.7 μm,3.5 μL進(jìn)樣量)方法相比,分析時(shí)間從10 min縮短至3.3 min,溶劑用量節(jié)約75%,樣本消耗量減少18倍。由于IMS增加了異構(gòu)體分辨,色譜峰明顯變窄,批次間重復(fù)性提高。此外,作者還發(fā)展了基于micro-RPLC-IMS-HRMS(1 mm×50 mm×1.7 μm,0.2 μL進(jìn)樣量)的高通量脂質(zhì)組學(xué)分析方法[23],分析時(shí)間由UHPLC-HRMS(2.1 mm×100 mm×1.7 μm)脂質(zhì)組學(xué)方法的12 min縮短至3.7 min,溶劑用量減少75%;共洗脫脂質(zhì)由于增加了IMS分離,獲得了較好的譜圖質(zhì)量。該方法用于乳腺癌及健康人血漿分析,主成分分析(principal components analysis, PCA)結(jié)果顯示,2組樣本實(shí)現(xiàn)了很好的區(qū)分,方法穩(wěn)定,適合大規(guī)模樣品分析。雖然多項(xiàng)研究結(jié)果表明,micro-UHPLC-HRMS方法可提高分析通量,但由于柱外效應(yīng)[24]以及共流出導(dǎo)致的基質(zhì)效應(yīng),方法的靈敏度受到影響[22]。
納流液相色譜(NanoLC)可以耦合更低流速的nESI技術(shù),與常規(guī)LC-HRMS方法相比,nanoLC-nESI-HRMS具有樣本用量少、有機(jī)溶劑消耗少、基質(zhì)效應(yīng)小、檢測靈敏度高等優(yōu)勢[25]。Danne-Rasche等[26]發(fā)展了基于nanoLC-nESI-HRMS的脂質(zhì)高覆蓋深度分析方法,采用自制的核殼型C18色譜柱(100 μm×30 cm×2.7 μm),進(jìn)樣量1 μL,流速600 nL/min,分析用時(shí)110 min。與傳統(tǒng)的LC-ESI-HRMS(2.1 mm×150 mm×2.7 μm)相比,方法檢測靈敏度和線性動(dòng)態(tài)范圍分別提高了2~3個(gè)和1~2個(gè)數(shù)量級,鑒定到的脂質(zhì)數(shù)量增加了3倍。從釀酒酵母(S.cerevisiae)中鑒定到PA、PE、PC、PS、PG、PI等共447個(gè)磷脂類化合物,其中包括低豐度或者共流出的脂質(zhì)同分異構(gòu)體。進(jìn)一步結(jié)合半自動(dòng)數(shù)據(jù)分析流程,從S.cerevisiae中鑒定到的脂質(zhì)數(shù)目增至894個(gè),共覆蓋26種脂質(zhì)類別,比傳統(tǒng)鳥槍法的鑒定率提高4倍[27]。Luo等[28]則將化學(xué)同位素標(biāo)記(chemical isotope labeling, CIL)與nanoLC-HRMS結(jié)合,進(jìn)一步提高微量樣本的檢測靈敏度。通過采用12C-/13C-丹磺酰氯衍生細(xì)胞裂解液,檢測少量細(xì)胞中的氨基、苯酚類代謝物,樣品用量少(pmol級),即使使用100個(gè)或1 000個(gè)MCF-7乳腺癌細(xì)胞,仍可獲得數(shù)千個(gè)代謝物信息。最優(yōu)條件下,該方法在104個(gè)細(xì)胞中檢測到的代謝物數(shù)量比micro-LC-HRMS方法(0.18 mL/min流速,34 min分析時(shí)長)在105個(gè)細(xì)胞中測得的代謝物數(shù)量增加37%,顯著提高了檢測覆蓋度。
多維液相色譜(multi-dimensional liquid chromatography, MDLC)采用分離機(jī)理不同且相互獨(dú)立的液相色譜柱系統(tǒng),經(jīng)第一維色譜分離的組分在后續(xù)分析過程中不會或很少再混合[29]。與傳統(tǒng)一維色譜方法相比,可以顯著提高柱系統(tǒng)的分離度和峰容量,與高分辨質(zhì)譜技術(shù)聯(lián)用,有望為復(fù)雜代謝組分析提供有效手段。但在線MDLC存在二維流動(dòng)相不兼容,組分轉(zhuǎn)移至第二維過程中存在嚴(yán)重稀釋效應(yīng),以及兩維分離條件的優(yōu)化等制約因素[30],限制了其在代謝組學(xué)研究中的應(yīng)用。針對上述瓶頸問題,本課題組[31-33]提出“分而治之”的研究策略,在基于MDLC-HRMS的代謝組學(xué)分析新技術(shù)方面開展了系統(tǒng)研究。為解決二維流動(dòng)相不兼容和嚴(yán)重稀釋效應(yīng)導(dǎo)致的色譜峰畸變,以及第二維分離度和靈敏度損失問題,研發(fā)了新型停流模式接口[31]。通過引入捕集柱和稀釋液,有效解決了二維溶劑不兼容的問題。此外,第一維和第二維均使用常規(guī)尺寸色譜柱,結(jié)合最佳流速條件,有效避免了第二維高流速帶來的嚴(yán)重稀釋效應(yīng),顯著提高了方法靈敏度和分辨率。在新型停流接口基礎(chǔ)上,發(fā)展HILIC-RPLC-HRMS正交系統(tǒng),其色譜系統(tǒng)峰容量與文獻(xiàn)[34]報(bào)道的全二維液相色譜系統(tǒng)相當(dāng)。采用該系統(tǒng)僅一次進(jìn)樣即可實(shí)現(xiàn)復(fù)雜不同族、不同脂肪酸鏈的脂質(zhì)精細(xì)分離。針對現(xiàn)有2D LC技術(shù)存在的二維色譜正交性不高、稀釋效應(yīng)嚴(yán)重的問題,進(jìn)一步將新型停流模式接口技術(shù)與具有正交分離機(jī)制的多維色譜系統(tǒng)結(jié)合,搭建了一種新型在線三維HILIC-RPLC×RPLC-HRMS系統(tǒng)[32],示于圖1。復(fù)雜樣品組分經(jīng)第一維HILIC色譜柱預(yù)分離,被分割成一定數(shù)量性質(zhì)不同的餾分,再經(jīng)停流接口,使每個(gè)餾分均進(jìn)入RPLC×RPLC全二維系統(tǒng)進(jìn)行分離。以大豆提取物為模型樣本,在同等條件下使用3D HILIC-RPLC×RPLC-HRMS方法鑒定到的黃酮類化合物比傳統(tǒng)全二維液相色譜法增加了30%,顯示了該方法在復(fù)雜樣本代謝組分析中的應(yīng)用價(jià)值。
注:a.系統(tǒng)流路圖;b.3D TIC色譜圖圖1 3D LC/HRMS分析大豆樣品中黃酮類化合物[32]Fig.1 Analysis of soybean extract by 3D LC/HRMS system[32]
在生物樣本中,由于代謝物和脂質(zhì)極性不同,獲取代謝組和脂質(zhì)組信息通常需要2次分析,且由于部分代謝物信息重疊,增加了數(shù)據(jù)處理的復(fù)雜程度。為此,本課題組采用上述新型停流接口技術(shù),發(fā)展了新型停流平行柱2D LC-HRMS系統(tǒng),僅1次進(jìn)樣即可同時(shí)獲取代謝組和脂質(zhì)組的全景信息[33]。具體為:樣本首先經(jīng)第一維預(yù)分離柱,根據(jù)極性分割成2個(gè)餾分,第1個(gè)餾分直接轉(zhuǎn)移至C18色譜柱,并在乙腈-水流動(dòng)相體系下進(jìn)行代謝組學(xué)分析;待C18色譜柱完成分析后,采用疏水性更強(qiáng)的流動(dòng)相洗脫預(yù)分離柱得到第2個(gè)餾分,至T3色譜柱進(jìn)行脂質(zhì)組學(xué)分析。結(jié)果表明,該方法1次進(jìn)樣即可檢測到3 200多個(gè)代謝特征,覆蓋了傳統(tǒng)代謝組學(xué)和脂質(zhì)組學(xué)方法需2次檢測到的99%代謝特征,顯著提升了檢測覆蓋度,特別適合于少量樣品的高覆蓋代謝組學(xué)研究。將該系統(tǒng)進(jìn)一步用于生物體系中不同碳鏈長度?;o酶A的分析,用于解決由于?;o酶A極性跨度大導(dǎo)致的常規(guī)一維LC-HRMS方法覆蓋度低的問題。1次進(jìn)樣有效分離了短鏈、中鏈和長鏈?;o酶A,從肝組織提取物中鑒定到90種酰基輔酶A,是迄今為止最大的肝組織?;o酶A數(shù)據(jù)集[35]。上述結(jié)果均表明,新型停流平行柱2D LC-HRMS系統(tǒng)具有代謝組覆蓋度廣、通量高、重復(fù)性好等優(yōu)點(diǎn),適用于組織、細(xì)胞等生物樣品的代謝組分析。
近年來,針對正交兩維系統(tǒng)溶劑兼容性差的問題,發(fā)展了新型調(diào)制接口并實(shí)現(xiàn)商品化,如活性溶劑調(diào)制[36](active solvent modulation, ASM)以及柱頭稀釋[37](at-column dilution, ACD)技術(shù)。ASM是由Stoll等在2017年研發(fā)的,該接口更適合于第二維是反相色譜的多維系統(tǒng)[38]。通過在第二維色譜柱前使用第二維流動(dòng)相稀釋樣品環(huán)中第一維的洗脫液,使分析物在第二維柱頭聚集,從而改善第二維色譜峰形、分離度與靈敏度。ACD技術(shù)則是Chen等在Waters商業(yè)化的一維色譜ACD技術(shù)基礎(chǔ)上發(fā)展起來的,通過在常規(guī)二維液相裝置接口處額外引入1個(gè)傳輸泵,洗脫樣品環(huán)中的待分析物;該技術(shù)無需分流第一維餾分實(shí)現(xiàn)柱頭稀釋,使用該接口技術(shù)的RP×HILIC-Q-TOF聯(lián)用方法已成功用于植物代謝物分析[39]。MDLC-HRMS由于具有高覆蓋、高分辨率的特性,在復(fù)雜樣品分離分析中得到越來越多的關(guān)注,雖然針對二維匹配的難點(diǎn)問題已提出多個(gè)解決方案,但實(shí)現(xiàn)二維的高效調(diào)制仍是構(gòu)建MDLC-HRMS的關(guān)鍵問題,未來仍需發(fā)展新型接口改善二維流動(dòng)相的兼容性差,進(jìn)一步提高多維柱系統(tǒng)的實(shí)際峰容量和檢測靈敏度[38]。
大規(guī)模代謝組學(xué)分析技術(shù)已成為分子流行病學(xué)、精準(zhǔn)醫(yī)學(xué)以及代謝組全基因組關(guān)聯(lián)研究等領(lǐng)域的重要支撐技術(shù),對理解復(fù)雜疾病(病理)生理機(jī)制以及疾病的診斷、預(yù)防治療等具有重要作用。色譜-高分辨質(zhì)譜聯(lián)用技術(shù)的分析通量受色譜分離時(shí)間制約,且長時(shí)間運(yùn)行會引起色譜保留時(shí)間漂移、重復(fù)性差等問題,限制了其在大規(guī)模代謝組學(xué)研究中的應(yīng)用[11]。直接進(jìn)樣高分辨質(zhì)譜(direct injection HRMS, DI-HRMS)方法無需色譜預(yù)分離,分析時(shí)間、有機(jī)試劑消耗大大降低,適合高通量代謝組學(xué)分析,特別是樣本量受限的微量樣本高通量代謝組學(xué)研究[40]。
DI-ESI-HRMS主要包括流動(dòng)注射(fusion injection, FI)與針泵進(jìn)樣方式。由于缺少色譜分離,ESI-HRMS方法存在基質(zhì)效應(yīng),且無法分辨具有相同m/z的代謝物,代謝物鑒定較為困難。Zhu等[41]發(fā)展了基于FI-FTICR MS的高通量代謝組檢測方法,整個(gè)檢測過程僅需5 min。與高分辨質(zhì)譜相比,由于FTICR MS具有超高的分辨率與質(zhì)量準(zhǔn)確度,定性可靠性更高。將該技術(shù)用于T2D糖尿病標(biāo)志物的發(fā)現(xiàn),顯示出方法的通量高,且具有較好的重復(fù)性。為了提高鑒定準(zhǔn)確度,Zang等[42]將FI-HRMS與IMS結(jié)合,發(fā)展了FI-IMS-HRMS方法,檢測時(shí)長約3 min(另外需要3 min沖洗時(shí)間)。由于增加了代謝物CCS值,提高了代謝物的分離度和定性可靠性,將該方法用于前列腺癌代謝組學(xué)研究,前列腺癌患者的診斷準(zhǔn)確性為88.3%~89.3%、敏感性為88.5%~90.2%,特異性為88.1%。Sarvin等[40]系統(tǒng)地研究了FI-MS方法導(dǎo)致離子抑制效應(yīng)的主要因素,表明離子間競爭是導(dǎo)致質(zhì)譜離子抑制的主要原因,使用靈活可調(diào)控的質(zhì)譜分段采集技術(shù)是提高靈敏度和線性動(dòng)態(tài)范圍的有效策略。
nESI-HRMS采用納升級流速,可在顯著提高通量的同時(shí),降低基質(zhì)效應(yīng),且可避免液質(zhì)聯(lián)用技術(shù)的流動(dòng)相稀釋,實(shí)現(xiàn)高靈敏度分析?;趎ESI-HRMS質(zhì)譜拼接式采集方式的代謝組學(xué)和脂質(zhì)組學(xué)方法已作為范本發(fā)表[43]。通過質(zhì)譜分段采集,有效降低了空間電荷效應(yīng),減小了高豐度物質(zhì)對于低豐度物質(zhì)檢測的影響,提高了檢測靈敏度。Chekmeneva等[44]比較了UHPLC-HRMS和DI-nESI-HRMS兩種方法分析尿液代謝組,以135例人的尿液分析為例,DI-nESI-HRMS分析僅需9 h,遠(yuǎn)遠(yuǎn)少于UHPLC-HRMS所需的5天分析時(shí)長。該研究依據(jù)性別將樣品分為男性和女性2組,雖然DI-nESI-HRMS方法鑒定到的代謝物數(shù)目少于UHPLC-HRMS,但差異代謝物與UHPLC-HRMS高度重合,證明DI-nESI-HRMS可作為一種適合大批量樣本代謝組學(xué)研究的可靠、高通量的快速篩查方法。
代謝物空間分布信息對生物分子作用機(jī)理的研究至關(guān)重要。如NAD+的時(shí)空劃分是其代謝和信號傳導(dǎo)功能的基礎(chǔ),乳酸的定位和運(yùn)輸模式對癌癥的代謝研究具有重要價(jià)值[45]。免疫組化是常用的基于抗體-抗原結(jié)合以顯示組織中特定酶空間分布的方法,但該方法依賴靶向抗體,整個(gè)流程耗時(shí)長,無法非靶向分析未知特征[46]。高分辨質(zhì)譜成像技術(shù)(mass spectrometry imaging, MSI)可以在較高分辨率下顯示代謝物的空間分布信息,檢測覆蓋度廣、無需標(biāo)記。根據(jù)電離方式的不同,目前常用的MSI技術(shù)主要有MALDI MSI、二次離子質(zhì)譜(secondary ion mass spectrometry, SIMS)和Ambient MSI。其中,SIMS方法由于破壞性強(qiáng)、電離效率低,在代謝組質(zhì)譜成像研究中受限[47]。
MALDI-HRMS作為一種可以提供空間分布信息的檢測手段,具有軟電離特性且耐鹽性好等優(yōu)點(diǎn),已被廣泛用于生物成像研究。其中,基質(zhì)對離子化效率起著非常重要的作用。傳統(tǒng)基質(zhì)在小分子代謝物檢測方面存在明顯不足,如低質(zhì)量端存在嚴(yán)重的基質(zhì)背景干擾,基質(zhì)-樣品共結(jié)晶的不均勻性導(dǎo)致信號重復(fù)性差等[48]。近年來,MALDI-HRMS主要集中在發(fā)展樣品前處理技術(shù)、新型基質(zhì)、以及MALDI成像電離裝置等。
對組織表面進(jìn)行孵育衍生化預(yù)處理是提高目標(biāo)代謝物檢測靈敏度及離子化效率的有效手段之一,但存在反應(yīng)耗時(shí)長(1~12 h)、衍生試劑引起的雜質(zhì)干擾、衍生產(chǎn)物移位以及衍生化效率低等問題。Guo等[49]利用激光輔助組織轉(zhuǎn)移方式(laser-assisted tissue transfer, LATT)將噴涂有衍生化試劑和基質(zhì)的厚度為6 μm的組織切片激光銷蝕至1 μm,示于圖2,由于組織切片厚度減小,降低了基質(zhì)效應(yīng),提高了小分子代謝物在組織表面的衍生化效率,顯著縮短了衍生化時(shí)間,并在一定程度上降低了代謝物在衍生化過程中轉(zhuǎn)移的可能性。以氨基代謝物為例,相比于傳統(tǒng)衍生化方式,用4-羥基-3-甲氧基肉桂醛作為衍生化試劑,待測物質(zhì)譜信號強(qiáng)度達(dá)到最高時(shí)的衍生化時(shí)間從8 h縮短至5.4 min,氨基酸、神經(jīng)遞質(zhì)和二肽的MALDI-TOF/TOF MS檢測信號提高20~235倍。
圖2 LATT作用機(jī)理及纈氨酸在組織切片經(jīng)激光銷蝕前后檢測靈敏度對比結(jié)果[49]Fig.2 Mechanism of LATT and enhancement of on-tissue derivatization for valine[49]
新型MALDI有機(jī)基質(zhì)的發(fā)現(xiàn)及合成主要是根據(jù)“試錯(cuò)”原則[50],即從大量化合物中進(jìn)行系統(tǒng)篩選,一般遵循傳統(tǒng)有機(jī)基質(zhì)的化學(xué)特性,如有較強(qiáng)的紫外吸收、真空環(huán)境下低揮發(fā)性和含有酸性或者堿性基團(tuán)。Wang等[51]篩選出一種新型基質(zhì)——肉桂酸衍生物3,4-二甲氧基肉桂酸(3,4-dimethoxycinnamic acid, DMCA),該基質(zhì)具有較強(qiáng)的紫外吸收及較低的基質(zhì)背景干擾,與多種傳統(tǒng)基質(zhì)(2,5-二羥基苯甲酸、α-氰酸-4-羥基肉桂酸、2-硫醇基苯并噻唑、氧化石墨烯和銀納米顆粒)對比顯示,代謝物檢測覆蓋度顯著提升。以大鼠大腦和發(fā)芽紅豆杉種子組織切片為研究對象,在m/z<500范圍內(nèi),新型基質(zhì)分別可以檢測到200、248個(gè)代謝物,而傳統(tǒng)基質(zhì)僅能分別檢測到27~149和9~109個(gè)代謝物。雙極性基質(zhì)能夠顯著拓寬代謝物的檢測覆蓋度,利用同一塊組織切片可以同時(shí)獲得正負(fù)離子模式的代謝物信息。Huang等[52]設(shè)計(jì)并合成了一系列同時(shí)含有氨基和羧基雙官能團(tuán)的鄰氨基苯甲酸衍生物,其中COOH-NHMe在脂類、蛋白質(zhì)等生物分子的正負(fù)離子模式同時(shí)檢測中優(yōu)勢明顯。Horatz等[50]首次將共軛聚合物作為雙極性基質(zhì)應(yīng)用到MALDI成像中,由于聚合物具有大π鍵,可以吸收不同波長的光用于不同紫外波長的儀器;不易揮發(fā)、分子質(zhì)量較大、對低質(zhì)量端干擾小,并且含有烷基側(cè)鏈的大分子聚合物可以溶于有機(jī)溶劑中,在結(jié)晶過程中形成納米級薄膜。通過銀杏葉提取物分析,篩選出4種聚合物候選基質(zhì),最終將聚3-十二基噻吩-2,5-二基(poly(3-dodecylthiophene-2,5-diyl),P3DDT)成功應(yīng)用到小鼠腦組織成像分析中,質(zhì)譜峰數(shù)量與平均峰強(qiáng)度結(jié)果表明,該新型基質(zhì)效果與傳統(tǒng)基質(zhì)2,5-二羥基苯甲酸(正離子模式)和9-氨基吖啶(負(fù)離子模式)相當(dāng)。除有機(jī)基質(zhì)外,具有納米結(jié)構(gòu)的無機(jī)基質(zhì)由于具有結(jié)晶的均勻性、大的比表面積和化學(xué)功能修飾等優(yōu)勢,成為取代有機(jī)基質(zhì)的理想候選材料。Iakab等[48]設(shè)計(jì)了以硅材料為基底,覆蓋金納米顆粒作為激光解吸過程中的固態(tài)靶板,并且在表面修飾親水和疏水基團(tuán)(羥基和烷基),實(shí)現(xiàn)對不同極性代謝物的靶向選擇性提取。正負(fù)離子模式下,均可檢測到手指指紋及動(dòng)物組織中轉(zhuǎn)移到靶板上的代謝物信息。
通過對MALDI成像電離技術(shù)(包括光學(xué)器件)的改進(jìn),可進(jìn)一步提高檢測靈敏度及成像分辨率。Niehaus等[53]通過結(jié)合透射模式幾何的基質(zhì)輔助激光解吸電離質(zhì)譜成像(t-MALDI-MSI)技術(shù)與激光誘導(dǎo)后電離(MALDI-2)方法,開發(fā)了新型t-MALDI-2-MSI離子源,提高了像素分辨率。t-MALDI-MSI的空間分辨率可達(dá)到1 μm甚至更小,但是小像素點(diǎn)下離子豐度會降低,而MALDI-2技術(shù)可以提高脂質(zhì)和代謝物的離子化效率及覆蓋度。通過兩者結(jié)合,再與高分辨質(zhì)譜串聯(lián),可對組織和細(xì)胞培養(yǎng)物實(shí)現(xiàn)亞細(xì)胞水平上的成像分析,最小像素可達(dá)600 nm,多種類別的磷脂和糖脂檢測靈敏度提高了1~3個(gè)數(shù)量級,該結(jié)果表明其在細(xì)胞生物學(xué)的應(yīng)用潛力。
功能代謝物在生物組織中的空間分布有助于理解生物系統(tǒng)中分子的作用機(jī)理,如何在接近生理狀態(tài)下進(jìn)行代謝組學(xué)分析,對組織特異性分子的病理學(xué)研究至關(guān)重要。雖然MALDI MSI成像技術(shù)已在代謝組學(xué)中得到廣泛應(yīng)用,但需要真空環(huán)境,且需要基質(zhì)輔助電離。解吸電噴霧電離(desorption electrospray ionization, DESI)和實(shí)時(shí)直接分析(direct analysis in real time, DART)電離技術(shù)在2004~2005年被相繼報(bào)道,出現(xiàn)了原位電離的概念[54]。其中以DESI為代表的常壓敞開式電離質(zhì)譜成像已被廣泛應(yīng)用于組織成像研究[47]。相較于MALDI成像技術(shù),基于常壓敞開式電離的質(zhì)譜成像方法,樣品前處理簡單甚至無需前處理,無需基質(zhì)輔助離子化,可以有效避免基質(zhì)干擾,在活體原位代謝組學(xué)研究方面極具潛力。
近年來,AIMS技術(shù)的發(fā)展主要包括離子化裝置的研發(fā)與改進(jìn)。鑒于組織樣本的復(fù)雜性和異質(zhì)性,Abliz團(tuán)隊(duì)[55]發(fā)展了一種氣流輔助解吸電噴霧電離質(zhì)譜成像方法(air flow-assisted desorption electrospray ionization, AFADESI-MSI),示于圖3。利用高速氣流將噴霧溶劑霧化形成帶電液滴,帶電液體轟擊組織表面并實(shí)現(xiàn)代謝物的萃取,通過高速空氣流可以實(shí)現(xiàn)大氣壓下帶電離子的遠(yuǎn)距離傳輸,提高檢測靈敏度。該方法用于非靶向代謝組學(xué)分析,使用乙腈-水(8∶2,V/V)作為噴霧溶劑,在自主研發(fā)的成像軟件處理下可得到包括膽堿、多胺、氨基酸、肉堿、核苷、核苷酸、有機(jī)酸、碳水化合物、膽固醇類、膽酸、脂類等在內(nèi)的超過1 500種代謝物,具有覆蓋度高、靈敏度高、動(dòng)態(tài)范圍寬、分析速度快、特異性高等優(yōu)點(diǎn);且代謝物的分布與大鼠腎臟、大鼠腦和人食管癌組織的組織學(xué)結(jié)構(gòu)和生物功能有良好的空間匹配。此外,Hieta等[56]發(fā)展了新型紅外激光波束對焦技術(shù),采用激光消融大氣壓光電離(laser ablation atmospheric pressure photoionization, LAAPPI)和激光消融電噴霧電離(laser ablation electrospray ionization, LAESI)質(zhì)譜成像,實(shí)現(xiàn)了小于100 μm的空間分辨率。LAESI適用于分析小分子和生物大分子,而LAAPPI更適合小分子代謝物和脂質(zhì),兩者具有較好的互補(bǔ)性,結(jié)合使用可以獲得更豐富的生物分子信息。采用該方法分析小鼠大腦組織,獲得了70 μm的空間分辨率。Stopka等[57]將LAESI與超高分辨質(zhì)譜21 T FTICR MS聯(lián)用,直接從生物組織中獲得代謝物的同位素信息,通過對分辨率與靈敏度的權(quán)衡,在珊瑚葉片中共匹配到106個(gè)分子式。
圖3 用于原位組織功能代謝物檢測的高靈敏度、高覆蓋AFADESI-MSI方法的構(gòu)建[54]Fig.3 Strategy to develop a sensitive and wide coverage AFADESI-MSI method for functional metabolites based molecular histology[54]
原位電離質(zhì)譜為代謝組學(xué)研究提供機(jī)遇,但仍面臨一些挑戰(zhàn),如檢測覆蓋度低、數(shù)據(jù)復(fù)雜、定量困難、重復(fù)性差等。進(jìn)一步構(gòu)建基于原位電離質(zhì)譜的公共數(shù)據(jù)庫,實(shí)現(xiàn)方法的標(biāo)準(zhǔn)化和自動(dòng)化、以及發(fā)展現(xiàn)場檢測方法是今后發(fā)展的方向[54]。
隨著代謝組學(xué)技術(shù)的發(fā)展,特別是高分辨質(zhì)譜技術(shù)的迅猛發(fā)展,生物樣本非靶向代謝組學(xué)分析獲得了海量的代謝組數(shù)據(jù)?;诔咝б合嗌V-高分辨質(zhì)譜技術(shù)(UHPLC-HRMS)的非靶向代謝組學(xué)方法1次即可實(shí)現(xiàn)上萬或數(shù)萬個(gè)質(zhì)譜特征(metabolic feature)的檢測,但其中僅1.8%~20%的譜圖信息可被注釋[58-59],代謝組規(guī)模化定性一直是代謝組學(xué)研究亟待解決的瓶頸問題之一[60]。
質(zhì)譜數(shù)據(jù)庫檢索是代謝物鑒定的主要方式,代謝物的收錄情況直接決定了代謝物鑒定的數(shù)量與質(zhì)量。目前已有多個(gè)開源代謝組學(xué)質(zhì)譜數(shù)據(jù)庫,列于表1。如,Metlin數(shù)據(jù)庫目前已收錄近百萬化合物,收錄二級質(zhì)譜(MS/MS)數(shù)量超過4 000 000張[61]。HMDB收錄114 100種化合物,其中2 265種化合物有實(shí)測LC-MS/MS譜圖數(shù)據(jù),98 601種化合物為預(yù)測LC-MS/MS譜圖。為了改進(jìn)數(shù)據(jù)庫檢索鑒定的可靠性及實(shí)現(xiàn)代謝組規(guī)?;b定,本課題組[62]發(fā)展了代謝物標(biāo)準(zhǔn)數(shù)據(jù)庫構(gòu)建策略和方法。從數(shù)據(jù)采集、色譜保留時(shí)間校正、定性分析算法、批量搜索等方面,提出了一整套解決方案,研發(fā)出包括2 000多個(gè)代謝物標(biāo)準(zhǔn)品的LC-HRMSn智能質(zhì)譜數(shù)據(jù)庫。該數(shù)據(jù)庫收錄數(shù)據(jù)均在標(biāo)準(zhǔn)操作條件下獲取,采用反相UHPLC色譜聯(lián)用TripleTOF高分辨質(zhì)譜,正、負(fù)電離模式,15、30、45 eV 3個(gè)碰撞能量。系統(tǒng)中包括代謝物色譜保留時(shí)間、MS1和MS/MS信息等。針對極性化合物,美國加州大學(xué)Oliver Fiehn教授團(tuán)隊(duì)[63]采用HILIC-Q Exactive和TripleTOF高分辨質(zhì)譜,建立了包括保留時(shí)間、MS1、MS/MS信息在內(nèi)的1 100多種標(biāo)樣化合物的開源質(zhì)譜數(shù)據(jù)庫。
表1 代謝組學(xué)常用質(zhì)譜數(shù)據(jù)庫信息統(tǒng)計(jì)Table 1 Public mass spectral database information for metabolomics
雖然已有少數(shù)代謝組數(shù)據(jù)庫可提供色譜保留時(shí)間、精確質(zhì)量數(shù)(MS1)和MS/MS信息,但是基于數(shù)據(jù)庫檢索鑒定代謝物的方法存在許多不足:1) 標(biāo)準(zhǔn)化合物樣品價(jià)格昂貴或難以獲得;2) 實(shí)驗(yàn)MS/MS譜圖有限[64],且MS2譜圖質(zhì)量參差不齊[65],不同類型質(zhì)譜采集的MS/MS差異較大;3) 數(shù)據(jù)庫收錄的代謝物數(shù)目快速增加,但由于代謝組在種類、結(jié)構(gòu)、含量和功能等方面極具多樣性,現(xiàn)有數(shù)據(jù)庫代謝物的覆蓋度仍有限。
基于計(jì)算代謝組學(xué)的質(zhì)譜譜學(xué)預(yù)測(insilico)方法在過去10年間得到快速發(fā)展,已成為代謝組學(xué)分析流程的重要組成部分[66-67]。Insilico脂質(zhì)質(zhì)譜數(shù)據(jù)庫,如LipidBlast[67],Lipid Maps[68]在對具有確定質(zhì)譜碎裂模式的脂質(zhì)鑒定方面發(fā)揮著重要作用,但對于分子結(jié)構(gòu)更為多樣、復(fù)雜的代謝組注釋仍極具挑戰(zhàn)。Insilico質(zhì)譜數(shù)據(jù)已成為目前質(zhì)譜數(shù)據(jù)庫的常用手段,預(yù)測算法包括量子化學(xué)(如QCEIMS)、自啟發(fā)式(LipidBlast)、質(zhì)譜裂解規(guī)則(MS-FINDER,MassFrontier,MetFrag,MAGMa)、機(jī)器學(xué)習(xí)或組合機(jī)器學(xué)習(xí)(CFM-ID[69],CSI:FingerID)等[70]。B?cker等[71]發(fā)展了一種分子結(jié)構(gòu)識別工具——SIRIUS 4,該工具整合了CSI: FingerID和分子結(jié)構(gòu)數(shù)據(jù)庫用于代謝物的快速鑒定。此外,隨著離子淌度質(zhì)譜技術(shù)在代謝組學(xué)領(lǐng)域中的應(yīng)用,將CCS值與高分辨質(zhì)譜結(jié)合來增加代謝物定性的可靠性。朱正江研究員團(tuán)隊(duì)將機(jī)器學(xué)習(xí)算法用于大規(guī)模預(yù)測代謝物CCS值,構(gòu)建CCS數(shù)據(jù)庫,如構(gòu)建了包含35 230個(gè)代謝物預(yù)測CCS的MetCCS[72];包含15 646個(gè)脂質(zhì)預(yù)測CCS的LipidCCS[73];用于脂質(zhì)鑒定的包含m/z、RT、CCS和MS/MS的四維信息的LipidIMMS[73];以及近期構(gòu)建的包含200多萬個(gè)小分子的5 000多個(gè)實(shí)驗(yàn)CCS,1 300多萬個(gè)預(yù)測CCS的AllCCS[74]。
目前,代謝組質(zhì)譜數(shù)據(jù)庫大多為針對未有實(shí)驗(yàn)MS/MS信息的代謝物進(jìn)行insilicoMS/MS預(yù)測[75],而直接預(yù)測代謝物的質(zhì)譜數(shù)據(jù)庫較少[76-77]。其中代表性工作是加拿大阿爾伯特大學(xué)厲良教授團(tuán)隊(duì)[77]研發(fā)的MyCompoundID,其通過對HMDB中收錄的8 021個(gè)已知內(nèi)源性代謝物進(jìn)行insilico生化轉(zhuǎn)化(76種最常見的轉(zhuǎn)化類型),得到375 809個(gè)Ⅰ相代謝產(chǎn)物和10 583 901個(gè)Ⅱ相代謝產(chǎn)物,并預(yù)測了相應(yīng)的insilicoMS/MS。利用該數(shù)據(jù)庫,可將尿樣和血漿中鑒定出的代謝物增加1倍,顯示出其在未知代謝物鑒定方面的潛力。本課題組[78]發(fā)展了一種不依賴于現(xiàn)有數(shù)據(jù)庫/知識庫,實(shí)現(xiàn)已知/未知代謝物規(guī)模化鑒定策略,該方法基于代謝途徑insilico生成代謝物,并研究其質(zhì)譜特征。以植物中羥基肉桂酸酰胺類化合物為例,首先insilico預(yù)測了植物中可能存在的846個(gè)羥基肉桂酸酰胺類化合物,構(gòu)建羥基肉桂酸酰胺數(shù)據(jù)庫,建立了保留時(shí)間預(yù)測模型,并獲取該類物質(zhì)的二級質(zhì)譜特征碎片。采用該方法從實(shí)際樣品中鑒定的數(shù)量比文獻(xiàn)最好水平高1.4~4.1倍,63.6%羥基肉桂酸酰胺在該植物種屬中未見報(bào)道,30.3%羥基肉桂酸酰胺從未在植物中報(bào)道。該方法基于生物代謝生化反應(yīng),突破了物種種屬、組織、時(shí)空特異性帶來的代謝組鑒定瓶頸,特別適合已知/未知次生代謝物的鑒定。但現(xiàn)有insilico代謝物質(zhì)譜數(shù)據(jù)庫及insilicoMS/MS在用于復(fù)雜代謝組鑒定時(shí),仍存在一些不足:1) 采用已知內(nèi)源性代謝物進(jìn)行insilico生化轉(zhuǎn)化,多基于統(tǒng)一的常見生化轉(zhuǎn)化反應(yīng)模式,并未考慮實(shí)際生物體內(nèi)生化反應(yīng)的多樣性和特異性,使得生成的insilico代謝物質(zhì)譜數(shù)據(jù)庫存在大量冗余,同時(shí)覆蓋度很有限;2) 基于質(zhì)譜斷裂規(guī)則的預(yù)測方法,由于規(guī)則種類繁多,可能存在相互沖突;3) 基于特定分子的斷裂規(guī)則,在實(shí)際應(yīng)用中更適合特定類別的代謝物分析。如用于大范圍代謝分子預(yù)測,預(yù)測精度將顯著下降;4) 部分算法有賴于訓(xùn)練集的質(zhì)譜數(shù)據(jù),采用不同訓(xùn)練集,預(yù)測結(jié)果可能不同,鑒定準(zhǔn)確度仍需進(jìn)一步提高[79]。發(fā)展更為高效的代謝物預(yù)測方法以及穩(wěn)健的質(zhì)譜碎裂預(yù)測模式和質(zhì)譜智能解析算法,建立更為全面的代謝物質(zhì)譜數(shù)據(jù)庫,實(shí)現(xiàn)代謝組深度注釋十分必要。
續(xù)表1
隨著基于高分辨質(zhì)譜的分析新技術(shù)不斷出現(xiàn),檢測靈敏度、覆蓋度、通量及代謝物鑒定等方面已取得長足的進(jìn)步,對復(fù)雜生物體代謝小分子的認(rèn)識更加全面與深入,推動(dòng)了代謝組學(xué)的發(fā)展及其應(yīng)用領(lǐng)域的拓展。然而,受生物體系復(fù)雜性及當(dāng)前技術(shù)水平的制約,仍需進(jìn)一步提升分析的精度、分辨率、通量以及不同實(shí)驗(yàn)室間數(shù)據(jù)的可比性、可交換性等;需要關(guān)注難以獲得的小體積樣本、大規(guī)模臨床隊(duì)列樣本的代謝組學(xué)分析;亟待發(fā)展高通量、可重復(fù)的代謝組活體、原位、實(shí)時(shí)檢測技術(shù)以及單細(xì)胞、亞細(xì)胞水平的代謝組學(xué)新技術(shù)、新方法。代謝組規(guī)?;b定一直是制約代謝組學(xué)發(fā)展的瓶頸問題之一,雖然現(xiàn)有代謝組數(shù)據(jù)庫在深度和廣度存在不足,但快速增長的開源質(zhì)譜數(shù)據(jù)庫與共享代謝組數(shù)據(jù)集為代謝組規(guī)模化定性提供機(jī)遇。計(jì)算代謝組學(xué)方法有助于譜學(xué)數(shù)據(jù)的注釋,但可靠性和準(zhǔn)確性仍有待提高,如何結(jié)合代謝物結(jié)構(gòu)數(shù)據(jù)庫、增加新的分離維度信息、發(fā)展新型智能學(xué)習(xí)算法以提高計(jì)算代謝組學(xué)工具的注釋能力和準(zhǔn)確性是今后的發(fā)展方向。此外,生物體代謝調(diào)控網(wǎng)絡(luò)極其復(fù)雜,從全局規(guī)模上認(rèn)識細(xì)胞生物功能,需與其他組學(xué)數(shù)據(jù)進(jìn)行有效整合,多學(xué)科的交叉融合將極大促進(jìn)代謝組學(xué)的發(fā)展。