宋正陽(yáng) 蔣春明
遺傳病是指遺傳物質(zhì)改變所致基因功能異常而導(dǎo)致的一類疾病,按遺傳方式可分為單基因遺傳病、多基因遺傳病、線粒體遺傳病和染色體病。單基因遺傳病,即孟德?tīng)栠z傳病,是指由一對(duì)等位基因控制的疾病。遺傳學(xué)分子診斷是指應(yīng)用分子遺傳學(xué)技術(shù)對(duì)染色體、基因組、DNA序列等進(jìn)行檢測(cè),判斷患者是否存在遺傳物質(zhì)突變。其中,DNA測(cè)序技術(shù)是最重要的分子診斷手段之一。迄今為止,仍有很大一部分遺傳病仍不能被明確遺傳病因,因此,越來(lái)越多的新技術(shù)被應(yīng)用于遺傳病診斷領(lǐng)域。
組學(xué)是指對(duì)生物系統(tǒng)中的基因、蛋白質(zhì)或代謝物進(jìn)行高通量整體分析的技術(shù),其中基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等已在臨床和基礎(chǔ)領(lǐng)域發(fā)揮了重要的作用,并被逐漸引入遺傳病領(lǐng)域,多組學(xué)技術(shù)也日漸被重視。本文就多組學(xué)技術(shù)在單基因遺傳病領(lǐng)域的應(yīng)用現(xiàn)狀和進(jìn)展作一綜述。
隨著現(xiàn)代醫(yī)學(xué)不斷發(fā)展、組學(xué)技術(shù)不斷進(jìn)步,如何突破單一組學(xué)研究的局限性成為了目前的研究熱點(diǎn)。將不同組學(xué)聯(lián)合應(yīng)用于遺傳病的診斷,即將基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等多種組學(xué)數(shù)據(jù)相結(jié)合的多組學(xué)綜合分析方法,在理解復(fù)雜疾病的病理生理方面引起了人們的重視。
1.1 基因組學(xué)
1.1.1 靶向捕獲基因測(cè)序 靶向捕獲基因測(cè)序也稱基因panel,臨床上將多個(gè)基因或多個(gè)位點(diǎn)按照一定標(biāo)準(zhǔn)進(jìn)行選擇和組合,從而檢測(cè)出對(duì)遺傳病有診治意義的基因。其原理是將若干靶基因?qū)?yīng)的探針設(shè)計(jì)到同一張芯片上以捕獲目標(biāo)DNA并用于后續(xù)檢測(cè)。對(duì)于遺傳特征明確的可疑疾病,基因panel檢測(cè)通常比全外顯子測(cè)序(whole exome sequencing,WES)、全基因組測(cè)序(whole genome sequencing,WGS)有更高的診斷率,因?yàn)槠錅y(cè)序深度更高,靈敏度和特異度更好[1]。不同基因panel的診斷率各不相同,容易受到panel設(shè)計(jì)方案和遺傳表型及遺傳特征識(shí)別的影響。因此,在診斷不確定的情況下,選擇其他測(cè)序方法可能更合適。
基因panel是目前臨床上診斷各種明確表型或疾病的常規(guī)選擇,廣泛應(yīng)用于先天性肌無(wú)力綜合征等神經(jīng)肌肉疾病,遺傳性眼病、遺傳性運(yùn)動(dòng)障礙等遺傳性疾病的病因診斷。
1.1.2 WES 目前認(rèn)為,僅占人類全基因組1%左右的外顯子區(qū)域,包含了85%的致病性變異,可以通過(guò)外顯子組測(cè)序直接識(shí)別孟德?tīng)栠z傳病的致病基因,其中WES對(duì)遺傳病診斷和新致病基因的發(fā)現(xiàn)具有重要價(jià)值。WES是一種靶向候選基因外顯子區(qū)域序列的測(cè)序方法,需要通過(guò)分子雜交和PCR擴(kuò)增技術(shù)來(lái)富集目標(biāo)序列。WES主要靶向蛋白質(zhì)編碼區(qū)序列,也可能包含一些重要的基因調(diào)控區(qū),如啟動(dòng)子、5'-UTR等側(cè)翼區(qū)域,使得遺傳信息更全面,從而更有效地鑒定致病性變異。Platt等[2]在原發(fā)性免疫缺陷疾病的臨床診治中發(fā)現(xiàn),與基因panel相比,WES可簡(jiǎn)化工作流程,降低成本,并提高發(fā)現(xiàn)新的遺傳性疾病的能力。
Salfati等[3]研究報(bào)道,在12個(gè)月后對(duì)未確診的患者進(jìn)行重分析可使診斷率提高11%,這使得WES與傳統(tǒng)基因panel相比性價(jià)比更高。隨著變異分類工具改進(jìn)、基因數(shù)據(jù)庫(kù)和臨床表型識(shí)別的完善,WES數(shù)據(jù)重分析可能是提高孟德?tīng)栠z傳病的診斷效能的重要手段。
盡管WES對(duì)孟德?tīng)栠z傳病的分子遺傳學(xué)診斷具有劃時(shí)代意義,但是臨床上仍有50%~75%的孟德?tīng)栠z傳病無(wú)法通過(guò)WES得到基因診斷[4]。推測(cè)可能是因?yàn)閃ES僅覆蓋了基因組約2%的區(qū)域,無(wú)法檢測(cè)非編碼區(qū)所含有的對(duì)細(xì)胞發(fā)育和生物學(xué)至關(guān)重要的調(diào)控區(qū)域。非編碼區(qū)中存在影響RNA轉(zhuǎn)錄豐度的序列,其調(diào)控蛋白質(zhì)表達(dá)在很多復(fù)雜的性狀和疾病中發(fā)揮了關(guān)鍵性作用。
當(dāng)前,WES已是孟德?tīng)栠z傳病診斷中最常用的二代測(cè)序技術(shù),診斷率可達(dá)到25%~52%,采用家系檢測(cè)可再提高16%的診斷率[5]。WES在神經(jīng)系統(tǒng)疾病的診斷陽(yáng)性率可高達(dá)30.6%,遠(yuǎn)高于非神經(jīng)系統(tǒng)遺傳病的陽(yáng)性率(如皮膚系統(tǒng)17.2%、血液系統(tǒng)疾病17.1%);對(duì)于癲癇或共濟(jì)失調(diào)的表型,WES檢測(cè)的總體診斷率達(dá)36.1%[6]。在明確家系遺傳傾向的情況下,WES的診斷率明顯超過(guò)了其他遺傳診斷方法,如染色體微陣列分析或基因panel檢測(cè)。隨著技術(shù)的成熟,WES已廣泛應(yīng)用于癲癇、阿爾茨海默病、腦性癱瘓等神經(jīng)系統(tǒng)疾病的臨床診斷。
1.1.3 WGS WGS是一種不受捕獲步驟和擴(kuò)增反應(yīng)限制的技術(shù),對(duì)包括非編碼區(qū)在內(nèi)的整個(gè)基因組進(jìn)行測(cè)序和數(shù)據(jù)分析,能夠更好地覆蓋單核苷酸變異、插入和缺失和結(jié)構(gòu)變異(structure variantions,SVs),包括較短和較大的拷貝數(shù)變異[7]。雖然目前提供的覆蓋深度低于WES,但WGS不需要外顯子捕獲或其他富集策略,在檢測(cè)內(nèi)含子區(qū)域的致病變異方面有較高的效能。但當(dāng)前對(duì)全基因組尤其是非編碼序列的致病性認(rèn)識(shí)尚不充分,缺乏足夠的分析數(shù)據(jù)庫(kù),且WGS對(duì)海量測(cè)序數(shù)據(jù)的處理(包括生物信息過(guò)濾、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和解釋)需要耗費(fèi)生信學(xué)家、遺傳學(xué)家和臨床醫(yī)生大量的時(shí)間,WGS測(cè)序成本也較WES高,使得WGS的臨床應(yīng)用受到顯著限制[8]。
目前研究認(rèn)為WGS具有廣泛的適用性,可顯著提高臨床診斷率。大量薈萃分析發(fā)現(xiàn)WGS診斷率幾乎是WES的兩倍,早期找到病因可有效改善患者的診治和預(yù)后,降低家庭復(fù)發(fā)風(fēng)險(xiǎn),因此認(rèn)為WGS比WES具有更高的性價(jià)比[7]。有研究發(fā)現(xiàn)WGS可用于識(shí)別阿爾茨海默病相關(guān)的罕見(jiàn)基因變異,特別是外顯子組之外的變異[9],在脊髓小腦共濟(jì)失調(diào)等神經(jīng)系統(tǒng)疾病中應(yīng)用WGS的可行性和效能也得到了肯定[10]。盡管現(xiàn)在WGS尚未在遺傳性疾病的臨床診治上得到廣泛應(yīng)用,但這該方法為更全面揭示遺傳性疾病的病因和發(fā)病機(jī)制提供了技術(shù)保障。
1.1.4 第三代測(cè)序技術(shù)(third-generation sequencing,TGS) TGS即長(zhǎng)讀長(zhǎng)測(cè)序/單分子測(cè)序技術(shù),其特點(diǎn)是實(shí)時(shí)單分子測(cè)序,包括單分子實(shí)時(shí)測(cè)序和納米孔測(cè)序兩類技術(shù)。TGS是遺傳學(xué)領(lǐng)域的里程碑式的技術(shù)革新,實(shí)現(xiàn)了對(duì)每一條DNA分子單獨(dú)測(cè)序,測(cè)序過(guò)程無(wú)需進(jìn)行PCR擴(kuò)增,保留了二代測(cè)序的速度和通量?jī)?yōu)勢(shì),且彌補(bǔ)了二代測(cè)序讀數(shù)相對(duì)較短、難以檢測(cè)到較大的SVS等不足。相比于第二代測(cè)序(next-generation sequencing,NGS),長(zhǎng)讀長(zhǎng)是 TGS的關(guān)鍵優(yōu)勢(shì),而通量低、錯(cuò)誤率高和成本高是TGS的顯著缺陷[11]。臨床上,可以通過(guò)短讀長(zhǎng)的NGS來(lái)修正TGS的長(zhǎng)讀長(zhǎng)片段測(cè)序的局限性[12]。目前TGS主要用于全基因組denovo測(cè)序、甲基化研究、點(diǎn)突變檢測(cè)、特殊基因區(qū)域等檢測(cè)[13],例如癲癇、X連鎖性肌張力障礙-帕金森病等神經(jīng)系統(tǒng)遺傳疾病。
TGS可能在不久的將來(lái)成為一種標(biāo)準(zhǔn)的罕見(jiàn)病診斷工具。最近研究顯示,TGS有助于明確其他基因檢測(cè)方法均無(wú)法檢測(cè)到的SVs,可協(xié)助驗(yàn)證生殖細(xì)胞基因組的結(jié)構(gòu)變異和分類,這對(duì)遺傳病篩查和干預(yù)具有重要意義[14]。
1.2 蛋白質(zhì)組學(xué) 單基因遺傳疾病通常是由于特定基因中的位點(diǎn)變異所導(dǎo)致的蛋白質(zhì)質(zhì)量異常所致。蛋白質(zhì)組學(xué)是鑒定和定量細(xì)胞、組織或有機(jī)體中全部蛋白質(zhì)的一種技術(shù),包括對(duì)蛋白質(zhì)的結(jié)構(gòu)和功能、表達(dá)和翻譯后修飾、蛋白質(zhì)之間的相互作用等的研究[15]。蛋白質(zhì)組學(xué)對(duì)疾病的早期診斷、動(dòng)態(tài)監(jiān)測(cè)和預(yù)后評(píng)估至關(guān)重要。隨著人類蛋白質(zhì)組計(jì)劃的開(kāi)展和臨床蛋白質(zhì)組學(xué)技術(shù)的推進(jìn),當(dāng)前只需要微量的體液(血漿或尿液等)或組織樣本就能夠可靠地檢測(cè)到>90%的人類蛋白質(zhì),促進(jìn)了臨床應(yīng)用。然而,要提高蛋白質(zhì)組學(xué)技術(shù)的可重復(fù)性和性能,還需要進(jìn)一步的努力。多年來(lái),蛋白質(zhì)組學(xué)技術(shù)的應(yīng)用一直面臨嚴(yán)峻挑戰(zhàn)和技術(shù)難題,結(jié)果受到蛋白質(zhì)譜動(dòng)態(tài)濃度范圍較大、剪接變體和翻譯后修飾等復(fù)雜因素的影響。近年來(lái),蛋白質(zhì)組學(xué)技術(shù)的靈敏度得到了極大的提高,也具有更大的覆蓋范圍。將蛋白質(zhì)組學(xué)和遺傳學(xué)、細(xì)胞生物學(xué)方法相結(jié)合來(lái)研究疾病相關(guān)變異的細(xì)胞生物學(xué)功能,有助于識(shí)別與疾病相關(guān)的蛋白分子,并可為遺傳性疾病的發(fā)病機(jī)制研究、臨床診斷和治療提供新思路。在亨廷頓病[16]、遺傳性中性粒細(xì)胞減少癥[17]、線粒體疾病[18]等疾病領(lǐng)域的研究結(jié)果顯示,蛋白質(zhì)組學(xué)在遺傳病診斷中具有較高的應(yīng)用價(jià)值。
因此,不斷發(fā)展的蛋白質(zhì)組學(xué)技術(shù)將加深人們對(duì)遺傳疾病的理解、診斷和管理,有利于對(duì)疾病診療實(shí)施精準(zhǔn)的指導(dǎo)。
1.3 代謝組學(xué) 基因組學(xué)或蛋白質(zhì)組學(xué)分析僅反映了部分生命活動(dòng),尚不足以解釋人類遺傳代謝性疾病的復(fù)雜性。代謝組學(xué)是20世紀(jì)90年代中期發(fā)展起來(lái)的一門新興學(xué)科,多用于研究相對(duì)分子質(zhì)量1 000內(nèi)的小分子代謝物,是遺傳代謝性疾病臨床診斷的重要依據(jù)。代謝組學(xué)分析能描述某種組織細(xì)胞的特定病理生理狀態(tài),并對(duì)其進(jìn)行定性和定量分析,其基本的研究方法分為靶向和非靶向兩種。這兩種方法可聯(lián)合用于對(duì)代謝產(chǎn)物的鑒定和定量,以及代謝相關(guān)分子標(biāo)志物的分析研究。由于樣本收集和儲(chǔ)存的條件會(huì)影響代謝物的豐度[19],因此,標(biāo)本穩(wěn)定性是代謝組學(xué)技術(shù)發(fā)展必須要克服的問(wèn)題之一。
隨著WES的應(yīng)用逐漸廣泛,發(fā)現(xiàn)了很多與臨床表型相關(guān)但致病性不確定的變異,結(jié)合代謝組學(xué)技術(shù)可為其得到更準(zhǔn)確的基因診斷提供實(shí)驗(yàn)室證據(jù)。臨床上,代謝組學(xué)技術(shù)多用于檢測(cè)和監(jiān)測(cè)先天性代謝異常[20],已有多個(gè)研究報(bào)道了代謝組學(xué)技術(shù)成功應(yīng)用于先天性銅代謝障礙等疾病[21-22],代謝組學(xué)技術(shù)是下一代遺傳代謝病的重要篩查技術(shù)。
1.4 轉(zhuǎn)錄組學(xué) 轉(zhuǎn)錄組是特定組織或細(xì)胞在某一發(fā)育階段或功能狀態(tài)下轉(zhuǎn)錄出來(lái)的所有RNA的總和,主要包括mRNA和非編碼RNA。由于受到當(dāng)前測(cè)序技術(shù)和基因功能認(rèn)識(shí)的限制,學(xué)者推測(cè)很多遺傳性疾病可能是由于轉(zhuǎn)錄水平發(fā)生各種異常而導(dǎo)致的,因此不可能僅依靠基因組測(cè)序來(lái)解決。轉(zhuǎn)錄組測(cè)序(RNA-sequence,RNA-Seq)是一種可以對(duì)特定時(shí)空狀態(tài)下的器官組織進(jìn)行轉(zhuǎn)錄組分析的高通量測(cè)序技術(shù),可以直接檢測(cè)RNA豐度和RNA序列的變異,彌補(bǔ)了DNA遺傳信息的局限性[4],具有高精度、高靈敏度和高穩(wěn)定性的特點(diǎn),可提高遺傳性疾病的臨床診斷率[23]。這為RNASeq作為一種DNA測(cè)序的補(bǔ)充手段的臨床應(yīng)用提供了重要依據(jù)。但由于轉(zhuǎn)錄組存在高度的時(shí)間、空間特異性,如何選擇最佳的組織進(jìn)行檢測(cè)是臨床面臨的重要挑戰(zhàn)[24]。此外,RNA-Seq對(duì)數(shù)據(jù)存儲(chǔ)要求較高,其數(shù)據(jù)的生物信息學(xué)解讀難度大,都限制了臨床應(yīng)用。雖然現(xiàn)已有表達(dá)變異分析技術(shù)等輔助工具來(lái)幫助分析轉(zhuǎn)錄組測(cè)序數(shù)據(jù)[25],但臨床解讀仍是巨大挑戰(zhàn)。
近年來(lái),已有較多研究將其成功應(yīng)用于線粒體疾病和神經(jīng)肌肉疾病等先天性代謝性疾病的臨床。研究證實(shí),RNA-Seq有助于甲基丙二酸尿癥[26]、線狀體肌病[27]、罕見(jiàn)遺傳性皮膚病[28]等疾病的臨床診斷;尤其適用于WES陰性的累及皮膚肌肉相關(guān)遺傳性疾病的患者,因?yàn)榧∪?、成纖維細(xì)胞等組織容易獲取且適于RNA-Seq 檢測(cè)[29]。
綜上所述,雖然目前RNA-Seq不是診斷孟德?tīng)栠z傳病的常規(guī)診斷技術(shù),但確是提高罕見(jiàn)遺傳病分子診斷的重要補(bǔ)充診斷技術(shù)。
隨著現(xiàn)代醫(yī)學(xué)和組學(xué)技術(shù)的不斷進(jìn)步,如何突破單一組學(xué)研究的局限性已成為當(dāng)前該領(lǐng)域的研究熱點(diǎn)。將不同組學(xué)技術(shù)聯(lián)合應(yīng)用于遺傳性疾病的診斷,即將基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等多種組學(xué)數(shù)據(jù)相結(jié)合的多組學(xué)綜合分析方法,在理解復(fù)雜疾病的病因機(jī)制方面日益受到人們的重視。
聯(lián)合應(yīng)用NGS和代謝組學(xué)篩查可以發(fā)現(xiàn)新的致病基因和生物標(biāo)志物[30],可提高遺傳性代謝缺陷病的診斷效能,進(jìn)一步提高診斷率和縮短診斷時(shí)間[31]。研究發(fā)現(xiàn),基因組學(xué)與其他多組學(xué)數(shù)據(jù)的整合分析,可有效提高單基因遺傳病的診斷效能和明確潛在的治療靶點(diǎn),從而實(shí)現(xiàn)早診早治和改善預(yù)后,例如將基因組和轉(zhuǎn)錄組聯(lián)合應(yīng)用可提高阿爾茨海默病[32]、特異性皮炎[33]等疾病的精準(zhǔn)診治。迄今為止,臨床上已經(jīng)開(kāi)發(fā)了大量針對(duì)單基因遺傳病診斷的多組學(xué)聯(lián)合檢測(cè)技術(shù)和多組學(xué)數(shù)據(jù)整合分析工具,來(lái)提高遺傳罕見(jiàn)病的分子診斷效能,但該領(lǐng)域仍進(jìn)展緩慢。
隨著多組學(xué)技術(shù)的突破,基因組、轉(zhuǎn)錄組、蛋白質(zhì)組和代謝組等生命信息將對(duì)單基因遺傳病的診斷和治療發(fā)揮越來(lái)越重要的作用。今后的研究應(yīng)該使用系統(tǒng)生物學(xué)方法整合多組學(xué)數(shù)據(jù),并積極運(yùn)用于遺傳性疾病的診斷和治療領(lǐng)域。在將多組學(xué)技術(shù)引入臨床實(shí)踐的過(guò)程中,存在一些問(wèn)題尚待解決[34]。首先,要克服不同組學(xué)技術(shù)的臨床局限性,深入理解多組學(xué)數(shù)據(jù)的潛在生命疾病信息;其次,要開(kāi)發(fā)多組學(xué)數(shù)據(jù)之間的整合分析技術(shù)和平臺(tái),揭示數(shù)據(jù)的互補(bǔ)性和整體性,以推動(dòng)高特異度和靈敏度的生物標(biāo)志物的發(fā)現(xiàn);再次,要解決由于樣本收集、處理、儲(chǔ)存和運(yùn)輸?shù)犬a(chǎn)生的影響,以及不同制造商生產(chǎn)的組學(xué)圖譜平臺(tái)的技術(shù)差異;最后,多組學(xué)數(shù)據(jù)安全和患者隱私等倫理問(wèn)題尚待深入研究解決。此外,要建設(shè)規(guī)范的多組學(xué)醫(yī)學(xué)遺傳診斷模式,組建臨床醫(yī)生、實(shí)驗(yàn)室專業(yè)人員、生物學(xué)家、甚至律師和倫理專家等多個(gè)領(lǐng)域?qū)<业亩鄬W(xué)科遺傳病診斷團(tuán)隊(duì),以開(kāi)啟基于多組學(xué)數(shù)據(jù)整體解讀的未來(lái)單基因遺傳病診斷時(shí)代。