姚如恩,傅啟華,郁婷婷△
1.上海交通大學醫(yī)學院附屬上海兒童醫(yī)學中心遺傳分子診斷科,上海 200127;2.上海市兒科臨床分子診斷重點實驗室,上海 200127
全基因組測序(WGS)技術是利用計算機科學和生物技術結合的方法,對生物體整個基因組序列進行測序,并分析其遺傳信息的基因檢測技術。相比其他分子檢測技術,WGS技術具有檢測基因組所有區(qū)域內(nèi)幾乎所有類型遺傳變異的重要優(yōu)勢。近年來,基因測序技術的快速發(fā)展,尤其是國產(chǎn)測序儀的不斷推出和優(yōu)化,推動著測序成本的降低,使得WGS技術越來越多地應用于臨床診斷。特別是在遺傳病診斷領域中,WGS技術已經(jīng)逐漸展現(xiàn)出強大的診斷實力和廣泛的應用前景。
目前在遺傳病基因診斷、腫瘤基因檢測、個體化用藥研究等臨床應用中,靶向測序和全外顯子組測序(WES)已經(jīng)得到臨床廣泛認可,但由于技術特點,這些測序方法在檢測結構變異(SV)、深度內(nèi)含子區(qū)等方面仍存在局限性。隨著基因檢測技術的大規(guī)模推廣、臨床研究的不斷深入,復雜致病變異不斷涌現(xiàn),亟需更加全面的檢測手段。WGS技術對受檢者基因組中的全部DNA序列進行檢測,不僅覆蓋了全部基因的外顯子序列,也覆蓋了內(nèi)含子序列和基因間序列,同時WGS技術可有效避免在對相關基因組區(qū)域進行靶向富集時產(chǎn)生的技術性擴增偏差,不僅可以檢出單個核苷酸變異(SNV)、堿基插入缺失(InDel)、拷貝數(shù)變異(CNV),還可以對SV進行分析,并可以常規(guī)性地對線粒體基因組(mtDNA)變異進行分析,極大地擴展了檢測范圍,同時其操作步驟相對簡化,能更加快速地獲得更完整的基因組信息。隨著近年臨床實踐及科學研究的不斷深入,WGS技術的應用也在不斷拓展,在藥物基因組學、腫瘤及感染性疾病的基因組學研究等多方面的應用進一步成熟,WGS技術已逐漸成為分子診斷領域的重要技術平臺和研究工具。
基因組學的發(fā)展推動了遺傳病診斷的革新與轉(zhuǎn)變,在已經(jīng)發(fā)布的WGS技術臨床應用專家共識中指出,WGS技術應用于臨床遺傳病診斷可以提高診斷率,縮短診斷流程,節(jié)省時間及降低診療費用[1]。目前WGS技術的適應證范圍主要為高度懷疑為遺傳病,但前期一種或多種遺傳學檢測未獲得明確分子診斷的病例[1]。多項研究和實踐已經(jīng)證明,WGS技術有助于臨床快速診斷疾病,幫助患者家庭避免漫長的診斷過程,從而及時為患者提供個性化的治療方案[2-10]。WGS在技術上的優(yōu)勢及特點,已在許多遺傳病的分子診斷過程中得到了充分的體現(xiàn),促進了遺傳病診療水平的提高。
1.1出生缺陷及遺傳綜合征 在出生缺陷防控中,基因診斷是極其重要的一個環(huán)節(jié),WGS技術已經(jīng)在許多出生缺陷及遺傳綜合征的臨床診斷中展現(xiàn)出更好的診斷效率。在一項針對22例Rubinstein-Taybi綜合征患兒的隊列研究中,研究者比較了高分辨率熔解曲線分析、染色體芯片分析(CMA)、靶向測序、WES和WGS等多項基因檢測技術在該綜合征診斷中的應用,發(fā)現(xiàn)其中4例患兒的變異位于致病基因的5′端非翻譯區(qū)、內(nèi)含子區(qū)等非編碼區(qū),結合此類疾病患兒表型的多樣性,提示W(wǎng)GS技術是針對此類疾病患兒診斷的有效檢測技術[2]。目前在產(chǎn)前診斷領域中,針對超聲異常胎兒的分子診斷主要還是采用序貫檢測方法,即先采用CMA或低深度全基因組拷貝數(shù)測序(CNV-seq)技術分析染色體拷貝數(shù)異常,如CMA/CNV-seq檢測結果陰性則進一步采用WES技術排查單基因病。一項針對WGS技術在產(chǎn)前診斷中的應用的前瞻性研究顯示,在結構異常胎兒的產(chǎn)前診斷中,WGS技術與CMA/WES序貫檢測方法相比,具有檢測更全的基因組變異類型、較短的報告周期以及較低的DNA用量等優(yōu)勢[3]。
1.2神經(jīng)系統(tǒng)遺傳病 相對于WES技術,WGS技術在神經(jīng)系統(tǒng)遺傳病的基因診斷中更為高效,可獲得更高的診斷率。在一項線粒體基因和核基因檢測均陰性的以腦病、癲癇等神經(jīng)系統(tǒng)異常為主要臨床表現(xiàn)的患者隊列研究中,通過WGS技術的應用,以及個性化定制的生物信息學分析流程、針對性的表型及功能學實驗驗證等,可將診斷率從16.7%提高到31.4%[4]。同時WGS技術對于SV的檢測效果顯著,如PACOT等[5]通過WGS技術成功鑒定到1型神經(jīng)纖維瘤患兒NF1基因啟動子區(qū)域至第一外顯子之間大小為24.6 kb的嵌合缺失。
1.3肌肉系統(tǒng)疾病 WGS技術可用于肌萎縮性肌無力癥、肌營養(yǎng)不良等肌肉系統(tǒng)遺傳病的診斷。臨床上常見部分肌肉疾病患者,其病史和/或肌肉活檢結果高度提示遺傳病可能,但無法通過WES技術檢測中得到準確的診斷,強烈提示變異可能位于致病基因深部內(nèi)含子區(qū)域或其他非編碼區(qū)域。如PLUTA等[6]利用WGS技術檢測發(fā)現(xiàn)3號染色體上SGCG基因和LINC00621基因的純合子倒位變異,產(chǎn)生融合基因LINC00621-SGCG,造成SGCG基因翻譯異常,導致常染色體隱性遺傳性肢帶肌營養(yǎng)不良癥5型;ZAUM等[7]和GON?ALVES等[8]分別利用WGS技術檢測發(fā)現(xiàn)DMD基因44號內(nèi)含子和Xq13.3區(qū)域發(fā)生臂間倒位、第74號內(nèi)含子和PRDX4基因上游區(qū)域的重排等特殊類型的變異,從而確診以往WES技術檢測無法明確病因的假肥大性肌營養(yǎng)不良病例,為此類患者的精準診治提供了重要的遺傳學證據(jù)。
1.4遺傳代謝性疾病 家族性高膽固醇血癥(FH)最常見的致病基因為低密度脂蛋白受體(LDLR)基因,LDLR基因致病性突變的人群發(fā)病率較高,大約50%的LDLR雜合子基因突變在40~50歲會發(fā)展為各種類型的心血管疾病,因此通過基因檢測早期診斷或篩查LDLR基因致病性突變,對于高膽固醇血癥及相關心血管系統(tǒng)疾病的防治有著重要的作用。在一項針對FH患者的分子診斷研究中,通過WGS技術檢測到LDLR基因Alu序列之間的非等位基因同源重組引起的拷貝數(shù)重復,并準確定位變異的位置及斷裂位點,從而實現(xiàn)精準診斷[9]。隨著測序成本的不斷降低,WGS技術以其強大的檢測能力可能在未來被廣泛應用于遺傳代謝病的分子診斷,甚至可能擴展應用于疾病篩查。有研究通過對比常規(guī)串聯(lián)質(zhì)譜技術和WGS技術在新生兒疾病篩查中的應用,發(fā)現(xiàn)WGS技術不僅降低了假陽性結果的發(fā)生,還在特定疾病和目標基因中發(fā)現(xiàn)更多具有臨床意義的致病突變位點和CNV,為未來WGS技術在疾病篩查領域的應用提供了新的思路[10]。
WGS技術作為綜合、全面的變異檢測方法,在腫瘤基礎研究和臨床診斷中的應用成果層出不窮。越來越多的證據(jù)顯示,該技術在腫瘤精準檢測方面有其獨特的優(yōu)勢,有充分的潛力成為腫瘤研究和臨床診斷更佳的選擇[11-12]。
通過WGS技術檢測可以得到腫瘤患者全基因組數(shù)據(jù),揭示患者腫瘤樣本中的突變特征、DNA損傷等信息,為分析其致瘤作用提供全方位視角。有研究團隊利用WGS技術揭示了22種轉(zhuǎn)移性實體瘤的全基因組變化特征,證明WGS技術在癌轉(zhuǎn)移研究中發(fā)揮重要作用[11];在腫瘤變異檢測研究中,通過采用WGS、WES和RNA-Seq 3種不同的測序方法,對78例兒科腫瘤樣本進行變異檢測及交叉驗證,結果顯示W(wǎng)GS技術能極大提升腫瘤變異檢測的靈敏度和準確度,對于低腫瘤純度或高腫瘤內(nèi)異質(zhì)性樣本的檢測極具潛力[12]。WGS技術在變異檢測及腫瘤變異數(shù)據(jù)深度挖掘方面展現(xiàn)出高度的敏感性、全面性和準確性,該技術將在腫瘤基礎研究和臨床診斷方面的應用發(fā)揮不可替代的重要作用。
藥物遺傳學的揭示有望實現(xiàn)個體化用藥,WES技術應用于藥物遺傳學的不足之處在于其缺失部分編碼區(qū)的捕獲探針,對含鳥嘌呤胞嘧啶(GC)序列的敏感性較差,以及對于一些非外顯子區(qū)域的藥物遺傳學變異信息無法分析,包括CYP2C19*17、CYP3A5*3、UGT1A1*28/*37和VKORC1*2等[13]。而WGS從技術上更適合個體化用藥研究,WGS技術檢測及分析可以幫助識別患者對某些藥物的敏感性或耐受性,從而提高藥物的療效和降低不良反應的風險,因此個體化用藥也是WGS技術今后臨床應用的一個重要場景。
目前,WGS技術在個體化用藥中的應用包括在急性早幼粒細胞白血病患者中鑒別隱匿的融合基因和指導治療方案[14];在惡性腫瘤患者中,通過WGS技術檢測分析識別體細胞驅(qū)動突變和指導抑制突變的治療[15];在非瘤樣病變的治療中,用于鑒別華法林敏感性生殖細胞系多態(tài)性并指導用藥劑量[16];進行多巴-反應性肌張力障礙患者的疾病鑒別診斷進而指導臨床用藥等[17]。盡管WGS技術在個體化用藥中已經(jīng)取得了實質(zhì)性進展,但目前其臨床應用還不夠完善,未來通過在基因組信息全面評估的基礎上進行藥物治療的個性化評分,結合藥物基因突變作用的精確預測和其他患者特異性因素,有望最終達到基于藥物基因組學的精準治療和安全用藥的目的。
通過WGS技術,可以評估家族成員的遺傳風險,以便提供遺傳咨詢服務。WGS技術可以幫助識別患者潛在的疾病風險,以便采取預防措施,降低疾病的發(fā)生風險。目前大規(guī)模人群隊列的基因組學和多組學大數(shù)據(jù)在重大慢病、腫瘤和遺傳病的預防、診斷和新藥研發(fā)中發(fā)揮引領作用,推動個體化精準健康管理和疾病診療的變革。美國和歐洲已實施多項以大規(guī)模隊列的基因分型、基因組測序數(shù)據(jù)為基礎的醫(yī)學研究計劃,包括著名的英國生物樣本庫(UK Biobank)、腫瘤基因組圖譜計劃(TCGA)和多組學精準醫(yī)學研究計劃(TOPMed)等,已得出一系列具有深遠影響的里程碑式成果。我國的中國代謝解析計劃(ChinaMAP)是目前最大規(guī)模的中國人群WGS和表型研究[18]。該研究通過高深度WGS數(shù)據(jù)和精細表型分析,以覆蓋中國各地區(qū)的研究隊列為基礎建立高質(zhì)量中國人群數(shù)據(jù)庫,為疾病機制研究、預防、遺傳咨詢和公共衛(wèi)生管理提供依據(jù)。在復雜疾病的遺傳因素中,效應較強的基因變異大多存在于特定的地理區(qū)域和種族群體中,只有基于特定人群完善的數(shù)據(jù)分析才有可能對該類人群的疾病遺傳風險進行精準評估,通過本地人群大規(guī)模WGS數(shù)據(jù)累積及臨床研究的深入,也必將為疾病預防、遺傳咨詢、精準治療等提供全面的基因組信息和證據(jù)。
WGS技術具有非常重要和多樣化的臨床應用,但作為一項新技術,WGS技術臨床應用的全面推廣仍面臨著諸多挑戰(zhàn)。
5.1技術復雜性及數(shù)據(jù)分析困難 (1)數(shù)據(jù)規(guī)模:WGS技術生成的數(shù)據(jù)量巨大,在解決數(shù)據(jù)存儲、管理和分析問題方面需要先進的計算機技術和軟件工具;(2)復雜的基因組結構:人類基因組結構復雜,其中包含大量的基因重復和變異,因此數(shù)據(jù)分析難度較高;(3)數(shù)據(jù)準確性:WGS技術的數(shù)據(jù)準確性受到諸多因素的影響,如序列誤差、技術偏差等,這需要在數(shù)據(jù)分析過程中進行充分校正;(4)缺乏標準化:WGS技術缺乏統(tǒng)一的數(shù)據(jù)分析標準,這導致了數(shù)據(jù)分析結果的不一致性和可重復性差;(5)參考數(shù)據(jù)庫的缺失:雖然目前有內(nèi)含子區(qū)域變異、SV等相關罕見變異類型的數(shù)據(jù)庫,但相對于WES技術分析常用的參考數(shù)據(jù)庫,WGS技術參考數(shù)據(jù)庫仍處于初步發(fā)展階段,需要大量臨床數(shù)據(jù)的累積及經(jīng)驗。
5.2臨床醫(yī)生對于WGS技術檢測的認識及結果解讀能力 國內(nèi)臨床醫(yī)生能力差異顯著,絕大多數(shù)基層醫(yī)生及非遺傳??漆t(yī)生對于基因檢測報告的解讀能力有限,因此也極大地限制了新技術如WGS技術等在臨床應用中的推廣。
5.3信息安全 與所有的高通量測序技術相同,WGS技術所產(chǎn)生的數(shù)據(jù)包含個人隱私信息,如果不妥善處理,可能會造成個人隱私泄露的風險;同時WGS數(shù)據(jù)屬于人類遺傳資源管理保護體系,需嚴格按照《中華人民共和國人類遺傳資源管理條例》做到有效保護和合理利用。
5.4檢測費用 雖然高通量測序成本目前已經(jīng)逐步下降,但WGS技術由于分析難度高等原因,大多需要核心家系同時檢測,總體費用較高,對于國內(nèi)多數(shù)患者來說,檢測費用很難負擔。
面對上述挑戰(zhàn)和限制,通過進一步加強相關技術的研發(fā),提升對數(shù)據(jù)的保護和管理,促進相關領域的合作和交流,遵循相關的道德和法律規(guī)定,保護個人隱私的安全,確保臨床診斷的準確性和公正性,將促進WGS技術在臨床醫(yī)學領域的健康發(fā)展。WGS技術在臨床醫(yī)學領域的應用具有廣闊的前景,隨著技術的持續(xù)完善、應用的不斷規(guī)范及檢測成本的降低,未來WGS技術在臨床醫(yī)學領域的應用將得到進一步提升,WGS技術的廣泛應用將為臨床診療帶來顯著益處。