張玲莉,朱慶文,王 婧,蔣鴻儒,卞文君
南通大學(xué)附屬婦幼保健院產(chǎn)前篩查與診斷中心 江蘇南通 226010
無創(chuàng)產(chǎn)前DNA檢測(non-invasive prenatal testing,NIPT)是一種直接檢測胎兒染色體異常的方法[1]。羊膜穿刺術(shù)是胎兒染色體異常產(chǎn)前診斷的金標(biāo)準,涉及有創(chuàng)取樣[2]。與傳統(tǒng)的產(chǎn)前診斷(如羊膜穿刺術(shù))相比,NIPT在降低胎兒的流產(chǎn)風(fēng)險方面具有優(yōu)勢。一項多中心研究[3]認為NIPT能夠可靠和準確地檢測出臨床常見的胎兒非整倍體異常。
胎兒DNA僅占母體血漿游離DNA的一小部分[4],在NIPT中只能匹配到染色體某一個位置的DNA序列,被作為唯一匹配讀取序列(uniquely mapped read,UMR)。一般對UMR進行Z檢驗[5]。根據(jù)參考值的不同,可以有多種Z檢驗[6-7]。絕大多數(shù)用于胎兒染色體非整倍體檢測的NIPT都基于該算法[8-10]。Z檢驗將每條染色體視為一個整體,計算某一整條染色體的Z值。然而,當(dāng)某條染色體的某個區(qū)域的拷貝數(shù)缺失,同時另一個區(qū)域的拷貝數(shù)增加時,這兩個變異會在Z值計算過程中產(chǎn)生抵消,導(dǎo)致計算錯誤。因此,常規(guī)NIPT(nNIPT)分析方法無法檢測此類病例。本研究對11 565例單胎妊娠婦女的NIPT數(shù)據(jù)進行圖形輔助算法(gNIPT)分析,并與nNIPT分析結(jié)果進行比較,評價gNIPT應(yīng)用于產(chǎn)前篩查的潛力。
1.1 研究對象選擇2019年1月至2020年12月南通市婦幼保健院產(chǎn)前篩查與診斷中心11 565例符合NIPT技術(shù)規(guī)范要求的孕婦納入NIPT檢測。孕婦均為單胎妊娠。孕婦年齡構(gòu)成:16~歲134例(1.16%),21~歲1 995例(17.25%),26~歲4 649例(40.20%),31~歲3 216例(27.81%),36~歲1 495例(12.92%),≥41歲76例(0.66%)。NIPT時孕周構(gòu)成:12~周1 085例(9.39%),16~周8 855例(76.57%),20~周1 508例(13.04%),24~周113例(0.98%),28~36周4例。
1.2 NIPT采集孕婦10 mL全血,立即緩慢顛倒混勻10次,在室溫(6~35 ℃)條件下豎直暫存,96 h內(nèi)送檢。采用兩步離心法提取血漿:首先,在4 ℃條件下1 600×g離心10 min后將血漿轉(zhuǎn)移至微量離心管中;然后,以16 000×g離心10 min獲得無細胞血漿。使用核酸提取試劑盒(德國Qiagen公司)從600 μL無細胞血漿中提取DNA片段。使用Ion Proton測序平臺配套的Ion Plus片段文庫試劑盒(美國Life Technologies公司)構(gòu)建測序文庫,包括DNA片段化、末端修復(fù)、接頭連接、PCR富集目的片段和文庫質(zhì)檢等步驟。在Qubit?熒光計上對文庫進行定量,將Qubit?dsDNA HS Assay Kit試劑盒(美國賽默飛世爾科學(xué)公司)中高濃度的熒光染料預(yù)先稀釋成工作液,然后把工作液與待測樣本和標(biāo)準品混勻,通過Qubit?熒光計測定文庫濃度,文庫的質(zhì)檢標(biāo)準為≥0.5 μg/L。測序文庫加載到Ion P2芯片上。在單向測序模式中循環(huán)160個周期。測序數(shù)據(jù)由Ion Torrent平臺專用Pipeline軟件(版本4.4.3)處理。
1.3 數(shù)據(jù)分析通過Bowtie2軟件將測序數(shù)據(jù)與hg38人類參考基因組(版本GRCh38/hg38)進行匹配[11]。利用Pipeline軟件進行數(shù)據(jù)預(yù)處理[12]。數(shù)據(jù)篩選[13]:刪除4種類型的匹配讀取序列數(shù)據(jù),包括PCR重復(fù)、短讀取序列(<35 bp)、多處匹配和低質(zhì)量讀取序列(MAPQ評分<60),UMR匹配人類參考基因組后的最小覆蓋率標(biāo)準為0.16倍。對11 565份病例同時使用nNIPT和gNIPT分析21三體、18三體和13三體綜合征陽性例數(shù)。
1.3.1nNIPT分析 通過局部加權(quán)回歸公式對UMR數(shù)進行擬合,使用選定染色體的UMR數(shù)除以所有染色體中的UMR數(shù),可以計算出匹配到每條染色體的UMR的百分比。以染色體正常胎兒的孕婦群體的血漿作為陰性對照,計算出每條染色體UMR百分比的平均值和標(biāo)準差,作為計算Z值的基線[5]。各條染色體的異常態(tài)根據(jù)Z值的統(tǒng)計意義進行分類。置信水平設(shè)為99.9%, |Z|≥3的染色體被歸類為異常染色體,|Z|<3的染色體為正常染色體。
1.3.2gNIPT分析 將每條染色體劃分為2 Mb大小的窗口,并將每個窗口作為一個獨立的計算單元,從而檢測出上述異常。計算每個窗口的Z值,公式如下:
繪制折線圖。如果|Z|≥3,則用黑點表示潛在異常。將每個染色體的Z值作為一維向量添加到R軟件包cghFlasso(版本0.2.1)中進行拷貝數(shù)分析,結(jié)果用紫線繪制。如果幾個連續(xù)窗口的Z>0,導(dǎo)致部分線段位于X軸上方,cghFlasso算法會將該區(qū)域分類為塊,并使用每個窗口的Z值加權(quán)計算整塊的Z值。如果|Z|≥3,則窗口將在紫線中標(biāo)記1個紅點,提示拷貝數(shù)存在潛在異常。
gNIPT中Z值的分類方式與nNIPT相同。系統(tǒng)將在兩種情況下給出警告:如果連續(xù)5個窗口的|Z|≥5,表示某個≥10 Mb的染色體區(qū)域存在未知的異常;如果兩個或多個連續(xù)的窗口的|Z|≥5且和已知的綜合征有關(guān),表示某個≥4 Mb的染色體區(qū)域存在已知的異常。
1.4 NIPT結(jié)果的驗證對nNIPT和gNIPT結(jié)果提示染色體異常的孕婦行羊膜穿刺術(shù)。抽取20 mL羊水樣本進行細胞培養(yǎng)和染色體核型分析,或用Affymetrix平臺(美國賽默飛世爾科學(xué)公司)進行SNP染色體微陣列分析。對于提示低風(fēng)險NIPT結(jié)果的孕婦進行電話隨訪。
1.5 統(tǒng)計學(xué)處理應(yīng)用SPSS 26.0進行分析,利用Kappa一致性檢驗分析gNIPT和nNIPT結(jié)果的一致性。Kappa>0.80說明一致性程度很強。檢驗水準α=0.05。
2.1 gNIPT分析的折線圖21三體綜合征陰性和陽性病例gNIPT的輔助折線圖見圖1。圖1上中綠線表示每個2 Mb大小窗口的染色體狀態(tài),紫線表示每個窗口拷貝數(shù)變異的Z值,|Z|≥3,提示21號染色體正常。圖1下示病例為典型的21三體綜合征,圖中綠線偏離X軸,而紫線上有幾個連續(xù)的紅點標(biāo)識。
2.2 gNIPT和nNIPT分析比較gNIPT能使nNIPT整體檢測21、18和13三體綜合征的陽性預(yù)測值(positive predictive value,PPV)從88.3%提高到91.4%,見表1。兩種方法具有較強的一致性,見表2。
圖1 21三體綜合征陰性(上)和陽性(下)各1例gNIPT分析的折線圖
表1 gNIPT和nNIPT對染色體異常的陽性預(yù)測值比較例
表2 gNIPT與nNIPT的Kappa一致性檢驗 例
2.3 gNIPT分析發(fā)現(xiàn)1例18號染色體異常病例一孕17+3周的24歲孕婦的21、18和13號染色體的|Z|分別為0.477、1.783和1.055,在正常范圍內(nèi)。然而gNIPT折線圖中可見紫線有一段Z<-3且紫線上有4個紅點,提示染色體拷貝數(shù)存在丟失;另一段的Z=3,提示染色體該區(qū)域的拷貝數(shù)增加(圖2上)。gNIPT結(jié)果提示18號染色體上存在部分拷貝數(shù)異常。
在Affymetrix平臺上利用750K SNP微陣列芯片進行驗證,結(jié)果發(fā)現(xiàn)18號染色體p11.32-p11.21存在拷貝數(shù)缺失,p11.21-q23存在拷貝數(shù)重復(fù),見圖2下。根據(jù)人類全基因核型模擬圖,兩處拷貝數(shù)異常的區(qū)域幾乎覆蓋了整個18號染色體。在DECIPHER數(shù)據(jù)庫中(https://DECIPHER.sanger.ac.uk)查閱發(fā)現(xiàn),缺失的區(qū)域包括41個與全身發(fā)育遲緩和嬰兒肌張力低下相關(guān)的致病性報道,重復(fù)的區(qū)域包含18條類似的記錄。因此,本次妊娠被確定為18號染色體高風(fēng)險,gNIPT校正了nNIPT的假陰性病例。
圖2 nNIPT分析18號染色體正常的假陰性病例的gNIPT分析(上)和SNP微陣列分析(下)
2.4 gNIPT發(fā)現(xiàn)1例致病性拷貝數(shù)變異一孕16周的36歲孕婦的染色體21、18和13號染色體的|Z|分別為1.195、0.528和1.174,在正常范圍內(nèi)。17號染色體的Z=0.677,也在正常范圍內(nèi),但該樣本的gNIPT分析折線圖的綠線中有2個黑點,紫線中有2個紅點(圖3上),提示該區(qū)域的拷貝數(shù)增加。
SNP微陣列芯片分析結(jié)果發(fā)現(xiàn)17號染色體17q12有一段1 868 kb的拷貝數(shù)重復(fù)(圖3下)。染色體的這一區(qū)域與23個在線孟德爾遺傳基因直接相關(guān)。人類基因組變異和表型數(shù)據(jù)庫中有多個與該重復(fù)片段相關(guān)的致病性的報道,這可能導(dǎo)致發(fā)育和形態(tài)異常,如發(fā)育遲緩、智力障礙、小頭畸形、身材矮小和言語發(fā)育遲緩等。臨床基因組資源數(shù)據(jù)庫顯示該片段具有3倍劑量效應(yīng),可能導(dǎo)致多種臨床表型[14]。該片段重復(fù)將導(dǎo)致17q12微重復(fù)綜合征,其外顯率約為21.1%。這段拷貝數(shù)異常被確定為致病性。
圖3 17號染色體致病性拷貝數(shù)異常病例的gNIPT分析(上)和SNP微陣列分析(下)
在產(chǎn)前篩查遺傳病領(lǐng)域,NIPT已被廣泛用于檢測21、18和13號染色體等項目。除了上述常見非整倍體染色體異常的篩查,NIPS-Plus技術(shù)通過實驗優(yōu)化和算法的升級,利用基于主成分分析的方法來提升信噪比值,然后使用隱馬爾可夫模型算法可以進一步檢出拷貝數(shù)異常,如DiGeorge綜合征、22q微重復(fù)綜合征、Cri du chat綜合征等[15]。
本研究中,作者提出了一種提高nNIPT準確度的新算法,即gNIPT,該方法可進行深入詳細的分段式染色體拷貝數(shù)分析。gNIPT和nNIPT兩種方法的Kappa為0.982,這表明gNIPT在大多數(shù)病例檢測中仍然與nNIPT結(jié)果一致。
nNIPT使用的Z檢驗將整條染色體視為整體,無法正確判別同一染色體局部Z值減低和增加同時發(fā)生且相互抵消的情況,原因可能是由于一對染色體同時存在著局部缺失和重復(fù),也可能是由于UMR偏少而導(dǎo)致計算異常。雖然樣本的檢測結(jié)果是每一條染色體都有正常的Z值,但不能排除樣本存在上述異常而需要做進一步的產(chǎn)前診斷。為了避免nNIPT的計算方式在檢測過程中錯誤地糾正染色體局部的Z值異常波動造成的假陰性結(jié)果,本研究應(yīng)用gNIPT方法將每個染色體分割成2 Mb大小的窗口,并將每個窗口作為一個單元進行Z值計算和拷貝數(shù)異常的評估。它可以檢測小片段的致病性拷貝數(shù)異常或影響整個染色體的大片段拷貝數(shù)異常。通過gNIPT的數(shù)據(jù)分析,本研究成功檢測到了1例18號染色體的異常,其中一個區(qū)域丟失,另一個區(qū)域重復(fù),而nNIPT提示18號染色體的Z值在正常范圍內(nèi)。另外,gNIPT檢測到了1例17號染色體存在致病性拷貝數(shù)異常的病例,證明gNIPT理論上能夠檢測出染色體上的微缺失和微重復(fù)。
本研究結(jié)果顯示gNIPT對于常見非整倍體異常的總體PPV由原來的88.3%提高到了91.4%,對于今后提高NIPT的準確性方面提供了新的思路。從算法上來講,gNIPT有著獨特的優(yōu)勢,可以觸及nNIPT檢測的盲區(qū);另一方面,gNIPT在檢測過程中可視化效果好,有助于實驗人員更加簡潔直觀地分析數(shù)據(jù)。