(四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院法醫(yī)研究所,四川 成都 610041)
法庭科學(xué)中,混合斑是指兩名或兩名以上個(gè)體的體液、分泌液混合形成的生物斑痕,常出現(xiàn)于性犯罪案件、多人受傷的現(xiàn)場血跡、咬痕拭子及指甲垢等。由于受到混合成分的種類、個(gè)體數(shù)量以及各組分在混合斑中所占比例等因素的影響,混合斑的鑒定比單一個(gè)體來源斑痕的鑒定復(fù)雜得多[1]。目前,混合斑檢測分析主要依賴于毛細(xì)管電泳(capillary electrophoresis,CE)分離技術(shù),但此技術(shù)分辨率有限,并不能完全發(fā)揮各遺傳標(biāo)記的效能,拆分能力受限。同時(shí),檢測得到的電泳圖譜的分型結(jié)果受多種因素的影響而使其結(jié)果解釋較為復(fù)雜[2-6]。近年來,大規(guī)模平行測序(massively parallel sequencing,MPS)技術(shù)發(fā)展逐漸成熟,與傳統(tǒng)的CE分離技術(shù)相比,MPS不僅能獲得遺傳標(biāo)記的序列信息,而且具有同時(shí)檢測多種遺傳標(biāo)記的能力[7-10]?;贛PS平臺衍生出的數(shù)據(jù)分析軟件大幅度提高了分析混合斑的可能性,為混合斑檢測分析帶來了新的契機(jī)。
目前,CE分離技術(shù)是混合斑檢測分析的常規(guī)技術(shù),常用的遺傳標(biāo)記包括常染色體和Y染色體短串聯(lián)重復(fù)(short tendem repeat,STR)序列、單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)、線粒體DNA(mitochondrial DNA,mtDNA)、插入缺失(insertion or deletion,InDel)多態(tài)性等。常染色體STR的優(yōu)勢在于其多態(tài)性好、個(gè)體識別能力強(qiáng),在混合斑分析中的作用明顯。Y-STR檢測無需兩步消化,可避免DNA的損失,通常每個(gè)男性個(gè)體僅有一個(gè)等位基因,因此可根據(jù)分型圖譜中Y-STR等位基因的數(shù)目推定混合斑的供者個(gè)數(shù),對輪奸案的分析有重要意義。mtDNA在混合斑降解檢材鑒定中有重要作用,可用于混合斑來源個(gè)體數(shù)的推定[11]。二等位基因SNP和InDel用于混合斑分析時(shí),相比常染色體STR更易獲得供者的遺傳圖譜,且無stutter峰干擾,但其識別效力有限[12]?;诖?,CE分離技術(shù)鑒定混合斑中次要供者所占比例的檢測限在10%左右[4]。
目前,STR-CE分離技術(shù)分析混合斑的統(tǒng)計(jì)方法主要有包含概率(probability of inclusion,PI)法和似然率(likelihood ratio,LR)法。PI法又稱為隨機(jī)男子不能被排除率(random man not excluded,RMNE)法,是指隨機(jī)個(gè)體被錯誤地認(rèn)定為存在于混合斑中的概率,對應(yīng)于統(tǒng)計(jì)學(xué)中的“Ⅰ型錯誤”。若累積父權(quán)指數(shù)(combined probability of inclusion,CPI)小于 10-9,則幾乎可以完全確定嫌疑人存在于混合斑中[13-14]。該法不必對混合斑的供者個(gè)數(shù)進(jìn)行假設(shè),計(jì)算簡單且容易解釋。但其對結(jié)果的解釋有時(shí)不保守,未充分利用信息,不考慮等位基因丟失或其他隨機(jī)效應(yīng),若出現(xiàn)基因座丟失,解釋比較困難[13,15]。LR法是通過兩個(gè)對立假設(shè)來評估遺傳分析提供的證據(jù)強(qiáng)度的方法。原告假設(shè)(prosecutions hypothesis,Hp)指分型結(jié)果由一名嫌疑人和額外的未知無關(guān)個(gè)體構(gòu)成,被告假設(shè)(defense hypothesis,Hd)指分型結(jié)果由一個(gè)或多個(gè)未知個(gè)體構(gòu)成。將混合樣本DNA分型結(jié)果定義為E,則:
式中,Pr為Hp或Hd條件下獲得E的概率,E為檢材的DNA分型結(jié)果。該方法能最大程度利用信息,假設(shè)靈活,考慮了等位基因丟失、等位基因插入等PCR隨機(jī)效應(yīng)的因素,只是計(jì)算較復(fù)雜,解釋較為困難[15]。國際法醫(yī)物證學(xué)會(International Society for Forensic Genetics,ISFG)推薦使用LR法進(jìn)行混合斑分析[17]。
CE分離技術(shù)分析混合斑的常用軟件主要有LoComatioN軟件(英國Forensic Science Service公司)、GeneMapper?ID-X軟件(美國Thermo Fisher Scientific公司)、TrueAllele?DNA Interpretation軟件(美國CybergeneticsMenu公司)、Forensim軟件包(Hinda Haned開發(fā))等。LoComatioN軟件是第一個(gè)用LR統(tǒng)計(jì)分析方法評估解釋混合斑的專門系統(tǒng),考慮了等位基因丟失和等位基因插入的因素[18]。Gene-Mapper?ID-X軟件用于分析解釋兩人混合斑,可計(jì)算嫌疑人與受害人參考樣本的條件LR[19]。TrueAllele?DNA Interpretation軟件可同時(shí)有效解決多個(gè)案件信息,利用獲得的DNA分型數(shù)據(jù)與嫌疑人進(jìn)行比較并計(jì)算證據(jù)統(tǒng)計(jì)量——LR,評價(jià)嫌疑人的相關(guān)性[20]。Forensim軟件包可模擬司法鑒定中常見的DNA分型數(shù)據(jù),包含4種統(tǒng)計(jì)學(xué)方法,專用于解釋混合斑[21]。
CE分離技術(shù)分析混合斑時(shí)存在一些局限性。例如,由于受到熒光染料數(shù)量的限制,目前最多能復(fù)合檢測30個(gè)左右的STR位點(diǎn)或50個(gè)左右的SNP位點(diǎn),提供的信息量相對較少(只提供片段長度大?。?,達(dá)不到復(fù)雜混合斑分析的信息量要求[22]。大多數(shù)商品試劑盒包含的STR位點(diǎn)的PCR片段在80~500 bp,當(dāng)檢測降解混合斑檢材時(shí)常常導(dǎo)致較長PCR片段的STR位點(diǎn)信號明顯下降甚至丟失,造成分型困難[3]。由于STR基因座中復(fù)合序列和(或)復(fù)雜序列的存在導(dǎo)致CE分離技術(shù)無法得到STR基因座的全序列信息而不能區(qū)分長度一致的序列等位基因,造成次要供者的等位基因常與stutter峰混淆或被主要供者的等位基因掩蓋[3,22-23]。同時(shí)其電泳分型圖譜中的加A不全、等位基因缺失、等位基因插入等均影響正確分型模式的推斷,給混合斑鑒定帶來了困難[6]。
MPS技術(shù),又稱二代測序(second generation sequencing,SGS)技術(shù)或下一代測序(next generation sequencing,NGS)技術(shù),其核心思想是邊合成邊測序,即通過捕捉新合成的末端標(biāo)記來確定DNA序列。MPS技術(shù)可以同時(shí)在一個(gè)反應(yīng)內(nèi)完成數(shù)十萬到數(shù)百萬條DNA分子片段的序列測定。此技術(shù)近年來發(fā)展迅速,其在測序通量、測序讀長、測序成本等方面的突破,使法醫(yī)遺傳學(xué)進(jìn)入了一個(gè)新的發(fā)展階段,且法醫(yī)遺傳學(xué)領(lǐng)域關(guān)于MPS技術(shù)的研究文獻(xiàn)呈爆發(fā)式增長,這些成果為解決法醫(yī)遺傳學(xué)難題(如混合斑)提供了新的可能性[24]。
MPS技術(shù)下不同基因座的識別基于引物序列,不受限于熒光染料數(shù)量,可同時(shí)對數(shù)百甚至數(shù)千個(gè)大小重疊的遺傳標(biāo)記進(jìn)行檢測;借助條形碼技術(shù)可同時(shí)對多個(gè)樣本進(jìn)行檢測。由于無需熒光染料標(biāo)記,基因座間檢測片段可相互重疊,可將目標(biāo)片段設(shè)計(jì)在300bp以內(nèi),大大提高了降解檢材的分析能力。MPS技術(shù)產(chǎn)生的完整DNA序列將長度多態(tài)性轉(zhuǎn)化為序列多態(tài)性,增加了基因座的等位基因數(shù)量,從而提高了系統(tǒng)效能。同時(shí),能對多種不同類型的遺傳標(biāo)記進(jìn)行聯(lián)合檢測,使一次反應(yīng)產(chǎn)生更大的信息量,為分析混合DNA 提供了一個(gè)新的研究方向[5,9,25-30]。
目前常用的遺傳標(biāo)記均能應(yīng)用MPS技術(shù)進(jìn)行檢測,如STR、SNP、InDel、mtDNA、微單倍型等。
2.2.1 STR
STR識別能力較強(qiáng),在混合斑中的作用明顯。目前,多家MPS公司推出了商品化的MPS-STR的檢測試劑盒,如PowerSeqTMSystem(美國Promega公司)、PowerSeqTMAuto System(美國Promega公司)、Ion TorrentTMHID STR 10-plex(美國Thermo Fisher Scientific公司)、Precision ID GlobalFilerTMNGS STR Panel(美國Thermo Fisher Scientific公司)。借助MPS技術(shù)能檢出大量序列等位基因,大大增加系統(tǒng)效能。van der GAAG等[3]應(yīng)用PowerSeqTMSystem在MPS平臺上進(jìn)行兩人混合斑分析,通過計(jì)算未與其他等位基因或stutter重疊的次要供者的等位基因覆蓋度所占比例來推斷混合比例,結(jié)果表明,隨著混合斑中次要供者比例減少,對次要供者的定量預(yù)測的準(zhǔn)確性降低,但當(dāng)次要供者所占比例為1%時(shí)仍可得到完整分型。
2.2.2 SNP
SNP通常為二等位基因遺傳標(biāo)記,突變率極低(約1×10-9),無stutter峰產(chǎn)生。應(yīng)用MPS技術(shù),可大大提高SNP的檢測數(shù)量,增加系統(tǒng)效能。美國Thermo Fisher Scientific公司于2014年推出HID-Ion AmpliSeqTMIdentity Panel,應(yīng)用MPS技術(shù)可同時(shí)檢測90個(gè)常染色體SNP和34個(gè)Y-SNP。有研究[31]表明,混合斑的純合子數(shù)量相對單一個(gè)體較少,混合比例在1∶49到49∶1之間時(shí)仍可得到次要供者的完整分型。此外,還有許多其他SNP試劑盒,如GeneRead DNASeq SNP panel PCR試劑盒(美國Qiagen公司)、HID-Ion AmpliSeqTMAncestry Panel(美國 Thermo Fisher Scientific公司)等。
2.2.3 InDel
InDel為二等位基因,可簡單分為短InDel和長InDel,突變率與SNP相近,兼具STR和SNP的某些特征。應(yīng)用MPS技術(shù)可大大提高InDel的檢測數(shù)量,增加系統(tǒng)的個(gè)體識別能力。當(dāng)進(jìn)行混合斑分析時(shí),比常染色體STR更容易獲得供者的遺傳圖譜,且無stutter峰干擾,不受混合斑供者性別的限制,混合斑的檢測限為 1∶1000[4,12,32-35]。WENDT 等[36]提出了一個(gè)包含68個(gè)InDel的體系,在MiSeq(美國Illumina公司)平臺上進(jìn)行檢測并運(yùn)用STRait Razor v2.5軟件分析數(shù)據(jù),結(jié)果表明,InDel應(yīng)用于混合斑分析有很大的潛力。
2.2.4 mtDNA
mtDNA是細(xì)胞核外DNA,具有高拷貝性、異質(zhì)性,多用于分析無足夠核DNA的樣本(如毛干、陳舊骨骼)。應(yīng)用MPS技術(shù),當(dāng)每個(gè)核苷酸位置的覆蓋度達(dá)成千上萬時(shí),可檢測1%~2%的低水平變異,從而解析其異質(zhì)性[37-38]。KIM等[39]應(yīng)用Roche 454 GS Junior平臺(美國454 Life Sciences公司)對mtDNA的高變區(qū)(hypervariable region,HV)Ⅰ和HVⅡ進(jìn)行檢測,分析兩人混合斑,結(jié)果表明,次要供者所占比例為2.5%及以上時(shí),能得到完整分型,次要供者所占比例為1%時(shí)除HVⅡ的150位點(diǎn)外均能得到分型,因此其對兩人混合斑生物檢材的檢測靈敏度高(1.0%~2.5%),該平臺也能區(qū)分三個(gè)供者的不同序列。此外,HOLLAND等[40]的研究也表明,當(dāng)覆蓋度在1000以上時(shí),1%的次要供者能被成功檢出。
2.2.5 微單倍型
微單倍型是指在200 bp內(nèi)包含兩個(gè)或兩個(gè)以上SNP,并有三個(gè)或三個(gè)以上等位基因的遺傳標(biāo)記,其篩選應(yīng)避免重組熱點(diǎn)。與SNP、InDel相比,其多態(tài)性有所增加;與STR相比,其突變率低,不會產(chǎn)生stutter峰且擴(kuò)增片段短,適用于降解檢材[41-43]。運(yùn)用MPS技術(shù)可同時(shí)檢測大量微單倍型,增加系統(tǒng)效能。KIDD等[41]篩選了31個(gè)高雜合性的微單倍型,應(yīng)用MPS技術(shù)平臺進(jìn)行研究,結(jié)果表明,微單倍型具有定性分析混合斑及定量分析混合斑中各組分的潛力(若在一個(gè)位點(diǎn)上有足夠覆蓋度的三個(gè)或三個(gè)以上不同序列,則證明為混合斑,且其相應(yīng)的覆蓋度可確定混合斑各組分比例),因此可成為混合斑分析有力的檢測遺傳標(biāo)記。
2.2.6 組合遺傳標(biāo)記
將各種不同類型的遺傳標(biāo)記組合在一個(gè)試劑盒中同時(shí)進(jìn)行檢測,可結(jié)合各種遺傳標(biāo)記的特點(diǎn),提高運(yùn)作效率,使一次實(shí)驗(yàn)產(chǎn)生的信息量最大化。目前,已經(jīng)研發(fā)出的組合遺傳標(biāo)記試劑盒有MiSeq FGxTMForensic Genomics System(美國Illumina公司)和ForenSeqTMDNA Signature Prep試劑盒(美國Illumina公司)等。其中MiSeq FGxTMForensic Genomics System由58個(gè)STR、94個(gè)個(gè)體識別SNP、22個(gè)表型信息SNP和56個(gè)祖先信息SNP組成,應(yīng)用MiSeq FGxTM平臺(美國Illumina公司)對兩人混合斑進(jìn)行檢測,研究結(jié)果表明,當(dāng)次要供者所占比例低于5%時(shí)仍能被檢出[22]。
隨著MPS技術(shù)的發(fā)展,相關(guān)數(shù)據(jù)分析軟件應(yīng)運(yùn)而生。對于MiSeq平臺,My-Forensic-Loci-queries(MyFLq)[44]可用于對原始MPS數(shù)據(jù)進(jìn)行STR和SNP的分析,MiSeq Reporter(美國Illumina公司)軟件分析后的數(shù)據(jù)可以再運(yùn)用NextGENe?軟件(美國SoftGenetics公司)進(jìn)行二級分析,F(xiàn)orenSeqTMUniversal Analysis軟件可同時(shí)管理實(shí)驗(yàn)設(shè)置并進(jìn)行數(shù)據(jù)分析[29]。針對Ion PGM平臺,STRait Razor軟件[45]可依靠智能的并行處理減少分析時(shí)間,Torrent Suite Server(美國Thermo Fisher Scientific公司)可根據(jù)不同實(shí)驗(yàn)選擇不同的插件進(jìn)行分析[10,31],即將推出的Converge軟件(美國Thermo Fisher Scientific公司)可對數(shù)據(jù)進(jìn)行三級處理。
綜上所述,MPS技術(shù)檢測混合斑中次要供者的檢測限約為1%,相比STR-CE分離技術(shù)更為靈敏。微單倍型有望成為混合斑檢測的有力工具,為混合斑分析提供了新的研究方向。但是,MPS測序平臺及相關(guān)試劑的成本、相關(guān)技術(shù)產(chǎn)品的推出及驗(yàn)證、分析軟件的成熟化、與現(xiàn)有數(shù)據(jù)庫接軌等都是決定該技術(shù)能否替代PCR-CE分離技術(shù)普遍應(yīng)用于混合斑檢測的關(guān)鍵。期望后續(xù)能研發(fā)出更加完善的應(yīng)用MPS技術(shù)的檢測系統(tǒng),并將MPS技術(shù)的成本降低到一個(gè)可以接受的水平,同時(shí)開發(fā)出成熟、便捷、準(zhǔn)確的MPS數(shù)據(jù)分析軟件,從而使MPS技術(shù)在混合斑分析中發(fā)揮更大的潛能。