朱波峰 ,孟昊天 ,蘭瓊
(1.南方醫(yī)科大學(xué)法醫(yī)學(xué)院,廣東 廣州 510515;2.西安交通大學(xué)口腔醫(yī)院 陜西省顱頜面精準(zhǔn)醫(yī)學(xué)研究重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710004)
人體表征,即人體外部可見(jiàn)的一系列形態(tài)特征,包括容貌、身高、發(fā)色、膚色等。對(duì)犯罪嫌疑人外部可見(jiàn)表型特征(表征)的精準(zhǔn)鑒識(shí),可為偵查破案、緝查罪犯提供依據(jù)和線(xiàn)索,在公安機(jī)關(guān)偵破案件的過(guò)程中,具有重要的實(shí)際應(yīng)用價(jià)值。在目前的案件偵破中,可通過(guò)獲取被侵害人或目擊者對(duì)犯罪嫌疑人形態(tài)特征的回憶,直接形成描述文字,或利用模擬畫(huà)像技術(shù)生成模擬畫(huà)像加以輔助,以配合后續(xù)的調(diào)查工作。其中,模擬畫(huà)像可以直觀地反映人的相貌,在案件調(diào)查過(guò)程中,當(dāng)模擬畫(huà)像與嫌疑人的真實(shí)相貌的相像度達(dá)到60%時(shí),就具有推斷價(jià)值,達(dá)到80%以上時(shí)輔助偵查效果就非常理想[1],有利于發(fā)現(xiàn)和查獲犯罪嫌疑人。但在實(shí)際刑偵工作中,模擬畫(huà)像的使用面臨著許多挑戰(zhàn),如目擊證人對(duì)嫌疑人體貌特征的回憶和描述可能存在偏差和錯(cuò)誤,導(dǎo)致繪制出的模擬畫(huà)像失真,畫(huà)像人員的繪畫(huà)技能,也對(duì)模擬畫(huà)像的相像度有較大影響。
分子生物學(xué)和生物信息學(xué)等相關(guān)理論和技術(shù)的飛速發(fā)展為人體外部可見(jiàn)表型特征的刻畫(huà)提供了新的研究思路。通過(guò)對(duì)遺傳信息和表型特征進(jìn)行關(guān)聯(lián)分析,可以在特定表型與相應(yīng)的遺傳標(biāo)記之間建立對(duì)應(yīng)關(guān)系,這為通過(guò)分子標(biāo)記鑒識(shí)人體表征提供了理論依據(jù)。法醫(yī)DNA表型(forensic DNA phenotyping,F(xiàn)DP)推斷研究始于20世紀(jì)末,并在最近幾年受到越來(lái)越多科研工作者的廣泛關(guān)注。在2019年9月舉辦的第28屆國(guó)際法醫(yī)遺傳學(xué)大會(huì)(The 28th Congress of the International Society for Forensic Genetics)上,來(lái)自鹿特丹伊拉斯姆斯大學(xué)的知名專(zhuān)家Manfred Kayser作了題為Forensic appearance prediction from DNA——A journey through 10 years of scientific contributions的報(bào)告,回顧了其團(tuán)隊(duì)在色素特征、發(fā)質(zhì)、身高及容貌推斷等領(lǐng)域的研究成果,并對(duì)未來(lái)利用表觀遺傳學(xué)技術(shù)推斷生活習(xí)慣的可行性進(jìn)行了展望,充分展現(xiàn)了人體表征分子鑒識(shí)研究在當(dāng)今法醫(yī)遺傳學(xué)領(lǐng)域的重要性和創(chuàng)新性。圍繞這一法醫(yī)遺傳學(xué)的重點(diǎn)、熱點(diǎn)和難點(diǎn)研究領(lǐng)域,我國(guó)研究者在過(guò)去的10多年中進(jìn)行了大量的研究工作,取得了一系列成果,在此進(jìn)行簡(jiǎn)要回顧與探討。
目前,生物地理祖先、色素特征(包括虹膜顏色、發(fā)色和膚色)及年齡是FDP領(lǐng)域研究最為成熟的人體表征。
生物地理祖先推斷根據(jù)使用的祖先信息位點(diǎn)(ancestry informative marker,AIM)和建模樣本的不同,可進(jìn)行從洲際到地區(qū)以及不同族群等不同方面的祖先來(lái)源推斷。過(guò)去10多年來(lái),我國(guó)研究人員在洲際人群遺傳推斷水平篩選AIM-單核苷酸多態(tài)性(single nucleotide polymorphism,SNP),基于不同檢測(cè)技術(shù)和平臺(tái),構(gòu)建了多種推斷體系[2-10]。針對(duì)其中的27重復(fù)合SNP檢測(cè)體系[4]發(fā)表了一系列驗(yàn)證、優(yōu)化研究結(jié)果[11-15]。2018年,馬咪等[16]報(bào)道了應(yīng)用該體系進(jìn)行祖先推斷的實(shí)際案例,在該案例中,通過(guò)推斷犯罪嫌疑人族群,將可疑人員范圍從3000多人減少至400余人,顯著縮小了嫌疑人范圍,最終協(xié)助專(zhuān)案組成功抓獲犯罪嫌疑人。在地區(qū)水平亞人群遺傳推斷方面,立足于我國(guó)實(shí)際情況,研究主要針對(duì)亞洲群體的細(xì)分[17-18]以及高原適應(yīng)基因相關(guān)的高原人群和其他人群細(xì)分[19-20]。除SNP標(biāo)記外,插入/缺失(insertion/deletion,InDel)多態(tài)性也可作為AIM進(jìn)行祖先來(lái)源推斷。2019年,LAN等[21]開(kāi)發(fā)了基于毛細(xì)管電泳技術(shù)平臺(tái)的包含39個(gè)AIM-InDels的五色熒光檢測(cè)體系。該研究及相關(guān)后續(xù)研究[22]也對(duì)該體系在洲際人群及亞人群中的遺傳推斷效能進(jìn)行了評(píng)估。此外,對(duì)于應(yīng)用其他類(lèi)型的分子標(biāo)記,如微單倍型標(biāo)記,進(jìn)行祖先來(lái)源推斷的可行性也有探索[23]。
在色素特征方面,由于我國(guó)大部分群體為黃色人種,頭發(fā)、虹膜、皮膚顏色差異較小,色素特征的分子鑒識(shí)從研究角度而言不易收集表征不同的樣本,從實(shí)際應(yīng)用角度而言應(yīng)用價(jià)值較低,相關(guān)研究[24-25]相對(duì)較少。
年齡的分子鑒識(shí)是我國(guó)研究人員關(guān)注較多的領(lǐng)域。早期研究關(guān)注外周血白細(xì)胞端粒DNA長(zhǎng)度變化與年齡的相關(guān)性[26],在確定了外周血白細(xì)胞端粒DNA長(zhǎng)度與年齡呈現(xiàn)負(fù)相關(guān)后,有研究[27]進(jìn)一步探討了性別對(duì)以上相關(guān)性的影響,并最終構(gòu)建模型進(jìn)行年齡推斷[28-29],但遺憾的是研究中未對(duì)推斷模型的準(zhǔn)確性進(jìn)行評(píng)估。此外,信號(hào)結(jié)合T細(xì)胞受體刪除環(huán)(signal joint T-cell receptor excision circle,sjTREC)用于年齡推斷的潛能受到關(guān)注。2011年,OU等[30]探討了中國(guó)人群外周血白細(xì)胞sjTREC水平與年齡之間的定量關(guān)系,并給出回歸方程,結(jié)果顯示年齡推斷標(biāo)準(zhǔn)誤差為10年左右。此后,有研究[31-32]進(jìn)一步探索證明血痕中的sjTREC水平也適用于年齡推斷。另外,RNA和DNA甲基化標(biāo)記也被用于年齡推斷研究[33-44],其中基于DNA甲基化的年齡推斷獲得了更多關(guān)注,研究人員篩選了年齡相關(guān)的CpG位點(diǎn),建立了相應(yīng)的年齡推斷模型,推斷結(jié)果誤差多在5歲以下[38-39,41-44]。
除上述人體表征外,身高和容貌也是FDP研究所關(guān)注的重要人體表征,但與生物地理祖先、色素特征、年齡等推斷準(zhǔn)確性較高的人體表征相比,目前這些人體表征的分子鑒識(shí)準(zhǔn)確性還有待進(jìn)一步提高。
研究結(jié)果[45]表明,身高受到遺傳、環(huán)境等多種因素的影響,其中遺傳因素所占的比例最大。但作為受多個(gè)基因影響的復(fù)雜性狀,盡可能全面地篩選身高相關(guān)分子標(biāo)記,是準(zhǔn)確進(jìn)行身高分子鑒識(shí)的難點(diǎn)之一。我國(guó)研究人員在漢族、藏族等群體中篩選驗(yàn)證了部分與身高相關(guān)的基因(位點(diǎn))[46-49],同時(shí)發(fā)現(xiàn)部分基因(位點(diǎn))在中國(guó)群體中的多態(tài)性發(fā)生頻率與國(guó)外人群存在差異[46,48],部分SNP位點(diǎn)的基因變異情況在我國(guó)群體與歐洲人群中效應(yīng)不同[49]。還有部分研究基于年齡相關(guān)分子標(biāo)記建立推斷模型,準(zhǔn)確性(曲線(xiàn)下面積,area under curve,AUC)在0.6~0.8[50-53]。
人的容貌具有高度的辨識(shí)性,在案件偵查過(guò)程中,往往是最直接和有效的線(xiàn)索。通過(guò)甄選與面部形態(tài)特征相關(guān)的分子標(biāo)記,構(gòu)建相應(yīng)的推斷模型,形成具有一定相似性的“分子模擬畫(huà)像”,是FDP研究的重要目標(biāo)之一?!胺肿幽M畫(huà)像”的準(zhǔn)確性,既依賴(lài)于與面部形態(tài)高度相關(guān)的分子標(biāo)記,也依賴(lài)于科學(xué)合理的推斷模型。2017—2018年發(fā)表的兩項(xiàng)研究成果[54-55],通過(guò)全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)篩選面部特征相關(guān)SNP,并在此基礎(chǔ)上構(gòu)建分子模擬畫(huà)像推斷模型,經(jīng)驗(yàn)證基于面部特征相關(guān)SNP推斷獲得的分子模擬畫(huà)像與真實(shí)臉型的相似性高于完全隨機(jī)推斷臉型,但現(xiàn)有推斷模型還不夠成熟,推斷標(biāo)記還需進(jìn)一步篩選、優(yōu)化,要真正將這項(xiàng)技術(shù)應(yīng)用于法醫(yī)學(xué)實(shí)踐,還需要更多的探索。2019年,LI等[56]報(bào)道了位于不同基因座上的8個(gè)影響歐亞人群面部特征的SNP位點(diǎn),豐富了歐洲和亞洲群體之間面部形態(tài)特征遺傳差異的研究。
研究表明,人體表征鑒識(shí)分子標(biāo)記在亞洲人群和其他人群中的表型特征相關(guān)性和影響效應(yīng)可能存在差異[49],基于其他人群篩選出的分子鑒識(shí)標(biāo)記應(yīng)用于我國(guó)群體時(shí),可能會(huì)影響推斷結(jié)果的準(zhǔn)確性[50]。目前,篩選更多有效的推斷位點(diǎn),提高推斷準(zhǔn)確性依然是FDP研究的難點(diǎn)之一。在中國(guó)群體中繼續(xù)開(kāi)展全基因組水平的表征鑒識(shí)分子標(biāo)記的篩選,以發(fā)現(xiàn)中國(guó)群體特異性的人體表征鑒識(shí)分子標(biāo)記,將有助于進(jìn)一步提高推斷準(zhǔn)確性。與此同時(shí),充分利用大量基于其他群體的FDP研究成果,對(duì)這些標(biāo)記在中國(guó)群體中的適用性進(jìn)行驗(yàn)證,也有助于形成適合我國(guó)群體的人體表征分子鑒識(shí)標(biāo)記體系。
我國(guó)大部分人群屬于東亞群體,僅有少部分人群具有洲際混合遺傳成分,多數(shù)人具有典型的黃色人種表型特征,這一情況決定了在我國(guó)的法醫(yī)學(xué)實(shí)踐中,部分人體表征分子鑒識(shí)的重要性與有效性和其他國(guó)家存在一定的差異。美國(guó)是移民國(guó)家,美國(guó)人可能存在歐洲、非洲、亞洲、美洲等多種洲際祖先來(lái)源,因此,洲際祖先來(lái)源推斷結(jié)果對(duì)案件的偵破具有較高的參考價(jià)值;而對(duì)我國(guó)而言,則更需要進(jìn)行民族之間的細(xì)分,或所屬地域的推斷。歐洲人群中,色素特征較為多變,對(duì)頭發(fā)和虹膜顏色的推斷有助于縮小偵查范圍;而我國(guó)人群多為黃色皮膚、黑色頭發(fā)、棕色眼睛,色素特征的推斷對(duì)案件偵破提供的幫助相對(duì)有限。因此,針對(duì)我國(guó)實(shí)際情況,選擇適宜的人體表征作為研究對(duì)象,一方面更易獲得研究樣本,另一方面有利于未來(lái)在我國(guó)法醫(yī)學(xué)工作中的實(shí)際應(yīng)用。此外,以往研究結(jié)果[57-59]表明,雀斑、重瞼、耳垂形態(tài)等人體表征同樣具有遺傳相關(guān)性,因而也具有分子鑒識(shí)潛能。這些局部表征的分子鑒識(shí),可對(duì)“分子模擬畫(huà)像”進(jìn)行細(xì)化,從而提供更多線(xiàn)索信息。
人體表征分子鑒識(shí)研究,是涉及樣本收集(包括表型特征信息收集和生物樣本采集)、分子標(biāo)記篩選、推斷模型建立及驗(yàn)證等多個(gè)環(huán)節(jié)和步驟的復(fù)雜研究,每一個(gè)環(huán)節(jié)都存在多學(xué)科合作和交叉的可能。研究樣本的獲取是開(kāi)展人體表征分子鑒識(shí)研究的基礎(chǔ),建立和優(yōu)化生物樣本庫(kù)、遺傳信息數(shù)據(jù)庫(kù),將有利于樣本資源的合作開(kāi)發(fā)和數(shù)據(jù)信息的深度挖掘。同時(shí),國(guó)外許多FDP研究樣本來(lái)自臨床隊(duì)列研究,對(duì)資源進(jìn)行有效整合和合理充分利用,節(jié)約時(shí)間和經(jīng)濟(jì)成本,值得我們借鑒。體質(zhì)人類(lèi)學(xué)研究中,也涉及大量人體表征信息的收集,同樣存在合作收集、資源共享的可能。而針對(duì)模型的建立及驗(yàn)證,與生物統(tǒng)計(jì)學(xué)、計(jì)算生物學(xué)、人工智能等學(xué)科或領(lǐng)域的交叉合作,有利于開(kāi)發(fā)更為先進(jìn)合理的推斷模型。例如,將人工智能技術(shù)運(yùn)用于人體表征分子鑒識(shí)研究,對(duì)法醫(yī)學(xué)而言,將有望構(gòu)建出準(zhǔn)確性更高的推斷模型。對(duì)人工智能領(lǐng)域而言,則拓展了技術(shù)的應(yīng)用方向,利用成熟的技術(shù)解決新的問(wèn)題,可能為技術(shù)的進(jìn)一步發(fā)展提供新的思路。
除原創(chuàng)性研究論文外,還有許多科研工作者發(fā)表了人體表征分子鑒識(shí)相關(guān)的綜述文章[60-63],對(duì)同期國(guó)內(nèi)外相關(guān)研究情況進(jìn)行歸納梳理和分析提煉,一方面便于關(guān)注人體表征分子鑒識(shí)領(lǐng)域的研究人員在較短時(shí)間內(nèi)了解最新的研究動(dòng)態(tài),另一方面也可為交叉領(lǐng)域的研究人員提供新的研究思路或方向。本期專(zhuān)題收錄了人體表征分子鑒識(shí)相關(guān)的多篇綜述和原創(chuàng)性研究論文,內(nèi)容涉及年齡[64]、族群地域[22,65-66]、容貌[67]、色素表型[68]等多種人體表征[69-70],希望能對(duì)人體表征分子鑒識(shí)研究在我國(guó)的發(fā)展起到推動(dòng)和促進(jìn)作用。