周 密 汪 軍
(1 蕪湖市公安局刑警支隊(duì) 安徽 蕪湖 241000;2 安徽工程大學(xué)計(jì)算機(jī)與信息學(xué)院 安徽 蕪湖 241000)
2組分混合樣本系統(tǒng)效能分析的實(shí)驗(yàn)性研究
周 密1,2汪 軍2
(1 蕪湖市公安局刑警支隊(duì) 安徽 蕪湖 241000;2 安徽工程大學(xué)計(jì)算機(jī)與信息學(xué)院 安徽 蕪湖 241000)
對(duì)2組分混合樣本的系統(tǒng)效能進(jìn)行公式推導(dǎo),并以隨機(jī)模擬法驗(yàn)證公式。建立2組分混合樣本3個(gè)分類的系統(tǒng)效能定義,在此基礎(chǔ)上自行推導(dǎo)數(shù)學(xué)公式,并在Identifiler系統(tǒng)的15個(gè)基因座上計(jì)算系統(tǒng)效能的公式值。應(yīng)用隨機(jī)模擬法設(shè)計(jì)實(shí)驗(yàn),在15個(gè)基因座上計(jì)算系統(tǒng)效能的模擬值。以模擬值對(duì)比公式值的方式,對(duì)公式進(jìn)行實(shí)驗(yàn)驗(yàn)證。結(jié)果表明,3類系統(tǒng)效能公式均符合模擬實(shí)驗(yàn)驗(yàn)證。Identifiler系統(tǒng)中,犯罪嫌疑人和受害人混合類型的系統(tǒng)效能(CDPC2-11)為1-1.82910×10-13,犯罪嫌疑人和未知個(gè)體混合類型的系統(tǒng)效能(CDPC2-1)為1-1.98396×10-8,2個(gè)犯罪嫌疑人混合類型的系統(tǒng)效能(CDPC2-2)為1-5.15033×10-22。3個(gè)類型的公式可應(yīng)用于2組分混合樣本的系統(tǒng)效能計(jì)算。
混合樣本 系統(tǒng)效能 隨機(jī)模擬法
法醫(yī)DNA檢驗(yàn)中,最常見(jiàn)的混合樣本由2個(gè)組分形成,如性犯罪案中犯罪嫌疑人和受害人的混合樣品。根據(jù)組分類型,2組分混合樣本分為3種類型:①犯罪嫌疑人和受害人混合;②犯罪嫌疑人和未知個(gè)體混合;③2個(gè)犯罪嫌疑人混合。這3種類型的確信概率(LR值)計(jì)算雖有報(bào)道[1],但相應(yīng)的系統(tǒng)效能分析仍未見(jiàn)報(bào)道。因此,本實(shí)驗(yàn)首先提出2組分混合樣本3種類型的系統(tǒng)效能定義,然后進(jìn)行數(shù)學(xué)推導(dǎo)和模擬實(shí)驗(yàn)驗(yàn)證。
按隨機(jī)模擬法,自主研發(fā)軟件[2]模擬Identifiler系統(tǒng)的15個(gè)常染色體STR基因座的隨機(jī)個(gè)體和隨機(jī)2組分混合樣本。
2.1.1 隨機(jī)個(gè)體
在單個(gè)基因座上,隨機(jī)產(chǎn)生2個(gè)等位基因,組成隨機(jī)個(gè)體的單基因座分型。等位基因的產(chǎn)生概率參考中國(guó)漢族人群基因頻率[3]。同理在15個(gè)基因座上分別模擬,獲得隨機(jī)個(gè)體的Identifiler試劑盒的完整STR分型。
2.1.2 隨機(jī)2組分混合樣本
獨(dú)立產(chǎn)生2個(gè)隨機(jī)個(gè)體的Identifiler試劑盒STR分型,按照混合樣本的形成規(guī)律,將兩者混合而成2組分混合樣本的Identifiler試劑盒STR分型。其中2個(gè)隨機(jī)個(gè)體即為該混合樣本的2個(gè)組分。將上述過(guò)程重復(fù)n次,模擬出n個(gè)2組分混合樣本及其組分。
2.2.1 基本概念
本實(shí)驗(yàn)的2組分混合樣本為理想狀態(tài):STR圖譜顯示混合樣本全部等位基因,均為真峰,忽略偽峰;2個(gè)組分互相獨(dú)立,無(wú)親緣關(guān)系。
2組分混合樣本判斷標(biāo)準(zhǔn):
(1)犯罪嫌疑人和未知個(gè)體混合類型
該類型只有犯罪嫌疑人1個(gè)已知組分,其判斷標(biāo)準(zhǔn)為:①犯罪嫌疑人的等位基因均與混合樣本等位基因共享,犯罪嫌疑人不含混合樣本中沒(méi)有的等位基因;②排除重復(fù)的等位基因后,混合樣本等位基因數(shù)-犯罪嫌疑人等位基因數(shù)≤2。
(2)犯罪嫌疑人和受害人混合類型或2個(gè)犯罪嫌疑人混合類型
該2種類型中的已知組分有2個(gè),分別稱為1~2號(hào)。其判斷標(biāo)準(zhǔn)為:①2個(gè)組分的等位基因均與混合樣本等位基因共享,2個(gè)組分均不含混合樣本中沒(méi)有的等位基因;②排除重復(fù)的等位基因后,混合樣本等位基因數(shù)=1號(hào)等位基因數(shù)+2號(hào)等位基因數(shù)。
根據(jù)2組分混合樣本分類,基于以上混合樣本判斷標(biāo)準(zhǔn),單基因座系統(tǒng)效能同樣分為3類:
(1)犯罪嫌疑人和受害人混合類型
①混合樣本匹配概率(QC2-11):?jiǎn)位蜃?個(gè)隨機(jī)個(gè)體(稱為1~3號(hào)),將1號(hào)和2號(hào)混合形成隨機(jī)混合樣本,將3號(hào)視為犯罪嫌疑人,1號(hào)視為受害人,則3號(hào)、1號(hào)和混合樣本符合2組分混合樣本判斷標(biāo)準(zhǔn)的概率。
②混合樣本識(shí)別能力(DPC2-11):?jiǎn)位蜃?個(gè)隨機(jī)個(gè)體(稱為1~3號(hào)),將1號(hào)和2號(hào)混合形成隨機(jī)混合樣本,將3號(hào)視為犯罪嫌疑人,1號(hào)視為受害人,則1號(hào)、2號(hào)和混合樣本不符合2組分混合樣本判斷標(biāo)準(zhǔn)的概率。
(2)犯罪嫌疑人和未知個(gè)體混合類型
①混合樣本匹配概率(QC2-1):?jiǎn)位蜃?個(gè)隨機(jī)個(gè)體(稱為1~3號(hào)),將1號(hào)和2號(hào)混合形成隨機(jī)混合樣本,將3號(hào)視為犯罪嫌疑人,則3號(hào)和混合樣本符合2組分混合樣本判斷標(biāo)準(zhǔn)的概率。
②混合樣本識(shí)別能力(DPC2-1):?jiǎn)位蜃?個(gè)隨機(jī)個(gè)體(稱為1~3號(hào)),將1號(hào)和2號(hào)混合形成隨機(jī)混合樣本,將3號(hào)視為犯罪嫌疑人,則3號(hào)和混合樣本不符合2組分混合樣本判斷標(biāo)準(zhǔn)的概率。
(3)2個(gè)犯罪嫌疑人混合類型
①混合樣本匹配概率(QC2-2):?jiǎn)位蜃?個(gè)隨機(jī)個(gè)體(稱為1~4號(hào)),將1~2號(hào)混合作為混合樣本,將3~4號(hào)視為2個(gè)犯罪嫌疑人,則3號(hào)、4號(hào)和混合樣本符合混合樣本判斷標(biāo)準(zhǔn)的概率。
②混合樣本識(shí)別能力(DPC2-2):?jiǎn)位蜃?個(gè)隨機(jī)個(gè)體(稱為1~4號(hào)),將1~2號(hào)混合作為混合樣本,將3~4號(hào)視為2個(gè)犯罪嫌疑人,則3號(hào)、4號(hào)和混合樣本不符合混合樣本判斷標(biāo)準(zhǔn)的概率。
∵DP事件和Q事件是相互對(duì)立的事件
∴DPC2-11+QC2-11=1,DPC2-1+QC2-1=1,DPC2-2+QC2-2=1
DP的數(shù)學(xué)推導(dǎo)與個(gè)體識(shí)別DP類似,均為先推導(dǎo)Q公式,而非直接DP公式。
2.2.2 DPC2-11公式
設(shè)某基因座上A、B、C、D的基因頻率分別為a、b、c、d。設(shè)定義中的1~3號(hào)隨機(jī)個(gè)體的基因型概率分別為1~3號(hào)概率。假設(shè)合并概率=1號(hào)概率×2號(hào)概率×3號(hào)概率。根據(jù)2組分混合樣本的基因型分為4種情況:
(1)混合樣本A
∵1~3號(hào)的基因型均為A
∴合并概率1=a2×a2×a2=a6
(2)混合樣本AB
∵1~3號(hào)的基因型組分為3大類:
①1號(hào)基因型為A、2~3號(hào)基因型為B/AB時(shí),概率=a2(b2+2ab)2
②1號(hào)基因型為B、2~3號(hào)基因型為A/AB時(shí),概率=b2(a2+2ab)2
③1號(hào)基因型為AB、2~3號(hào)基因型為A/B/AB時(shí),概率=2ab(a2+b2+2ab)2
∴合并概率2=a2(b2+2ab)2+b2(a2+2ab)2+2ab(a2+b2+2ab)2
(3)混合樣本ABC
∵1~3號(hào)的基因型組分為6大類:
①1號(hào)基因型為A、2~3號(hào)基因型為BC時(shí),概率=a2(2bc)2
②1號(hào)基因型為B、2~3號(hào)基因型為AC時(shí),概率=b2(2ac)2
③1號(hào)基因型為C、2~3號(hào)基因型為AB時(shí),概率=c2(2ab)2
④1號(hào)基因型為AB、2~3號(hào)基因型為C/AC/BC時(shí),概率=2ab(c2+2ac+2bc)2
⑤1號(hào)基因型為AC、2~3號(hào)基因型為B/AB/BC時(shí),概率=2ac(b2+2ab+2bc)2
⑥1號(hào)基因型為BC、2~3號(hào)基因型為A/AB/AC時(shí),概率=2bc(a2+2ab+2ac)2
∴合并概率3=12a2b2c2+2ab(c2+2ac+2bc)2+2ac(b2+2ab+2bc)2+2bc(a2+2ab+2ac)2
(4)混合樣本ABCD
∵1~3號(hào)的基因型組分為6大類:
①1號(hào)基因型為AB、2~3號(hào)基因型為CD時(shí),概率=2ab(2cd)2
②1號(hào)基因型為AC、2~3號(hào)基因型為BD時(shí),概率=2ac(2bd)2
③1號(hào)基因型為AD、2~3號(hào)基因型為BC時(shí),概率=2ad(2bd)2
④1號(hào)基因型為BC、2~3號(hào)基因型為AD時(shí),概率=2bc(2ad)2
⑤1號(hào)基因型為BD、2~3號(hào)基因型為AC時(shí),概率=2bd(2ac)2
⑥1號(hào)基因型為CD、2~3號(hào)基因型為AB時(shí),概率=2cd(2ab)2
∴合并概率4=2ab(2cd)2+2ac(2bd)2+2ad(2bd)2+2bc(2ad)2+2bd(2ac)2+2cd(2ab)2
綜上,DPC2-11=1-Q2C-11=1-(合并概率1+合并概率2+合并概率3+合并概率4)。設(shè)n為某基因座的等位基因數(shù),Pi, Pj, Pk, Pw為該基因座第i, j, k, w個(gè)等位基因頻率。將合并概率轉(zhuǎn)化為全基因座形式,則DPC2-11公式為:
2.2.3 DPC2-1公式
設(shè)某基因座上A、B、C、D的基因頻率分別為a、b、c、d。設(shè)定義中的1~3號(hào)隨機(jī)個(gè)體的基因型概率分別為1~3號(hào)概率。假設(shè)合并概率=1號(hào)概率×2號(hào)概率×3號(hào)概率。分為4種情況:
(1)混合樣本A
∵1~3號(hào)均為A
∴合并概率1=a2×a2×a2=a6
(2)混合樣本AB
∵1~2號(hào)的基因型組合為A+B、B+A、AB+AB、A+AB、AB+A、B+AB、AB+B共計(jì)7種。
∴1號(hào)概率×2號(hào)概率的總和=a2·b2+b2·a2+2ab·2ab+a2·2ab+2ab·a2+b2·2ab+2ab·b2=6a2b2+4a3b+4ab3
∵3號(hào)基因型為A/B/AB
∴3號(hào)概率=a2+b2+2ab
∴合并概率2=(6a2b2+4a3b+4ab3)(a2+b2+2ab)
(3)混合樣本ABC
∵1~2號(hào)的基因型組合為AB+BC、BC+AB、AC+BC、BC+AC、AB+AC、AC+AB、A+BC、BC+A、B+AC、AC+B、AB+C、C+AB共計(jì)12種。
∴1號(hào)概率×2號(hào)概率的總和=2(2ab·2bc+2ac·2bc+2ab·2ac+a2·2bc+b2·2ac+c2·2ab)=12(a2bc+ab2c+abc2)
∵3號(hào)可能為A/B/C/AB/AC/BC
∴3號(hào)概率=a2+b2+c2+2ab+2ac+2bc
∴合并概率3=12(a2bc+ab2c+abc2)(a2+b2+c2+2ab+2ac+2bc)
(4)混合樣本ABCD
∵1~2號(hào)的基因型組合共計(jì)6種,但每種的概率均為4abcd
∴1號(hào)概率×2號(hào)概率的總和=24abcd
∵3號(hào)基因型為AB/AC/AD/BC/BD/CD
∴3號(hào)概率=2ab+2ac+2ad+2bc+2bd+2cd
∴合并概率4=48abcd(ab+ac+ad+bc+bd+cd)
綜上,DPC2-1=1-Q2C-1=1-(合并概率1+合并概率2+合并概率3+合并概率4)。設(shè)n為某基因座的等位基因數(shù),Pi, Pj, Pk, Pw為該基因座第i, j, k, w個(gè)等位基因頻率。將合并概率轉(zhuǎn)化為全基因座形式,則DPC2-1公式為:
2.2.4 DPC2-2公式
設(shè)某基因座上A、B、C、D的基因頻率分別為a、b、c、d。設(shè)定義中的1~4號(hào)隨機(jī)個(gè)體的基因型概率分別為1~4號(hào)概率。假設(shè)合并概率=1號(hào)概率×2號(hào)概率×3號(hào)概率×4號(hào)概率。分為4種情況:
(1)混合樣本A
∵1~4號(hào)均為A
∴合并概率1=a2×a2×a2×a2=a8
(2)混合樣本AB
∵1~2號(hào)的基因型組合為A+B、B+A、AB+AB、A+AB、AB+A、B+AB、AB+B共計(jì)7種。
∴1號(hào)概率×2號(hào)概率的總和=a2·b2+b2·a2+2ab·2ab+a2·2ab+2ab·a2+b2·2ab+2ab·b2=6a2b2+4a3b+4ab3
∵3號(hào)概率×4號(hào)概率的總和=1號(hào)概率×2號(hào)概率的總和
∴合并概率2=(6a2b2+4a3b+4ab3)2
(3)混合樣本ABC
∵1~2號(hào)的基因型組合為AB+BC、BC+AB、AC+BC、BC+AC、AB+AC、AC+AB、A+BC、BC+A、B+AC、AC+B、AB+C、C+AB共計(jì)12種。
∴1號(hào)概率×2號(hào)概率的總和=2(2ab·2bc+2ac·2bc+2ab·2ac+a2·2bc+b2·2ac+c2·2ab)=12(a2bc+ab2c+abc2)
∵3號(hào)概率×4號(hào)概率的總和=1號(hào)概率×2號(hào)概率的總和
∴合并概率3=[12(a2bc+ab2c+abc2)]2
(4)混合樣本ABCD
∵1~2號(hào)的基因型組合共計(jì)6種,但每種的概率均為4abcd
∴1號(hào)概率×2號(hào)概率的總和=24abcd
∵3號(hào)概率×4號(hào)概率的總和=1號(hào)概率×2號(hào)概率的總和
∴合并概率4=(24abcd)2
綜上,DPC2-2=1-Q2C-2=1-(合并概率1+合并概率2+合并概率3+合并概率4)。設(shè)n為某基因座的等位基因數(shù),Pi, Pj, Pk, Pw為該基因座第i, j, k, w個(gè)等位基因頻率。將合并概率轉(zhuǎn)化為全基因座形式,則DPC2-2公式為:
2.3.1 DPC2-11公式模擬實(shí)驗(yàn)
根據(jù)2.1方法和中國(guó)漢族人群基因頻率,在單基因座上模擬n組,每組包含3個(gè)隨機(jī)個(gè)體(稱為1~3號(hào))。在每組中,將1~2號(hào)組成混合樣本,將3號(hào)視為犯罪嫌疑人,1號(hào)視為受害人,判斷3號(hào)、1號(hào)和混合樣本是否符合混合樣本標(biāo)準(zhǔn)。設(shè)不符合標(biāo)準(zhǔn)的組的數(shù)量為C1,則DPC2-11模擬值(DPC2-11-S)=C1/n。設(shè)n=1000萬(wàn),在Identifiler系統(tǒng)的15個(gè)基因座上統(tǒng)計(jì)DPC2-11-S。
根據(jù)公式(1)和中國(guó)漢族人群基因頻率,在15個(gè)基因座上計(jì)算DPC2-11的公式值(DPC2-11-F)。
2.3.2 DPC2-1公式模擬實(shí)驗(yàn)
根據(jù)2.1方法和中國(guó)漢族人群基因頻率,在單基因座上,模擬n組,每組包含3個(gè)隨機(jī)個(gè)體(稱為1~3號(hào))。在每組中,將1~2號(hào)組成混合樣本,將3號(hào)視為犯罪嫌疑人,判斷3號(hào)和混合樣本是否符合混合樣本標(biāo)準(zhǔn)。設(shè)不符合標(biāo)準(zhǔn)的組的數(shù)量為C2,則DPC2-1模擬值(DPC2-1-S)=C2/n。設(shè)n=1000萬(wàn),在15個(gè)基因座上統(tǒng)計(jì)DPC2-1-S。
根據(jù)公式(2)和中國(guó)漢族人群基因頻率,在15個(gè)基因座上計(jì)算DPC2-1的公式值(DPC2-1-F)。
2.3.3 DPC2-2公式模擬實(shí)驗(yàn)
根據(jù)2.1方法和中國(guó)漢族人群基因頻率,在單基因座上,模擬n組,每組包含4個(gè)隨機(jī)個(gè)體(稱為1~4號(hào))。在每組中,將1~2號(hào)組成混合樣本,將3~4號(hào)視為2個(gè)犯罪嫌疑人,判斷3~4號(hào)和混合樣本是否符合混合樣本標(biāo)準(zhǔn)。設(shè)不符合標(biāo)準(zhǔn)的組的數(shù)量為C3,則DPC2-2模擬值(DPC2-2-S)=C3/n。設(shè)n=1000萬(wàn),在15個(gè)基因座上統(tǒng)計(jì)DPC2-2-S。
根據(jù)公式(3)和中國(guó)漢族人群基因頻率,在15個(gè)基因座上計(jì)算DPC2-2的公式值(DPC2-2-F)。
Identifiler系統(tǒng)15個(gè)基因座的DPC2-11、DPC2-1和DPC2-2的模擬值和公式值如表所示。將單基因座DP值代入多基因座CDP公式[4],計(jì)算得Identifiler系統(tǒng)的CDPC2-11=1-1.82910×10-13、CDPC2-1=1-1.98396×10-8、CDPC2-2=1-5.15033×10-22。結(jié)果表明:
表 Identifiler系統(tǒng) DPC2-11、DPC2-1和 DPC2-2的模擬值和公式值
(1)各基因座上,DPC2-11、DPC2-1和DPC2-2的模擬值和公式值均極為接近,因此公式(1)~(3)均符合模擬實(shí)驗(yàn)驗(yàn)證。
(2)無(wú)論單基因座或多基因座的系統(tǒng)效能對(duì)比,均有犯罪嫌疑人和未知個(gè)體混合類型<犯罪嫌疑人和受害人混合類型<2個(gè)犯罪嫌疑人混合類型。
隨著磁珠法自動(dòng)提取平臺(tái)的大量應(yīng)用和擴(kuò)增試劑盒的進(jìn)步,DNA檢測(cè)的靈敏度越來(lái)越高,從脫落細(xì)胞等檢材中檢出混合樣本分型結(jié)果也越來(lái)越多,最常見(jiàn)的2組分混合樣本分型的解釋和分析也越來(lái)越重要。雖然2組分混合樣本的分類方法和相應(yīng)LR值計(jì)算方法早已有報(bào)道[5],但是不管系統(tǒng)效能,僅憑LR值高低單一指標(biāo)進(jìn)行統(tǒng)計(jì)決策是不可靠的[6]。本實(shí)驗(yàn)在2組分混合樣本分類基礎(chǔ)上,對(duì)3種類型的系統(tǒng)效能公式進(jìn)行數(shù)學(xué)推導(dǎo),均符合實(shí)驗(yàn)驗(yàn)證。這一結(jié)論不僅證明本實(shí)驗(yàn)數(shù)學(xué)公式的有效性,而且進(jìn)一步體現(xiàn)模擬實(shí)驗(yàn)驗(yàn)證方法在法醫(yī)DNA領(lǐng)域的復(fù)雜概率問(wèn)題中的強(qiáng)大輔助能力。
在全國(guó)公安機(jī)關(guān)DNA數(shù)據(jù)庫(kù)基礎(chǔ)上,可以根據(jù)本實(shí)驗(yàn)混合樣本判斷標(biāo)準(zhǔn)建立混合樣本直接比對(duì)法。以下分別論述混合樣本直接比對(duì)法在3種類型中比對(duì)價(jià)值和實(shí)戰(zhàn)意義:
(1)犯罪嫌疑人和受害人混合類型是性犯罪案件中最常見(jiàn)的類型,其系統(tǒng)效能(1-1.82910×10-13)高于雙親皆疑鑒定系統(tǒng)效能(1-8.66381×10-11),具有很高的比對(duì)價(jià)值。傳統(tǒng)上根據(jù)專家人工拆分該類型混合樣本的案例報(bào)道[7-9],在Identifiler試劑盒的15個(gè)基因座上分別拆分出10、7、12、14個(gè)基因座的犯罪嫌疑人分型。專家人工拆分雖然可拆分出較多基因座,但主要依賴于經(jīng)驗(yàn)和判斷,主觀性很強(qiáng),風(fēng)險(xiǎn)很大。Clayton[10]等強(qiáng)調(diào)混合樣本分析的獨(dú)立性,即單獨(dú)分析混合樣本的基因型組合,最后才與比對(duì)樣本進(jìn)行比較,從而避免人工拆分的先入為主和個(gè)人偏好。直接比對(duì)法將混合樣本和受害人與數(shù)據(jù)庫(kù)進(jìn)行直接比對(duì),可充分利用全部基因座的分型信息,無(wú)需錄入峰高及峰面積數(shù)據(jù),混合比例也無(wú)任何影響。因此,在該類型中應(yīng)用直接比對(duì)法方便省力,價(jià)值高,風(fēng)險(xiǎn)低,大大優(yōu)于傳統(tǒng)拆分法。
(2)對(duì)于犯罪嫌疑人和未知個(gè)體混合類型,雖然其系統(tǒng)效能(1-1.98396×10-8)在3個(gè)分類中最低,但仍高于三聯(lián)體鑒定的系統(tǒng)效能(1-1.00239×10-6),同樣具有較高的比對(duì)價(jià)值。無(wú)比對(duì)樣本的2組分混合樣本通常最難拆分,需要根據(jù)排列組合原理,拆分出多個(gè)分型,進(jìn)行鐘擺查詢,工作量大,分析復(fù)雜[11]。在實(shí)際應(yīng)用中,Pendulum算法中混合樣本中主要組分被正確拆分出來(lái)且排在第1位的可能性只有50%,主要組分或次要組分均正確拆分且排在前10名的可能性有40%[12]。因此,該類型拆分風(fēng)險(xiǎn)大,可行性低,沒(méi)有實(shí)戰(zhàn)意義。與之相比,直接比對(duì)法將混合樣本與數(shù)據(jù)庫(kù)進(jìn)行直接比對(duì),不產(chǎn)生大量的可能分型,風(fēng)險(xiǎn)較低,具備實(shí)戰(zhàn)意義。
(3)對(duì)于2個(gè)犯罪嫌疑人混合類型,其系統(tǒng)效能(1-5.15033×10-22)甚至高于個(gè)體識(shí)別系統(tǒng)效能(1-7.47208×10-18)。雖然理論上可以進(jìn)行2個(gè)犯罪嫌疑人混合類型的比對(duì),但是實(shí)際上不可能如同雙親皆疑的父+母聯(lián)合錄入方法一樣聯(lián)合錄入2個(gè)犯罪嫌疑人的分型,因此,該類型比對(duì)不具備實(shí)戰(zhàn)意義。實(shí)際應(yīng)用中以犯罪嫌疑人和未知個(gè)體混合類型比對(duì)來(lái)代替。此外,該類型的系統(tǒng)效能高于個(gè)體識(shí)別,貌似不合常理,但是實(shí)際上本實(shí)驗(yàn)研究的前提是理想狀態(tài)下的2組分混合樣本。實(shí)際檢案中,混合樣本很難達(dá)到理想狀態(tài),特別是脫落細(xì)胞檢材的真峰和偽峰混雜,難以辨認(rèn)。更大的不確定因素則來(lái)自于組分?jǐn)?shù)評(píng)估,這也是混合樣本鑒定的主要風(fēng)險(xiǎn)之一。周密等人計(jì)算表明Identifiler系統(tǒng)中約3.56%的3組分混合樣本和0.02%的4組分混合樣本可表現(xiàn)為2組分混合樣本形式。即使2組分混合樣本的組分?jǐn)?shù)評(píng)估風(fēng)險(xiǎn)最低,也不能排除高組分混合樣本帶來(lái)的干擾。若考慮組分?jǐn)?shù)評(píng)估風(fēng)險(xiǎn),則該類型的真實(shí)系統(tǒng)效能顯然低于個(gè)體識(shí)別。
綜上所述,混合樣本直接比對(duì)法的適用范圍廣,實(shí)戰(zhàn)意義大,風(fēng)險(xiǎn)較低,若進(jìn)一步開(kāi)發(fā)混合樣本直接比對(duì)軟件,則可大大提高公安機(jī)關(guān)應(yīng)用混合樣本分型比中案件犯罪嫌疑人的能力,為辦案指明方向。
[1]鄭秀芬.法醫(yī)DNA分析[M].北京:中國(guó)人民公安大學(xué)出版社,2002:412-421.
[2]周密,汪軍.混合DNA樣本的組分?jǐn)?shù)分析[J].刑事技術(shù),2017(1):28-31.
[3]吳薇薇,劉冰,郝宏蕾,等.中國(guó)28個(gè)省/區(qū)漢族人群41個(gè)STR基因座多態(tài)性數(shù)據(jù)分析[J].中國(guó)法醫(yī)學(xué)雜志,2016(1):27-32.
[4]周密,韋帆.兩個(gè)個(gè)體混合樣本似然比率分析法的研究[C]//葛百川.DNA數(shù)據(jù)庫(kù)建設(shè)應(yīng)用成果與展望IV.北京:中國(guó)人民公安大學(xué)出版社,2015:409-414.
[5]鄭秀芬,紀(jì)貴金.二組分混合樣品DNA結(jié)果解釋[J].中國(guó)法醫(yī)學(xué)雜志,2000(4):203-207.
[6]侯一平.法醫(yī)物證司法鑒定實(shí)務(wù)[M].北京:法律出版社,2013:222-224.
[7]陳蓉華,侯杰,晏斌,等.成功拆分混合樣本破獲強(qiáng)奸案1例[J].法醫(yī)學(xué)雜志,2014(1):78-79.
[8]李旭鵬,張玉紅,賈東濤,等.混合基因型拆分分析1例[J].中國(guó)法醫(yī)學(xué)雜志,2011(3):246-246.
[9]苑美青,李萬(wàn)水,康艷榮,等.混合樣本拆分查詢犯罪嫌疑人的應(yīng)用研究[J].刑事技術(shù),2012(6):5-7,12.
[10] Clayton T M, Whitaker J P, Sparkes R, et al. Analysis and interpretation of mixed forensic stains using DNA STR profiling[J]. Forensic Science International,1998(1):55-70.
[11] 陳靜,徐秀蘭,李萬(wàn)水,等.混合樣本拆分結(jié)合快速協(xié)查比對(duì)平臺(tái)破獲命案積案[C]//葛百川.DNA數(shù)據(jù)庫(kù)建設(shè)應(yīng)用成果與展望IV.北京:中國(guó)人民公安大學(xué)出版社,2015:228-230.
[12] Bill M, Gill P, Curran J, et al. PENDULUM—a guideline-based approach to the interpretation of STR mixtures[J]. Forensic Science International,2005(2-3):181-189.
Experimental Research of System Effectiveness in Mixed Sample with 2 Components
ZHOU Mi1,2Wang Jun2
(1 Criminal Police Detachment of Wuhu Public Security Bureau Anhui Wuhu 241000;2 School of Computer & Information Science of Anhui Polytechnic University Anhui Wuhu 241000)
The system effectiveness of the mixed sample with 2 components is derived by formula, which is verifi ed by random simulation. Firstly, 3 kinds of exact defi nition of system effectiveness in mixed sample with 2 components were established, and the corresponding mathematical formulas were derived based on the defi nition. 3 kinds of formula values were calculated in 15 STR loci of Identifi ler system. Secondly, 3 kinds of simulation values were counted through multi-group simulation experiments in 15 STR loci. Finally, 3 kinds of formulas were empirically validated by correlation method between the formula values and simulation values. The result shows that 3 kinds of formulas are all in accord with the simulation experiments. In Identifiler system, system effectiveness of suspect and victim type (CDPC2-11) was 1-1.82910×10-13, system effectiveness of suspect and unknown type (CDPC2-1) was 1-1.98396×10-8, system effectiveness of 2 suspects type (CDPC2-2)was 1-5.15033×10-22. 3 kinds of formulas could be applied to the calculation of system effectiveness in mixed sample with 2 components.
Mixed sample System effectiveness Stochastic simulation method
DF795.2
A
2095-7939(2017)05-0090-06
10.14060/j.issn.2095-7939.2017.05.018
2017-05-12
安徽省科技強(qiáng)警資助項(xiàng)目(編號(hào):1604d0802002)。
周密(1982-),男,安徽蕪湖人,安徽省蕪湖市公安局刑警支隊(duì)主檢法醫(yī)師,主要從事法醫(yī)物證學(xué)研究。
(責(zé)任編輯:孟凡騫)