0 引言
在龐大的人口體系中,眾多學者對人體的血樣分組檢測法進行了大量的研究。最早的分組檢測在1943年德國科學家Dorfman在對罕見疾病進行大樣本研究時發(fā)現(xiàn),對樣本進行分組檢測可以快速有效地識別出患病個體,此研究成果一出就引發(fā)了醫(yī)學界的震動[1]。1957年,Swallow指出在樣本分組檢測中利用極大似然估計方法得到的分組結(jié)果存在一定誤差[2]。對于大規(guī)模的血液檢測,單體檢測需要花費大量的時間和資金的投入。通過建立不同的樣本分組,替換掉原始的單個體檢測的方法,減少血液檢測的次數(shù)從而提高檢測的效率。盡管分組方法被提出后受到眾多學者的關注,但對實驗進行樣本分組,組大小的確定是一直以來學者們探討的難題。 雖然在使用近似最優(yōu)組大小進行樣本分組實驗相比于傳統(tǒng)Dorfman單體檢測可以獲取更大的效益,但是這種實驗失敗的風險也是巨大的[3]。對龐大的人口體系進行分組檢測并不是分組檢測人數(shù)越多越好,也不是分組人數(shù)越少越好,只有通過恰當?shù)姆纸M才能有效地降低檢測的次數(shù)[4]。張樂成在血液檢測分組模型中,給出了分組檢測模型中求導迭代判斷的最佳K值計算方法及計算機程序,該方法的檢測存在一定的誤差影響[5]。檢測過程的環(huán)境和手段都可能給檢測結(jié)果造成一定的影響。檢測個體一般分為陽性個體和陰性個體,在檢測過程中常會出現(xiàn)把真實狀態(tài)為陽性的個體檢測為陰性,真實狀態(tài)為陰性的個體檢測為陽性等現(xiàn)象,使得檢測過程中患病率p 和最優(yōu)組大小的估算產(chǎn)生誤差[6]。李浩研究稀釋效應下針對分組檢測數(shù)據(jù)的參數(shù)估計問題,利用EM算法求得參數(shù)估計,并進行模擬計算,該方法在檢測誤差中可以有效提高檢測效率[7]。為了更加準確地估計總體患病率p 和確定最優(yōu)分組大小k,本文采用數(shù)學期望值最小化原則推導出患病率q 的估計區(qū)間,并提出一種新的逐步調(diào)整分組大小的迭代算法,快速準確地確定最優(yōu)分組大小k。本文方法計算簡單高效,可為傳染病的分組檢測提供更加精確的參考。
1 分組檢測模型建立
整個分組檢測算法從兩個方面展開分析,其一不考慮外部環(huán)境等影響因子的Dorfman模型,其二是考慮診斷誤差影響的模型。對于流行性的傳染性疾病來說,由于檢測儀器精密程度不同、人為操作的不規(guī)范等原因,造成檢測分組的最優(yōu)組大小k 值和患病率q 估計錯誤,造成實驗的失敗。如果能夠盡早地檢測出患病者,并進行相應的隔離治療措施,可以極大地降低疾病的傳播風險,盡可能地降低檢測成本、人力物力等一系列的投入??焖俚卣业絺魅驹辞以谟行У臅r間內(nèi)控制疾病的傳播,是非常必要的。在疾病檢測中需要考慮檢測誤差,盡可能使得檢測結(jié)果更加精確,則引入了敏感性和特異性的定義,基于Dorfman原理,給出樣本分組檢測的分布函數(shù)和計算出函數(shù)的數(shù)學期望值,需要采用數(shù)學期望值取得極值問題推導出患病率q 的取值范圍和在q 取確定值下的k 值,并且采用新的逐步遞增或遞減1個單位的方法,直到函數(shù)的前一項和后一項異號,即得到最優(yōu)的分組大小k。
從表1可以看出,當最佳分組人數(shù)取111時,函數(shù)F (k) > 0,則需要采用逐級加1法,當取112時,使得函數(shù)F (k) < 0,函數(shù)的前一項和后一項異號,則最佳分組數(shù)取112。
為了驗證上述最佳分組人數(shù)的有效性,本文通過計算機語言Python進行模擬驗證,取同樣的條件,通過循環(huán)語句,當效益函數(shù)取最小值時,即取到最佳的分組人數(shù),算法如下:
由圖1顯示,循環(huán)結(jié)果的最佳分組人數(shù)也為112,則上述方法進一步證實本文運用的方法與模擬結(jié)果一致,當存在檢測誤差時,能夠得到最佳的分組人數(shù)使得檢測效益達到最優(yōu)。
從圖2可以看出,函數(shù)曲線是一個凹函數(shù),隨著分組的增加,函數(shù)逐漸遞減,當組大小k=112取到極小值時,函數(shù)隨后緩慢遞增,其最佳的分組人數(shù)為112,效益約為0.1178。
當Se = 0.9,Sp = 0.9時,考慮在不同的p 值下的最佳分組人數(shù)以及最佳分組下的檢測效率如下表所示。
由表2發(fā)現(xiàn),不同患病概率p 值下,人群中患病概率越低,進行分組檢測的最優(yōu)分組人數(shù)相對較大,患病概率越大,為了更加精確地檢測出患病個人,減少感染的風險,則需要的最佳分組人數(shù)需要相對較小,才能保證檢測的精度,當患病率達到p=0.659,則需要進行單體檢測。
3 結(jié)論
本文在考慮檢測誤差影響的情況下,基于Dorf?man分組檢測原理,采用數(shù)學期望值最小化原則推導出患病率q 的估計區(qū)間,提出一種新的逐步調(diào)整分組大小的迭代算法,快速準確地確定最優(yōu)分組大小k。通過Python語言給出了最優(yōu)分組檢測算法,且模擬出的結(jié)果與迭代算法計算出的結(jié)構(gòu)一致,充分證明新方法在誤差檢查下,可以有效地估算出最佳的分組大小。本文方法計算簡單高效,可為傳染病的分組檢測提供參考。