曾四清
1. 廣東省疾病預(yù)防控制中心(廣州 511430)
2. 廣東省公共衛(wèi)生研究院(廣州 511430)
混合檢驗(yàn)的主要目的是提高檢測(cè)能力和效率,降低檢測(cè)成本?;旌蠙z驗(yàn)的方法主要包括單采混檢、混采檢測(cè)和混采混檢三種[1-4]。2020—2022 年間,我國(guó)新冠肺炎疫情防控大規(guī)模人群新冠病毒核酸篩查工作中,采用了5 至10份單采標(biāo)本稀釋混樣檢測(cè),5 合1、10 合1 和20合1 等多種混采檢驗(yàn)技術(shù)[5-8]。有的地區(qū)還嘗試采用混采混檢技術(shù),以進(jìn)一步提高檢驗(yàn)工作效率、降低成本[2]。目前,對(duì)于混合檢驗(yàn)的效率研究主要集中于單采混檢,而對(duì)混采檢測(cè)和混采混檢的研究則較少[1-4,9-14]。不同于單采混檢,混采檢測(cè)涉及二次采樣檢測(cè)問題。研究表明,采用最適宜的樣本混合數(shù)是實(shí)現(xiàn)混合檢測(cè)工作效率最大化的關(guān)鍵[12-13,15-16]。Agarwal 等[17]認(rèn)為有必要通過數(shù)學(xué)模型評(píng)估混采檢測(cè)的適宜采樣混合數(shù)。因此,本研究采用二項(xiàng)分布和群檢驗(yàn)技術(shù)原理,探討了混采檢測(cè)的工作效率和最適宜采樣混合數(shù)[18]。
目前,我國(guó)發(fā)布的多項(xiàng)混采檢測(cè)技術(shù)規(guī)范中,提出的采樣混合數(shù)有 5 合1、10 合1 和20 合1。據(jù)此,本研究通過預(yù)分析,縮小采樣混合數(shù)至2合1,擴(kuò)大采樣混合數(shù)至120 合1;假定人群中的感染率為1%~9%、1‰~9‰和1/萬~9/萬三個(gè)等級(jí)區(qū)間水平;假定采樣區(qū)域的總?cè)丝谝?guī)模為N,每個(gè)人感染的概率均等且在采樣檢測(cè)期間保持不變。
假設(shè)采樣與檢驗(yàn)單位工作量的權(quán)重分別為SW 和DW,SW ∶ DW=1 ∶ K,K 為二者權(quán)重比值,則SW=1/(1+K), DW=K/(1+K)。假設(shè)K 值依次為1/4、1/3、1/2、1、2、3 和4。
本研究所指的混采檢測(cè)(n-in-1 test)技術(shù)指將采集自n 人的n 支拭子集合于1 個(gè)采集管中進(jìn)行核酸檢測(cè)的方法,n 即為采樣混合數(shù)?;觳蓹z測(cè)結(jié)果為陽性、灰區(qū)或單個(gè)靶標(biāo)陽性,則對(duì)該混采管的n 個(gè)受試者分別重新采集單管拭子進(jìn)行復(fù)核,按照復(fù)核單管核酸檢測(cè)結(jié)果報(bào)告[7-8]。本研究假定檢測(cè)的靈敏度和特異度均為100%。
通過兩輪采樣檢測(cè)發(fā)現(xiàn)全部陽性感染者所需的人均采樣次數(shù)、人均檢測(cè)管數(shù)及其加權(quán)綜合工作量等指標(biāo)的變化規(guī)律來評(píng)價(jià)混采檢測(cè)的工作效率。
研究主要采用二項(xiàng)分布和群檢驗(yàn)技術(shù)理論進(jìn)行分析[13,18]。二項(xiàng)分布是指在只會(huì)產(chǎn)生兩種可能結(jié)果如“陰性”或“陽性”之一的n 次獨(dú)立重復(fù)試驗(yàn)中,當(dāng)每次試驗(yàn)的“陽性”概率π 保持不變時(shí),出現(xiàn)“陽性”次數(shù)X=0,1,2,…,n 的一種概率分布。其概率可由下面的公式求出(式1)[18]:
X=0,1,2,…n。
對(duì)于抽樣調(diào)查,若從陽性率為π 的總體N 中,有放回隨機(jī)抽取個(gè)體數(shù)為n 的樣本,則出現(xiàn)陽性數(shù)為X 的概率分布即呈二項(xiàng)分布。若是無放回隨機(jī)抽樣,當(dāng)抽取的個(gè)體數(shù)n 遠(yuǎn)小于總體數(shù)N(如n<N/10)時(shí),也可近似當(dāng)作二項(xiàng)分布處理。群檢驗(yàn)技術(shù)是二項(xiàng)分布的主要應(yīng)用之一,主要用于估計(jì)總體感染率,也可用于混合樣品分析[18]。
本研究假設(shè)大規(guī)模人群N 中的感染率為π,混合采樣采用n 人一組(管)。n 人中只要有1人陽性,該組(管)檢驗(yàn)結(jié)果即呈“陽性”,然后該組n 人即分別再次進(jìn)行單獨(dú)采樣檢測(cè)。根據(jù)二項(xiàng)分布原理,n 人一組(管)混合采樣檢測(cè)結(jié)果呈“陰性”的概率為n 人中“陽性”人數(shù)X=0的概率,表示為P(0)(式2);n 人一組(管)混合采樣檢測(cè)結(jié)果呈“陽性”的概率為n 人中“陽性”人數(shù)X=1,2,…,n 的概率合計(jì),表示為P(1 ≤X ≤n)(式3)。
據(jù)此,計(jì)算混合采樣檢測(cè)結(jié)果呈陽性的管數(shù)(number of positive tubes, NPT)(式4)、需再次單獨(dú)采樣的人數(shù)(number of resamplers, NRS) (式5),以及再次單管檢測(cè)管數(shù)(number of retest,NRT) (式6)。最后計(jì)算人均采樣次數(shù)(number of samples per capita, NSPC)(式7)和人均檢測(cè)管數(shù)(number of tubes per capita, NTPC)(式8)。如果采用單采單檢,人均采樣次數(shù)和人均檢測(cè)管數(shù)則均為1。因此,本研究采用混采檢測(cè)的采樣工作量增長(zhǎng)率(sampling workload growth rate,SWGR)(式9)和檢測(cè)工作量增長(zhǎng)率(detection workload growth rate, DWGR)(式10)反應(yīng)采樣工作效率和檢測(cè)工作效率變化。同時(shí),計(jì)算權(quán)重比值為K 時(shí)的采樣與檢測(cè)加權(quán)綜合工作量增長(zhǎng)率(weighted comprehensive workload growth rate,WCWGR)(式11或式12),反應(yīng)綜合工作效率變化。SWGR=((NSPC-1)/1)×100%
可見,如果不考慮單檢與混檢之間檢測(cè)靈敏度與特異度的差異,式9 和式10 兩指標(biāo)均只取決于兩個(gè)參數(shù)π 和n 的大小,與N 無關(guān);式11和式12 除與π 和n 的大小有關(guān),還與權(quán)重比值K 有關(guān),與N 無關(guān)。因此,本研究主要分析在較大規(guī)模人群中,不同感染率下,采用不同采樣混合數(shù)n 時(shí)的采樣工作效率和檢測(cè)工作效率,繪制不同感染率、不同采樣混合數(shù)情況下的SWGR 變化曲線圖和DWGR 變化曲線圖。同時(shí),分別從不同感染率π 值、不同權(quán)重比值K 情況下,篩選出加權(quán)綜合工作量增長(zhǎng)率最小值(minimum weighted comprehensive workload growth rate, MWCWGR)及其采樣混合數(shù)(m),即為混采檢測(cè)加權(quán)綜合工作效率最適宜的采樣混合數(shù)m 值,并制成圖表。
繪制SWGR 和DWGR 曲線時(shí)選用2 ≤n≤50示意;計(jì)算最小值和繪制MWCWGR 與m 曲線時(shí)選用2 ≤n≤120,以展現(xiàn)最佳工作效率和最適宜采樣混合數(shù)變化規(guī)律。
根據(jù)本研究結(jié)果,對(duì)采樣混合數(shù)為5 合1、10 合1 和20 合1 的最適宜人群感染率及混采檢測(cè)效率進(jìn)行評(píng)估。
本研究采用Python 語言numpy、pandas、matplotlib.pyplot 和scipy.stats 等編程工具包進(jìn)行數(shù)據(jù)整理分析和可視化[19-20]。
按照人群感染率π 在1%~9%、1‰~9‰和1/萬~9/萬三個(gè)區(qū)間取值并進(jìn)行分析,繪制采樣混 合數(shù)n 為2 合1 至50 合1 的SWGR 和DWGR變化曲線圖,分別見圖1、圖2 和圖3。結(jié)果顯示,SWGR 隨著采樣混合數(shù)的增加而增加,感染率越高,增加幅度越大,但不超過100%;DWGR 隨著采樣混合數(shù)的增加呈現(xiàn)先下降后回升的變化趨勢(shì),存在最低值,感染率越高,下降幅度越小,但不超過0%。
圖1 感染率為1%~9%的人群混采檢測(cè)的SWGR和DWGR變化曲線圖Figure 1. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1% to 9%
圖2 感染率為1‰~9‰的人群混采檢測(cè)的SWGR和DWGR變化曲線圖Figure 2. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1‰ to 9‰
圖3 感染率為1/萬~9/萬的人群混采檢測(cè)的SWGR和DWGR變化曲線圖Figure 3. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1/10 000 to 9/10 000
根據(jù)感染率π、采樣混合數(shù)n 和權(quán)重比K,計(jì)算WCWGR,篩選出MWCWGR 及其采樣混合數(shù)(m),結(jié)果見表1 和圖4。結(jié)果顯示,感染率越高,最適宜采樣混合數(shù)越小,MWCWGR越大(負(fù)數(shù)的絕對(duì)值越?。?,即混采檢測(cè)效率提高越少;K 值越大,最適宜采樣混合數(shù)越大,MWCWGR越小(負(fù)數(shù)的絕對(duì)值越大),即混采檢測(cè)效率提高越多。然而,當(dāng)感染率超過6%以上,且K 值小于1/2 時(shí),MWCWGR 即為正數(shù),表明混采檢測(cè)反而增加工作量,降低工作效率。此時(shí),就不宜采用該方法。
表1 不同感染率人群中混采檢測(cè)加權(quán)綜合工作量增長(zhǎng)率最小值(%)及其采樣混合數(shù)Table 1. Swab pooling sizes at the MWCWGRs (%) for swab pooling detection in people with different infection rates
表1 和圖4 顯示,當(dāng)K 值依次為1/4、1/3、1/2、1、2、3 和4 時(shí),5 合1 分別最適用于在感染率為7‰~1%、9‰~1%、1%~2%、2%、3%、3%~4%和4%的人群中進(jìn)行混采檢測(cè),相應(yīng)的MWCWGR 分別為-12.55%~-11.10%、-15.58%~-15.10%、-21.93%~-17.24%、-30.39%、-39.21%、-45.87%~-41.54%和-45.54%;10合1 分別最適用于在感染率為2‰、2‰~3‰、3‰~4‰、5‰、7‰、8‰~9‰和8‰~9‰的人群中進(jìn)行混采檢測(cè),相應(yīng)的MWCWGR 分別為-16.02%、-20.55%~-19.55%、-27.05%~-26.09%、-40.11%、-53.22%、-59.78%~-58.86% 和-64.28%~-63.36%;2 0 合1 分 別 最適用于在感染率為5/萬、6/萬~7/萬、8/萬~9/萬、1‰~2‰、1‰~2‰、2‰和2‰的人群中進(jìn)行混采檢測(cè),相應(yīng)的MWCWGR 分別為-18%、-22.56%~-22.36%、-30.08%~-29.88%、-45.55%~-43.72%、-61.53%~-59.43%、-67.33%和-72.08%??梢姡S著K 值增大,采樣混合數(shù)5 合1、10 合1 和20 合1 混采檢測(cè)技術(shù)應(yīng)用的最適宜感染率分別逐步提高,加權(quán)綜合工作量減少的幅度分別逐步增大。
本研究主要基于二項(xiàng)分布和群檢驗(yàn)技術(shù)原理,推導(dǎo)出混采檢測(cè)的采樣工作效率和檢測(cè)工作效率計(jì)算公式,并據(jù)此分析了人群感染率在百分率、千分率和萬分率三個(gè)取值區(qū)間場(chǎng)景下,不同采樣混合數(shù)的采樣和檢測(cè)工作量增長(zhǎng)率,得到了其變化趨勢(shì)圖。同時(shí),按照采樣與檢測(cè)單位工作量七級(jí)權(quán)重比值,分別計(jì)算了各個(gè)水平感染率情況下的MWCWGR,篩選出其中的最小值及其采樣混合數(shù)。據(jù)此,對(duì)5 合1、10 合1 和20 合1 混采檢測(cè)的最適宜感染率及工作效率進(jìn)行了評(píng)估。
本研究主要有以下發(fā)現(xiàn):第一,混采檢測(cè)綜合工作效率的決定性因素(參數(shù))是感染率、采樣混合數(shù),以及采樣與檢驗(yàn)的單位工作量權(quán)重,而與人口規(guī)模沒有直接聯(lián)系。第二,無論感染率高低和采樣混合數(shù)多少,混采檢測(cè)均會(huì)增加采樣工作量人次數(shù),超過單采人次數(shù),且隨著采樣混合數(shù)的增加,采樣人次數(shù)增加;感染率越高,增加的幅度越大,速度越快。第三,無論感染率高低和采樣混合數(shù)多少,混采檢測(cè)均會(huì)減少檢測(cè)工作量,且隨著采樣混合數(shù)的增加,檢測(cè)工作量呈現(xiàn)先減少后回升的變化趨勢(shì),但總不會(huì)超過單采單檢的檢測(cè)工作量。因此,存在檢驗(yàn)工作量減少幅度最大的最佳采樣混合數(shù)。感染率越低,檢測(cè)工作量減少幅度越大,減少的速度越快。第四,加權(quán)綜合工作量增長(zhǎng)率分析顯示,在不同感染率的人群中進(jìn)行混采檢測(cè),可以得到相應(yīng)的混采檢測(cè)加權(quán)工作效率最高的采樣混合數(shù)。感染率越高,最適宜采樣混合數(shù)越小,其提高的工作效率值越低;感染率越低,最適宜采樣混合數(shù)越大,甚至可以達(dá)到90 合1 及以上,其提高的加權(quán)工作效率值越高,可以達(dá)到75%以上。第五,當(dāng)人群感染率超過6%,且K 值小于1/2 時(shí),MWCWGR 即為正數(shù),此時(shí)混采檢測(cè)會(huì)增加工作量降低工作效率,不宜采用。第六,不同的采樣與檢驗(yàn)單位工作量權(quán)重下,5 合1、10 合1 和20 合1 混采檢測(cè)技術(shù)分別有各自最適用的人群感染率水平。然而,近兩年發(fā)布的多個(gè)混采檢測(cè)技術(shù)規(guī)范,均未指明其適用范圍,各地在實(shí)際工作中無法科學(xué)選擇使用[6-8]。對(duì)此,很有必要修訂完善,確保使用混采檢測(cè)技術(shù)時(shí),能根據(jù)人群感染率高低和采樣與檢驗(yàn)的單位工作量權(quán)重,正確選用最適宜采樣混合數(shù),以最大限度地提高工作效率。
本研究主要采用的是數(shù)理分析方法,其中檢測(cè)效率部分的研究方法和主要研究結(jié)果與Robert D[21]對(duì)混合血清檢測(cè)梅毒抗原的研究,Abdalhamid等[9]和Brynildsrud[16]對(duì)SARS-CoV-2/COVID-19 混樣檢測(cè)效果研究及陳穎丹等[13]對(duì)混合血清檢測(cè)寄生蟲病的效果研究具有一致性,表明該數(shù)理分析研究方法用于實(shí)踐是可行的。然而,上述研究采用實(shí)驗(yàn)室檢測(cè)效率對(duì)比分析方法,主要針對(duì)的是實(shí)驗(yàn)室混樣檢測(cè)工作效率。本研究則是針對(duì)混采檢測(cè),不僅針對(duì)實(shí)驗(yàn)室檢測(cè)工作效率,同時(shí)還包括現(xiàn)場(chǎng)采樣工作效率。因此,本研究結(jié)果有助于制定最佳混采檢測(cè)策略,提高綜合工作效率。
本研究的結(jié)果分析及其應(yīng)用需注意以下幾點(diǎn):首先,從分析原理及計(jì)算模型直觀看,混采檢測(cè)的工作效率不受人口規(guī)模的影響,但為了滿足二項(xiàng)分布的應(yīng)用條件,需假設(shè)人群中個(gè)人的感染概率保持均等且恒定,所應(yīng)用場(chǎng)景的人口規(guī)模應(yīng)足夠大。其次,由于傳染病具有一定的傳染性和聚集性,通常人群中的感染率分布并不均勻,應(yīng)用時(shí)須考慮到這一點(diǎn),可將人群根據(jù)感染率水平細(xì)分為亞群進(jìn)行分析應(yīng)用。再次,本研究主要以采樣和檢測(cè)工作量(人力成本)變化為指標(biāo),評(píng)估混采檢測(cè)的工作效率,并未考慮經(jīng)濟(jì)成本和流行病學(xué)調(diào)查等其他成本權(quán)重。采樣工作與檢測(cè)工作的單位工作量成本與單位經(jīng)濟(jì)成本存在一定差異,單位檢測(cè)經(jīng)濟(jì)成本權(quán)重高于單位采樣經(jīng)濟(jì)成本權(quán)重;如果采樣混合數(shù)過大,對(duì)混采檢測(cè)陽性管全體人員進(jìn)行再次單獨(dú)采樣和流行病學(xué)調(diào)查時(shí),會(huì)增加人力成本[22]。因此,對(duì)全要素成本—效益綜合評(píng)估有待進(jìn)一步研究。最后,本研究假設(shè)混采檢測(cè)與單采單檢的檢測(cè)方法的靈敏度與特異度保持一致,實(shí)際上二者可能存在差異,樣本混合數(shù)過多會(huì)增加假陰性的風(fēng)險(xiǎn),對(duì)檢測(cè)效果會(huì)產(chǎn)生一定影響[3,23]。
綜上,混采檢測(cè)能提高采樣檢測(cè)綜合工作效率,針對(duì)不同感染率的人群,存在提升加權(quán)綜合工作效率最大化的最適宜采樣混合數(shù)。本研究為分析評(píng)估混采檢測(cè)工作效率提供了技術(shù)方案,為疾病篩查檢測(cè)工作中針對(duì)不同的感染率水平確定能最大化提升綜合采樣檢測(cè)工作效率的適宜采樣混合數(shù)提供了參考。同時(shí),也為開展混采檢測(cè)綜合成本—效益分析提供了研究方法基礎(chǔ)。通過研究混采檢測(cè)綜合工作效率最大化和成本投入最小化,可以實(shí)現(xiàn)最優(yōu)的綜合成本—效益,從而為進(jìn)一步優(yōu)化完善疾病篩查混采檢測(cè)技術(shù)規(guī)范提供科學(xué)依據(jù)。