趙 芃 吳立晨 閆淼佳 米白冰 陳方堯 顏 虹
西安交通大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系,710061陜西 西安
在診斷醫(yī)學領(lǐng)域,評估一種新的診斷試驗對某疾病的診斷能力有很重要的現(xiàn)實意義[1]。靈敏度和特異度是診斷試驗評價中最基本的指標,其余相關(guān)綜合性評價指標如ROC曲線、Youden指數(shù)、陽性/陰性預測值等,皆以其為基礎(chǔ)。在經(jīng)典的診斷試驗評價中,靈敏度和特異度的估計須依靠“金標準”,但在診斷試驗評價的實踐中,不存在“金標準”或“金標準”難以實施的情形卻十分常見。
以2020年初爆發(fā)的新型冠狀病毒肺炎(COVID-19)疫情為例,根據(jù)第8版診療指南[2]相關(guān)規(guī)定,我國目前的COVID-19確診病例的診斷是以RT-PCR核酸與血清總抗體檢測的聯(lián)合檢測結(jié)果為基礎(chǔ)的。有研究表明,雖然聯(lián)合檢測的靈敏度可達到99.4%,但COVID-19確診患者的核酸檢測陽性率僅有30%~50%[3],可知臨床上使用的核酸與抗體檢測均不是該疾病診斷的“金標準”。隨著全球疫情的發(fā)展,越來越多的新型冠狀病毒檢測試劑盒被研發(fā)出來,從中選出最優(yōu)的檢測方法對于疫情的防控有重要的現(xiàn)實意義。此時,一種能快速高效地評估診斷準確性的方法顯得尤為重要。
無“金標準”診斷試驗評價的相關(guān)方法學研究一直是診斷試驗評價的熱點問題。當前無“金標準”診斷試驗的分析框架,可以追溯至Hui和Walter在1980年提出的經(jīng)典模型(以下簡稱Hui-Walter模型)[4]。Hui-Walter模型的核心思想是用最大似然估計法解決“金標準”缺失的問題,估算診斷試驗的準確性參數(shù)。近年來,潛在類別分析或潛在分類分析在無“金標準”診斷試驗評價中有著廣泛的應用,這一類方法也是在Hui-Walter模型的基礎(chǔ)上提出的。
Hui-Walter模型對于試驗有一個基本的假設(shè),即條件獨立的假設(shè)。所謂條件獨立[5]是指在被檢個體的真實情況為患病或不患病的狀態(tài)下,2種診斷試驗的檢測結(jié)果無關(guān),如血液檢查和X射線檢查。但在實際應用中“條件獨立”這一假設(shè)常無法得到滿足,即需比較診斷準確性的試驗,其檢測原理往往是類似的。例如欲比較鼻咽拭子組合(CNTS)和鼻咽抽吸物(NPA)使用逆轉(zhuǎn)錄酶PCR(RT-PCR)檢測甲型H1N1流感病毒的準確性[6],Hui-Walter模型則無法使用。之前已有學者改進Hui-Walter模型[7-8]來弱化條件獨立這一要求,但有的優(yōu)化模型存在增加模型計算難度等問題[9]。
基于這樣的問題,Lu等[10]在條件相關(guān)假設(shè)下,對Hui-Walter模型進行了改進,提出了Hui-Walter模型的簡化模型(以下簡稱簡化條件模型)。該模型降低了Hui-Walter模型的復雜度,使參數(shù)的估計更加簡便,并且拓展了該方法的適用范圍。
本文將從簡化條件模型的基本原理、極大似然估計算法的實現(xiàn)、應用實例等方面對該模型進行介紹。
耶魯大學的Hui和Walter基于有誤差率未知的標準診斷試驗的條件下,提出了評估新診斷試驗準確性的方法[4]。本文介紹的Lu等[10]提出的診斷試驗準確性評價方法是以此方法為基礎(chǔ)進行優(yōu)化得到的,故先對Hui等提出的Hui-Walter模型的原理進行介紹。
令D表示個體真實的患病狀態(tài)(1=患病,0=不患病);πs表示總體S的患病率;Ti=j表示第i(i=1,2,…)種診斷試驗的結(jié)果(j=0:陰性,j=1:陽性)。則對從總體S中抽樣得到的所有個體用第i種診斷方法進行檢測后,可得該診斷方法(第i種診斷試驗)的相關(guān)診斷性能評價指標有:假陽性率αi=pi(Ti=1|D=0),假陰性率βi=pi(Ti=0|D=1),靈敏度(1-βi),特異度(1-αi)。
該無“金標準”診斷試驗的數(shù)據(jù)形式如表1所示:
表1 2個診斷試驗應用于同一樣本(來自總體S)的數(shù)據(jù)形式
同時,該方法在應用中,需滿足如下假設(shè):
(1)總體S(S=1,2)的患病率不相等,即π1≠π2。若π1=π2,則說明研究樣本來自同一個總體,即S=1,R=2時,S (2)診斷試驗Ti(i=1,2)在總體S(S=1,2)中抽得的個體進行試驗,試驗結(jié)果的出錯率相同,即α1,i=α2,i=αi,β1,i=β2,i=βi。若α1,i≠α2,i,β1,i≠β2,i,此時的待估參數(shù)θ′=(α1,1,α2,1,α1,2,α2,2,β1,1,β2,1,β1,2,β2,2,π1,π2)共10個,在R=2,S=2的條件下無法估計。故條件(2)也必須滿足。 (3)對于同一被檢個體,診斷試驗T1和T2的檢測結(jié)果條件獨立。 基于以上假設(shè),診斷試驗T1和T2在總體S中診斷結(jié)果的頻率分布為S個獨立的多項式。其似然函數(shù)為: (1) 結(jié)合已知的觀測數(shù)據(jù)ns,jk,用式(1)可對待估的參數(shù)θ=(α1,α2,β1,β2,π1,π2)進行估計。 當待評估診斷試驗的原理相同或相近時,不同診斷方法的檢測結(jié)果可能條件相關(guān)[11]。例如:在牛結(jié)核病的診斷中,細菌學和PCR檢測都可能有條件地依賴于動物的感染狀態(tài)[12]。這種依賴性主要是由于PCR陽性動物和PCR陰性動物細菌學試驗的不同敏感性(或特異性)引起。而Hui-Walter模型對條件相關(guān)的診斷試驗缺乏穩(wěn)健性[7,13],對此,之前有研究者將Hui-Walter模型進行優(yōu)化,使其適用于條件相關(guān)的情形;但是優(yōu)化后的這些模型存在不同程度的缺陷,如協(xié)方差模型[7]被引入2個診斷試驗應用于2個總體的Hui-Walter模型,該模型的主要缺陷是:當有n個診斷試驗需要評價時,需要(n2+n)個參數(shù)。隨機效應模型[8]將“條件相關(guān)”看作每個待評估的診斷試驗均未發(fā)現(xiàn)的隨機效應,但是該模型易導致有偏估計[14]。 本文介紹的簡化條件模型,是Lu等[10]剔除第(3)條假設(shè),引入經(jīng)驗條件法后優(yōu)化Hui-Walter模型得到的。該模型的計算易實現(xiàn),且模型評估結(jié)果準確。 診斷方法T1的診斷結(jié)果為j(即T1=j),診斷方法T2的診斷結(jié)果為k的聯(lián)合概率為: ps,(j,k)=p(T1=j,T2=k|S)。 (2) 診斷方法T1的診斷結(jié)果為k(即T1=k)的前提下,診斷方法T2的結(jié)果為j的條件概率為: ps,(j|k)=p(T2=j|T1=k,S)。 診斷方法T2的診斷結(jié)果為k(即T2=k)的前提下,診斷方法T1的結(jié)果為j的條件概率為: qs,(j|k)=p(T1=j|T2=k,S)。 (3) 結(jié)合定義的參數(shù),根據(jù)貝葉斯公式可得2種診斷方法的不同結(jié)果組合時,對應的聯(lián)合概率可表達為: (4) 根據(jù)表1定義的數(shù)據(jù)形式,結(jié)合試驗檢測結(jié)果得到的數(shù)據(jù),可對ps,(j|k)和qs,(j|k)進行經(jīng)驗估計,即: (5) 將式(4)和經(jīng)驗估計式(5)帶入式(1),得經(jīng)驗似然估計為: ([πs(1-β1)+(1-πs)α1]ps,(0|1)+[πsβ2+(1-πs)(1-α2)]qs,(1|0))ns,10× ([πsβ1+(1-πs)(1-α1)]ps,(1|0)+[πs(1-β2)+(1-πs)α2]qs,(0|1))ns,01× ([πsβ1+(1-πs)(1-α1)]ps,(0|0)+[πsβ2+(1-πs)(1-α2)]qs,(0|0))ns,00]。 (6) 以從總體S(S=1,2)中獲得的觀測數(shù)據(jù)(ns,11,ns,10,ns,01,ns,00)為基礎(chǔ),用式(6)即可對6個待估參數(shù)θ=(α1,α2,β1,β2,π1,π2)進行估計。 式(1)似然函數(shù)的參數(shù)中是3階多項式,并且需要事先設(shè)定診斷試驗T1和T2的檢測結(jié)果條件獨立。在沒有條件獨立要求的情況下,Lu等得到關(guān)于參數(shù)的2階多項式的似然函數(shù)式(6)。也就是說,似然函數(shù)式(6)比式(1)具有更少的要求并且計算更簡單。 COVID-19具有極強的傳染性,是全球大流行的公共衛(wèi)生事件。當前咽拭子或鼻拭子的新型冠狀病毒(SARS-CoV-2)核酸檢測結(jié)果是COVID-19診斷的重要依據(jù),但常發(fā)現(xiàn)患者咽拭子核酸檢測陰性后鼻拭子核酸檢測復查呈陽性的現(xiàn)象。鑒于疫情防控工作的重要性,比較鼻拭子、咽拭子2種取樣方法的病毒核酸檢測敏感性,發(fā)現(xiàn)靈敏度高的方法對提高病例診斷的準確性有重要價值[15-16]。 劉焱斌等[15](研究1)對100例疑似和確診COVID-19病例同時留取咽拭子和鼻拭子,周蘭蘭等[16](研究2)對541例疑似病例和密切接觸者同時采集鼻拭子和咽拭子標本。兩研究均對所得鼻咽拭子樣本用實時熒光PCR技術(shù)檢測SARS-CoV-2核酸(表2)。 表2 COVID-19不同采樣方式檢測病毒核酸的結(jié)果比較 因2種取樣方法對COVID-19的診斷均以所得標本SARS-CoV-2核酸檢測結(jié)果陽性為標準,則可認為2種方法的診斷結(jié)果相關(guān),不滿足條件獨立假設(shè)[1]。 現(xiàn)用條件簡化模型和Hui-Walter模型,對鼻拭子和咽拭子的COVID-19篩檢效果進行評價(表3)。我們發(fā)現(xiàn)條件簡化模型估計鼻拭子(靈敏度為99.95%)的病毒核酸檢測陽性率明顯高于咽拭子(靈敏度為59.43%),與多項研究的結(jié)果一致[15,17-19]。相比之下,Hui-Walter模型的估計結(jié)果與實際狀況相差較大。 表3 條件簡化模型的準確性評價結(jié)果 本文主要介紹了簡化條件模型的基本原理和應用,為無“金標準”條件下診斷試驗的準確性評價提供了一種新方法。 無“金標準”條件下,診斷試驗準確性的評價日益引起科研工作者的關(guān)注。經(jīng)典的Hui-Walter模型的應用基于條件獨立的假設(shè),但在實際應用中待評估的診斷試驗有時難以滿足條件獨立的要求。本文介紹的條件簡化模型剔除條件獨立的假設(shè),對Hui-Walter模型進行優(yōu)化,實例研究結(jié)果顯示條件簡化模型對于不滿足條件獨立要求的診斷試驗的準確性有較好的評價效果。 此外,SAS軟件的proc iml過程步驟、R語言中的多個函數(shù)包均可用于極大似然估計算法的實現(xiàn),滿足不同研究者的編程需求并且極大地方便該模型的推廣應用。見附錄A[掃描本文開放科學(資源服務(wù))標識碼(OSID)]。 總的來說,簡化條件模型作為一種實用性強、算法簡便且易于理解的新模型,值得在診斷醫(yī)學領(lǐng)域推廣應用。1.2 簡化條件模型的基本原理
2 實例分析
3 討論