[摘要] 目的 建立一套基于非參數統(tǒng)計原理的評估方案,用于空白標本檢測結果為非正態(tài)分布、標準曲線為非直線線性的檢測體系最低檢出限(limit of detection,LoD)的確定。 方法 根據數據分布模型,以非參數統(tǒng)計方法確定空白標本檢測結果的第95百分位數作為空白檢測限(limit of blank,LoB),通過LoD=LoB+tβ×s低值的數學模型來評估LoD。 結果 以非參數統(tǒng)計方法建立的評估程序可通過驗證程序證明該LoD值有效。 結論 對于空白標本檢測結果不符合正態(tài)分布,標準曲線為非直線線性的資料可用非參數統(tǒng)計的評估方法來確定LoD。
[關鍵詞] 最低檢出限;非參數統(tǒng)計;非正態(tài)分布
[中圖分類號] R311 [文獻標識碼] B [文章編號] 1673-9701(2012)28-0108-03
根據國際標準化機構(ISO)要求,在確定檢測體系的最低檢出限(LoD)時盡量避免Ⅰ(α)類和Ⅱ(β)類統(tǒng)計學錯誤的發(fā)生[1-4],ISO制定的一系列評估方案已考慮到這一問題,但都基于參數統(tǒng)計原理設計[5,6],只適用于空白標本測定結果符合正態(tài)分布、標準曲線為直線線性的檢測體系LoD的確定。但實際工作中有些儀器不報告吸光度、熒光強度等原始響應量,對于小于零的擬合結果直接報告為零或較小的正值,導致空白標本的檢測結果不符合正態(tài)分布規(guī)則。此外,很多定量檢測項目特別是基于抗原-抗體反應原理的檢測方法,標準曲線并不符合一元一次直線線性[2,5,7],而是復雜的曲線線性。針對以上不適合采用參數統(tǒng)計方法評估檢測體系LoD的情況,應建立一種新的采用非參數統(tǒng)計原理設計的LoD評估方案來確定檢測體系的LoD。
1 參數統(tǒng)計方法的理論基礎及應用局限
理論上,空白標本由于不含有待測物,其真實濃度(μβ)為零,但由于空白響應量并不是一個固定值,其波動服從正態(tài)分布規(guī)律,因此對空白標本進行多次檢測所得到的檢測結果并不總是等于零。以均值(x)和標準偏差(S)表示空白響應量的集中位置和離散程度,單次檢測的空白響應量有95%的概率分布在區(qū)間[x-2·s,x+2·s]內。在確定方法學性能或繪制標準曲線時常常以x作為校準至零點的基準,其對應的待測物濃度(x空白)定為零。各個檢測樣品的反應響應量減去x就是該標本中待測物產生的響應量,結合標準曲線計算出待測物濃度。由于空白響應量有波動,因此空白標本的檢測結果應對稱分布在x空白的兩側,大于0和小于0的概率都是50%,符合正態(tài)分布規(guī)則,空白標本單次檢測結果有95%的概率在區(qū)間[x空白-2·s空白,x空白+2·s空白]內,在此區(qū)間外的概率只有5%。以該區(qū)間的上限值(x空白+2·s空白)作為空白檢測限(limit of blank,LoB),只有檢測結果高于LoB時才認為標本中確實含有待測物。對于小于或等于LoB的檢測結果認為是由空白標本單次檢測的空白響應量波動造成,可報告“無分析物檢出”。但部分儀器無法給出原始響應量,而是直接報告檢測結果,并將負值結果自動轉換為零或者指定的檢測低限,無法給出負值的檢測結果。從醫(yī)學角度分析,患者血清或其他體液標本中某待測物的含量不可能為負值,儀器對負值結果的轉化是合理的,但這種偏態(tài)分布資料不適合采用參數統(tǒng)計方法通過x空白和s空白來確定該檢測體系的LoB[8,9]。否則得到的LoB要明顯大于真實的LoB[8],從而導致很大一部分低濃度標本被誤判為陰性,而出現(xiàn)“假陰性”的報告。
2 非參數統(tǒng)計方法的理論基礎
2.1 Ⅰ類錯誤與LoD的關系
2.2 Ⅱ類錯誤與LoD的關系
3 非參數統(tǒng)計的評估程序
3.1 空白標本和低值標本的納入標準
空白標本的物理性狀和基質成分應盡可能接近患者標本,如果患者常規(guī)標本為血清或血漿標本,則應選擇不含待測物的血清或血漿標本作為空白標本而不是非血清基質的緩沖液。由于不同來源的標本可能存在不同的基質效應以及形成不同的內源性復合物,為確保評估過程中的檢測具有代表性,應選擇多份空白標本(建議5~10份甚至更多),每份標本多次測定。低濃度標本也同樣采用一系列(至少5~10例)不同患者來源的血清/血漿標本,每份標本進行5~10次重復測定,連續(xù)檢測5~10 d,得到低濃度標本檢測結果的標準偏差(s低值)。
3.2樣本量的選擇
評估程序中,空白標本數量和低值標本數量的最佳比例的選擇取決于LoB估計值(LoB估計)和低值標本檢測結果的離散度估計的不確定性。統(tǒng)計學上非參數統(tǒng)計方法的效率要低于參數統(tǒng)計方法,其檢驗效率只有參數統(tǒng)計的一半左右,因此用非參數統(tǒng)計的方法計算P95·空白時,建議空白標本的數量應該大于低值標本的數量。但低值標本檢測結果的離散程度(s低值)要明顯大于空白標本檢測結果的離散程度(s空白)。因此綜合以上兩個因素,建議空白標本和低值標本的檢測次數一樣或至少接近[8]。而且理論上通過增加空白標本和低值標本的重復檢測次數可以擴大樣本量,減少抽樣誤差,使樣本更好地反映總體。但實際工作中不可能對標本進行無限次重復檢測,一般要求做20次或20次以上的重復測定,降低P95·空白和s低值來分別估計LoB和σs所帶來的不確定性。
3.3 LoB和LoD的評估
由于是從有限例數的樣本信息中推斷總體特征,因此在LoD的評估過程中還要考慮到估值的不確定性,LoD估計的不確定性由LoB估計和s低值的不確定性共同構成??瞻讟吮局貜蜋z測次數(nB)不同,LoB的95%的可信限(Confidence Interval,CI)也不同,當50≤nB≤300時,可通過LoB的可信限界值表來查得LoB的80%和95%的可信限[10]。例如當nB=50,LoB有95%的概率落入第(n-5)位數到第n位數這一區(qū)間內(所有的檢測結果按照從小到大順序排列)。s低值估值80%和95%的可信限的界限值通過其公差因數表查得。
在實際的評估過程中,我們只能根據已有的資料或經驗粗略地估計LoD可能的存在范圍,配置該濃度水平的低值標本并重復測定,根據該濃度水平下檢測結果的s低值來計算LoD估計。Linnet[8]認為:對于含有不同待測物水平的低值標本,其檢測結果的離散程度有差異,隨著標本濃度的增加,檢測結果的離散度同時增加。但兩個低值標本的待測物濃度相差較小時,兩組檢測結果的離散度可認為是相當的。因此處理程序就相對簡單,否則還要將標準偏差考慮成一個隨樣本濃度變化而變化的函數,那將會是一個非常復雜的處理程序。
3.4 LoD估計或LoD理論的驗證
根據以上點估計的方法得到的LoD估計難以和LoD真值完全一致,因此必須對LoD估計的有效性進行檢驗。此外,很多實驗室的現(xiàn)有條件可能難以建立一個適合本實驗室使用的LoD,那么就要對制造商提供的理論LoD(LoD理論)進行有效性檢驗,評價其是否適用于本實驗室的檢測體系。一套完整的LoD估計或LoD理論驗證程序包括:①對一份或多份空白標本進行nB次重復檢測后,計算P95·空白,作為本實驗室檢測體系的LoB估計;②在空白標本中加入標準品,使標本中的待測物濃度達到LoD估計或LoD理論水平,觀察檢測結果中大于LoB估計的部分在所有檢測結果中所占的比例(P),P≥95%時認為LoD估計或LoD理論是有效的??紤]到以樣本代替總體時,會發(fā)生抽樣誤差,因此對于n<1000的樣本,即使LoD估計或LoD理論有效,P值也可能低于95%。所以Linnet[8]在假設α=β=0.05、σs/σB=1.5、n=nB=nS的前提下,利用統(tǒng)計學原理進行模擬分析,得出不同樣本量的情況下,對待測物濃度為LoD估計或LoD理論水平的最低濃度標本的檢測結果中要求大于LoB的比例。對于樣本量在20~1 000之間的樣本,我們可以通過查詢要有多少相應比例的檢測結果分布在指定區(qū)間內。對于完整檢驗程序來說,由于LoB是一個自變量,所以這一比例可以適度放寬。
3.5結果的報告
LoB的取值直接反映醫(yī)學實驗室的檢測水平,關系到患者結果如何報告臨床,是報告“檢測到某物質”還是報告“未檢出某物質”,這對臨床來說應該是一個非常明確的提示。如果報告“未檢出某物質”,那說明某物質的檢測結果低于LoB水平,這意味著標本中該物質的真實水平“可能”要低于LoD。為什么是“可能”呢?因為我們還要考慮到統(tǒng)計學的Ⅱ類錯誤(即β類錯誤)的發(fā)生,盡管其發(fā)生的概率往往被限制在5%以內。因此,對于一個低于LoB水平的檢測結果,我們只能夠報告“低于LoD水平”而不能夠報告“低于LoB水平”或是“0”。對于一個大于LoB的結果,這意味著其濃度大于0,一般報告”>0”或者“檢到某物質”,因為這樣我們可以避開統(tǒng)計學I類錯誤(α類錯誤)的發(fā)生,盡管發(fā)生此類錯誤的概率低于5%。
對于待測物水平等于或略高于LoD的標本的檢測結果,其相對不確定度往往會很大,一般來說這種數據不應直接報告給臨床。對于每個定量檢測的項目還應該設立其相應的定量限 (Limit of Quantitation,LoQ),以規(guī)范定量檢測結果的報告,這一界限值(LoQ)和實驗室能接受的相對不精密度(CV)有關。在實驗室的操作規(guī)程和文件中,每個項目的LoQ都應明確規(guī)定,例如在CV為10%或20%時,各自對應的LoQ是多少。應該充分考慮在這一濃度水平的檢測結果可能存在的偏倚,以便計算出其相應的LoQ,使定量檢測項目的檢測結果能夠準確報告。為了保證檢驗結果報告的科學性,當檢驗結果≤LoB時,可報告“未檢出待測物”或“待測物濃度 [參考文獻] [1] International Organization for Standardization. Capability of detection-part 1:terms and definitions(11843-1)1997 ISO Geneva,Switzerland. [2] International Organization for Standardization. Capability of detection-part 2:methodology in the linear calibration case(11843-2)2000 ISO Geneva,Switzerland. [3] International Organization for Standardization. Capability of detection-part 3:methodology for determination of the critical value for the response variable when no calibration data are used(11843-3)2001 ISO Geneva,Switzerland. [4] International Organization for Standardization. Capability of detection-part 4:methodology for comparing the minimum detectable value with a given value(11843-4)2001 ISO Geneva, Switzerland. [5] Currie LA. Nomenclature in evaluation of analytical methods including detection and quantif- ication capabilities(IUPAC recommendations 1995)[J]. Pure Appl Chem,1995,67(10):1699-1723. [6] Davenport JM,Schlain B. Testing claimed minimal detectable concentrations of in vitro medical diagnostic devices[J]. Clin Chem,2000,46(10):1669-1680. [7] Brown EN,McDermott TJ,Bloch KJ,et al. Defining the smallest analyte concentration an immunoassay can measure[J]. Clin Chem,1996,42(6 Pt 1):893-903. [8] Linnet K,Kondratovich M. Partly nonparametric approach for determining the limit of detection[J]. Clin Chem,2004,50(4):732-740. [9] 馮仁豐. 分析靈敏度(檢測限)[J]. 上海醫(yī)學檢驗雜志,2002,17(3):133-136. [10] Hahn GJ,Meeker WQ. Statistical intervals:A guide for practitioners[M]. New York:John Wiley Sons,1991:319. (收稿日期:2012-05-07)