張詩詩,王薇,趙海建,王治國
(1.北京醫(yī)院 國家老年醫(yī)學中心,衛(wèi)生部臨床檢驗中心/北京市臨床檢驗工程技術研究中心,北京 100730;2.北京協(xié)和醫(yī)學院研究生院,北京 100730)
·專家論壇·
常規(guī)臨床檢驗項目如何選擇不同分析性能規(guī)范模型*
張詩詩1,2,王薇2,趙海建2,王治國1,2
(1.北京醫(yī)院 國家老年醫(yī)學中心,衛(wèi)生部臨床檢驗中心/北京市臨床檢驗工程技術研究中心,北京 100730;2.北京協(xié)和醫(yī)學院研究生院,北京 100730)
2014年,歐洲臨床化學和檢驗醫(yī)學聯(lián)合會(EFLM)等機構在米蘭聯(lián)合召開了一次關于設定分析性能規(guī)范(analytical performance specifications)的戰(zhàn)略性會議。該會成立了一個任務完成小組,專門負責根據不同分析性能規(guī)范設定模型的準則,為常規(guī)臨床檢驗項目選擇合理的模型并設定合理的分析性能規(guī)范。模型1,基于分析性能對臨床結果的影響設定分析性能規(guī)范。選擇該模型的被測量應在特殊疾病的診斷和/或監(jiān)測以及醫(yī)療決策的制定中起關鍵且明確的作用,其相應測量結果所建立的切值/決定限在疾病的診斷、篩查或監(jiān)測過程中也起核心作用。模型2,基于被測量的生物學變異組分來設定分析性能規(guī)范。選擇該模型的被測量應在特殊疾病的診斷和/或監(jiān)測,以及臨床表現(xiàn)中不起關鍵作用,且被測量的濃度處于穩(wěn)定狀態(tài)。模型3,基于測量的當前技術水平來設定分析性能規(guī)范。選擇該模型的被測量應該是無法使用前2種模型以及需要進一步研究臨床結果或生物學變異數據的被測量。該文介紹常規(guī)臨床檢驗項目如何選擇不同分析性能規(guī)范模型。
分析性能規(guī)范;生物學變異;當前技術水平
2014年歐洲臨床化學和檢驗醫(yī)學聯(lián)合會(The European Federation of Clinical Chemistry and Laboratory Medicine,EFLM)等機構[1]在意大利米蘭召開了關于“在斯德哥爾摩會議15年之后規(guī)定分析性能規(guī)范”的第1次戰(zhàn)略性會議。該會議將1999年“斯德哥爾摩等級結構”調整并簡化成3種模型用于設定分析性能規(guī)范(analytical performance specifications):模型1,基于分析性能對臨床結果的影響;模型2,基于被測量的生物學變異(biological variation)組分;模型3,基于測量的當前技術水平[2]。同時,EFLM成立了專門的任務完成小組,負責根據米蘭會議共識聲明中所規(guī)定的各種模型的準則以及不同檢驗項目的具體情況,為常規(guī)臨床檢驗項目選擇恰當的分析性能規(guī)范設定模型[1-3]。
設定分析性能規(guī)范的3種模型各具優(yōu)缺點。在為常規(guī)臨床檢驗項目選擇分析性能規(guī)范設定模型時,必須清楚地說明選擇依據[3]。對于同一檢驗項目,用不同模型設定分析性能規(guī)范有差異。例如,糖化血紅蛋白(HbA1c)基于生物學變異數據導出的適當水平允許總誤差是±3%,但我國室間質量評價(EQA)標準則基于我國實驗室檢測的當前技術水平將允許總誤差設定為±10%。因此,對于運用何種模型,應以患者需求為基礎并提供清晰明確且科學合理的依據。在選擇模型的過程(圖1)中,模型1和2是優(yōu)先選擇的方法。然而,模型1作為設定分析性能規(guī)范的“金標準”,是極難實現(xiàn)的一種方法;模型2作為臨床實驗室普遍認可和接受的方法,也依然無法適用于所有檢驗項目。因此,對于無法使用前兩種優(yōu)選模型的檢驗項目以及需要進一步研究臨床結果或生物學變異數據的檢驗項目,可以暫時使用模型3來設定分析性能規(guī)范。
模型1的顯著優(yōu)點在于其可以通過研究分析性能對臨床結果的影響,導出直接與臨床結果相關的分析性能規(guī)范。研究一般分為2類[5]:(1)直接結果研究,適用于檢測結果、醫(yī)療決策與臨床結果間有明確定義關系的檢驗項目。研究方法通常是診斷性隨機對照試驗(randomized controlled trials,RCTs),要求大量的樣本數據,并且根據檢測結果制定的醫(yī)療決策,其完整的臨床結果需要通過持續(xù)較長的隨訪時間來獲得,時間成本大。(2)間接結果研究,是基于試驗的分析性能對臨床分類或醫(yī)療決策以及患者結局概率的影響設定分析性能規(guī)范。研究方法包括聯(lián)系證據法、模擬或決策分析模型(相比于診斷性RCTs,此方法更快、更易且成本更低)。一般用于比較新檢測方法和現(xiàn)有檢測方法的分析性能差異并推斷臨床結果的差異。適用檢驗項目滿足以下條件:(1)與檢測結果相關的臨床決策具有明確的定義;(2)可以利用與檢測的診斷準確度相關的證據進行臨床(患者)分類并制定不同的醫(yī)療決策;(3)對于正確或錯誤的檢測結果分類,已經建立了相應的臨床結果。由于直接結果研究極具挑戰(zhàn)性,因此間接結果研究更為可行[5]。
圖1 常規(guī)臨床檢驗項目選擇分析性能規(guī)范設定模型的基本流程[4]
然而,模型1也存在明顯的缺點,即易受當前檢測質量的影響,臨床結果可能會因實際應用的試驗方法、研究人群和醫(yī)療環(huán)境的差異而有所不同[2]。因此,在使用模型1設定的分析性能規(guī)范之前,需要評估其有效性。原則上,該模型設定的分析性能規(guī)范,其對應的被測量應該在特殊疾病的診斷和/或監(jiān)測以及醫(yī)療決策的制定中起關鍵且明確的作用;被測量的測量結果不僅可用于建立公認的切值或決定限,還可直接影響患者的管理及其臨床結果。選擇模型1來設定分析性能規(guī)范的常規(guī)臨床檢驗項目有多種:(1)總膽固醇、高(低)密度脂蛋白膽固醇等。這些與血脂含量相關的檢驗項目目前已有明確規(guī)定的決定限和相關的治療指征,對心血管疾病的風險定義至關重要,提高檢測過程的分析質量可有效降低心血管疾病風險定義的錯誤分類[6-7]。(2)肌鈣蛋白。該項目是診斷急性冠脈綜合征(acute coronary syndrome, ACS)特異的生物化學標志物。假設檢測方法無偏移,在肌鈣蛋白的決定限,當分析不精密度(CVA)為16%時,醫(yī)生的誤診率為1.8%~3.6%;當CVA<10%時,誤診率<1%;當CVA<6%時,誤診率僅為0.5%[8]。數據說明了分析不精密度對誤診率(臨床結果)的影響,若能研究并確定臨床可接受的誤診率,即可反過來設定重復測量中可接受的允許不精密度。若檢測方法存在正偏移,則部分真陰性的檢測結果會被判斷為陽性;若檢測方法存在負偏移,則部分真陽性的檢測結果會被判斷為陰性;對于錯誤劃分的檢測結果(假陽性和假陰性結果),若能通過研究確定其可接受的百分比,即可反過來設定檢測方法的允許偏移[9]。類似地,對于不同允許總誤差下的肌鈣蛋白檢測結果,若能研究并確定其產生的臨床結果(死亡率、再入院率等)的可接受程度,也可反過來設定允許總誤差。(3)清蛋白。該指標在血液、泌尿、消化系統(tǒng)等多種疾病的診斷和治療監(jiān)測中是一個重要的生物化學標志物。在血液系統(tǒng)疾病的診斷中,國際骨髓瘤工作小組推薦,血漿清蛋白濃度>35 g/L聯(lián)合血漿β2微球蛋白<3.5 g/L,可用于第一期多發(fā)性骨髓瘤的分類[10]。在對腎臟透析患者治療監(jiān)測時,血漿清蛋白濃度達到并維持在40 g/L以上可認為患者達到治療目標并有較好的蛋白質能量營養(yǎng)狀態(tài);相反,若在慢性透析開始或維持透析治療過程中,血漿清蛋白濃度低于40 g/L,則預示有高度的死亡風險[11-12]。在消化系統(tǒng)疾病中,肝硬化并伴有自發(fā)性細菌性腹膜炎或伴有難治性腹水并使用利尿劑治療的患者,或伴有腸下垂或經歷大型外科手術的患者,一般血漿清蛋白濃度<25 g/L代表需要輸注清蛋白。在使用人體清蛋白替代治療時,建議使用血漿清蛋白的測量結果來計算其輸注劑量并用于治療監(jiān)測。(4)血紅蛋白。血紅蛋白濃度水平是臨床診斷貧血或相關疾病,以及判斷有無輸血指征的重要依據。目前,國際上對于貧血的診斷切值規(guī)定為男性130 g/L、非妊娠女性120 g/L、兒童110 g/L[13];輸血的決定限為70~80 g/L,但若患者血紅蛋白濃度處于穩(wěn)定狀態(tài)則無需輸血[14-15];血紅蛋白增多癥的決定限為男性180 g/L、女性160 g/L。(5)血小板。其濃度對于判斷是否輸注血小板有重要意義。對于臨床表現(xiàn)穩(wěn)定的患者,當血小板<10×109/L時表明需要輸注血小板;對于臨床表現(xiàn)不穩(wěn)定的患者,需要輸注血小板的切值是20×109/L;對于小型外科手術治療的患者,需要輸注血小板的切值是50×109/L,而對于大型外科手術治療的患者切值則為100×109/L[16]。(6)葡萄糖和糖化血紅蛋白(HbA1c)。二者對于糖尿病的診斷和治療監(jiān)測有重要意義,且目前已有明確規(guī)定的決定限。其中,血糖監(jiān)測可采用其他模型來設定相應的分析性能規(guī)范。(7)促甲狀腺激素(TSH)。TSH是診斷和治療監(jiān)測甲狀腺功能減低癥和甲狀腺功能亢進癥的重要生物標志物。歐洲的一部臨床實踐指南中[17],規(guī)定輕度甲狀腺功能減低癥的TSH濃度4.0~10.0 mIU/L,重度甲狀腺功能減低癥TSH濃度>10.0 mIU/L;并推薦用甲狀腺素替代治療,且成年患者TSH治療限是0.4~2.5 mIU/L,老年患者TSH治療限是1.0~5.0 mIU/L。此外,歐洲的另一部指南則對甲狀腺功能亢進癥進行了規(guī)定[18],將該疾病分為2個等級:等級1的TSH濃度0.10~0.39 mIU/L,等級2的TSH濃度<0.1 mIU/L;并建議對于65歲以上患有任意一種等級甲狀腺功能亢進癥的患者均需治療,但對于較年輕的患者僅需治療患有等級2甲狀腺功能亢進癥者。然而,不同國家/地區(qū)的臨床實踐指南中對這2種疾病TSH濃度的規(guī)定有差異[19-20]。此外,對于以上規(guī)定,目前仍沒有臨床試驗評估TSH檢測的分析性能對其應用的影響。(8)其他。如C反應蛋白的濃度可用于區(qū)分病毒和細菌感染或用于判定急性胰腺炎的嚴重程度;中性粒細胞的濃度嚴重降低時(≤0.5×109/L,中性粒細胞減少癥的范圍),預示嚴重感染的高度風險。
模型2(也稱生物學變異模型)的顯著優(yōu)點是其適用于已經基于人群或特定個體建立生物學變異數據的大部分檢驗項目。生物學變異分為個體內生物學變異(CVI)和個體間生物學變異(CVG),二者是設定允許不精密度、允許偏移和允許總誤差的相關變異組分,在使用模型2設定分析性能規(guī)范的過程中非常重要[9]。以肌酐為例,其CVI為5.95%、CVG為14.7%[21],結合表1中的公式可得到基于生物學變異導出的各水平允許不精密度、允許偏移和允許總誤差(見表2)。
表1 基于生物學變異導出各水平分析性能規(guī)范的計算公式[9]
表2 肌酐基于生物學變異導出的各水平分析性能規(guī)范
因為獲得生物學變異數據的方法科學合理[22-23],所以使用該模型設定的分析性能規(guī)范也具有客觀依據。然而,值得注意的是,有研究表明當CVI>33.3%時,個體差異的數據呈非高斯分布,該情況下不再適合用模型2來設定分析性能規(guī)范[2,24]。目前,www.westgard.com網站上所提供的生物學變異數據庫由西班牙臨床化學和分子病理學學會的Ricos教授及其團隊成員在多年前共同研究編制[21],此數據庫中有一些檢驗項目的生物學變異數據呈現(xiàn)了上述特征,因此這些檢驗項目應暫時選擇模型3并探索更好的生物學變異數據研究方法或數學方法來導出更合適的生物學變異數據[25]。由EFLM成立的任務完成小組也正在對Ricos團隊提出的生物學變異數據庫進行修訂。
使用模型2時,需要盡可能地將分析變異(相對于生物學變異)最小化。雖然該模型設定的分析性能規(guī)范與臨床結果沒有直接關聯(lián),但盡量降低分析噪音與生物學信號固有變異的比值將使結果的臨床解釋變得容易。原則上,該模型適用于特殊疾病診斷和/或監(jiān)測,以及臨床表現(xiàn)中不起關鍵作用的檢驗項目。但被測量穩(wěn)定與否、被測量的濃度、檢測的時間間隔以及潛在疾病等均會影響生物學變異數據的相關性和有效性。因此,對于選擇該模型的檢驗項目有一個重要要求,即相應被測量的濃度需要處于一個穩(wěn)定狀態(tài)。關于“穩(wěn)定”,可以分為2種不同的情況:第一,在血清/血漿中,被測量需要維持在一定的濃度水平,否則機體會患病并表現(xiàn)出癥狀(例如,被測量處于嚴格的穩(wěn)態(tài)控制下);第二,被測量實際上具有穩(wěn)定的濃度,但偏離該濃度本身不會引起癥狀。據此,在實驗室中,適于選擇該模型的檢驗項目(見表3)包括:(1)電解質和礦物質,例如鈉離子、鉀離子、鈣離子、無機磷酸鹽等,其血漿中的濃度受到激素(例如醛固酮、甲狀旁腺素等)和其他病理生理機制(例如腎損傷)的嚴格調控;(2)肌酐、尿素和半胱氨酸蛋白酶抑制劑C,其血漿中的濃度均受到腎臟功能的精細調控;(3)尿酸,腎功能可代償其內源性生成和飲食補充間的差異;(4)總蛋白,大部分典型的蛋白質在血漿中有相對較長的半衰期,可受到激素的精細調控而保持濃度穩(wěn)定;(5)血液成分(紅細胞計數、紅細胞壓積、平均紅細胞體積);(6)血紅蛋白(用于治療監(jiān)測);(7)具有明確臨床應用的基本凝血試驗,例如凝血酶原時間用于監(jiān)測雙香豆素治療,活化部分凝血活酶時間用于監(jiān)測肝素治療。
其中,鉀離子、鈣離子、肌酐、紅細胞計數、紅細胞壓積、PT、APTT等指標雖然也在醫(yī)療決策的制定中起關鍵且明確的作用,但它們仍選擇模型2設定分析性能規(guī)范。主要原因是:(1)這些指標具有生物學變異數據,且濃度或值通常處于穩(wěn)定狀態(tài);(2)根據模型1設定分析性能規(guī)范的原理,主要是通過“檢測-管理(醫(yī)療決策,指治療及進一步檢測)-結果(臨床結果,指死亡率、再入院率、生活質量等)”路徑來獲得分析性能的變化對臨床結果的影響[5]。雖然這些檢驗項目的結果對于醫(yī)療決策的制定起關鍵明確的作用,但對臨床結果的影響還需進一步明確。顯然,需要嚴格按圖1流程選擇合適的模型。
表3 選擇各種分析性能規(guī)范設定模型的常規(guī)臨床檢驗項目
注:該表僅列出臨床實驗室中的部分檢驗項目;a,代表樣本類型。
在實驗室實際工作中,對于不適于使用模型1或2的檢驗項目,以及需要進行臨床結果或生物學變異數據研究以使用對應分析性能規(guī)范設定模型的檢驗項目,可暫時使用模型3來設定分析性能規(guī)范。其中,在“當前技術水平”下的測量性能通常代表臨床實驗室常規(guī)檢測方法在技術上可以實現(xiàn)的分析性能的最高水平,但這與臨床需求之間并沒有直接的關系。顯然,該模型并非設定分析性能規(guī)范的首選方法。截止目前,針對如何使用該模型來設定分析性能規(guī)范依然尚未達成官方共識,僅Haeckel等提出的一些經驗性方法或通過EQA計劃來設定分析性能規(guī)范[2,26]。在臨床檢驗中,適于選擇該模型的檢驗項目主要是尿液中的多種被測量,例如鈉離子、鉀離子、肌酐、尿素等(見表3)。
文中根據EFLM第1次戰(zhàn)略性會議共識聲明中3種不同分析性能規(guī)范設定模型的特點[2],為臨床實驗室常規(guī)檢驗項目如何選擇具體模型提出了初步建議,并列出了適于各種模型的部分常規(guī)臨床檢驗項目。基于常規(guī)檢驗項目的特點確定具體的分析性能規(guī)范設定模型,有助于臨床實驗室運用合理的模型設定實用有效的分析性能規(guī)范,確保其分析性能水平能夠滿足要求并不斷提高,力求為臨床提供更準確的檢測結果。對于設定具體模型的檢驗項目,臨床實驗室不能盲目地運用該模型設定的分析性能規(guī)范作為質量要求。相反,臨床實驗室應判斷其實際的分析性能水平是否符合具體模型所設定的分析性能規(guī)范的要求。若符合,則可使用此分析性能規(guī)范;若不符合,則實驗室可能需要使用較低等級的模型設定較寬松的分析性能規(guī)范。
對于文中未列出的大部分常規(guī)臨床檢驗項目,也應根據3種模型的選擇原則來選擇模型并設定符合實驗室分析質量水平的分析性能規(guī)范。此外,使用文中所描述的選擇原則來為檢驗項目選取合理模型的同時,還需考慮另一問題,即不同實驗室檢測同一檢驗項目的分析質量水平有差異。因此,若其他模型能參照生物學變異模型為檢驗項目設定不同質量水平(最低、適當和最佳)的分析性能規(guī)范,則實驗室可以根據實際的分析質量水平設定更合適的分析性能規(guī)范。實驗室可在達到并使用最低水平分析性能規(guī)范時,不斷提高分析質量,進一步達到適當或最佳水平分析性能規(guī)范的要求。另外,對于暫時使用模型3來設定分析性能規(guī)范的檢驗項目,仍需進行基于臨床結果或生物學變異數據的研究。
[1]Panteghini M, Sandberg S. Defining analytical performance specifications 15 years after the Stockholm conference[J]. Clin Chem Lab Med, 2015, 53(6): 829-832.
[2]張詩詩,王薇,趙海建,等. 臨床檢驗定量測定項目性能規(guī)范制定新進展[J]. 臨床檢驗雜志, 2016, 34(3): 208-210.
[3]Sandberg S, Fraser CG, Horvath AR,etal. Defining analytical performance specifications: Consensus Statement from the 1st Strategic Conference of the European Federation of Clinical Chemistry and Laboratory Medicine[J]. Clin Chem Lab Med, 2015, 53(6): 833-835.
[4]Ceriotti F, Fernandez-Calle P, Klee GG,etal. Criteria for assigning laboratory measurands to models for analytical performance specifications defined in the 1st EFLM Strategic Conference[J]. Clin Chem Lab Med, 2017,55(2):189-194.
[5]Horvath AR, Bossuyt PM, Sandberg S,etal. Setting analytical performance specifications based on outcome studies - is it possible?[J]. Clin Chem Lab Med, 2015, 53(6): 841-848.
[6]Expert Panel on Detection, Evaluation and Treatment of High Blood Cholesterol in Adults. Executive summary of the third report of the National Cholesterol Education Program (NCEP) Expert Panel on detection, evaluation and treatment of high blood cholesterol in Adults (Adult Treatment Panel III)[J]. J Am Med Assoc, 2001, 285(19): 2486-2497.
[7]Langlois MR, Descamps OS, van der Laarse A,etal. Clinical impact of direct HDLc and LDLc method bias in hypertriglyceridemia. A simulation study of the EAS-EFLM Collaborative Project Group[J]. Atherosclerosis, 2014, 233(1): 83-90.
[8]Sheehan P, Biennerhassett J, Vasikaran SD. Decision limit for troponin I and assay performance[J]. Ann Clin Biochem, 2002, 39(3): 231-236.
[9]王治國. 臨床檢驗生物學變異與參考區(qū)間[M]. 北京:人民衛(wèi)生出版社, 2012: 16-44.
[10]Grelpp PR, San Miguel J, Durie BG,etal. International staging system for multiple myeloma[J]. J Clin Oncol, 2005, 23(15): 3412-3420.
[11]National Kidney Foundation. KDOQI Clinical Practice Guideline for hemodialysis adequacy: 2015 update[J]. Am J Kidney Dis, 2015, 66(5): 884-930.
[12]Davison AM. European best practice guidelines for haemodialysis[J]. Nephrol Dial Transplant, 2002,17(Suppl 7): 1-111.
[13]World Health Organization. Worldwide prevalence of anaemia 1993-2005: WHO global database on anaemia[R]. Geneva, Switzerland: World Health Organization, 2008.
[14]Vincent JL, Baron JF, Reinhart K,etal. Anemia and blood transfusions in critically ill patients[J]. J Am Med Assoc, 2002, 288(12): 1499-1507.
[15]Carson JL, Grossman BJ, Kleinman S,etal. Red blood cell transfusion: a clinical practice guideline from the AABB[J]. Ann Intern Med, 2012, 157(1): 49-58.
[16]Kaufman RM, Djulbegovic B, Gernsheimer T,etal. Platelet transfusion: a clinical practice guideline from the AABB[J]. Ann Intern Med, 2015, 162(3): 205-213.
[17]Pearce SH, Brabant G, Duntas LH,etal. 2013 ETA guideline: management of subclinical hypothyroidism[J]. Eur Thyroid J, 2013, 2(4): 215-228.
[18]Biondi B, Bartalena L, Cooper DS,etal. The 2015 European Thyroid Association guidelines on diagnosis and treatment of endogenous subclinical hyperthyroidism[J]. Eur Thyroid J, 2015, 4(3): 149-163.
[19]Jonklaas J, Bianco AC, Bauer AJ,etal. Guidelines for the treatment of hypothyroidism: prepared by the American Thyroid Association Task Force on Thyroid Hormone Replacement[J]. Thyroid, 2014, 24(12): 1670-1751.
[20]Bahn RS, Burch HB, Cooper DS,etal. Hyperthyroidism and other causes of thyrotoxicosis: management guidelines of the American Thyroid Association and American Association of Clinical Endocrinologists[J]. Endocr Pract, 2011, 17(3): 456-520.
[21]Desirable specifications for Total Error, Imprecision, and Bias, derived from intra- and inter-individual biological variation[EB/OL].(2016-08-15)[2016-10-20].http://www.westgard.com/biodatabase1.htm.
[22]Carobene A. Reliability of biological variation data available in an online database: need for improvement[J]. Clin Chem Lab Med, 2015, 53(6): 871-877.
[23]Bartlett WA, Braga F, Carobene A,etal. A checklist for critical appraisal of studies of biological variation[J]. Clin Chem Lab Med, 2015, 53(6): 879-885.
[24]Braga F, Panteghini M. Generation of data on within-subject biological variation in laboratory medicine: an update[J]. Crit Rev Clin Lab Sci, 2016, 53(5): 313-325.
[25]Kristoffersen AH, Petersen PH, Sandberg S. A model for calculating the within-subject biological variation and likelihood ratios for analytes with a time-dependent change in concentrations; exemplified with the use of D-dimer in suspected venous thromboembolism in healthy pregnant women[J]. Ann Clin Biochem, 2012, 49(6): 561-569.
[26]Haeckel R, Wosniok W, Streichert T. Optimizing the use of the "state-of-the-art" performance criteria[J]. Clin Chem Lab Med, 2015, 53(6): 887-891.
(本文編輯:王海燕)
10.13602/j.cnki.jcls.2017.02.02
北京市自然科學基金(7143182);北京醫(yī)院課題(BJ-2015-025)。
張詩詩,1991年生,女,碩士研究生,研究方向為實驗室質量管理。
王治國,研究員,E-mail:zgwang@nccl.org.cn。
R446
A
2016-10-20)