劉慶香, 張?zhí)鞁桑堢麒?,周偉燕,張傳?/p>
(1.北京醫(yī)院 國家老年醫(yī)學中心 中國醫(yī)學科學院老年醫(yī)學研究院 國家衛(wèi)生健康委臨床檢驗中心 北京市臨床檢驗工程技術研究中心 中國醫(yī)學科學院北京協和醫(yī)學院,北京 100730;2.北京醫(yī)院 國家老年醫(yī)學中心 中國醫(yī)學科學院老年醫(yī)學研究院 國家衛(wèi)生健康委臨床檢驗中心 北京市臨床檢驗工程技術研究中心,北京 100730)
互通性是參考物質的一個重要屬性,也是參考物質在不同測量程序間保持結果一致的關鍵性能參數。參考物質具有互通性是保證患者結果可溯源的關鍵環(huán)節(jié),也是參考物質用于量值溯源與傳遞的技術基礎[1]。當前,由于絕大多數臨床項目分析物對被測量的代表性不足、參考物質基質不同等原因,導致參考物質和臨床樣本在不同測量系統(tǒng)之間不具有互通性。因此,無論是參考物質生產者,還是臨床實驗室工作人員均應重視互通性。2010年和2014年,美國臨床和實驗室標準化協會(the Clinical and Laboratory Standards Institute,CLSI)發(fā)布的EP30-A[2]和EPl4-A3[3]文件、2018年國際臨床化學和檢驗醫(yī)學聯合會(the International Federation of Clinical Chemistry and Laboratory Medicine,IFCC)介紹的互通性評價更新方案[1,4-5]提供了詳細的參考物質互通性評價方案,有助于參考物質生產者、臨床實驗室制備及使用互通的參考物質,促進臨床實驗室檢驗結果的準確、可比。
互通性的概念起源于1973年,首次被應用于酶活性測量,以強調用于內部和外部質量控制程序的材料必須具有與臨床樣本相似的特性[6],目前已被廣泛應用于所有的定量測量?;ネㄐ灾赣貌煌瑴y量程序測量參考物質時,各測量程序所得的測量結果之間的數字關系,與用這些測量程序測量實際臨床樣本時測量結果的數字關系的一致程度[7]?;ネㄐ栽u價可建立和驗證常規(guī)測量結果到參考系統(tǒng)的溯源性及各方法檢測結果的協調性[8]。對參考物質進行互通性評價可判斷其是否適合被用作校準品、正確度質控品或室間質量評價(external quality assessment,EQA)材料。具備互通性的參考物質可直接用于生產者校準品的定值,以確保計量溯源鏈的連續(xù)性及實驗室結果的正確性[2]。使用互通的參考物質進行校準時,可確保在臨床實驗室中無論使用哪種測量程序測量臨床樣本,結果都是等效的;使用不互通的參考物質進行校準會在校準過程中產生偏差,導致在測定臨床樣本時可能會產生不正確的結果[9]。因此,對參考物質進行互通性評價是十分必要的。
EP30-A文件、EP14-A3文件及IFCC互通性評價方案詳細敘述了參考物質互通性的評價方案,本文對這3個方案進行歸納?;ネㄐ缘脑u價方案應包括準備材料、制備參考物質和臨床樣本、選擇測量程序、確定各樣本需要重復檢測的次數、分析數據及評價結果。
2.1.1 材料 評價互通性所需的材料包括試劑、校準品和儀器系統(tǒng)等,應對所使用的材料情況進行說明。EP14-A3文件指出,同一測量程序應使用同一批試劑[3]。
2.1.2 樣品 樣品包括待評價的參考物質及臨床樣本,應詳細說明樣品收集、處理和儲存條件。(1)參考物質。進行互通性評價的參考物質一般為校準品、正確度質控品或EQA材料。EP30-A文件要求當參考物質需要被稀釋來制備測量程序范圍內的樣品時,每個稀釋的樣品必須被視為1個單獨的樣品,并進行互通性評價。稀釋劑可能會影響所測樣品的性質,因此有必要驗證稀釋液是否適合在制備過程中使用[2]。(2)臨床樣本。臨床樣本應按照設定的標準來收集。單人份臨床樣本應來自健康人和患者,其濃度或活性應大致均勻地分布,并包括參考物質的濃度或活性,其體積應足夠用于所有測量程序進行分析。收集樣品時應避免那些因存在已知干擾或交叉反應物質而被認為不適合分析的樣品。EP14-A3文件指出單人份臨床樣本數應>20個[3];IFCC認為單人份臨床樣本數應>30個,可根據測量程序的性能特征而有所不同[4]。只有不能收集足夠體積的單人份臨床樣本時,才允許收集混合臨床樣本?;旌吓R床樣本會稀釋單個樣本中存在的物質的影響,可能減少少數單個樣本特異性效應的影響,相比于單人份臨床樣品,混合臨床樣本的基質可能會有所改變。因此,在用于互通性評價之前,應根據CLSI-C37文件[10]要求,驗證混合臨床樣本與單個臨床樣本的互通性。臨床樣本應避免進行添加,當在實際情況下無法收集到高濃度或活性的樣本而需要進行添加時,應對添加得到的樣本進行標記說明[3]。
IFCC互通性評價方案[1]指出,用于互通性評價的測量程序應具備如下特性:(1)足夠的精密度,精密度不足會導致更大的不確定度,影響互通性的評價;(2)對被測量具有足夠的選擇性,采用選擇性不足的測量程序可能會產生錯誤的互通性評價結果;若測量程序包含參考測量程序,則參考測量程序為比對方法,常規(guī)測量程序為待評價方法;若不含參考測量程序,則將常規(guī)測量程序進行兩兩比較。
使用測量程序對參考物質和臨床樣本進行分析時,參考物質和臨床樣本應隨機穿插排列。EP14-A3文件[3]要求樣品至少要重復測量3次,不同測量程序樣品重復測量次數可不同。IFCC互通性評價方案[4]要求樣品重復測量次數至少為2次,推薦重復測量3次,在同一批測量中應在不同位置對參考物質進行測量,建議測量位置的數量至少為5個。
數據分析方法應該根據參考物質、臨床樣本和測量程序的數目以及是否包含參考測量程序來進行選擇[2]。EP30-A文件、EP14-A3文件及IFCC互通性評價方案中的數據分析方法不同。
2.4.1 EP30-A文件 (1)選擇回歸方法來評價互通性?;貧w分析方法是假定1組變量(X,Y)間具有線性關系,并估計線性模型參數和標準差。常用的回歸方法有:普通最小二乘法(ordinary least square,OLS)、戴明回歸法和Passing-Bablock(PB)回歸法?;貧w方法的選擇和正確使用在很大程度上取決于數據的特性,即X和Y的標準差以及參考物質和臨床樣本的重復檢測次數。OLS和戴明回歸法均采用最小二乘法擬合,但對數據的假設不同。OLS假設變量Y服從標準差恒定的正態(tài)分布,自變量X無隨機誤差,主要適用于比對方法為參考測量程序的情況。戴明回歸法假定2個測量程序所得的結果都含有隨機誤差,根據觀察點到回歸線的垂直距離的平方和最小來估計回歸模型斜率和截距。戴明回歸法不需要X和Y數據標準差相等,當標準差不相等時,根據觀察點到回歸線的非垂直(合適的角度)距離的平方和最小來估計回歸模型斜率和截距,但前提是標準差在數據范圍內是恒定的。當X和Y的標準差在測量范圍內都近似恒定時,可以對測量結果的均值使用常規(guī)的戴明回歸法;若標準差與濃度成比例時,推薦使用加權戴明回歸法或者非加權戴明回歸法對結果進行對數轉換。戴明回歸法適用于2種常規(guī)測量程序間的互通性評價。OLS和戴明回歸法最大的區(qū)別在于參數的估計,OLS在估計參數時只考慮了因變量來源的隨機誤差,而未考慮自變量來源的隨機誤差;戴明回歸法在估計參數時同時考慮了自變量、因變量來源的隨機誤差。因此,相對于OLS,從回歸的科學性、合理性上來說,戴明回歸法在估計參數時更為嚴謹,估計的參數與實際情況的一致性更好,得到的回歸線對測量點的代表性更強,從統(tǒng)計學角度考慮,戴明回歸法在互通性研究中的適用范圍更廣[10]。PB回歸是一種非參數程序,對誤差分布類型沒有規(guī)定,可用于標準差恒定或標準差與濃度成比例的誤差,唯一的限制是假設標準差的比例等于斜率的平方。PB回歸法使用任意2個數據點之間的斜率來估計回歸線的斜率;截距的估計是使50%的數據點落在直線的上方,50%落在下方。PB回歸法的優(yōu)點在于穩(wěn)健性好,離群值對結果的影響小;缺點是其會造成的較寬的置信區(qū)間。
不同的回歸方法可能會導致不同的數學關系和互通性評價結果,因此在互通性報告中應提供所使用回歸方法的適當信息,如描述所檢測的濃度范圍的標準差??紤]到上述3種回歸方法的優(yōu)點和局限性,在互通性評價中,當數據可以通過線性關系擬合時,Deming回歸分析似乎是建立等價數學關系最合適的方法。
(2)使用95%預測區(qū)間進行回歸分析。以2個測量程序(A、B)測得結果的均值(或log10均值)為相應X、Y軸進行回歸分析,計算臨床樣本對于相應的X值,其Y值的預測值和雙側95%預測區(qū)間,并繪制回歸圖,見圖1。若參考物質的檢測結果在預測區(qū)間內,則認為參考物質具有互通性;若在預測區(qū)間外,則認為參考物質不具有互通性。
圖1 使用回歸方法和95%預測區(qū)間來評估A、B測量程序之間的互通性
(3)使用回歸標準差sy-x的倍數進行回歸分析。用臨床樣本數據點與回歸分析的最佳擬合線之間的殘差制定殘差評估標準。用2個測量程序的臨床樣本結果計算回歸線和回歸標準差sy-x。因為PB回歸是非參數估計,所以使用PB回歸法算出的sy-x會比OLS和戴明回歸法大。這部分所考慮的測量標準差在測量范圍內是恒定的,臨床樣本數在參考物質濃度范圍內是適當的。參考物質也由2個測量程序檢測,預測值通過臨床樣本的回歸標準差計算,相對殘差的計算公式為:相對殘差=(測量值-預測值)/sy-x,評價標準為±2sy-x,±2sy-x表示參考物質與臨床樣本具有相同數值關系的大約95%的置信范圍。若相對殘差在±2sy-x范圍內,則認為參考物質具有互通性;若超出了±2sy-x范圍,則認為參考物質不具有互通性。
(4)多元統(tǒng)計方法。用于進行互通性評價的多元統(tǒng)計技術為主成分分析和相應分析。主成分分析和相應分析是描述性的方法,不進行數據模型的假設。這2種方法能夠將臨床樣本中可能的屬性差別展示出來,也可以將參考物質處理為“非活動元素”,使之不會被“活動元素”臨床樣本的模式影響。這2種方法主要適用于沒有參考測量程序的多種方法比較。相應分析是將原始數據轉換成二維的表格(樣品欄和方法欄),不同單位的方法間進行對比不需要重新計算或轉換。因子平面是由2個因子軸來確定的,每1個數據點可以通過將其投射到因子平面上使之可視化。評價參考物質的互通性時,使用臨床樣本建立主軸,參考物質作為非活動元素,置信區(qū)間可以通過臨床樣本參考集來確定,投射在臨床樣本確定的點群中心的參考物質代表了高度的互通性,遠離中心的參考物質被認為缺乏互通性。
2.4.2 EP14-A3文件 首先使用OLS檢查數據是否適用于線性回歸分析,并檢查是否存在異常值;然后通過差異圖檢查2個測量程序(A、B)獲得的臨床樣本結果的均值分布,差異圖的X軸為2個測量程序所得結果的均值,Y軸為2個測量程序所得結果的差值,見圖2。若偏差/移是恒定的,則可進行戴明回歸分析;若偏差/移隨著被測量濃度的增加而增加,則需將數據進行對數轉換,若轉換后的偏差/移恒定,則將轉換后的數據進行戴明回歸分析,經對數轉換的戴明回歸分析結果見圖3。以2個測量程序測得結果的均值(或對數均值)為相應的X、Y軸,計算臨床樣本對于相應的X值,其Y值的預測值和雙側95%的預測區(qū)間,并繪制回歸圖,見圖1。若參考物質的檢測結果在預測區(qū)間內,則認為參考物質是互通的,若在預測區(qū)間外,則認為參考物質不互通。
圖2 A、B測量程序差分圖
圖3 檢測結果進行對數轉換的戴明回歸圖
2.4.3 IFCC互通性評價方案 IFCC互通性評價方案采用偏差差值法評價參考物質的互通性。以2個測量程序(A、B)檢測結果均值為X軸,檢測結果(或經對數轉換)的相對偏差為Y軸繪制偏差圖,見圖4。計算dRM及U(dRM),dRM為參考物質在2個測量程序間檢測結果的偏差與臨床樣本在2個測量程序間檢測結果偏差均值的差值,u(dRM)是dRM的合成不確定度,U(dRM)為dRM的擴展不確定度,U(dRM)=k×u(dRM),k為擴展因子。設定1個可接受的最大值為互通性評價標準(以C表示),若dRM±U(dRM)在±C范圍內,則參考物質具有互通性,如圖4中的RM1、RM4、RM5;若dRM±U(dRM)超出±C范圍,則參考物質不具有互通性,如圖4中的RM3;若dRM±U(dRM)與±C范圍存在重疊,則參考物質的互通性難以確定,如圖4中的RM2。C可以根據參考物質作為校準、正確度控制或外部質量評估的預期用途來選擇,并且該標準可以與基于臨床實驗室測試結果的醫(yī)療決策要求相關。一般來說,參考物質用作溯源鏈中的校準品時應該使用嚴格的標準來評價互通性,當其作為質控品時,可采用較廣泛的標準[9]。在選擇可互通性標準時,可參考2014年在米蘭召開的歐洲臨床化學和檢驗醫(yī)學聯盟會議定義的模型[12]。
圖4 檢測結果進行對數轉換的偏差/移圖
總結參考物質在測量程序間的互通性情況,可采用表格的形式將互通性評價的結果更加簡潔、明確地展示出來。
EP30-A文件詳細描述了OLS、戴明回歸法和PB回歸法,還介紹了能夠同時測試參考物質在多個測量過程中互通性的分析技術。EP14-A3文件主要對戴明回歸法進行了描述,可幫助臨床實驗室、監(jiān)管者和參考物質生產者了解被評價物質的互通性,以及樣品的基質效應,還可幫助區(qū)分測量過程故障和使用人工或人工處理的樣品造成的影響,但無法獲得不互通的確切機制或原因。EP30-A文件及EP14-A3文件也存在一些問題。(1)95%預測區(qū)間是一個基于統(tǒng)計學公式計算的變化的標準,與參考物質的醫(yī)學預期用途無關。測量程序的隨機誤差越小,95%預測區(qū)間越窄,標準物質獲得互通性結果的可能性也越??;反之,測量程序的隨機誤差越大,95%預測區(qū)間越寬,標準物質得到互通性結果的可能性也越大。(2)95%預測區(qū)間的方法主要基于參考物質與臨床樣本的測定結果從屬于同一分布的假設,該假設不一定符合所有情況。(3)通過回歸方程計算得到的基質相關偏移評價是參考物質與臨床樣本組的差異,因此95%預測區(qū)間的方法不能量化在所關注的濃度,如醫(yī)學決定水平、參考物質與臨床樣本之間的差異。
IFCC互通性評價方案采用偏差差值法,強調互通性評價標準應是一個固定且與醫(yī)學預期用途相關的標準,該評價標準可克服回歸分析法的不足,對參考物質的預期用途進行更相關的評估。鑒于每個檢驗項目的測量原理、方法、技術水平等的不同,每個項目的醫(yī)學預期用途和允許偏移/差都有相應的標準,因此評價標準表達形式也不盡相同[13]。在IFCC互通性評價方案中,互通性評價標準起著至關重要的作用。DELATOUR等[14]認為,寬松的標準不能區(qū)分材料之間微小的互通性差異,不能準確地評價參考物質的互通性,嚴格的標準可能與臨床實驗室的實際測定水平不適配,并可能遺漏符合預期用途的參考物質[13]。因此,制定一個適用于參考物質預期用途并考慮測量程序性能特征的標準非常必要,而制定科學、合理的評價標準是偏差差值評估法實施過程中的一個難點。在制定互通性評價標準時,可參考2014年在米蘭召開的歐洲臨床化學和檢驗醫(yī)學聯盟會議定義的模型[12],如臨床需求、生物學變異和當代技術水平。生物學變異最常被用于制定質量要求,但Westgard網站上大多數檢測項目的生物學變異數據引自1篇或少數幾篇文獻,且部分文獻年代較為久遠,其科學性和嚴謹性不足[15]。因此,需依據歐洲臨床化學和檢驗醫(yī)學聯盟發(fā)布的核查表對生物學變異相關文獻進行質量評估,篩選可靠的生物學變異數據,結合參考物質預期用途及測量程序性能特征的標準,制定出一個合適的評價標準。
目前,國內外尚沒有文件明確規(guī)定在進行互通性評價時應選擇的方案。在IFCC互通性評價更新方案發(fā)表前,臨床上一般采用EP30-A文件或EP14-A3文件方案來評價互通性,在IFCC互通性評價更新方案發(fā)表后,臨床上大多采用EP30-A文件或EP14-A3文件與IFCC互通性評價方案分別對同一參考物質進行互通性評價,雖然不同方案評價互通性的結果可能會存在一定的差異,但這能更好地說明參考物質互通性的情況。
互通性是參考物質的重要屬性,互通性評價可建立常規(guī)測量結果到參考系統(tǒng)的溯源性,也可驗證各常規(guī)方法檢測結果的一致性,因此對參考物質進行互通性評價是必要的。在進行互通性評價時,采用不同方案評價同一參考物質互通性的結果可能不同,因此臨床應根據參考物質的預期用途和測量程序的性能特征來選擇合適的互通性評價方案。本文對EP30-A文件、EP14-A3文件及IFCC互通性評價方案進行了歸納、比較和總結,希望能為參考物質的互通性評價提供一定的幫助。