鐘 堃,何法霖,王 薇,張 妍,王治國
(北京醫(yī)院,衛(wèi)生部臨床檢驗中心,北京100730)
今天我們所知的“參考區(qū)間”概念是Graetsbeck和Saris在上世紀六十年代末建立的,并于1969年在斯堪的納維亞學(xué)會大會上提出[1]。20年后,國際臨床化學(xué)聯(lián)合會(IFCC)專家組發(fā)表了第一篇關(guān)于參考值理論的正式IFCC文件[2]。30多年前Galen和Gambino就發(fā)表了標志性書籍《超越正態(tài)性》,為何在現(xiàn)在這個循證醫(yī)學(xué)的時代還討論參考區(qū)間并使用決定界限來描述特征[3]。三個新生事實驅(qū)動了以上論題的討論:國際標準化組織(ISO)發(fā)布的標準15189:2007[4]對臨床實驗室質(zhì)量和能力的要求、體外診斷(IVD)醫(yī)療器械歐洲指令98/97[5]的執(zhí)行以及與指令間接相關(guān)的檢驗醫(yī)學(xué)溯源性聯(lián)合委員會(JCTLM)的建立。
本文中,除強調(diào)了重要方面的理論升級之外,還描述了參考區(qū)間領(lǐng)域新的視角和發(fā)展。
參考值與實驗室檢驗共同發(fā)展,而且它們只在特定的情況下才有意義,通常是在生理或病理情況下。在70年代之前,通常使用的術(shù)語是“正常值”,但它會有多個易混淆的不同含義:墨菲(Murphy)列出了其中的7種(統(tǒng)計學(xué)的——高斯分布——最能代表一個等級、一個等級中最常規(guī)的代表、最適合生存的、沒有危害——在醫(yī)學(xué)中——常規(guī)的、理想的)[6]。因此它可能是主觀并且模糊的,而且暗示所有在范圍以外的個體都是“不正常的”。由于上述原因IFCC文件介紹了術(shù)語“參考值”。這些數(shù)值常與健康相關(guān),除此之外它們也能反映一些特殊的生理狀況如懷孕、或者涉及到某些特殊人群如專業(yè)運動員等。它的基本概念是這個數(shù)值代表了一個特定的人群,因此它們依賴于所選擇的受試對象。首先,需要明確定義參考個體的遴選準則;參考個體代表了參考人群,參考樣本組從參考個體中選擇,在其上測量參考值。所得數(shù)值將會假設(shè)為一個特定分布(也就是參考分布),并且通過適當?shù)慕y(tǒng)計方法進行分析并計算參考界限。按照慣例,這些界限設(shè)定為包括了95%的測量值。用參考界限定義包括它們的參考區(qū)間需注意以下情況:(1)一個特定被測項目的參考區(qū)間依賴于參考對象樣本組中的個體內(nèi)和個體間的生物學(xué)變異;因此,所選擇對象的數(shù)量和他們的亞組組成可能具有相關(guān)的重要性;(2)需要嚴格地控制分析前方面以保證從總體人群中收集樣本操作的可重復(fù)性;(3)分析方面是十分重要的。測量的標準化允許在不同對象組獲得的數(shù)據(jù)具有可比性,并且最終與它們獲得方式不同的,以及不同地點和時間的人群應(yīng)用也具有可比性;(4)計算參考界限的方法可能顯著地改變所獲得的結(jié)果,例如,如果應(yīng)用不適當?shù)慕y(tǒng)計模型或錯誤地執(zhí)行離群值的排除。
通常我們會選擇“健康”的個體,但健康如何準確定義和識別已在多篇評論[7-9]中進行了解釋。世界衛(wèi)生組織(WHO)的定義:“身體上、精神上和社會適應(yīng)上的完好狀態(tài),而不是僅僅是沒有疾病和不虛弱”[10]并不能作為現(xiàn)實的出發(fā)點。1975年的斯堪的納維亞參考值委員會嘗試排除一系列病理情況來定義個體的“健康”[11]。但后來發(fā)現(xiàn)這并不實際[12],尤其是涉及到年長者。當Horn和Pesce[13]查看美國第三次國家健康和營養(yǎng)檢測調(diào)查(NHANESⅢ)時,他們發(fā)現(xiàn)只有不超過10%的70-80歲調(diào)查對象落在“最健康”類別以內(nèi)。
在選擇個體時,有必要考慮所有可能影響檢驗項目結(jié)果的因素:性別、年齡、環(huán)境、生活方式和種族等。參考區(qū)間的寬度受到三種變異性來源的影響:選擇的參考個體的個體內(nèi)和個體間的變異,以及測量系統(tǒng)的分析性變異。個體內(nèi)和個體間變異性的影響要緊密結(jié)合在一起。這兩個來源的變異性的相對大小能實質(zhì)上影響參考區(qū)間作為解釋個體結(jié)果工具的效用。在大多數(shù)情況下參考區(qū)間在評價個體結(jié)果上的效用和發(fā)現(xiàn)異常數(shù)據(jù)上的敏感性是較低的。
使用數(shù)據(jù)挖掘方法發(fā)表的第一篇論文是在上世紀60年代并且假設(shè)大多數(shù)實驗室結(jié)果是“正常的”。考慮到結(jié)果的分布頻數(shù),應(yīng)該使用一些統(tǒng)計學(xué)軟件來排除極端值,排除較小頻率的數(shù)據(jù),也就是典型的“不健康”個體。但它不滿足參考值理論的基本原理,其是參考人群特點的精確定義。雖然信息技術(shù)提供我們強有力的計算方法,也不能認為數(shù)據(jù)挖掘方法是定義參考區(qū)間的最好方法。
參考區(qū)間研究的樣本必須代表臨床實踐中樣本的采集。但在臨床實踐中分析前因素通常很難標準化。所以在進行參考區(qū)間研究時,有必要確切的規(guī)定和描述分析前因素,使得其他研究者能夠重復(fù)同樣的步驟(例如采血設(shè)備和個人的體位)。表1給出了評價血液分析項目時要考慮的最為重要的分析前因素。對于體液來說可能需要包括不同的因素,而對于特定的分析物,則需要更多的信息(例如對于某些激素的情緒化應(yīng)力水平)。
表1 在建立參考值時應(yīng)該考慮的主要分析前因素
IFCC文件對這一主題給出了一系列建議,如文件記錄操作程序。然而,當規(guī)定的參考區(qū)間僅應(yīng)用于特定實驗室時,這些建議有效,因為它能理解某些分析方面的修改是否會改變參考區(qū)間。反之,在提供給其它實驗室“可轉(zhuǎn)換”的參考區(qū)間定義程序時無效。
包括三個主要問題:(1)統(tǒng)計學(xué)提供最為有效的方法從樣本人群所得的結(jié)果推斷整體;(2)不同組間(年齡、性別等)的結(jié)果進行分組;(3)排除離群值。
Wootton等人在1951年首次將參數(shù)統(tǒng)計學(xué)應(yīng)用于參考區(qū)間的計算。但他們不久就意識到這種統(tǒng)計學(xué)模型只能應(yīng)用于少數(shù)的情況,并在兩年后他們建議數(shù)據(jù)進行對數(shù)轉(zhuǎn)換以達到更接近高斯分布。在數(shù)據(jù)分布的形狀沒有進行任何初步驗證的情況下就將參考區(qū)間定義為均值±2倍標準差是不正確的做法,但卻已沿用至今。
1987年IFCC發(fā)表了關(guān)于使用分位數(shù)定義參考區(qū)間的里程碑似的文章。首先,選擇使用中間95%分布作為參考區(qū)間計算。其次,IFCC文件建議參考界限要代表著它們的90%置信區(qū)間。再次,文章建議使用非參數(shù)統(tǒng)計方法來計算參考界限。使用參數(shù)方法可以降低對象的數(shù)量,但是要求數(shù)據(jù)具有高斯分布?;谠紨?shù)據(jù)的Box和Cox轉(zhuǎn)換,Horn等人建議使用“穩(wěn)健的方法”進行替代,即使在數(shù)據(jù)不太理想的情況下依然能夠提供正確結(jié)果。計算界限的90%置信區(qū)間,可以使用所謂的“bootstrap”方法學(xué)。
較直觀的方法是基于計算兩個亞組均值之間差異的統(tǒng)計顯著性來完成的。Sinton等人,建議只要兩個均數(shù)之間的差異大于從混合分布95%計算區(qū)間的1/4時,就應(yīng)該分為兩組。目前最常用的分組方法是Harris和Boyd建議的,后由美國臨床和實驗室標準化研究院(CLSI)文件C28-A2認可。他們建議檢驗要包括兩步:第一,評估均值間的差異,第二,比較它們的標準差。
離群值的正確檢出和排除十分重要。直觀檢查法是簡單而有效的檢出離群值的方法。如果檢出一個離群值卻沒有明顯的原因來排除它(比如對象的情況、分析性問題、計算或記錄錯誤),有必要應(yīng)用統(tǒng)計方法來證明。
目前較為常用的統(tǒng)計方法是由Dixon建議的。它基于D/R的比值,D是離群值與下一個或前面數(shù)值的差值的絕對值,R代表觀察值的總體范圍(最大值-最小值),包括離群值。Horn等人建議了一個更加復(fù)雜的兩步算法,首先使用Box和Cox方法進行數(shù)據(jù)轉(zhuǎn)換,得到高斯分布,然后使用Tukey穩(wěn)健方法識別離群值。
實驗室經(jīng)常使用不同的參考區(qū)間卻沒有實際的原因。這種常見的情況對臨床醫(yī)生和患者的危險性產(chǎn)生了誤導(dǎo)(同樣的分析結(jié)果根據(jù)所用的參考區(qū)間,在一家實驗室認為是“正常的”而另一家實驗室是“異常的”)。另外,它阻礙了常規(guī)數(shù)據(jù)庫的建立,如不同實驗室數(shù)據(jù)的合并。克服這種情況的替換方法是建立和執(zhí)行“共同的”參考區(qū)間[14,15]。
如果分析方法是相同的或經(jīng)過正確的標準化后結(jié)果具有可比性,并且人群具有相同的特征或,可以知道特定項目沒有受到種族或環(huán)境的影響,就可以使用共同的參考區(qū)間。在采用之前需要檢查表2中匯總的一些先決條件是否已達到。
表2 共同的參考區(qū)間建立和使用必須的先決條件
最好的方法是執(zhí)行多中心研究,目前已在西班牙實行,并且在北歐國家得到了進一步的發(fā)展。它要求:(1)根據(jù)年齡、性別、種族、生活方式等分組所要求對象的數(shù)量來確定參加研究的單位和所要召集個體的數(shù)量。(2)分析前階段的清楚定義。理想情況下,在臨床實驗室為了再現(xiàn)樣本處理,應(yīng)對新鮮樣本進行分析。(3)使用可溯源到參考測量系統(tǒng)以及實驗室間高度可比的方法。(4)合理的數(shù)據(jù)分析計算參考界限。在計算參考界限之前,必須檢出和排除可能的離群值。
為了能夠應(yīng)用共同的參考區(qū)間,臨床實驗室必須驗證在區(qū)間產(chǎn)生過程中采用的那些分析前條件、所用分析系統(tǒng)的性能和服務(wù)人群的特征相似。
分析前條件:如果應(yīng)用相同的分析前條件(比如標本類型、禁食等),或者證明任何引入的修改沒有顯著的影響。
分析中的方面:(1)對特定的分析物,所用方法必須產(chǎn)生可溯源至參考測量系統(tǒng)的結(jié)果。(2)所用方法的分析質(zhì)量應(yīng)控制在總誤差的規(guī)定界線內(nèi)。
如果已知種族或者生活方式不會影響到參考區(qū)間,那么就只用驗證分析前和分析中的方面。如果已知種族或生活方式可能會影響到參考區(qū)間,那么建議臨床實驗室采用來自其服務(wù)人群的小樣本組進行參考區(qū)間的確認。
參考測量系統(tǒng)的發(fā)展和制造商對溯源性的依從是一個緩慢的過程。建立穩(wěn)健的參考區(qū)間是費時和費力的過程。由于修正參考區(qū)間是一項很費力的工作,而且要求對臨床醫(yī)生和患者進行督導(dǎo),所以臨床實驗室通常不愿獨立完成。對于一些分析項目,正確地定義共同的參考區(qū)間需要較大范圍的多中心研究。為了在這個領(lǐng)域取得真正的進步,需要在完善的理論和并不完備的實際之間建立起橋梁。
如果滿足了所有之前規(guī)定的組織上、分析前的和分析中的要求,不僅多中心實驗研究所得的參考區(qū)間可以作為共同的參考區(qū)間,甚至可由單個實驗室規(guī)定。IFCC參考區(qū)間和決定限委員會(C-RIDL)最近發(fā)表的一篇文章中顯示,當采用單個實驗室建立的已確認的參考區(qū)間時,當?shù)厝巳簠^(qū)間的初步驗證會有重要的意義。
表3中給出了這兩個概念的相關(guān)信息。參考區(qū)間描述明確定義了(通常是明顯健康的)人群的生物特征,決定限依賴于診斷性和特殊臨床研究,為的是規(guī)定存在某種疾病或?qū)Σ煌Y(jié)果的概率。選擇的決定限通常是基于兩個人群(疾?。羌膊。┲丿B的水平以及期望的臨床靈敏度和特異度的程度。
表3 參考區(qū)間和決定界限間的差別
Harris在30多年前就對個體的參考區(qū)間給出了理論基礎(chǔ)和統(tǒng)計學(xué)方法,但是在未來的執(zhí)行仍具有挑戰(zhàn)性。信息技術(shù)的發(fā)展允許我們存儲大量資料并對進行快速的檢索和處理。而且溯源性和檢測標準化的改進也將會增加不同地點和時間結(jié)果的穩(wěn)定性和可比性。實驗?zāi)P头浅:唵?,要求在穩(wěn)定的健康狀態(tài)時期從同一個體采集多份樣本。對于給定分析物,這些樣本的測量結(jié)果將會產(chǎn)生一個時間系列,組成一個基線來判斷未來的結(jié)果。
修改已存在的參考區(qū)間通常是一項復(fù)雜的任務(wù),應(yīng)告知臨床醫(yī)生和他們的患者。共同參考區(qū)間的確定將顯著地降低同一項目不同參考區(qū)間的數(shù)量,提供更恰當和更有效的信息。實驗室人員需要在這些領(lǐng)域克服實際困難,盡快將理論改進應(yīng)用于臨床實踐,以使醫(yī)療機構(gòu)和患者獲得預(yù)期的效益。
[1]Graetsbeck R,Saris NE.Establishment and use of normal values[J].Scand J Clin Lab Invest,1969,26(Suppl 110):62.
[2]Solberg HEInternational Federation of Clinical Chemistry (IFCC).Scientific Committee,Clinical Section.Expert Panel on Theory of Reference Values International Committee for Standardization in Haematology (ICSH),Standing Committee on Reference Values.Approved recommendation(1986)on the theory of reference values.Part 1.The concept of reference values[J].J Clin Chem Clin Biochem,1987,25:3370.
[3]Galen RS,Gambino SR.Beyond Normality:The Predictive Value and Efficiency of Medical Diagnoses[M].New York,USA:John Wiley and Sons,1975.
[4]International Organization for Standardization.Medical Laboratories-Particular Requirements for Quality and Competence ISO 15189[J].Geneva:ISO,2007.
[5]Directive 98/79/EC of the European Parliament and of the Coun-cil of 27October 1998on in vitro diagnostic medical devices[S].Offic J Eur Commun 7December 1998,L331/1-L331/37.
[6]Murphy EA.The normal,and the perils of the sylleptic argument[J].Perspect Biol Med,1972,15:566.
[7]Gr?sbeck R.The evolution of the reference value concept[J].Clin Chem Lab Med,2004,42:692.
[8]Petitclerc C.Normality:the unreachable star[J].Clin Chem Lab Med,2004,42:698.
[9]Ritchie RF,Palomaki G.Selecting clinically relevant populations for reference intervals[J].Clin Chem Lab Med,2004,42:702.
[10]World Health Organization.Constitution in Basic Documents[S].Geneva:WHO,1948.
[11]Alstrucm T,Gretsbeck R,Hjelm M,et al.Committee on Reference Values,Scandinavian Society for Clinical Chemistry and Clinical Physiology.Recommendations concerning the collection of reference values in clinical chemistry and activity report[J].Scand J Clin Lab Invest,1975,35(Suppl.144):1.
[12]Berg B,Nilsson JE,Solberg HE,et al.Practical experience in the selection and preparation of reference individuals:empirical testing of the provisional Scandinavian recommendations[M].In:Gretsbeck R,Alstrucm T’eds.Reference Values in Laboratory Medicine.John Wiley & Sons,1981:55-64.
[13]Horn PS,Pesce AJ.Reference intervals:an update[J].Clin Chim Acta,2003,334:5.
[14]鐘 堃,王治國,王 薇,等.利用多中心使用相同檢測系統(tǒng)建立人體參考區(qū)間的要求[J].中華檢驗醫(yī)學(xué)雜志,2010,33(8):790.
[15]王治國.臨床檢驗質(zhì)量控制技術(shù)(第2版)[M].北京:人民衛(wèi)生出版社,2008.