李 昕,賈正仙
(昆明醫(yī)科大學(xué)第一附屬醫(yī)院 醫(yī)學(xué)檢驗(yàn)科,云南 昆明 650032)
生物參考區(qū)間是解釋、分析檢驗(yàn)結(jié)果的依據(jù),可直接采用國(guó)家權(quán)威機(jī)構(gòu)或權(quán)威刊物發(fā)表的適合實(shí)驗(yàn)室的生物參考區(qū)間,也可自行建立或直接引用試劑供應(yīng)商提供的生物參考區(qū)間,但需對(duì)引用的生物參考區(qū)間進(jìn)行驗(yàn)證確認(rèn)[1,2]。隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,有眾多學(xué)者提出利用實(shí)驗(yàn)室儲(chǔ)存的大量數(shù)據(jù),建立以數(shù)學(xué)統(tǒng)計(jì)模式為基礎(chǔ)的生物參考區(qū)間(間接法)[3],并被美國(guó)臨床實(shí)驗(yàn)室標(biāo)準(zhǔn)化委員會(huì)(CLSI)和國(guó)際臨床化學(xué)聯(lián)合會(huì)(IFCC)共同頒布的導(dǎo)則EP28-A3c所認(rèn)可。2018年4月27日中華人民共和國(guó)國(guó)家衛(wèi)生健康委員會(huì)發(fā)布了國(guó)家行業(yè)標(biāo)準(zhǔn)WS/T 404.4-2018《臨床常用生化檢驗(yàn)項(xiàng)目參考區(qū)間第4部分:血清總膽紅素、直接膽紅素》。該行業(yè)標(biāo)準(zhǔn)的參考樣本選擇了東北(沈陽(yáng))、華北(北京)、西北(西安)、華東(上海)、華南(廣州)和西南(成都)6地區(qū)城鄉(xiāng)居民。這些地區(qū)相比昆明地區(qū)均處于低海拔地區(qū),同時(shí)昆明地區(qū)民族人口眾多,所以需要驗(yàn)證行業(yè)標(biāo)準(zhǔn)是否適用于昆明地區(qū)人群。
本文利用本院實(shí)驗(yàn)室信息管理系統(tǒng)(laboratory information system,LIS)數(shù)據(jù)庫(kù)中存儲(chǔ)的血清總膽紅素(TBIL) 與直接膽紅素(DBIL) 的檢測(cè)數(shù)據(jù),獲取本地區(qū)生物生物參考區(qū)間,并與行業(yè)標(biāo)準(zhǔn)進(jìn)行比較,從而獲得一種快速建立本地區(qū)的生物參考區(qū)間的方法,現(xiàn)報(bào)告如下。
材料與方法 一、數(shù)據(jù)來(lái)源 昆明醫(yī)科大學(xué)第一附屬醫(yī)院實(shí)驗(yàn)室信息管理系統(tǒng)(LIS) 中儲(chǔ)存的2017年12月-2018年11月份所有體檢人群的TBIL和DBIL的實(shí)驗(yàn)室檢測(cè)數(shù)據(jù),共獲得健康男性20~79歲27 023份數(shù)據(jù),健康女性20~27歲22 804份數(shù)據(jù)。
二、儀器和試劑 本實(shí)驗(yàn)室所有體檢人群數(shù)據(jù)均是用配套儀器(Cobas8000) 及配套試劑檢測(cè)而得,同時(shí)在每天開(kāi)關(guān)機(jī)分別使用配套的常規(guī)生化多項(xiàng)目質(zhì)控品(中值C.A.F.S批號(hào):186380;高值C.A.F.S批號(hào):186394)進(jìn)行室內(nèi)質(zhì)量控制。如果質(zhì)控失控均及時(shí)糾正后才可做常規(guī)標(biāo)本。
三、方法 1.通過(guò)使用計(jì)算機(jī)結(jié)構(gòu)化查詢(xún)語(yǔ)言(Structured Query Language,SQL) 將所有做了TBIL和DBIL的數(shù)據(jù),同時(shí)將做了以下檢驗(yàn)項(xiàng)目紅細(xì)胞、血紅蛋白、丙氨酸氨基轉(zhuǎn)移酶、天門(mén)冬氨酸氨基轉(zhuǎn)移酶、總蛋白、白蛋白、γ-谷氨酰轉(zhuǎn)移酶、總膽汁酸、總膽固醇、甘油三脂、尿素、肌酐等超出參考范圍的異常樣本數(shù)據(jù)踢除。已盡可能排除存在血液系統(tǒng)疾病,肝膽疾病以及腎臟疾病對(duì)膽紅素的影響。
2.將剔除后最終數(shù)據(jù)共獲得健康男性20~79歲14 722份數(shù)據(jù),健康女性20~79歲12 687份數(shù)據(jù)導(dǎo)出至EXCEL表中,運(yùn)用Dixon法判斷離群值,并剔除。
3.觀(guān)察頻數(shù)分布圖,運(yùn)用Kolmogorov-Smirnov檢驗(yàn)分別驗(yàn)證男、女TBIL和DBIL資料分布情況及同性別不同年齡的資料分布情況。
4.生物參考區(qū)間建立和驗(yàn)證:依據(jù)中華人民共和國(guó)衛(wèi)生行業(yè)標(biāo)準(zhǔn)WS/T404-2018《臨床常用生化檢驗(yàn)項(xiàng)目參考區(qū)間第4部分:血清總膽紅素、直接膽紅素》計(jì)算P2.5~P97.5為其95%參考區(qū)間,對(duì)TBLL、DBLL進(jìn)行驗(yàn)證,對(duì)不能接受的給予重建。
四、統(tǒng)計(jì)學(xué)分析 1.使用Office Excel 2016辦公軟件錄入各組數(shù)據(jù)。首先將檢測(cè)數(shù)據(jù)按照大小排序并計(jì)算極差R,然后分別計(jì)算最大和最小值與其相鄰數(shù)值之差D;若D/R≥1/3,則將最大值或最小值視為離群值予以剔除;將余下數(shù)據(jù)重復(fù)前述步驟進(jìn)行離群值檢驗(yàn),直至剔除所有離群值。
2.使用SPSS 22.0統(tǒng)計(jì)軟件觀(guān)察頻數(shù)分布圖及Kolmogorov-Smirnov檢驗(yàn)判斷資料分布情況,最后分別按照性別年齡進(jìn)行分組,分別用非參數(shù)方法計(jì)算參考樣本組以P2.5為參考下限,P97.5為參考上限,建立男20~59歲、男60~79歲、女20~59歲、女60~79歲4組參考區(qū)間。
3.不同組間采用獨(dú)立樣本T檢驗(yàn)來(lái)比較實(shí)驗(yàn)室數(shù)據(jù)得到的參考區(qū)間上限分別比較后,再與行業(yè)標(biāo)準(zhǔn)中的參考區(qū)間上限進(jìn)行比較,看是否存在差異。
結(jié) 果 一、離群值的剔除:男、女的TBIL,DBIL4組數(shù)據(jù)均存在2個(gè)離群值。剔除后TBIL健康男性20~59歲12 589份數(shù)據(jù)、60~79歲2 131份數(shù)據(jù);健康女性20~59歲10 894份數(shù)據(jù)、60~79歲1 791份數(shù)據(jù);DBIL健康男性20~59歲10 981份數(shù)據(jù)、60~79歲1 324份數(shù)據(jù);健康女性20~59歲9 090份數(shù)據(jù)、60~79歲1 056份數(shù)據(jù)。
二、數(shù)據(jù)分布:從LIS數(shù)據(jù)庫(kù)中提取的各組TBIL,DBIL數(shù)據(jù)均成偏態(tài)分布,不同性別按年齡分組比較,分別計(jì)算以P2.5~P97.5建立參考區(qū)間,見(jiàn)表1,表2。通過(guò)統(tǒng)計(jì)學(xué)分析,總膽紅素及直接膽紅素在同一性別的不同年齡分組間無(wú)統(tǒng)計(jì)學(xué)差異(P<0.05)。無(wú)論男性,還是女性的TBIL,DBIL參考區(qū)間均不受年齡影響。
三、不同性別分別進(jìn)行使用獨(dú)立樣本T檢驗(yàn)進(jìn)行比較,比較結(jié)果見(jiàn)表3。不同性別血清TBIL和DBIL的參考區(qū)間相比,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05),且男性>女性。
四、本地區(qū)建立的TBIL與DBIL的參考區(qū)間上限均高于行業(yè)標(biāo)準(zhǔn)WS/T 404.4-2018。TBIL、DBIL下限對(duì)于臨床無(wú)意義,即將下限均設(shè)為0,上限四舍五入取整數(shù),見(jiàn)表4。昆明地區(qū)的總膽紅素與直接膽紅素參考區(qū)間均高于現(xiàn)行的國(guó)家標(biāo)準(zhǔn)。
討 論 血清中的膽紅素來(lái)源有3個(gè)方面,絕大部分來(lái)自人體紅細(xì)胞衰老后的血紅蛋白分解代謝,小部分來(lái)自造血過(guò)程中紅細(xì)胞的過(guò)早破壞,還有很少一部分來(lái)自非血紅蛋白血紅素的分解,所以膽紅素含量受血紅蛋白(Hemoglobinopathy,Hb)影響較大。昆明地處高原,造成缺氧,Hb相對(duì)升高,進(jìn)而膽紅素的來(lái)源也相對(duì)升高,導(dǎo)致本地區(qū)總膽紅素,直接膽紅素可能偏高,所以需要驗(yàn)證行業(yè)標(biāo)準(zhǔn)的參考區(qū)間是否適用。
表1 男、女性不同年齡段總膽紅素的參考區(qū)間(μmol/L)
表2 男、女性不同年齡段總膽紅素的參考區(qū)間(μmol/L)
表3 不同性別總膽紅素和直接膽紅素參考區(qū)間比較 (P2.5-P97.5,μmol/L)
表4 不同性別總膽紅素和直接膽紅素參考值范圍(μmol/L)
對(duì)于定量檢測(cè)項(xiàng)目,參考區(qū)間界限值的改變會(huì)影響臨床醫(yī)生的判斷,可能忽視疾病的嚴(yán)重性而導(dǎo)致治療的延遲,為患者帶來(lái)不良結(jié)果,增大醫(yī)療成本[4]。血清TBIL,DBIL的檢驗(yàn)結(jié)果在肝膽疾病的診斷中起著重要作用。本次研究顯示,TBIL、DBIL參考區(qū)間在同性別中是沒(méi)有明顯的年齡差異。男性TBIL、DBIL參考區(qū)間明顯高于女性,這與男性血液中紅細(xì)胞數(shù)、血紅蛋白含量高于女性的生理特點(diǎn)是一致的。同時(shí)TBIL、DBIL參考區(qū)間略高于行業(yè)標(biāo)準(zhǔn),所以昆明地區(qū)不適用于國(guó)家的行業(yè)標(biāo)準(zhǔn)WS/T404《臨床常用生化檢驗(yàn)項(xiàng)目參考區(qū)間第4部分:血清總膽紅素、直接膽紅素》的參考區(qū)間。需要自行建立昆明地區(qū)的參考區(qū)間。
目前國(guó)際上推薦通過(guò)建立排除標(biāo)準(zhǔn),選取合適參考樣本以獲得參考值的方法(直接法)是生物參考區(qū)間建立的首選方法。但是直接法操作過(guò)程復(fù)雜,耗時(shí)長(zhǎng),且費(fèi)用昂貴,因此大部分實(shí)驗(yàn)室仍以引用并驗(yàn)證廠(chǎng)商或行業(yè)標(biāo)準(zhǔn)推薦的參考區(qū)間的方法為主[5]。
隨著信息化時(shí)代的到來(lái),大數(shù)據(jù)(big data)已經(jīng)在各行各業(yè)中越來(lái)越多的應(yīng)用起來(lái)。醫(yī)學(xué)檢驗(yàn)科是其在醫(yī)療單位中具有大數(shù)據(jù)特征的科室之一。隨著實(shí)驗(yàn)室信息管理系統(tǒng)(LIS) 普及,醫(yī)學(xué)檢驗(yàn)科的檢測(cè)數(shù)據(jù)每天增加百兆字節(jié)或幾十千兆字節(jié)。近年來(lái),全球檢驗(yàn)醫(yī)學(xué)專(zhuān)家更加關(guān)注醫(yī)學(xué)檢驗(yàn)大數(shù)據(jù)(big data in laboratory medicine,BDLM)[6]。已經(jīng)有多篇利用間接法建立參考區(qū)間的文獻(xiàn)說(shuō)明間接是可行的[7-9]。間接法建立生物參考區(qū)間作為一種后驗(yàn)的方法,最大缺點(diǎn)是可能納入疾病狀態(tài)的異常數(shù)據(jù)[10,11。本次的研究篩選的數(shù)據(jù)僅限于LIS系統(tǒng)中,沒(méi)有將其他系統(tǒng)(體檢系統(tǒng)、PACS系統(tǒng)、HIS系統(tǒng))中的相關(guān)指標(biāo)納入篩選條件,所以依舊可能存在異常數(shù)據(jù)。通過(guò)大數(shù)據(jù)的萃取,數(shù)據(jù)正態(tài)性分布的有效轉(zhuǎn)換,合適的離群值剔除規(guī)則和數(shù)學(xué)統(tǒng)計(jì)模式,能夠鑒別出絕大部分的異常數(shù)據(jù)并直接擯棄,由此途徑得到的參考區(qū)間與直接法相比具有較高的可信度[9]。通過(guò)結(jié)構(gòu)化查詢(xún)語(yǔ)言 (SQL) 將醫(yī)學(xué)檢驗(yàn)大數(shù)據(jù)(BDLM) 中所需要的數(shù)據(jù)按一定條件檢索,快速準(zhǔn)確的提取出來(lái),節(jié)省成本,提高了工作效率。
利用BDLM最首要的問(wèn)題是先按一定的條件檢索并導(dǎo)出相關(guān)數(shù)據(jù),然后才能進(jìn)一步利用。醫(yī)學(xué)檢驗(yàn)科應(yīng)該有強(qiáng)大的LIS,能夠按一定條件和要求檢索并導(dǎo)出電子表格類(lèi)型數(shù)據(jù),比如可以按年齡、性別、項(xiàng)目、科室、病種等條件檢索,同時(shí)必需檢索全符合條件的數(shù)據(jù)。當(dāng)然,要想采集BDLM進(jìn)行科學(xué)研究,還需要LIS與體檢中心的體檢健康信息管理系統(tǒng)或(和) 醫(yī)院電子病歷信息系統(tǒng) (electronic medical record system,EMRS) 相互兼容、讀取數(shù)據(jù)的能力[13]。相信不久的將來(lái),更多系統(tǒng)間的數(shù)據(jù)共享,可以更為嚴(yán)格的篩選需要的數(shù)據(jù),將影像學(xué)指標(biāo),病歷等納入篩選條件,從而得到更為準(zhǔn)確的生物參考區(qū)間。
結(jié) 論 利用BDLM建立與驗(yàn)證生物參考區(qū)間的方法必將取代傳統(tǒng)方法,成為各個(gè)實(shí)驗(yàn)室建立生物參考區(qū)間的首選方法。這樣的方法可以實(shí)現(xiàn)程序化,自動(dòng)化,人性化的根據(jù)自己實(shí)驗(yàn)室的需求建立不同地域、不同人群、甚至是不同疾病患者間的一個(gè)參考區(qū)間。這個(gè)方法值得大力推廣。