魏學敏,黃 潔,康小強,孟皓宇,胡坤融
(1.景洪市第一人民醫(yī)院,云南 景洪 666100;2.云南盛時迪安生物科技有限公司,云南 昆明 650000;3.西南林業(yè)大學大數(shù)據(jù)與智能工程學院,云南 昆明 650000)
在檢驗標本的采集、傳輸、檢驗的過程中,標本質(zhì)量控制是一個要重點關(guān)注的問題。本文主要討論通過對檢驗標本采集、檢驗標本傳輸、檢驗質(zhì)量控制過程的中形成的數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘的分析方法,對檢驗標本質(zhì)量進行管理。
檢驗標本采集前,病人的飲食情況、運動及情緒、體位、服藥情況等各方面都可能影響檢測結(jié)果的準確性;護士崗前技術(shù)培訓不到位、無采集規(guī)范標準、護士責任心缺乏等原因也會對導致檢驗標本質(zhì)量不合格。
如圖1所示,在基于互聯(lián)網(wǎng)的云檢驗系統(tǒng)中,檢驗標本采集過程需要的數(shù)據(jù)可以及時錄入系統(tǒng)。在這些錄入系統(tǒng)的數(shù)據(jù)中,提取一些影響檢驗標本質(zhì)量的關(guān)鍵數(shù)據(jù)項參與研究。
圖1 云檢驗系統(tǒng)中的檢驗標本采集
基層醫(yī)療機構(gòu)采集標本后裝入智能標本箱,交由專業(yè)冷鏈物流運輸。智能標本箱密封性、防震性能好,且能依據(jù)檢驗標本目的和保存溫度不同進行設(shè)置,能較好地提高標本質(zhì)量。智能標本箱在血液、疫苗、DNA等生物標本的小批量運送場景下,通過內(nèi)置傳感器實時采集標本箱內(nèi)生物標本的溫濕度、密封性、位置等數(shù)據(jù),并實時上傳至云平臺。
如圖2所示,在基于互聯(lián)網(wǎng)的云檢驗系統(tǒng)中,能實時獲取到檢驗標本傳輸過程的數(shù)據(jù),本研究提取在標本傳輸過程中影響檢驗標本質(zhì)量的關(guān)鍵數(shù)據(jù)項參與研究,主要是標本傳遞時間和溫度。
圖2 云檢驗系統(tǒng)中檢驗標本運輸過程數(shù)據(jù)監(jiān)控
在檢驗分析過程中,檢驗機構(gòu)建立了室內(nèi)質(zhì)量控制(IQC)體系,檢驗人員按照一定的頻度連續(xù)測定穩(wěn)定樣品中的特定組分,并采用一系列方法進行分析,按照統(tǒng)計學規(guī)律推斷和評價本批次測量結(jié)果的可靠程度,以此判斷檢驗報告是否可發(fā)出,及時發(fā)現(xiàn)并排除質(zhì)量環(huán)節(jié)中的不滿意因素。
如圖3所示,在基于互聯(lián)網(wǎng)的云檢驗系統(tǒng)中,把檢驗機構(gòu)的臨床實驗室質(zhì)量體系運行監(jiān)控與管理平臺也整合到系統(tǒng)中,本研究提取在檢驗分析中影響檢驗標本質(zhì)量的關(guān)鍵數(shù)據(jù)項參與研究。
圖3 檢驗分析
作為一種利用患者標本檢測結(jié)果進行IQC的方法,其更加符合真實的實驗室情況,因此無基質(zhì)效應(yīng)、無互換性等問題;患者標本在不斷地被檢測,因此質(zhì)控也可以持續(xù)地進行下去,甚至可以與患者的臨床狀態(tài)直接相關(guān)。精心設(shè)計的患者數(shù)據(jù)質(zhì)控方法可以幫助臨床實驗室了解自己實驗室特定檢測項目的生物學和分析特性以及患者人群情況。
檢驗標本數(shù)據(jù)的質(zhì)量控制數(shù)據(jù)挖掘方法設(shè)計的基本思路:通過已有的數(shù)據(jù)形成數(shù)據(jù)集,數(shù)據(jù)集包括兩部分內(nèi)容,一部分是描述屬性,一個是分類屬性。分類屬性把檢驗數(shù)據(jù)分成兩類,達標的和不達標的。本研究通過建立樸素貝葉斯分類挖掘模型,然后對新產(chǎn)生的檢驗數(shù)據(jù)進行分類預(yù)測,如果模型分類預(yù)測結(jié)果為不達標,則對該標本的檢驗過程進行回溯,以達到質(zhì)量控制的目的。
在檢驗標本采集階段,重點提取檢驗項目名稱、樣本類型、標本存放時間等作為描述屬性。數(shù)據(jù)項的采集不涉及病人的具體信息,達到了脫敏處理的效果,為了表示每一個檢驗項目,進行檢驗質(zhì)量追蹤,記錄了檢驗條碼號。
在檢驗標本傳輸階段,重點通過提取標本傳輸時間、標本溫度這兩個數(shù)據(jù)項作為描述屬性。標本溫度在沒有異常值的情況下,選取傳輸時間段的平均溫度。
在標本檢驗階段,提取檢驗結(jié)果、檢驗參考值、異常提示三個數(shù)據(jù)項作為描述屬性。
通過前期的工作積累,把所有標本的檢驗數(shù)據(jù)按照上述提取的描述屬性構(gòu)造一個數(shù)據(jù)集,同時納入檢驗質(zhì)量符合要求的數(shù)據(jù)以及檢驗質(zhì)量不符合要求的數(shù)據(jù),并把數(shù)據(jù)分為檢驗質(zhì)量達標和檢驗質(zhì)量不達標兩類。構(gòu)成數(shù)據(jù)集的基本形式如表1所示。
表1 檢驗質(zhì)量數(shù)據(jù)集的數(shù)據(jù)構(gòu)成
Microsoft Naive Bayes 算法是由 Microsoft SQL Serv er Analysis Services 提供的一種基于貝葉斯定理的分類算法,通過發(fā)現(xiàn)輸入列與可預(yù)測列之間的關(guān)系來進行預(yù)測性建模。對于可預(yù)測性變量的每個狀態(tài),樸素貝葉斯算法會計算出輸入的每一個可能狀態(tài)的概率。然后可以利用這些概率對新的目標進行預(yù)測。由于該算法相當簡單,所以它構(gòu)建模型非???。
在本項目的研究中,提取的數(shù)據(jù)保存在SQLServer中,通過SQLServer的分析服務(wù)來構(gòu)建樸素貝葉斯分類模型。操作步驟較多,僅描述主要的步驟如下。
(1)安裝配置好SQLServer的分析服務(wù)。
(2)按照3.1節(jié)設(shè)計的方法準備好的數(shù)據(jù)集。
(3)在SQL Server Data Tools中建立Microsoft Naiv e Bayes數(shù)據(jù)挖掘模型。
(4)通過建立的挖掘模型對新產(chǎn)生的檢驗數(shù)據(jù)進行分類預(yù)測。
(5)對分類預(yù)測結(jié)果為質(zhì)量不達標的檢驗標本進行回溯處理,以提高檢驗質(zhì)量。
在分級診療體系中,開展標本云檢驗可以使得農(nóng)村和社區(qū)醫(yī)院分享到更先進的檢驗設(shè)備,患者也減少了路途的時間和經(jīng)費開銷。但是檢驗標本需要采樣后保存一段時間,并經(jīng)過冷鏈長距離運輸,可能會對檢驗質(zhì)量產(chǎn)生影響,本文提出的基于樸素貝葉斯的檢驗樣本質(zhì)量分類辦法可以幫助找出那些質(zhì)量異常的檢驗樣本,可以達到保護患者權(quán)益、提高檢驗水平等效果,是一種值得推廣的方法。