黃江珊 高 娃 宿 靜 王偉麗
上海城建職業(yè)學(xué)院,上海,201415
海量醫(yī)學(xué)信息的數(shù)字化和就診流程的電子化,適應(yīng)了人口迅速增多、老齡化趨勢(shì)加快、慢性病患者群體增長(zhǎng)的社會(huì)現(xiàn)狀[1]。與此同時(shí),醫(yī)學(xué)影像數(shù)據(jù)迅猛增長(zhǎng),醫(yī)學(xué)影像數(shù)據(jù)能夠?yàn)獒t(yī)生的疾病診斷提供關(guān)鍵性的決策支持,但目前大多數(shù)的CT、MRI、X光片、B超、彩超等醫(yī)學(xué)影像信息只是經(jīng)過簡(jiǎn)單的儲(chǔ)存、提取和統(tǒng)計(jì),用于滿足基礎(chǔ)的查詢檢索需求,而大量蘊(yùn)含價(jià)值的醫(yī)學(xué)影像數(shù)據(jù)沒有被有效利用起來,造成嚴(yán)重的信息資源浪費(fèi),醫(yī)療工作者也很難從以往珍貴的患者影像中挖掘出更多有研究?jī)r(jià)值的信息,從而達(dá)到預(yù)測(cè)疾病的發(fā)展趨勢(shì)和發(fā)現(xiàn)其中隱含的規(guī)律等目標(biāo)[2]。為此,本研究借助卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)與長(zhǎng)短期記憶網(wǎng)絡(luò)(Long-Short Term Memory,LSTM),提出醫(yī)學(xué)影像數(shù)據(jù)管理的一般方法,將復(fù)雜的醫(yī)學(xué)影像通過模型的自動(dòng)學(xué)習(xí)轉(zhuǎn)化為可供直接利用的文本診斷數(shù)據(jù)(病情描述和病情診斷),采用統(tǒng)一的DICOM標(biāo)準(zhǔn)(Digital Imaging and Communication in Medicine,醫(yī)學(xué)數(shù)字圖像和通信),在同一信息模態(tài)下關(guān)聯(lián)患者信息、病案信息,以期實(shí)現(xiàn)醫(yī)學(xué)影像數(shù)據(jù)的深度管理開發(fā)與利用,為后續(xù)的臨床病例診斷提供參考。
醫(yī)學(xué)影像主要包括CT、MRI、X光片、B超、彩超等,多用于檢查人體的胸、腦、肺、乳腺、肝臟、甲狀腺等部位[3],伴隨著醫(yī)學(xué)影像的生成,患者的姓名、年齡、性別、看診時(shí)間等文本信息等也會(huì)記錄保存下來。本研究中的患者信息包括:患者ID、姓名、性別、年齡、身份證號(hào)、家庭住址、聯(lián)系電話、就診時(shí)間、門診號(hào)碼、住院號(hào)碼、就診科室、檢查部位、檢查技術(shù)、初診疾病、影像信息、檢查結(jié)論等[4]。醫(yī)學(xué)影像及診斷信息常存儲(chǔ)于醫(yī)院不同類別的醫(yī)學(xué)影像數(shù)據(jù)庫及信息系統(tǒng)中,而本研究主要是基于江蘇大學(xué)附屬醫(yī)院信息科提供的醫(yī)學(xué)影像數(shù)據(jù)。
本研究利用CNN-LSTM對(duì)醫(yī)學(xué)影像進(jìn)行自主學(xué)習(xí),以識(shí)別甲狀腺良性、惡性結(jié)節(jié)為例,具體過程包括:數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)組織、數(shù)據(jù)的關(guān)聯(lián)存儲(chǔ)、數(shù)據(jù)應(yīng)用5個(gè)階段,其中數(shù)據(jù)組織與數(shù)據(jù)的關(guān)聯(lián)存儲(chǔ)階段是本文重點(diǎn)。將經(jīng)過CNN-LSTM提取過特征的海量影像數(shù)據(jù)有序組織,生成結(jié)構(gòu)化的醫(yī)學(xué)影像描述和醫(yī)學(xué)診斷(標(biāo)簽),具體思路如圖1所示。
本研究采用深度學(xué)習(xí)中具有代表性、應(yīng)用范圍最廣的CNN,融合主流處理時(shí)序數(shù)據(jù)的LSTM,利用CNN-LSTM即可挖掘低層次圖像特征并能有序組織這一特性對(duì)醫(yī)學(xué)影像進(jìn)行自主學(xué)習(xí),以識(shí)別甲狀腺良性、惡性結(jié)節(jié)為例[5],對(duì)醫(yī)學(xué)影像及診斷信息進(jìn)行組織管理,再將醫(yī)學(xué)影像、患者信息、病案信息以及病種信息關(guān)聯(lián)存儲(chǔ),為醫(yī)學(xué)影像管理提供一般方法的同時(shí),為醫(yī)學(xué)影像數(shù)據(jù)的進(jìn)一步開發(fā)與利用提供了信息保障。
圖1 醫(yī)學(xué)影像數(shù)據(jù)結(jié)構(gòu)化流程
在對(duì)醫(yī)學(xué)圖像進(jìn)行數(shù)據(jù)處理前,為了使醫(yī)學(xué)影像的識(shí)別精度更高、實(shí)際操作更具有可行性,本研究選取患者甲狀腺結(jié)節(jié)部位的B超影像作為樣本數(shù)據(jù)。
從成像設(shè)備中采集到的醫(yī)學(xué)影像包含著大量的噪聲。為精準(zhǔn)地分割、檢測(cè)甲狀腺結(jié)節(jié),需要進(jìn)行去除圖像中的噪聲,增強(qiáng)圖像中結(jié)節(jié)區(qū)域。基于江蘇大學(xué)附屬醫(yī)院信息科提供的醫(yī)學(xué)影像數(shù)據(jù)來源,在實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備階段,圖像數(shù)據(jù)集被分割為訓(xùn)練集和測(cè)試集,以便最后得到識(shí)別模型的最佳參數(shù)[6]。首先,讀取甲狀腺結(jié)節(jié)的B超數(shù)據(jù),包括至少5000張良性結(jié)節(jié)的圖像和至少5000張惡性結(jié)節(jié)的圖像;其次,對(duì)甲狀腺結(jié)節(jié)圖像進(jìn)行預(yù)處理,進(jìn)行圖像灰度化,并利用周圍像素點(diǎn)的灰度值去掉超聲圖像中醫(yī)生為測(cè)量結(jié)節(jié)相關(guān)量做的標(biāo)記,利用高斯濾波去噪;最后利用灰度直方圖均衡化增強(qiáng)對(duì)比度,得到預(yù)處理后的增強(qiáng)圖像。
選取需要訓(xùn)練的醫(yī)學(xué)圖像,利用CNN自動(dòng)學(xué)習(xí)分割出結(jié)節(jié)部分與非結(jié)節(jié)部分,結(jié)節(jié)部分就是感興趣區(qū)域,這個(gè)過程就叫做提取感興趣特征,接著并對(duì)結(jié)節(jié)形狀進(jìn)行細(xì)化。首先選取經(jīng)過預(yù)處理后的增強(qiáng)圖像10000張,包括良惡性結(jié)節(jié)各5000張。其次對(duì)每一張圖片,首先手動(dòng)截取出結(jié)節(jié)部分與非結(jié)節(jié)部分,然后通過CNN訓(xùn)練出適合甲狀腺良惡性結(jié)節(jié)識(shí)別的CNN-LSTM模型,模型結(jié)構(gòu)如圖2所示。
圖2 CNN-LSTM混合模型結(jié)構(gòu)
該混合模型是由13層卷積層、2層下采樣層組成的,卷積層的卷積核的大小分別為:第一層為13×13,第二層與第三層為5×5,其余各層為3×3。卷積層的步長(zhǎng)分別是:前兩個(gè)卷積層是2,其余的都是1;下采樣層的大小都是3×3,步長(zhǎng)都是2。
通過設(shè)計(jì)好的CNN的卷積層與下采樣層自動(dòng)學(xué)習(xí)特征,并提取出特征,并利用這些提取好的特征結(jié)合Softmax函數(shù)自動(dòng)識(shí)別出結(jié)節(jié),確定好自動(dòng)分割的模型。利用CNN自動(dòng)分割所有甲狀腺的結(jié)節(jié),即區(qū)分出結(jié)節(jié)區(qū)域與非結(jié)節(jié)區(qū)域,找到結(jié)節(jié)區(qū)域的邊界,并對(duì)分割出的結(jié)節(jié)形狀進(jìn)行細(xì)化,即通過腐蝕、膨脹形態(tài)學(xué)算子進(jìn)行填洞以及去掉與非結(jié)節(jié)區(qū)域的連接[7]。
最后利用步驟二得到的模型對(duì)所有的甲狀腺結(jié)節(jié)圖片進(jìn)行自動(dòng)分割,得到感興趣區(qū)域,即所有的良惡性結(jié)節(jié)。
將自動(dòng)分割出的感興趣區(qū)域平均分成P組,對(duì)數(shù)據(jù)進(jìn)行歸一化,即自動(dòng)分割出結(jié)節(jié)后,提取出這些結(jié)節(jié)的特征,對(duì)這些特征進(jìn)行線性變化,使結(jié)果值映射到[0,1]。選出p-1組數(shù)據(jù)做訓(xùn)練集,剩余一組做測(cè)試,通過CNN訓(xùn)練出識(shí)別模型進(jìn)行測(cè)試。
LSTM由若干個(gè)循環(huán)連接記憶塊構(gòu)成,每個(gè)記憶塊都至少包含一個(gè)記憶細(xì)胞,同時(shí)還具有輸入門,消除門和輸出門這3個(gè)控制信息的開關(guān)[8]。記憶細(xì)胞具有記憶某一時(shí)間段信息的特點(diǎn),因此LSTM通過記憶之前某一時(shí)刻的文本信息,可以充分學(xué)習(xí)事件上下文信息內(nèi)在關(guān)系,以實(shí)現(xiàn)深入發(fā)掘信息文本序列中內(nèi)在有序性的目的。
基于LSTM與Softmax分類器對(duì)提取后特征后的醫(yī)學(xué)影像進(jìn)行結(jié)構(gòu)化時(shí)序組織用于分類識(shí)別,將CNN分割與特征提取后的歸一化向量,作為全連接層后的LSTM的輸入。LSTM會(huì)充分挖掘圍繞醫(yī)學(xué)影像的抽象序列關(guān)系特征,將經(jīng)過CNN標(biāo)注后圖像生成的向量進(jìn)行特征合并,組合生成具有時(shí)序特征的字符描述。最后將LSTM輸出的特征信息輸入Softmax分類器中,實(shí)現(xiàn)對(duì)疾病的分類識(shí)別,具體如圖3所示。
圖3 CNN-LSTM模型流程
在分類識(shí)別過程中,因?yàn)榻Y(jié)節(jié)的良惡性作為結(jié)果互斥,不適合采用組合分類器,所以本文利用一種Softmax分類,該模型由logistic線性模型演化而來,logistic模型常用于處理兩類分類問題,而Softmax分類器主要用于解決類別數(shù)(c≥2)的多分類問題[9]。但由于本文案例中的甲狀腺結(jié)節(jié)只有良性、惡性之分,故采用只有兩分類的Softmax分類器,求解一個(gè)損失函數(shù)的最優(yōu)值,Softmax分類器的類別數(shù)等于2。Softmax識(shí)別過程輸出一個(gè)概率值,當(dāng)損失函數(shù)中的指示性函數(shù)的值為真時(shí),結(jié)果為1,否則結(jié)果為0,將結(jié)果值映射到[0,1]。根據(jù)Softmax給出的概率可以得到將所有的結(jié)節(jié)區(qū)域與非結(jié)節(jié)區(qū)域區(qū)分開的一個(gè)概率圖。通過梯度下降方法就能得到屬于良性結(jié)節(jié)還是惡性結(jié)節(jié)的概率。重復(fù)進(jìn)行測(cè)試,做對(duì)于P組數(shù)據(jù),每次選出P-1組數(shù)據(jù)訓(xùn)練,余下的做測(cè)試,得到識(shí)別模型的最佳參數(shù),最終確定基于CNN自動(dòng)識(shí)別甲狀腺結(jié)節(jié)良惡性的識(shí)別流程。
采用CNN-LSTM模型對(duì)醫(yī)學(xué)影像進(jìn)行組織管理,最終要通過某種媒介或載體存放挖掘過的醫(yī)學(xué)影像數(shù)據(jù),還要實(shí)現(xiàn)對(duì)醫(yī)學(xué)影像數(shù)據(jù)、患者信息和病歷信息等文本數(shù)據(jù)的關(guān)聯(lián)儲(chǔ)存和管理,將醫(yī)學(xué)影像的智能識(shí)別與其他文本信息結(jié)合,為病情描述、病情診斷等結(jié)構(gòu)化數(shù)據(jù)的形成提供數(shù)據(jù)保障。同時(shí)只有將數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)好,才能讓醫(yī)學(xué)影像數(shù)據(jù)分析的價(jià)值得以實(shí)現(xiàn),更好地服務(wù)于醫(yī)療和社會(huì)。
基于DICOM標(biāo)準(zhǔn)建立MIID(Medical Image Intelligence Database,醫(yī)學(xué)影像智能數(shù)據(jù)庫),該標(biāo)準(zhǔn)是為了實(shí)現(xiàn)不同醫(yī)學(xué)影像設(shè)備之間的數(shù)據(jù)通信而制定的關(guān)于醫(yī)學(xué)圖像和相關(guān)信息領(lǐng)域的國際標(biāo)準(zhǔn)[10]。MIID是用來儲(chǔ)存大量醫(yī)學(xué)影像并可以進(jìn)行調(diào)用、查詢等功能的系統(tǒng),為實(shí)現(xiàn)圖像信息應(yīng)用提供了基礎(chǔ)平臺(tái),也是醫(yī)學(xué)影像存檔和通信系統(tǒng)、醫(yī)院信息系統(tǒng)和其他醫(yī)學(xué)影像信息系統(tǒng)的重要組成部分。MIID醫(yī)學(xué)影像智能數(shù)據(jù)庫是基于DICOM 標(biāo)準(zhǔn),結(jié)合醫(yī)學(xué)影像存檔和通信系統(tǒng)設(shè)計(jì)搭建的。MIID是由DICOM 接口模塊、用戶接口模塊和醫(yī)學(xué)影像智能數(shù)據(jù)庫構(gòu)建三部分組成。
2.4.1 接口模塊。DICOM 接口模塊輸入聯(lián)機(jī)的醫(yī)學(xué)影像,提供符合醫(yī)學(xué)數(shù)字影像通信標(biāo)準(zhǔn)DICOM的接口,實(shí)現(xiàn)各種醫(yī)學(xué)影像設(shè)備之間進(jìn)行數(shù)據(jù)交換,例如:斷層攝影CT設(shè)備、核磁共振成像MRI設(shè)備、超聲波檢查設(shè)備、膠片數(shù)字化系統(tǒng)、視頻采集系統(tǒng)和醫(yī)院信息管理系統(tǒng)等。
2.4.2 用戶接口模塊。用戶接口模塊主要負(fù)責(zé)與醫(yī)院的門診系統(tǒng)、放射科成像系統(tǒng)、信息科內(nèi)部的集成平臺(tái)等關(guān)聯(lián)起來,提供患者信息、病歷信息的錄入與查詢,醫(yī)學(xué)影像的顯示、檢索、歸類、處理,會(huì)診結(jié)果查詢等。
①影像歸檔。根據(jù)不同影像各自的類型,將輸入的醫(yī)學(xué)影像歸檔到對(duì)應(yīng)的目錄下。
②影像檢索和查詢。根據(jù)患者姓名、身份證號(hào)、門診號(hào)碼、住院號(hào)碼、就診部位、檢查時(shí)間等檢索項(xiàng)進(jìn)行檢索,查詢并顯示檢索后的信息。
③影像文件的處理。采集影像文件,可以實(shí)現(xiàn)影像的黑白翻轉(zhuǎn)、影像增強(qiáng)、任意放大裁剪、調(diào)節(jié)影像顯示模式等。對(duì)影像進(jìn)行預(yù)處理、基于深度學(xué)習(xí)模型提取特征信息、識(shí)別分類影像文件。通過計(jì)算機(jī)網(wǎng)絡(luò)保存影像文件到智能影像數(shù)據(jù)庫。
④影像文件格式轉(zhuǎn)換。將B超、彩超等影像文件格式轉(zhuǎn)換成BMP、JPG、TIF等文件格式。
⑤病案信息、患者信息的錄入。伴隨著患者影像的生成,病歷信息、患者個(gè)人信息也應(yīng)被一同錄入用戶接口,在數(shù)據(jù)庫內(nèi)部實(shí)現(xiàn)彼此的數(shù)據(jù)關(guān)聯(lián),利用唯一的主鍵將患者信息、影像信息等聯(lián)系在一起;
⑥影像、文本等信息的刪除。若發(fā)生錄入信息錯(cuò)誤,圖像歸類失誤的情況時(shí),可進(jìn)行刪除操作,也可減少占用數(shù)據(jù)庫空間。
2.4.3 智能數(shù)據(jù)庫構(gòu)建。采用統(tǒng)一DICOM通信標(biāo)準(zhǔn),建立患者信息表、影像信息表、病案表和鏈接表,在智能數(shù)據(jù)庫中實(shí)現(xiàn)同一信息模態(tài)下影像信息與患者信息、病案信息的關(guān)聯(lián),為后期醫(yī)療大數(shù)據(jù)的分析利用提供信息基礎(chǔ)。
①患者信息。DICOM標(biāo)準(zhǔn)中涵蓋了以數(shù)據(jù)元素的形式的各類數(shù)據(jù)。一個(gè)數(shù)據(jù)元素是由標(biāo)簽(Tag),值類型(Value Representation,VR),值長(zhǎng)度(Value Length)和值(Value Content)4個(gè)部分來組成[11]。設(shè)計(jì)數(shù)據(jù)庫表-患者信息表(Patient Table),具體如表1所示。
表1 患者信息
②影像信息。不同格式的影像文件通過DICOM接口傳輸?shù)街悄苡跋駭?shù)據(jù)庫,包括圖像編號(hào)、圖像UID、圖像類型、圖像寬度、圖像高度、窗位、窗寬、字節(jié)順序等。設(shè)計(jì)數(shù)據(jù)庫表-影像表(Image Table),具體如表2所示。
表2 影像信息
③病案信息記錄的是病人每一次就診產(chǎn)生的病案記錄,設(shè)計(jì)數(shù)據(jù)庫表-病案表(Illness Table),具體如表3所示。
表3 病案
④關(guān)聯(lián)信息。以BMP(Bit MaP)、JPG(Joint Picture Experts Group)、TIF(Tagged Image File Format)等格式影像、掃描儀生成影像為代表的影像信息、患者信息、生成的病案信息等關(guān)聯(lián)在一起加入到影像數(shù)據(jù)庫。
為了實(shí)現(xiàn)讓影像數(shù)據(jù)、患者數(shù)據(jù)、病案數(shù)據(jù)進(jìn)行關(guān)聯(lián),設(shè)計(jì)數(shù)據(jù)庫表-鏈接表(Link Table),如表4所示,將影像UID、患者ID、病案ID關(guān)聯(lián)在一起,以便下一步的對(duì)醫(yī)學(xué)數(shù)據(jù)的開發(fā)與利用。
表4 鏈接
借助CNN-LSTM對(duì)醫(yī)學(xué)影像進(jìn)行有序化組織,將未標(biāo)注的非結(jié)構(gòu)化的醫(yī)學(xué)圖像轉(zhuǎn)化為結(jié)構(gòu)化的文本數(shù)據(jù),基于DICOM標(biāo)準(zhǔn)將影像數(shù)據(jù)與患者信息、病案信息、病種信息關(guān)聯(lián)起來,對(duì)非結(jié)構(gòu)化形式的醫(yī)學(xué)影像數(shù)據(jù)進(jìn)行有效管理與挖掘,為醫(yī)學(xué)影像管理提供一般方法的同時(shí),為醫(yī)學(xué)影像數(shù)據(jù)的進(jìn)一步開發(fā)與利用提供了信息保障。醫(yī)學(xué)影像數(shù)據(jù)應(yīng)用主要包括智能醫(yī)療輔助診斷的推動(dòng)與發(fā)展、醫(yī)學(xué)影像元數(shù)據(jù)格式與傳輸標(biāo)準(zhǔn)的規(guī)范、人類流行病的預(yù)測(cè)預(yù)防、個(gè)人健康檔案的構(gòu)建這4個(gè)領(lǐng)域。
近年來,國內(nèi)外正處于人工智能醫(yī)療的風(fēng)口,我國相關(guān)國家部門相繼出臺(tái)政策及措施鼓勵(lì)支持人工智能醫(yī)療的發(fā)展[12]。本研究在這此時(shí)代背景下,借助深度學(xué)習(xí)模型,深度開發(fā)利用醫(yī)學(xué)影像數(shù)據(jù)的有用價(jià)值,將訓(xùn)練好的數(shù)據(jù)集與患者信息、病案信息、病種信息等多模態(tài)醫(yī)療數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)在數(shù)據(jù)庫中,這為智能診斷輔助平臺(tái)實(shí)現(xiàn)對(duì)患者病情的智能診斷提供了信息保障,可以減少醫(yī)生讀片時(shí)間,提高醫(yī)生判定的準(zhǔn)確率和工作效率,降低臨床漏檢率,協(xié)助醫(yī)生診斷;同時(shí)可以對(duì)疾病進(jìn)行監(jiān)控、預(yù)測(cè)、預(yù)防與診治,提早發(fā)現(xiàn)潛在疾病與易復(fù)發(fā)疾病,及時(shí)得到醫(yī)療救治。
本研究中的醫(yī)學(xué)影像、患者信息、病案信息以及病種信息的交互與關(guān)聯(lián)都是基于統(tǒng)一的DICOM標(biāo)準(zhǔn),但目前不同承接商為了滿足不同醫(yī)院的信息需求,建設(shè)的業(yè)務(wù)模塊都是以分散的模式存在的,醫(yī)院各信息系統(tǒng)設(shè)計(jì)的標(biāo)準(zhǔn)不盡統(tǒng)一,很難實(shí)現(xiàn)同一醫(yī)院內(nèi)或不同醫(yī)院間集成管理與資源的共享、共建。因此,統(tǒng)一醫(yī)療信息標(biāo)準(zhǔn),規(guī)范醫(yī)療元數(shù)據(jù)格式十分重要,這不僅可以提倡多方參與標(biāo)準(zhǔn)管理工作,還可以完善醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)管理平臺(tái)、促進(jìn)醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)體系的建立與施行。
人工智能在進(jìn)行疾病的篩查和預(yù)測(cè)過程中,可以通過影像檢查結(jié)果中去發(fā)現(xiàn)疾病的端倪,從而實(shí)現(xiàn)對(duì)流行病的預(yù)測(cè)預(yù)防。通過統(tǒng)一的患者ID將患者信息、病案信息、病種信息與醫(yī)學(xué)影像信息四者關(guān)聯(lián)起來,利用海量醫(yī)療大數(shù)據(jù)優(yōu)勢(shì),其中涵括的患者年齡、地址、發(fā)病預(yù)兆、診斷結(jié)論等信息為后續(xù)疾病預(yù)測(cè)有著極大的借鑒作用。
同一醫(yī)院的歷史醫(yī)療數(shù)據(jù)或是不同醫(yī)院間某類疾病的醫(yī)療數(shù)據(jù),對(duì)其加以整合利用,讓計(jì)算機(jī)工具主動(dòng)學(xué)習(xí)醫(yī)療數(shù)據(jù)中蘊(yùn)含的內(nèi)在規(guī)律,訓(xùn)練好的輔助診斷工具可以在對(duì)患者進(jìn)行疾病診治時(shí),察覺患者的潛在疾病風(fēng)險(xiǎn),對(duì)易發(fā)生疾病加以預(yù)防,也可以培養(yǎng)居民個(gè)人健康習(xí)慣。
面向個(gè)人健康是未來醫(yī)療事業(yè)發(fā)展的重要方向之一,2009年我國衛(wèi)生部發(fā)布試行數(shù)據(jù)集編制規(guī)范,其中對(duì)數(shù)據(jù)集元數(shù)據(jù)描述規(guī)則、數(shù)據(jù)元分類代碼進(jìn)行了規(guī)范[13]。本研究對(duì)醫(yī)學(xué)影像等信息統(tǒng)一描述,規(guī)范其元數(shù)據(jù)格式,在數(shù)據(jù)采集過程中,對(duì)醫(yī)學(xué)影像及其醫(yī)療信息的采集標(biāo)準(zhǔn)進(jìn)行了要求;在數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)環(huán)節(jié)中,對(duì)各醫(yī)療數(shù)據(jù)的元數(shù)據(jù)命名作出統(tǒng)一規(guī)范。醫(yī)學(xué)影像數(shù)據(jù)管理方法的提出,有利于居民對(duì)自身的健康狀況、身體變化過程進(jìn)行統(tǒng)一規(guī)范記錄,對(duì)社會(huì)個(gè)人來說,可以及時(shí)預(yù)防預(yù)測(cè)自身的健康狀況,抵抗患大病、慢性病風(fēng)險(xiǎn);對(duì)于醫(yī)務(wù)工作者,可以為患者提供直接準(zhǔn)確個(gè)性化的診治和預(yù)防醫(yī)療服務(wù)。
目前醫(yī)學(xué)影像數(shù)據(jù)管理在實(shí)際應(yīng)用層面,特別是在基層中小型醫(yī)院,仍因多種復(fù)雜因素,只是對(duì)醫(yī)療信息系統(tǒng)建設(shè)與管理的進(jìn)一步完善或單一疾病醫(yī)學(xué)影像數(shù)據(jù)庫的構(gòu)建進(jìn)行研究[14],不能實(shí)現(xiàn)對(duì)醫(yī)學(xué)影像數(shù)據(jù)的有效利用與開發(fā),借助新興的CNN-LSTM,基于DICOM標(biāo)準(zhǔn)對(duì)醫(yī)學(xué)影像數(shù)據(jù)進(jìn)行采集、加工、組織、存儲(chǔ)、利用,將其轉(zhuǎn)化為結(jié)構(gòu)化的文本診斷數(shù)據(jù),可進(jìn)一步為非結(jié)構(gòu)化醫(yī)學(xué)影像數(shù)據(jù)管理與智能診斷的有效結(jié)合提供信息保障,推動(dòng)智能醫(yī)療事業(yè)的發(fā)展,同時(shí)也為醫(yī)學(xué)影像數(shù)據(jù)的管理提供一種一般方法。但本研究也存在著一些不足,深度學(xué)習(xí)方法的過程不可見,訓(xùn)練時(shí)間過長(zhǎng),缺乏普適性,無法拆解出具體的智能化業(yè)務(wù)規(guī)則,而且高度依賴標(biāo)注好的圖像數(shù)據(jù);此外,臨床需求復(fù)雜,花費(fèi)大量精力訓(xùn)練好的數(shù)據(jù)不能完全保證精準(zhǔn)度,若發(fā)生誤差,醫(yī)生再進(jìn)行復(fù)檢,也是對(duì)醫(yī)療人力的一種消耗;因缺乏統(tǒng)一的質(zhì)量評(píng)估框架,各大醫(yī)院采集到的數(shù)據(jù)存在著大量的噪聲[15],建立行業(yè)類規(guī)范科學(xué)的醫(yī)學(xué)影像標(biāo)準(zhǔn)迫在眉睫。
國際上運(yùn)用深度學(xué)習(xí)模型進(jìn)行病情診斷處于應(yīng)用起步階段,大多數(shù)公司的人工智能產(chǎn)品還處于研發(fā)打磨階段[16]。本研究從圖書情報(bào)領(lǐng)域出發(fā),立足于對(duì)醫(yī)學(xué)影像數(shù)據(jù)的管理與利用,利用深度學(xué)習(xí)模型CNN-LSTM,以甲狀腺良惡性結(jié)節(jié)B超影像為例,將非結(jié)構(gòu)化的醫(yī)學(xué)影像轉(zhuǎn)化為可直接利用的文本診斷數(shù)據(jù),在同一模態(tài)下與患者信息、病案信息關(guān)聯(lián)起來,通過CNN自主學(xué)習(xí)特征的優(yōu)勢(shì),對(duì)海量的醫(yī)學(xué)圖像大數(shù)據(jù)進(jìn)行加工與組織,再將訓(xùn)練好的數(shù)據(jù)集儲(chǔ)存在MIID數(shù)據(jù)庫中,當(dāng)未標(biāo)注的醫(yī)學(xué)影像輸入輔助診斷系統(tǒng)中,可輸出結(jié)構(gòu)化的文字病情診斷描述,這為醫(yī)學(xué)影像數(shù)據(jù)的管理提供了一般方法,也削減了醫(yī)生讀片時(shí)間,提高醫(yī)生判定的準(zhǔn)確率和工作效率,降低臨床漏檢率,協(xié)助醫(yī)生診斷。