劉義, 吳靜云, 馬帥, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
·腹部影像學·
泌尿系結(jié)石CT征象與手術(shù)方式的相關(guān)性:NLP研究
劉義, 吳靜云, 馬帥, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
目的以自然語言處理(NLP)方法研究泌尿系結(jié)石CT報告征象與臨床手術(shù)方式的相關(guān)性。方法回顧性選取HIS中因泌尿系結(jié)石行CT檢查、并在本院行外科處理的住院患者資料,包括CT報告、出院小結(jié)中記錄的診療經(jīng)過,形成記錄文檔。使用不同NLP模型研究CT報告中結(jié)石的影像特征與手術(shù)方式的相關(guān)性。結(jié)果共納入371例連續(xù)患者的資料用于分析,其中行經(jīng)皮腎鏡碎石取石術(shù)(PNL)142例,輸尿鏡碎石術(shù)(URL)190例,輸尿管軟鏡碎石術(shù)(IRS)39例。NLP提取“結(jié)石”、“炎癥”、“輸尿管形態(tài)”為關(guān)鍵CT特征,十折交叉驗證結(jié)果顯示,經(jīng)優(yōu)化后的NLP對結(jié)石手術(shù)(URL和PNL)分類符合率為0.730,ROC曲線下面積為0.741。結(jié)論NLP用于CT結(jié)石特征分析是可行的,可為臨床決策提供一定的幫助。
自然語言處理; 數(shù)據(jù)挖掘; 泌尿系結(jié)石; 影像信息學
隨著信息技術(shù)的迅速發(fā)展,影像數(shù)據(jù)對臨床決策的影響日益增大[1]。臨床工作中,將醫(yī)學影像信息應(yīng)用于臨床決策的過程基本依賴于專家經(jīng)驗,但隨著影像數(shù)據(jù)量的大幅增長,僅憑專家個人經(jīng)驗對影像數(shù)據(jù)做出判讀的缺陷逐漸突顯,依賴數(shù)據(jù)挖掘、人工智能技術(shù),幫助臨床醫(yī)生做出決策成為潛在的解決方案[2]。但常用的數(shù)據(jù)庫管理系統(tǒng)的查詢機制和統(tǒng)計學分析方法已經(jīng)遠不能滿足影像學數(shù)據(jù)挖掘的需要,各種新技術(shù)應(yīng)運而生[3]。但醫(yī)學問題復(fù)雜度高、變異情況多,信息技術(shù)在醫(yī)學領(lǐng)域的應(yīng)用必須經(jīng)過大量的驗證才可能進入到實際工作中,而驗證過程也常常是從簡單、單一的應(yīng)用場景過度到復(fù)雜、多樣的應(yīng)用場景。本文將自然語言處理(natural language processing,NLP)技術(shù)應(yīng)用于泌尿系結(jié)石的CT圖像特征分析,了解不同NLP提取CT圖像特征與手術(shù)方式的相關(guān)性,來觀察臨床醫(yī)生可能的決策過程。
材料與方法
1.研究對象
本研究經(jīng)倫理委員批準。在本院HIS系統(tǒng)中回顧性選取2014年1月-2016年9月因泌尿系結(jié)石在本院行泌尿系統(tǒng)CT檢查、手術(shù)治療、資料完整的連續(xù)病例。
手術(shù)方式的收集過程:在HIS系統(tǒng)中檢索出院診斷為“結(jié)石”的“泌尿外科住院”患者,查閱出院記錄,若出院記錄中顯示“在本院行手術(shù)治療”則入組,記錄患者的手術(shù)方式。
CT報告的收集過程:在上述入組人群中查閱檢查記錄,如在住院期間或入院前在本院行CT檢查,則在本院PACS/RIS系統(tǒng)中查閱影像科CT報告。設(shè)置高級查詢條件:同時滿足掃描設(shè)備為“CT”,且診斷為“腎結(jié)石”,最終篩選出滿足要求的病例。
將上述數(shù)據(jù)庫中收集的資料導出為Word/Excel格式的文件,匯總進行后續(xù)的NLP分析。
2.NLP分析
文檔處理:將各單元格內(nèi)容讀出并組織成raw_text格式,輸出到n_CT.txt文檔中,對數(shù)據(jù)編號,形成可供NLP處理的文檔。分析過程中遇到信息缺失的情況,通過手工修正。
基于ngrams決策樹的構(gòu)建:先將文本內(nèi)容分詞、生成相應(yīng)的ngram(連續(xù)n個相鄰詞組成的小片段),從而將每個患者的CT報告內(nèi)容表示為一個向量,含ngram的頻數(shù),篩選出帶有完整語義的屬性,用于后續(xù)的分析處理。
使用不同的算法,針對不同手術(shù)類型進行測試,對NLP進行優(yōu)化。
3.統(tǒng)計分析
利用十折交叉驗證方法,對CT報告中結(jié)石相關(guān)特征與手術(shù)方式的相關(guān)性進行分析。
結(jié)果
共入組371個連續(xù)病例,男244例,女127例,年齡15~93歲,平均49歲。以手術(shù)方式進行分組,行經(jīng)皮腎鏡碎石取石術(shù)(percutaneous nephrolithotripsy,PNL)142例,行輸尿鏡碎石術(shù)(ureteroscopic lithotripsy,URL)190例,行輸尿管軟鏡碎石術(shù)(retrograde intrarenal surgery,RIRS)39例。
NLP分析所得手術(shù)方式關(guān)鍵決策信息為:“結(jié)石”、“炎癥”、“輸尿管形態(tài)”的相關(guān)描述。
J48算法的分類預(yù)測符合率為0.456、ROC曲線下面積為0.608(圖1)。為簡化模型,使用RPART算法,從上述決策樹中摘取可信度較高的預(yù)測分支,總結(jié)提煉出修正的規(guī)則,分類預(yù)測符合率為0.434,ROC曲線下面積為0.596。在更進一步簡化模型時,考慮到RIRS的病例數(shù)量較少,故刪去對RIRS的分析,此時NLP對“PNL”和“URL”的分類預(yù)測符合率為0.730,ROC曲線下面積為0.741。
討論
泌尿系結(jié)石發(fā)病率高,嚴重影響患者的生活質(zhì)量[4]。臨床多根據(jù)結(jié)石在輸尿管的位置,停留時間的長短,結(jié)石的大小以及輸尿管梗阻程度,選擇不同的治療方法[5]。隨著腔鏡技術(shù)的不斷成熟,輸尿管結(jié)石的治療越來越傾向于微創(chuàng)技術(shù),主要是碎石或取石治療,常用方法分為URL、RIRS、PNL等[6]。即使是對巨大結(jié)石和復(fù)雜性腎結(jié)石,微創(chuàng)手術(shù)治療也是金標準,必要時行雙側(cè)微創(chuàng)經(jīng)皮腎鏡也是安全有效的,還可減少患者進行二次手術(shù)的痛苦和治療費用[7]。
多排螺旋CT對泌尿系結(jié)石的檢查效果好,是“血尿待查”、“結(jié)石”臨床檢查的一線檢查方法[8-9]。泌尿系結(jié)石在CT圖像上多表現(xiàn)為管腔內(nèi)圓形、類圓形高密度影;結(jié)石以上腎盂、腎盞、輸尿管不同程度擴張、積水;輸尿管壁水腫、增厚、毛躁;輸尿管周圍條索影;腎周水腫,由于急性結(jié)石梗阻時,輸尿管及腎內(nèi)壓力增高,尿液滲出到腎周所致;腎臟體積可增大。CT報告應(yīng)描結(jié)石的具體位置、大小、CT值,如有可能,應(yīng)報告結(jié)石成分[10],以利于進一步?jīng)Q定治療方式。
雖然有明確的共識和要求,且CT診斷的難度不大,但實際工作中泌尿外科醫(yī)師對CT報告的解讀常常感覺不滿意,這與自由文本式報告的固有缺陷有關(guān)[11];也與影像信息較多時,進行綜合判斷信息權(quán)重不易把握有關(guān)[12]。NLP等信息學工具有望改進這一情況,從報告中自動提取與手術(shù)方式選擇相關(guān)的特征信息,對臨床醫(yī)生做出決策提供支持。NLP處理影像報告時,能夠自動識別和提取信息[13],將文本轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),進行數(shù)據(jù)挖掘[14]。它融合了數(shù)據(jù)庫、人工智能、機器學習、統(tǒng)計學等多個領(lǐng)域的理論和技術(shù)?;跊Q策樹的分類算法在數(shù)據(jù)挖掘中的應(yīng)用非常廣泛。與其它分類算法相比,決策樹具有計算量相對較小、易于提取等優(yōu)點,可以充分顯示重要的決策屬性,且分類準確性較高[15-16]。
本研究顯示的NLP首先得到?jīng)Q策樹,既而從算法、任務(wù)兩方面進行了優(yōu)化。首先,經(jīng)過半自動化的屬性篩選,得到的修剪決策樹(pruned tree),提取出結(jié)石、炎癥、輸尿管形態(tài)等關(guān)鍵特征,與手術(shù)方式的選擇有較強的關(guān)聯(lián)。但決策樹的決策層次較多、預(yù)測準確性僅0.456,決策的復(fù)雜性較高,且針對不同患者所采取的具體方案可能存在一定的個體差異。為進一步簡化模型,使用了RPART算法,由于摘取了可信度較高的預(yù)測分支,減少了部分決策分支,決策效率有提高,但預(yù)測符合率稍有減低,僅為0.434。
分析本項目決策樹龐雜、準確性欠佳的原因,可能有兩個方面,一方面是輸入信息的不規(guī)范,另一方面是決策任務(wù)的復(fù)雜性。CT報告中對結(jié)石的特征描述有很多不規(guī)范的報告用語,甚至診斷標準也不完全統(tǒng)一,由于輸入信息的不規(guī)范,以致不能精確地建立起目標向量模型,將來以結(jié)構(gòu)式報告替代文本式報告后[17-18],報告信息可做到規(guī)范、完整,就能解決這一問題。另外,由于一個提高預(yù)測符合率的方向就是對任務(wù)重新定義。從本研究NLP模型評價結(jié)果可以看出,相比于RIRS,模型對于PNL和URL有更好的預(yù)測符合率。
因此,本研究中對NLP的項目任務(wù)定義進行了修改,只保留PNL和URL兩種手術(shù)方式并平衡樣本權(quán)重后的決策樹,其符合率有明確的提高,分類預(yù)測符合率為0.730。改變?nèi)蝿?wù)后NLP效能提高,可能是由于的RIRS的樣本數(shù)較少,影響了模型分類性能。更重要的是,在實際工作中,RIRS常與PNL聯(lián)合使用[6],這也部分解釋了在模型中,部分采取RIRS方案的患者被誤分類為PNL的原因。這兩類患者在CT報告的描述上相似,具體的手術(shù)方案選取依賴于其他方面的因素和個體化的差異。為了驗證這一推論,將這兩類手術(shù)方案進一步細分,需要更大量樣本、多樣化的信息來源以及其專業(yè)知識的介入。
本研究收集了住院患者的信息,未包括門診患者。由于本單位的實際臨床流程中,泌尿系結(jié)石患者如擬用體外震波碎石方法治療,則均在門診進行,因此未能將體外震波碎石方法治療的患者納入實驗研究,使得本研究對象收集不全面,是本研究的局限性之一。
總之,NLP用于CT結(jié)石特征分析是可行的,可為臨床決策提供一定的幫助。本研究僅是初步探索,NLP對回顧性資料的分析顯示有可能根據(jù)影像報告內(nèi)容支持手術(shù)方式?jīng)Q策,這是本領(lǐng)域研究的熱點[19]。當然這一技術(shù)的影像學應(yīng)用仍然存在挑戰(zhàn),如數(shù)據(jù)挖掘算法符合率不高、統(tǒng)計模型的多樣性等,需要IT技術(shù)改進及醫(yī)學專業(yè)知識的提升來克服這些困難。
[1] Kaggal VC,Elayavilli RK,Mehrabi S,et al.Toward a learning health-care system-knowledge delivery at the point of care empowered by big data and NLP[J].Biomed Inform Insights,2016,8(Suppl 1):13-22.
[2] Jee K,Kim GH.Potentiality of big data in the medical sector:focus on how to reshape the healthcare system[J].Healthc Inform Res,2013,19(2):79-85.
[3] Li KC,Marcovici P,Phelps A,et al.Digitization of medicine:how radiology can take advantage of the digital revolution[J].Acad Radiol,2013,20(12):1479-1494.
[4] Kambadakone AR,Eisner BH,Catalano OA,et al.New and evolving concepts in the imaging and management of urolithiasis:urologists' perspective[J].Radiographics,2010,30(3):603-623.
[5] Eisner BH,McQuaid JW,Hyams E,et al.Nephrolithiasis:what surgeons need to know[J].AJR,2011,196(6):1274-1278.
[6] Ziemba JB,Matlaga BR.Guideline of guidelines:kidney stones[J].BJU,2015,116(2):184-189.
[7] Pearle MS,Goldfarb DS,Assimos DG,et al.Medical management of kidney stones:AUA guideline[J].J Urol,2014,192(2):316-324.
[8] Coursey CA,Casalino DD,Remer EM,et al.ACR appropriateness criteria? acute onset flank pain——suspicion of stone disease[J].Ultrasound Q,2012,28(3):227-233.
[9] Scales CD Jr,Bergman J,Carter S,et al.Quality of acute care for patients with urinary stones in the united states[J].Urology,2015,86(5):914-921.
[10] 范兵,邱建星,王霄英,等.雙能CT對離體泌尿系尿酸結(jié)石的診斷價值[J].放射學實踐,2012,27(3):268-270.
[11] Bosmans JML,Weyler JJ,De Schepper AM,et al.The radiology report as seen by radiologists and referring clinicians:results of the COVER and ROVER surveys[J].Radiology,2011,259(1):184-195.
[13] Jensen PB,Jensen LJ,Brunak S.Mining electronic health records:towards better research applications and clinical care[J].Nat Rev Genet,2012,13(6):395-405.
[14] Topaz M,Lai K,Dowding D,et al.Automated identification of wound information in clinical notes of patients with heart diseases:Developing and validating a natural language processing application[J].Int J Nurs Stud,2016,19(64):25-31.
[15] Cai T,Giannopoulos AA,Yu S,et al.Natural language processing technologies in radiology research and clinical applications[J].Radiographics,2016,36(1):176-191.
[16] Pons E,Braun LM,Hunink MG,et al.Natural language processing in radiology:a systematic review[J].Radiology,2016,279(2):329-343.
[17] 秦岫波,王蕊,高歌,等.前列腺多參數(shù)MRI報告進展:基于第2版前列腺影像報告和數(shù)據(jù)系統(tǒng)的結(jié)構(gòu)式報告的構(gòu)建[J].腫瘤影像學,2016,25(2):111-116.
[18] 王可,劉慶,郭小超,等.肝癌影像報告進展:基于LI-RADS的結(jié)構(gòu)式報告[J].肝癌電子雜志,2016,3(1):26-31.
[19] Yadav K,Sarioglu E,Choi HA,et al.Automated outcome classification of computed tomography imaging reports for pediatric traumatic brain injury[J].Acad Emerg Med,2016,23(2):171-178.
CorrelationbetweenCTsignsandsurgicalproceduresofurinarycalculus:optimizationofnaturallanguageprocessingresearch
LIU Yi,WU Jing-yun,MA Shuai,et al.
Department of Radiology,Peking University First Hospital,Beijing 100034,China
Objective:To investigate the correlation between CT report signs and surgical procedures of urinary calculus by natural language processing (NLP) method.MethodsDocuments were retrospectively archived from HIS for the inpatients,who had CT examination for urinary calculus and ultimately underwent surgical procedures.NLP model was constructed and tested in the following steps:word segmentation,vector construction of word bags,word frequency construction and feature vector construction.Decision tree based on ngrams and RPART algorithm was used for correlation analysis between CT features and surgical methods.ResultsTotally 371 consecutive data of patients were recruited for NLP analysis,including cases of 142 percutaneous nephrolithotripsy (PNL),190 ureteroscopic lithotripsy (URL) and 39 retrograde intrarenal surgery (RIRS).According to NLP,there was correlation between the CT features of quot;calculusquot;,quot;inflammationquot;,and quot;morphology of ureterquot; to the choice of operation method.10-fold cross validation demonstrated that the precision for PNL and URL was 0.730,and area under ROC curve was 0.741.ConclusionIt is feasible to use the natural language processing in the decision-making of operation treatment for urinary calculus.
Natural language processing; Data mining; Urinary calculus; Imaging informatics
100034 北京,北京大學第一醫(yī)院醫(yī)學影像科(劉義、吳靜云、馬帥、王霄英);200233 上海,飛利浦中國研究院(李作峰、施雅慧、李俊博、魏娟)
劉義(1989-),女,河北石家莊人,博士研究生,主要從事影像診斷研究。
王霄英,E-mail: cjr.wangxiaoying@vip.163.com
R814.42; R691.4
A
1000-0313(2017)11-1179-04
10.13609/j.cnki.1000-0313.2017.11.017
2016-11-10)