梁 羽 ,岳林先,曹文斌,王 娟,游勤霞,王亞萍,楊 磊,陳 琴△
(1.四川省人民醫(yī)院超聲科,成都 610072;2.四川省成都市第三人民醫(yī)院超聲科 610031;3.四川省成都市第一人民醫(yī)院超聲科 610000)
近年來甲狀腺疾病發(fā)病率呈現(xiàn)快速上升的趨勢,其中甲狀腺結節(jié)患病率最高約占1/5,人群中甲狀腺癌的粗略發(fā)生率約7.56/10萬,在中國全部癌癥中排名第七[1-2]。甲狀腺結節(jié)影像報告和數(shù)據(jù)系統(tǒng)(thyroid imaging of reporting and data system,TI-RADS)在臨床中廣泛應用,但由于超聲醫(yī)師的經(jīng)驗和超聲設備性能造成診斷的不確定性,導致不同地區(qū)間、醫(yī)院之間和醫(yī)師之間超聲結果差異較大,帶給患者和臨床醫(yī)師很大困惑。近幾年,人工智能在醫(yī)學影像領域的迅速興起,尤其人工智能在甲狀腺結節(jié)的輔助診斷上已呈顯優(yōu)勢,對于降低超聲結果差異有很大幫助。目前人工智能報道大都是單中心回顧性研究,為減小選擇性偏倚,本研究同期納入3家醫(yī)院的不同醫(yī)師和不同設備,以Kwak和ACR TI-RADS分類為標準,采用人工智能安克偵計算機輔助診斷(computer-aided diagnosis,CAD)系統(tǒng),比較超聲醫(yī)師與該人工智能系統(tǒng)對甲狀腺結節(jié)診斷的效能,現(xiàn)報道如下。
于2019年11月初對成都地區(qū)3家三甲醫(yī)院超聲醫(yī)師統(tǒng)一進行Kwak TI-RADS分類[3-4]及ACR TI-RADS分類[5]標準培訓,規(guī)范甲狀腺超聲操作及數(shù)據(jù)收集流程。隨后,選取2019年11月至2020年1月該3家醫(yī)院的經(jīng)過細針穿刺活檢或手術病理確診的甲狀腺疾病患者為研究對象,最終納入252個甲狀腺結節(jié),每個結節(jié)留存縱、橫切面圖各1幅,記錄當時醫(yī)師超聲報告的TI-RADS分類,最后由安克偵CAD系統(tǒng)集中時間盲法讀圖并出具TI-RADS分類報告。
1.2.1甲狀腺結節(jié)超聲圖像數(shù)據(jù)庫建立
甲狀腺結節(jié)超聲圖像納入標準:(1)甲狀腺結節(jié)均有穿刺或手術病理結果者;(2)甲狀腺結節(jié)最大直徑小于60mm;(3)超聲圖像必須包含整個結節(jié),圖像清晰,結節(jié)清楚;(4)具有標準的縱、橫切面二維超聲圖;(5)超聲圖像中無血流信號、測量數(shù)據(jù)、彈性和造影信息;(6)超聲圖像中應包括甲狀腺前方肌肉回聲信息。排除標準:(1)甲狀腺結節(jié)無穿刺和手術病理結果者;(2)有穿刺結果而缺乏超聲圖像者;(3)有超聲報告無原始圖像者;(4)圖中結節(jié)包括不完整者。最終建立252個甲狀腺結節(jié)的504張標準圖像數(shù)據(jù)庫。
1.2.2甲狀腺結節(jié)圖像分析
(1)甲狀腺結節(jié)分類標準:按照Kwak及ACR TI-RADS分類標準執(zhí)行。(2)人工智能安克偵CAD分類原理(圖1):核心算法采用經(jīng)典機器學習算法,其分析參數(shù)建立在診斷甲狀腺結節(jié)良惡性的主要超聲特征的基礎之上,與Kwak及ACR TI-RADS分類采用的超聲特征基本一致,主要包括:實性低回聲、形態(tài)不規(guī)則、邊緣模糊、縱橫比大于1、微鈣化。
A:原始甲狀腺超聲影像;B:安克偵自動分析甲狀腺結節(jié)超聲影像特征,可量化和彩色視覺化各項特征指標;C:根據(jù)影像特征加以量化數(shù)據(jù)分析,并提示惡性風險評估;D:自動生成提示腫瘤良惡性的數(shù)字化診斷報告。
1.2.3甲狀腺超聲TI-RADS分類報告統(tǒng)計分析
研究分成低年資超聲醫(yī)師和安克偵CAD,比較兩者TI-RADS分類診斷效能。
252個甲狀腺結節(jié)中女207例(82.1%),男45例(17.9%),女∶男為4.6∶1,年齡22~79歲,平均(43.8±12.4)歲,結節(jié)最大直徑4~60 mm,平均(13.6±9.1)mm。在病理類型上,143(56.7%)個良性結節(jié),109(43.3%)個惡性結節(jié),其中乳頭狀癌98個(38.9%),濾泡狀癌10個(3.9%),髓樣癌1個(0.4%),結節(jié)性甲狀腺腫113個(44.8%),腺瘤10個(4.0%),炎性病變20個(7.9%)。
與低年資超聲醫(yī)師比較,安克偵CAD各TI-RADS分類的惡性百分比更符合Kwak或ACR TI-RADS分類規(guī)定的惡性風險,見表1。
與低年資超聲醫(yī)師比較,安克偵CAD對Kwak或ACR TI-RADS分類的診斷的曲線下面積(AUC)更高,差異有統(tǒng)計學意義(P<0.05),見表2。
表1 不同診斷模式運用Kwak和ACR TI-RADS分類法與甲狀腺結節(jié)病理結果的符合度
表2 不同診斷模式對甲狀腺結節(jié)TI-RADS分類的診斷價值
一致性檢測結果顯示,按臨床最佳診斷節(jié)點標準(4B類、4類),安克偵CAD(Kappa值=0.72)優(yōu)于低年資超聲醫(yī)師(Kappa值=0.39);按統(tǒng)計學最佳診斷節(jié)點標準(4B類或4C類,5類),安克偵CAD(Kappa值=0.87)同樣優(yōu)于低年資超聲醫(yī)師(Kappa值=0.53),見圖2。
圖2 不同診斷模式下Kwak或ACR TI-RADS分類的ROC曲線比較
甲狀腺人工智能研究主要是通過傳統(tǒng)機械學習和深度學習兩個途徑來實現(xiàn),兩種研究途徑最終目的都是達到對甲狀腺結節(jié)TI-RADS分類或結節(jié)良惡性的智能診斷,已經(jīng)在我國部分醫(yī)院進入臨床應用階段的計算機輔助系統(tǒng)主要是安克偵CAD,其主要功能是對甲狀腺結節(jié)進行智能TI-RADS分類,輔助超聲醫(yī)師診斷[6]。在多次甲狀腺人機讀片大賽或臨床應用研究上,計算機輔助診斷系統(tǒng)在短時間內診斷甲狀腺結節(jié)良惡性的準確率基本可以媲美專業(yè)甲狀腺超聲醫(yī)師[7-8],部分研究團隊結果甚至超越專業(yè)甲狀腺超聲醫(yī)師,表現(xiàn)出巨大臨床應用潛力[9-10]。
本研究結果表明:安克偵CAD各TI-RADS分類的惡性百分比更符合診斷標準規(guī)定的惡性風險,而低年資超聲醫(yī)師在Kwak TI-RADS分類法4A類惡性百分比(36.8%)遠高于規(guī)定的惡性風險(5%~10%),在ACR TI-RADS分類法3類惡性百分比(42.1%)遠高于規(guī)定的惡性風險(≤5%),說明安克偵CAD診斷更符合TI-RADS分類診斷標準。同時,安克偵CAD對甲狀腺TI-RADS分類的診斷效能的ROC曲線面積全面優(yōu)于低年資超聲醫(yī)師,在最優(yōu)診斷節(jié)點下對甲狀腺TI-RADS分類的靈敏度、特異度及準確性優(yōu)于低年資超聲醫(yī)師,顯示出一定的臨床應用價值。且安克偵CAD還科學驗證了甲狀腺Kwak與ACR TI-RADS分類法診斷效能基本一致,兩種TI-RADS分類方法的一致性Kappa值高達0.87,高于低年資超聲醫(yī)師Kappa值0.53,說明安克偵CAD能消除低年資超聲醫(yī)師主觀因素的干擾誤判,選擇任意一種TI-RADS分類法都能達到甲狀腺結節(jié)準確診斷。
實際上,1家醫(yī)院一般傾向選擇應用一種TI-RADS分類法,超聲醫(yī)師對一種TI-RADS分類法比較熟悉,掌握應用也比較熟練、準確。目前國內大部分醫(yī)院甲狀腺超聲醫(yī)師[11-12]更傾向選擇類似乳腺BI-RADS分類的Kwak TI-RADS分類法,對ACR TI-RADS分類法掌握及臨床應用不及Kwak TI-RADS分類法,而安克偵CAD一次超聲診斷就能高效、準確地提供多種TI-RADS分類結果供臨床選擇,可以輔助超聲醫(yī)師對不同TI-RADS分類更精確診斷,具有潛在的臨床應用優(yōu)勢。
此外,甲狀腺計算機輔助診斷的臨床應用也面臨諸多挑戰(zhàn)。(1)在臨床實際運用中不同醫(yī)院、不同醫(yī)師雖然對TI-RADS分類臨床最佳節(jié)點選擇存有爭議[13-14],但普遍接受Kwak TI-RADS 4B類及ACR TI-RADS 4類作為臨床最佳診斷節(jié)點[11]。本研究中,安克偵CAD最佳診斷節(jié)點Kwak TI-RADS 4C類及ACR TI-RADS 5類,高于臨床實際應用的診斷節(jié)點,說明安克偵CAD傾向提高結節(jié)的TI-RADS分類級別,臨床實際應用就會造成部分結節(jié)因TI-RADS分類升高、惡性風險增加而選擇穿刺活檢或手術治療,易造成甲狀腺結節(jié)過度診療,不能使患者受益。(2)許多研究表明臨床醫(yī)師即使將ACR TI-RADS 5類作為臨床診斷節(jié)點,也還需要結合患者的臨床病史及實際情況,并不會貿然建議患者穿刺活檢或手術治療[14-15]。(3)計算機輔助診斷所必要的超聲標準圖像受限于超聲醫(yī)師、超聲儀器的主客觀影響,不能智能診斷所有甲狀腺圖像,對于甲狀腺結節(jié)過小或者過大在圖像勾畫上都會存有診斷誤差,影響智能診斷[16]。
綜上所述,安克偵CAD診斷甲狀腺結節(jié)TI-RADS分類的一致性及診斷效能整體優(yōu)于低年資超聲醫(yī)師,可以輔助低年資超聲醫(yī)師提高甲狀腺TI-RADS分類的準確性和一致性,減少依靠主觀經(jīng)驗而造成的診斷誤判,具有一定的臨床應用價值,但不能完全取代超聲醫(yī)師的臨床診斷,超聲醫(yī)師結合CAD的人機結合診斷可能才是符合臨床實際需求的診斷方式。