孫斌,李盈盈,閻琳,肖靜,李欣洋,張明博,羅渝昆*
1.川北醫(yī)學(xué)院,四川 南充 637000;2.解放軍總醫(yī)院第一醫(yī)學(xué)中心超聲診斷科,北京 100853;*通信作者 羅渝昆 lyk301@163.com
甲狀腺癌是最常見的內(nèi)分泌和頭頸部惡性腫瘤[1],近幾十年在世界范圍內(nèi)發(fā)病率持續(xù)升高[2],我國發(fā)病率也同樣逐年升高,并且這一趨勢(shì)將持續(xù)下去[3]。超聲是甲狀腺檢查的首選影像學(xué)方法,高達(dá)68%的成人在甲狀腺超聲檢查中檢測(cè)到甲狀腺結(jié)節(jié)[4],其中約4.5%~10.0%可能是惡性結(jié)節(jié)[5-6],因此每年接受甲狀腺超聲檢查的人數(shù)持續(xù)增多。但甲狀腺超聲圖像判讀很大程度上依賴醫(yī)師的診斷經(jīng)驗(yàn)[7-8]。由于初級(jí)醫(yī)師欠缺經(jīng)驗(yàn),加上甲狀腺良、惡性結(jié)節(jié)的超聲圖像特征存在較多重疊[9-10],可能會(huì)導(dǎo)致漏、誤診。人工智能(artificial intelligence,AI)系統(tǒng)的應(yīng)用不僅提高了超聲醫(yī)師的篩查效率,也提升了初級(jí)醫(yī)師的診斷效能。一項(xiàng)針對(duì)韓國S-Detect和國產(chǎn)ITS100系統(tǒng)的研究發(fā)現(xiàn),初級(jí)醫(yī)師使用AI系統(tǒng)后診斷效能得到提升[11-12],且可以減少不必要的穿刺[13]。超聲檢查是掃查和診斷同步進(jìn)行的影像學(xué)檢查方法,醫(yī)師在檢查過程中需要實(shí)時(shí)調(diào)節(jié)儀器參數(shù)。但不同年資醫(yī)師在儀器參數(shù)調(diào)節(jié)能力方面存在一定差距,而超聲參數(shù)調(diào)節(jié)的差異是否會(huì)影響AI系統(tǒng)對(duì)結(jié)節(jié)的檢測(cè)和診斷效能目前鮮有報(bào)道。本研究在不同超聲參數(shù)下,應(yīng)用AI系統(tǒng)(ITS100)對(duì)結(jié)節(jié)進(jìn)行自動(dòng)檢測(cè)和鑒別良惡性,以驗(yàn)證不同超聲參數(shù)是否會(huì)影響AI系統(tǒng)對(duì)甲狀腺結(jié)節(jié)的檢測(cè)和診斷效能。
1.1 研究對(duì)象 前瞻性連續(xù)納入2023年3月30日—5月1日在解放軍總醫(yī)院第一醫(yī)學(xué)中心外科接受手術(shù)治療的甲狀腺結(jié)節(jié)患者147例,共289枚甲狀腺結(jié)節(jié),其中男35例,女112例,年齡20~73歲,平均(45.6±11.3)歲。結(jié)節(jié)最大徑0.3~5.4 cm,平均(1.06±0.97)cm。納入標(biāo)準(zhǔn):①術(shù)前診斷為甲狀腺結(jié)節(jié)并有手術(shù)指征;②術(shù)后病理證實(shí)結(jié)節(jié)良惡性;③術(shù)前1周內(nèi)完成超聲圖像采集。排除標(biāo)準(zhǔn):①患其他惡性腫瘤;②有甲狀腺手術(shù)史或頸部放療史;③臨床或病理資料不完整。本研究獲得本院倫理委員會(huì)批準(zhǔn)(S2022-526-02),患者或家屬在檢查前均已簽署知情同意書。
1.2 儀器與方法 采用飛利浦EPIQElite超聲診斷儀,L18-4高頻線陣探頭。AI系統(tǒng)為脈得智能科技公司的ITS100型超聲影像智能系統(tǒng)(V1.2),包括主機(jī)和AI輔助顯示屏。該系統(tǒng)為實(shí)時(shí)動(dòng)態(tài)AI系統(tǒng),運(yùn)用深度學(xué)習(xí)技術(shù),并基于卷積神經(jīng)網(wǎng)絡(luò)建立甲狀腺結(jié)節(jié)檢測(cè)與診斷模型,能夠?qū)崟r(shí)自動(dòng)地用方框檢測(cè)標(biāo)記可疑結(jié)節(jié),當(dāng)預(yù)測(cè)結(jié)節(jié)為惡性時(shí)方框顯示紅色,良性時(shí)方框?yàn)榫G色,并在方框旁顯示百分比表示預(yù)測(cè)的可能性大小。
1.3 圖像分析 由1名具有12年甲狀腺超聲診斷經(jīng)驗(yàn)并已接受AI設(shè)備系統(tǒng)培訓(xùn)的醫(yī)師進(jìn)行數(shù)據(jù)采集,在患者手術(shù)前1周內(nèi)完成。所有患者均行甲狀腺超聲檢查,并采集甲狀腺結(jié)節(jié)大小、形態(tài)、回聲、邊界、鈣化、縱橫比等超聲圖像特征。檢查時(shí)首先根據(jù)患者甲狀腺以及脂肪、肌肉等周圍組織情況,適當(dāng)調(diào)節(jié)超聲儀的增益、深度等參數(shù);使甲狀腺超聲圖像顯示效果達(dá)到最佳,此時(shí)超聲儀的增益、深度等各項(xiàng)參數(shù)的數(shù)值定義為標(biāo)準(zhǔn)參數(shù),然后分別掃查甲狀腺的橫切面和縱切面,發(fā)現(xiàn)結(jié)節(jié)后記錄基本特征,同時(shí)AI系統(tǒng)實(shí)時(shí)自動(dòng)檢測(cè)和診斷結(jié)節(jié),分別記錄AI系統(tǒng)對(duì)結(jié)節(jié)橫切面、縱切面最大徑檢測(cè)以及良惡性診斷結(jié)果。然后分別單獨(dú)調(diào)節(jié)增益、深度和放大等參數(shù),調(diào)節(jié)其中1個(gè)參數(shù)時(shí),其他參數(shù)保持標(biāo)準(zhǔn)參數(shù)設(shè)定。調(diào)節(jié)完參數(shù)后,用同樣步驟分別進(jìn)行橫切面和縱切面動(dòng)態(tài)掃查,并記錄AI系統(tǒng)對(duì)結(jié)節(jié)的檢測(cè)和診斷結(jié)果。
超聲參數(shù)的高、低增益調(diào)節(jié)范圍為標(biāo)準(zhǔn)參數(shù)上分別增加或減少15%左右,高、低深度調(diào)節(jié)范圍為增加2.0 cm或減少1.0 cm。放大為在其他圖像參數(shù)不變的前提下,將圖像放大1.4倍。本研究選用的參數(shù)調(diào)節(jié)范圍參考低年資醫(yī)師與高年資醫(yī)師使用本臺(tái)儀器進(jìn)行甲狀腺超聲檢查時(shí),相同患者甲狀腺圖像的參數(shù)調(diào)節(jié)范圍的差異,并結(jié)合甲狀腺超聲檢查中實(shí)際參數(shù)進(jìn)行設(shè)定,是真實(shí)臨床中低年資醫(yī)師可能會(huì)出現(xiàn)的參數(shù)設(shè)置范圍。
根據(jù)AI系統(tǒng)進(jìn)行圖像判讀,結(jié)節(jié)橫切面、縱切面均判斷為良性時(shí)定義為良性,結(jié)節(jié)橫切面、縱切面任意1個(gè)切面判斷為惡性時(shí)定義為惡性。當(dāng)結(jié)節(jié)僅有1個(gè)切面被AI系統(tǒng)準(zhǔn)確檢測(cè)時(shí),該切面的判讀結(jié)果即作為結(jié)節(jié)的良惡性診斷結(jié)果?;颊呤中g(shù)后,以病理結(jié)果為“金標(biāo)準(zhǔn)”,將AI系統(tǒng)的判讀結(jié)果與相對(duì)應(yīng)結(jié)節(jié)的病理結(jié)果進(jìn)行對(duì)照,判斷AI系統(tǒng)的診斷效能。同時(shí)記錄AI系統(tǒng)檢測(cè)定位結(jié)節(jié)的準(zhǔn)確性,當(dāng)檢測(cè)方框在橫切面、縱切面均能準(zhǔn)確標(biāo)記結(jié)節(jié)位置時(shí)定義為檢測(cè)準(zhǔn)確,方框在橫切面、縱切面任1個(gè)切面未能準(zhǔn)確標(biāo)記結(jié)節(jié)位置時(shí)為檢測(cè)不準(zhǔn)確。檢測(cè)準(zhǔn)確是檢測(cè)框與結(jié)節(jié)完全匹配或方框與結(jié)節(jié)基本匹配(方框不匹配的輪廓占結(jié)節(jié)整個(gè)輪廓30%以下),檢測(cè)不準(zhǔn)確指方框不匹配輪廓占結(jié)節(jié)輪廓>30%,或結(jié)節(jié)周圍未顯示檢測(cè)框[14-15](圖1)。
圖1 甲狀腺結(jié)節(jié)的識(shí)別。A.右葉上極低回聲結(jié)節(jié),縱切面AI系統(tǒng)準(zhǔn)確檢測(cè)結(jié)節(jié);B.橫切面結(jié)節(jié)周圍甲狀腺組織較少,AI系統(tǒng)未能檢測(cè)結(jié)節(jié)(A、B為相同結(jié)節(jié));C.甲狀腺右葉2個(gè)低回聲結(jié)節(jié);D.AI系統(tǒng)將2個(gè)結(jié)節(jié)錯(cuò)誤檢測(cè)為1個(gè)結(jié)節(jié)(C、D為相同結(jié)節(jié))
1.4 統(tǒng)計(jì)學(xué)方法 采用SPSS 25.0和MedCalc 20.2軟件,計(jì)量資料以±s表示,計(jì)數(shù)資料以例數(shù)表示;以術(shù)后病理結(jié)果為“金標(biāo)準(zhǔn)”,分別計(jì)算各超聲參數(shù)調(diào)節(jié)下系統(tǒng)對(duì)甲狀腺結(jié)節(jié)的敏感度、特異度、準(zhǔn)確度和檢測(cè)準(zhǔn)確度,采用χ2檢驗(yàn)比較標(biāo)準(zhǔn)參數(shù)與其他各參數(shù)的差異。繪制各參數(shù)的受試者工作特征(ROC)曲線,計(jì)算曲線下面積(AUC),各參數(shù)AUC比較采用Delong檢驗(yàn),P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
2.1 結(jié)節(jié)病理結(jié)果 289枚結(jié)節(jié)中,術(shù)后病理結(jié)果提示惡性結(jié)節(jié)188枚,其中甲狀腺乳頭狀癌187枚,濾泡癌1枚;良性結(jié)節(jié)101枚,其中結(jié)節(jié)性甲狀腺腫64枚,濾泡性腺瘤21枚,炎性結(jié)節(jié)13枚,濾泡結(jié)節(jié)性病變3枚。
2.2 不同參數(shù)下AI系統(tǒng)識(shí)別準(zhǔn)確度分析 289枚結(jié)節(jié)中,4枚結(jié)節(jié)在各參數(shù)下橫切面、縱切面均未被AI成功檢測(cè)。其余結(jié)節(jié)在橫切面、縱切面上至少有1個(gè)切面被AI檢測(cè)。最終各參數(shù)調(diào)節(jié)下AI系統(tǒng)檢測(cè)準(zhǔn)確度分別為94.1%(標(biāo)準(zhǔn))、89.2%(低增益)、88.2%(高增益)、93.0%(高深度)、92.3%(低深度)、91.0%(放大)。與標(biāo)準(zhǔn)參數(shù)相比,高增益(χ2=6.215,P=0.013)和低增益(χ2=4.453,P=0.035)參數(shù)下的檢測(cè)準(zhǔn)確度降低,差異有統(tǒng)計(jì)學(xué)意義。
2.3 不同參數(shù)下AI系統(tǒng)診斷效能分析 AI系統(tǒng)在標(biāo)準(zhǔn)參數(shù)下診斷甲狀腺結(jié)節(jié)良惡性的敏感度為90.9%,特異度為79.6%,準(zhǔn)確度為86.6%,與標(biāo)準(zhǔn)參數(shù)下對(duì)比,低增益條件下的特異度(χ2=4.620,P=0.032)和準(zhǔn)確度(χ2=7.521,P=0.006)、高增益下敏感度(χ2=6.170,P=0.013)和準(zhǔn)確度(χ2=4.127,P=0.042)、高深度下準(zhǔn)確度(χ2=5.011,P=0.025)均降低,差異有統(tǒng)計(jì)學(xué)意義(表1)。將各參數(shù)下診斷效能繪制ROC曲線,與標(biāo)準(zhǔn)條件下相比,低增益(Z=3.102,P=0.001)、高增益(Z=2.152,P=0.031)、高深度(Z=2.420,P=0.015)參數(shù)條件下AUC差異有統(tǒng)計(jì)學(xué)意義。
表1 不同超聲參數(shù)下AI系統(tǒng)診斷效能比較
2.4 不同特征結(jié)節(jié)AI的檢測(cè)及診斷準(zhǔn)確度分析 結(jié)節(jié)在是否有鈣化、低回聲、邊界清楚、形態(tài)規(guī)則、縱橫比>1以及結(jié)節(jié)大小是否≤1 cm等特征下結(jié)節(jié)檢測(cè)準(zhǔn)確度和診斷準(zhǔn)確度差異均無統(tǒng)計(jì)學(xué)意義(P>0.05,表2、圖2)。
表2 不同結(jié)節(jié)特征下動(dòng)態(tài)AI診斷準(zhǔn)確度和檢測(cè)準(zhǔn)確度比較
圖2 不同超聲參數(shù)下AI系統(tǒng)診斷差異。A.標(biāo)準(zhǔn)參數(shù)下AI診斷結(jié)節(jié)為惡性;B.同一結(jié)節(jié)高增益條件下AI診斷為良性;C.術(shù)后病理結(jié)果提示結(jié)節(jié)為甲狀腺乳頭狀癌(HE,×400);D.標(biāo)準(zhǔn)參數(shù)下AI診斷結(jié)節(jié)為惡性;E.同一結(jié)節(jié)高深度條件下AI診斷為良性;F.術(shù)后病理結(jié)果提示結(jié)節(jié)為甲狀腺乳頭狀癌(HE,×400)
隨著甲狀腺AI系統(tǒng)不斷研究和發(fā)展,多種AI系統(tǒng)已逐漸應(yīng)用于臨床工作,與其他診斷技術(shù)相比,AI系統(tǒng)耗時(shí)短、成本低、無創(chuàng)。AI系統(tǒng)與醫(yī)師相比誤診率較低[16],其診斷效能明顯優(yōu)于初級(jí)醫(yī)師,甚至與高年資醫(yī)師的診斷效能相當(dāng)[12,17],但是不同年資醫(yī)師間診斷能力存在一定差異,調(diào)節(jié)儀器參數(shù)的能力也存在差異。本研究納入包括增益、深度、放大等甲狀腺檢查中最常調(diào)節(jié)的參數(shù),分析這些超聲參數(shù)的調(diào)節(jié)對(duì)AI系統(tǒng)檢測(cè)和診斷結(jié)節(jié)的影響。
增益是將組織返回到換能器的超聲信號(hào)進(jìn)行放大[18],不恰當(dāng)?shù)卣{(diào)節(jié)可能會(huì)失去細(xì)節(jié)或產(chǎn)生偽像。Lefebvre等[19]針對(duì)乳腺的超聲研究發(fā)現(xiàn),總增益的變化會(huì)導(dǎo)致紋理特征的變化,影響對(duì)乳腺結(jié)節(jié)良惡性的診斷。本研究發(fā)現(xiàn),過高或過低的增益會(huì)影響AI系統(tǒng)的診斷準(zhǔn)確度,其原因可能是較高的增益使一些低回聲結(jié)節(jié)回聲增強(qiáng),導(dǎo)致AI系統(tǒng)判斷為良性。相反,較低的增益會(huì)使結(jié)節(jié)回聲減低,而低回聲結(jié)節(jié)容易被AI系統(tǒng)判斷為惡性。本研究也分析了深度對(duì)AI系統(tǒng)的影響,Girts等[20]針對(duì)骨骼肌的研究發(fā)現(xiàn),圖像中包含的組織會(huì)隨深度增加而增多,從而影響感興趣區(qū)的分辨率,導(dǎo)致圖像質(zhì)量相對(duì)降低。本研究發(fā)現(xiàn)較高的深度調(diào)節(jié)也會(huì)降低AI系統(tǒng)的診斷準(zhǔn)確度,其原因可能是較高的深度降低了結(jié)節(jié)的分辨率,影響了AI系統(tǒng)的判斷。
本研究同時(shí)驗(yàn)證了AI的檢測(cè)準(zhǔn)確度。張惠茅等[21]針對(duì)AI的問卷調(diào)查中,醫(yī)師對(duì)AI系統(tǒng)最期待的作用是輔助檢測(cè)和發(fā)現(xiàn)疾病。本研究發(fā)現(xiàn),標(biāo)準(zhǔn)參數(shù)下,AI的檢測(cè)能力較強(qiáng)。但較高或較低的增益均會(huì)影響AI對(duì)結(jié)節(jié)的檢測(cè),這可能因?yàn)檩^高或較低的增益會(huì)導(dǎo)致部分結(jié)節(jié)與周圍甲狀腺背景的差異相對(duì)縮小,導(dǎo)致檢測(cè)準(zhǔn)確度降低。
本研究發(fā)現(xiàn),AI系統(tǒng)對(duì)結(jié)節(jié)是否有鈣化、低回聲、邊界清楚、形態(tài)規(guī)則、縱橫比等特征均有較好的檢測(cè)和診斷穩(wěn)定性,與既往研究結(jié)果[22]類似。在臨床工作中,因?yàn)檩^小結(jié)節(jié)的惡性超聲特征尚未完全表現(xiàn)出來,有時(shí)會(huì)對(duì)醫(yī)師的診斷產(chǎn)生干擾。但本研究中AI系統(tǒng)對(duì)大小>1 cm或≤1 cm的結(jié)節(jié)檢測(cè)準(zhǔn)確度和診斷準(zhǔn)確度均無顯著差異。李盈盈等[23]研究表明,AI系統(tǒng)聯(lián)合常規(guī)超聲可以提高低年資醫(yī)師對(duì)大小≤1 cm甲狀腺影像報(bào)告和數(shù)據(jù)系統(tǒng)4類甲狀腺結(jié)節(jié)良惡性的診斷效能。李曉宇等[24]及趙雯婷等[25]研究表明,AI系統(tǒng)聯(lián)合超聲造影或聯(lián)合彈性成像同樣可以提高醫(yī)師對(duì)甲狀腺結(jié)節(jié)良惡性的診斷效能。
本研究的局限性:納入的研究對(duì)象均為手術(shù)患者,手術(shù)前患者大多經(jīng)過超聲造影、甲狀腺細(xì)針穿刺活檢,導(dǎo)致未納入一些炎性病變、僵尸結(jié)節(jié)等超聲圖像有惡性征象的良性結(jié)節(jié),惡性結(jié)節(jié)占比較高,研究對(duì)象選擇有一定偏移。本研究為單中心研究,單機(jī)器,缺乏多中心、多型號(hào)機(jī)器及大樣本數(shù)據(jù),未來可能會(huì)增加多中心、多機(jī)型的數(shù)據(jù)進(jìn)一步研究。
總之,AI系統(tǒng)在標(biāo)準(zhǔn)參數(shù)下,其檢測(cè)準(zhǔn)確度和診斷效能較高,可以提高醫(yī)師的篩查效率和準(zhǔn)確度。但當(dāng)增益、深度調(diào)節(jié)不準(zhǔn)確時(shí),會(huì)使AI系統(tǒng)的檢測(cè)和診斷準(zhǔn)確度受到一定影響。標(biāo)準(zhǔn)超聲參數(shù)的調(diào)節(jié),需要醫(yī)師根據(jù)患者頸部脂肪層、肌肉和甲狀腺組織等不同的條件做出不同調(diào)整,獲得最佳圖像,從而使AI發(fā)揮最大效能。同時(shí),AI系統(tǒng)軟件的不斷更新迭代,可以進(jìn)一步增強(qiáng)系統(tǒng)的魯棒性和泛化性,使其更好地應(yīng)用于各級(jí)醫(yī)療機(jī)構(gòu)和各年資醫(yī)師,為更多患者服務(wù)。