南京醫(yī)科大學第一附屬醫(yī)院超聲醫(yī)學科,江蘇 南京 210029
流行病學調查顯示,甲狀腺癌的發(fā)病率逐年增高[1-2]。目前判別甲狀腺結節(jié)良惡性的首選影像學手段是超聲檢查。通過常規(guī)超聲觀察結節(jié)特征,依據(jù)甲狀腺影像報告與數(shù)據(jù)系統(tǒng)(Thyroid Imaging Reporting and Data System,TIRADS),用分級的方式評價甲狀腺結節(jié)惡性風險程度。絕大多數(shù)(82%~91%)的甲狀腺癌是實性結節(jié)。隨著結節(jié)內囊性成分的增加,其惡性率也在下降。在以囊性為主的甲狀腺結節(jié)(囊性成分>50%)中惡性率只有3%[3]。而以實性為主的甲狀腺結節(jié),尤其是微囊性結節(jié),其惡性率仍不可忽視[4]。甲狀腺癌在進展過程中如發(fā)生出血、壞死亦可以形成囊腔,結節(jié)性甲狀腺腫在生長較快時亦可出現(xiàn)出血、壞死,超聲檢查時均可表現(xiàn)為囊實性結節(jié)[5]。因此在臨床工作中對于囊實性甲狀腺結節(jié)的良惡性仍需仔細甄別。本研究通過提取以實性為主的甲狀腺結節(jié)(囊性成分<50%)超聲特征,利用Spearman相關性分析及逐步回歸分析方法(Stepwise)對結節(jié)特征變量進行篩選,結合偏最小二乘-判別分析法(partial least squares-discriminant analysis,PLS-DA)和logistic回歸分析方法構建甲狀腺結節(jié)良惡性風險預估模型,并對以實性為主的結節(jié)良惡性進行預測分析。
收集2018年1月—12月在南京醫(yī)科大學第一附屬醫(yī)院就診的甲狀腺結節(jié)患者,選取其中聲像圖資料完整且圖像質量較高的患者進行回顧性分析,入組患者共97例,其中女性71例,男性26例,年齡16~79歲,平均年齡(41.9±10.5)歲,共97個結節(jié)納入統(tǒng)計,病理學檢查結果中良性40個,惡性57個。40個良性結節(jié)均經(jīng)細胞學檢查證實為良性濾泡結節(jié),同時有BRAF基因V600E突變檢測為野生型。57個惡性結節(jié)中,16個結節(jié)經(jīng)細胞學檢查證實為可疑乳頭狀癌,同時BRAF基因V600E突變檢測為突變型;41個結節(jié)經(jīng)手術后病理學檢查為1個濾泡癌和40個甲狀腺乳頭狀癌。
納入標準:患者有甲狀腺結節(jié),且結節(jié)以內部結構實性為主;超聲圖像清晰,患者病史信息完善;經(jīng)手術后病理學檢查或細胞學檢查證實為乳頭狀癌及良性濾泡結節(jié)。排除標準:既往行消融、硬化治療等介入治療術;2名醫(yī)師對結節(jié)相關超聲圖像特征存在爭議;細針抽吸活組織檢查(fine needle aspiration biopsy,F(xiàn)NAB)結果為無法診斷或不滿意、非典型病變/意義不明的濾泡性病變、濾泡性腫瘤或可疑濾泡性腫瘤、可疑惡性腫瘤。
使用荷蘭Philips公司的EPIQ5超聲診斷儀、德國Simens公司的Acuson S3000超聲診斷儀,線陣探頭頻率為7~12 MHz。調節(jié)超聲診斷儀(模式、深度、焦點、增益等),使圖像顯像至最佳效果;囑患者放松,保持仰臥位,頸部輕度后仰,充分暴露頸部。將探頭置于頸前正中,甲狀腺軟骨的下方,行橫向及縱向多切面掃查,每側葉掃查至甲狀腺包膜消失,觀察結節(jié)特征并評估頸部淋巴結情況;
依據(jù)韓國甲狀腺放射學會(Korean Society of Thyroid Radiology,KSThR)甲狀腺結節(jié)TIRADS分級[6],在選取性別、年齡、甲狀腺整體回聲、結節(jié)形態(tài)、結節(jié)邊緣、內部回聲、強回聲、縱橫比、血流模式的基礎上,對結節(jié)內囊性成分是否擴散、囊性成分是否偏心位、實性部分回聲是否均勻等結節(jié)超聲特征進行分析。在評估過程中為了達到評判的規(guī)范性,對以上征象進行分類[7]。在不知病理學檢查結果和患者臨床資料前提下,由2名高年資超聲醫(yī)師分別分析每個結節(jié)的同一典型圖像,依據(jù)TI-RADS分級各自描述記錄每個結節(jié)的描述詞和分類,描述不一致者予以刪除。
變量賦值:因變量(Y)為結節(jié)的病理學診斷結果(良性=0、惡性=1),此外,將患者性別、年齡、甲狀腺整體回聲、形態(tài)、邊緣、囊性成分分布、囊性成分位置、結節(jié)內實性部分回聲、實性部分回聲是否均勻、強回聲、縱橫比、血管模式、病灶數(shù)目等11個超聲特征作為待篩選的自變量(X),具體賦值情況詳見表1[7,12]。
表1 甲狀腺超聲特征變量賦值
本研究首先利用Spearman相關性分析對實性為主甲狀腺結節(jié)特征變量進行分析,并利用逐步回歸分析方法(Stepwise)對特征變量進行篩選,然后基于PLS-DA和logistic回歸分析方法建立結節(jié)良惡性判別模型,并進行預測分析。在數(shù)據(jù)分析過程中,采用蒙特卡羅模擬方法隨機將97個結節(jié)樣本分為訓練集和預測集,其80%結節(jié)樣本為訓練集,20%結節(jié)樣本為預測集。因此,訓練集包括46個癌癥結節(jié)樣本、33個非癌癥結節(jié)樣本,預測集中包括11個癌癥結節(jié)樣本、7個非癌癥結節(jié)樣本?;陬A測集樣本分析結果繪制受試者工作特征(receiver operating characteristic,ROC)曲線,計算ROC曲線的曲線下面積(area under curve,AUC)。為了驗證方法的準確性及穩(wěn)定性,利用蒙特卡羅模擬隨機運行1 000次,并采用t檢驗對兩個方法的AUC值進行比較。PLS-DA及l(fā)ogistic回歸分析方法程序基于MATLAB軟件編寫,t檢驗基于SPSS軟件分析。
超聲是評價甲狀腺結節(jié)良惡性的重要影像學手段,其中以實性為主的甲狀腺結節(jié)良惡性判別研究為其難點之一。圖1為2個囊實性結節(jié),1個為單發(fā)結節(jié)(圖1A~C),該結節(jié)實性部分呈極低回聲,周邊內可見點狀強回聲,囊性成分分布偏心、局限,結節(jié)周邊可見點條狀血流信號,結節(jié)內實性部分血流信號不豐富;術后病理學檢查證實該結節(jié)為甲狀腺乳頭狀癌,癌組織累犯背膜;BRAF基因第15號外顯子突變。另1個結節(jié)為多發(fā)結節(jié)(圖1D、E),該結節(jié)內部結構以實性為主,結節(jié)實性成分為低回聲,內可見粗大強回聲,囊性成分散在分布,結節(jié)周邊及實性部分血流稍豐富;細胞學病理診斷結果顯示為良性濾泡結節(jié),伴較多吞噬細胞;BRAF基因V600E突變檢測為野生型。這2個結節(jié)如不加以仔細甄別,經(jīng)驗不豐富的青年醫(yī)師很容易誤診。
圖1 以實性為主的甲狀腺結節(jié)超聲聲像圖
本研究首先對97例以實性為主的甲狀腺結節(jié)的良惡性指標進行Spearman相關性分析。結果表明:與以實性為主的甲狀腺結節(jié)良惡性顯著相關且相關系數(shù)絕對值大于0.5的變量包括囊性是否偏心(r=0.519,P<0.01)、強回聲(r=0.695,P<0.01)、邊緣(r=0.618,P<0.01)、形態(tài)(r=0.551,P<0.01)以及囊性成分分布(r=0.630,P<0.01);而性別(r=-0.223,P<0.05)、年齡(r=-0.177,P<0.05)、實性部分回聲是否均勻(r=0.337,P<0.05)、血流(r=0.230,P<0.05)、病灶數(shù)目(r=0.210,P<0.05)、縱橫比(r=0.340,P<0.05)也存在顯著相關性,但相關系數(shù)r的絕對值小于0.5,其臨床意義較?。徽w回聲與以實性為主的甲狀腺結節(jié)良惡性指標則沒有顯著相關性。因此,基于Spearman相關性分析篩選變量包括囊性是否偏心、強回聲、邊緣、形態(tài)以及囊性成分分布。此外,我們利用Stepwise方法進行變量篩選,發(fā)現(xiàn)變量年齡[擬合系數(shù)(Coeff)=-0.0044,P<0.05]、強回聲(Coeff=0.1009,P<0.0 1)、邊緣(Coeff=0.1267,P<0.0 1)、縱橫比(Coeff=0.1221,P<0.01)、甲狀腺整體回聲(Coeff=-0.1572,P<0.01)和囊性成分分布(Coeff=0.3489,P<0.01)與以實性為主的甲狀腺結節(jié)良惡性顯著相關。而Spearman相關性分析及Stepwise方法篩選的變量差異較大,為了保證建立的診斷模型準確性和穩(wěn)定性,選擇兩種方法篩選變量的并集用于后續(xù)數(shù)學模型的構建。因此,最終篩選出的8個變量指標,包括年齡[X(2)]、甲狀腺整體回聲[X(3)]、形態(tài)[X(4)]、邊緣[X(5)]、囊性成分分布[X(6)]、囊性成分位置[X(7)]、強回聲[X(10)]以及縱橫比[X(11)]。
PLS-DA作為一種統(tǒng)計學方法,基于最小化誤差平方和,找到一組數(shù)據(jù)最佳匹配函數(shù)建立線性診斷模型。在PLS-DA分析前,先將臨床數(shù)據(jù)構成矩陣,其中行變量為不同結節(jié),列變量為甲狀腺特征變量。在一次計算中,P L S-D A基于訓練集構建模型如下(因子數(shù)N=2):Y=-0.3 5 8×X(2)-0.8 6 4×X(3)+0.7 3 6×X(4)+1.220×X(5)+1.765×X(6)-0.174×X(7)+1.436×X(10)+0.857×X(11)+0.595。此時,PLS-DA分析結果如圖2所示,其中藍色為訓練集,紅色為預測集,Y<0.5的甲狀腺結節(jié)判定為良性,Y>0.5的甲狀腺結節(jié)判定為惡性。97個結節(jié)中,96個結節(jié)均判定正確,只有預測集樣本中第94個惡性結節(jié)的Y<0.5,被錯誤判定為良性結節(jié),而其病理學檢查結果為乳頭狀癌?;陬A測集樣本分析結果繪制ROC曲線(圖3),計算AUC值為0.955,結果比較滿意。
為了驗證方法的準確性及穩(wěn)定性,利用蒙特卡羅模擬隨機運行1 000次,PLS-DA結果如表2所示,訓練集的真陽性、真陰性準確度平均值分別是97.2%和99.8%,而2.8%的癌癥結節(jié)和0.2%的非癌癥結節(jié)被錯誤判定,即存在假陽性和假陰性。預測集中PLS-DA的真陽性和真陰性預測率平均值分別是92.9%和96.6%,此時,AUC均值為0.947,95% CI為0.932~0.963。
圖2 PLS-DA模型訓練集及預測集的散點圖
圖3 基于PLS-DA和logistic回歸分析的ROC曲線
表2 蒙特卡羅模擬運行1 000次PLS-DA分析結果
logistic回歸分析是一種廣義的線性回歸分析模型,是醫(yī)學中最常用的疾病診斷模型。在一次計算中,logistic建立模型如下:logistic(Y)=-9.372×X(2)+1.107×X(3)+1.220×X(4)+0.6 8 9×X(5)-2.2 9 9×X(6)-0.0 2 9×X(7)+3.9 7 2×X(11)-1.798×X(10)+5.251。此時,logistic回歸分析結果如圖4所示,其中Y=0的甲狀腺結節(jié)被判定為良性,Y=1的甲狀腺結節(jié)病理結果被判定為惡性。97個結節(jié)中,95個結節(jié)判定正確,2個結節(jié)判定錯誤。這2個結節(jié)均是預測集樣本:其中第20個樣本為良性結節(jié),而其Y值為1,被誤判為惡性結節(jié);第94個樣本為惡性結節(jié),其Y值為0,被誤判為良性結節(jié)?;陬A測集樣本分析結果繪制ROC曲線(圖3),計算AUC值為0.883。
圖4 logistic回歸模型訓練集及預測集的散點圖
為了驗證方法的準確性及穩(wěn)定性,同樣利用蒙特卡羅模擬隨機運行1 000次,logistic回歸分析結果如表3所示,訓練集的真陽性、真陰性準確度平均值分別是95.9%和96.6%,而4.1%的癌癥結節(jié)和3.4%的非癌癥結節(jié)被錯誤判定。預測集中l(wèi)ogistic回歸分析的真陽性、真陰性預測率平均值分別是92.0%和88.8%,而8.0%的癌癥結節(jié)和11.2%非癌癥結節(jié)被錯誤判定,此時,AUC均值為0.904,95% CI為0.883~0.924。通過t檢驗比較logistic回歸分析和PLS-DA的AUC值,結果表明,PLS-DA的AUC值顯著大于logistic回歸分析的結果(P<0.01)。
表3 蒙特卡羅模擬運行1 000次logistic回歸分析結果
大多數(shù)囊實性甲狀腺結節(jié)是良性結節(jié),然而隨著對甲狀腺研究的深入,人們發(fā)現(xiàn)一部分甲狀腺癌也可伴發(fā)囊性改變[4,8-9]。據(jù)文獻[10]報道,在甲狀腺惡性腫瘤中,實性結節(jié)及微囊性結節(jié)占88%,實性為主甲狀腺結節(jié)約占9%,囊實性甲狀腺結節(jié)容易被臨床低估。因此,以實性為主的惡性結節(jié)除了我們常說的惡性結節(jié)基本特征如患者年齡、甲狀腺整體回聲、有無強回聲、邊緣、形態(tài)、縱橫比,結節(jié)內囊性是否偏心、囊性成分分布是否局限等特征也應引起超聲醫(yī)師的注意。我們希望構建一個較為穩(wěn)健的診斷模型,在難以判斷結節(jié)性質時,可借助于這兩種模型進行綜合判斷[11-12]。
研究結果表明,Spearman相關性分析及逐步回歸分析均顯示腫瘤與發(fā)病年齡呈負相關,即惡性腫瘤發(fā)病年齡較良性小,這可能與青少年甲狀腺乳頭狀癌發(fā)病率升高有關。據(jù)最新的流行病學調查,兒童與青少年分化型甲狀腺癌發(fā)病率顯著增高也許不能完全歸咎于檢查手段敏感性提高與過度治療[13],而肥胖、激素、環(huán)境等因素也是可能的誘因[14-15]。Stepwise逐步回歸分析顯示甲狀腺整體回聲(Coeff=-0.157 2,P<0.01)與以實性為主的甲狀腺結節(jié)良惡性顯著相關,與既往文獻[16-17]報道相符。聲像圖上的結節(jié)內強回聲并非均為微鈣化,除常說的砂粒體外,還有可能是纖維條索、鈣鹽沉積,或是膠體結晶、纖維化、囊內出血[18-20]。臨床工作中除了選用高頻探頭觀察點狀強回聲的形態(tài),觀察點狀強回聲的位置也可以作為輔助判斷方法,如位于囊性成分內,更偏向于膠質凝聚而成;如位于實性成分內,則偏向于微鈣化。當結節(jié)囊性成分呈偏心性,局限性分布、形態(tài)不規(guī)則、邊緣不清晰、縱橫比>1都提示結節(jié)存在惡性風險。結節(jié)內血供情況在本研究中差異無統(tǒng)計學意義,因此我們還是需要在二維圖像的基礎上,綜合多種因素進行分析判斷。
本研究分析結節(jié)超聲特征,利用Spearman相關性分析及 Stepwise分別篩選相關變量,并使用篩選變量的并集用于后續(xù)診斷模型的建立。分別使用logistic回歸分析及PLS-DA用于構建以實性為主的甲狀腺結節(jié)良惡性判別診斷模型,并用于預測分析。PLS-DA真陽性預測值(訓練集97.2%、預測集99.8%)、真陰性預測值(訓練集92.9%、預測集96.6%)及l(fā)ogistic回歸分析真陽性預測值(訓練集95.9%、預測集96.6%)、真陰性預測集(訓練集92.0%、預測集88.8%)均可接受,說明二者都可以用于以實性為主的甲狀腺結節(jié)良惡性判別診斷,但PLS-DA的AUC值(0.947)顯著高于logistic回歸分析(0.904)(P<0.01),說明PLS-DA建立模型的預測能力在一定程度上優(yōu)于logistic回歸分析。
本研究的局限性在于,納入本研究的患者數(shù)(n=97)相對較少。另外,良性結節(jié)的診斷是基于細胞學及BRAF基因V600E突變檢測,而不是術后病理學檢查。因為一般良性結節(jié)在FNAB獲得細胞學檢查結果后并不能確認系手術適應證。今后,將進一步行大樣本多中心研究,驗證并提高模型的準確性。