馮慧俊 朱慧玲 江 峰
多形性腺瘤是腮腺最常見的良性腫瘤,占涎腺腫瘤的60%~70%,其次是腺淋巴瘤[1]。多形性腺瘤的惡性率為2%~25%,單純腫瘤剔除術易復發(fā),臨床常采取根治性切除治療[2]。而腺淋巴瘤不易復發(fā),且尚未發(fā)現(xiàn)惡性變。近年有研究[3]提出對于腮腺深葉的腺淋巴瘤建議行部分切除術,而腮腺淺葉較小的腺淋巴瘤選擇觀察還是手術尚無明確共識。因此,兩者的鑒別對治療方案的選擇及預后至關重要。高頻超聲是目前的首選檢查方法,研究[4]表明高頻超聲診斷多形性腺瘤的準確率為87.5%,診斷腺淋巴瘤的準確率為91.3%,但實際操作中發(fā)現(xiàn)二者聲像圖存在較多重疊,鑒別診斷困難。影像組學可從醫(yī)學圖像中提取人肉眼無法識別的腫瘤紋理特征,構建影像組學模型,這些特征通常提示腫瘤的某些病理特點,對腫瘤的定性診斷有其獨特優(yōu)勢,可以評估腫瘤的多種生物學行為,目前已經應用于腫瘤的鑒別診斷及預后評估[5]。本研究采用支持向量機(SVM)、K 緊鄰(KNN)、決策樹(Decision Tree)3 種機器學習算法根據篩選的最佳特征構建超聲影像組學模型,探討其在鑒別診斷腮腺多形性腺瘤與腺淋巴瘤中的應用價值。
選取2016 年6 月至2021 年9 月我院經術后病理確診的腮腺多形性腺瘤和腺淋巴瘤患者232 例,其中腮腺多形性腺瘤133 例,男51 例,女82 例,年齡11~78 歲,平均(44.0±14.2)歲;病灶最大徑0.8~6.9 cm,平均(2.4±1.0)cm;腺淋巴瘤99 例,男95 例,女4 例,年齡40~81歲,平均(64.0±9.3)歲;病灶最大徑1.2~4.9 cm,平均(3.1±0.9)cm。按7∶3 的比例分為訓練集162 例和驗證集70例,其中訓練集中腮腺多形性腺瘤101例、腺淋巴瘤61 例,驗證集中腮腺多形性腺瘤32 例、腺淋巴瘤38例。納入標準:①術前均于我院行超聲檢查,且采集圖像標準、清晰;②均經術后病理證實,且臨床資料完整;③既往無穿刺、放療史,④對于多發(fā)病灶,僅納入最大病灶。排除標準:①圖像資料不齊全或不清晰;②合并其他腫瘤。本研究經我院醫(yī)學倫理委員會批準,為回顧性研究故免除患者知情同意。
1.超聲檢查:使用百勝MyLab Twice或西門子Acuson S 2000彩色多普勒超聲診斷儀,LA-523 線陣探頭,頻率4~13 MHz;9-L4 線陣探頭,頻率4~9 MHz。患者取仰臥位,頸部后仰,充分暴露腮腺區(qū)域,常規(guī)超聲觀察腫瘤部位、數目、形態(tài)、血流信號等,并進行雙側比較;獲取病灶最大徑切面,用于圖像后期分析及超聲影像組學的特征提取。
2.病灶感興趣區(qū)(ROI)勾畫和紋理特征提?。核谐晥D像均以JPG 格式存儲,再利用軟件轉換成Nifti格式,使用ITK-SNAP軟件(http://www.itksnap.org)勾畫,由2 名分別具有4 年和12 年工作經驗的超聲醫(yī)師采用雙盲法閱片,在獲取最大徑二維超聲圖像上達成一致后沿病灶邊緣勾畫ROI(圖1)。本研究先采用簡單隨機抽樣法分別隨機抽取15%的患者(35例),由上述2 名醫(yī)師獨立進行圖像ROI 勾畫,評估觀察者間重復性,1 周后由其中1 名醫(yī)師以同樣方法再次勾畫ROI,評估觀察者內重復性。ICC 評估觀察者內、觀察者間數據采集一致性均>0.8,故剩余圖像分割工作均由其中同一醫(yī)師完成。
圖1 腮腺病灶二維超聲圖像、ROI勾畫及特征提取示意圖
3.超聲影像組學特征篩選及組學標簽構建:采用ITK-SNAP 軟件中Pyradiomics 工具包進行數據標準化及特征提取,以中位數代替特征值中的異常值及缺失值。首先對所有提取的超聲組學定量特征均采用Z-score 標準化方法進行正則化,將數據變化到N(0,1)之間,對于重復性高的特征,采用Pearson 相關系數計算特征之間的相關性(圖2),保留任意兩個特征之間相關系數>0.9 的一個特征,再采用最大相關最小冗余(mRMR)算法及最小絕對收縮和選擇算子(LASSO)回歸分析篩選訓練集中基于超聲圖像提取的影像組學特征(圖3),將選取的非零系數組學特征與其加權系數相乘構成超聲影像組學標簽特征權重圖(圖4)。
圖2 特征之間Pearson相關系數圖
4.超聲影像組學模型的構建:將上述構建標簽分別采用支持向量機(SVM)、K 緊鄰(KNN)、決策樹(Decision Tree)3種機器學習算法進行模型構建。
應用R 4.1.0、Python 3.9.16 統(tǒng)計軟件,計數資料以率表示,繪制受試者工作特征(ROC)曲線分析各個模型鑒別腮腺多形性腺瘤與腺淋巴瘤的診斷效能;曲線下面積比較采用Delong檢驗。應用臨床決策曲線(DCA)評估模型的臨床應用價值。P<0.05 為差異有統(tǒng)計學意義。
訓練集中,SVM、KNN、Decision Tree 3種不同機器算法構建的超聲影像組學模型鑒別腮腺多形性腺瘤與腺淋巴瘤的AUC 分別為0.893、0.825、1.000;驗證集中,SVM、KNN、Decision Tree 3種機器算法構建的超聲影像組學模型鑒別腮腺多形性腺瘤與腺淋巴瘤的AUC 分別為0.848、0.721、0.620,其中SVM 算法構建的超聲影像組模型AUC 高于其他兩種算法所構建的模型,差異均有統(tǒng)計學意義(均P<0.05)。見表1,2和圖5。DCA 顯示SVM 機器算法構建的超聲影像組學模型的臨床獲益效能最好。見圖6。
表1 3種機器算法構建的超聲影像組學模型鑒別訓練集中腮腺多形性腺瘤與腺淋巴瘤的診斷效能
表2 3種機器算法構建的超聲影像組學模型鑒別驗證集中腮腺多形性腺瘤與腺淋巴瘤的診斷效能
圖5 3 種算法構建的超聲影像組學模型鑒別腮腺多形性腺瘤與腺淋巴瘤的ROC曲線圖
圖6 3種算法構建的超聲影像組學模型鑒別腮腺多形性腺瘤與腺淋巴瘤的DCA圖
多形性腺瘤是腮腺最常見的良性腫瘤,其次是腺淋巴瘤,兩者腫瘤組織成分復雜,且缺乏特異性的臨床癥狀及檢測指標,臨床較難鑒別。既往研究[6]多基于超聲影像學表現(xiàn)如病灶形態(tài)、大小、邊緣、有無鈣化或囊變、后方增強方式等鑒別兩者,但在實際操作中易受醫(yī)師主觀判斷及經驗影響。近年來,人工智能下的機器學習已經運用到醫(yī)療領域中,機器學習算法的使用使原有復雜過程簡化,醫(yī)療方面也逐漸將人工智能機器學習應用納入未來發(fā)展規(guī)劃,彌補了傳統(tǒng)醫(yī)學的不足,隨著技術的深入發(fā)展,其在醫(yī)學領域內的影響也被逐步拓展[7]。影像組學可以通過非侵入性手段評估人肉眼無法識別的特征,允許更多以高通量的方式準確地描述腫瘤、計算機輔助特征提取和識別圖像放射組學特征[8]。目前,已有諸多研究[9-11]探討影像組學在鑒別腮腺良惡性腫瘤中的應用價值,但大多基于CT、MRI 圖像,基于二維超聲圖像影像組學研究較少。本研究基于二維超聲影像組學,采用3 種機器學習算法(SVM、KNN、Decision Tree)構建模型,結果顯示采用SVM、KNN、Decision Tree 3 種機器算法構建的超聲影像組學模型鑒別驗證集中腮腺多形性腺瘤與腺淋巴瘤的AUC 分別為0.848、0.721、0.620,其中SVM算法構建的超聲影像組模型AUC高于另外兩種算法所構建的模型,差異均有統(tǒng)計學意義(均P<0.05);且DCA顯示該模型的臨床獲益效能最好。分析原因可能為兩種腫瘤病理結構不同,腮腺多形性腺瘤來自導管上皮細胞,來源于外胚葉,形成黏液樣及軟骨樣組織間質等物質[12];腺淋巴瘤來源于腺體的淋巴結或殘存于鄰近淋巴結內異位腺體組織,其病理組織主要是上皮和淋巴樣組織[13]。內部成分的不同造成提取定量特征的不同[2,11,14-15]。同時本研究在構建超聲影像組學模型時勾畫ROI 的一致性較好,說明受人為等主觀因素影響較小。
本研究的局限性:①為單中心、回顧性研究,其結論可能會出現(xiàn)偏倚;②僅從二維超聲影像組學單一模型角度出發(fā),后期將擴大樣本量并結合超聲其他相關數據進行驗證;③僅納入病灶最大徑切面聲像圖;④未聯(lián)合臨床指標;⑤未涉及其他機器算法,如邏輯回歸、隨機森林算法等。
綜上所述,超聲影像組學在鑒別腮腺多形性腺瘤與腺淋巴瘤中有一定的應用價值;其中以SVM 算法構建的超聲影像組學模型診斷效能最佳。