凌人男 ,楊若峰,易芹芹,饒梓彬 ,楊熠,金洪濤 ,程立新
宮頸癌是婦科第二位惡性腫瘤,是女性癌癥相關(guān)死亡的一個(gè)重要原因[1],最近的一份報(bào)告預(yù)測(cè)2021年新發(fā)宮頸癌患者14 480例,其中4290人將死亡[2]。淋巴結(jié)轉(zhuǎn)移(lymph node metastasis,LNM)是影響宮頸癌復(fù)發(fā)或死亡的最重要的獨(dú)立不良預(yù)后因素,F(xiàn)IGO 2018 (International Federation of Gynecology and Obstetrics,F(xiàn)IGO)分期系統(tǒng)首次將淋巴結(jié)納入分期,盆腔淋巴結(jié)轉(zhuǎn)移和主動(dòng)脈旁淋巴結(jié)轉(zhuǎn)移分期分別為ⅢC1和ⅢC2,并需要同步放化療[3]。腹腔鏡淋巴結(jié)切除術(shù)是診斷LNM的金標(biāo)準(zhǔn)[3],但由于其侵入性、操作費(fèi)用高及并發(fā)癥風(fēng)險(xiǎn)而不能作為常規(guī)方法。前哨淋巴結(jié)活檢的安全性和有效性仍有爭(zhēng)議[4]。MRI對(duì)淋巴結(jié)評(píng)估主要依據(jù)淋巴結(jié)的大小(短軸>1 cm)和形態(tài),即使應(yīng)用功能技術(shù)亦難以鑒別炎性或結(jié)核性淋巴結(jié)與轉(zhuǎn)移性淋巴結(jié)。PET-CT(positron emission tomography-computed tomography,PET-CT)對(duì)LNM的診斷優(yōu)于MRI,但當(dāng)淋巴結(jié)較小時(shí),其診斷準(zhǔn)確性降低。目前基于磁共振圖像的機(jī)器學(xué)習(xí)研究仍不足夠滿(mǎn)足臨床需求[5-9],本研究旨在通過(guò)多參數(shù)磁共振的放射組學(xué)模型,利用神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)宮頸癌LNM,并評(píng)價(jià)不同模型的預(yù)測(cè)效能。
本文為回顧性研究,收集深圳市人民醫(yī)院2018年11月至2020年9月經(jīng)病理證實(shí)的宮頸癌病例。本研究經(jīng)深圳市人民醫(yī)院倫理委員會(huì)批準(zhǔn)(批準(zhǔn)文號(hào):LL-KY-2019519),免除受試者知情同意。
納入標(biāo)準(zhǔn):①行子宮全切+盆腔淋巴結(jié)清掃手術(shù);②術(shù)前2周內(nèi)進(jìn)行3.0 T磁共振成像檢查;③宮頸腫瘤最大徑大于1 cm。排除標(biāo)準(zhǔn):①M(fèi)RI檢查前行放化療和/或免疫抑制治療;②曾行LEEP手術(shù);③臨床及病理特征不完整;④同期患有其他惡性腫瘤;⑤MRI序列不完整,圖像質(zhì)量有缺陷;⑥失訪。
患者入組:共納入178例宮頸癌,經(jīng)病理組織學(xué)或PET-CT證實(shí)盆腔LNM 68例。兩位放射科醫(yī)師同時(shí)對(duì)70例患者進(jìn)行了腫瘤分割,進(jìn)行觀察者間一致性評(píng)估,余下108例由一位放射科醫(yī)師單獨(dú)分割,并對(duì)其中18例進(jìn)行了2次分割評(píng)價(jià)可重復(fù)性。共納入研究樣本248個(gè),按2∶1比例隨機(jī)分為訓(xùn)練集和測(cè)試集。訓(xùn)練集:165個(gè)樣本,發(fā)病年齡28~84(53.21±11.31)歲,LNM組41個(gè)樣本,非LNM組124個(gè)樣本;測(cè)試集:83個(gè)樣本,發(fā)病年齡28~75(50.36±11.47)歲,LNM組27個(gè)樣本,非LNM組56個(gè)樣本。
所有病例均行腹部和盆腔平掃加增強(qiáng)掃描。掃描儀為Siemens Magnetom Skyra 3.0 T。檢查前患者禁食約6~8 h,適度充盈膀胱。研究序列包括:(1)快速自旋回波序列T2WI矢狀位,掃描參數(shù)TR:4000 ms,TE:109 ms,翻轉(zhuǎn)角:176°,矩陣:448×448,層厚:3 mm,層間距:0.6 mm,F(xiàn)OV:230 mm×230 mm;(2)擴(kuò)散加權(quán)成像序列軸位,掃描參數(shù)B值分別為0、500和1000 s/mm2,TR:3000 ms,TE:84 ms,翻轉(zhuǎn)角:180°,矩陣:118×118,層厚:4 mm,層間距:0.8 mm,F(xiàn)OV:220 mm×220 mm;(3)三維容積內(nèi)插增強(qiáng)T1WI矢狀位,掃描參數(shù)TR:5.8 ms,TE:2.7 ms,翻轉(zhuǎn)角:180°,矩陣:448×448,層厚:3 mm,層間距:0.6 mm,F(xiàn)OV:320 mm×260 mm;(4)三維容積內(nèi)插增強(qiáng)T1WI軸位,掃描參數(shù)TR:5.8 ms,TE:2.7 ms,翻轉(zhuǎn)角:180°,矩陣:320×320,層厚:4 mm,層間距:0.8 mm,F(xiàn)OV:220 mm×220 mm。
7個(gè)臨床特征包括年齡、妊娠次數(shù)、分娩次數(shù)、流產(chǎn)次數(shù)、首次性交年齡、月經(jīng)狀態(tài)、癌癥家族史。2個(gè)病理特征包括病理分型、病理分化程度。臨床分期依據(jù)FIGO 2018分期系統(tǒng)。
兩位放射科醫(yī)生(觀察者1和2,分別有10年和20年影像診斷經(jīng)驗(yàn))利用3D-slicer軟件對(duì)4個(gè)MRI序列宮頸原發(fā)腫瘤進(jìn)行逐層勾畫(huà)分割,分割前瀏覽每個(gè)序列并進(jìn)行比對(duì)。每個(gè)序列感興趣區(qū)(the volume of interest,VOI)提取107個(gè)放射組學(xué)特征,分為7組:①一階統(tǒng)計(jì)量特征(first-order statistics features,n=18),②基于形狀的特征(shape-based features,n=14),③灰度共生矩陣的特征(gray level co-occurrence matrix,GLCM,n=24),④灰度游程長(zhǎng)度矩陣特征(gray level run length matrix features,GLRLM,n=16),⑤灰度大小區(qū)域矩陣特征(gray level size zone matrix features,GLSZM,n=16),⑥相鄰灰度差分矩陣特征(neighboring gray tone difference matrix features,NGTDM,n=5),⑦灰度相關(guān)矩陣特征(gray level dependence matrix,GLDM,n=14)。因此,每個(gè)腫瘤共獲得428個(gè)放射組學(xué)特征,將其融合為428維初始特征向量。
1.5.1 臨床及病理特征篩選、模型建立
通過(guò)方差分析在9個(gè)臨床及病理特征(即:年齡、妊娠次數(shù)、分娩次數(shù)、流產(chǎn)次數(shù)、首次性交年齡、月經(jīng)狀態(tài)、癌癥家族史、病理分型、病理分化)中篩選出方差大的3個(gè)特征進(jìn)入模型,分別組成428維模型(即:428維初始特征向量)、437維模型(即:428維初始特征向量+9個(gè)臨床及病理特征)和431維模型(即:428維初始特征向量+3個(gè)臨床及病理特征)。
1.5.2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立
Python庫(kù)的torch和sklearn建立三層神經(jīng)網(wǎng)絡(luò)模型。由一個(gè)輸入層、一個(gè)輸出層和一個(gè)隱藏層組成,詳見(jiàn)圖1。輸入層中的神經(jīng)元數(shù)(維數(shù))分別為428、437、431。隱藏層神經(jīng)元大小為300,該模型輸出一個(gè)二維向量,為了防止過(guò)度擬合,我們還在輸入層和隱藏層之間執(zhí)行了一個(gè)隨機(jī)dropout操作。訓(xùn)練集中全部樣本的學(xué)習(xí)率和訓(xùn)練次數(shù)(epoch,輪數(shù))分別為2.05×10-4和200。
圖1 神經(jīng)網(wǎng)絡(luò)模型。LNM:淋巴結(jié)轉(zhuǎn)移;non-LNM:非淋巴結(jié)轉(zhuǎn)移Fig.1 Structure of the neural network model.LNM:Lymph node metastasis.non-LNM:non-lymph node metastasis.
為了比較評(píng)估模型的性能,我們分別采用神經(jīng)網(wǎng)絡(luò)(neural network,NN)、支持向量機(jī)算法(support vector machine,SVM)進(jìn)行建模。
本研究的統(tǒng)計(jì)分析使用IBM SPSS 25.0軟件。采用Mann-WhitneyU檢驗(yàn)評(píng)估年齡、妊娠次數(shù)、分娩次數(shù)、流產(chǎn)、首次性交年齡、月經(jīng)狀態(tài)、癌癥家族史之間的差異。采用Chi-square檢驗(yàn)分析病理類(lèi)型、分化程度及FIGO分期之間的差異。P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)來(lái)評(píng)估觀察者(觀察者1和觀察者2)的信度和觀察者兩次測(cè)量值的重復(fù)性,ICC>0.75時(shí),認(rèn)為兩者具有較好的一致性。使用分類(lèi)準(zhǔn)確率、敏感度、特異度和受試者特征曲線下面積(area under the receiver operating characteristics curve,AUC)用來(lái)衡量檢測(cè)模型性能。使用sklearn中的metrics.roc_curve函數(shù)繪制ROC曲線,通過(guò)最大約登指數(shù)確定最佳界值評(píng)估診斷效能。
臨床特征基線如表1所示,LNM組和非LNM組臨床及病理特征差異沒(méi)有統(tǒng)計(jì)學(xué)意義(P>0.05)。兩位觀察者ICC為0.819,觀察者內(nèi)ICC為0.796,一致性較好。
表1 訓(xùn)練集和測(cè)試集患者臨床及病理特征(n=248)Tab.1 Characteristics of patients in the training set and test set(n=248)
通過(guò)方差分析,從9個(gè)臨床及病理特征(即:年齡、妊娠次數(shù)、分娩次數(shù)、流產(chǎn)次數(shù)、首次性交年齡、月經(jīng)狀態(tài)、癌癥家族史、病理分型、病理分化)中篩選出3個(gè)特征,即月經(jīng)狀態(tài)、癌癥家族史、病理類(lèi)型(F=0.2490,0.1080和0.0999)進(jìn)入模型,分別組成428維模型、437維模型和431維模型。
428維NN模型和428維SVM模型的分類(lèi)準(zhǔn)確率、AUC分別為0.747、0.834和0.710、0.783;437維NN模型和437維SVM模型的分類(lèi)準(zhǔn)確率、AUC分別為0.831、0.871和0.735、0.788;431維NN模型和431維SVM模型的分類(lèi)準(zhǔn)確率、AUC分別為0.810、0.882和0.723、0.779,詳見(jiàn)圖2。
圖2 測(cè)試集中428維、437維、431維神經(jīng)網(wǎng)絡(luò)模型和支持向量機(jī)模型的ROC曲線。NN:神經(jīng)網(wǎng)絡(luò);SVM:支持向量機(jī)Fig.2 The ROC curves of NN and SVM models including features of 428-dimension,437-dimension,and 431-dimension,respectively,in the test set.NN:neural network.SVM:support vector machine.
NN模型訓(xùn)練集和測(cè)試集的敏感度和特異度見(jiàn)表2和表3。在測(cè)試集中,428維NN模型的AUC為0.834(95%CI:0.748~0.919),437維 NN模型的 AUC為0.871(95%CI:0.793~0.949),431維 NN 模型的AUC為 0.882(95%CI:0.810~0.954)。結(jié)果顯示,431維NN模型的敏感度和特異度分別為0.840和0.741,性能最好。
表2 訓(xùn)練集中不同維度神經(jīng)網(wǎng)絡(luò)模型ROC曲線分析結(jié)果Tab.2 The result of ROC curve analysis in neural network with different dimension in training set
表3 測(cè)試集中不同維度神經(jīng)網(wǎng)絡(luò)模型ROC曲線分析結(jié)果Tab.3 The result of ROC curve analysis in neural network with different dimension in test set
早期宮頸癌僅15%~20%患者伴有LNM[10],術(shù)前通過(guò)磁共振成像對(duì)盆腔及腹膜后的LNM進(jìn)行準(zhǔn)確定性是具有挑戰(zhàn)性的,這就使得部分炎性或小淋巴結(jié)但并不是轉(zhuǎn)移性淋巴結(jié)的患者也經(jīng)歷了淋巴結(jié)清掃手術(shù)。本研究以多模態(tài)MRI包括矢狀位T2WI、軸位擴(kuò)散加權(quán)、增強(qiáng)矢狀位和軸位T1WI四個(gè)序列為基礎(chǔ),分析了放射組學(xué)特征和神經(jīng)網(wǎng)絡(luò)模型對(duì)于區(qū)分LNM的效能。
支持向量機(jī)是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的傳統(tǒng)學(xué)習(xí)方法,具有較好的魯棒性,逼近能力和泛化能力較強(qiáng),廣泛應(yīng)用在影像組學(xué)機(jī)器學(xué)習(xí)中[6,9,11-13],然而由于傳統(tǒng)的機(jī)器學(xué)習(xí)方法和有限的變量而難以取得臨床實(shí)用價(jià)值。
神經(jīng)網(wǎng)絡(luò)基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化為優(yōu)化目標(biāo),更多應(yīng)用于復(fù)雜的特征分析中,直接由原始數(shù)據(jù)建立層級(jí)結(jié)構(gòu)[14],可以合并更多不同類(lèi)型的變量,更適用于大樣本,模型訓(xùn)練過(guò)程中可以自動(dòng)調(diào)節(jié)權(quán)重,其算法優(yōu)于支持向量機(jī)。目前神經(jīng)網(wǎng)絡(luò)模型已經(jīng)在疾病診斷[15-17]、療效評(píng)估和預(yù)后預(yù)測(cè)[18-19]等方面有所應(yīng)用,獲得了一定經(jīng)驗(yàn)。有研究已成功應(yīng)用到臨床,縮短檢驗(yàn)時(shí)間到3分鐘[20]。然而,相關(guān)的研究仍不足夠,且如何構(gòu)建最優(yōu)的放射組學(xué)神經(jīng)網(wǎng)絡(luò)模型尚不清楚,尤其宮頸癌LNM的預(yù)測(cè),故本研究構(gòu)建了一個(gè)診斷效能較好的神經(jīng)網(wǎng)絡(luò)模型,以期探索更優(yōu)的建模方式并對(duì)臨床決策有所幫助。
本研究對(duì)比了神經(jīng)網(wǎng)絡(luò)模型和支持向量機(jī)模型,在428維、437維、431維模型中,神經(jīng)網(wǎng)絡(luò)模型的效能均高于支持向量機(jī)模型,預(yù)測(cè)LNM效能更高。437維神經(jīng)網(wǎng)絡(luò)模型的分類(lèi)準(zhǔn)確率、敏感度、特異度均高于428維神經(jīng)網(wǎng)絡(luò)模型。431維神經(jīng)網(wǎng)絡(luò)模型分類(lèi)準(zhǔn)確率、敏感度、特異度略遜于437維神經(jīng)網(wǎng)絡(luò)模型,但亦高于428維神經(jīng)網(wǎng)絡(luò)模型,且其AUC較437維神經(jīng)網(wǎng)絡(luò)模型有所提高,相對(duì)于437維中的9個(gè)臨床及病理特征,431維神經(jīng)網(wǎng)絡(luò)模型的3個(gè)臨床及病理特征更易獲得,使得模型更穩(wěn)定、易被推廣,故本研究認(rèn)為431神經(jīng)網(wǎng)絡(luò)模型為最佳模型。
之前有學(xué)者[6]建立基于磁共振多參數(shù)成像,包括矢狀位T2WI、軸位T1WI和動(dòng)態(tài)增強(qiáng)T1WI等的序列,并采集7個(gè)臨床及病理特征(年齡、妊娠次數(shù)、分娩次數(shù)、流產(chǎn)次數(shù)、首次性交年齡、月經(jīng)狀態(tài)、癌癥家族史),建立支持向量機(jī)模型預(yù)測(cè)宮頸癌轉(zhuǎn)移。本研究建立的431維神經(jīng)網(wǎng)絡(luò)模型在敏感度、特異度、分類(lèi)準(zhǔn)確率均較Kan等[6]的研究結(jié)果(分別為0.714、0.379、0.488)有明顯提高。Dong[15]等構(gòu)建了一個(gè)4層神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)宮頸癌LNM(每層10個(gè)神經(jīng)元,訓(xùn)練集AUC和準(zhǔn)確率為0.99和0.97),本研究采用3層神經(jīng)網(wǎng)絡(luò)并隨機(jī)執(zhí)行了dropout操作更進(jìn)一步避免過(guò)擬合。
本研究結(jié)果較好,原因之一為本研究中的兩位觀察者具有豐富的影像診斷經(jīng)驗(yàn),對(duì)腫瘤的分割一致性較高。而且本研究將病理分型及分級(jí)納入模型,并且將臨床及病理特征進(jìn)行了篩選,篩選出的3個(gè)臨床特征即月經(jīng)狀態(tài)、癌癥家族史、病理類(lèi)型較9個(gè)臨床特征較易獲得且準(zhǔn)確,進(jìn)而使得模型分類(lèi)準(zhǔn)確率、敏感度、特異度明顯提高。動(dòng)態(tài)增強(qiáng)掃描采用不同的模型其診斷效能不盡相同[21-22],目前缺乏統(tǒng)一的標(biāo)準(zhǔn),故本研究采用常規(guī)增強(qiáng)進(jìn)行建模,進(jìn)入模型的四個(gè)磁共振序列重復(fù)性強(qiáng)且穩(wěn)定,且在模型過(guò)程中增加了防止過(guò)擬合操作。因此本研究構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型分類(lèi)準(zhǔn)確率較高,更易推廣,如圖3。
圖3 放射組學(xué)模型示例,47歲女,宮頸鱗癌,分化程度中等,F(xiàn)IGO 2018Ⅱb。A~C:軸位T2WI顯示右側(cè)閉孔淋巴結(jié),最大徑為8 mm,ADC值為1.081×10-3mm2/s,增強(qiáng)T1WI呈不均質(zhì)強(qiáng)化;D:矢狀位T2WI顯示宮頸腫瘤大小為26 mm×32 mm×43 mm;E:手工分割ROI;F:提取3D-VOL 431維神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)為淋巴結(jié)轉(zhuǎn)移(-),與病理相符Fig.3 Radiomics model used in this study.A 47-year-old woman with cervical squamous cell carcinoma,moderately differentiated,FIGO 2018 Ⅱ b.A-C:The right obturator node was round and the size of 8 mm.The ADC value was 1.081×10-3mm2/s,and heterogeneous on contrast enhanced T1WI.D-E:The segmentation of three-dimensional volume of interest(3D-VOI)was based on sagittal T2WI.The size of cervical cancer tumor was 26 mm×32 mm×43 mm.F:The neural network model predicted lymph node was non-metastatic consistent with pathological results.
本研究為單中心、回顧性研究,樣本不可避免地存在選擇性偏倚,今后將嘗試多中心研究擴(kuò)大樣本量降低偏倚。
綜上,基于多參數(shù)磁共振成像的宮頸癌神經(jīng)網(wǎng)絡(luò)模型,可以有效地預(yù)測(cè)宮頸癌LNM,有助于腫瘤分期和治療決策。以往經(jīng)驗(yàn)認(rèn)為支持向量機(jī)模型在預(yù)測(cè)方面具有優(yōu)越性,而本研究結(jié)果表明神經(jīng)網(wǎng)絡(luò)模型在分類(lèi)準(zhǔn)確率和AUC方面都有一定的提高,因此該模型具有較高的臨床應(yīng)用推廣價(jià)值。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。