漆安琪,張海捷,殷 夫,楊麗洋,崔維維,楊?yuàn)檴?,?戈
1南方醫(yī)科大學(xué)南方醫(yī)院增城院區(qū)醫(yī)學(xué)影像科,廣東 廣州 511300;2深圳市第二人民醫(yī)院PET/CT 中心,廣東深圳 518052;3深圳大學(xué)信息工程學(xué)院,廣東 深圳 518052;4南方醫(yī)科大學(xué)南方醫(yī)院影像中心,廣東 廣州510515
腎透明細(xì)胞癌(ccRCC)是腎細(xì)胞癌中最常見的亞型,占比超過70%,惡性程度普遍較高,相比其它亞型預(yù)后也較差[1]。ccRCC的核分級與患者的5年生存率存在相關(guān)性,通常核分級越高,其生存期會(huì)越短[2-3]。目前,ccRCC分級系統(tǒng)采用的是世界衛(wèi)生組織/國際泌尿病理學(xué)會(huì)(WHO/ISUP)的最新核分級系統(tǒng)[4-5]。該系統(tǒng)是根據(jù)核仁突出的情況,是否存在細(xì)胞的多形性以及橫紋肌樣或肉瘤樣形態(tài)來劃分的四分類的分級系統(tǒng)。研究表明,ccRCC患者的低級別(1~2級)核分級之間[6-7]和高級別(3~4級)核分級之間[2],他們的生存率并沒有差異,因此WHO/ISUP核分級系統(tǒng)也可被簡化為此二分類標(biāo)準(zhǔn)。在臨床治療方面,低級別ccRCC患者可采取相對保守的治療,如射頻消融、局部切除術(shù)或腹腔鏡手術(shù)、保留腎單位手術(shù)或主動(dòng)監(jiān)測;高級別ccRCC患者可能需要接受更多的根治性干預(yù)如手術(shù)切除和更密切的隨訪[8],因其腫瘤具有更高的侵襲性和死亡率[9]。術(shù)前明確患者的WHO/ISUP核分級,對指導(dǎo)其治療和臨床決策至關(guān)重要。
目前確定ccRCC的WHO/ISUP核分級的金標(biāo)準(zhǔn)是通過組織病理學(xué)檢查。然而,通過細(xì)針穿刺活檢確認(rèn)核分級仍存在一些局限性[10-11]:活檢具有侵入性,可能會(huì)導(dǎo)致腫瘤擴(kuò)散、出血以及感染等多種風(fēng)險(xiǎn)[12-13],并且穿刺活檢經(jīng)常會(huì)低估腫瘤分級[14],對于位置較深或體積較小的腫塊,由于腫瘤獨(dú)有的異質(zhì)性,可能會(huì)出現(xiàn)病理結(jié)果不太準(zhǔn)確的情況[15]。因此,無創(chuàng)并且精準(zhǔn)的術(shù)前預(yù)測ccRCC的病理分級的方法將對患者的治療具有重要的臨床意義。研究發(fā)現(xiàn),影像組學(xué)通過其自身的影像組學(xué)特征(RFs)可反映腫瘤異質(zhì)性的特點(diǎn),可有效用于病理檢測、尋找致癌基因以及評估預(yù)后[16-17]。
在影像組學(xué)中,特征數(shù)量通常大于實(shí)驗(yàn)樣本,故通常需要選擇合適的特征選擇的方法以減少對預(yù)測模型的干擾。隨著機(jī)器學(xué)習(xí)的發(fā)展,支持向量機(jī)、決策樹、隨機(jī)森林等機(jī)器學(xué)習(xí)方法,已廣泛用于影像組學(xué)的特征篩選,但仍然存在一些局限性。其中,最大的缺陷是忽略了冗余特征的相關(guān)信息,這意味著一些同樣重要的RFs會(huì)被舍棄。同時(shí),大多數(shù)機(jī)器學(xué)習(xí)的特征選擇方法都是基于包裝式的框架,容易出現(xiàn)過擬和。最后,現(xiàn)有的機(jī)器學(xué)習(xí)的方法通常是黑箱操作,選擇特征的可解釋性不強(qiáng)。因此,需要一個(gè)更可靠的特征選擇方法以改善上述問題。
近年來,基于差異化網(wǎng)絡(luò)分析的特征選擇方法,在大規(guī)模數(shù)據(jù)分析方面表現(xiàn)出了出色的魯棒性,廣泛應(yīng)用于相關(guān)疾病的生物標(biāo)志物的識別[18]。差異化網(wǎng)絡(luò)分析以網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為中心,通過比較兩個(gè)不同群體網(wǎng)絡(luò)之間的結(jié)構(gòu)差異來選擇特征,特別在處理小樣本和不平衡樣本問題時(shí)表現(xiàn)突出。然而目前少有文獻(xiàn)報(bào)道其在影像組學(xué)中的相關(guān)應(yīng)用。本研究旨在利用差異化網(wǎng)絡(luò)分析選擇特征,并以此構(gòu)建ccRCC的WHO/ISUP核分級預(yù)測模型[19]。除此之外,本文希望探討通過此新的特征選擇的方法所選擇的RFs 與ccRCC 的無進(jìn)展生存期(PFS)是否存在相關(guān)性,使影像組學(xué)預(yù)測模型及其特征具有更強(qiáng)的可解釋性。
本研究為回顧性研究,已獲得南方醫(yī)科大學(xué)南方醫(yī)院倫理委員會(huì)審核批準(zhǔn),并免簽患者的知情同意書?;仡櫺苑治隽?015~2021年南方醫(yī)科大學(xué)南方醫(yī)院收治的腎細(xì)胞癌患者的臨床、病理、CT、隨訪資料,包括:年齡、性別、腫瘤最大徑、T 分期、生長模式以及WHO/ISUP核分級。納入標(biāo)準(zhǔn):篩選病理檢查為腎透明細(xì)胞癌的患者納入研究;依據(jù)2016版WHO/ISUP標(biāo)準(zhǔn),由2位病理學(xué)醫(yī)生獨(dú)立對組織標(biāo)本進(jìn)行重新閱片,并進(jìn)行核分級(1~2級定義為低級別,3~4級定義為高級別);有完整CT平掃和增強(qiáng)圖像資料。排除標(biāo)準(zhǔn):由于組織病理資料不全而無法進(jìn)行重新核分級的腎癌患者;在CT檢查前已做過治療的腎癌患者;單側(cè)或雙側(cè)腎臟出現(xiàn)2個(gè)或2個(gè)以上病變的患者;腫瘤的囊性成分特征達(dá)到75%以上的腎癌患者;病理組織學(xué)中包含混合特征的腎癌患者,如同時(shí)含有透明細(xì)胞和乳頭狀特征等。最終共有175例患者被納入研究,其中訓(xùn)練集105例,測試集70例。經(jīng)統(tǒng)計(jì),診斷為低級別ccRCC(按WHO/ISUP 標(biāo)準(zhǔn)為1~2級)有122例,高級別ccRCC(按WHO/ISUP標(biāo)準(zhǔn)為3~4級)有53例。訓(xùn)練集和測試集患者所有特征的差異均無統(tǒng)計(jì)學(xué)意義(P>0.05,表1)。
表1 訓(xùn)練集與測試集患者的臨床信息Tab.1 Patient's clinical information between the training set and test set
本研究病例采用西門子64 排CT(Siemens Somatom Definition CT)以及飛利浦256 層iCT(Philips Brilliance ICT)進(jìn)行CT圖像采集。囑患者仰臥位,在屏氣后進(jìn)行CT平掃及三期增強(qiáng)掃描。掃描范圍從膈頂?shù)诫p腎下極,使其包含有完整的腎臟及主要供血血管及鄰近組織。管電壓120 kV;管電流150~320 mA;層厚5 mm;層間距5 mm;視野360 mm;矩陣512×512。首先進(jìn)行平掃期(NCP)掃描,在常規(guī)平掃結(jié)束后,根據(jù)患者體質(zhì)量經(jīng)肘前靜脈注射造影劑(碘海醇或優(yōu)維顯),劑量為2 ml/kg,以2.5 ml/s的速度注射。在造影劑注射后的30~35 s 掃描皮髓質(zhì)期(CMP)、60~70 s 掃描實(shí)質(zhì)期(NP)、190~200 s掃描排泄期(EP)。
由2名具有腹部影像診斷經(jīng)驗(yàn)的的放射科醫(yī)生(醫(yī)生A:10年,醫(yī)生B:15年),使用ITK-SNAP軟件對CT圖像進(jìn)行手動(dòng)分割獲取感興趣區(qū)。在手工勾畫感興趣區(qū)時(shí),其輪廓需與腫瘤邊緣保持2 mm的距離,以減少鄰近組織的干擾,如正常腎組織或周圍脂肪[20]。
為了評估分割圖像中提取特征的魯棒性,進(jìn)行一致性檢驗(yàn)。醫(yī)生A和B分別隨機(jī)為30張圖像繪制感興趣區(qū),1周后醫(yī)生A再次重新分割同一批圖像,計(jì)算兩位放射科醫(yī)生提取的RFs的組內(nèi)和組間相關(guān)系數(shù)。結(jié)果顯示,組內(nèi)和組間相關(guān)系數(shù)均大于0.75,表示圖像分割的一致性很好,因此剩余的圖像由醫(yī)生A執(zhí)行分割。所有圖像在提取特征前,均進(jìn)行了重采樣、歸一化和濾波去噪的預(yù)處理。影像組學(xué)的特征提取基于PyRadiomics軟件平臺實(shí)現(xiàn)。
本文首次使用了一種基于Glasso的差異化網(wǎng)絡(luò)分析方法進(jìn)行RFs選擇。Glasso是一種經(jīng)典的最大熵網(wǎng)絡(luò)構(gòu)建模型[21],通過稀疏懲罰極大似然估計(jì)的方法預(yù)測協(xié)方差矩陣的逆。它明確地從一個(gè)概率模型出發(fā),利用聯(lián)合似然從多個(gè)條件中估計(jì)協(xié)方差矩陣的逆,并以此作為推斷的網(wǎng)絡(luò)結(jié)構(gòu)。其一般形式可以寫成:
其中M是估計(jì)網(wǎng)絡(luò),C是樣本協(xié)方差矩陣,tr表示矩陣的軌跡,det表示矩陣的行列式,λ是正則化參數(shù)。矩陣M中的元素描述了在去除間接影響后仍然存在的成對特征的相關(guān)性,從而提供了特征之間相互作用的更健壯的描述。
特征選擇的的具體流程如下:首先根據(jù)RFs的不同階段(NCP、CMP、NP、EP和ALL-P)構(gòu)建5個(gè)實(shí)驗(yàn)組。其中,NCP、CMP、NP和EP組的樣本僅包含相應(yīng)期相的RFs,ALL組的樣本包含上述4個(gè)期相的所有RFs。在各個(gè)實(shí)驗(yàn)組中,根據(jù)WHO/ISUP核分級把樣本分為低級別組(1~2 級)和高級別組(3~4 級)。然后,利用Glasso分別構(gòu)建各實(shí)驗(yàn)組中的高級別和低級別網(wǎng)絡(luò)。通過比較高低級別網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)之間的差異,構(gòu)建各實(shí)驗(yàn)組的WHO/ISUP高低級別的差異化網(wǎng)絡(luò)。
一個(gè)WHO/ISUP核分級差異化網(wǎng)絡(luò)示例圖(圖1)顯示,在高級別和低級別網(wǎng)絡(luò)中,特征A和C均存在連接,這意味著在這兩個(gè)網(wǎng)絡(luò)中,特征A與C的連接關(guān)系沒有發(fā)生變化,即沒有差異性。最后,根據(jù)各實(shí)驗(yàn)組中構(gòu)建的高低級別差異化網(wǎng)絡(luò)結(jié)構(gòu),通過節(jié)點(diǎn)度的直方圖選取各自的RFs,即網(wǎng)絡(luò)中排名較高的節(jié)點(diǎn)被選擇為重要的RFs(圖中紅色標(biāo)記)。本實(shí)驗(yàn)中所選特性的數(shù)量被設(shè)置為不超過15個(gè)。
圖1 WHO/ISUP核分級差異化網(wǎng)絡(luò)示例Fig.1 A sample of WHO/ISUP grade differential networks.
各模型均在訓(xùn)練集上進(jìn)行5次分層10折交叉驗(yàn)證以檢驗(yàn)其性能,并在測試集上進(jìn)行獨(dú)立測試。每次10折交叉驗(yàn)證中,訓(xùn)練集分為內(nèi)部訓(xùn)練集和內(nèi)部驗(yàn)證集(9:1)。其中交叉驗(yàn)證的數(shù)據(jù)劃分中保持相同的類分布。之后將各實(shí)驗(yàn)?zāi)P驮?次交叉驗(yàn)證中的平均性能作為其在內(nèi)部訓(xùn)練集和內(nèi)部驗(yàn)證集上的最終性能,最后在測試集中進(jìn)行測試。
在本實(shí)驗(yàn)中,首先通過差異化網(wǎng)絡(luò)分析特征選擇得到NCP、CMP、NP、EP和ALL期相的RFs,之后通過Logistic回歸方法構(gòu)建預(yù)測模型,最后篩選出其中性能最好的模型。通過ROC 曲線以及曲線下面積(AUC),進(jìn)一步分別與最小絕對收縮和選擇算子(LASSO)、隨機(jī)森林和支持向量機(jī)模型等機(jī)器學(xué)習(xí)對照模型以及臨床特征模型行比較,評估所選模型的性能。
進(jìn)一步通過生存分析,探索WHO/ISUP核分級預(yù)測模型中所選RFs是否與PFS相關(guān),以驗(yàn)證所選特征的可解釋性。首先,進(jìn)行Kaplan-Meier分析;然后,采用單因素和多因素Cox比例風(fēng)險(xiǎn)回歸模型研究與PFS相關(guān)的影像組學(xué)特征因素;最后,使用風(fēng)險(xiǎn)評分可視化描述所選擇的RFs。
采用SPSS22.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。分類數(shù)據(jù)以n(%)表示,連續(xù)數(shù)據(jù)以均數(shù)±標(biāo)準(zhǔn)差表示。采用非參數(shù)Mann-WhitneyU檢驗(yàn)或獨(dú)立樣本t檢驗(yàn)比較連續(xù)數(shù)據(jù)的組間差異;采用Fisher精確檢驗(yàn)(樣本量≤5)或者卡方檢驗(yàn)分析分類數(shù)據(jù)的組間差異。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。在生存分析中,使用surviminer軟件包中的surv-cutpoint函數(shù)自適應(yīng)選擇了連續(xù)數(shù)據(jù)的最佳cut-off值,統(tǒng)計(jì)結(jié)果以及建模均由R 軟件執(zhí)行,包括‘rms’,‘ggplot’,‘survival’,‘rmda’以及‘proc’軟件包。
每個(gè)患者從單期CT圖像中提取107個(gè)RFs,包括18個(gè)一階統(tǒng)計(jì)特征、14個(gè)形狀的特征、24個(gè)灰度共生矩陣特征、14個(gè)灰度依賴矩陣(GLDM)特征、16個(gè)灰度運(yùn)行長度矩陣(GLRLM)特征、16個(gè)灰度大小區(qū)域矩陣特征、5個(gè)相鄰灰度差矩(NGTDM)特征。因此從4期CT圖像中共提取428個(gè)RFs(4×107)。
通過差異化網(wǎng)絡(luò)分析特征選擇,NCP、CMP、NP、EP和ALL-P模型分別選取7、10、9、5和8個(gè)RFs。不同期相的差異化網(wǎng)絡(luò)(圖2,其中紅色節(jié)點(diǎn)表示所選的RFs)。
圖2 不同期相的差異化網(wǎng)絡(luò)圖Fig.2 Differential networks of different phases.
根據(jù)差異化網(wǎng)絡(luò)分析構(gòu)建的不同期相模型在訓(xùn)練集、驗(yàn)證集和測試集的ROC曲線分析(圖3)。在訓(xùn)練集中,NCP模型的AUC為0.78,表現(xiàn)最佳,優(yōu)于其他模型(P<0.05)。在驗(yàn)證集中,NCP模型(AUC=0.76)仍為最佳,優(yōu)于其他單期模型(P<0.05)。最后在測試集中,NCP模型(AUC=0.75)依然是最好的兩個(gè)模型之一,另一個(gè)是ALL-P模型(AUC=0.76),性能均優(yōu)于其他模型(P<0.05),但二者間的性能差異無統(tǒng)計(jì)學(xué)意義(P=0.063)。結(jié)果表明,NCP 模型具有良好的魯棒性,對WHO/ISUP核分級的預(yù)測能力較好,被選為最終模型。模型公式為NCP=-3.7×X1+6×X2+1.97×X3+2.62×X4+1.94×X5+6.73×X6+4.2×X7。NCP模型選擇的RFs的相關(guān)信息(表2)。
圖3 不同期相模型在訓(xùn)練集(A)、驗(yàn)證集(B)以及測試集(C)上的ROC曲線Fig.3 The ROC curves of different phase models in the training set (A),validation set (B) and test set(C).
表2 采用差異化網(wǎng)絡(luò)特征選擇的NCP期相模型的RFsTab.2 The RFs of NCP phase model using the differential network feature selection
NCP模型與其它機(jī)器學(xué)習(xí)模型(LASSO、支持向量機(jī)和隨機(jī)森林模型)在訓(xùn)練集、驗(yàn)證集和測試集中的ROC曲線(圖4)。在訓(xùn)練集中,NCP模型和隨機(jī)森林模型AUC分別為0.78和0.84,優(yōu)于其它對照組模型,但二者差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。在驗(yàn)證集中,所有機(jī)器學(xué)習(xí)模型的性能均發(fā)生了急劇下降,而NCP模型波動(dòng)較小,在所有模型中表現(xiàn)最佳,AUC為0.76,優(yōu)于其它模型(P<0.05)。最后在測試集中,大部分機(jī)器學(xué)習(xí)模型的性能同樣有大幅度降低,特別是支持向量機(jī)和LASSO模型,預(yù)測性能下降明顯,但NCP模型依然保持穩(wěn)定。
圖4 NCP 模型與其他機(jī)器學(xué)習(xí)模型在訓(xùn)練集(A)、驗(yàn)證集(B)以及測試集(C)上的ROC曲線Fig.4 The ROC curves of NCP model and other machine learning models in the training set (A),validation set(B)and test set(C).
NCP模型與臨床對照模型(CICFs模型)及兩者聯(lián)合模型(CICFs-NCP模型)在訓(xùn)練集、驗(yàn)證集和測試集中的ROC曲線(圖5)。在訓(xùn)練集、驗(yàn)證集和測試集中,NCP模型均為最佳(AUC分別為0.78、0.76和0.75),優(yōu)于其他模型(P<0.05)。NCP模型不僅具有良好的魯棒性,同時(shí)在聯(lián)合了NCP模型后,臨床模型的性能有了提高。
圖5 NCP 模型、臨床對照模型及聯(lián)合模型在訓(xùn)練集(A)、驗(yàn)證集(B)以及測試集(C)上的ROC曲線Fig.5 The ROC curves of NCP model、clinical control model and combined model in the training set (A),validation set(B)and test set(C).
NCP模型的RFs的Kaplan-Meier生存分析結(jié)果顯示,除特征X2(P=0.23)外,其余所有的RFs在高低分組間的差異有統(tǒng)計(jì)學(xué)意義(P<0.05,圖6)。
圖6 NCP模型RFs的Kaplan-Meier分析Fig.6 Kaplan-Meier analysis of the RFs of the NCP model.
單因素分析結(jié)果顯示,X1、X3、X4、X5、X6、X7,是PFS的風(fēng)險(xiǎn)因子(P<0.05),將其納入多因素Cox 回歸分析;多因素結(jié)果顯示,X3 以及X6 仍具有顯著性(P<0.05),是PFS的獨(dú)立風(fēng)險(xiǎn)因子(表3)。
表3 NCP模型中RFs的單變量和多變量Cox回歸分析Tab.3 The univariate and multivariate Cox regression analysis of the RFs of the NCP model
NCP模型特征在不同數(shù)據(jù)集上的ccRCC患者風(fēng)險(xiǎn)評分分析(圖7)。其中a表示每個(gè)患者的風(fēng)險(xiǎn)評分分布;b表示ccRCC患者的生存狀態(tài)與生存時(shí)間的關(guān)系(按風(fēng)險(xiǎn)評分排序);c表示RFS的熱圖,從紅色到綠色表示水平從高到低。模型在訓(xùn)練集(圖7A)、測試集(圖7B)以及所有數(shù)據(jù)集(圖7C)上的風(fēng)險(xiǎn)評分基本一致,所選特征有較好的魯棒性。其中X3為危險(xiǎn)因素,其表達(dá)分布與危險(xiǎn)評分相似;相反,X6是一個(gè)保護(hù)因素。
圖7 在訓(xùn)練集、測試集和全數(shù)據(jù)集上,ccRCC患者基于NCP模型RFs的風(fēng)險(xiǎn)評分分析Fig.7 Risk score analysis of ccRCC patients in the training set,test set and all data set based on the RFs of the NCP model.
ccRCC作為最常見的腎癌病理亞型,具有侵襲性最強(qiáng)、腫瘤相關(guān)致死率最高的特點(diǎn)[22],因此,能在術(shù)前通過無創(chuàng)的預(yù)測方法準(zhǔn)確判斷ccRCC患者的病理核分級,對患者的后續(xù)針對性治療具有重要的意義。
本研究引入了差異化網(wǎng)絡(luò)分析方法選擇高低級別的RFs并構(gòu)建預(yù)測模型。實(shí)驗(yàn)結(jié)果表明,基于差異化網(wǎng)絡(luò)分析構(gòu)建的NCP模型具有良好的預(yù)測能力和出色的魯棒性,與3種經(jīng)典的機(jī)器學(xué)習(xí)模型和臨床模型相比具有很強(qiáng)的競爭力。相比于其他特征選擇方法在驗(yàn)證集和測試集性能較訓(xùn)練集急劇下降不同,基于差異化網(wǎng)絡(luò)分析構(gòu)建的NCP模型表現(xiàn)穩(wěn)定,在訓(xùn)練集、驗(yàn)證集以及測試集中的AUC分別為0.78、0.76以及0.75。其中一個(gè)原因可能是我們的特征選擇方法更關(guān)注的是RFs的高低等級網(wǎng)絡(luò)的拓?fù)洳町?,而不是在?xùn)練集中的預(yù)測性能,避免了模型的過擬合。另一方面,我們的方法使用Glasoo構(gòu)造網(wǎng)絡(luò)模型,充分考慮了特征間的高階相關(guān)性,能有效處理小樣本問題,因此確保了所選RFs具有更強(qiáng)的魯棒性和良好的泛化性能。
在差異化網(wǎng)絡(luò)分析中,不同的網(wǎng)絡(luò)構(gòu)建方法可能導(dǎo)致截然不同的結(jié)果。最常見的構(gòu)建方法是Pearson相關(guān)系數(shù)網(wǎng)絡(luò)模型。然而,Pearson相關(guān)性在反映兩個(gè)特征的相關(guān)性時(shí)可能具有誤導(dǎo)性,因?yàn)樗雎粤似渌卣鞯挠绊懀?3]。Glasso 的提出解決了這一問題,它依賴于Boltzmann的熵最大化概念來支持統(tǒng)計(jì)推斷,對缺失信息形式的依賴最?。?9]。基于此構(gòu)建的網(wǎng)絡(luò)模型可以描述在去除間接影響后,特征間仍然存在的相關(guān)性,因此能提供更可靠的信息?;谏鲜鲈?,Glasso被用來構(gòu)建WHO/ISUP的高低級別網(wǎng)絡(luò)。
本研究基于Glasso的差異化網(wǎng)絡(luò)分析方法構(gòu)建了一種無創(chuàng)的WHO/ISUP核分級預(yù)測模型,可以僅通過NCP掃描,即可有效預(yù)測患者的核分級。實(shí)驗(yàn)結(jié)果表明,該NCP模型能在術(shù)前有效預(yù)測腫瘤的核分級,有助于對ccRCC的治療做出更準(zhǔn)確的決策。針對影像組學(xué)的相關(guān)研究,我們的結(jié)論與既往研究[20,24]一致,他們也發(fā)現(xiàn)NCP期相的相關(guān)特征能更好的反映分級。同時(shí),更多數(shù)基于傳統(tǒng)的機(jī)器學(xué)習(xí)方法的研究小組則認(rèn)為,來自增強(qiáng)期或聯(lián)合期相的RFs表現(xiàn)更佳。例如,有學(xué)者通過LASSO篩選CMP和NP期相特征構(gòu)建分級預(yù)測模型[25];有研究發(fā)現(xiàn)通過機(jī)器學(xué)習(xí)的方法構(gòu)建了基于NCP、CMP和NP期相的混合模型的性能比單一期相模型的預(yù)測性能更佳[26]。
本文首次探討了WHO/ISUP 核分級預(yù)測模型的RFs與ccRCC的PFS之間的關(guān)系,以往大多數(shù)研究只是單獨(dú)探討預(yù)測核分級或生存分析,而不是將二者結(jié)合起來研究。例如,有研究只是通過相關(guān)機(jī)器學(xué)習(xí)方法構(gòu)建了分級預(yù)測模型[27-28],有研究則只探討了1~3期腎透明細(xì)胞癌術(shù)后復(fù)發(fā)的相關(guān)生存分析實(shí)驗(yàn)結(jié)果[29-30]。本研究在分級預(yù)測模型的基礎(chǔ)上,通過生存分析實(shí)驗(yàn),探討了用于分級的特征與預(yù)后的關(guān)系,結(jié)果表明,核分級模型中選擇的幾乎所有RFs都能有效預(yù)測PFS。其中X3是PFS的危險(xiǎn)因素,X6是PFS的保護(hù)因素。以上結(jié)果證明了用于預(yù)測分級的RFs與ccRCC的PFS存在關(guān)聯(lián),驗(yàn)證了本文使用的特征選擇方法有較強(qiáng)的可解釋性。
綜上,基于差異化網(wǎng)絡(luò)分析特征選擇構(gòu)建的平掃期模型不僅可以有效預(yù)測腎透明細(xì)胞癌的WHO/ISUP核分級,同時(shí)該模型的特征也能很好的預(yù)測無進(jìn)展生存期,有較強(qiáng)的可解釋性。但本研究仍有值得改進(jìn)之處:首先,本研究是一項(xiàng)單中心的回顧性研究,僅納入了175例ccRCC患者,研究結(jié)果仍存在抽樣誤差。其次,模型的性能還需要與其它的網(wǎng)絡(luò)構(gòu)建方法、基于過濾的特征選擇方法進(jìn)行比較,來進(jìn)一步深入驗(yàn)證差異化網(wǎng)絡(luò)分析的有效性。此外,僅使用PFS的保護(hù)或危險(xiǎn)因素來證明RFs的可解釋性還不夠充分。最后,本研究構(gòu)建的NCP模型如果應(yīng)用于實(shí)際臨床診斷,仍需其他大規(guī)模的外部數(shù)據(jù)來進(jìn)一步驗(yàn)證。