高文治,何宇輝,夏漫城,鞏艷青,何世明,張建燁,周利群,郭躍先,李學松
(1.北京大學第一醫(yī)院泌尿外科,北京 100000;2.河北醫(yī)科大學第三醫(yī)院泌尿外科,河北省石家莊市 050000)
前列腺癌是泌尿外科最常見的惡性腫瘤之一,在美國前列腺癌的發(fā)病率已經超過肺癌位居危害男性健康的腫瘤之首,近年來在我國的發(fā)病率和病死率呈逐年上升趨勢。流行病學調查資料顯示美國2020 年新增前列腺癌患者超過24 萬例,死亡達3.4 萬例[1];中國預計新增前列腺癌人數(shù)超10 萬,死亡人數(shù)超5萬[2]。根治性前列腺癌切除術是前列腺癌的主要治療手段,但術后生化復發(fā)率較高,這說明前列腺癌根治術后體內仍有殘留的前列腺癌病灶[3]。目前關于預測前列腺癌生化復發(fā)的單一指標都有一定的局限性,為克服此局限性,本文綜合當前的研究現(xiàn)狀,收集前列腺癌根治術后患者的相關臨床信息作為研究變量,通過深度學習算法確定納入模型的最佳變量組合,采用多種機器學習方法建立前列腺癌生化復發(fā)預測模型,并將得到的模型應用于臨床,評價模型的準確性,旨在揭示深度學習在前列腺癌生化復發(fā)中的應用價值,為前列腺癌生化復發(fā)的預測提供新的思路。
1.1 數(shù)據(jù)收集及變量介紹收集2001 年3 月-2016年11月北京大學第一醫(yī)院泌尿外科接受前列腺癌根治術后442 例患者的臨床信息,包括患者年齡、身體質量指數(shù)(body mass index,BMI)、是否有前列腺癌家族史、既往史、吸煙史、飲酒史、術前是否行新輔助內分泌治療、化驗結果、前列腺特異性(prostate specific antigen,PSA)密度、穿刺前穿刺前總的前列腺特異抗原(total prostate specific antigen,tPSA)、穿刺前游離PSA(free PSA,f PSA)與tPSA 比 值(f/t PSA)、前tPSA、術前f/t PSA、直腸指診、磁共振結果、骨掃描、臨床分期、前列腺體積、B 超下結節(jié)、穿刺陽性率、穿刺Gleason 主次要評分、手術病理Gleason主次要評分、前列腺周圍脂肪有無侵犯、前列腺尖部是否侵犯、精囊是否侵犯、淋巴結侵犯情況及陽性淋巴結百分率共48 個變量用于建模,基線資料如表1。本文共納入樣本442 例,其中前列腺癌生化復發(fā)患者60 例,前列腺癌未生化復發(fā)382 例。
表1 前列腺癌根治術后442 例患者臨床信息
1.2 數(shù)據(jù)預處理
1.2.1缺失值處理 絕大部分患者的臨床信息能夠完整收集,但仍有少部分患者的信息缺失。我們僅納入缺失數(shù)據(jù)小于10%的442 例患者,使用拉格朗日插值法插值填充缺失值的方法,補全所有患者信息[4]。
1.1.2結局變量 納入的所有患者均接受了前列腺癌根治術,以術后患者出現(xiàn)術后較最低PSA 上升>0.2 ng/mL 或PSA 絕對值>0.4 ng/mL 為“金標準”,若隨訪結果顯示為術后較最低PSA 上升>0.2 ng/mL 或PSA 絕對值>0.4 ng/mL 則為陽性樣本,否則為陰性樣本[5]。本文共納入422 例樣本,其中陽性樣本60 例,陰性樣本382 例,用于建立模型。
1.3 模型構建方法
1.3.1卷積神經網絡 卷積神經網絡(convolutional neural networks ,CNN)在提取局部特征方面優(yōu)勢明顯,主要由輸入層、卷積層、池化層、全連接層4 部分。CNN 主要是通過卷積層數(shù),提取更高層次特征,通過CNN 提取的特征對前列腺癌生化復發(fā)具有特異性和分辨力[6]。
卷積層利用多個不同卷積核對輸入前列腺癌根治術后患者信息變量進行計算,產生新的特征,經過運算,從而輸出預測生化復發(fā)結果。
1.3.2長短期記憶網絡 長短期記憶網絡(long short-term memory ,LSTM)是循環(huán)神經網絡中的一種,LSTM 模型包含多個LSTM 單元,每個LSTM 單元包含遺忘門、輸入門、輸出門3 種門結構,以及一個細胞狀態(tài)更新共同進行控制,以此來保持和更新狀態(tài)信息并進行傳遞,該方法擅長處理持續(xù)的數(shù)據(jù)序列,能有效處理臨床數(shù)據(jù)序列,可以很好地實現(xiàn)對時序數(shù)據(jù)的建模[7]。
1.3.3卷積神經網絡模型及雙向長短期記憶神經網絡模型結構 卷積神經網絡模型及雙向長短期記憶神經網絡模型(convolutional neural networks-bi long short-term memory,CNN-BiLSTM)是融合卷積神經網絡和雙向長短期記憶的模型,解決較長信息的長期依賴問題,同時有效實現(xiàn)特征與類別標簽相關性的可解釋性,即在不降低準確率與不提高誤報率的同時,讓模型具有自適應更新的能力,來應對預測前列腺癌的生化復發(fā)[8]。
CNN-BiLSTM 模 型 由 輸 入 層、4 個 卷 積 層、1 個池化層、2 個LSTM 層、4 個全連接層和1 個輸出層組成。將前列腺癌根治術后患者數(shù)據(jù)直接作為模型輸入,通過卷積層循環(huán),從而輸出預測生化復發(fā)結果。
將該模型與其他常見的CNN 和LSTM 進行比較,對比模型有卷積神經網絡模型及雙向長短期記憶神經網絡(convolutional neural networks-long shortterm memory,CNN-LSTM)、雙向長短期記憶神經網絡(bi long short-term memory,BiLSTM)和卷積神經網絡雙向門控循環(huán)單元(convolutional neural networks-Area under Curve,CNN-BiGRU),我們采用精確度(precision)準確度(accuracy)、召回率(recall)、f1 值和曲線下面積(area under curve,AUC)來評估模型效能。準確率是分類正確樣本占樣本總數(shù)的比例,通常情況下,準確率越高模型越好;精確率是分類正確的正樣本數(shù)占被分類為正樣本的樣本數(shù)的比例,體現(xiàn)了模型的精度,召回率是分類正確的正樣本占總的正樣本的比例,衡量的是查全率,在數(shù)據(jù)集構建的模型中常作為重要評估指標。
其中,TP 代表正確地把正樣本預測為正,F(xiàn)N 代表錯誤地把正樣本預測為負,F(xiàn)P 代表錯誤地把負樣本預測為正,TN 代表正確地把負樣本預測為負。
2.1 模型分析為進一步提高模型性能,采用五折交叉驗證劃分訓練集和測試集,運用深度學習方法選取雙向長短期記憶神經網絡(bi long short-term memory,BiLSTM)、CNN-BiLSTM、CNN_LSTM、LSTM 等分類器,構建前列腺癌生化復發(fā)預測模型。為驗證不同算法構建的模型性能,采用精確度、準確度、召回率、F1 值和AUC 共4 個指標對生化復發(fā)預測模型進行評價和比較。4 種算法構建的模型性能略有差異,使用CNN-BiLSTM 方式建立的模型中準確率最高76.7%,受試者工作曲線下面積為0.71(表2、圖1)。
表2 不同模型的檢驗效能
圖1 各指標ROC 曲線
2.2 模型驗證為進一步驗證模型性能,將模型應用于臨床研究,采用相同的納入標準和排除標準,收集30 例患者,陽性15 例,陰性15 例作為測試集,采用CNN-BiLSTM 算法應用相同的參數(shù)進行模型評估。得出結論,CNN-BiLSTM 模型效果最好,準確率達76.7%,受試者工作曲線下面積為0.71。
近些年來,我國的前列腺癌患者逐年增多,同時術后大約25%的患者面臨生化復發(fā)[9]。預測患者的生化復發(fā),對指導醫(yī)生調整治療方案有重要意義。本文旨在運用深度學習方法,根據(jù)患者信息,可以快速無創(chuàng)預測生化復發(fā)結果,同時減輕患者經濟負擔。面對臨床龐大信息量,如何篩選變量及選擇深度學習算法是面臨的主要問題。
深度學習算法在醫(yī)學中的應用將已有的信息不斷重組,提升性能,屬于多領域交叉學科。近些年來,深度學習基于大數(shù)據(jù)的前列腺癌相關疾病預測愈加成熟,對于前列腺癌根治術后生化復發(fā)的預測預熱成為了目前的一個熱點[5]。相關文獻中,大多是構建前列腺癌的預測模型,如杜超等[10]基于集成算法算法構建的前列腺癌預測模型,有較高的準確率預測前列腺癌的發(fā)生,準確率最高可達79%。曹文哲等[11]基于BP 神經網絡、Logistic 回歸和隨機森林算法構建前列腺癌診斷預測模型,準確率最高可達77%。但目前關于前列腺癌術后生化復發(fā)的預測模型較少,而關于通過前列腺癌生化復發(fā)預測患者前列腺癌特性性死亡率患者的意義也很重大。文獻報道通過術前PSA、病理Gleason 評分、前列腺外擴張、精囊浸潤、前列腺癌生化復發(fā)時間、前列腺癌生化復發(fā)PSA 水平和PSA倍增時間這些參數(shù)構建并驗證了列線圖,預測根治性前列腺切除術后患有前列腺癌生化復發(fā)的男性在10年時發(fā)生前列腺癌特異性死亡的風險[11],可用于患者咨詢和前列腺癌臨床試驗的設計。本研究運用CNN、LSTM 與CNN-BiLSTM3 種方法,構建前列腺癌生化復發(fā)預測模型,在測試集中CNN-BiLSTM 方式建立的模型中準確率達76.7%。區(qū)別于癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫等分析,本研究采用北京大學第一醫(yī)院2001 年3 月-2016年11 月前列腺癌根治術后患者隨訪數(shù)據(jù),更加具有實際意義。
但是,由于是本研究是基于臨床數(shù)據(jù)的回顧性研究,客觀上存在樣本量偏小的局限性,我們未來將進一步收集和關注更多前列腺癌相關患者信息,以盡可能減小該局限性所帶來的影響。同時本研究基于單中心展開,有一定的局限性,未來也會開展多中心合作,同時擴大樣本量,提高模型的預測準確性。自變量數(shù)目較多也是模型的一個局限性,因為構建模型中樣本量數(shù)目較少,只有通過擴大自變量數(shù)目才能進一步提高模型的準確性,通過深度學習中的算法擬合得出48 個最佳組合變量構建準確性最高的模型,但自變量數(shù)目過多在臨床實踐中的應用可操作性降低,后續(xù)在擴大樣本量優(yōu)化模型的同時,還需進一步調整自變量數(shù)目,使其更加符合臨床實際。綜上所述,深度學習算法在前列腺癌術根治術后生化復發(fā)的預測中,有較高的準確率,但其臨床應用尚待進一步研究。