李祖飛,黃志剛,房居高,陳曉紅,鐘琦,李平棟,侯麗珍,高文,張洋
100730 北京,首都醫(yī)科大學(xué)附屬北京同仁醫(yī)院 耳鼻咽喉頭頸外科
喉鱗狀細(xì)胞癌(laryngeal squamous cell carcinoma,LSCC)大約占所有新發(fā)癌癥病例的0.8%和癌癥死亡病例的0.6%,男性比女性更易發(fā)病,發(fā)病率男女之比為5∶1,其主要危險因素是煙草,次要因素包括喉咽反流、人乳頭瘤病毒感染、環(huán)境或職業(yè)暴露以及酒精等,隨著婦女吸煙的增加,婦女喉癌的發(fā)病率也隨之增加[1-2]。喉癌的生存率與疾病的初始階段密切相關(guān),早期T1和T2腫瘤的治愈率高達(dá)80%~90%,而IV期患者的生存率下降到40%[3]。
近年來,人工智能在腫瘤的診斷、治療及預(yù)后方面扮演了重要的角色。通過對患者的人口學(xué)資料以及腫瘤的臨床資料,甚至是內(nèi)鏡圖像、影像學(xué)資料、采集到的生理信號等參數(shù)進(jìn)行分析,采用人工智能算法建立模型,可以對腫瘤進(jìn)行診斷上的輔助,預(yù)測腫瘤的預(yù)后[4-5]。人工智能算法包括機(jī)器學(xué)習(xí)及深度學(xué)習(xí)兩大類,其中常用的機(jī)器學(xué)習(xí)算法有:支持向量機(jī)(support vector machine,SVM)、決策樹(decision tree,DT)、隨機(jī)森林(random forest,RF)、線性判別分析(linear discriminant analysis,LDA)、集成學(xué)習(xí)(包括AdaBoost,XGBoost等)、K鄰近算法(K-nearest neighbor,KNN)及樸素貝葉斯模型等,不同算法在不同的數(shù)據(jù)集分別有不同的模型表現(xiàn)[6-7]。人工智能算法應(yīng)用于頭頸部腫瘤的相關(guān)研究已有報(bào)道[8-13],如有研究將機(jī)器學(xué)習(xí)方法建立的模型用于指導(dǎo)頭頸腫瘤的輔助治療[8];Smith等[9]通過應(yīng)用機(jī)器學(xué)習(xí)算法建模,為放療失敗的喉癌患者預(yù)測是否值得行挽救性喉切除術(shù),為喉癌的個體化和精準(zhǔn)治療提供了數(shù)據(jù)信息;Zhang 等[10]發(fā)現(xiàn)應(yīng)用深度學(xué)習(xí)算法建立的模型可以提高術(shù)中冰凍病理診斷的準(zhǔn)確性,有助于喉癌的外科治療。但是,使用人工智能方法構(gòu)建預(yù)測喉癌患者5年生存率預(yù)測模型尚未見報(bào)道,我們首次應(yīng)用人工智能機(jī)器學(xué)習(xí)算法,構(gòu)建預(yù)測喉癌患者5年生存狀態(tài)的預(yù)測模型,判斷不同年齡、分期,不同治療方法等狀態(tài)下喉癌患者5年生存率,為臨床醫(yī)生的診治提供參考。
本研究為回顧性分析研究,納入數(shù)據(jù)均來自北京同仁醫(yī)院,共隨訪了確診于2003年7月至2016年3月的147例喉癌患者,隨訪截止時間為2021年3月。納入標(biāo)準(zhǔn)為:1)隨訪時間滿5年(即2016年3月以前于本院就診的喉癌患者);2)年齡18歲以上的成年患者;3)經(jīng)病理確診證實(shí)為喉癌的患者。排除標(biāo)準(zhǔn)為:1)剔除病歷資料不全患者;2)剔除失訪患者;3)排除合并其他腫瘤患者;4)排除在我院就診前已有放化療病史的患者。為保證模型的準(zhǔn)確性與可靠性,剔除23例失訪數(shù)據(jù),最終納入124例用于預(yù)測模型的訓(xùn)練與測試,其中60%數(shù)據(jù)為訓(xùn)練集,另外40%作為測試集,訓(xùn)練集與測試集的劃分方式為應(yīng)用基于Python編程語言的sklearn庫里的train_test_split模塊進(jìn)行隨機(jī)分配,隨機(jī)種子設(shè)置為42。
將患者的性別(女性賦值0,男性賦值1)、年齡、是否抽煙(不抽煙賦值為0,抽煙賦值1)、是否飲酒(無飲酒史賦值為0,有者賦值1)、TNM分期(T,M,N分為3個特征,其中T分期賦值1、2、3、4,分別代表T1、T2、T3、T4;N為有無淋巴結(jié)轉(zhuǎn)移,有者賦值為1,無者賦值為0;M為是否轉(zhuǎn)移,無轉(zhuǎn)移賦值為0,有轉(zhuǎn)移賦值為1);腫瘤的臨床分期(賦值1、2、3、4分別代表1期、2期、3期與4期)、有無復(fù)發(fā)(無賦值0,有賦值1),有無放化療(無賦值0,有賦值1)及病理分級(原位癌賦值0,高分化賦值為1,高中分化及中分化賦值為2,中低分化及低分化賦值為3)。上述共計(jì)11個臨床參數(shù)作為訓(xùn)練模型的特征。所有特征與5年生存狀態(tài)之間的關(guān)系采用Spearman相關(guān)系數(shù)進(jìn)行相關(guān)性分析。此外,我們還對不同特征下喉癌五年生存狀態(tài)差異進(jìn)行分析,采用交叉表卡方檢驗(yàn)來實(shí)現(xiàn)。
機(jī)器學(xué)習(xí)算法主要采用算法,所有參數(shù)均設(shè)置為默認(rèn),除此之外,我們還采用了一些其它常用的機(jī)器學(xué)習(xí)算法進(jìn)行對比分析,如SVM、RF、DT及KNN等。
采用Python(3.8版本)編程語言實(shí)現(xiàn)統(tǒng)計(jì)學(xué)及模型建立,其中,Spearman相關(guān)分析采用基于Python的Pandas庫里的corr模塊進(jìn)行分析,采用基于Python的seaborn庫和matplotlib庫進(jìn)行作圖,人工智能機(jī)器學(xué)習(xí)模型建立采用基于Python的sklearn機(jī)器學(xué)習(xí)庫實(shí)現(xiàn)。
模型的評估采用以下幾個指標(biāo)實(shí)現(xiàn):準(zhǔn)確率、靈敏度、特異度、曲線下面積(area under the curve,AUC)、F1值和Cohen’s kappa系數(shù)。對于模型結(jié)果的評估,我們希望最終獲得的結(jié)果不能出現(xiàn)某個指標(biāo)過低的情形,比如,某個算法得出的模型結(jié)果,準(zhǔn)確率與靈敏度較高,但是特異性極低,那我們將排除此模型作為最終模型的建立。此外,我們還設(shè)置了混淆矩陣,以對模型的測試結(jié)果進(jìn)行可視化直觀評估。
本研究資料滿足使用LDA的條件,納入數(shù)據(jù)除年齡外,其余數(shù)據(jù)均為分類變量,在所有分類變量中,除臨床分期、T分期以及病理分級為有序變量資料外,其余皆為無序變量資料。采用SPSS 20.0版本進(jìn)行統(tǒng)計(jì)學(xué)分析,不同特征下5年生存狀態(tài)差異采用卡方檢驗(yàn)分析,生存曲線采用Kaplan-Meier法,各變量之間的關(guān)系采用Spearman相關(guān)分析,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
本研究共納入124例喉癌患者數(shù)據(jù),年齡為38~85歲[平均(62.4±11.1)歲],其人口學(xué)資料及不同臨床特征下喉癌患者的生存狀態(tài)比較見表1,各臨床特征分別作生存曲線圖(圖1)。除年齡與有無放化療史外,其余特征下生存狀態(tài)差異均有統(tǒng)計(jì)學(xué)意義:女性喉癌患者5年生存比率明顯高于男性,預(yù)后較佳(χ2=6.323,P=0.012);有抽煙、飲酒史,有淋巴結(jié)轉(zhuǎn)移、遠(yuǎn)處轉(zhuǎn)移者及有復(fù)發(fā)者,預(yù)后較差(均P<0.05);晚期(III~I(xiàn)V期)喉癌患者預(yù)后較早期(I~I(xiàn)I期)差(χ2=4.336,P=0.047),T1患者預(yù)后好于T2~4期患者(χ2=4.237,P=0.042),高、中分化患者預(yù)后要好于較低分化者(χ2=26.215,P<0.001)。
表1 入組患者臨床資料表及不同臨床特征下生存狀態(tài)比較
圖1 不同臨床特征分組下的生存曲線圖
特征的重要性以所有納入模型訓(xùn)練的特征與5年生存狀態(tài)之間的相關(guān)性分析來判定,見相關(guān)性熱圖(圖2),圖中數(shù)字為相關(guān)系數(shù)r,其中正值表示正相關(guān),負(fù)值為負(fù)相關(guān)??梢娨韵绿卣髋c喉癌患者5年生存狀態(tài)呈負(fù)相關(guān):性別(r=-0.23,P=0.012)、腫瘤的T分期(r=-0.19,P=0.027)、有無淋巴結(jié)轉(zhuǎn)移(r=-0.28,P=0.002)、有無遠(yuǎn)處轉(zhuǎn)移(r=-0.37,P<0.001)、臨床分期(r=-0.27,P=0.004)、病理分級(r=-0.46,P<0.001)、有無復(fù)發(fā)(r=-0.48,P<0.001)、有無飲酒史(r=-0.2,P=0.028)、有無抽煙史(r=-0.33,P<0.001)。年齡、是否放化療在本研究中與喉癌患者的預(yù)后不相關(guān)(P=0.182,P=0.603),但是考慮到這些特征均為臨床診治中重要一環(huán),因此我們將這些特征全部納入模型訓(xùn)練。
圖2 特征與5年生存狀態(tài)相關(guān)性熱圖
LDA模型的混淆矩陣和ROC曲線圖見圖3,從混淆矩陣中可以看出,測試集中,有11例死亡患者被正確預(yù)測,約占85%,僅2例未被正確預(yù)測,模型的準(zhǔn)確率、靈敏度、特異度、AUC、F1值及Cohen’s kappa值分別為:0.86、0.86、0.85、0.86、0.86和0.66。
圖3 測試集LDA模型的混淆矩陣與ROC曲線
不同算法的結(jié)果對比見表2,可見LDA算法獲得最佳模型結(jié)果,雖然SVM和RF算法以及ADABoost和XGBoost集成學(xué)習(xí)算法的準(zhǔn)確率及靈敏度較高,但其特異度均過低,因此我們最終選擇LDA作為本研究模型建立的算法。
表2 不同機(jī)器學(xué)習(xí)算法模型結(jié)果對比
本文采用LDA算法進(jìn)行模型建立,除此之外,我們也針對本文的數(shù)據(jù)采用其他機(jī)器學(xué)習(xí)算法進(jìn)行了計(jì)算,最終發(fā)現(xiàn)LDA的模型表現(xiàn)最佳。基于LDA算法建立的預(yù)測喉癌患者5年生存率的預(yù)后模型的準(zhǔn)確率、靈敏度、特異度、AUC、F1值及Cohen’s kappa系數(shù)均較滿意,提示本模型可靠且具有一定的應(yīng)用價值。
對于人工智能機(jī)器學(xué)習(xí)算法建立的模型而言,特征的選擇尤為重要,不同的特征選擇直接關(guān)系到模型的準(zhǔn)確性與泛化性[14-15]。所有與預(yù)測目標(biāo)相關(guān)的因素均可作為潛在的特征,在通過一定算法篩選后,即可作為預(yù)測目標(biāo)的特征。在本研究中,所要預(yù)測的目標(biāo)為喉癌患者5年生存狀態(tài),那么,所有與之有關(guān)的如患者的人口學(xué)資料和臨床資料均具備作為本模型預(yù)測特征的可能性。常用的特征篩選辦法有相關(guān)性分析、遞歸特征消除法、主成分分析等方法[16]。本研究采取的特征篩選方法為相關(guān)性分析法,將與預(yù)測目標(biāo)有相關(guān)性的臨床資料均作為模型的預(yù)測特征。本研究發(fā)現(xiàn)除了年齡與是否放化療這兩個臨床資料外,其余臨床資料(患者的性別、抽煙史、飲酒史、喉癌的臨床分期、T分期、有無遠(yuǎn)處轉(zhuǎn)移、有無淋巴結(jié)轉(zhuǎn)移、有無復(fù)發(fā)及腫瘤的病理分級)均與喉癌患者5年生存狀態(tài)存在相關(guān)性。雖然年齡以及有無放化療這兩個參數(shù)與喉癌5年生存狀態(tài)之間相關(guān)性不明顯,但是考慮到這些參數(shù)也是重要的臨床特征,且本研究樣本量相對較小,因此,我們也將這些參數(shù)作為特征納入模型訓(xùn)練。
喉癌的發(fā)病具有明顯的性別差異,通常男性發(fā)病率遠(yuǎn)大于女性,一項(xiàng)研究指出,女性喉癌患者與男性相比,通常預(yù)后更好,生存時間更長[17],這點(diǎn)與我們的結(jié)果一致:性別與喉癌患者5年生存狀態(tài)相關(guān),女性喉癌患者5年生存狀態(tài)較男性好。
抽煙史與飲酒史是喉癌發(fā)病的獨(dú)立危險因素,也與喉癌的預(yù)后相關(guān),具有抽煙史和飲酒史的喉癌患者預(yù)后更差[18],這點(diǎn)也與我們的研究一致,抽煙史與飲酒史與喉癌患者5年生存狀態(tài)呈負(fù)相關(guān)。喉癌的臨床分期、有無淋巴結(jié)轉(zhuǎn)移與遠(yuǎn)處轉(zhuǎn)移,皆為眾所周知的與喉癌預(yù)后明顯相關(guān)的臨床因素[2,18],本研究對人口學(xué)資料及臨床資料的分析結(jié)果顯示,有無遠(yuǎn)處轉(zhuǎn)移、淋巴結(jié)轉(zhuǎn)移、腫瘤的臨床分期也與喉癌患者5年生存狀態(tài)呈負(fù)相關(guān)。因此,上述臨床資料均納入為本模型的預(yù)測特征。
本研究中,喉癌的分化水平與其死亡和復(fù)發(fā)風(fēng)險顯著相關(guān)。有研究顯示,晚期但分化良好的喉癌患者的預(yù)后明顯優(yōu)于早期但分化差的患者[19],因此,喉癌的病理分級水平在喉癌的預(yù)后中占有較為重要的比重,一項(xiàng)研究顯示,低分化和高分化LSCC的5年控制率分別為44%和76%,低分化LSCC頸淋巴結(jié)轉(zhuǎn)移率高,生存率低[20],這點(diǎn)與本研究結(jié)果一致:5年后喉癌患者生存狀態(tài)與其病理分級水平呈負(fù)相關(guān),病理分級作為本模型的預(yù)測特征之一,占有較大權(quán)重。
不同的機(jī)器學(xué)習(xí)算法間,各有優(yōu)缺點(diǎn),并不存在某種算法絕對優(yōu)于另一種算法的情形,不同算法在不同的數(shù)據(jù)集,各有其表現(xiàn),比如,在某一數(shù)據(jù)集中,SVM算法做的模型最佳,但是在另一數(shù)據(jù)集中,可能會是RF算法效果最佳,因此,沒有最優(yōu)秀的機(jī)器學(xué)習(xí)算法,只有最合適該數(shù)據(jù)集的算法[6-7]。在本研究中,雖然SVM、RF算法以及ADABoost和XGBoost集成學(xué)習(xí)算法的準(zhǔn)確率及靈敏度較高,但其特異度均過低,而LDA算法各指標(biāo)均較滿意,因此我們最終選擇LDA作為建立本研究模型的算法,通過對模型的輸入部分輸入患者的上述特征數(shù)據(jù),即可預(yù)測該患者5年后的生存狀態(tài),為喉癌患者的個體化治療以及預(yù)后預(yù)測提供了一個新的輔助手段。
當(dāng)然,本研究也存在以下兩點(diǎn)不足:1)樣本量過小。由于為確保模型能有準(zhǔn)確的數(shù)據(jù)進(jìn)行訓(xùn)練,我們剔除了部分失訪及隨訪不足5年數(shù)據(jù),因此樣本量偏小,對模型的穩(wěn)定性以及泛化能力有一定影響;2)本模型僅適用于對喉癌患者的5年生存狀態(tài)做預(yù)測,并沒有對患者3年生存狀態(tài)做預(yù)測,因?yàn)?年后還存活的患者比例遠(yuǎn)大于已經(jīng)死亡的喉癌患者,因此訓(xùn)練時會出現(xiàn)數(shù)據(jù)分布過于不平衡的問題,因此,我們只對喉癌患者5年生存狀態(tài)進(jìn)行預(yù)測。在未來的研究里,我們會納入更多喉癌患者生存數(shù)據(jù),并嘗試更多人工智能算法,以對喉癌的人工智能生存預(yù)后模型進(jìn)行進(jìn)一步研究。
綜上所述,我們成功的采用LDA人工智能算法建立了一個喉癌5年生存狀態(tài)的預(yù)測模型,本模型可為喉癌臨床診治提供一定參考。人工智能算法有望在喉癌的臨床診治及預(yù)后判斷里發(fā)揮更多功能。
作者聲明:本文全部作者對于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;并承諾論文中涉及的原始圖片、數(shù)據(jù)資料等已按照有關(guān)規(guī)定保存,可接受核查。
學(xué)術(shù)不端:本文在初審、返修及出版前均通過中國知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)的學(xué)術(shù)不端檢測。
同行評議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。
利益沖突:所有作者均聲明不存在利益沖突。
文章版權(quán):本文出版前已與全體作者簽署了論文授權(quán)書等協(xié)議。