于 李
我國乙型肝炎病毒(hepatitis B virus,HBV)相關(guān)原發(fā)性肝癌患者的生存率低,年齡標(biāo)化的5年相對生存率僅為10.1%[1]。 老齡化加劇導(dǎo)致老年患者比例增加,其病情復(fù)雜,治療難度大,使用現(xiàn)有癥狀評估及預(yù)后判定體系效果有限。 而中醫(yī)采用整體方式對患者進(jìn)行綜合評估[2]。
人工智能(artificial intelligence,AI)旨在模仿人類認(rèn)知功能,促進(jìn)醫(yī)療數(shù)據(jù)的可用性及分析技術(shù)發(fā)展,但醫(yī)學(xué)疾病非線性關(guān)系特征導(dǎo)致其建模難度大[3],因此須采用特定的方式。 人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)是一種受人類神經(jīng)突觸系統(tǒng)啟發(fā)的機(jī)器學(xué)習(xí)技術(shù),為模擬人腦的一種算法,可推導(dǎo)出描述樣本特征的數(shù)據(jù)模型[4]。 近年來,ANN 在醫(yī)療領(lǐng)域取得諸多方面的進(jìn)展[5]。 本研究旨在應(yīng)用ANN 算法結(jié)合中醫(yī)證候分類建立一種有效的預(yù)測模型,用于老年HBV 相關(guān)原發(fā)性肝癌患者的預(yù)后判定。
1.1 研究對象 選擇2010年1 月—2014年12 月于北京中醫(yī)藥大學(xué)第三附屬醫(yī)院收治診斷為HBV相關(guān)原發(fā)性肝癌老年患者408 例(≥60 歲),全部患者均住院治療。 收集患者人口學(xué)、疾病史、臨床資料、實(shí)驗(yàn)室及病理檢查結(jié)果等數(shù)據(jù)。 對入組患者進(jìn)行5年隨訪(生存或死亡)自患者死亡時(shí)間或隨訪時(shí)間點(diǎn)終止,平均隨訪時(shí)間為12 個(gè)月。
患者臨床診斷依據(jù)WHO HBV 相關(guān)原發(fā)性肝癌分類診斷標(biāo)準(zhǔn)[6]。 根據(jù)“臨床研究指導(dǎo)原則”,5 位高年資中醫(yī)學(xué)主任醫(yī)師(具有20年以上中醫(yī)行醫(yī)經(jīng)驗(yàn))以共識確定中醫(yī)證候[7]。 排除嚴(yán)重心血管、泌尿、造血等各系統(tǒng)重大疾病,以及心理障礙疾病患者。
1.2 預(yù)測變量及ANN 模型的選擇 通過應(yīng)用研究特定的特征提取軟件(KNIME 2.6)從27 個(gè)可用變量中(性別、確診時(shí)年齡、身高、體重、ALT、AST、ALP、白蛋白、總膽紅素、膽固醇、甘油三酯、血糖、血清鐵、鐵蛋白、T3、T4、TSH、AFP、腫瘤大小、原發(fā)腫瘤范圍、是否淋巴結(jié)轉(zhuǎn)移、是否遠(yuǎn)期轉(zhuǎn)移、腫瘤分化程度、是否存在門脈瘤栓、是否侵襲血管、腫瘤是否存在分隔及中醫(yī)辨證證候特征)提取出11 個(gè)(性別、確診時(shí)年齡、腫瘤大小、原發(fā)腫瘤范圍、是否淋巴結(jié)轉(zhuǎn)移、是否遠(yuǎn)期轉(zhuǎn)移、腫瘤分化程度、是否存在門脈瘤栓、是否侵襲血管、腫瘤是否存在分隔以及中醫(yī)辨證的證候特征),表1。
HBV 相關(guān)原發(fā)性肝癌老年患者的中醫(yī)證候特征與其他年齡患者不同,根據(jù)相關(guān)研究經(jīng)驗(yàn),將本研究入組的全部患者歸結(jié)為5 種主要證候,即脾虛證、肝腎陰虛證、肝膽濕熱證、肝郁氣滯證和肝血瘀阻證[7]。
采用單時(shí)間點(diǎn)神經(jīng)網(wǎng)絡(luò)模型[5],其可以在任意預(yù)定時(shí)間點(diǎn)有效預(yù)測患者的生存概率。
表1 基于神經(jīng)網(wǎng)絡(luò)模型用于評估患者預(yù)后的臨床特征
1.3 預(yù)測效果評價(jià) 通過計(jì)算準(zhǔn)確度、敏感度、特異度、陽性預(yù)測值、陰性預(yù)測值及曲線下的面積(area under curve,AUC)來評估ANN 預(yù)測模型的性能。本研究中,如果事件(死亡)在所預(yù)測的時(shí)間段內(nèi)未發(fā)生,則將患者分類為“存活”,否則將患者分類為“死亡”。 ROC 分析曲線的ANN 預(yù)測模型的預(yù)測精度由ROC AUC 表示。
總體AUC 的交叉驗(yàn)證估計(jì)值是從5 次獨(dú)立計(jì)算所獲得的5 個(gè)測試集的平均值。 模型校準(zhǔn)評估的預(yù)測與AUC 標(biāo)準(zhǔn)不同。 使用Hosmer-Lemeshow(HL)擬合優(yōu)度檢驗(yàn)?zāi)P瓦M(jìn)行校準(zhǔn)。 參與研究的所有受試者均根據(jù)其預(yù)測的死亡概率進(jìn)行分類,分為十分位數(shù)。 然后根據(jù)在每個(gè)十分位中觀察到的與預(yù)期生存概率之間的差異,進(jìn)行卡方檢驗(yàn)。 對于給定的有效水平α計(jì)算χ2和P值。P>0.05 表示預(yù)測結(jié)果與實(shí)際情況生存概率之間無顯著差異。
2.1 預(yù)測結(jié)果 單一時(shí)間點(diǎn)模型的目標(biāo)是,預(yù)測在特定時(shí)間點(diǎn)的死亡概率。 5 個(gè)獨(dú)立的單時(shí)間點(diǎn)ANN模型被用來預(yù)測1 ~5年內(nèi)的死亡率。 事件(死亡)的發(fā)生被編碼為1,事件的未發(fā)生被編碼為0。 模型輸出包括數(shù)據(jù)集中每個(gè)患者的一組死亡概率評估。在給定的時(shí)間點(diǎn),如果在該時(shí)間段內(nèi)沒有發(fā)生死亡,則將患者分類為“生存”,否則將其視為“死亡”。 對于特定患者,根據(jù)分類規(guī)則,“死亡”意味著網(wǎng)絡(luò)輸出大于截止水平,如P≥0.5,否則為“生存”。
首先,對模型進(jìn)行錯(cuò)誤分類的評估,表2 為1~5年內(nèi)預(yù)測的混淆矩陣。 ①在408 例患者中,106(76±30)例患者在1年內(nèi)死亡,302(291±11)例患者在1年內(nèi)存活。 該模型準(zhǔn)確預(yù)測出291 例生存患者和76 例死亡患者,準(zhǔn)確率為89.95%。 ②本研究結(jié)果表明,2年內(nèi)模型預(yù)測死亡患者人數(shù)的準(zhǔn)確率為85.78%。 在2年內(nèi),232(199±33)例患者死亡,176(164±12)例患者存活。 ANN 模型準(zhǔn)確預(yù)測了199名死亡患者和164 名生存患者,準(zhǔn)確率為88.97%。③3年內(nèi)有297(266±31)例患者死亡,111(99±12)例患者存活。 該模型對266 名死亡患者和99 名生存患者進(jìn)行了準(zhǔn)確分類,準(zhǔn)確率為89.46%。 此外,研究結(jié)果顯示4年和5年時(shí)預(yù)測的死亡患者人數(shù),并基于精度測量法對模型進(jìn)行了評估,表2。
表2 1~5年內(nèi)生存期的預(yù)測結(jié)果
2.2 基于5 次檢驗(yàn)的5 倍交叉效度分析所獲得的平均結(jié)果對運(yùn)用單時(shí)間點(diǎn)ANN 模型預(yù)測1 ~5年患者存活期的評估效果分析 對于1年生存期預(yù)測,ANN 模型的準(zhǔn)確率為90.3%,靈敏度為70.7%,特異性為96.2%,表明該模型在預(yù)測患者存活率優(yōu)于對患者死亡率的預(yù)測。 其陽性和陰性預(yù)測值分別為85.2%和91.5%。 AUC 為0.96(95%CI:0.871 ~0.928),結(jié)果提示本研究建立的老年晚期肝癌患者預(yù)后預(yù)測的單時(shí)間點(diǎn)ANN 模型是一個(gè)比較完善的模型。 對于2年生存期預(yù)測,單時(shí)間點(diǎn)ANN 模型的準(zhǔn)確率為88.9%,靈敏度為84.4%,特異性為93.2%。 陽性預(yù)測值是92.0%,陰性預(yù)測值為86.5%,表明在該模型預(yù)測的“生存”患者中,86.5%實(shí)際上存活,AUC 為0.958,表3。
表3 1~5年內(nèi)生存期的預(yù)測結(jié)果的準(zhǔn)確率、敏感度、特異度分析
近期研究表明,中醫(yī)藥在腫瘤防治的全過程中均可發(fā)揮重要作用,中醫(yī)辨證在其中起到關(guān)鍵性作用。 本研究通過中醫(yī)辨證明確患者個(gè)體的不同證候特征,并探尋其做為長期預(yù)后預(yù)測指標(biāo)的可行性、應(yīng)用前景及臨床價(jià)值。
本研究旨在探討是否能夠結(jié)合中醫(yī)證候數(shù)據(jù)建立一個(gè)有效的ANN 結(jié)構(gòu)模型用于患者預(yù)后預(yù)測。本研究在前期工作中已比較是否包括中醫(yī)辨證分型(5 型)做為預(yù)測模型指標(biāo),而未應(yīng)用中醫(yī)辨證分型(5 型)做為預(yù)測指標(biāo)的模型其預(yù)測準(zhǔn)確率僅在60%~70%之間。 同時(shí),經(jīng)權(quán)重分析證實(shí),中醫(yī)辨證分型(5 型)的相對權(quán)重為0.085(12.6%)。 因此,本研究所探討的預(yù)測模型中增加了中醫(yī)證候指標(biāo)做為預(yù)測因素。
本研究通過應(yīng)用單時(shí)間點(diǎn)前饋ANN 模型,同時(shí)結(jié)合中醫(yī)證候用于預(yù)測老年HBV 相關(guān)原發(fā)性肝癌患者術(shù)后1、2、3、4 及5年的生存率。 本預(yù)測模型,精確度范圍為88.7%~90.2%,靈敏度范圍為70.2%~92.5%,特異度范圍為66.7%~96.2%。 本模型AUC值大于0.9,表明該模型在1 ~5年內(nèi)預(yù)測老年HBV相關(guān)原發(fā)性肝癌患者的生存時(shí)間均較為準(zhǔn)確。
本研究提出的單時(shí)間點(diǎn)ANN 模型能夠?yàn)榛颊咛峁┥骖A(yù)測。 這些信息對于臨床醫(yī)生和患者均具有一定的臨床意義及價(jià)值。 對于高死亡風(fēng)險(xiǎn)患者可能需要獲得比低死亡風(fēng)險(xiǎn)患者更為頻繁的追蹤隨訪,以便將有限的資源向高風(fēng)險(xiǎn)患者傾斜,而所獲得預(yù)后的預(yù)測結(jié)果也有利于患者規(guī)劃其術(shù)后生活。本研究收集入組的均為≥60 歲的老年HBV 相關(guān)原發(fā)性肝癌患者且為小樣本單中心研究,隨訪病例數(shù)量有限。 有待進(jìn)一步深入探討該模型在其他年齡組HBV 相關(guān)原發(fā)性肝癌患者中的預(yù)測效果,同時(shí)應(yīng)進(jìn)行多中心長期隨訪研究。 此外,ANN 預(yù)測其他年齡問題未見國內(nèi)外相關(guān)研究報(bào)道,其優(yōu)劣勢也有待進(jìn)一步研究。