譚滬生 任敏
摘要:目的:探討治療使用生信方法對肝癌免疫治療進行指導。方法:在tcga數(shù)據(jù)庫下載數(shù)據(jù),使用R語言進行分析。結(jié)果:使用模型構建的低風險評分患者對抗PD-L1與抗CTLA4治療敏感性較高。結(jié)論:模型可以對抗PD-L1以及抗CLT4治療在肝癌患者中的應用效果起到預測作用。
關鍵詞:生物信息學;肝癌;免疫治療;預后分析
【中圖分類號】R735.7???????????? 【文獻標識碼】A???????????? 【文章編號】2107-2306(2021)15--01
肝癌是人類常見的惡性腫瘤之一。沒有療效確切的輔助治療手段??筆D-1單克隆抗體,在多項癌癥治療中,都扮演了化腐朽為神奇的角色。但因為高額的負擔,使肝癌患者在未有正面的預期情況下,難以下決心使用。本文使用TCGA數(shù)據(jù)庫下載的數(shù)據(jù)建立模型,預測肝臟惡性腫瘤患者對于抗PD-1單克隆抗體的敏感性,探索抗PD-1單克隆抗體在于肝癌的應用。
1方法
1.1數(shù)據(jù)下載與分析
在tcga數(shù)據(jù)庫下載數(shù)據(jù)。計算腫瘤組和正常組的基因表達量標準差,進行差異分析,得到在腫瘤樣品和正常組織樣品中表達有區(qū)別的差異基因(p<0.05),對數(shù)據(jù)進行校正后保存。通過immport數(shù)據(jù)庫,找到免疫相關基因,對免疫基因與得到的差異基因進行取交集,得到差異的免疫基因。
1.2預后模型建立
對差異免疫基因的表達數(shù)據(jù)和臨床數(shù)據(jù)中的生存時間數(shù)據(jù)進行合并,排除隨訪時間小于30天的樣本。對差異的免疫基因進行生存分析,找到與預后相關的免疫基因。用這些與預后相關的免疫基因,構建預后模型。將所有的樣本數(shù)據(jù)分組,得到train和test組(2:1),對分組的各項臨床性狀使用卡方檢驗。用train組的數(shù)據(jù)來構建模型,用test組的數(shù)據(jù)來驗證模型的準確性。預測模型風險得分=每個樣品中,所有與預后相關的免疫基因的表達量*風險系數(shù)后求總和。取train組風險打分的中位值,大于中位值為高風險組,小于中位值為低風險組。同樣的在test組中,風險得分大于train組中位值為高風先祖,小于中位值為低風險組。
1.3風險系數(shù)(coef)的確定
對train進行單因素cox分析,如果P值小于0.05,則說明該基因是預后相關基因,保留,反之則剔除。對留下的單因素顯著基因及其表達量進行l(wèi)asso回歸,構建lasso模型,剔除相關性過高的基因,防止模型的過度擬合,并找到交叉驗證誤差最小的點,得到各基因的風險系數(shù)。
1.4生存分析與ROC分析
對高低風險組進行生存分析,查看是否有高低風險的患者生存曲線是否有差異。查看ROC曲線下面積,推測模型準確率。
1.5獨立預后分析
將風險得分與其他臨床特征分別與生存時間和生存狀態(tài)做關聯(lián),若P<0.05,則認為為獨立預后相關。再做多因素獨立預后分析,若P<0.05,則認為獨立于其他臨床因素,與患者的預后相關。
1.6免疫治療分析
對于高低風險組的病人,哪一組更適合免疫治療。在tcia數(shù)據(jù)庫下載肝癌患者的免疫打分文件,與研究的全部患者取交集,按照高低風險分組,分別求得高低風險組的免疫打分,做差異分析,得到高低風險的免疫打分對比。
2結(jié)果
2.1樣本與免疫基因數(shù)量
TCGA下載數(shù)據(jù)總共465份樣本。其中正常樣品數(shù)量:58;腫瘤樣品數(shù)量:407。可以得到相對正常細胞在腫瘤細胞中高表達和低表達的差異基因。將腫瘤樣品和正常樣品中區(qū)別表達的這些差異基因與immport數(shù)據(jù)庫下載的免疫基因取交集后,總共得到343個差異的免疫基因。
2.2模型構建
2.2.1模型構建
lasso回歸數(shù)據(jù)見圖,剔除過度擬合基因后,可以得到預測模型,用我們的模型對test組和總樣本進行的生存分析結(jié)果為:1.train組的生存分析,可見高低風險組之間存在差異(p<0.05);2.用模型對test組進行驗證,可見高低風險組之間的生存分析存在差異(p<0.05);3.train組的AUC面積為0.782;4.test組的AUC面積為0.782;高低風險組之間的生存數(shù)據(jù)存在明顯差異,驗證了我們的模型預測價值。Roc曲線下面積train組、test組、總樣本均大于0.5,檢測方法真實性良好。
Fig2:a.lasso回歸模型;b.對lasso模型進行交叉驗證,找到誤差最小點,所對應的基因即為lasso回歸顯著基因,從而得到預測模型。
2.2.2患者預后相關基因的單因素COX分析與多因素cox分析結(jié)果
患者單因素與多因素cox結(jié)果得到,我們的風險打分能夠獨立的預測患者的預后(P小于0.01)。
2.3免疫治療相關基因分析結(jié)果
高低風險組之間CD274(PDL1基因)表達量差異P小于0.05,存在統(tǒng)計學差異。與tcia下載的免疫打分文件合并后,得到高低風險組之間的免疫打分,進行統(tǒng)計學比較,結(jié)果如圖,可以得到結(jié)果:我們的預測模型預測低風險組患者在接受抗CTL4、抗PDL1以及兩者聯(lián)合治療時,效果明顯優(yōu)于高風險組P<0.05。
a.? b.
Fig2:a.高低風險組在抗PD-L1治療時,低風險組敏感性大于高風險組,p<0.05;b.高低風險組在抗CTL4治療時,低風險組敏感性大于高風險組,p<0.05。
3討論
我們的模型能夠通過對患者進行風險評分,對于低風險組患者,我們建議行抗PD-L1或(和)抗CTLA4免疫治療,能獲得更好的療效。更重要的是,希望通過本文,給廣大同行提供思路,使用大數(shù)據(jù)來對疾病的治療進行指導。
參考文獻:
[1]肖亮, 周樂杜. 肝癌外科治療理念的革新與挑戰(zhàn)[J]. 中國普通外科雜志, 2021, 30(7):8.
[2]陸林敏, 張衛(wèi)平. PD-1/PDL-1及CTLA-4抑制劑治療原發(fā)性肝癌的研究進展[J]. 浙江醫(yī)學, 2018, 40(13):4.
[3]胡文龍, 梁惠芳, 李明. 基于代謝相關基因的生物信息學分析構建肺鱗癌預后模型[J]. 臨床肺科雜志, 2020, 25(11):8.