崔涵 張春雷 黃創(chuàng)
前列腺癌(prostate cancer, PCa)是男性最常見的惡性腫瘤[1],研究其發(fā)病機制仍是當前醫(yī)療科研領域的重要課題。作為分泌信號蛋白Hedgehog家族成員之一, SHH的異常表達與多種腫瘤疾病有關,包括髓母細胞瘤、胰腺癌和肺癌等[2-4]。而Hedgehog?;D移酶(Hedgehog acyltransferase, HHAT)能夠催化脂肪酸棕櫚酸酯轉移到SHH上進而激活SHH信號通路[5]。已有研究表明HHAT在ER陽性、HER2擴增和激素抵抗的乳腺癌增殖中起關鍵作用[6],HHAT也能誘導胰腺導管腺癌的進展,它的小分子抑制劑可以抑制胰腺癌細胞增殖[7]。然而HHAT在PCa中的作用尚無相關研究,故本文利用生物信息學分析了在PCa中HHAT mRNA的表達與患者臨床特征之間的相關性,以及作為PCa患者診斷和預后指標的有效性,同時分析了其在PCa疾病進程中可能參與的信號通路。
提取癌癥基因圖譜(The Cancer Genome Atlas, TCGA)(https://portal.gdc.cancer.gov/)數據庫中PCa項目中52例PCa正常組織、499例癌組織 HTSeq-FPKM格式的RNAseq數據,將FPKM格式的RNAseq數據轉換成了TPM格式并進行l(wèi)og2轉化,以用于HHAT表達量分析,使用R軟件統(tǒng)計分析與可視化(3.6.3版本),R包主要為ggplot2(用于可視化)(3.3.3版本)。通過基因表達數據庫(Gene Expression Omnibus, GEO)query包[8]從GEO數據庫中提取GSE46602數據集中的36例PCa組織及14例正常前列腺組織(包含4例癌旁組織),測序結果進行HHAT表達量驗證,利用RMA方法進行標準化。采用STRING(11.5版本)數據庫進行功能蛋白相互作用分析(https://www.string-db.org/),采用THE HUMAN PROTEIN ATLAS 數據庫進行免疫組化結果分析(https://www.proteinatlas.org/),采用UALCAN數據庫進行基因啟動子區(qū)甲基化水平分析(http://ualcan.path.uab.edu/index.html)。
GSEA中顯著富集的閾值為:錯誤發(fā)現(xiàn)率(false discovery rate, FDR)<0.25且P<0.05。在篩選HHAT相關基因時,選擇在PCa組織及正常組織中差異表達的基因(log|FC|>1,P<0.05)進行分析,以HHAT在所有PCa組織中表達量的中位數為標準分為低表達及高表達兩組,對這些差異表達基因在兩組中的表達量進行分析,差異有統(tǒng)計學意義的基因定為HHAT相關基因(P<0.05),使用R軟件,R包DESeq2(1.26.0版本)[9]。
T分期包括T2~T4期,N分期包括N0及N1,M分期包括M0及M1,初始治療結果分為疾病進展(progressive disease, PD)、疾病穩(wěn)定(stable disease, SD)、部分緩解(partial response, PR)、完全緩解(complete response, CR),種族分為亞裔、非裔和白人,年齡分為≤60歲和>60歲,年齡的中位數(四分位距)為61(56歲,66歲),PSA分為<4 ng/ml及≥4 ng/ml,Gleason評分包括6~10分。根據中位HHAT mRNA表達值,將HHAT表達情況分為高表達和低表達兩組。
樣本基因表達差異采用Mann-WhitneyU檢驗,配對樣本表達量比較采用配對t檢驗;臨床信息組間差異采用卡方檢驗和Fisher精確檢驗;年齡選用Wilcoxon rank sum檢驗,表述為中位數(四分位距);繪制受試者工作特征(receiver operating characteristic, ROC)曲線并計算ROC曲線下面積(area under curve, AUC)用于診斷效能分析,預后分析采用Kaplan-Meier分析和log-rank檢驗,預后的影響因素分析采用單因素及多因素Cox回歸分析。
為檢測HHAT在PCa組織中的表達情況,我們選取了TCGA數據庫中的551例(正常組織52例,癌組織499例)PCa患者術后組織標本的測序結果進行分析,結果表明,相比于正常組織,HHAT mRNA表達在PCa組織中顯著下調(圖1A,P<0.001),對其中52例配對的癌及正常組織樣本單獨進行了表達量分析得到了類似的結論, HHAT mRNA表達在PCa組織中顯著下調(圖1B,P<0.001)。為了驗證這一結果的準確性,我們對GEO數據庫中GSE46602數據集的36例PCa組織及14例正常前列腺組織測序結果進行了HHAT表達量分析,結果表明,HHAT mRNA表達在癌組織中低于正常組織(圖2,P<0.05)。此外,我們利用THE HUMAN PROTEIN ATLAS數據庫對HHAT蛋白質在PCa癌組織及前列腺正常組織中表達量進行對比,結果表明,相比于正常組織,HHAT的蛋白質表達量在癌組織中有下降趨勢,并且HHAT主要表達在細胞質及細胞膜上(圖3)。為了探索HHAT在癌組織中表達下調的可能因素,我們在UALCAN數據庫中對PCa癌相關樣本中HHAT基因啟動子區(qū)甲基化水平進行分析,結果表明HHAT在癌組織中的啟動子區(qū)甲基化水平顯著高于正常組織(圖4,P<0.001)。
A:TCGA數據庫中HHAT mRNA在非配對PCa及正常組織中的表達情況;B:TCGA數據庫中HHAT mRNA在配對PCa及正常組織中的表達情況圖1 TCGA數據庫中HHAT mRNA在PCa組織及正常組織中的表達情況
圖2 GSE46602數據集中HHAT mRNA在PCa組織及正常組織中的表達情況
A:正常組織;B:癌組織圖3 HHAT蛋白在PCa組織及正常組織中的表達情況(HE染色,×10)
圖4 PCa及正常組織中HHAT基因啟動子區(qū)甲基化水平(*部分數據缺失)
為了進一步分析HHAT在癌組織中的表達量與患者臨床信息之間的關系,我們分析了TCGA數據庫中499例腫瘤組織樣本HHAT的表達在不同臨床信息組間的差異,樣本對應的患者的臨床信息詳見表1。結果表明,HHAT在高T分期組、N1組、>60歲組、Gleason評分>7分組以及疾病未緩解組等組別的組織樣本中顯著低表達(P<0.05, 見表2及圖5)。
表1 入組PCa患者臨床信息[例(%)]
表2 不同臨床組別患者HHAT低表達 和高表達的差異分析[例(%)]
注:無疾病進展生存期(progress free interval, PFI);*部分數據缺失
注:*部分數據缺失
為探索HHAT mRNA表達在PCa中的診斷價值,我們繪制了ROC曲線用于分析HHAT mRNA表達區(qū)分不同組織的診斷能力,共分為:正常 vs 腫瘤、正常 vs T2、正常 vs T3& T4、N0vs N1、SD vs PD、CR vs PR等6個組別,結果表明,HHAT mRNA表達能夠有效區(qū)分正常組織與腫瘤組織(AUC=0.753),尤其是對于正常組織與T3&T4組織(AUC=0.788)的區(qū)分,其他組別AUC均小于0.7。 此外,我們采用Kaplan-Meier分析和log-rank檢驗分析HHAT mRNA表達在所有患者、T2分期、T3&T4分期、N0、N1、M0等患者中的預后價值。因患者的總生存期和疾病特異性生存期刪失率過高,故選取PFI代替PCa預后指標,結果證實,低表達的HHAT預示著腫瘤患者具有較差的PFI(P<0.05),尤其是T3&T4或N0或M0的患者(P<0.05)。同時,我們對PFI的獨立影響因素進行了單因素及多因素的Cox回歸分析,結果表明,在單因素分析中,高T分期、N1、初始治療后疾病進展、高PSA值、高Gleason評分以及HHAT mRNA低表達均是PCa較差PFI的影響因素(P<0.05),將這些因素納入多因素分析,結果表明高T分期、高Gleason評分以及HHAT mRNA低表達是PCa較差PFI的獨立危險因子(P<0.05),見表3。
A:在不同T分期中的表達;B:在不同N分期中的表達;C:在不同M分期中的表達;D:在不同年齡中的表達;E:在不同種族中的表達;F:在不同PSA中的表達;G:在不同Gleason評分中的表達;H:在不同治療效果中的表達圖5 HHAT mRNA在不同PCa亞組患者組織中的表達情況
表3 Cox回歸分析PCa預后影響因素
為研究HHAT在PCa疾病進展中可能的作用機制,我們利用STRING數據庫構建了HHAT的功能性相關蛋白網絡,證實HHAT與DHH、IHH、SHH、SOX2、BCL2L10、MLANA、AASDH、SERPINA10、PROZ等蛋白具有相互作用(圖6)。為了探索HHAT在PCa中可能發(fā)揮的作用機制,通過TCGA數據庫中測序結果篩選與HHAT表達具有相關性的基因,并對這些基因進行GSEA分析,結果表明在PCa中與HHAT具有相關性的基因主要作用在氨基酸及其衍生物的代謝和M期通路,見圖7。
圖6 HHAT與相關蛋白之間的相互作用
A:M期信號通路;B:氨基酸及其衍生物的代謝信號通路圖7 HHAT相關基因的GSEA富集分析
我們通過對TCGA數據庫中數據的分析,證實了HHAT mRNA在PCa組織中顯著低表達,并通過GEO數據庫中的數據進行驗證,與正常組織對比,HHAT的蛋白質表達量在癌組織中也有下降趨勢?;騿幼訁^(qū)甲基化是基因表達下調的重要因素[10],我們進一步對TCGA數據庫中PCa組織及正常組織中基因的基因啟動子區(qū)甲基化水平進行分析,結果表明癌組織中HHAT基因啟動子區(qū)甲基化水平顯著高于正常組織,說明HHAT在癌組織中的低表達很有可能是其啟動子區(qū)甲基化水平過高導致的。作為基因轉錄表達的mRNA往往能夠較好的區(qū)分疾病和疾病亞組,因此其常具有較高的診斷和預后價值[11-12]。通過比較分析,我們發(fā)現(xiàn),低表達的HHAT具有較差的預后,尤其是在T3&T4或N0或M0的患者中。在T分期較高、具有淋巴結轉移、年齡較大、Gleason評分較高以及疾病初始治療之后不緩解的組別中HHAT表達顯著降低,而高T分期、高Gleason評分往往是PCa生化復發(fā)的高危因素[13],與本文研究的結論一致。此外,我們還發(fā)現(xiàn)HHAT mRNA表達能夠有效區(qū)分正常組織與腫瘤組織,尤其是區(qū)分正常組織與T3&T4。
在與HHAT相互作用的功能性相關蛋白分析中,HHAT與DHH、IHH、SHH、SOX2、BCL2L10、MLANA、AASDH、SERPINA10、PROZ等蛋白具有相互作用,而DHH、IHH、SHH均屬于Hedgehog家族成員[14],Hedgehog信號通路在癌癥中與GLI1、mTORC1通路相互作用[15-16],還會受到腫瘤相關基因Trp53和Rb1以及TGFBR2等的調控[17-18],共同促進腫瘤疾病的進展。轉錄因子 SOX2 促進胚胎發(fā)育,在維持胚胎細胞和各種成體干細胞群的干性方面起著至關重要的作用[19]。并且SOX2 表達的失調在腫瘤細胞的增殖、遷移、侵襲和轉移中也發(fā)揮著不可替代的作用[20]。BCL2L10被證明在黑色素瘤中由STAT3 誘導表達,高表達的BCL2L10促進黑色素瘤細胞的存活[21],也介導著卵巢癌細胞的增殖、轉移和侵犯潛能[22]。HHAT是否通過與這些基因的相互作用促進PCa的進展還需要進一步研究。GSEA富集分析提示HHAT可能與氨基酸及其衍生物代謝和M期兩條信號通路有關,氨基酸對癌細胞的生長是必不可少的,氨基酸也是重要的信號分子,具有調節(jié)代謝途徑、蛋白質翻譯、自噬、抵抗活性氧等多種功能[23]。M期是細胞周期中的重要一環(huán),腫瘤細胞周期的改變會影響腫瘤疾病的進程。因此,研究HHAT在PCa中是否通過這些信號通路及蛋白質發(fā)揮功能也是極具挑戰(zhàn)性及重要意義的。