王閣,肖何,陳川
隨著放射治療技術的進步,放療在結直腸癌的綜合治療中具有越來越重要的地位。特別是,對于Ⅱ~Ⅲ期局部晚期直腸癌(locallyadvancedrectalcancer,LARC),新輔助放化療可以顯著提高局控率和保肛率而成為標準治療方式[1-2]。新輔助放化療后腫瘤退縮分級(tumorregressiongrading,TRG)在臨床實踐中受到特別關注:達到DworakTRG病理學完全緩解(pathologicalcompleteresponse,pCR)(TRG4)患者具有良好預后,而且將TRG納入到AJCC臨床病理分期可以進一步促進復發(fā)風險評估的準確性[3-4]。因此,大量研究探討了通過治療前臨床特征[5]、腫瘤組織病理學特征[6]、影像組學特征[7]和腫瘤內在放療敏感性[8-12]等方法預測pCR的可行性。其中,基于腫瘤內在放療敏感性的pCR預測模型不但在臨床實踐上有重要意義,而且還具有揭示直腸癌放射抵抗機制的潛在價值。本文就研究策略、既往研究方法的缺陷和進一步分析的方向對基于放療敏感基因表達構建預測模型的多項研究進行論述。
總體上,該類研究一般采取在放療敏感和抵抗細胞系或腫瘤中利用mRNA微陣列芯片或轉錄組測序(transcriptomesequencing,RNAseq)篩選與放療敏感性相關基因或差異表達基因(differentiallyexpressedgenes,DEGs),再利用網(wǎng)絡調控分析[8]或按照基因顯著性排秩[11]得到候選基因,并聯(lián)合各種特征選擇算法如支持向量機[11]構建pCR預測模型,以實現(xiàn)在最小冗余最大相關條件下得到穩(wěn)定模型,并在獨立驗證集中驗證。
在這種研究策略中,最終納入預測模型的基因種類和參數(shù)是決定模型可重復性的重要保證。盡管特征選擇算法在同組人群中決定模型預測效能上存在些許差異[11],但是訓練集樣本量、總RNA提取起始材料(細胞系/腫瘤組織)、腫瘤組織樣本內非腫瘤細胞成分和含量等因素導致預測模型在各研究組間的不一致遠勝于所用算法。因此,本文主要討論以上因素對LARC新輔助放化療敏感模型構建的影響及相關考慮因素,對算法不作討論。
迄今,在納入模型候選基因的篩選上,一是利用體外細胞系2Gy電離輻射后的生存分數(shù)(survivalfractionat2Gy,SF2),采用線性回歸等方法篩選其mRNA表達值與SF2值顯著相關的基因作為放射敏感基因[8-9]。二是利用實際接受新輔助放化療治療病例,評估腫瘤退縮等級后分為pCR組與非pCR組或者分為緩解組(TRG3/4)與未緩解組(TRG0-2),分析新輔助治療前腫瘤組織基因的DEGs[10-12]。利用多種腫瘤細胞系(NCI-60細胞系)SF2值構建放療敏感模型的經(jīng)典方法最早由Eschrich等[8]建立,并且該10基因模型在小樣本量的直腸癌新輔助治療病例中得到驗證[13]。然而,體外條件下測定細胞系SF2值缺乏體內諸多因素,比如乏氧、血管生成、浸潤免疫細胞等。事實上,體內腫瘤組織篩選的放療敏感基因不一定都可在體外細胞系實驗中得到驗證[12]。如果考慮到腫瘤病灶浸潤邊緣CD8+細胞毒性T淋巴細胞含量對新輔助放化療的增敏作用[14],以及乏氧條件下誘導上皮間葉轉化(epithelial-mesenchymaltransition,EMT)對新輔助放化療的抵抗[6,15],體外SF2值構建放療敏感模型由于缺乏這些因素有不可避免的缺陷。總之,由于腫瘤細胞與腫瘤微環(huán)境內如腫瘤相關性成纖維細胞的相互作用而導致對化療、放療抵抗等因素[16],基于體內腫瘤組織基因表達水平構建新輔助放化療敏感模型似乎具有更高的臨床適用性。盡管如此,基于腫瘤組織基因表達篩選放療敏感基因在不區(qū)別腫瘤細胞和腫瘤微環(huán)境細胞亞群條件下進行RNAseq或微陣列芯片檢測有嚴重弊端,下文即將討論。
已發(fā)表研究中發(fā)現(xiàn)集樣本量從22~77例不等,均屬于小樣本量研究[10-12]。而且,這些研究都沒有考慮篩選放療敏感基因的發(fā)現(xiàn)集樣本量問題。但是,該類研究中發(fā)現(xiàn)集樣本量對候選基因的確定和預測效能有很大影響。在發(fā)現(xiàn)集樣本量較小情況下,基于統(tǒng)計量顯著性排秩的方法選擇基因具有較大的不確定性和預測效能的不穩(wěn)定性[17-18]。經(jīng)驗研究提示,對于預測如雌激素受體陽性等簡單的二分類結局變量而言,訓練集樣本量60例是個臨界值,大于60例訓練集均可達到穩(wěn)定的預測效能。
但是,對于LARC新輔助放化療該經(jīng)驗規(guī)則并不充分。從幾個研究納入最后預測模型的基因種類幾乎完全不重疊即可得到間接證明[10-12]。而且,早期研究中,雖然模型在發(fā)現(xiàn)集中有較高的預測效能,但是在獨立驗證集中卻只有很差的靈敏度(50%~86.6%)[10-11]。推測人群間腫瘤異質性是導致各研究組報道的預測基因種類不一致并且在獨立驗證集中驗證失效的主要原因。我們綜合分析GEO(GeneExpressionOmnibus)數(shù)據(jù)庫4個利用微整列芯片法檢測基因表達水平的GSE35452、GSE46862、GSE68204和GSE53781數(shù)據(jù)集共174例病例也得到類似結果:反復取樣分析表明在121例訓練集中構建的TRG3/4預測模型在53例驗證集中的預測效能相當?shù)?未發(fā)表數(shù)據(jù))。以上分析和既往研究結果說明,基于未分類全體人群中篩選和構建預測模型的效能由于個體間強烈的腫瘤異質性而大打折扣,提示在結直腸癌分子分型的基礎上篩選放療敏感基因的思路對預測模型改進的可能性。
盡管基于腫瘤組織基因表達構建模型可以將體內腫瘤微環(huán)境等因素考慮在內[10-12]。但是,由于現(xiàn)有RNAseq或微陣列芯片檢測均是對腫瘤細胞和間充質細胞混雜總RNA進行分析,得到的基因表達水平將受到腸鏡取樣偏倚以及由此導致的腫瘤細胞含量和其它細胞組分占比的嚴重影響[19]。該缺點對構建放療敏感模型和臨床應用會產(chǎn)生如下不良影響:①間充質細胞或濾過性免疫細胞等非腫瘤細胞基因表達值對腫瘤細胞內在放療抵抗基因表達值測定產(chǎn)生干擾。②無法獨立評估濾過性免疫細胞參與放化療增敏機制與腫瘤細胞內在放療抵抗機制。在沒有考慮腫瘤微環(huán)境的體外構建模型策略中,此問題將更加嚴重。
比如,Torres-Roca等人建立的10基因放療敏感模型中納入了2個干擾素通路基因(STAT1和IRF1),而且49個干擾素通路基因中有36個與射線誘導DNA損傷抵抗正相關,具有顯著的功能富集[8,20]。但是,研究表明腫瘤細胞基因組DNA片段可異位到瘤體內浸潤的樹突狀細胞胞漿內,激活胞內TBK1和IRF3誘導β干擾素產(chǎn)生,促進機體抗腫瘤免疫活性,介導放療免疫效應[21-22]。如此,干擾素通路在腫瘤細胞中參與放療抵抗,而在腫瘤微環(huán)境中通過樹突狀細胞中則參與放療增敏。要精確的根據(jù)納入模型的基因表達來預測放療敏感性在混合檢測RNA情況下是不可能的。與此緊密相關的是,不區(qū)分細胞類型亞群進行分析還將導致現(xiàn)已逐步建立的分子分型的不準確性[19],而分子分型可能具有建立精確放療敏感模型的基礎。
結直腸癌分子分型正在逐步轉化為療效預測標志物或指導治療策略標志物[23-25]。其中,Bramsen等[24]的研究結果對直腸癌放療敏感模型研究提供了重要參考意義。Bramsen將結直腸癌患者預后生物標志物篩選奠定在分子分型基礎上,其結果表明即使是同一類導致劣勢預后的生物學機制如EMT,在不同分子亞型中也有不同的分子標簽,這些分子標簽在不同分子亞型中并不具有相同的預后作用,突出地說明了在如腸癌等群體異質性較強的瘤種中根據(jù)分子分型進行標志物篩選在避免異質性難題上的重要意義[24]。更重要的是,Bramsen等人還強調了腫瘤微環(huán)境成纖維細胞和免疫細胞影響腫瘤行為的作用:完全基于腫瘤細胞內在基因表達水平(CRCintrinsicsignature,CRIS)的分子分型并不具有對無復發(fā)生存時間的預后作用。但是,聯(lián)合上皮腫瘤細胞和間充質細胞分別具有的生物學特征構建的預后評分在對TNM分期、共識分子分型[26]校正后依然是無復發(fā)生存的獨立預后因素,如在具有“CD4+CD8+T淋巴細胞活性”、“低間充質活性”和“低免疫抑制”特征的SSC亞型中聯(lián)合EMT、間質干細胞和IFN-γ分子標簽構建的預后評分。此種聯(lián)合考慮上皮腫瘤和腫瘤微環(huán)境細胞進行分子分型和標志物篩選對于新輔助放化療敏感模型的研究具有重要借鑒作用。
鑒于上述研究,考慮到現(xiàn)有研究結果表明EMT可能是LARC新輔助放化療抵抗機制之一[6,27],但是在不區(qū)別分子分型情況下篩選到的EMT標簽分子可能在不同研究人群中不一致,從而導致預測模型不能相互驗證。因此,在基于分子分型基礎上進行放療敏感基因篩選可能具有消除群體異質性影響的作用。
現(xiàn)階段,在不獨立定量表征上皮腫瘤細胞和腫瘤微環(huán)境成纖維細胞和浸潤免疫細胞各自生物學特征的情況下,混合檢測腫瘤組織總RNA從體內腫瘤退縮數(shù)據(jù)構建新輔助放化療敏感模型在不同人群中幾乎不具有精確預測能力??紤]到腫瘤細胞與腫瘤微環(huán)境相互作用在影響腫瘤生物學行為和介導放化療抵抗上的作用[16,24],分別對新輔助治療前瘤體內上皮腫瘤細胞、成纖維細胞、免疫細胞等亞群進行RNAseq或微陣列分析,分別利用分子分型等工具評估各細胞亞群特征,再與腫瘤退縮等級進行關聯(lián)性分析是達到構建精確預測模型的基礎以及未來的研究方向。
此外,第二種進一步優(yōu)化模型的方式是在不分離細胞亞群進行混合檢測RNA的情況下,精心選著代表各個細胞亞群及其生物學功能特征的基因標簽進行分析[19,28]。Trusolino等人利用患者腫瘤組織小鼠移植模型,用小鼠間充質細胞取代人間充質細胞分析基因表達得到CRIS。此外,大量其它腫瘤微環(huán)境細胞標簽基因,如Moffitt和Angelova分別關于活化的間充質細胞與各種免疫細胞亞群基因標簽可用于該類分析[29-30]。
總之,在更精細地區(qū)別細胞亞群基礎上構建放化療敏感模型是以后利用高通量技術篩選LARC新輔助放化療獲益人群的必由之路。