花 蕾,鄭先斌,2,郭偉茜,陶振超,周 燕,楊麗萍,張洋洋,黃一凡,孫 斌,楊 婧,何 健,高 勁
鼻咽癌(nasopharyngeal carcinoma, NPC)是我國(guó)常見(jiàn)的頭頸部惡性腫瘤,2018年全球新發(fā)病例129 000例,中國(guó)占近一半,放射治療是其主要治療方式[1]。盡管近些年NPC臨床診療水平不斷提高,仍有20%~30%的患者發(fā)生遠(yuǎn)處轉(zhuǎn)移,導(dǎo)致治療失敗,影響患者的整體生存率[2]。因此,NPC遠(yuǎn)處轉(zhuǎn)移是臨床面臨的主要問(wèn)題,鑒定NPC轉(zhuǎn)移相關(guān)靶點(diǎn)尤為重要。
長(zhǎng)鏈非編碼RNAs(long non-coding RNAs,lncRNAs)是一類由大于200個(gè)核苷酸組成的RNAs。在細(xì)胞中,lncRNAs可以通過(guò)4種作用模式發(fā)揮生物學(xué)功能:① 調(diào)控下游基因轉(zhuǎn)錄;② 阻斷分子的作用和信號(hào)通路;③ 將蛋白復(fù)合物定位到特定的DNA序列上;④ 起“中心平臺(tái)”的作用[3-4]。目前,越來(lái)越多參與NPC發(fā)生發(fā)展的lncRNAs被發(fā)現(xiàn)。例如,HOX轉(zhuǎn)錄反義RNA(HOX transcript antisense RNA,HOTAIR)能夠直接激活血管內(nèi)皮生長(zhǎng)因子A(vascular endothelial growth factor-A,VEGFA)[5]的轉(zhuǎn)錄,調(diào)控基質(zhì)金屬蛋白酶9(matrix metallopeptidase 9,MMP-9)和p21蛋白(protein 21,p21)的水平[6],參與NPC的進(jìn)展。lncRNA-LET通過(guò)調(diào)控MAPK/ERK 通路的表達(dá)譜[7]或多梳蛋白zeste基因增強(qiáng)子類同源物2(enhancer of zeste homolog 2,EZH2)抑制[8],影響NPC細(xì)胞增殖。然而,lncRNAs與NPC轉(zhuǎn)移相關(guān)的潛在機(jī)制少有報(bào)道。該研究通過(guò)高通量測(cè)序篩選出在轉(zhuǎn)移與非轉(zhuǎn)移NPC患者外周血樣本中差異表達(dá)的lncRNAs,并預(yù)測(cè)其潛在機(jī)制。
1.1 標(biāo)本收集選取2018年10月1日~2019年5月1日安徽醫(yī)科大學(xué)附屬省立醫(yī)院西區(qū)(安徽省腫瘤醫(yī)院)確診為NPC的5例患者,所有患者均首次診斷為NPC。其中發(fā)生遠(yuǎn)處器官轉(zhuǎn)移者3例,未發(fā)生轉(zhuǎn)移者2例。抽取患者外周血標(biāo)本5 ml,提取樣本中上層血清,分裝至無(wú)RNA酶小管,于液氮中凍存保存。所有研究對(duì)象均知情同意參加本項(xiàng)實(shí)驗(yàn),且該過(guò)程經(jīng)醫(yī)院倫理委員會(huì)審查批準(zhǔn)。
1.2 RNA提取和鑒定根據(jù)Takara RNAiso (Code No.9180/9109)說(shuō)明書(shū)提取血清樣品中的總RNA。提取完畢后,進(jìn)行瓊脂糖凝膠電泳,根據(jù)電泳條帶檢測(cè)總RNA完整性,并使用NanoDrop 1000分光光度計(jì)檢測(cè)總RNA濃度及純度。
1.3 文庫(kù)構(gòu)建測(cè)序文庫(kù)構(gòu)建采用每份樣品中1~2 μg總RNA,先經(jīng)過(guò)去除核糖體RNA處理,產(chǎn)物RNA用于下一步文庫(kù)構(gòu)建?;赿UTP的鏈特異性,將文庫(kù)構(gòu)建分為多個(gè)步驟,包括:將mRNA富集后的RNA進(jìn)行片段化處理;通過(guò)逆轉(zhuǎn)錄合成第一鏈cDNA模板;加入dUTP形成互補(bǔ)鏈,合成雙鏈cDNA;在各種聚合酶的作用下,使雙鏈cDNA添加多聚A尾,且修復(fù)末端;Illumina特異性接頭使用連接酶進(jìn)行連接;最后經(jīng)PCR擴(kuò)增并純化,得到RNA測(cè)序文庫(kù)。
1.4 文庫(kù)質(zhì)檢構(gòu)建好的文庫(kù)將使用Agilent 2100生物芯片分析系統(tǒng)進(jìn)行質(zhì)量檢測(cè),內(nèi)容包括文庫(kù)濃度、片段大小、是否含有接頭等項(xiàng)目,并通過(guò)定量PCR方法進(jìn)行文庫(kù)的最終定量,根據(jù)定量結(jié)果及最終測(cè)序數(shù)據(jù)量的要求,混合不同樣品的測(cè)序文庫(kù)進(jìn)入下一步測(cè)序流程。
1.5 上機(jī)測(cè)序混合處理完成的不同樣品的測(cè)序文庫(kù),經(jīng)過(guò)氫氧化鈉溶液處理變性為單鏈DNA,稀釋為特定濃度后,通過(guò)測(cè)序儀進(jìn)行原位擴(kuò)增,擴(kuò)增出的片段末端使用測(cè)序儀檢測(cè)150個(gè)循環(huán)。
1.6 測(cè)序數(shù)據(jù)分析和基因功能分析產(chǎn)生的測(cè)序數(shù)據(jù)通過(guò)測(cè)序質(zhì)控后,將經(jīng)過(guò)預(yù)處理過(guò)濾步驟產(chǎn)生的數(shù)據(jù)比對(duì)到參考基因組上,將比對(duì)結(jié)果進(jìn)行統(tǒng)計(jì)分析后進(jìn)行l(wèi)ncRNAs和轉(zhuǎn)錄本表達(dá)定量分析、lncRNAs表達(dá)水平分析、差異表達(dá)lncRNAs篩選、基因本體論(gene ontology,GO)、功能顯著性富集分析(GO enrichment analysis)、京都基因與基因組百科全書(shū)(kyoto encyclopedia of genes and genomes,KEGG)通路顯著性富集分析等一系列分析,初步探討NPC轉(zhuǎn)移相關(guān)lncRNAs潛在機(jī)制。
1.7 統(tǒng)計(jì)學(xué)處理使用R軟件中的Ballgown包進(jìn)行樣本表達(dá)水平的定量,以及組間的lncRNAs的差異表達(dá)分析。設(shè)定閾值為1.5倍差異,P<0.05,且組內(nèi)FPKM均值≥0.5來(lái)篩選差異表達(dá)lncRNAs。
2.1 文庫(kù)質(zhì)量評(píng)估及測(cè)序數(shù)據(jù)質(zhì)量控制表1為lncRNAs在轉(zhuǎn)移與非轉(zhuǎn)移NPC中的表達(dá)譜,序列數(shù)和堿基數(shù)分別代表各樣本的總序列及總堿基數(shù)。對(duì)每個(gè)樣品的序列統(tǒng)計(jì)代表錯(cuò)誤識(shí)別概率為0.1%的Q30,一般情況下認(rèn)為Q30≥80%則認(rèn)為測(cè)序質(zhì)量合格。本研究所涉及樣本測(cè)序數(shù)據(jù)Q30均≥90%,表明測(cè)序質(zhì)量合格。
通過(guò)高通量測(cè)序,共鑒定出1 726條lncRNAs在5例NPC患者血液樣本中表達(dá),其中1 328條lncRNAs在NPC轉(zhuǎn)移組中表達(dá)較高,398條lncRNAs在NPC轉(zhuǎn)移組中表達(dá)較低。在轉(zhuǎn)移組表達(dá)較高的lncRNAs中,有2條lncRNAs的表達(dá)量差異有統(tǒng)計(jì)學(xué)意義(Fold Change>1.5,P<0.05),在轉(zhuǎn)移組表達(dá)較低的lncRNAs中,有12條lncRNAs的表達(dá)量差異有統(tǒng)計(jì)學(xué)意義(Fold Change>1.5,P<0.05),如表2所示,lncRNA ENST00000610778是表達(dá)差異較大的lncRNA,F(xiàn)C值為4 011.71,在轉(zhuǎn)移組中含量低,非轉(zhuǎn)移組含量高。
表1 測(cè)序數(shù)據(jù)量統(tǒng)計(jì)
表2 差異表達(dá)lncRNAs列表
2.2 lncRNAs相應(yīng)基因的GO分析lncRNAs的功能往往與其相應(yīng)周圍編碼蛋白的基因具有功能相似性,因此可以根據(jù)基因功能注釋數(shù)據(jù)庫(kù)GO對(duì)差異表達(dá)的lncRNAs周圍編碼基因按照功能進(jìn)行分類及注釋,GO注釋內(nèi)容包括:生物學(xué)過(guò)程(biological process, BP)、分子生物學(xué)功能(molecular function, MF)和細(xì)胞學(xué)組分(cellular components, CC)。經(jīng)分析發(fā)現(xiàn),差異lncRNAs的周圍編碼基因生物學(xué)過(guò)程主要集中于翻譯、核糖體大亞基組裝、SRP依賴的膜靶向共翻譯蛋白、病毒轉(zhuǎn)錄、核轉(zhuǎn)錄mRNA分解代謝過(guò)程、翻譯啟動(dòng)以及rRNA加工,涉及基因包括NACA、RPL3、RPL12,如圖1A所示。分子生物學(xué)功能富集于核糖體結(jié)構(gòu)成分,涉及基因包括RPL3、RPL12,如圖1B所示。細(xì)胞學(xué)組分富集于胞質(zhì)大核糖體亞基、黏著斑,涉及基因包括RPL3、RPL12,如圖1C所示。
2.3 lncRNAs周圍對(duì)應(yīng)mRNAs的KEGG通路分析經(jīng)過(guò)KEGG通路分析后發(fā)現(xiàn),差異表達(dá)的lncRNAs對(duì)應(yīng)同位基因在“核糖體”(Ribosome)通路富集。如圖2、3所示。
圖1 差異表達(dá)lncRNAs周圍對(duì)應(yīng)編碼基因的GO注釋氣泡圖
圖2 差異表達(dá)lncRNAs對(duì)應(yīng)周圍編碼基因的
人類基因組計(jì)劃和DNA元件百科全書(shū)計(jì)劃研究[3]結(jié)果顯示,人類基因組中非編碼的RNA占了大部分區(qū)域,其中的lncRNAs曾一度被認(rèn)為是轉(zhuǎn)錄噪音。lncRNAs依據(jù)從基因組中被轉(zhuǎn)錄位置的不同,可被分為5大類:正義鏈、反義鏈、雙向、內(nèi)含子間、基因型[3-4],這種位置關(guān)系很大程度上與lncRNAs功能有關(guān)。隨著生物信息技術(shù)以及分子生物學(xué)的發(fā)展,發(fā)現(xiàn)多種lncRNAs在生命活動(dòng)中發(fā)揮重要作用,包括腫瘤轉(zhuǎn)移。例如,一項(xiàng)lncRNAs與NPC轉(zhuǎn)移相關(guān)的研究表明,AFAP1-AS1在體外實(shí)驗(yàn)中通過(guò)調(diào)節(jié)肌動(dòng)蛋白絲完整性促進(jìn)癌細(xì)胞轉(zhuǎn)移[9],而另一項(xiàng)96例NPC石蠟包埋樣本的回顧性分析發(fā)現(xiàn),AFAP1-AS1在浸潤(rùn)淋巴細(xì)胞中高表達(dá)的患者更容易發(fā)生轉(zhuǎn)移[10]。lncRNA H19也是NPC的促癌基因之一,能通過(guò)抑制miR-630 的活性而不是直接的相互作用來(lái)調(diào)節(jié) EZH2 的表達(dá),促進(jìn)NPC細(xì)胞的侵襲轉(zhuǎn)移[11]。也有新發(fā)現(xiàn)的lncRNAs在NPC中被探究,例如,LOC284454影響細(xì)胞骨架和黏附相關(guān)的Rho/Rac 信號(hào)通路,促進(jìn)NPC的遷移和侵襲[12],lncRNA-n326322通過(guò)激活PI3K/AKT 和 ERK/MAPK通路促進(jìn)NPC細(xì)胞的增殖和遷移[13]。除此之外,lncRNAs在NPC中也可直接與靶基因結(jié)合,通過(guò)靶基因影響其功能。NPCCAT1和LncRNA PXN-AS1-L可分別結(jié)合YY1和SAPCD2促進(jìn)細(xì)胞增殖和遷移[14-15]。當(dāng)然,也有部分lncRNAs在NPC中影響生物學(xué)功能的機(jī)制尚不明確。
本研究中,筆者通過(guò)嚴(yán)格控制入組標(biāo)準(zhǔn),篩選出2例無(wú)轉(zhuǎn)移的NPC患者,3例轉(zhuǎn)移NPC患者,其中轉(zhuǎn)移患者均為全身多發(fā)轉(zhuǎn)移。并成功提取患者外周血中的總RNA,使用全轉(zhuǎn)錄組測(cè)序方法檢測(cè)樣本中的lncRNAs,結(jié)果顯示,差異表達(dá)的lncRNAs有14條,表達(dá)差異較大的為lncRNA ENST00000610778,其對(duì)應(yīng)的基因?yàn)锳C245060.5,定位于22號(hào)染色體。在NPC轉(zhuǎn)移患者的血清中含量低,在非轉(zhuǎn)移NPC患者血清中含量高,與轉(zhuǎn)移組比較,差異倍數(shù)為4 011.71。這些差異表達(dá)的lncRNAs對(duì)應(yīng)的基因富集到不同區(qū)域,參與細(xì)胞信號(hào)通路的調(diào)節(jié)。通過(guò)生物信息學(xué)分析發(fā)現(xiàn),基因中RPL3、RPL12均編碼一種核糖體蛋白,分別定位于22號(hào)、9號(hào)染色體,真核細(xì)胞80S核糖體定位于胞質(zhì),由60S大亞基和40S小亞基組成,60S大亞基含有46個(gè)核糖體蛋白,40S小亞基含有33個(gè)核糖體蛋白。而RPL3、RPL12均為60S亞基的組成部分。參與GO注釋生物學(xué)過(guò)程、分子生物學(xué)功能、細(xì)胞學(xué)組分以及KEGG通路。其中,參與的生物學(xué)過(guò)程最多,共有7個(gè),包括翻譯、核糖體大亞基組裝、SRP依賴的膜靶向共翻譯蛋白、該圖為KEGG網(wǎng)站的核糖體通路具體組成,紅框部分L3、L12分別為RPL3、RPL12的簡(jiǎn)稱,代表RPL3、RPL12參與核糖體通路病毒轉(zhuǎn)錄、核轉(zhuǎn)錄mRNA分解代謝過(guò)程、翻譯啟動(dòng)以及rRNA加工。分子生物學(xué)功能富集于核糖體結(jié)構(gòu)成分,細(xì)胞學(xué)組分富集于胞質(zhì)大核糖體亞基、黏著斑。值得注意的是,RPL3、RPL12在KEGG信號(hào)通路中主要參與核糖體通路,KEGG網(wǎng)站中對(duì)應(yīng)編號(hào)為map03010,在中心法則中負(fù)責(zé)翻譯過(guò)程,由此推測(cè)本研究中它們相應(yīng)的lncRNA ENST00000465618、ENST00000497322/ ENST00000497825,也可能與蛋白質(zhì)的合成有關(guān),具有潛在研究?jī)r(jià)值??舍槍?duì)這些具有潛在研究?jī)r(jià)值的lncRNAs,在分子水平、細(xì)胞水平揭示它們與NPC轉(zhuǎn)移發(fā)生的相關(guān)性及具體作用機(jī)制,為NPC轉(zhuǎn)移的診斷和治療提供靶點(diǎn)。
圖3 核糖體通路組成
盡管lncRNAs與NPC相關(guān)性研究逐漸深入,但真正應(yīng)用到實(shí)際臨床工作中還需更多投入。主要難點(diǎn)在于:① lncRNAs自身作用復(fù)雜,且存在相互串?dāng)_,還有可能存在其他潛在機(jī)制,本研究鑒定出的lncRNA ENST00000610778、lncRNA ENST00000465618、ENST00000497322/ENST00000497825前期研究很少,尚未有文獻(xiàn)報(bào)道其具體功能及作用機(jī)制;② 一種lncRNA往往參與多種疾病的發(fā)生,NPC特異性的lncRNAs很少報(bào)道,轉(zhuǎn)移特異性的lncRNAs更是少見(jiàn),因此,需要更大的樣本量去發(fā)現(xiàn)和鑒定相關(guān)的lncRNAs;③ 實(shí)驗(yàn)室研究轉(zhuǎn)化以及與臨床應(yīng)用的整合面臨挑戰(zhàn),需要多學(xué)科的交叉、整合與協(xié)作。后續(xù)本課題組將繼續(xù)圍繞上述lncRNAs對(duì)NPC生物學(xué)影響深入展開(kāi)體外及體內(nèi)研究,為lncRNAs在NPC的臨床應(yīng)用提供基礎(chǔ)。
本研究補(bǔ)充了人體外周血樣本中轉(zhuǎn)移性NPC的表達(dá)譜,鑒定出與非轉(zhuǎn)移性NPC患者差異表達(dá)的一系列l(wèi)ncRNAs,提示lncRNAs可能參與NPC的轉(zhuǎn)移過(guò)程,利用lncRNAs與其相應(yīng)基因的功能相關(guān)性,對(duì)它們參與的生物學(xué)過(guò)程以及信號(hào)通路進(jìn)行預(yù)測(cè),為lncRNAs在NPC轉(zhuǎn)移過(guò)程中的生物學(xué)作用及潛在機(jī)制研究提供思路和方向。