徐思明, 宋雨翰, 邵彥雄, 陶嵐, 周海文
1.上海交通大學醫(yī)學院附屬第九人民醫(yī)院·口腔醫(yī)學院口腔黏膜病科,國家口腔疾病臨床研究中心,上海市口腔醫(yī)學重點實驗室,上海市口腔醫(yī)學研究所,上海(200011); 2. 上海交通大學醫(yī)學院附屬第九人民醫(yī)院·口腔醫(yī)學院口腔綜合科,國家口腔疾病臨床研究中心,上海市口腔醫(yī)學重點實驗室,上海市口腔醫(yī)學研究所,上海(200011)
口腔白斑(oral leukoplakia,OLK)是一種發(fā)生在口腔黏膜上以白色為主、不能擦除的斑片或斑塊,臨床或病理上不能診斷為其他任何疾病的口腔黏膜潛在惡性疾病。流行病學顯示OLK 的惡性轉化率高達3%~18%,非均質的OLK 惡性轉化率甚至高達15%~40%[1]。OLK 的病因較為復雜,發(fā)病機理仍不清楚,目前臨床上沒有特效治療方法,因此研究OLK 發(fā)病機制并確定新的潛在分子標志物具有重要意義。環(huán)狀RNA(circRNA)是具有共價閉環(huán)結構的非編碼RNA[2]。有報道表明circRNA 在腫瘤、神經系統(tǒng)、心血管疾病、炎癥及免疫疾病中發(fā)揮重要的作用[3?7]。研究表明circRNA可作為有效的生物標志物和治療靶點[8?11]。但目前還沒有OLK 相關circRNA 的報道。本研究通過高通量測序描繪OLK 和正常口腔黏膜(normal oral mucosal,NOM)組織中circRNA 的表達譜,并通過對篩選出的顯著差異表達的circRNA 進行驗證分析,同時構建circRNA?miRNA?mRNA 的競爭性內源RNA(competing endogenous RNA,ceRNA)網絡,為circRNA 在OLK 發(fā)病機制中的機理研究提供新的研究方向。
選取2018 年9 月至11 月于上海第九人民醫(yī)院口腔黏膜科接受治療的OLK 患者的白斑組織26例,男女比例1∶1?;颊叩慕M織樣本都通過組織病理學檢查確診為OLK。26 例NOM 組織來自整復外科及口腔外科拔牙的手術患者。組織納入標準為不伴有系統(tǒng)性疾病,且3 個月內未接受過免疫刺激治療(包括類固醇治療),無放療、化療史。所有的組織樣本取樣后都立即放入液氮保存。提供組織樣本的患者均于術前簽署知情同意書,本研究已通過上海第九人民醫(yī)院倫理委員會審批[審批編號:(2012)21]。從收集的52 例樣本中選取6 例OLK 組織及6 例NOM 組織進行高通量測序,樣本信息見表1,并采用qRT?PCR 驗證這52 例組織中篩選重點circRNA 的表達情況。
TRIzol 裂解液(Life Technologies,美國);Ribo?Zero rRNA Removal Kits(Illumina,美國);TruSeq Stranded Total RNA Library Prep Kit(Illumina,美國);SuperScript Ⅲ逆轉錄試劑盒(Invitrogen,美國);qRT?PCR 引物(上海云序生物工程技術有限公司);qPCR SYBR Green master mix(上海云序生物科技有限公司);RNaseR(epicentre,美國);RNase inhibitor(Millipore,美國)。NanoDrop ND?1000 儀器(Thermo Fisher Scientific,美國);BioAnalyzer 2100 儀器(Agilent Technologies,美國);Illumina HiSeq 4000測序平臺(上海云序生物科技有限公司);實時熒光定量PCR 儀(Thermo Fisher,美國);Gene Amp PCR Sys?tem 9700(應用生物系統(tǒng)公司,美國)。
表1 高通量測序口腔白斑組織的臨床特點Table 1 The clinical characteristics of patients with oral leukoplakia for sequencing
使用TRIzol 試劑盒提取總RNA,使用NanoDrop ND?1000 儀測量每個樣品的RNA 濃度。以吸光光度(OD)260/280值作為RNA 純度指標。使用Ribo?Zero rRNA Removal Kits 移除總RNA 中的rRNA。采用TruSeq Stranded Total RNA Library Prep Kit 預處理RNA,構建測序文庫。采用BioAnalyzer 2100 儀器進行文庫質控和定量。根據Illumina 測序說明,將10 pM 文庫變性為單鏈DNA 分子,在Illumina flowcell上捕獲,原位擴增為簇,并在Illumina HiSeq 測序儀上采用雙端模式(PE mode)進行150 cycle 測序。
通過Illumina HiSeq 4000 測序儀測序,并使用circBase 數據庫和circ2Traits 對所鑒定的環(huán)狀RNA進行注釋[12?13]。參考倍數變化(fold change,FC)和P 值進行篩選,選擇FC ≥2.0,P <0.05 作為篩選差異circRNA 的閾值。circRNA 高通量測序由上海云序生物有限公司完成檢測及數據初步分析。
根據高通量測序結果,選取表達差異程度較顯著的circRNA(FC 越大,P 值越小越佳;原始信號表達值越平均越佳),并結合功能分析結果,共選取10 個circRNA,采用測序的6 對樣本進行qRT?PCR 驗證。對提取的RNA 使用SuperScript Ⅲ逆轉錄試劑盒逆轉錄為cDNA 文庫。選取GAPDH 為內參,使用ViiA 7 實時熒光定量PCR 儀,采用qPCR SYBR Green master mix 試劑盒進行qRT?PCR。本研究所用引物序列由上海生工提供,引物序列見表2。采用2?ΔΔCt法對目的基因的相對表達水平進行計算分析,得到各目的基因差異表達情況。根據PCR 選取circRNA 進行酶耐受實驗,使用RNase處理提取的RNA,37 ℃水浴20 min,結果合格者進行sanger 測序驗證。另選OLK 與NOM 的樣本組織各20 例,對篩選合格circRNA circHLA?C 進行qRT?PCR 進行驗證。
表2 qRT?PCR 引物信息Table 2 The primers used for qRT?PCR experiments
通過TargetScan 和miRanda 預測目的circRNA下游的miRNA、mRNA,利用生物信息學軟件Cyto?scape(v2.8.0)構建ceRNA 網絡圖。
對差異表達基因進行GO 富集分析和KEGG 功能通路分析,預測差異circRNA 的功能和參與的功能通路。GO 分析主要歸類為三部分,包括:生物學過程、細胞成分和分子功能。GO 分析是根據差異表達circRNA 的來源基因和GO 注釋列表對GO條目進行篩選。
數據分析采用SPSS 19.0 和Graphpad Prism 8.0完成。計量資料符合正態(tài)分布,用±s 表示,兩組間比較采用獨立t 檢驗。使用ROC 曲線分析circH?LA?C 診斷的特異性與靈敏性,并用spearman 等級相關分析circHLA?C 與OLK 異常增生程度相關性。P<0.05 為差異具有統(tǒng)計學意義。
聚類分析圖顯示了OLK 與NOM 間的差異cir?cRNA 表達譜(圖1a)。根據統(tǒng)計標準,繪制散點圖和火山圖(圖1b、1c)。在OLK 中,共鑒定出366 個顯著差異的circRNA,其中65 個上調,301 個為下調。在這366 個circRNA 中,發(fā)現28 個新的cir?cRNA,其余的circRNA 在circbase 中已有過報道,且差異表達circRNA 大多數為外顯子circRNA(圖2a、2b),提示差異circRNA 具有重要的生物學功能。circRNA 的長度集中在小于500 bp 和500~2 000 bp 兩組內(圖2c)。這些差異表達circRNA 幾乎分布在所有染色體上,包括22 條常染色體和X染色體(圖2d),提示差異circRNA 分布較為廣泛。
Figure 1 Expression profiles of circRNAs in OLK versus NOM tissues圖1 OLK 與NOM 組織中circRNA 的表達譜
未經處理和分析的測序數據經標準化后,已上傳至GEO 網站,GEO 序列號為GSE131568。
選取的10 個circRNA 包括4 個表達上調和6 個表達下調的circRNA(表3)。經驗證,在這10 個circRNA 中有7 個qRT?PCR 結果與測序結果保持一致,且具有統(tǒng)計學意義(P <0.05,圖3)。由于cir?cRNA 對核酸酶不敏感,通過qRT?PCR 驗證的7 個circRNA 中選擇了5 個疾病相關性高的circRNA 進行酶耐受實驗。結果表示,circHLA?C、circPLIN4(perilip3?4)和circRNF13 可抵抗核糖核酸酶的水解(圖3c),對這3 個circRNA 進行Sanger 測序。結果顯示,差異表達最顯著的circHLA?C 是真正的circRNA,且具有特定反式剪接位點。進一步對circHLA?C 進行了可視化分析,circHLA?C 由8 個外顯子和7 個內含子組成,且反剪接位點為CTACCT?GG(圖4)。
Figure 2 Distribution of the characteristics of significantly dysregulated circRNAs圖2 顯著表達差異circRNA 分布特點
表3 OLK 組織10 個顯著表達差異circRNATable 3 Ten circRNAs differentially expressed in OLK
Figure 3 Ten circRNAs differentially expressed in OLK圖3 OLK 組織10 個顯著差異表達circRNA
在OLK 表達上調的circRNA 中,circHLA?C 的來源基因HLA?C 富集到多達95 個GO 功能條目,分別包括44 條生物學過程、45 條細胞組分和6 條分子功能通路(見本文OSID 碼)。HLA?C 在生物學過程中可參與調控T 細胞介導的細胞毒性和免疫功能。在細胞組分功能富集分析中,發(fā)現HLA?C可調控Ⅰ類人類主要組織相容復合體(major histo?compatibility complex,MHC)。
通過來源基因的相關通路,進行KEGG 通路富集分析,預測circRNA 功能通路。與366 個差異基因相關的KEGG 通路共有139 條,其中富集到上調的circRNA 通路有60 條。OLK 作為一種癌前病變,在上調通路中共預測到3 條KEGG 通路參與癌變過程。腫瘤相關蛋白聚糖、腫瘤相關miRNA 和腫瘤相關通路都可參與調節(jié)胞外信號蛋白激酶/促分裂原活化蛋白激酶(extracellular?signal?regulated protein kinase/mitogen?activated protein kinase,ERK/MAPK1),二者已被證明是OLK 發(fā)病的關鍵因素[14?15]。301 個下調circRNA 參與的79 條KEGG 通路,其中顯著調節(jié)的有泛素介導的蛋白水解、調節(jié)干細胞多能性的信號通路和mTOR信號通路(圖5)。
通過ROC 曲線分析評估circHLA?C 對OLK 的診斷意義。circHLA?C 曲線下面積(Area Under Curve,AUC)為0.955(95% CI:0.892~1.00,P<0.001)(圖6)。提示circHLA?C 具有成為OLK 生物標志物的可能性。
Figure 4 Ring formation mechanism and back spliced site of circHLA?C圖4 circHLA?C 的成環(huán)機制及反剪接位點
分析20例OLK組織circHLA?C的表達量與異常增生程度的相關性,結果表明circHLA?C 表達量與OLK輕、中度異常增生呈正相關(r=0.478,P=0.033)。
本研究共篩選出7 個circRNA 建立ceRNA 網絡(圖7)。根據結合能力,列出了每個circRNA 調控的前5 個miRNA。生物信息學繼續(xù)分析下游的miRNA?mRNA 網絡,圖中呈現了前5 個miRNA 能在下游抑制的mRNA。這表明circRNA 具有十分廣泛的作用空間,可通過多種不同的通路對下游分子甚至是蛋白進行調控。
Figure 6 ROC curve analysis of circHLA?C in OLK圖6 circHLA?C 在OLK 中的ROC 曲線分析
OLK 是最常見的口腔黏膜潛在惡性病變,研究表明OLK 發(fā)生癌變平均需要4 至5 年[16?17],因此,OLK 的早期診斷和治療非常重要。circRNA 曾被認為是分子內錯剪接的副產物[18]。近年來,cir?cRNA 得到越來越多科研界研究者的關注,目前circRNA 已在真核細胞內確認是一類新的廣泛存在、豐度高、保守性高且較為穩(wěn)定的內源性非編碼RNA[19?21]。研究表明circRNA_100290,circDOCK1和circ_0007059 可通過ceRNA 機制調控口腔鱗狀細胞癌(oral squamous carcinoma cell,OSCC)的生長和 轉 移[22?24]。hsa_circ_0005320,hsa_circ_0067531和hsa_circ_0000869 可調控口腔黑色素瘤的形成和轉移[25]。
circRNA 可作為順式作用元件調控其親本基因的表達,促進基因轉錄[26]。本研究通過circRNA來源基因的功能預測circRNA 的功能。HLA?C 表達的變化可影響免疫系統(tǒng)對感染性和自身免疫性疾病的應答效果,且HLA?C 的進化使其與殺傷細胞免疫球蛋白樣受體的相互作用更加強烈,從而影響自然殺傷細胞反應的調節(jié)[27]。研究表明KIR2DL1(+)?HLA?C2(+)基因型可能是OSCC 早期易感人群的危險因素[28]。
GO 功能富集分析顯示差異表達circRNA 具有豐富的功能,多數差異表達circRNA 都可富集到細胞周期過程。推測調控細胞周期的基因表達的變化是OLK 發(fā)生的主要原因之一。HLA?C 可富集到功能T 細胞介導的細胞毒性和免疫、MHCⅠ類蛋白復合體。研究表明,MHCⅠ類分子與特異性T 細胞受體和CD8+細胞表面分子的識別有關。MHCⅠ類分子是OLK 中的關鍵分子,在OLK 中呈低表達,且與異常增生程度相關[29?30]。此外,OSCC 和伴異常增生OLK 中CD8+細胞數量明顯多于無異常增生的OLK[31]。
KEGG 通路富集分析顯示在60 種上調的cir?cRNA 通路中,富集分數排名前10 通路包括自然殺傷細胞介導的細胞毒性、B 細胞受體信號通路、EB病毒感染、蛋白多糖在癌癥中的作用、T 細胞受體信號通路和移植物排斥等。在這些途徑中,circH?LA?C 的靶基因參與了自然殺傷細胞介導的細胞毒性、EB 病毒感染和移植物排斥。這一結果提示OLK 可能與感染和免疫抑制因子有關,而circHLA?C 可能是其中的關鍵因素。與NOM 組織樣本相比OLK 中circHLA?C 顯著升高。ROC 曲線表明circH?LA?C 對OLK 的診斷具有較高的特異性和靈敏性,且circHLA?C 的表達量與輕、中度異常增生程度呈正相關。揭示了circHLA?C 可能成為新的生物標志物。
研究表明circRNA 可作為ceRNA 作用于細胞調控網絡[32]。本研究構建的ceRNA 網絡顯示circHLA?C 可通過海綿機制與miR?9、miR?339?5p、miR?29a?3p、miR?26a?5p、miR?222?3p 進行互補配對,通過TargetScan、MiRanda 軟件可預測circHLA?C 與以上miRNA 之間具有結合位點。有研究發(fā)現OLK 和OSCC 患者血清miR?9 表達較NOM 標本明顯降低[33]。在OLK 和一些原發(fā)癌組織中,miR?339?5p 表達下調,作為腫瘤抑制因子參與癌癥進展[34?35]。miR?29a?3p 和miR?26a?5p 在OLK 和癌組織中顯著下調[36]。此外,與正常和OSCC 患者相比,OLK 中miR?222?3p 顯著下調[37]。由此可見,circHLA?C 可能具有同一miRNA 的多個結合位點或多個不同miRNA 的結合位點。circHLA?C 可能就是通過海綿吸附這些miRNAs 來調控OLK 的發(fā)生發(fā)展。對于circHLA?C 與miRNAs 及OLK 下游靶基因的相互作用,今后還需要進行更深入的研究。
綜上所述,本研究探討了circRNA 在OLK 病因病理及發(fā)生發(fā)展中的作用,并揭示了circHLA?C 具有成為OLK 潛在分子標志物及治療靶點的可能。
【Author contributions】Xu SM wrote and revised the article. Song YH, Shao YH, Tao L directed the data collection and analysis. Zhou HW designed the study. All authors read and approved the final manu?script as submitted.