李靖霄,李國盛,徐陽,何融泉,周華富,孔晉亮,陳罡*
肺癌(lung cancer,LC)是中國最常見且病死率最高的癌種;最新的研究報道顯示,在世界范圍內(nèi)的惡性腫瘤中,LC的發(fā)病率和病死率分別位居第二和第一[1,2]。根據(jù)病理分型,LC常被分為非小細胞肺癌(non-small cell lung cancer,NSCLC)和小細胞肺癌(small cell lung cancer,SCLC)兩種亞型,而前者約占LC的85%[3]。肺腺癌(lung adenocarcinoma,LUAD)和肺鱗狀細胞癌(lung squamous cell carcinoma,LUSC)是最常被診斷的NSCLC組織學亞型[4]。隨著診斷和治療技術的進步,手術聯(lián)合新型放化療已可使NSCLC患者5年生存率達到21.7%[5]。然而,更多的患者在確診時腫瘤已進展到晚期,這讓常規(guī)治療方法的療效不容樂觀[6,7]。因此,挖掘有效的臨床篩查和治療NSCLC的標志物,對降低患者病死率和提高患者生存質(zhì)量尤為重要。
微小RNA(microRNAs,miRNAs)可通過調(diào)控信使RNA的表達而影響轉(zhuǎn)錄過程[8]。作為miR-130家族的一員,miR-130b-3p已被報道參與調(diào)控多種腫瘤的進展,但其調(diào)控作用與調(diào)控機制在不同腫瘤中卻不盡相同[9]。例如,miR-130b-3p在肝細胞癌、乳腺癌、前列腺癌中被認為具有抑制腫瘤發(fā)展的作用,而在膀胱癌、腎母細胞癌、胃癌中被認為具有促進腫瘤發(fā)展的作用[10-15]。此外,miR-130b-3p在NSCLC中的作用也已被初步報道。一些針對人工培育NSCLC細胞和NSCLC患者腫瘤組織的研究表明,miR-130b-3p具有促進癌細胞增殖、侵襲和轉(zhuǎn)移的作用[16-18]。盡管Ulivi等人的研究提到,血液中miR-130b-3p的表達與NSCLC患者的總生存率顯著相關,但他們并未闡明miR-130b-3p在NSCLC患者血液中的表達情況與臨床意義[18]。此外,這些有關miR-130b-3p和NSCLC的研究均屬于單中心的小樣本研究,未探索miR-130b-3p應用于篩查NSCLC的潛在價值,且未闡明miR-130b-3p在NSCLC中的作用機制。因此,應用大量樣本進一步探索miR-130b-3p在NSCLC患者血液中的表達水平和作用機制對明確miR-130b-3p的潛在臨床應用價值至關重要。
本研究旨在通過分析來自公共數(shù)據(jù)庫的miRNAs表達譜,以探究miR-130b-3p在NSCLC患者血液中的表達水平及鑒別該疾病的潛力,從而挖掘miR-130b-3p篩查和治療NSCLC的潛在臨床意義。
為采集用于分析miR-130b-3p在NSCLC中的表達水平與鑒別潛力的數(shù)據(jù),本研究以“l(fā)ung AND(tumor OR cancer OR carcinoma OR neoplasms)
AND(microRNA OR miRNA)”作為檢索式,在基因表達譜數(shù)據(jù)庫(Gene Expression Omnibus,GEO)以及序列片段歸檔數(shù)據(jù)庫(Sequence Read Archive,SRA)中進行檢索。同時,為了檢索與提取癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)中收錄的數(shù)據(jù),Xena數(shù)據(jù)庫被用于下載LC相關數(shù)據(jù)集。數(shù)據(jù)集納入條件如下:①研究對象為智人;②數(shù)據(jù)應來自血液,包括全血、血漿等;③數(shù)據(jù)集需包含miR-130b-3p表達數(shù)據(jù);④每個數(shù)據(jù)集需包含至少3個腫瘤和3個非腫瘤樣本;⑤樣本未經(jīng)過任何藥物或其它化學物質(zhì)處理。隨后,將所收集到的數(shù)據(jù)按照測序平臺進行合并,并進行了log2(x+1)轉(zhuǎn)換。
為觀察不同NSCLC亞型中miR-130b-3p的表達水平,本研究根據(jù)腫瘤亞型將所有樣本分為兩組,分別為LUAD和LUSC組。首先,對數(shù)據(jù)集的平均值、標準差、敏感度、特異度進行計算,并根據(jù)分組進行記錄。接著,各個數(shù)據(jù)集的miR-130b-3p表達水平被繪制成散點圖和受試者工作特征(receiver operating characteristic,ROC)曲線。為了綜合展示各個數(shù)據(jù)集的結果,標準化均數(shù)差(standardized mean difference,SMD)和診斷性似然比(diagnostic likelihood ratio,DLR)也被計算。我們還繪制森林圖與綜合受試者工作特征(summaryreceiver operating characteristic,sROC)曲線。由于可收集到的數(shù)據(jù)有限,本研究在此將LUAD和LUSC的數(shù)據(jù)集合并分析。曲線下面積(area under curve,AUC)的百分比值大小是在ROC及sROC曲線中評判miR-130b-3p鑒別NSCLC的潛力的標準。
MiRwalk 2.0納入了12個數(shù)據(jù)庫的miRNAs和基因的表達情況,具有預測miRNA-靶基因關系的功能。本研究將“miR-130b-3p”作為關鍵詞在MiRwalk 2.0中進行檢索。對檢索到的靶基因基于下列條件篩選:結合分數(shù)(binding score)等于1且同時在12個數(shù)據(jù)集中被認為是miR-130b-3p的靶基因。將篩選到的基因輸入檢索相互作用基因的搜索工具(search tool for the retrieval of interacting genes,STRING)分析靶基因之間作用關系,并構建蛋白質(zhì)-蛋白質(zhì)交互(protein-protein interaction,PPI)網(wǎng)絡。隨后,根據(jù)各基因相互作用的degree值篩選出的樞紐基因(hub genes)被選用于后續(xù)分析。
將篩選得到的miR-130b-3p下游靶基因輸入注釋、可視化和集成發(fā)現(xiàn)數(shù)據(jù)庫(database for annotation,visualization and integrated discovery,DAVID)v 6.8進行富集分析。本研究選擇了基因本體(Gene Ontology,GO)-生物過程(biological process,BP)、GO-細胞成分(cellular component,CC)、GO-分子功能(molecular function,MF)對miR-130b-3p下游靶基因進行功能富集,同時應用京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析,以探討miR-130b-3p下游靶基因調(diào)控腫瘤發(fā)展的潛在信號通路。
在本研究中,Graphpad prism 8.0被用于構建散點圖及描繪ROC曲線。應用IBM SPSS 23.0計算數(shù)據(jù)平均值和標準差。Stata 14.0被用于計算SMD和DLR并繪制森林圖與sROC曲線。在線數(shù)據(jù)庫miRwalk 2.0以及DAVID v6.8分別被用于預測miR-130b-3p的下游靶基因和下游靶基因的潛在信號通路。我們使用Cytoscape v3.7.1的cytohubba模塊篩選出了miR-130b-3p下游靶基因的樞紐基因。
在本研究中,共有來自公共數(shù)據(jù)庫的7項研究被納入分析(表1)。
在4個納入的LUAD數(shù)據(jù)集中,有3個表明miR-130b-3p在LUAD組和對照組血液樣本間的表達差異被認為具有統(tǒng)計學意義(P<0.05)(圖1A~D)。如 圖1E~G所 示,在3個 納 入 的LUSC數(shù)據(jù) 集 中有1個表明在LUSC組和對照組血液樣本間miR-130b-3p的表達差異被認為具有統(tǒng)計學意義(P<0.05)。根據(jù)各個數(shù)據(jù)集ROC曲線的AUC,我們認為使用在NSCLC患者血液中低表達的miR-130b-3p具有良好的預測價值(圖2)。
圖1 MiR-130b-3p在NSCLC患者血液中表達水平的散點圖A~D:樣本來自LUAD患者血液;E~G:樣本來自LUSC患者血液
圖2 MiR-130b-3p在NSCLC患者血液中的ROC曲線A~D:分別為GSE27486、GSE40738、GSE152702和GSE171517的ROC曲線;E~G:分別為GSE40738、GSE152702和GSE171517的ROC曲線
為了進一步明確miR-130b-3p在NSCLC患者血液的表達水平,本研究綜合計算了miR-130b-3p的SMD(表2)。結果表明,在LUAD中,SMD=-1.45,95%置信區(qū)間(confidence interval,CI)為-2.66~-0.23;在LUSC中,SMD=-0.46,95%CI:-0.84~-0.09(圖3A)。未發(fā)現(xiàn)SMD結果存在明顯的發(fā)表偏倚(圖3B)。因此,目前結果顯示miR-130b-3p在NSCLC患者血液中的表達量顯著低于健康人血液。綜合結果,我們發(fā)現(xiàn)在NSCLC患者血液中低表達的miR-130b-3p具有較好地區(qū)分腫瘤組織和正常組織的潛力(AUC=0.85,95%CI:0.82~0.88)(圖3C)。圖3D提示納入的NSCLC組織數(shù)據(jù)集具有較低的陰性DLR以及較高的陽性DLR。
圖3 MiR-130b-3p在NSCLC患者體內(nèi)的表達水平及鑒別潛力A:MiR-130b-3p在血液中表達水平森林圖,上半部分表示其在LUAD血液樣本中的表達水平,下半部分表示其在LUSC血液樣本中的表達;B:漏斗圖展示所納入血液樣本的發(fā)表偏倚;C:MiR-130b-3p在NSCLC患者血液中的sROC曲線;D:在NSCLC患者血液中miR-130b-3p的DLR注:LUAD,肺腺癌;LUSC,肺鱗狀細胞癌;sROC,綜合受試者工作特征;NSCLC,非小細胞肺癌;DLR,診斷性似然比
表2 在7項納入的研究中,miR-130b-3p在NSCLC患者和健康人血液中的表達水平平均值與標準差
在miRwalk 2.0中,本研究篩選出了47個miR-130b-3p的下游靶基因,并通過PPI網(wǎng)絡展示了他們之間的聯(lián)系(圖4A)。根據(jù)各下游靶基因間的degree值,我們篩選出了前10個degree值最高的下游靶基因作為樞紐基因,分別為ESR1、AGO1、DDX6、MTMR9、CFL2、TRIM2、QKI、FMR1、TNRC6B和BRWD1(圖4B)。所篩選出的下游靶基因們將被用于后續(xù)分析。
結果顯示,在GO-BP分析中,miR-130b-3p下游靶基因顯著富集于protein phosphorylation、mRNA processing和RNA splicing(圖4C)。在GO-CC分析中,miR-130b-3p下游靶基因顯著富集于lysosome、early endosome membrane和processing body(圖4D)。在GO-MF分析中,miR-130b-3p下游靶基因顯著富集于protein binding、chromatin binding和protein serine(圖4E)。KEGG分析結果表明,miR-130b-3p下游靶基因顯著富集于endocytosis和axon guidance通路(圖4F)。這些結果提示miR-130b-3p可能通過參與相關通路的調(diào)控進而影響NSCLC的發(fā)展。
圖4 MiR-130b-3p下游靶基因的富集分析A:使用miR-130b-3p下游靶基因構建的PPI網(wǎng)絡圖;B:MiR-130b-3p下游靶基因的樞紐基因(hub genes);C:在GO_BP分析中miR-130b-3p下游靶基因富集情況;D:在GO_CC分析中miR-130b-3p下游靶基因富集情況;E:在GO_MF分析中miR-130b-3p下游靶基因富集情況;F:在KEGG富集分析中miR-130b-3p下游靶基因富集情況
在本研究中,基于300例血液樣本的miR-130b-3p表達水平,我們首次提出miR-130b-3p在NSCLC患者血液中表達下調(diào)。同時,我們發(fā)現(xiàn)在血液中低表達的miR-130b-3p具有顯著的篩查NSCLC患者的潛力。47個基因被鑒定為miR-130b-3p的下游靶基因,且根據(jù)這些靶基因探索miR-130b-3p參與調(diào)控NSCLC發(fā)生發(fā)展的潛在信號通路。
近年來,已有一些研究報道了miR-130b-3p在NSCLC中的表達水平及生物學作用?;诜治?5例組織樣本,Yu等[16]人發(fā)現(xiàn)miR-130b-3p的表達水平在來自NSCLC患者體內(nèi)的癌細胞中明顯升高,并與腫瘤細胞的增殖和轉(zhuǎn)移速度呈正相關,且敲低miR-130b-3p后,腫瘤細胞的增殖、侵襲和遷移隨之受到抑制。Guo等[17]人發(fā)現(xiàn)miR-130b-3p在人工培育的NSCLC細胞中表達上調(diào);而敲低miR-130b-3p的NSCLC細胞具有更低的增殖、侵襲和遷移能力,提示了miR-130b-3p表達可能影響NSCLC的進展。通過分析99例LUAD樣本和83例LUSC樣本的血液miRNAs表達水平,Ulivi等[18]人報道了高表達的miR-130b-3p與LUSC患者的無瘤生存期呈明顯負相關,且與LUAD患者的總生存率呈明顯負相關。這些研究提示了miR-130b-3p在NSCLC的表達差異及重要生物學功能,但存在樣本量較?。╪≤182)、僅基于單中心數(shù)據(jù)等問題,他們也并未闡明miR-130b-3p在血液中的表達水平。在本研究首次通過來自公共數(shù)據(jù)庫大樣本探討了miR-130b-3p在NSCLC患者血液內(nèi)的表達水平,并發(fā)現(xiàn)相較于健康人的血液,miR-130b-3p在NSCLC患者的血液中呈現(xiàn)明顯的低表達。已有的研究認為,細胞凋亡和活性分泌是血液中miRNAs的重要來源,當細胞凋亡和活性分泌活躍時,血液中miRNAs含 量 上調(diào)[19]。Guo等[17]人認為,miR-130b-3p主要來自間充質(zhì)干細胞,并通過胞外囊泡分泌轉(zhuǎn)移至NSCLC細胞內(nèi),從而促進NSCLC細胞的增殖、侵襲和轉(zhuǎn)移。因此,我們推斷NSCLC患者間充質(zhì)干細胞分泌的miR-130b-3p隨血液轉(zhuǎn)移至NSCLC細胞內(nèi),導致患者血液中miR-130b-3p含量較正常人的更低;同時,由于腫瘤細胞凋亡活動減弱,患者血液中miR-130b-3p將持續(xù)處于低水平。
現(xiàn)有研究表明,血液中miRNAs可作為某些腫瘤的生物標志物[20]。一些研究也通過診斷試驗鑒定了多個具有作為NSCLC早期篩查的生物標志物前景的miRNAs[21-23]。在本研究中,診斷試驗結果顯示miR-130b-3p的AUC=0.85,提示miR-130b-3p可以較為準確地鑒別NSCLC患者和健康人。因此,我們提出通過檢測血液中miR-130b-3p的表達水平,有助于篩查NSCLC。在未來投入更多的精力研究miR-130b-3p在NSCLC患者血液的表達水平,對早期預測NSCLC及其預后具有積極作用。
本研究尚存在一些局限:首先,尚需在將來經(jīng)過實驗驗證miR-130b-3p與下游靶基因的聯(lián)系;其次,下游靶基因所顯著富集的信號通路與NSCLC發(fā)展的關系尚無法闡明;最后,因可收集的樣本有限,除了LUAD和LUSC外,本研究未能對NSCLC的其他亞型進行分析。
總之,本研究通過分析來自多中心的大樣本數(shù)據(jù),首次提出miR-130b-3p在NSCLC患者血液內(nèi)表達下調(diào),并有望用于NSCLC的篩查。