朱林靜,姚俊,魏欽俊,魯雅潔,曹新
南京醫(yī)科大學 基礎(chǔ)醫(yī)學院生物技術(shù)系,江蘇 南京 211166
研究報告
催乳素處理的乳腺癌T-47D細胞lncRNA和mRNA表達譜差異分析
朱林靜,姚俊,魏欽俊,魯雅潔,曹新
南京醫(yī)科大學 基礎(chǔ)醫(yī)學院生物技術(shù)系,江蘇 南京 211166
目的:觀察催乳素處理引起乳腺癌T-47D細胞中長鏈非編碼RNA(lncRNA)和mRNA表達譜的變化。方法:利用轉(zhuǎn)錄組測序技術(shù)檢測催乳素處理前后乳腺癌T-47D細胞中l(wèi)ncRNA和mRNA的表達譜;通過數(shù)據(jù)庫KEGG、GO富集對有差異表達且具有統(tǒng)計學意義的mRNA進行通路分析,得到mRNA參與的生物學途徑;運用熒光定量PCR(qRT-PCR)技術(shù)對部分差異表達的 lncRNA(lnc-AK4-2、XLOC_075541、XLOC_093371、XLOC_081110、XLOC_047068、XLOC_006637、XLOC_064063、XLOC_086865、XLOC_099517、XLOC_106798、lnc-ZNF639-1)進行驗證,并利用生物信息學方法預(yù)測其靶基因,通過數(shù)據(jù)庫KEGG、GO富集對差異lncRNA的靶基因進行通路分析。結(jié)果:分析得到3564個差異lncRNA和477個差異mRNA(差異倍數(shù)>2,P<0.05),差異表達的mRNA主要富集在134條不同的信號通路,其中包括催乳素/催乳素受體信號通路相關(guān)的MAPK信號通路、p53信號通路和JAK-STAT信號通路;選取的11條lncRNA的變化趨勢(XLOC_093371、XLOC_006637、XLOC_064063、XLOC_086865、lnc-ZNF639-1表達上調(diào),lnc-AK4-2、XLOC_075541、XLOC_081110、XLOC_047068、XLOC_099517、XLOC_106798表達下調(diào))經(jīng)qRT-PCR技術(shù)得到驗證;lncRNA靶基因富集的信號通路同樣包括MAPK信號通路。結(jié)論:催乳素處理前后T-47D細胞中l(wèi)ncRNA的表達存在明顯差異,為進一步研究與乳腺癌發(fā)病機制相關(guān)的關(guān)鍵lncRNA分子提供了基礎(chǔ),并為尋找乳腺癌潛在的診療方法提供理論支持。
長鏈非編碼RNA;表達譜;乳腺癌;催乳素;T-47D細胞
乳腺癌是當今困擾女性健康的最普遍的癌癥之一,且其發(fā)病率呈逐年上升的趨勢,由于乳腺癌起病隱匿,部分乳腺癌患者檢出或確診時已屬中晚期,治療效果不甚理想,因此早期診斷、早期治療是提高生存率的關(guān)鍵[1]。目前,已經(jīng)發(fā)現(xiàn)多種因素與乳腺癌有著密切關(guān)系。人催乳素(prolactin,PRL)是由腦垂體前葉分泌的由199個氨基酸殘基構(gòu)成的一種重要的多肽類生長激素,參與正常乳腺上皮的增生和分化[2]。有實驗報道PRL在乳腺癌變過程中發(fā)揮重要作用[3]。PRL以內(nèi)分泌、旁分泌及自分泌的方式與靶細胞膜表面的催乳素受體(PRL receptor,PRLR)結(jié)合并啟動相應(yīng)的細胞內(nèi)信號轉(zhuǎn)導(dǎo)過程(如MAPK信號通路、p53信號通路和JAK-STAT信號通路等),從而發(fā)揮非常廣泛的生物學作用[4]。
近年來,長鏈非編碼RNA(long non-coding RNA,lncRNA)在腫瘤發(fā)生、遷移及抗藥性中作為調(diào)控因子和潛在治療因子被廣泛關(guān)注[5]。lncRNA由于缺少開放讀框而不具有編碼能力,因此一直以來被認為是轉(zhuǎn)錄噪音或克隆產(chǎn)物而很少受到關(guān)注[6]。但是,越來越多的實驗證據(jù)表明lncRNA在人體內(nèi)的異常表達與包括乳腺癌在內(nèi)的多種惡性腫瘤的發(fā)生、發(fā)展關(guān)系密切[7]。
本研究利用Illumina測序平臺檢測了催乳素處理前后T-47D細胞RNA的表達譜,并結(jié)合生物信息學分析了處理組與對照組lncRNA和mRNA的表達變化,得到一系列差異明顯且具有統(tǒng)計學意義(差異倍數(shù)>2,P<0.05)的 lncRNA和mRNA。從這些差異明顯的lncRNA中選擇了11個,利用熒光定量PCR對其表達差異情況進行驗證。同時,利用生物信息學方法對這11個lncRNA進行了靶基因預(yù)測,并對這些靶基因進行了生物功能分析,結(jié)果顯示催乳素處理前后T-47D細胞ln?cRNA和mRNA的表達變化可能與乳腺癌發(fā)生發(fā)展過程中催乳素受體信號通路相關(guān)。
乳腺癌T-47D細胞購于中國科學院上海細胞庫,由本實驗室保存,細胞在含10%胎牛血清(Hyclone公司)的RPMI1640培養(yǎng)基(Gibco公司)中,于37℃、5%CO2的培養(yǎng)箱中培養(yǎng)。催乳素處理T-47D細胞過程參照本實驗室之前的工作[8],將生長密度為70%~80%的細胞分為對照組與處理組,對照組僅加完全培養(yǎng)基,處理組加入含150 μg/mL PRL的培養(yǎng)液,每組均設(shè)3個平行復(fù)孔,于37℃、5%CO2飽和濕度孵箱內(nèi)培養(yǎng)24~48 h,提取細胞總RNA。
用TRIzol(Invitrogen公司)分別提取催乳素處理組與對照組T-47D細胞中的總RNA,紫外分光光度計測定D260nm和D280nm值,對總RNA進行定量;計算D260nm/D280nm值,結(jié)合甲醛變性凝膠電泳,分析RNA質(zhì)量。樣品中提取RNA的D260nm/D280nm值為1.8~2.0,經(jīng)甲醛變性膠電泳檢測有清晰的28S、18S條帶,無降解,且28S條帶亮度約是18S的1~2倍,則認為這些樣本的RNA可用于后續(xù)實驗。
分別提取催乳素處理組與對照組T-47D細胞總RNA并用DNaseⅠ消化DNA后,用帶有Oligo(dT)的磁珠富集mRNA;加入打斷試劑在Thermo?mixer中將mRNA打斷成短片段,以打斷后的mRNA為模板合成單鏈cDNA,然后配制雙鏈合成反應(yīng)體系合成雙鏈cDNA,用試劑盒純化回收、粘性末端修復(fù)、cDNA的3'端加上堿基“A”并連接接頭,然后進行片段大小選擇,最后進行PCR擴增;構(gòu)建的文庫經(jīng)Agilent 2100 Bioanalyzer和ABI StepOnePlus Real-Time PCR System質(zhì)檢合格后,用Illumina HiSeq 2000測序儀測序。
從變化倍數(shù)在2倍以上并有顯著差異(P<0.05)的lncRNA分子中挑選11個進行Real-time PCR驗證。分別以催乳素處理組和對照組T-47D細胞的cDNA為模板,每條lncRNA引物由在線軟件 Primer 5(http://sourceforge.net/projects/primer5/)合成,并在NCBI中經(jīng)BLAST驗證,采用StepOneplus熒光定量PCR儀,SYBR Green熒光染料(Ta?KaRa公司)摻入法相對定量。以內(nèi)參GAPDH為參照,計算差異表達的倍數(shù)。
為了尋找與lncRNA相互作用的mRNA,用2種不同的算法進行l(wèi)ncRNA靶基因預(yù)測。第一種算法是搜尋lncRNA順式作用基因,通過在線軟件UCSC(http://genome.ucsc.edu/)直接查找到的位于lncRNA位點上游或下游10 kb范圍內(nèi)轉(zhuǎn)錄的基因被認為是此lncRNA的順式作用基因[9]。第二種算法是尋找lncRNA反式作用基因,首先用BLAST比對找到在序列上有一定同源性的mRNA和lncRNA,然后利用mRNA和lncRNA的相關(guān)性對結(jié)果進行過濾,最后用RNAplex(一個用來尋找2條長鏈RNA之間短的相互作用的軟件)預(yù)測反義lncRNA與mRNA之間的互補結(jié)合[10]。
分別對預(yù)測得到的靶基因以及具有統(tǒng)計學意義的差異表達mRNA做進一步生物信息學分析,包括GO富集和KEGG通路分析。GO富集包括生物學過程、細胞組分、分子功能[11]。KEGG通路及GO富集分析由在線軟件DAVID(Database for Annotation,Visualization and Integrated Discov?ery,https://david.ncifcrf.gov/)完成。錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)用來表示P值的有效性。FDR<0.05表示差異具有統(tǒng)計學意義[12]。
對轉(zhuǎn)錄組測序得到的原始數(shù)據(jù)進行清理,去除低表達量、無意義及未比對上的數(shù)據(jù),再對數(shù)據(jù)進行標化,得到對照組樣品lncRNA和基因表達量整體的比較(圖1A),以及催乳素處理后樣品lncRNA和基因表達量整體的比較(圖1B),結(jié)果顯示該轉(zhuǎn)錄組測序檢測到的RNA信息基本全面,2組數(shù)據(jù)具有可比性。散點圖表示催乳素處理組與對照組之間RNA表達差異情況,紅色代表明顯上調(diào)的標簽,綠色代表明顯下調(diào)的標簽,中間藍色為差異不明顯的標簽(圖1C)。
此次轉(zhuǎn)錄本測序檢測到的2組樣品間差異明顯且具有統(tǒng)計學意義的lncRNA有3564條,其中586條為已知lncRNA,它們的信息可以從http://ln?cipedia.org/db/search獲得。為了進一步分析這些差異lncRNA,分別對它們的染色體位置和長度信息進行了整理,結(jié)果見圖1D和1E。
對所有差異明顯且具有統(tǒng)計學意義的mRNA進行GO分析,篩選標準為q值<0.05,得到這些差異表達mRNA分別在基因本體論三個功能方面的富集表達譜。圖2A、B和C為催乳素處理組和對照組比較所得差異mRNA的GO分析。結(jié)果顯示在生物學進程方面,差異mRNA顯著富集于16條通路(圖2A);在細胞組件方面,差異mRNA顯著富集于9條通路(圖2B);在分子功能方面,差異mRNA顯著富集于8條通路(圖2C)。
催乳素處理組與對照組差異mRNA的KEGG分析結(jié)果顯示,這些mRNA顯著富集于p53、JAKSTAT、MAPK等信號通路(圖2D),而這些信號通路與PRL/PRLR信號通路明顯相關(guān)。
從催乳素處理T-47D細胞前后差異明顯且具有統(tǒng)計學意義的全部lncRNA分子中選取11條(5條上調(diào),6條下調(diào))(表1)進行實驗驗證,熒光定量結(jié)果顯示這11條差異lncRNA的表達變化與測序結(jié)果一致(圖3A)。對所選差異表達的lncRNA相關(guān)基因進行GO分析,結(jié)果顯示在生物學進程方面,相關(guān)基因顯著富集于8條通路(圖3B);在細胞組件方面,相關(guān)基因顯著富集于2條通路(圖3C);在分子功能方面,相關(guān)基因顯著富集于6條通路(圖3D)。對所選差異表達的lncRNA相關(guān)基因應(yīng)用DAVID數(shù)據(jù)庫進行KEGG分析,發(fā)現(xiàn)其在PRL/PRLR相關(guān)的一條信號通路,即MAPK信號通路中顯著富集(圖3E)。
圖1 催乳素處理組與對照組lncRNA和mRNA表達譜差異分析
轉(zhuǎn)錄組測序是指用新一代高通量測序技術(shù)對物種或組織的轉(zhuǎn)錄本進行測序并得到相關(guān)的轉(zhuǎn)錄本信息,它的研究對象為特定細胞在某一功能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,包括mRNA和非編碼RNA[13]。本實驗采用的基于Illu?mina高通量測序平臺的轉(zhuǎn)錄組測序技術(shù)能夠在單核苷酸水平對任意物種的整體轉(zhuǎn)錄活動進行檢測。在分析轉(zhuǎn)錄本的結(jié)構(gòu)和表達水平的同時,還能發(fā)現(xiàn)未知轉(zhuǎn)錄本和稀有轉(zhuǎn)錄本,精確地識別可變剪切位點及SNP(編碼序列單核苷酸多態(tài)性),提供最全面的轉(zhuǎn)錄組信息[14]。另外,通過熒光定量PCR對轉(zhuǎn)錄組測序結(jié)果進行隨機驗證,結(jié)果也證實了該測序手段的可靠性。在本實驗中,分別發(fā)現(xiàn)了3564和477個顯著差異的lncRNA和mRNA,這為后續(xù)探討乳腺癌發(fā)病機制及發(fā)病過程中的關(guān)鍵分子提供了寶貴的數(shù)據(jù)。
1977年,首次有報道指出催乳素對乳腺癌的發(fā)病機制和發(fā)展進程具有顯著作用[15]。許多研究報道指出催乳素是乳腺癌上皮細胞主要的分化因素[16-18]。LncRNA是一類缺乏編碼蛋白能力,位于細胞核或胞質(zhì)內(nèi)的非編碼RNA分子,已有大量研究表明[19-21],lncRNA表達失調(diào)在腫瘤的發(fā)生發(fā)展過程中發(fā)揮著重要的作用。但是,至今仍未有關(guān)于催乳素介導(dǎo)的乳腺癌細胞中l(wèi)ncRNA異常表達的研究報道。在此,本文較深入地分析了催乳素處理前后T-47D細胞中l(wèi)ncRNA的表達情況,從而探討催乳素介導(dǎo)的通過催乳素受體信號通路對乳腺癌細胞中l(wèi)ncRNA表達的調(diào)控。通過對差異mRNA和差異lncRNA相關(guān)基因的KEGG分析,結(jié)果提示這些差異基因主要富集在催乳素/催乳素受體信號通路相關(guān)信號通路上,這可能歸因于催乳素的誘導(dǎo)表達。
圖2 催乳素處理組與對照組差異mRNA的GO和KEGG分析
表1 長鏈非編碼RNA的靶基因預(yù)測
總之,本文首次報道了催乳素處理乳腺癌T-47D細胞后RNA的差異表達譜,而這些差異RNA在乳腺癌中的生物功能及分子機制仍有待更深入的研究。同時,本實驗為進一步闡明由催乳素誘導(dǎo)表達引起的乳腺癌的發(fā)病機制,通過調(diào)控關(guān)鍵lncRNA尋找其新的藥物靶點提供了新的依據(jù)。
圖3 差異lncRNA的熒光定量PCR驗證及其靶基因的GO和KEGG分析
[1]范雅文,張旭.三陰乳腺癌的異質(zhì)性及靶向治療[J].生物技術(shù)通訊,2015,26(3):442-444.
[2]Carver K C,Arendt L M,Schuler L A.Complex pro?lactin crosstalk in breast cancer:new therapeutic im?plications[J].Mol Cell Endocrinol,2009,307(1):1-7.
[3]Tworoger S S,Hankinson S E.Prolactin and breast cancer risk[J].Cancer Lett,2006,243(2):160-169.
[4]譚敦勇,彭湘萍.催乳素受體研究[J].生理科學進展,2012,43(1):17-23.
[5]馮維熙,曹新.基于目標基因芯片數(shù)據(jù)預(yù)測lncRNAs調(diào)控腦缺血再灌注損傷后的作用效應(yīng)[J].生命科學研究,2016,20(3):235-242.
[6]Chen J,Fu Z Y,Ji C,et al.Systematic gene microar?ray analysis of the lncRNA expression profiles in hu?man uterine cervix carcinoma[J].Biomed Pharmacoth?er,2015,72:83-90.
[7]Brunner A L,Beck A H,Edris B,et al.Transcription?al profiling of long non-coding RNAs and novel tran?scribed regions across a diverse panel of archived hu?man cancers[J].Genome Biol,2012,13(8):1-13.
[8]Wei Q J,He W,Yao J,et al.Identification and char?acterization of microRNAs expressed in human breast cancer T-47D cells in response to prolactin treatment by Solexa deep-sequencing technology[J].Biochem Bio?phys Res Commun,2013,432(3):480-487.
[9]Han L,Zhang K,Shi Z,et al.LncRNA profile of glio?blastoma reveals the potential role of lncRNAs in con?tributing to glioblastoma pathogenesis[J].Int J Oncol,2012,40(6):2004-2012.
[10]Tafer H,Hofacker I L.RNAplex:a fast tool for RNARNA interaction search[J].Bioinformatics,2008,24(22):2657-2663.
[11]Lin X C,Zhu Y,Chen W B,et al.Integrated analy?sis of long non-coding RNAs and mRNA expression profiles reveals the potential role of lncRNAs in gas?tric cancer pathogenesis[J].Int J Oncol,2014,45(2):619-628.
[12]Kanehisa M,Goto S.KEGG:kyoto encyclopedia of genes and genomes[J].Nucleic Acids Res,2000,28(1):27-30.
[13]Zhu L,Mok S,Imwong M,et al.New insights into the Plasmodium vivax transcriptome using RNA-Seq[J].Sci Rep,2016,6:20498.
[14]Huang X,Jing Y,Liu D J,et al.Whole-transcrip?tome sequencing of Pinellia ternata using the Illumina platform[J].Genet Mol Res,2016,15(2):gmr.15028062.
[15]Welsch C W,Nagasawa H.Prolactin and murine mam?mary tumorigenesis:a review[J].Cancer Res,1977,37(4):951-963.
[16]Liu F,Pawliwec A,Feng Z,et al.Prolactin/Jak2 di?rects apical/basal polarization and luminal linage matu?ration of mammary epithelial cells through regulation of the Erk1/2 pathway[J].Stem Cell Res,2015,15(2):376-383.
[17]Kobayashi K,Tsugami Y,Matsunaga K,et al.Prolac?tin and glucocorticoid signaling induces lactation-spe?cific tight junctions concurrent with beta-casein ex?pression in mammary epithelial cells[J].Biochim Bio?phys Acta,2016,1863(8):2006-2016.
[18]Medina-Estrada I,Alva-Murillo N,Lopez-Meza,et al.Non-classical effects of prolactin on the innate im?mune response of bovine mammary epithelial cells:Im?plications during Staphylococcus aureus internalization[J].Microb Pathog,2015,89:43-53.
[19]Jiang J F,Sun A J,Xue W,et al.Aberrantly ex?pressed long noncoding RNAs in the eutopic endome?tria of patients with uterine adenomyosis[J].Eur J Ob?stet Gynecol Reprod Biol,2016,199:32-37.
[20]Chen Y,Wu J J,Lin X B,et al.Differential lncRNA expression profiles in recurrent gliomas compared with primary gliomas identified by microarray analysis[J].Int J Clin Exp Med,2015,8(4):5033-5043.
[21]Zhan Y,Lin J,Liu Y,et al.Up-regulation of long non-coding RNA PANDAR is associated with poor prognosis and promotes tumorigenesis in bladder cancer[J].J Exp Clin Cancer Res,2016,35(1):83.
Comprehensive Investigation on the Expression Profiles of Long Noncoding RNAs and mRNAs in Breast Cancer T-47D Cells Treated with Prolactin
ZHU Lin-Jing,YAO Jun,WEI Qin-Jun,LU Ya-Jie,CAO Xin*
Department of Biotechnology,School of Basic Medical Science,Nanjing Medical University,Nanjing 211166,China
Objective:To analyze the variation of long non-coding RNA(lncRNA) and mRNA expression pro?files in breast cancer T-47D cells after they were treated with prolactin(PRL).Methods:RNA-seq was used to detect the lncRNA and mRNA expression profile in T-47D cells before and after PRL treatment.The statistically differential expressed mRNA were selected for Gene ontology(GO) and Kyoto Encyclopedia of Genes and Genomes(KEGG)pathway.Quantitative real-time PCR(qRT-PCR)was used to validate the 11 differentially expressed ln?cRNA,and their target genes were predicted by bioinformatcs,and biological pathways those genes involved in were analyzed by GO and KEGG.Results:3564 lncRNA and 477 mRNA were detected with varied expression(fold<0.5 or >2.0,P<0.05) in T-47D cells.GO and KEGG analysis indicated that these differentially expressed mRNA were mainly implicated in 134 pathways,of which the MAPK signaling pathway,p53 signaling pathway and JAK-STAT signaling pathway were included in the PRL/PRL receptor(PRLR) signaling pathway.The qRTPCR analysis of 11 selected lncRNA(XLOC_093371,XLOC_006637,XLOC_064063,XLOC_086865,lnc-ZNF639-1 up-regulated;lnc-AK4-2,XLOC_075541,XLOC_081110,XLOC_047068,XLOC_099517,XLOC_106798 downregulated)confirmed the results of RNA-seq,and their targets are also enriched in the MAPK signaling pathway.Conclusion:Significant variation of lncRNA expression in T-47D cells was detected before and after PRL treat?ment,which may provide a useful database for further investigation on lncRNA' function and mechanism in breast cancer,and contribute to find potential diagnostic and therapeutic targets for breast carcinoma.
long non-coding RNA;expression profile;breast cancer;prolactin;T-47D cells
Q78;Q811.4
A
1009-0002(2017)05-0577-07
10.3969/j.issn.1009-
*Corresponding author,E-mail:caoxin@njmu.edu.cn
2017-03-01
國家自然科學基金(81172142);國家自然科學基金青年基金(51403103)
朱林靜(1991- ),女,碩士研究生,(E-mail)1115020628@qq.com;姚?。?979- ),男,講師;二者為并列第一作者
曹新,(E-mail)caoxin@njmu.edu.cn