裴徐梨,荊贊革,*,焦 鵬,唐 征
(1 昆明學(xué)院 農(nóng)學(xué)與生命科學(xué)學(xué)院,昆明 650214;2 溫州科技職業(yè)學(xué)院 農(nóng)業(yè)與生物技術(shù)學(xué)院,浙江溫州 325006)
青花菜(BrassicaoleraceaL.var.italica)為十字花科蕓苔屬甘藍(lán)種的一個(gè)變種,在世界各地廣泛栽培。細(xì)胞質(zhì)雄性不育(cytoplasmic male sterility,CMS)的應(yīng)用可以有效提高青花菜雜交種質(zhì)量[1]。目前青花菜細(xì)胞質(zhì)雄性不育發(fā)生機(jī)制仍未徹底明確。因此,進(jìn)一步研究青花菜長鏈非編碼RNA(long non-coding RNAs,LncRNAs)在雄性不育發(fā)生過程中的作用顯得尤為重要。
研究結(jié)果表明LncRNAs可在轉(zhuǎn)錄、轉(zhuǎn)錄后和表觀遺傳水平上調(diào)控多種生物學(xué)過程[2-3]。 自LncRNA在人類中報(bào)道以來[4],動(dòng)植物中鑒定得到越來越多LncRNA。然而,對植物L(fēng)ncRNA的深入研究僅限于少數(shù)模式植物。如水稻XLOC_057324可以影響穗軸發(fā)育和植株育性[5]。玉米的zm401可調(diào)控小孢子的發(fā)育[6]。擬南芥的IPS1可通過抑制miR399的剪切來促進(jìn)磷的吸收[7]。
目前,一些與細(xì)胞質(zhì)雄性不育相關(guān)的基因被克隆出來并進(jìn)行深入研究。然而,關(guān)于LncRNA在雄性不育過程的作用卻知之甚少。本研究利用illumina測序技術(shù)鑒定了青花菜細(xì)胞質(zhì)雄性不育相關(guān)LncRNAs,并對其靶基因和表達(dá)特征進(jìn)行了研究。并利用qRT-PCR技術(shù)對部分差異LncRNAs的表達(dá)特征進(jìn)行了檢測。為進(jìn)一步闡明LncRNAs參與青花菜雄性不育發(fā)生機(jī)制提供新的路徑。
以飽和回交的青花菜Ogu細(xì)胞質(zhì)雄性不育系及其保持系為試驗(yàn)材料,采集不同發(fā)育時(shí)期的花蕾以及花蕾的不同部位[8]。
1.2.1 青花菜RNA文庫構(gòu)建和RNA-seq數(shù)據(jù)分析總RNA提取合格后,進(jìn)行文庫構(gòu)建,最后使用illumina HiSeq2500進(jìn)行測序。利用TopHat軟件將過濾得到的干凈讀序比對到參考基因組。使用Cufflinks和Scripture軟件拼接轉(zhuǎn)錄本。
1.2.2 青花菜LncRNA鑒定對拼接好的轉(zhuǎn)錄本進(jìn)行LncRNA鑒定。首先去除長度< 200 nt、reads覆蓋度小于3及與已知mRNA重疊的3種轉(zhuǎn)錄本。然后分別利用CPC和CNCI軟件預(yù)測轉(zhuǎn)錄本的蛋白編碼潛能,去除CPC評分大于0且CNCI評分小于0的轉(zhuǎn)錄本。剩余含有已知蛋白結(jié)構(gòu)域的轉(zhuǎn)錄本在Pfam數(shù)據(jù)庫中進(jìn)一步篩除。最后使用Cuffcompare將組裝好的轉(zhuǎn)錄本與數(shù)據(jù)庫中的rRNAs、tRNAs、snRNAs、snoRNAs、premiRNAs和pseudogenes(假基因)進(jìn)行比對,剩余的轉(zhuǎn)錄本則被定義為候選LncRNAs。
1.2.3 青花菜差異表達(dá)LncRNA的篩選利用FPKM法計(jì)算LncRNA轉(zhuǎn)錄本的表達(dá)量。以|fold change|≥2且FDR <0.05為標(biāo)準(zhǔn)來鑒定差異表達(dá)LncRNAs。
1.2.4 青花菜LncRNAcis靶基因預(yù)測與功能注釋LncRNAs可通過順式(cis)作用方式調(diào)控鄰近基因,其上下游各100 kb內(nèi)的編碼基因可作為cis靶基因,并對其進(jìn)行功能注釋。P≤0.05的GO和KEGG條目則定義為顯著富集。
1.2.5 雄性不育相關(guān)LncRNAs的qRT-PCR分析qRT-PCR采用SYBR Premix Ex Taq試劑盒(大連TaKaRa公司)進(jìn)行。反應(yīng)條件參照裴徐梨前期研究,以青花菜actin基因作為內(nèi)參基因[9]。隨機(jī)選擇16個(gè)雄性不育相關(guān)的LncRNAs進(jìn)行qRT-PCR檢測,引物序列見表1?;蛳鄬Ρ磉_(dá)量通過2-ΔΔCt法進(jìn)行計(jì)算。
不育系和保持系分別獲得約10.8 G和9.8 G的干凈讀序,GC含量分別為45.64%和45.19%。將干凈讀序比對到參考基因組,不育系及其保持系分別有54.95% 和55.74% 的序列可比對上(表2)。
轉(zhuǎn)錄本拼接共得到174 813條轉(zhuǎn)錄本。根據(jù)鑒定流程,排除掉長度< 200 bp、外顯子數(shù)<2和最小讀序覆蓋<3的4 479條轉(zhuǎn)錄本、31 714條已知蛋白編碼轉(zhuǎn)錄本和126 759條不在i、u和x組的轉(zhuǎn)錄本。最終4 326條轉(zhuǎn)錄本被鑒定為高置信度的LncRNA。其中,基因間隔區(qū)LncRNA為4 033條,內(nèi)含子間LncRNA 為181條,反義LncRNA為112條。
對差異表達(dá)LncRNA (differentially expressed LncRNA,DE-LncRNA)進(jìn)行鑒定,在不育系和保持系中共得到37個(gè)LncRNA存在差異。其中34個(gè)DE-LncRNA同時(shí)存在于2個(gè)樣本中,3個(gè)DE-LncRNA(XLOC_005260、XLOC_007656和XLOC_034364)為保持系特有的。
對LncRNA的差異表達(dá)程度進(jìn)行分析,發(fā)現(xiàn)在上調(diào)LncRNA中XLOC_005260的log2FC值(4.75)最高,XL0C_041886(log2FC = -4.50)是下調(diào)LncRNA中表達(dá)差異最顯著的。聚類結(jié)果表明這些差異LncRNA在不育系和保持系中展現(xiàn)出不同的表達(dá)模式(圖1)。
對差異LncRNA的cis靶基因進(jìn)行預(yù)測,共得到370個(gè)靶基因。每個(gè)差異LncRNA靶向的靶基因數(shù)目差異較大。其中XLOC_006651的靶基因數(shù)最多,為25個(gè),其次是XLOC_038298(24個(gè))和XLOC_017574(19個(gè))。同時(shí),2個(gè)差異LncRNA只有1個(gè)靶基因。
GO分析表明,這些靶基因可注釋到19個(gè)生物學(xué)過程條目、16個(gè)細(xì)胞成分條目和17個(gè)分子功能條目。GO條目富集分析發(fā)現(xiàn)預(yù)測靶基因參與了多種生物過程,包括細(xì)胞內(nèi)、蛋白結(jié)合和細(xì)胞蛋白代謝過程。KEGG分析得到34條與差異LncRNAs相關(guān)的代謝通路,其中靶基因參與最多的通路為氨基酸生物合成、碳代謝和核糖體相關(guān)。
為了驗(yàn)證差異LncRNA的表達(dá)模式,隨機(jī)選取16個(gè)差異LncRNA進(jìn)行qRT-PCR分析(圖2)。結(jié)果發(fā)現(xiàn):XLOC_011575、XLOC_039677、XLOC_037356、XLOC_013157、XLOC_006651、XLOC_013121、XLOC_016660、XLOC_003494在不育系花蕾發(fā)育早期表達(dá)量較高,之后隨著花蕾的發(fā)育,表達(dá)量逐漸下降;而XLOC_040653、XLOC_021769、XLOC_038964、XLOC_037468、XLOC_017574和XLOC_014153隨著不育系花蕾發(fā)育呈現(xiàn)出先下降后上升的模式。在保持系花蕾發(fā)育不同階段,XLOC_013157、XLOC_034182、XLOC_037468、XLOC_017574、XLOC_014153、XLOC_006651、XLOC_013121、XLOC_016660、XLOC_003494表達(dá)量逐漸下降;XLOC_040653、XLOC_011575、XLOC_039677和XLOC_037356呈現(xiàn)出先升后降的表達(dá)模式,而XLOC_012613、XLOC_021769、XLOC_038964則是先降后升。XLOC_038964和XLOC_012613在花蕾不同發(fā)育階段不育系的表達(dá)量均高于保持系。
青花菜花蕾不同部位表達(dá)特性分析結(jié)果表明16個(gè)差異LncRNA在花梗、花萼、花瓣、雄蕊及雌蕊中均可表達(dá)。其中,XLOC_038964、XLOC_011575、XLOC_013157在花蕾雄蕊中表達(dá)量最低,花梗、花萼和花瓣中逐漸升高,雌蕊表達(dá)量最高。XLOC_039677、XLOC_037356、XLOC_034182和XLOC_017574呈現(xiàn)出相似的表達(dá)模式,只是其在花瓣的表達(dá)量有所下降。所有檢測的LncRNA中XLOC_037468在雌蕊中表達(dá)量最高。
大量研究表明,植物L(fēng)ncRNA可參與多種復(fù)雜的生物學(xué)過程,如開花調(diào)控、果實(shí)發(fā)育以及逆境脅迫響應(yīng)[10]。然而,青花菜LncRNAs的生物學(xué)功能尚不清楚。本研究系統(tǒng)鑒定和分析了青花菜雄性不育相關(guān)LncRNAs,共獲得4 326個(gè)LncRNA,其中37個(gè)差異表達(dá),研究結(jié)果將有助于深入探討青花菜LncRNAs參與的CMS發(fā)生機(jī)制。
LncRNAs靶基因預(yù)測可有效探究LncRNA潛在功能[11]。糖代謝對青花菜雄性不育有重要意義。在小麥胼胝質(zhì)合成和降解過程中,與糖苷酶代謝相關(guān)基因的活性在可育系和不育系之間存在差異[12]。在本研究中,6個(gè)差異LncRNA為與糖苷酶代謝相關(guān)的靶基因。表達(dá)分析結(jié)果表明,它們大部分在雄性不育發(fā)生過程中表達(dá)上調(diào)。這些結(jié)果表明LncRNAs可能通過糖代謝來調(diào)控青花菜的育性。此外,還發(fā)現(xiàn)6個(gè)差異LncRNAs參與了谷胱甘肽代謝。谷胱甘肽S-轉(zhuǎn)移酶(GST)是谷胱甘肽解毒系統(tǒng)必不可少的調(diào)節(jié)因子。過量的活性氧可觸發(fā)植物細(xì)胞程序性死亡,最終導(dǎo)致絨氈層細(xì)胞退化和雄性不育[13]?;ǚ蹟∮^程中產(chǎn)生的過量活性氧可改變GST基因的表達(dá)。本研究結(jié)果發(fā)現(xiàn)大部分靶向GST基因的LncRNA在FS花蕾中上調(diào)表達(dá),進(jìn)一步表明這幾個(gè)LncRNA可能是通過谷胱甘肽代謝來參與青花菜CMS的過程。
LncRNAs是基因轉(zhuǎn)錄的調(diào)節(jié)因子[9]。本研究結(jié)果中多個(gè)差異LncRNA的靶基因?yàn)檗D(zhuǎn)錄因子。NAC轉(zhuǎn)錄因子是XLOG_011575的靶基因,可在水稻中顯著調(diào)控可育花粉比例和雄性不育[14]。本研究測序數(shù)據(jù)得出XLOG_011575在不育花蕾中表達(dá)上調(diào),表明NAC可能在青花菜CMS發(fā)生過程中起重要作用。MYB是另外一個(gè)重要的轉(zhuǎn)錄因子。已有研究表明,MYB26在花藥內(nèi)壁二次增厚過程中對花藥開裂和育性起關(guān)鍵作用[15]。而MYB33和MYB65是擬南芥花藥正常發(fā)育的重要組成部分[16]。本試驗(yàn)鑒定到的靶基因中發(fā)現(xiàn)了3個(gè)MYB家族轉(zhuǎn)錄因子, 推測LncRNA通過調(diào)控MYB表達(dá)量的變化可能會(huì)導(dǎo)致青花菜的CMS發(fā)生。