魏佳玉 張素芳 劉紫怡 張海胤 付粱晨 楊樹(shù)云 張磊
(林木遺傳育種國(guó)家重點(diǎn)實(shí)驗(yàn)室(東北林業(yè)大學(xué)),哈爾濱,150040)
MicroRNA(miRNA)是一類由內(nèi)源基因編碼的長(zhǎng)度約在18~24個(gè)核苷酸的非編碼單鏈RNA分子,主要參與轉(zhuǎn)錄后水平基因表達(dá)的調(diào)控,其結(jié)構(gòu)很保守,所以可以通過(guò)生物信息學(xué)的方法來(lái)預(yù)測(cè)miRNA和其靶基因。自從2002年在擬南芥(Arabidopsisthaliana(L.)Heynh.)中發(fā)現(xiàn)植物中第一個(gè)miRNA后[1],截止到2017年目前為止,曼徹斯特大學(xué)和劍橋大學(xué)組建的miRBase數(shù)據(jù)庫(kù)miRBase(18.0)公布了223個(gè)物種的28 645條miRNA前體序列,35 828條成熟序列,但是絕大多數(shù)是被子植物,裸子植物只有火炬松(PinustaedaL.)和云杉(Piceaaspoerata)等少數(shù)物種的miRNA信息被收錄[2-3]。裸子植物miRNA信息的匱乏很大程度阻礙了其miRNA的研究進(jìn)展,高通量測(cè)序技術(shù)的運(yùn)用可幫助解決這個(gè)問(wèn)題,特別對(duì)于基因組龐大、ESTs信息少的針葉樹(shù),Solexa測(cè)序可高通量、快速、有效的獲取miRNA信息。
長(zhǎng)白落葉松作為中國(guó)東北地區(qū)重要的經(jīng)濟(jì)、生態(tài)及主要的造林樹(shù)種之一采用常規(guī)改良的方法獲得的遺傳增益隨著改良周期的增加而降低,而且其遺傳背景較為復(fù)雜,基因組龐大,對(duì)其生長(zhǎng)發(fā)育等分子機(jī)理的研究比較落后,通過(guò)對(duì)長(zhǎng)白落葉松不同發(fā)育時(shí)期的形成層樣品的miRNA差異表達(dá)分析,找出可能參與調(diào)控長(zhǎng)白落葉松生長(zhǎng)發(fā)育過(guò)程的miRNA,從而為針葉樹(shù)種分子育種的研究奠定基礎(chǔ)。
形成層是木本植物位于木質(zhì)部和韌皮部之間的一種分生組織,向莖的中軸方向分裂而形成新的木質(zhì)部細(xì)胞,向外分裂形成新的韌皮部細(xì)胞,大量調(diào)控木材合成的基因在此過(guò)程中表達(dá),所以本研究以生長(zhǎng)在東北林業(yè)大學(xué)帽兒山實(shí)驗(yàn)林場(chǎng)的長(zhǎng)白落葉松無(wú)性系的形成層為試驗(yàn)材料,選取相同無(wú)性系材料3株,根據(jù)長(zhǎng)白落葉松生長(zhǎng)物候期及前期觀測(cè)[4-6],分別于粗生長(zhǎng)開(kāi)始時(shí)期(5月5日,S01)和粗生長(zhǎng)旺盛期(6月15日,S02)取已木質(zhì)化的側(cè)枝,剝?nèi)?shù)皮及韌皮部,取形成層及周圍組織薄層樣品,立刻置于液氮中,帶回實(shí)驗(yàn)室置于冰箱-80 ℃保存,提取RNA。
采用Nanodrop、Qubit2.0、Agilent2100 bioanalyzer方法檢測(cè)RNA樣品的純度、濃度和完整性等,保證樣品符合測(cè)序要求,樣品檢測(cè)合格后,以總RNA為起始樣品,使用small RNA Sample Pre Kit試劑盒提取構(gòu)建small RNA文庫(kù)。然后通過(guò)Solexa測(cè)序技術(shù)快速分離鑒定miRNA,使用miRDeep2軟件鑒定出保守的和新發(fā)現(xiàn)的miRNA。
通過(guò)原始測(cè)序數(shù)據(jù)處理后對(duì)miRNA進(jìn)行預(yù)測(cè)及數(shù)據(jù)分析,采用植物miRNA本地命令軟件TargetFinder預(yù)測(cè)miRNA的靶基因。利用blast軟件將預(yù)測(cè)靶基因序列與COG、GO、KEGG、SwissPort和NR數(shù)據(jù)庫(kù)中的與其相應(yīng)的mRNA序列分別進(jìn)行比對(duì),從而獲得靶基因的注釋信息。
構(gòu)建miRNA文庫(kù)后,通過(guò)質(zhì)量控制,每個(gè)樣品的干凈數(shù)據(jù)均大于11.91 M,其中S01從原始數(shù)據(jù)21 095 170中獲得15 294 797分析數(shù)據(jù),占總數(shù)的72.50%,S02從原始數(shù)據(jù)16 395 342中獲得11 913 982待分析數(shù)據(jù),占總數(shù)的72.67%。最終共預(yù)測(cè)到78個(gè)新的miRNA,未得到已知的miRNA,由于Dicer酶和DCL酶的特異性,最終生成的成熟miRNA長(zhǎng)度主要集中在20到22個(gè)核苷酸的范圍內(nèi),其中以21個(gè)核苷酸居多,占總數(shù)的55.13%。
新預(yù)測(cè)的78個(gè)miRNA中,差異表達(dá)的miRNA為49個(gè),分屬于miR164、miR166、miR160、miR950、miR396這5個(gè)miRNA家族,其中16條上調(diào)表達(dá),33條下調(diào)表達(dá)。
2.2.1差異表達(dá)的miRNA GO分析
差異表達(dá)的miRNA在GO分析中主要分為3個(gè)分支:分別是細(xì)胞組分(描述基因產(chǎn)物在什么地方起作用)、分子功能(描述在個(gè)體分子生物學(xué)上的活性)、生物學(xué)過(guò)程(由分子功能有序地組成具有多個(gè)步驟的一個(gè)過(guò)程)。共涉及了23個(gè)類別,其中細(xì)胞組分8類,分子功能均分6類,生物學(xué)過(guò)程分9類(圖1)。
圖1 差異表達(dá)miRNA的GO分析
差異表達(dá)的miRNA的靶基因注釋總共有315個(gè),占所有靶基因注釋總數(shù)的55.95%。其中,與細(xì)胞組分相關(guān)的靶基因有39個(gè),所占比例較多的3個(gè)分別是:細(xì)胞(8個(gè))、細(xì)胞器(8個(gè))、細(xì)胞組分(8個(gè)),其他的總共有15個(gè);與分子功能相關(guān)的靶基因有129個(gè),所占比例較多的兩個(gè)分別是:催化活性(54個(gè))、綁定(70個(gè)),其它合計(jì)5個(gè);與生化過(guò)程相關(guān)的靶基因有147個(gè),所占比例較多的3個(gè)分別是:代謝過(guò)程(38個(gè))、細(xì)胞過(guò)程(37個(gè))、刺激反應(yīng)(45個(gè)),其它合計(jì)共有27個(gè)。結(jié)果表明差異miRNA參與了細(xì)胞組成、分子功能、生化過(guò)程3個(gè)方面,為后續(xù)的miRNA基因的功能研究提供參考。
2.2.2差異表達(dá)miRNA的COG分析
差異表達(dá)miRNA靶基因的COG數(shù)據(jù)庫(kù)分類注釋結(jié)果表明(圖2):所有靶基因涉及到氨基酸、輔酶、脂質(zhì)、無(wú)機(jī)離子運(yùn)輸和代謝等運(yùn)輸代謝過(guò)程,翻譯、核糖體結(jié)構(gòu)和生物起源、細(xì)胞壁和細(xì)胞膜發(fā)生,轉(zhuǎn)錄,復(fù)制,重組和修復(fù),轉(zhuǎn)錄后修飾,蛋白質(zhì)轉(zhuǎn)運(yùn),分子伴侶等生命過(guò)程,信號(hào)轉(zhuǎn)導(dǎo)機(jī)制過(guò)程,一般功能預(yù)測(cè)和未知功能等功能預(yù)測(cè)幾大類別。在不同的功能分類中,注釋到的差異miRNA靶基因反映了對(duì)應(yīng)時(shí)期和環(huán)境下生理或代謝偏向等信息,結(jié)果顯示與轉(zhuǎn)錄,復(fù)制,重組和修復(fù),細(xì)胞壁和細(xì)胞膜發(fā)生,轉(zhuǎn)錄后修飾,蛋白質(zhì)轉(zhuǎn)運(yùn),分子伴侶等生命過(guò)程,無(wú)機(jī)離子運(yùn)輸和代謝相關(guān)的靶基因表達(dá)量相對(duì)較高,這說(shuō)明測(cè)序樣品正處于旺盛的生長(zhǎng)發(fā)育期,和實(shí)際情況樣品處于年生長(zhǎng)周期的粗生長(zhǎng)初期和旺盛期相符。
圖2 差異表達(dá)miRNA靶基因的COG分析
2.2.3差異表達(dá)的miRNA KEGG分析
對(duì)miRNA靶基因KEGG的注釋結(jié)果按照通路類型進(jìn)行分類,發(fā)現(xiàn)其參與16個(gè)通路類型,分別為(1)核糖體,(2)脂肪酸生物合成,(3)N-Glycan生物合成,(4)植物激素信號(hào)轉(zhuǎn)導(dǎo),(5)Propanoate新陳代謝,(6)內(nèi)吞作用,(7)Butanoate新陳代謝,(8)纈氨酸、亮氨酸、和異亮氨酸的生物合成,(9)在真核生物核糖體生物起源,(10)植物-病原互作,(11)丙酮酸代謝,(12)C5-Branched二元酸新陳代謝,(13)在內(nèi)質(zhì)網(wǎng)蛋白處理,(14)泛酸酯和生物合成,(15)剪接體,(16)RNA運(yùn)輸。說(shuō)明在長(zhǎng)白落葉松生長(zhǎng)發(fā)育過(guò)程中,可能需要多種代謝途徑共同參與,而這些代謝途徑由多個(gè)miRNA的共同協(xié)調(diào)作用完成,而miRNA的靶標(biāo)的作用機(jī)制和原理還有待進(jìn)一步研究和驗(yàn)證。
2.2.4差異表達(dá)的miRNA靶基因分析
差異表達(dá)miRNA層次聚類分析結(jié)果顯示:所有miRNA表達(dá)豐度不同,可以分為常規(guī)表達(dá)(表達(dá)量很低)和高豐度(表達(dá)量較高)兩類(圖3)。對(duì)同一個(gè)miRNA在兩個(gè)樣本中的差異表達(dá)情況分析,出現(xiàn)差異表達(dá)的miRNA(49個(gè))約占所有測(cè)序的miRNA(78)的62.82%,差異表達(dá)一倍以上的miRNA12個(gè),其中上調(diào)表達(dá)的2個(gè),下調(diào)表達(dá)的10個(gè),分別占全部上調(diào)表達(dá)(16個(gè))和下調(diào)表達(dá)(33個(gè))的miRNA12.5%和30.3%(表1)。miRNA負(fù)調(diào)控其靶基因,可以推測(cè)在粗生長(zhǎng)旺盛期時(shí),與木材材性合成的相關(guān)基因大量表達(dá),所以miRNA大多表現(xiàn)為下調(diào)表達(dá)。差異表達(dá)miRNA層次聚類分析結(jié)果表明(圖3):差異表達(dá)部分大都出現(xiàn)高豐度表達(dá)的miRNA中,差異表達(dá)的miRNA有一部分是屬于穩(wěn)定表達(dá)的,而有部分是隨著生長(zhǎng)發(fā)育不斷變化的。
S01表示粗生長(zhǎng)開(kāi)始時(shí)間(5月5日);S02表示粗生長(zhǎng)旺盛期(6月15日)。
2.2.5差異表達(dá)的miRNA的注釋分析
通過(guò)將差異表達(dá)的miRNA與數(shù)據(jù)庫(kù)中已有序列進(jìn)行比對(duì)發(fā)現(xiàn),部分miRNA與其它已知植物的miRNA序列相似度較高,如擬南芥,火炬松等(表2)[2,7-14],將比對(duì)到的物種的miRNA序列查找文獻(xiàn)可知其中大部分miRNA處于剛被發(fā)現(xiàn),功能尚不清楚。在已知功能的miRNA中,發(fā)現(xiàn)擬南芥miR164c通過(guò)調(diào)控靶基因影響生長(zhǎng)素梯度、側(cè)根的起始以及花瓣的數(shù)量[9],擬南芥miR396家族在高表達(dá)情況下導(dǎo)致擬南芥花柱頭彎曲,擬南芥AtTTP-miR160-ARF17通路參與胼胝質(zhì)合成的調(diào)控等[11],都對(duì)擬南芥的生長(zhǎng)發(fā)育有影響,這些結(jié)論將作為長(zhǎng)白落葉松miRNA功能初步分析的依據(jù),從中挖掘可能參與調(diào)控生長(zhǎng)發(fā)育的miRNA進(jìn)行qRT-PCR分析,以進(jìn)一步判斷及分析這些miRNA在的功能。
表1 差異表達(dá)
表2 miRNA序列比對(duì)結(jié)果
長(zhǎng)白落葉松粗生長(zhǎng)初期和盛期樣品中共發(fā)現(xiàn)49個(gè)差異表達(dá)的miRNA,占全部新預(yù)測(cè)的miRNA(78個(gè))的62.82%,分屬于miR164、miR166、miR160、miR950、miR396這5個(gè)miRNA家族,其中16條上調(diào)表達(dá),33條下調(diào)表達(dá)。GO分析表明這些差異表達(dá)的miRNA主要參與了細(xì)胞組分、分子功能和生物學(xué)過(guò)程中共計(jì)23個(gè)類別,其中調(diào)控把基因參與最多的主要是催化活性、結(jié)合、代謝、細(xì)胞進(jìn)程和刺激反應(yīng)。COG數(shù)據(jù)庫(kù)分類注釋表明所有靶基因涉及氨基酸、輔酶、脂質(zhì)、無(wú)機(jī)離子運(yùn)輸和代謝等8類過(guò)程。轉(zhuǎn)錄,復(fù)制,重組和修復(fù)、細(xì)胞壁和細(xì)胞膜發(fā)生、轉(zhuǎn)錄后修飾,蛋白質(zhì)轉(zhuǎn)運(yùn),分子伴侶等生命過(guò)程、無(wú)機(jī)離子運(yùn)輸和代謝得到注釋到的差異miRNA靶基因表達(dá)量相對(duì)較高,這說(shuō)明測(cè)序樣品正處于旺盛的生長(zhǎng)發(fā)育期,和實(shí)際情況樣品相符。
本研究新預(yù)測(cè)到了多個(gè)長(zhǎng)白落葉松miRNA,極大地豐富了針葉樹(shù)種的信息資源。由于miRNA能夠揭示分子機(jī)理,主要在轉(zhuǎn)錄后水平調(diào)控基因的表達(dá),可以利用該功能進(jìn)行基因沉默的研究,使得不利于植物生長(zhǎng)及發(fā)育的基因不表達(dá),得到人們所需要的性狀。而落葉松的基因組復(fù)雜,所以在基因組測(cè)序方面明顯落后于其他物種。目前,只有日本落葉松有miRNA的相關(guān)研究結(jié)果,共獲得了來(lái)自于85個(gè)miRNA家族的174個(gè)miRNAs[15]。落葉松良種選擇和繁育已開(kāi)展多年,獲得了較好的效果,但對(duì)于落葉松生長(zhǎng)發(fā)育的調(diào)控機(jī)理研究很少,本研究彌補(bǔ)了該方面的不足,從miRNA角度探討了落葉松生長(zhǎng)發(fā)育的分子機(jī)理。隨著越來(lái)越多的miRNA被發(fā)現(xiàn),將填補(bǔ)人們對(duì)其在基因表達(dá)調(diào)控中的更多的認(rèn)識(shí)。
雖然木本植物中雖已經(jīng)鑒定出了很多miRNA,但是對(duì)其功能研究還尚不足,在不久的將來(lái),對(duì)miRNA及其調(diào)控機(jī)制的挖掘及與其功能相結(jié)合,miRNA及其靶基因相互作用將會(huì)成為木本植物分子遺傳學(xué)研究的熱點(diǎn)。