王 麗,路運(yùn)才
(1黑龍江大學(xué)現(xiàn)代農(nóng)業(yè)與生態(tài)環(huán)境學(xué)院,哈爾濱 150080;2黑龍江省肇東市農(nóng)業(yè)技術(shù)推廣中心,黑龍江肇東 151100)
MicroRNA(miRNA)是 由 20~22 個(gè) 核 苷 酸(nucleotide,nt)組成的非編碼RNA,較早在秀麗隱桿線蟲中發(fā)現(xiàn)[1],在植物和動(dòng)物的發(fā)育過(guò)程中具有沉默靶基因和負(fù)調(diào)控基因表達(dá)的作用[2-3]。在擬南芥中,miR159和miR172分別參與控制葉形態(tài)和花發(fā)育[4,5]。miRNA基因具有莖環(huán)結(jié)構(gòu),通常位于前體的莖區(qū)域。在植物中,miRNA前體通常為60至上百個(gè)nt不等[6]。成熟miRNA由其前體經(jīng)DCL1(Dicer-like1)酶2次切割形成。miRNA與RNA誘導(dǎo)的沉默復(fù)合物(RNA-induced silencing complex,RISC)結(jié)合,并通過(guò)相同配對(duì)位點(diǎn)切割靶mRNA或在miRNA錯(cuò)配時(shí)抑制蛋白翻譯,從而指導(dǎo)轉(zhuǎn)錄后調(diào)控過(guò)程[7]。
資料表明,microRNA在植物響應(yīng)環(huán)境脅迫方面具有重要調(diào)節(jié)作用。一些microRNAs已被鑒定響應(yīng)水稻、小麥、豆類、番茄等非生物脅迫[8-10]。在植物miRNA基因家族中,miR395基因家族較特別,該家族成員在不同物種中形成大小的簇。正常條件下,在擬南芥中無(wú)法檢測(cè)到miR395轉(zhuǎn)錄物,但在低硫酸鹽脅迫下可被誘導(dǎo)[11]。根據(jù)數(shù)據(jù)庫(kù)檢索顯示,miR395與其他幾種植物的硫?;竚RNA匹配,包括水稻、玉米、蕓苔屬和蔥屬,這表明miR395硫酰化酶配對(duì)在許多植物基因組中是保守的[12]。在擬南芥,6個(gè)miR395基因具有較高的序列相似性,分成兩組串聯(lián)復(fù)制[13]。與擬南芥含有6個(gè)成員相比,該基因家族在水稻中顯著擴(kuò)大,包括24個(gè)成員,在1 kb的范圍內(nèi)存在7個(gè)基因[14],表現(xiàn)出清晰的串聯(lián)和分段重復(fù)[15],24個(gè)水稻miR395基因形成4個(gè)緊湊的簇,每個(gè)簇均可轉(zhuǎn)錄為一個(gè)轉(zhuǎn)錄本[16-17]。
此外,miR395還以3種ATP硫?;福ˋPS1、APS3和APS4)和一種低親和力的硫酸鹽轉(zhuǎn)運(yùn)蛋白(SULTR2)為靶點(diǎn),兩者都參與了植物硫酸鹽代謝途徑。硫酸鹽同化過(guò)程的第一步是ATP硫酸化酶催化無(wú)機(jī)硫酸鹽和ATP結(jié)合,形成5′-磷酸腺苷(APS)和無(wú)機(jī)焦磷酸鹽。隨后,APS被兩種不同的硫酸鹽同化途徑利用。一方面,APS通過(guò)使用ATP的APS激酶進(jìn)一步磷酸化APS,從而導(dǎo)致形成3′-磷酸腺苷5′-磷酸硫酸鹽(PAPS),這是用于植物大分子硫酸化的高能SO42-供體。另一方面,APS被腺苷5′-磷酰硫酸還原酶(APR)還原為亞硫酸鹽后被進(jìn)一步還原,然后摻入O-乙酰絲氨酸(OAS)的氨基酸骨架中[18]。有報(bào)道稱,miR395是由硫酸鹽缺乏或重金屬脅迫誘導(dǎo)的,而這種誘導(dǎo)對(duì)植物的硫酸鹽穩(wěn)態(tài)和氧化應(yīng)激反應(yīng)起著至關(guān)重要的作用[19-20]。已經(jīng)證實(shí)在低硫酸鹽期間,miR395在轉(zhuǎn)錄后水平上調(diào)控了3個(gè)APS基因,低硫酸鹽對(duì)APS1,APS3和APS4有不同的調(diào)節(jié)作用[21-22]。
本研究采用生物信息學(xué)方法,對(duì)玉米中16個(gè)miR395前體序列、成熟序列、序列保守性、折疊結(jié)構(gòu)、染色體位置進(jìn)行分析,對(duì)前體序列的順式作用元件及靶基因進(jìn)行預(yù)測(cè),并對(duì)zma-miR395基因表達(dá)模式進(jìn)行分析,旨在為解析該家族基因的生物學(xué)功能提供依據(jù)。
從miRNA數(shù)據(jù)庫(kù)miRBase(http://www.miRbase.org)中下載整理玉米所有miR395基因家族的前體序列、成熟miRNA序列及其相關(guān)信息。
采用NCBI數(shù)據(jù)庫(kù)相似性搜索工具BLAST(http://blast.ncbi.nlm.nih.gov/Blast.cgi)進(jìn)行比對(duì),基因定位使用MapChart軟件進(jìn)行zma-miR395基因的染色體位置繪制。使用2個(gè)標(biāo)準(zhǔn)確認(rèn)基因重復(fù):(a)較短的比對(duì)序列覆蓋了較長(zhǎng)序列長(zhǎng)度的>70%;(b)中比對(duì)的序列的相似性為>70%[23]。位于同一染色體片段中小于100 kb且被5個(gè)或更少的基因分隔的2個(gè)基因被鑒定為串聯(lián)重復(fù)基因[24]。通過(guò)搜索植物基因組復(fù)制數(shù)據(jù)庫(kù)可以確認(rèn)重復(fù)的zma-miR395基因片段[25]。
利用ClustalW(https://www.genome.jp/tools-bin/clustalw)在線軟件對(duì)所收集到的所有zma-miR395序列進(jìn)行多序列比對(duì)。采用WebLogo(https://weblogo.berkeley.edu/logo.cgi)在線軟件,繪制序列l(wèi)ogo圖,分析基因保守程度。另外將結(jié)果輸入MEGA7.0軟件中,構(gòu)建zma-miR395系統(tǒng)發(fā)育樹(shù),重復(fù)抽樣數(shù)設(shè)為1000。
利用Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對(duì)基因上游200 bp的啟動(dòng)子區(qū)域進(jìn)行分析。
利用The mfold Web Server(http://unafold.rna.albany.edu/?q=mfold)中的RNA Folding Form在線預(yù)測(cè)zma-miR395家族成員前體的二級(jí)結(jié)構(gòu),默認(rèn)系統(tǒng)參數(shù)值。
使用在線靶位點(diǎn)分析軟件psRNATarget(https://bio.tools/psrnatarget)預(yù)測(cè)zma-miR395的靶基因。
在PmiREN數(shù)據(jù)庫(kù)中獲得zma-miR395基因家族16個(gè)成員不同組織中的表達(dá)量數(shù)據(jù)。
從miRBase數(shù)據(jù)庫(kù)中共獲得16個(gè)zma-miR395基因,這些基因分別分布在Chr2和Chr10這2條染色體上。如圖1所示,從染色體上基因分布的數(shù)量來(lái)看,染色體Chr2上分布1個(gè)簇,有9個(gè)成員(zma-miR395d,zma-miR395f,zma-miR395g,zma-miR395e,zma-miR395i,zma-miR395h,zma-miR395b,zma-miR395a,zma-miR395j),染色體Chr10上分布2個(gè)簇,第一個(gè)簇有 4 個(gè) 成 員 (zma-miR395k,zma-miR395l,zmamiR395m,zma-miR395c),第二個(gè)簇只有3個(gè)成員(zmamiR395n,zma-miR395o,zma-miR395p)。
圖1 zma-miR395基因位置
zma-miR395基因家族的前體序列長(zhǎng)度為70~234nt,成熟序列長(zhǎng)度為20~23 nt。將zma-miR395家族的前體序列進(jìn)行比對(duì),結(jié)果顯示zma-miR395在產(chǎn)生成熟序列的區(qū)域堿基高度保守,有些位置上的堿基甚至完全相同(圖2)。將16個(gè)zma-miR395的序列進(jìn)行比對(duì),結(jié)果顯示(表1)zma-miR395的堿基高度保守,有19個(gè)堿基甚至完全相同。這可能暗示zma-miR395功能的單一性。
表1 成熟zma-miR395多序列比對(duì)結(jié)果
圖2 前體序列的堿基位置
根據(jù)圖3可知,兩株進(jìn)化樹(shù)均分為3枝,A圖構(gòu)建的前體進(jìn)化樹(shù)每分枝數(shù)量相近,不同分支之間的分化程度有差異,位于同一條染色體上的zma-miR395前體基因并沒(méi)有位于同一分支,表現(xiàn)出更近的親緣關(guān)系。例如,圖A染色體Chr10上第二個(gè)簇3個(gè)成員(zmamiR395n,zma-miR395o,zma-miR395p)位于2個(gè)不同的分支中。此外,B圖構(gòu)建的成熟體進(jìn)化樹(shù)中成熟體的分類情況更為特別,3’端的成熟體在同一分區(qū)內(nèi),而5’端的成熟體卻分為兩類,zma-miR395d-5p和zmamiR395g-5p單獨(dú)分離出來(lái),推測(cè)可能是存在特殊的進(jìn)化機(jī)制。
續(xù)表1
運(yùn)用PlantCARE對(duì)上述zma-miR395啟動(dòng)子序列上的脅迫相關(guān)元件進(jìn)行分析,結(jié)果見(jiàn)表2。zmamiR395基因家族上游啟動(dòng)子元件有12類,包括脫落酸響應(yīng)元件、生長(zhǎng)素響應(yīng)元件、干旱響應(yīng)元件、光響應(yīng)元件等。其中數(shù)量最多的ABRE類元件,主要調(diào)節(jié)ABA信號(hào)傳導(dǎo)。其次是MYB元件、AC-II元件和STRE元件,MYB元件是植物最大的轉(zhuǎn)錄因子家族之一,廣泛參與植物代謝調(diào)控,功能十分多樣;AC-II元件參與木質(zhì)部特異性表達(dá);STRE元件與植物非生物脅迫相應(yīng)相關(guān)。G-box元件主要參與調(diào)節(jié)植物的光反應(yīng),其他元件的數(shù)量相對(duì)較少。
表2 zma-miR395基因順式作用原件
由二級(jí)結(jié)構(gòu)預(yù)測(cè)分析和成熟體定位分析(圖4)可知,zma-miR395前體二級(jí)結(jié)構(gòu)為十分典型的發(fā)卡狀結(jié)構(gòu)。最小折疊自由能為-28.00 kcal/mol。其中大量堿基均能互補(bǔ)配對(duì),miR395前體序列原本5’和3’兩端A-U堿基結(jié)合形成穩(wěn)定氫鍵,前體中間成環(huán),2個(gè)成熟體產(chǎn)生于靠近5’端的位置。提示了該結(jié)構(gòu)可能提高了其在遺傳進(jìn)化過(guò)程中的穩(wěn)定性,發(fā)揮了重要的作用,從而不易造成堿基的缺失,也佐證了其遺傳的保守性。
圖4 zma-miR395前體二級(jí)結(jié)構(gòu)
對(duì)zma-miR395基因家族的16個(gè)成員進(jìn)行靶基因預(yù)測(cè)(E≤3),發(fā)現(xiàn)所有的zma-miR395成員都靶向參與硫酸鹽同化的ATP硫酰化酶,這也驗(yàn)證了miR395通過(guò)調(diào)控ATP來(lái)控制植物的生長(zhǎng)及發(fā)育。其他靶向基因與交替氧化酶,光系統(tǒng)I反應(yīng)中心亞基VI相關(guān),參與調(diào)控玉米呼吸和光合作用(表3)。
表3 zma-miR395靶基因預(yù)測(cè)
zma-miR395基因家族16個(gè)成員表達(dá)模式情況復(fù)雜 ,如 圖 5,其 中zma-miR395a/b/d/e/g/h/j、zmamiR395n/o/p、zma-miR395f/i分別具有相同的表達(dá)模式,而zma-miR395基因家族16個(gè)成員在葉片和種子中表達(dá)情況完全相反。此外,zma-miR395基因家族16個(gè)成員在各組織中多數(shù)處于下調(diào)狀態(tài),推測(cè)zmamiR395成員可能在不同的組織中發(fā)揮調(diào)控作用。
圖5 zma-miR395基因家族成員表達(dá)模式
miRNA介導(dǎo)的基因調(diào)控是一種古老的基因調(diào)控機(jī)制,在陸地植物的所有世系中都得到保留,甚至早于動(dòng)、植物界的分化[26]。目前,未見(jiàn)有zma-miR395基因家族相關(guān)研究報(bào)道,所以對(duì)zma-miR395基因家族進(jìn)行鑒定和研究可以進(jìn)一步了解zma-miR395對(duì)于玉米生長(zhǎng)發(fā)育的作用。本研究通過(guò)生物信息學(xué)分析方法可知:zma-miR395基因家族進(jìn)化樹(shù)結(jié)果表明,由于進(jìn)化選擇的積極性,zma-miR395基因家族在基因組中進(jìn)行串聯(lián)重復(fù)形成3個(gè)基因簇,這些基因簇在基因調(diào)控方面普遍優(yōu)于零散基因;zma-miR395基因家族成員之間的序列相似性極高(其中一些甚至相同)表明zmamiR395基因在進(jìn)化過(guò)程中的不同時(shí)間進(jìn)行了串聯(lián)重復(fù),個(gè)別成員的差異可能由于外界環(huán)境原因?qū)е聠蝹€(gè)堿基突變,外界環(huán)境的改變,例如重金屬,低溫,鹽堿度和干旱等已被證明可以調(diào)節(jié)miRNA在植物組織中的表達(dá)[27];啟動(dòng)子是基因表達(dá)調(diào)控的關(guān)鍵區(qū)域,分析zma-miR395的響應(yīng)元件時(shí),發(fā)現(xiàn)雖然響應(yīng)元件的種類多,但只有個(gè)別種類數(shù)量多,說(shuō)明zma-miR395功能的單一性,這一點(diǎn)在后面的靶基因預(yù)測(cè)時(shí)也得到了證實(shí);zma-miR395主要靶向參與硫酸鹽同化的ATP硫?;福土驐l件下,miR395被證實(shí)調(diào)節(jié)低親和力的硫酸鹽轉(zhuǎn)運(yùn)體(SULTR2;1)和兩種ATP硫化酶(APS1和APS4)[28-29];轉(zhuǎn)錄組數(shù)據(jù)表明16個(gè)zma-miR395基因家族成員在玉米各組織中多數(shù)處于下調(diào)狀態(tài),實(shí)驗(yàn)證明在硫酸鹽、砷酸鹽、鎘和銅脅迫下,擬南芥植株中miR395表達(dá)量有所增加[30],在SO2脅迫下,擬南芥中miR395d和miR395e的表達(dá)量增加,而在低硫酸鹽處理過(guò)程中,所有6個(gè)成員(miR395a、miR395b、miR395c、miR395d、miR395e、miR395f)表達(dá)量均上調(diào)[31]。不同植物基因組中miR395基因家族成員組織表達(dá)多樣性為miR395基因的不同時(shí)空表達(dá)模式佐證,miR395基因的多樣化分布解釋了組織特異性甚至細(xì)胞類型特異性表達(dá)。對(duì)本文中預(yù)測(cè)到的zma-miR395基因家族的調(diào)控功能還需要進(jìn)行進(jìn)一步的實(shí)驗(yàn)驗(yàn)證,未來(lái)的研究應(yīng)預(yù)測(cè)并驗(yàn)證miR395基因家族的基因組差異對(duì)靶基因調(diào)控的影響,了解植物miR395基因家族的進(jìn)化將有助于人們更好地理解這些小RNA分子所強(qiáng)調(diào)的基因調(diào)控機(jī)制的復(fù)雜性。
通過(guò)生物信息學(xué)方法鑒定到16個(gè)zma-miR395基因,均分布在Chr2和Chr10染色體上,形成3個(gè)基因簇。zma-miR395基因成熟序列的區(qū)域堿基高度保守;zma-miR395前體基因進(jìn)化樹(shù)及成熟體進(jìn)化樹(shù)均分為3枝;zma-miR395基因上游啟動(dòng)子元件包括12類,其中數(shù)量最多的是ABRE類,占比超過(guò)25%;zma-miR395前體二級(jí)結(jié)構(gòu)為十分典型的發(fā)卡狀結(jié)構(gòu),最小折疊自由能僅為-28.00 kcal/mol;zma-miR395基因靶向參與硫酸鹽同化的ATP硫酰化酶;16個(gè)zma-miR395基因家族成員在多種組織中處于下調(diào)狀態(tài),推測(cè)zmamiR395基因可能反向調(diào)控基因表達(dá)。