劉 潮,褚洪龍,韓利紅,代冬琴,陳歡歡,唐利洲
(曲靖師范學(xué)院 云南高原生物資源保護與利用研究中心,云南 曲靖 655011)
MicroRNA(miRNA)是一類約22個核苷酸的小分子非編碼RNA,通過Argonaute(AGO)蛋白和RNA誘導(dǎo)沉默復(fù)合體(RNA-induced silencing complex,RISC)的形式,在轉(zhuǎn)錄或轉(zhuǎn)錄后水平抑制靶基因的表達[1],從而參與基因的表達調(diào)控[2]。miRNA的初級轉(zhuǎn)錄本pri-miRNA通過編碼具有調(diào)節(jié)功能的多肽,促進miRNA積累,調(diào)節(jié)基因表達[3]。miRNA在調(diào)節(jié)植物基因表達、促進生長發(fā)育和抵御脅迫等方面發(fā)揮作用。miR399是miRNA的重要家族成員,在植物響應(yīng)低磷脅迫過程中發(fā)揮重要作用[4]。miR399受低磷誘導(dǎo)上調(diào)表達,通過抑制PHO2基因表達[5],參與了植物體內(nèi)磷酸鹽的轉(zhuǎn)運[6]。
目前,多個物種miR399家族成員已被鑒定,然而該家族成員在各植物中的數(shù)量分布、進化關(guān)系及其功能的比較研究較少。為全面了解植物miR399家族成員進化與功能特征,本研究以miRBase數(shù)據(jù)庫中記錄的植物miR399為研究對象,通過生物信息學(xué)方法,對物種分布、序列特征、啟動子區(qū)特征和靶基因功能等進行研究,為該家族成員的進一步開發(fā)利用提供借鑒。
所有植物miR399數(shù)據(jù)下載于miRBase數(shù)據(jù)庫(http://www.mirbase.org/)和PMRD數(shù)據(jù)庫(http://bioinformatics.cau.edu.cn/PMRD/)。
利用ClustalX進行序列比對,利用MEGA 5.0軟件,采用鄰接法(Neighbor-joining,NJ)構(gòu)建系統(tǒng)發(fā)育樹。
采用Mfold在線軟件(http://unafold.rna.albany.edu/?q=mfold)對pre-miR399進行二級結(jié)構(gòu)預(yù)測,并對成熟體位置進行分析。
通過PMRD數(shù)據(jù)庫(http://bioinformatics.cau.edu.cn/PMRD/)獲取擬南芥和水稻per-miRNA轉(zhuǎn)錄起始位點上游1.5 kb序列,通過PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)數(shù)據(jù)庫進行基因啟動子區(qū)順式作用元件分析。
從PMRD下載獲得擬南芥、水稻miRNA靶基因,并在psRNATarget數(shù)據(jù)庫(http://plantgrn.noble.org/psRNATarget/)中進行驗證。利用AGRiGO數(shù)據(jù)庫(http://bioinfo.cau.edu.cn/agriGO/analysis.php)對水稻miR399靶基因的基因本體(Gene ontology,GO)進行分析。
截至2018年2月1日,通過miRBase數(shù)據(jù)庫共搜索到32個植物物種的206個pre-miR399和244個成熟miR399。miR399僅分布在被子植物中,其中25種為雙子葉植物,pre-miR399和miR399的數(shù)量分別為166,192個,7種為單子葉植物,pre-miRNA和成熟miRNA的數(shù)量分別為40,52個(表1)。各物種間miR399家族成員數(shù)量不同,即使同科植物間也相差較大,pre-miR399和成熟miR399數(shù)量在豆科的蒺藜苜蓿分別為20,22個,而菜豆中均為1,在禾本科的玉米分別為10,20個,而小麥中均為1,表明植物miR399家族成員的數(shù)量與植物的進化程度關(guān)系不大。各物種pre-miR399和成熟miR399數(shù)量之間比例關(guān)系分為兩類,一類二者接近1∶1,大多數(shù)植物屬于此類,另一類是接近1∶2,僅有山羊草、玉米、馬鈴薯和琴葉擬南芥屬于此類。
pre-miR399廣泛分布在63~286 nt,呈鐘型分布,平均長度為116 nt,數(shù)量最多的核苷酸數(shù)為64 nt,有10條序列,其次為94 nt的有8條,長度為122,123 nt的分別有7條,長度為101~140 nt的序列數(shù)量有113條,占全部數(shù)量的54.85%(圖1)。成熟miR399序列長度在19~23 nt,其中21 nt的占93.85%,其次為22 nt的有12條,說明miR399在植物中的長度較穩(wěn)定。
植物前體和成熟miRNAs在植物進化過程中高度保守[7]。利用Weblogo在線軟件對植物miR399家族前體序列進行分析(圖2),發(fā)現(xiàn)5′和3′端均有較保守序列,其中3′端一致序列為UGC CAAAGGAGA*UUGCCC*G,該序列即為大部分miR399序列。
表1 植物miR399家族成員分布Tab.1 Distribution of plant miR399 family members
圖1 植物前體miR399和成熟miR399核苷酸長度分布Fig.1 Size distribution of plant pre-miR399 and mature miR399
為了解植物miR399家族進化特征,以雙子葉植物中豆科的大豆、茄科的煙草、十字花科的擬南芥、楊柳科的楊樹、薔薇科的蘋果和單子葉植物中禾本科的水稻、玉米為代表,構(gòu)建系統(tǒng)發(fā)育樹,并對成熟體序列進行比對分析(圖3)。除玉米外,其他6個物種miR399序列一致性較高,水稻既有部分miR399與大豆的聚在一組,也有部分miR399與玉米、楊樹和蘋果聚在一組,說明miR399在植物種間的保守性較強,該家族在植物的生命調(diào)控中發(fā)揮重要且穩(wěn)定的作用。
圖2 前體miR399保守核苷酸序列標簽Fig.2 Sequence logo analysis of plant pre-miR399
圖中miRNA物種縮寫分別為:gma.大豆;osa.水稻;ptc.楊樹;mdm.蘋果;ath.擬南芥;zma.玉米;nta.煙草。
The miRNA species abbreviations:gma.Glycinemax;osa.Oryzasativa;ptc.Populustrichocarpa;mdm.Malusdomestica;ath.Arabidopsisthaliana;zma.Zeamays;nta.Nicotianatabacum, respectively.
圖3 不同科植物miR399家族聚類及成熟體序列比對
Fig.3 Phylogenetic tree of different family plants miR399
family and multiple alignment of mature sequences
植物pre-miR399經(jīng)RNase Ⅲ-Dicer切割產(chǎn)生成熟miRNA[8]。pre-miRNA二級結(jié)構(gòu)及成熟miRNA序列位置的研究,對序列切割和折疊預(yù)測具有重要的參考價值。本研究利用Mfold在線軟件對部分pre-miR399二級結(jié)構(gòu)進行預(yù)測,發(fā)現(xiàn)植物pre-miR399主要分為3種類型:①產(chǎn)生1條成熟miR399,且位于pre-miR399的3′端,大部分植物pre-miR399均屬此類;②產(chǎn)生2條成熟miR399,分別位于pre-miR399的3′端和5′端,產(chǎn)生2條成熟miR399的前體均屬此類;③產(chǎn)生1條成熟miR399,且位于pre-miR399的5′端,僅有g(shù)ra-miR399和stu-miR399h屬此類(圖4)。這些不同類型的miR399可能在植物中發(fā)揮了不同的功能。
圖4 植物pre-miR399家族發(fā)夾結(jié)構(gòu)Fig.4 Predicted hairpin secondary structures of selected plant pre-miR399
通過PlantCARE數(shù)據(jù)庫對擬南芥和水稻miR399家族pre-miRNA上游1.5 kb啟動子區(qū)順式作用元件進行了分析(表2),發(fā)現(xiàn)所有基因啟動子區(qū)均含有多個TATA-box和CAAT-box,部分基因含有Py-rich;所有基因啟動子區(qū)均含有1個到多個激素響應(yīng)元件,包括脫落酸響應(yīng)元件ABRE、茉莉酸響應(yīng)元件CGTCA-motif、赤霉素響應(yīng)元件GARE-motif等;多數(shù)基因啟動子區(qū)均含有多個脅迫響應(yīng)元件,包括熱激響應(yīng)元件HSE、低溫反應(yīng)順式作用元件LTR、干旱脅迫響應(yīng)MYB結(jié)合位點MBS、防御和脅迫相關(guān)響應(yīng)元件TC-rich。除此之外,大部分基因含有厭氧響應(yīng)元件ARE和蛋白代謝調(diào)控順式元件O2-site?;蚝械募に鼗蛎{迫響應(yīng)元件數(shù)量和類型不同,可能是不同的基因在不同的信號通路中發(fā)揮作用,也說明該家族基因功能的多樣性和復(fù)雜性。
表2 擬南芥和水稻miR399基因上游1.5 kb啟動子區(qū)順式作用元件信息Tab.2 Information about putative cis-acting elements in the 1.5 kb upstream promoter region of miR399 genes in Arabidopsis and rice
注:ABRE.脫落酸響應(yīng)元件;CGTCA-motif.茉莉酸響應(yīng)元件;GARE-motif.赤霉素響應(yīng)元件;HSE.參與熱激反應(yīng)的順式作用元件;LTR.參與低溫反應(yīng)的順式作用元件;MBS.干旱響應(yīng)MYB結(jié)合位點;TC-rich repeats.防御和脅迫相關(guān)響應(yīng)元件;ARE.厭氧誘導(dǎo)的順式作用元件;O2-site.參與玉米醇溶蛋白代謝調(diào)控的順式作用元件。
Note: ABRE.Cis-acting element involved in the abscisic acid responsiveness; CGTCA-motif.Cis-acting regulatory element involved in the MeJA-responsiveness;GARE-motif.Gibberellin-responsive element; HSE.Cis-acting element involved in heat stress responsiveness;LTR.Cis-acting element involved in low-temperature responsiveness; MBS.MYB binding site involved in drought-inducibility;TC-rich repeats.Cis-acting element involved in defense and stress responsiveness;ARE.Cis-acting regulatory element essential for the anaerobic induction; O2-site.Cis-acting regulatory element involved in zein metabolism regulation.
miRNA通過特異性剪切靶標mRNA、阻止靶標mRNA翻譯等方式調(diào)控基因表達[9]。預(yù)測并分析靶基因,對于深入了解miR399家族功能特征及其進化規(guī)律具有重要意義。本研究利用PMRD和psRNATarget數(shù)據(jù)庫對擬南芥和水稻miR399家族靶基因進行預(yù)測,分析發(fā)現(xiàn)擬南芥和水稻miR399分別調(diào)控了11,22個靶基因。利用AGRiGO數(shù)據(jù)庫對水稻miR399家族靶基因的基因本體進行分析(圖5),發(fā)現(xiàn)其功能涉及生物學(xué)過程、細胞組分及分子功能3大類共7個小類。生物學(xué)過程分類中,胞內(nèi)過程類型基因占比最大,比水稻該類基因本底提高了15.1%,其次為代謝過程;細胞組分分類中,細胞和細胞部分類別占比均為59.1%,其次為細胞器類型,其中,細胞類型比水稻該類基因本底降低了5.2%;分子功能分類中,催化活性和結(jié)合類型占比分別為40.9%,45.5%,分別比水稻該類基因本底提高了1.5%,1.4%。
圖5 水稻miR399家族靶基因基因本體分析Fig.5 Gene ontology analysis of rice miR399 target genes
擬南芥miR399家族調(diào)控靶基因主要包括泛素聯(lián)結(jié)酶、磷酸鹽轉(zhuǎn)運蛋白、絲氨酸/蘇氨酸蛋白激酶、鈉膽汁酸轉(zhuǎn)運蛋白等基因(表3),這些基因主要參與了RNA合成和代謝調(diào)控、轉(zhuǎn)錄調(diào)控等過程。水稻miR399家族調(diào)控靶基因主要為磷酸鹽轉(zhuǎn)運蛋白、絲氨酸/蘇氨酸蛋白激酶、類受體激酶2、DnaJ結(jié)構(gòu)域蛋白、泛素聯(lián)結(jié)酶、抗病蛋白、反轉(zhuǎn)錄轉(zhuǎn)座子蛋白、WW結(jié)構(gòu)域蛋白等基因(表3),這些基因主要參與了植物磷代謝、應(yīng)激響應(yīng)、基因表達調(diào)控等多項進程。
miRNAs是一類參與植物生長、發(fā)育和應(yīng)激反應(yīng)的非編碼小分子調(diào)節(jié)因子[10],在植物抵御環(huán)境脅迫過程中發(fā)揮作用,因此,miRNAs的鑒定和功能分析對植物抗逆新品種選育具有重要意義。傳統(tǒng)的miRNAs研究需要構(gòu)建小RNA文庫、Northern Blot、qRT-PCR等一系列復(fù)雜的試驗步驟,在實際研究中存在諸多困難。隨著基因組學(xué)和測序技術(shù)的發(fā)展,計算方法被廣泛應(yīng)用于生物學(xué)研究中,利用多種計算軟件和方法,對不同物種miRNA及其靶基因進行預(yù)測和分析[11],這些研究大大縮減了科研工作量,使得科研工作更加快速、高效地開展。本研究利用miRBase數(shù)據(jù)庫對植物miR399家族成員進行系統(tǒng)分析,搜索到32個植物物種的244個成熟miR399,說明該家族miRNA在大部分植物物種中普遍存在,但在各物種中的分布數(shù)量很不均衡。一半以上的pre-miR399長度為101~140 nt,極大部分成熟miR399為21 nt,說明該家族成員進化上具有較高的保守性。
表3 植物miR399家族預(yù)測靶基因信息Tab.3 Information of predicted target genes of plant miR399 family
分析pre-miRNA二級結(jié)構(gòu),對了解成熟miRNA的剪切和折疊具有重要意義。pre-miR399在5′和3′端均有較保守序列,其中3′端序列保守性較強。大部分植物miR399位于pre-miRNA的3′端,除部分pre-miR399能產(chǎn)生5′和3′端2條成熟miR399外,極少miR399位于5′端。進化分析發(fā)現(xiàn),除玉米外,該研究的6個物種miR399序列一致性較高,在植物種間的保守性較強,且不同種屬間進化分組存在交叉。
植物miRNA通過序列互補的方式與靶基因結(jié)合,從而導(dǎo)致靶基因的降解或功能失活?;谠撛瓌t,對miRNA靶基因進行預(yù)測分析,對深入研究miRNA的功能具有重要指導(dǎo)意義。研究表明,miR399參與了植物對干旱、高鹽和低磷脅迫的響應(yīng)[10,12-13]。AtMYB2通過調(diào)控miR399表達,提高了擬南芥對磷元素的吸收[14]。Hvu-miR399受低磷誘導(dǎo)上調(diào)表達,調(diào)控其靶基因HvPHO2下調(diào)表達,并釋放出磷轉(zhuǎn)運蛋白PHO1和PHT1s,促進磷酸鹽的吸收和轉(zhuǎn)運[15]。Zma-miR399通過調(diào)控其靶基因ZmPHT1;3、ZmPHT1;8和ZmPHO2的表達,影響了玉米對低磷脅迫的耐受性[16]。Osa-miR399參與了水稻對多種營養(yǎng)饑餓脅迫的調(diào)控[17]。上述研究表明,miR399在植物生長發(fā)育和抵御環(huán)境脅迫過程中發(fā)揮了重要作用。該研究中,miR399家族靶基因功能分析顯示,ath-miR399a-f均調(diào)控了泛素聯(lián)結(jié)酶E2基因AT2G33770,泛素鏈接酶E2基因表達受植物中磷的調(diào)控,參與了磷酸鹽饑餓響應(yīng),介導(dǎo)了PHO1和PHT1s在內(nèi)膜中的降解[18-20]。ath-miR399b和ath-miR399c均調(diào)控了PHT1蛋白編碼基因AT3G54700,PHT1為磷酸鹽轉(zhuǎn)運蛋白,在植物中發(fā)揮磷素轉(zhuǎn)運功能;ath-miR399a、ath-miR399d和ath-miR399e均調(diào)控了RH39蛋白編碼基因AT4G09730,RH39為DEAD盒蛋白,參與葉綠體23S rRNA的隱性斷裂,突變體大大降低了核糖1,5-二磷酸羧化酶/加氧酶的水平[21]。osa-miR399a~osa-miR399k均調(diào)控了DnaJ功能域包含蛋白和泛素連接酶,DnaJ功能域包含蛋白屬于熱激蛋白家族,在多種生物進程中發(fā)揮作用[22],OsPHO2編碼E2泛素聯(lián)結(jié)酶,并且作為磷饑餓響應(yīng)信號途徑中的重要成員,間接負調(diào)控下游的多個無機磷轉(zhuǎn)運體[23-24]。osa-miR399a-d、osa-miR399a-i、osa-miR399a-j調(diào)控了無機磷酸鹽轉(zhuǎn)運蛋白OsPT6[25]。多個miR399成員調(diào)控了同一類靶基因,說明該家族存在冗余現(xiàn)象,對細胞響應(yīng)多種信號和細胞功能的穩(wěn)定具有重要作用。
Pre-miR399啟動子區(qū)含有多個激素和脅迫響應(yīng)元件,miR399家族多個靶基因在磷饑餓響應(yīng)、磷轉(zhuǎn)運和信號轉(zhuǎn)導(dǎo)等過程中起作用,表明植物miR399家族在植物響應(yīng)環(huán)境脅迫中發(fā)揮作用,單個miR399成員對脅迫環(huán)境的響應(yīng)模式及對靶基因的具體調(diào)控機制值得進一步深入研究。