(1.海南醫(yī)學院生物化學與分子生物學教研室,海南海口571199;2.海南大學農學院,海南???70228;3.中國熱帶農業(yè)科學院熱帶生物技術研究所分析測試中心,海南???71101)
李崇奇1,2,3,周 鵬2,3* ,蔡望偉1*
桉屬(Eucalyptus)植物統(tǒng)稱桉樹,分類學上屬桃金娘科(Myrtaceae),原產于澳大利亞。由于其具有生長速度快、適應性強、材質優(yōu)良等特點,與松樹和楊樹并稱為世界3大速生樹種之一。我國從1890年開始引種栽培桉樹,目前栽培面積已達360萬hm2,占我國人工林面積的5.8%,占我國木材產量的20%[1]。目前桉樹廣泛用于房屋建筑、人造板、造紙等領域,同時也是重要的潛在能源植物之一。近年來有研究發(fā)現,桉樹種植對礦山生態(tài)環(huán)境的恢復具有積極意義[2]。桉樹具有重要的經濟價值,也是分子遺傳育種改良的重要目標植物之一。識別影響桉樹生長速率和其他品質相關的基因對桉樹甚至其他林木樹種的遺傳品質改良具有重要的意義。Lacombe等[3]首次克隆表達了岡尼桉(Eucalyptus gunnii)的木質素合成關鍵酶肉桂酰CoA還原酶(cinnamyl-CoA reductase,CCR)。Paux 等[4]應用消減雜交技術在岡尼桉中識別224個與木質形成相關的基因,其中1/3的基因與細胞信號轉導和細胞壁的合成相關。Ranik和Myburg[5]克隆了6個巨桉(Eucalyptus grandis)全長的纖維素合酶基因,發(fā)現纖維素合酶1、2和3主要參與植物次生壁的形成,而纖維素合酶4和5則參與初生壁的合成。Rengel等[6]發(fā)現岡尼桉中與木質形成相關的基因主要是與植物初生壁和次生壁形成相關基因及部分轉錄因子序列。近年來對桉樹轉錄圖譜的研究[7-8]更是為從全基因組水平識別和篩選木質相關基因提供了理論基礎。然而物種內部很多基因尤其是一些轉錄因子都受到miRNA的調控,對人類的研究發(fā)現30%的基因都受到miRNA的調控[9]。miRNA被認為參與了植物器官的發(fā)育、代謝的調節(jié)和抗逆反應等一系列復雜生物學過程。筆者擬應用miRtour在線分析工具(http://bio2server.bioinfo.uni-plovdiv.bg/miRTour/)[10]對岡尼桉(Eucalyptus gunnii)、粗皮桉(Eucalyptus pellita)、藍桉(Eucalyptus globulus)、垂尾桉(Eucalyptus urophylla)和赤桉(Eucalyptus camaldulensis)的表達序列標簽(expressed sequence tag,EST)進行分析,然后進行miRNA和靶基因預測,識別與桉樹品質相關或疾病相關的miRNA和其調控的靶基因,以期為未來桉樹以及其它林木分子遺傳育種奠定理論基礎。
1.1 材料 從美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)的網站(www.ncbi.nlm.nih.gov)的EST數據庫中分別下載岡尼桉、粗皮桉、藍桉、垂尾桉和赤桉的EST序列,分別為19 841、8 871、28 949、7 440條和58 584條。另外分別從rfam(http://rfam.sanger.ac.uk/)網站和pfam(http://pfam.sanger.ac.uk/)網站下載非編碼RNA數據庫和蛋白質數據庫。
1.2 試驗設計 分別將5中桉屬植物的EST序列分批遞交到miRtour在線界面上傳后參數設置如下,與已知miRNA序列能夠比對的最小數量(Minimum number of known miRNAs to be aligned)設置為1,miRNA序列與其互補序列的不配對數(Maximum unpaired nt in miR/miR*)設置為6,其他參數默認。下載分析結果可以得到miRNA序列、前體序列、最小自由能、最小自由能指數等相關參數。然后應用blast-2.2.27+軟件中的blastn程序將預測到的miRNA前體序列與rfam數據庫進行比對,應用blastx程序與pfam數據庫進行比對,將evalue參數設置為1e-6,其他參數默認,去除非miRNA序列,即為預測到的miRNA序列前體,相應的miRNA序列即為桉樹miRNA序列。將預測到的成熟桉樹miRNA序列以fasta格式上傳到psrobot網站(http://omicslab.genetics.ac.cn/psRobot/index.php)[11],應用靶基因預測在線工具進行預測,選擇巨桉轉錄組作為對照,參數選擇嚴格模式,同時將分值(score)設置為2.5。
1.3 數據分析 應用bioedit統(tǒng)計miRNA及其前體的序列長度,然后統(tǒng)計miRNA序列每個位點的堿基組成,對其堿基偏倚進行分析。
2.1 m iRNA預測 5種桉屬所有EST序列經過miRtour分析發(fā)現有30條序列具有莖環(huán)結構,分別與rfam和pfam數據庫比對后發(fā)現1條rRNA序列和3條蛋白質序列。共預測到26條miRNA前體序列和19條不同的成熟miRNA序列(表1)。表1中 eca-mir857和 egu-mir857相同,eca-mir164、eglmir164和eur-mir164相同,eca-mir167b和egl-mir167b相同,eca-mir167a和egl-mir167a,但由于在不同物種中發(fā)現,所以共命名為24個miRNA。赤桉中發(fā)現miRNA序列最多,為12條;而粗皮桉和垂尾桉分別僅發(fā)現1條成熟miRNA序。前體序列最小自由能為-19.6~-109.6 kcal/mol,最小自由能指數為0.71~0.94,GC含量為14.0% ~67.9%。
表1 新預測的桉樹m iRNA及其前體序列相關參數
2.2 m iRNA和前體的堿基組成特征 預測的miRNA長度為18~24 bp,其中長度為21個堿基的miRNA數量最多,達12個。miRNA序列中嘌呤與嘧啶的比值為1∶1.26,其堿基組成 A∶G∶C∶U 為1∶1.05∶1.15∶1.43,尿嘧啶比例明顯偏高。同時發(fā)現A、G、C、U出現頻率最高的位置分別為5’端第11堿基、第13堿基、第19堿基、第1堿基,其頻率分別為52.6%、42.1%、61.1%和52.6%。miRNA前體長度為91~221 bp,平均長度為173 bp,嘌呤與嘧啶的比值為1.00∶1.03,堿基組成 A∶G∶C∶U 為1.00∶1.15∶0.96∶1.25,尿嘧啶的比例最高。
2.3 m iRNA靶基因預測 19個miRNA中有11個預測到了靶基因,共發(fā)現104條編碼序列受到miRNA調控,去除不能夠被注釋的序列后共發(fā)現87條靶基因序列(表2)。其中32條序列為與疾病抗性相關基因,13條序列為轉錄因子,16條序列為酶。靶基因數目最多的是mir482,發(fā)現40個靶基因。靶基因中與木質形成相關的基因主要為調節(jié)MYB轉錄因子、NAC轉錄因子和過氧化酶,相應調控木質形成的miRNA主要為mir828、mir902和mir477。
EST序列是從一個隨機選擇的cDNA克隆進行5’端和3’端單一次測序獲得的短的cDNA部分序列,目前被廣泛應用于植物miRNA預測研究;尤其是對于缺少基因組信息的物種來說,EST序列是識別miRNA前體序列的重要途徑。Zhang等先后應用EST序列分別識別了60個物種的338條miRNA序列[12]和71個物種的481條miRNA 序列[13]。試驗經過對桉屬5種植物的123 685條序列進行分析,識別了19條不同的miRNA序列,識別效率與多數應用EST序列預測miRNA的研究一致。潘玉欣等對花生(Arachis hypogaea)的研究發(fā)現13條miRNA序列[14];郭強等對馬鈴薯的研究發(fā)現22條miRNA序列[15]。然而目前在mirbase數據庫(www.mirbase.org)中超過200條成熟microRNA序列的植物已經有13種,miRNA序列最多的蒺藜苜蓿(Medicago truncatula)有756條,因而應用EST識別植物miRNA的效率相對是較低的。這主要可能是由于植物的miRNA序列的初級轉錄產物很快在DCL等蛋白的作用下加工為為成熟的miRNA序列,從而導致前體序列存在時間較短有關。因而桉樹的miRNA還有待于進一步的生物信息學挖掘,或通過芯片技術、基因克隆和小RNA測序等相關實驗技術進行識別。
擬南芥和水稻的研究發(fā)現其miRNA序列的5’端第1堿基尿嘧啶比例最高[13],而在大豆和亞麻的研究中也發(fā)現在第1堿基和第19堿基分別出現頻率最高的為尿嘧啶和胞嘧啶[16-17]。試驗也發(fā)現桉樹miRNA序列的5’端第1堿基尿嘧啶出現頻率和第19堿基胞嘧啶出現頻率都超過了50%。目前認為miRNA 5’端堿基對于其與選擇不同Argonaute蛋白結合形成RISC復合物是至關重要的[18]。
桉樹是我國木材產量的重要來源之一,篩選與桉樹木質形成相關的基因具有重要意義。目前認為影響植物木質形成的轉錄因子主要包括ARF家族、HD-ZIPIII家族、KAN家族、MYB家族和NAC家族[19];影響木質形成酶主要包括苯丙氨酸裂解酶、4-香豆酸輔酶A連接酶、肉桂醇脫氫酶、過氧化物酶、漆酶和dirigent蛋白[20]。試驗結果發(fā)現,桉樹miRNA靶基因中與木質形成相關的基因主要為調節(jié)MYB轉錄因子、NAC轉錄因子和過氧化酶,相應參與調控木質形成的miRNA主要為mir828、mir902 和 mir477。Goicoechea等[21]發(fā)現桉樹MYB2可以結合肉桂酰CoA還原酶基因和肉桂醇脫氫酶基因的啟動子區(qū)從而調節(jié)其轉錄水平,并在MYB2轉基因植物中發(fā)現次生細胞壁增厚現象。因而在桉樹中miRNA是否為通過影響轉錄因子的表達水平而影響木質的形成,還是既調節(jié)轉錄因子又同時調節(jié)木質形成相關的酶,還需進一步研究。
[1]陳少雄,陳小菲.我國桉樹經營的技術問題與思考[J].桉樹科技,2013,30(3):52-59.
[2]時彧,羅杰.桉樹對礦山環(huán)境的改善[J].安徽農業(yè)科學,2014,42(2):483-486.
[3]LACOMBE E,HAWKINS S,VAN DOORSSELAERE J,et al.Cinnamoyl CoA reductase,the first committed enzymeof the lignin branch biosynthetic pathway:cloning,expression and phylogenetic relationships[J].Plant J,1997,11(3):429-441.
[4]PAUX E,TAMASLOUKHTM,LADOUCEN S,etal.Identification of genes preferentially expressed during wood formation in Eucalyptus[J].Plant Mol Biol,2004,55(2):263-280.
[5]RANIK M,MYBURG A A.Six new cellulose synthase genes from Eucalyptus are associated with primary and secondary cell wall biosynthesis[J].Tree Physiol,2006,26(5):545-556.
[6]RENGEL D,SAN CLEMENTE H,SERVANT F,et al.A new genomic resource dedicated to wood formation in Eucalyptus[J].BMC Plant Biol,2009,27;9:36.
[7]HENDRE P S,KAMALAKANNAN R,VARGHESE M.High-throughput and parallel SNP discovery in selected candidate genes in Eucalyptus camaldulensis using Illumina NGS platform[J].Plant Biotechnol J,2012,10(6):646-656.
[8]MIZRACHIE,HEFERCA,RANIKM,etal.De novo assembled expressed gene catalog of a fast-growing Eucalyptus tree produced by IlluminamRNA-Seq[J].BMCGenomics,2010,11:681.
[9]LEWISB P,BURGE C B,BARTEL D P.Conserved seed pairing,often flanked by adenosines,indicates that thousands of human genes are microRNA targets[J].Cell,2005,120(1):15-20.
[10]MILEV I,YAHUBYAN G,MINKOV I,et al.miRTour:PlantmiRNA and target prediction tool[J].Bioinformation,2011,6(6):248-249.
[11]WU H J,MA Y K,CHEN T,etal.PsRobot:aweb-based plant small RNA meta-analysis toolbox[J].Nucleic Acids Research,2012,40(W1):22-28.
[12]ZHANGBH,PANX P,WANGQ L,etal.Identification and characterization of new plantmicroRNAs using EST analysis[J].Cell Res,2005,15(5):336-360.
[13]ZHANG B,PAN X,CANNON C,et al.Conservation and divergence of plantmicroRNA genes[J].Plant J,2006,46(2):243-259.
[14]潘玉欣,劉恒蔚.花生miRNA與其靶基因的生物信息學預測[J].中國油料作物學報,2010,32(2):290-294.
[15]郭強,項安玲,楊清,等.利用 EST及生物信息學方法挖掘馬鈴薯中miRNA 及其靶基因[J].科學通報,2007,52(14):1656-1664.
[16]ZHANGB,PANX,STELLWAGE J.Identification of soybeanmicroRNAs and their targets[J].Planta,2008,229(1):161-182.
[17]NEUTELINGS G,FéNART S,LUCAU-DANILA A,et al.Identification and characterization ofmiRNAs and their potential targets in flax[J].J Plant Physiol,2012,169(17):1754-1766.
[18]THIEME C J,SCHUDOMA C,MAY P,etal.Give It AGO:The Search for miRNA-Argonaute Sorting Signals in Arabidopsis thaliana Indicates a Relevance of Sequence Positions Other than the 5'-Position Alone[J].Front Plant Sci,2012,3:272.
[19]DEMURA T,FUKUDA H.Transcriptional regulation in wood formation[J].Trends Plant Sci,2007,12(2):64-70.
[20]石海燕,張玉星.木質素生物合成途徑中關鍵酶基因的分子特征[J].中國農學通報,2011,27(5):288-291.
[21]GOICOECHEA M,LACOMBE E,LEGAY S,et al.EgMYB2,a new transcriptional activator from Eucalyptus xylem,regulates secondary cell wall formation and lignin biosynthesis[J].The Plant Journal,2005,43(4):553.