劉慧敏 ,烏云塔娜 ,杜紅巖
(1.中國林業(yè)科學(xué)研究院經(jīng)濟(jì)林研究開發(fā)中心,河南 鄭州 450003;2.國家林業(yè)局杜仲工程技術(shù)研究中心,河南 鄭州 450003)
杜仲是我國名貴的經(jīng)濟(jì)樹種,千百年來以作為中國傳統(tǒng)的中藥材而廣為人知[1]。近二十年來,隨著對杜仲研究的逐漸深入,科研工作者發(fā)現(xiàn)杜仲除了作為藥用植物外,還有其他重要的用途,其果皮、葉片和樹皮中都含有豐富的白色膠絲——杜仲膠[2]。杜仲膠(反式聚異戊二烯)是三葉橡膠(順勢聚異戊二烯)的同分異構(gòu)體,杜仲膠具有“橡塑”二重性[3],使其在海底電纜、高爾夫球、輪胎、醫(yī)療器械等多領(lǐng)域發(fā)揮獨(dú)特作用[4]。與三葉橡膠相比,杜仲有病蟲害少、適應(yīng)性廣等多種優(yōu)點,又是我國特有的樹種,已被提到國家戰(zhàn)略資源的高度[5],因此具有巨大的開發(fā)價值,是能夠替代三葉橡膠的最佳膠源樹種。
盡管杜仲具有很高的經(jīng)濟(jì)價值,其杜仲膠合成途徑尚不完全清楚,杜仲膠合成上游有兩條途徑MEP和MVA途徑,MEP和MVA途徑在植物中廣泛存在,它們的終產(chǎn)物IPP是所有萜類物質(zhì)合成的前體物質(zhì)。杜仲膠合成下游涉及的基因主要有橡膠延長因子(Rubber elongation factor)、小顆粒橡膠蛋白(Small rubber particle protein)等。橡膠延伸因子(Ref)基因是巴西橡膠樹產(chǎn)膠相關(guān)的重要功能基因,是一種與橡膠粒子緊密結(jié)合的蛋白,約為14 kDa,占膠乳總蛋白的10%~60%,是異戊二烯基轉(zhuǎn)移酶催化多聚異戊二烯單元添加到橡膠分子中不可缺少的成分。已有研究者克隆了三葉橡膠Ref基因的全長或cDNA片段[6-8],并對其在橡膠樹基因組中進(jìn)行了物理定位[9],然而該基因在杜仲研究較少,2012年Suzuki等人在構(gòu)建杜仲EST文庫時發(fā)現(xiàn)在杜仲中存在該基因[10]。
本研究用到的杜仲Ref基因序列來源于GenBank(accession number: KJ413007),經(jīng)過人工檢驗,該基因序列以ATG開頭,以TAA結(jié)尾,序列長度為678 bp,且序列中間無N或終止密碼子,可以進(jìn)行后續(xù)分析。
數(shù)據(jù)分析用到的四種模式生物大腸桿菌(Escherichia coli)、 酵 母(Saccharonmyces cerevisine)、擬南芥(Arabidopsis thaliana)和煙草(Nicotiana tabacum)的密碼子偏性數(shù)據(jù)下載于 Codon Usage Database(http://www.kazusa.or.jp/codon/)數(shù)據(jù)庫。
首先運(yùn)用CUSP和CodonW軟件對杜仲Ref基因進(jìn)行密碼子組成和使用偏好性分析,密碼子組成分析主要包括GC含量(鳥嘌呤和胞嘧啶含量);A3s、T3s、G3s、C3s(同義密碼子在第3位上腺嘌呤、胸腺嘧啶、鳥嘌呤和胞嘧啶的出現(xiàn)頻率);GC3s(同義密碼子第3位的G+C含量)。密碼子使用偏好性分析主要包括ENC(有效密碼子數(shù));RSCU(同義相對密碼子使用度);Frequency(密碼子使用頻率);Fraction(單個密碼子在其同義密碼子中出現(xiàn)的比例)。
有效密碼子數(shù)(effective number of codons,ENC or Nc)是檢測單個基因的密碼子偏好程度,取值范圍為20(每個氨基酸只使用一個密碼子)到61(各個密碼子被均衡使用)。其值越低,表明該基因的密碼子使用偏好性越強(qiáng)[11-12]。
同義密碼子相對使用度(relative synonymous codon usage, RSCU)是指對于某一特定的密碼子,在編碼對應(yīng)氨基酸的同義密碼子間的相對概率,去除了氨基酸組成對密碼子使用的影響。該值的計算方法為某一密碼子所使用的頻率與其在無偏使用時預(yù)期頻率之間的比值[13-14],如果密碼子使用無偏好性,則RSCU值為1;如果該密碼子比其他密碼子使用更頻繁,則其RSCU值大于1;反之亦然[15]。
運(yùn)用CodonW統(tǒng)計杜仲Ref基因的密碼子組成及有效密碼字?jǐn)?shù)(ENC),結(jié)果見表1。杜仲Ref基因的ENC值為56.18,表明杜仲Ref基因密碼子偏好性比較弱且基因表達(dá)水平偏低。Ref基因的GC含量為49%,密碼子第三位堿基的GC含量GC3s為59%,表明杜仲Ref基因編碼區(qū)序列中G+C含量(49%)與A+T(51%)含量相當(dāng),略微偏好于使用以G/C結(jié)尾的密碼子。Ref第三位上各個堿基(A、T、G、C)的含量分別為:23%、28%、31%和43%。
表1 杜仲Ref基因的密碼子組成及使用參數(shù)Table 1 Composition and parameters of EuRef gene
運(yùn)用CodonW和CUSPS分析杜仲Ref基因的密碼子使用偏好性,包括RSCU(同義密碼子相對使用度)和Fraction(單個密碼子在其同義密碼子中出現(xiàn)的比例,每個氨基酸的同義密碼子fraction的和等于1),結(jié)果見表2。結(jié)果表明:在杜仲Ref基因的密碼子中共有28個密碼子的RSCU值大于1,為杜仲Ref基因的偏好密碼子,其中17個密碼子以G/C結(jié)尾,9個密碼子以A/T結(jié)尾,與其密碼子第三位堿基組成中GC含量(59%)的結(jié)果相吻合;同義密碼子相對使用度RSCU值較大的密碼子其相應(yīng)的Fraction值也比較大;其中4個密碼子(GTA、ACT、CGG、AGT)的相對使用度為0,在杜仲Ref基因中未被使用。
杜仲Ref基因的密碼子與大腸桿菌、酵母、擬南芥和煙草基因組的密碼子偏好性比較
表3列出了杜仲Ref基因、大腸桿菌、酵母、擬南芥和煙草基因組的密碼子使用頻率(單個密碼子在編碼基因總密碼子出現(xiàn)的頻率,1/1 000),并計算杜仲Ref基因密碼子使用頻率與其它4個模式物種密碼子使用頻率的比值,不同物種或基因的密碼子使用頻率比值在0.5~2.0之間的,表明對該密碼子的使用偏好性較為接近;反之,,若比值≤0.5或≥2.0,表明對該密碼子的使用偏好差異較大。
杜仲Ref基因與大腸桿菌相比有23個密碼子使用差異較大,與擬南芥相比有22個密碼子的使用差異較大,與煙草相比有25個密碼子的使用差異較大,與酵母相比有24個密碼子的使用差異較大。
表2 杜仲Ref基因的密碼子偏好性Table 2 Codon bias of EuRef gene
本研究以杜仲Ref基因為研究對象,運(yùn)用CodonW等軟件分析了杜仲Ref基因的密碼子組成及偏好性,基因的GC含量為49%,密碼子第三位堿基的GC含量GC3s為59%,有效密碼子數(shù)為56.18,表明杜仲Ref基因的密碼子偏好性較弱且基因的表達(dá)水平較低。
同義密碼子相對使用度和Fraction分析表明,杜仲Ref偏好使用28個密碼子且這些密碼子大部分(17)個以G/C結(jié)尾。
通過將杜仲Ref基因的密碼子使用頻率與大腸桿菌、酵母、擬南芥和煙草比較發(fā)現(xiàn),杜仲Ref基因的密碼子使用偏好與四個物種的密碼子使用偏好差異均較大,與擬南芥密碼子的使用偏好相對較接近,考慮到擬南芥中有杜仲膠合成上游途徑MEP和MVA途徑,因此擬南芥更適宜作為Ref轉(zhuǎn)基因的受體,通過密碼子改造可以提高Ref基因在宿主中的表達(dá)。杜仲Ref基因與煙草密碼子的使用偏好差異最大,可能是因為Ref基因的長度較短,密碼子數(shù)量較少引起的。
表3 杜仲Ref基因的密碼子與大腸桿菌、酵母、擬南芥、煙草的密碼子偏好性比較Table 3 Comparison of codon bias among EuRef gene and E.coli, A.thaliana, N.tabacum and S.cerevisiae
此分析結(jié)果可應(yīng)用于杜仲Ref轉(zhuǎn)基因功能驗證中模式生物的選取,Ref基因密碼子的優(yōu)化改造,為該基因后續(xù)研究工作的開展提供理論基礎(chǔ)。
續(xù)表 3Continuation of table 3
參考文獻(xiàn):
[1]劉慧敏,烏云塔娜,王 淋,等.杜仲M(fèi)EP途徑系列基因表達(dá)差異的研究[J].中南林業(yè)科技大學(xué)學(xué)報,2014,34(2):26-33.
[2]烏云塔娜,劉慧敏,杜紅巖.杜仲M(fèi)EP途徑系列基因5’端非編碼區(qū)的順式作用元件預(yù)測[J].經(jīng)濟(jì)林研究, 2013,31(4):9-15.
[3]劉慧敏,烏云塔娜,杜紅巖.杜仲M(fèi)EP途徑系列基因的基因結(jié)構(gòu)預(yù)測[J].經(jīng)濟(jì)林研究,2013,31(4):39-44.
[4]張繼川,薛兆弘,嚴(yán)瑞芳,等.天然高分子材料——杜仲膠的研究進(jìn)展[J].高分子學(xué)報,2011,(10):1105-1117.
[5]黎云昆.一個樹種的國家戰(zhàn)略[J].中國林業(yè)產(chǎn)業(yè),2012, (Z2):102.
[6]彭世清,傅相輝,吳坤鑫,等.巴西橡膠樹死皮病相關(guān)基因HbMyb1的結(jié)構(gòu)分析及表達(dá)[J].植物生理與分子生物學(xué)學(xué)報,2003, 29(2):147-152.
[7]Attanyaka DPSTG, Kekwick RGO, Franklin FCH. Molecular cloning and nucleotide sequencing of the rubber elongation factor gene from Hevea Brasiliensis[J]. Plant Molecular Biology, 1991,16:1079-1081.
[8]Goyvaerts E, Dennis M, Light D, Chua HN. Cloning Sequencing of the cDNA Encoding the Rubber Elongation Factor of Hevea brasiliensis[J]. Plant Physiology, 1991, 97:317-321.
[9]邱海燕.巴西橡膠樹REF、RT和SRPP基因物理定位的研究[D].海口:海南大學(xué),2010.
[10]Nobuaki Suzuki, Hirotaka Uefuji, Takashi Nishikawa,et al.Construction and analysis of EST libraries of the transpolyisoprene producing plant,Eucommia ulmoidesOliver[J].Planta, 2012,(236):1405-1417.
[11]Wright F. The effective number of codons used in a gene[J].Gene, 1990,87:23-29.
[12]Gupta S K, Bhattacharyya T K, Ghosh T C. Synonymous codon usage in lactococcuslatis: mutational bias versus translational selection[J]. Biomol. Struct. Dyn.,2004,21:1-9.
[13]Sharp P M, Haney T M F, Mosurski K R. Codon usage in yeast:cluster analysisclearly differentiates highly and lowly expressed genes [J]. Nucl. Acids Res., 1986,14: 5125-5143.
[14]Sau K, Gupta S K, Sau S,et al.Analysis of factors shaping codon usage in the mitochondrion genome ofOraza sativa[J].Mitochondrion, 2004,4:313-320.
[15]Sau K, Gupta S K, Sau S,et al.Analysis of factors shaping codon usage in the mitochondrion genome ofOraza sativa[J].Mitochondrion, 2004,4:313-320.