吳彥慶,趙大球,王 靜,陶 俊
(揚(yáng)州大學(xué) 園藝與植物保護(hù)學(xué)院,江蘇 揚(yáng)州 225009)
?
芍藥查爾酮異構(gòu)酶基因(CHI)克隆、密碼子偏好性分析以及蛋白結(jié)構(gòu)功能預(yù)測
吳彥慶,趙大球,王靜,陶俊
(揚(yáng)州大學(xué) 園藝與植物保護(hù)學(xué)院,江蘇 揚(yáng)州225009)
摘要:為了豐富芍藥CHI基因研究的基礎(chǔ)數(shù)據(jù),首先利用RACE技術(shù)對芍藥CHI基因的CDS區(qū)進(jìn)行克隆,并通過EMBOSS軟件分析序列的密碼子偏好性,其次利用生物信息學(xué)軟件和在線數(shù)據(jù)庫對芍藥CHI進(jìn)行蛋白結(jié)構(gòu)與功能預(yù)測。結(jié)果表明,克隆獲得芍藥CHI 基因cDNA序列長度為898 bp(GenBank序列號:JN119872),芍藥CHI基因偏好使用以A/U結(jié)尾的密碼子,28種偏好密碼子(RSCU>1),其中偏好性較強(qiáng)的有UUG、UGU、CAU、AGA、AGG、CGG(RSCU≥2),在密碼子的使用頻率上,芍藥CHI基因與酵母、大腸桿菌等模式生物基因組的差異均大于擬南芥基因組。芍藥CHI為非跨膜親水的穩(wěn)定蛋白,無信號肽,屬于非分泌蛋白;主要分布在細(xì)胞質(zhì)(45.0%)和微體(42.5%)中;無糖基化位點(diǎn),14個磷酸化位點(diǎn),其中第20位氨基酸處存在一個典型的磷酸激酶PKC,含有1個異構(gòu)酶Chalcone保守結(jié)構(gòu)域;二級結(jié)構(gòu)包括α螺旋(39%)、延伸鏈(20%)、β-轉(zhuǎn)角結(jié)構(gòu)(13%)和無規(guī)則卷曲(27%);三級結(jié)構(gòu)呈β-三明治折疊形成的倒置花束。發(fā)現(xiàn)了一個異構(gòu)酶催化活性區(qū)域和一個重要的特異性蛋白質(zhì)激酶PKC位點(diǎn),為今后深入研究CHI基因功能提供有利的基礎(chǔ)資料,此外,擬南芥真核表達(dá)更適合作為芍藥CHI基因的外源表達(dá)系統(tǒng)。
關(guān)鍵詞:芍藥;CHI基因;密碼子偏好性;蛋白結(jié)構(gòu)與功能
花色的優(yōu)劣不僅影響到觀賞植物的觀賞價值,而且直接關(guān)系到其商業(yè)開發(fā)價值,具有新奇花色的觀賞植物擁有更為廣闊的市場前景。芍藥(PaeonialactifloraPall.)是中國傳統(tǒng)名花,盡管我國芍藥品種資源豐富,花色多樣如粉、紅、紫色系品種,而黃色品種僅有1個,因此,培育新奇花色如黃色的芍藥品種已是我國育種工作者當(dāng)前面臨的重要課題,常規(guī)的栽培方式已經(jīng)不能從根本上去解決黃色芍藥品種的匱乏問題,這也提示我們迫切需要從芍藥花色形成與調(diào)控的分子機(jī)制入手,最終利用分子設(shè)計(jì)改良芍藥花色,促進(jìn)芍藥產(chǎn)業(yè)的可持續(xù)發(fā)展。研究發(fā)現(xiàn),涉及黃色形成的色素主要為類胡蘿卜素(Carotenoids)和類黃酮(Flavonoids)兩大類,在類黃酮生物合成途徑中,黃色的形成均與查爾酮異構(gòu)酶CHI(Chalcone isomerase)基因有關(guān)[1]。CHI基因是催化黃色的查爾酮轉(zhuǎn)化為無色的柚皮素的關(guān)鍵酶,CHI基因表達(dá)量的多少會直接影響到上游黃色查爾酮、下游無色或淡黃色花黃素以及紅色花色苷的積累,CHI基因在黃色花的改良中起著十分重要的作用[2]。由于CHI基因在花色形成過程中的重要調(diào)控作用,引起了許多植物研究者的密切關(guān)注。Mehdy等[3]第一次從蠶豆中分離出CHI基因的cDNA序列,隨后在大豆[4](Glycinemax)、金魚草[5](Antirrhinummajus)、翠菊[6](Callistephuschinensis)等植物中分離出CHI基因。隨后觀賞植物和草本植物的CHI基因也開始引起研究者的高度關(guān)注,如喬中全等[7]成功克隆出金銀花葉片CHI基因cDNA全長序列725 bp;馬春雷等[8]采用ESTs測序技術(shù)和T4RNA連接酶介導(dǎo)的5′ RACE技術(shù)克隆了茶樹CHI基因全長1 163 bp。目前,國內(nèi)外關(guān)于芍藥CHI基因的研究還處于起步階段,對其序列信息、蛋白結(jié)構(gòu)功能以及表達(dá)模式尚未清楚。本研究首先利用RACE技術(shù),克隆芍藥CHI基因全長cDNA序列,并將芍藥CHI基因編碼序列翻譯成氨基酸序列,并利用在線預(yù)測以及生物信息軟件進(jìn)一步分析CHI蛋白理化性質(zhì)、二級結(jié)構(gòu)、保守功能域以及重要功能位點(diǎn),并構(gòu)建CHI蛋白三維結(jié)構(gòu)模型,為今后深入探究CHI基因功能以及將其作為芍藥花色育種的有效遺傳標(biāo)記提供理論參考。此外,基因密碼子偏好性分析可以有效地揭示基因分子進(jìn)化機(jī)制和外源表達(dá)模式[9-10],在此基礎(chǔ)上本研究利用EMBOSS軟件包[11]分析芍藥CHI基因編碼區(qū)密碼子使用偏好性,并分別與擬南芥、大腸桿菌和酵母等3種不同的模式生物基因組密碼子使用頻率進(jìn)行差異比較,尋找芍藥CHI基因適合的外源表達(dá)系統(tǒng),旨在為今后將CHI基因轉(zhuǎn)入模式生物中進(jìn)行功能驗(yàn)證提供一定的指導(dǎo)和依據(jù)。
1材料和方法
1.1試驗(yàn)材料
1.1.1樣本來源 本研究選用芍藥紅艷爭輝內(nèi)外花瓣為試驗(yàn)材料,進(jìn)行酮異構(gòu)酶基因CHI(Chalcone isomerase)的克隆;試驗(yàn)材料于2011年4-7月采自揚(yáng)州大學(xué)園藝與植物保護(hù)學(xué)院芍藥種質(zhì)資源圃,采取花瓣后立即置于液氮速凍并帶回實(shí)驗(yàn)室,于-70 ℃超低溫冰箱中保存?zhèn)溆谩?/p>
1.1.2主要試劑RACE試劑盒(3′-Full RACE Core Set Kit、5′-Full RACE Core Set Kit、SMARTerTMRACE cDNA Amplification Kit)、DL2000 Marker、TaqDNA聚合酶、dNTP、PCR Buffer、DNA凝膠回收試劑盒、DH5α大腸桿菌(Escherichiacoli)均購自TaKaRa公司,所有引物合成以及DNA序列測定均由上海生工生物工程技術(shù)服務(wù)有限公司完成。
1.2試驗(yàn)方法
1.2.1引物設(shè)計(jì)根據(jù)GenBank數(shù)據(jù)庫中已報(bào)道的不同植物CHI基因序列的保守區(qū)域,運(yùn)用Primer Premier 5.0軟件分別設(shè)計(jì)目的基因的5′端和3′端RACE擴(kuò)增引物(表1),引物送上海生工生物工程技術(shù)服務(wù)有限公司合成。
表1 芍藥CHI基因引物信息
1.2.2RACE擴(kuò)增及測序以芍藥花瓣中所提取的總RNA為模板(1.0 μg),根據(jù)3′-full RACE Core Set Kit和5′-full RACE Core Set Kit的說明書進(jìn)行cDNA的3′末端和5′末端擴(kuò)增;擴(kuò)增獲得的PCR產(chǎn)物利用1%瓊脂糖凝膠進(jìn)行檢測,DNA產(chǎn)物經(jīng)純化回收,進(jìn)一步克隆連接到pMD18-T載體上,轉(zhuǎn)化和挑取質(zhì)粒進(jìn)行測序驗(yàn)證。
1.2.3亞細(xì)胞定位以及蛋白結(jié)構(gòu)功能預(yù)測利用DNAMAN軟件將CHI基因的核苷酸序列翻譯成相應(yīng)的氨基酸序列,首先通過亞細(xì)胞定位工具TargetP[12]以及PSORTⅡPrediction(http://psort.hgc.jp/form.html)分別進(jìn)行CHI蛋白亞細(xì)胞定位分析[13-14]。其次,利用生物信息學(xué)軟件預(yù)測芍藥CHI蛋白基本理化性質(zhì)、二級結(jié)構(gòu)、三維空間結(jié)構(gòu)以及蛋白修飾位點(diǎn)(包括糖基化位點(diǎn)、磷酸化位點(diǎn))和保守功能域,包括利用ProtParam分析蛋白理化性質(zhì),SignalP 4.0軟件[15]分析信號肽,ProtScale分析蛋白疏水性區(qū)域;TMHMM 2.0分析蛋白跨膜區(qū)域,Antheprot 5.0(Universite Claude Bernard,Lyon)軟件分析蛋白二級結(jié)構(gòu)(包括α螺旋、β延伸鏈、無規(guī)則卷曲);利用SWISS-MODEL軟件[16]進(jìn)行三維同源建模分析;利用NetNGlyc分析糖基化位點(diǎn),NetPhos分析磷酸化位點(diǎn)以及NetPhosK 1.0分析特異性蛋白激酶位點(diǎn),最后利用SMART軟件[17]分析蛋白保守功能域。
1.2.4密碼子使用偏好性分析本研究利用EMBOSS軟件包[11]中CodonW、CHIPS以及CUSP軟件分別計(jì)算以下密碼子偏好性指標(biāo):①有效密碼子數(shù)(Effective number of codon,ENC)、整個CDS序列的整體GC含量、第3位堿基上GC含量(GC3s);②同義密碼子相對使用度RSCU(Relative synonymous codon usage),目前被認(rèn)為是衡量密碼子使用偏好性程度的有效指標(biāo)[18];③密碼子使用頻率(Frequency)。此外,擬南芥、大腸桿菌以及酵母基因組的密碼子偏好性數(shù)據(jù)來源于密碼子使用數(shù)據(jù)庫 Codon Usage Database (http://www.kazusa.or.jp/codon)。
2結(jié)果與分析
2.1芍藥CHI基因克隆與測序分析
以芍藥花瓣總RNA為模板,分別進(jìn)行CHI基因3′端和5′端RACE擴(kuò)增,3′端擴(kuò)增得到一條約為800 bp的條帶,5′端擴(kuò)增得到一條約為300 bp的條帶,其大小均與預(yù)期片段長度相一致(圖1)。經(jīng)測序與拼接結(jié)果顯示(圖2),芍藥CHI基因cDNA序列全長898 bp,5′-UTR非編碼區(qū)(194 bp)、具有一個完整開放閱讀框ORF(654 bp)、3′-UTR非編碼區(qū)(50 bp)和poly A(12 bp),該基因已提交GenBank數(shù)據(jù)庫,登錄號為JN119872。
圖1 芍藥CHI基因RACE擴(kuò)增
推導(dǎo)的氨基酸序列標(biāo)于相應(yīng)核苷酸序列下方,其余為非編碼區(qū);方框表示起始密碼子;*表示終止密碼子;下劃線表示多聚腺苷酸化信號。
2.2芍藥CHI基因密碼子偏好性分析
2.2.1芍藥CHI基因ENC、GC和GC3s計(jì)算CodonW在線程序計(jì)算芍藥CHI基因的ENC值、GC含量和GC3s值分別為59.51,0.476,0.488。一般來說,ENC值≤35表示該基因有顯著的密碼子偏好性[19],結(jié)果顯示ENC值偏大,表明芍藥CHI各密碼子在編碼氨基酸時出現(xiàn)的頻率比較一致,沒有明顯的密碼子偏好性;CHI編碼區(qū)GC和GC3s含量均略小于50%,表明芍藥CHI基因稍微偏好使用以A/U 結(jié)尾的密碼子,且在整個編碼區(qū)序列中AU含量大于GC。
2.2.2相對同義密碼子使用度RSCU(Relative synonymous codon usage)分析CHIPS在線程序計(jì)算芍藥CHI基因中每個密碼子的RSCU值,結(jié)果顯示(表2),在芍藥CHI的所有密碼子中(除起始密碼子AUG、終止密碼子UGA、UAG、UAA外),有28種密碼子的RSCU值>1.00,為CHI基因的偏好性密碼子,其中偏好性較強(qiáng)的有UUG、UGU、CAU、AGA、AGG、CGG(RSCU≥2.00);而編碼Ala的密碼子GCA、GCU,Asn的密碼子AAC、AAU,Trp的密碼子UGG,其RSCU值均等于1.00,結(jié)果表明Ala、Asn和Trp在芍藥CHI基因中沒有使用偏好性。
表2 CHIPS程序計(jì)算芍藥CHI基因的密碼子RSCU值
注:帶有下劃線的數(shù)值表示RSCU>1.00,表明該密碼子使用頻率較高。
Note:The number with underline means RSCU>1.00,which indicates a codon with higher frequency.
2.2.3與模式生物基因組密碼子使用頻率比較分析密碼子使用頻率(Frequency)在不同物種及生物體的基因密碼子使用存在著很大的差異,通??梢岳貌煌锓N之間密碼子使用頻率比值來分析密碼子使用偏好性的差異程度,若密碼子使用頻率≤0.5或者密碼子使用頻率>2.0時,表示2個物種之間存在較大的密碼子使用偏差;反之,密碼子使用頻率位于0.5~2.0表示密碼子使用偏好性程度比較接近。本研究通過比較芍藥CHI基因與擬南芥、酵母、大腸桿菌等模式生物基因組的密碼子使用頻率,發(fā)現(xiàn)芍藥CHI與擬南芥基因組存在19個差異較大的使用密碼子,而與酵母、大腸桿菌基因組分別存在23,26個差異較大的使用密碼子,由此可以看出擬南芥基因組與芍藥CHI基因的密碼子使用偏好性最接近,擬南芥真核表達(dá)可能更適合作為CHI基因的外源表達(dá)系統(tǒng)(表3)。
表3 芍藥CHI與模式生物密碼子使用偏好性比較
表3(續(xù))
注:下劃線表示2個物種密碼子比較具有明顯偏差(≤0.5,≥2)的分值。CHI/E、CHI/Y和CHI/A分別表示CHI基因與大腸桿菌基因組E、酵母基因組Y和擬南芥基因組A的密碼子使用頻率比值。
Note:The value marked with “underline” means significantly different codon usage bias between the two species.CHI/E,CHI/Y andCHI/A mean the codon usage frequency ratio ofCHIgene andEscherichiacoligenome E,Saccharomycesgenome Y,Arabidopsisgenome A,respectively.
2.3芍藥CHI基因的蛋白結(jié)構(gòu)和功能分析
2.3.1蛋白基本理化性質(zhì)運(yùn)用Protparatam在線生物軟件預(yù)測芍藥CHI基因編碼蛋白質(zhì)的理化性質(zhì),結(jié)果顯示,其分子式為C1063H1667N259O327S3,蛋白質(zhì)的分子量為23.403 6 kDa,等電點(diǎn)pI為4.93,蛋白的不穩(wěn)定指數(shù)39.78,小于40,是個穩(wěn)定的蛋白。在氨基酸的構(gòu)成中,相對含量較多的氨基酸是Glu(谷氨酸)、Ser(絲氨酸)、Gly(甘氨酸)、Lys(賴氨酸)和Thr(蘇氨酸),分別占9.7%,8.8%,8.8%,8.3%,8.3%。帶負(fù)電荷的殘基(Asp(天冬氨酸)+Glu)為28,帶正電荷的殘基(Arg(精氨酸)+Lys)為21。CHI蛋白脂溶指數(shù)為84.01,表明該蛋白是脂溶性蛋白[20],總親水性平均系數(shù)(Grand average of hydropathy,GRAVY)為-0.105,表明該蛋白為親水性蛋白。
2.3.2蛋白信號肽分析信號肽是位于分泌蛋白N端15~30個氨基酸之間的一段疏水性區(qū)域,主要負(fù)責(zé)把蛋白質(zhì)引導(dǎo)到細(xì)胞含不同膜結(jié)構(gòu)的亞細(xì)胞器內(nèi),利用SignalP 4.0軟件預(yù)測信號肽時,蛋白剪切位點(diǎn)預(yù)測通過Y最大值(Y-score maximum,Max.Y)來判斷,是否為分泌蛋白通過S平均值(Mean-score,Mean S)來判斷,結(jié)果發(fā)現(xiàn)(圖3)Y最大值為0.112,S平均值為0.098(均小于0.5),表明芍藥CHI無信號肽,為非分泌蛋白。
圖3 芍藥CHI蛋白信號肽預(yù)測
2.3.3蛋白跨膜結(jié)構(gòu)與親疏水性分析TMHMM 2.0分析表明芍藥CHI蛋白跨膜螺旋數(shù)為0,為非跨膜蛋白;Protscale分析蛋白親/疏水性表明,芍藥CHI蛋白最大親水性區(qū)域位于第72號氨基酸(Score:-2.100),最大疏水性區(qū)域位于51號氨基酸(Score:1.700),從整體來看親水性殘基數(shù)多于疏水性殘基(圖4),表明芍藥CHI編碼蛋白為可溶性蛋白。
圖4 芍藥CHI基因疏水性/親水性的預(yù)測
2.3.4蛋白二級結(jié)構(gòu)與三級結(jié)構(gòu)預(yù)測芍藥CHI蛋白二級結(jié)構(gòu)包括α螺旋(Alpha helix)占39%,延伸鏈(Extended strand)占20%,β-轉(zhuǎn)角結(jié)構(gòu)(β-turn)占13%,無規(guī)則卷曲(Random coil)占27%;SWISS-MODEL同源建模分析CHI蛋白的三維結(jié)構(gòu),發(fā)現(xiàn)呈β-三明治形狀,并且該蛋白模型由6~216個氨基酸殘基組成,與PDB蛋白質(zhì)數(shù)據(jù)庫(Protein Data Bank,http://www.rcsb.org/pdb/home/home.do)中模板4doi.1.A的相似性為68.25%(圖5-A),該模型通過低質(zhì)量評估(Local quality estimate)(圖5-B)和模型結(jié)構(gòu)優(yōu)化評估Normalized QMEAN(圖5-C),模型質(zhì)量評分的復(fù)合評分函數(shù)QMEAN的Z值為-0.06,表明芍藥CHI蛋白三維模型構(gòu)建比較成功。
2.3.5蛋白保守功能域分析利用SMART數(shù)據(jù)庫分析CHI蛋白的功能結(jié)構(gòu)域,結(jié)果發(fā)現(xiàn)(圖5-D),CHI蛋白包含1個保守結(jié)構(gòu)域:Chalcone domain,位于12~215號氨基酸,預(yù)測評估值(E-value)為2.4e-106;Chalcone domain作為酮異構(gòu)酶催化活性區(qū)域,酮異構(gòu)酶(Chalcone-flavanone isomerase,EC5.5.1.6)主要具有催化查爾酮異構(gòu)化為4,5,7-三羥基黃烷酮的功能,是類黃酮生物合成的一個關(guān)鍵酶。
圖5 芍藥CHI蛋白三維空間結(jié)構(gòu)和保守功能域預(yù)測
2.3.6亞細(xì)胞定位分析TargetP亞細(xì)胞定位分析顯示(表 4),該蛋白主要定位在細(xì)胞其他位置,而很少分布在線粒體和信號肽分泌途徑上,為非分泌蛋白;進(jìn)一步利用PSORTⅡPrediction分析發(fā)現(xiàn)主要在細(xì)胞質(zhì)(Cytoplasm)(45.0%)和微體(Microbody)(42.5%)中發(fā)揮生物學(xué)功能,此外在線粒體基質(zhì)間和溶酶體中也有少量分布。
表4 CHI蛋白的亞細(xì)胞定位分析
2.3.7蛋白修飾位點(diǎn)(糖基化位點(diǎn)和磷酸化位點(diǎn))分析蛋白功能位點(diǎn)分析表明,芍藥CHI蛋白不存在糖基化位點(diǎn)(圖6-A),存在14個潛在的磷酸化位點(diǎn),包括8個Ser(6/8/14/26/110/133/187/201)、4個Thr(20/73/78/158)和2個Tyr(15/127)(圖6-B),同時結(jié)合磷酸激酶預(yù)測結(jié)果顯示,在CHI蛋白上可能有CKⅠ、CKⅡ、DNAPK、PKC、PKG、PKA、p38MAPK、cdc2、cdk5這9種保守的特異性蛋白質(zhì)激酶的結(jié)合位點(diǎn)(表5),其中在第20位氨基酸處存在一個最高分值的蛋白激酶PKC(分值為0.87)。
橫線代表閾值;圖B中各條豎線分別代表潛在的酪氨酸、絲氨酸和蘇氨酸磷酸化位點(diǎn);
激酶Kinase全稱Fullname位點(diǎn)SitePKC蛋白激酶20、64、89、105、126、156CKⅠ細(xì)胞周期蛋白依賴性激酶抑制因子162、168、193CKⅡ酪蛋白激酶Ⅱ8、14、78、80、89、128、133DNAPK依賴DNA的蛋白激酶14、64、162PKA蛋白激酶A123、151、207PKG蛋白激酶G123、151、207cdc2細(xì)胞分裂周期激酶214p38MAPKp38分裂原激活的蛋白激酶158cdk5細(xì)胞周期素依賴蛋白激酶5158
3討論
CHI是第一個被認(rèn)識的類黃酮合成相關(guān)酶,是類黃酮類色素生物合成所需的關(guān)鍵酶之一,其表達(dá)量的多少會直接影響花色素的合成,因而CHI的轉(zhuǎn)基因研究正成為觀賞植物基因工程的研究熱點(diǎn)之一。研究表明,CHI基因不表達(dá)或者活性缺失會嚴(yán)重阻礙許多植物的黃酮生物合成途徑,導(dǎo)致花色素和類黃酮含量顯著降低[21-22],而CHI基因過表達(dá)則會使類黃酮含量提高[23]?;贑HI在黃酮類化合物生物合成中的重要性,近年來受到許多學(xué)者的關(guān)注,其應(yīng)用主要集中在改良觀賞植物花色、提高植物藥用成分等幾方面[24]。Muir等[23]將矮牽牛的CHI基因轉(zhuǎn)入到番茄,獲得了轉(zhuǎn)基因番茄,使得黃酮類化合物含量顯著升高;Nishihara等[25]利用RNAi對煙草CHI基因的表達(dá)水平進(jìn)行沉默后,發(fā)現(xiàn)煙草花瓣中查爾酮含量顯著增加,并且花瓣的顏色也發(fā)生改變;Bednar等[26]發(fā)現(xiàn)矮牽牛CHI基因突變會引起花粉中查爾酮的含量增加,從而導(dǎo)致花瓣的顏色呈現(xiàn)黃色或綠色。然而,目前國內(nèi)外鮮見有針對芍藥查爾酮異構(gòu)酶CHI基因的研究,本試驗(yàn)首次通過RACE克隆及測序技術(shù)獲得了芍藥CHI基因的CDS編碼序列,為今后開展芍藥CHI基因RNA干擾、過表達(dá)以及基因敲除等技術(shù)來深入研究其功能機(jī)制提供基礎(chǔ)素材。
密碼子偏好性的分析,不僅能夠幫助有效理解不同物種的進(jìn)化發(fā)展[27],還能夠有效的幫助同義密碼子使用偏好性相關(guān)機(jī)制的理解[28-29]。更重要的是,密碼子偏好性分析有助于了解某個基因轉(zhuǎn)錄和翻譯水平上的調(diào)控機(jī)制,并且對尋找該基因最佳外源表達(dá)系統(tǒng)或宿主從而提高基因的表達(dá)水平具有重要的理論意義[30]。因此,通過密碼子改造或者外源表達(dá)可以調(diào)節(jié)芍藥CHI基因的表達(dá)量,進(jìn)而改變類黃酮的含量和導(dǎo)致花色變異。本研究通過EMBOSS軟件包分析芍藥CHI基因的密碼子使用偏好性,發(fā)現(xiàn)該基因大多數(shù)密碼子偏好以A/U結(jié)尾且整個編碼區(qū)序列中AU含量大于GC,同時發(fā)現(xiàn)28個密碼子具有偏好性,其中使用頻率最高的是UUG(3.00)。在研究功能未知的新基因時,目前大腸桿菌原核表達(dá)系統(tǒng),以及擬南芥和酵母介導(dǎo)的真核表達(dá)系統(tǒng)已經(jīng)廣泛用于新基因功能研究,本研究通過分析芍藥CHI與3種不同模式生物基因組中不同密碼子用法差異,從而發(fā)現(xiàn)芍藥CHI基因與擬南芥基因組密碼子使用偏好性差異最小,由此表明擬南芥真核表達(dá)系統(tǒng)更適合作為CHI基因的外源表達(dá)系統(tǒng)。因此,本研究通過分析了CHI基因的密碼子使用偏好性不僅為尋找其最佳外源表達(dá)系統(tǒng),也為今后通過密碼子優(yōu)化提高芍藥CHI基因表達(dá)水平提供一定的理論參考。
糖基化和磷酸化是真核生物常見的組蛋白質(zhì)翻譯后修飾過程,糖基化主要是修飾天冬酰胺上的N端,其氨基酸的特征序列為Asn-X-Ser/Thr(X代表任何一種氨基酸)[31],蛋白質(zhì)糖基化主要發(fā)生在哺乳動物蛋白中,與許多疾病的早期診斷和發(fā)展密切相關(guān)。在真核生物中,磷酸化主要發(fā)生在絲氨酸(Ser)、蘇氨酸(Thr)和酪氨酸(Tyr)等殘基,其修飾過程與基因表達(dá)、信號傳導(dǎo)以及細(xì)胞分裂等調(diào)控密切相關(guān)[32]。本研究發(fā)現(xiàn)芍藥CHI蛋白無糖基化位點(diǎn),14個磷酸化位點(diǎn)(8個絲氨酸、4個蘇氨酸和2個酪氨酸),其中第20位蘇氨酸存在一個典型的特異性蛋白質(zhì)激酶PKC,如果該位點(diǎn)發(fā)生磷酸化后,很有可能會影響到查爾酮異構(gòu)酶的活性從而改變基因表達(dá)水平,這提示我們今后開展蛋白修飾組學(xué)研究時應(yīng)重點(diǎn)關(guān)注這一具有特異性蛋白激酶的磷酸化位點(diǎn)。
CHI基因位于細(xì)胞質(zhì)內(nèi),主要催化查爾酮分子的環(huán)化,將黃色的查爾酮轉(zhuǎn)化為無色的柚皮素,本研究通過亞細(xì)胞定位發(fā)現(xiàn)芍藥CHI基因主要分布在細(xì)胞質(zhì)(Cytoplasm)(45.0%)和微體(Microbody)(42.5%)上,微體內(nèi)含有黃素氧化酶和過氧化氫酶類,這進(jìn)一步表明CHI蛋白可能在細(xì)胞質(zhì)內(nèi)微體中發(fā)揮重要的生物學(xué)作用。疏水性/親水性及跨膜結(jié)構(gòu)域的預(yù)測結(jié)果可以推測芍藥的CHI蛋白為一種水溶性蛋白且不存在跨膜結(jié)構(gòu)域,這與一些植物的分析結(jié)果相一致,如巨峰葡萄[33]、中國水仙[34]、燈盞花[35]。芍藥CHI蛋白二級結(jié)構(gòu)主要以α螺旋(39%)、無規(guī)則卷曲(27%)和延伸鏈(20%)為主,同時三維結(jié)構(gòu)預(yù)測發(fā)現(xiàn)CHI蛋白的空間結(jié)構(gòu)整體上像是由開面的β-三明治折疊形成的倒置花束,而這種CHI 蛋白質(zhì)的三維結(jié)構(gòu)呈三明治狀,可以作為一種植物特有的基因及結(jié)構(gòu)標(biāo)記[36]。此外,蛋白保守域分析發(fā)現(xiàn)芍藥CHI第12~215號氨基酸之間存在一個異構(gòu)酶Chalcone活性區(qū)域,這對今后尋找功能區(qū)域內(nèi)的重要變異位點(diǎn)以及基因定點(diǎn)編輯技術(shù)提供參考和依據(jù)。本研究利用生物信息學(xué)系統(tǒng)地分析芍藥CHI蛋白二維和空間結(jié)構(gòu),并預(yù)測了蛋白的核心功能區(qū)域,對今后開展芍藥CHI基因功能機(jī)制的研究提供一定的理論參考。
參考文獻(xiàn):
[1]周琳,王雁,彭鎮(zhèn)華.黃色花形成機(jī)制及基因工程研究進(jìn)展[J].林業(yè)科學(xué),2009,45(2):111-119.
[2]Zhao Daqiu,Tao Jun,Han Chenxia,et al.Flower color diversity revealed by differential expression of flavonoid biosynthetic genes and flavonoid accumulation in herbaceous peony(PaeonialactifloraPall.)[J].Molecular Biology Reports,2012,39(12):11263-11275.
[3]Mehdy M C,Lamb C J.Chalcone isomerase cDNA cloning and mRNA induction by fungal elicitor,wounding and infection[J].The EMBO Journal,1987,6(6):1527-1533.
[4]陳宣欽,張樂,徐慧妮,等.大豆異黃酮生物合成關(guān)鍵酶及其代謝工程研究進(jìn)展[J].中國生物工程雜志,2012,32(7):133-138.
[5]Sparvoli F,Martin C,Scienza A,et al.Cloning and molecular analysis of structural genes involved in flavonoid,stilbene biosynthesis in grape.VitisviniferaL.[J].Plant Molecular Biology,1994,24(5):743-755.
[6]Li F,Jin Z,Qu W,et al.Cloning of a cDNA encoding the Saussurea medusa chalcone isomerase and its expression in transgenic tobacco[J].Plant Physiology and Biochemistry,2006,44(7/9):455-461.
[7]喬中全.金銀花chs、fls、chi基因全長克隆及序列分析[D].長沙:中南林業(yè)科技大學(xué),2012.
[8]馬春雷,趙麗萍,張亞麗,等.茶樹查爾酮異構(gòu)酶基因克隆及序列分析[J].茶葉科學(xué),2007,27(2):127-132.
[9]張濤,張跟喜,韓昆鵬,等.京海黃雞MyoG基因密碼子特性分析[J].華北農(nóng)學(xué)報(bào),2014,29(4):71-79.
[10]吳彥慶,葛金濤,陶俊.芍藥AP1(APETALA1)基因密碼子使用的偏好性分析[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2015,41(6):610-615.
[11]Rice P,Longden I,Bleasby A.EMBOSS:The european molecular biology open software suite[J].Trends in Genetics,2000,16(6):276-277.
[12]Emanuelsson O,Nielsen H,Brunak S,et al.Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J].Journal of Molecular Biology,2000,300(4):1005-1016.
[13]孫偉,李達(dá),蘇銳,等.綿羊YAP1基因全長cDNA克隆及生物信息學(xué)分析[J].中國農(nóng)業(yè)科學(xué),2013,46(8):1725-1735.
[14]孫雪婧,杜曉華,楊孝樸,等.牦牛CYGB基因CDS區(qū)克隆與生物信息學(xué)分析[J].中國農(nóng)業(yè)科學(xué),2014,47(13):2690-2698.
[15]Petersen T N,Brunak S,Von heijne G,et al.SignalP 4.0:discriminating signal peptides from transmembrane regions[J].Nature Methods,2011,8(10):785-786.
[16]Biasini M,Bienert S,Waterhouse A,et al.SWISS-MODEL:modelling protein tertiary and quaternary structure using evolutionary information[J].Nucleic Acids Research,2014,42(W1):W252-W258.
[17]Letunic I,Doerks T,Updates B S.New developments and status in 2015[J].Nucleic Acids Research,2015,43(1):257-260.
[18]Sharp P M,Li W H.An evolutionary perspective on synonymous codon usage in unicellular organisms[J].Journal of Molecular Evolution,1986,24(1/2):28-38.
[19]Comeron J M,Aguad M.An evaluation of measures of synonymous codon usage bias[J].Journal of Molecular Evolution,1998,47(3):268-274.
[20]Wilkins M R,Gasteiger E,Bairoch A,et al.Protein identification and analysis tools in the ExPASy server[J].Methods in Molecular Biology,1999,112:531-552.
[21]Kim S,Jones R,Yoo K S,et al.Gold color in onions(Alliumcepa):a natural mutation of the chalcone isomerase gene resulting in a premature stop codon[J].Molecular Genetics and Genomics,2004,272(4):411-419.
[22]Van tunen A J,Koes R E,spelt C E,et al.Cloning of the two chalcone flavanone isomerase genes from petunia hybrida:coordinate,light-regulated and differential expression of flavonoid genes[J].EMBO Journal,1988,7(5):1257-1263.
[23]Muir S R,Collins G J,Robinson S,et al.Overexpression of petunia chalcone isomerase in tomato results in fruit containing increased levels of flavonols[J].Nature Biotechnology,2001,19(5):470-474.
[24]吳冰,祝欽瀧,郭余龍,等.查爾酮異構(gòu)酶基因的分子特征及其在基因工程中的應(yīng)用[J].植物生理學(xué)通訊,2008,44(1):175-181.
[25]Nishihara M,Nakatsuka T,Yamamura S.Flavonoid components and flower color change in transgenic tobacco plants by suppression of chalcone isomerase gene[J].FEBS Letters,2005,579(27):6074-6078.
[26]Bednar R A,Hadcock J R.Purification and characterization of chalcone isomerase from soybeans[J].The Journal of Biological Chemistry,1988,263(20):9582-9588.
[27]Angellotti M C,Bhuiyan S B,Chen G,et al.CodonO:codon usage bias analysis within and across genomes[J].Nucleic Acids Research,2007,35(Web Server issue):W132-W136.
[28]Lü H,Zhao Wei ming,Zheng Yan,et al.Analysis of synonymous codon usage bias in Chlamydia[J].Acta Biochimica et Biophysica Sinica,2005,37(1):1-10.
[29]尚明照,劉方,華金平,等.陸地棉葉綠體基因組密碼子使用偏性的分析[J].中國農(nóng)業(yè)科學(xué),2011,44(2):245-253.
[30]郭秀麗,王玉,楊路成,等.茶樹CBF1基因密碼子使用特性分析[J].遺傳,2012,34(12):1614-1623.
[31]Mellquist J L,Kasturi L,Spitalnik S L,et al.The amino acid following an asn-X-Ser/Thr sequon is an important determinant of N-linked core glycosylation efficiency[J].Biochemistry,1998,37(19):6833-6837.
[32]Kim J H,Lee J,Oh B,et al.Prediction of phosphorylation sites using SVMs[J].Bioinformatics,2004,20(17):3179-3184.
[33]周軍,姚泉洪,彭日荷,等.巨峰葡萄查爾酮異構(gòu)酶基因克隆及表達(dá)分析[J].西北植物學(xué)報(bào),2009,29(9):1723-1729.
[34]蔡雪玲,陳曉靜,葉一江,等.中國水仙查爾酮異構(gòu)酶基因的克隆與表達(dá)分析[J].熱帶作物學(xué)報(bào),2011,32(12):2287-2292.
[35]劉春霞,王玥,崔明昆,等.燈盞花chi的克隆及其生物信息學(xué)分析[J].武漢植物學(xué)研究,2010,28(6):682-690.
[36]Gensheimer M,Mushegian A.Chalcone isomerase family and fold:no longer unique to plants[J].Protein Science:a Publication of the Protein Society,2004,13(2):540-544.
Cloning,Codon Usage Bias and Protein Structure and Function Prediction ofCHIGene inPaeonialactiflora
WU Yanqing,ZHAO Daqiu,WANG Jing,TAO Jun
(School of Horticulture and Plant Protection,Yangzhou University,Yangzhou225009,China)
Abstract:In order to enrich basic data in Paeonia lactiflora CHI gene,the CDS region of Paeonia lactiflora CHI gene was cloned by RACE technology,further codon usage was analyzed by EMBOSS software,then the structure and function of CHI protein was predicted by bioinformatics software and online databases.Results indicated that,the 898 bp full-length cDNA of CHI of Paeonia lactiflora(GenBank No.:JN119872)was obtained.Paeonia lactiflora CHI gene has certain preference of codon usage with the terminal base A or U.There were twenty-eight biased codons(RSCU>1),whose biased strongly codons were UUG,UGU,CAU,AGA,AGG and CGG(RSCU≥2).In codon usage frequency,the differences between CHI gene and Saccharomyces,E.coli genomes were more than Arabidopsis genome.CHI was non-transmembrane and hydrophilic protein with no signal peptide,which located mostly in cytoplasm(45.0%)and microbody(42.5%)by the result of subcellular level prediction and does not belong to the secretory protein.CHI protein had no glycosylation sites and fourteen phosphorylation sites,including a PKC kinase located in 20th amino acid.Additionally,it had one conservative domain named chalcone.The secondary structure of CHI protein contained 39% α-helices,20% extended strand,13% β-turn and 27% random coil.Tertiary structure presented an inversion bouquet by beta sandwich folding.In this study,we found one conservative domain responsible for catalytic activity of isomerase and an specific protein kinases PKC site,which will provide advantageous basic data for further studying CHI gene function.Moreover,the eukaryotic Saccharomyces expression systems may be more suitable for the expression of CHI gene.
Key words:Paeonia lactiflora;CHI gene;Codon usage bias;Protein structure and function
doi:10.7668/hbnxb.2016.02.013
中圖分類號:Q78;S682.03
文獻(xiàn)標(biāo)識碼:A
文章編號:1000-7091(2016)02-0071-10
通訊作者:陶俊(1966-),男,江蘇揚(yáng)州人,教授,博士,主要從事觀賞植物栽培生理、遺傳育種與分子生物學(xué)研究。
作者簡介:吳彥慶(1988-),男,江蘇揚(yáng)州人,在讀碩士,主要從事觀賞園藝研究。
基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(31372097);江蘇省農(nóng)業(yè)科技自主創(chuàng)新資金項(xiàng)目(CX(12)2019)
收稿日期:2016-01-18