張志國, 丁寒雪, 蔣成娣, 張世杰, 王藝程, 秦巧平, 劉 翔
(1.上海應(yīng)用技術(shù)大學(xué)生態(tài)技術(shù)與工程學(xué)院,上海 201400; 2.金華花卉苗木產(chǎn)業(yè)研究院,浙江金華 321000)
花發(fā)育的ABC模型是一種成花模型,描述了在花的不同部位,不同轉(zhuǎn)錄因子對花器官形成的作用。其中C類基因主要控制心皮、雄蕊的發(fā)育,AGAMOUS(AG)是擬南芥(Arabidopsisthaliana)中唯一的C類基因,也是第一個被分離的MADS-box基因[1]。迄今,人們已經(jīng)從不同植物中克隆并鑒定了很多AG同源基因,盡管這些基因在序列上存在些許差異,但功能是基本保守的[2]。AG基因的主要功能包括以下幾個方面:抑制A功能基因在第3輪、第4輪中的異常表達(dá);在前期調(diào)控雄蕊、心皮和胚珠的正常發(fā)育;在后期控制細(xì)胞分化,終止花分生組織的分化以保證花器官的特征和數(shù)量[3]。1990年Yanofsky等通過T-DNA插入突變技術(shù),獲得了AG基因突變的重瓣表型擬南芥(圖1),其6枚雄蕊被6枚花瓣取代,與4枚正常的花瓣形成了具有10枚花瓣的突變體,而心皮也被4枚萼片和10枚花瓣取代,具有花中花的整體表型[1];同年,Carpenter等通過轉(zhuǎn)座子誘變試驗,獲得了10種花器官同源異型突變的金魚草(Antirrhinummajus),其中pleniflora-624、pleniflora-625和pleniflora-626的表型非常相似,第1輪、第2輪花器官表型與野生型相同,第3輪花器官變?yōu)榛ò隊罱Y(jié)構(gòu),且與第2輪花瓣結(jié)合在一起,第4輪花器官由2個部分組成,在野生型金魚草心皮相對應(yīng)的位置產(chǎn)生加厚卷曲表面蠟質(zhì)的花瓣狀結(jié)構(gòu),且在第4輪內(nèi)有5個瓣狀結(jié)構(gòu)輪生[4]。1991年Coen等總結(jié)了花器官特異基因在植物4輪結(jié)構(gòu)中的表達(dá)情況,并提出花發(fā)育的ABC模型,為植物花發(fā)育生物學(xué)的研究帶來了里程碑式的突破[5]。之后,隨著D類基因[6]及E類基因[7]的發(fā)現(xiàn),花發(fā)育ABC模型不斷得到補充完善。
萱草(Hemerocallisfulva)是阿福花科(Asphodelaceae)萱草屬(Hemerocallis)多年生草本植物,花被片數(shù)量通常為6枚,排成2輪,外輪花被片即萼片,未開放時在花蕾外起到保護(hù)作用,顏色通常較淺,內(nèi)輪花被片較外輪花被片稍大,花色鮮艷,雄蕊通常與花被片同數(shù),子房上位常3室,即萱草共有4輪花器官,由外向內(nèi)數(shù),第1輪為花萼,第2輪為花瓣,第3輪為雄蕊,第4輪為心皮[8]。我國是萱草屬植物的自然分布中心,已有3 000多年的種植歷史,世界萱草育種歷經(jīng)1個世紀(jì)的發(fā)展,如今已經(jīng)取得了卓越成就,但是目前應(yīng)用于園林景觀的僅有少數(shù)幾個單瓣品種,因此萱草花型的補充改造是其育種的重要研究目標(biāo)之一。隨著花卉基因工程研究的深入開展,人們相繼從萱草中分離了生物鐘相關(guān)基因HcLHY[9]與成花相關(guān)基因HkTFL1、HkSVP、HkAP1[10]、糖轉(zhuǎn)運蛋白相關(guān)基因HfSWEET2a[11]、衰老相關(guān)HhNAC1基因[12]等,但是對于花發(fā)育中極其重要的AGAMOUS基因在萱草中的研究尚未見報道。萱草1輪3枚花被片共2輪的單瓣表型為人們所熟知,然而隨著育種工程的發(fā)展,也產(chǎn)生了一些重瓣表型,產(chǎn)生重瓣表型的原因是否與AGAMOUS突變有關(guān)仍不得而知。筆者所在課題組在轉(zhuǎn)錄組測序和基因組測序數(shù)據(jù)的基礎(chǔ)上,從單瓣萱草品種秋紅、重瓣材料AH6中對C類同源基因HfAG進(jìn)行克隆、多序列對比分析、理化性質(zhì)分析、系統(tǒng)進(jìn)化分析和生物信息學(xué)分析,為進(jìn)一步探究萱草花器官形成過程中上述基因發(fā)揮的功能提供理論基礎(chǔ),從而為萱草花型變異機制的研究和通過基因工程手段開展萱草重瓣育種研究奠定基礎(chǔ)。
供試材料采自上海應(yīng)用技術(shù)大學(xué)國家萱草種質(zhì)資源庫(地理位置:121°5′E、30°8′N),單瓣品種名稱為秋紅(圖2),重瓣材料田間編號為AH6(圖3),于2021年7—8月盛花期采集其未開放的花蕾(直徑在0.5~0.8 cm之間),分離得到花萼、花瓣、雄蕊和心皮以及四者的混合樣,共10份樣品,于液氮中速凍后于-80 ℃保存,用于后續(xù)RNA的提取。
1.2.1 總RNA的提取與cDNA第1條鏈的合成 分別以萱草秋紅、AH6的花蕾混合樣為材料,用RNApre Pure Plant Kit(Polysacchairdes & Polyphenolics)試劑盒提取總RNA,用NanoDrop One超微量紫外分光光度計檢測RNA的純度、濃度,用1.0%瓊脂糖凝膠電泳檢測RNA的完整性,再以總RNA為模板,用M-MLV轉(zhuǎn)錄酶[購自寶生物工程(大連)有限公司],以O(shè)ligo(dT)為引物,反轉(zhuǎn)錄合成cDNA第1鏈,將獲得的cDNA于-20 ℃保存。
1.2.2HfAG基因的克隆 參考筆者所在課題組前期建立的萱草秋紅全長轉(zhuǎn)錄組庫,篩選AG的同源基因序列,設(shè)計引物(表1)。以cDNA為模板,使用TaqDNA聚合酶[購自寶生物工程(大連)有限公司]進(jìn)行PCR擴增。20 μL PCR擴增體系:2 μL 10×TaqBuffer with KCl,1.6 μL MgCl2(25 mmol/L),0.2 μLTaqDNA聚合酶(5 U/μL),0.4 μL dNTP(10 mmol/L),1 μL Primer-F(10 μmol/L),1 μL Primer-R(10 μmol/L),1 μL模板DNA,12.8 μL ddH2O。PCR反應(yīng)程序:95 ℃ 5 min;95 ℃ 30 s,55 ℃ 30 s,72 ℃ 1 min,35個循環(huán);72 ℃ 10 min。
1.2.3 目的基因的回收連接轉(zhuǎn)化與測序 將PCR產(chǎn)物用1%瓊脂糖凝膠電泳檢測擴增效果,對檢測結(jié)果合格的PCR產(chǎn)物進(jìn)行電泳分離,隨后用DNA凝膠回收試劑盒(上海碧云天生物技術(shù)有限公司)進(jìn)行回收。將PCR純化產(chǎn)物連接到pMD19-T載體[寶生物工程(大連)有限公司]上,轉(zhuǎn)化大腸桿菌DH5α,挑取單菌落進(jìn)行菌液PCR檢測,隨后對陽性菌落進(jìn)行基因測序。
1.2.4 實時熒光定量PCR 以萱草材料秋紅、AH6同一花蕾的不同器官(萼片、花瓣、雄蕊、心皮)為材料提取的RNA為模板,用Vazyme公司的逆轉(zhuǎn)錄試劑盒(HiScript? Ⅲ RT Su perMix for qPCR)合成cDNA第1鏈。根據(jù)cDNA序列設(shè)計上、下游定量引物,HfAG基因和內(nèi)參基因的引物序列見表1,其中內(nèi)參基因是萱草最優(yōu)內(nèi)參基因HfGAPDH[13],每個樣品設(shè)置3個重復(fù),使用熒光定量試劑盒(ChamQ Universal SYBR qPCR Master Mix)進(jìn)行熒光定量PCR。設(shè)置3個生物學(xué)重復(fù)和3次技術(shù)重復(fù),用2-ΔΔCT法[14]對基因進(jìn)行相對定量分析。反應(yīng)體系:10 μL SYBR qPCR Master Mix、0.4 μL上游引物、0.4 μL下游引物、2 μL cDNA模板,用dd H2O補至 20 μL。擴增程序:95 ℃ 30 s,95 ℃ 10 s,56 ℃ 30 s,72 ℃ 30 s,40個循環(huán),熔解曲線為95 ℃ 15 s,56 ℃ 1 min,95 ℃ 15 s。
表1 ahHfAG蛋白PCR與定量PCR的引物序列
1.2.5 生物信息學(xué)分析 用DNAMAN軟件分析陽性菌落的測序結(jié)果,用Primer Premier 5.0軟件將核苷酸序列蛋白質(zhì)編碼區(qū)翻譯成氨基酸序列,對蛋白進(jìn)行理化性質(zhì)、保守結(jié)構(gòu)域、親水性疏水性、二級結(jié)構(gòu)、亞細(xì)胞定位等方面的預(yù)測和分析?;贛EGA version 7,采用鄰接法構(gòu)建蛋白的系統(tǒng)發(fā)育進(jìn)化樹,分析與其他物種的親緣關(guān)系。具體分析內(nèi)容和工具見表2。
本研究以HfAG1084cF/cR為引物,分別以萱草秋紅、AH6的花蕾混合樣為材料提取RNA,反轉(zhuǎn)錄得到cDNA為模板進(jìn)行PCR擴增。PCR產(chǎn)物經(jīng)凝膠電泳檢測,在700 bp附近出現(xiàn)1條特異條帶(圖4),與預(yù)測片段大小吻合,片段在回收后的測序結(jié)果表明,最終得到2個MADS-box基因的CDS序列。
表2 生物信息學(xué)分析網(wǎng)站及軟件
測序結(jié)果表明,ahHfAG的序列長度為624 bp。對序列進(jìn)行多序列對比和結(jié)構(gòu)域分析,結(jié)果(圖5)表明,ahHfAG具有典型的植物MADS-box基因結(jié)構(gòu),編碼肽鏈具有2個保守結(jié)構(gòu)域,即MADS區(qū)(2~73 aa)、K區(qū)(88~172 aa)。MADS區(qū)、K區(qū)屬于MIKCc型基因特征基序[15],MADS區(qū)、K區(qū)之間為長度為14個氨基酸的Ⅰ區(qū),在二聚體的選擇性形成過程中起著關(guān)鍵作用[16],而C端區(qū)域是位于K區(qū)下游保守性最低的轉(zhuǎn)錄激活區(qū)區(qū)間。雖然C末端的變化較大,但是MADS-box蛋白常含有一些保守基序,AGAMOUS基因有AG基序Ⅰ、Ⅱ這2個相對保守區(qū)[2,17],高志紅等認(rèn)為,這2個相對保守區(qū)是AG同源基因的特征之一[17-18]。
通過ProtParam軟件對萱草AG編碼氨基酸序列的理化性質(zhì)進(jìn)行預(yù)測,得到qhHfAG、ahHfAG編碼蛋白質(zhì)的分子式、理論分子質(zhì)量、等電點、總平均疏水性和不穩(wěn)定性指數(shù)等。ahHfAG編碼蛋白質(zhì)的總平均疏水性為-0.843,屬于親水蛋白,不穩(wěn)定性指數(shù)為45.84,為不穩(wěn)定蛋白;qhHfAG編碼蛋白質(zhì)的總平均疏水性為-0.855,也屬于親水蛋白,不穩(wěn)定性指數(shù)為46.25,為不穩(wěn)定蛋白(表3)。兩者的疏水性和不穩(wěn)定性略有差異。亞細(xì)胞定位預(yù)測結(jié)果顯示,萱草ahHfAG和qhHfAG編碼的蛋白定位于細(xì)胞核中,可知該蛋白合成后不需要分泌到細(xì)胞外,而是進(jìn)入細(xì)胞核中。
表3 qhHfAG和ahHfAG編碼蛋白質(zhì)的一級結(jié)構(gòu)分析
將AG同源蛋白ahHfAG的氨基酸序列與美國國家生物技術(shù)信息中心(NCBI)數(shù)據(jù)庫中已知的序列進(jìn)行比較分析。結(jié)果顯示,ahHfAG蛋白與玉簪(Hostaplantaginea)的HopAG(ACB70410.1)、蓮(Nelumbonucifera)的NenAGL(XP_010272685.1)、麝香百合(Liliumlongiflorum)的LMADS10(AIJ29174.1)、小蘭嶼蝴蝶蘭(Phalaenopsisequestris)的PeAGL(XP_020582512.1)等有較高的一致性,都在80%以上,其中與玉簪的HopAG(ACB70410.1)蛋白一致性最高,達(dá)88.78%,與擬南芥(Arabidopsisthaliana)的AG(AT4G18960)一致性為59.13%。
將重瓣萱草AG同源基因ahHfAG和單瓣萱草AG同源基因qhHfAG相比,發(fā)現(xiàn)有2個位點發(fā)生突變。一是第247位堿基,其突變導(dǎo)致位于保守性較低的Ⅰ區(qū)的第83位氨基酸產(chǎn)生變化,在單瓣品種秋紅中為絲氨酸(Ser),而在重瓣萱草AH6中為蘇氨酸(Thr)。另一個是第296位堿基,其突變導(dǎo)致位于半保守的K區(qū)的第99位氨基酸發(fā)生變化,在單瓣品種秋紅中為丙氨酸(Ala),而在重瓣萱草AH6中為纈氨酸(Val)。
圖6是ahHfAG與qhHfAG編碼的蛋白質(zhì)和一致性靠前的4個不同物種蛋白質(zhì)序列的BLAST比較分析結(jié)果??梢钥闯?,氨基酸序列5′端的保守性比較高,而3′端的保守性比較低。且ahHfAG與qhHfAG缺少C末端AG基序Ⅱ這個相對保守區(qū)。
在NCBI中用ahHfAG蛋白進(jìn)行BLASTp比對,選取不同物種中已經(jīng)確認(rèn)的C功能MADS-box蛋白的氨基酸序列(序列信息見表4)構(gòu)建系統(tǒng)進(jìn)化樹(圖7)??梢钥闯?,AmFAR、TAG1、HmAG、PgAG2、GhMADS10和AG歸為1支,屬于euAG同源蛋白;FBP6、LAG、SHP1、SHP2和PLE歸為1支,同屬于PLE同源蛋白;而ahHfAG基因的蛋白序列則與其他序列一同被歸于AG同源蛋白,即萱草的ahHfAG基因?qū)儆贏G譜系。此外,萱草與天門冬目的植物聚于1支,且與掃帚蘆筍(Asparagusvirgatus)的親緣關(guān)系最近,這也與同源性對比結(jié)果一致。
用SOPMA在線分析工具對ahHfAG和qhHfAG編碼蛋白序列的二級結(jié)構(gòu)進(jìn)行分析。由表5可以看出,HfAG蛋白以α-螺旋結(jié)構(gòu)為主,其次為無規(guī)則卷曲結(jié)構(gòu),延伸鏈占比較少,占比最少的是β-轉(zhuǎn)角,其中α-螺旋結(jié)構(gòu)主要集中在K區(qū)。
表4 部分被子植物C類MADS-box蛋白
相較于qhHfAG基因,ahHfAG基因編碼蛋白在M區(qū)的第10位由α-螺旋變?yōu)棣?轉(zhuǎn)角,在M區(qū)的第56位由延伸鏈變?yōu)棣?螺旋;ahHfAG基因編碼蛋白在K區(qū)的第140~141位由無規(guī)則卷曲、延伸鏈變?yōu)棣?螺旋;保守性最低轉(zhuǎn)錄激活區(qū)(C區(qū))的第174~178位由α-螺旋變?yōu)闊o規(guī)則卷曲結(jié)構(gòu),第184位由α-螺旋變?yōu)闊o規(guī)則卷曲,第194~197位由α-螺旋變?yōu)闊o規(guī)則卷曲,第201~203位由無規(guī)則卷曲變?yōu)棣?螺旋。
使用在線工具ProtScale對qhHfAG編碼的氨基酸進(jìn)行疏水性分析,結(jié)果表明,該肽鏈第45位點上的L疏水性最強,分值為2.089,而第71位點上的K親水性最強,分值為-2.556,預(yù)測qhHfAG編碼的氨基酸疏/親水性值總和為-170.621,因此認(rèn)為該蛋白是親水性蛋白。而ahHfAG編碼氨基酸的疏水性最高值、最低值都沒有變化,但從第80~88位、第96~104位開始疏水性明顯升高,總和變?yōu)?168.12(圖9)。
為了研究AG編碼蛋白的表達(dá)模式,以單瓣品種萱草秋紅、重瓣萱草AH6的同一花蕾不同花器官的cDNA為模板,以HfGAPDH為內(nèi)參基因,用qRT-PCR技術(shù)對ahHfAG編碼蛋白在萱草不同器官中的表達(dá)量進(jìn)行分析。由圖10 qRT-PCR結(jié)果表明,ahHfAG蛋白在萱草的雄蕊、心皮中均有較高的表達(dá)量,在花萼、花瓣中的表達(dá)量較低,推測該基因可能為特異性表達(dá)基因。其次,在單瓣品種秋紅中,qhHfAG蛋白在4輪花器官中均有表達(dá),且在第1輪花萼中表達(dá)明顯,但是在重瓣萱草AH6中,表達(dá)范圍顯著收縮,在1、2輪花器官中幾乎不表達(dá)。這種表達(dá)模式與ABC模型中C類基因的表達(dá)模式較為符合。上述結(jié)果表明,HfAG基因在萱草花器官發(fā)育過程中發(fā)揮著重要作用,且在不同植物中功能較為保守。
本研究以萱草單瓣品種秋紅、重瓣材料AH6為試驗材料,用RT-PCR技術(shù)克隆了C類基因AGAMOUS的全長序列,用生物信息學(xué)軟件分析其序列信息,通過實時熒光定量PCR技術(shù)分析表達(dá)模式。結(jié)果表明,AGAMOUS基因作為C類功能基因可調(diào)控雄蕊、心皮和胚珠的正常發(fā)育,在植物花器官中均有表達(dá),但在不同器官中的表達(dá)量存在差異。研究重瓣花的馴化過程可以發(fā)現(xiàn),C類基因的功能喪失和表達(dá)收縮都會引起生殖器官的缺失,促進(jìn)額外花瓣的形成,形成重瓣花。Dubois等通過研究1個由重瓣變?yōu)閱伟甑脑录?Rosahybrida)突變體發(fā)現(xiàn),重瓣月季的形成與C類基因RhAG表達(dá)范圍縮小有關(guān)[19]。在重瓣品種中,RhAG的表達(dá)僅限于花芽的中心部位;而在單瓣突變體中,RhAG的表達(dá)范圍更大。從qRT-PCR結(jié)果可以看出,在單瓣品種秋紅中,qhHfAG蛋白在4輪花器官中均有表達(dá),且在第1輪花萼中表達(dá)明顯,但是在重瓣材料AH6中,表達(dá)范圍顯著收縮,在1、2輪花器官中幾乎不表達(dá)。該研究結(jié)果與AGAMOUS基因在其他植物中的研究結(jié)果相似。
表5 萱草AG同源基因的二級結(jié)構(gòu)預(yù)測分析結(jié)果
AGAMOUS基因具有典型的植物MADS-box基因結(jié)構(gòu),即MADS區(qū)(M區(qū))、間隔區(qū)(I區(qū))、角蛋白類似區(qū)(K區(qū))和C末端區(qū)(C區(qū))[20]。MADS區(qū)(第1~72位)含有C-A/T rich-GC(CArG)基序,是AG與其他DNA結(jié)合所必需的結(jié)合基元[21],也是MADS-box基因中最保守的區(qū)域[22]。半保守的K區(qū)(第88~172位)是由疏水的氨基酸殘基規(guī)律性的間隔排列組成的coiled-coil結(jié)構(gòu),能夠折疊形成3個連續(xù)的兩性α-螺旋K1、K2、K3,參與有選擇性地介導(dǎo)蛋白與蛋白之間的相互作用[20]。在本研究獲得的萱草HfAG中,具有MADS區(qū)、K區(qū)這2個保守結(jié)構(gòu)域,可以推測HfAG基因也是通過與其他基因結(jié)合來共同調(diào)控花器官發(fā)育的。Galimba等下調(diào)唐松草(Thalictrumthalictroides)栽培品種雙白的AG同源基因ThtAG1的表達(dá),導(dǎo)致轉(zhuǎn)錄組無意義衰退和選擇性拼接,最終致使其蛋白的K區(qū)丟失,形成重瓣花[23]。在星花木蘭(Magnoliatomentosa)中,MastAG基因發(fā)生選擇性拼接,形成2種非正常的轉(zhuǎn)錄蛋白mastag-2蛋白(I區(qū)、K區(qū)缺失)和msatag-3蛋白(K區(qū)和C區(qū)缺失),導(dǎo)致星花木蘭的花瓣數(shù)增加[24]。但是本研究發(fā)現(xiàn),ahHfAG編碼蛋白具有較為完整的MADS-box基因結(jié)構(gòu),因此材料AH6重瓣的原因不是保守結(jié)構(gòu)域的丟失。C區(qū)是位于K區(qū)下游的轉(zhuǎn)錄激活區(qū)區(qū)間[2],AG基因編碼產(chǎn)物結(jié)合形成同源二聚體,或者與其他MADS家族基因編碼的蛋白質(zhì)結(jié)合形成異源二聚體,然后特異地結(jié)合到靶基因DNA調(diào)控區(qū),通過C末端與其他二聚體結(jié)合形成四聚體,再綁定到靶基因上游,調(diào)控下游靶基因的表達(dá),指導(dǎo)花器官的形成。Mizukami等通過異位表達(dá)試驗表明,C末端對AG轉(zhuǎn)錄因子功能的正常發(fā)揮具有重要影響[25]。C末端保守性最低,但是常含有AG基序Ⅰ、Ⅱ這2個相對保守區(qū)。Liu等從單瓣和日本晚櫻(Prunuslannesiana)的栽培變種Alborosea中各分離出來1個AG基因的異構(gòu)體[26],重瓣品種的Prseag-1與單瓣品種的PrseAG相比有1個 170 bp 的外顯子跳躍且表達(dá)范圍更廣泛。Prseag-1可能因為C末端的AG基序Ⅰ、Ⅱ丟失而喪失了C類基因的功能,從而使雄蕊轉(zhuǎn)變成花瓣,雌蕊轉(zhuǎn)變成葉狀結(jié)構(gòu)。不過在本研究得到的CDS序列中,ahHfAG、qhHfAG編碼肽鏈只含有AG基序Ⅰ而沒有AG基序Ⅱ。盡管AG基序的丟失可能會造成C類基因功能的喪失,從而形成重瓣花,但是對比單瓣、重瓣萱草序列可以發(fā)現(xiàn),二者均缺失基序Ⅱ,說明該基序Ⅱ的缺失并不是造成重瓣的根本原因。通過二級結(jié)構(gòu)預(yù)測的對比可以發(fā)現(xiàn),氨基酸的突變導(dǎo)致基序Ⅰ(第196位到第207位)二級結(jié)構(gòu)第 194~197位由α-螺旋變?yōu)闊o規(guī)則卷曲,第 201~203位由無規(guī)則卷曲變?yōu)棣谅菪;蛟S基序Ⅰ對于重瓣表達(dá)有更重要的作用,這可能是產(chǎn)生重瓣的原因之一。根據(jù)系統(tǒng)進(jìn)化樹可以看出,ahHfAG基因?qū)儆贏GL亞家族中C類基因的AG譜系,參與雄蕊、心皮的發(fā)育,與掃帚蘆筍的親緣關(guān)系最近,說明其遺傳背景較為相似。ahHfAG基因與qhHfAG基因序列有2個氨基酸的差異,該差異導(dǎo)致蛋白質(zhì)二級結(jié)構(gòu)、三級結(jié)構(gòu)及疏水性發(fā)生變化,這也許是導(dǎo)致花型變異的一個內(nèi)在因素。接下來可以將ahHfAG基因轉(zhuǎn)入擬南芥和煙草中,進(jìn)行進(jìn)一步的功能鑒定。
本試驗克隆的萱草HfAG基因為研究觀花植物的重瓣機制奠定了基礎(chǔ),同時也為進(jìn)一步通過基因工程開展萱草重瓣新品種育種提供了理論和試驗依據(jù)。