陳 衡,潘相文,王飛飛,劉長(zhǎng)鍇,王 雪,李彥生,張秋英
(1.中國(guó)科學(xué)院 東北地理與農(nóng)業(yè)生態(tài)研究所 大豆分子設(shè)計(jì)育種重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱150081;2.中國(guó)科學(xué)院 種子創(chuàng)新研究院,北京 100101;3.中國(guó)科學(xué)院大學(xué),北京 100049)
大豆(Glycinemax(L.)Merrill),古稱菽,是雙子葉植物綱、豆科、大豆屬的一年生草本。原產(chǎn)于我國(guó),已有5000年的栽培歷史,是我國(guó)和世界最重要的幾種栽培作物之一。
大豆不僅富含蛋白質(zhì)和脂肪酸,還含有異黃酮及維生素E等多種營(yíng)養(yǎng)成分。其中,大豆異黃酮(Soy isoflavone,SI)因具有降血壓、降低血液膽固醇、改善人腦的認(rèn)知能力和緩解更年期綜合癥等功能,而被稱為植物雌激素[1]。可以說(shuō),大豆異黃酮與蛋白質(zhì)、維生素E一樣,是人類最重要的營(yíng)養(yǎng)物質(zhì)。
20世紀(jì)40年代,許多澳洲西部的母羊在食用了富含異黃酮類物質(zhì)的三葉草后出現(xiàn)了一系列生殖問(wèn)題,這一現(xiàn)象引起了研究者Bennetts等[2]的興趣,他研究報(bào)道稱大豆異黃酮具有植物雌激素的作用,從而引起科學(xué)界的關(guān)注。之后,研究者們也發(fā)現(xiàn)大豆異黃酮對(duì)貓科動(dòng)物、嚙齒類動(dòng)物的生殖也有相似的影響,由此,“大豆異黃酮具有植物雌激素的作用”的觀點(diǎn)開(kāi)始被廣泛接受。到了21世紀(jì)初,Lamartiniere等[3]研究報(bào)道了“早期食用大豆異黃酮可有效降低成年動(dòng)物乳腺癌發(fā)病率”,這堪稱是該領(lǐng)域一個(gè)里程碑式的發(fā)現(xiàn)。
隨著研究的進(jìn)一步深入,大豆異黃酮的理化性質(zhì)被解析出來(lái)。研究表明,大豆異黃酮的密度為1.239 g·cm-3,沸點(diǎn)均在367 ℃(760 mmHg)左右。大豆包含4大類異黃酮,分別是苷元(Aglycones)、糖苷(Glycosides)、乙酰糖苷(Acetylglycosides)和丙二酰糖苷(Malonylglycosides)[2];共有12種,分別為:大豆黃素(Daidzein,DAI),染料木素(Genistein,GEN),黃豆黃素(Glycitein,GLY), 大豆黃素苷元(Daidzin,DAI-G),染料木苷(Genistin,GEN-G),黃豆黃素苷元(Glycitin,GLY-G),乙酰大豆黃素苷元(Acetyldaidzin,DAI-GA),乙酰染料木苷(Acetylgenistin,GEN-GA),乙酰黃豆黃素苷元(Acetylglycitin,GLY-GA),丙二酰大豆黃素苷元(Malonyldaidzin,DAI-GM),丙二酰染料木苷(Malonylgenistin,GEN-GM)以及丙二酰黃豆黃素苷元(Malonylglycitin,GLY-GM)[3-5]。
研究表明,丙二酰糖苷及其衍生物(DAI-GM、GEN-GM、GLY-GM)是大豆中異黃酮最主要的存在形式,占總異黃酮(Total isoflavone,TIF)的82.5%;糖苷類(DAI-G、GLY-G、GEN-G)、苷元類(DAI、GEN、GLY)和乙酰糖苷類(DAI-GA、GEN-GA、GLY-GA)的含量分別占TIF的16.48%,0.88%和0.81%[5-8]。
已有研究證實(shí),植物苯丙氨酸代謝途徑是大豆異黃酮合成的最主要途徑。植物中,一切含苯丙烷骨架的物質(zhì)都是由苯丙氨酸代謝途徑直接或間接合成的[9-10]。該代謝過(guò)程可產(chǎn)生黃酮類(Flavone)和木質(zhì)素(Lignin)等重要的次生代謝產(chǎn)物。在大豆中,大豆黃素、黃豆黃素和染料木素等3種苷元型大豆異黃酮由植物苯丙氨酸途徑直接合成的,其他類型的大豆異黃酮,則是由該代謝產(chǎn)物運(yùn)輸至高爾基體后,被葡糖基化或丙二酰葡糖基化而合成的[11]。
苯丙氨酸途徑的最初底物為苯丙氨酸(Phenylalanine,Phe),它在苯丙氨酸裂解酶(Phenylalanine ammonia-lyase,PAL)作用下生成肉桂酸(Cinnamate),再經(jīng)肉桂酸-4-羥化酶(Cinnamic acid 4-hydrocylase,C4H)、4-香豆酰CoA連接酶(4- Coumarate:CoA ligase,4CL)催化生成香豆酰CoA。此時(shí),部分香豆酰CoA經(jīng)查爾酮合酶(Chalcone synthase,CHS)和查爾酮還原酶(Chalcone reductase,CHR)催化后生成異甘草素(Isoliquiritigenin)。異甘草素在查爾酮異構(gòu)酶(Chalcone isomerase,CHI)催化下異構(gòu)化,生成甘草素(Liquiritigenin)后可生成大豆黃素;異甘草素亦可經(jīng)一系列反應(yīng)后可生成黃豆黃素。另一部分香豆酰CoA被查爾酮合酶催化后可生成柚皮素(Naringenin),再經(jīng)異黃酮合酶(Isoflavone synthase,IFS)可生成染料木素[9,12-14]。
本文評(píng)述了大豆異黃酮合成代謝過(guò)程中的相關(guān)酶,重點(diǎn)綜述了影響異黃酮含量的QTL位點(diǎn),異黃酮的生物合成途徑中的多種酶系基因,以及調(diào)控該途徑中相關(guān)酶系基因表達(dá)的轉(zhuǎn)錄因子和相關(guān)基因的研究進(jìn)展,以期為大豆異黃酮的合成分子機(jī)制研究,及高異黃酮大豆品系選育等提供理論參考。
一般認(rèn)為控制大豆異黃酮含量的基因位于數(shù)量性狀基因座(Quantitative rrait locus,QTL)。母體遺傳效應(yīng)(Maternal genetic effect)是限制大豆異黃酮含量的最主要遺傳因素。胚效應(yīng)(Embryogenetic effect)對(duì)大豆異黃酮含量的影響也十分顯著,而胞質(zhì)效應(yīng)(Cytoplasmic effect)對(duì)其影響不甚明顯。由于現(xiàn)存的大豆品種的生長(zhǎng)環(huán)境、遺傳信息均有較大差異,所以已知的大豆異黃酮及其組分含量QTL無(wú)法形成穩(wěn)定表現(xiàn)型。有關(guān)大豆異黃酮的QTL部分工作,具體整理在表1中[15-21]。
表1 大豆異黃酮的相關(guān)數(shù)量性狀基因座Table 1 The quantitative trait locus of SI
QTL定位時(shí),大多采用構(gòu)建重組自交系(Recombinant inbred lines,RIL)的方式,其構(gòu)建群體所需的時(shí)間比構(gòu)建近等基因系(Near-isogenic line,NIL)和染色體片段代換系(Chromosome segment substitution lines,CSSLs)而言更短,且定位的精確度較F2家系、回交群體和雙單倍體群體(Double haploid,DH)更準(zhǔn)確。而遺傳圖譜構(gòu)建時(shí),多采用測(cè)序后建立分子標(biāo)記的方式進(jìn)行構(gòu)建。早期測(cè)序成本相對(duì)較高,之后出現(xiàn)了SLAF-Seq技術(shù)使得圖譜構(gòu)建的門檻顯著降低。隨著高通量測(cè)序技術(shù)的發(fā)展,目前,重測(cè)序的成本已經(jīng)大幅降低,因此測(cè)序結(jié)果最完整、最精確的重測(cè)序成為了遺傳圖譜構(gòu)建時(shí)的第一選擇。早期的分子標(biāo)記技術(shù),主要是限制性內(nèi)切酶片段長(zhǎng)度多態(tài)標(biāo)記(Restriction fragment length polymorphism,RFLP)和簡(jiǎn)單重復(fù)序列標(biāo)記(Simple sequence repeat,SSR)等標(biāo)記;如今,單核苷酸多態(tài)性標(biāo)記(Single nucleotide polymorphism,SNP)憑借其密度高、分布廣泛及遺傳穩(wěn)定等諸多優(yōu)點(diǎn)而最受研究者的青睞。而隨著測(cè)序和分子標(biāo)記技術(shù)的快速發(fā)展,全基因組關(guān)聯(lián)分析(Genome-wide association studies,GWAS)在大豆研究中的應(yīng)用也逐漸增多,這種用于連鎖作圖、揭示表型性狀與基因型間內(nèi)在關(guān)系的高效方法,也開(kāi)始在QTL的定位中逐漸興起,并取代了連鎖分析(Linkage analysis)[22-23]。
大豆的異黃酮含量屬于典型的數(shù)量性狀,且存在至少10個(gè)主效QTL位點(diǎn)。而且,由于品種之間差異較大,定位的位點(diǎn)也存在較大差異。因此,研究不同品種影響大豆異黃酮含量的QTL定位工作仍具有較大意義。而且,不同品種之間共有的QTL以及特有的QTL也值得研究。此外,QTL定位區(qū)間的精細(xì)化,以及位點(diǎn)對(duì)應(yīng)基因的探究與驗(yàn)證等研究也是很重要的工作。相信,隨著生物信息學(xué)的發(fā)展,這些工作將會(huì)越來(lái)越完善。
異黃酮合成過(guò)程中,主要有苯丙氨酸途徑和類黃酮合成途徑兩個(gè)階段,并受到多個(gè)酶的催化,因此,該過(guò)程受到多個(gè)基因的調(diào)控。
2.1.1 苯丙氨酸代謝途徑的關(guān)鍵酶。PALs作為苯丙氨酸代謝中的重要酶系,普遍存在于各種植物和真菌中[24]。Koukol和Conn等[24]解析了苯丙氨酸生成肉桂酸和NH3的脫氨反應(yīng),并分離出一種脫氨酶,能夠催化L-苯丙氨酸發(fā)生脫氨反應(yīng)。Young等[25]認(rèn)為該酶受酪氨酸(Tyrosine,Tyr)的抑制?,F(xiàn)今,PAL酶己從許多植物組織中純化和分離,其分子量約為 240~330 kD,是由4個(gè)相同亞基構(gòu)成的四聚體[10]。
C4H酶是苯丙氨酸代謝途徑的關(guān)鍵酶之一,當(dāng)體系中存在NADPH時(shí),該酶可催化反式肉桂酸的氧化過(guò)程,并生成對(duì)-香豆酸。C4H隸屬于細(xì)胞色素P450-依賴型的單加氧酶(Cytochrome P450-dependent monooxygenase)CYP73家族[26],是植物中較早發(fā)現(xiàn)并被研究的一種典型P450單加氧酶[26-27]。P450s是一種膜結(jié)合蛋白,廣泛存在于真核生物和原核生物中。而植物中,P450s家族的成員參與了許多次生代謝中的氧化過(guò)程,間接影響了植物的抗逆及抗病等功能。除C4H外,IFS和異黃酮 2′-羥化酶(Isoflavone 2′-hydroxylase,I2′H)也屬于P450s家族,但C4H的存在較二者更加廣泛[28]??梢哉f(shuō),P450s是植物中非常重要的一類酶,而C4H則是重中之重。
4CL是木質(zhì)素生物合成的關(guān)鍵酶之一,它位于苯丙氨酸途徑與木質(zhì)素特異合成途徑的轉(zhuǎn)折點(diǎn)上,催化肉桂酸及其羥基或甲氧基衍生物生成相應(yīng)輔酶A酯的過(guò)程[29-30]。4CLs主要分成2類,I類包括:擬南芥At4CL1、At4CL2,雜種楊Ptd4CL1、Ptd4CL2和Pt4CL1,其主要伴隨木質(zhì)素以及其他苯丙烷類衍生物的生物合成;II類主要包括:擬南芥At4CL3及楊樹(shù)Pt4CL2,其主要伴隨著類黃酮的生物合成。大豆中,II類所占比例較高[30]。
2.1.2 類黃酮代謝途徑的關(guān)鍵酶。CHS是首個(gè)被發(fā)現(xiàn)的Ⅲ型聚酮合酶(Polyketide synthase,PKS),是類黃酮合成途徑的限速酶,催化3分子丙二酰-CoA和1分子對(duì)香豆酰-CoA結(jié)合形成查爾酮的過(guò)程[31]。查爾酮作為類黃酮、異黃酮及花青素等重要次生代謝物生物合成途徑的中間產(chǎn)物[32],影響著諸多下游代謝途徑的進(jìn)行,也對(duì)許多植物的抗逆及抗病等性狀有著重要影響。CHS蛋白是由兩個(gè)40~50 kDa亞基構(gòu)成的同源二聚體,單個(gè)亞基仍具有催化活性,二者之間起協(xié)同作用且高度保守。CHS蛋白具有典型的αβαβα的結(jié)構(gòu),這一結(jié)構(gòu)也是β-酮乙基合酶(β-Ketoacyl synthase)的典型特征[31-33]。
CHR是植物中參與黃酮和異黃酮代謝的重要酶,它與CHS共同作用。Welle等[34]從大豆栽培品種Harosoy63中首次分離出CHR,并證明其與查爾酮合成酶協(xié)同作用催化香豆-CoA生成異甘草素。CHR是一個(gè)由318個(gè)氨基酸組成的蛋白質(zhì),分子量在35 kDa左右;其二維結(jié)構(gòu)包含無(wú)規(guī)卷曲(45.28%),α-螺旋(45.28%)和延長(zhǎng)鏈(10.38%);三維結(jié)構(gòu)顯示,CHR包含一個(gè)AKR結(jié)構(gòu)域(Aldo-ket-red domain),因而具有醛酮還原酶活性[35]。
CHI是一種24~29 kDa的蛋白質(zhì),存在組織特異性。在大豆、葡萄及玉米等許多植物中都發(fā)現(xiàn)了該酶,但CHI保守性較低,氨基酸序列同源性僅為50%左右。CHI在植物中分為Ⅰ型和Ⅱ型,在豆科植物中,Ⅰ型和Ⅱ型CHI同時(shí)存在;而在其他植物中,幾乎只有Ⅰ型CHI;在真菌中,也存在CHI酶系,一般將其定義為第Ⅲ類。CHI酶活性的高低直接影響黃酮類化合物的含量,在番茄和牽?;ㄖ羞^(guò)表達(dá)CHI基因,黃酮類化合物產(chǎn)量比對(duì)照分別提高了48倍和79倍[36-37]。
IFS是合成大豆異黃酮最重要的酶。IFS在NADPH和O2的參與下,可催化底物的芳香基團(tuán)重排過(guò)程。雖然該過(guò)程目前還未被完全解析,但可以肯定的是IFS可以直接催化染料木素和大豆黃素的合成反應(yīng),且該酶的底物柚皮素和甘草素幾乎是所有大豆異黃酮的前體物質(zhì)。與C4H一樣,IFS也是P450s的一種,但屬于CYP93C家族[38-39]。雖然IFS的分布較C4H而言并不廣泛,但I(xiàn)FS因其直接催化異黃酮的生成,而在異黃酮的合成過(guò)程中具有無(wú)可比擬的重要性。
綜上所述,大豆異黃酮的合成包含苯丙氨酸途徑和類黃酮合成途徑兩個(gè)階段,受到多個(gè)酶的影響。在苯丙氨酸途徑中,PAL酶為限速酶,C4H酶和4CL酶是影響異黃酮前體物質(zhì)合成的關(guān)鍵酶;而在類黃酮途徑中,CHS酶、CHR酶、CHI酶與大豆異黃酮的合成密切相關(guān),IFS酶則直接參與異黃酮的合成。
有關(guān)上述酶系及代謝途徑的研究仍存在一些挑戰(zhàn)。例如,針對(duì)“PALs作為苯丙氨酸途徑限速酶”的觀點(diǎn),如今也有研究,通過(guò)光照和遮光處理大豆后,發(fā)現(xiàn)光照組的PAL基因的mRNA和酶活性均有增加,但在異黃酮等下游次級(jí)代謝產(chǎn)物的積累量中卻沒(méi)有體現(xiàn),這表明可能有其他的限速酶參與該過(guò)程[10]。同樣,一些發(fā)現(xiàn)也激發(fā)了人們的思考:既然IFS可以直接參與合成異黃酮過(guò)程,那么可否通過(guò)調(diào)控IFS基因的表達(dá)從而操縱整個(gè)異黃酮的合成代謝過(guò)程,進(jìn)而改善豆科作物的農(nóng)藝性狀與營(yíng)養(yǎng)價(jià)值?進(jìn)一步而言,能否通過(guò)調(diào)節(jié)IFS以及其他關(guān)聯(lián)基因的表達(dá)量,以改善豆科作物的抗逆境能力?同時(shí),IFS也可在其他植物中(如玉米、擬南芥等)表達(dá)并生成異黃酮,因此在非豆科植物中的異黃酮分子(模塊)設(shè)計(jì)育種也是一個(gè)非常有前景的領(lǐng)域。
酶系的合成受相關(guān)酶系基因的調(diào)控,植物中大豆異黃酮的合成受到多個(gè)基因影響的觀點(diǎn)已被人認(rèn)可??刂拼蠖巩慄S酮合成的基因中,最重要的是異黃酮合酶基因(IFS),它直接影響大豆黃素和染料木素的合成;其次,調(diào)控類黃酮途徑的CHS、CHR和CHI等3個(gè)基因,對(duì)異黃酮的合成也有很大影響;此外,PAL、C4H、4CL等3個(gè)調(diào)控植物苯丙氨酸代謝的基因,也會(huì)影響大豆異黃酮的合成。
2.2.1 直接影響大豆異黃酮合成的基因。IFS基因的產(chǎn)物,直接催化大豆黃素和染料木素的合成反應(yīng)。該基因主要存在于豆類中,基因拷貝數(shù)在1~3之間,編碼區(qū)含有1個(gè)內(nèi)含子(約135~218 bp長(zhǎng)),cDNA序列高度保守,在400~600 bp和80~120 bp區(qū)段完全相同,由cDNA推導(dǎo)的蛋白氨基酸序列同源性在92%~97%之間。Subramanian等[40]分析了大豆IFS的啟動(dòng)子結(jié)構(gòu),發(fā)現(xiàn)IFS啟動(dòng)子的TATA box和CAAT box在-125 bp和-264 bp處存在抑制子(Repressor),而在-537處和-887處存在增強(qiáng)子(Enhancer)。IFS啟動(dòng)子受UV、水楊酸、茉莉酸甲醋和固氮菌的誘導(dǎo)。大豆中的IFS基因有兩種,分別命名為IFS1和IFS2,二者高度同源,但表達(dá)上存在組織特異性。IFS1含有一個(gè)218 bp的內(nèi)含子,主要在大豆的根系中表達(dá);IFS2含有一個(gè)135 bp的內(nèi)含子,主要在豆莢和胚芽中表達(dá)[40-45]。目前,有關(guān)IFS的研究已經(jīng)比較深入,且存在許多直接證據(jù)表明,IFS與異黃酮的合成與含量密切相關(guān),例如,Jung等[14]在模式植物擬南芥(非豆科植物且不生成異黃酮)中表達(dá)IFS基因并發(fā)現(xiàn)染料木素的生成;Sohn等[46]對(duì)水稻進(jìn)行IFS基因的轉(zhuǎn)化實(shí)驗(yàn),結(jié)果表明水稻種子中染料木素含量最高可達(dá)103 μg·g-1。
2.2.2 類黃酮代謝途徑中的相關(guān)基因。Sommer等[47]于1988年獲得CHS基因的序列,目前已獲得超過(guò)2 700個(gè)編碼CHS的基因序列,廣泛存在于在擬南芥(同源基因?yàn)閠t4、lap5、lap6等)[48-49]、水稻(同源基因?yàn)長(zhǎng)OC4334901)[50]和大豆中。CHS基因一般由2個(gè)外顯子和一個(gè)內(nèi)含子構(gòu)成,內(nèi)含子插入在同一個(gè)半胱氨酸位點(diǎn)密碼子的前2位堿基之間。其同源基因的保守性較高,不同種類植物之間的氨基酸同源性一般在80%以上。Anguraj等[51]在全基因組范圍內(nèi)定位了21個(gè)CHS位點(diǎn),發(fā)現(xiàn)CHS基因共有14種,即CHS1~14,其中,CHS1主要在綠葉中表達(dá),CHS2主要在子葉中表達(dá),種皮中主要表達(dá)的是CHS7和CHS8。CHS基因表達(dá)具有組織特異性和時(shí)間特異性,且受溫度、光照及營(yíng)養(yǎng)元素等條件影響[47,51-56]。并且,也正是因?yàn)镃HS這種表達(dá)的差異,大多數(shù)植物具有多拷貝的CHS序列[31]。Dhaubhadel等[57]利用cDNA芯片,研究大豆胚胎發(fā)育過(guò)程中CHS7、CHS8、IFS及PAL等一些與異黃酮合成相關(guān)基因的表達(dá),在授粉后第70天呈現(xiàn)出較高的水平,這與異黃酮在胚胎中開(kāi)始積累的時(shí)間是一致的,說(shuō)明上述基因?qū)Υ蠖狗N子的異黃酮積累有著重大影響;且該研究還通過(guò)比較RCAT(高異黃酮品種)與Harovinton(低異黃酮品種)中CHS7、CHS8表達(dá)量的差異,發(fā)現(xiàn)RCAT與Harovinton的異黃酮含量差異很大可能是因?yàn)镃HS7、CHS8在種子發(fā)育后期表達(dá)量差異引起的[57],這再次佐證了這一觀點(diǎn)。
Li等[58]在大豆中首次分離出GmCHR基因。在豆科植物中,CHR基因也是以小基因家族及多拷貝形式存在。他們以大豆為材料,研究發(fā)現(xiàn),CHR基因在大豆的各個(gè)部位均有表達(dá),而且其基因的表達(dá)量在花中的含量最高。而紫花苜蓿被克隆出3個(gè)CHR家族的基因,在根部中表達(dá)較多。這說(shuō)明CHR基因的表達(dá)存在物種、器官和組織的差異性[58-60]。吳楠等[61]通過(guò)RNAi抑制濟(jì)農(nóng)28中的CHR1的表達(dá),發(fā)現(xiàn)大豆苷元等異黃酮前體物質(zhì)的下降了38.7%,這為CHR影響異黃酮的合成及含量提供了有力證據(jù)。
CHI基因的序列由Mehdy等[62]從法國(guó)豌豆中首次獲得,之后,陸續(xù)從菜豆及玉米等多種植物中分離出CHI的同源基因,現(xiàn)已發(fā)現(xiàn)超過(guò)1 300條CHI同源基因。如前文所述,CHI酶分為Ⅰ型、Ⅱ型以及Ⅲ型(存在于真菌中),同樣CHI基因家族成員也分為Ⅰ型、Ⅱ型以及Ⅲ型。CHI基因家族間的序列同源性較低,cDNA的同源性一般在42%~65%之間[62-65]。
2.2.3 苯丙氨酸途徑中的相關(guān)基因。PAL基因序列已經(jīng)在大豆、擬南芥和水稻等多種植物中被解析,它由一個(gè)小基因編碼。在菜豆中,PAL的基因有3個(gè),分別命名為PAL1、PAL2和PAL3。這些基因的表達(dá)存在組織特異性,在葉片中,僅PAL1表達(dá);在根系中PAL1、PAL2和PAL3均可大量表達(dá);在花瓣中PAL2可大量表達(dá),PAL1表達(dá)量很少,PAL3幾乎不表達(dá)。PAL受環(huán)境影響較大,是一種典型的誘導(dǎo)酶,受光質(zhì)(光的波長(zhǎng))、溫度(低溫)和機(jī)械損傷等誘導(dǎo),也有研究表明生長(zhǎng)素、乙烯、激動(dòng)素和赤霉素等植物激素也可誘導(dǎo)PALs基因表達(dá)[66-69]。
如前文所述,C4H酶是一種典型的P450單加氧酶,而P450蛋白家族是一種常見(jiàn)于動(dòng)物肝臟細(xì)胞膜上的血紅素蛋白。目前,約20種C4H基因已被解析。與PAL基因類似,它由一個(gè)小基因編碼,在不同植物中拷貝數(shù)也不盡相同。這些基因啟動(dòng)子大約1.1 kb左右,序列具有較高的同源性,但也有例外,例如,來(lái)自玉米和法國(guó)菜豆的兩個(gè)序列的同源性就相對(duì)較低。C4H的表達(dá)一般與該部位的木質(zhì)化程度相關(guān),如在歐芹中,C4H在維管束發(fā)達(dá)的花梗中表達(dá)豐富,在幼葉和老葉中不表達(dá)。在一項(xiàng)以擬南芥為對(duì)象的研究中發(fā)現(xiàn),當(dāng)細(xì)胞正在發(fā)生木質(zhì)化時(shí),C4H基因表達(dá)達(dá)到峰值。此外,C4H還受機(jī)械損傷及真菌感染等外界環(huán)境的影響,這點(diǎn)與PAL類似[70-72]。
植物中,4CL基因以小的基因家族及多拷貝的形式存在,具有細(xì)胞、組織和器官特異性。該基因的表達(dá)受到發(fā)育的調(diào)控和環(huán)境因子的影響,這些方面與PAL、C4H等酶系的基因別無(wú)二致。但由于4CL催化的反應(yīng)位于苯丙氨酸代謝途徑的分支處,所以它的表達(dá)與PAL、C4H又有不同。Hu等[73]在研究關(guān)于美洲山楊4CL酶時(shí)發(fā)現(xiàn),該植物中存在兩種4CL基因(Pt4CL1和Pt4CL2),它們分別參與不同的代謝過(guò)程,二者差異表達(dá)可以調(diào)控不同的苯丙烷類衍生物的生物合成。其中,Pt4CL1主要參與植物苯丙氨酸代謝途徑中木質(zhì)素生物合成這一分支,在正在發(fā)育的木質(zhì)部組織中表達(dá)量較高;而Pt4CL2主要參與該途徑中類黃酮的生物合成分支途徑(大豆異黃酮的合成便處于這一分支),因此在表皮細(xì)胞中含量較高[73-76]。
2.2.4 影響大豆異黃酮含量的其它酶系基因。除了直接催化大豆異黃酮及其前體物質(zhì)合成的酶系外,有些酶還可以通過(guò)抑制苯丙氨酸途徑的其他分支,使得代謝反應(yīng)更傾向于大豆異黃酮合成的方向行進(jìn)。例如,黃烷酮-3-羥化酶(Flavanone 3-hydroxylase,F(xiàn)3H)對(duì)大豆異黃酮合成的影響就有相關(guān)報(bào)道。F3H雖然不催化大豆異黃酮的合成途徑中的任何反應(yīng),但它的活性會(huì)影響苯丙氨酸途徑中,柚皮素生成二氫黃酮醇(Dihydroflavonol)的分支途徑,影響柚皮素的含量,進(jìn)而影響柚皮素生成GEN這一分支途徑,最終導(dǎo)致TIF變化。Yu等[77]報(bào)道了大豆中的玉米同源基因C1/R的表達(dá),再結(jié)合F3H阻斷花青素的分支途徑(The anthocyanin branch pathway),導(dǎo)致TIF水平增加。
此外,一些編碼蛋白激酶的基因?qū)Ξ慄S酮含量也有較大影響。Wu等[21]以200個(gè)大豆品種和150個(gè)重組自交系為基礎(chǔ),通過(guò)全基因組關(guān)聯(lián)分析和連鎖定位后發(fā)現(xiàn),qISO8-1號(hào)染色體上存在一個(gè)主基因座。qISO8-1在BC2F5群體中精細(xì)定位于99.5千堿基區(qū)域,兩側(cè)分別為SSR_08_1651和SSR_08_1656。qISO8-1的致病基因?yàn)榫幋a絲裂原活化蛋白激酶的GmMPK1,其中兩個(gè)天然GmMPK1多態(tài)性與異黃酮含量顯著相關(guān)[21]。不僅如此,這項(xiàng)研究還發(fā)現(xiàn),過(guò)表達(dá)GmMPK1后,大豆毛狀根中異黃酮濃度升高[21]。
綜上所述,大豆異黃酮的合成受多個(gè)基因的調(diào)控,其中,IFS是影響異黃酮合成最主要的基因;而CHS、CHR和CHI等3個(gè)基因的影響也十分巨大;PAL、C4H、4CL等基因通過(guò)調(diào)控植物苯丙氨酸代謝的基因來(lái)影響大豆異黃酮的合成。此外,還有一些基因,如F3H,通過(guò)抑制苯丙氨酸途徑的其他分支來(lái)間接影響異黃酮的合成。這些基因都已經(jīng)被克隆出來(lái),功能也被解析清楚。但該領(lǐng)域中,仍有幾點(diǎn)值得關(guān)注,如苯丙氨酸途徑中各調(diào)控基因在不同品種大豆中表達(dá)量的差異,因?yàn)樵摯x途徑及其的分支途徑對(duì)大豆的生長(zhǎng)發(fā)育過(guò)程有很大影響,并涉及到包括抗蟲(chóng)、抗病及抗倒伏等諸多農(nóng)藝性狀,也和異黃酮含量及花青素含量等性狀密切相關(guān)。因此,可以通過(guò)分析各基因在不同地方品種(系)中表達(dá)量的差異,結(jié)合該品種的特點(diǎn)、種植地的環(huán)境條件等因素進(jìn)行分析,進(jìn)而為地方品種的分子設(shè)計(jì)育種提供參考。此外,同源基因的深入挖掘是另一個(gè)重要的研究方向,這些基因在大多數(shù)植物中都存在對(duì)應(yīng)的同源基因,通過(guò)綜合比較基因間序列的差異性,可以為物種間的親緣關(guān)系比較提供一定的參考。PAL、C4H、4CL等編碼異黃酮合成途徑上游酶系的基因在大豆中研究相對(duì)較少,在模式植物擬南芥中研究相對(duì)較多,這些基因在非模式植物中特殊功能的研究日后應(yīng)有較大的發(fā)展。同樣,隨著測(cè)序技術(shù)和代謝組學(xué)的進(jìn)一步發(fā)展,非模式植物的特殊代謝通路也是一個(gè)很有發(fā)展前景的領(lǐng)域。
近期,一些轉(zhuǎn)錄因子對(duì)大豆異黃酮合成的影響也頗受研究者的關(guān)注。如前文所述的C1/R就是典型的編碼轉(zhuǎn)錄因子的基因。大豆種子中的這2個(gè)轉(zhuǎn)錄因子,可以激活植物苯基丙酸合成途徑相關(guān)的基因,從而引起染料木素的減少和大豆苷的增多,而TIF則少量增多[77]。一般認(rèn)為,參與植物苯丙氨酸代謝途徑調(diào)控的轉(zhuǎn)錄因子,主要有MYB類蛋白和bHLH類蛋白。
Klempnauer等[78]首次將來(lái)自髓細(xì)胞瘤病毒(Avian myeloblastosis virus)中一個(gè)癌基因(即V-MYB)和它在細(xì)胞中的同源基因(即C-MYB)成功克?。恢?,MYB的同源基因又相繼在脊椎動(dòng)物、果蠅(Drosophila melanogaster)和玉米中被發(fā)現(xiàn),如上文提及的C1基因就是MYB基因家族;Biedenkapp等[79]研究結(jié)果顯示,蛋白質(zhì)V-MYB的DNA結(jié)合結(jié)構(gòu)域(DNA-binding domain)有一段非常保守的氨基末端(N末端),這表明MYB/DNA互作是MYB蛋白的主要功能。此外,他們還發(fā)現(xiàn)了V-MYB可以特異性識(shí)別5′-AACGG-3′和5′-AACTG-3′序列(現(xiàn)一般認(rèn)為MYB蛋白結(jié)合5′-AACNG-3′序列),且這段序列在生物中十分保守;并且,與已發(fā)現(xiàn)的DNA結(jié)合蛋白HLH和Zinc-Finger不同,MYB蛋白的DNA結(jié)構(gòu)域位于N末端,這表明MYB又是一種新類型的DNA結(jié)合蛋白[80-83]。MYB蛋白包含1~4個(gè)R結(jié)構(gòu)域,而每個(gè)R結(jié)構(gòu)域包含1個(gè)HTH(Helix-turn-helix)結(jié)構(gòu)以及1個(gè)作為疏水核心(Hydrophobic core)的色氨酸殘基(Tryptophan residues),HTH結(jié)構(gòu)一般參與DNA合成過(guò)程,而疏水核心主要功能為保持HTH結(jié)構(gòu)的穩(wěn)定[84-85]。
根據(jù)R結(jié)構(gòu)域數(shù)目,MYB蛋白被分為4類,1R-MYB(含1個(gè)R結(jié)構(gòu)域)主要功能為穩(wěn)定染色體結(jié)構(gòu),是一類重要的端粒結(jié)合蛋白;含有3個(gè)和4個(gè)R結(jié)構(gòu)域的MYB蛋白分別被稱為R1R2R3-MYB和4R-MYB,前者在植物和真菌中發(fā)現(xiàn),而后者只在擬南芥、楊樹(shù)等少數(shù)植物中存在,且研究都不深入;含2個(gè)R結(jié)構(gòu)域的MYB蛋白稱為R2R3-MYB,是植物細(xì)胞中含量最豐富、應(yīng)用最廣泛的MYB蛋白,主要參與激素應(yīng)答、細(xì)胞分化、抗病抗蟲(chóng)和環(huán)境脅迫等過(guò)程,它們也是植物苯丙氨酸途徑中最重要的轉(zhuǎn)錄因子之一[85-88]。
MYB轉(zhuǎn)錄因子通過(guò)調(diào)節(jié)植物苯丙氨酸代謝途徑中的各個(gè)酶基因的轉(zhuǎn)錄水平,來(lái)影響代謝過(guò)程行進(jìn)的方向和各次級(jí)代謝產(chǎn)物的含量。例如,大豆中的GmMYB12B12(MYB同源基因)就是典型的CHI、CHS、IFS正調(diào)控基因,玉米中的C1基因就是F3H的負(fù)調(diào)控基因。由此確保植物在不同時(shí)期、不同環(huán)境、不同生理狀態(tài)下穩(wěn)定生長(zhǎng)和發(fā)育。Pei等[19]利用大豆種質(zhì)LHD2和NHZ構(gòu)建的群體,定位與大豆異黃酮含量相關(guān)的24個(gè)QTL中,有13個(gè)編碼MYB轉(zhuǎn)錄因子的基因座,這表明許多MYB轉(zhuǎn)錄因子對(duì)異黃酮含量有著重要的影響。因此,我們也可以在基因水平增加或者減少一些轉(zhuǎn)錄因子的拷貝數(shù),從而達(dá)到增加目的產(chǎn)物的效果。
在大豆中,MYB的同源基因被命名GmMYBs,如GmMYB12d、GmMYB12a和GmMYB12B2等。Du等[87]定位了大約700個(gè)MYB相關(guān)的DNA序列,經(jīng)過(guò)篩選、比對(duì)和分析后,得到了2個(gè)4R-MYB蛋白、6個(gè)R1R2R3-MYB蛋白和244個(gè)R2R3-MYB蛋白的基因序列。此外,還有26個(gè)與R2R3-MYB相關(guān)的基因序列,但是它們所編碼的蛋白質(zhì)在N末端都不完整;同時(shí),基因Glyma09g37340雖然擁有MYB基序和完整的開(kāi)放閱讀框(Open reading frame,ORF),但是置信區(qū)間較低,因此被排除在MYB基因家族之外。這244種R2R3-MYB的5′-非翻譯區(qū)(5′-Untranslated Regions,5′-UTR)非常短,與3′-UTR一樣保守性較低,而它們的DNA 結(jié)合結(jié)構(gòu)域的保守性卻非常高[87]。
除此之外,Du等[87]還發(fā)現(xiàn)大豆中有10種R2R3-MYB的mRNA前體(Precursor mRNA,pre-mRNA)存在自我剪接(Alternative splicing,AS)現(xiàn)象,這會(huì)造成一段pre-mRNA發(fā)生序列的插入和刪除,從而生成多種不同的mRNA,進(jìn)而得到多種不同的GmMYBs蛋白,造成GmMYBs的類型發(fā)生改變,如GmMYB082的一個(gè)189 bp的可變啟動(dòng)子位點(diǎn)(Alternative promoter site)變異導(dǎo)致了移碼(Frame shift),將一個(gè)典型的R2R3-MYB轉(zhuǎn)變?yōu)樾盘?hào)重復(fù)型MYB(Signal-repeat MYB)。
許多MYB基因的功能也被鑒定出來(lái),如C1亞家族(如GmMYB096、GmMYB080等7個(gè))包含了構(gòu)成GmMYBs蛋白C末端(C-terminal)的2個(gè)基序[88-89];AtMYB12(擬南芥中的MYB基因)會(huì)激活植物苯丙氨酸途徑中CHS和F3H的表達(dá),并對(duì)CHI的表達(dá)有一定促進(jìn)作用[88];前文所述的玉米中C1基因,及其同源基因PcMYB1(歐芹中的MYB基因)和AtMYB111可以激活CHS的表達(dá)[88,90-91]。MYB家族中除了有轉(zhuǎn)錄的激活蛋白(Activator),同樣也存在阻遏蛋白(Repressor)。AtMYB4通過(guò)抑制C4H的表達(dá),來(lái)提高芥子酸酯(一類具有紫外吸收作用的羥基肉桂酸衍生物)的積累量[91];FaMYB1(草莓中的MYB基因)可以抑制煙草中花青素和黃酮的生成[92]。Yi等[93]和Li等[94]報(bào)道了GmMYB12B12通過(guò)調(diào)控大豆中CHS8基因的表達(dá)來(lái)影響大豆異黃酮的生成;Yi等[95]通過(guò)RNAi(RNA interference)抑制GmMYB176(一種R1-MYB基因)表達(dá),影響了大豆根系細(xì)胞中的CHS的表達(dá),從而使得大豆異黃酮含量增加,證明了GmMYB176可調(diào)控CHS的表達(dá)。
Murre等[96]以小鼠為材料,報(bào)道了2段cDNA序列(E12和E47),它們及其同源序列可以合成1種具有兩親活性(Amphipathic activity)的蛋白質(zhì),該蛋白質(zhì)由2個(gè)螺旋結(jié)構(gòu)(Helix)通過(guò)1個(gè)環(huán)狀結(jié)構(gòu)(Loop)相連組成(即螺旋-環(huán)-螺旋,Helix-loop-helix,HLH),此蛋白具有二聚化(Dimerization)和DNA結(jié)合兩種功能。之后,越來(lái)越多的bHLH蛋白及相關(guān)基因在線蟲(chóng)、果蠅、小鼠和人類中被分離出來(lái)。大多bHLH蛋白與序列5′-CANNTG-3′(E-box)相結(jié)合,有少部分這類轉(zhuǎn)錄因子在bHLH基序后還有一個(gè)亮氨酸拉鏈(Leucine zipper,LZ)。Atchley等[97]通過(guò)對(duì)242條bHLH蛋白序列的系統(tǒng)發(fā)生分析,提出了bHLH蛋白的自然分類法(Natural classification),并將bHLH按照結(jié)合位點(diǎn)、是否含有亮氨酸拉鏈以及其他基序氨基酸構(gòu)成的不同分成了5個(gè)家族,這表明bHLH蛋白家族可能起源不是單一的[98],又對(duì)bHLH蛋白進(jìn)一步解構(gòu),發(fā)現(xiàn)bHLH包含了19個(gè)保守的氨基酸殘基:5個(gè)氨基酸殘基存在于堿性序列中,5個(gè)氨基酸殘基存在于第一個(gè)α-Helix中,1個(gè)氨基酸殘基存在于Loop中,8個(gè)氨基酸殘基存在于第一個(gè)α-Helix中。
bHLH蛋白具有一段非常保守的結(jié)構(gòu)域,可以同時(shí)結(jié)合DNA,并參與蛋白質(zhì)互作。這些功能主要通過(guò)幾個(gè)基序?qū)崿F(xiàn),其中一個(gè)是主要由堿性氨基酸殘基構(gòu)成的基序,這保證了bHLH蛋白可以特異結(jié)合E-BOX;另一個(gè)基序是主要由疏水殘基構(gòu)成,這保證了bHLH蛋白可以與蛋白質(zhì)互作并構(gòu)成二聚體[97,99]。
已發(fā)現(xiàn)的bHLH轉(zhuǎn)錄因子主要有兩種功能:DNA結(jié)合和二聚化[96]。其DNA結(jié)合功能取決于bHLH的堿性氨基酸序列,因此在氨基酸序列的前17位中是否富含堿性氨基酸殘基決定了這個(gè)蛋白是DNA結(jié)合的bHLHs(DNA binding bHLHs),還是非DNA結(jié)合的bHLHs(non-DNA binding bHLHs)。在擬南芥中,DNA結(jié)合的bHLHs的氨基酸序列前17位,平均含有6個(gè)堿性氨基酸殘基,而非DNA結(jié)合的bHLHs則平均含有3.8個(gè)。DNA結(jié)合的bHLHs又可根據(jù)其結(jié)合位點(diǎn)的不同,分為E-Box結(jié)合型(E-box binder)和非E-Box結(jié)合型(non E-box binder)。根據(jù)所識(shí)別的E-Box類型,E-Box結(jié)合型又分為G-Box結(jié)合型(G-box binder)和非G-box結(jié)合型(non G-box binder)[100]。
植物中,bHLH轉(zhuǎn)錄因子及其同源基因也已被發(fā)現(xiàn)。Li等[101]以模式植物擬南芥和水稻為材料,進(jìn)行全基因組分析,鑒定出167個(gè)bHLH轉(zhuǎn)錄因子相關(guān)基因,其中,84.7%含有內(nèi)含子,數(shù)目在0~4個(gè)范圍內(nèi)。前文提及的玉米中R基因,便是一種研究相對(duì)較多的bHLH轉(zhuǎn)錄因子編碼基因[77],它可以與順式調(diào)控元件(Cis-regulatory elements)結(jié)合,并通過(guò)招募其他的因子,調(diào)控一些參與花青素途徑的基因。bHLH蛋白質(zhì)被認(rèn)為無(wú)法單獨(dú)結(jié)合DNA,但越來(lái)越多的證據(jù)表明bHLH蛋白單獨(dú)存在時(shí),也具有結(jié)合DNA的活性。不過(guò),主流觀點(diǎn)依舊認(rèn)為bHLH轉(zhuǎn)錄因子直接結(jié)合DNA的活性是可有可無(wú)的,因?yàn)榻^大多數(shù)的情況下,bHLH會(huì)與MYB結(jié)合后共同調(diào)控DNA的轉(zhuǎn)錄過(guò)程;而且,有研究表明MYB互作區(qū)域的突變導(dǎo)致MYB激活bHLH的表達(dá),這說(shuō)明MYB轉(zhuǎn)錄因子可能可以調(diào)控bHLH基因的轉(zhuǎn)錄[102-103]。
上述的R2R3-MYB可以直接與DNA連接,有些也需要在bHLH蛋白的參與下與DNA相連。已有實(shí)驗(yàn)證明部分bHLH和MYB蛋白會(huì)相互作用[88-91]。通常情況下,二者互作的結(jié)構(gòu)域分別是R2R3-MYB的R3結(jié)構(gòu)域和bHLH的N-末端[104-109]。植物中,兩種轉(zhuǎn)錄因子互作的情況也是十分常見(jiàn)的,且在苯丙氨酸代謝途徑中存在MYB與bHLH兩種蛋白結(jié)合后共同調(diào)控的情況,如前文所述玉米中C1基因的產(chǎn)物(R2R3-MYB),便會(huì)與R基因產(chǎn)物(bHLH)互作,且只有在R的參與下C1才能發(fā)揮轉(zhuǎn)錄因子的作用,即R-依賴型。Hernandez等[110]以玉米為材料,通過(guò)C1、R、P1(一種R2R3-MYB轉(zhuǎn)錄因子,并可以在無(wú)R蛋白的參與下調(diào)控部分C1調(diào)控的基因(C1-regulated gene)、P1*(將P1中6個(gè)氨基酸替換成C1中對(duì)應(yīng)位置中的6個(gè),其在調(diào)控C1-調(diào)控基因時(shí),表現(xiàn)為R-依賴型;調(diào)控P1-調(diào)控基因時(shí),表現(xiàn)為R-增強(qiáng)型)等4個(gè)基因,研究了C1基因與R基因的互作關(guān)系,發(fā)現(xiàn)R基因其中一個(gè)功能是減輕植物中的一種抑制子對(duì)C1基因的抑制作用,從而促進(jìn)C1的表達(dá)。又比如矮牽牛花中PhAN2(MYB同源基因)與PhJAF13(bHLH同源基因)的結(jié)合;以及前文中所提及的草莓中FaMYB1,也會(huì)與bHLH蛋白結(jié)合,且該bHLH與玉米中的R基因同源[92,110]。
除了MYB與bHLH直接結(jié)合外,二者還會(huì)與第三個(gè)蛋白質(zhì)WDR(WD repeat)結(jié)合形成MYB-bHLH-WDR三聚體(MBW)。WDR蛋白又稱WD40蛋白,是真核生物體中最豐富的蛋白質(zhì)家族之一,通常會(huì)與其他生物大分子互作,并作為支架參與蛋白質(zhì)復(fù)合體的裝配過(guò)程[94]。WDR大約由40~60個(gè)氨基酸殘基構(gòu)成,是一類含4~10個(gè)隨機(jī)WD重復(fù)結(jié)構(gòu)域(WD repeat domain)的蛋白質(zhì)家族,而WDR結(jié)構(gòu)域是由以色氨酸和天冬氨酸結(jié)尾的氨基酸序列組成的[111]。因此,WDR又稱為Trp-asp。此外, WDR蛋白的N-末端,還含有一個(gè)甘氨酸-組氨酸二肽[112-113]。WDR蛋白本身不具有催化功能,但它能夠與多種蛋白質(zhì)相互作用,進(jìn)而為大分子蛋白復(fù)合體的組合起到連接作用[112-117]。WDR蛋白在真核生物中十分常見(jiàn),在許多生命活動(dòng)中都承擔(dān)著重要的角色,包括G蛋白介導(dǎo)的信號(hào)轉(zhuǎn)導(dǎo)、轉(zhuǎn)錄調(diào)控、泛素依賴型蛋白質(zhì)降解、染色質(zhì)修飾、囊泡運(yùn)輸、細(xì)胞骨架組裝和細(xì)胞周期調(diào)控等[114-118]。并且,WDR在花青素合成、分生組織形成、幼苗發(fā)育、花發(fā)育、光信號(hào)傳遞和感知等方面也發(fā)揮著重要作用[116-119]。擬南芥中的TTG1基因就是一種典型的WDR蛋白編碼基因,它會(huì)影響黃酮類化合物的生物合成途徑(植物苯丙氨酸途徑的一個(gè)分支)[120]。
MBW三聚體在植物中普遍存在。例如,在擬南芥的種皮內(nèi)細(xì)胞層的原花青素積累過(guò)程,就涉及至少4種MBW復(fù)合物,包括TT2-TT8/GL3/EGL3-TTG1(依次對(duì)應(yīng)為MYB-bHLH-WDR的基因),以及MYB5-TT8-TTG1。TT2-TT8-TTG1在調(diào)控后期生物合成基因中承擔(dān)重要角色,包括無(wú)花色素雙加氧酶、黃烷酮醇還原酶、TT12(Transparent Testa 12)、TT19(Transparent Testa 19)、AHA10(Autoinhibited H+-ATPase Isoform 10)等基因;TT2-EGL3/GL3-TTG1主要調(diào)控BAN、LODX、TT12、AHA10等基因;MYB5-TT8-TTG1主要參與DFR、LODX的調(diào)控。此外,花青素途徑也受MBW復(fù)合物的調(diào)控,如PAP(Production of anthocyanin pigment)1/2/3/4(MYB同源基因),GL3/EGL3/TT8(bHLH同源基因),TTG1(WDR同源基因)(圖1)[121]。
注:圖為擬南芥中黃酮類、花青素、原花青素的生物合成途徑。其中,前期生物合成基因(EBGs)受到MYB11、MYB12、MYB111等3個(gè)轉(zhuǎn)錄因子調(diào)控;后期生物合成基因(LBGs)受MBW復(fù)合物調(diào)控。流程圖中大寫字母表示相應(yīng)的酶,如CHS,CHI等;小寫字母表示相應(yīng)的基因座,如tt等。Note:The biosynthetic pathway for flavanols,anthocyanins,and PAs in Arabidopsis.The early biosynthetic genes(EBGs) are activated by 3 functionally redundant R2R3-MYB proteins(MYB11,MYB12,and MYB111),whereas the expression of the late biosynthetic genes(LBGs) requires the transcriptional activation activity of the R2R3-MYB/bHLH/wD40(MBW) complex.Enzymes are denoted in uppercase(CHS,CHI) and corresponding genetic loci are indicated in italic lowercase letters(tt).圖1 擬南芥中轉(zhuǎn)錄因子調(diào)控植物苯丙氨酸途徑(修改自Li等[121])Fig.1 Regulation of phenylpropanoid biosynthetic pathway by transcription factors in Arabidopsis
綜上所述,參與調(diào)控大豆異黃酮合成的轉(zhuǎn)錄因子主要有R2R3-MYB類、bHLH類以及二者同WD40的結(jié)合體MBW復(fù)合物。其中,MYB類蛋白可以直接調(diào)控合成代謝過(guò)程,而bHLH蛋白通常需要和MYB蛋白結(jié)合后發(fā)揮作用, bHLH能否單獨(dú)結(jié)合DNA仍存在一定爭(zhēng)議。雖然有關(guān)轉(zhuǎn)錄因子的研究已經(jīng)開(kāi)展了近40年,但該領(lǐng)域仍有許多問(wèn)題尚未解決。如bHLH能否單獨(dú)結(jié)合DNA并發(fā)揮作用的研究已經(jīng)開(kāi)展多年,但進(jìn)展依舊緩慢。此外,有關(guān)1R-MYB,3R-MYB和4R-MYB的研究也相對(duì)較少,前者作為端粒結(jié)合蛋白,起到了穩(wěn)定染色體結(jié)構(gòu)的重要作用,這一領(lǐng)域的研究無(wú)論是在動(dòng)物、植物還是微生物中的研究都十分缺乏;而后二者在植物和真菌中較多,在其他生物中鮮有發(fā)現(xiàn),甚至4R-MYB只在擬南芥、楊樹(shù)等少數(shù)植物中存在,這表明這些蛋白可能承擔(dān)著部分物種中的特殊功能。此外,關(guān)于R2R3-MYB對(duì)異黃酮合成相關(guān)基因的調(diào)控也只停留在部分異黃酮合成階段的早期,其對(duì)糖苷類等其他種類異黃酮的調(diào)控過(guò)程還不甚了解,這些都將會(huì)成為未來(lái)的研究熱點(diǎn)。
大豆異黃酮的研究雖已取得一定進(jìn)展,但仍有許多重要問(wèn)題亟待解決。其中有幾項(xiàng),在未來(lái)一段時(shí)間內(nèi)可能會(huì)成為熱點(diǎn)。
大豆異黃酮有12種,其中苷元類在植物苯丙氨酸途徑和類黃酮途徑中合成,該過(guò)程的解析仍然不夠透徹,許多問(wèn)題仍有爭(zhēng)議,包括苯丙氨酸途徑限速酶是否是PAL酶,IFS酶催化底物的芳香基團(tuán)重排的機(jī)制等,這些都將是未來(lái)人們關(guān)注的重點(diǎn)。此外,還有一些含有糖苷配基、丙二酰配基的大豆異黃酮會(huì)由前體遷移至其他部位合成加工,目前的研究中,對(duì)這些過(guò)程的分子機(jī)制了解不夠深入。加強(qiáng)這些方面的研究,可以對(duì)大豆異黃酮乃至其他諸多次級(jí)代謝產(chǎn)物合成方面的研究都大有裨益。
由于大豆異黃酮合成受環(huán)境因素影響很大,這給控制大豆異黃酮合成的相關(guān)QTLs的解析帶來(lái)了很大的困擾。因此,對(duì)QTLs定位方法的改進(jìn)也是一項(xiàng)重要的研究工作。不僅如此,不同品種的QTLs定位結(jié)果也存在差異,因此在多個(gè)品種當(dāng)中共同存在的QTLs,以及存在于不同品種中的QTLs進(jìn)行解析,也是一項(xiàng)值得研究的工作。
隨著測(cè)序技術(shù)與生物信息學(xué)的發(fā)展,QTL定位工作越來(lái)越精細(xì)準(zhǔn)確,但QTL終究只是一個(gè)區(qū)間,上面可能存在著多個(gè)基因。因此,尋找QTL位點(diǎn)與對(duì)應(yīng)基因之間的關(guān)系,將是未來(lái)一項(xiàng)很重要的工作。這需要更加龐大的計(jì)算量,也需要生物信息學(xué)的繼續(xù)發(fā)展,同時(shí)要結(jié)合遺傳轉(zhuǎn)化等分子與遺傳學(xué)手段,當(dāng)基因達(dá)到一定數(shù)目時(shí),需要借助“正交試驗(yàn)”的思路來(lái)設(shè)計(jì)實(shí)驗(yàn),以便研究者更加高效地進(jìn)行探究與分析。
就目前已知的栽培大豆而言,雖然國(guó)內(nèi)已有10余個(gè)高異黃酮大豆品種,但高異黃酮特用大豆的選育工作仍有很大發(fā)展空間。因?yàn)椴糠值胤酱蠖蛊贩N具備高異黃酮的品質(zhì),但僅適合該地方種植,而在其它重要的農(nóng)藝指標(biāo)中呈現(xiàn)的水平相對(duì)較低。因此,我們可以建立高異黃酮分子模塊,并以影響大豆品質(zhì)性狀的遺傳改良為切入點(diǎn),向目標(biāo)受體親本中分別導(dǎo)入相應(yīng)分子模塊。在現(xiàn)有大豆種質(zhì)基礎(chǔ)之上,采用分子模塊設(shè)計(jì)育種與傳統(tǒng)育種相結(jié)合的方式,將高異黃酮模塊精準(zhǔn)設(shè)計(jì)組裝到現(xiàn)有的品種中,培育出富含大豆異黃酮、適應(yīng)性強(qiáng)且具備高產(chǎn)、抗病、高蛋白等多個(gè)優(yōu)良性狀的特色大豆新品種。此外,由于一些基因,如IFS,在其他植物(如玉米、擬南芥等)中表達(dá)時(shí)也可生成異黃酮,因此,非豆科植物中的異黃酮分子(模塊)設(shè)計(jì)育種也是一個(gè)非常有前景的領(lǐng)域。