李田雨,楊遠霄,劉紅艷,汪魏,周芳,周婷,趙應忠
(中國農(nóng)業(yè)科學院油料作物研究所,農(nóng)業(yè) 農(nóng)村部油料作物生物學與遺傳育種重點實驗室,湖北 武漢, 430062)
芝麻是我國的傳統(tǒng)特色油料作物,具有極高的營養(yǎng)價值和經(jīng)濟價值。我國雖是世界上芝麻的主產(chǎn)國之一,但也是最大的芝麻進口國,芝麻原料供給嚴重不足[1]。利用雜種優(yōu)勢可以顯著提高作物產(chǎn)量,增強植株抗逆性和抗病性,是可持續(xù)發(fā)展條件下增加作物產(chǎn)量的有效途徑。目前,在水稻、油菜、小麥等多種作物中已建立雜優(yōu)育種體系,顯著提高了作物產(chǎn)量[2~5]。植物雄性不育作為雜種優(yōu)勢利用的最優(yōu)途徑而受到廣泛研究,而挖掘雄性不育相關基因,對于通過基因工程創(chuàng)制雄性不育材料、選配優(yōu)勢雜交組合、提高芝麻產(chǎn)量具有重要的意義。
細胞色素P450(cytochrome P450,簡稱CYP450)是植物中最大的代謝酶家族,具有廣泛的底物譜和催化活性,催化大量初生和次生代謝物的生物合成及外源毒性化學物質的降解[6]?;谙到y(tǒng)發(fā)育研究,Nelson[7]將陸地植物P450 超家族歸類為10 個獨立的家族簇(clan),即源于相同祖先的不同基因家族的集合,同時對雙子葉植物和單子葉植物中各個家族簇中家族分布情況做出闡述。每個家族簇(clan)以簇中最小蛋白家族的編號作為簇名,包括71 Clan、72 Clan、85 Clan、86 Clan、51 Clan、74 Clan、97 Clan、710 Clan、711 Clan 和727 Clan,其中727 Clan為單子葉植物特有[8,9]。家族和亞家族基因的分類與命名主要依據(jù)基因編碼的氨基酸序列之間的相似度[10]。目前在植物基因組中共鑒定出74 個P450 家族(family),包括127 個不同的亞家族(subfamily)[11]。
隨著分離和鑒定突變體技術的發(fā)展,不斷有新的P450 基因功能被發(fā)掘。目前有多個家族,近40個P450基因被克隆并鑒定參與了脂肪酸的羥基化、環(huán) 氧 化 等,包 括 家 族CYP703、CYP704、CYP92、CYP81、CYP77、CYP78、CYP96、CYP709、CYP726、CYP86 和CYP94[12]。其中擬南芥CYP704B1是一種長鏈脂肪酸v-羥化酶基因,對花粉中孢粉素的合成至關重要[13]。有研究表明牽?;–YP703A1在花藥發(fā)育早期階段表達,并催化月桂酸的羥基化[14]。擬南芥CYP703A2在花藥小孢子和絨氈層細胞表達,催化中鏈飽和脂肪酸轉化為相應的單羥基脂肪酸,被鑒定為是一個特異參與花粉發(fā)育的P450 家族[15]。另外,水稻CYP703A3作用于花藥角質層和花粉外壁的發(fā)育,參與雄性器官發(fā)育所需的月桂酸鏈內(nèi)羥化途徑[16,17]。除了脂肪酸外,CYP450 還主要參與生物體內(nèi)萜類化合物的合成,菊科植物黃花蒿的CYP71AV1作為多功能倍半萜類氧化酶基因在青蒿素的生物合成途徑中起關鍵作用[18]。在唇形科植物丹參中,發(fā)現(xiàn)CYP71BE52氧化鐵氨酚,產(chǎn)生了二萜類物質丹參酚[19]。
本研究鑒定了芝麻P450超基因家族的成員,并克隆了芝麻CYP703 家族成員SiCYP703A2基因,初步揭示了其在花藥發(fā)育中的功能。SiCYP703A2在芝麻花蕾中特異表達,且在花藥發(fā)育的四分體時期高量表達。在擬南芥中超量表達SiCYP703A2導致轉基因擬南芥雄性不育,花粉壁發(fā)育異常。研究的結果期待為芝麻花藥發(fā)育和雜種優(yōu)勢利用提供有效的基因資源。
芝麻材料為隱性細胞核雄性不育兩用系95ms-5AB,種植于中國農(nóng)業(yè)科學院油料作物研究所試驗田,于自然條件下正常生長。于盛花期,分別取芝麻根、莖、葉、花蕾和果莢組織,以及可育和不育花藥的四分體時期、小孢子發(fā)育時期和成熟時期的花藥樣品,迅速冷凍于液氮中,用于后續(xù)試驗。哥倫比亞生態(tài)型擬南芥(Col-0)種植于培養(yǎng)室中,溫度為22℃,光照強度為130 μmol·m-2·s-1,光周期為光照培養(yǎng)16 h,黑暗培養(yǎng)8 h,濕度控制在60%~70%。在苗期時取轉基因植株和野生型的幼嫩葉片,在花期時取不同花藥發(fā)育時期(stage7-8、9-10、11-12、13-14)的花蕾,迅速冷凍于液氮中,所有樣品保存在-80℃?zhèn)溆谩?/p>
芝麻全基因組氨基酸序列下載自Sinbase 數(shù)據(jù)庫(http://www. ocri-genomics. org/Sinbase/)[20],使 用TBtools 軟件將其建立一個本地數(shù)據(jù)庫,以擬南芥P450基因的氨基酸序列作為查詢(query),在本地數(shù)據(jù)庫中進行BlastP(E-value = 0.001),初步篩選出芝麻P450候選基因序列,后將搜索比對得到的所有同源氨基酸序列提交至Pfam 數(shù)據(jù)庫中的Batch sequence search 程序(E-value= 0.001)中進行結構域的分析,檢驗其是否含有P450結構域(PF00067),剔除重復的和錯誤序列,最終得到預測的芝麻P450氨基酸序列。使用EMBOOS 軟件包的needleall 程序(Needleman-Wunsch 算法)對303 條芝麻P450 基因的氨基酸序列進行全局比對,得到序列之間的一致度和相似度,參數(shù)均為默認值[21]。
模式植物擬南芥的P450 基因的氨基酸序列下載自P450 數(shù)據(jù)庫(http://drnelson. uthsc. edu/CytochromeP450.html),共273 條(不包括未分類基因)。將得到的芝麻和擬南芥P450氨基酸序列通過ClustalW 工具進行序列比對,比對結果進一步通過IQtree 軟件構建芝麻和擬南芥P450 基因的系統(tǒng)進化樹,采用最大似然法(maximum likelihood,ML),設置重復次數(shù)(bootstrap)為1000。將芝麻P450 基因氨基酸序列逐條提交到擬南芥數(shù)據(jù)庫(https://www.arabidopsis. org/Blast/index. jsp)中進行BLASTP,同時結合在NCBI 中BLASTP 的結果,尋找與其一致性最高的序列。依據(jù)P450 基因國際命名標準對預測的芝麻P450 基因進行家族分類:兩個P450 基因的氨基酸序列一致性(identity)在40%~55%之間則劃分為同一家族,大于55%則歸為同一亞家族[10]。
基因連鎖圖由R 包karyoploteR(1.16.0)繪制,具體方法參見Bernat(2019)[22]。參照其它基因家族研究中關于基因簇的鑒定標準,對芝麻所有P450基因進行基因簇的分析[23,24]。判定標準:(1)兩個相鄰的P450 基因的間距≤200 kb;(2)兩個P450 基因之間間隔的非P450基因個數(shù)≤8。
利用在線軟件ExPASy(http://web. expasy. org/protparam)ProtParam 預測SiCYP703A2 蛋白的分子量和理論等電點。運用NCBI 中CDD(conserved domain database)程序分析氨基酸序列的結構域。采用ClustalX 軟件對芝麻SiCYP703A2和其它物種中CYP703 家族基因進行多重序列比較分析,序列下載自NCBI(http://www. ncbi. nlm. nih. gov/),Accession number 為:AT1G01280、XP_011093925.1、XP_003624793.1 和XP_015648492.1;系統(tǒng)進化樹使用MEGA7.0 軟件的鄰位相連法(neighbor-joining,NJ)構建[25],bootstrap 設為1000。Accession number 分別為 : XP_002263965.2、 XP_003541057.1、 XP_003624793.1、XP_003624793.1、BAA92894.1、XP_021319871.1、XP_004248085.1、XP_021968776.1、AT1G01280,XP_015648492.1、NP_001149251.1。
以芝麻95ms-5B 四分體時期的花藥cDNA 為模板,依據(jù)Sinbase 數(shù)據(jù)庫(http://www.sesame-bioinfo.org/Sinbase2.0/index. html)[25]中SiCYP703A2基 因 的編碼序列(CDS),通過Primer 5 軟件設計CDS 全長引物SiCYP703A2-forward: 5’-ATGCTCCCCCCAGGCCCTCC-3’和SiCYP703A2-reverse: 5’- CTAATTATACAAATGGGCTGCTAGTCTG -3’,使用I-5TM 2x High-Fidelity Master Mix 高保真酶進行擴增。PCR 程序如下:98℃3 min;98℃10 s,55℃10 s,72℃1 min 35 個循環(huán);72℃2 min。PCR 產(chǎn)物經(jīng)電泳檢測后使用普通瓊脂糖凝膠DNA 試劑盒(天根生化)進行回收純化,然后連接到TSV-007 載體(擎科生物)上,并轉化大腸桿菌感受態(tài)Top10,通過測序獲得無突變的陽性克隆T-SiCYP703A2。以獲得的無突變的陽性克隆T-SiCYP703A2 為模板進行擴增,獲得帶有酶切位點的目標片段,并通過TA 克隆連接到TSV-007 載體(擎科生物)上,測序獲得無突變的陽性克隆T-ovSiCYP703A2。使用限制性內(nèi)切酶NdeⅠ和SmaⅠ分別對表達載體PRI101-AN(TaKaRa,日本)和T-ovSiCYP703A2 進行雙酶切,并將PCR 產(chǎn)物回收純化,后使用T4 連接酶(TaKaRa,日本)進行連接,最終獲得過表達載體(35S::SiCYP703A2)。
通過液氮凍融法將重組表達載體轉化農(nóng)桿菌感受態(tài)(GV3101),挑選單克隆進行PCR 檢測,后將陽性克隆接種于含有利福平(Rif)和卡納(Kan)抗生素的液體LB 培養(yǎng)基中,200 r/min、28℃振蕩培養(yǎng)至OD600為0.8~1.0。收集菌體并制備蔗糖懸浮液,通過花序浸染法[26]將過表達載體導入野生型擬南芥(Col-0)中,一周后進行第2次浸染。
將T0種子于具有卡納抗性的1/2 MS 固體培養(yǎng)基上篩選陽性轉化子,待陽性轉化子具有2 片真葉時,移栽到營養(yǎng)土中生長,待種子成熟,收獲T1代。將單株收獲的種子于具有卡納抗性的1/2 MS 固體培養(yǎng)基上篩選,通過統(tǒng)計綠苗和黃苗的分離比(符合3:1)來篩選單拷貝轉基因家系,并將單拷貝超表達家系移栽到營養(yǎng)土中,待成熟后收獲各單株種子,各株系通過卡納抗性篩選,抗性不分離的株系即為純合子,用于后續(xù)的功能驗證。
所有植物材料的RNA 提取使用Trizol 試劑(Invitrogen,美國),cDNA 合成利用HiScipt II One Step RT-PCR Kit 反轉錄試劑盒(諾唯贊生物)。半定量PCR(RT-PCR)試驗使用Taq Master Mix(諾唯贊生物)。RT-PCR 程序如下:95℃3 min;95℃10 s,55℃10 s,72℃1 min 30個循環(huán);72℃5 min。實時熒光定量PCR(qRT-PCR)體系配制使用ChamQ Universal SYBR qPCR Master Mix 試劑盒(諾唯贊生物),在Roche Light Cycler 480 系統(tǒng)進行qRT-PCR 分析。qRT-PCR 程序如下:95℃30 s; 95℃10 s, 60℃30 s,72℃1 min 40 個循環(huán)。以芝麻Si-Actin(SIN_1009011)的表達作為內(nèi)參,檢測SiCYP703A2在芝麻組織和花藥中的相對表達水平。以擬南芥At-Actin(AT3G18780)的表達作為內(nèi)參,檢測擬南芥花粉壁發(fā)育相關基因的相對表達水平。qRT-PCR 試驗設置3 個生物學重復和3 個技術重復,使用2-△Ct方法計算相對表達水平[27]。數(shù)據(jù)處理和統(tǒng)計分析使用Excel 2010和SPSS11.5軟件。本研究中使用的引物列于表1。
在植株生長第8 周時,拍攝植株整體長勢圖。取當天早上正在開花的野生型和轉基因擬南芥植株的花蕾,利用0.5%醋酸洋紅染色,每朵花觀察3個視野,飽滿、暗紅色的計為正?;ǚ?,瘦小、染色淺或未染上色的計為不育花粉,在熒光倒置顯微鏡(IX71,Olympus)下觀察并拍照。
取當天正在開花的野生型和轉基因擬南芥植株的花蕾,加入4℃預冷的2.5%~3%戊二醛試劑,在4℃條件下進行固定(>4 h),之后使用PBS 緩沖液(0.1 mol/L、不含NaCl)浸洗3~5次。用系列梯度乙醇(30%、50%、70%、80%、90%、95%、100%)進行脫水,之后使用醋酸異戊酯浸洗兩次。脫水后的花蕾采用臨界干燥法進行干燥,用真空噴鍍法對樣品進行包金,最后使用掃描電鏡(VEGA3,Tescan)觀察并拍照。
將模式植物擬南芥的P450 蛋白序列與芝麻基因組進行比對和預測,獲得了322條候選基因,通過Pfma數(shù)據(jù)庫分析候選基因的結構域,剔除不含P450保守結構域的基因,最終在芝麻基因組中鑒定到了303個芝麻P450基因。氨基酸序列的全局比對分析結果顯示,這些P450 基因之間的相似度范圍在0.6%~99.8%之間,基因之間的相似度差異較大(附表1,首頁OSID 二維碼)。將273 條擬南芥P450 基因與預測的芝麻P450基因進行氨基酸序列的比對,并構建系統(tǒng)進化樹,結果如圖1 所示。芝麻303 個P450基因在雙子葉植物特有的9個家族簇中均有分布,且主要分布在71 Clan、72 Clan、85 Clan 和86 Clan 這4 個 家 族 簇 中,71 Clan 包 含192 個P450 基因,占63.0%,其次是72 Clan,占12%,而擬南芥中除71 Clan外,在86 Clan中基因分布最多。
表1 本研究中所用的引物序列Table 1 Primers used in this study
芝麻P450 基因在其它5 個家族簇中分布較少,這與擬南芥P450基因的分布情況一致(圖1)。依據(jù)P450 基因國際命名標準[10],氨基酸序列一致性在45%~55%之間為同一家族,以及基因的進化分析結果,對預測的芝麻P450 基因逐條進行一致性鑒定,并進行家族劃分,家族分布情況如表2,此外,預測的芝麻P450 基因分布在9 個家族簇的43 個P450基因家族中,且主要分布于家族CYP71、CYP76、CYP72、CYP706和CYP81中(表2)。
圖1 芝麻CYP450基因與擬南芥CYP450基因的系統(tǒng)進化樹Fig.1 Phylogenetic tree of CYP450 genes in Sesame and Arabidopsis
本研究所鑒定到的303 個芝麻P450 基因全部是非重復基因,依據(jù)這些基因在基因組數(shù)據(jù)庫中的位點信息,將這些基因的物理位置信息可視化。如圖2 所示,277 個P450 基因在芝麻染色體16 個連鎖群(LGs)上都有分布,并且呈現(xiàn)隨機不均勻分布的特點,有26 個P450 基因被定位到了未被錨定的片段上,未在圖中顯示。這些基因在LG1、LG2、LG3和LG6上的分布較為密集,分別包括36、31、34和36個基因,而在LG13 和LG16 上均只有3 個基因分布。對應表2 的基因分布情況,可知71 Clan 的基因在每個連鎖群上都有分布,且數(shù)目均勻;72 Clan 的基因在LG6 上分布較多,在其它連鎖群上零星分布;86 Clan和85 Clan的基因在多個連鎖群上無分布。
圖2 芝麻P450基因在芝麻基因組中的分布特征Fig.2 Distribution characteristics of CYP450 genes in sesame genome
表2 預測的303個芝麻細胞色素P450基因的分布Table 2 Distribution of 303 predicted CYP450 genes in Sesamum indicum
芝麻P450 基因在連鎖群上呈明顯排列成簇的現(xiàn)象。依據(jù)基因簇的鑒定標準,被定位的287 個P450 基因中,共有169 個基因以基因簇的形式分布在連鎖群上,占P450基因總數(shù)的58%?;虼乜倐€數(shù)為46個,主要出現(xiàn)在除LG13和LG16外的14個連鎖群上,LG6上存在最多的基因簇。
進化分析結果顯示芝麻SIN_1014166 基因與擬南芥CYP703A2基因聚為一類(圖1),比對結果表明兩個基因的氨基酸序列一致性為77%,符合同一亞家族的劃分標準,因此,將芝麻SIN_1014166基因命名為SiCYP703A2。通過對芝麻全基因組序列比對,SIN_1014166與芝麻P450基因之間的氨基酸序列一致性最高為37%(附表1,首頁OSID 二維碼),低于同一家族的劃分標準,同時,芝麻P450 基因的聚類分析顯示(附圖1,首頁OSID 二維碼),SIN_1014166為單獨的分枝,表明SIN_1014166 基因是芝麻CYP703 家族的唯一成員,這與報道的植物CYP703家族通常只包含一個成員一致。
研究表明在擬南芥和水稻中CYP703 家族的基因都特異參與了花藥發(fā)育[20,22]。為探究SiCYP703A2在芝麻中的功能,我們比較了SiCYP703A2在芝麻雄性不育兩用系95ms-5AB 之間的序列差異,結果表明,SiCYP703A2在可育和不育株植株中的DNA 序列不存在差異。該基因CDS序列長度為1449 bp,編碼482 個氨基酸?;蚪M結構分析表明,SiC?YP703A2含有兩個外顯子和一個內(nèi)含子(圖3A)。將SiCYP703A2的氨基酸序列提交至NCBI 的CDD程序進行結構域的分析,結果如圖3B 所示,在氨基酸位點2-482 的位置存在一個P450 蛋白結構域,域名為PLN03112。預測的分子量為54.94kDa,理論等電點為6.24。氨基酸序列多重比較分析發(fā)現(xiàn),SiCYP703A2與擬南芥、紫花苜蓿和水稻中的CYP703A 蛋白相似,在其C 末端都含有一個高度保守的血紅素結合域(Heme binding domain)“FSAGKRKCPG”,此外還包含C 螺旋結構(C-Helix)“W×R×R”、PERF 結構域“P×R×”和K 螺旋結構(K-Helix)“E××R”(圖3C)。SiCYP703A2與其它作物中已知的CYP703家族基因的系統(tǒng)進化樹如圖4所示,依據(jù)單子葉植物和雙子葉植物的進化關系而分為兩類,SiCYP703A2與茄科植物的番茄、牽?;ê兔阑煵莸挠H緣關系較近。
圖3 SiCYP703A2的序列結構和多序列比對分析Fig.3 Gene structure and multiple sequence alignment analysis of SiCYP703A2
圖4 SiCYP703A2基因的系統(tǒng)進化分析Fig.4 Phylogenic analysis of SiCYP703A2
為了解SiCYP703A2的表達模式,設計了SiC?YP703A2的特異引物,即將引物序列提交到NCBI的Primer-BLAST 程序,選擇芝麻的基因組DNA 為模板,通過比對結果顯示該引物的唯一產(chǎn)物為基因SiCYP703A2,表明該引物特異檢測SiCYP703A2的表達。首先通過RT-PCR 和qRT-PCR 檢測了SiC?YP703A2在芝麻不同組織中的表達水平,結果如圖5A 和5B 所示,SiCYP703A2在花蕾組織中表達量最高,在根、莖、葉和果莢中幾乎不表達,表明SiC?YP703A2可能參與生殖發(fā)育。進一步比較了SiC?YP703A2在芝麻雄性不育兩用系95ms-5AB 的不同發(fā)育時期的花藥中的表達模式。結果表明,SiC?YP703A2在花藥發(fā)育四分體時期的表達量最高,在小孢子發(fā)育和花粉成熟期表達量較低。并且在不育植株四分體時期的表達水平顯著高于可育植株,在小孢子時期和成熟花粉時期,二者之間沒有差異(圖5C 和5D),表明SiCYP703A2可能與芝麻雄性生殖器官的發(fā)育有關。
圖5 SiCYP703A2的表達模式分析Fig.5 Expression patterns of SiCYP703A2
為進一步驗證SiCYP703A2在花藥發(fā)育中的功能,構建SiCYP703A2超表達載體,轉化擬南芥,共獲得19 個獨立的轉化子,并篩選到6 個單拷貝(綠苗和黃苗的分離比為3:1)的超表達家系并進一步獲得其純合株系(圖6A)。選取表達量相對較高并且為純系的的超表達家系OE-4 用于后續(xù)功能分析。通過觀察OE-4 過表達家系與野生型對照的生長發(fā)現(xiàn),二者在營養(yǎng)生長上無明顯差異,但與野生型植株角果(圖6C)相比,SiCYP703A2超表達植株的角果變短(圖6D)。進一步通過醋酸洋紅染色觀察花粉活力,發(fā)現(xiàn)野生型(WT)的花粉粒圓潤飽滿,并且被染成紅色,表明野生型花粉活力正常(圖6E),而SiC?YP703A2超表達植株的花粉粒未被染上色(圖6F),表明SiCYP703A2轉基因植株的花粉活力降低。掃描電鏡觀察進一步表明,野生型的花粉粒飽滿且具有規(guī)則的紋飾結構(圖6G),而SiCYP703A2超表達植株的花粉粒表面布滿不規(guī)則的凸起物,呈現(xiàn)異常的花粉壁結構(圖6H),這些結果表明SiCYP703A2在轉基因擬南芥花粉發(fā)育過程中發(fā)揮作用,并且可能影響正常花粉壁的形成。
圖6 SiCYP703A2超表達植株鑒定和表型分析Fig.6 Identification and phenotypic analysis of SiCYP703A2-overexpressing plants
為進一步了解SiCYP703A2在花粉發(fā)育中的作用,檢測了一些花粉壁發(fā)育相關基因的表達水平,包括AtFLP1(AT5G57800)、AtCYP704B1(AT1G69500)、AtPKSA(AT1G02050)、AtPKSB(AT4G34850)、AtTK?PR1(AT4G35420)和AtTKPR2(AT1G68540)[28~31]。如圖7 所示,與野生型相比,在SiCYP703A2超表達植株中,AtFLP1、AtTKPR1、AtTKPR2和AtPKSA的表達水平在花粉發(fā)育的7~14時期都出現(xiàn)明顯下調(diào),而AtCYP704B1和AtPKSB的表達水平在花粉發(fā)育前期即7、8 時期出現(xiàn)上調(diào),在發(fā)育成熟時期即13、14 時期又出現(xiàn)下調(diào)。這些結果說明SiCYP703A2的過表達擾亂了花粉壁發(fā)育相關基因的正常表達,SiC?YP703A2可能參與了花粉壁發(fā)育。
圖7 花藥發(fā)育相關基因的表達水平Fig.7 Relative expression levels of genes related to anther development
近年來,研究人員不斷從植物中分離出新的CYP450 家族和基因,Nelson 等人[32]構建的細胞色素P450 數(shù)據(jù)庫涵蓋了動物、植物和真菌等生物,包括擬南芥、番茄、玉米和大麥等在內(nèi)的66 種植物。擬南芥基因組中含有286 個P450 基因(包括未分類的基因),分為45 個家族和72 個亞家族,水稻和煙草中分別包含47 和44 個P450 家族[32~34]。并且在擬南芥基因組數(shù)據(jù)中已有245 個P450 基因被注釋,煙草中有173個P450基因已經(jīng)找到EST證據(jù)[34]。本研究中,我們在芝麻中鑒定到了303 個可能的P450 基因(圖1),系統(tǒng)進化分析表明,芝麻的303 個可能的P450 基因歸屬于43 個基因家族(表2),這與一般雙子葉植物中的P450 基因分布情況相似。芝麻中CYP51、CYP75、CYP85、CYP711、CYP734 等家族的成員個數(shù)與擬南芥相同,但芝麻中不含有在擬南芥中存在的CYP708 和CYP709 家族。而在芝麻基因組中鑒定到的CYP736 家族,在擬南芥和水稻中均不存在,而CYP736 家族在苜蓿中也被鑒定到[12,35]。此外,研究表明擬南芥和水稻中共有的P450基因家族只有2/3,這可能與P450 基因在物種間的差異性和進化程度有關。我們發(fā)現(xiàn)芝麻P450 基因在16 個連鎖群上是隨機分布的,71 Clan 作為最大的簇,其簇內(nèi)基因在每一個連鎖群上都有分布。同時,14 條連鎖群上出現(xiàn)多個基因密切排列的基因簇,這些基因一般具有較高的相似度,多數(shù)屬于同一個基因家族?;虼氐某霈F(xiàn)一般是由于基因復制產(chǎn)生的,芝麻P450 基因較多的聚集在LG1、LG2、LG3 和LG6 這四個連鎖群上,因此,推測它們相應的染色體上可能發(fā)生過P450基因的大量復制。
細胞色素P450 是生物界廣泛存在的超大蛋白家族,蛋白結構和功能多樣。P450 基因一般具有500 個左右的氨基酸,分子量在46~60 kDa,不同家族的氨基酸序列存在差異,但三級結構一般都由N端的折疊結構和C 端的螺旋束構成[36,37]。同時功能結構域也具有很高的保守度,特別是起接受電子作用的血紅色素結合位點(Heme binding domain),該位點含有一個絕對保守的半胱氨酸(Cys)殘基,與鐵元素形成硫醇鹽離子鍵,以及與血紅素形成電子拉鏈的螺旋C(helix-C)和起到穩(wěn)定血紅素核心結構作用 的 螺 旋K(helix-K)[38]。 本 研 究 克 隆 到SiC?YP703A2,其編碼482 個氨基酸,含有一個保守的P450 家族結構域,屬于細胞色素P450 家族的成員(圖3B)。多重序列比對結果顯示SiCYP703A2含有多個在P450 蛋白中保守的結構域和螺旋結構(圖3C),這些結構與P450 基因特征結構一致。SiC?YP703A2的系統(tǒng)進化結果表明SiCYP703A2與茄科植物的親緣關系較近(圖4),并且牽牛花CYP703A1基因已被揭示在花藥發(fā)育階段表達,推測SiC?YP703A2可能具有相似的表達模式。
芯片檢測數(shù)據(jù)分析顯示許多擬南芥P450 基因的表達具有組織特異性,如CYP88A3和CYP706A2在葉片組織中的表達水平較高,CYP77A6僅在花中特異表達,CYP708A2僅在根中特異表達,CYP81F4和CYP83B1在營養(yǎng)組織中特異表達[39]。煙草中,部分P450基因在整個生長過程中的表達水平都較高,如CYP73A1、CYP51G1、CYP82E2、CYP90A2和CYP97B1等,推測這些基因可能參與內(nèi)源生理代謝途徑[40]。本研究對芝麻SiCYP703A2進行組織表達分析,發(fā)現(xiàn)SiCYP703A2在花蕾組織中的表達量遠高于其它組織,進一步檢測SiCYP703A2在整個花藥發(fā)育過程中的表達情況,發(fā)現(xiàn)其在芝麻花藥發(fā)育的四分體時期表達量最高(圖5)。這與擬南芥、水稻和牽?;ㄖ蠧YP703A基因的表達模式相符[14~17],因此,推測SiCYP703A2可能發(fā)揮與這些基因相似的功能,參與芝麻雄性生殖器官的發(fā)育。
敲除CYP703A2基因的擬南芥植株呈現(xiàn)部分雄性不育表型,超微結構觀察顯示敲除系植株的花粉壁發(fā)育嚴重受損,外壁缺失[15]。水稻cyp703a3-2突變體的花藥較小并且不產(chǎn)生花粉粒,電鏡觀察顯示花藥的表皮層出現(xiàn)缺陷[17]。我們在擬南芥中超量表達SiCYP703A2,發(fā)現(xiàn)轉基因擬南芥植株的莢果長度與野生型相比明顯縮短(圖6C、D),并且花粉活力顯著降低(圖6E 和6F)。進一步通過掃描電鏡觀察花粉粒結構,發(fā)現(xiàn)過表達植株花粉粒表面出現(xiàn)異常突起物,花粉壁結構存在嚴重缺陷(圖6G 和6H)。這可能是由于轉基因植株花藥中SiCYP703A2持續(xù)表達導致AtCYP703A2的精確表達被破壞。有研究也表明,ABORTED MICROSPORES(AMS)作為擬南芥絨氈層特定的擬南芥轉錄因子,其正確的表達時機對于絨氈層和花粉發(fā)育至關重要[41]。花粉外壁是花粉最外層的結構,其主要組成成分為孢粉素。目前在擬南芥、水稻、煙草等作物中存在一條保守的孢粉 素 生 物 合 成 路 徑,由FLP1、ACOS5、PKSA/B、CYP703A、CYP704B、TKPR1/2等基因順序作用,最終合成孢粉素的前體物質[42,43]。檢測這些基因在SiCYP703A2過表達擬南芥中的表達水平,結果顯示(圖7)這些基因的表達水平都被擾亂,并且多個基因的表達水平出現(xiàn)明顯下調(diào),可能由于SiCYP703A2的過表達干擾了這些基因的正常表達,擾亂了正常的孢粉素代謝途徑,最終導致花粉外壁異常。
綜上所述,本研究鑒定了303 個芝麻細胞色素P450 基因,分布在43 個基因家族中。SiCYP703A2具有保守的P450 結構域和螺旋結構,可能是芝麻CYP703 家族的唯一成員。組織表達模式顯示該基因在芝麻花蕾組織中高量表達。在擬南芥中超量表達SiCYP703A2導致轉基因擬南芥花粉壁發(fā)育異常,植株育性降低,花粉結構異常,并且多個與花粉壁發(fā)育相關基因的表達水平發(fā)生變化。這些結果表明,在轉基因擬南芥中SiCYP703A2可能通過影響花粉壁發(fā)育進而影響花粉育性。本研究對芝麻中P450 超家族進行了鑒定,并對其家族分類和進化進行分析,為芝麻P450基因的功能研究奠定了良好基礎。同時揭示了芝麻SiCYP703A2基因在花粉發(fā)育中的功能,為芝麻雜種優(yōu)勢的利用提供基因資源和新思路。