朱雪雯,米要磊,孟祥霄,陳偉強,王思凡,曹 雪,陳士林,徐志超,蘇 暢,孫 偉*,萬會花*
1.中國中醫(yī)科學院中藥研究所,中藥鑒定與安全性評估重點實驗室,北京 100700
2.東北林業(yè)大學生命科學學院,黑龍江 哈爾濱 150040
3.深圳市藥品檢驗研究院,廣東 深圳 518057
聚酮類化合物(polyketide,PK)是一類由細菌、真菌、放線菌及植物產生的具有重要生物活性的天然次生代謝產物,它們在植物與環(huán)境相互作用以及植物生長發(fā)育方面發(fā)揮著重要的生物學意義[1]。聚酮合酶(polyketide synthases,PKSs)是催化聚酮化合物合成過程中的關鍵酶,該類酶可催化起始底物?;o酶A(CoA)與丙二酰-CoA 縮合形成一系列的聚酮類化合物骨架。PKSs 根據(jù)其蛋白結構和催化機制的不同分為I、II 和III 型[2]。I 型和II 型PKS主要存在于微生物中。I 型PKS 是以模塊形式存在的復合酶,每個模塊含有多個催化功能域,每個模塊負責完成一次鏈延伸反應,這些模塊包含不同的活性位點,以至于每個酶催化的反應均具有不同的活性[3];II 型PKS 是一組多酶復合物,主要催化多環(huán)芳族聚酮化合物的生物合成[2]。III 型PKS 廣泛存在于植物中,是一類同源二聚體蛋白,主要由查耳酮合酶(chalcone synthase,CHS)和類CHS 超家族組成[4-5]。目前基于基因組水平的PKS基因家族已在多種被子植物中(例如水稻、玉米、香蕉、大豆和陸地棉等)被鑒定[4,6-11],且它們的研究主要集中在苯丙烷兩大代謝分支類黃酮和木脂素的生物合成中。例如,碭山酥梨PbPKS 參與梨果實石細胞和木質素的合成[12],從而決定梨果實品質;而CHS作為花青素生物合成的關鍵酶已經(jīng)在多種植物中被鑒定。植物中已發(fā)現(xiàn)的III 型PKS 根據(jù)其催化產物結構的區(qū)別可分為 CHS 以及類 CHS 超家族(chalcone synthase-like,CHSL)包括2-吡喃酮合酶(2-pyrone synthase,2-PS)、茋類合酶(stilbene synthase,STS)、聯(lián)芐基合酶(bibenzyl synthase,BBS)、吖啶酮合酶(acridone synthase,ACS)、二苯甲酮合酶(benzophenone synthase,BPS)、苯戊酮合酶(valerophenone synthase,VPS)、苯亞甲基丙酮合酶(benzalacetone synthase,BAS)以及橄欖醇合成酶(olivetol synthases,OLS)等[6]。
漢麻Cannabis sativaL.又名火麻、胡麻和線麻,是大麻科(Cannabinaceae)大麻屬CannabisL.一年生草本植物。漢麻具有重要的經(jīng)濟和藥用價值,其干燥成熟果實即火麻仁可潤腸通便,滋陰養(yǎng)血[13],其花和苞片中富含的萜酚類化合物,具有鎮(zhèn)痛、抗腫瘤、抗炎等作用。其中大麻二酚(cannabidiol,CBD)和精神活性物質四氫大麻酚(tetrahydrocannabinol,THC)的結構、生物合成和生物活性已經(jīng)得到了深入的研究[14-16]。CBD 作為非精神活性物質,其巨大的藥用潛力正逐步被挖掘[17]。漢麻中萜酚類化合物的生物合成途徑主要來自脂肪酸途徑和萜類途徑。OLS 作為新型PKS,是漢麻萜酚類化合物前體物質合成的關鍵酶[18]。OLS 與橄欖酸環(huán)化酶(olivetolic acid cyclase,OAC)將丙二酰輔酶A(malonyl-CoA)與己酰輔酶A(hexanoly-CoA)縮合生成2,4-二羥基-6-戊基-苯甲酸(olivetolic acid,OA)。OA 和香葉基二磷酸(geranyl diphosphate,GPP)在大麻醇酸合成酶(cannabigerolic acid synthase,CBGAS)的催化下合成漢麻酚萜類化合物的主要前體物質大麻醇酸(cannabigerolic acid,CBGA)。此外,漢麻中的PKS 還參與多種次生代謝產物如類黃酮和茋類等的生物合成[19]。但是目前在全基因組層面對漢麻PKS基因家族的分析還未有報道,因此對漢麻中PKS基因家族的物理化學性質,基因和蛋白結構特征以及基因的表達模式等信息的挖掘,對漢麻中萜酚類化合物以及其他次生代謝產物的合成有著重要的意義。
本研究利用生物信息學工具,對漢麻基因組中聚酮合酶基因家族進一步挖掘與分析。根據(jù)CsPKS基因家族成員的同源性和基因結構特征,探究CsPKS基因家族在進化過程中的復制事件,結合基因的表達模式探討功能上是否存在部分或者完全冗余;同時研究CsPKSs基因在染色體上的分布情況,從而說明CsPKS基因家族的規(guī)模在進化過程中經(jīng)歷了收縮或者擴張;通過分析啟動子區(qū)域窺探基因的表達模式,為揭示CsPKSs 功能提供了方向,為進一步研究漢麻中酚萜類化合物以及類黃酮的生物合成機制和CsPKSs 在漢麻中的生理功能奠定基礎,并對開發(fā)新聚酮化合物藥用資源提供理論基礎。
從NCBI(https://www.ncbi.nlm.nih.gov)網(wǎng)站上獲取雌性漢麻CBDRx 的全基因組及注釋文件(accession number:GCA_900626175.1),應用TBtools[20]軟件提取漢麻蛋白序列,于 Uniport(https://www.uniprot.org/)網(wǎng)站進行預測,預測得到的所有PKS 家族成員,進一步去除重復轉錄本,利用TBtools 軟件獲得CsPKS 家族的gene ID 所對應的蛋白序列。同時從Uniport 獲得擬南芥和水稻的PKS 家族成員,利用BlastTP 工具比對漢麻CBDRx的蛋白序列文件,以E值<1×10-5獲得漢麻CsPKS序列,去冗余后與上述方法進行比較,獲得最終的漢麻 PKS 家族成員。使用生物信息學工具ExPASy-ProSite(http://web.expasy.org/ protparam/)對CsPKSs 蛋白的相對分子質量和等電點進行預測。利用softberry 網(wǎng)站(http://www.softberry.com/cgi-bin/programs/proloc/protcomppl.pl)進行亞細胞定位預測。
利用DNAMAN 將CsPKSs 與其他物種的PKS氨基酸序列進行保守結構域的同源性比對。使用MEGA6.0[21]通過鄰接(neighbour-joining,NJ)方法構建系統(tǒng)發(fā)育樹,并進行重復1000 次的Bootstrap檢驗。利用 MEME(http://meme-suite.org/tools/meme)網(wǎng)站預測保守基序Motif(參數(shù)設為10)。用TBtools 軟件對CsPKSs基因進行外顯子和內含子、保守結構域和系統(tǒng)進化樹三者可視化處理。
使用TBtools軟件解析漢麻的基因組注釋文件,確定每個PKS基因的位置信息并繪制其所對應的染色體物理位置圖。從NCBI 網(wǎng)站下載擬南芥、漢麻、水稻和番茄的全基因組數(shù)據(jù),使用TBtools 軟件對其共線性關系進行可視化處理,并找到PKS基因的同源基因對。
使用PlantCare(http://www.plantcare.co.uk/)網(wǎng)站對CsPKSs基因順式作用元件進行預測,并使用TBtools 軟件對其可視化構圖。
通過SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)在線預測蛋白質二級結構。利用Alphafold[22]構建CsPKSs 蛋白三維結構模型。首先分析靶蛋白序列并進行多序列比對,隨著深度神經(jīng)網(wǎng)絡學習預測原子對的距離和扭轉分布,通過梯度下降的蛋白特異性電位來構建靶蛋白結構[23]。使用的工具包括:HHblits[24](3 次迭代,E=1×10-3);PSI-BLAST v.2.6.0 nr 數(shù)據(jù)集[25](3 次迭代,E=1×10-3);BioPython v.1.65[26];用于結構可視化的PyMol 2.2.0[27]。
根據(jù)已公布的9 個不同栽培品種(Black Berry Kush(BB)、Sour Diesel(SD)、Black Lime(BL)、Canna Tsu(CT)、Cherry Chem(CC)、Terple-3(T3)、Mama Thai(MT)、Valley Fire(VF)、White Cookies(WC)雌株腺毛轉錄組數(shù)據(jù)(PRJNA498707)以及商業(yè)品種Dinamed kush CBD autoflowering(Diku)的花、葉、苞片、莖、種子和根的轉錄組數(shù)據(jù)(Accession No.:bract:SMAN16122880~SAMN16 122882;stem:SAMN16122883~ SAMN16122885 ;flower :SAMN16122886~ SAMN16122888 ;leaf :SAMN16122889~SAMN16122891)計算CsPKSs基因的表達量(FPKM),并運用TBtools 軟件繪制熱圖,進行基因聚類和差異表達分析。具體比對以及計算方法如下:使用star 軟件將RNA-seq 數(shù)據(jù)比對至參考基因組,然后使用rsem 軟件包中的rsem-calculateexpression 工具對比對結果進行定量分析,獲得表達量FPKM 值。
根據(jù)進化關系以及RNA-seq 數(shù)據(jù)對本研究中篩選的CsPKS1、CsPKS4-5和CsPKS9基因進行實時熒光定量 PCR(quantitative real-time PCR,qRT-PCR)驗證。漢麻Diku 品種的花、苞片、種子、根、葉和莖的RNA 提取使用RNAperp Pure Plant Kit試劑盒(北京天根有限公司),采用TransScript?One-Step gDNA Removal and cDNA Synthesis SuperMix 試劑盒(北京全式金公司)逆轉錄合成cDNA,使用StarLighter SYBR Green qPCR Mix 試劑盒(北京啟衡星公司)在Rotor-Gene Q(QIAGEN公司,德國)上進行qRT-PCR 檢測,反應程序:95 ℃酶激活5 min,95 ℃變性 30 s,58 ℃退火 20 s,72 ℃延伸 15 s,循環(huán)次數(shù)40,用2-ΔΔCt法計算基因相對表達量[28]。相關引物見表1,內參基因選擇EF1α[29]。本實驗進行了3 次生物學重復。
表1 qRT-PCR 引物Table 1 Primers for qRT-PCR
從NCBI 網(wǎng)站獲取漢麻的全基因組及注釋文件(accession number:GCA_900626175.1),利用TBtools 軟件提取漢麻蛋白序列,將PlantTFDB 網(wǎng)站獲得的擬南芥和水稻PKSs 蛋白序列與漢麻蛋白序列數(shù)據(jù)進行比對,去除重復轉錄本后,共篩選得到CsPKS基因家族成員9 個,依次命名為CsPKS1~CsPKS9,其編碼氨基酸長度為356~412 aa;蛋白相對分子質量的大小為39 285.38~45 282.99;等電點介于5.52~8.07。亞細胞定位預測9 個基因全部定位于細胞質(表2)。
表2 CsPKS 基因家族成員基本信息及特征Table 2 Information and characteristics of CsPKSs
利用DNAMAN 軟件將9 條CsPKS 氨基酸序列與GenBank 數(shù)據(jù)庫中其他植物PKS 氨基酸序列進行比對分析(圖1)。CsPKS 氨基酸序列與金魚草Antirrhinum majusL.(BAE80511)、紫花苜蓿Medicago sativaL.(P30074)、虎杖Polygonum cuspidatumL.(ABK92282)中的氨基酸序列具有較高的相似度。CsPKS 具有植物III 型PKS 超家族三聯(lián)體活性中心位點Cys164、His303 和Asn336(圖1)[30],其中Cys164 是聚酮鏈形成過程中的親核活性位點,通過共價鍵與起始底物分子和反應中間體結合,而His303 和Asn336 則起著穩(wěn)定或活化起始底物和延伸底物的作用。同時CsPKSs 氨基酸序列具有CHS 典型的活性位點[31],如Arg38、Phe49、Thr50、Thr132、Gly211、Gly216 等。起“Gatekeeper”作用的2 個氨基酸殘基Phe 215 和Phe265 在大多數(shù)CsPKSs 中高度保守,但CsPKS5 和CsPKS8 中Phe256 分別被Tyr 和Ile 取代,與其他PKS 存在較為明顯的差異。
圖1 PKS 氨基酸序列比對Fig.1 Alignment of PKSs
為了闡明CsPKS 與其他植物物種PKS 之間的進化關系,對CsPKS 與擬南芥、水稻、苜蓿等植物的PKS、CHS、CHSL、STS 和VPS 等進行了系統(tǒng)發(fā)育樹分析。系統(tǒng)發(fā)育重建后發(fā)現(xiàn),CsPKS蛋白共劃分為3 個組,分別命名為group 1、group 2 和group 3(圖2)。針對9 個CsPKS,發(fā)現(xiàn)第1組共包含CsPKS2、CsPKS3 和CsPKS4 3 個成員,其中CsPKS2 和CsPKS3 聚為一支后與NsCHSL聚在一起,CsPKS4 與AtPBSB 聚為一支。第一組PKS 多與模式植物如擬南芥、水稻和煙草等關系密切;第2 組包含5 個CsPKS,分別是CsPKS1、CsPKS 5~8,該組5 個成員與VvSTS1、RpBAS和HlVPS 關系較為密切,其中CsPKS5 和CsPKS8聚為一支;CsPKS1、7 和6 聚為一支后與啤酒花的VPS 聚為一支;第3 組僅包含CsPKS9,其與啤酒花CHS 同源。
圖2 CsPKS 家族基因系統(tǒng)發(fā)育樹及其分類Fig.2 Phylogenetic analysis of PKSs from C.sativa and other plant species
CsPKSs基因結構分析顯示(圖3)所有的CsPKSs基因中僅有1 個內含子這與其他植物III 型PKS基因的結構較為保守相符。裸子植物和被子植物中,除已報道的金魚草外,其余已報道III 型PKS基因均含有1 個內含子且該內含子位置保守[31-33]。CsPKS2和CsPKS3在3’端無非翻譯區(qū)(untranslated region,UTR),CsPKS4和CsPKS6內含子較長,分別為1187、2075 bp。通過保守基序分析發(fā)現(xiàn),
圖3 CsPKS 的基因結構及蛋白質保守基序分析Fig.3 Gene structure and conserved motif analysis of CsPKS
Motif1、Motif2、Motif4、Motif5、Motif7、Motif8、Motif9 存在于所有CsPKSs 中,Motif3 和Motif6 存在于CsPKS1、CsPKS5、CsPKS6、CsPKS7、CsPKS8、CsPKS9 中,Motif10 存在于CsPKS2、CsPKS3、CsPKS4 中。
通過對CsPKS 家族成員染色體進行定位分析(圖4),發(fā)現(xiàn)該家族9 個成員分布在Chr1、Chr3、Chr5、Chr7、Chr10 號染色體上。其中,CsPKS1、CsPKS6和CsPKS7成簇位于10 號染色體運用比較基因組學的方法和共線性原理挖掘漢麻與雙子葉模式植物擬南芥、番茄以及單子葉模式植物水稻之間的共線性關系。圖5 中高亮區(qū)域顯示PKS 家族在3個物種間的同源基因對,漢麻和擬南芥中,一共發(fā)現(xiàn)2 對同源基因(CsPKS4和AtPKSB,CsPKS1或7和AtCHSY),其中CsPKS1和CsPKS7為一對串聯(lián)重復基因,且氨基酸序列完全一致;在漢麻和水稻中,一共發(fā)現(xiàn)了1 對同源基因(CsPKS1或CsPKS 7和OsCHS1);漢麻和番茄中,一共發(fā)現(xiàn)2 對同源基因(CsPKS4和SlPKSB,CsPKS9和NM_001247104.2)。
圖4 CsPKS 基因染色體定位Fig.4 Chromosomal locations of CsPKS genes in C.sativa
圖5 漢麻與擬南芥、水稻和番茄的共線性分析Fig.5 Collinear relationship of C.sativa with respect to Arabidopsis thaliana,Oryza sativa and Solanum lycopersicm
提取CsPKS 基因的翻譯起始密碼子(ATG)上游的2 kb 作為啟動子序列,對CsPKS基因家族成員順式作用元件進行預測和可視化分析(圖6),結果發(fā)現(xiàn),核啟動元件、光響應元件存在于漢麻所有PKS基因的啟動子區(qū)域。CsPKS1、CsPKS6、CsPKS7中順式作用元件的數(shù)目和種類均較多,CsPKS3所含順式作用元件數(shù)目最少,且干旱誘導元件僅存在于CsPKS3中。CsPKS基因啟動子區(qū)的順式作用元件種類及分布具有多樣性。
圖6 CsPKS 家族基因的啟動子區(qū)順式作用元件Fig.6 Cis-acting elements within the promoters of CsPKS genes
蛋白質二級結構預測結果如表3 所示,CsPKSs的α-螺旋介于38.11%~46.56%;延伸鏈和β-折疊在整個二級結構中占比較少,分別為14.61%~18.45%和5.85%~8.50%;隨機卷曲介于32.88%~62.40%。使用Alphafold 對目前已鑒定功能的OLS(CsPKS1/CsPKS7)和CsPKS9 蛋白進行三維建模(圖7)并通過Pymol 軟件實現(xiàn)蛋白構象的可視化。AlphaFold 的核心組件是一個卷積神經(jīng)網(wǎng)絡,它通過對Protein Data Bank(PDB)數(shù)據(jù)庫中的蛋白結構深度學習來預測蛋白質殘基的Cβ原子對ij之間的距離(dij)[23]。OLS 和CsPKS9 蛋白主要由α-螺旋和無規(guī)則卷曲形成活性口袋組成,Asn330、His257、Cys157、Phe208 和Phe259 為OLS 活性位點:Asn330、His257 和Cys157 是OLS 活性中心位點,Phe208 和Phe259 為OLS 起“Gatekeeper”作用的兩個氨基酸殘基;Asn336、His303、Cys167、Phe215 和Phe265 為CsPKS9 活性位點:Asn336、His303 和Cys167 是CsPKS9 活性中心位點,Phe215 和Phe265 為CsPKS9起“Gatekeeper”作用的2 個氨基酸殘基。
圖7 CsOLS (CsPKS1 或CsPKS7) 和CsPKS9 蛋白三維結構Fig.7 Three-dimensional structure of CsOLS and CsPKS9
表3 CsPKS 蛋白二級結構Table 3 Predicted protein secondary structures of CsPKS
為探究CsPKS基因的表達模式,對漢麻品種Diku 的花、苞片、種子、根、葉、莖6 個不同組織和9 個不同漢麻品種的腺毛轉錄組數(shù)據(jù)進行基因表達差異分析,并繪制熱圖。研究發(fā)現(xiàn)CsPKS9在花中表達量最高,苞片和葉中表達量均較高,莖中表達較低,種子和根中幾乎不表達;CsPKS1、CsPKS7在莖中表達量較低,種子和根中幾乎不表達,花和苞片中表達較高,且在苞片表達量高于花;CsPKS5在花和苞片中表達量較低,在其他組織中不表達;其余基因在6 個組織中都幾乎不表達。早期的研究顯示CsPKS1和CsPKS7為漢麻中萜酚類化合物合成途徑的關鍵酶基因[17]。通過熱圖聚類可以看出,在漢麻9 個不同品種的腺毛中(圖8),CsOLS(CsPKS1和CsPKS7)在所有品種的腺毛中都高度表達,CsPKS5和CsPKS9在所有腺毛中也均有較高的表達,其次是CsPKS6。CsPKS2、CsPKS3、CsPKS4和CsPKS8在所有品種中表達量很低或者不表達。
圖8 CsPKS 基因的表達模式分析Fig.8 Expression pattern of CsPKS genes in different tissues of Diku and trichomes of different varieties
為了進一步驗證轉錄組數(shù)據(jù)的表達分析結果,本研究利用qRT-PCR 驗證OLS(CsPKS1/7)、CsPKS4-5、CsPKS9在漢麻Diku品種不同組織部位的表達情況(圖9)。結果顯示OLS、CsPKS5、CsPKS9在漢麻花和苞片中的表達量比在其他組織部位的表達量高(P<0.05),與轉錄組結果一致。由于CsPKS4基因整體表達量極低,其qRT-PCR 結果與轉錄組趨勢略有不同。
圖9 CsPKS 在不同組織中的相對表達水平Fig.9 Relative gene expression of the CsPKS in different tissues
PKS 是聚酮化合物合成過程中的關鍵酶,在植物生長發(fā)育、抗逆以及植物與環(huán)境之間的信息交互等方面起著重要的作用[1]。基于基因組水平的PKS基因家族成員已在多種植物中被鑒定[7],目前水稻和薔薇科梨[12]中含有數(shù)量最多的PKS 成員,達27個,而在其他被子植物中PKS 的數(shù)量基本在4-20個之間(香蕉20 個[9]、玉米14 個[8]、大豆14 個[10]、懸鉤子10 個[11]和蘭花5 個[34]等)。通過基因組水平的研究發(fā)現(xiàn),PKS 在植物基因組中的數(shù)量差異可能與物種是否存在古老的全基因組復制或者近期的串聯(lián)重復復制有關[12]。本研究在漢麻基因組中共鑒定得到9 個CsPKS基因,其中CsPKS1、CsPKS7和CsPKS6在基因組上成簇存在,CsPKS1和CsPKS7核酸序列相似度為99.40%,氨基酸序列相似度為100%;CsPKS6與CsPKS7的核酸序列相似度為69.1%,并且它們具有相似的保守基序和保守結構域分布。Gao 等[35]通過對1 個野生品種的漢麻深度測序,發(fā)現(xiàn)其發(fā)生了3 次近代全基因組復制事件和一次大規(guī)模的基因復制事件,因此推測全基因組復制事件可能是產生CsPKS1和CsPKS7基因對的直接原因。
CsPKS 在漢麻類黃酮和酚萜類化合物的生物合成中發(fā)揮著重要的作用。CsPKS 在酚萜類化合物合成途徑中以己酰輔酶A(hexanoyl-CoA)和丙二酰輔酶A(malonyl-CoA)作為底物生成中間產物丁烯酮輔酶A(tetraketide-CoA);CsPKS 在類黃酮合成途徑中以香豆酰輔酶A(p-coumaroyl-CoA)和丙二酰輔酶A 為底物生成柚配基查耳酮。CsPKS1/7與Taura 等[18]克隆鑒定的漢麻酚萜類化合物合成途徑基因OLS為同一基因,因此CsPKS1/7是參與漢麻酚萜類化合物生物合成的關鍵酶基因。另外,CsPKS9與Raharjo等[36]在漢麻中克隆的參與漢麻類黃酮化合物合成的CHS基因序列一致,這也表明了CsPKS9是漢麻類黃酮合成的關鍵酶基因。CsPKS1/7 和CsPKS6 在系統(tǒng)發(fā)育樹中與HlVPS 聚類[37],以異戊酰輔酶A(isovaleryl-CoA)和異丁基輔酶A(isobutyryl-CoA)作為偏好性底物。在漢麻與擬南芥以及水稻的共線性分析中發(fā)現(xiàn)CsPKS1/7與AtCHSY和OsCHS1同源,而AtCHSY 和OsCHS1已報道的催化產物是柚配基查耳酮,這也說明了PKS 在進化過程中功能產生了分化。在系統(tǒng)發(fā)育樹中CsPKS9 與其它多種植物的CHS 聚類,且在共線性分析中CsPKS9 和番茄SlCHS 同源,它們都參與了柚配基查耳酮的生成,這也表明CHS 作為類黃酮合成的關鍵酶,其功能是相對保守的。值得一提的是,CsPKS9 不僅可以香豆酰輔酶A(p-coumaroyl-CoA)作為底物,也可以異戊酰輔酶A 或異丁基輔酶A 作為底物分別生成間苯二酮和間苯異丁苯甲酮[38],這也表明CsPKS9 具有VPS 活性。
CsPKS2、CsPKS3 和CsPKS4 與NsCHSLK、AtPKSA 和 AtPKSB 聚為一支,研究發(fā)現(xiàn)煙草NsCHSLK 在花藥發(fā)育中,特別是對花粉粒外壁合成中起促進作用,它的mRNA 的表達僅限于小孢子和絨毛細胞且NsCHSLK 啟動子表現(xiàn)出花藥特異性[39];在擬南芥花藥的孢子發(fā)育過程中,AtPKSA和AtPKSB 在絨毛膜細胞中存在組織特異性和時空特異性表達,其參與了孢粉蛋白的合成,被分類為花藥特異性 CHS like(anther specific chalcone synthase-like,ASCL)蛋白[36,40]。由于本研究中涉及的漢麻為雌性植株,不存在花藥的發(fā)育過程,所以轉錄組中CsPKS2、CsPKS3和CsPKS4基因的表達量很低甚至不表達。因此,CsPKS2、CsPKS3和CsPKS4基因可能在雄性大麻花藥發(fā)育過程中發(fā)揮作用。另外,CsPKS5 和CsPKS8 與STS 聚為一支,因此這2 個PKS 可能參與漢麻茋類化合物的生物合成。CsPKS 啟動子的激素誘導和抗逆脅迫類順式作用元件數(shù)量較多,表明PKS 基因家族在漢麻生長發(fā)育過程中,尤其是在響應脅迫中可能具有重要的調控作用[41]。
植物中聚酮類化合物的積累以及關鍵III 型PKS 基因的表達往往具有一定的組織特異性。例如,GhCHS 主要在陸地棉Gossypium hirsutumLinn.的纖維中表達,與纖維素的生物合成密切相關[42];凹緣金虎尾Malpighia emarginataL.中的MeCHS 的表達在果實成熟過程中顯著上調[43];HlVPS基因在啤酒花蛇麻腺中特異性表達,直接影響苦味酸的生物合成[37]。漢麻雌花和苞片是酚萜類化合物等次生代謝產物的主要合成場所[36],而與這些次生代謝產物密切相關的基因比如CsPKS1、CsPKS5-7和CsPKS9在花和苞片以及不同品種的漢麻腺毛中都高度表達。
PKS 是聚酮類化合物的合成關鍵酶和限速酶。本研究通過生物信息學,對CsPKS在全基因組水平上進行了鑒定與分析,對該家族成員的物理特性、基因結構、保守基序等進行分析,并探究了漢麻與其他物種間PKS 的進化關系,確定了各基因在漢麻的組織表達特異性,為探明CsPKS基因功能提供理論支撐,并為尋找潛在的漢麻中聚酮類合成的關鍵酶提供理論依據(jù)。
利益沖突所有作者均聲明不存在利益沖突