韓 霜,余靜雅,李孝平,牛 玉,張發(fā)起
(1 中國(guó)科學(xué)院西北高原生物研究所高原生物適應(yīng)與進(jìn)化重點(diǎn)實(shí)驗(yàn)室,西寧 810001;2 中國(guó)科學(xué)院大學(xué) 生命科學(xué)學(xué)院,北京 100039)
基因組學(xué)與系統(tǒng)發(fā)育生物學(xué)相結(jié)合,建立新的學(xué)科——系統(tǒng)發(fā)育基因組學(xué)(Phylogenomics),也為正確解決多基因序列系統(tǒng)發(fā)育樹沖突等問題提供新的方法和見解[1,2-4]。基因組包含豐富的基因序列信息及基因復(fù)制、轉(zhuǎn)移、丟失等事件的重要信息,為系統(tǒng)發(fā)育研究提供大量證據(jù)。系統(tǒng)發(fā)育重建進(jìn)入基因組時(shí)代,越來(lái)越多的學(xué)者將核基因組與質(zhì)體基因組應(yīng)用到系統(tǒng)發(fā)育學(xué)研究中[5-6],通過(guò)基因組數(shù)據(jù)構(gòu)建更高分辨率、更成熟的系統(tǒng)發(fā)育樹,進(jìn)而更準(zhǔn)確地推斷植物類群的進(jìn)化關(guān)系。對(duì)于高等植物和一些藻類植物而言,其體內(nèi)固有的細(xì)胞器葉綠體在植物的光合作用過(guò)程中具有重要作用[7]。此外,由于葉綠體為母系遺傳,高度保守、變異位點(diǎn)多并具有獨(dú)立的基因組,是研究植物系統(tǒng)發(fā)育的理想目標(biāo)[5]。測(cè)序技術(shù)的迅速發(fā)展與測(cè)序成本的降低,實(shí)現(xiàn)了許多植物的葉綠體基因組測(cè)序,為解決植物類群系統(tǒng)發(fā)育問題提供新的思路[8-9]。近年來(lái),許多學(xué)者利用大量有價(jià)值的基因組數(shù)據(jù)解決了長(zhǎng)期存在爭(zhēng)議的植物系統(tǒng)發(fā)育問題。在這些研究案例中,對(duì)薔薇科的123個(gè)葉綠體基因組進(jìn)行測(cè)序,應(yīng)用多種系統(tǒng)發(fā)育重建方法明晰薔薇科的深層系統(tǒng)發(fā)育關(guān)系,為其多樣化歷史提供了新的重要見解[10]。對(duì)麻黃屬3個(gè)物種的葉綠體基因組進(jìn)行測(cè)序,為其系統(tǒng)發(fā)育研究提供有價(jià)值的信息[11]。
喉毛花屬(Comastoma)隸屬于龍膽科(Gentianaceae)獐牙菜亞族(subtribe Swertiinae),多為一年生或多年生草本植物,全球共15種,中國(guó)有11種[12]。該屬植物主要分布在青藏高原及其毗鄰地區(qū),也是藏茵陳入藥基原植物之一,在保肝、抗氧化、抗病毒等方面具有顯著效果[13-15]。綜合以往研究分析,學(xué)者基于ITS序列對(duì)龍膽亞族進(jìn)行系統(tǒng)發(fā)育分析,支持喉毛花屬為單系起源,胚胎學(xué)研究將喉毛花屬處理為1個(gè)獨(dú)立的屬,質(zhì)體基因組與核基因組研究結(jié)果進(jìn)一步支持該屬為1個(gè)單系類群[16-20]。目前,喉毛花屬屬級(jí)分類問題已明晰,但其屬下物種關(guān)系問題尚未得到解決。此外,研究者還發(fā)現(xiàn)不同數(shù)據(jù)集構(gòu)建的系統(tǒng)發(fā)育樹表現(xiàn)出不一致的拓?fù)浣Y(jié)構(gòu)[16,20],主要表現(xiàn)在皺邊喉毛花(Comastomapolycladum)、鐮萼喉毛花(Comastomafalcatum)等物種上。目前,喉毛花屬下物種關(guān)系尚不清晰,有關(guān)喉毛花屬下物種的系統(tǒng)發(fā)育研究鮮見報(bào)道,對(duì)其屬下物種的認(rèn)識(shí)有限。因此,后續(xù)研究應(yīng)結(jié)合更多豐富、有價(jià)值的基因組數(shù)據(jù)闡明喉毛花屬下物種分類問題。鑒此,文章以皺邊喉毛花及其近緣種作為研究對(duì)象,通過(guò)生物信息學(xué)方法進(jìn)行基因組比較、進(jìn)化與密碼子偏好性等分析,構(gòu)建不同數(shù)據(jù)集,重建喉毛花屬下物種的系統(tǒng)發(fā)育關(guān)系,為進(jìn)一步展開喉毛花屬下物種分化研究提供可靠的分子依據(jù)。
選取12個(gè)喉毛花屬植物樣本(5個(gè)皺邊喉毛花、2個(gè)長(zhǎng)梗喉毛花、2個(gè)鐮萼喉毛花和2個(gè)高杯喉毛花),這些樣本分別采自不同地區(qū)與不同群體(表1)。野外采集的新鮮幼葉放入硅膠中干燥,回到實(shí)驗(yàn)室后,置于-20 ℃冰箱保存。憑證標(biāo)本存放于中國(guó)科學(xué)院西北高原生物研究所青藏高原生物標(biāo)本館(HNWP)內(nèi)。
表1 物種信息與測(cè)序結(jié)果
采用改良后的CTAB法從干燥葉片中提取基因組總DNA[21],瓊脂糖凝膠電泳檢測(cè)DNA純度和完整性,送至公司構(gòu)建全基因組小片段文庫(kù)。構(gòu)建完成后使用Agilent 2100對(duì)文庫(kù)插入片段進(jìn)行檢測(cè)。文庫(kù)檢測(cè)合格后,利用Illumina高通量測(cè)序平臺(tái)NovaSeq 6000平臺(tái)進(jìn)行150 bp長(zhǎng)度的雙末端測(cè)序。
利用fastp v 0.23.1[22]對(duì)原始數(shù)據(jù)(raw reads)進(jìn)行質(zhì)量控制和過(guò)濾(參數(shù)設(shè)置:-poly_x_min_len:10;cut_front cut_tail cut_window_size:4;qualified_quality_phred:15;low_complexity_filter complexity_threshold:30;length_required:30 thread:4),過(guò)濾后的高質(zhì)量數(shù)據(jù)(clean reads)用于后續(xù)生物信息學(xué)分析。使用SPAdes v 3.13.1 與Getorganelle v 1.7.7.0組裝12個(gè)個(gè)體的葉綠體基因組[23-24],提交至在線工具Geseq進(jìn)行基因組注釋,得到Genbank文件[25],隨后提交至Sequin軟件,手動(dòng)去除內(nèi)含子及外顯子,調(diào)整起始/終止密碼子的位置,最終導(dǎo)出用于后續(xù)分析的Genbank文件并提交至NCBI數(shù)據(jù)庫(kù)中。此外,從本數(shù)據(jù)庫(kù)中下載已經(jīng)發(fā)表的龍膽科4個(gè)屬獐牙菜屬(Swertia)、花錨屬(Halenia)、扁蕾屬(Gentianopsis)與肋柱花屬(Lomatogonium)的9個(gè)物種:蒙自獐牙菜(Swertialeducii,登錄號(hào):NC_045301,153 015 bp)、顯脈獐牙菜(Swertianervosa,登錄號(hào):NC_057596,153 690 bp)、祁連獐牙菜(Swertiaprzewalskii,登錄號(hào):MZ261904,153 269 bp)、宿根肋柱花(Lomatogoniumperenne,登錄號(hào):NC_050659,151 678 bp)、橢圓葉花錨(Haleniaelliptica,登錄號(hào):NC_050657,153 305 bp)、Haleniacoreana(登錄號(hào):NC_050657,NC_042674,153 198 bp)、大花扁蕾(Gentianopsisgrandis,登錄號(hào):NC_049879,151 271 bp)、濕生扁蕾(Gentianopsispaludosa,登錄號(hào):NC_050656,151 308 bp)和扁蕾(Gentianopsisbarbata,登錄號(hào):MZ579704,151 123 bp),獐牙菜屬物種作為外類群。
選取4個(gè)同科植物(顯脈獐牙菜、宿根肋柱花、扁蕾與橢圓葉花錨)與1個(gè)已發(fā)表的喉毛花MK331815,與皺邊喉毛花(Chensl-0749)、鐮萼喉毛花(Zhang2019002)、長(zhǎng)梗喉毛花(Chensl-0876)和高杯喉毛花(Chen2013572-1)進(jìn)行密碼子偏好性分析。使用codonW v 1.4.2(http://codonw.sourceforge.net/)計(jì)算相對(duì)同義密碼子使用度(relative synonymous codon usage,RSCU)、密碼子適應(yīng)指數(shù)(codon adaptation index,CAI)、有效密碼子數(shù)(effective number of codons,ENc)、同義密碼子第三位GC含量(GC content of the synonymous third codons,GC3s)、同義第三密碼子胸腺嘧啶含量(synonymous third codon thymine content,T3s)、同義第三密碼子胞嘧啶含量(synonymous third codon cytosine content,C3s)、同義第三密碼子腺嘌呤含量(synonymous third codon adenosine content,A3s)和同義第三密碼子鳥嘌呤含量(homonymous third codon guanine content,G3s)等指數(shù)。在TBtools v 1.09中繪制密碼子偏好性分析圖[26]。
為比較喉毛花屬及其近緣屬的葉綠體基因組相似性及差異性,利用mVISTA軟件[27]進(jìn)行可視化分析。以鐮萼喉毛花作為參考,與其余8個(gè)物種(顯脈獐牙菜、宿根肋柱花、扁蕾、橢圓葉花錨、皺邊喉毛花、長(zhǎng)梗喉毛花、喉毛花及高杯喉毛花)進(jìn)行比較,選擇Shuffle-LAGAN模型,其他參數(shù)設(shè)為默認(rèn)值。利用MISA v 1.0[28]進(jìn)行短重復(fù)序列(short repeat sequence)分析,參數(shù)設(shè)置:1=10;2=5;3=4;4=3;5=3;6=3,利用Excel 2016繪制SSR數(shù)量及其分布情況。
在Phylosuite v 1.2.2[29]中提取9個(gè)GB文件的編碼基因(protein-coding gene,PCGs)以及基因間隔區(qū)(intergentic spacers,IGS),在MAFFT v 7.313[30]中進(jìn)行基因及基因間隔區(qū)的序列比對(duì),得到的比對(duì)結(jié)果為輸入文件進(jìn)行核苷酸多態(tài)性分析。將提取的共有基因分為不同的數(shù)據(jù)集:accD(fatty acid synthesis)、atp(ATP synthase)、cemA(carbon metabolism)、clpP(proteolysis)、infA(translational initiation factor)、matK(RNA processing)、ndh(NADPH dehydrogenase)、pet(cytochrome b/f complex)、psa(photosystem I)、psb(photosystem II)、rbcL(rubisco)、rpl(large subunit of ribosome)、rpo(DNA dependent RNA polymera)、rps(small subunit of ribosome)。利用DNAsp v 6[31]的Nucleotide diversity模塊計(jì)算PCGs和IGS的Pi值(參數(shù)設(shè)置:滑動(dòng)窗口大小為600 bp,為200 bp),利用Excel 2016繪制結(jié)果圖。從結(jié)果中篩選高度變異基因間隔區(qū)(Pi>0.06)用于系統(tǒng)發(fā)育分析。
以顯脈獐牙菜為參考,利用軟件KaKs_Calculator v 2.0[32]計(jì)算14個(gè)數(shù)據(jù)集的同義替代率(synonymous,Ks)、非同義替代率(nonsynonymous,Ka)及同義替代率/非同義替代率的比值(Ka/Ks)(method:NG;genetic code:11-Bacterial and plant plastid code)。在R v 4.2.4(https://www.R-project.org/)中利用ggplot2包繪制進(jìn)化分析圖。
共構(gòu)建了4個(gè)數(shù)據(jù)集:蛋白編碼序列(CDS),第一、二位密碼子位置(CDS1+2),第三位密碼子位置(CDS3)以及篩選出的高度變異基因間隔區(qū)(ndhC_trnV-UAC、psbC_trnS-UGA和psbK_psbI)序列用于喉毛花屬下系統(tǒng)發(fā)育關(guān)系重建。利用MAFFT v 7.313[30]對(duì)共有CDS基因以及高度變異IGS進(jìn)行比對(duì)(密碼子比對(duì)策略),對(duì)24條葉綠體基因組序列共有的82個(gè)編碼基因進(jìn)行多基因聯(lián)合分析。CDS基因的密碼子位點(diǎn)數(shù)據(jù)集采用Partition估算建樹最佳模型,其余數(shù)據(jù)集在Modelfinder中計(jì)算最佳模型[33-34](表2)。在IQ-tree v 1.6.8[35]中進(jìn)行最大似然(maximum likelihood,ML)分析,選擇Ultrafast bootstrap,快速自然重復(fù)設(shè)置為1 000次。使用MrBayes v 3.2.6[36]進(jìn)行貝葉斯(bayesian inference,BI)分析,每次分析進(jìn)行2次獨(dú)立的馬爾可夫鏈蒙特卡羅(MCMC)鏈運(yùn)行,迭代選擇1 000 000代,每1 000代選1次樣,舍棄前25%的樣本。利用ITOL(interactive tree of life, https://itol.embl.de/)在線軟件對(duì)結(jié)果圖進(jìn)行可視化和修改。
表2 所有數(shù)據(jù)集的最佳建樹模型
經(jīng)測(cè)序后,對(duì)12個(gè)樣本的測(cè)序質(zhì)量進(jìn)行評(píng)估,其中,10個(gè)樣本的Q30均在90%以上(除高杯喉毛花的2個(gè)樣本外),GC含量范圍在35.34%~41.38%之間,基因組長(zhǎng)度范圍在150 772~152 093 bp之間(表1)。經(jīng)組裝及注釋后,獲得12個(gè)完整的葉綠體基因組,均由四分體結(jié)構(gòu)組成,包括大單拷貝區(qū)(large single copy,LSC)、小單拷貝區(qū)(small single copy,SSC)及1對(duì)反向重復(fù)區(qū)(inverted repeat region,IRa、IRb)。選取9個(gè)葉綠體基因組進(jìn)行比較分析,葉綠體基因組長(zhǎng)度范圍在151 123~153 690 bp之間(表3)。
表3 9個(gè)葉綠體基因組結(jié)構(gòu)信息
基于82個(gè)共有基因?qū)砻▽傥锓N的密碼子偏好性進(jìn)行分析,結(jié)果顯示,喉毛花屬與其近緣屬之間略有差異,主要體現(xiàn)在編碼蛋白基因的密碼子數(shù)量不同,范圍為50 374~51 230。在20個(gè)氨基酸中,亮氨酸(Leu)具有最多的密碼子,而色氨酸(Trp)具有最少的密碼子。RSCU結(jié)果表明,有35個(gè)密碼子的RSCU值均大于1,其余密碼子均≤1(圖1)。密碼子指數(shù)計(jì)算結(jié)果顯示,所有物種的GC含量相差不大,均在0.39~0.394之間。密碼子適應(yīng)指數(shù)CAI在0.15~0.162之間,有效密碼子數(shù)目ENc值在55.89~56.44之間(表4)。
圖1 9個(gè)葉綠體基因組的密碼子偏好性熱圖
表4 葉綠體基因組編碼基因的密碼子偏好性指數(shù)
9個(gè)葉綠體基因組序列相似性可視化分析顯示編碼區(qū)比非編碼區(qū)更保守,相比于反向重復(fù)區(qū)單拷貝區(qū)差異性更大,與核苷酸多態(tài)性分析結(jié)果基本保持一致(圖2)。SSR分析結(jié)果顯示,喉毛花屬及其近緣屬中的重復(fù)類型總數(shù)在42~53之間,其中扁蕾和顯脈獐牙菜的數(shù)量最多。單堿基重復(fù)類型最豐富,范圍在28~37之間(圖3)。在10個(gè)基因數(shù)據(jù)集的核苷酸多態(tài)性結(jié)果中,其Pi值范圍為0.005~0.037。其中,cemA、matK基因具有較高的Pi值,說(shuō)明它們?cè)诤砻▽僦参镏械淖儺惵首罡?而基因間隔區(qū)的結(jié)果中,筆者只展示Pi值大于0.05的基因間隔區(qū),并選取Pi大于0.06的基因間隔區(qū)作為數(shù)據(jù)集構(gòu)建系統(tǒng)發(fā)育樹(圖4)。
圖2 喉毛花屬及其近緣類群的葉綠體基因組比較
圖3 9個(gè)葉綠體基因組分SSR分析
圖4 蛋白編碼基因和基因間隔區(qū)的核苷酸多態(tài)性分析
為進(jìn)一步檢測(cè)葉綠體基因組編碼基因受到的選擇壓力,利用9個(gè)葉綠體基因組的共有編碼基因,將其分為不同的9個(gè)基因數(shù)據(jù)集,計(jì)算同義替代率、非同義替代率以及Ka/Ks值(圖5)。結(jié)果表明,非同義替換率均較低,范圍在0.002~0.035之間,而同義替代率的范圍值在0.003~0.11之間。非同義替代率與同義替代率的比值(Ka/Ks)結(jié)果中,psbA基因擁有最小值0.005,而ndhB基因的比值(1.24)最大。
圖5 蛋白編碼基因的同義替代率、非同義替代率以及Ka/Ks比率
基于CDS、密碼子第一、二位置及第三位置構(gòu)建的ML和BI系統(tǒng)發(fā)育樹具有相似的拓?fù)浣Y(jié)構(gòu),所有分支具有較高的支持率(圖6)。從系統(tǒng)發(fā)育樹可知,所有的喉毛花屬物種均聚為一支,其姊妹類群為肋柱花屬植物,二者共同與花錨屬的3個(gè)物種和獐牙菜屬的1個(gè)物種聚為1個(gè)大支。而基因間隔區(qū)的系統(tǒng)發(fā)育樹結(jié)果也具有相似的結(jié)果(圖7)。
圖6 基于葉綠體基因組蛋白編碼序列,第1、2位密碼子位置與第三位密碼子位置的喉毛花屬下系統(tǒng)發(fā)育關(guān)系
圖7 基于高度變異基因間隔區(qū)聯(lián)合喉毛花屬下系統(tǒng)發(fā)育關(guān)系
從喉毛花屬的分支結(jié)果可知,皺邊喉毛花、鐮萼喉毛花、長(zhǎng)梗喉毛花均聚在了同一支上且相互嵌套在一起。在分支A中,2個(gè)鐮萼喉毛花(QXA0366和Zhang2019356-1)與1個(gè)皺邊喉毛花(Chensl-0749)聚在一支(分支a1),與分支b1構(gòu)成姐妹類群。在分支b1中,皺邊喉毛花(Zhang2019427-1)與鐮萼喉毛花(MK331815)、長(zhǎng)梗喉毛花(Zhang2019277)和皺邊喉毛花(Zhang2019004-1)構(gòu)成姐妹類群。分支B由分支a2和b2構(gòu)成,二者互為姐妹類群,在分支a2中,皺邊喉毛花(Zhang2018056)與皺邊喉毛花(Zhang2019179-1)、長(zhǎng)梗喉毛花(Chensl-0876)聚為一支。在分支b2中,2個(gè)高杯喉毛花(Chen2013572-1/2)與鐮萼喉毛花(Zhang2019002)、2個(gè)喉毛花(NC_050654、MW324577)互為姐妹類群?;谝陨辖Y(jié)果可以得知,皺邊喉毛花及其近緣種相互嵌套,未按物種聚類。
此外,聯(lián)合變異程度較高的基因間隔區(qū)(ndhC_trnV-UAC、psbC_trnS-UGA和psbK_psbI)構(gòu)建了ML和BI樹,拓?fù)浣Y(jié)構(gòu)進(jìn)一步說(shuō)明喉毛花屬的單系性(圖7)。在2種系統(tǒng)發(fā)育樹中,部分物種表現(xiàn)出不一致的拓?fù)浣Y(jié)構(gòu)。
在最大似然樹中,長(zhǎng)梗喉毛花(Chensl-0876)與皺邊喉毛花(Zhang2018056)互為姐妹類群,而在貝葉斯樹中,其與皺邊喉毛花(Zhang2019004-1)聚在一起(圖7)。類似的結(jié)果進(jìn)一步說(shuō)明皺邊喉毛花、鐮萼喉毛花與長(zhǎng)梗喉毛花無(wú)法按照物種聚類,與CDS系統(tǒng)發(fā)育樹結(jié)果一致。
測(cè)序技術(shù)的迅速發(fā)展與測(cè)序成本的降低,實(shí)現(xiàn)了許多植物的葉綠體基因組測(cè)序,其長(zhǎng)期作為解決植物類群系統(tǒng)發(fā)育問題的有利手段[8-9,37]。對(duì)于系統(tǒng)發(fā)育位置存在爭(zhēng)議的喉毛花屬而言,葉綠體基因組數(shù)據(jù)構(gòu)建出成熟、高分辨率的喉毛花屬系統(tǒng)發(fā)育樹,支持了該屬為單系起源。綜合歷史研究分析,喉毛花屬的系統(tǒng)發(fā)育位置問題已得到解決,但其屬下物種的系統(tǒng)發(fā)育關(guān)系尚不明晰[18]。一些系統(tǒng)發(fā)育研究案例中,不同數(shù)據(jù)構(gòu)建的系統(tǒng)發(fā)育樹表現(xiàn)出不一致的拓?fù)浣Y(jié)構(gòu),類似情況也在其他植物類群中發(fā)現(xiàn)[38-40]。為此,本研究構(gòu)建了不同數(shù)據(jù)集重建喉毛花屬下的系統(tǒng)發(fā)育關(guān)系,以期為喉毛花屬下物種關(guān)系的研究提供有價(jià)值的分子信息。
對(duì)測(cè)序原始數(shù)據(jù)的質(zhì)控結(jié)果顯示,其Q20均在96%以上,Q30值基本在90%以上,進(jìn)一步說(shuō)明其測(cè)序質(zhì)量良好,可以進(jìn)行后續(xù)的生物信息學(xué)分析。組裝及注釋后的葉綠體基因組為四分體結(jié)構(gòu),均由1個(gè)LSC區(qū)、SSC區(qū)和1對(duì)IR區(qū)組成。5個(gè)喉毛花屬物種在基因組長(zhǎng)度差異較小,長(zhǎng)度范圍為從151 526~152 093 bp不等,長(zhǎng)梗喉毛花物種的基因組長(zhǎng)度最短。同屬物種之間的基因組長(zhǎng)度差異是葉綠體基因組研究中最常見的結(jié)果,類似的結(jié)果也在其他植物中發(fā)現(xiàn)[41-42]。這種差異主要與某些基因的擴(kuò)張和收縮有關(guān),從而影響基因組大小[43]。
葉綠體基因組比較分析表明,喉毛花屬下物種之間的差異較小。mVISTA以及核苷酸多態(tài)性結(jié)果表明,非編碼區(qū)比編碼區(qū)的變異程度高,反向重復(fù)區(qū)比單拷貝區(qū)的核苷酸多態(tài)性低,這與大多數(shù)植物的結(jié)果[44-45]保持一致。此外,篩選出變異程度高的基因間隔區(qū)或基因可作為進(jìn)一步研究喉毛花屬物種鑒定及群體遺傳的分子標(biāo)記候選。SSR結(jié)果表明,單堿基重復(fù)最為豐富。這與其他青藏高原地區(qū)的植物結(jié)果保持一致,也與多數(shù)植物的結(jié)果不一致,或與SSR分析所設(shè)定的參數(shù)、測(cè)序方法及物種本身有關(guān)[46]。這些結(jié)果可為進(jìn)一步設(shè)計(jì)SSR引物及開發(fā)高度多態(tài)性的SSR標(biāo)記提供基礎(chǔ)數(shù)據(jù)。
同義核苷酸替換率和非同義核苷酸替換率的計(jì)算,對(duì)于植物系統(tǒng)發(fā)育的重建具有重要意義,可以判斷植物葉綠體基因組編碼基因是否受到選擇壓力的作用[47-48]。同義核苷酸的替代并不改變蛋白質(zhì)的結(jié)構(gòu),而非同義核苷酸的替代卻能改變蛋白質(zhì)結(jié)構(gòu),因此非同義替換往往帶來(lái)有害性狀而被固定下來(lái)[49]。當(dāng)Ks=Ka,說(shuō)明編碼基因未受到自然選擇的影響[50];如果Ka/Ks>1,說(shuō)明基因受正選擇的作用。喉毛花屬植物的進(jìn)化分析結(jié)果顯示,幾乎所有編碼基因的非同義替代率與同義替代率比值(Ka/Ks)均小于1,表明Ks>Ka,進(jìn)一步說(shuō)明這些編碼基因受到純化選擇的作用。以上結(jié)果與其他植物的結(jié)果[11,50]保持一致。本研究篩選的正選擇基因,能夠?yàn)檫M(jìn)一步研究喉毛花屬下物種的適應(yīng)性進(jìn)化提供基礎(chǔ)數(shù)據(jù)。
密碼子偏好性分析結(jié)果表明喉毛花屬的20個(gè)氨基酸均由61個(gè)密碼子編碼(3個(gè)終止密碼子除外)。計(jì)算多個(gè)衡量指標(biāo)可以量化植物葉綠體基因組密碼子的偏好性,RSCU可以很直觀地展示密碼子使用的偏好性[51]。在喉毛花屬植物中,有1/2以上密碼子的RSCU值大于1,說(shuō)明使用這些密碼子的頻率較高。ENc值可以反映出同義密碼子非均衡使用的偏好程度,其結(jié)果具有較高的參考價(jià)值[52]。當(dāng)ENc值越小時(shí),其密碼子的偏好程度高。因此,通過(guò)比較ENc值可以確定內(nèi)源基因表達(dá)量的相對(duì)高低[52]。本研究中,喉毛花屬物種的ENc范圍在55~57之間(均大于35),說(shuō)明該屬物種的葉綠體基因密碼子偏好性較弱。
喉毛花屬下物種系統(tǒng)發(fā)育關(guān)系重建結(jié)果顯示,基于CDS、密碼子位置與基因間隔區(qū)數(shù)據(jù)集的系統(tǒng)發(fā)育樹均表現(xiàn)出高度一致的拓?fù)浣Y(jié)構(gòu)。該結(jié)果進(jìn)一步支持喉毛花屬植物為單系類群,肋柱花屬植物為該屬的近緣類群,與之前的研究結(jié)果[18]保持一致。在支持率良好的喉毛花屬下的系統(tǒng)發(fā)育關(guān)系結(jié)果中,皺邊喉毛花、長(zhǎng)梗喉毛花和鐮萼喉毛花各自并未按物種進(jìn)行聚類,而是相互嵌套,在聯(lián)合IGS區(qū)構(gòu)建的系統(tǒng)發(fā)育樹中也出現(xiàn)類似結(jié)果,進(jìn)一步支持ITS、matK基因系統(tǒng)發(fā)育樹的結(jié)果[20]。利用質(zhì)體基因組數(shù)據(jù)重建喉毛花屬下物種系統(tǒng)發(fā)育關(guān)系的研究受到限制,無(wú)法明晰皺邊喉毛花及其近緣種之間的關(guān)系。在后續(xù)的研究中,需要對(duì)這些物種展開群體采樣并進(jìn)行物種分化研究。
本研究利用二代測(cè)序技術(shù)對(duì)皺邊喉毛花及其近緣物種進(jìn)行了葉綠體基因組的測(cè)序與組裝,獲得的測(cè)序數(shù)據(jù)用于分析葉綠體基因組比較、進(jìn)化、密碼子偏好性等分析,并基于不同數(shù)據(jù)集和變異程度較高的基因間隔區(qū)聯(lián)合進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建,所呈現(xiàn)的系統(tǒng)發(fā)育拓?fù)浣Y(jié)構(gòu)一致。然而,皺邊喉毛花及其近緣物種未按物種分類,各自并未形成獨(dú)立的分支。對(duì)于喉毛花屬下的物種分化問題需要開展進(jìn)一步的群體遺傳學(xué)研究,基于現(xiàn)有的成熟技術(shù),揭示屬下物種關(guān)系,闡明物種形成機(jī)制。