楊林,譚萍,姜月影,舒軍霞,王玉昌,王大瑋
西南山地森林資源保育與利用教育部重點實驗室,云南 昆明 650224
葉綠體是大部分具有光合作用的植物不可或缺的細胞器,其基因組的大部分基因擁有控制光合作用、自我復制和其他生物合成功能。憑借單親遺傳特性,葉綠體基因組在研究植物系統(tǒng)發(fā)育領(lǐng)域發(fā)揮著越來越重要的作用。近年來,隨著高通量測序技術(shù)的快速發(fā)展,有效縮短了測序技術(shù)的成本和時間,加速了植物葉綠體基因組組裝注釋的進程。大量葉綠體基因組序列的組裝為這些植物的種間親緣關(guān)系、物種分化、譜系地理學等方面的研究提供了數(shù)據(jù)支撐。
密碼子是生物體內(nèi)用于傳遞信息的重要組成部分,是連接DNA與蛋白質(zhì)之間的紐帶。密碼子的偏好性是指同種生物中的不同基因?qū)γ艽a子的使用頻率存在差異的現(xiàn)象。密碼子的突變偏好在一定程度上影響了外源基因的表達和蛋白質(zhì)的翻譯過程,是物種感應(yīng)自然環(huán)境變化從而引起的一種分子適應(yīng)機制。密碼子的偏好性分析可為蛋白結(jié)構(gòu)、基因功能、外源基因的轉(zhuǎn)錄和翻譯等研究提供理論依據(jù)。因此,對植物葉綠體基因組密碼子使用模式的偏好性進行分析可為基因工程的基因表達和載體選擇提供理論依據(jù)。
木蘭科Magnoliaceae植物是具有較高藥用、觀賞價值的經(jīng)濟樹種,是被子植物中最瀕危的科之一,其中以木蓮屬Bl.最為嚴重。木蓮屬植物主要分布于我國熱帶和亞熱帶地區(qū),富含大量單萜類和倍半萜類化合物,具有較好的抗腫瘤和抗癌活性,以及治療痙攣、潰瘍、炎癥等功效,為傳統(tǒng)藥用資源。粗梗木蓮Law、大果木蓮Hu et Cheng和毛果木蓮N.V.Tiep是木蘭科木蓮屬瀕危藥用植物,目前對這3個種的研究主要集中在繁殖方法、生理生殖及居群結(jié)構(gòu)等方面。本研究基于木蓮屬植物葉綠體的拼裝注釋結(jié)果,對其密碼子使用模式的偏性進行分析,以期為這3種木蓮屬瀕危藥用植物的基因表達和基因載體選擇等研究提供依據(jù)。
植物樣本由西南林業(yè)大學王大瑋教授于2020 年7 月14 日采集自云南省昆明植物研究所(102°10′E,24°23′N,海拔1 891 m),經(jīng)西南林業(yè)大學劉江華教授鑒定,分別為木蘭科木蓮屬植物粗梗木蓮Law、大果木蓮Hu et Cheng、毛果木蓮N.V.Tiep。
參照王大瑋等方法提取DNA,委托安諾優(yōu)達基因科技(北京)有限公司使用Illumina測序平臺進行高通量測序并將結(jié)果上傳至NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/),登錄號為粗梗木蓮MW415418、大果木蓮MW415419、毛果木蓮MW415421。
使用CodonW1.4.2軟件篩選出45條密碼子編碼序列(CDS)偏好參數(shù),分析獲得相對同義密碼子使用度(RSCU)、每條CDS的密碼子出現(xiàn)次數(shù)(N)和有效密碼子數(shù)(ENC);通過EMBOSS(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)獲得木蓮屬植物葉綠體基因組中各密碼子第1 位(GC)、第2 位(GC)、第3位(GC)及3位堿基(GC)的GC含量。3種木蓮屬植物葉綠體基因組的GC含量及ENC見表1。GC、GC、GC平均含量為47.12%~48.49%、40.22%~41.39%、30.23%~32.50%,GC平均含量為39.74%~40.43%,均小于50%,且GC>GC>GC,表明3 種木蓮屬植物葉綠體基因組均偏好使用A/U結(jié)尾的密碼子。粗梗木蓮、大果木蓮、毛果木蓮葉綠體基因組編碼區(qū)ENC分別為35.74%()~55.37%()、39.95%()~52.98()、35.74%()~52.98(),均大于35%,表明木蓮屬植物葉綠體基因組密碼子偏性較弱。
表1 3種木蓮屬植物葉綠體基因組密碼子不同位置GC含量(%)
利用SPSS19.0軟件對3種木蓮屬植物葉綠體基因組密碼子ENC、N和不同位置GC含量進行相關(guān)性分析,結(jié)果見圖1。3種木蓮屬植物葉綠體基因組密碼子的 GC、GC、GC與 GC呈極顯著相關(guān),GC與 GC呈極顯著相關(guān),但GC與GC、GC無顯著相關(guān)性,表明3種木蓮屬植物的第1、2位堿基之間差異較小,與第3位堿基差異較大。此外,ENC與GC極顯著相關(guān),與GC、GC的關(guān)系未達到顯著水平,表明木蓮屬密碼子最后一位堿基受到的偏性影響較大。
圖1 3種木蓮屬植物葉綠體基因組密碼子數(shù)據(jù)相關(guān)性分析
中性繪圖分析可以初步辨別影響密碼子使用偏性的因素。若圖中所有基因沿對角線分布,回歸系數(shù)接近于1,即GC和GC的變異基本相同,表明該基因受突變的影響較大,受自然選擇的影響小,反之則說明該基因受到自然選擇的壓力較大。3種木蓮屬植物葉綠體基因組中性繪圖分析見圖2。粗梗木蓮、大果木蓮、毛果木蓮的GC分別為0.224 4~0.369 3、0.274 5~0.369 3、 0.274 5~0.369 3; GC分 別 為0.345 90~0.557 55、0.380 45~0.505 25、0.345 90~0.505 25。回歸系數(shù)為-0.262 7~0.049 1,其中粗梗木蓮和毛果木蓮GC與GC呈負相關(guān),大果木蓮呈正相關(guān),回歸系數(shù)顯示均無顯著相關(guān)性,表明密碼子偏好使用受自然選擇影響較大,受突變的影響較小。
圖2 3種木蓮屬植物葉綠體基因組中性繪圖分析
ENC-plot分析可直觀表明密碼子的使用模式和偏好性形成受到自然選擇及突變的影響程度。ENC值理論范圍為20~61,該值越接近20表示該基因受到自然選擇的影響較弱,反之則受自然選擇影響較大。3種木蓮屬植物葉綠體基因組ENC-plot繪圖分析見圖3,結(jié)果顯示大部分基因離標準曲線有一定的距離,ENC實際值與期望值存在一定差異,表明自然選擇作用對密碼子的影響較大,但部分基因位于標準曲線周圍,ENC實際值與期望值基本相似,表明突變對這些密碼子影響較大。以上數(shù)據(jù)表明3種木蓮屬植物葉綠體基因組密碼子的使用偏好性同時受到突變和自然選擇的影響,其中自然選擇為主要影響因素。
圖3 3種木蓮屬植物葉綠體基因組ENC-plot分析
若PR2-plot平面圖內(nèi)的基因均勻分布,則說明密碼子中各堿基的A、U、C和G使用頻率相同。3種木蓮屬植物葉綠體基因組PR2-plot繪圖分析見圖4??梢姡?種木蓮屬植物的葉綠體基因呈不規(guī)則分布,其中大部分基因分布在圖中左下角。U/C在密碼子最后一位出現(xiàn)的頻率較高,且G與C、A與U的使用頻率不相同,表明3種木蓮屬植物葉綠體基因組密碼子的使用偏性受到多種因素的共同影響。
圖4 3種木蓮屬植物葉綠體基因組PR2-plot繪圖分析
同時符合高頻及高表達條件的密碼子被認定為最優(yōu)密碼子。以RSCU>1 為條件,篩選出高頻密碼子;以ENC值為參考,從大到小排序,篩選最高和最低兩端各10%的基因,建立高、低表達基因庫,以ΔRSCU(高表達基因RSCU-低表達基因RSCU)≥0.08為條件,篩選出高表達密碼子。結(jié)果粗梗木蓮、大果木蓮、毛果木蓮分別確定了15、12、16個最優(yōu)密碼子,共43個最優(yōu)密碼子。其中,23個密碼子以A結(jié)尾,12個密碼子以U結(jié)尾4,6個密碼子以C結(jié)尾,2個密碼子以G結(jié)尾。3個物種共有的最優(yōu)密碼子有5個,分別為編碼纈氨酸(Val)的GUU和GUA、編碼絲氨酸(Ser)的UCA、編碼脯氨酸(Pro)的CCA、編碼丙氨酸(Ala)的GCA。見表2。
表2 3種木蓮屬植物葉綠體基因組最優(yōu)密碼子分析
粗梗木蓮、大果木蓮、毛果木蓮一直以來被用于治療炎癥等疾病。近年來隨著生物信息技術(shù)的發(fā)展,發(fā)現(xiàn)其體內(nèi)含有的單萜類和倍半萜類化合物具有較高的抗癌活性。隨著需求量不斷增加,粗梗木蓮、大果木蓮、毛果木蓮均呈瀕危狀態(tài),野生資源不斷減少,因此亟須對其進行保護和引種研究。目前,從葉綠體基因組層面對3種木蓮屬瀕危藥用植物的研究未見報道,因此本研究通過對其葉綠體基因組密碼子偏好性進行分析,為其植物保護利用和引種馴化等研究提供理論依據(jù)。
研究表明,密碼子的使用偏性與GC含量密切相關(guān)。本研究3種木蓮屬瀕危藥用植物葉綠體基因組密碼子的GC、GC、GC和GC平均含量均小于50%,表明其偏好使用A/U結(jié)尾的密碼子和堿基,這與前人對于木蓮屬其他物種的堿基使用偏性研究結(jié)果一致。推測可能與植物富含A/U堿基并且進化過程中相對保守的關(guān)系有關(guān)。同時本研究結(jié)果與竹亞科、茄科等高等植物結(jié)果一致,也說明高等植物的密碼子在使用偏性上具有一定的相似性。相關(guān)性分析發(fā)現(xiàn),3種木蓮屬植物葉綠體基因組密碼子3個位置上堿基的GC含量之間無顯著相關(guān)性,其中ENC值僅與第3位上的GC含量呈顯著相關(guān),由此可見其密碼子最后一位堿基受到的偏性影響較大。
自然選擇和突變是影響密碼子使用偏性的最主要因素。3種瀕危木蓮屬植物葉綠體基因組密碼子中性繪圖、PR2-plot 繪圖及ENC-plot 繪圖分析結(jié)果顯示,其回歸系數(shù)均無顯著相關(guān)性;大部分密碼子ENC值和期望值差異較大,但也有少部分基因差異較小。說明3種瀕危木蓮屬植物葉綠體基因組密碼子的使用偏性同時受到了自然選擇和突變的影響,其中自然選擇為主要因素。這與同屬的香木蓮、大葉木蓮、川滇木蓮等近緣種的分析結(jié)果一致,表明絕大多數(shù)情況下近緣種之間對密碼子使用偏性的影響因素相似,密碼子的使用偏好不是受到選擇或突變中某個單一因素的影響,而是共同作用的結(jié)果。
本研究在3種瀕危木蓮屬藥用植物葉綠體基因組中確定了GUU、GUA、UCA、CCA、GCA等43個最優(yōu)密碼子,其中以A結(jié)尾有23個,以U結(jié)尾的有12個,可以看出木蓮屬最優(yōu)密碼子大部分是以A/U結(jié)尾。在3種瀕危木蓮屬植物葉綠體基因組的最優(yōu)密碼子中,粗梗木蓮、大果木蓮、毛果木蓮的RSCU最高值密碼子分別是編碼亮氨酸(Leu)的CUU、編碼纈氨酸(Val)的GUU、編碼精氨酸(Arg)的AGA,說明3種瀕危藥用木蓮屬物種中使用頻率最高的密碼子和對應(yīng)編碼的氨基酸各不相同,這與季凱凱等對木蓮屬植物的最優(yōu)密碼子研究結(jié)果一致,表明不同物種之間在密碼子和氨基酸的使用上存在一定差異。研究表明,可利用物種的葉綠體基因組密碼子使用頻率的差異來推斷該物種的氨基酸含量,因此對3種瀕危木蓮屬藥用植物葉綠體基因組密碼子的使用頻率進行比較,發(fā)現(xiàn)其密碼子使用頻率基本相同,僅毛果木蓮中編碼精氨酸(Arg)的AGA與其他密碼子的使用頻率差異較大,因此推測毛果木蓮中的精氨酸含量可能較高。
本研究通過木蓮屬植物的密碼子使用偏好性分析發(fā)現(xiàn),3個瀕危物種的密碼子使用偏性均受到選擇和突變的共同影響,但更多受到自然選擇的影響。分析篩選出的最優(yōu)密碼子,揭示物種基因工程中的基因表達和基因載體選擇等方面的重要信息,可為后續(xù)3種瀕危木蓮屬藥用植物進行外源基因密碼子改造及重要經(jīng)濟性狀的改良提供理論依據(jù)。