史 鵬
(山西省林業(yè)科學研究院,山西太原030012)
蘋果(Malus pumila)是薔薇科蘋果亞科蘋果屬植物,其與葡萄(Vitis vinifera)、柑橘(Citrus reticulat a Blanco.)和香蕉(Musa nana Lour.)并稱為世界四大水果。蘋果性味溫和,富含礦物質、維生素和碳水化合物等營養(yǎng)物質,是一種“全方位的健康水果”,深受大眾喜愛[1-3]。蘋果樹是山西省重要的水果經(jīng)濟林樹種,2016 年山西省蘋果樹栽培面積33.23 萬hm2,產(chǎn)量達到550.7 萬t。提高蘋果風味及品質,對于促進山西省國土增綠、林業(yè)增效、農(nóng)民增收具有重要意義[4-5]。
蔗糖含量是決定蘋果風味、品質的關鍵因素之一,蔗糖是植物光合作用產(chǎn)物儲存、轉運的關鍵物質之一。蔗糖轉運蛋白(Sucrose transport protein,SUT 或sucrose carriers,SUC)通過偶聯(lián)H+-ATP 酶形成膜電位差,實現(xiàn)蔗糖的跨質膜運輸,因此,其也被稱為蔗糖-H+共轉運蛋白[6]。該蛋白在植物碳水化合物的長距離運輸中扮演關鍵角色,并參與植物生長發(fā)育、能量運輸與調(diào)節(jié),可能與經(jīng)濟作物甜菜(Beta vulgaris)、蘋果(Malus pumila)和甘蔗(Saccharum officinarum)等的產(chǎn)量與品質直接相關[7]。蔗糖轉運蛋白屬于易化擴散載體家族(Major facilitator superfamily,MFS),該蛋白家族成員通常含有12 個富含α- 螺旋的疏水跨膜結構域,面向細胞質的游離N- 端以及序列中段面向細胞質的親水胞質環(huán)區(qū)域,該親水胞質環(huán)區(qū)域序列較長,能將蔗糖轉運蛋白分隔為前后2 個半?yún)^(qū),每個半?yún)^(qū)含有6 個跨膜結構域[8]。根據(jù)氨基酸序列的相似性,植物蔗糖轉運蛋白分為5 個家族,其中,雙子葉植物含有SUT1,SUT2 和SUT4 家族;單子葉植物含有SUT2,SUT4,SUT3 和SUT5 家族[9]。
近年來,隨著高通量測序技術的改進和多種重要植物基因組數(shù)據(jù)的公布,為植物蔗糖轉運蛋白家族研究奠定了基礎。研究者已從擬南芥(Arabidopsis thaliana)[10]、水稻(Oryza sativa)[11]、巴西橡膠樹(Hevea brasiliensis)[12]、葡萄(Vitis vinifera L.)[13]基因組中分別鑒定出9,5,6,6 個蔗糖轉移蛋白基因序列,但目前蘋果的相關研究還相對較少。
本研究充分挖掘蘋果基因組數(shù)據(jù)庫,以蘋果蔗糖轉運蛋白為主要研究對象,從蘋果基因組中鑒定蔗糖轉移蛋白基因,并對其進行蛋白序列以及系統(tǒng)發(fā)育分析,旨在為利用蔗糖轉運蛋白基因進行蘋果分子育種和優(yōu)良品種選育提供有益信息。
首先利用蘋果全基因組cDNA 序列構建Blast本地數(shù)據(jù)庫,以擬南芥蔗糖轉運蛋白為種子序列,針對蘋果基因組cDNA 序列執(zhí)行本地Blast 搜索(使用默認參數(shù))。對搜索得到的cDNA 序列進行去冗余后,再經(jīng)過Blast X 軟件(https://blast.ncbi.nlm.nih.gov/Blast.cgi)在線對比和注釋后,得到蘋果基因組中蔗糖轉運蛋白的基因序列。
根據(jù)Blast X 軟件在線比對結果,并結合DNA translate(https://web.expasy.org/translate/)軟 件 預 測結果,將蘋果蔗糖轉運蛋白基因DNA 序列翻譯為氨基酸序列。利用ClustalW 軟件在默認參數(shù)下,將擬南芥蔗糖轉運蛋白的氨基酸序列與蘋果蔗糖轉移酶蛋白的氨基酸序列進行多序列聯(lián)配,將序列聯(lián)配文件導入MEGA 7 軟件,通過鄰接法(Neighbor-Joining method,NJ)構建系統(tǒng)進化樹(Bootstrap值為1 000)。
采用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html),NetNGlyc 1.0(http://www.cbs.dtu.dk/services/NetNGlyc/#opennew w-indow),NetOGlyc 4.0 Server(http://www.cbs.dtu.dk/services/NetOGlyc/)和ProtParam(https://web.expasy.org/protparam/)等軟件對蘋果蔗糖轉運蛋白的二級結構、糖基化修飾位點、蛋白分子量、理論等電點等參數(shù)進行在線預測。使用SignalIP 4.1 軟件(http://www.cbs.dtu.dk/services/SignalP/) 和TMHMM 軟 件(http://www.cbs.dtu.dk/services/TMHMM/)分別對該蛋白的信號肽和跨膜區(qū)結構進行預測。
從NCBI 數(shù)據(jù)庫下載擬南芥9 個蔗糖轉移蛋白基因序列(基因名稱/ 登錄號:SUC1/Q39232,SUC2/Q39231,SUC3/O80605,SUC4/Q9FE59,SUC5/Q9C8X2,SUC6/Q6A329,SUC7/Q67YF8,SUC8/AEC0 6318 和SUC9/Q9FG00),再利用上述序列針對蘋果基因組cDNA 序列執(zhí)行TBLASTX 搜索。結果顯示,蘋果基因組中含有7 個待定蔗糖轉移蛋白基因序列,對應蘋果基因組ID 號分別為MD05G1040000,MD10G1045900,MD15G1394000,MD08G1209900,MD16G1075900,MD13G1074600 和MD12G1059700(表1)。
表1 蘋果基因組中蔗糖轉運蛋白基因序列信息
進一步使用Blast X 軟件將2.1 得到的7 個待定基因與Nr 數(shù)據(jù)庫進行比對,結果顯示,蘋果蔗糖轉移蛋白基因與來自中國白梨(Pyrus bretschneideri)的相應蔗糖轉移蛋白序列最為相似(表1),其中,有6 個基因為全長序列,其cDNA 長度范圍是1 667~2 635 bp,只有MD12G1059700 基因缺少5′- 端序列。使用ClustalW 軟件,將擬南芥9 個蔗糖轉移蛋白基因序列和蘋果6 個蔗糖轉移蛋白基因全長序列進行多序列聯(lián)配,將聯(lián)配結果導入MEGA 7軟件,并構建NJ 系統(tǒng)發(fā)育樹(圖1),結果顯示,隸屬于SUT1 家族的7 個擬南芥蔗糖轉移酶蛋白基因(AtSUC1,AtSUC2,AtSUC5,AtSUC6,AtSUC7,AtSUC8 和AtSUC9) 與蘋果基因組MD05G1040000 和MD10G1045900 基因聚為一支;隸屬于SUT4 家族的擬南芥蔗糖轉移酶蛋白基因(AtSUC4)與MD15G1394000 和MD08G1209900 基因聚為一支;隸屬于SUT2 家族的擬南芥蔗糖轉移酶蛋白基因(AtSUC3)與蘋果基因組MD16G1075900 和MD13G 1074600 基因聚為一支?;谙到y(tǒng)發(fā)育結果,分別將蘋果MD05G1040000 和MD10G1045900 基因命名為SUT1-like1 和SUT1-like2,將MD15G1394000和MD08G1209900 基因分別命名為SUT4-like1 和SUT4-like2,將MD16G1075900 和MD13G1074600基因分別命名為SUT2-like1 和SUT2-like2。
表2 蘋果蔗糖轉運蛋白氨基酸全長序列信息
6 個蔗糖轉移蛋白全長基因對應的蛋白序列長度范圍是507~612 個氨基酸,蛋白相對分子量范圍是54.04~65.69 ku,理論等電點范圍是6.46~9.72(表2)。
上述6 個全長序列均無信號肽和N- 糖基化位點,但存在1~8 個O- 糖基化位點。蘋果蔗糖轉移酶蛋白序列的中部親水胞質環(huán)將該蛋白序列分為前后2 個半?yún)^(qū),SUT1-like2 的前半?yún)^(qū)含有5 個跨膜區(qū),后半?yún)^(qū)含有6 個跨膜區(qū);SUT2-like1 和SUT2-like2 前半?yún)^(qū)含有5 個典型跨膜區(qū)和1 個疑似跨膜區(qū)(序列具有較高可能性,但未達閾值),后半?yún)^(qū)含有6 個跨膜區(qū);而SUT1-like1,SUT4-like1 和SUT4-like2 的前、后半?yún)^(qū)均含有6 個跨膜區(qū)(圖2)。上述6 個蛋白二級序列中,α- 螺旋占比最大(42.56%),無規(guī)則卷曲次之(38.15%),β- 折疊占比相對較少(15.35%),β- 轉角占比最少(3.95%)(表3)。
表3 蘋果蔗糖轉運蛋白二級結構信息
根據(jù)植物SUT 基因序列的同源性,可將SUT分為5 個家族,其中,雙子葉植物SUT 可分為SUT1,SUT2 和SUT4 家族;而單子葉植物SUT 可分為SUT2,SUT3,SUT4 和SUT5 家族,其中SUT2 和SUT4家族為單子葉和雙子葉植物所共有[14-15]。以擬南芥為代表的雙子葉植物,SUT 蛋白功能相對清晰[10]。SUT1 家族的蔗糖轉運蛋白具有高親和—低轉運能力;沉默煙草SUT1 基因后,煙草葉片光合作用產(chǎn)生的碳水化合物就不能有效運輸至其他組織,導致植株整體生長受到抑制。SUT4 家族的蔗糖轉運蛋白具有低親和—高轉運能力;已知的SUT4 家族蔗糖轉運蛋白主要位于植物細胞液泡膜上,負責將液泡儲存的蔗糖轉運至細胞質中。并可能在暗反應條件下進行韌皮部裝載。SUT2 家族的蔗糖轉運蛋白具有低親和—高轉運能力或具有蔗糖信號感應能力。SUT2 家族蛋白主要在韌皮部SE/CC 復合體表達,在種皮、根尖、花粉和防衛(wèi)細胞中也有高水平表達。
與擬南芥等模式植物相比,蘋果蔗糖轉移蛋白基因研究相對薄弱[16-17]。LI 等[18]從蘋果基因組中篩選得到5 個蔗糖轉運蛋白基因;而魏曉鈺[19]報道,蘋果基因組中有9 個蔗糖轉運蛋白基因。本研究表明,蘋果基因組中有7 個蔗糖轉運蛋白基因,造成蘋果蔗糖轉移蛋白基因數(shù)量差異的原因可能有2 點:一是在研究工作中,蔗糖轉移酶基因搜索方案、種子序列來源、Blast 程序搜索參數(shù)乃至基因鑒定閾值均存在差異;二是基因篩選研究工作分別基于不同品種蘋果的基因組。如LI 等[18]和魏曉鈺[19]的研究是基于2010 年意大利米開來農(nóng)業(yè)研究所公布的蘋果基因組(https://www.rosaceae.org/analysis/14),其DNA測序文庫基于嘎啦蘋果(Malus×domestica Borkh)[20]。而本研究基于2017 年法國Bucher 實驗室公布的蘋果基因組(https://iris.angers.inra.fr/gddh13/),其DNA測序文庫基于金冠蘋果(Golden delicious)[21]。由于近年來高通量測序技術的高速發(fā)展,金冠蘋果的測序質量遠高于嘎啦蘋果基因組的測序質量,具有較高的可靠性。
本研究從蘋果基因組中搜索獲得7 條蔗糖轉移蛋白待定cDNA 序列。其中,6 條cDNA 序列被鑒定為全長序列,cDNA 長度范圍是1 667~2 635 bp,對應編碼507~612 個氨基酸,包含11~12 個跨膜結構域。系統(tǒng)發(fā)育結果顯示,上述6 個蔗糖轉移酶蛋白分別屬于SUT1,SUT2 和SUT4 家族,可能具有與擬南芥蔗糖轉移酶相似的生物學功能。本研究結果將為利用蔗糖轉運蛋白基因進行蘋果分子育種和優(yōu)良品種選育提供有益信息。