黃琦 程建峰 朱衛(wèi)豐 褚懷亮 趙文峰 葛菲 吳波 丁立軍 張建華 余聰
摘要 [目的]尋求粉葛生長發(fā)育的蛋白調(diào)控機制。[方法]以高淀粉型贛葛1號(鮮葛根含淀粉20%,干葛根含淀粉35%)和低淀粉型贛葛2號(鮮葛根含淀粉14%,干葛根含淀粉25%)為材料,采用基于全掃描數(shù)據(jù)非依賴性采集高分辨率色譜-質(zhì)譜(DIA LC-MS)的定量蛋白質(zhì)組學技術(shù)得到差異蛋白質(zhì),并對差異蛋白進行GO富集、KEGG通路和KOG分析。[結(jié)果]2個不同粉葛葉片中有178個蛋白(101個上調(diào)和77個下調(diào))存在顯著差異,主要涉及分子功能,但|log2(FC)|>5.0的差異蛋白僅占11.2%。GO富集分析表明,差異蛋白主要富集在代謝過程、催化活性、水解酶活性、細胞部分、細胞內(nèi)部分、細胞質(zhì)部分和細胞內(nèi)細胞器類別。KEEG富集代謝途徑集中在苯丙氨酸生物合成、植物體內(nèi)的MAPK信號通路、次生代謝物生物合成、丙酮酸代謝和脂肪酸代謝。KOG分析顯示,差異蛋白功能主要歸為核苷酸轉(zhuǎn)運和代謝、核糖體結(jié)構(gòu)和生物發(fā)生、能量產(chǎn)生和轉(zhuǎn)換、信號轉(zhuǎn)導(dǎo)以及翻譯后蛋白修飾、周轉(zhuǎn)和伴侶機制。差異程度極大的蛋白依次為上調(diào)的類LHC Ⅱ型1葉綠素a-b結(jié)合蛋白、kunitz家族胰蛋白酶和蛋白酶抑制劑前體、凝集素類蛋白和幾丁質(zhì)酶同源物及下調(diào)的類溶酶體Pro-X羧肽酶、預(yù)測的類dCTP焦磷酸酶1、富含半胱氨酸的受體類蛋白激酶25和色氨酸轉(zhuǎn)氨酶相關(guān)蛋白4。[結(jié)論]研究結(jié)果為粉葛的生長發(fā)育、營養(yǎng)成分和活性物質(zhì)的合成及調(diào)控、遺傳改良及分子育種等提供數(shù)據(jù)支撐和技術(shù)途徑。
關(guān)鍵詞 粉葛;高淀粉型;低淀粉型;定量蛋白組學;差異蛋白;DIA LC-MS
中圖分類號 R284? 文獻標識碼 A? 文章編號 0517-6611(2023)14-0168-10
作者簡介 黃琦(1984—),男,江西橫峰人,高級農(nóng)藝師,碩士,從事葛新品種選育及高產(chǎn)高效栽培利用研究。
*通信作者,教授,博士,博士生導(dǎo)師,從事植物生理生態(tài)研究。
粉葛(Pueraria thomsonii)是豆科葛屬植物,多年生落葉藤本[1]。粉葛具有解肌退熱、生津止渴、透疹、升陽止瀉、通經(jīng)活絡(luò)、解酒毒之功效[2],目前常應(yīng)用于臨床治療一些高血壓、高血脂、高血糖。粉葛中含有大量的維生素和微量元素,用于治療風熱感冒、麻疹、痢疾、腹瀉、吐血、尿血等疾病,還可以增加免疫功能和抗衰老,已被用于保健食品和生物醫(yī)藥等領(lǐng)域[3]。粉葛是我國傳統(tǒng)的藥食同源植物,其根為肉質(zhì),粗壯肥大,最豐富的營養(yǎng)物質(zhì)為淀粉,為鮮重的15%~20%、干重的25%~35%,干重含量最高可達47%[4-5]。粉葛的葛根產(chǎn)量及淀粉含量與品種特性及栽培措施密切相關(guān)。張應(yīng)等[4]研究表明,苕葛1號干重淀粉含量最高(46.39%),地金2號干重淀粉含量最低(29.92%),5—12月淀粉含量逐月增加;黃榮韶等[6]認為,保留3條根2條枝時,粉葛塊根的淀粉含量最高;趙婧文等[7]研究表明,粉葛中的淀粉含量與葛根素含量呈顯著負相關(guān);顧彩霞[8]研究顯示,云南地區(qū)野生葛根淀粉含量較高(12.12%~21.80%),河北地區(qū)淀粉含量較低(4.41%~10.86%),穴施25 g磷肥時粉葛淀粉含量顯著提高了1.78倍,粉葛塊根中淀粉含量與土壤中速效磷和速效鉀含量呈顯著正相關(guān);朱盼等[9]研究發(fā)現(xiàn),不同產(chǎn)地粉葛不同部位的化學成分含量差異較大,粉葛不同部位可以發(fā)揮藥用、食用的不同作用,實現(xiàn)對其的綜合利用;何明慧等[10]研究表明,粉葛塊根中的淀粉含量隨有機肥用量的增加呈先升后降的趨勢,以6 000 kg/hm2較合適。但人們對粉葛中淀粉合成的內(nèi)在調(diào)控機制研究較少,限制了粉葛品種的遺傳改良和高淀粉含量的良種選育。
蛋白質(zhì)是生命代謝活動的直接體現(xiàn)者,所有生命體性狀表達功能均由蛋白質(zhì)承擔,隨著眾多植物基因組學和轉(zhuǎn)錄組學研究的不斷深入,作為在蛋白質(zhì)水平上解釋基因表達調(diào)控機制的蛋白質(zhì)組學是后基因組時代的重要研究領(lǐng)域,對蛋白質(zhì)的功能分析、鑒定及翻譯后修飾的研究將會極大地闡明基因功能,更加客觀準確地揭示生命現(xiàn)象[11-13]。基于全掃描數(shù)據(jù)非依賴性采集高分辨率色譜-質(zhì)譜(data independent acquisition liquid chromatography-mass spectrometry,DIA LC-MS)的定量蛋白質(zhì)組學技術(shù)由蛋白質(zhì)組學屆Aebersold教授開創(chuàng)[14],該技術(shù)融合了傳統(tǒng)蛋白質(zhì)組學“鳥槍法”(shotgun)和質(zhì)譜絕對定量“金標準”選擇反應(yīng)監(jiān)測/多反應(yīng)監(jiān)測(SRM/MRM)技術(shù)的優(yōu)勢和特點,且DIA技術(shù)將質(zhì)譜整個全掃描范圍分為若干個窗口,高速、循環(huán)地對每個窗口中的所有離子進行選擇、碎裂、檢測,從而無遺漏、無差異地獲得樣本中所有離子的全部碎片信息,具有全景式動態(tài)掃描、更大的識別率、更高的重現(xiàn)性和靈敏度、更少的缺失值、數(shù)據(jù)可回溯等優(yōu)勢[15-18]。但DIA LC-MS技術(shù)也存在需要建立高質(zhì)量的DIA蛋白光譜庫、數(shù)據(jù)獲取比較昂貴、數(shù)據(jù)分析相對復(fù)雜和需要一定的專業(yè)知識等不足[19-23],故目前主要用于生物醫(yī)學和藥學上[22-30],在植物上的應(yīng)用較少。鑒于此,為揭示淀粉含量存在明顯差異的2個粉葛品種葉片在蛋白水平的差異,該研究選取了高淀粉型贛葛1號(鮮葛根淀粉含量20%和干葛根含淀粉35%)和低淀粉型贛葛2號(鮮葛根淀粉含量14%和干葛根含淀粉25%)為材料,采用DIA LC-MS定量蛋白質(zhì)組學技術(shù)來解析它們間的蛋白差異,為粉葛的生長發(fā)育、營養(yǎng)成分和活性物質(zhì)的合成及調(diào)控、遺傳改良及分子育種等提供數(shù)據(jù)支撐和技術(shù)途徑。
1 材料與方法
1.1 供試材料
選用2個淀粉含量存在明顯差異的粉葛品種,分別為高淀粉型贛葛1號(鮮葛根淀粉含量20%和干葛根含淀粉35%)和低淀粉型贛葛2號(鮮葛根淀粉含量14%和干葛根含淀粉25%),取樣部位為主藤頂部功能葉,采自江西綠色生態(tài)葛研究所種植基地。
1.2 試驗原理
試驗共2組樣品,3個生物學重復(fù)。將6個樣品中提取的蛋白等量混合為一個新的樣品進行建庫,在這個基礎(chǔ)上進行數(shù)據(jù)庫檢索,再通過數(shù)據(jù)依賴采集技術(shù)進行數(shù)據(jù)采集建庫,之后將6個樣品依次進行非數(shù)據(jù)依賴采集對樣本進行相對定量分析。在準備樣品期間,所有待測樣品中都添加iRT肽段進行一定時間矯正和質(zhì)譜峰提取。采集到的DIA數(shù)據(jù)通過Spectronaut 14軟件進行數(shù)據(jù)歸一化和蛋白質(zhì)的相對定量,通過單向方差分析測試計算p值。
1.3 樣品前處理
1.3.1 樣品準備。
在液氮中進行樣品研磨,隨后加入2 mL細胞裂解液,于冰上超聲裂解1 h后高速離心30 min(8 000 r/min,4 ℃)。加入等體積的Tris-HCl苯酚飽和溶液(pH 7.5),混合液于4 ℃搖勻(約30 min)。高速離心15 min(4 ℃,8 000 r/min),取上層酚相。重復(fù)萃取1次。加入5倍體積丙酮溶液于-20 ℃沉淀過夜。沉淀蛋白用丙酮溶液沖洗2次,凍干,用含1% SDS的8 mol/L尿素溶液重溶。
1.3.2 蛋白酶解。
將每種條件下100 μg蛋白質(zhì)轉(zhuǎn)移到新的艾本德(Eppendorf)管,用8 mol/L尿素將最終體積調(diào)節(jié)至100 μL。加入2 μL 0.5 mol/L TCEP,在37 ℃孵育1 h。然后向樣品中加入4 μL 1 mol/L碘乙酰胺,在室溫避光下持續(xù)孵育40 min。之后,在樣品中加入5倍體積的-20 ℃預(yù)冷丙酮,在-20 ℃下過夜沉淀蛋白質(zhì)。沉淀物用1 mL預(yù)冷的90%丙酮水溶液洗滌2次,然后重新溶解在100 μL 100 mmol TEAB中。以1∶50(酶∶蛋白質(zhì),質(zhì)量比)的比例加入序列級修飾的胰蛋白酶,在37 ℃下過夜酶解蛋白質(zhì)。肽混合物通過除鹽柱除鹽,通過皮爾斯肽段定量試劑盒測定其最終濃度并凍干。
1.4 建立數(shù)據(jù)庫
1.4.1 高pH反相分離。
將肽段混合物在緩沖液A(20 mmol/L甲酸銨水溶液,用氨水調(diào)節(jié)pH至10.0)中重新溶解,然后用Ultimate 3000系統(tǒng)連接反向柱進行高pH分離,使用線性梯度進行高酸堿度分離,在40 min內(nèi)緩沖液B(80%乙腈中加入20 mmol/L 甲酸銨,用氨水調(diào)節(jié)pH至10.0)從5%到45%。柱子在初始條件下重新平衡15 min,柱流速保持在1 mL/min,柱溫保持在30 ℃。共收集到8個餾分,每個餾分在真空濃縮器中干燥,以便下一步操作。
1.4.2 Nano-HPLC-MS/MS分析。
除鹽凍干后的肽段被重新溶解在溶劑A(0.1%甲酸水溶液)中,由配備在線納噴離子源的LC-MS/MS分析。色譜柱為C18(3 mm×50 mm×3 μm),進行120 min梯度分離。色譜梯度如表1所示,其中,流動相A為0.1%甲酸水溶液,流動相B為含0.1%甲酸的乙腈溶液。色譜柱流速維持在400 nL/min,電噴霧電壓為2 kV。
1.4.3 搜庫。
原始數(shù)據(jù)由Spectronaut 14(Biognosys AG)在默認設(shè)置下處理和分析,生成一個初始數(shù)據(jù)庫,其中包含44 057個母離子、32 067個肽段、5 830個蛋白質(zhì)和5 642個蛋白質(zhì)組。搜庫參數(shù)固定修飾為Carbamidomethyl(C),可變修飾為methionine氧化。母離子和肽段水平的假陽性率設(shè)置為1%。
1.5 DIA數(shù)據(jù)采集與分析
1.5.1 Nano-HPLC-MS/MS數(shù)據(jù)采集。
將肽段重新溶于溶劑A(0.1%甲酸水溶液)中,從中取出9 μL并加入1 μL 10×iRT肽段,混合后用nano-LC分離,再由在線電噴霧串聯(lián)質(zhì)譜分析。上樣量為2 μL,進行120 min梯度分離,柱的流量保持在400 nL/min,采用2 kV的電噴電壓。色譜梯度如表1所示,其中流動相A為0.1%甲酸水溶液,流動相B為含01% 甲酸的乙腈溶液。
1.5.2 數(shù)據(jù)分析。
1.5.2.1 差異表達蛋白篩選。
DIA的原始數(shù)據(jù)由Spectronaut 14(Biognosys AG)以默認設(shè)置參數(shù)進行處理和分析,保留時間預(yù)測類型設(shè)置為動態(tài)iRT。Spectronaut 14根據(jù)廣泛的質(zhì)量校準確定數(shù)據(jù)提取,且根據(jù)iRT校準和梯度穩(wěn)定性動態(tài)確定理想的提取窗口。通過過濾器的所有選定前體都用于定量,除了3個干擾最小的離子外,MS2干涉將去除所有干擾碎片離子。經(jīng)單因素方差分析后,如果某個蛋白表達的p值<0.05且差異倍數(shù)絕對值>1.5,則判定為差異表達蛋白。
1.5.2.2 差異蛋白GO分析。
使用Blast2GO version 5進行功能注釋,采用GOATOOLS進行差異蛋白功能富集。GO分析根據(jù)三點(分子功能、細胞器組成和生物過程)注釋和分類基因及其對應(yīng)的產(chǎn)物來獲取蛋白質(zhì)的功能信息。GO分析后根據(jù)挑選出的差異基因,計算這些差異基因與GO 分類中某(幾)個特定的分支的超幾何分布關(guān)系,GO 分析會對每個有差異基因存在的GO 存在一個特定p值,p值越小表示差異基因在該GO 中富集程度越大。
1.5.2.3 差異蛋白KEGG分析。
通路分析使用KOBAS(http://kobas.cbi.pku.edu.cn/)進行。與GO分析類似,p值越小表示差異基因在該KEGG中富集程度越大。當p值小于某一個閾值時(一般設(shè)為0.05),認為該功能是可信的,同時根據(jù)p值進行錯誤發(fā)現(xiàn)率(FDR)校正計算后,獲得校正后的p值,可根據(jù)實際需要選取p值或校正后的p值來判定可信度。
1.5.2.4 差異蛋白KOG分析。
KOG數(shù)據(jù)庫(EuKaryotic Orthologous Groups)包括來自7個真核生物基因組的蛋白質(zhì),包括3種動物(智人、黑腹果蠅和秀麗隱桿線蟲),1種植物(擬南芥),2種真菌(粟酒裂殖酵母和釀酒酵母),1種細胞內(nèi)微孢子蟲(寄生蟲)。 KOG數(shù)據(jù)庫由4 852個直系同源簇組成,其中包括59 838個蛋白質(zhì),655個基因產(chǎn)物。
KOG提供了4個功能組,每個功能組又細分為由字母表中的字母確定的KOG分類。在每個分類中,直系同源或旁系同源蛋白質(zhì)組被分配一個KOG ID。對KOG分類的考察揭示了所有分析物種中存在的保守核心,約占KOG集合的20%。
2 結(jié)果與分析
2.1 蛋白鑒定與分布
圖1顯示,大部分蛋白質(zhì)表達沒有變化,少部分表現(xiàn)為上調(diào)和下調(diào)。根據(jù)獲得數(shù)據(jù)分析發(fā)現(xiàn),一共鑒定到5 111個蛋白,相對于贛葛1號,贛葛2號中有2 625個蛋白上調(diào)、2 271個蛋白下調(diào)和215個蛋白沒變化;符合原始p值< 0.05且差異倍數(shù)絕對值>1.5標準的,贛葛2號中有308個蛋白上調(diào)、214個蛋白下調(diào);符合調(diào)整后p值< 0.05且差異倍數(shù)絕對值>1.5標準的,贛葛2號中有101個蛋白上調(diào)、77個蛋白下調(diào);這說明造成贛葛1號和贛葛2號間本質(zhì)差異的蛋白主要是由178個蛋白引起的。
2.2 差異蛋白GO分析
圖2顯示,在生物過程(biological process)類別的20個二級分類中,第一梯隊從多到少依次是參與代謝過程(metabolic process)、小分子代謝過程(small molecular metabolic process)、碳水化合物代謝過程(carbohydrate metabolic process)的蛋白,第二梯隊從多到少依次為參與碳水化合物衍生物代謝過程(carbohydrate derivative metabolic process)、生物過程負調(diào)節(jié)(negative regulation of biological process)、催化活性調(diào)節(jié)(regulation of catalytic activity)、代謝過程負調(diào)節(jié)(negative regulative of metabolic process)、大分子代謝過程負調(diào)節(jié)(negative regulation of macromolecule metabolic process)、藥物分解代謝過程(drug catabolic process)、水解酶活性調(diào)節(jié)(regulation of hydrolase activity)、催化活性負調(diào)節(jié)(negative regulation of catalytic activity)、分子功能負調(diào)節(jié)(negative regulation of molecular function)、水解酶活性負調(diào)節(jié)(negative regulation of hydrolase activity)和氨基糖代謝過程(aminoglycan metabolic process)的蛋白,第三梯隊從多到少依次為參與含氨基葡萄糖化合物催化過程(glucosamine-containing compound catabolic process)、幾丁質(zhì)代謝過程(chitin metabolic process)、幾丁質(zhì)分解代謝過程(chitin catabolic process)、氨基糖分解代謝過程(amino sugar catabolic process)、氨基聚糖分解代謝過程(aminoglycan catabolic process)和含氨基葡萄糖化合物代謝化過程(glucosamine-containing compound metabolic process)的蛋白。在分子功能(molecular function)類別的20個二級分類中,第一梯隊從多到少依次是參與催化活性(catalytic activity)、水解酶活性(hydrolase activity)、作用于酯鍵的水解酶活性(hydrolase activity,acting on ester bonds)、作用于糖基鍵的水解酶活性(hydrolase activity,acting on glycosyl bonds)、水解O-糖基化合物的水解酶活性(hydrolase activity,hydrolyzing O-glycosyl compounds)的蛋白,第二梯隊從多到少依次為參與酶調(diào)節(jié)劑活性(enzyme regulator activity)、分子功能調(diào)節(jié)劑(molecular function regulator)、裂解酶活性(lyase activity)、酶抑制劑活性(enzyme inhibitor activity)、絲氨酸型肽酶活性(serine-type peptidase activity)、絲氨酸水解酶活性(serine hydrolase activity)和幾丁質(zhì)酶活性(chitinase activity)的蛋白,第三梯隊從多到少依次為參與幾丁質(zhì)結(jié)合(chitin binding)、內(nèi)肽酶抑制劑活性(endopeptidase inhibitor activity)、內(nèi)肽酶調(diào)節(jié)劑活性(endopeptidase regulator activity)、肽酶抑制劑活性(peptidase inhibitor activity)、激素結(jié)合(hormone binding)和肽酶調(diào)節(jié)劑活性(peptidase regulator activity)的蛋白,第四梯隊從多到少依次為參與纈氨酸-tRNA連接酶活性(valine-tRNA ligase activity)和胺裂解酶活性(ammoina-lyase activity)的蛋白。在細胞組分(cellular component)類別的20個二級分類中,第一梯隊從多到少依次是參與細胞部分(cell part)、細胞內(nèi)部分(intracellular part)、細胞質(zhì)部分(cytoplasmic part)和細胞內(nèi)細胞器(intracellular organelle)的蛋白,第二梯隊從多到少依次為參與胞質(zhì)溶膠(cytosol)、胞外區(qū)域(extracelluar region)、葉綠體部分(chloroplast part)、質(zhì)體部分(plastid part)、細胞壁(cell wall)、外部封裝結(jié)構(gòu)(external encapsulating structure)、葉綠體基質(zhì)(chloroplast stroma)和質(zhì)體基質(zhì)(plastid stroma)的蛋白,第三梯隊從多到少依次為參與植物型細胞壁(plant-type cell wall)、質(zhì)膜錨定成分(anchored component of plasma membrane)、質(zhì)外體(apoplast)和膜錨定成分(anchored component of membrane)的蛋白,第四梯隊從多到少依次為參與胞質(zhì)外RNase復(fù)合物的泌體(cytoplasmic exosome,RNase complex)、胞質(zhì)外核外泌體(nuclear exosome,RNase complex)、外泌體(exosome,RNase complex)和外泌核酸酶復(fù)合物(exoribonuclease complex)的蛋白??傮w來看,最主要的差異蛋白發(fā)生在代謝過程中的催化活性和細胞組分中的細胞器發(fā)生過程中(圖3)。
2.3 差異蛋白KEGG通路分析
將富集到的KEGG通路按照其所屬的分類進行歸類,如圖4所示,左邊的縱坐標顯示富集到的具體的代謝通路,右邊的縱坐標由外向內(nèi)依次表示富集到的代謝通路所屬的一級和二級分類名稱的縮寫,括號中的數(shù)字顯示該通路富集的p值。在一級通路上,代謝(A)占絕大部分,遺傳信息處理(B)和環(huán)境信息處理(C)分別只有蛋白的“折疊、排序和降解(BC)”和“信號轉(zhuǎn)導(dǎo)(CB)”1個二級通路,而代謝可分為總體和概覽(global and overview maps,AA)、碳水化合物代謝(carbohydrate metabolism,AB)、脂代謝(lipid metabolism,AD)、氨基酸代謝(amino acid metabolism,AF)、其他氨基酸代謝(metabolism of other amino acids,AG)、糖的生物合成和代謝(glycan biosynthesis and metabolism,AH)、輔因子和維生素的代謝(metabolism of cofactors and vitamins,AI)、萜類和聚酮化合物的代謝(metabolism of terpenoids and ployketides,AJ)和其他次生代謝物的生物合成(biosynthesis of other secondary metabolites,AK)9個二級通路,其中蛋白數(shù)目占總蛋白百分數(shù)最多的代謝通路有次生代謝物的生物合成(biosynthesis of secondary metabolites)、氨基酸糖和核苷酸糖類代謝(amino sugar and nucleotide sugar metabolism)、苯丙氨酸生物合成(phenylpropanoid biosynthesis)、植物的MAPK信號途徑(MAPK signaling pathway-plant)、RNA降解(RNA degradation)、丙酸代謝(propanoate metabolism)、淀粉及蔗糖代謝(starch and sucrose metabolism)等。所得的具體的富集KEGG通路見表2,所有的通路均與糖類、脂肪酸、氨基酸及一些次生代謝物的合成有關(guān),位居前5位的已知代謝途徑是苯丙氨酸的生物合成、植物體內(nèi)的MAPK信號通路、次生代謝物的生物合成、丙酮酸代謝、脂肪酸代謝。
2.4 差異蛋白KOG分析
圖5為使用KOG數(shù)據(jù)庫對差異蛋白進行基于序列相似度的功能分類注釋及預(yù)測,以柱形圖分別展示上/下調(diào)蛋白的不同KOG功能分類情況,紅色表示上調(diào)蛋白,黑色表示下調(diào)蛋白,X軸為各種COG分類,Y軸標明屬于該類別的蛋白數(shù)量。由圖5可知,在贛葛2號中,上調(diào)蛋白數(shù)目遠多于下調(diào)蛋白數(shù)目,其中位居前列的上調(diào)蛋白質(zhì)數(shù)目所屬類別從多到少依次為僅一般的功能預(yù)測(general function prediction only,R),核苷酸的轉(zhuǎn)運和代謝(nucleotide transport and metabolism,F(xiàn)),翻譯、核糖體結(jié)構(gòu)和生物發(fā)生(translation,ribosomal structure and biogenesis,J),能量產(chǎn)生和轉(zhuǎn)換(energy production and conversion,C),翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶(posttranslational modification,protein turnover,chaperones,O),信號轉(zhuǎn)導(dǎo)機制(signal transduction mechanisms,T);位居前列的下調(diào)蛋白質(zhì)數(shù)目所屬類別從多到少依次為僅一般的功能預(yù)測(general function prediction only,R),翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶(posttranslational modification,protein turnover,chaperones,O),碳水化合物的運輸和代謝(carbohydrate transport and metabolism,G),能量產(chǎn)生和轉(zhuǎn)換(energy production and conversion,C),脂質(zhì)運輸和代謝(lipid transport and metabolism,I),未知功能(function unknown,S)。
2.5 差異表達蛋白分析
表3表明,在贛葛2號的178個差異蛋白中,上調(diào)蛋白101個,下調(diào)蛋白77個,上調(diào)和下調(diào)蛋白中分別有91和66個被描述,涉及生物過程的上調(diào)和下調(diào)蛋白分別為56和40個,涉及分子功能的上調(diào)和下調(diào)蛋白分別為80和58個,涉及細胞組分的上調(diào)和下調(diào)蛋白分別為55和28個;在|log2(FC)|>5.0的差異蛋白中,上調(diào)蛋白13個,下調(diào)蛋白7個,上調(diào)和下調(diào)蛋白中分別有13和6個被描述,涉及生物過程的上調(diào)和下調(diào)蛋白分別為6和4個,涉及分子功能的上調(diào)和下調(diào)蛋白分別為12和4個,涉及細胞組分的上調(diào)和下調(diào)蛋白分別為6和3個;在|log2(FC)|>10.0的差異蛋白中,上調(diào)蛋白5個,下調(diào)蛋白2個,上調(diào)和下調(diào)蛋白中分別有5個和1個被描述,涉及生物過程的上調(diào)和下調(diào)蛋白分別為2和1個,涉及分子功能的上調(diào)和下調(diào)蛋白分別為5和1個,涉及細胞組分的上調(diào)和下調(diào)蛋白分別為2和0個;這說明差異蛋白主要與分子功能有關(guān),其次為生物過程和細胞組分,且只有少數(shù)差異蛋白的調(diào)節(jié)水平較高。
為了深入挖掘差異蛋白及功能,將GO注釋分類中每一類的|log2(FC)|位列前3的上調(diào)和下調(diào)差異蛋白列于表4。由表4可知,在生物過程類別中,上調(diào)程度最大的為Unigene 0019578編碼的類LHC Ⅱ型1葉綠素a-b結(jié)合蛋白(chlorophyll a-b binding protein of LHC Ⅱ type 1-like),其次為Unigene 0027341編碼的幾丁質(zhì)酶同源物(chitinase homologue)和Unigene 0048557編碼的MLP類蛋白423(MLP-like protein 423);下調(diào)程度最大的為Unigene 0028984編碼的類溶酶體Pro-X羧肽酶(lysosomal Pro-X carboxypeptidase-like)、其次為Unigene 0021523編碼的預(yù)測的類dCTP焦磷酸酶1(predicted:dCTP pyrophosphatase 1-like)和Unigene 0036013編碼的富含半胱氨酸的受體類蛋白激酶25(cysteine-rich receptor-like protein kinase 25)。在分子功能類別中,上調(diào)程度最大的為Unigene 0000855編碼的kunitz家族胰蛋白酶和蛋白酶抑制劑前體(kunitz family trypsin and protease inhibitor precursor),其次為Unigene 0000863編碼的kunitz家族胰蛋白酶和蛋白酶抑制劑前體(kunitz family trypsin and protease inhibitor precursor)和Unigene 0068213編碼的凝集素類蛋白(lectin-like protein);下調(diào)程度最大的為Unigene 0036605編碼的色氨酸轉(zhuǎn)氨酶相關(guān)蛋白4(tryptophan aminotransferase-related protein 4),其次為Unigene 0066349編碼的類發(fā)病相關(guān)蛋白1(pathogenesis-related protein 1-like)和Unigene 0008388編碼的α-葡萄糖苷酶(Alpha-glucosidase protein)。在細胞組分類別中,上調(diào)程度最大的為Unigene 0071598編碼的可能的木葡聚糖內(nèi)轉(zhuǎn)糖酶/水解酶蛋白6(probable xyloglucan endotransglucosylase/hydrolase protein 6),其次為Unigene 0027340編碼的幾丁質(zhì)酶同源物(chitinase homologue)和Unigene 0025707編碼的動態(tài)蛋白相關(guān)蛋白4C(dynamin-related protein 4C);下調(diào)程度最大的為Unigene 0045570編碼的Auxin結(jié)合蛋白ABP19a部分(Auxin-binding protein ABP19a,partial),其次為Unigene 0064846編碼的可能酯酶PIR7A亞型X1(probable esterase PIR7A isoform X1)和Unigene 0008951編碼的脅迫誘導(dǎo)蛋白SAM22(stress-induced protein SAM22)。綜合看來,差異程度巨大的蛋白依次為上調(diào)的類LHC Ⅱ型1葉綠素a-b結(jié)合蛋白、kunitz家族胰蛋白酶和蛋白酶抑制劑前體、凝集素類蛋白和幾丁質(zhì)酶同源物及下調(diào)的類溶酶體Pro-X羧肽酶、預(yù)測的類dCTP焦磷酸酶1、受體類蛋白激酶25和色氨酸轉(zhuǎn)氨酶相關(guān)蛋白4。
3 結(jié)論與討論
Wilkins 等[31]提出“蛋白質(zhì)組學(proteomics)”概念,是指從整體水平上研究蛋白質(zhì)的組成和調(diào)控規(guī)律,包括蛋白質(zhì)的表達水平、翻譯后修飾的種類和蛋白間的相互作用等,分為定性蛋白質(zhì)組學和定量蛋白質(zhì)組學[32]。近年來,高分辨率和靈敏度的質(zhì)譜設(shè)備及數(shù)據(jù)分析軟件不斷涌現(xiàn),為蛋白質(zhì)組學研究從定性轉(zhuǎn)向定量分析提供了良好的軟硬件基礎(chǔ)[33]。定量蛋白質(zhì)組學研究方法可分絕對定量和相對定量兩類,因絕對定量需要已知含量的標記肽段和高成本而存在應(yīng)用局限,故目前常用的是相對定量來比較樣本間的蛋白質(zhì)差異[34-35]。近些年來發(fā)展的數(shù)據(jù)非依賴性采集(data independent acquisition,DIA)結(jié)合了基于數(shù)據(jù)依賴性采集(data dependent acquisition,DDA)與選擇反應(yīng)監(jiān)測(Selected reaction monitoring,SRM)的特點,具有無需目標肽段、通量無上限、均勻采集信息、快速靈敏、高準確性、大重現(xiàn)性、數(shù)據(jù)可回溯、定性確證和定量離子篩選等優(yōu)勢[36-37]。
DIA技術(shù)剛開始建立不久,因需要事先建立高質(zhì)量的DIA蛋白光譜庫、數(shù)據(jù)獲取昂貴和數(shù)據(jù)分析復(fù)雜等問題使得其主要被生物醫(yī)學和藥學領(lǐng)域。隨著近些年的不斷改進完善和迅速發(fā)展,在植物研究中也逐漸被采用,但主要集中在大宗作物的籽粒成分、抗病性和滲透脅迫等,在藥食同源植物上應(yīng)用極少。Bromilow等[38]利用DDA和DIA相結(jié)合的方法對小麥面筋蛋白質(zhì)組進行全面分析,結(jié)合人工篩選的谷蛋白序列數(shù)據(jù)庫,共鑒定出2 736個谷蛋白肽,而2個平臺僅鑒定出157個肽,其中127份和63份谷蛋白肽分別含有至少1個和3個獨特肽段;在63種嚴格鑒定的蛋白中,包括26種麥膠蛋白(4種 ω-、14種 α-和8種 γ-麥膠蛋白)和37種谷蛋白(29種LMW谷蛋白和8種HMW谷蛋白)。Riebel等[39]DIA分析發(fā)現(xiàn),德國成熟Dornfelder葡萄漿果中的712個蛋白質(zhì),其中650個可以被Blast2GO軟件注釋,大部分蛋白質(zhì)均與應(yīng)激反應(yīng)有關(guān),所有糖酵解關(guān)鍵酶均在成熟葡萄果實中檢測到。Fan等[40]應(yīng)用DIA研究了番茄發(fā)病反應(yīng)前后期的蛋白質(zhì)組變化,在發(fā)病反應(yīng)早期,與伴侶直接相關(guān)的蛋白被防御蛋白調(diào)控;在后期,不僅防御蛋白被高度誘導(dǎo),且一套病原體相關(guān)分子模式觸發(fā)免疫(PTI)和效應(yīng)觸發(fā)免疫(ETI)相關(guān)蛋白也被高度誘導(dǎo)。Xie等[41]對殼聚糖處理后的水稻幼苗進行DIA分析,結(jié)果表明,殼聚糖可能上調(diào)水稻苗期植物生長相關(guān)的鈣離子結(jié)合、光合作用、RNA結(jié)合和分解代謝蛋白。Wang等[42]利用DIA技術(shù)對滲透脅迫下西藏青稞的蛋白質(zhì)組學進行比較分析,在所有樣品中共鑒定和定量了6 921個蛋白,一些激素代謝相關(guān)基因和植物激素脫落酸誘導(dǎo)基因主要受滲透脅迫的影響,活性氧調(diào)節(jié)蛋白活性增強。Sun等[43]基于DIA的定量蛋白質(zhì)組學揭示,共鑒定和定量了6 913個蛋白,篩選出3 513個差異豐富蛋白(DAPs),其中640個在生熱階段中高度豐富的蛋白質(zhì)主要參與三羧酸循環(huán)等碳代謝過程,枸櫞酸合成酶是蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)中連接最緊密的蛋白,交替氧化酶在花托中特別豐富;蓮花生熱作用涉及三羧酸循環(huán)代謝、淀粉和蔗糖代謝、脂肪酸降解和泛醌合成等復(fù)雜的蛋白調(diào)控網(wǎng)絡(luò)。該研究顯示,采用DIA LC-MS定量蛋白組學技術(shù)鑒定到高淀粉型和低淀粉型粉葛葉片中的5 111個蛋白,其中符合差異蛋白標準的是178個(101個上調(diào)和77個下調(diào)),僅占鑒定蛋白的3.48%;在差異蛋白中,與分子功能有關(guān)的最多(138個),其次是生物過程(106個)和細胞組分(83個),未被歸類的23個;這說明極少蛋白造成了不同淀粉含量粉葛葉片及品質(zhì)間的較大差異,一種蛋白參與或調(diào)控多個生理生化過程,但絕大部分的調(diào)控程度相對較小。GO和KEGG富集分析發(fā)現(xiàn),差異蛋白主要集中在物質(zhì)代謝(苯丙氨酸、丙酮酸和脂肪酸)和MAPK信號通路2個方面,主要通過調(diào)控核酸代謝、核糖體生物發(fā)生、能量代謝、信號轉(zhuǎn)導(dǎo)以及翻譯后蛋白的修飾、周轉(zhuǎn)、伴侶來實現(xiàn)。綜合分析發(fā)現(xiàn),低淀粉型粉葛贛葛2號葉片中的類LHCⅡ型1葉綠素a-b結(jié)合蛋白、kunitz家族胰蛋白酶和蛋白酶抑制劑前體、凝集素類蛋白和幾丁質(zhì)酶同源物的上調(diào)程度極大,下調(diào)程度極大的是類溶酶體Pro-X羧肽酶、預(yù)測的類dCTP焦磷酸酶1、富含半胱氨酸的受體類蛋白激酶25和色氨酸轉(zhuǎn)氨酶相關(guān)蛋白4,至于它們的內(nèi)在調(diào)控機制有待于深入的分子生物研究去驗證。
DIA LC-MS定量蛋白組學技術(shù)雖然具有很多的優(yōu)點,但僅依靠其對生物系統(tǒng)進行探究還是不夠全面的,最好要與其他組學(如基因組學、轉(zhuǎn)錄組學、翻譯后修飾組學和代謝組學)進行有機結(jié)合才能達到更全面和系統(tǒng)的分析結(jié)果,構(gòu)建完整的基因表達和蛋白精準調(diào)控網(wǎng)絡(luò),深度挖掘物種特征和信號調(diào)控網(wǎng)絡(luò),從而更好地理解各項生命活動[44-50]。今后該研究組也將在該研究獲得的粉葛蛋白組學的基礎(chǔ)上,深入開展與其他組學的整合分析,從多個組學的角度對粉葛的植物特征進行解析,為粉葛的生長發(fā)育、營養(yǎng)成分和活性物質(zhì)的合成及調(diào)控、遺傳改良及分子育種等提供數(shù)據(jù)支撐和技術(shù)途徑。
參考文獻
[1] 中國科學院中國植物志編輯委員會.中國植物志:第41卷[M].北京:科學出版社,1995:226-227.
[2] 國家藥典委員會.中華人民共和國藥典:2020年版 一部[S].北京:中國醫(yī)藥科技出版社,2020:289,333.
[3] 于欽輝,杜以晴,孫啟慧,等.基于功效和物質(zhì)基礎(chǔ)的野葛、粉葛解熱和抗病毒作用研究進展[J].中華中醫(yī)藥學刊,2021,39(9):89-94.
[4] 張應(yīng),李隆云,舒抒,等.不同產(chǎn)地、品種及采收期粉葛可溶性糖和淀粉的含量測定[J].中藥材,2013,36(11):1751-1754.
[5] 何紹浪,張昆,成艷紅,等.江西省粉葛種植產(chǎn)業(yè)發(fā)展現(xiàn)狀及對策[J].江西中醫(yī)藥,2020,51(12):7-10.
[6] 黃榮韶,黎禮麗,朱丹青,等.整枝和修根對粉葛產(chǎn)量和品質(zhì)影響[J].農(nóng)業(yè)與技術(shù),2017,37(2):56-58.
[7] 趙婧文,張建逵,魏巍,等.粉葛中淀粉含量與葛根素含量的相關(guān)性研究[J].中國中醫(yī)藥現(xiàn)代遠程教育,2018,16(15):95-97.
[8] 顧彩霞.不同區(qū)域葛品質(zhì)評價及施肥對粉葛品質(zhì)的影響[D].北京:北京林業(yè)大學,2019.
[9] 朱盼,謝娟平.不同產(chǎn)地粉葛不同部位中7種化學成分的含量測定與比較[J].化學與生物工程,2019,36(7):59-64.
[10] 何明慧,楊遠寧,王艷,等.有機肥對粉葛營養(yǎng)元素和產(chǎn)量品質(zhì)的影響[J].中國農(nóng)學通報,2020,36(16):79-83.
[11] REUBENKALU J I,EKEOKORO O N.Recent advances in plant proteomics towards stress adaptation and crop improvement[J].International journal of agriculture science and research,2020,10(4):71-80.
[12] OKOLI E E,NWORJI M J,OKORONKWO C M.Potentials of proteomics in plant improvement[J].International journal of scientific advances,2021,2(1):80-84.
[13] JORRIN NOVO J V.Proteomics and plant biology:Contributions to date and a look towards the next decade[J].Expert review of proteomics,2021,18(2):93-103.
[14] AEBERSOLD R,MANN M.Mass spectrometrybased proteomics[J].Nature,2003,422(6928):198-207.
[15] DOERR A.DIA mass spectrometry[J].Nature methods,2015,12(1):35.
[16] ONG S E,MANN M.Mass spectrometrybased proteomics turns quantitative[J].Nature chemical biology,2005,1(5):252-262.
[17] WANG J,TUCHOLSKA M,KNIGHT J D,et al.MSPLITDIA:Sensitive peptide identification for dataindependent acquisition[J].Nature methods,2015,12(12):1106-1108.
[18] BICHMANN L,GUPTA S,ROSENBERGER G,et al.DIAproteomics:A multifunctional data analysis pipeline for dataindependent acquisition proteomics and peptidomics[J].Journal of proteome research,2021,20(7):3758-3766.
[19] CANTERBURY J D,MERRIHEW G E,GOODLETT D R,et al.Comparison of data acquisition strategies on quadrupole ion trap instrumentation for shotgun proteomics[J].Journal of the American society for mass,2014,25(12):2048-2059.
[20] TSOU C C,AVTONOMOV D,LARSEN B,et al.DIAUmpire:Comprehensive computational framework for dataindependent acquisition proteomics[J].Nature methods,2015,12(3):258-264.
[21] SCHUBERT O T,GILLET L C,COLLINS B C,et al.Building highquality assay libraries for targeted analysis of SWATH MS data[J].Nature protocols,2015,10(3):426-441.
[22] MEYER J G,SCHILLING B.Clinical applications of quantitative proteomics using targeted and untargeted dataindependent acquisition techniques[J].Expert review of proteomics,2017,14(5):419-429.
[23] KRASNY L,HUANG P H.Dataindependent acquisition mass spectrometry(DIAMS)for proteomic applications in oncology[J].Molecular omics,2021,17(1):29-42.
[24] MEYER J G,MUKKAMALLA S,STEEN H,et al.PIQED:Automated identification and quantification of protein modifications from DIAMS data[J].Nature methods,2017,14(7):646-647.
[25] PIAZZA I,BEATON N,BRUDERER R,et al.A machine learningbased chemoproteomic approach to identify drug targets and binding sites in complex proteomes[J].Nature communications,2020,11(1):1-13.
[26] 李文娟,萬祎,李桐,等.基于數(shù)據(jù)非依賴型采集質(zhì)譜技術(shù)的血液脂質(zhì)分子高通量分析[J].生態(tài)毒理學報,2017,12(2):46-55.
[27] 童譯慶,吳春榮,劉建軍,等.利用定量蛋白組學對膿毒癥外周血單個核細胞差異蛋白的研究[J].中華急診醫(yī)學雜志,2018,27(11):1251-1259.
[28] 王陳龍,邱峰,操龍斌,等.基于DIA LC-MS對膿毒癥患者外周血差異蛋白的研究分析[J].檢驗醫(yī)學與臨床,2020,17(18):2600-2603.
[29] 陳雯,劉智文,游小龍,等.基于DIA/SWATH的質(zhì)譜定量技術(shù)研究皮膚鱗狀細胞癌患者的血清蛋白質(zhì)組學[J].實用癌癥雜志,2020,35(12):1928-1931.
[30] 阿爾孜古麗·吐爾遜,楊麗菲,鄭樹濤,等.基于DIA LC-MS對Ⅲ期食管鱗癌和食管良性疾病患者外周血外泌體差異蛋白的研究[J].新疆醫(yī)科大學學報,2021,44(6):659-663.
[31] WILKINS M R,APPEL R D,VAN EYK J E,et al.Guidelines for the next 10 years of proteomics[J].Proteomics,2006,6(1):4-8.
[32] DUPREE E J,JAYATHIRTHA M,YORKEY H,et al.A critical review of bottomup proteomics:The good,the bad,and the future of this field[J].Proteomes,2020,8(3):1-26.
[33] NOOR Z,AHN S B,BAKER M S,et al.Mass spectrometrybased protein identification in proteomicsA review[J].Briefings in bioinformatics,2021,22(2):1620-1638.
[34] ARUL A B,ROBINSON R A S.Sample multiplexing strategies in quantitative proteomics[J].Analytical chemistry,2019,91(1):178-189.
[35] PAPPIREDDI N,MARTIN L,WHR M.A review on quantitative multiplexed proteomics[J].ChemBioChem,2019,20(10):1210-1224.
[36] CHO K C,CLARK D J,SCHNAUBELT M,et al.Deep proteomics using two dimensional data independent acquisition mass spectrometry[J].Analytical chemistry,2020,92(6):4217-4225.
[37] SANTOS M D M,CAMILLOANDRADE A C,KURT L U,et al.Mixeddata acquisition:Nextgeneration quantitative proteomics data acquisition[J/OL].Journal of proteomics,2020,222[2022-03-17].https://doi.org/10.1016/j.jprot.2020.103803.
[38] BROMILOW S N L,GETHINGS L A,LANGRIDGE J I,et al.Comprehensive proteomic profiling of wheat gluten using a combination of dataindependent and datadependent acquisition[J].Frontiers in plant science,2016,7:1-13.
[39] RIEBEL M,F(xiàn)RONK P,DISTLER U,et al.Proteomic profiling of German Dornfelder grape berries using dataindependent acquisition[J].Plant physiology & biochemistry,2017,118:64-70.
[40] FAN K T,WANG K H,CHANG W H,et al.Application of dataindependent acquisition approach to study the proteome change from early to later phases of tomato pathogenesis responses[J].International journal of molecular medicine,2019,20(4):1-20.
[41] XIE X,YAN Y L,LIU T,et al.Dataindependent acquisition proteomic analysis of biochemical factors in rice seedlings following treatment with chitosan oligosaccharides[J/OL].Pesticide biochemistry and physiology,2020,170[2022-03-17].https://doi.org/10.1016/j.pestbp.2020.104681.
[42] WANG Y L,SANG Z,XU S H,et al.Comparative proteomics analysis of Tibetan hullless barley under osmotic stress via dataindependent acquisition mass spectrometry[J].GigaScience,2020,9(3):1-12.
[43] SUN Y Y,ZOU Y,JIN J,et al.DIAbased quantitative proteomics reveals the protein regulatory networks of floral thermogenesis in Nelumbo nucifera[J].International journal of molecular sciences,2021,22(15):1-19.
[44] WALLEY J W,SARTOR R C,SHEN Z X,et al.Integration of omic networks in a developmental atlas of maize[J].Science,2016,353(6301):814-818.
[45] FABRES P J,COLLINS C,CAVAGNARO T R,et al.A concise review on multiomics data integration for terroir analysis in Vitis vinifera[J].Frontiers in plant science,2017,8:1-8.
[46] GUTIERREZ D B,GANTBRANUM R L,ROMER C E,et al.An integrated,highthroughput strategy for multiomic systems level analysis[J].Journal of proteome research,2018,17(10):3396-3408.
[47] 秦愛,鄭曉敏,王坤.基于質(zhì)譜的植物蛋白質(zhì)組學研究方法[J].植物科學學報,2018,36(3):470-478.
[48] WANG S B,WEI J L,LI R D,et al.Identification of optimal prediction models using multiomic data for selecting hybrid rice[J].Heredity,2019,123(3):395-406.
[49] ZANDER M,LEWSEY M G,CLARK N M,et al.Integrated multiomics framework of the plant response to jasmonic acid[J].Nature plants,2020,6(3):290-302.
[50] SHRESTHA V,YOBI A,SLATEN M L,et al.Multiomics approach reveals a role of translational machinery in shaping maize kernel amino acid composition[J].Plant physiology,2022,188(1):111-133.