沈清清 ,劉 芳 ,趙 芳 ,張玉潔
(1.文山學院 環(huán)境與資源學院,云南 文山 663099;2.文山學院 化學與工程學院,云南 文山 663099)
肌動蛋白(actin)是1941年首先在脊椎動物骨骼細胞中發(fā)現(xiàn)并命名的一種蛋白,廣泛存在于真核生物細胞膜、細胞質和細胞核中,是細胞骨架微絲的主要成分,在氨基酸序列組成和長度上( 374~376個氨基酸)具有高度保守性[1-4]。長期以來,人們認為細胞骨架僅存在于真核生物中,然而近十年來科研人員逐漸在許多種類的原核生物中也發(fā)現(xiàn)了細胞骨架蛋白,其中MreB蛋白就是一類與細菌和原核藻類形態(tài)維持密切相關的蛋白,且該蛋白在氨基酸序列組成、裝配方式和功能等方面都與真核生物肌動蛋白具有高度相似性[5-7]。這一發(fā)現(xiàn)推動了學術界轉換角度重新審視肌動蛋白的起源以及真核生物與原核生物的進化關系,并成為近年來的研究熱點。生物大分子蛋白質的三級結構決定蛋白質的生物學功能,因此比較蛋白質的三級結構可以使我們了解蛋白之間的相互作用和進化關系,發(fā)現(xiàn)遠程同源關系[8-9]。但是,目前已知的蛋白質序列數(shù)據(jù)庫中,已經(jīng)根據(jù)實驗測出其結構和功能的蛋白質只占其中的小部分,大部分晶體結構尚未解析,因此利用一級氨基酸序列信息和已知蛋白質的空間結構信息來研究預測未知蛋白質的空間結構,已成為結構生物學中研究蛋白質結構和功能關系的主要手段[10]。當前實際有效的方法是蛋白質同源建模,即根據(jù)模板蛋白將一級序列轉成3D結構的技術[11-13]。本研究擬采用生物信息學的手段和方法對幾種原核MreB蛋白和真核actin蛋白進行同源建模,預測蛋白的三維結構,分析原核MreB蛋白和真核actin蛋白結構相關性和進化關系,旨在為實驗尚不能攻克的生物細胞骨架蛋白起源和進化問題提供一些基礎理論數(shù)據(jù),同時也為MreB蛋白在系統(tǒng)發(fā)育學研究中的應用奠定理論基礎和參考價值。
從美國生物信息中心(National Center for Biotechnology Information,NCBI)蛋白數(shù)據(jù)庫篩選出來自于19種細菌的MreB蛋白和16種真核生物的actin蛋白作為分析材料,選取的蛋白相關信息見表1。
蛋白數(shù)據(jù)庫(Rcsb-PDB)檢索獲得有價值的模板,利用SWISS-MEDOL服務器進行同源建模,獲得蛋白的預測模型和相關參數(shù)。
利用在線工具PROCHECK對蛋白結構模型進行評估,獲得蛋白模型的氨基酸殘基二面角分布圖(Ramachandran Plot),由圖中相關參數(shù)評鑒模型的質量等級,確定其可信度與合理性。
利用可視化分析軟件PyMOL疊合比對預測模型,分析蛋白三維結構的構象差異。
應用序列比對軟件ClustalX2.0對表1所列出的蛋白序列進行比對,根據(jù)比對結果用MEGA6構建NJ系統(tǒng)進化樹。Bootstrap 分析中使用1000次重復計算NJ樹的支持率。
表1 MreB蛋白和actin蛋白相關信息
3.1.1 同源建模模板的篩選
利用SWISS-MODEL對表1所列35種蛋白全部進行了同源建模,發(fā)現(xiàn)該軟件檢索系統(tǒng)為各蛋白建模所篩選出的最佳模板存在一定程度的重復性,如表2所示,其中SWISS-MODEL為克雷伯氏桿菌屬的肺炎克雷伯氏菌、產酸克雷伯菌、鼻硬結克雷伯氏桿菌;埃希氏菌屬的大腸桿菌、弗格森埃希菌、赫爾曼埃希菌、傷口埃希菌,氣單胞菌屬的維氏氣單胞菌所選擇的最佳模板均為4czm;為氣單胞菌屬的殺鮭氣單胞菌、嗜水氣單胞菌、豚鼠氣單胞菌和類芽孢桿菌屬的蜂房芽孢桿菌選擇的模板均為4czf;為類芽孢桿菌屬的膠質類芽胞桿菌、北方類芽孢桿菌、多粘類芽孢桿菌和乳酸桿菌屬的干酪乳桿菌、短乳桿菌和加氏乳桿菌選擇的模板均為2wus;為真菌中的釀酒酵母、黃曲霉和草酸青霉菌選擇的模板均為1yag;為大變形蟲、向日葵和鞘毛藻選擇的模板均為4efh;為野豬和真蛸選擇的模板均為3b5u;為大豆、大麥、鐵皮石斛和水仙選擇的模板均為3ci5。從以上數(shù)據(jù)可知不同類群的生物可能選擇相同的模板進行同源建模,SWISSMODEL系統(tǒng)選擇的模板蛋白與建模蛋白可能屬于不同類群的生物,表明模板與建模蛋白并不存在類群或種屬對稱性。
表2 同源建模的模板信息
3.1.2 同源建模及質量評估
SWISS-MODEL預測系統(tǒng)中,用同一模板構建的模型存在相似性較高的特點,因此本文僅列出分別 以 4czm、4czf、2wus、4cze、1yag、4efh、2btf和3ci5為模板構建的8種生物(每個類群至少1種)的預測模型,結果如圖1所示,A為肺炎克雷伯氏菌MreB蛋白模型,B為嗜水氣單胞菌MreB蛋白模型,C為多粘類芽孢桿菌MreB蛋白模型,D為嗜酸乳酸桿菌MreB蛋白模型,E為草酸青霉菌actin蛋白模型,F(xiàn)為大變形蟲actin蛋白模型,G為布氏雙尾藻actin蛋白模型,H為大麥actin蛋白模型。
圖2 蛋白氨基酸殘基二面角分布圖
為證實SWISS-MODEL系統(tǒng)同源建模模型的可靠性,對圖1中構建的模型進行PROCHECK質量評估,結果如圖2所示,A模型的蛋白氨基酸殘基二面角分布圖顯示該模型99.3%的氨基酸殘基落在允許區(qū),其中93.5%落在最適區(qū),5.4%落在附加區(qū),0.4%落在寬容區(qū),剩余0.7%落在非允許區(qū);B模型的蛋白氨基酸殘基二面角分布圖顯示該模型99.6%的氨基酸殘基落在允許區(qū),其中88.7%落在最適區(qū),10.2%落在附加區(qū),0.7%落在寬容區(qū),剩余0.4%落在非允許區(qū);C模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中92.8%落在最適區(qū),6.5%落在附加區(qū),0.7%落在寬容區(qū);D模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中87.5%落在最適區(qū),11.8%落在附加區(qū),0.7%落在寬容區(qū);E模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中92.5%落在最適區(qū),7.5%落在附加區(qū);F模型的蛋白氨基酸殘基二面角分布圖顯示該模型99.7%的氨基酸殘基落在允許區(qū),其中92.2%落在最適區(qū),7.5%落在附加區(qū),剩余0.3%落在非允許區(qū);G模型的蛋白氨基酸殘基二面角分布圖顯示該模型98.8%的氨基酸殘基落在允許區(qū),其中82.8%落在最適區(qū),15.3%落在附加區(qū),0.6%落在寬容區(qū),剩余1.2%落在非允許區(qū);H模型的蛋白氨基酸殘基二面角分布圖顯示該模型100%的氨基酸殘基落在允許區(qū),其中93.8%落在最適區(qū),5.9%落在附加區(qū),0.3%落在寬容區(qū)。以上結果表明通過SWISSMODEL構建的8個蛋白模型基本符合立體化學規(guī)則,有較高的合理性與可靠性,其中A、C、E、F、H模型均屬高質量模型(落于最適區(qū)的氨基酸殘基數(shù) >90%)。
8個模型中A、B、C和D結構比較相似,E、F、G和H結構較為相似,因此A、B、C和D做第一組,E、F、G和H做第二組分別進行疊合比對處理,分別比較兩組存在的差異。結果如圖3A所示,PyMOL軟件將肺炎克雷伯氏菌、嗜水氣單胞菌、多粘類芽孢桿菌和嗜酸乳酸桿菌的MreB蛋白模型疊合比對后得出的RMSD值為0.951,4個蛋白的骨架折疊非常相似,α螺旋和β折疊在數(shù)量和構型上都很接近,表明核心結構差別不大,主要在Ⅰ、Ⅱ和Ⅲ表面環(huán)區(qū)空間結構上存在較大差異;如圖2B所示,將草酸青霉菌、大變形蟲、布氏雙尾藻和大麥actin蛋白模型疊合比對后PyMOL軟件計算的RMSD值為0.535,4個蛋白的骨架折疊也非常相似,α螺旋和β折疊在數(shù)量和構型上都很接近,主要是Ⅰ表面環(huán)區(qū)空間結構上存在較大差異。另外,第一組模型(圖2A)與第二組模型(圖2B)從大致框架上比較有很多相似的結構,特別是核心部位,但周邊蛋白骨架和表面環(huán)區(qū)結構上差異度較大,表明MreB和actin蛋白雖為同源蛋白,氨基酸序列和結構上存在一定相似性,但兩者從三維結構上比較存在特異性差異。
圖3 蛋白晶體結構、同源建模結構的疊合比較
將表1中35種生物的MreB和actin蛋白序列比對和構建系統(tǒng)發(fā)育樹,進行系統(tǒng)進化分析,結果如圖4所示,整棵進化樹明顯分為兩支,其中19種細菌同屬于第一分支,而植物、藻類、動物和真菌同屬于第二分支。由此表明雖然MreB和actin在氨基酸序列和結構上雖存在相似性,但兩者仍具有顯著的獨立性,可以比較容易地將真核生物和原核生物分別聚類。MreB蛋白的聚類情況表明克雷伯氏桿菌屬、埃希氏菌屬和氣單胞菌屬親緣關系較近,而類芽孢桿菌屬和乳酸桿菌屬親緣關系較近,腸球菌屬與乳酸桿菌屬親緣關系較遠,這一結果與張斌等[14]在研究FtsZ蛋白同源性時獲得的結果一致。另外圖中還顯示加氏乳桿菌和干酪乳桿菌與類芽孢桿菌屬的親緣關系比另外兩種乳酸桿菌的親緣關系較近。actin蛋白是一種非常保守的蛋白質,各種生物間氨基酸序列的同源性高達70%~100% ,植物與動物之間的氨基酸序列差異在11%~15%,大豆與玉米之間的差異在8%~10%,因此肌動蛋白是一種非常適合研究生物進化規(guī)律的分子工具。早在1999年國內胡年松等[1]就研究了74種生物共128個肌動蛋白序列,將這些蛋白序列比對后構建了進化樹,分析得出肌動蛋白進化樹能較好的反映真核生物間的進化關系。2012年張珍等[15]利用肌動蛋白分析了千里光與其他植物的親緣關系,發(fā)現(xiàn)千里光與甘草和鷹嘴豆的親緣關系較近。本研究構建的進化樹中,肌動蛋白actin將表1中16種真核生物分別進行了聚類,分出植物、真菌、動物3個分支,均顯示了與傳統(tǒng)分類系統(tǒng)一致的親緣關系,只有藻類生物聚類不明顯,表明真核藻類actin蛋白的來源或進化分歧可能不同。
圖4 蛋白系統(tǒng)發(fā)育樹分析
1)SWISS-MODEL系統(tǒng)選擇的模板蛋白與建模蛋白可能屬于不同類群的生物,模板與建模蛋白不存在類群或種屬對稱性。PROCHECK評估結果表明,預測得到的蛋白模型基本符合立體化學規(guī)則,有較高的合理性與可靠性,其中大部分屬于高質量模型(落于最適區(qū)的氨基酸殘基數(shù)>90%)。
2)用可視化分析軟件PyMOL將蛋白疊合比對,結果表明MreB蛋白和actin蛋白雖為同源蛋白,氨基酸序列和結構上存在一定相似性,但存在特異性差異。
3)以MreB蛋白和actin蛋白為分子指標應用MEGA6軟件構建的進化樹基本能反映與傳統(tǒng)分類系統(tǒng)一致的進化軌跡,但在某些細節(jié)方面顯示出與傳統(tǒng)分類系統(tǒng)相異的親緣關系。
[1]胡松年,閻隆飛.肌動蛋白與真核生物的進化[J].動物學報,1999(4): 440-443.
[2]曲東明,韓梅,溫進坤.肌動蛋白結合蛋白[J].細胞生物學雜志,2007(2):219-224.
[3]劉曦,張少斌,汪澈.植物肌動蛋白功能的研究進展[J].生物技術通報,2010(3):13-16.
[4]Reisler E, Egelman E H.Actin Structure and Function :What We Still Do Not Understand[J].Journal of Biological Chemistry,2007(50):36133-36137.
[5]van den Ent F, Johnson C M, Persons L, et al.Bacterial actin MreB assembles in complex with cell shape protein RodZ[J].The EMBO Journal,2010(6):1081-1090.
[6]陳曉燕,汪志平,楊靈勇.原核細胞骨架蛋白的結構與功能[J].細胞生物學雜志,2006(5):699-703.
[7]Hu B, Yang G, Zhao W, et al.MreB is important for cell shape but not for chromosome segregation of the filamentous cyanobacterium Anabaena sp.PCC 7120[J].Molecular Microbiology,2007(6):1640-1652.
[8]郎美娜.蛋白質三級結構比對方法及其應用[D].吉林大學,2009.
[9]趙東明,強小利,劉向榮.一種蛋白質結構同源建模的DNA算法[J].北京大學學報:自然科學版,2009(5):748-752.
[10]陳紅梅,周俊祥.基于同源建模的蛋白質結構預測方法的研究[J].河南科學,2009(9):1108-1110.
[11]秦菠,張博,周艷芬,等.鯽魚GABAARβ3亞基生物信息學分析與同源建模[J].世界農藥,2014(2):27-33.
[12]王世佳,林浩鵬,李升康.擬穴青蟹(Scylla paramamosain)NOS蛋白結構分析及同源建模[J].汕頭大學學報:自然科學版,2013(2):39-44.
[13]陸宗超,王邦平,李振興.褐蝦過敏原Cra c 8蛋白的結構分析和同源建模[J].食品科學,2012(9):177-181.
[14]張斌,東秀珠.FtsZ蛋白同源性分析在乳酸菌系統(tǒng)學研究中的應用[J].微生物學報,2005(5):661-664.
[15]張珍,平軍嬌,蔡振鋒,等.千里光肌動蛋白基因(Actin)的生物信息學及功能分析[J].植物研究,2012(5):591-595.