王 琦 ,王俊紅 ,王 榮
(1.長(zhǎng)治學(xué)院 生物科學(xué)與技術(shù)系,山西 長(zhǎng)治 046011;2.陜西師范大學(xué) 生命科學(xué)學(xué)院,陜西 西安 710062;3.長(zhǎng)治衛(wèi)生學(xué)校,山西 長(zhǎng)治 046000)
擬南芥MPK17基因在玉米中的電子克隆分析
王 琦1,王俊紅2,王 榮3
(1.長(zhǎng)治學(xué)院 生物科學(xué)與技術(shù)系,山西 長(zhǎng)治 046011;2.陜西師范大學(xué) 生命科學(xué)學(xué)院,陜西 西安 710062;3.長(zhǎng)治衛(wèi)生學(xué)校,山西 長(zhǎng)治 046000)
文章主要運(yùn)用生物信息學(xué)的方法,利用擬南芥MPK17基因在玉米中進(jìn)行了電子克隆,并得到了目的基因,進(jìn)一步對(duì)其DNA堿基序列與蛋白質(zhì)氨基酸序列進(jìn)行了分析,旨在為更好地研究MPK17基因提供一定的理論資料。
擬南芥;玉米;MPK17;電子克隆
擬南芥(Arabidopsis thaliana)形態(tài)結(jié)構(gòu)簡(jiǎn)單,莖直立,花小,株高15-30cm,生殖周期短,繁殖系數(shù)高[1-3]。其基因組全序列測(cè)序工作已于2000年12月完成[4],這樣使得有關(guān)擬南芥基因克隆、結(jié)構(gòu)與功能的研究發(fā)展迅速。且在已知基因組的高等植物中,擬南芥核基因組最小[5]?;蚪M中所含高度重復(fù),中度重復(fù)及低度重復(fù)的比例也很低,絕大多數(shù)為單拷貝序列[6-8]。
MAP激酶(Mitogen activated protein kinases MPKs),中文全稱為有絲分裂原活化蛋白激酶[9],它與其他一系列蛋白激酶構(gòu)成級(jí)聯(lián)放大信號(hào)通路[10],控制細(xì)胞生物學(xué)反應(yīng)和參與植物對(duì)多種外界刺激的信號(hào)轉(zhuǎn)導(dǎo)過程[11]。對(duì)MPK最早研究始于哺乳動(dòng)物和酵母(Yeast),近年來,在擬南芥、苜蓿(Medicago sativa Linn)、煙草(Nicotiana tabacum)、水稻(O-ryza sativa)等高等植物中也取得了很大的進(jìn)展[12-14]。文章主要通過生物信息學(xué)方法,分析了單子葉植物玉米(Zea mays)中存在的MPK17基因,旨在增強(qiáng)人類對(duì)于MPK17基因的認(rèn)識(shí),提高人類對(duì)玉米生長(zhǎng)發(fā)育的控制能力,增加玉米抗旱、抗脅迫的能力,從而最終達(dá)到增加產(chǎn)量的目的。
擬南芥MPK17基因編碼的氨基酸序列、克隆得到的玉米新蛋白激酶的cDNA序列及其編碼的氨基酸序列等。
從GenBank的核酸數(shù)據(jù)庫中檢索擬南芥MPK17基因,獲得MPK17基因cDNA序列,以該序列為模板對(duì)玉米EST數(shù)據(jù)庫進(jìn)行BLAST檢索,獲得與之部分同源的EST群,從中選取一條EST作為種子序列BLAST檢索玉米的EST數(shù)據(jù)庫,將檢出與種子序列同源性較高或有部分重疊的EST序列拼接組裝為重疊群,再以此重疊群序列重復(fù)以上BLAST檢索過程,反復(fù)進(jìn)行EST重疊群序列的拼接和比對(duì),直至檢出所有的重疊EST或重疊群不能繼續(xù)延伸,最終獲得玉米MPK17基因的cDNA全序列。
(1)ORF分析
將之前電子克隆得到的玉米MPK17基因的cDNA在ORFFinder中進(jìn)行開放讀碼框(ORF)分析。
(2)玉米MPK17基因編碼蛋白的一級(jí)結(jié)構(gòu)分析
首先利用在線分析工具ExPASy tool對(duì)玉米MPK17基因編碼蛋白進(jìn)行分子量分析,然后利用BIOEDIT軟件對(duì)玉米MPK17基因編碼蛋白的氨基酸序列分布進(jìn)行分析。
(3)玉米MPK17基因編碼蛋白的二級(jí)結(jié)構(gòu)分析
利用蛋白質(zhì)二級(jí)結(jié)構(gòu)在線預(yù)測(cè)工具ExPASy Secondery Structure Prediction GOR對(duì)玉米MPK17基因編碼蛋白進(jìn)行二級(jí)結(jié)構(gòu)分析。
(4)玉米MPK17基因編碼蛋白的三級(jí)結(jié)構(gòu)分析
利用網(wǎng)絡(luò)同源建模服務(wù)器SWISS-MODEL對(duì)玉米MPK17基因編碼蛋白進(jìn)行三級(jí)結(jié)構(gòu)預(yù)測(cè)[15-17]。
(5)蛋白質(zhì)等電點(diǎn)分析
利用生物軟件ANTHEPROT對(duì)玉米MPK17基因編碼蛋白進(jìn)行等電點(diǎn)分析。
(6)蛋白質(zhì)信號(hào)肽分析
利用在線生物軟件ExPASy Signal P對(duì)玉米MPK17基因編碼蛋白進(jìn)行信號(hào)肽分析。
(7)蛋白質(zhì)疏水性與跨膜區(qū)分析
利用生物軟件TopPred和TMHMM Server v.2.0分別對(duì)玉米MPK17基因編碼蛋白的疏水性與跨膜區(qū)進(jìn)行分析。
(8)蛋白質(zhì)電荷分布分析
利用在線生物軟件SAPS對(duì)玉米MPK17基因編碼蛋白進(jìn)行電荷分布分析。
(9)蛋白質(zhì)保守域分析
利用在線蛋白質(zhì)保守域分析工具NCBICDSearch對(duì)玉米MPK17基因編碼蛋白進(jìn)行結(jié)構(gòu)域分析。
按照上述方法,使用擬南芥MPK17基因所編碼的氨基酸序列(NCBI登錄號(hào):Q84M93.1)在玉米EST數(shù)據(jù)庫中利用tBLASTn程序進(jìn)行同源檢索,最后將所有檢索到的EST進(jìn)行拼接獲得一個(gè)長(zhǎng)度為2344bp序列。然后把此序列在玉米EST數(shù)據(jù)庫里進(jìn)行BLASTn檢索,結(jié)果表明,該序列受玉米EST數(shù)據(jù)庫完全支持(如圖1)。
圖1 玉米MPK17基因編碼蛋白序列檢索玉米EST數(shù)據(jù)庫Fig.1 EST database results of protein coded by corn MPK17 gene
開放閱讀框(ORF)的識(shí)別是證明一個(gè)新的DNA序列為特定的蛋白質(zhì)編碼基因的部分或全部的先決條件。ORF是基因序列的一部分,包含一段可以編碼蛋白的堿基序列,不能被終止子打斷。由于蛋白質(zhì)由三聯(lián)體密碼子所編碼,所以一個(gè)雙鏈DNA序列就有6個(gè)潛在的閱讀框。其中一條鏈的3個(gè)讀框稱為正向讀框,互補(bǔ)鏈上的三個(gè)讀框稱為反向讀框。本文將電子克隆得到的玉米MPK17基因的cDNA在ORF Finder中進(jìn)行ORF分析,結(jié)果如圖2所示,不難發(fā)現(xiàn)在259-1998 bp之間有一個(gè)最長(zhǎng)的完整ORF,長(zhǎng)為1740 bp,編碼579個(gè)氨基酸。
圖2 玉米MPK17基因的ORFFinder結(jié)果Fig.2 ORFF inderr esult of corn MPK17 gene
利用在線生物軟件ExPASy預(yù)測(cè)玉米MPK17基因編碼蛋白的分子量約為66.04 kDa。利用BIOEDIT軟件預(yù)測(cè)其氨基酸序列組成情況如圖3所示。
圖3 玉米MPK17基因編碼蛋白的氨基酸組成Fig.3 The amino acid composition of protein coded by corn MPK17 gene
運(yùn)用蛋白質(zhì)二級(jí)結(jié)構(gòu)在線分析工具GOR4對(duì)玉米MPK17基因編碼蛋白進(jìn)行分析,結(jié)果如圖4所示,其中h代表α螺旋,e代表β折疊,c代表無規(guī)則卷曲。且α螺旋占35.06%;β折疊占15.20%;無規(guī)則卷曲占49.74%。由此可知,該玉米MPK17基因編碼蛋白是由大量α螺旋、無規(guī)則卷曲以及少量的β折疊所構(gòu)成的。
圖4 GOR4分析玉米MPK17基因編碼蛋白的二級(jí)結(jié)構(gòu)Fig.4 Secondary structures predicted by GOR4 of coded protein by corn MPK17 gene
利用基于同源建模的分析工具Swiss-Model對(duì)玉米MPK17基因編碼蛋白進(jìn)行三級(jí)結(jié)構(gòu)分析,軟件自動(dòng)選擇PDB數(shù)據(jù)庫中匹配度最高的的3py3A(磷酸化的p38-alpha MAPK激酶的晶體結(jié)構(gòu))作為模板,對(duì)目的蛋白進(jìn)行三級(jí)結(jié)構(gòu)的預(yù)測(cè)。由圖5可知,目的蛋白的確是由大量α螺旋、無規(guī)卷曲以及少量的β折疊共同構(gòu)成的復(fù)雜結(jié)構(gòu),與上述二級(jí)結(jié)構(gòu)的分析結(jié)果一致。
圖5 蛋白質(zhì)的三級(jí)結(jié)構(gòu)Fig.5 Tertiary structure of protein
利用生物軟件ANTHEPROT對(duì)玉米MPK17基因編碼蛋白進(jìn)行分析,結(jié)果如圖6所示,玉米MPK17基因編碼蛋白的理論等電點(diǎn)為6.43。
對(duì)蛋白質(zhì)進(jìn)行信號(hào)肽分析,有助于蛋白質(zhì)功能域的區(qū)分及蛋白質(zhì)細(xì)胞定位。用Signal P對(duì)玉米MPK17基因編碼蛋白進(jìn)行信號(hào)肽分析,結(jié)果如圖7所示,通過直觀分析氨基酸分值,可知該玉米MPK17基因編碼蛋白的分值曲線不典型,因而得知玉米MPK17基因編碼蛋白沒有信號(hào)肽,屬于非分泌性蛋白。
圖6 等電點(diǎn)分析Fig.6 The anal ysis of isoel ectric point
圖7 玉米MPK17基因編碼蛋白信號(hào)肽分析Fig.7 Singal peptide prediction in protein coded by corn MPK17 gene
利用TopPred軟件對(duì)玉米MPK17基因編碼蛋白進(jìn)行分析,結(jié)果如圖8所示,橫坐標(biāo)表示蛋白質(zhì)中氨基酸殘基的序號(hào),縱坐標(biāo)表示殘基的親水/疏水特性,正值為疏水,負(fù)值為親水。因此,可以判斷得出,該蛋白質(zhì)為親水性蛋白。
利用TMHMM Server v.2.0對(duì)玉米MPK17基因編碼蛋白跨膜區(qū)進(jìn)行分析,結(jié)果如圖9所示,其中橫坐標(biāo)代表蛋白質(zhì)中氨基酸殘基的序號(hào),縱坐標(biāo)代表可能性的大小,結(jié)果表明此蛋白質(zhì)不存在跨膜區(qū),說明不是跨膜蛋白。
圖8 玉米MPK17基因編碼蛋白親/疏水性分析Fig.8 Hydrophilic/hydrophobic analysis of protein coded by corn MPK17 gene
圖9 玉米MPK17基因編碼蛋白跨膜區(qū)Fig.9 Striding filmsection of protein coded by corn MPK17 gene
利用在線分析工具SAPS對(duì)玉米MPK17基因編碼蛋白氨基酸序列進(jìn)行蛋白質(zhì)電荷分布分析,結(jié)果如圖10所示,該蛋白質(zhì)含有88個(gè)帶負(fù)電荷的氨基酸(Glu和Asp)和82個(gè)帶正電荷的氨基酸(Arg和Lys),因此該玉米MPK17基因編碼蛋白總計(jì)帶6個(gè)負(fù)電荷。
運(yùn)用保守域(CD)分析玉米MPK17基因編碼蛋白的結(jié)構(gòu)域,結(jié)果表明,玉米MPK17基因編碼蛋白中的保守結(jié)構(gòu)域包括ATP結(jié)合位點(diǎn),底物結(jié)合位點(diǎn),活性位點(diǎn)以及KIM(即激酶相互作用模體)停泊位點(diǎn),它們所在的具體位置則如圖11所示。
電子克隆技術(shù)是伴隨著基因定位、人類基因組測(cè)序及生物信息學(xué)技術(shù)的發(fā)展而出現(xiàn)的,它是一種克隆基因的新方法。文章利用電子克隆技術(shù)從玉米中成功得到MPK17基因,并對(duì)該基因及其編碼蛋白進(jìn)行了一系列生物信息學(xué)分析。經(jīng)過初步分析,表明該目的基因長(zhǎng)為2344 bp,編碼579個(gè)氨基酸。所編碼的蛋白質(zhì)的分子量約為66.04 KDa,等電點(diǎn)為6.43,不存在跨膜區(qū)。該蛋白凈帶有六個(gè)負(fù)電荷,保守結(jié)構(gòu)包括一些例如:ATP結(jié)合位點(diǎn),底物結(jié)合位點(diǎn),活性位點(diǎn)以及KIM停泊位點(diǎn)等。二級(jí)結(jié)構(gòu)中,β折疊占15.20%;無規(guī)則卷曲占49.74%;α螺旋占35.06%。最后通過利用軟件SWISS-MODEL對(duì)其進(jìn)行三級(jí)結(jié)構(gòu)的預(yù)測(cè),找到與其匹配度最高的模板3py3A,從而預(yù)測(cè)出它的三級(jí)結(jié)構(gòu)。需要注意的是,在實(shí)驗(yàn)過程中,筆者會(huì)采用不同的軟件對(duì)目的蛋白進(jìn)行分析,難免有時(shí)的結(jié)果不一定全部一致。這是因?yàn)椴煌臄?shù)據(jù)庫,存放的數(shù)據(jù)有些差異,算法也有些差異,是屬于正常的,基本上大部分都是可靠的。總之,以上種種分析都僅僅只是一個(gè)推測(cè),還需要在實(shí)驗(yàn)室中進(jìn)行進(jìn)一步的研究論證。
圖10 玉米MPK17基因編碼蛋白電荷分布Fig.10 Change dist ribution of protein coded by corn MPK17 gene
圖11 玉米MPK17基因編碼蛋白質(zhì)的保守域Fig.11 Conserved domain in protein coded by corn MPK17 gene
[1]袁月星,李巧麗.植物界中的“果蠅”——擬南芥[J].生物學(xué)教學(xué),2003,28(1):48-49.
[2]陳璋.擬南芥:植物分子生物學(xué)研究的模式物種[J].植物學(xué)通報(bào),1994,11(1):6-11.
[3]安賢惠.擬南芥及其研究發(fā)展[J].西北農(nóng)業(yè)學(xué)報(bào),1998,7(1):92-94.
[4]徐平麗,張傳坤,孫萬鋼,等.模式植物擬南芥基因組研究進(jìn)展[J].山東農(nóng)業(yè)科學(xué),2006,(6):100-102.
[5]Cai-Ping Feng,John Mundy.Gene discovery and functional analysis in the model plant Arabidopsis[J].Journal of integrative plant biology,2006,48(1):5-14.
[6]梁成真,張銳,郭三堆.染色體步移技術(shù)研究進(jìn)展[J].生物技術(shù)通報(bào),2009,(10):75-87.
[7]Shinozaki K G,Tena J,Sheen Y.Mitogen-activated protein kinase cascades in plants:a new nomenclature[J].Trends in Plant Science,2002,7(7):301-308.
[8]Mizoguch T,Ichimura K,Shinozaki K.Environmental stress response in plants:the role of mitogen-activated protein kinases[J].Trends Biotech,1997,(15):15-19.
[9]劉強(qiáng),薛成.SHINOZAKI K.植物促分裂原活化蛋白(MAP)激酶[J].植物學(xué)報(bào),2000,42(7):661-667.
[10] 吳濤,宗曉娟,谷令坤等.植物中的MAPK及其在信號(hào)傳導(dǎo)中的作用[J].生物技術(shù)通報(bào),2006,(5):1-7.
[11] 陳婭斐,馮斌,趙小明等.MAPK級(jí)聯(lián)途徑在植物信號(hào)轉(zhuǎn)導(dǎo)中的研究進(jìn)展[J].植物學(xué)通報(bào),2005,(3):357-365.
[12]肖文娟,賓金華,武波.植物體中的 MAPK[J].植物學(xué)通報(bào),2004,21(2):205-215.
[13]張成崗,賀福初.生物信息學(xué)方法與實(shí)踐[M].北京:科學(xué)出版社,2002.
[14]張淼,趙茂林.利用表達(dá)序列標(biāo)簽電子克隆cDNA全序列的策略[J]. 生物技術(shù)通報(bào),2010,(1):45-67.
[15]Arnold K,Bordoli L,Kopp J, et al.The SWISS-MODEL Workspace:A web-based environment for protein structure homology modelling.Bioinformatics,2006,(22):195-201.
[16]Schwede T, Kopp J, Guex N, et al.SWISS-MODEL:an automated protein homology-modeling server.Nucleic Acids Research,2003,(31):3381-3385.
[17] Guex N and Peitsch M C.SWISS-MODEL and the Swiss-PdbViewer:An environment for comparative protein modelling.Electrophoresis,1997,(18):2714-2723.
In Silico Cloning Analysis of Arabidopsis Thaliana MPK17 in Zea Mays
Wang Qi1,Wang Jun-hong2,Wang Rong3
(1.Department of Life Science and Technology Changzhi University,Changzhi Shanxi 046011;2.College of Life Sciences Shaanxi Normal University,Xi'an Shaanxi 210037;3.Changzhi Municipal Health School,Changzhi Shanxi 046000)
MPK is a Ser/Thr-type protein kinase which exists widely in each eukaryote.Nowadays,a lot of MPKs have been isolated in the plant.However,in the plant the MPK research mainly concentrates on the double seed leaf pattern plant (e.g.Arabidopsis thaliana),is very few about the single seed leaf pattern plant Zea mays'MPK research.We used Arabidopsis thaliana's MPK17 gene and then in silico cloned Zea mays'MPK17 gene using bioinformatics in the corn and moreover,carried on the preliminary analyses.It has provided the rich rationale for better research MPK17.
a rabidopsis thaliana;zea mays;mitogen activated protein kinase 17 (MPK17);in silico cloning
Q785
A
1673-2014(2012)02-0009-05
2011—10—18
長(zhǎng)治學(xué)院校級(jí)課題基金資助項(xiàng)目(2010111)。
王 琦(1980—),男,山西長(zhǎng)治人,碩士,講師,主要從事生物化學(xué)、分子生物學(xué)、生物信息學(xué)研究。
(責(zé)任編輯 王璟琳)