林授鍇,傅曉菲,黃 健,陶 歡,徐超群,劉 偉,張麗娜,艾育芳,何華勤*
(1.福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福建 福州 350002;2.莆田學(xué)院環(huán)境與生物工程學(xué)院/福建省新型污染物生態(tài)毒理效應(yīng)與控制重點(diǎn)實(shí)驗(yàn)室,福建 莆田 351100)
?
植物線粒體和質(zhì)體雙定位蛋白質(zhì)的帶電特性分析
林授鍇1,2,傅曉菲1,黃健1,陶歡1,徐超群1,劉偉1,張麗娜1,艾育芳1,何華勤1*
(1.福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福建福州350002;2.莆田學(xué)院環(huán)境與生物工程學(xué)院/福建省新型污染物生態(tài)毒理效應(yīng)與控制重點(diǎn)實(shí)驗(yàn)室,福建莆田351100)
蛋白質(zhì)亞細(xì)胞定位分析是揭示蛋白質(zhì)功能的關(guān)鍵步驟。1個(gè)蛋白質(zhì)分子能被定位到2個(gè)亞細(xì)胞位置,這一現(xiàn)象被稱為蛋白質(zhì)的“雙定位”。本研究首先從Uniprot、MitoP2、MGI、TAIR、DBMLoc等蛋白質(zhì)數(shù)據(jù)庫(kù)及已發(fā)表文獻(xiàn)中收集雙定位于線粒體與質(zhì)體的植物蛋白質(zhì)數(shù)據(jù),共獲得703個(gè)雙定位蛋白質(zhì),組成測(cè)試數(shù)據(jù)集。再?gòu)腢niprot數(shù)據(jù)庫(kù)中選取唯一定位于線粒體的829個(gè)和唯一定位于質(zhì)體的6 376個(gè)植物蛋白質(zhì),組成參照數(shù)據(jù)集,分析雙定位于線粒體與質(zhì)體的植物蛋白質(zhì)的帶電特征。結(jié)果表明,與單定位于線粒體或質(zhì)體的植物蛋白質(zhì)相比,雙定位線粒體與質(zhì)體的植物蛋白質(zhì)具有更低的凈電荷量;此外,雙定位蛋白質(zhì)電荷分布較為集中對(duì)稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。本文研究結(jié)果將為揭示植物蛋白質(zhì)雙定位的分子機(jī)制奠定理論基礎(chǔ)。
植物;雙定位蛋白質(zhì);線粒體;質(zhì)體;帶電特性
細(xì)胞內(nèi)蛋白質(zhì)的定位多種多樣,最常見(jiàn)的是1個(gè)蛋白質(zhì)1個(gè)特定的細(xì)胞器位置,也可能是1個(gè)蛋白質(zhì)有多個(gè)細(xì)胞器位置,或是1個(gè)基因的多個(gè)蛋白質(zhì)產(chǎn)物分別定位到不同的細(xì)胞器位置。換句話說(shuō),1個(gè)蛋白質(zhì)分子能定位到多個(gè)亞細(xì)胞位置,這一現(xiàn)象被稱為“雙定位 (Dual target)”[1],能夠雙定位的蛋白質(zhì)稱為雙定位蛋白質(zhì) (Dual targeted proteins)。雙定位減少了蛋白質(zhì)的冗余,而非冗余蛋白質(zhì)的雙定位使細(xì)胞器獲得新的功能。研究人員先后在植物中發(fā)現(xiàn)了許多雙定位蛋白質(zhì)[2-3]。在過(guò)去的幾年里不斷發(fā)現(xiàn)單個(gè)基因產(chǎn)物定位到多個(gè)亞細(xì)胞中,但單個(gè)蛋白質(zhì)不同定位的分子機(jī)制還未被完全闡明,蛋白質(zhì)易位機(jī)制的研究尚未深入??傮w而言,植物有4種不同的蛋白質(zhì)易位系統(tǒng),其中大多數(shù)雙定位蛋白質(zhì)是定位到線粒體和葉綠體,主要是通過(guò)翻譯后由特異的信號(hào)肽轉(zhuǎn)運(yùn)到不同的細(xì)胞器中[4]。這些信號(hào)肽是由具有特殊拓?fù)湫畔⒌陌被嵝蛄薪M成的,1個(gè)蛋白質(zhì)是單定位、雙定位還是多定位,與這個(gè)蛋白質(zhì)所結(jié)合的信號(hào)肽有關(guān)。蛋白質(zhì)的雙定位機(jī)制是由各種分子事件相互交錯(cuò)而成,蛋白質(zhì)折疊、翻譯后修飾和蛋白質(zhì)互作是雙定位現(xiàn)象的后續(xù)事件[5]。
目前,UniProt[6]、MitoP2[7]、MGI[8]、TAIR[9]、DBMLoc[10]等許多數(shù)據(jù)庫(kù)可以提供蛋白質(zhì)雙定位甚至是多定位的信息。而基于這些數(shù)據(jù)庫(kù)信息,研究人員也開(kāi)發(fā)出用于預(yù)測(cè)蛋白質(zhì)雙定位的工具,例如ATP[2]、TargetP 1.1[11]、WoLF PSORT[12]、MultiLoc2[13]、Predotar[14]、CELLO[15]、Plant-mPLoc 2.0[16]等,但是只有ATP是專門(mén)預(yù)測(cè)雙定位蛋白質(zhì)亞細(xì)胞定位的工具,其余工具都是主要針對(duì)單個(gè)亞細(xì)胞位置的蛋白質(zhì),因此所得出的預(yù)測(cè)性能也是包括單個(gè)亞細(xì)胞定位和雙定位的情況。
當(dāng)前對(duì)蛋白質(zhì)雙定位的研究存在3個(gè)方面問(wèn)題。其一,蛋白質(zhì)雙定位或多定位的信息十分有限,數(shù)據(jù)大多集中在哺乳動(dòng)物主要細(xì)胞器的雙定位信息,如細(xì)胞核與細(xì)胞質(zhì)、細(xì)胞核與細(xì)胞膜、線粒體與細(xì)胞質(zhì)等,對(duì)植物蛋白質(zhì)的雙定位或多定位信息仍較分散;其二,蛋白質(zhì)分選機(jī)制的研究尚待深入,對(duì)蛋白質(zhì)雙定位或多定位發(fā)生的機(jī)制仍存在盲區(qū);其三,蛋白質(zhì)雙定位的預(yù)測(cè)工具屈指可數(shù),更未見(jiàn)關(guān)于植物蛋白質(zhì)多定位預(yù)測(cè)工具的研究報(bào)道。
因此,本研究首先從各種蛋白質(zhì)定位信息數(shù)據(jù)庫(kù)中,收集并整理雙定位在線粒體和質(zhì)體的植物蛋白質(zhì)的信息數(shù)據(jù);然后以單定位到線粒體或質(zhì)體的植物蛋白質(zhì)為參照,分析雙定位在線粒體和質(zhì)體的植物蛋白質(zhì)序列的基本特性,為揭示植物蛋白質(zhì)雙定位的分選機(jī)制奠定基礎(chǔ)。
1.1植物雙定位蛋白質(zhì)數(shù)據(jù)庫(kù)的構(gòu)建
1.1.1雙定位蛋白質(zhì)數(shù)據(jù)的收集收集整理植物中雙定位蛋白質(zhì)的編碼基因名、序列數(shù)據(jù)、來(lái)源的物種名稱、蛋白質(zhì)功能描述等相關(guān)信息。數(shù)據(jù)來(lái)源主要包括:(1)從Uniprot、MitoP2、MGI、TAIR、DBMLoc等多個(gè)數(shù)據(jù)庫(kù)中查找植物雙定位于線粒體和質(zhì)體的蛋白質(zhì),并根據(jù)蛋白質(zhì)注釋信息,確認(rèn)定位信息經(jīng)試驗(yàn)驗(yàn)證而非預(yù)測(cè)。(2)從新近發(fā)表的文獻(xiàn)[17-19]中收集經(jīng)試驗(yàn)方法鑒定到的植物雙定位于線粒體和質(zhì)體的蛋白質(zhì),并在Uniprot中找到相對(duì)應(yīng)的蛋白質(zhì)序列記錄。
1.1.2基于GO的亞細(xì)胞注釋蛋白質(zhì)數(shù)據(jù)的GO信息來(lái)自文獻(xiàn)數(shù)據(jù)或由GOA[20]中查詢獲得。為了提高GO注釋的準(zhǔn)確性,僅選擇數(shù)據(jù)庫(kù)中非歧義蛋白質(zhì)的亞細(xì)胞定位信息。同時(shí),參考特異物種數(shù)據(jù)庫(kù)MGI數(shù)據(jù)庫(kù)和TAIR數(shù)據(jù)庫(kù),并收集數(shù)據(jù)庫(kù)自帶的關(guān)于蛋白質(zhì)定位的GO注釋。
1.2測(cè)試數(shù)據(jù)集的收集
上述研究獲得雙定位于質(zhì)體和線粒體的植物蛋白質(zhì),再?gòu)腢niprot數(shù)據(jù)庫(kù)中收集經(jīng)試驗(yàn)驗(yàn)證的且唯一定位到線粒體或質(zhì)體的植物蛋白質(zhì)數(shù)據(jù),作為對(duì)照數(shù)據(jù)集。
1.3雙定位線粒體與質(zhì)體植物蛋白質(zhì)的帶電特性分析
1.3.1蛋白質(zhì)凈電荷信息的獲取利用EMBL-EBI在線工具Pepstats(http://www.ebi.ac.uk/Tools/seqstats/emboss_pepstats/ help/index.html),獲取上述3種定位蛋白質(zhì)數(shù)據(jù)集中蛋白質(zhì)的凈電荷信息,統(tǒng)計(jì)各蛋白質(zhì)的凈電荷。
1.3.2蛋白質(zhì)凈電荷的分布形式蛋白質(zhì)凈電荷的分位數(shù)-分位數(shù)圖(Quantile-Quantile Plot, QQ Plot)可以很直觀地表現(xiàn)數(shù)據(jù)整體的分布情況,幫助鑒別樣本的分布類型。若雙定位蛋白質(zhì)的電荷分布近似于正態(tài)分布,在QQ圖上將近似為一條直線,其中,直線的斜率是標(biāo)準(zhǔn)差σ,截距是均值μ。若QQ圖上的點(diǎn)近似地在一條直線附近,可以認(rèn)為雙定位蛋白質(zhì)的電荷數(shù)據(jù)總體符合正態(tài)分布。
隨后,應(yīng)用Pearson系數(shù)擬合優(yōu)度檢驗(yàn)了雙定位蛋白質(zhì)凈電荷是否服從正態(tài)分布。檢驗(yàn)雙定位蛋白質(zhì)凈電荷正態(tài)分布,當(dāng)某隨機(jī)變量應(yīng)當(dāng)有分布F,現(xiàn)對(duì)X進(jìn)行n次觀察,得到一個(gè)樣本X1,X2,…,Xn。對(duì)蛋白質(zhì)電荷值進(jìn)行分組測(cè)試,計(jì)算原假設(shè)(正態(tài)分布)在各小區(qū)間的理論概率值,先計(jì)算雙定位蛋白質(zhì)的均值(mean)、標(biāo)準(zhǔn)差(sd)與理論概率。根據(jù)不同區(qū)間的劃分,據(jù)此判斷觀測(cè)值是否符合理論假設(shè)。
1.3.3蛋白質(zhì)凈電荷的總體分布比較觀察雙定位于質(zhì)體和線粒體的植物蛋白質(zhì)凈電荷的樣本分布是否滿足Mann-Whitney秩和檢驗(yàn)的假定,即總體分布是否連續(xù)。采用Mann-Whitney秩和檢驗(yàn),分析雙定位于質(zhì)體和線粒體的蛋白質(zhì)、單定于質(zhì)體、單定位于線粒體植物蛋白質(zhì)凈電荷總體間的差異。并利用R語(yǔ)言繪制箱線圖,以展示數(shù)據(jù)分布的主要特征。
2.1植物中定位在線粒體和質(zhì)體的雙定位蛋白質(zhì)
從蛋白質(zhì)定位信息數(shù)據(jù)庫(kù)和已發(fā)表文獻(xiàn)中提取出植物中雙定位于線粒體和質(zhì)體的蛋白質(zhì)(以下簡(jiǎn)稱雙定位蛋白質(zhì))信息(表1)。由表1可見(jiàn),植物雙定位蛋白質(zhì)共有703條。收集到單定位于質(zhì)體或線粒體的植物蛋白質(zhì),其中單定位于質(zhì)體的植物蛋白質(zhì)有6 376個(gè),單定位于線粒體的829個(gè)。本研究也查找以上3種類型蛋白質(zhì)的轉(zhuǎn)運(yùn)肽信息,其中在雙定位蛋白質(zhì)只查找到17個(gè)轉(zhuǎn)運(yùn)肽,在單定位于線粒體或質(zhì)體的植物蛋白質(zhì)中分別查找到376和686個(gè)轉(zhuǎn)運(yùn)肽。
表1雙定位于質(zhì)體和線粒體、單定位于質(zhì)體或線粒體的植物蛋白質(zhì)及其轉(zhuǎn)運(yùn)肽數(shù)量
Table 1Quantities of dual targeted, mitochondrion, and plastid proteins in plants
由表2可見(jiàn),在703條植物雙定位于線粒體和質(zhì)體的蛋白質(zhì)中,來(lái)自擬南芥的蛋白質(zhì)數(shù)量最多,為669個(gè),占比95.16%;來(lái)自水稻的雙定位蛋白質(zhì)共有11個(gè),占比1.56%。其余的來(lái)自8個(gè)植物物種,包括擬南芥、水稻、玉米、煙草(3個(gè)種)、橡膠樹(shù)、小立碗蘚、陸地棉、草莓。
2.2雙定位蛋白質(zhì)的凈電荷分布
2.2.1雙定位蛋白質(zhì)凈電荷的分布類型為了分析植物雙定位蛋白質(zhì)凈電荷分布的特性。本研究比較雙定位蛋白質(zhì)與線粒體或質(zhì)體蛋白質(zhì)的凈電荷分布情況。先應(yīng)用QQ圖描述蛋白質(zhì)凈電荷的分布,雙定位蛋白質(zhì)、線粒體和質(zhì)體蛋白質(zhì)凈電荷QQ圖(圖1)。
表2不同物種中鑒定的植物雙定位蛋白質(zhì)
Table 2Numbers of identified dual targeted proteins in mitochondrion and plastid in differentplant species
若蛋白質(zhì)凈電荷均勻分布在直線兩側(cè),那么蛋白質(zhì)凈電荷符合正態(tài)分布。由圖1可見(jiàn),植物雙定位蛋白質(zhì)凈電荷數(shù)據(jù)在電荷為0附近比較接近正態(tài)分布,但頭尾很大一部分偏離直線的(圖1-A)。整體而言,偏離正態(tài)分布的概率分布。而植物線粒體和質(zhì)體蛋白質(zhì)的凈電荷分布基本相似,凈電荷量低的部分符合正態(tài)分布,但凈電荷高的部分偏離較大(圖1-B、C)。表明僅從蛋白質(zhì)的凈電荷數(shù)據(jù)分布的總體情況,難于做出是否符合正態(tài)分布。
下面再用Pearson系數(shù)擬合優(yōu)度檢驗(yàn)雙定位蛋白質(zhì)的凈電荷是否服從正態(tài)分布,在植物雙定位蛋白質(zhì)凈電荷范圍為[-62.0,59.5],取多個(gè)區(qū)間范圍,檢驗(yàn)其分布與標(biāo)準(zhǔn)正態(tài)分布之間的擬合程度。由表3可見(jiàn),在給定的顯著性水平0.05條件下,P值均小于2.2e-16,表明植物雙定位蛋白質(zhì)凈電荷不服從正態(tài)分布。
2.2.2雙定位蛋白質(zhì)與線粒體和質(zhì)體蛋白質(zhì)凈電荷的總體差異先對(duì)植物雙定位蛋白質(zhì)、線粒體蛋白質(zhì)和質(zhì)體蛋白質(zhì)的凈電荷做統(tǒng)計(jì)分析,結(jié)果見(jiàn)表3。由表3可見(jiàn),植物雙定位蛋白質(zhì)凈電荷、線粒體蛋白質(zhì)凈電荷和質(zhì)體蛋白質(zhì)凈電荷的分布基本滿足Mann-Whitney秩和檢驗(yàn)的假定,即總體分布是連續(xù)的,總體對(duì)其中位數(shù)也是對(duì)稱的。
表33個(gè)蛋白質(zhì)數(shù)據(jù)集凈電荷的基本統(tǒng)計(jì)數(shù)值
Table 3Basic statistics of electric charges of 3 protein datasets
注:*N代表數(shù)據(jù)集包含的總數(shù),Median代表數(shù)據(jù)集的中位數(shù),Mean代表數(shù)據(jù)集的平均值,Sd代表數(shù)據(jù)集的標(biāo)準(zhǔn)差。
采用Mann-Whitney秩和檢驗(yàn),分析植物雙定位蛋白質(zhì)與植物線粒體和質(zhì)體蛋白質(zhì)凈電荷總體間的差異。根據(jù)蛋白質(zhì)電荷的中位數(shù)是否相等,來(lái)判斷2個(gè)樣本分布是否相同。無(wú)論采用連續(xù)修正或不采用連續(xù)修正,其P值均小于0.05,表明雙定位蛋白質(zhì)的凈電荷樣本分布不同于植物線粒體蛋白質(zhì)或質(zhì)體蛋白質(zhì)凈電荷的分布。而且植物線粒體和質(zhì)體蛋白質(zhì)凈電荷樣本的差異P值1.98e-05,顯著大于雙定位蛋白質(zhì)與植物線粒體蛋白質(zhì)凈電荷樣本的差異(P<2.2e-16),也大于雙定位蛋白質(zhì)與植物質(zhì)體蛋白質(zhì)凈電荷樣本的差異(P<2.2e-16)。進(jìn)一步證明了植物雙定位蛋白質(zhì)與植物線粒體或質(zhì)體蛋白質(zhì)凈電荷間均存在顯著差異性。
為了進(jìn)一步比較雙定位蛋白質(zhì)與線粒體蛋白質(zhì)、質(zhì)體蛋白質(zhì)凈電荷分布的差異,對(duì)3個(gè)數(shù)據(jù)集作連續(xù)修正的左邊Mann-Whitney秩和檢驗(yàn),結(jié)果見(jiàn)表4。由表4可見(jiàn),雙定位蛋白質(zhì)與線粒體蛋白質(zhì)凈電荷樣本的差異P值<2.2e-16,遠(yuǎn)小于0.05,表明植物線粒體蛋白質(zhì)的凈電荷和質(zhì)體蛋白質(zhì)的凈電荷均高于雙定位蛋白質(zhì)。
利用箱線圖能直觀展示數(shù)據(jù)的分布特征,做3個(gè)數(shù)據(jù)集蛋白質(zhì)凈電荷分布的箱線圖,結(jié)果見(jiàn)圖2。由圖2中可以看出,3個(gè)數(shù)據(jù)集的電荷分布,主要集中在0~20,質(zhì)體蛋白質(zhì)和線粒體蛋白質(zhì)的電荷明顯高于雙定位蛋白質(zhì)。雙定位蛋白質(zhì)電荷分布較為集中對(duì)稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。另外,質(zhì)體蛋白質(zhì)還含有較多超出上下四分位數(shù)的異常值,質(zhì)體蛋白質(zhì)和線粒體蛋白質(zhì)電荷的異常值大多是高于上四分位數(shù)。
表4連續(xù)修正的左邊Mann-Whitney秩和檢驗(yàn)
Table 4Left sided Mann-Whitney rank sum test with continuity correction
注:W是Wilcoxon-MannWhitne統(tǒng)計(jì)量。
本研究查找發(fā)現(xiàn),經(jīng)試驗(yàn)驗(yàn)證的植物線粒體和質(zhì)體雙定位蛋白質(zhì)有703個(gè),其中擬南芥的線粒體和質(zhì)體雙定位蛋白質(zhì)就達(dá)到669個(gè)。Carrie等[3]也收集了100多個(gè)經(jīng)試驗(yàn)驗(yàn)證的植物線粒體和質(zhì)體雙定位蛋白質(zhì),發(fā)現(xiàn)大多數(shù)已知的雙定位蛋白質(zhì)為可溶的基質(zhì)蛋白。而僅小部分為膜結(jié)合蛋白質(zhì),且多為外膜蛋白。這些蛋白質(zhì)大多與核苷酸代謝、DNA復(fù)制、重組與修復(fù)、蛋白質(zhì)翻譯等功能相關(guān)。此外,在本研究發(fā)現(xiàn)的703個(gè)雙定位蛋白質(zhì)中僅找到17條轉(zhuǎn)運(yùn)肽信息。轉(zhuǎn)運(yùn)肽是一種12~60個(gè)氨基酸殘基的前導(dǎo)序列,它引導(dǎo)在細(xì)胞溶質(zhì)中合成的蛋白質(zhì)輸入線粒體和質(zhì)體。植物雙定位蛋白質(zhì)的轉(zhuǎn)運(yùn)肽同時(shí)具有線粒體轉(zhuǎn)運(yùn)肽和質(zhì)體轉(zhuǎn)運(yùn)肽的特征,并且常常介于二者之間[21-22]。Mitschke等[2]應(yīng)用這一特性開(kāi)發(fā)了首個(gè)針對(duì)植物雙定位蛋白質(zhì)的預(yù)測(cè)工具ATP。當(dāng)然,僅依據(jù)蛋白質(zhì)N端前導(dǎo)序列特征預(yù)測(cè)植物線粒體和質(zhì)體雙定位蛋白質(zhì)還存在嚴(yán)重的假陽(yáng)性,其預(yù)測(cè)靈敏度有待提高。因此,研究人員要不斷探究植物蛋白質(zhì)雙定位的分子機(jī)制。
對(duì)植物線粒體和質(zhì)體雙定位蛋白質(zhì)的特征分析發(fā)現(xiàn),植物雙定位蛋白質(zhì)的凈電荷顯著性低于線粒體和質(zhì)體蛋白質(zhì)。Dinurmills 等[23]根據(jù)亞細(xì)胞定位篩選和預(yù)測(cè)結(jié)果,將線粒體蛋白質(zhì)分為2個(gè)子集,一類是預(yù)測(cè)為具有雙定位能力的線粒體蛋白質(zhì)126個(gè),另一類是預(yù)測(cè)為只定位在線粒體的蛋白質(zhì)409個(gè)。他們的研究也發(fā)現(xiàn)與只定位在線粒體的蛋白質(zhì)相比,雙定位蛋白質(zhì)的總凈電荷更低。由此可見(jiàn),凈電荷更低是雙定位蛋白質(zhì)相對(duì)于單定位蛋白質(zhì)的顯著特征之一。雙定位蛋白質(zhì)電荷分布較為集中對(duì)稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。這似乎暗示,雙定位蛋白質(zhì)與線粒體蛋白質(zhì)差異較小,而與質(zhì)體蛋白質(zhì)差異較大。說(shuō)明雙定位蛋白質(zhì)可能是由線粒體蛋白質(zhì)獲得再定位到質(zhì)體的功能而產(chǎn)生的;也可能是在雙定位機(jī)制受到阻礙時(shí),雙定位蛋白質(zhì)會(huì)優(yōu)先選擇定位到線粒體。這為下一步開(kāi)展植物蛋白質(zhì)定位研究提供了線索。
本研究結(jié)果表明,與單定位于線粒體或質(zhì)體的植物蛋白質(zhì)相比,雙定位線粒體與質(zhì)體的植物蛋白質(zhì)具有更低的凈電荷量,這是雙定位蛋白質(zhì)相對(duì)于單定位蛋白質(zhì)的顯著特征之一。此外,雙定位蛋白質(zhì)電荷分布較為集中對(duì)稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。本研究結(jié)果將為揭示植物蛋白質(zhì)雙定位的分子機(jī)制奠定理論基礎(chǔ)。
[1]YOGEV O,PINES O.Dual targeting of mitochondrial proteins:mechanism,regulation and function [J].Biochim Biophys Acta,2011,1808(3):1012-1020.
[2]MITSCHKE J,F(xiàn)USS J,BLUM T,et al.Prediction of dual protein targeting to plant organelles[J].New Phytol,2009,183(1):224-235.
[3]CARRIE C,SMALL I.A reevaluation of dual-targeting of proteins to mitochondria and chloroplasts [J].Biochim Biophys Acta,2013,1833(2):253-259.
[4]SILVAFILHO M C.One ticket for multiple destinations:dual targeting of proteins to distinct subcellular locations [J].Curr Opin Plant Biol,2003,6(6):589-595.
[5]KARNIELY S,PINES O.Single translation—dual destination:mechanisms of dual protein targeting in eukaryotes [J].EMBO reports,2005,6(5):420-425.
[6]CONSORTIUM U P.The Universal Protein Resource (UniProt) in 2010 [J].Nucleic Acids Res,2010,38(Database issue):D142-148.
[7]ELSTNER M,ANDREOLI C,KLOPSTOCK T,et al.The mitochondrial proteome database:MitoP2 [J].Methods Enzymol,2009,457:3-20.
[8]DRABKIN H J, BLAKE J A.Manual Gene Ontology annotation workflow at the Mouse Genome Informatics Database [J].Database,2012,2012:bas045.
[9]LAMESCH P,BERARDINI T Z,LI D.The Arabidopsis Information Resource (TAIR): improved gene annotation and new tools [J].Nucleic Acids Res,2012,40(Database issue):D1202-D1210.
[10]ZHANG S,XIA X,SHEN J,et al.DBMLoc:a Database of proteins with multiple subcellular localizations [J].BMC Bioinformatics,2008,9:127.
[11]EMANUELSSON O,NIELSEN H,BRUNAK S,et al.Predicting subcellular localization of proteins based on their N-terminal amino acid sequence [J].J Mol Biol,2000,300(4):1005-1016.
[12]HORTON P,PARK K J,OBAYASHI T,et al.WoLF PSORT: protein localization predictor [J].Nucleic Acids Res,2007,35(Web Server issue):W585-587.
[13]BLUM T,BRIESEMEISTER S,KOHLBACHER O.MultiLoc2:integrating phylogeny and Gene Ontology terms improves subcellular protein localization prediction [J].BMC Bioinformatics,2009,(10):274.
[14]SMALL I,PEETERS N,LEGEAI F,et al.Predotar: A tool for rapidly screening proteomes for N-terminal targeting sequences [J].Proteomics,2004,4(6):1581-1590.
[15]YU C,CHEN Y,LU C,et al.Prediction of protein subcellular localization [J].Proteins,2006,64(3):643-651.
[16]CHOU K,SHEN H.Plant-mPLoc:a top-down strategy to augment the power for predicting plant protein subcellular localization [J].PLoS One,2010,5(6):e11335.
[17]MORGANTE C V,RODRIGUES R A,MARBACH P A,et al.Conservation of dual-targeted proteins in Arabidopsis and rice points to a similar pattern of gene-family evolution [J].Mol Genet Genomics,2009,281(5):525-538.
[18]SCHWACKE R,F(xiàn)ISCHER K,KETELSEN B,et al.Comparative survey of plastid and mitochondrial targeting properties of transcription factors in Arabidopsis and rice [J].Mol Genet Genomics,2007,277(6):631-646.
[19]CARRIE C,GIRAUD E,WHELAN J.Protein transport in organelles: Dual targeting of proteins to mitochondria and chloroplasts [J].FEBS J,2009,276(5):1187-1195.
[20]CAMON E,MAGRANE M,BARRELL D,et al.The Gene Ontology Annotation (GOA) Database: sharing knowledge in Uniprot with Gene Ontology [J].Nucleic Acids Res,2004,32(Database issue):D262-D266.
[21]BERGLUND A K,SPANNING E,BIVERSTAHL H,et al.Dual targeting to mitochondria and chloroplasts: characterization of Thr-tRNA synthetase targeting peptide [J].Mol Plant,2009,2(6):1298-1309.
[22]PUJOL C,MARECHAL-DROUARD L,DUCHENE A M.How can organellar protein N-terminal sequences be dual targeting signals in silico analysis and mutagenesis approach [J].J Mol Biol,2007,369 (2) 356-367.
[23]DINURMILLS M,TAL M,PINES O.Dual targeted mitochondrial proteins are characterized by lower MTS parameters and total net charge [J].PLoS One,2008,3(5):e2161.
(責(zé)任編輯:柯文輝)
Net Electric Charges of Dual Targeted Proteins in Mitochondria and Plastid of Plants
LIN Shou-kai1,2,F(xiàn)U Xiao-fei1,HUANG Jian1,TAO Huan1,XU Chao-qun1,Liu Wei1,Zhang Li-na1,Ai Yu-fang1,He Hua-qin1*
(1.CollegeofLifeSciences,F(xiàn)ujianAgricultureandForestryUniversity,F(xiàn)uzhou,F(xiàn)ujian350002,China;2.CollegeofEnvironmentalandBiologicalEngineering/FujianProvincialKeyLaboratoryofEcology-toxicologicalEffects&ControlforEmergingContaminants,PutianUniversity,Putian,F(xiàn)ujian351100,China)
Protein targeting is an important tool to determine the functionality of a protein. Adual targeted protein isa protein that located in two subcellular locations. It was estimated that more than 400 proteins were putatively targeted to mitochondria as well as plastid based on the ambiguous N-terminal pre-sequences in land plant genomes. In this study, the dual targeted proteins were searched against the protein databases of Uniprot, Mito P2, MGI, TAIR, and DBMLoc as well as the existing publications. A total of 703 proteins localized in both mitochondria and plastid in plants were collected. Whilst, 829 exclusive mitochondrial and 6 376 exclusive plastid proteins were downloaded from Uniprotfor comparison. The net electric charges of the dual targeted proteins were analyzed based on these 3 data sets. The results indicated the net charge of the plant dual targeted proteins was significantly lower than that of the proteins exclusively existed in mitochondrial or plastid. The charge differentiation provideda critical clue for the study of the molecular mechanism of dual targeted proteins in plants.
dual targeted protein; plant; mitochondria; plastid; net electric charge
2016-05-28初稿;2016-06-18修改稿
林授鍇(1984-),男,博士生,助理研究員,研究方向:植物分子生物學(xué)與生物信息學(xué)(E-mail:shoukai.lin@foxmail.com)
何華勤(1968-),男,博士,教授,博士生導(dǎo)師,研究方向:植物分子生態(tài)學(xué)與生物信息學(xué)(E-mail:hehq3@fafu.edu.cn)
國(guó)家自然科學(xué)基金(31270454、81502091);福建省自然科學(xué)基金(2016J01101);閩臺(tái)作物特色種質(zhì)創(chuàng)制與綠色栽培協(xié)同創(chuàng)新中心項(xiàng)目(2015-75)
Q 51
A
1008-0384(2016)07-671-06
林授鍇,傅曉菲,黃健,等.植物線粒體和質(zhì)體雙定位蛋白質(zhì)的帶電特性分析[J].福建農(nóng)業(yè)學(xué)報(bào),2016,31(7):671-676.
LIN S-K,F(xiàn)U X-F,HUANG J,et al.Net Electric Charges of Dual Targeted Proteins in Mitochondria and Plastid of Plants[J].FujianJournalofAgriculturalSciences,2016,31(7):671-676.