萬(wàn)平
(首都師范大學(xué)生命科學(xué)學(xué)院,北京 100048)
RNA編輯指通過替換、插入、缺失機(jī)制在RNA分子水平改變遺傳信息的生物學(xué)過程[1-3]。1986年,在錐體蟲的線粒體中首先發(fā)現(xiàn)RNA編輯現(xiàn)象[4]。1989年,在植物的線粒體中發(fā)現(xiàn)RNA編輯現(xiàn)象[5-7]。1991年,在植物的葉綠體中發(fā)現(xiàn)RNA編輯現(xiàn)象[8]。到目前為止,在真核生物、細(xì)菌、病毒中都已發(fā)現(xiàn)RNA編輯,但在古細(xì)菌中還沒有發(fā)現(xiàn)[9]。
植物中RNA編輯主要發(fā)生在進(jìn)行光合作用的葉綠體和進(jìn)行呼吸作用的線粒體這兩種細(xì)胞器中[10],植物RNA編輯類型主要有3種:C-to-U、U-to-C和A-to-I。C-to-U編輯發(fā)生在除苔類植物地錢之外的所有陸生植物中,U-to-C編輯只發(fā)生在從角苔到蕨類的少數(shù)非開花陸生植物中[11]。A-to-I編輯只在種子植物葉綠體 tRNA 中被觀察到[12,13]。
植物線粒體和葉綠體RNA編輯數(shù)目存在很大差別。被子植物葉綠體中RNA編輯位點(diǎn)數(shù)目遠(yuǎn)低于線粒體RNA編輯位點(diǎn)數(shù)目[14]。盡管距發(fā)現(xiàn)植物RNA編輯現(xiàn)象已過去了20多年,但人們對(duì)于葉綠體和植物線粒體中RNA編輯的機(jī)理仍知之甚少[15,16]。
Thompson 等[17,18]采用(1)氨基酸轉(zhuǎn)移概率、(2)密碼子轉(zhuǎn)移概率、(3)編輯位點(diǎn)在密碼子中的位置、(4)編輯位點(diǎn)-1位置堿基出現(xiàn)頻率、(5)編輯位點(diǎn)+1位置堿基出現(xiàn)頻率5個(gè)特征預(yù)測(cè)植物線粒體C-to-U編輯,取得很好預(yù)測(cè)效果。本研究采用這5個(gè)特征,對(duì)非維管植物和維管植物線粒體和葉綠體RNA編輯進(jìn)行比較研究,旨在為該方面研究提供參考。
非管植物和維管植物RNA編輯位點(diǎn)信息及基因組DNA序列下載自NCBI GenBank數(shù)據(jù)庫(kù)(表1)。
采用Perl腳本,對(duì)4 892個(gè)線粒體RNA編輯位點(diǎn)和1 228個(gè)葉綠體RNA編輯位點(diǎn)進(jìn)行以下5個(gè)方面的分析:
表1 本研究所用數(shù)據(jù)集
(1)氨基酸轉(zhuǎn)移概率。計(jì)算公式如下:
其中,ai代表RNA編輯前編輯位點(diǎn)所在密碼子編碼的氨基酸;aj代表RNA編輯后編輯位點(diǎn)所在密碼子編碼的氨基酸;faiaj代表由編輯前密碼子編碼的氨基酸ai轉(zhuǎn)移為編輯后密碼子編碼的氨基酸aj出現(xiàn)的頻數(shù)。氨基酸共有20種。
(2)密碼子轉(zhuǎn)移概率。計(jì)算公式如下:
其中,codoni代表RNA編輯前編輯位點(diǎn)所在密碼子;codonj代表RNA編輯后編輯位點(diǎn)所在密碼子;fcodonicodonj代表由編輯前密碼子codoni轉(zhuǎn)移為編輯后密碼子codonj出現(xiàn)的頻數(shù)。密碼子共有64種。
(3)編輯位點(diǎn)在密碼子中出現(xiàn)位置概率。編輯位點(diǎn)在密碼子中可能出現(xiàn)的位置分別為1、2、3,統(tǒng)計(jì)編輯位點(diǎn)出現(xiàn)在密碼子中每個(gè)位置上的概率。
(4)編輯位點(diǎn)-1位堿基組成。統(tǒng)計(jì)編輯位點(diǎn)上游-1位置出現(xiàn)A、U、C、G四種堿基的概率。
(5)編輯位點(diǎn)+1位堿基組成。統(tǒng)計(jì)編輯位點(diǎn)下游+1位置出現(xiàn)A、U、C、G四種堿基的概率。
樣本概率分布差異檢驗(yàn)采用R語(yǔ)言工具包(http://www.r-project.org/)中Mann-Whitney檢驗(yàn)方法。
RNA編輯前后,編輯位點(diǎn)所在密碼子編碼的氨基酸種類通常會(huì)發(fā)生轉(zhuǎn)變,被稱為氨基酸轉(zhuǎn)移。在RNA編輯中,不同氨基酸發(fā)生轉(zhuǎn)移的概率不同。結(jié)果顯示,非維管植物(角苔)中脯氨酸到亮氨酸(P>L)、絲氨酸到苯丙氨酸(S>F)的轉(zhuǎn)移概率較高(圖1-A)。而維管植物中脯氨酸到亮氨酸(P>L)和絲氨酸到亮氨酸(S>L)氨基酸轉(zhuǎn)移概率較高(圖1-B和 1-C)。
圖1 植物線粒體和葉綠體RNA編輯的氨基酸轉(zhuǎn)移概率
Mann-Whitney檢驗(yàn)結(jié)果表明,在非維管植物和蕨類植物中,線粒體和葉綠體RNA編輯在氨基酸轉(zhuǎn)移概率都沒有顯著差別(p值分別為0.816 6和0.099 98),而被子植物線粒體和葉綠體在氨基酸轉(zhuǎn)移概率方面存在顯著差異(p值為0.042 94)。
RNA編輯前后,編輯位點(diǎn)所在密碼子的種類也有可能發(fā)生轉(zhuǎn)變,這種轉(zhuǎn)變被稱為密碼子轉(zhuǎn)移。在RNA編輯中,不同密碼子發(fā)生轉(zhuǎn)移的概率不同。非維管植物(角苔)中密碼子UCA>UUA和UCU>UUU的轉(zhuǎn)移概率較高(圖2-A)。蕨類植物的線粒體RNA編輯中,密碼子CGG>UGG和UCC>UUC的轉(zhuǎn)移概率較高;而蕨類植物葉綠體RNA編輯中,密碼子ACG>AUG和UCA>UUA中的轉(zhuǎn)移概率較高(圖2-B)。被子植物中,密碼子UCA>UUA的轉(zhuǎn)移概率都很高(圖2-C),但線粒體密碼子轉(zhuǎn)移的種類(57種)遠(yuǎn)多于葉綠體密碼子轉(zhuǎn)移的種類(10種),并且也多于非維管植物(角苔)(43種)和蕨類植物(35種)中線粒體密碼子轉(zhuǎn)移的種類。
Mann-Whitney檢驗(yàn)結(jié)果表明,在非維管植物和蕨類植物中,線粒體和葉綠體RNA編輯在密碼子轉(zhuǎn)移概率方面都沒有顯著差別(p值分別為0.221 2和0.181 4),而被子植物線粒體和葉綠體在密碼子轉(zhuǎn)移概率方面存在顯著差異(p值為5.989 e-9)。
編輯位點(diǎn)在密碼子中的3個(gè)位置都有可能出現(xiàn),但在非維管植物和維管植物線粒體和葉綠體RNA編輯中,編輯位點(diǎn)在密碼子第2位出現(xiàn)的概率都很高(圖3)。Mann-Whitney檢驗(yàn)結(jié)果表明,植物線粒體和葉綠體RNA編輯位點(diǎn)在密碼子中出現(xiàn)位置不存在顯著差異。
圖2 植物線粒體和葉綠體RNA編輯的密碼子轉(zhuǎn)移概率
圖3 植物線粒體和葉綠體RNA編輯編輯位點(diǎn)在密碼子中的位置
植物線粒體和葉綠體RNA編輯中,4種堿基在編輯位點(diǎn)-1位都有可能出現(xiàn),但尿嘧啶(U)和胞嘧啶(C)出現(xiàn)在編輯位點(diǎn)-1位的概率較高(圖4)。Mann-Whitney檢驗(yàn)結(jié)果表明,植物線粒體和葉綠體RNA編輯在編輯位點(diǎn)-1位堿基出現(xiàn)概率方面不存在顯著差異。
植物線粒體和葉綠體RNA編輯中,4種堿基在編輯位點(diǎn)+1位都有可能出現(xiàn)(圖5)。非維管植物中U和C出現(xiàn)概率較高(圖5-A);蕨類植物中C和G出現(xiàn)概率較高(圖5-B);被子植物中A和G出現(xiàn)概率較高(圖5-C)。Mann-Whitney檢驗(yàn)結(jié)果表明,非維管植物和維管植物植物線粒體和葉綠體RNA編輯在編輯位點(diǎn)+1位堿基出現(xiàn)概率方面都不存在顯著差異。
圖4 植物線粒體和葉綠體RNA編輯編輯位點(diǎn)-1位堿基出現(xiàn)概率
圖5 植物線粒體和葉綠體RNA編輯編輯位點(diǎn)+1位堿基出現(xiàn)概率
植物線粒體RNA編輯位點(diǎn)的數(shù)目大約是葉綠體RNA編輯位點(diǎn)數(shù)目的10倍,但目前人們還不知道為什么植物線粒體RNA編輯位點(diǎn)數(shù)目遠(yuǎn)多于葉綠體RNA 編輯位點(diǎn)數(shù)目[19]。
已發(fā)現(xiàn)在植物線粒體中存在兩套tRNA:第一套由線粒體基因組編碼,第二套由核基因組編碼,經(jīng)細(xì)胞質(zhì)輸入到線粒體[20]。而在葉綠體中,所有tRNA 都是由葉綠體基因組編碼[21,22]。然而,在已測(cè)序的葉綠體tRNA或tRNA基因中,與密碼子CUU/C(Leu),CCU/C(Pro),GCU/C(Ala)和 CGC/A/G(Arg)互補(bǔ)的反密碼子tRNA都沒有被發(fā)現(xiàn)[12]。
本研究發(fā)現(xiàn),被子植物線粒體和葉綠體RNA編輯在密碼子轉(zhuǎn)移概率方面存在顯著差異,葉綠體RNA編輯中密碼子轉(zhuǎn)移的種類(10種)遠(yuǎn)少于線粒體中密碼子轉(zhuǎn)移的種類(57種)。產(chǎn)生這種現(xiàn)象的原因很可能是由于葉綠體中tRNA種類不全造成的,而被子植物線粒體和葉綠體RNA編輯在氨基酸轉(zhuǎn)移概率方面的顯著差異可能也是由于葉綠體中tRNA種類不全間接導(dǎo)致的。
另外,已發(fā)現(xiàn)有兩個(gè)蛋白家族:PPR和MORF參與RNA編輯[23],蛋白家族中不同成員分別參與葉綠體和線粒體RNA編輯過程。參與葉綠體和線粒體RNA編輯過程的PPR蛋白的種類和數(shù)目可能也是導(dǎo)致葉綠體和線粒體RNA編輯在氨基酸轉(zhuǎn)移概率和密碼子轉(zhuǎn)移概率方面存在顯著差異原因。
植物RNA編輯機(jī)理仍是一個(gè)未解之謎,葉綠體中tRNA的種類為何不完整,以及除PPR和MORF家族外是否還有其他蛋白家族參與植物RNA編輯,這些問題需要進(jìn)一步深入的研究。
被子植物線粒體和葉綠體RNA編輯在氨基酸轉(zhuǎn)移概率、密碼子轉(zhuǎn)移概率方面存在顯著差異。
[1] Gott JM. Expanding genome capacity via RNA editing[J].Comptes Rendus Biologies, 2003, 326(10-11):901-908.
[2] Brennicke A, Marchfelder A, Binder S. RNA editing[K]. FEMS Microbiol Rev, 1999, 23(3):297-316.
[3] Knoop V. When you can’t trust the DNA:RNA editing changes transcript sequences[J]. Cell Mol Life Scie, 2011, 68:1-20.
[4] Benne R, Van den Burg J, Brakenhoff JP, et al. Major transcript of the frameshifted coxII gene from trypanosome mitochondria contains four nucleotides that are not encoded in the DNA[J]. Cell, 1986,46(6):819.
[5] Covello PS, Gray MW. RNA editing in plant mitochondria[J].Nature, 1989, 341:662-666.
[6] Hiesel R, Wissinger B, Schuster W, Brennicke A. RNA editing in plant mitochondria[J]. Science, 1989, 246:1632-1634.
[7] Gualberto JM, Lamattina L, Bonnard G, et al. RNA editing in wheat mitochondria results in the conservation of protein sequences[J].Nature, 1989, 341(6243):660-662.
[8] Hoch B, Maier RM, Appel K, et al. Editing of a chloroplast mRNA by creation of an initiation codon[J]. Nature, 1991, 353:178-180.
[9] Grosjean H. Modification and editing of RNA:historical overview and important facts to remember[J]. Topics in Current Genetics,2005, 12:1-22.
[10] Chateigner-Boutin AL. Plant RNA editing[J]. RNA Biology,2010, 7(2):213-219.
[11] Freyer R, Kiefer-Meyer MC, K?ssel H. Occurrence of plastid RNA editing in all major lineages of land plants[J]. PNAS, 1997, 94(12):6285- 6290.
[12] Pfitzinger H, Weil JH, Pillay DTN, Guillemaut P. Codon recognition mechanisms in plant chloroplasts[J]. Plant Molecular Biology,1990, 14(5):805-814.
[13] Delannoy E, Le Ret M, Faivre-Nitschke E, et al.ArabidopsistRNA adenosine deaminase arginine edits the wobble nucleotide of chloroplast tRNAArg(ACG)and is essential for efficient chloroplast translation[J]. The Plant Cell, 2009, 21(7):2058-2071.
[14] Gray MW. RNA editing in plant mitochondria:20 years later[J].IUBMB Life, 2009, 61(12):1101-1104.
[15] Kotera E, Tasaka M, Shikanai T. A pentatricopeptide repeat protein is essential for RNA editing in chloroplasts[J]. Nature, 2005,433(7023):326-330.
[16] Fujii S, Small I. The evolution of RNA editing and pentatricopeptide repeat genes[J]. New Phytol, 2011, 191(1):37-47.
[17] Thompson J, Gopal S. Genetic algorithm learning as a robust approach to RNA editing site prediction[J]. BMC Bioinformatics,2006, 7(1):145.
[18] Thompson J, Gopal S. Correction:genetic algorithm learning as a robust approach to RNA editing site prediction[J]. BMC Bioinformatics, 2006, 7(1):406.
[19] Gray MW. Evolutionary origin of RNA editing[J]. Biochemistry,2012, 51(26):5235-5242.
[20] Marechal-Drouard L, Weil JH, Guillemaut P. Import of several tRNAs from the cytoplasm into the mitochrondria in beanPhaseolus vulgaris[J]. Nucl Acids Res, 1988, 16(11):4777-4788.
[21] Ohyama K, Fukuzawa H, Kohchi T, et al. Chloroplast gene organization deduced from complete sequence of liverwortMarchantia polymorphachloroplast DNA[J]. Nature, 1986, 322:572-574.
[22] Shinozaki K, Ohme M, Tanaka M, et al. The complete nucleotide sequence of the tobacco chloroplast genome:its gene organization and expression[J]. The EMBO Journal, 1986, 5(9):2043-2049.
[23] Takenaka M, Zehrmann A, Verbitskiy D, et al. Multiple organellar RNA editing factor(MORF)family proteins are required for RNA editing in mitochondria and plastids of plants[J]. PNAS, 2012,109(13):5104-5109.