田金虎,鄭明剛,鄭 立,肖立家,李建波
(1.石河子大學(xué)食品學(xué)院,新疆 石河子832003;2.國家海洋局第一海洋研究所,山東 青島266061;3.大唐山東發(fā)電有限公司,山東 青島266061)
近年來,由于全球石化燃料消費(fèi)量的激增、石化儲量的減少,引起了世界范圍內(nèi)的能源危機(jī),尋找一種廉價的綠色可再生能源已成為世界各國政府以及民眾廣泛關(guān)注的科學(xué)與社會問題[1-3]。微擬球藻(Nannochloropsis sp.)屬于褐藻門,大眼藻綱,單珠藻科。它的油脂含量占干重的比重達(dá)68%以上,油脂以C16和C20脂肪酸為主。相對于目前的生物質(zhì)燃料而言,微擬球藻是公認(rèn)的最有希望用于工業(yè)化的高產(chǎn)油海水藻[4]。微擬球藻生產(chǎn)生物柴油具有光合作用效率高、環(huán)境適應(yīng)能力強(qiáng)、生長周期短、不受氣候限制、培養(yǎng)不占用耕地、易于實(shí)現(xiàn)大規(guī)模生產(chǎn)等優(yōu)點(diǎn)[5-6]。但是,微擬球藻生物柴油的開發(fā)仍面臨許多瓶頸,高昂的成本讓其產(chǎn)業(yè)化步履維艱。如果微擬球藻的油脂含量得到大幅增加,則意味著利用其制造生物柴油將更具有競爭力。
隨著分子生物學(xué)的發(fā)展,更多的科研工作者希望通過基因工程技術(shù)對微藻進(jìn)行改造,以期獲得高油脂含量的藻株。相比于大豆﹑油菜、酵母等[7-10]其他基因工程研究開展的比較早的物種而言,微擬球藻產(chǎn)油的研究還處在初級階段,現(xiàn)有的微擬球藻分子生物學(xué)研究還局限于對少量基因的克隆﹑分析及表達(dá)研究[11-12]。對于微擬球藻生長發(fā)育、抗逆、產(chǎn)油等的調(diào)控機(jī)制,還需要大量的基礎(chǔ)研究工作。
轉(zhuǎn)錄組分析是在整體水平上研究細(xì)胞中基因轉(zhuǎn)錄的情況及轉(zhuǎn)錄調(diào)控規(guī)律的分析方法,高通量測序技術(shù)如羅氏454、Illumina等是研究植物﹑微生物等轉(zhuǎn)錄組最常用的方法[13-14],它們具有高通量﹑高準(zhǔn)確性﹑高靈敏度和低運(yùn)行成本等突出優(yōu)勢[15]。通過高通量測序技術(shù),每一個樣品可以產(chǎn)生數(shù)百萬個mRNA標(biāo)簽,這些標(biāo)簽幾乎涵蓋了單個細(xì)胞所有的mRNA,這為確認(rèn)轉(zhuǎn)錄組功能信息提供了有力的技術(shù)保障。本研究針對微擬球藻指數(shù)期和平臺期基因表達(dá)調(diào)控模式和表達(dá)量的變化,采用高通量測序技術(shù)對微擬球藻不同生長時期的轉(zhuǎn)錄組進(jìn)行測序,以期豐富微擬球藻油脂代謝調(diào)控及轉(zhuǎn)錄組學(xué)相關(guān)基礎(chǔ)理論,闡明微擬球藻油脂積累與相關(guān)基因表達(dá)差異的關(guān)系,為構(gòu)建富油微擬球藻工程藻株提供理論依據(jù)。
實(shí)驗選用國家海洋局第一海洋研究所藻種庫的微擬球藻藻種(Nannochloropsis gaditana HH-1),采用f/2培養(yǎng)基培養(yǎng)[16],培養(yǎng)溫度為25℃,光照強(qiáng)度8 000lx,光暗比為12h/12h,在微擬球藻生長的指數(shù)期和平臺期分別取樣[17],4℃、5 000r/min離心5min后液氮速凍,放入-80℃保存,用于總RNA提取。
指數(shù)期和平臺期總RNA提取方法參照Invitrogen公司的Trizol Reagent說明書并用1.0%瓊脂糖凝膠電泳和紫外分光光度計檢測確定總RNA質(zhì)量。
將符合條件的指數(shù)期和平臺期提取的總RNA用含有oligo-dT的Beads與mRNA上的poly-A結(jié)合,純化出mRNA,然后用化學(xué)加高溫的方法將mRNA打斷成155bp左右的短片段。以mRNA為模版,用隨機(jī)引物合成第一條cDNA鏈,加入緩沖溶液、dNTPs、RNase H、DNA polymerase I合成第二條cDNA 鏈,并通過3′-5′核酸外切酶及聚合酶的共同作用,修復(fù)帶有突出末端的DNA片段。在修復(fù)平整的DNA片段3′端引入單堿基“T”,在連接酶的作用下,孵育含有標(biāo)簽的接頭與DNA片段使其相連。用AMPure XPbeads純化游離的接頭和沒有連上接頭的片段,然后用PCR有選擇性的富集DNA片段,同時擴(kuò)增DNA文庫。最后用Pico green和熒光分光光度計定量文庫,并使用Agilent 2100對PCR富集片段進(jìn)行質(zhì)量控制,驗證DNA文庫的片段大小及分布,將得到的樣品逐步稀釋到4~5pmol/L后進(jìn)行上機(jī)測序。
利用HiSeq 2000平臺獲得微擬球藻指數(shù)期和平臺期的圖像序列信息,然后將所得圖像數(shù)據(jù)轉(zhuǎn)化為相應(yīng)的核苷酸序列(Raw reads),并對所產(chǎn)生的核苷酸序列進(jìn)行可信度分析及質(zhì)量評估。去除核苷酸序列中低質(zhì)量和低復(fù)雜的序列,然后用Velvet和Oases軟件進(jìn)一步進(jìn)行轉(zhuǎn)錄組裝和拼接(K=47,length_300,其他默認(rèn)),用于獲得相關(guān)序列。
分析轉(zhuǎn)錄組整體表達(dá)情況,使用RPKM值(Reads per kb per million reads)[18]計算基因表達(dá)量,并利用2-fold法統(tǒng)計指數(shù)期和平臺期序列的RPKM值差異(定義:一條序列的RPKM值在指數(shù)期大于或等于平臺期的2倍,則為指數(shù)期表達(dá)上調(diào),反之則為平臺期表達(dá)上調(diào)。若兩時期RPKM值差異不超過2倍,則為表達(dá)無差異)。將全部序列在KEGG pathway數(shù)據(jù)庫對比,獲得相關(guān)序列的代謝通路注釋及在代謝通路中的具體位置信息[19],然后對2個時期參與脂質(zhì)代謝途徑的序列進(jìn)行統(tǒng)計分析。
將所得的序列與SwissProt、nr數(shù)據(jù)庫進(jìn)行序列比對分析,統(tǒng)計與數(shù)據(jù)庫中已收錄基因具有高度相似性的序列,獲取最佳注釋(E-value<10-5)。然后將所有序列在COG數(shù)據(jù)庫[20](http://www.ncbi.nlm.nih.gov/COG)中進(jìn)行比對分析(E-value<10-5),獲得微擬球藻表達(dá)序列的COG功能注釋及分類。
瓊脂糖凝膠電泳結(jié)果顯示5S、18S及28SRNA條帶完整,RNA純度較高。紫外分光光度檢測表明在指數(shù)期和平臺期A260/A280均不小于1.8,表明總RNA質(zhì)量較好。對2個時期總RNA樣品分別進(jìn)行處理后,參照試劑盒說明書(Agilent 2100DNA 1000Kit)對樣本文庫進(jìn)行大小質(zhì)檢,檢測結(jié)果顯示兩時期文庫大小均在280~320bp之間,可以滿足測序和分析要求。
全部數(shù)據(jù)經(jīng)去除雜質(zhì)及低質(zhì)量片段后,用Velvet軟件和Oases軟件進(jìn)行轉(zhuǎn)錄序列組裝。2個時期共獲得29 203條序列,序列長度主要分布在100~3 000bp范圍內(nèi)。大于3 000bp的序列有1 642條,占序列總量的17.78%。200~1 600bp范圍內(nèi)的序列數(shù)量最多,占全部序列數(shù)量的67.71%,序列長度分布見圖1。
圖1 Unigene長度分布圖Fig.1 Length distribution of unigenes
利用RPKA值對基因表達(dá)量進(jìn)行計算,并用2-fold法進(jìn)行數(shù)據(jù)統(tǒng)計分析,分析結(jié)果見圖2。在整個轉(zhuǎn)錄組序列數(shù)據(jù)中,指數(shù)期表達(dá)上調(diào)的序列有7 305條,平臺期表達(dá)上調(diào)的序列有9 745條,2個時期表達(dá)沒有差異的序列有12 153條。微擬球藻在指數(shù)期主要進(jìn)行的生物學(xué)過程為生長和增殖,而平臺期主要為油脂等次級代謝產(chǎn)物的積累,基因表達(dá)差異從整體上反映了微擬球藻2個時期基因表達(dá)的變化過程,為下一步利用相關(guān)基因去進(jìn)行轉(zhuǎn)基因高產(chǎn)油微藻奠定了基礎(chǔ)。
圖2 表達(dá)差異分布圖Fig.2 Expression level different dot plot
對全部序列進(jìn)行KEGG代謝通路數(shù)據(jù)庫比對和注釋,結(jié)果表明指數(shù)期涉及238種代謝途徑,表達(dá)上調(diào)的序列有818條;平臺期涉及248種代謝途徑,表達(dá)上調(diào)的序列有1 148條。統(tǒng)計發(fā)現(xiàn)在指數(shù)期和平臺期關(guān)于脂質(zhì)代謝的序列總共有195條,指數(shù)期有53條序列表達(dá)上調(diào),平臺期有47條序列表達(dá)上調(diào),這些關(guān)于脂質(zhì)代謝的序列分屬于14種代謝途徑。在甘油磷酸酯代謝途徑(Glycerophospholipid metabolism)中指數(shù)期和平臺期分別有7、5條序列表達(dá)上調(diào);脂肪酸代謝途徑(Fatty acid metabolism)中指數(shù)期和平臺期分別有12、11條序列表達(dá)上調(diào);甘油脂類代謝途徑(Glycerolipid metabolism)中指數(shù)期和平臺期分別有6、2條序列表達(dá)上調(diào);不飽和脂肪酸生物合成途徑(Biosynthesis of unsaturated fatty acids)中指數(shù)期和平臺期分別有5、8條序列表達(dá)上調(diào);鞘脂類代謝(Sphingolipid metabolism)中指數(shù)期和平臺期分別有6、5條序列表達(dá)上調(diào);類固醇生物合成途徑(Steroid biosynthesis)指數(shù)期和平臺期分別有11、10條序列表達(dá)上調(diào);脂肪酸生物合成途徑(Fatty acid biosynthesis)中指數(shù)期有1個序列表達(dá)上調(diào);花生四烯酸代謝途徑(Arachidonic acid metabolism)中指數(shù)期和平臺期分別有3、4條序列表達(dá)上調(diào);合成和降解酮體途徑(Synthesis and degradation of ketone bodies)中平臺期1個序列表達(dá)上調(diào);初級膽汁酸生物合成途徑(Primary bile acid biosynthesis)及類固醇生物激素合成途徑(Steroid hormone biosynthesis)中2個時期無表達(dá)差異基因存在;亞麻酸代謝途徑(alpha-Linolenic acid metabolism)中指數(shù)期有1個序列表達(dá)上調(diào);醚酯類代謝途徑(Ether lipid metabolism)中2個時期無表達(dá)差異基因存在;脂肪酸延伸途徑(Fatty acid elongation)中指數(shù)期和平臺期分別有1個序列表達(dá)上調(diào)(見圖3)。
圖3 脂質(zhì)代謝途徑分類及Unigene數(shù)量Fig.3 The category of lipid metabolism pathway and number of Unigenes
為了從整體上了解轉(zhuǎn)轉(zhuǎn)錄組序列信息,首先利用NCBI中的nr數(shù)據(jù)庫和Swissprot數(shù)據(jù)庫對上述29 203條轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比對分析,統(tǒng)計與已知基因序列具有高相似性的片段。結(jié)果顯示,在29 203條序列中,47.16%的序列(13 775條)能夠比對到數(shù)據(jù)庫中已收錄基因,15 428(52.82%)條序列沒有命中任何已知基因(E-value<10-5)。隨后用COG數(shù)據(jù)庫對所有序列進(jìn)行比對和功能注釋(E-value<10-5),共獲得11 604條具有COG功能注釋的序列,占總轉(zhuǎn)錄組序列數(shù)目的39.74%,涉及25個COG功能類別(見圖4)??傮w上看,在具有COG功能注釋的序列中,指數(shù)期表達(dá)上調(diào)的序列有4 135條,平臺期表達(dá)上調(diào)的序列有5 015條。其中,在指數(shù)期,一般功能基因(General function prediction only)的序列比例最大,為13.06%;其次為蛋白質(zhì)翻譯后修飾與轉(zhuǎn)運(yùn)及分子伴侶相關(guān)基因(Posttranslational modification,protein turnover,chaperones)和信號轉(zhuǎn)換機(jī)制相關(guān)基因(Signal transduction mechanisms),所 占 比 例 分 別 為 11.68% 和11.05%。而在平臺期,翻譯、核糖體結(jié)構(gòu)和生物起源相關(guān)基因(Translation,ribosomal structure and biogenesis)最多,為14.00%。其次為一般功能基因(General function prediction only)和蛋白質(zhì)翻譯后修飾與轉(zhuǎn)運(yùn)及分子伴侶相關(guān)基因(Posttranslational modification,protein turnover,chaperones),分 別 為12.84%和11.31%。在COG功能注釋中,涉及能量代謝過程相關(guān)功能定義主要包括能量產(chǎn)生、保存(Energy production and conversion)、脂質(zhì)轉(zhuǎn)運(yùn)和代謝(Lipid transport and metabolism),在指數(shù)期分別有189條和174條序列表達(dá)上調(diào),而在平臺期分別有249條和211條序列表達(dá)上調(diào)。微擬球藻在平臺期進(jìn)行油脂的積累,這可能與在平臺期表達(dá)的能量代謝相關(guān)基因數(shù)目相對比指數(shù)期高有關(guān)。在指數(shù)期,微擬球藻主要進(jìn)行細(xì)胞生長和增殖,因此細(xì)胞循環(huán)控制及分化、染色體分裂及糖類轉(zhuǎn)運(yùn)和代謝、細(xì)胞運(yùn)動性等相關(guān)功能分類的基因表達(dá)上調(diào)的數(shù)目要比平臺期多。細(xì)胞核結(jié)構(gòu)功能相關(guān)的序列在指數(shù)期和平臺期表達(dá)上調(diào)的數(shù)目均較少,分別有6條和7條。
圖4 COG分類及表達(dá)水平差異Fig.4 COG Group analysis and different expression level
目前,關(guān)于微藻產(chǎn)油的研究主要集中在對油脂代謝相關(guān)基因的克隆、表達(dá)上,但結(jié)果卻不盡如人意。美國國家可再生能源實(shí)驗室(NREL)最早開展了利用ACCase基因的過量表達(dá)構(gòu)建高油微藻的工作,微藻油脂含量并沒有明顯提高[11,21]。對于甘油三酯組裝過程中的其他酶如甘油3-磷酸脫氫酶,脂肪酸轉(zhuǎn)移酶系等,它們基因的過量表達(dá)在高等植物中都能促進(jìn)油脂積累[22-24],但在微藻上還未開展相應(yīng)研究。有研究表明,球等鞭金藻(Isochrysis galbana)在平臺期改變與脂肪酸生物合成相關(guān)的碳代謝[25],光固定的碳更多地進(jìn)入脂類合成途徑而使其細(xì)胞中脂類和碳水化合物得到積累[26];蛋白核小球藻(Chlorella pyrenoidosa)等15種綠藻平臺期總脂含量可比指數(shù)期多1.3~1.5倍[27]。但關(guān)于微擬球藻平臺期和指數(shù)期總脂含量的差異研究還沒有和其對應(yīng)時期基因表達(dá)的差異聯(lián)系起來。作者希望從不同時期基因表達(dá)差異的角度去探討與脂質(zhì)積累相關(guān)的生物學(xué)過程,然后從中發(fā)現(xiàn)相關(guān)基因,進(jìn)行克隆表達(dá),通過基因工程獲得油脂含量更高的微擬球藻改良藻種。
本文首次采用HiSeq 2000高通量測序技術(shù)初步建立了微擬球藻指數(shù)期和平臺期轉(zhuǎn)錄組的表達(dá)圖譜,闡明了在指數(shù)期和平臺期基因表達(dá)的種類、數(shù)量,初步明確了部分編碼蛋白質(zhì)的功能、分類及在指數(shù)期和平臺期表達(dá)量的差異。并分析了與脂質(zhì)代謝相關(guān)的代謝通路,闡明了與脂質(zhì)代謝相關(guān)的基因在代謝通路中的位置,探討了基因表達(dá)差異和微擬球藻油脂代謝等的調(diào)控關(guān)系。通過對指數(shù)期和平臺期的轉(zhuǎn)錄組差異比較,發(fā)掘參與微藻油脂積累的相關(guān)基因,從基因表達(dá)差異的角度對微藻油脂積累進(jìn)行研究,為進(jìn)一步研究微擬球藻提供理論指導(dǎo)和技術(shù)支持。
[1] Hu Q,Sommerfeld M,Jarvis E,et al.Microalgal triacylglycerols as feedstocks for biofuel production:perspectives and advances[J].The Plant Journal,2008,54(4):621-639.
[2] 李元廣,譚天偉,黃英明.微藻生物柴油產(chǎn)業(yè)化技術(shù)中的若干科學(xué)問題及其分析 [J].中國基礎(chǔ)科學(xué),2009,11(5):64-70.
[3] 閔恩澤,杜澤學(xué).我國生物柴油產(chǎn)業(yè)發(fā)展的探討 [J].中國工程科學(xué),2010,12(2):11-15.
[4] Sheehan J,Dunahay T,Benemann J,et al.A look back at the US department of energy's aquatic species program:biodiesel from algae[M].US :National Renewable Energy Laboratory Golden,1998:4-12.
[5] 宋東輝,侯李君,施定基.生物柴油原料資源高油脂微藻的開發(fā)利用 [J].生物工程學(xué)報,2008,5(3):167-173.
[6] 劉小澄,劉永平.海藻生物柴油市場競爭力分析 [J].可再生能源,2010,28(6):106-111.
[7] Roesler K,Shintani D,Savage L,et al.Targeting of the Arabidopsis homomeric acetyl-coenzyme A carboxylase to plastids of rapeseeds[J].Plant Physiology,1997,113(1):75-81.
[8] Klaus D,Ohlrogge J B,Neuhaus H E,et al.Increased fatty acid production in potato by engineering of acetyl-CoA carboxylase[J].Planta,2004,219(3):389-396.
[9] Papanikolaou S,Komaitis M,Aggelis G.Single cell oil(SCO)production by Mortierella isabellina grown on high-sugar content media[J].Bioresource Technology,2004,95(3):287-291.
[10] Khadake R M,Ranjekar P K,Harsulkar A M.Cloning of a novelω-6desaturase from Flax (Linum usitatissimumL.)and its functional analysis in Saccharomyces cerevisiae [J].Molecular Biotechnology,2009,42(2):168-174.
[11] Dunahay T G,Jarvis E E,Roessler P G.Genetic transformation of the diatoms Cyclotella cryptica and Navicula saprophila [J].Journal of Phycology,1995,31(6):1004-1012.
[12] 張琳.微擬球藻脂酰輔酶A合成酶與脂肪酸延伸酶的研究[D].青島:中國海洋大學(xué),2011.
[13] He M,Wang Y,Hua W,et al.De Novo sequencing of Hypericum perforatum transcriptome to identify potential genes involved in the biosynthesis of active metabolites [J].Plos one,2012,7(7):42081.
[14] Yan X,Cheng X Y,Wang Y S,et al.Comparative transcriptomics of two pathogenic pinewood nematodes yields insights into parasitic adaptation to life on pine hosts [J].Gene,2012,505(1):81-90.
[15] Sultan M,Schulz M H,Richard H,et al.A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome[J].Science,2008,321(5891):956-960.
[16] Guillard R R L.Studies of marine planktonic diatoms.I.Cyclotella nana Hustedt and Detonula confervacea Cleve[J].Canadian Journal of Microbiology,1962,8:229-239.
[17] 魏東,張學(xué)成.細(xì)胞生長時期對兩種海洋微藻總脂含量和脂肪酸組成的影響 [J].青島海洋大學(xué)學(xué)報:自然科學(xué)版,2000,30(3):503-509.
[18] Mortazavi A,Williams B A,McCue K,et al.Mapping and quantifying mammalian transcriptomes by RNA-Seq [J].Nature Methods,2008,5(7):621-628.
[19] Kanehisa M,Goto S,Kawashima S,et al.The KEGG resource for deciphering the genome[J].Nucleic Acids Research,2004,32(sup):277-280.
[20] Roman T,Natalie F,John J,et al.The COG database:an updated version includes eukaryotes[J].BMC Bioinformatics,2003,4:41.
[21] Roessler P,Ohlrogge J.Cloning and characterization of the gene that encodes acetyl-coenzyme A carboxylase in the algaCyclotella cryptica[J].Journal of Biological Chemistry,1993,268(26):19254-19259.
[22] Jain R,Coffey M,Lai K,et al.Enhancement of seed oil content by expression of glycerol-3-phosphate acyltransferase genes[J].Biochemical Society Transactions,2000,28(6):959-960.
[23] Jako C,Kumar A,Wei Y,et al.Seed-specific over-expression of an Arabidopsis cDNA encoding a diacylglycerol acyltransferase enhances seed oil content and seed weight[J].Plant Physiology,2001,126(2):861-874.
[24] Vigeolas H,Waldeck P,Zank T,et al.Increasing seed oil content in oil-seed rape(Brassica napus L.)by over-expression of a yeast glycerol-3-phosphate dehydrogenase under the control of a seed-specific promoter[J].Plant Biotechnology Journal,2007,5(3):431-441.
[25] Ohta S,Chang T,Aozasa O,et al.Sustained production of arachidonic and eicosapentaenoic acids by the red algaPorphyridium purpureumcultured in a light/dark cycle[J].Journal of Fermentation and Bioengineering,1992,74(6):398-402.
[26] Zhu C,Lee Y,Chao T.Effects of temperature and growth phase on lipid and biochemical composition of Isochrysis galbana TK1[J].Journal of Applied Phycology,1997,9(5):451-457.
[27] Roessler P G.Environmental control of glycerolipid metabolism in microalgae:commercial implications and future research directions[J].Journal of Phycology,1990,26(3):393-399.
中國海洋大學(xué)學(xué)報(自然科學(xué)版)2013年8期