位文倩,孫昕,黃峰,李鵬飛,李盟
(西安建筑科技大學(xué)環(huán)境與市政工程學(xué)院,西北 水資源與環(huán)境生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室,陜西西安,710055)
目前,能源危機(jī)是國內(nèi)外面臨的主要危機(jī)之一[1]。生物燃料作為一種可再生能源,可以有效削減化石燃料的使用量,減少碳排放,生物燃料(特別是生物柴油)的產(chǎn)量增加能極大地緩解能源危機(jī)[2]。微藻具有生物質(zhì)產(chǎn)率和油脂產(chǎn)率高、環(huán)境友好、成熟期短等優(yōu)點(diǎn),被認(rèn)為是一種最具潛力的生物柴油原料[3~6]。但微藻較高的生產(chǎn)成本限制了其規(guī)?;瘧?yīng)用。
在能源和水資源危機(jī)加重的大背景下,利用城市污水培養(yǎng)微藻,有效利用污水中的氮磷養(yǎng)分,既能實(shí)現(xiàn)污水資源化,也能降低微藻生物質(zhì)能源的成本[7~9]。Shen 等[10]在二沉池出水中培養(yǎng)Scenedesmus obliquus,其油脂產(chǎn)率達(dá)到了9 mg·L-1·d-1。Han 等[11]在初沉池出水中培養(yǎng)Scenedesmus obliquus,其生物質(zhì)產(chǎn)率為123 mg·L-1·d-1,油脂產(chǎn)率達(dá)到了32.78%。Manzoor 等[12]在甘蔗廢水中培養(yǎng)Scenedesmus dimorphusNT8c,生物量為119.5 mg·L-1·d-1,蛋白質(zhì)含量和脂肪酸含量分別達(dá)到了34.82%、15.41%。
轉(zhuǎn)錄組學(xué)作為一種重要的分子生物學(xué)方法[13],有助于研究生物基因結(jié)構(gòu)及基因表達(dá),以便更好地進(jìn)行生物基因組水平的調(diào)控。目前轉(zhuǎn)錄組學(xué)已應(yīng)用于分析廢水中微藻、藍(lán)細(xì)菌等對不同環(huán)境條件的基因應(yīng)答[14]。由于貯藏脂質(zhì)的生物合成受到多種途徑的調(diào)控,因此轉(zhuǎn)錄組學(xué)分析有助于揭示微藻高產(chǎn)脂質(zhì)的調(diào)控機(jī)制[15]。本研究將柵藻Desmodesmussp.分別在培養(yǎng)基和生活污水中進(jìn)行自養(yǎng)和混合培養(yǎng),使用轉(zhuǎn)錄組分析Desmodesmussp. 在不同培養(yǎng)條件下的代謝途徑差異和基因的差異表達(dá)。
柵藻Desmodesmussp.(FACHB-2042)購買于中國科學(xué)院水生生物研究所淡水藻種庫。用蒸餾水洗滌以消除介質(zhì)影響,進(jìn)一步在含有瓊脂粉的BG11培養(yǎng)基進(jìn)行分離純化。
自養(yǎng)采用含有BG11 培養(yǎng)基的錐形瓶,在恒溫光照培養(yǎng)箱(MGC-P,上海一恒)中進(jìn)行,光照強(qiáng)度80 μmol 光子·m-2·s-1,光暗比為12h∶12h,生長溫度在25℃下進(jìn)行培養(yǎng),每天手動(dòng)搖藻3~4次,隨機(jī)更換位置以保證光照均勻?;旌吓囵B(yǎng)采用的生活污水來源于西安建筑科技大學(xué)雁塔校區(qū)逸夫樓污水,對污水靜沉12 h后取上清液、再用0.45 μm濾膜過濾,然后取濾液高壓滅菌。對滅菌后污水進(jìn)行接種,初始吸光度OD680為0.1,培養(yǎng)時(shí)間為20 d左右,其他培養(yǎng)條件同自養(yǎng)。自養(yǎng)和混合培養(yǎng),均取了兩組平行樣,分別記為P_0、P_00(自養(yǎng))和YG_1、YG_11(混合培養(yǎng))。
使用無RNase 的槍頭吸取對數(shù)期(OD680=0.5~0.8)的微藻樣品于10mL 無酶管中。在8000 r·min-1、4℃下離心5 min充分去除上清,重復(fù)操作取藻泥約0.3~0.6 g 迅速放入液氮中冷凍15 min,放入-80℃冰箱保存。使用RNAprep Pure Plant kit 多糖多酚植物試劑盒(DP441)對RNA 進(jìn)行提取。對RNA 提取后使用RNA 專用瓊脂糖凝膠電泳對濃度及純度進(jìn)行檢測。通過mRNA 特有的poly A 結(jié)構(gòu)純化總RNA 中的mRNA,通過離子打斷的方式將mRNA打斷到200~300 bp片段。
由上海派森諾生物科技有限公司利用Illumina HiSeq 測序平臺完成,使用Trinity 軟件對高質(zhì)量序列(Clean Reads)進(jìn)行拼接得到轉(zhuǎn)錄本后再進(jìn)行后續(xù)分析。Trinity 為針對轉(zhuǎn)錄組拼接的De Novo 組裝軟件,基于DBG(De Bruijn Graph)拼接原理對高質(zhì)量序列進(jìn)行拼接。拼接完成后,可獲得FASTA 格式的Transcript 序列文件。提取每個(gè)基因下最長的轉(zhuǎn)錄本作為該基因的代表序列,稱為Unigene。N50 是將所有序列從長到短排列,將序列長度按照該順序依次相加,當(dāng)相加的長度達(dá)到序列總長度的50%時(shí),最后一條序列的長度。N90 為將所有序列從長到短排列,將序列長度按照該順序依次相加,當(dāng)相加的長度達(dá)到序列總長度的90%時(shí),最后一條序列的長度。一般認(rèn)為N50 大于1000 bp 則拼接結(jié)果合格。
對Unigene 進(jìn)行基因功能注釋。基因功能注釋所用到的數(shù)據(jù)庫主要有NR (NCBI non-redundant protein sequences)、GO (Gene Ontology)、KEGG (Kyoto Encyclopedia of Genes and Genome)、eggNOG (evolutionary genealogy of genes: Non-supervised Orthologous Groups)等。
使用轉(zhuǎn)錄組表達(dá)定量軟件RSEM,以轉(zhuǎn)錄本序列為參考,分別將每個(gè)樣品的Clean Reads 比對到參考序列上。然后統(tǒng)計(jì)每個(gè)樣品比對到每一個(gè)基因上的Reads 數(shù),并使用如下公式計(jì)算每個(gè)基因的FPKM值:
采用DESeq 對基因表達(dá)進(jìn)行差異表達(dá)分析,篩選差異表達(dá)基因條件為表達(dá)差異倍數(shù)|log2Fold-Change|>1,顯著性P-value<0.05。差異基因富集分析主要是通過GO 富集分析和KEGG 富集分析。使用topGO 進(jìn)行GO 富集分析,利用GO term 注釋的差異基因?qū)γ總€(gè)term 的基因列表和基因數(shù)目進(jìn)行計(jì)算,然后通過超幾何分布方法計(jì)算P-value(顯著富集的標(biāo)準(zhǔn)為P-value<0.05),找出與整個(gè)基因組背景相比,差異基因顯著富集的GO term,從而確定差異基因行使的主要生物學(xué)功能。選擇每個(gè)GO 分類中P-value 最小即富集最顯著的前10 個(gè)GO term 條目。KEGG 富集分析是通過該pathway 中富集到的差異基因個(gè)數(shù)與注釋到的差異基因個(gè)數(shù)的比值(Rich factor)、FDR 值和富集到此通路上的基因個(gè)數(shù)來衡量富集的程度。選擇FDR 值最小的前20 條,通過KEGG 注釋進(jìn)一步了解基因在代謝途徑中的功能。對樣本分別進(jìn)行KO 注釋,即將分子網(wǎng)絡(luò)的相關(guān)信息進(jìn)行跨物種注釋,和KEGG Pathway 注釋,即代謝通路注釋,獲得物種內(nèi)分子間相互作用和反應(yīng)的網(wǎng)絡(luò)。
樣品經(jīng)過上機(jī)測序,得到圖像文件,由測序平臺自帶軟件進(jìn)行轉(zhuǎn)化,生成FASTQ 的原始數(shù)據(jù)(Raw Data),即下機(jī)數(shù)據(jù)。對每個(gè)樣品的下機(jī)數(shù)據(jù)(Raw Data)分別進(jìn)行統(tǒng)計(jì),包括Q30、模糊堿基所占百分比、以及Q20(%)和Q30(%)。統(tǒng)計(jì)結(jié)果見表1。Reads 總數(shù)都在4 千萬條,堿基總數(shù)都超過了60 億bp,堿基識別準(zhǔn)確率在99.9%以上的堿基總數(shù)所占百分比(Q30)在90%以上,測序錯(cuò)誤率為0.1%;堿基識別率在99%以上的堿基總數(shù)所占百分比(Q20)均超過了95%,測序錯(cuò)誤率為1%。一般來說,Q20不低于90%,Q30不低于80%被認(rèn)為數(shù)據(jù)質(zhì)量較好,數(shù)據(jù)可用。
表1 原始數(shù)據(jù)統(tǒng)計(jì)Table 1 Raw data statistics
對Transcript 和Unigene 序列進(jìn)行統(tǒng)計(jì),結(jié)果如表2 所示。拼接完成后的Transcript 序列總數(shù)(Sequence Number)在5 萬以上,Unigene 的序列總數(shù)在2 萬以上,最長Transcript 和Unigene 的N50 分別為2069 bp和1979 bp。
表2 序列整體統(tǒng)計(jì)表Table 2 Sequence overall statistics table
對原始數(shù)據(jù)進(jìn)行無參拼接后的Unigene 進(jìn)行基因功能注釋,無參拼接后共獲得了27 932 個(gè)Unigene,在GO, KEGG, Pfam, Swiss-prot, eggNOG, NR 數(shù)據(jù)庫注釋的結(jié)果如圖1 所示。其中9.54%的Unigene 在上述6 個(gè)數(shù)據(jù)庫中都有注釋,在NR、eggNOG、KEGG 數(shù)據(jù)庫中分別注釋到11 886、9690、6382 個(gè)Unigene。
圖1 Unigene注釋結(jié)果統(tǒng)計(jì)信息Fig.1 Unigene annotation result statistics upset chart
FPKM 密度分布能整體考察樣品所有基因的表達(dá)量模式,一般來說,中等表達(dá)的基因占絕大多數(shù),低表達(dá)和高表達(dá)的基因占一小部分。所有基因在各個(gè)樣品中的表達(dá)量特征統(tǒng)計(jì)結(jié)果見圖2。由圖可知,自養(yǎng)組和混合培養(yǎng)中等表達(dá)的基因都是占絕大多數(shù),低表達(dá)和高表達(dá)的基因占比較小。
圖2 FPKM 密度分布Fig.2 FPKM density distribution
采用R 語言ggplots2 軟件包繪制差異表達(dá)基因的火山圖[16,17],結(jié)果如圖3所示?;鹕綀D展示的是基因分布情況、基因的表達(dá)倍數(shù)差異和顯著性結(jié)果,2倍表達(dá)差異,P-value=0.05為閾值。與自養(yǎng)組比較,混合培養(yǎng)組上調(diào)基因總共1081 個(gè),下調(diào)基因總共575個(gè),非顯著差異表達(dá)基因?yàn)?3 331個(gè)。
圖3 差異表達(dá)基因的火山圖Fig.3 Volcano map of differentially expressed genes
根據(jù)差異表達(dá)的基因的GO 和KEGG 富集分析結(jié)果,圖4(A)按照細(xì)胞組分(Cellular Component)、分子功能(Molecular Function)和生物過程(Biological Process)進(jìn)行GO 分類,即富集最顯著的前20 條KEGG pathway 結(jié)果見圖4(B)。由圖中可知,差異基因GO 富集主要在光合作用的分子功能、生物過程和細(xì)胞組分上,如類囊體、光系統(tǒng)I、葉綠素結(jié)合、光合電子傳輸、光反應(yīng)和暗反應(yīng)等。KEGG pathway 富集最顯著的代謝通路是光合作用,其次還有脂肪酸伸長、內(nèi)質(zhì)網(wǎng)中的蛋白質(zhì)加工以及淀粉和蔗糖合成。
圖4 差異基因的GO富集(A)和KEGG富集(B)Fig.4 Differential gene enrichment analysis of GO(A)and KEGG(B)
2.6.1 光合作用 在光合作用固碳過程中,磷酸甘油酸激酶(PGK)的作用下生成1,3-雙磷酸甘油酸酯,進(jìn)而磷酸化形成3-磷酸甘油醛,在果糖二磷酸醛縮酶(ALDO)的作用下生成果糖二磷酸,在這個(gè)過程中編碼PGK、GAPA 和ALDO 的基因數(shù)量分別為5、6、9 個(gè),表達(dá)倍數(shù)均在2 倍以上,表達(dá)水平上調(diào)。編碼GAPDH 的基因表達(dá)倍數(shù)為0.06,表達(dá)水平下調(diào),固碳作用的初始途徑增強(qiáng)。4-磷酸赤蘚糖在果糖二磷酸醛縮酶的作用下生成1,7-二磷酸七庚酯,進(jìn)而在七羥庚糖-1,7-雙磷酸酶(glpx-SEBP)的作用下生成7-磷酸七庚糖,最后生成核糖形成卡爾文循環(huán)。PGK、ALDO、GAPA、glpx-SEBP 表達(dá)水平的上調(diào)表明卡爾文循環(huán)途徑增強(qiáng)。在二羧酸循環(huán)中,編碼丙氨酸轉(zhuǎn)氨酶(GPT)的基因表達(dá)倍數(shù)為3.31,有4 個(gè)基因編碼GPT,其表達(dá)水平上調(diào)使得蘋果酸到丙酮酸、丙氨酸進(jìn)而生成丙酮酸途徑增強(qiáng)。這些都使得光合作用碳固定過程得到增強(qiáng),為細(xì)胞提供更多的甘油三磷酸用于糖酵解和其他細(xì)胞過程。
光合作用系統(tǒng)由ATP合酶、光系統(tǒng)I(PSI)、細(xì)胞色素b6/f 復(fù)合物和光系統(tǒng)II(PSII)組成,從圖5 可以看出,PSII 系統(tǒng)P680 反應(yīng)中心編碼D1和D2蛋白、CP43、CP47 葉綠素載體蛋白的基因表達(dá)水平下調(diào),表達(dá)倍數(shù)分別均小于0.5,表明混合培養(yǎng)降低了PSII 對光能的需求。編碼放氧增強(qiáng)蛋白1 的基因表達(dá)倍數(shù)為103,具有顯著的表達(dá)差異性,表達(dá)水平上調(diào)表明混合培養(yǎng)提高了氧氣的釋放。PSI 系統(tǒng)中編碼PsaA 和PsaB 的基因分別為2 個(gè)和1 個(gè),其表達(dá)倍數(shù)分別為0.17、0.21、0.13,表達(dá)水平顯著下調(diào)。已有的研究表明,PsbA、PsbC 和PsaB 等與光合作用相關(guān)的基因,在混合培養(yǎng)下被下調(diào),從而導(dǎo)致光合色素水平降低[18]。編碼蛋白亞基X、PsaN 和PsaO 的基因數(shù)量分別為2、1、1,表達(dá)倍數(shù)均大于3,表達(dá)水平上調(diào)。放氧蛋白表達(dá)水平的提高,PsaA和PsaB結(jié)合形成異二聚體的PSI 反應(yīng)中心,其表達(dá)水平的下調(diào)表明捕光和光保護(hù)能力有所下降。光合電子傳輸中質(zhì)體藍(lán)蛋白(PetE)、鐵氧還蛋白(PetF)、細(xì)胞色素(PetJ)的表達(dá)水平均上調(diào),在混合培養(yǎng)條件下,光合電子傳輸增強(qiáng),電子傳遞鏈從PSII 出發(fā),會(huì)裂解水釋放氧氣,產(chǎn)生ATP 和NADPH,電子傳遞作用增強(qiáng)表明產(chǎn)生更多的ATP 和NADPH 用于光合作用的碳固定和其他代謝活動(dòng)。捕光葉綠素蛋白復(fù)合物(LHC)鑲嵌于類囊體膜上,能夠捕獲光能并把能量迅速傳至反應(yīng)中心引起光化學(xué)反應(yīng),是一類在光保護(hù)機(jī)制中起著關(guān)鍵作用的跨膜蛋白[19]。Lhca1-5 編碼的蛋白呈一個(gè)半月牙型緊靠在PSI 的一側(cè),這種二聚體形式能夠更好地幫助LHC 行使能量轉(zhuǎn)移及色素識別功能[20]。綠藻具有調(diào)節(jié)PSI-LHCI 復(fù)合物的組成與結(jié)構(gòu)的能力,從而應(yīng)對環(huán)境條件的變化。其中編碼Lhca3、Lhca4、Lhca5 的基因表達(dá)水平上調(diào),表明混合培養(yǎng)條件下光保護(hù)機(jī)制、光捕獲和光傳遞能力增強(qiáng)。所有結(jié)合葉綠素a/b 的生物體都具有LHCII 同系物,其蛋白均具有一個(gè)三聚體結(jié)構(gòu),LHCII 的三聚體結(jié)構(gòu)較單體在結(jié)構(gòu)上更為穩(wěn)定,并且能在早期更快地適應(yīng)光捕獲功能[21]。編碼Lhcb2和Lhcb5 的基因表達(dá)水平上調(diào)表明PSII光捕獲功能提高。在杜氏鹽藻中,鐵脅迫可以引起Lhca3 很大的結(jié)構(gòu)變化,從而增大PSI 捕光系統(tǒng),平衡光系統(tǒng)中的激感現(xiàn)象[22]。
圖5 光合作用代謝途徑Fig.5 Photosynthesis metabolic pathway
表3 Desmodesmus sp.在自養(yǎng)和混合培養(yǎng)條件下的差異表達(dá)基因Table 3 Differentially expressed genes of Desmodesmus sp.under autotrophic and mixotrophic conditions
2.6.2 脂質(zhì)代謝 與自養(yǎng)條件相比,編碼糖酵解途徑的限速酶丙酮酸激酶(PK)的基因表達(dá)倍數(shù)為2.06,其表達(dá)水平上調(diào),表明在混合培養(yǎng)條件下糖酵解作用增強(qiáng),從而為細(xì)胞提供了更多的碳骨架、ATP 和NADPH,為磷酸戊糖途徑和脂肪酸生物合成提供了更多的底物。據(jù)報(bào)道(圖6),在混合培養(yǎng)條件下,細(xì)胞可能處于能量供需之間的不平衡狀態(tài)(ATP/NADPH 不平衡),從而激發(fā)過大能量產(chǎn)生過量的NADPH[23]。在磷酸戊糖途徑中,6-磷酸葡萄糖脫氫為6-磷酸葡萄糖酸酯,進(jìn)而氧化為3-磷酸甘油醛,在果糖二磷酸醛縮酶(ALDO)的催化下生成6-二磷酸果糖,編碼ALDO 的基因有3 個(gè),表達(dá)倍數(shù)均大于2,其表達(dá)水平顯著上調(diào),進(jìn)而產(chǎn)生更多的丙酮酸用于糖酵解產(chǎn)生乙酰輔酶A(Acetyl-CoA),乙酰輔酶A 為脂肪酸生物合成提供底物導(dǎo)致脂質(zhì)生產(chǎn)增強(qiáng)。脂肪酸合成從乙酰輔酶A 轉(zhuǎn)化成丙二酰輔酶A,也是脂肪酸合成的關(guān)鍵,生成乙酰輔酶A 酶水平的提高,促進(jìn)了脂肪酸生成。脂肪?;鵄CP 硫酯酶(FATB)將長鏈?;呋癁殚L鏈脂肪酸,長鏈?;o酶A 合成酶(ACSL)再將長鏈脂肪酸轉(zhuǎn)化為長鏈酰基輔酶,其中編碼FATB的基因表達(dá)水平上調(diào),編碼ACSL 的基因表達(dá)倍數(shù)小于0.5,表達(dá)水平下調(diào),使得生成更多的長鏈脂肪酸,導(dǎo)致脂質(zhì)生產(chǎn)水平提高。
圖6 脂肪酸的生物合成及相關(guān)的代謝途徑Fig.6 Fatty acid biosynthesis and related metabolic pathways
Desmodesmussp. 混合培養(yǎng)條件下光保護(hù)機(jī)制、光捕獲和光傳遞能力增強(qiáng),光合電子傳輸增強(qiáng),裂解水釋放氧氣,產(chǎn)生更多的ATP 和NADPH用于光合作用的碳固定,為細(xì)胞提供更多的甘油三磷酸用于糖酵解和其他細(xì)胞過程。在混合培養(yǎng)條件下糖酵解作用增強(qiáng)會(huì)導(dǎo)致磷酸戊糖途徑產(chǎn)生更多的丙酮酸用于糖酵解產(chǎn)生乙酰輔酶A(Acetyl-CoA),乙酰輔酶A 為脂肪酸生物合成提供底物導(dǎo)致脂質(zhì)生產(chǎn)增強(qiáng)。轉(zhuǎn)錄組學(xué)分析為調(diào)控污水混合培養(yǎng)條件下微藻油脂產(chǎn)量提供了分子生物學(xué)基礎(chǔ)。