婁宇棟,馮 建 ,何嬌嬌,晁 帥 ,王 萍 ,2
(1.浙江海洋大學(xué)海洋科學(xué)與技術(shù)學(xué)院,浙江省海洋養(yǎng)殖裝備與工程技術(shù)重點實驗室,浙江舟山 316022;2.寧波大學(xué)海洋學(xué)院,浙江寧波 315211)
水流是魚類生長發(fā)育的基礎(chǔ)環(huán)境,魚類的生長、繁殖、遷徙和種群分布都受到水流的影響[1-3]?,F(xiàn)階段有關(guān)水流對魚類的影響主要集中在游泳機(jī)制和游泳速率等方面[4]。隨著研究技術(shù)和方法的深入,許多學(xué)者開始從分子水平研究流速對魚類的生理影響。MAGNONI,et al[5]在研究虹鱒魚Oncorhynchus mykiss的肌肉轉(zhuǎn)錄組時發(fā)現(xiàn),虹鱒魚在最大續(xù)航游泳速度下游泳時能量和物質(zhì)表達(dá)的相關(guān)基因大量參與表達(dá)。PALSTRA,et al[6]研究發(fā)現(xiàn),在持續(xù)的游泳刺激下,虹鱒幼魚骨骼肌中白肌肉生長發(fā)育的基因出現(xiàn)明顯上調(diào)。同時PALSTRA,et al[7]還發(fā)現(xiàn),在流速影響下,斑馬魚Danio rerio的胰島素樣生長因子受體、生長激素受體等出現(xiàn)明顯差異表達(dá)。在其它的魚類研究中,免疫[8]、低溫脅迫[9]、營養(yǎng)代謝機(jī)制[10]等大量相關(guān)基因被發(fā)現(xiàn)并得到證實。這些研究使人們從分子水平上對魚類的行為機(jī)制有了新的認(rèn)識,同時給魚類的網(wǎng)箱養(yǎng)殖、增殖放流等提供了一些合理的建議。
美國紅魚Sciaenops ocellatus是我國網(wǎng)箱養(yǎng)殖魚類中的主要經(jīng)濟(jì)魚種[11]。關(guān)于美國紅魚的流速研究已有相關(guān)報道[12]。但是,關(guān)于流速脅迫對美國紅魚肝臟轉(zhuǎn)錄組影響的研究鮮有報道。該試驗主要探究了美國紅魚的肝臟轉(zhuǎn)錄組在最大續(xù)航游泳速度下的變化。本實驗結(jié)果為美國紅魚的養(yǎng)殖海區(qū)選址提供了一定的參考依據(jù),并進(jìn)一步完善了流速對美國紅魚肝臟轉(zhuǎn)錄組的研究。
美國紅魚購于舟山岱山縣養(yǎng)殖基地,并于實驗室暫養(yǎng)2周,以適應(yīng)實驗室環(huán)境。挑選規(guī)格相近,活力較好的美國紅魚作為實驗對象。實驗室海水為天然海水,并經(jīng)過過濾沉淀,用次氯酸鈉消毒并曝氣。實驗過程中,實驗水溫20~21℃;海水鹽度27~28;水中溶解氧大于7.0 m·L-1,實驗光源為自然光。實驗美國紅魚總計 25 尾,體長 31.5~33.8 cm,體重 501.3~589.0 g。避免測量基礎(chǔ)數(shù)據(jù)對實驗魚的影響,基礎(chǔ)數(shù)據(jù)測量均是實驗結(jié)束后進(jìn)行。實驗全程用攝像機(jī)攝像實時監(jiān)控,以此確定實驗魚的游泳時間,并避免人為因素干擾。
實驗前對實驗水槽的參數(shù)與性能進(jìn)行校正并測定該規(guī)格美國紅魚的最大續(xù)航游泳速度,標(biāo)定實驗流速為0.9 m/s。實驗前將美國紅魚放入水槽中進(jìn)行低流速的適應(yīng),適應(yīng)流速控制在0.2 m·s-1左右,適應(yīng)時間為1 h[13]。將實驗組(T01)的適應(yīng)流速均勻加速到0.9 m·s-1,通過視頻監(jiān)控軟件遠(yuǎn)程監(jiān)控實驗魚,避免人為因素影響實驗魚的游泳狀態(tài),實驗魚觸網(wǎng)20 s以上即視為達(dá)到疲勞,結(jié)束實驗[14]。對照組(T02)美國紅魚規(guī)格與實驗組基本一致,控制實驗流速為0 m·s-1。
1.2.1 采樣與處理
實驗結(jié)束后立即撈出實驗魚,并在無菌操作臺迅速解剖獲得肝臟,放入液氮中冷凍,保存至-80℃冰箱中。根據(jù)Tiangen的要求,提取肝組織的RNA(Trizol法)。RNA完整性檢測(1%瓊脂糖凝膠電泳法);RNA純度檢測(NanoPhotometer法);RNA濃度檢測(Qubit?);RNA完整性的評估(NA Nano 6000 Assay Kit of the Agilent Bioanalyzer 2100)[15]。
1.2.2 構(gòu)建 RNA 文庫
檢測樣品完畢并合格后,啟動RNA文庫構(gòu)建,在Illumina平臺HiSeq 2500開始測序[16]。cDNA文庫的構(gòu)建和測序由測序公司完成。
1.2.3 生物信息學(xué)分析
為了得到較高質(zhì)量的數(shù)據(jù),需要對所得數(shù)據(jù)進(jìn)行過濾從而降低數(shù)據(jù)噪音。同時去除堿基質(zhì)量低于10,堿基數(shù)低于4和堿基質(zhì)量低于13,堿基數(shù)不高于6的序列;刪除無插入片段序列、palyA序列、長度小于15 nt的小片段序列、5′或3′接頭污染序、列插入片段過長的序列。確保測序的可靠性。經(jīng)過上述處理,獲取干凈序列(clean reads)。
測序共計獲得9.32Gb Clean Data,兩組樣品Clean Data 均達(dá)到 4.54 Gb,Q30 堿基百分比在 92.12% 及以上。De novo拼裝后共獲得70 148條Unigene,其中長度在1 kb以上的Unigene有12 465條。對Unigene進(jìn)行功能注釋,包括與 NR、Swiss-Prot、KEGG、COG、KOG、GO和Pfam數(shù)據(jù)庫的比對,共獲得31 704條Unigene的注釋結(jié)果。具體的統(tǒng)計信息如圖1與表1。
圖1 Unigene長度分布圖Fig.1 The length distribution map of Unigene
表1 組裝結(jié)果統(tǒng)計表Tab.1 The assembly results
分析檢測組裝得的70 148條基因共得到SSR標(biāo)記10 214個,同時單堿基(Mono-nucleotide)重復(fù)個數(shù)至多為6 052個,六堿基(Hexa-nucleotide)重復(fù)至少為2個(表2)。同時發(fā)現(xiàn)雙堿基對與三堿基對也出現(xiàn)重復(fù),其中AC/GT,共有重復(fù)1 685個;AGG/CCT,重復(fù)404個。
表2 重復(fù)堿基的長度和數(shù)量的分布Tab.2 Length and number distribution of SSRs based on the number of repeat units
通過對實驗樣品的SNP分析檢測發(fā)現(xiàn):實驗組T01和對照組T02的純合型數(shù)目分別為38 020和29 627,雜合型SNP數(shù)目分別為57 835和66 088個(表3)。
表3 SNP數(shù)量統(tǒng)計表Tab.3 Statistics of SNP number
通過Bowtie5[17]將實驗樣本所測定的reads與基因庫比較,同時和RSEM5[18]對比,并進(jìn)行表達(dá)量水平的評價。基因轉(zhuǎn)錄本的豐度表示為FPKM。總體看,基因片段(編碼蛋白質(zhì))經(jīng)過測序得到的基因轉(zhuǎn)錄本的豐度值跨度很大[19],詳細(xì)如圖2所示。
圖2 兩樣品FPKM密度分布對比圖Fig.2 The comparison of FPKM density in two samples
對樣品T01與樣品T02進(jìn)行了差異表達(dá)分析,默認(rèn)將FDR<0.01且差異倍數(shù)(兩樣品間表達(dá)量的比值)≥2作為篩選標(biāo)準(zhǔn)[20]。篩選后得到1 773個顯著性差異表達(dá)基因,包括204個上調(diào)基因和969個下調(diào)基因。
繪制兩組樣品基因表達(dá)差異的火山圖,圖上坐標(biāo)點各表示1個表達(dá)基因,圖中的橫坐標(biāo)表示兩組樣品的差異性表達(dá)倍數(shù)的對數(shù)值,隨著差異表達(dá)倍數(shù)的對數(shù)值的線性增加,其絕對值也增大;圖中縱坐標(biāo)表示錯誤發(fā)生率的負(fù)對數(shù)值,差異表達(dá)性決定其數(shù)值,差異表達(dá)越大,數(shù)值越大。將差異表達(dá)基因進(jìn)行統(tǒng)計,無顯著性表達(dá)差異的基因用紅色表示(FALSE),顯著性表達(dá)的差異基因用綠色表示(TURE),如圖3所示。
圖3 樣品T01和樣品T02間差異表達(dá)基因火山圖Fig.3 The Differentially expressed gene volcanic map between T01 and T02
通常,具有相似表達(dá)模式的基因其功能上也存在較高的相似性。因而,通過MySQL Cluster,對兩組數(shù)據(jù)的表達(dá)模式進(jìn)行聚類分析。如圖4所示,左側(cè)代表試驗組T01的基因表達(dá),右側(cè)代表對照組T02的基因表達(dá),行表示基因表達(dá)量(用6種不同顏色表示不同表達(dá)量FPKM)。此圖說明兩個樣本存在相似表達(dá)模式的基因同時其功能上也存在較高的相似性。
圖4 樣品T01和樣品T02間差異表達(dá)基因聚類圖Fig.4 Cluster analysis of differentially expressedn genes in T01 and T02
GO富集的分析結(jié)果說明了在流速脅迫下,美國紅魚應(yīng)對脅迫所表達(dá)的生物過程。富集分析發(fā)現(xiàn),生物過程、細(xì)胞組分和代謝過程3組,總計高達(dá)424個富集到生物過程中,其中有90個富集到細(xì)胞組分中,310個富集到分子功能。在實驗結(jié)果中發(fā)現(xiàn),總計有80個差異基因富集在代謝過程上;氧化還原過程(oxidation-reduction process)和負(fù)調(diào)節(jié)肽鏈內(nèi)切酶的活動(negative regulation of endopeptidase activity)顯著性富集;在細(xì)胞組分上,細(xì)胞類別上共有90個差異表達(dá)基因富集,其中發(fā)現(xiàn)顯著性富集的有胞外區(qū) (extracellular region)和細(xì)胞外間隙(extracellular space);此外有310個差異表達(dá)基因富集到分子功能類別上,實驗發(fā)現(xiàn)只有一個內(nèi)肽酶抑制活性(endopeptidase inhibitor activity)存在顯著性富集。
實驗樣本T01和對照樣本T02間差別表達(dá)基因以及全部檢測的基因在GO二級Term的詳細(xì)解釋結(jié)果如圖5所示。從圖5可以看出,GO各功能位于不同差異表達(dá)基因和所有基因兩個背景下的處所,從圖中發(fā)現(xiàn)紅色柱體與藍(lán)色柱體具有明顯差別的Term也許和差異有關(guān)。
圖5 差異表達(dá)基因的GO分類Fig.5 Gene Ontology classifications of differentially expressed genes
生物體的統(tǒng)一性由大量差別基因配合調(diào)節(jié),彼此作用。不同基因行駛不同功能,各司其職。我們進(jìn)行了基因差異性表達(dá)的Pathway注釋分析去認(rèn)識各個基因的差異功能。將得到的Pathway和KEGG(Kyoto Encyclopedia of Genes and Genomes)數(shù)據(jù)庫進(jìn)行對比。實驗數(shù)據(jù)表明,共有1 096個基因數(shù)差異表達(dá);發(fā)現(xiàn)423條基因被注釋到KEGG通路上。其中富集到新陳代謝通路、環(huán)境信息處理和細(xì)胞過的差異表達(dá)基因比較多,分別為136、69和67條。分析這423條代謝通路發(fā)現(xiàn)有4條代謝通路顯著富集(Qvalue≤0.05),分別參與甘氨酸、絲氨酸和蘇氨酸代謝(glycine,serine and threonine metabolism)(p=0.000 9)、色氨酸代謝(tryptophan metabolism)(p=0.0036)、視黃醇的代謝(retinol metabolism)(p=0.003 6)和類固醇類的生物合成(steroid biosynthesis)(p=0.030 3),具體如圖 5 所示。
對差異表達(dá)基因的KEGG代謝通路富集分析,得到了美國紅魚應(yīng)對流速脅迫的一些相對基因。如Hedgehog 信號通路(Hedgehog signaling pathway)中 Hh、PKA、CK1、Wnt等基因表現(xiàn)為上調(diào)、RNA 降解(RNA degradation)中的Dcp1、EDC3基因表現(xiàn)為下調(diào),而TOB基因則表現(xiàn)為上調(diào);甾類激素生物合成(steroid hormone biosynthesis)過程中的 17beta-estradiol 17-dehydrogenase酶、testosterone 17beta-dehydrogenase(NADP+)酶會表現(xiàn)下調(diào),葡萄糖醛酸轉(zhuǎn)移酶(glucuronosyltransferase)等酶表達(dá)量會表現(xiàn)上升、組氨酸的代謝(histidine metabolism)過程中的 aldehyde dehydrogenase(NAD+)、組氨酸解氨酶(histidine ammonia-lyase)、天冬酰轉(zhuǎn)移酶(aspartoacylase)表達(dá)量會表現(xiàn)上升。通過GO功能富集分析與KEGG信號通路富集分析,得到了美國紅魚在流速脅迫下與運動和疲勞有關(guān)的基因,同時對比了在脅迫下與正常情況下這些基因在肝臟中表達(dá)的不同。具體實驗結(jié)果如表4。
表4 根據(jù)GO和KEGG信號通路富集分析游泳相關(guān)的差異表達(dá)基因Tab.4 According to GO and KEGG signaling pathways to analyzed the swimming related differentially expressed genes
圖6 前20個差異表達(dá)基因信號通路富集Fig.6 Scatter chart of top 20 pathway enrichment of differentially expressed genes
為了驗證RNA-seq分析的表達(dá)譜,對11個基因進(jìn)行了相關(guān)mRNA水平上qPCR測定。這些基因的表達(dá)數(shù)據(jù)和通過RNA-seq和qPCR檢測到的轉(zhuǎn)錄亞型見表5和圖7。這些基因和轉(zhuǎn)錄本的表達(dá),均通過qPCR得到證實。經(jīng)過Spearman的rho測試發(fā)現(xiàn)qPCR數(shù)據(jù)之間顯著相關(guān)(R2=0.979 7)。根據(jù)qPCR及RNA測序的數(shù)據(jù),上調(diào)和下調(diào)基因均非常吻合。
表5 RT-PCR和RNA-Seq的對比驗證結(jié)果Tab.5 Comparisons between RNA-Seq data and RT-PCR results
本實驗發(fā)現(xiàn),美國紅魚的游泳能力很強(qiáng),與王萍等[21]的研究結(jié)果基本一致。在分子方面,美國紅魚無參考基因[22-23],從基因上研究流速脅迫對其的影響機(jī)制仍不明確。本文采用Nanordrop、Qubit2.0、Aglient2100 方法對 RNA 樣品進(jìn)行分析。測序總共獲得9.32Gb Clean Data,各樣品 Clean Data 均達(dá)到 4.54 Gb,Q30堿基百分比在92.12%及以上。De novo組裝后共獲得70 148條Unigene。其中長度在1 kb以上的Unigene有12 465條。本次樣品測序效果較好,文庫構(gòu)建成功可用,同時進(jìn)行基因結(jié)構(gòu)注釋、基因表達(dá)量分析和基因功能注釋等一系列生物信息分析,為今后有關(guān)美國紅魚功能基因研究提供了寶貴的資源與數(shù)據(jù)庫。
圖7 用RT-PCR驗證的結(jié)果Fig.7 Validation of RNA-seq data using qPCR
相關(guān)文獻(xiàn)發(fā)現(xiàn),在其它脅迫下,如溫度、鹽度、pH、重金屬等會使魚類的基因表達(dá)產(chǎn)生巨大的差異[24-25]。本試驗中,通過差異基因的分析發(fā)現(xiàn),在流速脅迫的下,美國紅魚試驗組有大量顯著性差異表達(dá)的基因。經(jīng)過篩選后獲得顯著差異表達(dá)的基因有1 773個,其中上調(diào)的基因數(shù)量為204個,下調(diào)的基因數(shù)目為969個。這些差異表達(dá)的基因與許多重要的過程和途徑相關(guān),如糖的代謝、RNA剪接、蛋白質(zhì)的分解代謝、核糖體合成、剪接體等。該研究結(jié)果對魚類應(yīng)對流速脅迫的特異信號網(wǎng)絡(luò)的進(jìn)一步探究具有十分重要的意義。
在生物過程中,富集差異基因最多的為代謝過程,顯著性富集的類別是氧化還原過程和負(fù)調(diào)節(jié)肽鏈內(nèi)切酶的活動,內(nèi)肽酶抑制活性。研究發(fā)現(xiàn),在環(huán)境脅迫下,植物的氨基酸和糖類的代謝受到顯著影響[26]。在相關(guān)實驗中發(fā)現(xiàn)美國紅魚的游泳疲勞主要與肝糖原相關(guān)[12]。這些差異表達(dá)基因的發(fā)現(xiàn),能從分子層次說明美國紅魚在持續(xù)游泳200 min內(nèi)主要進(jìn)行有氧呼吸,但是高強(qiáng)度的持續(xù)游泳,魚體內(nèi)的的糖類得不到有效補充,從而發(fā)生了糖的異生作用。氧化還原過程直接決定細(xì)胞衰老和影響蛋白質(zhì)的功能[27-29]。細(xì)胞組分方面,胞外區(qū)和細(xì)胞外間隙的顯著性富集說明美國紅魚在運動過程中,伴隨著劇烈的物質(zhì)交換,物質(zhì)跨膜運輸頻繁。內(nèi)肽酶[30-31]在植物中決定著植物葉片的老化,在動物中對動物的造血系統(tǒng)[32]、呼吸功能[33]等有著一定的調(diào)節(jié)作用。本實驗中發(fā)現(xiàn)在分子功能類別中,內(nèi)肽酶抑制活性基因有顯著性富集,因此推測在流速脅迫下,美國紅魚的造血系統(tǒng)和呼吸系統(tǒng)受到一定的影響,具體的機(jī)理尚未明確。應(yīng)激信號的檢測及其細(xì)胞內(nèi)轉(zhuǎn)導(dǎo)是在各種環(huán)境脅迫下生物的適應(yīng)和生存的關(guān)鍵。關(guān)于魚類應(yīng)對流速脅迫信號并觸發(fā)細(xì)胞內(nèi)的反映機(jī)制的信息是極為稀缺的。在本研究中,Hedgehog信號通路中Hh、PKA、CK1、Wnt等基因表現(xiàn)為上調(diào)、RNA降解(RNA degradation)中的Dcp1、EDC3基因表現(xiàn)為下調(diào),而TOB基因則表現(xiàn)為上調(diào)。在老鼠的研究中,TOB基因特異性表達(dá)于大鼠的海馬和小腦,其與大鼠的運動協(xié)調(diào)性有關(guān)[34]。
在早期分的化斑馬魚肌細(xì)胞中,Hh信號能控制快慢肌之間的命運選擇[35]。除了調(diào)節(jié)早期二元態(tài)(慢與快纖維類型)細(xì)胞命運的決定,Hh信號還誘導(dǎo)這些譜系中不同類型的細(xì)胞生成(肌肉祖細(xì)胞、慢肌纖維的子集、內(nèi)側(cè)快肌纖維和快肌纖維的子集)[36]。在美國紅魚持續(xù)游泳過程中,推測Hh信號將誘導(dǎo)慢纖維的生成。同時肌節(jié)分化需要神經(jīng)管中的Shh和Wnt信號,Wnt信號在胚胎生肌過程中發(fā)揮重要作用,且Wnt與Shh相互合作誘導(dǎo)肌節(jié)形成[37]。在成熟成骨細(xì)胞中,Hedgehog信號通路活性增強(qiáng)將上調(diào)細(xì)胞內(nèi)甲狀旁腺激素相關(guān)蛋白的表達(dá)量,通過PKA等信號調(diào)控軸促使環(huán)磷酸腺苷應(yīng)答元件結(jié)合蛋白與RANKL基因增強(qiáng)子結(jié)合,促進(jìn)RANKL基因表達(dá),促使破骨前體細(xì)胞分化為成熟的破骨細(xì)胞,進(jìn)而增強(qiáng)骨吸收活動[38],從而進(jìn)一步提高美國紅魚的游泳能力。
甾類激素是一類脂溶性激素,它們在結(jié)構(gòu)上都是環(huán)戊烷多氫菲衍生物,普遍存在于動植物細(xì)胞之中[39]。甾類激素生物合成過程中的17beta-estradiol 17-dehydrogenase酶、testosterone 17beta-dehydrogenase(NADP+)酶會表現(xiàn)下調(diào),說明美國紅魚在游泳過程中,糖的氧化受到抑制,迫使血液中的糖持續(xù)升高,另一方便又促進(jìn)蛋白質(zhì)等非糖物質(zhì)轉(zhuǎn)化為糖(糖的異生作用)。葡萄糖醛酸轉(zhuǎn)移酶(UGT)是重要的II相代謝酶,在大鼠和水牛[40-41]的研究中發(fā)現(xiàn),肝片吸蟲感染的肝臟中UGT的活性均有不同程度的下降。在魚類中,卻是鮮有研究。本文中的(UGT)等酶表達(dá)量會表現(xiàn)上升組,其中具體原因還需進(jìn)一步驗證。組胺1型受體[42]主要分布于內(nèi)皮和平滑肌等多種細(xì)胞,對于血管擴(kuò)張有一定的促進(jìn)作用[43]。本實驗中發(fā)現(xiàn)在組氨酸的代謝過程中的Aldehyde dehydrogenase(NAD+)、組氨酸解氨酶、天冬酰轉(zhuǎn)移酶表達(dá)量會表現(xiàn)上升,說明在組氨酸脫羧酶的作用下,組氨酸脫羧形成組胺,在高強(qiáng)度的游泳過程中,迫使血管急速擴(kuò)張,體內(nèi)物質(zhì)交換加速,血液循環(huán)加快。
綜上所述,本實驗發(fā)現(xiàn)流速脅迫對美國紅魚肝臟轉(zhuǎn)錄組存在很大的影響。進(jìn)一步的分析發(fā)現(xiàn)很多與運動生理相關(guān)的編碼如RNA剪切、核糖體真核生物核糖的體合成、蛋白質(zhì)的分解代謝、剪接、蛋白酶和RNA的運輸?shù)闹匾M成的蛋白質(zhì)的基因。具體作用機(jī)理還需要進(jìn)一步深入研究討論。