王憲宗,劉青,李澍
(1.山西農(nóng)業(yè)大學(xué) 動(dòng)物科學(xué)學(xué)院,山西 太谷 030801;2.呂梁市農(nóng)業(yè)農(nóng)村局,山西 呂梁 033099)
虹鱒Oncorhynchusmykiss是一種具有較高經(jīng)濟(jì)價(jià)值的冷水性魚(yú)類(lèi)[1],其生長(zhǎng)過(guò)程不僅需要較低的水溫(12~18 ℃),還需要較高的溶氧(通常在7 mg/L以上)[2-3]。因此,中國(guó)虹鱒的主要養(yǎng)殖方式是利用冷水湖泊或水庫(kù)的網(wǎng)箱養(yǎng)殖,以及利用冷溪流、冷泉水、水庫(kù)底排冷水的流水養(yǎng)殖,且受地理環(huán)境制約較大[4]。
Ep300/Crebbp家族是脊椎動(dòng)物中普遍存在的一類(lèi)重要的乙酰轉(zhuǎn)移酶,其豐富的結(jié)合結(jié)構(gòu)域使得其可以參與到諸多調(diào)控網(wǎng)絡(luò)中,調(diào)節(jié)上千個(gè)基因的表達(dá),從而保持細(xì)胞的穩(wěn)態(tài),幫助有機(jī)體應(yīng)對(duì)外界環(huán)境的變化[5]。有研究表明,Ep300/Crebbp也是HIF-1α通路的關(guān)鍵成分[6-7]:低氧條件下HIF-1α蛋白的穩(wěn)定性比常氧條件下顯著增強(qiáng),累積的HIF-1α?xí)紫韧ㄟ^(guò)其C-TAD結(jié)構(gòu)域募集Ep300/Crebbp,再通過(guò)bHLH結(jié)構(gòu)域與HIF-1β形成二聚體,變成有功能的轉(zhuǎn)錄復(fù)合體,最后通過(guò)Ep300/Crebbp蛋白上的啟動(dòng)子結(jié)合結(jié)構(gòu)域與靶基因上的低氧反應(yīng)元件(hypoxia response elements,HREs)結(jié)合,最終啟動(dòng)下游100~200個(gè)基因的表達(dá)。HIF-1α已被證明是真核細(xì)胞維持氧平衡最主要的調(diào)節(jié)因子之一[7],因此,Ep300/Crebbp事實(shí)上也處于將低氧信號(hào)轉(zhuǎn)化為轉(zhuǎn)錄調(diào)節(jié)信號(hào)的樞紐位置。
真骨魚(yú)類(lèi)共同祖先在與其他脊椎動(dòng)物的祖先分枝發(fā)生分歧后經(jīng)歷過(guò)全基因組重復(fù)(whole genome duplication,WGD)事件[8],雖然多數(shù)基因都很快丟失了其中1個(gè)拷貝,但筆者前期研究發(fā)現(xiàn),ep300的雙拷貝在不同真骨魚(yú)類(lèi)群中均得到了普遍保留[9]。虹鱒則更為特殊,其較近的一個(gè)祖先物種在大約1億年前還經(jīng)歷過(guò)一次額外的全基因組重復(fù)事件[10],合理推測(cè)其ep300/crebbp家族成員應(yīng)該更多。一般而言,基因的拷貝數(shù)增多至少在早期會(huì)伴隨劑量效應(yīng),從而導(dǎo)致其功能增強(qiáng)[11]。但虹鱒反而不耐低氧,表明其相關(guān)功能基因可能丟失了大量拷貝,或者大量拷貝的功能發(fā)生了缺失。本研究中,對(duì)虹鱒ep300/crebbp家族成員進(jìn)行拷貝數(shù)、組織表達(dá)和結(jié)構(gòu)域分析,探討其不耐低氧的分子機(jī)制,以期為虹鱒耐低氧性能改良提供有效的候選基因。
選擇斑馬魚(yú)Daniorerio作為虹鱒的近緣物種,選擇小鼠Musmusculus和原雞Gallusgallus作為遠(yuǎn)緣物種。3個(gè)物種已被注釋的ep300/crebbp家族成員均通過(guò)NCBI的基因數(shù)據(jù)庫(kù)檢索獲取,相應(yīng)的基因及蛋白質(zhì)序列見(jiàn)表1。
表1 代表性物種的基因信息Tab.1 Genes of representative species
1.2.1 BLAST搜索及結(jié)果提取 使用表1中所列的4條斑馬魚(yú)蛋白質(zhì)序列作為查詢(xún)序列,分別參考虹鱒的非冗余蛋白質(zhì)數(shù)據(jù)庫(kù)(refseq_protein)和基因組數(shù)據(jù)庫(kù)(refseq_genomes)進(jìn)行在線BLASTP搜索和TBLASTN搜索,max target sequences均設(shè)置為5 000,e-value設(shè)置為1×10-5。編寫(xiě)python腳本提取比對(duì)結(jié)果,過(guò)濾掉覆蓋度低于30%的Hits,同時(shí)從gene2 accession文件中(下載自https://ftp.ncbi.nlm.nih.gov/gene/DATA/)提取出BLASTP搜索結(jié)果中Hits所對(duì)應(yīng)的基因在染色體上的位置信息。
1.2.2 系統(tǒng)發(fā)育分析 基于對(duì)BLASTP搜索結(jié)果的篩選,下載相應(yīng)的虹鱒蛋白質(zhì)序列,與斑馬魚(yú)、小鼠和原雞的Ep300/Crebbp蛋白質(zhì)序列合并,采用MAFFT[12]進(jìn)行多重序列比對(duì)(L-INS-i模式)。采用Gblocks[13]對(duì)多重比對(duì)結(jié)果進(jìn)行修剪,去除保守性較低的列(參數(shù)為-t=protein,-b2=10,-b3=20,-b4=2,-b5=All)。對(duì)修剪后的多重比對(duì)結(jié)果,采用RAxML 8.2.8[14]進(jìn)行最大似然樹(shù)的重構(gòu),采用GAMMA速率異質(zhì)性模型,氨基酸替代模型自動(dòng)選擇,自展抽樣500次。
1.2.3 基因表達(dá)及功能富集分析 使用NCBI的Run Selector(https://www.ncbi.nlm.nih.gov/Traces/ study/)對(duì)BioProject號(hào)PRJEB37848進(jìn)行檢索,下載該BioProject所包含的虹鱒及斑馬魚(yú)的原始轉(zhuǎn)錄組測(cè)序數(shù)據(jù),使用Sratoolkit中的Fasterq-dump程序?qū)嚎s數(shù)據(jù)轉(zhuǎn)換為fastq格式。從NCBI的FTP服務(wù)器(https://ftp.ncbi.nlm.nih.gov/genomes/refseq/vertebrate_other/)下載虹鱒和斑馬魚(yú)非冗余的轉(zhuǎn)錄本數(shù)據(jù)及最新版本的基因組拼接數(shù)據(jù),采用Salmon[15]建立2個(gè)物種以基因組為誘餌的索引(SAF genome index)后,對(duì)轉(zhuǎn)錄本進(jìn)行定量。用于衡量轉(zhuǎn)錄本組織表達(dá)水平的單位是TPM (transcripts per million),即每100萬(wàn)個(gè)reads里有多少個(gè)來(lái)自某個(gè)特定的轉(zhuǎn)錄本。定量完成后,根據(jù)gene2 accession文件將同一基因不同轉(zhuǎn)錄本的表達(dá)數(shù)據(jù)相加,得到虹鱒和斑馬魚(yú)不同基因在不同組織中的表達(dá)量。
使用Python語(yǔ)言下Scipy.stats模塊[16]的pearsonr函數(shù),計(jì)算ep300/crebbp家族不同成員間,以及它們與其所屬物種其他基因間表達(dá)譜的皮爾遜相關(guān)系數(shù)。設(shè)置合理閾值(r>0.9或r>0.95,同時(shí)要求P<0.01)篩選各ep300/crebbp成員的共表達(dá)基因,虹鱒上的共表達(dá)基因需要先通過(guò)本地BLASTP搜索找到它們?cè)诎唏R魚(yú)上的直系同源基因,然后使用GOATOOLs[17]對(duì)轉(zhuǎn)換后的共表達(dá)基因進(jìn)行功能富集分析;斑馬魚(yú)上的共表達(dá)基因則可以直接進(jìn)行功能富集分析。
1.2.4 保守結(jié)構(gòu)域分析 基于上述基因表達(dá)分析結(jié)果,提取出各ep300/crebbp成員表達(dá)量最高的轉(zhuǎn)錄本所對(duì)應(yīng)的蛋白質(zhì)序列,使用CDD search[18-19]搜索序列中的保守結(jié)構(gòu)域(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)。根據(jù)CDD search搜索結(jié)果確定每條序列上各保守結(jié)構(gòu)域的區(qū)間,提取并保存各結(jié)構(gòu)域的序列,采用MAFFT分別進(jìn)行多重序列比對(duì)(L-INS-i模式),最后再將所有的多重比對(duì)文件按照結(jié)構(gòu)域的順序重新合并。對(duì)于PHD和KAT結(jié)構(gòu)域的原始序列,同時(shí)采用I-TASSER 5.1[20]對(duì)它們逐個(gè)進(jìn)行三維結(jié)構(gòu)建模,最后采用PyMOL[21]對(duì)最佳模型進(jìn)行可視化。
TBLASTN搜索結(jié)果顯示,4條斑馬魚(yú)Ep300/Crebbp序列在虹鱒染色體序列上有8個(gè)較長(zhǎng)的匹配區(qū)間,這些匹配區(qū)間的長(zhǎng)度為18 620~64 649 nt,且對(duì)查詢(xún)序列的覆蓋度均在60%左右,可以初步認(rèn)為這8個(gè)匹配區(qū)間是8個(gè)基因座(表2)。另一方面,BLASTP搜索得到了8條覆蓋度非常高的蛋白質(zhì)序列(Hits),且這些蛋白質(zhì)序列所對(duì)應(yīng)基因的座位剛好與TBLASTN搜索得到的8個(gè)匹配區(qū)間相符合(表3)。
表2 斑馬魚(yú)Ep300/Crebbp序列參考虹鱒基因組的TBLASTN搜索結(jié)果Tab.2 TBLASTN search results of Ep300/Crebbp sequences of zebrafish Danio rerio against rainbow trout Oncorhynchus mykiss genome
表3 斑馬魚(yú)Ep300/Crebbp序列參考虹鱒蛋白質(zhì)數(shù)據(jù)庫(kù)的BLASTP搜索結(jié)果Tab.3 BLASTP search results of Ep300/Crebbp sequences of zebrafish Danio rerio against rainbow trout Oncorhynchus mykiss protein database
通過(guò)BLAST搜索可以看出,虹鱒很可能存在8個(gè)ep300/crebbp基因。重構(gòu)的最大似然樹(shù)顯示,虹鱒和斑馬魚(yú)的ep300/crebbp基因存在2∶1的關(guān)系(圖1),表明虹鱒的8個(gè)ep300/crebbp基因均來(lái)自全基因組重復(fù)事件,而非小規(guī)模的基因重復(fù)。由全基因組重復(fù)產(chǎn)生的旁系同源基因被稱(chēng)作ohnologs[22],因此,這8個(gè)ep300/crebbp成員可以分成4對(duì)ohnologs,分別與斑馬魚(yú)的4個(gè)成員存在直系同源的關(guān)系。根據(jù)通行的命名規(guī)則,將這8個(gè)成員命名為ep300aa~crebbpbb(表4)。
表4 虹鱒8個(gè)ep300/crebbp成員的命名Tab.4 Names of eight ep300/crebbp members of rainbow trout Oncorhynchus mykiss
圖1 虹鱒8條Ep300/Crebbp候選序列與相關(guān)序列的最大似然樹(shù)Fig.1 Maximum likelihood tree of eight candidate Ep300/Crebbp sequences of rainbow trout Oncorhynchus mykiss and related sequences
基于對(duì)PRJEB37848測(cè)序項(xiàng)目原始數(shù)據(jù)的統(tǒng)計(jì),得到虹鱒8個(gè)ep300/crebbp成員及斑馬魚(yú)4個(gè)ep300/crebbp成員的組織表達(dá)水平(圖2)。虹鱒的4對(duì)ohnologs與各自對(duì)應(yīng)的斑馬魚(yú)直系同源基因的表達(dá)譜存在不同程度的分化,其中,ep300ba和ep300bb與斑馬魚(yú)ep300b的分化程度最低,無(wú)論是單個(gè)基因還是2個(gè)基因的平均值和表達(dá)譜的相似度均達(dá)到了顯著或極顯著水平(P<0.05或P<0.01)(圖2(b));而crebbpba和crebbpbb與斑馬魚(yú)crebbpb的分化程度最高,無(wú)論是單個(gè)基因還是2個(gè)基因的平均值和表達(dá)譜的相似度均未達(dá)到顯著水平(P>0.05)(圖2(d))。斑馬魚(yú)的4個(gè)拷貝兩兩之間的表達(dá)譜相關(guān)系數(shù)均在0.9以上,而虹鱒的8個(gè)拷貝兩兩之間的表達(dá)譜相關(guān)系數(shù)僅有不到一半大于0.9(用與斑馬魚(yú)相同的8個(gè)組織的數(shù)據(jù)計(jì)算,相關(guān)系數(shù)大于0.9的則略多于一半),其中還包括了4對(duì)ohnologs內(nèi)部相關(guān)系數(shù)大于0.9的情況(表5、表6)。綜合分析,虹鱒的4對(duì)ohnologs之間功能分歧的程度要大于斑馬魚(yú)的4個(gè)拷貝,其中,crebbpba和crebbpbb與原始功能的分歧最大,而ep300ba和ep300bb則更接近原始的狀態(tài)。
*表示虹鱒和斑馬魚(yú)直系同源基因表達(dá)譜的相關(guān)性達(dá)到了顯著水平(P<0.05);** 表示相關(guān)性達(dá)到了極顯著水平(P<0.01)。* indicates significant correlation between the expression profiles of O.mykiss and D.rerio orthologous genes (P<0.05);** indicate very significant correlation(P<0.01).圖2 虹鱒和斑馬魚(yú)ep300/crebbp家族成員的組織表達(dá)譜Fig.2 Tissue expression profile of ep300/crebbp members of rainbow trout Oncorhynchus mykiss and zebrafish Danio rerio
表5 虹鱒8個(gè)拷貝之間的組織表達(dá)譜相關(guān)系數(shù)Tab.5 Correlation coefficient of tissue expression profile between eight copies of rainbow trout Oncorhynchus mykiss
表6 斑馬魚(yú)4個(gè)拷貝間的組織表達(dá)譜相關(guān)系數(shù)Tab.6 Correlation coefficient of tissue expression profile between four copies of zebrafish Danio rerio
通過(guò)設(shè)置合理的閾值發(fā)現(xiàn),無(wú)論是虹鱒還是斑馬魚(yú),其ep300/crebbp不同拷貝均有數(shù)量不等的特有共表達(dá)基因,即某個(gè)基因只與某一特定ep300/crebbp拷貝的表達(dá)譜相關(guān)系數(shù)大于閾值,與其他拷貝的表達(dá)譜相關(guān)系數(shù)則低于閾值(對(duì)虹鱒的基因,閾值設(shè)為0.9;對(duì)斑馬魚(yú)的基因,閾值設(shè)為0.95)。從表7可以看出,虹鱒crebbpab和crebbpba的共表達(dá)基因數(shù)量遠(yuǎn)少于其他拷貝,這些共表達(dá)基因所富集的GO條目也非常少,表明它們的功能很可能與其他拷貝發(fā)生了較大分化。除這2個(gè)拷貝外,其他的虹鱒拷貝和斑馬魚(yú)的全部拷貝普遍都能富集到數(shù)量較多與結(jié)合活性或蛋白質(zhì)/染色體修飾(主要是乙?;?相關(guān)的GO條目,這與Ep300/Crebbp蛋白的基本功能是相符合的,表明它們的核心功能尚未發(fā)生明顯退化。無(wú)論是虹鱒還是斑馬魚(yú)的拷貝,它們的共表達(dá)基因能富集到與應(yīng)對(duì)壓力/刺激相關(guān)的GO條目總體上比較少,其中虹鱒的crebbpbb基因和斑馬魚(yú)的ep300a基因?qū)儆诶?,它們所富集到的此?lèi)條目中,均有11個(gè)是與應(yīng)對(duì)某些具體化學(xué)物質(zhì)(如酮、甾類(lèi)激素和皮質(zhì)醇等)的刺激有關(guān)。與低氧應(yīng)答有關(guān)的GO條目只有虹鱒ep300bb和斑馬魚(yú)ep300a的共表達(dá)基因能富集到。可見(jiàn),在具體的信號(hào)通路里,不同ep300/crebbp拷貝所發(fā)揮的功能存在較大不同,表明它們的功能也發(fā)生了相應(yīng)的分化。此外,從共表達(dá)基因的功能富集分析結(jié)果上來(lái)看,虹鱒8個(gè)ep300/crebbp拷貝間的功能分化程度要大于斑馬魚(yú)的4個(gè)拷貝。
表7 虹鱒和斑馬魚(yú)ep300/crebbp家族成員共表達(dá)基因的功能富集結(jié)果Tab.7 GO enrichment analysis results of co-expressed genes of ep300/crebbp members of rainbow trout Oncorhynchus mykiss and zebrafish Danio rerio
為進(jìn)一步探究虹鱒8個(gè)Ep300/Crebbp家族成員功能分化的基礎(chǔ),對(duì)8個(gè)基因各自表達(dá)量最高的轉(zhuǎn)錄本所對(duì)應(yīng)的蛋白質(zhì)序列進(jìn)行CDD搜索,發(fā)現(xiàn)8個(gè)拷貝均存在該家族所特有的9個(gè)結(jié)構(gòu)域(圖3)。
將這9個(gè)結(jié)構(gòu)域分別進(jìn)行序列比對(duì)后發(fā)現(xiàn),4對(duì)ohnologs內(nèi)部的序列變異程度存在較大的差別:Crebbpaa與Crebbpab間,以及Crebbpba與Crebbpbb間,保守結(jié)構(gòu)域完全一致;Ep300aa與Ep300ab間存在1處插入缺失突變和6處非同義突變,其中的6處非同義突變中,有2處導(dǎo)致了氨基酸殘基側(cè)鏈基團(tuán)極性的改變;Ep300ba與Ep300bb的保守結(jié)構(gòu)域有35處變異,其中的32處屬于插入缺失突變,3處屬于非同義突變,32處插入缺失突變分布于KIX、Bromo、RING、KAT及Creb_binding結(jié)構(gòu)域,在前4個(gè)結(jié)構(gòu)域是Ep300bb相對(duì)于Ep300ba的插入突變,而在Creb_binding結(jié)構(gòu)域則是Ep300ba相對(duì)于Ep300bb的插入突變,3處非同義突變中,有2處改變了氨基酸殘基側(cè)鏈基團(tuán)的極性(圖4)。
結(jié)構(gòu)域1~9依次為zf-TAZ、KIX、Bromo_cbp_like、RING_CBP-p300、PHD_p300(或PHD_SF super family)、HAT_KAT11(或HAT_KAT11 super family)、ZZ_CBP、ZnF_TAZ和Creb_binding。Domains 1-9 are zf-TAZ,KIX,Bromo_cbp_like,RING_CBP-p300,PHD_p300(or PHD_SF super family),HAT_KAT11(or HAT_KAT11 super family),ZZ_CBP,ZnF_TAZ and Creb_binding,respectively.圖3 虹鱒8個(gè)Ep300/Crebbp成員的CDD搜索結(jié)果Fig.3 CDD search results of eight Ep300/Crebbp members of rainbow trout Oncorhynchus mykiss
從圖3可見(jiàn),8條序列的PHD和KAT結(jié)構(gòu)域存在較大區(qū)別,有4條序列的PHD結(jié)構(gòu)域特征不夠明顯,4條序列的KAT結(jié)構(gòu)域特征不夠明顯。使用I-TASSER對(duì)這2個(gè)結(jié)構(gòu)域進(jìn)行結(jié)構(gòu)建模,發(fā)現(xiàn)KAT結(jié)構(gòu)域過(guò)于復(fù)雜且高相似度的模板較少,導(dǎo)致即使是最佳模型也接近于隨機(jī)水平(TM-score通常在0.2左右);相比之下,PHD結(jié)構(gòu)域建模最佳模型的TM-score均在0.44以上,結(jié)果較為可信。由于這8條序列中同一對(duì)ohnolog內(nèi)部的PHD結(jié)構(gòu)域序列均完全一致,因此,它們的最佳模型結(jié)構(gòu)也完全一致。
從圖5可以看出,PHD結(jié)構(gòu)域的主體是一個(gè)由十幾個(gè)氨基酸形成的螺旋。雖然CDD search結(jié)果顯示,4條Ep300序列的PHD結(jié)構(gòu)域特征不夠明顯,但Ep300aa和Ep300ab的螺旋最長(zhǎng),而Ep300ba和Ep300bb除了有一條較長(zhǎng)的螺旋外,還有一個(gè)較短的螺旋。
天藍(lán)色、紅色、黃色和藍(lán)綠色分別代表該氨基酸殘基是非極性、中性、堿性和酸性氨基酸。 Sky blue,red,yellow and cyan colors indicate nonpolar,neutral,basic and acidic amino acid residue,respectively.圖4 虹鱒8個(gè)Ep300/Crebbp成員保守結(jié)構(gòu)域的序列比對(duì)Fig.4 Sequence alignment of conserved domains of eight Ep300/Crebbp members of rainbow trout Oncorhynchus mykiss
(a)Ep300aa and Ep300ab (b)Ep300ba and Ep300bb (c)Crebbpaa and Crebbpab (d)Crebbpba and Crebbpbb
基因家族的擴(kuò)張可通過(guò)2種形式來(lái)實(shí)現(xiàn),即全基因組重復(fù)和小規(guī)模重復(fù)(small-scale duplications,SSDs)。那些在細(xì)胞調(diào)控網(wǎng)絡(luò)中處于較為核心位置,編碼的蛋白質(zhì)與大量其他蛋白質(zhì)存在互作的基因,往往傾向于通過(guò)全基因組重復(fù)事件增加拷貝數(shù);而那些在調(diào)控網(wǎng)絡(luò)中處于較為邊緣位置,即使缺失也不易產(chǎn)生較大危害的基因,則傾向于通過(guò)小規(guī)模重復(fù)來(lái)增加拷貝數(shù)[11]。ep300/crebbp所編碼的蛋白質(zhì)能夠?qū)?xì)胞內(nèi)不同蛋白質(zhì)的上千個(gè)位點(diǎn)進(jìn)行乙?;痆23],實(shí)現(xiàn)對(duì)基因表達(dá)及蛋白質(zhì)的細(xì)胞內(nèi)定位、酶活性等功能的調(diào)控。顯然,它們的家族擴(kuò)張更有可能是通過(guò)全基因組重復(fù)事件實(shí)現(xiàn)的。事實(shí)上,脊椎動(dòng)物中普遍存在的ep300和crebbp這2個(gè)家族成員本身就是由4.5億年前的全基因組重復(fù)事件所產(chǎn)生[24-25]。筆者在前期研究中發(fā)現(xiàn),不同的真骨魚(yú)類(lèi)群普遍存在2個(gè)ep300基因拷貝,而那些經(jīng)歷過(guò)額外全基因組重復(fù)事件的物種則存在4個(gè)拷貝,這顯然也是全基因組重復(fù)事件后多拷貝得到保留的結(jié)果。本研究中發(fā)現(xiàn),虹鱒的ep300/crebbp家族有8個(gè)拷貝,其中,ep300和crebbp各有4個(gè),與前期研究結(jié)果及虹鱒祖先物種所經(jīng)歷的全基因組重復(fù)事件次數(shù)相符合,這表明歷次全基因組重復(fù)事件所產(chǎn)生的多拷貝被完全保留了下來(lái)。
全基因組重復(fù)事件后能夠在較長(zhǎng)時(shí)期內(nèi)保留2個(gè)拷貝的基因,最初可能只是為了維持劑量平衡;2個(gè)拷貝的進(jìn)化速率通常情況下并不一致,即使它們受到了強(qiáng)大的凈化選擇壓力,隨著時(shí)間的推移,2個(gè)拷貝仍會(huì)以新功能化或亞功能化的形式發(fā)生分化[11,26]。與同樣經(jīng)歷過(guò)額外全基因組重復(fù)事件的鯉和鯽相比[27],虹鱒對(duì)惡劣環(huán)境的適應(yīng)能力要低得多,鑒于ep300/crebbp家族在生物應(yīng)對(duì)環(huán)境變化時(shí)的重要作用,有理由懷疑虹鱒現(xiàn)有8個(gè)成員的功能很可能已發(fā)生了較大的分歧,進(jìn)而導(dǎo)致劑量效應(yīng)被大大弱化。本研究中,這8個(gè)成員表達(dá)譜的分離,以及它們的共表達(dá)基因所富集GO條目的分離,都能夠證明功能分歧的存在。虹鱒crebbpaa與crebbpab,以及crebbpba與crebbpbb間共表達(dá)基因數(shù)量和富集GO條目的巨大差異,進(jìn)一步證明這種功能的分歧不僅存在于不同的ohnologs間,同樣也存在于ohnologs內(nèi)部。對(duì)保守結(jié)構(gòu)域序列的分析表明,ohnologs內(nèi)部的變異總體而言是比較小的,大量變異發(fā)生在不同的ohnologs間,表明這些成員間的功能分歧在最近一次的全基因組重復(fù)事件之前就已經(jīng)存在[28-29]。本研究中,虹鱒的Crebbpaa與Crebbpab,以及Crebbpba與Crebbpbb間的保守結(jié)構(gòu)域序列完全相同,這表明由共表達(dá)基因功能富集所推測(cè)出的功能分歧并不是由于這兩對(duì)ohnologs內(nèi)部所編碼蛋白質(zhì)的結(jié)構(gòu)發(fā)生了顯著變化。推測(cè)一種可能的原因是這兩對(duì)ohnologs內(nèi)部某條序列在非保守結(jié)構(gòu)域的序列變異導(dǎo)致了一定程度的結(jié)構(gòu)創(chuàng)新,從而形成了新功能化。筆者對(duì)斑馬魚(yú)Ep300蛋白結(jié)構(gòu)的研究就表明,TAZ1結(jié)構(gòu)域側(cè)翼的低復(fù)雜度區(qū)域有可能存在較短的螺旋結(jié)構(gòu)[9]。由于結(jié)構(gòu)域間的連接序列也可以結(jié)合轉(zhuǎn)錄因子[30],那些新進(jìn)化出的螺旋結(jié)構(gòu)很有可能會(huì)促進(jìn)這種結(jié)合,最終導(dǎo)致該基因產(chǎn)生新的功能。
虹鱒的8個(gè)ep300/crebbp家族成員中,只有ep300bb的共表達(dá)基因富集到了應(yīng)對(duì)低氧脅迫的GO條目(1/8);相比之下,斑馬魚(yú)的4個(gè)成員中則是ep300a的共表達(dá)基因能富集到低氧脅迫相關(guān)的GO條目(1/4)。拷貝數(shù)增加反而降低了虹鱒ep300/crebbp家族應(yīng)對(duì)低氧脅迫的效率,這或許可以部分解釋為什么虹鱒對(duì)溶氧有更高的要求。另一方面,由于ep300bb基因在絕大多數(shù)組織中的表達(dá)水平均高于另外7個(gè)拷貝,即使其他拷貝也在低氧應(yīng)答中發(fā)揮一定作用,它們的重要性也不如前者。虹鱒的ep300bb基因和斑馬魚(yú)的ep300a基因是兩個(gè)物種中與應(yīng)對(duì)低氧脅迫關(guān)系最密切的ep300/crebbp成員,但它們并不是直系同源關(guān)系,這與筆者前期研究發(fā)現(xiàn)的不同真骨魚(yú)類(lèi)群對(duì)ep300拷貝的選擇偏好[9]是一致的。Ep300ba和Ep300bb在PHD結(jié)構(gòu)域中所存在的額外較短螺旋很可能與功能創(chuàng)新相關(guān)[31],而這2個(gè)拷貝在其他保守結(jié)構(gòu)域中甚至存在一級(jí)結(jié)構(gòu)上的較大變異,這表明它們擁有非??斓倪M(jìn)化速度,且Ep300bb進(jìn)化的方向很可能有利于提高虹鱒的耐低氧性能。
1)虹鱒的ep300/crebbp家族有8個(gè)成員,參考斑馬魚(yú)的4個(gè)ep300/crebbp成員,這8個(gè)成員可被分為4對(duì)ohnologs,說(shuō)明全基因組重復(fù)事件為虹鱒ep300/crebbp基因家族的分歧進(jìn)化提供了豐富的遺傳材料。
2)不同的ohnologs對(duì)之間在組織表達(dá)譜、編碼蛋白質(zhì)的一級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)上存在較大差異,而同一對(duì)ohnologs內(nèi)部的兩個(gè)拷貝在這些方面總體上差異較小,可以推測(cè)它們的功能也發(fā)生了不同程度的分化。
3)ep300bb基因進(jìn)化速度較快,且與虹鱒耐低氧性能相關(guān)性更大,可作為虹鱒遺傳改良的重要候選基因。
大連海洋大學(xué)學(xué)報(bào)2022年3期