陳丹丹,張 朝,劉阿克,鄒央云,谷 迅
(復(fù)旦大學(xué) 生命科學(xué)學(xué)院,上海 200438)
Netrin蛋白家族的進化分析
陳丹丹,張 朝,劉阿克,鄒央云,谷 迅
(復(fù)旦大學(xué) 生命科學(xué)學(xué)院,上海 200438)
神經(jīng)突起生長導(dǎo)向因子(Netrin)蛋白家族是分泌型蛋白質(zhì),其通過與不同的受體相互作用,在神經(jīng)發(fā)育過程中起軸突導(dǎo)向和細胞遷移中發(fā)揮著雙重導(dǎo)向功能.本文分別對涉及到細胞相互作用的Netrin基因家族的起源與進化進行研究.以進化史不同階段的代表物種作為研究對象,通過使用MEGA的鄰接法和似釋然法分別對Netrin基因家族構(gòu)建系統(tǒng)發(fā)育樹;使用PAML 4.7工具以核苷酸序列作為分析材料進行選擇壓分析,篩選出發(fā)生正選擇作用的位點;使用DIVERGE3.0軟件對Netrin氨基酸序列進行功能分化分析,篩選出Ⅰ型和Ⅱ型功能分化位點.
Netrin; 基因家族; 功能分化; 選擇壓力; 細胞黏連
癌癥是一個進化過程的產(chǎn)物,突變在細胞內(nèi)不斷積累到一定程度會使細胞轉(zhuǎn)變成惡性腫瘤.轉(zhuǎn)移特性是惡性腫瘤特有的特性之一,這個特性為腫瘤細胞轉(zhuǎn)移到身體其他組織提供條件,使得腫瘤細胞可以擴散到臨近的組織或者通過血液、淋巴系統(tǒng)等到達身體其他部位,浸潤目的組織,形成新的病灶.細胞通過解除與其他細胞之間的吸附作用,這個從原發(fā)病灶解吸附的過程是轉(zhuǎn)移過程的前提條件,這個過程涉及到與細胞吸附有關(guān)的蛋白質(zhì)的分泌,因此對這些基因的進化機制的研究具有一定的意義.
神經(jīng)突起生長導(dǎo)向因子(Netrin)是一組具有藥物導(dǎo)向作用的蛋白質(zhì).在結(jié)構(gòu)方面,Netrin的二級結(jié)構(gòu)高度保守,是一種多結(jié)構(gòu)域(domain)蛋白質(zhì).1992年Hedgecock第一次提出Netrin和層黏連蛋白(Laminin)的關(guān)系,Netrin蛋白的N末端結(jié)構(gòu)域和Laminin亞基的N末端結(jié)構(gòu)域同源[1].Netrin的C末端在各Netrin蛋白質(zhì)間具有多態(tài)性,且含有與細胞外基質(zhì)或者細胞表面相互作用的物種特異性氨基酸[2].Netrin具有藥物導(dǎo)向的作用,生長中的軸突會移向或者遠離更高濃度Netrin.在多種人類癌癥中發(fā)現(xiàn),Netrin過表達的同時會有某些相關(guān)受體的表達下調(diào).Netrin也會導(dǎo)致細胞凋亡,Netrin- 1的存在可以抑制凋亡通路.在人類直腸上皮細胞中觀察到絨毛頂部高水平的細胞自然死亡和Netrin- 1濃度梯度降低有關(guān).腫瘤抑制基因和Netrin- 1的表達有關(guān),暗示Netrin可能涉及到p53調(diào)控細胞周期的通路.Netrin對細胞死亡的調(diào)控影響很大,因此編碼Netrin- 1的基因被認為是原癌基因[3].同時研究發(fā)現(xiàn)Netrin對神經(jīng)系統(tǒng)以外的其他組織的表達和發(fā)育有重要作用,如肺、胎盤、脈管系統(tǒng)、胰腺、肌肉和乳腺組織.Netrin通過控制位于分化中的器官內(nèi)的發(fā)育中的細胞的遷移和黏附作用來影響組織的形態(tài)形成.在乳腺癌的發(fā)育過程中,腔細胞分泌的Netrin- 1和帽狀細胞表面受體neogenin結(jié)合,使腔細胞層和帽狀細胞層具有黏附作用,因此除了對神經(jīng)系統(tǒng)中的導(dǎo)向作用,Netrin- 1也在哺乳動物中作為黏附因子起作用[4- 5].在胰腺發(fā)育過程中,上皮導(dǎo)管細胞表達的Netrin- 1定位于基底膜,和細胞外基質(zhì)的一些元件(膠原蛋白Ⅵ、纖維連接蛋白和整合蛋白)相互作用.而這些細胞外基質(zhì)元件與上皮細胞的黏附和遷移有關(guān).Netrin- 1在血管形成、維持腫瘤微環(huán)境和轉(zhuǎn)和抑制直腸癌細胞等過程中都起到重要作用[6].
目前對Netrin基因家族的系統(tǒng)的功能分化分析仍舊很少,本文嘗試對Netrin基因家族的進化先后順序、進化選擇壓和蛋白質(zhì)功能加以分析,以期對Netrin基因家族的深入研究有所裨益.
1.1基因序列的獲取
通過HGNC網(wǎng)站(http:∥www.genenames.org)獲得已經(jīng)人工校對的人類Netrin基因家族成員的基本信息,這些信息包含基因名字、基因在染色體的位置、Ensembl ID等(表1).
表1 人類Netrin基因家族的基本信息
將人類Netrin基因的Ensembl ID導(dǎo)入Ensembl數(shù)據(jù)庫(http:∥www.ensembl.org/index.html)中的BioMart工具,分別在目標(biāo)物種數(shù)據(jù)庫中搜索同源基因.將收集到的候選基因作為參考序列,使用BLAST工具在GenBank database中搜索來驗證序列真實性.如在某個物種基因組數(shù)據(jù)庫中未找到同源基因,可將人的相應(yīng)基因作為參考序列,在該物種的基因組數(shù)據(jù)庫中通過BlastN和TblastN工具進行搜索,以進一步核實是否存在該基因.人類與其他物種的同源編碼序列(Coding Sequence, CDS)及其蛋白質(zhì)序列(Protein Sequence)同樣通過Ensembl數(shù)據(jù)庫的BioMart工具下載得到[7].用perl腳本作去冗余處理,即針對具有選擇性剪切的基因,選取序列最長的選擇性剪切形式做序列比對等處理.
1.1.1 氨基酸序列比對
使用MUSCLE(Multiple Sequence Comparison by Log- Expectation)方法對Netrin蛋白的氨基酸序列進行比對.然后通過BioEdit序列比對編輯器(BioEdit Sequence Alignment Editor)對結(jié)果進行調(diào)整,刪除差異大的序列來提高比對的準(zhǔn)確度.為保證序列比對結(jié)果的準(zhǔn)確性,對保留的序列重新進行多序列比對,再通過BioEdit編輯器對比對結(jié)果進行修飾.
1.1.2 核苷酸序列比對
將比對后的蛋白質(zhì)序列及編碼序列作為原始數(shù)據(jù)導(dǎo)入網(wǎng)頁PAL2NAL(http:∥www.bork.embl.de/pal2nal/)獲得核苷酸序列比對結(jié)果.所得比對結(jié)果用來計算同義密碼子替換率(dS)和非同義密碼子替換率(dN).
用WebLogo對氨基酸序列中的功能結(jié)構(gòu)域LamNT區(qū)域進行處理,得到序列標(biāo)識(Sequence Logos),即對氨基酸或核苷酸的進行序列比對結(jié)果圖形化處理.使用默認參數(shù)設(shè)置,標(biāo)識范圍為79到598位點.
1.2系統(tǒng)發(fā)育分析
本文分別采用鄰接法(Neighbor- Joining, NJ)、最小進化法(Minimum Evolution method, ME)以及速度較慢的最大似然法(Maximum Likelihood, ML)3種方法構(gòu)建Netrin基因家族系統(tǒng)發(fā)育樹.bootstrap值設(shè)為1000,即采用1000次抽樣來定量每個進化枝的可信度,一般bootstrap值大于70可認為比較有意義,認為構(gòu)建的系統(tǒng)發(fā)育樹比較可靠,高于90%認為顯著.
1.3選擇壓力分析
Netrin直系同源基因和人Netrin基因家族成員進化上的選擇壓力用PAML4.8分析.PAML(Phylogenetic Analysis by Maximum Likelihood)是一個用極大似然法(Maximum Likelihood, ML)對DNA或蛋白質(zhì)序列進行分析的程序包.本文主要使用Codeml程序包,本程序包對選擇壓力的分析模型有位點模型、枝模型和枝位點模型,選擇壓力使用壓力系數(shù)ω來表示,ω為非同義替換率dN和同義替換率dS的比值.
位點模型(Site Model)假設(shè)密碼子或者蛋白質(zhì)的氨基酸的各位點間有不同的ω值,即不同的dN/dS值[8].Codeml程序包含多個位點模型,通過設(shè)置參數(shù)NSsites(model=0)實現(xiàn).如,NSsites=0,1,2,3,7,8時,代表在同一組數(shù)據(jù)中使用6個模型(3組模型).位點模型采用3對模型檢驗位點的選擇壓力,分別為M0(one- ratio model)/M3(discrete)、M1a(nearly neutral)/M2a(positive selection)和M7(β分布模型)/M8(β分布+ω分布模型),通過似然比檢驗(Likelihood Ratio Tests)來檢驗最佳模型.其中M0模型假設(shè)各個位點具有相同進化速率,稱作單一速率模型;M3假設(shè)不同位點具有不同的進化速率,參數(shù)中的P2、P1和P0分別表示受到正選擇、中性選擇和純化選擇的位點的比例,相對應(yīng)的ω值分別為ω0、ω1和ω2;M1a模型(中性選擇模型)假設(shè)部分位點為保守位點也就是純化選擇位點(ω0<1),位點所占比例為P0,部分位點是中性選擇位點(ω1=1),中性位點所占比例為P1=1-P0;M2a模型(正選擇模型)中P2=1-P0-P1是正選擇位點比例,ω2通過估算得到;M7模型(β分布模型)假設(shè)0<ω<1;M8模型(β分布+ω分布模型)假設(shè)部分位點是正選擇位點(ω>1).M0和M3被用來檢驗不同位點的不同的ω值,不用來做正選擇檢測,M1a/M2a和M7/M8兩對比較用來檢測正選擇位點.
枝模型(branch model)假設(shè)系統(tǒng)發(fā)育樹上的不同枝之間有不同的選擇壓(即不同的ω值),來檢測不同種分枝的正選擇壓[9].枝模型有M0、M1和M2三個模型.其中M0(one- ratio model)模型假設(shè)系統(tǒng)發(fā)育樹各種系之間有單一的選擇壓,M1(free- ratios model)模型假設(shè)系統(tǒng)發(fā)育樹各種系有各自獨立的選擇壓,M2(two- ratios model)模型假設(shè)選定的枝(前景枝,fore- ground branch)和其他枝(背景枝,background branch)相比有不同的選擇壓,這里需用枝標(biāo)簽標(biāo)記前景枝.
枝位點模型(Branch- Site Model, BSM)同時考慮不同枝和不同位點的經(jīng)歷的選擇壓情況,旨在測定特定種系(前景枝)上的正選擇位點.最初Yang和Nielsen使用ModelA(model=2,NSsites=2)和ModelB(model=2,NSsites=3)來測定前景枝的正選擇位點[10],但是經(jīng)驗證明這兩個模型的效果不佳[11],因此將ModelA修改為2個測試[12],即現(xiàn)在的檢測正選擇壓的枝位點模型,是作者推薦使用的一個模型.修改后的前景枝的正選擇位點的檢測分為兩部分,比較零假設(shè)(model=2,NSsites=2,fix omega=1,omega=1)和備擇假設(shè)(model=2,NSsites=2,fix_omega=0)[13].
選擇壓檢驗的操作流程如下: 首先使用位點模型的M0/M3、M1/M2和M7/M8初步檢測整個基因家族的位點選擇壓情況,而后按照亞家族分組分別使用位點模型進一步做位點模型的分析,旨在檢測每個分組的位點經(jīng)歷的選擇壓的情況;然后分別使用枝模型M0/M1粗略檢測每個分枝接受選擇壓的情況,最后對每個亞家族進行枝位點模型分析,旨在檢測出每個亞家族經(jīng)歷正選擇的位點,推測對Netrin亞家族功能形成的重要位點.
1.4功能分歧分析(FunctionDivergenceAnalysis)
采用DIVERGE3.0[14]程序(可在http:∥www.xungulab.com/software.html下載)對Netrin蛋白家族各成員進行功能分化檢測.功能分化系數(shù)(θ)作為功能分化的衡量標(biāo)準(zhǔn),θ值在0~1波動,如θ顯著大于0,意味存在顯著功能分化.Ⅰ型功能分化定義為進化速率發(fā)生改變引起的功能分化,Ⅱ型功能分化定義為進化速率未發(fā)生改變但氨基酸特性(正負帶電性等)發(fā)生改變從而引起功能分化.DIVERGE3.0通過后驗概率預(yù)測發(fā)生功能分化的顯著程度,通過適當(dāng)閾值來預(yù)測發(fā)生功能分化的氨基酸位點.不過θ=0不代表不存在功能分歧位點,可能是功能分歧位點數(shù)少被整體掩蓋.
分析流程如下: 將多序列比對后的Netrin基因家族的氨基酸序列導(dǎo)入DIVERGE3.0程序中,再將已構(gòu)建的系統(tǒng)發(fā)育樹導(dǎo)入DIVERGE3.0中,分別選取NTNG1、NTNG2、NTN5&3、NTN4和NTN1等及其包含的其他序列為獨立的5組,對任意的兩分組進行比對分析.這里采用DVERGE3.0中Gu99算法進行Ⅰ型和II型功能分化分析.
2.1序列收集和氨基酸序列比對
共獲得12個物種的45條序列,將Netrin基因在上述物種中的情況匯總(表2)更加直觀展示Netrin各基因在不同物種中的存在情況.最終選擇39個Netrin基因(表2中Y表示的序列加上斑馬魚的7個基因:NTN- 1a,NTN- 1b,NTN- 2,NTN- 4,NTN- 5,NTN-G1a,NTN-G1b(vav3b))對應(yīng)的氨基酸序列進行比對,比對結(jié)果顯示Netrin蛋白含有1947個氨基酸殘基(aa),其中結(jié)構(gòu)域LamNT位于79~598aa.這個結(jié)構(gòu)域包含7個保守的位點,分別是186(W)、242(S)、246(G)、249(W)、259(C)、286(C)、342(T)(圖1).從比對結(jié)果可見Netrin基因家族中功能結(jié)構(gòu)域LamNT的絕對保守位點.同時從Netrin氨基酸全序列的比對結(jié)果可見,絕對保守位點僅存在于LamNT結(jié)構(gòu)域中,而對于其他結(jié)構(gòu)域,如EGF_Lam、C354C等,并未顯示保守位點,推測可能由于EGF_Lam結(jié)構(gòu)域的多次重復(fù)引起.
表2 Netrin基因家族各基因在不同物種中的存在情況
注: Y表示存在相關(guān)基因;*倍增.
圖1 Netrin氨基酸序列比對Fig.1 Multiple alignments of amino acid sequence of Netrin圖中字母縱向越高表示該位點越保守.
2.2系統(tǒng)發(fā)育分析
構(gòu)建的系統(tǒng)發(fā)育樹的結(jié)果(圖2,見第110頁)顯示,3種方法構(gòu)建的系統(tǒng)發(fā)育樹基本一致,拓撲結(jié)構(gòu)基本吻合且bootstrap值基本一致,基本都在70以上.從拓撲結(jié)構(gòu)看,A節(jié)點倍增后形成NTN1和NTN3&5(NTN3&NTN5)兩簇,B節(jié)點倍增后產(chǎn)生NTN4和NTNG1兩簇,其中海鞘(Ciona)的NTNB基因位于NTNG1亞簇的外節(jié)點,海鞘的NTNA基因位于NTN4亞簇的外節(jié)點,果蠅(fruitfly)的NTN位于NTN1&3&5亞簇的外節(jié)點.所以由此推斷,NTN1、NTN3和NTN5來自于同個祖先,NTN4和海鞘的NTNA接近,NTNG1&NTNG2海鞘的NTNB接近.從構(gòu)建的系統(tǒng)發(fā)育樹的枝長來看,NTN1進化速率最慢,也是最保守,推測NTN1的功能接近穩(wěn)定,NTNG1s和NTN4的進化速率相對快,推測可能還有很大的進化空間趨向于形成比較穩(wěn)定的功能.
圖2 Netrin基因家族系統(tǒng)發(fā)育樹Fig.2 The phylogenetic tree of Netrin gene family
2.3選擇壓力分析
首先使用3對位點模型進行選擇壓分析,結(jié)果見表3(第110頁).從位點模型的結(jié)果中可見,M0vs. M3中P<0.001,存在顯著性,可見M3模型優(yōu)于M0模型,即不同位點有不同的ω值,即經(jīng)歷不同的選擇壓.隨后比對M1a和M2a,M1a是接近中性而M2a是正選擇模型,結(jié)果不存在顯著性,說明從位點模型來看沒有明顯的正選擇現(xiàn)象存在.
表3 位點模型檢驗結(jié)果
這里考慮可能由于不同的基因經(jīng)歷的選擇作用差別比較大,湮沒了部分基因的選擇壓力的情況,因此我們使用位點模型將6個Netrin亞家族分別做了分析,結(jié)果見表4.
表4 每個Netrin基因位點模型的比對結(jié)果以及似然檢驗值
從結(jié)果中顯示,在Netrin基因家族的所有基因中M3模型均優(yōu)于M0模型,表明在所有亞家族中離散模型更合適,即每個基因的每個位點經(jīng)歷的選擇壓不同,符合大部分功能不同的基因的與預(yù)期的結(jié)果一致.大部分基因中沒有檢測出經(jīng)歷正選擇的現(xiàn)象,即M1a/M2a和M7/M8均沒有顯著性.除NTNG2和NTN3,基因的比對結(jié)果顯示M0/M3、M1a/M2a和M7/M8的檢測結(jié)果表明NTNG2和NTN3可能均經(jīng)歷了明顯的正選擇作用.從NTNG2的M2a的參數(shù)(表5)可以看出,發(fā)生正選擇位點的比例為0.00453,大部分位點發(fā)生純化選擇作用,6%左右的位點經(jīng)歷中性選擇作用.從NTN3的M2a模型的參數(shù)(表5,見第112頁)可以看出,發(fā)生正選擇的位點的比例為0.00566,大部分位點(90%)發(fā)生純化選擇作用,8.5%的位點發(fā)生中性選擇作用,正選擇ω值為999.00000.枝模型檢驗結(jié)果(表6)顯示M0vs. M1有顯著性差異,即M1模型優(yōu)于M0模型,不同的枝有不同的選擇壓力.
表5 NTNG2和NTN3的M2a模型的參數(shù)
表6 枝模型的參數(shù)以及似然比檢驗結(jié)果
檢驗結(jié)果(表7)顯示M1模型篩選出經(jīng)歷正選擇的位點(ω>1)所在的分枝.
表7 M1枝點模型的結(jié)果
注: 灰色陰影標(biāo)注M1模型篩選出的經(jīng)歷正選擇的位點所在枝,即ω>1的位點所在枝的標(biāo)號及對應(yīng)的ω的值.
結(jié)合系統(tǒng)發(fā)育樹(圖3),發(fā)現(xiàn)所涉及到的分枝主要為每個基因亞家族出現(xiàn)前的祖先枝,除果蠅的NTN-a和NTN-b、NTN4的形成,以及海鞘的NTN-b之外.由此推測果蠅可能延續(xù)NTN1、NTN3&5的共同祖先的原始功能,而NTN4延續(xù)42號節(jié)點的祖先基因的功能.同時推測NTNG1、NTNG2、NTN3&5和NTN1在倍增之前可能經(jīng)歷的正選擇作用,從而保留下一些非同義突變,增加形成新功能的潛力.除此之外其他的一些枝也存在正選擇的現(xiàn)象,已在系統(tǒng)發(fā)育樹的相應(yīng)位置標(biāo)出(圖3),這些正選擇作用可能對基因功能的形成有一定的潛在作用.
圖3 枝模型的M1模型檢測出的ω>1的分枝在系統(tǒng)發(fā)育樹上的位置(紅色圓點標(biāo)記)Fig.3 The position of branches whose ω value is larger than 1 on the phylogenetic tree(red oval dots)
通過枝位點模型Ma(model=2,NSsites=2)和Ma1(model=2,NSsites=2,fix_omega=1,omega=1)分別對Netrin基因家族的不同基因分析,將基因分為7個組(NTN1、NTN3、NTN4、NTN5、NTNG1、NTNG2和fruitfly NTN).結(jié)果見表8,使用似然比檢驗兩個模型之間的顯著性,得出僅NTN4簇存在顯著區(qū)別(P<0.001),Ma模型檢測發(fā)現(xiàn)正選擇的位點(13N0.751,115E0.930,73A0.737,116D0.543,87H0.914,121A0.596,88D0.607),后驗概率值達到0.9以上的分別有87(H)和115(E),即這兩個位點發(fā)生正選擇,對基因功能的改變或者新功能的形成有潛在的作用.
表8 枝-位點模型檢驗結(jié)果
(續(xù)表)
2.4功能分歧分析
結(jié)果見表9,Ⅰ型結(jié)果中MFEθ顯示Netrin亞家族間功能分化程度區(qū)別較大,θ值從0.03至1.0不等,也就是各亞組間Ⅰ型功能分化程度波動幅度較大,對應(yīng)的標(biāo)準(zhǔn)誤差SE(Standard Error, SE)為0.15附近.NTNG1/NTNG2和NTN1/NTN3&5兩個分組的P值,表示這兩個分組內(nèi)部基因沒有顯著性,說明NTNG1/NTNG2沒有檢測到顯著的進化速率變化位點;而其余分組的比對結(jié)果說明各組間具有顯著性,說明存在顯著的Ⅰ型功能分化(P<0.01).從Ⅱ型功能分化分析結(jié)果(表9)可看出θ值從0.2至0.60,θ的誤差在0.1附近浮動,從結(jié)果顯示NTNG1/NTN4、NTNG1/NTN1、NTNG2/NTN4、NTNG2/NTN1和NTN4/NTN1存在顯著Ⅱ型功能分化,即基因組group之間存在進化速率未發(fā)生改變而相應(yīng)的氨基酸特性發(fā)生改變的位點.
表9 Ⅰ型和Ⅱ型功能分化分析結(jié)果
*MFE: model- free method.E-x表示×10-x.
結(jié)合Ⅰ型功能分化的結(jié)果發(fā)現(xiàn)NTNG1/NTN3&5,NTNG2/NTN3&5及NTN4/NTN3&5均未檢測到Ⅱ型功能分化,而NTNG1/NTNG2和NTN1/NTN3&5既無Ⅰ型功能分化也無Ⅱ型功能分化,所以認為這兩組的基因功能差別不明顯.
由于得到的Ⅰ型功能分化和Ⅱ型功能分化位點的數(shù)目比較多,因此我們對位點做了統(tǒng)計結(jié)果見表10.分別統(tǒng)計閾值大于0.9和大于0.8的位點數(shù)以及所占比例.
表10 Ⅰ型功能分化和Ⅱ型功能分化位點統(tǒng)計分析
1)P>0.9;2)P>0.8.
通過構(gòu)建的系統(tǒng)發(fā)育樹的拓撲結(jié)構(gòu)來展現(xiàn)Netrin基因家族各成員之間在進化上的關(guān)系,顯示Netrin可分為7個亞家族,分別為果蠅的Netrin和NTN1、NTN3、NTN5、NTN4、NTNG1和NTNG2.其中NTN1、NTN3、NTN5來自于共同祖先,NTNG1、NTNG2和NTN4來自于共同的祖先.從多序列比對結(jié)果可以清晰地看出序列中的保守位點多為LamNT結(jié)構(gòu)域的保守位點,可見Netrin基因家族的LamNT結(jié)構(gòu)域相對穩(wěn)定,猜測為承載Netrin基因原始功能的結(jié)構(gòu)域,而EGF結(jié)構(gòu)域中檢測到的保守位點不明顯,可能是由于EGF多次重復(fù)且重復(fù)次數(shù)差異大引起.
從對整個基因家族的位點模型的檢測結(jié)果可以看出,離散模型M1更加適合,即每個位點有不同的選擇壓力,不過從M1a和M2a的比對結(jié)果看,未檢測到正選擇現(xiàn)象,猜測可能是由于不同的亞家族的進化方向不同等原因湮沒了某些重要的正選擇位點.根據(jù)每個亞家族分類使用位點模型再次檢測,從結(jié)果可看出NTNG2和NTN3均經(jīng)歷了顯著的正選擇作用,其他亞家族中的位點模型結(jié)果不存在顯著性.枝模型M0和M1的檢測結(jié)果有顯著差異,不同的分枝有不同的ω值即不同的選擇壓,其中M1模型檢測到一些受到正選擇作用的分枝,這些分枝幾乎包括亞家族形成之前的全部祖先基因的進化枝(除NTN4的祖先枝),因此在除NTN4的各亞家族出現(xiàn)之前經(jīng)歷了不同程度的正選擇作用.從枝位點模型檢測結(jié)果看只有在NTN4亞家族檢測到顯著性,同時檢測到幾個正選擇位點,其中后驗值高于0.9的位點有87(H)和115(E),結(jié)合枝模型的檢驗結(jié)果,顯示NTN4經(jīng)歷的正選擇作用主要在NTN4出現(xiàn)之后,枝位點模型檢測到的兩個正選擇位點可能對NTN4的新功能的形成有重要的作用.
Ⅰ型功能分化結(jié)果顯示NTNG1/NTNG2、NTN1/NTN3&5組外的其他分組均存在明顯的Ⅰ型功能分化;Ⅱ型功能分化結(jié)果顯示,除不存在Ⅰ型共能分化的組,NTNG1/NTN3&5、NTNG2/NTN3&5和NTN4/NTN3&5不存在顯著的Ⅱ型功能分化,可見決定NTN1/NTN3&5、NTNG2/NTN3&5和NTN4/NTN3&5的功能分化的主要是Ⅰ型的功能分化位點,即主要由一個亞家族中保守而在另一個亞家族中不保守的位點決定.基因倍增為新功能的形成提供條件,一個基因的序列保持相對穩(wěn)定,另一個倍增基因的序列發(fā)生改變,從而功能分化便會產(chǎn)生.
需要提到的是,2000年的一篇文章中[15]發(fā)現(xiàn)雞種存在Netrin- 2基因,當(dāng)時的數(shù)據(jù)量不多,所以猜測在哺乳動物中應(yīng)該也有Netrin- 2,不過在ENSEMBL數(shù)據(jù)庫中并未找到Netrin- 2基因的數(shù)據(jù),因此推測Netrin- 2可能在哺乳動物中丟失,或從未出現(xiàn),和大多數(shù)的發(fā)育相關(guān)的基因家族相似,Netrin基因家族的倍增發(fā)生在脊椎動物進化的早期.研究發(fā)現(xiàn)兩棲動物Netrin的表達和人Netrin- 1基因很接近,但是與Netrin- 2和Netrin- 3的表達模式差別很大,猜測Netrin- 1基因可能保持了祖先在發(fā)育方面的作用,而Netrin- 2和Netrin- 3則已經(jīng)進化出了新的功能[16].
[1] ISHII N, WADSWORTH W G, STERN B D,etal. UNC- 6, a laminin- related protein, guides cell and pioneer axon migrations inC.elegans[J].Neuron, 1992,9(5): 873- 881.
[2] CHILTON J K. Molecular mechanisms of axon guidance[J].DevBiol, 2006,292(1): 13- 24.
[3] ARAKAWA H. Netrin- 1 and its receptors in tumorigenesis[J].NatRevCancer, 2004,4(12): 978- 987.
[4] LAI W S K, CORREIA J P, KENNEDY T E. Netrins: Versatile extracellular cues with diverse functions[J].Development, 2011,138(11): 2153- 2169.
[5] SRINIVASAN K, STRICKLAND P, VALDES A,etal. Netrin- 1/neogenin interaction stabilizes multipotent progenitor cap cells during mammary gland morphogenesis[J].DevCell, 2003,4(3): 371- 382.
[6] KO S Y, BLATCH G L, DASS C R. Netrin- 1 as a potential target for metastatic cancer: Focus on colorectal cancer[J].CancerMetastasisRev, 2014,33(1): 101- 113.
[7] KINSELLA R J, KAHARI A, HAIDER S,etal. Ensembl BioMarts: A hub for data retrieval across taxonomic space[J].Database(Oxford), 2011,2011: r30.
[8] NIELSEN R, YANG Z. Likelihood models for detecting positively selected amino acid sites and applications to the HIV- 1 envelope gene[J].Genetics, 1998,148(3): 929- 936.
[9] YANG Z, NIELSEN R, HASEGAWA M. Models of amino acid substitution and applications to mitochondrial protein evolution[J].MolBiolEvol, 1998,15(12): 1600- 1611.
[10] YANG Z, NIELSEN R. Codon- substitution models for detecting molecular adaptation at individual sites along specific lineages[J].MolBiolEvol, 2002,19(6): 908- 917.
[11] ZHANG J. Frequent false detection of positive selection by the likelihood method with branch- site models[J].MolBiolEvol, 2004,21(7): 1332- 1339.
[12] ZHANG J, NIELSEN R, YANG Z. Evaluation of an improved branch- site likelihood method for detecting positive selection at the molecular level[J].MolBiolEvol, 2005,22(12): 2472- 2479.
[13] YANG Z. PAML 4: Phylogenetic analysis by maximum likelihood[J].MolBiolEvol, 2007,24(8): 1586- 1591.
[14] GU X, ZOU Y, SU Z,etal. An update of DIVERGE software for functional divergence analysis of protein family[J].MolBiolEvol, 2013,30(7): 1713- 1719.
[15] KOCH M, MURRELL J R, HUNTER D D,etal. A novel member of the Netrin family, beta- Netrin, shares homology with the beta chain of laminin: Identification, expression, and functional characterization[J].JCellBiol, 2000,151(2): 221- 234.
[16] SHIMELD S. An amphioxusNetringene is expressed in midline structures during embryonic and larval development[J].DevGenesEvol, 2000,210(7): 337- 344.
Abstract: Netrins are a class of secretory proteins involved in axon guidance. Netrins are chemotropic; a growing axon will either move towards or away from a higher concentration of Netrin, which involved in different acceptors. This paper studies the evolutionary history ofNetringene family with the sequences of representative species. Phylogenetic trees were constructed by using Neighbor- Joining and Maximum Likelihood methods. The analysis of selection pressure was performed by PAML4.7 tool for detecting positive selected sites. Except these, the function diversity of Netrins was also analysized by using DIVERGE3.0 software, the functional divergence sites of Type Ⅰ and Type Ⅱ in Netrin were screened out.
Keywords:Netrin; gene family; functional divergence; evolutionary selection; selective pressure
TheEvolutionAnalysisofNetrinFamily
CHEN Dandan, ZHANG Zhao, LIU Ake, ZOU Yangyun, GU Xun
(SchoolofLifeSciences,FudanUniversity,Shanghai200438,China)
Q349+.55
A
0427- 7104(2017)01- 0106- 11
2016- 04- 26
國家自然科學(xué)基金(31571355)
陳丹丹(1989—),女,碩士研究生;谷 迅,男,教授,通信聯(lián)系人,E- mail: xgu@iastate.edu.