閆曉紅,王 寧
(東北農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,哈爾濱 150030)
DLK1(Delta-like 1 homolog)是一個跨膜蛋白,它的膜外區(qū)具有六個特征性的串聯(lián)表皮生長因子樣重復(fù)序列(EGF-like repeat)。DLK1又稱前脂肪細(xì)胞因子(Preadipocyte factor 1)、SCP-1(Stromal cell derived protein-1),F(xiàn)A-1 (Fetal antigen 1),Zog(Zone glomerulosa specific clone)及 pG2。DLK1 是前脂肪細(xì)胞分泌的一個重要脂肪細(xì)胞因子,它參與多種細(xì)胞分化過程,包括脂肪形成、造血作用、骨生成、腎上腺和神經(jīng)內(nèi)分泌細(xì)胞的分化。此外,它還參與外周和中樞神經(jīng)系統(tǒng)的分化,還與生長抑制及未分化腫瘤的惡性程度有關(guān)[1]。
DLK1蛋白的編碼基因是DLK1基因。DLK1基因的第五外顯子存在選擇性拼接,因此該基因在不同動物和細(xì)胞存在不同拼接形式的轉(zhuǎn)錄本,其不同拼接形式轉(zhuǎn)錄本的表達(dá)量因組織和發(fā)育階段不同而不同[2]。鼠的DLK1基因有4種不同的選擇性轉(zhuǎn)錄拼接形式,除了全長的DLK1 mRNA轉(zhuǎn)錄本DLK1A之外,還有3種短的選擇性拼接形式DLK1B、DLK1C、DLK1D[2]。牛、羊及豬的DLK1基因的主要拼接形式為DLK1C2。人和雞的DLK1基因都僅有一種全長的DLK1 mRNA轉(zhuǎn)錄本DLK1A[3]。DLK1A和DLK1B所編碼蛋白的膜外區(qū)存在兩個蛋白酶切割位點,一個位于第四個EGF串聯(lián)重復(fù)序列附近,蛋白酶在這個位點切割后釋放出一個含有3個EGF重復(fù)序列的小的可溶性蛋白,大小約為24~25 ku。另一個切割位點位于近膜區(qū),由 TACE(Tumor necrosis factor α converting enzyme,ADM17)切割,切割后釋放出一個含有6個EGF重復(fù)序列的大的可溶性蛋白(人可溶性蛋白為38 ku,鼠可溶性蛋白為 50 ku)[4]。(見圖 2)DLK1A 和 DLK1B 編碼的DLK1蛋白經(jīng)蛋白酶切割后所釋放出的一大一小兩個可溶性蛋白,目前僅知大的可溶性蛋白具有生物活性,它具有抑制脂肪細(xì)胞分化的能力[2-5]。而DLK1C和DLK1D所編碼的蛋白都沒有近膜區(qū),因此,它們所編碼的蛋白只有一個蛋白酶切點,酶切后只產(chǎn)生一個小的可溶性蛋白。
雞和哺乳動物的DLK1基因具有相似表達(dá)模式,DLK1基因在胚胎期的多種組織和細(xì)胞中表達(dá),但出生后其表達(dá)僅限于前脂肪細(xì)胞[3],因此DLK1基因常被用作前脂肪細(xì)胞的標(biāo)志基因。體內(nèi)和體外研究表明,DLK1基因促進哺乳動物肌肉的生長發(fā)育,但抑制脂肪組織的生長發(fā)育[3]。DLK1基因的這一特性對于提高動物生產(chǎn)具有重要的意義。哺乳動物DLK1基因是一個父源表達(dá)而母源沉默的印跡基因[6],但禽類并不存在印記基因,而且試驗也證實禽類DLK1并不是印記基因[7],它是雙等位基因表達(dá)。雞DLK1基因已被克隆[3],但其功能和調(diào)控機制還不清楚。本文采用生物信息學(xué)方法,開展了包括雞在內(nèi)的13種動物DLK1蛋白的多序列比對、分子進化分析、糖基化分析,比較了人、鼠以及雞的DLK1基因結(jié)構(gòu)、基因同線性、啟動子結(jié)構(gòu)、3′非編碼區(qū)(3′UTR)結(jié)構(gòu)等。本研究為下一步雞DLK1基因的試驗研究奠定了基礎(chǔ)。
人、鼠、猴、牛、豬、羊、袋鼠、原雞、雞、火雞、珍珠雞以及鴨嘴獸等13種動物的DLK1蛋白序列以及人、鼠、雞等的mRNA參考序列,序列均來自美國國家生物信息中心(NCBI,National center for biotechnology information)(http://www.ncbi.nlm.nih.gov)。
1.2.1 蛋白質(zhì)序列比對分析
利用EBI在線多序列比對軟件Clustalw2.0。
1.2.2 蛋白質(zhì)分子進化分析
采用 MEGA4.1(Molecular evolutionary genetics analysis)軟件分析,使用鄰近相連算法 NJ(Neighbor joining model)構(gòu)建系統(tǒng)進化樹,計算距離采用泊松校驗(Poisson correction)的方法,自展檢驗(Bootstrap test)估計NJ法所構(gòu)系統(tǒng)樹的可靠性,重復(fù)次數(shù)5 000次,其余參數(shù)取默認(rèn)值。
1.2.3 蛋白質(zhì)結(jié)構(gòu)分析
利用蛋白結(jié)構(gòu)預(yù)測和功能分析工具SMART(Simple modular architecture research tool)。
1.2.4 蛋白糖基化分析
利用真核生物蛋白功能位點數(shù)據(jù)庫ELM分析(Eukaryotic linear motif resource for functional sites in proteins)。
1.2.5 基因結(jié)構(gòu)分析
利用UCSC基因組瀏覽器(UCSC genome browser)提供的在線分析工具。PolyAde的加尾信號采用PolyA_SVM分析。
1.2.6 啟動子分析
采用McPromoter和TRES軟件分析,CpG島分析采用UCSC基因組瀏覽器在線軟件分析。
1.2.7 3′UTR 結(jié)構(gòu)分析
3′UTR結(jié)構(gòu)的功能元件分析采用UTR scan分析,micro RNA的結(jié)合位點采用MicroInspector軟件分析。
從NCBI的蛋白質(zhì)序列數(shù)據(jù)庫和核酸序列數(shù)據(jù)庫查詢動物的全長DLK1蛋白質(zhì)序列和mRNA序列,獲得13種動物的全長DLK1蛋白序列及其相應(yīng)的mRNA序列(見表1)。各種動物DLK1蛋白的大小有一定差異,其中雞、原雞、火雞的DLK1蛋白大小均為386 aa,而人、猴、大鼠、羊、豬、珍珠雞的DLK1蛋白序列長為383 aa,小鼠的為385 aa,鴨嘴獸的為375 aa,袋鼠的則為379 aa。
表1 不同動物DLK1基因查詢信息Table 1 Information of DLK1 genes in 13 different animals
2.1.1 DLK1蛋白質(zhì)序列比對分析
利用Clustalw 2.0軟件對13種動物的全長DLK1蛋白做序列比對分析(見表2),結(jié)果表明,哺乳類(袋鼠除外)人、鼠、牛、豬、羊及猴的DLK1蛋白序列相似度在81%~96%之間,禽類中雞、原雞、火雞和珍珠雞的DLK1蛋白序列相似度在85%~100%。物種間進化關(guān)系越近則它們的DLK1蛋白序列的相似度越高,反之,動物間進化關(guān)系越遠(yuǎn),DLK1蛋白序列相似度越低。例如,人與猴DLK1蛋白序列相似度高達(dá)96%,小鼠與大鼠為95%,牛與羊為96%,雞與原雞為100%,雞和火雞為97%,但哺乳類人、猴、鼠、牛、羊和豬與禽類雞、火雞、珍珠雞的DLK1蛋白序列的相似度僅為46%~56%。
2.1.2 DLK1蛋白分子進化分析
選取上述13種動物的全長DLK1蛋白序列,利用分子進化遺傳分析軟件MEGA4.1構(gòu)建系統(tǒng)進化樹,結(jié)果如圖1所示。13種動物的DLK1蛋白分子被聚為兩大組,哺乳類組和禽類組。哺乳類組包括4個亞組,分別為:人與猴組、鼠類組、家畜類組,袋鼠組。鴨嘴獸與禽類聚在同一大組,其中雞、原雞、火雞和珍珠雞一組,鴨嘴獸獨自一組,這表明鴨嘴獸與禽類的親緣關(guān)系比起哺乳類更近。從遺傳距離矩陣分析結(jié)果也可以看出(見表3),禽類雞與原雞、火雞和珍珠雞間的遺傳距離很小,在0.000~0.0097之間;哺乳類人、鼠、猴、牛、豬和羊(袋鼠除外)彼此間的遺傳距離稍大些,在0.021~0.179,但仍表現(xiàn)出動物間進化關(guān)系越近則遺傳距離越小的規(guī)律,如人與猴之間的進化距離為0.021,鼠類間0.045、家畜(牛、羊及豬)之間<0.093,而遺傳差異較大的人與鼠間遺傳距離為0.141,人與家畜豬、牛和羊間的遺傳距離為0.145~0.159,與禽類間遺傳距離則>0.410。袋鼠是低等的哺乳動物,它雖與其他高等哺乳類同組,但在哺乳類組中單獨為一組,這也表明袋鼠同人、猴、鼠、牛、豬等哺乳類動物的親緣關(guān)系較遠(yuǎn)。鴨嘴獸是卵生的單孔類哺乳動物,是現(xiàn)存最原始的哺乳動物,它在進化上處于爬行類動物與哺乳類動物中間,它是形成高等哺乳動物的進化環(huán)節(jié)。根據(jù)DLK1蛋白序列進化分析,鴨嘴獸與禽類動物間的進化距離<0.307,而與哺乳類動物間的遺傳距離>0.414,故被聚類到禽類組。鴨嘴獸全基因組序列分析發(fā)現(xiàn),鴨嘴獸基因組是一個基因混合體,包含部分鳥類基因、部分爬行動物類基因以及部分哺乳動物類基因[8],這可能是鴨嘴獸被聚類到禽類組中的原因。
表2 不同動物DLK1蛋白全長序列多序列比對結(jié)果Table 2 Mutiple sequence alignment of DLK1 protein in different animals
圖1 用鄰接法(NJ)構(gòu)建的13種動物DLK1蛋白的系統(tǒng)進化樹Fig.1 Phylogenetic tree of DLK1 protein sequence from 13 different animals.
表3 不同動物DLK1蛋白質(zhì)分子進化距離矩陣Table 3 Genetic distance of DLK1 proteins among 13 different animals
利用蛋白質(zhì)結(jié)構(gòu)預(yù)測工具SMART分析13種動物全長DLK1蛋白序列,發(fā)現(xiàn)DLK1蛋白都由信號肽(Signal peptide)、EGF結(jié)構(gòu)域(EGF domain)構(gòu)成的膜外區(qū)以及跨膜區(qū)(Transmembrane)組成。絕大多數(shù)動物(人、猴、鼠、豬、羊、袋鼠、原雞、雞、火雞及珍珠雞)的DLK1蛋白都有6個EGF domain,只有牛和鴨嘴獸的DLK1蛋白有5個EGF domain。另外,EGF domain中與鈣離子結(jié)合的EGF domain(EGF_Ca)結(jié)構(gòu)域在不同動物DLK1蛋白中分布不同,人、鼠、牛、豬、羊的EGF_Ca為第三個EGF,而袋鼠及禽類(原雞、雞、火雞和珍珠雞)的EGF_Ca則為第五個EGF。Clustalw 2.0比對結(jié)果顯示,DLK1蛋白EGF_Ca及跨膜區(qū)的序列組成在同類物種間具有較高的保守性。哺乳類動物的EGF_Ca結(jié)合位點序列的相似度為81%~97%,禽類在86%~100%。哺乳類動物DLK1蛋白跨膜區(qū)序列間的相似度達(dá)91%~100%,不同禽類動物DLK1蛋白跨膜區(qū)序列的相似度達(dá)100%。此外,與哺乳類動物不同,禽類(原雞、雞和火雞)DLK1蛋白序列的N端都有7個連續(xù)的半胱氨酸(Cys)。
結(jié)果見圖2。
圖2 DLK1蛋白結(jié)構(gòu)域及其剪切位點Fig.2 Schematic of DLK1 protein domain structure and its cleavage sites
蛋白質(zhì)糖基化是一種重要的翻譯后修飾,約有一半以上的蛋白質(zhì)發(fā)生糖基化。大量的研究表明,糖基化對蛋白質(zhì)的結(jié)構(gòu)和功能具有重要影響,它能影響蛋白質(zhì)的折疊、運輸、定位等。通過ELM(Eukaryotic linear motif resource for functional sites in proteins)數(shù)據(jù)庫,分析比較這13種動物DLK1蛋白的糖基化位點。結(jié)果發(fā)現(xiàn),哺乳類動物人、猴、鼠、牛、羊、豬的全長DLK1蛋白序列共有8個保守的糖基化位點,其中O-型2個(S/T),N-型6個(N),分別對應(yīng)小鼠全長DLK1蛋白序列的第41N(牛、羊除外)、94S、100N、134N、165N、174N、216S(豬除外)和330N。在其中的四個糖基化位點100N、134N、165N和216S處,禽類原雞、雞、火雞、珍珠雞也具有相同的糖基化位點,它們分別對應(yīng)于雞全長DLK1蛋白序列的第105N、139N、170N和218S。除此之外,原雞、雞、火雞和珍珠雞的DLK1蛋白序列還有另外6個保守的糖基化位點,分別對應(yīng)于雞全長DLK1蛋白序列的60N、181S、255N、363N、378N和382N位點。
小鼠DLK1蛋白的大的可溶性蛋白片段由261個氨基酸構(gòu)成,試驗證實它具有3個N-糖基化位點 Asn77(100N)、Asn142(165N)、Asn151(174N)和 3 個 O-糖基化位點 Ser71(94S),Ser193(216S),Thr201[9]。這些糖基化位點分別對應(yīng)于ELM數(shù)據(jù)庫對小鼠全長DLK1蛋白預(yù)測得到的糖基化位點100N,165N,174N,94S,216S,小鼠DLK1蛋白糖基化位點的實驗檢測結(jié)果與ELM數(shù)據(jù)庫預(yù)測結(jié)果一致,這說明ELM數(shù)據(jù)庫對糖基化位點預(yù)測的準(zhǔn)確性較高。應(yīng)用ELM數(shù)據(jù)庫預(yù)測分析,可知雞DLK1蛋白的大的可溶性蛋白片段可能存在7個糖基化位點,它們分別是60N、105N、139N、170N、181S、218S和255N。除此之外,雞全長DLK1蛋白的胞漿區(qū)還可能存在363N、378N和382N 3個糖基化位點。
利用 UCSC genome browser在線軟件 BLAT,以雞、人和鼠的DLK1 mRNA參考序列(NM_0011 42254、NM_003836、NM_010052)為查詢序列,分別對雞、人和鼠的基因組數(shù)據(jù)庫進行Blat搜索,可見雞DLK1基因位于#5染色體,大小為9 616 bp,它有5個外顯子和4個內(nèi)含子。人DLK1基因位于#14染色體,大小為8 205 bp,與雞的DLK1基因結(jié)構(gòu)相同,同樣具有5個外顯子4個內(nèi)含子,起始密碼子位于第一個外顯子。小鼠DLK1基因位于#12染色體,大小為7 469 bp,不同于人和雞,它有6個外顯子和5個內(nèi)含子,其起始密碼子位于第二外顯子上。雞的基因組大約是人基因組的35%,鼠的45%[10],但在這三個動物中意想不到的是,雞的DLK1基因最大,而且雞DLK1基因的內(nèi)含子大小累計之和也大于人和鼠的,雞DLK1基因有一個最大內(nèi)含子近5 kb,而人和小鼠DLK1基因最大內(nèi)含子都小于3 kb。
DLK1基因是哺乳動物的一個印跡基因[6],它分別位于人#14染色體、小鼠#12染色體及羊#18染色體,印記基因的特征之一是呈簇存在,大小從幾百kb到上千kb[11]。DLK1基因的印記簇為DLK1-DIO3印跡基因簇,該區(qū)域得到了人們廣泛的關(guān)注和研究[12-13]。人和鼠DLK1-DIO3印跡基因簇都存在三個父源表達(dá)的基因:DLK1、類反轉(zhuǎn)座子基因1(RTL1)、3型脫碘酶基因 (DIO3),多個母源表達(dá)長的非編碼RNA和短的非編碼RNA基因:Meg3/Gtl2、Anti-Peg11、Meg8、Irm/“Rian”、AK050713、AK053394、Meg9/Ming,以及核仁小 RNA簇和microRNA基因簇等[12]。人和鼠的DLK1-DIO3區(qū)域的基因同線性水平很高。雞DLK1基因位于#5染色體上,與人和小鼠相比,雞與人和鼠的DLK1基因具有一定的同線性,雞DLK1基因和DIO3基因也位于同一染色體上,且兩者位置相鄰。根據(jù)DLK1和DIO3的mRNA參考序列,利用UCSD genome browser在線分析軟件分析,可知雞DLK1基因和DIO3基因間序列最短,大小僅為348.9 kb,而人和鼠的DLK1-DIO3基因間序列較長,分別約為836和827.6 kb。與人和鼠的一個顯著不同之處是,雞DLK1基因和DIO3基因間不存在其他基因。
根據(jù)NCBI數(shù)據(jù)庫中人(NM_003836)、小鼠(NM_010052)以及雞(NM_001142254)的mRNA序列,利用UCSC genome browser在線軟件,分別獲取人、小鼠以及雞的起始密碼子上游2 kb的基因組序列。CpG島分析發(fā)現(xiàn),這三種動物的DLK1基因起始密碼子上游2 kb區(qū)域都有一個CpG島,且都靠近起始密碼子處(1 kb內(nèi))。其中鼠的CpG島最大是862 bp,甲基化區(qū)包括第一外顯子、第一內(nèi)含子以及第二外顯子;人的CpG島為648 bp,甲基化區(qū)域包括整個第一外顯子;雞的CpG島大小為586 bp,包括第一外顯子和部分第一內(nèi)含子。甲基化區(qū)域往往涉及到轉(zhuǎn)錄區(qū)域,CpG島一般與基因的啟動子區(qū)重疊,由此推測,人、小鼠以及雞的DLK1基因的啟動子位于起始密碼子上游1 kb范圍之內(nèi)。進一步采用McPromoter軟件分析,結(jié)果顯示人、小鼠以及雞的DLK1基因起始密碼子上游1 kb范圍之內(nèi)作為啟動子區(qū)的可能性最大。依據(jù)CpG島分析和啟動子分析結(jié)果可以確定,人、小鼠和雞的DLK1基因的啟動子區(qū)位于起始密碼子上游1 kb范圍內(nèi)。利用UCSC基因組瀏覽器分析人、小鼠和雞啟動子區(qū)的保守性,發(fā)現(xiàn)三者核苷酸序列的保守性非常低,雞與鼠的啟動子區(qū)沒有同源區(qū)域,雞與人僅在啟動子區(qū)有一個77 bp的同源性區(qū)域,這一同源性區(qū)域具有一個CAP(Cap signal for transcription initiation)信號,1 個 MZF、c-Myb、STRE、AML-1a,5個 HSF位點和2個ADR1位點。利用TRES軟件比較人、小鼠和雞的啟動子區(qū)的保守轉(zhuǎn)錄因子結(jié)合位點(Search TF Binding Sites/Cis-Elements using IUPAC consensus strings),查詢5 919個位點,共發(fā)現(xiàn)了35個保守位點,包括10個SP1、2個AP2、2個GATA1結(jié)合位點,此外,還發(fā)現(xiàn)有TFIIB 結(jié)合位點和轉(zhuǎn)錄酶復(fù)合體的結(jié)合位點、PEA3、ETS、MBF-I、E2A、malT、P3A1/P3A2、Lmo2、SEF4、CTCF以及多個未知結(jié)合位點。目前已知SP1/KLFs轉(zhuǎn)錄因子家族成員、AP2及GATA等轉(zhuǎn)錄因子均在脂肪細(xì)胞表達(dá),并在脂肪細(xì)胞分化中發(fā)揮重要調(diào)控作用。啟動子區(qū)保守性轉(zhuǎn)錄因子結(jié)合位點分析結(jié)果顯示,人、小鼠和雞DLK1基因啟動子區(qū)存在多個這些轉(zhuǎn)錄因子的結(jié)合位點,這為下一步分析DLK1基因的轉(zhuǎn)錄調(diào)控機制提供了方向,具有重要的參考價值。
基因的3′非編碼區(qū) (3′UTR)是基因表達(dá)調(diào)控的重要區(qū)域,它在基因表達(dá)轉(zhuǎn)錄后的調(diào)控中發(fā)揮重要作用,3′UTR調(diào)控mRNA的定位、翻譯及穩(wěn)定性等[14]。mRNA的3′UTR區(qū)的順式作用元件除了有microRNA結(jié)合位點,還有特定RNA結(jié)合蛋白的結(jié)合基序(Motif)。mRNA的3′UTR序列保守性很低,轉(zhuǎn)錄后的調(diào)控主要依賴于其存在的順式元件。
雞DLK1基因的3′UTR序列目前尚未報道,為了獲取3′UTR序列,我們利用UCSC的BLAT軟件,將雞mRNA序列(NM_001142254)與雞基因組序列進行比對,取終止密碼子下游1 kb基因組序列,進而采用PolyA_SVM分析Poly A加尾信號(PolyA_SVM:analysis and prediction of mRNA polyadenylation sites by Support Vector Machine)[15]。PolyA_SVM分析結(jié)果顯示,該序列有四個可能的Poly A加尾信號,分別位于終止密碼子下游263、319、403及629處,cutoff值分別為1.2、5.7、0.5及5.3,該軟件是cutoff值越小,結(jié)果可靠性越大,由此推測403 bp處的AATAAA作為加尾信號的可能性最大,其切割加尾的位置在419 bp處。為驗證上述推測的可靠性,利用UCSC Genome Browser Home在線分析軟件比較終止密碼子下游1 kb序列與雞EST序列,發(fā)現(xiàn)絕大多數(shù)雞DLK1基因的EST序列與該1 kb序列的5′端匹配,即位于所推測的419 bp的范圍之內(nèi),與其匹配最長的一個EST(BU353140)序列的同源性為96.1%,該EST序列(BU353140)僅比所推測的雞DLK1基因的3′UTR序列的3′端少6個核苷酸。這說明通過生物信息學(xué)方法分析獲得的雞DLK1基因的3′UTR序列是正確的。利用這419 bp序列做Blast分析,發(fā)現(xiàn)其1~364區(qū)與珍珠雞DLK1基因(XM_002200261)的3′UTR序列有達(dá)77%的同源性,這也提示我們雞的DLK1基因3′UTR序列是正確的。
根據(jù)人和鼠的DLK1基因參考序列(NM_003836、NM_010052),分別獲得人和鼠DLK1基因的3′UTR序列,它們大小分別為227和331 bp。利用UCSC Genome Browser在線軟件分析DLK1基因3′UTR序列的保守性,發(fā)現(xiàn)雞與鼠的3′UTR序列無相似性,但與人的DLK1基因的3′UTR序列組成有一定的相似性,雞與人DLK1基因3′UTR序列 的5′端存在一個由172個核苷酸組成的相似區(qū)域;雞與人和鼠3′UTR的3′端序列相似性非常低,但雞與斑馬魚3′UTR的3′端序列相似度較高。另外,雞與負(fù)鼠(Opossum)的DLK1的3′UTR保守性也較高。
試驗還利用UTR scan做了人、鼠和雞3′UTR的Motif分析,結(jié)果顯示,除了都有加尾信號(Polyadenylation Signal,PAS)外,三者沒有找到其他相同的基序。
雞和鼠的3′UTR都具有一個IRES(Internal Ribosome Entry Site,IRES)元件。此外,雞還有一個MBE結(jié)合位點(Musashi binding element)。
DLK1基因3′UTR序列的microRNA結(jié)合位點分析采用microRNAinspector軟件(Version 1.5,miRBASE 13)(http://bioinfo.uni-plovdiv.bg/microinsp ector/),按照軟件默認(rèn)的雜交溫度和自由能閾值條件分析人、鼠及雞DLK1基因的microRNA結(jié)合位點,結(jié)果顯示,人具有27個microRNA結(jié)合位點(包括兩個hsa-miR-611和兩個hsa-miR-127-3p)、鼠有34個microRNA結(jié)合位點(包括3個mmumiR-1966和三個 mmu-miR-1943)、雞有 27個microRNA結(jié)合位點(包括兩個gga-miR-1619)。比較發(fā)現(xiàn),雞、鼠以及人三者之間沒有相同的microRNA結(jié)合位點,但人和鼠具有5個相同的micorRNA結(jié)合位點(miR-16、miR-195、miR-339-3p、miR-449a、miR-449b)。由此可知,雞DLK1基因的轉(zhuǎn)錄后調(diào)控與哺乳動物的轉(zhuǎn)錄調(diào)控差異很大。
印記基因雖然數(shù)量不多,但其功能多樣,它們在哺乳動物生長發(fā)育以及維持人和動物的健康中發(fā)揮重要作用,印記基因表達(dá)異常將導(dǎo)致包括癌癥在內(nèi)的疾病發(fā)生?;蚪M印記是一種表觀遺傳學(xué)現(xiàn)象,表現(xiàn)為只有雙親中一方的基因表達(dá)?;蚪M印記僅發(fā)現(xiàn)于胎盤類哺乳動物,鳥類等低等動物沒有這種現(xiàn)象[10]?;虻挠∮浭且环N基因表觀調(diào)控機制,DLK1基因在哺乳動物中是一個父源表達(dá)而母源沉默的印跡基因。禽類并不存在印記基因,而且試驗也證實雞DLK1基因并非印記基因。目前非哺乳動物DLK1基因的功能和表達(dá)調(diào)控還不清楚。因此,開展雞的DLK1基因研究對于了解印記基因的進化、闡明雞脂肪細(xì)胞分化的機制以及雞的分子育種等具有重要意義。
從蛋白序列的多序列比對分析、分子進化分析、蛋白糖基化分析以及共線性分析來看,雞與人和鼠的DLK1蛋白相似性很低,進化關(guān)系較遠(yuǎn),但從mRNA拼接形式、基因結(jié)構(gòu)、啟動子結(jié)構(gòu)、3′UTR結(jié)構(gòu)以及CpG島來看,雞和人卻有許多相似之處,提示雞的DLK1基因的調(diào)控與人的DLK1基因調(diào)控相似。這一分析結(jié)果與雞的比較基因組學(xué)研究結(jié)果類似,比較基因組學(xué)研究發(fā)現(xiàn),雞染色體上的基因結(jié)構(gòu)更接近于人而不是鼠[16]。
microRNA是一類短的內(nèi)源非編碼RNA(noncoding RNA),大小約為20~22個核苷酸,它通過與靶基因mRNA的3′UTR的結(jié)合位點(micro RNA binding site)結(jié)合,參與基因轉(zhuǎn)錄后調(diào)控(Posttranscriptional regulation)。microRNA 參與細(xì)胞增殖、凋亡、分化、代謝、發(fā)育等多種生物學(xué)過程。近年來的研究證實,microRNA也是一類廣泛存在的重要反式作用因子,絕大多數(shù)基因受microRNA的調(diào)控。3′UTR結(jié)構(gòu)分析發(fā)現(xiàn),人、雞及鼠三者沒有相同的microRNA識別位點,除了加尾信號外,也沒有其他相同的調(diào)控元件,這表明雞與人和鼠在DLK1基因轉(zhuǎn)錄后的調(diào)控有極顯著的差別。DLK1基因在人和鼠等哺乳動物為印記基因,而在雞并非印記基因,因此,推測DLK1基因作為印記基因和非印記基因時其調(diào)控方式是不同的。這些分析結(jié)果為下一步的實驗研究提供了依據(jù)和方向。
人和鼠的DLK1-DIO3區(qū)域大小均約為1 Mb,而雞的DLK1-DIO3區(qū)域約為0.4 Mb,同線性分析顯示,人和鼠該區(qū)域同線性程度很高,人和鼠DLK1基因和DIO3基因間插入有多個基因和小的非編碼RNA基因,但是雞的DLK1-DIO3區(qū)域較小,該區(qū)域也沒有人和鼠的相應(yīng)的基因和非編RNA基因。由于DLK1基因是哺乳動物的一個印記基因,本研究提示該區(qū)域的基因組印記現(xiàn)象出現(xiàn)晚于DLK1和DIO3基因的同線性。推測DLK1-DIO3基因間插入其他基因和非編RNA基因后才出現(xiàn)基因組該區(qū)域的印記現(xiàn)象。
雞的基因組大小為1.2×109bp,大約是人基因組的35%,鼠的45%[10]?;蚪Y(jié)構(gòu)分析顯示,與人和鼠相比,雞DLK1基因具有最大的內(nèi)含子,而且雞DLK1基因的內(nèi)含子大小之和也最大。有研究報道,內(nèi)含子長度隨物種的復(fù)雜性升高而變長[17],人和鼠的進化程度都要高于雞,但雞DLK1基因并不符合這一規(guī)律。哺乳動物印記基因和非印記基因相比較分析表明,印記基因具有較少的內(nèi)含子和較小的內(nèi)含子[18]。DLK1基因是哺乳動物的一個印記基因,但在禽類它并不是印記基因,根據(jù)本研究結(jié)果我們推測動物在進化過程中,從非印記基因向印記基因進化的過程中其內(nèi)含子變小。
[1] Nueda M L,García-Ramírez J J,Laborda J,et al.Dlk1 specifically interacts with insulin-like growth factor binding protein 1 to modulate adipogenesis of 3T3-L1 cells[J].J Mol Biol,2008,379(3):428-442.
[2] Wang Y,Kim K A,Kim J H,et al.Pref-1,a preadipocyte secreted factor that inhibits adipogenesis[J].J Nutr,2006,136(12):2953-2956.
[3] Shin J,Lim S,Latshaw J D,et al.Cloning and expression of deltalike protein 1 messenger ribonucleic acid during development of adipose and muscle tissues in chickens[J].Poult Sci,2008,87(12):2636-2646.
[4] Wang Y,Sul H S.Ectodomain shedding of preadipocyte factor 1((Pref-1)by tumor necrosis factor alpha converting enzyme(TACE)andinhibitionofadipocytedifferentiation[J].Mol Cell Biol,2006,26(14):5421-5435.
[5] Smas C M,Chen L,Sul H S.Cleavage of membrane-associated pref-1 generates a soluble inhibitor of adipocyte differentiation[J].Mol Cell Biol,1997,17(2):977-988.
[6] Sul H S.Minireview:Pref-1:Role in adipogenesis and mesenchymal cell fate[J].Mol Endocrinol,2009,23(11):1717-1725.
[7] Shin S,Han J Y,Lee K.Cloning of avian Delta-like 1 homolog gene:the biallelic expression of Delta-like 1 homolog in avian species[J].Poult Sci,2010,89(5):948-955.
[8] Warren W C,Hillier L W,Marshall G J A,et al.Genome analysis of the platypus reveals unique signatures of evolution[J].Nature,2008,453(7192):175-183.
[9] Krogh T N,Bachmann E,Teisner B,et al.Glycosylation analysis and protein structure determination of murine fetal antigen 1(mFA1)-the circulating gene product of the delta-like protein(dlk),preadipocyte factor 1(Pref-1)and stromal-cell-derived protein 1(SCP-1)cDNAs[J].Eur J Biochem,1997,244(2):334-342.
[10] Burt D W.Chicken genome:Current status and future opportunities[J].Genome Res,2005,15(12):1692-1698.
[11] Bartolomei M S.Genomic imprinting:employing and avoiding epigenetic processes[J].Genes Dev,2009,23(18):2124-2133.
[12] Hagan J P,O'Neill B L,Stewart C L,et al.At least ten genes define the imprinted Dlk1-Dio3 cluster on mouse chromosome 12qF1[J].PLoS One,2009,4(2):e4352.
[13] 張意軍,屈良鵠.非編碼RNA與哺乳動物基因組印記的起源[J].中國科學(xué)C輯:生命科學(xué),2009,39(1):3-12.
[14] Chatterjee S,Pal J K.Role of 5'-and 3'-untranslated regions of mRNAs in human diseases[J].Biol Cell,2009,101(5):251-262.
[15] Lee J Y,Yeh I,Park J Y,et al.PolyA_DB 2:mRNA polyadenylationsitesinvertebrategenes[J].NucleicAcidsRes,2007,35:165-168.
[16] Hillier L W,Miller W,et al.(International Chicken Genome Sequencing Consortium)Sequence and comparative analysis of the chicken genome provide unique perspectiveson vertebrate evolution[J].Nature,2004,432(7018):695-716.
[17] Gopalan V,Tan T W,Lee B T,et al.Xpro:Database of eukaryotic protein-encoding genes[J].Nucleic Acids Res,2004,32:D59-63.
[18] Hurst L D,McVean G,Moore T.Imprinted genes have few and small introns[J].Nat Genet,1996 12(3):234-237.