高智慧,黃佳新,羅昊玉,徐海冬,婁明,寧博林,邢曉旭,牟芳,李輝,王寧
研究報告
雞基因組及轉(zhuǎn)錄本結(jié)構(gòu)分析
高智慧1,2,3,黃佳新1,2,3,羅昊玉1,2,3,徐海冬1,2,3,婁明1,2,3,寧博林1,2,3,邢曉旭1,2,3,牟芳1,2,3,李輝1,2,3,王寧1,2,3
1. 農(nóng)業(yè)農(nóng)村部雞遺傳育種重點實驗室,哈爾濱 150030 2. 黑龍江省普通高等學(xué)校動物遺傳育種與繁殖重點實驗室,哈爾濱 150030 3. 東北農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,哈爾濱 150030
神經(jīng)調(diào)節(jié)蛋白4(neuregulin 4,NRG4)是一個重要的脂肪細(xì)胞因子,在維持哺乳動物能量平衡、調(diào)節(jié)糖脂代謝和預(yù)防非酒精性脂肪性肝病中起著非常重要的作用。目前,人基因的基因組結(jié)構(gòu)、轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體等已有深入的研究。本實驗室前期研究顯示,雞脂肪組織也表達,但是目前有關(guān)雞(chicken,)基因的基因組結(jié)構(gòu)、轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體尚不清楚。為此,本研究采用RACE(rapid-amplification of cDNA ends)和RT-PCR(reverse transcription-PCR)等技術(shù),系統(tǒng)開展了基因的基因組和轉(zhuǎn)錄本的結(jié)構(gòu)分析。結(jié)果發(fā)現(xiàn),基因編碼區(qū)很小,但該基因卻非常復(fù)雜,存在選擇性轉(zhuǎn)錄起始位點、選擇性拼接、內(nèi)含子滯留、隱匿外顯子和選擇性多聚腺苷酸化,這導(dǎo)致基因產(chǎn)生4種不同的5?UTR異構(gòu)體(、、和)和6種不同的3?UTR異構(gòu)體(、、、、和)?;蚪M結(jié)構(gòu)分析發(fā)現(xiàn),基因跨越基因組21,969 bp (Chr.10: 3,490,314~3,512,282),由11個外顯子和10個內(nèi)含子構(gòu)成。與NCBI數(shù)據(jù)庫中的基因mRNA序列(NM_001030544.4)相比,本研究發(fā)現(xiàn)了基因的2個新外顯子和1個隱匿外顯子。生物信息學(xué)分析、RT-PCR、克隆和測序分析發(fā)現(xiàn),基因能編碼3種蛋白異構(gòu)體(cNRG4-1、cNRG4-2和 cNRG4-3)。本研究為進一步開展基因的功能和調(diào)控研究奠定了基礎(chǔ)。
雞;NRG4;基因組結(jié)構(gòu);轉(zhuǎn)錄異構(gòu)體;蛋白異構(gòu)體
神經(jīng)調(diào)節(jié)蛋白4(neuregulin4,NRG4)是一個重要的脂肪細(xì)胞因子,屬于EGF(epidermal growth factor)家族。哺乳動物的研究發(fā)現(xiàn),基因在棕色脂肪組織中高表達,此外,在白色脂肪組織、胰腺、肺、心臟等多種器官和組織中也有不同程度的表達[1]。NRG4通過其EGF結(jié)構(gòu)域與受體ErbB4(v-erb-b2 avian erythroblastic leukemia viral oncogene homolog 4)的胞外區(qū)域相結(jié)合,使ErbB4和ErbB3發(fā)生二聚化,進而激活下游磷脂酰肌醇(phosphatidyl inositol 3 kinase,PI3K)和絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)等信號通路[2],從而促進細(xì)胞增殖,抑制細(xì)胞凋亡以及改善細(xì)胞能量代謝等。臨床研究顯示,成人非酒精性脂肪性肝病(nonalcoholic fatty liver disease,NAFLD)的發(fā)生率與血清NRG4水平呈負(fù)相關(guān)[3]。對轉(zhuǎn)基因小鼠()的研究發(fā)現(xiàn),NRG4可降低肝臟的脂肪合成,改善NAFLD和胰島素抵抗[4]。流行病學(xué)調(diào)查顯示,糖尿病患者血清中的NRG4含量明顯高于正常對照組[5]。這些研究提示,NRG4有望成為多種疾病的潛在治療靶點。
神經(jīng)調(diào)節(jié)蛋白(neuregulins,NRGs)家族包括4個成員,分別為NRG1、NRG2、NRG3和NRG4,這4個NRG家族成員均具有多個轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體[6~9]。人基因包含9個外顯子和8個內(nèi)含子,跨越基因組71,509 bp[8]。人基因能產(chǎn)生、、、和共5種轉(zhuǎn)錄異構(gòu)體,這些轉(zhuǎn)錄異構(gòu)體擁有相同的起始密碼子,由于選擇性剪接它們的終止密碼子位置不同,導(dǎo)致人基因的5種轉(zhuǎn)錄異構(gòu)體編碼5種不同的NRG4蛋白異構(gòu)體(NRG4A1、NRG4A2、NRG4B1、NRG4B2和NRG4B3)[10]。其中NRG4A1和NRG4A2具有完整的EGF結(jié)構(gòu)域和跨膜結(jié)構(gòu)域,定位于細(xì)胞膜,經(jīng)過ADAM/TACE型蛋白酶加工后,兩者位于膜外的EGF結(jié)構(gòu)域被釋放到細(xì)胞外,作為分泌因子參與機體的調(diào)控[8]。與NRG4A1和NRG4A2相比,其余3種NRG4異構(gòu)體(NRG4B1~3)缺失跨膜結(jié)構(gòu)域,EGF結(jié)構(gòu)域也不完整,均定位在細(xì)胞質(zhì)[11]。
與哺乳動物不同,雞()缺乏棕色脂肪組織。本實驗室前期研究顯示,雞腹部脂肪組織表達,并且發(fā)現(xiàn)東北農(nóng)業(yè)大學(xué)高脂系肉雞脂肪組織表達量是低脂系肉雞脂肪組織表達量的2.55倍[12]。目前人們對哺乳動物基因的基因組結(jié)構(gòu)、轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體都已有了深入研究,但對雞(chicken,)基因的基因組結(jié)構(gòu)、轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體還不甚了解。本文采用RACE(rapid-amplification of cDNA ends)和RT-PCR(reverse transcription-PCR)等技術(shù),對基因的基因組和轉(zhuǎn)錄本結(jié)構(gòu)進行了分析。
克隆載體pEASY-Blunt Simple和pEASY-T1 Simple、菌株Trans1-T1 Phage Resistant Chemically Competent Cell、Trans2K DNA Marker和Trans5K DNA Marker均購自北京全式金生物技術(shù)有限公司;AxyPrep DNA凝膠回收試劑盒購自美國Axygen公司;Phanta Max super-fidelity DNA polymerase 購自南京Vazyme公司;RNAiso Plus、SMARTer?RACE 5?/3?Kit和PrimeScriptTMRT reagent Kit with gDNA Eraser購自寶生物工程(大連)有限公司;FirstChoiceTMRLM-RACE Kit購自美國Thermo Fisher公司;5?/3?RACE Kit,2nd Generation購自德國Roche公司。腹部脂肪組織采自4周齡AA白羽肉雞(東北農(nóng)業(yè)大學(xué)阿城實習(xí)基地)。
根據(jù)NCBI數(shù)據(jù)庫中基因(NM_ 001030544.4)序列,利用Oligo 7軟件設(shè)計基因的RACE引物和RT-PCR引物(表1),由北京睿博興科生物技術(shù)有限公司合成。
取AA白羽肉雞腹部脂肪組織樣,置于研缽中,加入液氮充分研磨成粉末,采用RNAiso Plus試劑提取RNA。使用紫外分光光度計測定樣品總RNA在260 nm與280 nm的吸光度,根據(jù)兩者的比值(260/280)評價總RNA的質(zhì)量,并計算總RNA的濃度,分裝凍存于–80℃。
表1 本研究所用引物信息
按照SMARTer?RACE 5?/3?Kit、FirstChoiceTMRLM-RACE Kit和5?/3?RACE Kit,2nd Generation說明書分別擴增基因mRNA的5′和3′端。5′和3′RACE引物序列如表1所示。以雞腹部脂肪組織提取的混合RNA為模板,分別反轉(zhuǎn)錄獲得5?RACE-Ready cDNA和3?RACE-Ready cDNA。利用獲得的cDNA分別進行PCR擴增,反應(yīng)體系均為:PCR-Grade H2O 15.5 μL,2×SeqAmp Buffer 25.0 μL,SeqAmp DNA Polymerase 1.0 μL,5?或者3?RACE-Ready cDNA 2.5 μL,10×Universal Primer A Mix(UPM)(由試劑盒提供)5 μL,5?或者3?GSP 1 μL,總體積為50 μL。
基因5?和3?RACE的PCR反應(yīng)條件均為:94℃ 5 min;94℃ 30 s,72℃ 3 min,5個循環(huán);94℃ 30 s,70℃ 30 s,72℃ 3 min,5個循環(huán);94℃ 30 s,68℃ 30 s,72℃ 3 min,25個循環(huán);72℃ 5 min。5?和3?RACE的PCR產(chǎn)物經(jīng)過瓊脂糖凝膠電泳之后,進行切膠回收,使用AxyPrep DNA凝膠回收試劑盒對RACE-PCR產(chǎn)物進行凝膠純化。將純化的5?和3?RACE的PCR產(chǎn)物分別與pEASY-T1 Simple克隆載體連接,將連接產(chǎn)物轉(zhuǎn)化Trans1-T1感受態(tài)細(xì)胞后,涂布氨芐青霉素(Ampicillin,Amp)抗性LB平板,37℃過夜培養(yǎng),然后隨機挑選陽性菌落,由北京睿博興科生物技術(shù)有限公司進行測序。
RT-PCR用于新發(fā)現(xiàn)的外顯子和內(nèi)含子滯留的驗證以及CDS區(qū)克隆。取雞腹部脂肪組織總RNA (1 μg),按照PrimeScriptTMRT reagent Kit with gDNA Eraser試劑盒說明書,去除基因組DNA并反轉(zhuǎn)錄合成cDNA。以獲得的cDNA為模板進行PCR擴增,RT-PCR引物序列如表1所示。RT-PCR反應(yīng)體系為:2×Phanta Max Buffer 25 μL,dNTP Mix(10 mmol/L) 1 μL,上、下游引物(10 μmol/L)各2 μL,Phanta Max Super-Fidelity DNA Polymerase 1 μL,模板1~5 μL,加ddH2O至總體積為50 μL。反應(yīng)條件:95℃預(yù)變性3 min;95℃變性 15 s,60℃退火15 s,72℃延伸30 s,共35個循環(huán);72℃延伸5 min。RT-PCR產(chǎn)物經(jīng)過瓊脂糖凝膠電泳之后,進行切膠回收,使用AxyPrep DNA凝膠回收試劑盒對產(chǎn)物進行凝膠純化。將RT-PCR產(chǎn)物和pEASY-Blunt Simple克隆載體連接,將連接產(chǎn)物轉(zhuǎn)化Trans1-T1感受態(tài)細(xì)胞后,涂布Amp抗性LB平板,37℃過夜培養(yǎng),隨機挑選陽性菌落,由北京睿博興科生物技術(shù)有限公司進行測序。
利用UCSC(http://genome.ucsc.edu/)和NCBI(http:// www.ncbi.nlm.nih.gov)數(shù)據(jù)庫查詢基因序列;采用Oligo 7軟件進行引物設(shè)計;采用DNAMAN 6.0進行序列比對;采用Chromas查看測序峰圖;采用ORF Finder(https://www.ncbi.nlm.nih.gov/orffinder/)預(yù)測編碼蛋白;采用Signal IP-5.0(http://www.cbs. dtu.dk/services/SignalP/)預(yù)測分泌信號肽;采用TMHMM2.0(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測跨膜結(jié)構(gòu);采用SMART(http://smart.embl- heidelberg.de/)分析蛋白序列;使用ITB tools (http://itbtools.ba.itb.cnr.it/utrscan)分析多聚腺苷酸化信號(polyadenylation signal,PAS)。
為了確定mRNA轉(zhuǎn)錄本的5?端序列,取5只AA白羽肉雞腹部脂肪組織的混合RNA進行5?RACE分析。瓊脂糖電泳分析顯示,基因5?RACE擴增產(chǎn)物主要有3條帶,大小分別約為600 bp、500 bp和400 bp(圖1A)。將5?RACE擴增產(chǎn)物進行凝膠回收和克隆,共隨機挑選187個重組質(zhì)粒進行測序分析。測序結(jié)果與基因mRNA序列(NM_001030544.4)和基因組序列(NC_052541.1)比對發(fā)現(xiàn),這些5?RACE擴增產(chǎn)物序列與基因的外顯子3(E3)、E4和E5序列完全相同,但E3上游序列差異較大。根據(jù)E3上游序列的不同,將這些基因5?RACE擴增產(chǎn)物命名為(19個克隆)、(147個克隆)、(17個克隆)和(4個克隆)(圖1B)。與NM_001030544.4相比,本研究發(fā)現(xiàn)、和分別存在1個新的外顯子,大小分別是76 bp、85 bp和56 bp,按照NM_ 001030544.4的外顯子命名,本研究將新發(fā)現(xiàn)的這3個基因外顯子分別命名為E76、E85和E56。其中E85和E76位于E1的上游,E76的3?端與E85的5?端有38 bp的序列重疊,兩者為互斥外顯子(mutually exclusive exons,MEE)。E56是一個隱匿外顯子(cryptic exon),位于E2與E3之間的內(nèi)含子區(qū)。此外,本研究發(fā)現(xiàn)在和都存在內(nèi)含子1(I1)滯留,大小為194 bp。序列分析顯示,、、和的剪接都遵循GT-AG 法則。
圖1 雞NRG4基因5?RACE分析
A:基因5?RACE PCR擴增產(chǎn)物的瓊脂糖凝膠電泳分析。M: DL2000 DNA marker;泳道1:基因5?RACE PCR擴增片段;泳道2:陰性對照。B:基因5?RACE產(chǎn)物的外顯子分析。上面一排為基因NM_001030544.4外顯子分析結(jié)果;中間4排分別為4種不同5?RACE擴增產(chǎn)物的外顯子分析結(jié)果;最下面一排為5?RACE擴增產(chǎn)物序列在基因組上的位置;GSP1-R1為5?RACE的特異性引物。C:基因的轉(zhuǎn)錄起始位點分析?;騎SS在-123~+74范圍內(nèi)的分布頻率(%)。
測序分析發(fā)現(xiàn)具有54個轉(zhuǎn)錄起始位點(transcription start site,TSS),如圖1C所示,以NM_001030544.4的第一個堿基為+1,的TSS離散地分布在–123~+74(–123/+74)的范圍內(nèi)。其中E76有12個TSS,分布在(–123/–64)范圍內(nèi),導(dǎo)致E76大小在17~76 bp范圍內(nèi)變化;E85有9個TSS,分布在(–85/0)范圍內(nèi),導(dǎo)致E85大小在4~85 bp范圍內(nèi)變化;E1有33個TSS,分布在(+1/+74)范圍內(nèi),導(dǎo)致E1大小在2~75 bp范圍內(nèi)變化。
為了獲得完整mRNA轉(zhuǎn)錄本序列,取5只AA白羽肉雞腹部脂肪組織的混合RNA進行3?RACE分析。瓊脂糖電泳分析顯示,基因3?RACE的PCR擴增產(chǎn)物主要有3條帶,大小分別約為2000 bp、1500 bp和600 bp(圖2A)。將3?RACE擴增產(chǎn)物進行凝膠回收和克隆,共隨機挑選36個重組質(zhì)粒進行測序分析。測序分析結(jié)果顯示,基因有5種不同的3?RACE擴增產(chǎn)物,大小分別是2140 bp、553 bp、1458 bp、1449 bp和2422 bp,命名為(1個克隆)、(15個克隆)、(13個克隆)、(4個克隆)和(3個克隆)。
將3?RACE擴增產(chǎn)物序列與基因mRNA序列(NM_001030544.4)和基因組序列(NC_052541.1)進行比對,發(fā)現(xiàn)3?RACE擴增產(chǎn)物均包含基因E6和E7,且序列與NM_001030544.4的3?端序列完全相同,提示本研究已成功獲得基因mRNA 3?端序列,但是這些擴增產(chǎn)物的3?末端序列和長度差異較大,說明基因存在選擇多聚腺苷酸化(alternative polyadenylation,APA)。序列分析發(fā)現(xiàn)、和存在內(nèi)含子滯留,內(nèi)含子分別為I5和I7,大小分別是2068 bp和896 bp;的poly(A)加尾位點位于I5上,和的poly(A)加尾位點位于E8中部,和的poly(A)加尾位點位于E8末端(圖2B)。
圖2 雞NRG4基因3?RACE分析
A:基因3?RACE PCR擴增產(chǎn)物的瓊脂糖凝膠電泳分析。M:DL5000 DNA marker;泳道1:基因3?RACE PCR擴增片段;泳道2:陰性對照。B:基因3?RACE產(chǎn)物的外顯子分析。最上面一排為基因mRNA序列(NM_001030544.4)的外顯子分析結(jié)果,下面為5種不同3?RACE擴增產(chǎn)物序列的外顯子分析結(jié)果。GSP2-F1為3?RACE特異性引物。
5?RACE和3?RACE測序分析結(jié)果顯示,基因的一些轉(zhuǎn)錄本存在新外顯子(E76、E85和E56)和內(nèi)含子滯留(I1、I5和I7)。為驗證它們的存在,本研究跨內(nèi)含子設(shè)計了這些新外顯子和內(nèi)含子滯留的6對特異性檢測引物,引物位置如圖3A所示。以雞腹部脂肪組織總RNA為材料進行RT-PCR驗證。RT-PCR擴增、克隆及測序分析顯示:E76、E85、E56、I1、I5和I7經(jīng)RT-PCR擴增,條帶大小與預(yù)期相符,分別為294 bp、366 bp、123 bp、346 bp、219 bp和269 bp(圖3B),測序結(jié)果與RACE結(jié)果一致,說明基因確實存在外顯子E76、E85、E56及3個內(nèi)含子(I1、I5和I7)的滯留。在E85和I5的RT-PCR驗證中,除了擴增出預(yù)期大小的條帶外,都擴增出了一條額外條帶(圖3B)。測序分析顯示,在E85的RT-PCR驗證中擴增出的額外條帶為非特異性條帶,其序列與基因無關(guān),出現(xiàn)非特異擴增帶的主要原因是E85比較小,只有85 bp,難以設(shè)計高特異性的上游檢測引物。但值得注意的是,在I5的RT-PCR驗證中擴增出的額外條帶確實為基因轉(zhuǎn)錄本的一部分,該擴增產(chǎn)物包含I5,但是其E5外顯子的3?端缺失了79 bp序列,本研究將其命名為E5?外顯子,將該序列命名為(圖3C)。生物信息學(xué)分析發(fā)現(xiàn),在EST數(shù)據(jù)庫中有1個基因序列(BU348396),其3?端與完全相同,說明基因確實存在這樣一種3?末端序列。
圖3 雞NRG4基因新外顯子和內(nèi)含子滯留的RT-PCR鑒定
A:RT-PCR鑒定新外顯子和內(nèi)含子滯留的引物位置(箭頭所示)示意圖。由上到下分別鑒定E76、E85、E56、I1、I5和I7;虛線框代表引物預(yù)計擴增出的片段。B:RT-PCR鑒定新外顯子和內(nèi)含子滯留的瓊脂糖凝膠電泳分析。M:DL2000 DNA marker;泳道1~6依次為RT-PCR擴增E76、E85、E56、I1、I5和I7的瓊脂糖電泳圖,在鑒定I5的電泳圖中分子量大的條帶為,分子量小的條帶為,兩者均用紅色方框標(biāo)記。C:和基因mRNA序列(NM_001030544.4)外顯子分析結(jié)果。E5序列長度為150 bp,E5?序列長度71 bp。
整合5?RACE、3?RACE以及新外顯子和內(nèi)含子滯留的驗證結(jié)果,按照隨機組合排列,基因可能產(chǎn)生多達24種轉(zhuǎn)錄異構(gòu)體(圖4),本研究進一步利用ORF Finder對這24種潛在轉(zhuǎn)錄本的CDS進行了分析。結(jié)果提示,這些基因轉(zhuǎn)錄異構(gòu)體可能存在3種不同的CDS(CDS1、CDS2和CDS3),大小分別為258 bp、351 bp和198 bp。將這3個CDS分別編碼的蛋白命名為cNRG4-1、cNRG4-2和cNRG4-3。在24種潛在基因轉(zhuǎn)錄異構(gòu)體中,4種潛在異構(gòu)體擁有CDS1,16種潛在異構(gòu)體擁有CDS2,4種潛在異構(gòu)體擁有CDS3。CDS1、CDS2和CDS3的起始密碼子ATG均位于E3;CDS1和CDS3的終止密碼子位于I5,而CDS2的終止密碼子位于E7(圖4)。
基因的起始密碼子均位于E3,根據(jù)5?RACE擴增產(chǎn)物序列,基因存在4種5?UTR異構(gòu)體。其中所包含的5?UTR由E76、E2和部分E3組成,其5?UTR命名為;所包含的5?UTR由E85、E1、E2和部分E3組成,其5?UTR命名為;所包含的5?UTR由E1、I1、E2和部分E3組成,其5?UTR命名為;所包含的5?UTR由E1、I1、E2、E56和部分E3組成,其5?UTR命名為(圖1B)。這4種的5?UTR的最長和最短序列已提交GenBank,序列號分別為OP893938、OP893939、OP893940、OP893941、OP893942、OP893943、OP893944和OP893945。
根據(jù)3?RACE克隆測序結(jié)果和終止密碼子的位置,基因存在6種3?UTR異構(gòu)體,大小分別是2064 bp、384 bp、1289 bp、1280 bp、2184 bp和2045 bp。3?RACE擴增產(chǎn)物所包含的3?UTR由部分I5組成,其3?UTR命名為;所包含的3?UTR由部分E7和部分E8組成,其3?UTR命名為;所包含的3?UTR由部分E7和E8組成,其3?UTR命名為,與NM_001030544.4的3?UTR序列相同;所包含的3?UTR由部分E7、I7和部分E8組成,其3?UTR命名為;所包含的3?UTR由部分E7、I7和E8組成,其3?UTR命名為;所包含的3?UTR由部分I5組成,其3?UTR命名為(圖2B,圖3C)。這6個轉(zhuǎn)錄異構(gòu)體的3?UTR序列已提交GenBank,序列號分別為OP893946、OP893947、OP893948、OP893949、OP893950和OP893951。
基因轉(zhuǎn)錄本具有不同長度和序列的3?UTR,表明基因存在APA。與此相一致,ITB tools分析發(fā)現(xiàn),基因具有3個PAS,分別位于I5和E8,其中E8有兩個PAS(圖4)。根據(jù)PAS的位置,PAS分為編碼區(qū)PAS(coding region PAS,CR-PAS)和非編碼區(qū)PAS(untranslated region PAS,UTR-PAS)?;虻?個PAS分別為1個CR-PAS和2個UTR-PAS。和的PAS位于I5,導(dǎo)致編碼蛋白變??;另外4種3?UTR異構(gòu)體的PAS都位于E8上,均不影響基因的蛋白編碼。此外,基因的3個PAS都位于poly(A)加尾位點上游10~30核苷酸處,都具有六聚體AAUAAA或其相近變異體、下游的U/GU-rich元件和臨近剪接位點的CA(或UA)序列等。
由于基因轉(zhuǎn)錄異構(gòu)體數(shù)量眾多(24種),且轉(zhuǎn)錄本間序列差異較小,難以利用常規(guī)方法逐一加以鑒定。因此,本研究設(shè)計引物,以雞腹部脂肪組織的總RNA為材料,采用RT-PCR驗證了基因3種不同CDS。RT-PCR擴增結(jié)果顯示:利用CDS1特異擴增引物(CDS1-F/R)和CDS2特異擴增引物(CDS2-F/R)分別擴增出一條預(yù)期大小的特異條帶(258 bp和351 bp);利用CDS3擴增引物(CDS3-F/R)擴增出預(yù)期大小的兩條帶,一條包含CDS1的片段(321 bp)和一條包含CDS3的擴增片段(242 bp) (圖5A)。這些擴增產(chǎn)物的測序分析結(jié)果與預(yù)期完全一致,CDS1、CDS2和CDS3全長分別為258 bp、351 bp和198 bp,表明基因轉(zhuǎn)錄異構(gòu)體確實存在3種不同CDS(CDS1、CDS2和CDS3)。將這3個CDS分別編碼的蛋白命名為cNRG4-1、cNRG4-2和cNRG4-3。其中cNRG4-1蛋白異構(gòu)體包含85個氨基酸,cNRG4-2蛋白異構(gòu)體包含116個氨基酸,cNRG4-3蛋白異構(gòu)體包含65個氨基酸(圖5B)。cNRG4-2與NCBI數(shù)據(jù)庫中的cNRG4氨基酸序列(NP_001025715.2)完全相同,cNRG4-1和cNRG4-3是兩個新發(fā)現(xiàn)的cNRG4蛋白異構(gòu)體。cNRG4-1與人的6個NRG4蛋白異構(gòu)體(NP_612640.1、CAL35830.1、EAW99228.1、CAL35831.1、CAL35829.1和XP_047288140.1)同源性分別為68%、76%、77%、72%、65%和65%;與小鼠的3個NRG4蛋白異構(gòu)體(NP_114391.1、AAH34839.1和EDL25847.1)同源性分別為61%、74%和46%。cNRG4-3與人的6個NRG4蛋白異構(gòu)體同源性分別為73%、76%、77%、72%、73%和73%;與小鼠的3個NRG4蛋白異構(gòu)體同源性分別為81%、74%和78%?;?種CDS全長序列已提交GenBank,序列號分別為OP288945、OP288946和OP288947。
圖4 雞NRG4基因轉(zhuǎn)錄本結(jié)構(gòu)分析
基因24種潛在轉(zhuǎn)錄異構(gòu)體的CDS分析。這24種基因潛在轉(zhuǎn)錄異構(gòu)體共存在3種不同的CDS:CDS1、CDS2和CDS3。這3種CDS的起始密碼子均位于E3,CDS1和CDS3編碼的蛋白終止密碼子均位于I5,CDS2編碼的蛋白終止密碼子位于E7。3個星號(*)為本研究發(fā)現(xiàn)的3個PAS,其中1個位于I5,為CR-PAS,另外2個位于E8,均為UTR-PAS。
NRG4是作為前體合成的,前體NRG4通過蛋白酶水解后成為有活性的形式[4]。利用在線軟件Signal IP-5.0預(yù)測分析顯示,這3個cNRG4蛋白異構(gòu)體缺乏分泌蛋白的經(jīng)典分泌信號,這與人、小鼠NRG4蛋白分泌信號肽的分析結(jié)果一致。利用TMHMM2.0進行跨膜結(jié)構(gòu)分析顯示,cNRG4-1和cNRG4-2都存在一個跨膜螺旋結(jié)構(gòu),cNRG4-3沒有跨膜結(jié)構(gòu)。利用SMART進行結(jié)構(gòu)域分析,結(jié)果發(fā)現(xiàn)cNRG4-1和cNRG4-2都包含1個EGF結(jié)構(gòu)域、1個跨膜結(jié)構(gòu)域和1個與跨膜結(jié)構(gòu)域重疊的低復(fù)雜性區(qū)域(low-complexity regions,LCRs),其二者的區(qū)別在于跨膜結(jié)構(gòu)域后的蛋白長度不同,而cNRG4-3只包含一個EGF結(jié)構(gòu)域,沒有跨膜結(jié)構(gòu)域和低復(fù)雜性區(qū)域。
圖5 雞NRG4蛋白質(zhì)異構(gòu)體的鑒定與分析
A:基因3種不同CDS的 RT-PCR鑒定分析。M:DL2000 DNA marker;泳道1:CDS1的RT-PCR擴增片段;泳道2:CDS2的RT-PCR擴增片段;泳道3:CDS3的RT-PCR擴增片段。箭頭所指的條帶為目標(biāo)條帶。B:cNRG4蛋白異構(gòu)體的結(jié)構(gòu)域分析。LCRs:low-complexity regions,cNRG4-1全長有85個氨基酸(aa),其中8~46 aa為EGF結(jié)構(gòu)域,61~83 aa為跨膜結(jié)構(gòu)域(TM),61~76 aa為低復(fù)雜性區(qū)域(LCRs)。cNRG4-2全長116 aa,其中8~46 aa為EGF結(jié)構(gòu)域,61~83 aa為跨膜結(jié)構(gòu)域(TM),61~76 aa為低復(fù)雜性區(qū)域(LCRs)。cNRG4-3全長65 aa,其中8~46 aa為EGF結(jié)構(gòu)域。
本研究發(fā)現(xiàn)基因存在多個轉(zhuǎn)錄異構(gòu)體,這些轉(zhuǎn)錄異構(gòu)體編碼3個cNRG4蛋白異構(gòu)體。與本研究結(jié)果類似,人基因能產(chǎn)生5種轉(zhuǎn)錄異構(gòu)體和相對應(yīng)的5種蛋白異構(gòu)體(NRG4 A1、NRG4 A2、NRG4 B1、NRG4 B2和NRG4 B3)[11]。NRGs家族其他成員也普遍存在多轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體。例如,人基因由于選擇性轉(zhuǎn)錄起始位點和選擇性剪接能產(chǎn)生33種轉(zhuǎn)錄異構(gòu)體和6種蛋白異構(gòu)體(NRG1 I-VI)[6];人基因由于選擇性剪接能產(chǎn)生至少10種轉(zhuǎn)錄異構(gòu)體和2種蛋白異構(gòu)體(NRG2-α和NRG2-β)[7];人基因由于選擇性剪接能產(chǎn)生15種轉(zhuǎn)錄異構(gòu)體[9]。
在5?RACE測序分析中,本研究發(fā)現(xiàn)基因存在選擇性轉(zhuǎn)錄起始位點、互斥外顯子、隱匿外顯子和內(nèi)含子滯留現(xiàn)象,其轉(zhuǎn)錄本的5?端非常復(fù)雜,為了保證結(jié)果的準(zhǔn)確性和可靠性,本研究對187個5?RACE的PCR產(chǎn)物克隆質(zhì)粒進行了測序。而在3?RACE測序分析中發(fā)現(xiàn),基因mRNA的3?端比較簡單,只存在內(nèi)含子滯留和選擇性多聚腺苷酸化,因此本研究只對36個3?RACE的擴增產(chǎn)物的克隆質(zhì)粒進行了測序。本研究發(fā)現(xiàn),基因具有選擇性轉(zhuǎn)錄起始位點、選擇性剪接、選擇性多聚腺苷酸化以及內(nèi)含子滯留和隱匿外顯子,這導(dǎo)致基因存在多個轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體。人基因也具有多個轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體,但其造成的原因是選擇性剪接[11]。目前尚無報道其他動物基因存在選擇性轉(zhuǎn)錄起始位點、隱匿外顯子、內(nèi)含子滯留以及選擇性多聚腺苷酸化。此外,生物信息學(xué)分析顯示,基因5?UTR與人和小鼠基因5?UTR的序列同源性均低于45%,基因3?UTR與人和小鼠基因的3?UTR序列的同源性均低于40%。這些結(jié)果提示,雞與人和鼠等其他動物基因的表達調(diào)控機制不同。
本研究發(fā)現(xiàn)基因可以編碼3種蛋白異構(gòu)體(cNRG4-1、cNRG4-2和cNRG4-3)。研究顯示,人NRG4具有5種蛋白異構(gòu)體(NRG4 A1、NRG4 A2、NRG4 B1、NRG4 B2和NRG4 B3)[11]。其中cNRG4-1和cNRG4-2與人的NRG4 A型相似,具有完整的EGF結(jié)構(gòu)域和跨膜結(jié)構(gòu)域。人NRG4 A蛋白異構(gòu)體是目前研究最廣泛的,其定位于細(xì)胞膜,通過蛋白酶加工,釋放膜外EGF結(jié)構(gòu)域,分泌入血液,作為經(jīng)典配體發(fā)揮作用[5],本研究推測cNRG4-1和cNRG4-2與人NRG4 A類似,均定位于細(xì)胞膜,經(jīng)過酶切加工后釋放EGF結(jié)構(gòu)域,進入血液,通過結(jié)合靶細(xì)胞受體ErbB4,觸發(fā)下游信號通路。cNRG4-3蛋白異構(gòu)體是雞獨有的,其具有完整的EGF樣結(jié)構(gòu)域,但缺失跨膜結(jié)構(gòu)域。人NRG4 B蛋白異構(gòu)體具有2/3的EGF結(jié)構(gòu)域,缺失跨膜結(jié)構(gòu)域,定位于細(xì)胞內(nèi)[11]。由于cNRG4-3沒有跨膜結(jié)構(gòu)域,推測其可能定位于細(xì)胞質(zhì)或細(xì)胞核而發(fā)揮作用[4,13]。
本研究發(fā)現(xiàn)基因的基因組(NC_052541.1)大小為21,969 bp(Chr.10: 3,490,314~3,512,282),由11個外顯子和10個內(nèi)含子構(gòu)成。與基因mRNA序列(NM_001030544.4)相比,本研究發(fā)現(xiàn)了基因存在2個新外顯子和1個隱匿外顯子;基因5?端在基因組的位置向前延伸了123 bp(圖6)。
最近的研究表明,人和鼠的大多數(shù)基因并非只有1個TSS[14,15],而是具有一系列分布緊密的多個TSS,即選擇性轉(zhuǎn)錄起始位點,這一區(qū)域構(gòu)成一個TSS簇[16]。有研究將TSS簇根據(jù)TSS數(shù)目與分布特征分為2種類型:尖峰型,分布集中且具有單一、豐度較高的TSS,通常從一個固定位置開始轉(zhuǎn)錄,大多與TATA-box相關(guān)[17];寬峰型,具有多個豐度相似的鄰近TSS,離散分布于寬泛區(qū)域[14,16~18],可從多個位置開始轉(zhuǎn)錄,絕大多數(shù)與CpG島相關(guān)[17]。本研究發(fā)現(xiàn)基因具有多個TSS,離散地分布在基因組(–123/+74)。為了排除由于RNA降解和試劑盒差異等原因?qū)е禄虺霈F(xiàn)多個TSS的可能性,本研究嘗試了多個批次的新鮮實驗材料,試用了3種不同原理的RACE分析試劑盒,結(jié)果都證實基因確實存在選擇性TSS,基因TSS簇呈寬峰型。與此相一致,基因啟動子區(qū)存在一個1206 bp的CpG島(–1019/+186)[12]。人基因的結(jié)構(gòu)信息是通過生物信息學(xué)和RT-PCR擴增獲得的[11],人類基因是否存在選擇性轉(zhuǎn)錄起始位點還不清楚。選擇性轉(zhuǎn)錄起始點會導(dǎo)致基因轉(zhuǎn)錄本的5?UTR長度及其所包含調(diào)控元件的不同,這些調(diào)控元件如上游開放閱讀框(upstream open reading fragment,uORF)會影響mRNA穩(wěn)定性、翻譯效率和定位等[18]。推測選擇性TSS可能是基因表達的一個重要調(diào)控方式。
內(nèi)含子滯留最初在植物和病毒中被描述,后來發(fā)現(xiàn)哺乳動物的基因也存在內(nèi)含子滯留[19~22]。內(nèi)含子滯留在基因表達調(diào)控中發(fā)揮多種作用,不僅可以通過導(dǎo)致無義介導(dǎo)的mRNA降解來降低基因表達,還可以導(dǎo)致產(chǎn)生新的轉(zhuǎn)錄異構(gòu)體和蛋白異構(gòu)體[21,22]。CDS區(qū)的內(nèi)含子滯留會導(dǎo)致基因產(chǎn)生新的蛋白異構(gòu)體[23],5?UTR區(qū)的內(nèi)含子滯留會影響mRNA穩(wěn)定性和翻譯效率等[24,25];3?UTR區(qū)的內(nèi)含子滯留也能影響mRNA的穩(wěn)定性、翻譯效率和定位等[26,27]。本研究首次發(fā)現(xiàn)c基因存在內(nèi)含子滯留(I1、I5和I7),其中I1位于5?UTR區(qū),產(chǎn)生新的5?UTR異構(gòu)體(和);I5位于主CDS區(qū),導(dǎo)致產(chǎn)生了新的蛋白異構(gòu)體cNRG4-1和cNRG4-3;I7位于3?UTR區(qū)域,產(chǎn)生新的3?UTR(和)。I1和I7滯留并未影響蛋白編碼,推測它們會引入新的調(diào)控元件,從而實現(xiàn)基因表達的精細(xì)調(diào)控。
圖6 雞NRG4基因組結(jié)構(gòu)分析
圖上方為基因mRNA序列(NM_001030544.4)的基因組結(jié)構(gòu)。下方為本研究所確定的基因組結(jié)構(gòu),E76、E85和E56為本研究新發(fā)現(xiàn)的基因的3個新外顯子。
真核生物基因普遍具有多個PAS,APA是一個重要的轉(zhuǎn)錄后調(diào)控機制[28]。PAS分為CR-PAS和UTR-PAS,其中UTR-PAS最為常見[29],UTR-PAS產(chǎn)生具有不同3?UTR長度的轉(zhuǎn)錄異構(gòu)體[30];CR-PAS會導(dǎo)致基因編碼不同C端的蛋白異構(gòu)體,其中一些異構(gòu)體可能缺乏某些重要的功能域[31]。本研究首次發(fā)現(xiàn)基因存在APA,并同時具有UTR-PAS和CR-PAS。有研究報道,雞生長激素受體()基因和雞轉(zhuǎn)化生長因子β受體II()基因同時具有CR-PAS和UTR-PAS[32,33]。NRG4在動物體內(nèi)發(fā)揮著多種重要的作用,考慮到APA在轉(zhuǎn)錄后調(diào)控中的重要性,未來有必要探討APA在基因表達調(diào)控中的作用和機制。
下游開放閱讀框(downstream open reading fragment,dORFs)是真核生物基因中廣泛存在的一個轉(zhuǎn)錄后調(diào)節(jié)元件,它可以提高mRNA的翻譯效率[34~36]。本研究分析發(fā)現(xiàn)基因的3?UTR()有一個dORF,可以編碼一個由233個氨基酸組成的蛋白,其編碼區(qū)大于基因的編碼區(qū)。將該dORF的核苷酸序列進行BLAST分析,發(fā)現(xiàn)的dORF序列與兔()、白斑兔()、鵪鶉()、鴻雁()、黑天鵝()和紅鴨()等物種基因的mRNA同源性在78%以上,提示該dORF可能在基因的轉(zhuǎn)錄后調(diào)控中發(fā)揮重要作用。下一步有必要探究該dORF對基因表達的調(diào)控作用。
[1] Yang F, Li XN. Research progress of neuregulin 4 biological function., 2017, 69(3): 351–356.楊帆, 李曉南. 神經(jīng)調(diào)節(jié)蛋白4生物學(xué)功能的研究進展. 生理學(xué)報, 2017, 69(3): 351–356.
[2] Ledonne A, Mercuri NB. On the modulatory roles of neuregulins/ErbB signaling on synaptic plasticity., 2019, 21(1): 275.
[3] Dai YN, Zhu JZ, Fang ZY, Zhao DJ, Wan XY, Zhu HT, Yu CH, Li YM. A case-control study: association between serum neuregulin 4 level and non-alcoholic fatty liver disease., 2015, 64(12): 1667–1673.
[4] Wang GX, Zhao XY, Meng ZX, Kern M, Dietrich A, Chen ZM, Cozacov Z, Zhou DQ, Okunade AL, Su X, Li SM, Blüher M, Lin JD. The brown fat-enriched secreted factor Nrg4 preserves metabolic homeostasis through attenuation of hepatic lipogenesis., 2014, 20(12): 1436– 1443.
[5] Chen LL, Peng MM, Zhang JY, Hu X, Min J, Huang QL, Wan LM. Elevated circulating Neuregulin4 level in patients with diabetes., 2017, 33(4): e2870.
[6] Steinthorsdottir V, Stefansson H, Ghosh S, Birgisdottir B, Bjornsdottir S, Fasquel AC, Olafsson O, Stefansson K, Gulcher JR. Multiple novel transcription initiation sites for NRG1., 2004, 342(1): 97–105.
[7] Rimer M, Prieto AL, Weber JL, Colasante C, Ponomareva O, Fromm L, Schwab MH, Lai C, Burden SJ. Neuregulin-2 is synthesized by motor neurons and terminal Schwann cells and activates acetylcholine receptor transcription in muscle cells expressing ErbB4., 2004, 26(2): 271–281.
[8] Hayes NVL, Gullick WJ. The neuregulin family of genes and their multiple splice variants in breast cancer., 2008, 13(2): 205–214.
[9] Carteron C, Ferrer-Montiel A, Cabedo H. Characterization of a neural-specific splicing form of the human neuregulin 3 gene involved in oligodendrocyte survival., 2006, 119(Pt 5): 898–909.
[10] Hayes NVL, Newsam RJ, Baines AJ, Gullick WJ. Characterization of the cell membrane-associated products of the neuregulin 4 gene., 2008, 27(5): 715–720.
[11] Hayes NVL, Blackburn E, Smart LV, Boyle MM, Russell GA, Frost TM, Morgan BJT, Baines AJ, Gullick WJ. Identification and characterization of novel spliced variants of neuregulin 4 in prostate cancer., 2007, 13(11): 3147–3155.
[12] Guo YQ, Wang WJ, Gao ZH, Mu F, Xu HD, Li H, Wang N. Cloning, expression and promoter analysis of adipokinegene in chicken.,2021, 29(11): 2129–2138.郭亞琦, 王偉佳, 高智慧, 牟芳, 徐海冬, 李輝, 王寧. 雞脂肪細(xì)胞因子NRG4基因的克隆、表達及啟動子分析. 農(nóng)業(yè)生物技術(shù)學(xué)報, 2021, 29(11): 2129–2138.
[13] Pfeifer A. NRG4: an endocrine link between brown adipose tissue and liver., 2015, 21(1): 13–14.
[14] Haberle V, Stark A. Eukaryotic core promoters and the functional basis of transcription initiation., 2018, 19(10): 621–637.
[15] Forutan M, Ross E, Chamberlain AJ, Nguyen L, Mason B, Moore S, Garner JB, Xiang RD, Hayes BJ. Evolution of tissue and developmental specificity of transcription start sites in Bos taurus indicus., 2021, 4(1): 829.
[16] Mejía-Guerra MK, Li W, Galeano NF, Vidal M, Gray J, Doseff AI, Grotewold E. Core promoter plasticity between maize tissues and genotypes contrasts with predominance of sharp transcription initiation sites., 2015, 27(12): 3309–3320.
[17] Carninci P, Sandelin A, Lenhard B, Katayama S, Shimokawa K, Ponjavic J, Semple CAM, Taylor MS, Engstr?m PG, Frith MC, Forrest ARR, Alkema WB, Tan SL, Plessy C, Kodzius R, Ravasi T, Kasukawa T, Fukuda S, Kanamori-Katayama M, Kitazume Y, Kawaji H, Kai C, Nakamura M, Konno H, Nakano K, Mottagui-Tabar S, Arner P, Chesi A, Gustincich S, Persichetti F, Suzuki H, Grimmond SM, Wells CA, Orlando V, Wahlestedt C, Liu ET, Harbers M, Kawai J, Bajic VB, Hume DA, Haya-shizaki Y. Genome-wide analysis of mammalian promoter architecture and evolution., 2006, 38(6): 626–635.
[18] Thieffry A, López-Márquez D, Bornholdt J, Malekroudi MG, Bressendorff S, Barghetti A, Sandelin A, Brodersen P. PAMP-triggered genetic reprogramming involves wides-pread alternative transcription initiation and an immediate transcription factor wave., 2022, 34(7): 2615– 2637.
[19] Braunschweig U, Barbosa-Morais NL, Pan Q, Nachman EN, Alipanahi B, Gonatopoulos-Pournatzis T, Frey B, Irimia M, Blencowe BJ. Widespread intron retention in mammals functionally tunes transcriptomes., 2014, 24(11): 1774–1786.
[20] Hammarskj?ld ML. Regulation of retroviral RNA export., 1997, 8(1): 83–90.
[21] Ner-Gaon H, Halachmi R, Savaldi-Goldstein S, Rubin E, Ophir R, Fluhr R. Intron retention is a major phenomenon in alternative splicing in arabidopsis., 2004, 39(6): 877–885.
[22] Rekosh D, Hammarskjold ML. Intron retention in viruses and cellular genes: detention, border controls and passports., 2018, 9(3): e1470.
[23] Marquez Y, H?pfler M, Ayatollahi Z, Barta A, Kalyna M. Unmasking alternative splicing inside protein-coding exons defines exitrons and their role in proteome plasticity., 2015, 25(7): 995–1007.
[24] Tahmasebi S, Jafarnejad SM, Tam IS, Gonatopoulos- Pournatzis T, Matta-Camacho E, Tsukumo Y, Yanagiya A, Li WC, Atlasi Y, Caron M, Braunschweig U, Pearl D, Khoutorsky A, Gkogkas CG, Nadon R, Bourque G, Yang XJ, Tian B, Stunnenberg HG, Yamanaka Y, Blencowe BJ, Giguère V, Sonenberg N. Control of embryonic stem cell self-renewal and differentiation via coordinated alternative splicing and translation of YY2., 2016, 113(44): 12360–12367.
[25] Weatheritt RJ, Sterne-Weiler T, Blencowe BJ. The ribosome-engaged landscape of alternative splicing., 2016, 23(12): 1117–1123.
[26] Sun SY, Zhang Z, Sinha R, Karni R, Krainer AR. SF2/ASF autoregulation involves multiple layers of post- transcriptional and translational control., 2010, 17(3): 306–312.
[27] Thiele A, Nagamine Y, Hauschildt S, Clevers H. AU-rich elements and alternative splicing in the beta-catenin 3'UTR can influence the human beta-catenin mRNA stability., 2006, 312(12): 2367–2378.
[28] Nourse J, Spada S, Danckwardt S. Emerging roles of RNA 3'-end cleavage and polyadenylation in pathogenesis, diagnosis and therapy of human disorders., 2020, 10(6): 915.
[29] Chen W, Jia Q, Song YF, Fu HH, Wei G, Ni T. Alternative polyadenylation: methods, findings, and impacts., 2017, 15(5): 287–300.
[30] Jambhekar A, Derisi JL. Cis-acting determinants of asymmetric, cytoplasmic RNA transport., 2007, 13(5): 625–642.
[31] Tian B, Manley JL. Alternative polyadenylation of mRNA precursors., 2017, 18(1): 18–30.
[32] Lau JS, Yip CW, Law KM, Leung FC. Cloning and chara-cterization of chicken growth hormone binding protein (cGHBP)., 2007, 33(1): 107–121.
[33] Ning BL, Huang JX, Xu HD, Lou YQ, Wang WS, Mu F, Yan XH, Li H, Wang N. Genomic organization, intragenic tandem duplication, and expression analysis of chicken TGFBR2 gene., 2022, 101(12): 102169.
[34] Wu QS, Wright M, Gogol MM, Bradford WD, Zhang N, Bazzini AA. Translation of small downstream ORFs enhances translation of canonical main open reading frames., 2020, 39(17): e104763.
[35] Bazzini AA, Johnstone TG, Christiano R, Mackowiak SD, Obermayer B, Fleming ES, Vejnar CE, Lee MT, Rajewsky N, Walther TC, Giraldez AJ. Identification of small ORFs in vertebrates using ribosome footprinting and evolu-tionary conservation., 2014, 33(9): 981–993.
[36] Dodbele S, Wilusz JE. Ending on a high note: downstream ORFs enhance mRNA translational output., 2020, 39(17): e105959.
Characterization of the genomic and transcriptional structure of chickengene
Zhihui Gao1,2,3, Jiaxin Huang1,2,3, Haoyu Luo1,2,3, Haidong Xu1,2,3, Ming Lou1,2,3, Bolin Ning1,2,3, Xiaoxu Xing1,2,3, Fang Mu1,2,3, Hui Li1,2,3, Ning Wang1,2,3
Neuregulin 4 (NRG4) is an important adipocytokine, which plays crucial roles in maintaining energy balance, regulating glucose and lipid metabolism, and preventing non-alcoholic fatty liver disease in mammals. At present, the genomic organization, transcript and protein isoforms of humangene have been fully explored. Previous studies in our laboratory have shown that thegene is expressed in chicken adipose tissue, but the chickengenomic structure, transcript and protein isoforms are still unknown. To this end, in this study, the genomic and transcriptional structure of thegene were systematically investigated using rapid amplification of cDNA ends (RACE) and reverse transcription-polymerase chain reaction (RT-PCR). The results showed thatthe coding region (CDS) of thegene was small, but it had a very complextranscriptional structure characterized by multiple transcription start sites, alternative splicing, intron retention, cryptic exons, and alternative polyadenylation, thus leading to production of four 5?UTR isoforms (,,, and) and six 3?UTR isoforms (,,,,, and)of thegene. Thegene spanned 21,969 bp of genomic DNA (Chr.10:3,490,314~3,512,282) and consisted of 11 exons and 10 introns. Compared withthegene mRNA sequence (NM_001030544.4), two novel exons and one cryptic exon of thegene were identified in this study. Bioinformatics analysis, RT-PCR, cloning and sequencing analysis showed that thegene could encode three protein isoforms (cNRG4-1, cNRG4-2 and cNRG4-3). This studylays a foundation for further research on the function and regulation of thegene.
chicken; NRG4; genomic structure; transcript isoform; protein isoform
2023-01-03;
2023-04-04;
2023-04-19
國家自然科學(xué)基金項目(編號:31872346)和國家肉雞產(chǎn)業(yè)技術(shù)體系(編號:CARS-41)資助[Supported by the National Natural Science Foundation of China (No. 31872346) and the China Agriculture Research System (No. CARS-41)]
高智慧,在讀碩士研究生,專業(yè)方向:動物遺傳育種與繁殖。E-mail: gaozhihui@neau.edu.cn
王寧,博士,教授,博士生導(dǎo)師,研究方向:動物遺傳育種與繁殖。E-mail: wangning@neau.edu.cn
10.16288/j.yczz.23-001
(責(zé)任編委: 趙要風(fēng))