陳 磊,倪文浩,李雯雯,李欣毅,李文蓉
(1.新疆畜牧科學院 生物技術研究所,農業(yè)部草食家畜繁育生物技術重點開放實驗室,自治區(qū)重點實驗室,烏魯木齊 830000;2.新疆生產建設兵團第二中學,烏魯木齊 830000)
中國美利奴羊是中國于 1985 年育成的第一個毛用細毛綿羊品種,具有毛叢密度高、羊毛細長而彎曲和凈毛量高的特點。目前,羊毛纖維產量已經占世界纖維原料的 1.9%[1],是細毛羊主要的高附加值產品,具有重要的經濟價值。中國雖是世界羊毛的生產大國,但優(yōu)質細毛羊的羊毛產量和品質仍遠落后于養(yǎng)羊業(yè)發(fā)達國家,主要原因是細毛羊優(yōu)良品種選育擴繁和羊毛質量控制體系滯后。傳統(tǒng)的綿羊育種方法雖然能夠改良和提升羊毛產量和品質,但周期長、進展緩慢,而運用分子育種技術在篩選獲得與細毛羊毛囊發(fā)育相關功能基因的基礎上,進一步闡明其對綿羊毛囊發(fā)育和毛品質形成的影響,對推動細毛羊品種選育和提高中國優(yōu)質細毛羊羊毛品質具有重要意義。
可變剪接(或選擇性剪接, Alternative splicing)是指基因的 mRNA 前體通過不同的剪接方式(選擇不同的剪接位點)拼接產生不同的mRNA剪接異構體,是生物體內一種普遍存在的調控方式[2-3]。同時,可變剪接是調節(jié)基因表達和產生蛋白質組多樣性的重要機制。可變剪接多發(fā)生在受體、信號傳導通路、轉錄因子等參與信號轉導和表達調節(jié)的基因上,對個體分化發(fā)育、凋亡和細胞興奮等生理過程的精確調控發(fā)揮重要作用[4-6]。此外,它也是導致真核生物基因和蛋白質數(shù)量較大差異的重要原因。已有研究發(fā)現(xiàn),基因可變剪接發(fā)生在動物神經系統(tǒng)、免疫系統(tǒng)、肌肉和毛囊的生長發(fā)育過程中均具有關鍵的生物學功能[7-11]。
TGFβ2是TGF-β超家族成員之一,在毛囊形態(tài)發(fā)生、發(fā)育和毛囊周期性調控中發(fā)揮重要的生物學功能。Chuong等[12]研究發(fā)現(xiàn) TGFβ2 在毛囊基板和凝集簇中表達,能夠誘導胚胎間充質中真皮凝集簇的形成,Soma等[13-14]研究發(fā)現(xiàn) TGFβ2 能夠抑制毛囊毛干的延長,誘導毛囊發(fā)生退行期的形態(tài)學改變,同時,免疫組化分析發(fā)現(xiàn) TGFβ2 在毛囊真皮乳頭、外根鞘、毛球和毛母質細胞中均表達,且在毛囊生長期—退行期過渡階段, TGFβ2 在毛球內的表達具有特異性,調控毛囊發(fā)育和毛囊周期性生長過程[15-17]。此外, TGFβ2 基因敲除小鼠模型發(fā)現(xiàn),單拷貝失活的小鼠毛囊數(shù)量下降,而 TGFβ2 雙敲除小鼠毛囊的形成和生長發(fā)育受到嚴重影響[18]。由此可見, TGFβ2 在調控動物毛囊生長發(fā)育和周期性循環(huán)過程中發(fā)揮重要作用,但目前綿羊 TGFβ2 基因序列結構和生物學特性尚不清楚,該基因在調控毛囊發(fā)生和發(fā)育中的作用機制鮮有報道。本研究對綿羊 TGFβ2 其剪切體CDS進行克隆,利用生物信息學軟件對TGFβ2及其剪切體蛋白的結構和功能進行分析,闡明其生物學特征,為深入研究 TGFβ2 在綿羊毛囊生長發(fā)育過程中的作用及其表達調控提供理論基礎。
綿羊為新疆畜牧科學院綿羊中心羊場的2~3 歲中國美利奴羊,通過同期發(fā)情和人工授精技術分別采集中國美利奴羊妊娠期毛囊發(fā)育起始階段[第 55 天(D55)]、初級毛囊形成階段[第 75 天(D75)]、次級毛囊形成階段[第85天(D85)]、次級獲得性毛囊形成階段[第 105 天(D105)]和毛發(fā)生長成熟階段[第135 天(D135)]各 3 只胎羊體側皮膚組織樣本,分別置于凍存管中,保存在液氮中,備用。隨機挑選妊娠期第 85 天的 3 只中國美利奴羊體側皮膚組織樣本為模板,進行綿羊 TGFβ2基因克隆。
Trizol試劑,Zero Blunt○RTOPO○RPCR cloning kit購自Life Technology公司;PrimeSTAR○RHS DNA聚合酶,限制性內切酶,T4DNA連接酶購自TAKARA公司;反轉錄試劑盒,感受態(tài)細胞DH5α,質粒提取試劑盒,膠回收試劑盒購自全式金科技有限公司;其他試劑為分析純產品。
參照TRIzol Reagent操作步驟分別提取中國美利奴羊體側皮膚組織總RNA,10 g/L非變性瓊脂糖凝膠電泳檢測其完整性,利用Nandrop 2000 核酸蛋白分析儀測定RNA的質量濃度,按照反轉錄酶試劑盒說明進行cDNA合成。
根據(jù)GenBank中的綿羊 TGFβ2基因序列(XM_004013602)設計引物。上游引物:5′-GTCCGGATCCATGCACTACTGTGTGTTGA- GCG -3′(下劃線為BamHⅠ酶切位點);下游引物:5′- CCTGAAGCTTTTAGCTGCATTTGCAAGACTTGAC-3′(下劃線為Hind Ⅲ酶切位點),引物由上海生工生物工程股份有限公司合成。
將 3 只中國美利奴羊皮膚組織總 RNA 等量混合,反轉錄成 cDNA,以 cDNA 為模板進行PCR擴增,反應體系:cDNA模板 1.0 μL,Premix PrimeSTAR○RHS聚合酶25.0 μL,上、下游引物(10 mol/mL)各1.0 μL,滅菌去離子水 22.0 μL。反應條件:95 ℃ 5 min;95 ℃ 10 s,58 ℃ 15 s,72 ℃ 1.0 min,35 個循環(huán);72 ℃ 5 min。PCR 反應結束后取 6.0 μL PCR產物進行瓊脂糖凝膠電泳檢測。利用 DNA 膠回收試劑盒純化回收PCR 產物,隨后對 PCR 回收產物和 PCRTMBlunt Ⅱ-TOP○R克隆載體進行雙酶切,利用 T4連接酶進行連接反應,并將連接產物轉化至感受態(tài)細胞 DH5α 中,將細胞懸液涂于含有卡那霉素的 LB 固體培養(yǎng)基上,37 ℃ 培養(yǎng)箱中培養(yǎng) 16 h。挑取培養(yǎng)皿上的單克隆接種于含有卡那霉素的液體培養(yǎng)基中,培養(yǎng)過夜。利用質粒小型提取試劑盒提取質粒,對重組質粒進行雙酶切鑒定,將鑒定的陽性質粒送上海生工生物工程股份有限公司測序。
使用DNAstar軟件進行克隆序列的拼接和各物種同源性分析;利用ProtParam(http://us.expasy.org/tools/protparam.html)分析綿羊TGFβ2氨基酸的理化性質[19];利用TMHMM server 2.0 預測綿羊TGFβ2蛋白的跨膜結構域[20];利用SignalP 4.0 軟件預測綿羊TGFβ2蛋白的信號肽;利用在線軟件Protcale(http://web.expasy.org/protscale/)進行綿羊TGFβ2蛋白親水性/疏水性分析;利用NetPhos分析蛋白質磷酸化位點;利用NetNGlyc分析蛋白質糖基化位點;使用Mega 6.0 軟件構建 8 個物種TGFβ2的系統(tǒng)進化樹;利用PSORT II Prediction預測蛋白質的亞細胞定位;利用SOPMA軟件(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測綿羊TGFβ2蛋白的二級結構;采用Phyre 2.0 軟件http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)進行綿羊TGFβ2蛋白的三級結構預測[21]。
利用Trizol提取3只中國美利奴羊總RNA,非變性瓊脂糖凝膠電泳檢測得到28 S、18 S和5 S 3條帶(圖略),Nandrop分光光度計檢測吸光度OD260nm/OD280nm為1.9~2.0,表明總RNA完整性較好,無蛋白質或DNA污染。利用設計的特異性引物進行PCR擴增,擴增產物經10 g/L瓊脂糖凝膠電泳檢測,獲得1 200 bp左右清晰且特異性好的DNA片段(圖1),可以進行后續(xù)試驗。
M.DNA marker 100 bp;1.PCR 產物 Product of PCR
圖1綿羊TGFβ2基因PCR擴增結果
Fig.1PCRamplificationresultofsheepTGFβ2gene
將純化回收獲得的 PCR 產物轉化至 DH5α感受態(tài)細胞,挑取單菌落培養(yǎng)后提取質粒,利用 TGFβ2 基因 CDS 特異性引物鑒定重組質粒,獲得約 1 200 bp 的插入片段(圖2),與預期結果相符,測序后獲得綿羊 TGFβ2 基因 CDS序列全長1 329 bp,編碼 442 個氨基酸;另發(fā)現(xiàn) 2 個可變剪切體TGFβ2-AS1和TGFβ2-AS2,與主轉錄本TGFβ2相比,可變剪切體TGFβ2-AS1和 TGFβ2-AS2分別編碼 331 和 414 個氨基酸, TGFβ2-AS1 缺失全部的第二外顯子序列和第六外顯子的 115 個堿基, TGFβ2-AS2 僅缺失第二外顯子(圖3)。此外,物種間的核苷酸序列相似性分析發(fā)現(xiàn),克隆獲得的 TGFβ2 基因 CDS 與人類、小鼠、大鼠、牛、雞、狗、豬和斑馬魚的相似性分別為 94.28%、83.37%、88.71%、92.85%、79.53%、94.51%、94.81%和 67.80%,表明 TGFβ2 基因在各物種間具有較高的相似性。
M.DNA marker 100 bp;1~8.菌落PCR 產物 Product of colony PCR
圖2綿羊TGFβ2基因菌落PCR擴增結果
Fig.2ColonyPCRamplificationresultofsheepTGFβ2gene
2.3.1 理化性質分析 利用Protparam軟件對綿羊TGFβ2及其剪切體 TGFβ2-AS1和 TGFβ2-AS2的理化性質進行分析,結果發(fā)現(xiàn):綿羊TGFβ2蛋白分子質量為50 550.99 ku,理論等電點為8.74,TGFβ2-AS1蛋白分子質量為37 672.38 ku,理論等電點為 7.60,TGFβ2-AS2蛋白分子質量為 47 691.71 ku,理論等電點為 8.82,綿羊TGFβ2及其剪切體TGFβ2-AS1和 TGFβ2-AS2蛋白均由 20 種基本氨基酸組成(圖3),其中:主轉錄本TGFβ2的氨基酸組成中絲氨酸(10.2%)含量最高,色氨酸(1.1%)最低,帶正電荷的殘基 59個,帶負電荷的殘基 49個,蛋白的平均親水系數(shù)為 -0.406; TGFβ2-AS1蛋白氨基酸組成中亮氨酸(9.7%)含量最高,色氨酸(0.9%)最低,帶正電荷的殘基 39個,帶負電荷的殘基 38個,蛋白的平均親水系數(shù)為-0.217;TGFβ2-AS2蛋白的氨基酸組成中亮氨酸(9.9%)含量最高,色氨酸(1.2%)最低,帶正電荷的殘基 58個,帶負電荷的殘基 48個,蛋白的平均親水系數(shù)為 -0.471 。
2.3.2 親水性/疏水性分析 如圖4所示,綿羊TGFβ2及其剪切體 TGFβ2-AS1和 TGFβ2-AS2第8位丙氨酸疏水性最強(最高分值2.856);綿羊TGFβ2第 326 位精氨酸親水性最強(最低分值為-3.622 ),TGFβ2-AS1第 94 位絲氨酸親水性最強(最低分值為 -3.178 ), TGFβ2-AS2第298 位精氨酸親水性最強(最低分值為-3.622 )。
紅色下劃線表示信號肽序列,綠色下劃線表示跨膜區(qū) Red underline indicates signal peptide sequence,green underline indicates TGFβ2 protein transmembrane domains
圖3綿羊TGFβ2及其剪切體氨基酸序列分析
Fig.3TGFβ2anditssplicedvariantaminoacidsequencesinsheep
2.3.3 磷酸化與糖基化位點分析 利用 NetPhos 3.1 Server 軟件分析發(fā)現(xiàn),綿羊TGFβ2蛋白有 33 個絲氨酸, 12 個蘇氨酸和 7 個酪氨酸; TGFβ2-AS1 有 22 個絲氨酸, 8 個蘇氨酸和 7 個酪氨酸;TGFβ2-AS2 有 30 個絲氨酸,10 個蘇氨酸和 7 個酪氨酸。根據(jù) NetNGlyc 1.0 Server 分析表明,綿羊TGFβ2及其剪切體均有 2 個糖基化位點。
2.3.4 信號肽及蛋白跨膜區(qū)分析 運用SignalP server 4.1對綿羊TGFβ2及其剪切體 TGFβ2-AS1和 TGFβ2-AS2進行信號肽分析,結果表明,均有1 個信號肽區(qū)域,位于 1~20 位氨基酸(圖3);同時,利用TMHMM server 2.0軟件進行跨膜結構域分析,綿羊TGFβ2及其剪切體 TGFβ2-AS1和 TGFβ2-AS2均為單跨膜蛋白(圖3),即綿羊TGFβ2 1~4位氨基酸為胞內部分,5~27 位氨基酸為跨膜螺旋部分,28~442 位氨基酸為胞外部分;綿羊 TGFβ2-AS1 1~4 位氨基酸為胞內部分, 5~27 位氨基酸為跨膜螺旋部分,28~331 位氨基酸為胞外部分;綿羊 TGFβ2-AS2 1~4 位氨基酸為胞內部分,5~27 位氨基酸為跨膜螺旋部分,28~414 位氨基酸為胞外部分。
2.3.5 亞細胞定位 根據(jù) PSORT II Prediction 預測分析發(fā)現(xiàn),綿羊TGFβ2和 TGFβ2-AS2 在細胞中的定位結果是一致的,主要在胞外(44.4%)和細胞核(44.4%)中發(fā)揮作用,其余在線粒體中(11.1%)發(fā)揮作用, TGFβ2-AS1 主要在胞外(44.4%)發(fā)揮作用,少量作用于細胞質(22.2%)、線粒體(22.2%)和細胞核(11.1% )。
2.3.6 蛋白高級結構預測 綿羊TGFβ2及其剪切體 TGFβ2-AS1和 TGFβ2-AS2蛋白均由α-螺旋、延伸、β-折疊和無規(guī)則卷曲 4 種結構組成,其中綿羊TGFβ2各種結構所占比例分別為 38.69%、 16.74%、 8.14%和 36.43%, TGFβ2-AS1為 46.22%、 16.62%、 7.25%和 29.91%, TGFβ2-AS2為 39.13%、 16.43%、 8.70%和 35.75%,其中α-螺旋主要分布在位于細胞內的氨基酸兩端。此外,蛋白三級結構分析發(fā)現(xiàn)(圖 5),綿羊TGFβ2及其剪切體均存在α-螺旋、β-折疊和disordred區(qū)域,其中綿羊TGFβ2蛋白存在 7 個α-螺旋區(qū)和 15 個β-折疊區(qū), TGFβ2-AS1蛋白存在 5 個α-螺旋區(qū)和 13 個β-折疊區(qū), TGFβ2-AS2蛋白存在 6 個α-螺旋區(qū)和 16 個β-折疊區(qū)。
圖4 綿羊TGFβ2及其剪切體蛋白親水性分析Fig.4 Analysis of hydrophobicity sheep TGFβ2 and its spliced variant protein
圖5 綿羊TGFβ2及其剪切體蛋白三級結構預測Fig.5 Prediction of tertiary structure of sheep TGFβ2 and its spliced variant protein
從NCBI數(shù)據(jù)庫下載人類、小鼠、大鼠、牛、雞、狗、豬和斑馬魚8個物種的 TGFβ2基因編碼蛋白序列,采用MegAlign 6.0軟件進行蛋白同源性分析,結果發(fā)現(xiàn),綿羊 TGFβ2基因編碼蛋白與上述物種具有較高的同源性,綿羊TGFβ2氨基酸序列與人類、小鼠、大鼠、牛、雞、狗、豬和斑馬魚的同源性分別為 98.42%、90.27%、 95.02%、92.85%、83.48%、94.51%、94.81%和 67.80%。同時, TGFβ2編碼蛋白的系統(tǒng)進化樹分析發(fā)現(xiàn),綿羊與人類在系統(tǒng)進化樹中的距離最近,與斑馬魚的距離最遠(圖6),提示綿羊 TGFβ2基因可能與人類具有相似的分子進化模式,可能具有相似的分子功能。
圖6 9個物種TGFβ2蛋白系統(tǒng)進化樹Fig.6 Phylogenetic tree constructed for TGFβ2 protein of 9 species
綿羊毛囊的發(fā)育始于胚胎形成時期,與毛囊發(fā)育相關的功能基因調控羊毛的形態(tài)學發(fā)生和毛品質性狀的形成[22-26]。 TGFβ2基因在毛囊生長發(fā)育和周期調控過程中具有重要作用,是調控毛囊形成、基板向下生長和毛品質性狀的重要候選功能基因[16,27-28],然而,目前該基因對綿羊毛囊發(fā)育和周期性調控的分子功能鮮有報道,完整的綿羊 TGFβ2基因編碼區(qū)全長序列目前仍尚未獲得。本試驗利用RT-PCR法首次克隆獲得綿羊 TGFβ2基因及其剪切體 TGFβ2-AS1和 TGFβ2-AS2的全長CDS, TGFβ2基因CDS全長 1 329 bp,其剪切體 TGFβ2-AS1和 TGFβ2-AS2分別缺失 333 和 84 個核苷酸, CDS全長分別為 996和 1 245 bp。綿羊 TGFβ2基因與毛囊周期性轉導和毛囊真皮乳頭細胞凝集性發(fā)生的密切關系[29-30],使人們日益重視該基因在綿羊毛囊生長發(fā)育過程中的作用,但目前針對 TGFβ2基因及其可變剪切體調控綿羊毛囊發(fā)育的分子機制研究尚未開展,同時,雖然NCBI數(shù)據(jù)庫中有人類和小鼠 TGFβ2基因的一個可變剪接形式,但其對生物體生長發(fā)育的作用機制尚未闡明, TGFβ2及其可變剪切體的作用機制仍有待于深入分析。
可變剪切是導致蛋白質功能多樣性的重要原因,其在調控毛囊生長發(fā)育過程中具有重要作用。已有研究表明,F(xiàn)GF5及其剪切體在毛囊真皮乳頭細胞中相互拮抗調控毛囊生長發(fā)育和周期性轉導過程[31],同時,角蛋白相關蛋白及其剪切體在調控細毛羊毛品質性狀形成過程中也發(fā)揮重要作用[32-33]。由此可知,基因可變剪切的發(fā)生能夠直接影響基因的功能和作用方式,它們在調控毛囊的生長發(fā)育過程中發(fā)揮重要功能。本試驗首次克隆獲得綿羊 TGFβ2基因及其剪切體編碼區(qū)全長序列,但目前 TGFβ2基因及其剪切體在綿羊毛囊生長發(fā)育和毛囊周期發(fā)生過程中的生物學功能仍知之甚少,在本研究的基礎上深入開展 TGFβ2基因及其剪切體在毛囊類細胞中的表達規(guī)律、分子功能和信號網絡調控等方面的研究將為闡明毛囊生長發(fā)育的分子調控機制奠定理論基礎。
綿羊TGFβ2及其剪切體TGFβ2-AS1和 TGFβ2-AS2蛋白分別編碼 442、331 和 414個氨基酸,均屬于I型跨膜蛋白,蛋白結構預測結果表明,TGFβ2及其剪切體蛋白均含有 1 個信號肽區(qū)域和 1 個跨膜結構區(qū)域。說明TGFβ2及其剪切體 TGFβ2-AS1和 TGFβ2-AS2蛋白是分泌性蛋白,在行使信號功能過程中發(fā)揮重要作用;另一方面,該蛋白的單跨膜結構為配體特異性結合相關受體提供分子基礎。蛋白二級結構預測表明,綿羊TGFβ2及其剪切體蛋白均由α-螺旋、延伸、β-折疊和無規(guī)則卷曲 4 種結構組成,但這 4 種結構所占比例各不相同,已有研究發(fā)現(xiàn), TGFβ2氨基酸序列中6個高度保守的半胱氨酸(Cys)能夠通過鏈內的二硫鍵連接β片層結構形成一個半胱氨酸結,其在受體與配體的識別和作用方式上具有重要作用[34],由此推測TGFβ2及其剪切體β片層結構上存在的差異可能影響TGFβ2及其剪切體與受體的作用方式,從而在生物體內行使不同的生物學功能。同時,蛋白三級結構預測發(fā)現(xiàn),綿羊TGFβ2及其剪切體蛋白空間結構比例亦存在差異,表明空間構想的變化可能與蛋白功能的多樣性密切相關。此外,綿羊TGFβ2蛋白序列與人類、小鼠、大鼠、牛、豬和狗等哺乳動物具有較高的同源性,表明 TGFβ2基因可能是由同一個祖先基因遺傳進化而來。其中,綿羊TGFβ2編碼的氨基酸序列與人類的序列相似性極高(98.42%),這與系統(tǒng)進化樹的結果相一致, 推測綿羊 TGFβ2基因可能存在與人類 TGFβ2基因相似的生物學功能。本試驗對綿羊TGFβ2及其剪切體蛋白信號肽、跨膜結構和蛋白二、三級結構的預測分析為進一步闡明其在毛囊生長和毛品質形成中的分子調控機制提供研究基礎。
本試驗首次克隆獲得綿羊TGFβ2及其剪切體 TGFβ2-AS1 和 TGFβ2-AS2 的 CDS,序列分析發(fā)現(xiàn) TGFβ2 基因 CDS 在物種間存在高度保守性。對TGFβ2及其剪切體蛋白理化性質、跨膜結構、信號肽以及蛋白高級結構進行預測分析,為進一步研究TGFβ2在綿羊毛囊發(fā)育和毛品質性狀形成中的作用機制提供理論基礎。