趙學(xué)亮,馮陳晨,孫 柯,王夢雅,王文龍*
(1.內(nèi)蒙古農(nóng)業(yè)大學(xué)獸醫(yī)學(xué)院/農(nóng)業(yè)部動物疾病臨床診療技術(shù)重點實驗室,內(nèi)蒙古呼和浩特 010018;2.內(nèi)蒙古農(nóng)業(yè)大學(xué)動物科學(xué)學(xué)院,內(nèi)蒙古呼和浩特 010018)
駱駝在動物學(xué)分類上屬于脊索動物門(Chordata)、駱駝科(Camlidae)、駱駝屬(Camelus)[1],因其極耐干渴,不怕炎熱和寒冷,適于在沙漠行走,故有“沙漠之舟”的美稱。近年來,內(nèi)蒙古乃至全國養(yǎng)駝業(yè)的發(fā)展呈現(xiàn)逐年萎縮的態(tài)勢,駱駝存欄數(shù)量急劇減少,已處于瀕危狀態(tài),2014年阿拉善雙峰駝再次被列入《中華人民共和國畜牧法》國家級畜禽品種保護名錄。分析駱駝數(shù)量銳減的原因,除環(huán)境和生產(chǎn)方式改變以外,寄生蟲病是造成駱駝數(shù)量銳減的主要原因之一[2]。有資料報道,在大多數(shù)養(yǎng)駝國家,寄生蟲病占駱駝發(fā)病總數(shù)的30%以上,而內(nèi)蒙古地區(qū)駱駝斯氏副柔線蟲病感染率曾高達90%以上。斯氏副柔線蟲病(Parabronemosis)是由斯氏副柔線蟲(Parabronemaskrjabini)寄生在駱駝?wù)嫖钢兴鸬囊环N寄生蟲病。除駱駝以外,牛、羊等反芻動物也可感染,但以駱駝最易感染并且是其最適宜的宿主[3-4]。斯氏副柔線蟲屬于柔線科(Habronematidea)、副柔亞科(Parabronematinae)、副柔屬(Parabronema))[5]。當(dāng)駱駝大量感染斯氏副柔線蟲后,可引起駱駝生長發(fā)育遲緩,營養(yǎng)不良,貧血甚至死亡,給養(yǎng)駝業(yè)和農(nóng)牧民帶來巨大的經(jīng)濟損失。
由于駱駝在地域上分布的特殊性,國內(nèi)外對駱駝斯氏副柔線蟲病的研究甚少。目前,有關(guān)駱駝斯氏副柔線蟲形態(tài)學(xué)及傳播媒介的研究逐漸清晰[6],趙治國[7]等捕捉了內(nèi)蒙古駱駝主產(chǎn)區(qū)的蠅類并進行生物學(xué)剖檢,確定西方角蠅和截脈角蠅是斯氏副柔線蟲的傳播媒介。同年,張曉東等[8]利用斯氏副柔線蟲ITS序列構(gòu)建系統(tǒng)進化樹,明確了副柔屬的歸科問題,副柔屬歸類于柔線科。鄧僑等[9]在2017年詳細描述了西方角蠅和截脈角蠅各蟲態(tài)的形態(tài)特征,確定了多處可用于區(qū)分兩種角蠅卵、2期幼蟲、3期幼蟲、蛹和成蠅的形態(tài)特征差異。馮陳晨等[10]在2017年對斯氏副柔線蟲進行了轉(zhuǎn)錄組測序,構(gòu)建出轉(zhuǎn)錄組學(xué)圖譜。
前人在斯氏副柔線蟲的研究中取得了階段性成果,但對斯氏副柔線蟲組學(xué)研究還很匱乏,尤其是對其生物信息學(xué)分析的研究甚少。本研究參考已報道的線蟲免疫學(xué)診斷抗原的特點,篩選高通量測序轉(zhuǎn)錄組數(shù)據(jù),通過Blastx比對確定與表皮膠原蛋白相關(guān)的候選基因NCC,通過克隆斯氏副柔線蟲NCC基因的CDS區(qū),構(gòu)建原核表達載體pET30a(+)-NCC,用生物信息學(xué)方法分析該基因結(jié)構(gòu)、理化性質(zhì)、抗原表位等,為斯氏副柔線蟲新藥物靶點發(fā)掘、NCC蛋白功能及其作用機制的研究奠定理論基礎(chǔ),同時也為駱駝斯氏副柔線蟲病生前診斷方法的建立提供參考。
1.1.1 蟲體和菌株 斯氏副柔線蟲樣本采自于內(nèi)蒙古自治區(qū)巴彥淖爾市烏拉特后旗雙峰駝?wù)嫖?。根?jù)雌、雄蟲的不同形態(tài)特征,在顯微鏡下鑒定,并分裝標記后存放液氮中保存。
試驗所用菌株E.coliDH5α、E.coliBL21(DE3)均購自北京全式金生物有限公司;質(zhì)粒載體,克隆載體pMD19-T購自寶生物工程有限公司,表達載體pET-30a(+)由本實驗室保存。
1.1.2 主要試劑 總RNA提取試RNAiso Plus、限制性內(nèi)切酶XhoⅠ、EcoRⅠ、T4DNA連接酶、DNA Marker,TaKaRa公司產(chǎn)品;質(zhì)粒小提試劑盒、DNA凝膠回收試劑盒,AXYGEN公司產(chǎn)品。
1.2.1 Total RNA提取與反轉(zhuǎn)錄 斯氏副柔線蟲Total RNA提取步驟按照RNAiso Plus(Trizol法)說明書操作。將獲得的Total RNA進行純度和濃度檢測后,根據(jù)反轉(zhuǎn)錄試劑盒(Primer ScriptTMRT reagent Kit,TaKaRa),以Total RNA為模板反轉(zhuǎn)錄合成cDNA。
1.2.2 擴增目的基因 NCC序列來自本實驗室駱駝斯氏副柔線蟲轉(zhuǎn)錄組測序數(shù)據(jù),利用Primer5.0和Oliga6.24軟件設(shè)計NCC基因的特異性引物,由華大基因有限公司合成。上游引物F:5′-CCGGAATTCATGGGTCTGATGGATGATAC-3′(下劃線為EcoRⅠ酶切位點);下游引物R:5′-CCACTCGAGCCTTTCAGGTTGTGCGCTAA-3′(下劃線為XhoⅠ酶切位點)。以cDNA為模板,用高保真酶進行NCC基因CDS區(qū)的PCR擴增,反應(yīng)條件為:94℃ 5 min;94℃ 1 min,55℃ 1 min,72℃ 90 s,31個循環(huán);72℃ 5 min。將PCR產(chǎn)物用10 g/L瓊脂糖凝膠電泳檢測。
1.2.3 pET30a(+)-NCC重組質(zhì)粒的構(gòu)建 從測序結(jié)果正確的菌株中提取克隆質(zhì)粒(命名為pMD-NCC),將pMD-NCC和表達載體pET30a(+)分別用限制酶EcoRⅠ、XhoⅠ雙酶切后,以凝膠回收試劑盒回收目的基因和載體片段,用T4 DNA連接酶連接構(gòu)建NCC基因原核表達載體(命名為pET30a(+)-NCC)并轉(zhuǎn)化大腸埃希菌BL21(DE3)感受態(tài)細胞。在含卡那霉素的固體LB培養(yǎng)基培養(yǎng)后,挑取單菌落分別進行PCR和質(zhì)粒雙酶切鑒定,陽性菌株送華大基因公司進行雙向序列測定。
1.2.4 NCC基因生物信息學(xué)分析 利用Prot-Param在線軟件分析NCC蛋白的氨基酸序列組成和理化性質(zhì);蛋白質(zhì)的疏水性在其構(gòu)象、三級結(jié)構(gòu)的穩(wěn)定性等方面都起著至關(guān)重要的作用[11],利用ProtScale軟件分析氨基酸殘基的疏水性;利用DNA Star軟件中的Kyte-Doolittle方法和Hopp-Woods方法對NCC蛋白的親水性進行分析;SOPMA在線軟件分析蛋白質(zhì)的二級結(jié)構(gòu);利用TMHMM Server軟件進行跨膜區(qū)結(jié)構(gòu)預(yù)測;SignaIP 4.1 Server在線軟件進行信號肽分析;NetPhos 3.0 Server軟件預(yù)測磷酸化位點;利用DNAStar預(yù)測NCC蛋白質(zhì)表面可行性,可塑性,B/T細胞抗原表位等。
經(jīng)PCR擴增出的NCC大小為711 bp,與預(yù)期目的基因片段大小一致(圖1)。
M.DNA 標準DL 2 000;1~3.NCC基因產(chǎn)物M.DNA Marker DL 2 000;1-3.Products of NCC gene
將陽性重組質(zhì)粒進行雙酶切鑒定,結(jié)果與預(yù)期大小相符(圖2),表明pET30a(+)-NCC質(zhì)粒構(gòu)建成功。經(jīng)過測序后,未發(fā)現(xiàn)基因突變,重組基因與目標基因序列完全一致。
M.DNA 標準DL 2 000;1~3.重組質(zhì)粒的雙酶切產(chǎn)物
M.DNA Marker DL 2 000;1-3.Enzyme digestion products of recombinant plasmid
圖2重組質(zhì)粒pET30a(+)-NCC的雙酶切鑒定
Fig.2 Enzyme digestion identification of recombinant plasmid
pET30a(+)-NCC
2.3.1 NCC蛋白理化性質(zhì)分析 利用在線軟件Prot-Param分析其氨基酸序列組成和理化性質(zhì),結(jié)果為蛋白質(zhì)理論大小值為25.252 3 ku,理論等電點為6.33,分子式為C1086H1699N321O355S10,其氨基酸組成如表1所示,包含20種氨基酸,含量最高的是Gly占15.2%,含量最低的是Trp占0.8%;帶負電荷數(shù)(Asp+Glu)為28個,帶正電荷數(shù)(Arg+Lys)為27個;蛋白質(zhì)不穩(wěn)定指數(shù)(instability index)為40.08,是不穩(wěn)定蛋白(注:不穩(wěn)定系數(shù)小于40,說明蛋白穩(wěn)定,反之則不穩(wěn)定);脂肪系數(shù)(aliphatic index)為58.8;總平均親水性(grand average of hydropathicity)為-0.559,是親水性蛋白質(zhì);NCC蛋白在體外哺乳動物類網(wǎng)狀紅細胞中的半衰期為30 h,在酵母體內(nèi)的半衰期大于20 h,在大腸埃希菌體內(nèi)的半衰期大于10 h。
表1 NCC蛋白質(zhì)的氨基酸組成
2.3.2 NCC蛋白的疏水性分析 應(yīng)用軟件ProtScale分析NCC蛋白氨基酸殘基的疏水性,由圖3可知其疏水性最大值為1.932,最小值為-1.979,為親水性蛋白,與ExPAsy-Prot Param在線分析軟件得到的結(jié)果一致。
2.3.3 NCC蛋白磷酸化位點的預(yù)測 蛋白質(zhì)磷酸化位點可以通過酶促反應(yīng)調(diào)控蛋白質(zhì)之間的相互作用,在細胞信號轉(zhuǎn)導(dǎo)的過程中起重要作用。細胞內(nèi)參與磷酸化的氨基酸主要有絲氨酸、蘇氨酸和酪氨酸。利用在線軟件NetPhos2.0 Server對NCC蛋白進行磷酸化位點的預(yù)測,如圖4可知,當(dāng)潛在磷酸化位點的閾值為0.5時,NCC蛋白存在27個潛在的磷酸化位點,其中包括23個絲氨酸位點,1個蘇氨酸位點,3個酪氨酸位點。
2.3.4 NCC蛋白跨膜結(jié)構(gòu)和信號肽預(yù)測 通過在線工具TMHMM/TMpred和SignalP4.0預(yù)測NCC蛋白跨膜結(jié)構(gòu)和信號肽。通過TMHMM預(yù)測結(jié)果(圖5)中展示了1個跨膜區(qū),從輸出的文本文件中確定NCC蛋白在21-43位置存在1個跨膜區(qū)。利用TMpred在線軟件分析NCC蛋白的跨膜螺旋特征,根據(jù)跨膜拓撲學(xué)分析模型可知,值大于500時該蛋白具有跨膜螺旋特征,而NCC蛋白數(shù)值大部分在500以下(圖6),NCC蛋白具有一個明顯的跨膜螺旋特征,與TMHMM預(yù)測結(jié)果一致。利用SignalP和SecretomeP軟件對NCC蛋白的信號肽序列預(yù)測分析發(fā)現(xiàn)NCC不存在信號肽,但是在SecretomeP軟件預(yù)測中被認為是非典型分泌蛋白NN-Score=0.929(若NN-Score﹥0.5,判定為分泌蛋白)(圖7)。
2.3.5 NCC蛋白的二級結(jié)構(gòu)預(yù)測 利用在線軟件Phyre2對NCC蛋白的二級結(jié)構(gòu)進行預(yù)測,結(jié)果顯示參與α螺旋的氨基酸有63個,占26.58%,參與構(gòu)成β-折疊的氨基酸有26個,占10.97%,參與構(gòu)成延伸鏈的氨基酸有34個,占14.35%,參與構(gòu)成無規(guī)卷曲的氨基酸有114個,占48.1%。
2.3.6 NCC蛋白的親水性分析 利用DNA Star軟件中的Kyte-Doolittle方法和Hopp-Woods方法對NCC蛋白的親水性進行分析,結(jié)果(圖8)顯示,NCC親水性區(qū)域主要分布在:3-17、58-69、79-97、108-151、153-194、203-226等氨基酸殘基,在NCC蛋白的18-42氨基酸殘基有很大的疏水性,與ExPASy-ProtScale軟件預(yù)測趨于一致。
圖3 NCC蛋白疏水性結(jié)果
圖4 NCC蛋白磷酸化位點的預(yù)測
圖5 NCC蛋白跨膜結(jié)構(gòu)預(yù)測
圖6 NCC蛋白跨膜螺旋預(yù)測
圖7 NCC基因信號肽預(yù)測
圖8 NCC蛋白的親水性分析
2.3.7 NCC蛋白的表面可及性分析 采用Emini方法預(yù)測NCC蛋白的表面可及性,表面可及性較高區(qū)域位于NCC蛋白分子表面,可及性較低區(qū)域埋藏于分子內(nèi)部的區(qū)域。由圖9可見,NCC蛋白的氨基酸呈現(xiàn)在表面可能性較大的區(qū)域主要是5-12、83-93、110-121、127-132、138-147、206-223、177-183、232-237等氨基酸殘基,其他部位展示的可能性較小或表現(xiàn)為負值。
2.3.8 NCC蛋白的表面可塑性分析 應(yīng)用DNA Star軟件中Karplus-Schulz方法對NCC蛋白質(zhì)骨架區(qū)的柔韌性進行分析,結(jié)果(圖10)顯示,韌性較高區(qū)域有5-18、50-56、62-67、76-87、90-100、112-166、171-192、200-227、233-234氨基酸殘基。這些區(qū)域可能具有一定的柔韌性,形成抗原表位的可能性較大,易與抗體進行嵌合。
2.3.9 NCC蛋白的B細胞抗原表位預(yù)測 采用Jameson-Wolf方法對NCC蛋白的B細胞抗原表位進行預(yù)測(圖11)。然后根據(jù)NCC的二級結(jié)構(gòu)預(yù)測及其表面特性,蛋白質(zhì)親水性、表面可及性、柔韌性等綜合分析所預(yù)測的NCC蛋白的B細胞抗原表位。NCC存在8個潛在的B細胞抗原表位位點,在3-18、50-55、60-69、75-99、110-168、171-197、203-227、229-237位氨基酸處具有較高的抗原性,可能是B細胞抗原表位的優(yōu)勢區(qū)段。
2.3.10 NCC蛋白的T細胞抗原表位預(yù)測 T細胞表位是可以被TCR識別的抗原表位。利用AMPHI方法預(yù)測免疫優(yōu)勢輔助性T淋巴細胞抗原位點,Rothbard-Taylor方法預(yù)測含有特定基序(motif)的潛在T淋巴細胞抗原決定簇。綜合兩種方法預(yù)測T細胞抗原表位(圖12),NCC蛋白的T細胞抗原表位可能有11個,主要位于2-5、13-22、24-38、45-53、66-69、73-84、105-119、128-130、132-137、141-150、158-167氨基酸殘基。
圖9 NCC蛋白表面可能性區(qū)域
圖10 NCC蛋白的表面柔韌性區(qū)域
Fig.10 Flexible regions of NCC protein
圖11 NCC蛋白B細胞抗原表位的預(yù)測
圖12 NCC蛋白T細胞抗原表位的預(yù)測
由于駱駝主要分布于經(jīng)濟欠發(fā)達國家或地區(qū),導(dǎo)致斯氏副柔線蟲病的相關(guān)研究較少,到目前為止,其確切的生活史仍未清晰。在斯氏副柔線蟲病的防治上,尚缺乏有效的生前診斷方法和防治措施。近20年來,駱駝斯氏副柔線蟲病是造成駱駝數(shù)量銳減的主要原因之一,嚴重制約我國養(yǎng)駝業(yè)的健康發(fā)展。本研究利用原核表達系統(tǒng)構(gòu)建原核表達載體pET30a(+)-NCC,利用DNA Star預(yù)測表皮膠原蛋白NCC基因的抗原表位,為斯氏副柔線蟲診斷方法的建立奠定基礎(chǔ),同時為該蛋白DNA疫苗的研究提供了可靠的依據(jù),具有重要的應(yīng)用價值。
表皮膠原蛋白構(gòu)成的表皮不僅能夠維持蟲體的形態(tài)和運動,還能夠抵抗宿主的防御系統(tǒng),保護蟲體免受外界傷害[12]。表皮膠原蛋白的一級結(jié)構(gòu)具有一段較長的氨基酸區(qū)間,由 Gly-X-Y 序列重復(fù)形成,其中 Gly 的位置屬于甘氨酸(Gly),X 的位置屬于脯氨酸(Pro),Y 的位置氨基酸種類不固定。通過在線軟件Prot-Param分析顯示,NCC蛋白的氨基酸序列中Gly和Pro含量較高,分別占11.4%和5.9%。這一結(jié)果表明駱駝斯氏副柔線蟲NCC蛋白存在與表皮膠原蛋白共有的結(jié)構(gòu)特征。根據(jù)李文娜[13]報道,旋毛蟲感染期表皮膠原蛋白附著一層外衣,正是由于這層外衣的存在,使得抗體血清無法識別膠原蛋白,除去外衣之后,體表皮斷面上的抗原可以被識別,而隱蔽的膠原蛋白抗原表位可以作為駱駝斯氏副柔線蟲病疫苗的候選抗原。
生物信息學(xué)是近年來發(fā)展起來的一種高效的研究手段,促進了生物學(xué)研究領(lǐng)域的快速發(fā)展[14]。在寄生蟲的研究上,也得到了廣泛的應(yīng)用[15]。本研究克隆了斯氏副柔線蟲與表皮膠原蛋白有關(guān)基因NCC編碼序列,成功構(gòu)建原核表達載體pET30a(+)-NCC。通過生物信息學(xué)軟件對駱駝斯氏副柔線蟲NCC蛋白氨基酸組成與理化性質(zhì)構(gòu)預(yù)測。NCC是親水性蛋白,親水區(qū)的存在有利于蛋白的高效表達。蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測是聯(lián)系一級結(jié)構(gòu)和三級結(jié)構(gòu)的紐帶,NCC蛋白二級結(jié)構(gòu)包括α螺旋、β折疊、無規(guī)則卷曲和延伸鏈,屬于混合型蛋白[16],轉(zhuǎn)角和無規(guī)則卷曲二級結(jié)構(gòu)比較松散,故該區(qū)域有可能與抗原表位有關(guān)[17]。利用DNA Star對斯氏副柔線蟲NCC蛋白的B細胞抗原表位進行預(yù)測,從該蛋白的親水性、表面可及性與可塑性等方面進行分析。說明該蛋白親水性多肽較多,其合成的多肽很可能易溶于水;表面可及性較高區(qū)域可能位于NCC蛋白分子表面;該蛋白的柔韌性區(qū)域較多,形成抗原表位的可能性較大,易與抗體進行嵌合。綜合分析可知駱駝斯氏副柔線蟲NCC既含有較多潛在的B細胞抗原表位,又有較多潛在的T細胞抗原表位。本試驗為進一步氏副柔線蟲病診斷方法的建立和免疫防治研究提供參考。