蘇文楠,劉佳琪,鐘嘉誠,陳濟鐺,朱婉君,張溢珊,張濟培,*
(1.佛山科學技術學院,佛山 528225;2.佛山天牧生物科技有限公司,佛山 528225)
副雞禽桿菌(Avibacteriumparagallinarum,Apg)屬于巴氏桿菌科禽桿菌屬,是一種無鞭毛、無芽胞的革蘭陰性菌,可引起雞傳染性鼻炎。該菌不屬于泛嗜性細菌,在以往文獻報道中,除了雞以外,甚少有其它動物感染Apg的報道,即使可以從其他動物上分離到Apg,也無法用本體動物復制出相同的癥狀和病理變化[1]。但1981年Reece等[2]報道了日本地區(qū)的鵪鶉群體出現(xiàn)疑似傳染性鼻炎病例,通過對病原體分離鑒定,證實為Apg感染所致,之后該病也出現(xiàn)在印度尼西亞,成為當?shù)伫g鶉群體中的一種常見病,從鵪鶉分離的菌株重新接種回本體動物,可以復制出同樣的臨床癥狀和病理變化[3-5],說明Apg已開始出現(xiàn)跨禽種傳播的趨勢。2020年初,鐘嘉誠等[6]從廣東地區(qū)發(fā)生傳染性鼻炎的種鵝中分離出了一株Apg,經(jīng)過動物回歸試驗證實了該菌株對鵝具有致病性。目前關于Apg引起鵝傳染性鼻炎的報道不多,鮮有對于鵝源Apg的研究報道,對于鵝源Apg的來源以及與雞源Apg基因組之間的異同仍不清楚。因此本研究對3株鵝源Apg和4株雞源Apg菌株進行全基因測序及基因組分析,通過對基因組進行基于核心基因SNPs的同源性分析來了解其系統(tǒng)進化關系,并根據(jù)宿主源和致病性的差異對菌株歸類,利用同源基因分析比較不同宿主源Apg之間的基因差異,以探討Apg對不同宿主的感染機制。
由本實驗室分離保存的3株鵝源Apg(G-AP1、G-AP2、G-AP3)及4株雞源Apg(C-AP1、C-AP2、C-AP3、C-AP4),菌株的具體信息見文獻[7](表1)。
表1 菌株信息
主要試劑:Ezup柱式細菌基因組DNA抽提試劑盒,生工生物工程(上海)有限公司。
分析軟件:測序數(shù)據(jù)質(zhì)量評估軟件FastQC(version 0.11.9),測序數(shù)據(jù)過濾軟件Trimmomatic(version 0.39),基因組序列拼接軟件Soapdenovo2(version 2.40),基因組注釋軟件prokka(version 1.14.6),圈圖繪制軟件CGView,序列比對相關軟件MEGA7、BLAST+(version 2.13.0)、BRIG(version 0.95),SNP分析軟件kSNP3(version 3.1.2),基因同源性分析軟件OrthoFinder(version 2.3.12),畫樹工具FastTree。
參照Ezup柱式細菌基因組DNA抽提試劑盒說明書對7株菌株進行細菌基因組的提取,干冰凍存送至生工生物工程(上海)股份有限公司完成測序工作。
7株Apg菌株的全基因組重測序工作由生工生物工程(上海)股份有限公司完成,采用二代測序平臺Illumina PE150 進行全基因組測序。將測序的原始數(shù)據(jù)(raw data)通過FastQC軟件作序列數(shù)據(jù)的質(zhì)量評估[4],利用Trimmomatic軟件進行過濾處理獲得有效數(shù)據(jù)(clean data);將有效數(shù)據(jù)利用Soapdenovo2軟件[8]進行denovo組裝后獲得高質(zhì)量的Contig片段,并進行序列補洞與修正,最終獲得基因組掃描圖。
采用Prokka軟件[9]對基因組掃描圖進行基因元件(編碼基因、tRNA、rRNA等)預測,Prokka軟件根據(jù)COG等數(shù)據(jù)庫對編碼蛋白進行功能預測與注釋;基因島通過IslandViewer 4在線預測,以副雞禽桿菌ESV-135(登錄號為NZ_CP050 316.1)作參照基因組;噬菌體序列由PHASTER[10]在線預測;利用VFDB數(shù)據(jù)庫(Virulence Factor Database)作毒力基因的預測。使用CGView軟件繪制基因組圈圖,并將基因島、前噬菌體信息整合到圈圖中。
運用kSNP3軟件[11],以Apg菌株ESV-135基因組作參考基因組,分別與本試驗的7株菌株基因和NCBI已公布的42個Apg基因組進行比對,獲得所有菌株的SNPs(單核苷酸多態(tài)性位點),根據(jù)核心基因SNPs,通過ML法(最大似然法)進行系統(tǒng)發(fā)育分析。
1.7.1 7株菌株基因組的同源性分析 提取7株菌株基因組的蛋白質(zhì)序列文件,運用OrthoFinder軟件[12]分析各個基因組之間共有和特有的基因。
1.7.2 鵝源菌株與雞源菌株基因組的同源性分析 為了解該地區(qū)的鵝源菌株群體與雞源菌株群體之間的同源基因分布情況,將本試驗的3株鵝源菌株設為A組,4株雞源菌株設為B組,分別對二組進行同源基因分析,隨后將鵝源菌株共有基因與雞源菌株共有基因進行聚類分析,從而獲到二者的特有基因。
1.7.3 Apg對鵝致病基因的篩查 7株Apg對鵝的致病性表征評分分別為G-AP1(1.26)、G-AP2(1.41)、G-AP3(1.16)、C-AP1(0.34)、C-AP2(0.06)、C-AP3(0.47)、C-AP4(0.41),C-AP2株對鵝的致病力最弱,且在鵝機體內(nèi)停留的時間最短,而鵝源Apg對鵝的致病性最強,另外3株雞源Apg次之[7]。為探究是否存在有助于Apg對鵝致病的相關基因,分別將低毒力的C-AP2株基因組設為A組,高毒力的鵝源菌株(G-AP1、G-AP2、G-AP3)和中等毒力的雞源菌株(C-AP1、C-AP3、C-AP4)的基因組集合設為B組,通過對A組和B組進行同源性分析比較,獲得B組特有基因。
1.7.4 Apg對雞致病基因的篩查 從Apg對雞的致病性表征表征評分分別為G-AP1(0.14)、G-AP2(0.47)、G-AP3(0.1)、C-AP1(0.51)、C-AP2(1.59)、C-AP3(1.51)、C-AP4(1.74),所有鵝源菌株和雞源菌株G-AP1對雞致病性弱,感染雞沒有明顯的臨床表征[7],為了尋找有助于Apg對雞致病的相關基因,將低毒力鵝源菌株(G-AP1、G-AP2、G-AP3)和中等毒力雞源菌株C-AP1基因組集合設為A組,3株高致病性雞源菌株(C-AP2、C-AP3、C-AP4)的基因組集合設為B組,通過對A組與B組進行同源性分析比較,獲得B組特有基因。
2.1.1 基因組分析 7株Apg全基因組原始測序結果經(jīng)數(shù)據(jù)過濾校正后,通過組裝處理,得到7個大小為2.567 339~2.637 621 Mb的基因組片段,GC含量介于40.79%~41.02% 之間,分別預測到2 481~2 624個蛋白編碼基因(protein coding sequences,CDSs)、tRNA 53~55個、rRNA 5~9個;利用IslandViewer4對菌株進行基因島預測,分別預測到9~14個基因島;通過PHASTER在線預測,可見菌株帶有5~7個前噬菌體序列(詳見OSID “開放科學內(nèi)容與數(shù)據(jù)”)(表2)。鵝源菌株與雞源菌株的全基因組相似,結果無顯著差異。
表2 菌株基因組信息
2.1.2 功能聚類分析 COG、KEGG和GO注釋分類統(tǒng)計圖都分別包含了7株Apg各種基因功能的平均基因數(shù)和對應的標準差,從圖1可見,基因功能主要聚集在細胞的新陳代謝、細胞的合成、膜轉(zhuǎn)運、信號轉(zhuǎn)導、DNA復制及修復、轉(zhuǎn)錄、翻譯;根據(jù)各基因功能的基因數(shù)標準差,可知7株Apg各種基因功能對應的基因數(shù)相差甚少。
圖1 COG、KEGG和GO基因功能聚類分析Fig.1 Functional cluster analysis of COG, KEGG and GO genes
2.1.3 毒力基因分析 利用細菌毒力因子數(shù)據(jù)庫(VFDB)在線分析,3株鵝源菌株和4株雞源菌株均預測出75個毒力相關基因,且所有菌株攜帶相同的毒力基因譜,其中占比最大的是內(nèi)毒素類的毒力基因,詳情見表3。
表3 毒力基因統(tǒng)計分析
根據(jù)核心基因SNPs構建進化樹,發(fā)現(xiàn)Apg的進化樹分布情況與菌株的分離地區(qū)有密切關系,各地區(qū)菌株基本會聚集在鄰近的分支上,國內(nèi)除了Hp8、A2S-2-1和Z1S-2-1株外,其他菌株均聚集在相鄰分支上,包括本試驗的7株菌株。在進化樹中,3株鵝源菌株和雞源菌株C-AP3以及p4chr1株位于同一小分支上,另外3株雞源菌株分布在其它國內(nèi)菌株分支上(圖2)。
圖2 核心基因SNPs進化樹Fig.2 Phylogenetic tree of core SNPs
2.3.1 7 株菌株同源性分析 為了解Apg菌株整體的同源基因分布情況,基于所有基因組的蛋白質(zhì)序列,利用OrthoFinder軟件分析各基因組間的共有基因和特有基因。結果顯示,7 個基因組共計17 200條蛋白質(zhì)序列,其中17 131個基因之間至少有兩個基因存在同源性,還有69個基因與其他基因沒有同源性;17 131個基因共計分出的2 241個共有基因家族,菌株普遍攜帶2 ~ 3個特有基因,而C-AP2株有14個特有基因、C-AP3株有44個特有基因;根據(jù)同源單拷貝基因構建的系統(tǒng)進化樹,可見G-AP1株和G-AP2株獨立于其它5株菌株(圖3)。
圖3 基于同源單拷貝基因構建的進化樹Fig.3 Phylogenetic tree of homologous single copy genes
2.3.2 鵝源菌株與雞源菌株的同源性分析 通過對鵝源菌株共有基因與雞源菌株共有基因作比較,發(fā)現(xiàn)鵝源和雞源菌株共有4 711個基因,其中共有基因4 598個分為2 225個基因家族類群。另有113個基因?qū)儆谔赜谢?其中鵝源菌株特有基因有76個,雞源菌株特有基因有37個。研究表明鵝源菌株與雞源菌株在基因水平上存在差異。
2.3.3 雞源Apg對鵝適應性基因的篩查 對A、B二組的基因組進行同源性分析,經(jīng)排除與A組(C-AP2)基因組同源的基因,剩余79個特有基因存在于B組(G-AP1、G-AP2、G-AP3、C-AP1、C-AP3、C-AP4),通過對79個特有基因的功能注釋可見,僅有22個基因編碼已知蛋白,包括ATP酶RavA、冷休克樣蛋白CspD、50S核糖體蛋白L3谷氨酰胺甲基轉(zhuǎn)移酶、雙官能團(IPC轉(zhuǎn)移酶和DIPP合成酶)、轉(zhuǎn)運蛋白家族EamA、膽堿/乙醇胺激酶、腺苷酸環(huán)化酶、Ⅰ型限制性內(nèi)切酶EcoR124II R蛋白、跨膜蛋白A、EcoKⅠ限制性修飾系統(tǒng)蛋白HsdS、抗阻遏物AntA/AntB、海藻酸鹽生物合成蛋白、巖藻糖轉(zhuǎn)移酶、DNA結合蛋白H-NS、轉(zhuǎn)肽酶D、脂多糖核心生物合成蛋白、碳水化合物二酸調(diào)節(jié)劑、唾液酸轉(zhuǎn)移酶PMO188、DoxX、乙酰轉(zhuǎn)移酶OatA、半乳糖、腸桿菌素EntS。其余57個蛋白均為假定蛋白;22個已知蛋白中,只有脂多糖核心生物合成蛋白與致病性有較大關聯(lián),其他蛋白與菌株致病性無直接聯(lián)系;由于存在大量假定蛋白,暫時無法判斷這79個基因中是否存在影響Apg對鵝的適應性基因,需要作進一步研究。
2.3.4 鵝源Apg對雞適應性基因的篩查 對鵝源菌株G-AP1、G-AP2、G-AP3和雞源菌株C-AP1共計9 831個基因進行同源基因分析,其中2 327個基因家族類群存在于所有樣本中,將2 327個基因家族類群記為A組。對雞源菌株C-AP2、C-AP3、C-AP4共計7 369個基因進行同源基因分析,其中2 278個基因家族類群存在于所有樣本中,將2 278個基因家族類群記為B組。對A、B二組進行同源性分析,篩選出39個B組特有基因,其中10個為有明確蛋白功能注釋的基因,包括灰分蛋白家族、β-自轉(zhuǎn)運域蛋白、Ogr/Delta樣鋅指、轉(zhuǎn)座酶DDE結構域蛋白、P2噬菌體J蛋白、噬菌體CP4-57調(diào)節(jié)蛋白(AlpA)、螺旋-轉(zhuǎn)角-螺旋結構域蛋白、質(zhì)粒穩(wěn)定系統(tǒng)蛋白、DNA結合轉(zhuǎn)錄抑制因子PuuR、噬菌體CI抑制因子螺旋-轉(zhuǎn)角-螺旋結構域蛋白,29個為假定基因;10個功能明確的基因中,除了β-結構域自轉(zhuǎn)運蛋白編碼基因與革蘭陰性菌毒力有較直接關系外,其它基因仍有待進一步研究才能證實是否存在介導Apg對雞適應的作用(表4)。
表4 已知功能蛋白
細菌基因組是細菌全部遺傳信息的集合,它在本質(zhì)上決定了細菌的外觀與功能,由于其基因數(shù)目龐大,且復雜多樣,導致研究難度較高。隨著全基因測序的發(fā)明以及比較基因組學方法的建立,讓細菌基因組的研究變得便捷且科學。本試驗3株鵝源Apg菌株基因組的整體參數(shù)與雞源Apg菌株的基因組相比差異不大[13]。借助COG、KEGG和GO數(shù)據(jù)庫對菌株基因組作注釋和聚類,可見所有鵝源菌株的基因功能主要聚集在細胞的新陳代謝、細胞的合成、膜轉(zhuǎn)運、信號轉(zhuǎn)導、DNA復制及修復、轉(zhuǎn)錄、翻譯,與雞源菌株分布情況相似。
目前VFDB數(shù)據(jù)庫仍未公布Apg的毒力因子信息,但由于大部分細菌的毒力因子為種屬特異的,不同物種間的比對會面臨假陽性高的風險,因此本試驗以親緣關系較為接近的流感嗜血桿菌數(shù)據(jù)庫作替代,結果顯示7株Apg均預測出75個相同的毒力基因,未找到菌株間毒力基因的差異,但可以肯定的是,仍有部分未知的Apg毒力基因在Apg感染宿主過程中起關鍵作用。
基因同源性分析試驗中,通過對鵝源菌株共有基因與雞源菌株共有基因作比較,結果顯示鵝源菌株與雞源菌株有2 225個共有基因,得到鵝源菌株特有基因76個,雞源菌株特有基因37個,說明鵝源菌株和雞源菌株存在基因水平上的差異。為了進一步了解這些基因差異是否會導致菌株的致病性差異以及是否會改變菌株對宿主的嗜性,作者根據(jù)菌株對不同宿主的致病性強弱進行物種的適應性篩查。Apg對雞適應性基因篩查結果顯示,共聚類出79個基因,其中編碼的蛋白大部分為假定蛋白,另外在22個已知蛋白中,目前較明確與致病性相關的基因為編碼脂多糖核心合成蛋白的基因,其它基因與細菌的黏附、抗宿主免疫系統(tǒng)、毒力因子和攝鐵系統(tǒng)沒有直接關聯(lián)[14-16];此外,由于假定蛋白的數(shù)量眾多,影響Apg對鵝適應性的基因也可能存在于此,暫時無法下明確結論。在Apg對雞適應性基因的篩查結果中,共聚類得到39個基因,其中10個編碼已知蛋白,29個編碼假定蛋白,在已知蛋白里,除β域自轉(zhuǎn)運蛋白具有明確的致病性外[17],其他蛋白與菌株的致病性沒有直接關系,另外29個假定蛋白編碼基因也可能是影響Apg感染雞的關鍵因素。
SNP是指基因組中由單個堿基突變引起的DNA序列多態(tài)性,是遺傳變異的重要依據(jù)[18-21],為研究物種起源、進化,本次利用SNP序列構建了包含50株Apg的進化樹,從進化樹中可以發(fā)現(xiàn),Apg菌株的SNP變化基本是以地區(qū)為單位,同一國家的菌株會分布在同一或相鄰的分支上,本試驗的3株鵝源菌株與雞源菌株都分布在我國新近分離株的大分支上,且鵝源菌株和雞源C-AP3株聚集在p4chr1株的小分支上,從菌株對鵝的致病性試驗可見,這4株菌對鵝的適應性要強于另外3株雞源菌株,由此推測,Apg對鵝機體產(chǎn)生適應性的原因不一定是物種適應性基因的擁有,也可能是由于菌株基因發(fā)生突變,改變了Apg的黏附能力、毒力或抗吞噬力等,從而達到實施感染致病的目的。
通過比較基因組學分析,發(fā)現(xiàn)與鵝源副雞禽桿菌(Apg)宿主適應性有關的基因為118個,對鵝適應性基因的篩查共聚類出79個基因,其中編碼已知蛋白的基因有22個,其余編碼假定蛋白;對雞適應性基因的篩查聚類出39個基因,其中10個編碼已知蛋白,29個編碼假定基因為進一步闡釋Apg跨物種感染的分子生物學機制奠定了基礎。