劉燕 邱品品 劉蒨瑩 向凱 楊小林 喬梁
(重慶師范大學(xué)生命科學(xué)學(xué)院, 重慶 401331)
幾丁質(zhì)是一種線性多糖,由N-乙酰-D-葡萄糖胺通過β-1,4-糖苷鍵聚合而成,主要以α-幾丁質(zhì)、β-幾丁質(zhì)、γ-幾丁質(zhì)3種形式存在,是僅次于纖維素的第二豐富的生物多聚體[1-6]。幾丁質(zhì)是昆蟲表皮與圍食膜的重要組成成分。昆蟲在其生長發(fā)育周期中會經(jīng)歷多次蛻皮,即蛻下舊表皮的同時合成新的初生表皮,舊表皮中的幾丁質(zhì)會被降解、吸收、重新利用[7-8],而這些過程無不依賴于具有生物催化水解活性的幾丁質(zhì)酶[5,9-10],特別是昆蟲體內(nèi)某些幾丁質(zhì)酶家族成員的功能是獨一無二不可替代的。因此,昆蟲體內(nèi)幾丁質(zhì)酶的表達(dá)與合成影響著昆蟲的蛻皮、化蛹、羽化及圍食膜再生等重要生理活動。探究幾丁質(zhì)酶基因的功能和作用機制,可為害蟲防治和經(jīng)濟昆蟲育種提供理論參考或重要的靶標(biāo)分子。
已有研究發(fā)現(xiàn),有的幾丁質(zhì)酶基因雖然在昆蟲整個生長發(fā)育時期均有表達(dá),但只在羽化階段起作用[5,7,9,11];而有的幾丁質(zhì)酶基因則在昆蟲整個生長發(fā)育時期都有表達(dá)且發(fā)揮重要作用[12]。幾丁質(zhì)酶的生理活性主要受pH值、溫度、金屬離子、作用底物等影響,除此之外,昆蟲不同組織部位中的幾丁質(zhì)酶活性也有所不同[10]。對幾丁質(zhì)酶的催化作用研究也已經(jīng)相當(dāng)深入,因此目前對幾丁質(zhì)酶的研究主要集中在幾丁質(zhì)酶及類似蛋白質(zhì)的結(jié)構(gòu)與功能方面。
中華按蚊(Anophelessinensis)在我國除新疆和青海以外的省份均有分布,是我國平原地區(qū)瘧疾傳播的重要媒介昆蟲。因此,中華按蚊的防控對維護人類健康具有重要意義。本項研究針對中華按蚊的幾丁質(zhì)酶基因家族進行全基因組鑒定分析,并將中華按蚊幾丁質(zhì)酶基因與岡比亞按蚊(Anophelesgambiae)、黑腹果蠅(Drosophilamelanogaster)、赤擬谷盜(Triboliumcastaneum)、埃及伊蚊(Aedesaegypti)、家蠶(Bombyxmori)等昆蟲的幾丁質(zhì)酶基因進行系統(tǒng)進化分析,為下一步對中華按蚊幾丁質(zhì)酶基因的表達(dá)及功能研究打下基礎(chǔ)。
中華按蚊基因組和蛋白質(zhì)數(shù)據(jù)來自于重慶師范大學(xué)昆蟲與分子生物學(xué)實驗室,岡比亞按蚊、赤擬谷盜、黑腹果蠅和埃及伊蚊4種昆蟲的幾丁質(zhì)酶的氨基酸序列來源于NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/genbank/),家蠶的幾丁質(zhì)酶的氨基酸序列來源于SGID數(shù)據(jù)庫(http://sgid.popgenetics.net/)。
根據(jù)已報道的代表性昆蟲的幾丁質(zhì)酶基因編號,在 NCBI數(shù)據(jù)庫中下載其氨基酸序列和DNA序列。以岡比亞按蚊的幾丁質(zhì)酶氨基酸序列為種子序列在中華按蚊蛋白質(zhì)數(shù)據(jù)庫進行本地序列對比,并對其氨基酸序列進行結(jié)構(gòu)域預(yù)測,根據(jù)包含 Glyco hydro 18這一幾丁質(zhì)酶特征結(jié)構(gòu)域,初步判定幾丁質(zhì)酶基因,從而初步得到中華按蚊中候選的幾丁質(zhì)酶基因的編碼產(chǎn)物。此外,綜合NCBI多序列比對結(jié)果、HMMER3.0同源建模搜索結(jié)果,以及FGENESH在線預(yù)測結(jié)果(http://www.softberry.com/berry.phtml),最終確定中華按蚊中預(yù)測的幾丁質(zhì)酶基因。
中華按蚊幾丁質(zhì)酶蛋白的基本理化性質(zhì)在ExPASyProtParam Server(http://web.expasy. org/protparam/)網(wǎng)站上預(yù)測得到。利用NCBI的在線程序Batch CD-Search(https://www.ncbi.nlm.nih.gov/Structure/ bwrpsb/bwrpsb.cgi)對幾丁質(zhì)酶蛋白的結(jié)構(gòu)域進行預(yù)測,根據(jù)預(yù)測位置提取出所有結(jié)構(gòu)域序列(多個結(jié)構(gòu)域記為AsCht10-dm-a、AsCht10-dm-b、AsCht10-dm-c等)。
結(jié)合中華按蚊的gff注釋文件或者預(yù)測結(jié)果繪制幾丁質(zhì)酶基因的外顯子和內(nèi)含子的位置結(jié)構(gòu)圖以及幾丁質(zhì)酶基因在染色體上的分布圖,通過結(jié)構(gòu)域預(yù)測結(jié)果繪制幾丁質(zhì)酶基因的結(jié)構(gòu)域圖。
聯(lián)合構(gòu)樹序列文件是所有比對物種幾丁質(zhì)酶蛋白的結(jié)構(gòu)域序列集合,并使用MAFFTT Alignment(https://mafft.cbrc.jp/alignment/server/)進行多重序列比對,隨后使用IQtree 2.1.3版本對對齊序列文件進行系統(tǒng)發(fā)育樹的構(gòu)建,各分支重復(fù)檢驗次數(shù)為1 000次。
將DNAsp用于分析幾丁質(zhì)酶家族基因的替換率以計算選擇壓力,將單個中華按蚊幾丁質(zhì)酶基因與岡比亞按蚊中的直系同源基因作為一個組合進行選擇壓力的分析。
通過與岡比亞按蚊和黑腹果蠅的幾丁質(zhì)酶氨基酸序列比對,篩選出22個預(yù)測的中華按蚊幾丁質(zhì)酶基因。進一步通過FGENESH程序在中華按蚊基因組中發(fā)現(xiàn)1個未被注釋的區(qū)域,也可能包含有幾丁質(zhì)酶基因。氨基酸序列分析結(jié)果顯示:這些預(yù)測基因的編碼產(chǎn)物均包含幾丁質(zhì)酶的保守基序FDGXDLDWEYP、KXXXXXGGW、MXYDXXG、GXXXWXXDXD中的1條或多條。另外,預(yù)測蛋白質(zhì)中均含有幾丁質(zhì)酶中的DWEYP特征基序;預(yù)測蛋白質(zhì)中均存在 Glyco hydro 18這一幾丁質(zhì)酶特征結(jié)構(gòu)域。因此,我們初步推測中華按蚊的基因組中存在23個幾丁質(zhì)酶基因。
從表1可見,預(yù)測的幾丁質(zhì)酶參考蛋白質(zhì)序列長度為271~2 361 aa,理論分子質(zhì)量為30.49~264.06 kDa,等電點為5.05~8.61。
表1 中華按蚊23個幾丁質(zhì)酶的基本特性
不同幾丁質(zhì)酶的序列長度差異較大。結(jié)構(gòu)域分析表明,幾丁質(zhì)酶AsCht5-4A、AsCht5-5、AsCht8、AsCht11、AsCht13、AsCht16不含信號肽;而其余的幾丁質(zhì)酶均含有信號肽。據(jù)此初步判斷中華按蚊中的大多數(shù)幾丁質(zhì)酶屬于分泌型蛋白質(zhì),會被分泌到胞外,后續(xù)可能參與表皮中幾丁質(zhì)的降解代謝。
中華按蚊的23個幾丁質(zhì)酶編碼基因的外顯子數(shù)目差異較大,其分布數(shù)量為2~13個,其中AsCht6、AsCht11分別擁有13和8個外顯子(圖1)。
藍(lán)色為外顯子,紅色為內(nèi)含子。
中華按蚊的大多數(shù)幾丁質(zhì)酶基因包含1個或2個編碼Glyco hydro 18結(jié)構(gòu)域的特征序列;而AsCht10有4個編碼Glyco hydro 18結(jié)構(gòu)域的特征序列,這與岡比亞按蚊、黑腹果蠅等昆蟲Cht10基因編碼多結(jié)構(gòu)域的情況相一致(圖2)。
圖2 中華按蚊23個幾丁質(zhì)酶基因編碼蛋白質(zhì)的結(jié)構(gòu)域示意圖
23個幾丁質(zhì)酶基因分別位于14個scaffold上(圖3)。岡比亞按蚊的Cht6、Cht11位于X染色體上,我們推測這2個基因在中華按蚊中的直系同源基因AsCht6和AsCht11可能也位于X染色體上。Cht5亞家族成員在岡比亞按蚊和埃及伊蚊中均存在不少于3個拷貝的形式,且串聯(lián)成簇排列。中華按蚊中存在3個IDGF基因,且成簇分布;而埃及伊蚊和岡比亞按蚊中,均只存在其中的2個IDGF基因(表2)。
圖中每個scaffold的右邊為基因名稱,左邊為該基因的起始位置。
表2 中華按蚊23個幾丁質(zhì)酶基因及其對應(yīng)的岡比亞按蚊直系同源基因的位置信息比對
根據(jù)中華按蚊與岡比亞按蚊、黑腹果蠅、赤擬谷盜、埃及伊蚊和家蠶等昆蟲的幾丁質(zhì)酶Glyco hydro 18結(jié)構(gòu)域序列構(gòu)建的ML系統(tǒng)發(fā)生樹如圖4所示,據(jù)此將該類幾丁質(zhì)酶的編碼基因劃分為9個亞家族。
As—中華按蚊Anopheles sinensis,Aa—埃及伊蚊Aedes aegypti,Ag—岡比亞按蚊Anopheles gambiae, Dm—黑腹果蠅Drosophila melanogaster,Bm—家蠶Bombyx mori, Tc—赤擬谷盜Tribolium castaneum;利用最大似然法進行構(gòu)建,各分支上的數(shù)字表示bootstrap值。
亞家族Ⅰ主要包含中華按蚊的AsCht5,其中AsCht5-4A、AsCht5-4B與岡比亞按蚊AgCht5-4的bootstrap值>80,支持其與AgCht5-4同源,故中華按蚊中存在2個Cht5-4基因,推測其可能經(jīng)歷了基因重復(fù)而形成;AsCht5-6和AsCht5-7則聚類在此家族的另一分支上,且bootstrap值較高,推測二者可能為此家族獨立演化出的旁系基因。
亞家族Ⅱ、Ⅲ、Ⅵ、Ⅶ、Ⅷ和Ⅸ均只包含1種幾丁質(zhì)酶基因,且分別獨立聚類為一支。其中,亞家族Ⅱ僅包括Cht10,亞家族Ⅲ僅包括Cht7,亞家族Ⅵ僅包括Cht6,亞家族Ⅶ僅包括Cht2,亞家族Ⅷ僅包括Cht11,亞家族Ⅸ僅包括Cht12。值得一提的是亞家族Ⅱ中TcCht10和BmCht10的第一個Glyco hydro 18結(jié)構(gòu)域編碼序列出現(xiàn)分離現(xiàn)象并與亞家族Ⅴ聚在一起,此現(xiàn)象還曾出現(xiàn)在Ye Pan等[13]構(gòu)建的系統(tǒng)發(fā)育樹中。
亞家族Ⅳ包含的幾丁質(zhì)酶基因數(shù)目眾多,包括AsCht8、AsCht9、AsCht4、AsCht13、AsCht16。值得一提的是在中華按蚊中AsCht4和AsCht16僅有1個拷貝,而岡比亞按蚊中的AgCht4與AgCht23,以及AgCht16與AgCht24高度同源(bootstrap值>80),為高度相似基因,我們推測這些基因的形成可能與基因重復(fù)事件相關(guān)。
亞家族Ⅴ主要包括幾丁質(zhì)酶類似蛋白編碼基因,包括:IDGF1、IDGF2、IDGF4。系統(tǒng)發(fā)生樹顯示:AsIDGF1與AsIDGF2分別與埃及伊蚊中的直系同源基因聚類,AsIDGF4與岡比亞按蚊中的AgIDGF4聚在一起,且AsIDGF1與AsIDGF4所在支的bootstrap值僅為65,暗示二者間在演化過程中產(chǎn)生了較大的分化。
以岡比亞按蚊作為參照,對中華按蚊中Cht5、Cht8、Cht9這3個幾丁質(zhì)酶基因家族成員進行選擇壓力分析。這些基因的Ka/Ks值均<1,暗示它們受到純化選擇(表3),推測這些幾丁質(zhì)酶基因家族成員可能在中華按蚊的重要生理過程中有不可或缺的作用。
表3 中華按蚊3個幾丁質(zhì)酶基因家族成員的 選擇壓力
本項研究采用生物信息學(xué)方法鑒定了中華按蚊的23個幾丁質(zhì)酶基因。對幾丁質(zhì)酶基因的分布進行分析發(fā)現(xiàn),Cht6、Cht11同時存在于岡比亞按蚊和果蠅的性染色體上,此外在中華按蚊、淡色按蚊(Anophelesalbimanus)、黑小按蚊(Anophelesatroparvus)中的分布位置均是如此(未發(fā)表數(shù)據(jù))。推測這2個基因間以及其與性染色體間可能存在連鎖關(guān)系,對此需進一步通過實驗驗證,這可以為后續(xù)針對性別特異性基因的研究提供基礎(chǔ)數(shù)據(jù)。在前期的研究中發(fā)現(xiàn),中華按蚊某些幾丁質(zhì)酶基因的表達(dá)具有雌雄特異性(未發(fā)表數(shù)據(jù)),這預(yù)示著對其表達(dá)的性別特異性進行更加深入的研究將為害蟲的靶向防治提供新的思路。同時,或可為研究其他昆蟲中類似基因在性別二態(tài)型中所扮演的角色起推動作用。
我們在研究中還發(fā)現(xiàn),不同昆蟲的幾丁質(zhì)酶種類盡管大致相似,但其數(shù)量卻呈現(xiàn)較大差異。有的昆蟲可以通過基因重復(fù)這一方式,增加類似功能的幾丁質(zhì)酶基因拷貝數(shù)量來調(diào)控其表達(dá)水平,進而行使其相應(yīng)的生理功能。