劉燕 邱品品 劉蒨瑩 向凱 楊小林 喬梁
(重慶師范大學(xué)生命科學(xué)學(xué)院, 重慶 401331)
幾丁質(zhì)是一種線性多糖,由N-乙酰-D-葡萄糖胺通過(guò)β-1,4-糖苷鍵聚合而成,主要以α-幾丁質(zhì)、β-幾丁質(zhì)、γ-幾丁質(zhì)3種形式存在,是僅次于纖維素的第二豐富的生物多聚體[1-6]。幾丁質(zhì)是昆蟲(chóng)表皮與圍食膜的重要組成成分。昆蟲(chóng)在其生長(zhǎng)發(fā)育周期中會(huì)經(jīng)歷多次蛻皮,即蛻下舊表皮的同時(shí)合成新的初生表皮,舊表皮中的幾丁質(zhì)會(huì)被降解、吸收、重新利用[7-8],而這些過(guò)程無(wú)不依賴(lài)于具有生物催化水解活性的幾丁質(zhì)酶[5,9-10],特別是昆蟲(chóng)體內(nèi)某些幾丁質(zhì)酶家族成員的功能是獨(dú)一無(wú)二不可替代的。因此,昆蟲(chóng)體內(nèi)幾丁質(zhì)酶的表達(dá)與合成影響著昆蟲(chóng)的蛻皮、化蛹、羽化及圍食膜再生等重要生理活動(dòng)。探究幾丁質(zhì)酶基因的功能和作用機(jī)制,可為害蟲(chóng)防治和經(jīng)濟(jì)昆蟲(chóng)育種提供理論參考或重要的靶標(biāo)分子。
已有研究發(fā)現(xiàn),有的幾丁質(zhì)酶基因雖然在昆蟲(chóng)整個(gè)生長(zhǎng)發(fā)育時(shí)期均有表達(dá),但只在羽化階段起作用[5,7,9,11];而有的幾丁質(zhì)酶基因則在昆蟲(chóng)整個(gè)生長(zhǎng)發(fā)育時(shí)期都有表達(dá)且發(fā)揮重要作用[12]。幾丁質(zhì)酶的生理活性主要受pH值、溫度、金屬離子、作用底物等影響,除此之外,昆蟲(chóng)不同組織部位中的幾丁質(zhì)酶活性也有所不同[10]。對(duì)幾丁質(zhì)酶的催化作用研究也已經(jīng)相當(dāng)深入,因此目前對(duì)幾丁質(zhì)酶的研究主要集中在幾丁質(zhì)酶及類(lèi)似蛋白質(zhì)的結(jié)構(gòu)與功能方面。
中華按蚊(Anophelessinensis)在我國(guó)除新疆和青海以外的省份均有分布,是我國(guó)平原地區(qū)瘧疾傳播的重要媒介昆蟲(chóng)。因此,中華按蚊的防控對(duì)維護(hù)人類(lèi)健康具有重要意義。本項(xiàng)研究針對(duì)中華按蚊的幾丁質(zhì)酶基因家族進(jìn)行全基因組鑒定分析,并將中華按蚊幾丁質(zhì)酶基因與岡比亞按蚊(Anophelesgambiae)、黑腹果蠅(Drosophilamelanogaster)、赤擬谷盜(Triboliumcastaneum)、埃及伊蚊(Aedesaegypti)、家蠶(Bombyxmori)等昆蟲(chóng)的幾丁質(zhì)酶基因進(jìn)行系統(tǒng)進(jìn)化分析,為下一步對(duì)中華按蚊幾丁質(zhì)酶基因的表達(dá)及功能研究打下基礎(chǔ)。
中華按蚊基因組和蛋白質(zhì)數(shù)據(jù)來(lái)自于重慶師范大學(xué)昆蟲(chóng)與分子生物學(xué)實(shí)驗(yàn)室,岡比亞按蚊、赤擬谷盜、黑腹果蠅和埃及伊蚊4種昆蟲(chóng)的幾丁質(zhì)酶的氨基酸序列來(lái)源于NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/genbank/),家蠶的幾丁質(zhì)酶的氨基酸序列來(lái)源于SGID數(shù)據(jù)庫(kù)(http://sgid.popgenetics.net/)。
根據(jù)已報(bào)道的代表性昆蟲(chóng)的幾丁質(zhì)酶基因編號(hào),在 NCBI數(shù)據(jù)庫(kù)中下載其氨基酸序列和DNA序列。以岡比亞按蚊的幾丁質(zhì)酶氨基酸序列為種子序列在中華按蚊蛋白質(zhì)數(shù)據(jù)庫(kù)進(jìn)行本地序列對(duì)比,并對(duì)其氨基酸序列進(jìn)行結(jié)構(gòu)域預(yù)測(cè),根據(jù)包含 Glyco hydro 18這一幾丁質(zhì)酶特征結(jié)構(gòu)域,初步判定幾丁質(zhì)酶基因,從而初步得到中華按蚊中候選的幾丁質(zhì)酶基因的編碼產(chǎn)物。此外,綜合NCBI多序列比對(duì)結(jié)果、HMMER3.0同源建模搜索結(jié)果,以及FGENESH在線預(yù)測(cè)結(jié)果(http://www.softberry.com/berry.phtml),最終確定中華按蚊中預(yù)測(cè)的幾丁質(zhì)酶基因。
中華按蚊幾丁質(zhì)酶蛋白的基本理化性質(zhì)在ExPASyProtParam Server(http://web.expasy. org/protparam/)網(wǎng)站上預(yù)測(cè)得到。利用NCBI的在線程序Batch CD-Search(https://www.ncbi.nlm.nih.gov/Structure/ bwrpsb/bwrpsb.cgi)對(duì)幾丁質(zhì)酶蛋白的結(jié)構(gòu)域進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)位置提取出所有結(jié)構(gòu)域序列(多個(gè)結(jié)構(gòu)域記為AsCht10-dm-a、AsCht10-dm-b、AsCht10-dm-c等)。
結(jié)合中華按蚊的gff注釋文件或者預(yù)測(cè)結(jié)果繪制幾丁質(zhì)酶基因的外顯子和內(nèi)含子的位置結(jié)構(gòu)圖以及幾丁質(zhì)酶基因在染色體上的分布圖,通過(guò)結(jié)構(gòu)域預(yù)測(cè)結(jié)果繪制幾丁質(zhì)酶基因的結(jié)構(gòu)域圖。
聯(lián)合構(gòu)樹(shù)序列文件是所有比對(duì)物種幾丁質(zhì)酶蛋白的結(jié)構(gòu)域序列集合,并使用MAFFTT Alignment(https://mafft.cbrc.jp/alignment/server/)進(jìn)行多重序列比對(duì),隨后使用IQtree 2.1.3版本對(duì)對(duì)齊序列文件進(jìn)行系統(tǒng)發(fā)育樹(shù)的構(gòu)建,各分支重復(fù)檢驗(yàn)次數(shù)為1 000次。
將DNAsp用于分析幾丁質(zhì)酶家族基因的替換率以計(jì)算選擇壓力,將單個(gè)中華按蚊幾丁質(zhì)酶基因與岡比亞按蚊中的直系同源基因作為一個(gè)組合進(jìn)行選擇壓力的分析。
通過(guò)與岡比亞按蚊和黑腹果蠅的幾丁質(zhì)酶氨基酸序列比對(duì),篩選出22個(gè)預(yù)測(cè)的中華按蚊幾丁質(zhì)酶基因。進(jìn)一步通過(guò)FGENESH程序在中華按蚊基因組中發(fā)現(xiàn)1個(gè)未被注釋的區(qū)域,也可能包含有幾丁質(zhì)酶基因。氨基酸序列分析結(jié)果顯示:這些預(yù)測(cè)基因的編碼產(chǎn)物均包含幾丁質(zhì)酶的保守基序FDGXDLDWEYP、KXXXXXGGW、MXYDXXG、GXXXWXXDXD中的1條或多條。另外,預(yù)測(cè)蛋白質(zhì)中均含有幾丁質(zhì)酶中的DWEYP特征基序;預(yù)測(cè)蛋白質(zhì)中均存在 Glyco hydro 18這一幾丁質(zhì)酶特征結(jié)構(gòu)域。因此,我們初步推測(cè)中華按蚊的基因組中存在23個(gè)幾丁質(zhì)酶基因。
從表1可見(jiàn),預(yù)測(cè)的幾丁質(zhì)酶參考蛋白質(zhì)序列長(zhǎng)度為271~2 361 aa,理論分子質(zhì)量為30.49~264.06 kDa,等電點(diǎn)為5.05~8.61。
表1 中華按蚊23個(gè)幾丁質(zhì)酶的基本特性
不同幾丁質(zhì)酶的序列長(zhǎng)度差異較大。結(jié)構(gòu)域分析表明,幾丁質(zhì)酶AsCht5-4A、AsCht5-5、AsCht8、AsCht11、AsCht13、AsCht16不含信號(hào)肽;而其余的幾丁質(zhì)酶均含有信號(hào)肽。據(jù)此初步判斷中華按蚊中的大多數(shù)幾丁質(zhì)酶屬于分泌型蛋白質(zhì),會(huì)被分泌到胞外,后續(xù)可能參與表皮中幾丁質(zhì)的降解代謝。
中華按蚊的23個(gè)幾丁質(zhì)酶編碼基因的外顯子數(shù)目差異較大,其分布數(shù)量為2~13個(gè),其中AsCht6、AsCht11分別擁有13和8個(gè)外顯子(圖1)。
藍(lán)色為外顯子,紅色為內(nèi)含子。
中華按蚊的大多數(shù)幾丁質(zhì)酶基因包含1個(gè)或2個(gè)編碼Glyco hydro 18結(jié)構(gòu)域的特征序列;而AsCht10有4個(gè)編碼Glyco hydro 18結(jié)構(gòu)域的特征序列,這與岡比亞按蚊、黑腹果蠅等昆蟲(chóng)Cht10基因編碼多結(jié)構(gòu)域的情況相一致(圖2)。
圖2 中華按蚊23個(gè)幾丁質(zhì)酶基因編碼蛋白質(zhì)的結(jié)構(gòu)域示意圖
23個(gè)幾丁質(zhì)酶基因分別位于14個(gè)scaffold上(圖3)。岡比亞按蚊的Cht6、Cht11位于X染色體上,我們推測(cè)這2個(gè)基因在中華按蚊中的直系同源基因AsCht6和AsCht11可能也位于X染色體上。Cht5亞家族成員在岡比亞按蚊和埃及伊蚊中均存在不少于3個(gè)拷貝的形式,且串聯(lián)成簇排列。中華按蚊中存在3個(gè)IDGF基因,且成簇分布;而埃及伊蚊和岡比亞按蚊中,均只存在其中的2個(gè)IDGF基因(表2)。
圖中每個(gè)scaffold的右邊為基因名稱(chēng),左邊為該基因的起始位置。
表2 中華按蚊23個(gè)幾丁質(zhì)酶基因及其對(duì)應(yīng)的岡比亞按蚊直系同源基因的位置信息比對(duì)
根據(jù)中華按蚊與岡比亞按蚊、黑腹果蠅、赤擬谷盜、埃及伊蚊和家蠶等昆蟲(chóng)的幾丁質(zhì)酶Glyco hydro 18結(jié)構(gòu)域序列構(gòu)建的ML系統(tǒng)發(fā)生樹(shù)如圖4所示,據(jù)此將該類(lèi)幾丁質(zhì)酶的編碼基因劃分為9個(gè)亞家族。
As—中華按蚊Anopheles sinensis,Aa—埃及伊蚊Aedes aegypti,Ag—岡比亞按蚊Anopheles gambiae, Dm—黑腹果蠅Drosophila melanogaster,Bm—家蠶Bombyx mori, Tc—赤擬谷盜Tribolium castaneum;利用最大似然法進(jìn)行構(gòu)建,各分支上的數(shù)字表示bootstrap值。
亞家族Ⅰ主要包含中華按蚊的AsCht5,其中AsCht5-4A、AsCht5-4B與岡比亞按蚊AgCht5-4的bootstrap值>80,支持其與AgCht5-4同源,故中華按蚊中存在2個(gè)Cht5-4基因,推測(cè)其可能經(jīng)歷了基因重復(fù)而形成;AsCht5-6和AsCht5-7則聚類(lèi)在此家族的另一分支上,且bootstrap值較高,推測(cè)二者可能為此家族獨(dú)立演化出的旁系基因。
亞家族Ⅱ、Ⅲ、Ⅵ、Ⅶ、Ⅷ和Ⅸ均只包含1種幾丁質(zhì)酶基因,且分別獨(dú)立聚類(lèi)為一支。其中,亞家族Ⅱ僅包括Cht10,亞家族Ⅲ僅包括Cht7,亞家族Ⅵ僅包括Cht6,亞家族Ⅶ僅包括Cht2,亞家族Ⅷ僅包括Cht11,亞家族Ⅸ僅包括Cht12。值得一提的是亞家族Ⅱ中TcCht10和BmCht10的第一個(gè)Glyco hydro 18結(jié)構(gòu)域編碼序列出現(xiàn)分離現(xiàn)象并與亞家族Ⅴ聚在一起,此現(xiàn)象還曾出現(xiàn)在Ye Pan等[13]構(gòu)建的系統(tǒng)發(fā)育樹(shù)中。
亞家族Ⅳ包含的幾丁質(zhì)酶基因數(shù)目眾多,包括AsCht8、AsCht9、AsCht4、AsCht13、AsCht16。值得一提的是在中華按蚊中AsCht4和AsCht16僅有1個(gè)拷貝,而岡比亞按蚊中的AgCht4與AgCht23,以及AgCht16與AgCht24高度同源(bootstrap值>80),為高度相似基因,我們推測(cè)這些基因的形成可能與基因重復(fù)事件相關(guān)。
亞家族Ⅴ主要包括幾丁質(zhì)酶類(lèi)似蛋白編碼基因,包括:IDGF1、IDGF2、IDGF4。系統(tǒng)發(fā)生樹(shù)顯示:AsIDGF1與AsIDGF2分別與埃及伊蚊中的直系同源基因聚類(lèi),AsIDGF4與岡比亞按蚊中的AgIDGF4聚在一起,且AsIDGF1與AsIDGF4所在支的bootstrap值僅為65,暗示二者間在演化過(guò)程中產(chǎn)生了較大的分化。
以岡比亞按蚊作為參照,對(duì)中華按蚊中Cht5、Cht8、Cht9這3個(gè)幾丁質(zhì)酶基因家族成員進(jìn)行選擇壓力分析。這些基因的Ka/Ks值均<1,暗示它們受到純化選擇(表3),推測(cè)這些幾丁質(zhì)酶基因家族成員可能在中華按蚊的重要生理過(guò)程中有不可或缺的作用。
表3 中華按蚊3個(gè)幾丁質(zhì)酶基因家族成員的 選擇壓力
本項(xiàng)研究采用生物信息學(xué)方法鑒定了中華按蚊的23個(gè)幾丁質(zhì)酶基因。對(duì)幾丁質(zhì)酶基因的分布進(jìn)行分析發(fā)現(xiàn),Cht6、Cht11同時(shí)存在于岡比亞按蚊和果蠅的性染色體上,此外在中華按蚊、淡色按蚊(Anophelesalbimanus)、黑小按蚊(Anophelesatroparvus)中的分布位置均是如此(未發(fā)表數(shù)據(jù))。推測(cè)這2個(gè)基因間以及其與性染色體間可能存在連鎖關(guān)系,對(duì)此需進(jìn)一步通過(guò)實(shí)驗(yàn)驗(yàn)證,這可以為后續(xù)針對(duì)性別特異性基因的研究提供基礎(chǔ)數(shù)據(jù)。在前期的研究中發(fā)現(xiàn),中華按蚊某些幾丁質(zhì)酶基因的表達(dá)具有雌雄特異性(未發(fā)表數(shù)據(jù)),這預(yù)示著對(duì)其表達(dá)的性別特異性進(jìn)行更加深入的研究將為害蟲(chóng)的靶向防治提供新的思路。同時(shí),或可為研究其他昆蟲(chóng)中類(lèi)似基因在性別二態(tài)型中所扮演的角色起推動(dòng)作用。
我們?cè)谘芯恐羞€發(fā)現(xiàn),不同昆蟲(chóng)的幾丁質(zhì)酶種類(lèi)盡管大致相似,但其數(shù)量卻呈現(xiàn)較大差異。有的昆蟲(chóng)可以通過(guò)基因重復(fù)這一方式,增加類(lèi)似功能的幾丁質(zhì)酶基因拷貝數(shù)量來(lái)調(diào)控其表達(dá)水平,進(jìn)而行使其相應(yīng)的生理功能。