柯 野,楊家臣,屈奇奇,袁小枚,黃鏡如
(韶關(guān)學(xué)院英東生物與農(nóng)業(yè)學(xué)院,廣東 韶關(guān) 512005)
【研究意義】近年來,由于全球畜牧產(chǎn)業(yè)飛速發(fā)展,全球每年產(chǎn)生廢棄羽毛成千上萬噸[1]。羽毛富含角蛋白具有的獨特天然結(jié)構(gòu),致使其難被降解,成為了蛋白資源廢棄物以及病源微生物滋生的污染物[2-3]。為了對廢棄羽毛的高值化開發(fā)利用、保護(hù)生態(tài)環(huán)境,分離、純化和篩選出羽毛高效降解微生物菌株成為了研究者關(guān)注的熱點。【前人研究進(jìn)展】從自然界分離獲得降解廢棄羽毛的微生物已經(jīng)超過30種,在細(xì)菌[2,4-6]、放線菌[7]和真菌[8-9]中均有分布。多數(shù)能降解羽毛的真菌同時也有致病性,這限制其應(yīng)用[10],因此,多數(shù)研究集中在放線菌和細(xì)菌。目前所報道微生物對羽毛的降解能力有限,尚達(dá)不到工業(yè)化生產(chǎn)的水平。這主要由于當(dāng)羽毛粉濃度高于1.5%,微生物菌株產(chǎn)生的胞外蛋白酶被抑制,致使羽毛的降解效率下降[8];如JAIN R等[7]發(fā)現(xiàn)StreptomycesexfoliatusCFS 1068菌株對0.5%濃度的羽毛降解率為96.6%,對2.0%羽毛粉的降解率僅為72.1%?!颈狙芯壳腥朦c】筆者在前期研究中分離篩選獲得一株S.sp.DJ菌株,該菌株在羽毛含量為5.0%的情況下,對羽毛的降解率高達(dá)50.0%;該DJ菌株對羽毛的降解率是現(xiàn)有文獻(xiàn)報道中對高羽毛濃度降解效果最好的菌株之一[11]?!緮M解決的關(guān)鍵問題】為了探究該菌株對羽毛高效降解的原因,預(yù)測分析羽毛降解的相關(guān)角蛋白酶基因及其酶結(jié)構(gòu)特征,采用二代高通量測序技術(shù)對S.sp.DJ菌株進(jìn)行全基因組測序,并將其基因組序列提交至美國國立生物基礎(chǔ)信息中心的Genbank數(shù)據(jù)庫中,獲得登錄號為PKSK00000000。進(jìn)一步對該基因組序列進(jìn)行了比對分析,深入分析其編碼分泌角蛋白酶的序列與結(jié)構(gòu),以期能對Streptomycessp.DJ菌株高效降解羽毛的角蛋白酶機(jī)理提供參考。
1.1.1 菌株來源 羽毛降解菌(Streptomycessp.) DJ菌株,是韶關(guān)學(xué)院的英東生物與農(nóng)業(yè)學(xué)院微生物學(xué)實驗室分離純化獲得的一株高效分解羽毛菌株,由本實驗室提供。
1.1.2 培養(yǎng)基 LB培養(yǎng)基:酵母提取物0.5%,蛋白胨1.0%,NaCl 1.0%,pH 7.0左右。
1.1.3 試劑 酵母提取物、蛋白胨、瓊脂糖等購自生工生物工程(上海)股份有限公司,其他化學(xué)試劑均為國產(chǎn)分析純試劑。
1.2.1 DJ菌株的培養(yǎng)及其基因組DNA的提取 將DJ菌株接種于LB培養(yǎng)液中,37 ℃、180 r/min培養(yǎng)2~3 d后,1000 r/min離心5 min收集菌體,按照酵母DNA快速分離方法[11],對DJ菌株的基因組DNA進(jìn)行提取,電泳鑒定基因組DNA質(zhì)量。
1.2.2 DJ菌株的基因組測序、組裝及其基因組注釋 將電泳鑒定合格后的基因組DNA 送至生工生物工程(上海)股份有限公司進(jìn)行全基因組測序。采用Illumina Hiseq 2500平臺對DJ菌株基因組進(jìn)行高通量測序,對測序的原始數(shù)據(jù)采用FastQC質(zhì)量評估后,利用Trimmomatic對數(shù)據(jù)進(jìn)行質(zhì)量剪切,獲得相對準(zhǔn)確的有效數(shù)據(jù)后;利用SPAdes對測序數(shù)據(jù)進(jìn)行拼裝,之后采用Kmer值進(jìn)行組裝,最終根據(jù)各Kmer值組裝獲得最佳的序列結(jié)果。將獲得DJ菌株的基因組序列提交至GenBank數(shù)據(jù)庫,根據(jù)NCBI網(wǎng)站提供的Prokaryotic GenomeAnnotation Pipeline注釋系統(tǒng)對基因功能進(jìn)行預(yù)測和注釋,同時也利用NCBI Blast+將基因蛋白序列與NT、NR、CDD、COG、GO、KEGG和TrEMBL等多個數(shù)據(jù)庫進(jìn)行比對,進(jìn)一步確定注釋基因的結(jié)構(gòu)與功能。
1.2.3 DJ菌株角蛋白酶基因的序列分析 運用Bio-Edit 7.0軟件對基因和角蛋白酶的序列組成、比對等的分析,http://www.cbs.dtu.dk/services/SignalP/的SignalP 5.0軟件和http://www.softberry.com中蛋白定位的ProtCompB 9.0軟件對酶定位分析,https://swissmodel.expasy.org/網(wǎng)站進(jìn)行同源建模以及模型評估,Discovery Studio 2.5軟件、VMD 1.9 軟件和DeepView軟件對角蛋白酶的結(jié)構(gòu)分析。
采用SPAdes 3.5.0軟件對DJ菌株的高通量測序結(jié)果進(jìn)行拼接,獲得測序片段,最長為91 450 bp,平均片段長度為2540 bp,拼接獲得2058 個contigs,N50大小為3327 bp。進(jìn)一步利用GapFiller 1.11軟件對contig補(bǔ)GAP,采用PrInSeS-G 1.0.0軟件對序列矯正后,獲得完整的DJ菌株基因組序列,該序列全長5 225 166 bp,其中GC含量為72%,預(yù)測編碼5668個基因,基因序列占整個基因組序列72.65%,基因平均長度756.70 bp,將該全長序列提交到GenBank數(shù)據(jù)庫(登錄號PKSK00000000)。通過GenBank數(shù)據(jù)庫的基因注釋系統(tǒng)分析,DJ菌株基因組中共Genes (total) 5668個,CDS (total)5592個,其中CDS (coding) 為5338個,將每個CDS編碼的氨基酸序列與NT、NR、CDD、COG、GO、KEGG和TrEMBL等數(shù)據(jù)進(jìn)行比對,其中有4456個序列能被同源基因注釋分類。
根據(jù)DJ菌株基因組的注釋分類結(jié)果,在4456個基因中有42個基因是編碼蛋白酶的基因。由于DJ菌株是分泌胞外蛋白酶對羽毛進(jìn)行降解;因此,利用http://www.cbs.dtu.dk/services/SignalP/的SignalP 5.0軟件和http://www.softberry.com中蛋白定位的ProtCompB 9.0軟件,對42個預(yù)測的蛋白酶分析可知,其中14個肽酶分泌到胞外,前期研究表明,DJ菌株分泌到胞外降解羽毛的蛋白酶主要為絲氨酸角蛋白酶[11]。在這14個分泌胞外的肽酶中有9個絲氨酸蛋白酶,即3個胰蛋白酶、2個類胰蛋白酶、4個類Subtilase;目前角蛋白酶一般都被歸類為subtilisin-like超家族(屬于絲氨酸蛋白酶,S8家族),當(dāng)然并不是subtilisin-like超家族的蛋白酶都能降解角蛋白[12],在這4個類Subtilase酶中,其中3個酶(GenBank數(shù)據(jù)庫的登錄號分別為:PLW69544.1、PLW71753.1和PLW71754.1)與已發(fā)現(xiàn)的角蛋白具有較高的序列同源性;因此,本論文僅對該3個角蛋白酶的結(jié)構(gòu)進(jìn)行分析。
由表1可知,3種角蛋白酶的肽鏈長度差異顯著,最長為522 aa,最短為386 aa,相差高達(dá)136 aa,但是3種角蛋白酶肽鏈中含量最多為G和A,最少為W或C,肽鏈主要由疏水性的非極性氨基酸(A,V,L,I,F(xiàn),W,M和P)和極性氨基酸(A,V,L,I,F(xiàn),W,M和P)組成,占肽鏈總氨基酸殘基數(shù)83(mol,%)左右,而酸性和堿性氨基酸含量差異不大,都約占肽鏈氨基酸量的17(mol,%)左右。3種角蛋白酶的信號肽切割位點不完全一致(26或34),3種角蛋白酶的前導(dǎo)肽長度均為71~78 aa,成熟肽長度均為274~278 aa,長度差異較小。
利用3種角蛋白酶的保守區(qū)域與來自MeiothermustaiwanensisWR-220的角蛋白酶(PDB數(shù)據(jù)庫code:5WSL.1.A)的氨基酸序列同源性高達(dá)60%以上[13],根據(jù)同源性高于30%以上可建模的理論,這3種角蛋白酶以5WSL.1.A為模板進(jìn)行同源建模;利用Ramachandran軟件對建模的3種酶分別進(jìn)行模型的合理性評估,每種酶的肽鏈主鏈中φ角和ψ角均在合理范圍之內(nèi),表明3種角蛋白酶的建模結(jié)構(gòu)合理,可用于酶結(jié)構(gòu)分析。
3種角蛋白酶3-D結(jié)構(gòu)序列在自身肽鏈位置如表1所示,而3種角蛋白酶及其模板(PDB code:5WSL.1.A)的序列比對及其二級結(jié)構(gòu)結(jié)果如圖1所示。將PLW69544.1、PLW71753.1和 PLW71754.1編碼的角蛋白酶分別命名為K1、K2和K3;對于3-D結(jié)構(gòu)中氨基酸殘基的編號,以序列比對中模板5WSL的第1個A氨基酸殘基的編號為1,往后殘基編號以此類推。由圖1可知,4種角蛋白酶包含α 螺旋6個、310α 螺旋2個和β折疊15個。4種角蛋白酶的催化三聯(lián)體D/H/S前后的氨基酸殘基均非常保守;為了確保酶的催化水解能力,雖然催化三聯(lián)體殘基在一級結(jié)構(gòu)上相距較遠(yuǎn),但是通過空間結(jié)構(gòu)(即催化三聯(lián)體殘基分別位于第3個 β 折疊、第2個α螺旋和第6個α螺旋上)將3個殘基的距離靠近,以確保其催化水解功能。
5wsl角蛋白酶中存在2個二硫鍵(C69~C101,C165~C196),表明這2個二硫鍵有助于該酶的熱穩(wěn)定[13]。然而K1中2個二硫鍵位點均為C,表明K1中存在2個二硫鍵;而K2和K3中4個位點殘基分別為GG、DN、SS和GI,且其他位點均無C殘基,表明K2和K3中未有二硫鍵形成。
這4種酶的部分loop環(huán)中有脯氨酸殘基,如在270位點,4種酶都有脯氨酸殘基來穩(wěn)定loop結(jié)構(gòu),而在含有242位點的loop環(huán)中,只有5wsl和K2酶具有脯氨酸殘基;因此,脯氨酸殘基維持loop環(huán)穩(wěn)定性的差異也可能導(dǎo)致4種酶具有不同熱定性。
表1 3種角蛋白酶的一級結(jié)構(gòu)分析
“→”表示β折疊,“”表示螺旋,“▲”表示催化位點 ‘→’ indicated β sheets,“”indicated helixes,‘▲’indicated catalytic sites圖1 3種角蛋白酶與M.taiwanensis角蛋白酶(PDB code:5WSL.1.A)的序列及其二級結(jié)構(gòu)分析Fig.1 Analysis of sequences and secondary structures of three kinds of keratinases and Meiothermus taiwan keratinase (PDB code:5WSL.1.A)
Ca2+對酶的正確折疊、結(jié)構(gòu)穩(wěn)定性以及熱穩(wěn)定的提高具有重要作用[14]。5WSL中有2個Ca2+結(jié)合,1Ca是V172和G175主鏈羰基O、T177的Oγ相結(jié)合,K1、K2和K3的172和175位點分別為A/V/V和A/A/A,雖然與模板的殘基不一致,但都有主鏈羰基O;177位點殘基分別為S/T/T,S殘基具有Oγ,與WSL T177的Oγ位置一致,表明K1、K2和K3都具有1Ca結(jié)合。5WSL中的2Ca對穩(wěn)定酶表面位于α1螺旋和β2折疊間的loop環(huán)具有作用;2Ca是D11和D14的Oδ1(分別相距Ca為2.322?和2.370?,D14的Oδ2與Ca相距3.634?,未能與Ca相結(jié)合),D11和T23主鏈羰基O(分別相距Ca為2.475?和2.348?),S21的Oγ以及Q15的Oε與Ca相結(jié)合(分別相距Ca為2.518?和2.268?)。在K1、K2和K3中,11、14和15位點為保守的D、D和Q;23位點分別為S/K/S,由于該位點主鏈羰基O與Ca結(jié)合,殘基保守性對Ca結(jié)合影響不大。21位點分別為S/D/N,K1和5WSL一致,表明K1有2Ca;對于K2酶,D殘基的Oδ具有2個O,Oδ1和Oδ2與Ca分別相距3.984?和5.371?,K3酶中N殘基的Oδ與Ca相距5.150O?,這表明K2和K3的21位點雖有O,但其與Ca相距遠(yuǎn),不利于Ca結(jié)合;因此,在K2和K3酶中可能沒有2Ca。
由圖2可知,S4底物結(jié)合區(qū)域是由保守殘基序列104~107和132~136圍成的口袋形狀,139位點殘基位于口袋底部,99和110位點殘基位于口袋的底側(cè)。在104~107序列中,4種酶都有高度保守的S104G105殘基,106和107位點殘基的保守性較差。106位點的殘基側(cè)鏈基團(tuán)面向溶劑,未占S4空間;5wsl和K1是S殘基,K2和K3是T殘基,S和T殘基的側(cè)鏈僅相差一個甲基,該甲基占據(jù)空間較??;因此,該位點的殘基變化對S4影響不顯著。對107位點,5wsl、K2和K3分別是N、L和T殘基,這3個殘基側(cè)鏈基團(tuán)與136位點殘基連在一起圍成S4,該位點側(cè)鏈基團(tuán)越大,越利于擴(kuò)大S4,這導(dǎo)致3種酶的S4大小具有差異。在K1中,107位點為Y,Y殘基的側(cè)鏈苯環(huán)基團(tuán)直接進(jìn)入占據(jù)S4區(qū)域,與132~134構(gòu)成S4口袋,這導(dǎo)致該K1的S4明顯小于其他3種酶。在5wsl、K2和K3的S4底部是高度保守的139位點殘基L組成,而且在K1中,由于107位點殘基直接進(jìn)入S4形成口袋,導(dǎo)致其S1口袋顯著小于其他3種酶,其底部由110位點的I殘基構(gòu)成。
S3底物結(jié)合區(qū)域由保守G132和G103S104殘基構(gòu)成,無明顯口袋形狀,本區(qū)域容納底物P3位點的殘基主鏈,且底物P3位點的殘基側(cè)鏈朝向溶劑,未與S3進(jìn)行結(jié)合。
S2底物結(jié)合區(qū)域是一個“cleft”構(gòu)造,在4種酶中,構(gòu)成S2的重要殘基位點均高度保守,如G103和H72殘基位于S2側(cè)邊,L99、D39和T40殘基位于S2底部,N70位于S2的邊緣,其中D39和H72殘基為4種酶的活性位點殘基。
紅色表示正電荷氨基酸殘基,藍(lán)色表示負(fù)電荷殘基,不同的顏色表示不同的S1、S2、S3、S4和S2`底物結(jié)合區(qū)域。a:5wsl;b:K1角蛋白酶;c:K2角蛋白酶;d:K3角蛋白酶 Red indicated positive charged amino acid residues,blue indicated negative charge amino acid residues,different colors respectively indicated different substrate binding regions of S1,S2,S3,S4 and S2.a:5wsl;b:K1keratinase;c:K2keratinase;d:K3keratinase圖2 3種角蛋白酶與角蛋白酶(PDB code:5WSL.1.A)的底物結(jié)合區(qū)域比較Fig.2 Analysis of substrate binding region of three kinds of keratinases and M.taiwan keratinase (PDB code:5WSL.1.A)
S1底物結(jié)合區(qū)域具有明顯的口袋構(gòu)造,S1主要由殘基序列131~133、159~160以及167殘基圍成,其底部由高度保守A156構(gòu)成,底側(cè)部由高度保守的A157G158構(gòu)成。在131~133殘基序列中,5WSL、K1、K3是保守的LGG殘基,而K2是VGG殘基,L的側(cè)鏈比V多一個CH2基團(tuán),但是L或V殘基的側(cè)鏈基團(tuán)朝向酶分子內(nèi)部,不占據(jù)S1口袋空間;雖然這兩個殘基不保守。但是并不影響S口袋構(gòu)造。在159~160殘基序列中,5WSL、K1、K3的159位點均為高度保守的N殘基, K2為S殘基;雖然S側(cè)鏈殘基比N殘基少NH2基團(tuán),但是這兩種殘基的側(cè)鏈面向溶劑,雖然該位點殘基不保守,但對4種酶S1影響不顯著。對于160位點殘基,5WSL和K2是不帶電荷的S殘基,K1和K3為帶負(fù)電荷的D殘基,該位點殘基的大小相比較于帶電荷而言,帶電荷情況對酶的底物特異性具有較大的影響[15];因此,K1、K3相對于5WSL、K2更偏向于P1帶正電荷的底物,更排斥P1帶負(fù)電荷的底物。167位點的殘基非常不保守,5WSL為F,K1和K3酶為Y,K2為S,對于F和Y殘基的側(cè)鏈有苯環(huán)基團(tuán),猶如對S1口袋該了一個蓋子,而S側(cè)鏈無苯環(huán),缺乏蓋子;因此,K2的S1具有更大的空間容納底物P1的側(cè)鏈。
S2`底物結(jié)合區(qū)域主要由159、190、221和222位點殘基形成。在S2`中,如對S1的分析,159位點的N或S殘基對S2`影響不大;對于190位點,為含有苯環(huán)側(cè)鏈基團(tuán)的Y(5wsl)或F(K1、K2和K3)殘基,正如多數(shù)subtilisin-like 超家族酶在該位點均為Y或者F殘基一樣,這個保守苯環(huán)側(cè)鏈基團(tuán)的取向決定了S2`的大小[16]。對于221和222位點,4種酶都分別是高度保守的S和G殘基構(gòu)成,為表現(xiàn)出任何差異。
蛋白質(zhì)一級序列結(jié)構(gòu)決定蛋白質(zhì)三維結(jié)構(gòu),三維結(jié)構(gòu)決定蛋白質(zhì)空間構(gòu)象,對其功能起到至關(guān)重要的作用。本研究中DJ菌株產(chǎn)生3種角蛋白序列的信號肽、前導(dǎo)肽和成熟肽在氨基酸殘基組成、極性和長度等方面較為保守一致,其催化三聯(lián)體(D/H/S)均為IDTG/NGHGTHV/SGTSM(V)A的Motif結(jié)構(gòu),表明3種酶屬于Subtilase超家族[16],具有相似水解角蛋白能力;但是這3種角蛋白酶α螺旋、β折疊、特別是無規(guī)卷曲、loop環(huán)間的氨基酸殘基存在差異,以及與報道的其他角蛋白之間存在氨基酸殘基的取代、替換、刪除差異,導(dǎo)致其具有不同的底物肽鍵偏好性[17]。特別對于底物結(jié)合區(qū)域而言,氨基酸性質(zhì)、序列差異、空間結(jié)構(gòu)直接決定了其度底物肽鍵的選擇性,這主要是由于酶通過S4-S1和S2`底物結(jié)合區(qū)域與底物P4-P1和S2`殘基結(jié)合底物的側(cè)鏈與之形成氫鍵,穩(wěn)定底物分子后,活性位點殘基對底物發(fā)起親核攻擊,實現(xiàn)切斷裂底物分子達(dá)到酶解作用。這3種酶的底物結(jié)合區(qū)域形態(tài)構(gòu)造大體一致,主要由疏水性殘基構(gòu)成;這表明對疏水性底物具有更強(qiáng)的水解能力,而對親水性強(qiáng)的底物水解能力較弱,這種水解能力與其他報道結(jié)果一致[11];對這幾種酶的S4-S1和S2`底物結(jié)合區(qū)域綜合分析而言,而這些酶S3、S2和S2`的重要構(gòu)成位點的氨基酸殘基非常保守,而在S1和S4中重要位點的氨基酸殘基保守性相對而言差一些,這也就直接體現(xiàn)出不同底物特異性。
在subtilisin-like超家族中,二硫鍵、脯氨酸和鈣離子結(jié)合的位點和數(shù)量是影響該類酶熱穩(wěn)定性的重要因素之一[18]。對于這類蛋白酶而言,一般天然自發(fā)形成的二硫鍵越多,熱穩(wěn)定性就越強(qiáng);因此,K1熱穩(wěn)定性可能比K2和K3更強(qiáng)。蛋白質(zhì)表面loop環(huán)中的脯氨酸限制了環(huán)結(jié)構(gòu)的柔性,使之具有剛性,有助于高溫下保持適當(dāng)結(jié)構(gòu),是保持其具有較強(qiáng)的熱定性因素之一;如aqualysin I的P5N、P240N、P7I和P268T突變體相對于野生型而言,熱穩(wěn)定性下降,特別是P7I和P268T突變體熱穩(wěn)定性顯著降低[19];在這3種酶中,K2具有脯氨酸殘基,可能比K1和K3有更強(qiáng)的穩(wěn)定性。在subtilisin-like超家族存在2個Ca2+結(jié)合,大多數(shù)具有第一個強(qiáng)結(jié)合(1Ca)位點,部分酶有第二個弱結(jié)合(2Ca位)點[20-21],K1具有1Ca和2Ca結(jié)合位點,而K2和K1只有1Ca結(jié)合位點,這表明K1可能具有更強(qiáng)的耐熱性。這些酶的耐熱性是二硫鍵、脯氨酸和鈣離子結(jié)合位點等多方面的綜合體現(xiàn)的結(jié)果,因此,可以對這些針對性強(qiáng)的位點進(jìn)行理性設(shè)計和改造,以提高其熱穩(wěn)定性[22]。
本論文對羽毛高效降解的Streptomycessp.DJ菌株進(jìn)行了全基因組的測序,通過對該基因組編碼的蛋白進(jìn)行預(yù)測分析,DJ菌株具有的高效降解羽毛的特性與其產(chǎn)生的3種角蛋白密切相關(guān),這3種角蛋白酶的氨基酸殘基含量、長度等差異不大,均是活性殘基為D/H/S的胞外絲氨酸蛋白酶,并且3種酶的3-D結(jié)構(gòu)中主要由6個α 螺旋、2個310α 螺旋和15個β折疊構(gòu)成,3種酶中K1酶具有2個二硫鍵,2個Ca2+結(jié)合位點,而K2和K3具有1個二硫鍵,1個Ca2+結(jié)合位點;3種酶都具有含有Pro殘基的loop環(huán),而在K2種含有這種loop環(huán)2個。3種酶都是主要偏向于對疏水性強(qiáng)的底物進(jìn)行水解,并且主要由S1和S4底物結(jié)合區(qū)域決定酶對底物水解的特異性,但是3種酶的S1和S底物結(jié)合區(qū)域重要位點的氨基酸殘基的不保守性,導(dǎo)致了3種酶對不同的底物特異性,這可能是DJ菌株分泌的3種酶對羽毛底物降解的互補(bǔ)性,導(dǎo)致對羽毛高效水解的重要因素之一。為了探究這些角蛋白酶對羽毛高效降解的機(jī)理,需進(jìn)一步對這些基因進(jìn)行克隆表達(dá)和定點突變,進(jìn)一步揭示其結(jié)構(gòu)與酶解機(jī)制。