張小梅,李單單,王祿山,趙越,陳冠軍
山東大學(xué)生命科學(xué)學(xué)院 微生物技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南 250100
纖維素酶家族及其催化結(jié)構(gòu)域分子改造的新進(jìn)展
張小梅,李單單,王祿山,趙越,陳冠軍
山東大學(xué)生命科學(xué)學(xué)院 微生物技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南 250100
張小梅, 李單單, 王祿山, 等. 纖維素酶家族及其催化結(jié)構(gòu)域分子改造的新進(jìn)展. 生物工程學(xué)報(bào), 2013, 29(4): 422?433.
Zhang XM, Li DD, Wang LS, et al. Molecular engineering of cellulase catalytic domain based on glycoside hydrolase family.Chin J Biotech, 2013, 29(4): 422?433.
纖維素酶的分子改造是其催化性能改進(jìn)及催化效率提升的重要手段。近年來(lái),組學(xué)技術(shù)與結(jié)構(gòu)測(cè)定技術(shù)的迅速發(fā)展,人們已建立了包括糖苷水解酶 (Glycoside hydrolase,GH) 在內(nèi)的碳水化合物活性酶組分?jǐn)?shù)據(jù)庫(kù)。通過(guò)對(duì)同一蛋白家族進(jìn)行序列比對(duì)、分子進(jìn)化分析與祖先基因重構(gòu),以結(jié)構(gòu)模建分析為指導(dǎo)的纖維素酶分子改造,可以明顯縮小序列或結(jié)構(gòu)的搜索空間,加快酶分子改造的速度,增大理性設(shè)計(jì)成功的概率;同時(shí)針對(duì)催化中心活性架構(gòu)的分析可以進(jìn)一步闡明纖維素酶的催化機(jī)理與酶分子持續(xù)性降解機(jī)制。文中主要對(duì)纖維素酶家族及其催化結(jié)構(gòu)域的分子改造取得的最新進(jìn)展作了綜述。在后基因組時(shí)代基于蛋白質(zhì)家族中的海量數(shù)據(jù)分析,以其保守結(jié)構(gòu)信息為指導(dǎo)的理性設(shè)計(jì),將會(huì)成為纖維素酶分子改造的重要方向,從而推動(dòng)生物質(zhì)轉(zhuǎn)化工藝的快速發(fā)展。
纖維素酶,糖苷水解酶家族,結(jié)構(gòu)生物信息學(xué),分子改造,理性設(shè)計(jì)
纖維素是構(gòu)成植物細(xì)胞壁的重要組分,是目前地球上含量最豐富的可再生性資源[1]。纖維素酶屬于糖苷水解酶類(lèi),是專(zhuān)門(mén)催化水解纖維素鏈中 β-1,4-糖苷鍵的一類(lèi)酶的總稱(chēng)。通過(guò)纖維素酶對(duì)纖維素類(lèi)生物質(zhì)進(jìn)行生物轉(zhuǎn)化,獲得相應(yīng)生物基產(chǎn)品及生物燃料,對(duì)解決能源危機(jī)及促進(jìn)社會(huì)可持續(xù)發(fā)展具有重要的戰(zhàn)略意義。但由于現(xiàn)有纖維素酶降解效率偏低、生產(chǎn)成本較高等因素限制了其在工業(yè)上的廣泛應(yīng)用[2]。通過(guò)分子生物學(xué)與蛋白質(zhì)工程手段進(jìn)行纖維素酶的分子改造,以改變其催化活性或其他反應(yīng)特性(如pH適應(yīng)范圍、熱穩(wěn)定性及持續(xù)催化能力等),不僅可以闡明天然纖維素酶的降解機(jī)制及其結(jié)構(gòu)與功能的進(jìn)化關(guān)系,同時(shí)也為進(jìn)一步對(duì)其進(jìn)行理性設(shè)計(jì)與改造,以獲得能夠滿(mǎn)足生物質(zhì)高效轉(zhuǎn)化的纖維素酶組分提供可能[3]。
纖維素酶主要是由各類(lèi)微生物產(chǎn)生的,其中絲狀真菌所產(chǎn)的典型游離纖維素酶分子具有多結(jié)構(gòu)域的構(gòu)架,包括碳水化合物結(jié)合模塊(Cellulose-binding module,CBM),其通過(guò)柔性的連接肽 (Linker) 連接至催化結(jié)構(gòu)域 (Catalytic domain,CD) 上,另外部分酶分子還含有其他結(jié)構(gòu)域。構(gòu)成厭氧細(xì)菌纖維小體的纖維素酶分子一般由一個(gè)對(duì)接模塊 (Dockerin) 通過(guò)連接肽與一個(gè)催化結(jié)構(gòu)域 (CD) 連接,其中對(duì)接模塊可與支架蛋白(Scaffoldin,又稱(chēng)作腳手架蛋白)的粘連模塊 (Cohesin) 結(jié)合,而支架蛋白一般還會(huì)存在一個(gè)CBM[4]。CBM在結(jié)合及降解天然纖維素的過(guò)程中具有重要作用[5];而CD則主要是催化糖苷鍵的斷裂。
根據(jù)蛋白質(zhì)結(jié)構(gòu)域中氨基酸序列的相似性,將不同物種來(lái)源的碳水化合物活性酶類(lèi)(Carbohydrate-Active enZYmes,CAZy)分成不同的蛋白質(zhì)家族 (http://www.cazy.org/)。其中糖苷水解酶現(xiàn)已有131個(gè)家族,纖維素酶類(lèi)分布在至少17個(gè)GH家族中,是糖苷水解酶數(shù)據(jù)庫(kù)中家族數(shù)目最多的一類(lèi)水解酶類(lèi)[6]。不同家族的纖維素酶具有不同的進(jìn)化起源與不同的演化歷史,有的 GH家族親緣關(guān)系較遠(yuǎn) (Deeply rooted evolutionarily),如 GH9家族的纖維素酶,產(chǎn)生該類(lèi)酶的生物種類(lèi)廣泛,有細(xì)菌 (包括好氧菌和厭氧菌)、真菌、植物與動(dòng)物 (原生動(dòng)物與白蟻),另外GH5與GH12家族的成員也廣泛分布于古菌、細(xì)菌與真菌三類(lèi)生物中;有的家族親緣關(guān)系較近 (Lightly rooted evolutionarily),如GH7家族只含有真菌的水解酶類(lèi),GH8家族只含有細(xì)菌產(chǎn)生的水解酶類(lèi)等等。有的家族盡管其親緣關(guān)系較近,但功能的演化卻非常迅速,如 GH7家族除含有內(nèi)切纖維素酶外,還含有高效降解結(jié)晶纖維素的外切纖維素酶類(lèi)[7]。另外,從微生物基因組角度分析,降解纖維素的微生物不同,其基因組中含有的纖維素酶家族也是不同的。從現(xiàn)已進(jìn)行全基因組測(cè)序的1 500余種微生物中發(fā)現(xiàn),其中40%以上的微生物其基因組中至少含有一種纖維素酶基因;而在高效降解纖維素的微生物基因組中,則一般會(huì)含有幾十條編碼纖維素酶的基因,且這些基因分屬不同的GH家族。如隸屬于絲狀真菌的瑞氏木霉Trichoderma Reesei(紅褐肉座菌Hypocrea jecorina的無(wú)性型),其分泌的纖維素酶主要分布于 GH5,GH6,GH7,GH12,GH45與GH61家族;放線(xiàn)菌中的褐色高溫單孢菌Thermobifida fusca主要有來(lái)自GH5,GH6,GH9與GH48家族的相關(guān)纖維素酶基因;而好氧細(xì)菌中哈氏噬纖維菌Cytophaga hutchinsonii主要產(chǎn)生GH5與GH9家族的相關(guān)纖維素酶[8];厭氧細(xì)菌中的熱纖梭菌Clostridium thermocellum主要產(chǎn)生GH5,GH8,GH9與GH48家族的相關(guān)蛋白[9]。
目前對(duì) CAZy家族的分類(lèi)是基于蛋白質(zhì)氨基酸序列相似性進(jìn)行的,分類(lèi)的基礎(chǔ)依據(jù)是序列相似度高于30%的即被歸為同一GH家族。由于蛋白質(zhì)的氨基酸序列與其折疊結(jié)構(gòu)具有一定關(guān)系,故若蛋白質(zhì)的氨基酸序列相似,其就有可能具有相同或相似的拓?fù)湔郫B結(jié)構(gòu),尤其是其活性部位的拓?fù)浣Y(jié)構(gòu)。這種以序列相似性為依據(jù)的 GH家族分類(lèi),為研究同一家族內(nèi)某一未知蛋白的結(jié)構(gòu)及催化機(jī)制提供了重要的信息。另外,基于拓?fù)浣Y(jié)構(gòu)的相似性,又將不同纖維素酶家族歸于相同的“族系 (Clan)”。根據(jù)水解過(guò)程中產(chǎn)物糖分子異頭碳羥基立體化學(xué)結(jié)構(gòu)的變化,將纖維素酶的催化斷鍵機(jī)制分為保留型或翻轉(zhuǎn)型兩種類(lèi)型[10]。同一家族具有相同的催化斷鍵機(jī)制;同一族系,甚至不同族系都可能會(huì)具有相同的斷鍵機(jī)制,表 1列出了部分主要纖維素酶家族的蛋白結(jié)構(gòu)折疊類(lèi)型、催化機(jī)制及其他主要信息。
根據(jù)纖維素酶降解底物時(shí)不同的作用方式可將其分成 3類(lèi):1) 內(nèi)切纖維素酶又稱(chēng)之為內(nèi)切葡聚糖酶 (Endoglucanase,EG;EC 3.2.1.4);2) 外切纖維素酶又稱(chēng)之為纖維二糖水解酶(Cellobiohydrolase,CBH;EC 3.2.1.91,EC 3.2.1.176);3) β-葡萄糖苷酶 (β-glucosidase,BGL;EC 3.2.1.21)。表2列出了GH家族中不同功能纖維素酶分子的分布情況。不同家族具有不同的蛋白質(zhì)結(jié)構(gòu)折疊類(lèi)型,而不同蛋白結(jié)構(gòu)進(jìn)化出相同功能活性的酶分子,這說(shuō)明蛋白功能進(jìn)化的收斂性。從其家族分布來(lái)看,內(nèi)切纖維素酶分布最廣,外切纖維素酶分布于內(nèi)切纖維素酶家族之中,β-葡萄糖苷酶僅在GH5和GH9家族與內(nèi)切/外切纖維素酶相關(guān)家族有交疊。同一蛋白質(zhì)家族具有相同的蛋白質(zhì)拓?fù)湔郫B結(jié)構(gòu),而相同的折疊結(jié)構(gòu)又有著明顯不同功能的酶組分,說(shuō)明同一家族的蛋白功能在進(jìn)化過(guò)程中發(fā)生了分歧演化。因此通過(guò)研究蛋白質(zhì)家族內(nèi)酶分子功能演化的結(jié)構(gòu)基礎(chǔ),將有助于對(duì)蛋白質(zhì)進(jìn)行有目的的理性設(shè)計(jì)。
大量纖維素酶結(jié)構(gòu)研究表明,內(nèi)切纖維素酶CD的活性部位是一個(gè)開(kāi)放的裂隙 (圖1A),可結(jié)合于纖維素鏈上,隨機(jī)切斷非結(jié)晶區(qū)的糖鏈,產(chǎn)生系列寡糖與新的還原末端。外切纖維素酶 CD的活性部位是一條孔道,纖維素的一條單鏈通過(guò)穿過(guò)該孔道而與CD結(jié)合,沿著纖維素鏈向結(jié)晶區(qū)單方向持續(xù)性催化 (Processive catalysis),產(chǎn)物一般為纖維二糖,因此又稱(chēng)為纖維二糖水解酶。根據(jù)結(jié)合分子鏈末端的不同,又將外切纖維素酶分成兩類(lèi):一類(lèi)作用于纖維素分子的非還原端(EC 3.2.1.91),這類(lèi)酶的典型代表是GH6家族的纖維素酶分子 (圖 1B);另一類(lèi)作用于纖維素鏈的還原端 (EC 3.2.1.176),該類(lèi)型的代表是由好氧真菌產(chǎn)生的GH7家族的纖維素酶分子 (圖1C)及由厭氧細(xì)菌產(chǎn)生的GH48家族酶分子 (圖1D)。已報(bào)道具有持續(xù)性降解作用的內(nèi)切纖維素酶多屬GH9家族 (圖1E),其活性部位與一般內(nèi)切纖維素酶相似,仍然是一開(kāi)放裂隙,該類(lèi)纖維素酶的催化結(jié)構(gòu)域與 CBM 的連接肽很短,其 CBM為第3家族,研究表明,該種結(jié)構(gòu)對(duì)于這類(lèi)酶分子的持續(xù)性降解是必需的[11]。
表1 主要纖維素酶家族*的基因序列、拓?fù)浣Y(jié)構(gòu)、催化機(jī)制及其成員信息統(tǒng)計(jì)表**Table 1 Statistics on the gene sequence, topological structure, catalytic mechanism and other information of the main glycoside hydrolase families*
表2 纖維素酶相關(guān)GH家族中不同功能糖苷水解酶的分布*Table 2 Distributions of glycoside hydrolases with different function in each cellulase relating GH family*
圖1 不同功能纖維素酶三維空間結(jié)構(gòu)示意圖Fig. 1 3D structures of different cellulases. (A) T. reesei Cel7B (PDB ID 1EG1). (B) T. reesei Cel6A (PDB ID 1QK2).(C) T. reesei Cel7A (PDB ID 1CEL). (D) C. thermocellum Cel48A (PDB ID 1L1Y). (E) T. fusca Cel9A (PDB ID 1JS4).Catalytic residues are shown in sticks (blue).
同一家族纖維素酶的分子結(jié)構(gòu)相對(duì)保守,但在長(zhǎng)期的進(jìn)化過(guò)程中卻演化出適應(yīng)不同環(huán)境的序列組成及功能特征。對(duì)纖維素酶家族序列與結(jié)構(gòu)的初步分析發(fā)現(xiàn),插入/缺失可以導(dǎo)致同一家族纖維素酶分子功能發(fā)生快速演化,并且該規(guī)律可推廣至多數(shù)蛋白質(zhì)家族;另外,SCOP數(shù)據(jù)庫(kù)(http://scop.mrc-lmb.cam.ac.uk/scop/) 中多數(shù)同源結(jié)構(gòu)家族中單氨基酸替換和插入/缺失對(duì)蛋白質(zhì)結(jié)構(gòu)的進(jìn)化具有共同作用[12];蛋白結(jié)構(gòu)發(fā)生插入/缺失后其側(cè)翼區(qū)域的二級(jí)及三級(jí)結(jié)構(gòu)變化明顯,同時(shí)可以降低側(cè)翼區(qū)域的選擇壓力,這是功能快速演化的結(jié)構(gòu)基礎(chǔ)[13-14]。所以針對(duì)家族內(nèi)酶分子的進(jìn)化分析,有助于認(rèn)識(shí)其序列空間多樣性與結(jié)構(gòu)空間有限性之間的關(guān)系,可以快速找出功能演化的決定因素,為后期進(jìn)行酶分子改造提供全新思路[15]。
木質(zhì)纖維素生物質(zhì)在長(zhǎng)期的進(jìn)化過(guò)程中形成了復(fù)雜的超分子結(jié)構(gòu),限制了微生物及相應(yīng)酶分子的有效降解,現(xiàn)在統(tǒng)稱(chēng)為“生物質(zhì)抗降解屏障”[2],其中綠色植物結(jié)晶纖維素是主要的降解限制因素之一。在纖維素合成時(shí),由纖維素合成酶系的末端復(fù)合體 (Terminal complex,TC) 同時(shí)完成36根葡萄糖鏈的合成,形成3 nm×5.5 nm左右的結(jié)晶狀微纖絲也稱(chēng)之為基元纖絲[2]。纖維素在酶解過(guò)程中,相應(yīng)的酶分子要從微纖絲上剝離單根糖鏈,這被認(rèn)為是限制纖維素水解的關(guān)鍵步驟。內(nèi)切纖維素酶隨機(jī)定位在微纖絲上的非結(jié)晶區(qū),產(chǎn)生大量還原端,而外切纖維素酶結(jié)合于單根纖維素鏈的還原端或非還原端,持續(xù)性地降解結(jié)晶區(qū)的纖維素分子鏈。由于結(jié)晶纖維素在木質(zhì)纖維素中含量較高,所以持續(xù)降解的外切纖維素酶是降解結(jié)晶纖維素的主要酶類(lèi),研究表明其活性的喪失被認(rèn)為是纖維素酶解過(guò)程中速率降低的主要原因[16]。因此纖維素酶理性設(shè)計(jì)的重要目標(biāo)之一就是設(shè)計(jì)新型的外切纖維素酶類(lèi),盡量提高其降解結(jié)晶纖維素的效率。
外切纖維素酶催化結(jié)構(gòu)域的孔道結(jié)構(gòu)使其在釋放纖維二糖產(chǎn)物的同時(shí),仍能夠緊緊地結(jié)合于纖維素鏈上,以便完成單方向持續(xù)性地催化水解。已有實(shí)驗(yàn)證實(shí),纖維二糖水解酶的可持續(xù)性催化動(dòng)力主要由糖苷鍵水解所釋放的能量驅(qū)動(dòng)[17]。該過(guò)程有兩步基元反應(yīng),計(jì)算獲得釋放的能量為?26.37 kcal/mol[18]。酶分子與底物的相互作用可從晶體表面上剝離出單根纖維素鏈,纖維二糖水解酶的這種催化方式類(lèi)似于 DNA解旋酶,后者則主要是利用ATP的水解釋放的能量使其沿DNA鏈持續(xù)前進(jìn)并打破雙螺旋間的氫鍵[19]。像這樣可以轉(zhuǎn)化化學(xué)能或熱能做功的生物大分子,通常被稱(chēng)為“分子機(jī)器”[20]。研究“分子機(jī)器”的序列、結(jié)構(gòu)、分子動(dòng)態(tài)學(xué)及其功能,在空間與時(shí)間上描述酶分子催化過(guò)程的所有原子特征,可以解釋與預(yù)測(cè)酶分子持續(xù)性催化的機(jī)理與功能,有利于對(duì)外切纖維素酶類(lèi)進(jìn)行理性設(shè)計(jì)。
自從 1983年 Ulmer提出“蛋白質(zhì)工程(Protein Engineering)”概念以來(lái),纖維素酶的分子改造先后經(jīng)歷了以下 3個(gè)階段:1) 以定點(diǎn)突變?yōu)榛A(chǔ)的“定點(diǎn)理性設(shè)計(jì)”;2) 以易錯(cuò)PCR或DNA改組技術(shù)主導(dǎo)的“定向進(jìn)化”;3) 目前以數(shù)據(jù)驅(qū)動(dòng)設(shè)計(jì)或結(jié)構(gòu)生物信息學(xué)指導(dǎo)的“結(jié)構(gòu)理性設(shè)計(jì)”[21]。
20世紀(jì)80年代,隨著定點(diǎn)突變技術(shù)的快速發(fā)展,纖維素酶理性改造策略應(yīng)運(yùn)而生。其基本概念是首先選擇一合適的纖維素酶分子,選定特定的氨基酸進(jìn)行突變,對(duì)相關(guān)蛋白進(jìn)行性質(zhì)研究。該方法對(duì)闡明酶分子活性部位的關(guān)鍵氨基酸與催化斷鍵機(jī)制,以及對(duì)其催化或與底物結(jié)合有關(guān)的關(guān)鍵位點(diǎn)的鑒定是非常有幫助的。通過(guò)定點(diǎn)突變技術(shù)已成功分析了不同芽胞桿菌屬來(lái)源的纖維素酶具有不同最適催化 pH的原因;Zhang等對(duì)褐色高溫單孢菌T. fusca來(lái)源的Cel6A活性位點(diǎn)周?chē)年P(guān)鍵氨基酸進(jìn)行了定點(diǎn)突變,提高了其催化降解羧甲基纖維素 (Carboxymethyl cellulose,CMC) 的活力,增強(qiáng)了對(duì)該底物的專(zhuān)一性;在以天然纖維素為底物的研究中,2005年Barker等對(duì)一嗜酸耐熱解纖維菌Acidothermus cellulolyticus的內(nèi)切纖維素酶Cel5A第245位進(jìn)行定點(diǎn)突變 (Y245G),降低了末端產(chǎn)物的抑制作用,使其對(duì)微晶纖維素的降解活力提高了20%[22]。
另外,定點(diǎn)改造技術(shù)還證明了外切纖維素酶活性部位特有的凸環(huán) (Loop) 結(jié)構(gòu)在可持續(xù)降解過(guò)程中發(fā)揮了重要作用。若定向刪除糞肥纖維單胞菌Cellulomonas fimi來(lái)源的Cel6B (之前稱(chēng)為Cellobiohydrolase A) C末端的一段凸環(huán)結(jié)構(gòu),其對(duì)可溶性底物 (如 CMC) 的降解能力則有所提高。對(duì)褐色高溫單孢菌T. fusca中具有可持續(xù)降解能力的Cel6B的6個(gè)凸環(huán)結(jié)構(gòu)分別進(jìn)行定點(diǎn)突變,發(fā)現(xiàn)所有突變體對(duì)濾紙與細(xì)菌微晶纖維素(Bacterial microcrystalline cellulose,BMCC) 的降解能力都有所降低,同時(shí)其可持續(xù)性也有所減弱,據(jù)此推測(cè)這些凸環(huán)結(jié)構(gòu)在Cel6B的可持續(xù)性降解中起著重要作用。另外,Von對(duì)瑞氏木霉Cel7A的凸環(huán)結(jié)構(gòu)中 3個(gè)位點(diǎn) (D241,Y247和D249) 進(jìn)行定點(diǎn)突變,通過(guò)消除酶分子與底物間的氫鍵及引入二硫鍵的方法,提高了酶分子對(duì)無(wú)定型纖維素與結(jié)晶纖維素的降解活力[22]。
盡管定點(diǎn)突變技術(shù)已經(jīng)成功地應(yīng)用于纖維素酶的改造,并通過(guò)這種突變改善了突變體酶分子的某些催化特性。但正如上文所述,通過(guò)理性設(shè)計(jì)對(duì)纖維素酶分子進(jìn)行改造,要求對(duì)其三維結(jié)構(gòu)信息要非常清楚,而目前僅有纖維素酶家族(如 GH5-9,GH12,GH45和 GH48) 的少數(shù)成員獲得了三維結(jié)構(gòu) (表1);而且,由于目前對(duì)纖維素酶的結(jié)構(gòu)與功能關(guān)系的理解還非常有限,所以即便在纖維素酶結(jié)構(gòu)已知的情況下對(duì)其進(jìn)行設(shè)計(jì),成功的可能性仍難以得到保證,所以至今尚未找到纖維素酶分子改造的普適性方案,也不能完全解析纖維素酶持續(xù)性催化過(guò)程的分子動(dòng)態(tài)行為。另外,同一家族的纖維素酶分子其序列相似性?xún)H大于30%,這說(shuō)明同一基因序列在進(jìn)化過(guò)程中發(fā)生了一系列位點(diǎn)的替換,但其功能并沒(méi)有明顯改變,這從某種側(cè)面也說(shuō)明該方法存在低效性問(wèn)題[23]。正因?yàn)槿绱?,?duì)基因進(jìn)行一系列人為的定點(diǎn)突變時(shí),在篩選過(guò)程中并不總能獲得功能差異的酶分子。此外,不同纖維素酶間往往具有錯(cuò)綜復(fù)雜的協(xié)同或競(jìng)爭(zhēng)關(guān)系,這都在一定程度上限制了該技術(shù)在纖維素酶分子改造上的廣泛應(yīng)用。
如上所述,由于人們對(duì)所要研究的纖維素酶分子結(jié)構(gòu)知之甚少,通過(guò)定點(diǎn)突變?yōu)榇淼睦硇栽O(shè)計(jì)進(jìn)行纖維素酶分子的改造在短期內(nèi)仍難以獲得廣泛的成效。因此,采用“非理性”設(shè)計(jì),就成為一種重要的研究手段。所謂“非理性”設(shè)計(jì),也即定向進(jìn)化,就是在對(duì)蛋白質(zhì)的結(jié)構(gòu)及催化機(jī)制不是很清楚的條件下,模擬自然進(jìn)化過(guò)程,在體內(nèi)或體外對(duì)基因進(jìn)行隨機(jī)突變或體外基因重組,并與高通量篩選策略相結(jié)合,最終獲得具有某些優(yōu)良特性的酶分子。該技術(shù)首先于1993年由美國(guó)科學(xué)家Arnold提出;1999年,Michael Himmel指出,非結(jié)構(gòu)信息指導(dǎo)的蛋白質(zhì)工程策略之一就是定向進(jìn)化的非理性設(shè)計(jì)[24]。表3列出了通過(guò)定向進(jìn)化技術(shù)成功改變纖維素酶性能的部分實(shí)例。
表3 利用定向進(jìn)化技術(shù)完成纖維素酶分子改造的實(shí)例*[22]Table 3 List of cellulases whose properties have been changed using directed evolution techniques*[22]
盡管定向進(jìn)化技術(shù)在對(duì)纖維素酶進(jìn)行改造時(shí)可能會(huì)得到意想不到的“有益收獲”,但由于對(duì)要改造的蛋白分子結(jié)構(gòu)信息并不清楚,因此操作起來(lái)具有明顯的“盲目性”。假設(shè)一個(gè)纖維素酶分子由300個(gè)氨基酸組成,其可能的序列空間數(shù)目將達(dá)20300,而其中有益的突變或組合突變就會(huì)非常少,這就使得篩選有效突變體的工作強(qiáng)度非常大,同時(shí)也大大降低了其改造的有效性。因此如何構(gòu)建有效的突變體文庫(kù),如何建立合理篩選突變體及正確評(píng)價(jià)各突變體性能的方法,就成為該策略亟待解決的關(guān)鍵問(wèn)題與限制性瓶頸[24]?,F(xiàn)在,通過(guò)對(duì)氨基酸密碼子表的簡(jiǎn)化及重復(fù)飽和突變 (Iterative saturation mutagenesis,ISM) 技術(shù)的引入有效地改進(jìn)了突變體文庫(kù)的質(zhì)量,也明顯縮短了突變體的篩選時(shí)間。盡管對(duì)構(gòu)建突變體文庫(kù)進(jìn)行了優(yōu)化,但由于篩選方法的限制,該策略目前仍?xún)H集中在對(duì)內(nèi)切纖維素酶和 β-葡糖苷酶的改造上,還尚未見(jiàn)到有關(guān)對(duì)外切纖維素酶分子進(jìn)行定向進(jìn)化的文獻(xiàn)報(bào)道。因此,僅利用定向進(jìn)化技術(shù)改造纖維素酶仍有一定的局限性。針對(duì)新型纖維素酶空間結(jié)構(gòu)、催化機(jī)制以及更高效的篩選策略仍有待開(kāi)發(fā)與深入探索。
隨著后基因組時(shí)代的來(lái)臨,糖苷水解酶數(shù)據(jù)庫(kù)中收錄的纖維素酶基因序列數(shù)目呈現(xiàn)爆炸式增長(zhǎng)[10]。組學(xué)數(shù)據(jù)的快速增長(zhǎng)推動(dòng)了后基因組時(shí)代基于蛋白質(zhì)家族或基于結(jié)構(gòu)生物信息學(xué)的理性設(shè)計(jì)新策略的形成,其特點(diǎn)即是結(jié)合了理性設(shè)計(jì)與定向進(jìn)化的優(yōu)勢(shì),通過(guò)一定的計(jì)算模擬與預(yù)測(cè)指導(dǎo)纖維素酶的改造。由于現(xiàn)有纖維素酶家族是基于序列相似性建立起來(lái)的,同一家族不同序列通常會(huì)共有一種拓?fù)淇臻g結(jié)構(gòu)[25]。這樣通過(guò)對(duì)目標(biāo)蛋白分子所在家族的相關(guān)基因進(jìn)行多序列比對(duì),就可以繪制出其蛋白質(zhì)家族的特征序列譜及其序列演化關(guān)系,再利用該家族已有結(jié)構(gòu)信息就可以快速找出序列譜中的功能氨基酸及其空間組合的變化規(guī)律。已有研究表明,這些功能殘基及其組合——功能區(qū) (Sector) 在進(jìn)化上具有很強(qiáng)的相關(guān)性,能反映蛋白質(zhì)的進(jìn)化歷程[26-27]。因此,這種基于蛋白質(zhì)結(jié)構(gòu)指導(dǎo)的生物信息統(tǒng)計(jì)分析,可以大大減小對(duì)有益突變空間的搜索強(qiáng)度和范圍,增大理性設(shè)計(jì)成功的概率。另外再輔助以計(jì)算機(jī)模擬,就可以為更好地探討纖維素酶與底物的結(jié)合及其催化斷鍵機(jī)制提供良好的研究平臺(tái)[28-29],同時(shí)能更清晰地繪制出纖維素酶催化過(guò)程的反應(yīng)坐標(biāo)[18,30],為創(chuàng)造具有新性能或新功能的纖維素酶分子奠定技術(shù)基礎(chǔ)。
目前,針對(duì)蛋白質(zhì)空間結(jié)構(gòu)優(yōu)化的理性設(shè)計(jì)算法已經(jīng)相繼推出,較突出的是 SCHEMA,ProSAR及 ROSETTA[31]。2009年,Heinzelman等基于結(jié)構(gòu)分析,以 3種真菌(特異腐質(zhì)霉Humicola insolens,嗜熱毛殼菌Chaetomium thermophilum和紅褐肉座菌H. jecorina)來(lái)源的外切纖維素酶 (CBH) Ⅱ超二級(jí)結(jié)構(gòu)為單元,進(jìn)行重組構(gòu)建嵌合體文庫(kù)。通過(guò)線(xiàn)性回歸模型-打分系統(tǒng)計(jì)算了每個(gè)超二級(jí)結(jié)構(gòu)單元對(duì)嵌合體穩(wěn)定性的影響,最終從 38個(gè)重組體文庫(kù)中篩選出了73個(gè)突變體,其中15個(gè)嵌合體的熱穩(wěn)定性得到了提高 (最高的熱穩(wěn)定性約比熱穩(wěn)定性最強(qiáng)的親本提高了7 )℃[32-33]。這種基于結(jié)構(gòu)的SCHEMA重組方法比基于序列的 DNA改組(DNA shuffling) 具有更高的效率,同時(shí)可以有效地避免重組時(shí)的結(jié)構(gòu)坍塌,利于快速篩選出穩(wěn)定性或其他性能得到提高或改善的突變體。
另外,對(duì)于同一家族的序列,可通過(guò)重建其祖先基因 (Ancestral sequence reconstruction, ASR)的方法研究其功能的演化過(guò)程。通過(guò)對(duì)同一家族序列的大規(guī)模比對(duì)分析,引入適當(dāng)?shù)臍v史突變;研究對(duì)其功能分歧有影響的序列變化,進(jìn)而重現(xiàn)進(jìn)化過(guò)程中的突變軌跡及其進(jìn)化關(guān)系,該方法現(xiàn)已成功應(yīng)用于分析類(lèi)綠色熒光蛋白、類(lèi)固醇受體及視蛋白的結(jié)構(gòu)、功能與進(jìn)化的潛在決定因素[15]。
本實(shí)驗(yàn)室通過(guò)對(duì)糖苷水解酶GH5、GH12等一系列家族的纖維素酶序列、結(jié)構(gòu)進(jìn)行大規(guī)模的統(tǒng)計(jì)分析,構(gòu)建了其序列進(jìn)化樹(shù)及酶活性中心序列譜。通過(guò)對(duì)GH12家族序列譜分析后發(fā)現(xiàn),該家族活性部位中含有絕對(duì)保守的氨基酸殘基(圖 2),也有相對(duì)保守的氨基酸殘基。通過(guò)對(duì)瑞氏木霉T. reesei來(lái)源的內(nèi)切纖維素酶Cel12A (EG III) 活性部位中絕對(duì)保守的 22位色氨酸(Tryptophan,W) 進(jìn)行定點(diǎn)突變,發(fā)現(xiàn)酶分子的活性隨突變殘基側(cè)鏈基團(tuán)π電子的大小而呈現(xiàn)有規(guī)律的變化,這與理論計(jì)算結(jié)果是一致的 (相關(guān)結(jié)果尚未發(fā)表)。這種基于結(jié)構(gòu)生物信息學(xué)的統(tǒng)計(jì)分析為進(jìn)一步對(duì)纖維素酶分子進(jìn)行理性設(shè)計(jì)奠定了理論基礎(chǔ)。
圖2 糖苷水解酶GH12家族纖維素酶活性部位序列譜中的絕對(duì)保守氨基酸統(tǒng)計(jì) (位點(diǎn)編號(hào)以瑞氏木霉的Cel12A為參照)Fig. 2 Statistics on the absolutely conservative amino acids in the sequence profile of the active site in GH12 family (Residues are numbered according to Cel12A of T. reesei).
隨著CAZy數(shù)據(jù)庫(kù)中越來(lái)越多的纖維素酶基因序列及結(jié)構(gòu)數(shù)據(jù)的不斷解析,通過(guò)對(duì)家族內(nèi)序列的大規(guī)模比對(duì)及 ASR方法就可重構(gòu)纖維素酶的祖先基因。利用已有結(jié)構(gòu)進(jìn)行適當(dāng)模建,然后引入適當(dāng)?shù)臍v史突變,以研究纖維素酶的進(jìn)化歷史和進(jìn)化軌跡,從而可為纖維素酶活性架構(gòu)的分析、精確反應(yīng)坐標(biāo)繪制及其持續(xù)性降解機(jī)制的闡釋奠定一定的基礎(chǔ);再利用SCHEMA等計(jì)算方法就可在一定程度上模擬預(yù)測(cè)突變體蛋白的結(jié)構(gòu)信息。這種以數(shù)據(jù)驅(qū)動(dòng)和結(jié)構(gòu)生物信息學(xué)指導(dǎo)的纖維素酶結(jié)構(gòu)理性設(shè)計(jì)方法將會(huì)大大加速纖維素酶分子改造的速率,并將成為后基因組時(shí)代中對(duì)纖維素酶或其他有應(yīng)用性?xún)r(jià)值的酶進(jìn)行改造的新思路。
通過(guò)蛋白質(zhì)工程手段對(duì)現(xiàn)有纖維素酶分子進(jìn)行改造,以提高其對(duì)結(jié)晶纖維素的降解活力或其持續(xù)降解性是目前生物燃料工藝亟待解決的關(guān)鍵問(wèn)題[34]。盡管在過(guò)去的幾十年中,利用定點(diǎn)突變與定向進(jìn)化技術(shù)在研究纖維素酶的催化機(jī)制與改進(jìn)其催化特性方面都取得了很大的進(jìn)步,但至今尚未得出提高纖維素酶活力的普遍性規(guī)律;對(duì)可否持續(xù)性提高酶分子的催化效率仍難以給出合理的回答[35]。因此如僅沿用固有思路對(duì)纖維素酶進(jìn)行改造,要達(dá)到其工業(yè)生產(chǎn)需求的目標(biāo)還將會(huì)經(jīng)歷很長(zhǎng)一段時(shí)間[36]。
隨著基因組學(xué)、蛋白質(zhì)組學(xué)、結(jié)構(gòu)組學(xué)等技術(shù)的迅速發(fā)展,以蛋白家族的序列比對(duì)與結(jié)構(gòu)模建為基礎(chǔ),通過(guò)分析纖維素酶序列、結(jié)構(gòu)與功能的進(jìn)化關(guān)系,研究酶分子的活性架構(gòu)及其持續(xù)性催化的分子動(dòng)態(tài)過(guò)程,有助于闡明其催化機(jī)制,從而奠定理性設(shè)計(jì)的理論基礎(chǔ)。因此,數(shù)據(jù)驅(qū)動(dòng)設(shè)計(jì)與結(jié)構(gòu)生物信息學(xué)指導(dǎo)的纖維素酶結(jié)構(gòu)理性設(shè)計(jì)必將成為后期分子改造的主流方向,也將會(huì)為進(jìn)一步滿(mǎn)足生物能源快速發(fā)展的需求提供一定的可能。
[1]Ragauskas AJ, Williams CK, Davison BH, et al.The path forward for biofuels and biomaterials.Science, 2006, 311(5760): 484?489.
[2]Himmel ME, Ding SY, Johnson DK, et al. Biomass recalcitrance: engineering plants and enzymes for biofuels production. Science, 2007, 315(5813):804?807.
[3]Wilson DB. Cellulases and biofuels. Curr Opin Biotechnol, 2009, 20(3): 295?299.
[4]Wang JL, Wang LS, Liu WF, et al. Research Advances on the assembly mode of cellulosomal macromolecular complexes. Prog Biochem Biophys, 2011, 38(1): 28?35 (in Chinese).
王金蘭, 王祿山, 劉巍峰, 等. 降解纖維素的“超分子機(jī)器”研究進(jìn)展. 生物化學(xué)與生物物理進(jìn)展,2011, 38(1): 28?35.
[5]Wang L, Zhang Y, Gao P. A novel function for the cellulose binding module of cellobiohydrolase I.Sci China Ser C: Life Sci, 2008, 51(7): 620?629.
[6]Cantarel BL, Coutinho PM, Rancurel C, et al. The Carbohydrate-Active EnZymes database(CAZy): an expert resource for glycogenomics. Nucleic Acids Res, 2009, 37(Database): D233?D238.
[7]Lynd LR, Weimer PJ, Van Zyl WH, et al. Microbial cellulose utilization: fundamentals and biotechnology. Microbiol Mol Biol Rev, 2002,66(3): 506?577.
[8]Michael EH. Biomass Recalcitrance: Deconstructing the Plant Cell Wall for Bioenergy. New Jersey:Wiley Blackwell, 2010 (in Chinese).
M.E. 希默爾. 生物質(zhì)抗降解屏障——解構(gòu)植物細(xì)胞壁產(chǎn)生物能. 北京: 化學(xué)工業(yè)出版社, 2010.
[9]Vladimir Uversky, Irina A. Kataeva. Cellulosome.New York: Nova Science Publishers, Inc., 2011 (in Chinese).
V.烏弗斯凱,I.A.卡塔耶瓦. 纖維素降解的超分子機(jī)器——纖維小體. 北京:化學(xué)工業(yè)出版社,2011.
[10]Xie G, Bruce DC, Challacombe JF, et al. Genome sequence of the cellulolytic gliding bacteriumCytophaga hutchinsonii. Appl Environ Microbiol,2007, 73(11): 3536?3546.
[11]Irwin D, Shin DH, Zhang S, et al. Roles of the catalytic domain and two cellulose binding domains ofThermomonospora fuscaE4 in cellulose hydrolysis. J Bacteriol, 1998, 180(7): 1709?1714.
[12]Zhang Z, Wang Y, Wang L, et al. The combined effects of amino acid substitutions and indels on the evolution of structure within protein families. PLoS ONE, 2010, 5(12): e14316.
[13]Zhang Z, Huang J, Wang Z, et al. Impact of indels on the flanking regions in structural domains. Mol Biol Evol, 2011, 28(1): 291?301.
[14]Zhang Z, Xing C, Wang L, et al. IndelFR: a database of indels in protein structures and their flanking regions. Nucleic Acids Res, 2011, 40(D1):D512?D518.
[15]Harms MJ, Thornton JW. Analyzing protein structure and function using ancestral gene reconstruction. Curr Opin Struct Biol, 2010, 20(3):360?366.
[16]Wang L, Zhang Y, Gao P, et al. Changes in the structural properties and rate of hydrolysis of cotton fibers during extended enzymatic hydrolysis.Biotechnol Bioeng, 2006, 93(3): 443?456.
[17]Himmel ME, Ruth MF, Wyman CE. Cellulase for commodity products from cellulosic biomass. Curr Opin Biotechnol, 1999, 10(4): 358?364.
[18]Li J, Du L, Wang L. Glycosidic-Bond hydrolysis mechanism catalyzed by cellulase Cel7A fromTrichoderma reesei: a comprehensive theoretical study by performing MD, QM, and QM/MM calculations. J Phys Chem B, 2010, 114(46):15261?15268.
[19]Pham XH, Tuteja N. Potent inhibition of DNA unwinding and ATPase activities of pea DNA helicase 45 by DNA-binding agents. Biochem Biophys Res Commun, 2002, 294(2): 334?339.
[20]Browne WR, Feringa BL. Making molecular machines work. Nat Nanotechnol, 2006, 1(1):25?35.
[21]Chaparro-Riggers JF, Polizzi KM, Bommarius AS.Better library design: data-driven protein engineering. Biotechnol J, 2007, 2(2): 180?191.
[22]Qu YB. Lignocellulose Degrading Enzymes and Biorefinery. Beijing: Chemical Industry Press,2011: 121?154 (in Chinese).
曲音波. 木質(zhì)纖維素降解酶與生物煉制. 北京:化學(xué)工業(yè)出版社, 2011: 121?154.
[23]Gerlt JA, Babbitt PC. Enzyme(re)design: lessons from natural evolution and computation. Curr Opin Chem Biol, 2009, 13(1): 10?18.
[24]Zhang Y-H P, Himmel ME, Mielenz JR. Outlook for cellulase improvement: screening and selection strategies. Biotechnol Adv, 2006, 24(5):452?481.
[25]Gu J, Bourne PE. Structural Bioinformatics. 2nd.New Jersey: Wiley Blackwell, 2009: 419?432.
[26]Halabi N, Rivoire O, Leibler S, et al. Protein sectors: evolutionary units of three-dimensional structure. Cell, 2009, 138(4): 774?786.
[27]Lichtarge O, Wilkins A. Evolution: a guide to perturb protein engineering strategies. Nat Chem Biol, 2010, 5(8): 526?529.
[28]Yan S, Li T, Yao L. Mutational effects on the catalytic mechanism of cellobiohydrolase Ⅰ fromTrichoderma Reesei. J Phys Chem B, 2011,115(17): 4982?4989.
[29]Li T, Yan S, Yao L. The impact ofTrichoderma reeseiCel7A carbohydrate binding domain mutations on its binding to a cellulose surface: a molecular dynamics free energy study. J Mol Model, 2012, 18(4): 1355?1364.
[30]Wilson DB. Processive and nonprocessive cellulases for biofuel production—lessons from bacterial genomes and structural analysis. Appl Microbiol Biotechnol, 2012, 93(2): 493?502.
[31]Bommarius AS, Blum JK, Abrahamson MJ. Status of protein engineering for biocatalysts: how to design an industrially useful biocatalyst. Curr Opin Chem Biol, 2011, 15(2): 194?200.
[32]Heinzelman P, Snow CD, Smith MA, et al.SCHEMA recombination of a fungal cellulase uncovers a single mutation that contributes markedly to stability. J Biol Chem, 2009, 284(39):26229 ?26233.
[33]Heinzelman P, Snow CD, Wu I, et al. A family of thermostable fungal cellulases created by structure-guided recombination. Proc Natl Acad Sci USA, 2009, 106(14): 5610 ?5615.
[34]Wen F, Nair NU, Zhao H. Protein engineering in designing tailored enzymes and microorganisms for biofuels production. Curr Opin Biotechnol, 2009,20(4): 412?419.
[35]The V Vuong, Wilson DB. Cellulases: Types and Action, Mechanism and Uses. New York: Nova Science Publishers, Inc., 2011: 277?294.
[36]Arnold FH. Combinatorial and computational challenges for biocatalyst design. Nature, 2001,409(6817): 253?257.
November 21, 2012; Accepted: December 24, 2012
Guanjun Chen. Tel: +86-531-88366202; E-mail: guanjun@sdu.edu.cn
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃 (973計(jì)劃) (No. 2011CB707402),國(guó)家高技術(shù)研究發(fā)展計(jì)劃 (863計(jì)劃) (No. 2012AA10180402),國(guó)家自然科學(xué)基金 (No. 31170071),山東省國(guó)際科技合作項(xiàng)目計(jì)劃 (魯科合字[2011]176號(hào)第6項(xiàng)) 資助。
Molecular engineering of cellulase catalytic domain based on glycoside hydrolase family
Xiaomei Zhang, Dandan Li, Lushan Wang, Yue Zhao, and Guanjun Chen
State Key Laboratory of Microbial Technology,College of Life Science,Shandong University,Jinan250100,Shandong,China
Molecular engineering of cellulases can improve enzymatic activity and efficiency. Recently, the Carbohydrate-Active enZYmes Database (CAZy), including glycoside hydrolase (GH) families, has been established with the development of Omics and structural measurement technologies. Molecular engineering based on GH families can obviously decrease the probing space of target sequences and structures, and increase the odds of experimental success.Besides, the study of cellulase active-site architecture paves the way toward the explanation of catalytic mechanism. This review focuses on the main GH families and the latest progresses in molecular engineering of catalytic domain. Based on the combination of analysis of a large amount of data in the same GH family and their conservative active-site architecture information, rational design will be an important direction for molecular engineering and promote the rapid development of the conversion of biomass.
cellulase, glycoside hydrolase family, structural bioinformatics, molecular engineering, rational design
Supported by: National Key Basic Research Program of China (973 Program) (No. 2011CB707402), National High Technology Research and Development Program of China (863 Program) (No. 2012AA10180402), National Natural Science Foundation of China (No. 31170071),Shandong International Science and Technology Cooperation Project (LuKeHeZi [2011]No. 176 in item 6).
(本文責(zé)編 陳宏宇)