高翠芳,吳小俊,田豐偉,夏雨,陳衛(wèi)
1 江南大學信息工程學院,無錫 214122
2 江南大學食品學院 食品科學與技術國家重點實驗室,無錫 214122
生物技術與方法
一種表征蛋白質可分泌性的結構融合度特征
高翠芳1,吳小俊1,田豐偉2,夏雨2,陳衛(wèi)2
1 江南大學信息工程學院,無錫 214122
2 江南大學食品學院 食品科學與技術國家重點實驗室,無錫 214122
選擇適宜的信號肽是實現(xiàn)外源蛋白高效分泌表達的一個重要因素。本研究利用生物信息學方法分析信號肽與外源蛋白之間的相容程度,將其定義為結構融合度,并從數(shù)學角度分析拼接信號肽與目的蛋白鄰近殘基之間的相互作用,提出了信號肽拼接區(qū)域與目標蛋白之間的數(shù)學模型,利用該模型進行結構融合度特征提取,以此來表征外源蛋白質的可分泌性。模擬結果顯示結構融合度特征能有效區(qū)分枯草芽胞桿菌宿主的可分泌和不可分泌蛋白。研究結果有助于信號肽的選擇,對目的蛋白分泌表達的優(yōu)化具有一定的指導意義。
信號肽,蛋白質分泌,結構融合度,特征提取
Abstract:Selection of suitable signal peptides is an important factor for efficient secretion of heterologous proteins. We defined structural fusion degree (SFD) as the compatibility degree of target proteins and signal peptides by a bioinformatics approach. We mathematically analyzed the interaction of fused signal peptides and adjacent residues of proteins, and proposed a mathematical model of extended signal region and the protein. SFD Features was extracted from this model to characterize the secretability of heterologous proteins. Simulation tests showed that SFD features can effectively discriminate high secretory proteins from poor ones in the hostBacillus subtilis. Results from this research will be useful in signal peptide selection and have a better guiding significance for the optimization of heterologous protein secretion.
Keywords:signal peptide, secretion of protein, structural fusion degree, feature extraction
能穿過合成所在的細胞位置轉移到其他細胞組織中去的蛋白質,統(tǒng)稱為分泌性蛋白質。分泌性蛋白的分泌依賴于信號肽的存在 (一般位于蛋白質鏈的 N-端),新合成的蛋白質在信號肽的引導下實現(xiàn)轉移以后,信號肽序列則在信號肽酶的作用下被切除[1-2],釋放出成熟蛋白質。采用分泌方式將目標蛋白質直接輸出到發(fā)酵液可大大提高工業(yè)生產(chǎn)率[3-4]。生物工程中采用基因技術分泌表達外源蛋白時,主要策略是推測目標蛋白質可能具有的分泌途徑,將該途徑可識別的信號肽融合到目標蛋白質,嘗試其分泌表達水平。但是該方法通常帶有較大程度的盲目性[5],因為外源蛋白質的來源菌種與宿主菌在進化關系上可能差別很大,不能預知蛋白質本身與它所融合的信號肽之間的相容程度。通過不斷更換信號肽反復嘗試或者對信號肽進行優(yōu)化雖然方法可行,但試驗費用較高且研究所包涵的共性結果較少,對其他外源蛋白質分泌表達的指導意義不大。生物信息學中常用的模式識別方法是分析和處理生物數(shù)據(jù)的重要手段[6-7],如果采用該智能預測技術對外源蛋白質的可分泌性進行預分析,可大大減少不必要的生物試驗。
模式識別方法用于分泌性蛋白的研究,目前主要集中在識別給定蛋白中信號肽的存在以及識別信號肽的切割位點[8-12]。其中滑動窗體 (以切割位點為基準,包括上下游部分氨基酸) 的方法較適用于識別信號肽的切割位點[8-9],序列中相鄰氨基酸的環(huán)境信息也有助于提高信號肽切割位點的預測精度[9-10]。SignalP3.0是目前準確率較高的信號肽預測軟件[11],它采用固定長度滑動窗體與氨基酸組分特征相結合的方法可有效提高信號肽識別率。這些研究都是以獨立的蛋白序列作為識別對象,沒有替換和拼接新的信號肽,因此不必考慮蛋白質本身與信號肽之間的相容問題。而外源蛋白拼接了新的信號肽以后,蛋白主鏈仍與原蛋白質相同,拼接前后序列的相似程度很高,但分泌水平可能變化很大。目前已開發(fā)的蛋白序列特征提取方法,如:氨基酸組分[13]、序列順序關系[14]、序列小波能量[9,15]等,直接用來識別外源蛋白質的分泌性難度很大,而且也不能揭示人工信號肽與目標蛋白質之間的相容程度。為了提取有效的特征向量來表征蛋白質的分泌特性,本研究建立了信號肽擴展序列與目標蛋白之間的數(shù)學關系模型,從該模型提取了結構融合度特征 (SFD),并利用這些特征來識別可分泌和不可分泌外源蛋白質。
枯草芽胞桿菌Bacillus subtilis屬于革蘭氏陽性真細菌,是食品安全菌種,能夠將大量蛋白質以分泌的方式輸出到細胞外,可作為分泌表達外源蛋白的良好受體菌[16-17]。本研究中采用的高分泌量天然樣本來自枯草芽胞桿菌N-端融合了Sec途徑信號肽的目標蛋白質,共有 4種:AmyE、AprE、NprB、SacB。外源蛋白質所融合的可識別信號肽來源于這些天然樣本。另外根據(jù)研究要求,從已報道的在枯草芽胞桿菌中進行過分泌嘗試的樣本中,選擇可分泌蛋白質和不可分泌 (極低分泌量) 蛋白質作為外源蛋白樣本 (表1~2)。蛋白原始序列 (氨基酸序列)可在UniProtKB/Swiss-Prot數(shù)據(jù)庫(http://www.uniprot.org/uniprot/) 中查詢獲得。信號肽序列位于蛋白質主鏈的前面 (也就是N端),數(shù)據(jù)庫中用signal記錄說明。
表1 高分泌外源蛋白樣本信息Table 1 Information of high secretory heterologous protein samples
用枯草芽胞桿菌中可識別的高分泌蛋白質AmyE、AprE、NprB、SacB的信號肽作為人工信號肽 (表3),根據(jù)表 1~2中信號肽與各外源蛋白質的對應關系,若外源蛋白質是不可分泌蛋白質,直接將外源蛋白質與相應人工信號肽進行融合。若外源蛋白質是可分泌蛋白質且有自己的信號肽,則切除其原始信號肽,再與相應人工信號肽進行融合,過程如圖1所示,其中 (a) 為從天然樣本中獲得可識別的信號肽序列,(b) 為切除外源樣本的原始信號肽序列,(c) 為將天然可識別信號肽融合到外源蛋白質的N-端。生物方法即為采用基因技術將可識別的天然信號肽融合到外源蛋白質的N-端。
對表 1~2中的所有外源蛋白樣本,利用計算機技術切除原始信號肽序列,然后再拼接人工信號肽序列,得到各個外源蛋白質的新序列樣本,從而構建人工研究樣本集。
圖1 將可識別的天然信號肽融合到外源蛋白質的N-端Fig.1 Model for recognized natural signal peptide in-frame fuse to N-terminal of heterologous protein chain.
2.1 氨基酸組分特征
提取蛋白質特征的典型方法是根據(jù)序列中氨基酸的組成成分。蛋白質鏈通常用一條氨基酸序列來描述,鏈上的元素就是氨基酸的名稱。按照字母排列順序,構成蛋白質序列的20種氨基酸的基本字符集為:
表2 低分泌外源蛋白樣本信息Table 2 Information of poor secretory heterologous protein samples
表3 信號肽序列信息Table 3 Information of signal peptides
Θ中每個字符代表一種氨基酸,給定一個包含n個氨基酸殘基的蛋白質序列Q:
其中 Ri(i=1,2,3…n) 為集合 Θ中的字符。為了能用計算機處理蛋白質樣本,需要把字符序列表示成向量數(shù)據(jù),傳統(tǒng)的離散化方法是用20維向量來表示蛋白質的20種氨基酸組成[13]:
與集合Θ中的字符排列順序對應,其中f1表示丙氨酸(A) 在整條蛋白質序列中出現(xiàn)的頻率,f2表示半胱氨酸(C) 在整條蛋白質序列中出現(xiàn)的頻率,以此類推。這樣可以提取蛋白質基本組成的20維特征向量。
2.2 結構融合度特征 (SFD)
上述向量是對整個蛋白質序列的特征提取,無法直接用來區(qū)分外源蛋白質的可分泌性。希望提取的特征向量能揭示人工信號肽與目標蛋白之間所蘊藏的內在關系,因此提出在信號肽拼接區(qū)與目標蛋白質之間建立數(shù)學關系模型,從模型得到的特征向量能客觀地反映人工信號肽和目標蛋白質之間的融合程度,進而反映拼接后目標蛋白質的可分泌性。
2.2.1信號肽擴展序列信息集
為了研究信號肽拼接以后與鄰近殘基之間的相互作用,也就是拼接區(qū)域的局部融合程度,對信號肽序列進行了擴展,使其延伸到包括部分外源蛋白序列,稱為信號肽擴展序列。例如信號肽序列的長度為l,延伸長度為15(與信號肽相鄰的15個氨基酸殘基),則擴展序列的長度為l+15,如圖2。
設S是信號肽擴展序列,則有:
其中Ri(i=1,2,3…l+15) 為集合Θ中表示氨基酸名稱的字符。根據(jù)子序列分布集合的描述方法[18],構建了信號肽擴展序列 S的子序列分布集合,集合中是序列 S的所有包含信號肽片段的子序列。由于信號肽序列一般包括3個功能區(qū)域[19],分別由不同極性的氨基酸組成,考慮到3個功能區(qū)域的相互作用,子序列應包含完整的信號肽序列。例如:第k(k≤16)條子序列是Uk={R1R2... RlRl+1... Rl+k-1}。按此規(guī)則,可以得到唯一的子序列分布集合:?=(U1U2... U15U16)。其中:
圖 3的例子顯示了信號肽擴展序列通過窗體拉伸得到的子序列分布集合 (即框中的子序列)。其中原信號肽長度為l=23 (即灰色區(qū)域內的序列)。顯然,序列集合?中共有16條子序列,其中U1就是信號肽序列,U16就是信號肽擴展序列。每條序列都比前一條序列多一個氨基酸殘基。子序列長度的延伸包含了信號肽與蛋白主鏈鄰近殘基之間的相互作用,因此擴展序列信息集一定程度上蘊含了拼接區(qū)域的局部特征,也蘊含了局部結構的融合信息。
圖2 信號肽擴展序列Fig.2 Extended signal peptide sequence.
圖3 信號肽擴展序列的子序列分布集合Fig.3 Distribution of sub sequence set of extended signal peptide sequence.
2.2.2提取結構融合度特征的數(shù)學模型
對于集合?中的每個子序列,均提取20維的氨基酸組分特征向量,共得到16個特征向量,組成信號肽拼接區(qū)域的特征矩陣A:
其中V1=[v1,1v1,2…v1,20]’ 是子序列U1的特征向量,V2=[v2,1v2,2…v2,20]’ 是子序列 U2的特征向量,以此類推。按照同樣方法提取整個蛋白質鏈的特征向量B=[b1b2…b20]’。
集合?中各子序列之間存在部分重疊,因此矩陣A中各向量之間存在一定的相關信息。協(xié)方差是用來描述兩個變量之間相互關系的數(shù)字特征,利用多個不同變量的協(xié)方差組成的協(xié)方差矩陣,可進行相應的總體相關性分析。設C是矩陣A中各維分量的協(xié)方差矩陣:
矩陣C是對稱陣,其中第(i,j) 個元素是矩陣A中第i維分量與第j維分量 (第i行與第j行) 的協(xié)方差。設D是由C的特征向量組成的矩陣,由于矩陣的特征向量既能描述矩陣本身的特征又不損失矩陣信息,還能方便數(shù)學上的處理,因此在矩陣D與向量B之間建立數(shù)學關系:
矩陣D蘊含了信號肽拼接區(qū)域的特征,向量B則蘊含了整個蛋白質鏈的特征,因此未知向量X=[x1x2…x20]’可以體現(xiàn)信號肽拼接區(qū)與目標蛋白質之間的內在關系,這里稱為結構融合度特征 (SFD),這種特征向量可用來描述外源蛋白質的分泌特征。
若D是滿秩矩陣,則D?1存在,方程組(1)的解向量為X=D?1B。當矩陣D是奇異矩陣時,D?1不存在,可用最小二乘法得到方程組(1) 的解向量。這種基于融合程度的方法只依賴于序列本身,不涉及任何主觀因素,可以快速對人工信號肽與蛋白主鏈建立內在關系分析,避免了不斷更換信號肽進行反復嘗試的盲目性。
在第 1部分構建的人工蛋白序列集上,分別取信號肽擴展序列的延伸長度為 5、10、15、20,對不同的延伸長度,每個蛋白序列均提取20維的結構融合度特征,加上氨基酸組分的基礎特征,這樣共得到 5個分別用不同特征向量表示的數(shù)據(jù)集。為了直觀觀察各數(shù)據(jù)集中的樣本分布情況,同時盡量保持原樣本間的相互距離關系,用線性映射的方法[20]將特征向量投影到二維平面,結果如圖4。
對于以上 5種特征,用下面的指標來檢驗其有效性:即類內距離tr(Sw) 盡量小,類間距離tr(Sb) 盡量大的準則。因此類間距與類內距的比值tr(Sb)/tr(Sw) 越大,聚類效果越好。
其中C是分類數(shù),Nk是第k類的樣本數(shù),mk是第k類樣本的均值向量,m是所有樣本的均值向量。
表4 不同特征的有效性指標Table 4 Validity indexes of different features
在表4顯示的5種特征中,當信號肽延長10或15個氨基酸殘基時,結構融合度特征的類間距與類內距比值較大。圖4中的二維特征分布圖也顯示,此時特征的類內緊致性和類間可分性較好。這說明信號肽拼接以后與蛋白主鏈中較鄰近的15個氨基酸殘基之間的相互作用較大,因此根據(jù)局部相互作用提取的融合度特征可以用來描述蛋白質的分泌性能。
采用FCM模糊聚類算法,分別用上述5種特征向量對表 1~2中的各蛋白樣本進行聚類分析,劃分為可分泌和不可分泌兩類 (其中天然可分泌樣本和人工可分泌樣本屬于同一類),聚類結果如表5。
圖4 不同特征集的二維分布效果Fig.4 2-D mapped distribution of different features. (a) Features of amino acid composition. (b) Features of SFD (prolongation is 5)(c) Features of SFD (prolongation is 10). (d) Features of SFD (prolongation is 15). (e) Features of SFD (prolongation is 20).
通過模擬實驗發(fā)現(xiàn),信號肽延長的氨基酸個數(shù)較少 (<5) 時,信號肽本身的特征信息影響較大,聚類結果基本上按照信號肽的種類劃分,也就是同一種信號肽會劃分為一類,不能區(qū)分可分泌和不可分泌蛋白質。相反,當信號肽延長的氨基酸個數(shù)較多 (>30) 時,信號肽本身的特征信息被淡化,結構融合度特征與整個蛋白質鏈的特征向量很接近。
為進一步測試利用SFD特征對外源蛋白分泌性的識別效果,與目前常用的信號肽預測軟件進行了實驗比較,分別是 SignalP3.0 (http://www.cbs.dtu.dk/services/SignalP/),TargetP(http://www.cbs.dtu.dk/services/TargetP/),PrediSi (http://www.predisi.de/),Phobius(http://www.ebi.ac.uk/Tools/phobius/)。其中 SignalP3.0包括神經(jīng)網(wǎng)絡(SignalP3-NN)和隱馬爾科夫模型(SignalP3-HMM)兩種預測結果,SignalP3-NN中用3種分值:max S、mean S、D-score預測給定蛋白中是否存在信號肽,其中max S是預測信號肽存在的粗測值; mean S可預測信號肽長度,也是SignalP2.0中識別信號肽的標準; D-score是識別信號肽的高級標準。對于 4種信號肽來源的天然樣本,實驗所涉及的幾種算法均能給出正確預測結果,無需再做比較,故這里只列出各算法對人工樣本的預測結果(表 6~7)。
目前的預測軟件僅局限于識別蛋白序列中是否存在信號肽,無法判斷給定蛋白屬于天然樣本還是人工拼接樣本。對于拼接后的人工樣本,信號肽序列的存在并不能表示分泌水平高,只有兩者真正相容才能實現(xiàn)高分泌。表中結果顯示,預測軟件雖然能識別信號肽的存在,卻幾乎把所有拼接天然信號肽的外源蛋白預測為可分泌蛋白,只有少數(shù)幾種不可分泌蛋白被識別出。本研究的特征提取方法與以前的研究不同,是從兩者的融合程度出發(fā),揭示人工信號肽與目標蛋白之間蘊藏的內在關系,因此能較好地區(qū)分拼接樣本中的可分泌和不可分泌外源蛋白。
表5 采用不同特征得到的聚類精度Table 5 Clustering accuracy obtained by different features
表6 高分泌外源蛋白樣本的預測結果Table 6 Prediction results of high secretory heterologous protein samples
表7 低分泌外源蛋白樣本的預測結果Table 7 Prediction results of poor secretory heterologous protein samples
實現(xiàn)外源蛋白高效分泌的一個重要因素是選用適宜的信號肽。本研究根據(jù)人工信號肽與目標蛋白質的融合程度進行前期分析預測,能為外源蛋白質的信號肽選擇提供理論參考,減少目標蛋白質進行生物試驗的分泌嘗試次數(shù)。文章中是基于氨基酸組分的結構融合度特征提取,對于其他不同角度的蛋白序列特征,如序列相關系數(shù)特征和序列小波能量特征等,也可用文中的數(shù)學模型得到結構融合度特征,但具體特征的有效性如何,有待繼續(xù)研究。模型中對信號肽拼接區(qū)的特征矩陣A的相關信息分析可以有多種方法,除了文章中所利用的協(xié)方差矩陣以外,還有矩陣的自相關分析、矢量間的信息增量等方法。另外,信號肽擴展序列的延伸長度不同,所提取的特征效果也不同,文章對此作了實驗對比和初步分析,但是拼接后信號肽與鄰近殘基之間的更密切的相互作用,有待于更深入的研究。對于文章中的理論研究結果,將來需采用生物試驗做進一步驗證,結合生物驗證結果,對文章中所提出的理論進行調整和完善。
REFERENCES
[1] Tjalsma H, Antelmann H, Jongbloed JDH,et al.Proteomics of protein secretion byBacillus subtilis:separating the “Secrets” of the secretome.Microbiol Mol Biol Rev, 2004, 68(2): 207–233.
[2] Wei XF, Wang DM, Liu S,et al. Signal sequence and its application to protein expression.Biotechnol Bull, 2006,6: 38–42.
韋雪芳, 王冬梅, 劉思, 等. 信號肽及其在蛋白質表達中的應用. 生物技術通報, 2006, 6: 38–42.
[3] Schallmey M, Singh A, Ward OP. Developments in the use ofBacillusspecies for industrial production.Can JMicrobiol, 2004, 50(1): 1–17.
[4] Zhang XZ, Cui ZL, Hong Q,et al. High-level expression and secretion of methyl parathion hydrolase inBacillus subtilisWB800.Appl Environ Microbiol, 2005, 71(7):4101–4103.
[5] Fu LL, Xu ZR, Li WF,et al. Protein secretion pathways inBacillus subtilis: implication for optimization of heterologous protein secretion.Biotechnol Adv, 2007,25(1): 1–12.
[6] Liew AWC, Yan H, Yang M. Pattern recognition techniques for the emerging field of bioinformatics: a review.Pattern Recognition,2005, 38(11): 2055–2073.
[7] Keedwell E, Narayanan A. Intelligent Bioinformatics: the Application of Artificial Intelligence Techniques to Bioinformatics Problems. Chichester, West Sussex,England: John Wiley & Sons Ltd, 2005: 101–218.
[8] Chou KC. Prediction of protein signal sequences.Curr Protein Pept Sci, 2002, 3(6): 615–622.
[9] Li YZ, Wen ZN, Zhou CS,et al. Effects of neighboring sequence environment in predicting cleavage sites of signal peptides.Peptides, 2008, 29(9): 1498–1504.
[10] K?ll L, Krogh A, Sonnhammer ELL. A combined transmembrane topology and signal peptide prediction method.J Mol Biol, 2004, 338(5): 1027–1036.
[11] Bendtsen JD, Nielsen H, Heijne G,et al. Improved prediction of signal peptides: SignalP 3.0.J Mol Biol,2004, 340(4): 783–795.
[12] Liu H, Yang J, Liu DQ,et al. Using a new alignment kernel function to identify secretory proteins.Protein Pept Lett, 2007, 14(2): 203–208.
[13] Shen HB, Chou KC. Ensemble classifier for protein fold pattern recognition.Bioinformatics, 2006, 22(14): 1717–1722.
[14] Chou KC. Prediction of protein cellular attributes using pseudo amino acid composition.Proteins: Struct, Funct,Genet, 2001, 43(3): 246–255.
[15] Liò P. Wavelets in bioinformatics and computational biology: state of art and perspectives.Bioinformatics,2003, 19(1): 2–9.
[16] Sonenshein AL, Hoch JA, Losick R.Bacillus subtilisand Its Closest Relatives. Washington DC: ASM Press, 2001.
[17] Xia Y, Chen W, Zhao JX,et al. Construction of a new food-grade expression system forBacillus subtilisbased on theta replication plasmids and auxotrophic complementation.Appl Microbiol Biotechnol, 2007, 76(3):643–650.
[18] Zhang M, Fang WW, Zhang JH,et al. MSAID: multiple sequence alignment based on a measure of information discrepancy.Comput Biol Chem, 2005, 29(2): 175–181.
[19] Tjalsma H, Bolhuis A, Jongbloed JDH,et al. Signal peptide-dependent protein transport inBacillus subtilis: agenome-based survey of the secretome.Microbiol Mol Biol Rev, 2000, 64(3): 515–547.
[20] Bian ZQ, Zhang XG. Pattern Recognition. 2nd ed. Beijing:Tsinghua University Press, 2000: 185–198.
邊肇祺, 張學工. 模式識別. 2版. 北京: 清華大學出版社, 2000: 185–198.
[21] Hemila H, Pakkanen R, Heikinheimo R,et al. Expression of theErwinia carotovorapolygalacturonase-encoding gene inBacillus subtilis: role of signal peptide fusions on production of a heterologous protein.Gene, 1992, 116(1):27–33.
[22] Tsukagoshi N, Iritani S, Sasaki T,et al. Efficient synthesis and secretion of a thermophilic alpha-amylase by protein-producingBacillus brevis47 carrying theBacillus stearothermophilusamylase gene.J Bacteriol, 1985,164(3): 1182–1187.
[23] Palva I, Sarvas M, Lehtovaara P,et al. Secretion ofEscherichia colibeta-lactamase fromBacillus subtilisby the aid of alpha-amylase signal sequence.Proc Natl Acad Sci USA, 1982, 79(18): 5582–5586.
[24] Palva I, Sarvas M, Lehtovaara P,et al. Secretion ofEscherichia colibeta-lactamase fromBacillus subtilisby the aid of alpha-amylase signal sequence.Biotechnology,1992, 24: 344–348.
[25] Sloma A, Pawlyk D, Pero J. Development of an Expression and Secretion System inBacillus subtilisUtilizing sacQ//Ganesan AT, Hoch JA, ed. Genetics and Biotechnolog ofBacilli. San Diego: Academic Press,1988: 23–26.
[26] Vasantha N, Thompson LD. Fusion of pro region of subtilisin to staphylococcal protein A and its secretion byBacillus subtilis.Gene, 1986, 49(1): 23–28.
[27] Fahnestock SR, Fisher KE. Expression of the staphylococcal protein A gene inBacillus subtilisby gene fusions utilizing the promoter from aBacillus amyloliquefaciensalpha-amylase gene.J Bacteriol, 1986,165(3): 796–804.
[28] Payne MS, Jackson EN. Use of alkaline phosphatase fusions to study protein secretion inBacillus subtilis.J Bacteriol, 1991, 173(7): 2278–2282.
[29] Nakayama A, Shimada H, Furutani Y,et al. Processing of the prepropeptide portions of theBacillus amyloliquefaciensneutral protease fused toBacillus subtilisalpha-amylase and human growth hormone during secretion inBacillus subtilis.J Bacteriol, 1992, 23(1): 55–69.
[30] Franchi E, Maisano F, Testori SA,et al. A new human growth hormone production process using a recombinantBacillus subtilisstrain.J Bacteriol, 1991, 18(1/2): 41–54.
[31] Edelman A, Joliff G, Klier A,et al. A system for the inducible secretion of proteins fromBacillus subtilisduring logarithmic growth.FEMS Microbiol Lett, 1988,52(1/2): 117–120.
[32] Petit MA, Joliff G, Mesas JM,et al. Hypersecretion of a cellulase fromClostridium thermocelluminBacillus subtilisby induction of chromosomal DNA amplification.Biotechnology, 1990, 8(6): 559–563.
[33] Zhang M, Zhao C, Du LX,et al. Expression, purification,and characterization of a thermophilic neutral protease fromBacillus stearothermophilusinBacillus subtilis.Sci China Series C: Life Sci, 2008, 51(1): 52–59.
[34] Simonen M, Tarkkaa E, Puohiniemia R,et al.Incompatibility of outer membrane proteins OmpA and OmpF ofEscherichia coliwith secretion inBacillus subtilis: fusions with secretable peptides.FEMS Microbiol Lett, 1992, 79(1/3): 233–241.
[35] Imanaka T, Tanaka T, Tsunekawa H,et al. Cloning of the genes for penicillinase, penP and penI, ofBacillus licheniformisin some vector plasmids and their expression inEscherichia coli,Bacillus subtilis, andBacillus licheniformis.J Bacteriol, 1981, 147(3): 776–86.
[36] Soutschek-Bauer E, Staudenbauer WL. Synthesis and secretion of a heat-stable carboxymethylcellulose fromClostridium thermocelluminBacillus subtilisandBacillus stearothermophilus.Mol Gen Genet, 1987, 208(3):537–541.
[37] Vasantha N, Filpula D. Expression of bovine pancreatic ribonuclease A coded by a synthetic gene inBacillus subtilis.Gene, 1989, 76(1): 53–60.
[38] Wang LF, Wong SL, Lee SG,et al. Expression and secretion of human atrial natriuretic alpha-factor inBacillus subtilisusing the subtilisin signal peptide.Gene,1988, 69(1): 39–47.
[39] Takagi M, Imanaka T. Role of the pre-pro-region of neutral protease in secretion inBacillus subtilis.J Ferment Bioeng, 1989, 67(2): 71–76.
[40] Palva I. Construction of aBacillussecretion vector.University of Helsinki, 1983.
[41] Yoshimura K, Toibana A, Kikuchi K,et al. Differences betweenSaccharomyces cerevisiaeandBacillus subtilisin secretion of human lysozyme.Biochem Biophys Res Commun, 1987, 145(2): 712–718.
[42] Ganesan AT, Hoch JA.BacillusMolecular Genetics and Biotechnology Applications. San Diego: Academic Press,1986: 479–491.
[43] Dion M, Rapoport G, Doly J. Expression of the MuIFN alpha 7 gene inBacillus subtilisusing the levansucrase system.Biochimie, 1989, 71(6): 747–755.
Characterization of protein secretion based on structural fusion degree
Cuifang Gao1, Xiaojun Wu1, Fengwei Tian2, Yu Xia2, and Wei Chen2
1School of Information Engineering,Jiangnan University,Wuxi214122,China
2State Key Laboratory of Food Science and Technology,School of Food Science and Technology,Jiangnan University,Wuxi214122,China
Received:November 19, 2009;Accepted:February 2, 2010
Supported by:Program for New Century Excellent Talents in University of China (No. NCET-06-0487), National Natural Science Foundation of China (Nos. 60572034, 60973094, 30670065), Natural Science Foundation of Jiangsu Province (No. BK2006081), Program for Innovative Research Team of Jiangnan University (No. JNIRT0702).
Corresponding author:Xiaojun Wu. Tel: +86-510-85912139; Fax: +86-510-85912136; E-mail: wu_xiaojun@yahoo.com.cn
教育部新世紀優(yōu)秀人才計劃項目 (No. NCET-06-0487),國家自然科學基金 (Nos. 60572034, 60973094, 30670065),江蘇省自然科學基金 (No.BK2006081),江南大學創(chuàng)新團隊計劃項目 (No. JNIRT0702) 資助。