吳小霞 許天委 李國(guó)寅
(瓊臺(tái)師范學(xué)院,瓊臺(tái)兒童認(rèn)知與行為發(fā)展研究中心,???571127)
位于人類22號(hào)染色體上的七個(gè)APOBEC3(apolipoprotein B mRNA editing enzyme-catalytic polypeptide like3,亦稱APOBEC3)蛋白是一個(gè)通過(guò)控制外源性逆轉(zhuǎn)錄病毒復(fù)制和內(nèi)源性逆轉(zhuǎn)錄因子轉(zhuǎn)座而廣泛參與固有免疫的胞苷脫氨酶家族[1,2],分別是APOBEC3A(簡(jiǎn)稱A3A)、APOBEC3B(簡(jiǎn)稱A3B)、APOBEC3C(簡(jiǎn)稱A3C)、APOBEC3DE(簡(jiǎn)稱A3DE)、APOBEC3F(簡(jiǎn)稱A3F)、APOBEC3G(簡(jiǎn)稱A3G)和APOBEC3H(簡(jiǎn)稱A3H)[1-3]。
脫氨酶活性會(huì)引起人類基因組的不穩(wěn)定和癌癥,A3A是目前這一家族中最活躍的[4],也是IAP和MusD以及其他逆轉(zhuǎn)錄轉(zhuǎn)座,如LINE-1的有效抑制劑[5]。A3G是該家族中第一個(gè)被證實(shí)限制逆轉(zhuǎn)錄病毒的家庭成員[5]。A3B在正常組織內(nèi)不表達(dá)或表達(dá)較低,而在乳腺癌、宮頸癌、膀胱癌、肺癌、卵巢癌等腫瘤組織卻過(guò)量表達(dá),盡管機(jī)制仍不太清楚,但A3B被認(rèn)為是癌細(xì)胞內(nèi)驅(qū)動(dòng)腫瘤發(fā)展的體細(xì)胞突變?cè)搭^[6-9]。A3C抑制病毒和內(nèi)源性逆轉(zhuǎn)錄元件的功能較弱[10,11],但Wittkopp等[10]分析發(fā)現(xiàn)A3C在靈長(zhǎng)類進(jìn)化抵御病原體時(shí)起非常重要的作用。而A3DE、A3F和A3H在Vif缺陷的細(xì)胞限制HIV-1感染,也在Vif成熟的細(xì)胞內(nèi)對(duì)病毒基因組進(jìn)行催化導(dǎo)致亞致死水平的突變[9]。
本文利用生物信息學(xué)方法對(duì)人類七個(gè)APOBEC3蛋白質(zhì)序列進(jìn)行理化性質(zhì)、蛋白質(zhì)定位等結(jié)構(gòu)和功能的分析,尋找人類APOBEC3蛋白的相似及不同之處,為進(jìn)一步深入研究和分析人類APOBEC3蛋白的結(jié)構(gòu)與功能的相互關(guān)系提供思路。
1.1材料 本文中的人類APOBEC3蛋白序列來(lái)自NCBI數(shù)據(jù)庫(kù),A3A(檢索號(hào):AKE33285),包含199個(gè)氨基酸,A3B(檢索號(hào):AAH53859)包含251個(gè)氨基酸,A3C(檢索號(hào):AAH11739)包含190個(gè)氨基酸,A3DE(檢索號(hào):ACB32248)包含386個(gè)氨基酸,A3F(檢索號(hào):AAH38808 )包含373個(gè)氨基酸,A3G(檢索號(hào):AAZ38722 )包含384個(gè)氨基酸以及 A3H(檢索號(hào):ACK77778)包含154個(gè)氨基酸。
1.2方法
1.2.1APOBEC3多重序列比對(duì) 進(jìn)入主頁(yè)https://www.ebi.ac.uk/Tools/msa/,選擇Launch Clustal Omega,輸入人類APOBEC3的蛋白序列fasta格式,點(diǎn)擊submit。
1.2.2APOBEC3理化性質(zhì)分析 進(jìn)入網(wǎng)頁(yè)http://web.expasy.org,然后點(diǎn)擊Proteomics,找到ExPASy數(shù)據(jù)分析系統(tǒng)中的ProtParam工具,輸入NCBI數(shù)據(jù)庫(kù)中獲得的APOBEC3的蛋白序列,點(diǎn)擊computer parameters,從而對(duì)APOBEC3的分子量、分子式、酸堿性和穩(wěn)定性等理化性質(zhì)進(jìn)行分析。在網(wǎng)頁(yè)https://www.expasy.org/proteomics,點(diǎn)擊Protsc-ale,使用Protscale工具,輸入APOBEC3蛋白序列,對(duì)APOBEC3的親疏水性進(jìn)行分析。
1.2.3APOBEC3亞細(xì)胞定位 進(jìn)入網(wǎng)頁(yè)http://psort.hgc.jp/,選擇PSORTⅡ工具,輸入AOBEC3序列,點(diǎn)擊Submit,進(jìn)行APOBEC3蛋白亞細(xì)胞定位預(yù)測(cè)。
1.2.4APOBEC3結(jié)構(gòu)分析 進(jìn)入網(wǎng)頁(yè)使用http://www.cbs.dtu.dk/,點(diǎn)擊Prediction Servers,找到TMHMM2.0工具,輸入APOBEC3蛋白序列,分析APOBEC3蛋白的跨膜區(qū)域。
進(jìn)入https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl網(wǎng)頁(yè),輸入APOBEC3蛋白序列,使用SOPMA工具,預(yù)測(cè)APOBEC3的二級(jí)結(jié)構(gòu)及各成分所占比例。進(jìn)入網(wǎng)頁(yè)http://pfam.xfam.org/,點(diǎn)擊search,輸入APOBEC3序列,點(diǎn)擊submit,預(yù)測(cè)APOBEC3蛋白的結(jié)構(gòu)域。進(jìn)入網(wǎng)頁(yè)http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index,利用Phyre2工具,進(jìn)行APOBEC3蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測(cè)。
1.2.5APOBEC3蛋白相互作用分析 使進(jìn)入http://string-db.org/,點(diǎn)擊protein by sequence,輸入APOBEC3蛋白質(zhì)序列,選擇Homo sapiens物種,點(diǎn)擊search,構(gòu)建與APOBEC3蛋白相互作用的蛋白網(wǎng)絡(luò)。
1.2.6APOBEC蛋白進(jìn)化分析 使用MEGA 7.0軟件,Neighbor-joining方法設(shè)置Boot-strap分析重復(fù)數(shù)為1 000,構(gòu)建人類APOBEC3分子進(jìn)化樹。
2.1APOBEC3多重序列比對(duì)結(jié)果 以A3H(ACK77778)作為參考序列,經(jīng)過(guò)Clustal Omega比對(duì)運(yùn)算,結(jié)果見(jiàn)表1。
表1 Clustal Omega比對(duì)結(jié)果Tab.1 Sequence alignment results of clustal omega
2.2理化性質(zhì)分析 利用ProtParam工具,可以分析人類APOBEC3七個(gè)蛋白質(zhì)的理化性質(zhì),結(jié)果見(jiàn)表2??梢钥闯鋈祟怉3A、A3DE、A3G和A3H含量最高的氨基酸均為L(zhǎng)eu,A3B、A3DE、A3G和A3H為堿性蛋白質(zhì),而A3A、A3C和A3F均為弱酸性蛋白質(zhì),A3A、A3B和A3F均為穩(wěn)定蛋白質(zhì),而A3C、A3DE、A3G和A3H為不穩(wěn)定蛋白質(zhì)。
表2 APOBEC3的理化性質(zhì)Tab.2 Physical and chemical properties of APOBEC3
利用ProtScale在線工具分析APOBEC3的親疏水性,結(jié)果見(jiàn)表3及圖1,可以看出APOBEC3七個(gè)蛋白質(zhì)的親水區(qū)域多于疏水區(qū)域,所以均為親水性蛋白質(zhì)。
2.3亞細(xì)胞定位分析 利用PSORTⅡ分析APOBEC3蛋白的亞細(xì)胞定位,結(jié)果見(jiàn)表4,可看出除A3H可能主要定位于細(xì)胞核外,其余APOBEC3可能主要定位于細(xì)胞質(zhì)。
2.4跨膜結(jié)構(gòu)分析 經(jīng)TMHMM2.0工具預(yù)測(cè)結(jié)果表5和圖2所示,A3A、A3B、A3C、A3DE、A3F、A3G及A3H均為不跨膜蛋白。圖2中紅色細(xì)線表示跨膜區(qū)域,A3A、A3DE、A3F、A3G及A3H位于膜外(粉色細(xì)線)的概率幾乎為100%,位于膜內(nèi)(藍(lán)色細(xì)線)和跨膜區(qū)域(紅色細(xì)線)的概率幾乎為0,而A3B、A3C位于膜外的概率接近80%。粉色粗線代表多肽鏈中跨膜區(qū)域所在位置,因沒(méi)有跨膜區(qū)域,所以不顯示相應(yīng)標(biāo)記。
表5 APOBEC3 TMHMM分析結(jié)果Tab.5 TMHMM analysis of APOBEC3 protein
圖2 APOBEC3的跨膜結(jié)構(gòu)分析Fig.2 Analysis of transmembrane structure of APOBEC3Note:In the figure,1 is a red thin line for the transmembrane,2 is a blue thin line for the inside,and 3 is a pink thin line for the outside.
2.5空間結(jié)構(gòu)分析 利用 SOPMA工具分析APOBEC3蛋白的二級(jí)結(jié)構(gòu)如圖3,與相應(yīng)二級(jí)結(jié)構(gòu)占比見(jiàn)表6。由此可見(jiàn),APOBEC3蛋白的二級(jí)結(jié)構(gòu)比例相差不大,結(jié)構(gòu)相似,只有A3Fα螺旋所占比例最高,其余蛋白均為無(wú)規(guī)則卷曲所占比例最高。
圖3 APOBEC3蛋白二級(jí)結(jié)構(gòu)分析Fig.3 Secondary structure analysis of APOBEC3 proteinNote:Blue represents the α helix,red represents the Extended strand,green represents the β turn,and purple represents the Random curl.
表6 APOBEC3蛋白二級(jí)結(jié)構(gòu)類型及占比Tab.6 Secondary structure types and proportions of APOBEC3 protein
利用pfam工具得出,A3A、A3B、A3C、A3DE、A3F和A3G都屬于NAD2家族,一個(gè)新的AID/APOBEC分支,而A3H屬于APOBEC家族;A3A、A3B、A3C、A3H有一個(gè)結(jié)構(gòu)域,而A3DE、A3F和A3G有兩個(gè)結(jié)構(gòu)域,A3F和A3G的結(jié)構(gòu)域相似性極高,具體結(jié)果如表7。
表7 APOBEC3 Pfam-A的重要匹配Tab.7 Signifitant Pfam-A matches of APOBEC3
利用Phyre2工具,進(jìn)行APOBEC3蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測(cè)結(jié)果如圖4,三維結(jié)構(gòu)中的二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果如圖5。A3A的模板為c2m65A,為人類A3A的NMR結(jié)構(gòu),可信度100%,覆蓋面為100%;A3B的模板為c5k83C,為靈長(zhǎng)類A3G N-結(jié)構(gòu)域的晶體結(jié)構(gòu),可信度100%,覆蓋面為75%;A3C的模板為c3vowB,為具有HIV-1 vif結(jié)合界面的人A3C的晶體結(jié)構(gòu),可信度為100%,覆蓋面為98%;A3DE的模板為c5k83C,為靈長(zhǎng)類A3G N-結(jié)構(gòu)域的晶體結(jié)構(gòu),可信度為100%,覆蓋面為49%;A3F模板為c5k83C,為靈長(zhǎng)類A3G N-結(jié)構(gòu)域的晶體結(jié)構(gòu),可信度為100%,覆蓋面為51%;A3G的模板為 c2kboA,為野生型A3G結(jié)構(gòu),可信度為100%,覆蓋面為50%;A3H的模板為c6b0bE,是人類A3H的晶體結(jié)構(gòu),可信度100%,覆蓋面為90%。
圖4 APOBEC3蛋白三維結(jié)構(gòu)Fig.4 Three-dimensional structure of APOBEC3 protein
圖5 APOBEC3蛋白三維結(jié)構(gòu)下的二級(jí)結(jié)構(gòu)Fig.5 Secondary structure of Three-dimensional APOBEC3 protein
2.6APOBEC3蛋白質(zhì)相互作用分析 利用STRING數(shù)據(jù)庫(kù)預(yù)測(cè)APOBEC3的蛋白相互作用網(wǎng)絡(luò),結(jié)果如圖6。與A3A、A3B和A3C相互作用的蛋白網(wǎng)絡(luò)是一樣的,包括APOBEC1、APOBEC2、APOBEC4等,主要參與胞嘧啶脫氨酶作用(GO:0009972)、DNA去甲基化(GO:0080111)及DNA修飾等過(guò)程(GO:0006304),具有有水解酶活性(GO:0016814)、胞嘧啶脫氨酶活性(GO:0004126)及脫氨酶活性(GO:0019239)等。A3A、A3B與A3C都可構(gòu)成細(xì)胞內(nèi)線粒體呼吸鏈復(fù)合物Ⅳ(GO:0005751),KEGG通路主要是心肌收縮(hsa04260)、亨廷頓氏病(Huntington′s disease,hsa05016)及帕金森病 (Parkinson′s disease,hsa05012)等,反應(yīng)途徑有編輯體的形成(HSA-75094)、TP53調(diào)節(jié)代謝基因(HSA-5628897)、呼吸鏈中的電子傳輸(HSA-611105)。
與A3DE相互作用的蛋白質(zhì)主要有CYCS(cytochrome c,somatic,簡(jiǎn)稱CYCS)、COX5A(cytochrome c oxidase subunit 5A,簡(jiǎn)稱COX5A)、CUL5(cullin 5,簡(jiǎn)稱CUL5)等,主要參與電子傳遞鏈(GO:0022900)、線粒體細(xì)胞色素c到氧的電子傳遞(GO:0006123)以及線粒體ATP合成耦合電子輸運(yùn)(GO:0042775)等,具有電子轉(zhuǎn)移活性(GO:0009055)、水解酶活性(GO:0016814)及細(xì)胞色素c氧化酶活性(GO:0004129)等。細(xì)胞色素c是一種定位于線粒體內(nèi)膜的約12 kD血紅素蛋白,在多種細(xì)胞過(guò)程中起著關(guān)鍵作用,例如在線粒體呼吸復(fù)合物Ⅲ和Ⅳ之間傳遞電子,在固有細(xì)胞凋亡途徑中是必需的[12]。A3DE可能是細(xì)胞內(nèi)呼吸體(GO:0070469)、細(xì)胞色素復(fù)合體(GO:0070069)及線粒體內(nèi)膜(GO:0005743)等的組成部分,KEGG通路主要是帕金森病 (Parkinson′s disease,hsa05012)、阿爾茨海默病(Alzheimer′s disease,hsa05010)及非酒精性脂肪性肝病(hsa04932)等,反應(yīng)途徑有TP53調(diào)節(jié)代謝基因(HSA-5628897)、呼吸鏈中的電子傳輸(HSA-611105)及新陳代謝(HSA-1430728)。
圖6 與APOBEC3相互作用的蛋白網(wǎng)絡(luò)Fig.6 Protein network interacting with APOBEC3
與A3F相互作用的蛋白質(zhì)有A3G、A1CF(APOBEC1 complementation factor,簡(jiǎn)稱A1CF)、CYC1(cytochrome c1,簡(jiǎn)稱CYC1)等,主要參與堿基轉(zhuǎn)換或替換編輯(GO:0016553)、胞嘧啶脫氨酶作用(GO:0009972)以及電子傳遞鏈(GO:0022900)等生物過(guò)程,具有水解酶活性(GO:0016814)、胞嘧啶脫氨酶活性(GO:0004126)及電子轉(zhuǎn)移活性(GO:0009055)等。A3F可能是細(xì)胞內(nèi)細(xì)胞色素復(fù)合體(GO:0070069)、載脂蛋白B mRNA編輯酶復(fù)合物(GO:0030895)及呼吸鏈復(fù)合體(GO:0098803)等的組成部分,KEGG通路主要是心肌收縮(hsa04260)、帕金森病 (Parkinson′s disease,hsa05012)及非酒精性脂肪性肝病(hsa04932)等,反應(yīng)途徑有呼吸鏈中的電子傳輸(HSA-611105)、編輯體的形成(HSA-75094)及Vif介導(dǎo)的A3G降解(HSA-180585)等。與A3G相互作用的蛋白質(zhì)有A3F、SAMHD1(Sterile alpha motif and HD domain-containing protein 1,簡(jiǎn)稱SAMHD1)、CDA(cytidine deaminase,簡(jiǎn)稱CDA)等,主要參與病毒生命周期負(fù)調(diào)節(jié)(GO:1903901)、病毒防御應(yīng)答(GO:0051607)及胞嘧啶脫氨酶作用(GO:0009972)等生物過(guò)程,具有水解酶活性(GO:0016814)、胞嘧啶脫氨酶活性(GO:0004126)以及細(xì)胞色素c氧化酶活性(GO:0004129)。SAMHD1是一種dNTPs水解酶,通過(guò)在非分化細(xì)胞降解細(xì)胞內(nèi)dNTPs來(lái)限制HIV-1等逆轉(zhuǎn)錄病毒及幾種DNA病毒的復(fù)制[13,14]。人類CDA是一個(gè)由完全相同的15 kD亞基組成的四聚體,每個(gè)亞基都在活性部位含有必不可少的鋅原子,是參與嘧啶修復(fù)的酶之一,可利用通過(guò)胞嘧啶和脫氧胞嘧啶的水解脫氨基作用分別催化形成尿嘧啶和脫氧尿嘧啶[15]。A3G是細(xì)胞內(nèi)載脂蛋白B mRNA編輯酶復(fù)合物(GO:0030895)、細(xì)胞質(zhì)處理小體(P-body,GO:0000932)及線粒體呼吸鏈復(fù)合物Ⅳ(GO:0005751)的組成部分,KEGG通路主要是心肌收縮(hsa04260)、亨廷頓氏病(Hun-tington′s disease,hsa05016)及帕金森病 (Parkinson′s disease,hsa05012)等,反應(yīng)途徑有編輯體的形成(HSA-75094)、干擾素信號(hào)(HSA-913531)及TP53調(diào)節(jié)代謝基因(HSA-5628897)等。
與A3H相互作用的蛋白質(zhì)有A3A、APOBEC2、A3B等,主要參與胞嘧啶脫氨酶作用(GO:0009972)、DNA去甲基化(GO:0080111)及轉(zhuǎn)座負(fù)調(diào)控(GO:0010529)等過(guò)程,具有脫氧胞苷脫氨酶活性(GO:0047844)、水解酶活性(GO:0016814)及胞嘧啶脫氨酶活性(GO:0004126)等。A3H的反應(yīng)途徑有編輯體的形成(HSA-75094)。
2.7APOBEC3進(jìn)化分析 利用MEGA 7.0軟件分析結(jié)果如圖7,A3F和A3G的親緣關(guān)系更近一些,A3B和A3C的親緣關(guān)系更近一些,而A3H與A3A親緣關(guān)系要親近一些,而A3DE與A3B和A3C可能源于親緣關(guān)系更接近的祖先。
圖7 人類APOBEC3的進(jìn)化樹Fig.7 Evolution tree of human APOBEC3
本文利用生物信息學(xué)方法對(duì)人類APOBEC3七個(gè)蛋白進(jìn)行分析和預(yù)測(cè),發(fā)現(xiàn)A3A、A3C和A3F為弱酸性蛋白質(zhì),A3B、A3DE、A3G和A3H為堿性蛋白質(zhì),A3A、A3B和A3F為穩(wěn)定的親水蛋白,而A3C、A3DE、A3G和A3H為不穩(wěn)定的親水性蛋白質(zhì);A3H可能主要定位于細(xì)胞核外,其余APOBEC3可能主要定位于細(xì)胞質(zhì),所有APOBEC3蛋白均為不跨膜蛋白。
APOBEC3蛋白的二級(jí)結(jié)構(gòu)比例相差不大,結(jié)構(gòu)極為相似,其中α螺旋和無(wú)規(guī)則卷曲所占比例最高。pfam工具分析發(fā)現(xiàn)A3A、A3B、A3C、A3DE、A3F和A3G都屬于NAD2家族,這是一個(gè)新的AID/APOBEC分支,而A3H屬于APOBEC家族;A3A、A3B、A3C、A3H有一個(gè)結(jié)構(gòu)域,而A3DE、A3F和A3G有兩個(gè)結(jié)構(gòu)域,其中A3F和A3G的結(jié)構(gòu)域相似性極高,同時(shí)利用Phyre2工具,對(duì)APOBEC3蛋白質(zhì)三維結(jié)構(gòu)進(jìn)行預(yù)測(cè)。
利用STRING分析發(fā)現(xiàn)APOBEC3除具有已知的胞嘧啶脫氨酶活性外,還具有水解酶活性;A3DE、A3F可能還參與了細(xì)胞色素C的電子傳遞;A3A、A3B、A3C參與DNA修飾過(guò)程,A3H參與DNA去甲基化過(guò)程,這暗示A3A、A3B、A3C和A3H可能參與基因突變,導(dǎo)致基因組的不穩(wěn)定與癌癥等疾病發(fā)生;A3G參與病毒的防御應(yīng)答,暗示A3G具有廣譜抗病毒功能。而最近的研究表明A3G除了有助于抵抗病毒感染外,A3G在癌癥中也發(fā)揮著重要的非抗病毒功能[16]。利用MEGA 7.0軟件分析顯示A3F和A3G的親緣關(guān)系更近一些,A3B和A3C的親緣關(guān)系更接近,而A3H與其他A3成員的親緣關(guān)系要遠(yuǎn)一些。
本文通過(guò)對(duì)人類APOBEC3七個(gè)蛋白理化性質(zhì)和結(jié)構(gòu)功能的分析,為進(jìn)一步研究APOBEC3的功能及抗病毒藥物的研發(fā)提供參考。