劉彬,秦照玲,戚中田
海軍軍醫(yī)大學(xué)微生物學(xué)教研室,全軍生物偵檢與防護重點實驗室,上海市醫(yī)學(xué)生物防護重點實驗室,上海 200433
2019年12月上旬,湖北省武漢市陸續(xù)出現(xiàn)肺炎患者,隨后開始在全國各地不斷出現(xiàn)。流行病學(xué)和病原學(xué)研究確認此次肺炎由新型冠狀病毒(2019 novel coronavirus,2019-nCoV)引起,且與武漢華南海鮮批發(fā)市場密切相關(guān)[1]。世界衛(wèi)生組織(World Health Organization,WHO)于2020年1月30日宣布此次疫情為“國際關(guān)注的公共衛(wèi)生突發(fā)事件”(public health emergency of international concern,PHEIC),2020年2月11日將此病命名為coronavirus disease 2019 (COVID-19)。截至2020年2月13日24時,累計確診患者 59 901 例,疑似患者 13 435 例,死亡病例 1 368 例。自COVID-19暴發(fā)以來,來自中國和其他國家的多個團隊成功分離出病毒并完成了全基因組測序[1](圖1),提示2019-nCoV與2003年暴發(fā)的嚴重急性呼吸綜合征冠狀病毒(severe acute respiratory syndrome coronavirus, SARS-CoV)同為β屬冠狀病毒B亞群,為后續(xù)疫情防控和臨床治療提供了理論支撐。
圖1 全球各機構(gòu)提交2019-nCoV全基因測序結(jié)果時間軸
Fig.1 Timeline of complete 2019-nCoV genome sequences submitted by global agents
冠狀病毒為正鏈單鏈RNA病毒,基因組約為30 kd,是基因組較大的RNA病毒。冠狀病毒屬于套式病毒目(Nidovirales)、冠狀病毒科(Coronaviridae),可劃分為4個(α、β、γ和δ )冠狀病毒屬[2]。2019年12月以前,已知共有6種冠狀病毒能感染人類,包括2種α屬冠狀病毒(HCoV-229E 和HKU-NL63)和4種β屬冠狀病毒(HCoV-OC43、HCoV-HKU1、 SARS-CoV 和MERS-CoV)。β屬冠狀病毒又可分為4個亞群(A、B、C和D)。HCoV-OC43與HCoV-HKU1屬于A亞群,通常引起輕微的上呼吸道感染癥狀,抑制免疫活性,偶爾會造成免疫力低下患者或者老年人的下呼吸道嚴重感染[3]。B亞群的SARS-CoV與C亞群的中東呼吸綜合征冠狀病毒(Middle East respiratory syndrome coronavirus,MERS-CoV)主要侵襲下呼吸道,引起急性呼吸窘迫綜合征以及腹瀉、淋巴細胞減少、肝功能紊亂、腎損傷等肺外臨床癥狀[4-5]。2019-nCoV主要侵犯肺泡上皮細胞,感染后潛伏期約為1~14 d,最長可達24 d,引起的臨床癥狀與SARS-CoV和MERS-CoV感染相似,主要以發(fā)熱、干咳為主。多數(shù)病人呈輕癥狀態(tài),表現(xiàn)為低熱、輕微乏力,但無肺炎癥狀。重癥多集中在老年患者或有嚴重基礎(chǔ)疾病的患者,常于感染后1周出現(xiàn)呼吸困難,然后發(fā)展為急性呼吸窘迫綜合征、膿毒血癥等,計算機斷層掃描(computed axial tomography,CT)顯示,肺呈多發(fā)性磨玻璃影和浸潤影,甚至肺實變[6]。2019-nCoV以飛沫傳播和接觸傳播為主;但在患者糞便中也已發(fā)現(xiàn)病毒核酸陽性,提示存在消化道傳播的可能性[7];此外還不能排除2019-nCoV以氣溶膠方式傳播。2020年2月20日為止,2019-nCoV的感染確診病例數(shù)已超過SARS-CoV和MERS-CoV,但是病死率比SARS-CoV(10%)和MERS-CoV(35%)低[8]。提示,2019-nCoV(與SARS-CoV 和MERS-CoV相比)傳染性強,但毒力稍弱。
2019-nCoV基因組(GenBank: MN975262)具有典型的冠狀病毒結(jié)構(gòu)(圖2),含有 29 891 個核苷酸,核苷酸G與C占比約40%,編碼 9 860 個氨基酸。基因組5′端有帽狀結(jié)構(gòu),3′端有多聚A尾,包含兩個側(cè)翼非翻譯區(qū)(untranslated regions,UTR)和整段編碼多聚蛋白的開放讀碼框架(open reading frame,ORF)。約占基因組全長2/3的ORF1a和ORF1b基因編碼16個非結(jié)構(gòu)蛋白(non-structural protein,NSP)。ORF1a與ORF1b之間存在移碼,翻譯產(chǎn)生2種多聚蛋白質(zhì)(polyprotein,pp)1a/ab,隨后在病毒編碼的胰凝乳蛋白酶、主蛋白酶和木瓜樣蛋白酶催化下裂解成NSP[9-10]??拷?′端占基因組全長1/3的ORF含9個頭端保守的小向?qū)NA(small guide RNA, sgRNA)、9個轉(zhuǎn)錄調(diào)控序列(transcription-regulatory sequences,TRS)、2個末端UTR。首尾兩端的UTR片段與蝙蝠CoV ZXC21、SARS-CoV基因組相比,該區(qū)域核苷酸同源性>83.6%[11]。
對多種冠狀病毒基因組序列比對發(fā)現(xiàn),非結(jié)構(gòu)蛋白和結(jié)構(gòu)蛋白編碼區(qū)的同源性分別為58%與43%,在全基因組水平上同源性為54%,這表明非結(jié)構(gòu)蛋白序列偏保守,而結(jié)構(gòu)蛋白序列為適應(yīng)環(huán)境而高變[12]。2019-nCoV基因組與SARS-CoV的同源性約為80%,與蝙蝠CoV ZC45和蝙蝠CoV ZXC21基因組的同源性約89%[8],而與蝙蝠CoV RaTG13同源性最高,達到96%[13];對基因組的系統(tǒng)進化分析也提示2019-nCoV很可能來源于蝙蝠。
A: 2019-nCoV, SARS-CoV and MERS-CoV belong to β-coronavirus, with a genome of about 30 kb. The sequences of all genomes are of 5′UTR-ORF1ab-structural protein encoding gene (S-E-M-N)-3′UTR. ORF1ab encodes 16 non-structural proteins. Structural protein encoding gene mainly encodes spike (S) protein, envelope (E) protein, membrane (M) protein and nucleocapsid (N) protein. The differences among 2019-nCoV, SARS-CoV and MERS-CoV mainly are in spike protein (S) gene, ORF3 and ORF8. B: Diagram of structure of 2019-nCoV particle. The N protein envelops the genome of 2019-nCoV, which is surrounded by N protein, and M protein and S protein are attached on the viral surface.
圖2 2019-nCoV、SARS-CoV、MERS-CoV基因組比對及2019-nCoV結(jié)構(gòu)示意圖
Fig.2 Comparison of 2019-nCoV, SARS-CoV, MERS-CoV genomes and diagram of structure of 2019-nCoV particle
2019-nCoV基因組序列為5′UTR-ORF1a/b-結(jié)構(gòu)蛋白基因〔刺突(spike,S)蛋白-包膜(envelope,E)蛋白-膜(membrane,M)蛋白-核衣殼(nucleocapsid,N)蛋白〕-3′UTR(圖2A)。冠狀病毒的非結(jié)構(gòu)蛋白序列相對比較保守,ORF1a與ORF1b分別編碼多聚蛋白pp1a或pplab,隨后裂解產(chǎn)生16個非結(jié)構(gòu)蛋白。
NSP1主要誘導(dǎo)宿主胞內(nèi)mRNA降解,抑制轉(zhuǎn)錄,阻滯細胞周期;NSP2可能與宿主胞內(nèi)環(huán)境的改變有關(guān);NSP3為木瓜樣蛋白酶,而NSP5包含胰凝乳蛋白酶和主蛋白酶,兩者共同裂解多聚蛋白而產(chǎn)生非結(jié)構(gòu)蛋白;NSP4與NSP6共同作用,促進雙層膜囊泡(double-membrane vesicle,DMV)的形成,在病毒復(fù)制早期發(fā)揮作用。此外NSP6為6次跨膜蛋白,誘導(dǎo)自噬與內(nèi)質(zhì)網(wǎng)穿孔;NS7和NS8能與NS12結(jié)合(進行共定位),NS8還具有引物酶活性;NSP9、NSP10具有部分復(fù)制酶活性,NSP9可形成二聚體,增強與核酸結(jié)合的親和力;NSP11具體功能未知;NSP12具有RNA依賴的RNA聚合酶活性;NSP13具有解旋酶活性;NSP14具有核酸外切酶活性,NSP15具有核酸內(nèi)切酶活性;NSP16是RNA帽子結(jié)構(gòu),可抑制先天性免疫[12]。2019-nCoV與SARS-CoV在非結(jié)構(gòu)蛋白序列區(qū)域具有高度的相似性,幾乎無區(qū)別;而在ORF3b、S蛋白、ORF8片段,序列存在明顯差異,特別是S蛋白與ORF8序列[11]。
2019-nCoV的主要結(jié)構(gòu)蛋白包括S蛋白、E蛋白、M蛋白和 N蛋白。此外,不同冠狀病毒還編碼特殊的結(jié)構(gòu)蛋白或輔助蛋白。例如β屬冠狀病毒B亞群通常編碼血凝素酯酶(hemagglutinin esterase,HE),但2019-nCoV無HE(圖2B)。
S蛋白介導(dǎo)病毒識別宿主細胞受體,促進膜融合,并誘導(dǎo)免疫反應(yīng)產(chǎn)生中和抗體。S蛋白由兩個亞基S1與S2組成。S1亞基包含1個信號肽、N末端結(jié)構(gòu)域(N-terminal domain,NTD)和受體結(jié)合域(receptor-binding domain,RBD),而S2亞基包含融合肽(fusion peptide,F(xiàn)P)、七肽重復(fù)序列(heptad repeat,HR)1和2、跨膜結(jié)構(gòu)域和胞內(nèi)結(jié)構(gòu)域。2019-nCoV的S1亞基序列與蝙蝠SL-CoV ZXC21、蝙蝠SL-CoV ZC45和 SARS-CoV相比,同源性約70%。RBD是與宿主細胞受體直接結(jié)合的部分,在病毒吸附、進入宿主細胞過程中發(fā)揮重要作用。2019-nCoV與SARS-CoV相比,S蛋白RBD序列同源性為73%,SARS-CoV的S蛋白已被證實能直接與血管緊張素酶2(angiotensin converting enzyme 2,ACE2)結(jié)合,且結(jié)合序列位點與2019-nCoV高度一致[11]。最新報道發(fā)現(xiàn),2019-nCoV能通過ACE2受體感染人類、蝙蝠和豬[13],這說明2019-nCoV的S蛋白也是通過與ACE2受體結(jié)合,參與病毒入侵過程。研究發(fā)現(xiàn),與2019-nCoV和SARS-CoV相比,大多數(shù)蝙蝠SARSr-CoVs的S蛋白RBD有兩段序列的缺失,而RBD序列不缺失的云南株WIV1也能結(jié)合ACE2而入侵細胞[11],表明S蛋白的RBD某段特定序列在病毒與ACE2結(jié)合、吸附宿主細胞過程中發(fā)揮重要作用。因此,S1亞基的RBD可作為抗2019-nCoV藥物和疫苗研發(fā)的重要作用靶點。在S1亞基RBD與宿主細胞結(jié)合后,S2亞基FP插入宿主細胞膜表面,并在HR1與HR2之間形成超螺旋結(jié)構(gòu),發(fā)生構(gòu)象變化,實現(xiàn)病毒與細胞膜融合,隨后病毒基因組釋放,進入胞內(nèi)后復(fù)制。來自于SARS-CoV S蛋白HR2區(qū)域的多肽SC1能與HR1區(qū)域結(jié)合,阻斷病毒與細胞的融合[14]。鑒于2019-nCoV的HR2區(qū)域序列與SARS-CoV完全一致,推測多肽SC1可能會有效抑制2019-nCoV感染。2019-nCoV的S2亞基序列高度保守,與蝙蝠SL-CoV ZXC21、蝙蝠SL-CoV ZC45和 SARS-CoV序列有99%的同源性[6],因此廣譜抗S2藥物可能有治療效果。
E蛋白包含疏水結(jié)構(gòu)域和跨膜α螺旋結(jié)構(gòu)域,是病毒包膜組成部分,并參與病毒顆粒組裝和釋放[15-16]。2019-nCoV的E蛋白序列與SARS CoV相比,同源性高達95%。SARS-CoV的E蛋白還能以五聚體結(jié)構(gòu)形式發(fā)揮離子通道作用[16],這也提示E蛋白在2019-nCoV病毒復(fù)制和致病過程中的功能多樣性。
M蛋白含有3個跨膜結(jié)構(gòu)域和1個保守結(jié)構(gòu)域,是病毒包膜的組成部分,參與病毒顆粒的組裝和釋放[15-16]。2019-nCoV的M蛋白序列與SARS CoV相比,同源性高達91%。SARS CoV的M蛋白只在內(nèi)質(zhì)網(wǎng)和高爾基體表達,其保守結(jié)構(gòu)域,通過蛋白-蛋白的相互作用參與病毒裝配和出芽過程。此外,M蛋白存在兩種構(gòu)象變化,對其他結(jié)構(gòu)蛋白(S、E、N蛋白)的結(jié)構(gòu)穩(wěn)定和功能表達起到重要作用[15]。
N蛋白序列保守程度高,在病毒復(fù)制過程中發(fā)揮重要作用。N蛋白與病毒RNA結(jié)合形成復(fù)合體,隨后在M蛋白和E蛋白的共同作用下,包裹后進入病毒衣殼中。N蛋白含有Nl和N2表位,表位Nl能刺激機體產(chǎn)生高親和力的抗體,但是一般沒有中和活性[17]。研究發(fā)現(xiàn),β屬冠狀病毒B亞群的N蛋白能發(fā)生血清交叉反應(yīng)[18]。與SARS-CoV相比,2019-nCoV的N蛋白同源性高達90%,因此,COVID-19患者血清有可能會識別SARS-CoV的N蛋白,可用于臨床檢測無癥狀的2019-nCoV攜帶者。
此外,2019-nCoV 的ORF3b片段中發(fā)現(xiàn)一段含有4個螺旋結(jié)構(gòu)的特異性蛋白,且與SARS-CoV不存在同源序列[11]。研究發(fā)現(xiàn),ORF3b缺失的SARS-CoV復(fù)制能力與野生型無差別,說明ORF3b在SARS-CoV復(fù)制過程中可有可無[19]。但轉(zhuǎn)染表達ORF3b的Vero細胞會發(fā)生壞死和凋亡現(xiàn)象[20]。有研究結(jié)果表明,ORF3b能抑制β干擾素信號通路,且不依賴蛋白質(zhì)核定位。因此,2019-nCoV 的ORF3b片段中的特異性蛋白所起的作用值得深入研究[11]。與SARS-CoV序列對比,2019-nCoV的ORF8片段也存在明顯差異,其不含功能性結(jié)構(gòu)域或基序。而SARS-CoV的ORF8片段能激活胞內(nèi)應(yīng)激信號和引起NLRP3炎癥反應(yīng)[21]。根據(jù)二級結(jié)構(gòu)分析預(yù)測,2019-nCoV的ORF8片段能形成α螺旋和β折疊,該空間結(jié)構(gòu)的功能有待進一步研究[11]。
2019-nCoV與SARS-CoV、MERS-CoV有相似之處,溯源分析發(fā)現(xiàn),2019-nCoV基因組序列與蝙蝠來源的冠狀病毒相似性最高,其中與蝙蝠CoV RaTG13同源性達到96%。結(jié)合系統(tǒng)進化分析,可以確定2019-nCoV來源于蝙蝠。2019-nCoV與SARS-CoV在非結(jié)構(gòu)蛋白序列區(qū)域具有高度的相似性,因此靶向復(fù)制酶蛋白的特異性酶抑制劑可能會抑制病毒的復(fù)制。鑒于2019-nCoV S蛋白S2亞基序列與其他冠狀病毒同源性達99%,靶向冠狀病毒S2亞基的藥物也應(yīng)納入基礎(chǔ)和臨床研究中。 此外,2019-nCoV S蛋白S1亞基的RBD序列與SARS-CoV高度相似,能與ACE2結(jié)合,并能誘導(dǎo)免疫反應(yīng)產(chǎn)生抗體,因此S1亞基的RBD可作為抗2019-nCoV藥物和疫苗研發(fā)的重要靶點。高度保守的N蛋白能刺激機體產(chǎn)生高親和力的交叉反應(yīng)性抗體,可用于臨床診斷,也為核酸檢測假陰性患者提供另一檢測方案。
總之,2019-nCoV基因組結(jié)構(gòu)與蛋白功能的研究進展促進了對病毒復(fù)制和致病免疫機制的認識,推動了病毒溯源、檢測診斷以及藥物和疫苗研發(fā),正在并必將為目前COVID-19疫情的防控提供有力的理論支撐。