鄧浩輝 李水鳳 樓燕 余衛(wèi)華 胡肖兵
廣州市第八人民醫(yī)院門診部 510060
新型冠狀病毒D614G 變異是刺突糖蛋白(S 蛋白)最常見的變異之一。根據(jù)文獻(xiàn)報(bào)道,發(fā)生該變異的毒株可顯著增強(qiáng)病毒感染能力和傳播能力,并增加患者的致死率。目前包含該變異的新型冠狀病毒毒株時(shí)間變化和空間分布特征國內(nèi)尚未見相關(guān)報(bào)道,現(xiàn)報(bào)道如下。
1.1 研究對象 本研究納入截止至2020 年7 月21 日在國內(nèi)外新型冠狀病毒公共數(shù)據(jù)庫發(fā)表的序列,其中包括美國國家生物信息中心(NCBI)GenBank數(shù)據(jù)庫11 583條,全球共享禽流感數(shù)據(jù)倡議組織(GISIAD)EpiCoV數(shù)據(jù)庫69 226條,國家基因庫生命大數(shù)據(jù)平臺(tái)(CNGBdb)75條,國家基因組科學(xué)數(shù)據(jù)中心(Genome Warehouse)37 條,國家微生物科學(xué)數(shù)據(jù)中心(NMDC)數(shù)據(jù)庫289條。
1.2 去除各數(shù)據(jù)庫重復(fù)的核酸序列 本研究納入5個(gè)新型冠狀病毒核酸數(shù)據(jù)庫的序列數(shù)據(jù)進(jìn)行分析,因部分?jǐn)?shù)據(jù)庫存在提交序列重復(fù)的情況,故根據(jù)各序列的信息使用腳本代碼對各序列數(shù)據(jù)庫進(jìn)行去重,去重后共納入69 510條新型冠狀病毒核酸序列進(jìn)行下游分析。
1.3 序列比對與序列數(shù)據(jù)過濾 對去重后的序列使用Minimap 2 v2.17軟件與新型冠狀病毒參考序列(NC_045512)編碼S蛋白的基因片段進(jìn)行序列比對,剔除不包含S 基因的序列。比對后的序列進(jìn)一步過濾,過濾的標(biāo)準(zhǔn)如下:⑴保留從人類身上獲取的病毒序列,剔除宿主為靈長類動(dòng)物和細(xì)胞系等來源的核酸序列;⑵剔除采樣時(shí)間信息欠清晰的序列;⑶剔除比對上新型冠狀病毒參考序列S 基因型,但無包含D614G 讀碼框的短序列;⑷剔除包含S 蛋白D614G 讀碼框前后3個(gè)堿基測序質(zhì)量差的序列,如存在N堿基或簡并堿基的序列。
1.4 新型冠狀病毒S 蛋白D614G 變異分析 使用Geneious R11.1.5 軟件對過濾后的新型冠狀病毒進(jìn)行序列比對,并對S 基因讀碼框進(jìn)行翻譯,確定所有納入分析序列S蛋白D614G變異情況。
1.5 統(tǒng)計(jì)學(xué)分析 本研究計(jì)數(shù)資料采用例數(shù)和百分比表示,使用SPSS13.0軟件進(jìn)行χ2檢驗(yàn)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義,均取雙側(cè)檢驗(yàn)。
2.1 數(shù)據(jù)過濾后保留的核酸序列 本研究經(jīng)數(shù)據(jù)過濾后最終納入分析的序列56 201 條,其中包括NCBI GenBank 數(shù)據(jù)庫 8 111 條,GISIAD EpiCoV 數(shù)據(jù)庫 47 747 條,CNGBdb 數(shù) 據(jù) 庫 69 條 ,Genome Warehouse 數(shù) 據(jù) 庫 26 條 ,NMDC 數(shù)據(jù)庫248 條。其中來自中國的序列1 060 條(1.9%),其他國家來源的序列55 141條(98.1%)。
2.2 D614G變異納入分析核酸序列中存在情況分析 在本研究納入的56 201條新型冠狀病毒核酸序列中,13 570 條(24.1%)序列為野生型,42 631 條(75.9%)序列為D614G 變異型。攜帶D614G 變異的毒株最早在四川(EpiCoV 數(shù)據(jù)庫 :EPI_ISL_451345) 和 浙 江 (NMDC 數(shù) 據(jù) 庫 :NMDC60013101-01)2020 年 1 月 24 日采集的樣本中被發(fā)現(xiàn),該2株毒株均與來自武漢參考序列的毒株(2019年12月30 日,Genbank 數(shù)據(jù)庫:NC_045512)序列同源性最高,同源性均為99.9%以上。
2.3 D614G 變異在不同時(shí)間分布特征分析 在納入分析不同時(shí)間點(diǎn)的核酸序列中,發(fā)現(xiàn)攜帶D614G 變異毒株的比例呈明顯上升趨勢。D614 野生型與D614G 變異型的毒株總數(shù)和各自構(gòu)成比如下:2019 年 12 月(21 條,100.0%比 0.0%),2020 年 1 月(452 條,96.9% 比 3.1%),2020 年 2 月(955 條,82.2%比 17.8%),2020 年3 月(24 270 條,34.2%比65.8%),2020 年 4 月(22 085 條,15.3% 比 84.7%),2020 年5 月(6 699 條,8.9% 比 91.1%),2020 年 6 月(1 719 條,3.1%比 96.9%)。自 2020 年 2 月份起至 2020 年 6 月份,D614G 構(gòu)成比明顯高于2019 年12 月份的數(shù)據(jù),均P<0.05,如圖1所示。
圖1 不同時(shí)間點(diǎn)攜帶D614G變異毒株分布情況
2.4 D614G 變異在不同國家分布特征分析 截止至2020 年7 月21 日,在現(xiàn)有新型冠狀病毒公共核酸數(shù)據(jù)庫納入分析的序列中,公布序列數(shù)量前10 的國家和該國公布序列包含D614G 變異毒株數(shù)量和構(gòu)成比如表1 所示。其中D614G 變異構(gòu)成比最多的國家為比利時(shí)(86.7%),其次為英國(79.0%)和美國(76.1%),構(gòu)成比最少的國家為中國(20.2%)。
2.5 D614G 變異在國內(nèi)分布特征分析 在本研究納入分析的1 060 條來自中國的序列中,不同時(shí)間點(diǎn)D614 野生型(846 條,79.8%)和D614G 變異型(214 條,20.2%)的毒株總數(shù)和各自構(gòu)成比如下:2019 年12 月(21 條,100.0%比0.0%),2020 年 1 月(336 條,98.8% 比 1.2%),2020 年 2 月(313 條,98.4% 比 1.6%),2020 年 3 月(316 條,56.0% 比44.0%),2020 年 4 月(72 條,11.1% 比 88.9%),2020 年 5 月(0 條),2020 年 6 月(2 條,0.0% 比100.0%)。自 2020 年3 月份起至 2020 年 6 月份,D614G 構(gòu)成比明顯高于 2019 年 12 月份的數(shù)據(jù),均P<0.05。包含D614G的毒株主要分布在廣州(50.9%)、臺(tái)灣(27.1%)和北京(10.8%),如圖2A、2B所示。
表1 截止至2020年7月21日納入分析的序列以及主要國家D614G變異毒株的構(gòu)成比
自2019 年12 月武漢地區(qū)發(fā)現(xiàn)首例新型冠狀病毒肺炎患者起,截止至2020年7月26日,全球213個(gè)國家或地區(qū)均有新型冠狀病毒感染的報(bào)道;據(jù)統(tǒng)計(jì),目前感染新型冠狀病毒的人數(shù)為 16 196 503,死亡人數(shù)為 648 327[1-2]。根據(jù)文獻(xiàn)報(bào)道,該病毒的傳染指數(shù)(RO)為2~4,提示在人與人之間有高度的傳染性,并可導(dǎo)致較高的病死率[3-4]。因此,新型冠狀病毒感染是目前嚴(yán)重的公共衛(wèi)生問題。
病毒為了適應(yīng)環(huán)境和宿主免疫等因素常導(dǎo)致基因組發(fā)生變異,RNA病毒由于復(fù)制時(shí)保真度較差,更容易在病毒基因組出現(xiàn)變異。病毒大部分變異為無義突變,但小部分變異可致基因組的讀碼框發(fā)生改變,從而影響病毒感染能力和致病性等特征[5-6]。新冠病毒S蛋白以三聚體形態(tài)存在于病毒衣殼表面,其受體為宿主細(xì)胞的血管緊張素轉(zhuǎn)化酶-2[7-8]。614位點(diǎn)變異是S蛋白主要變異位點(diǎn)之一,D614G變異為野生型的天冬氨酸(D)變異為突變型的甘氨酸(G)[9]。根據(jù)文獻(xiàn)報(bào)道,D614G 變異后的毒株可增強(qiáng)病毒對宿主的感染能力和增加病毒在人群中的傳播能力[10-12],并可增加新型冠狀病毒感染者的病死率[13-14]。因此,了解包含新型冠狀病毒S 蛋白D614G 變異毒株的時(shí)空分布和流行病毒學(xué)特征有重要的意義。
圖2 D614G變異在國內(nèi)分布特征;A:國內(nèi)不同時(shí)間點(diǎn)D614G變異毒株分布特點(diǎn);B:D614G變異毒株在國內(nèi)分布情況
本研究中,筆者納入了國內(nèi)外新型冠狀病毒序列數(shù)據(jù)庫的56 201 條核酸序列進(jìn)行分析,結(jié)果提示目前數(shù)據(jù)庫包含D614G 變異的毒株為75.9%,最早出現(xiàn)在中國四川和杭州等地,其與武漢最早發(fā)布的序列同源性最高,提示包含該變異的毒株可能直接起源于武漢。進(jìn)一步對該變異毒株進(jìn)行分析,提示目前攜帶D618G變異毒株主要分布在國外,構(gòu)成比最高的國家為比利時(shí),其次為英國和美國。筆者對不同時(shí)間的新型冠狀病毒序列進(jìn)行分析,結(jié)果提示攜帶D614G 變異毒株的構(gòu)成比呈明顯上升趨勢;對國內(nèi)不同時(shí)間點(diǎn)的序列分析的結(jié)果也提示,攜帶D614G 毒株在2020 年3月份后呈明顯上升趨勢,且國內(nèi)主要分布在廣州和北京等地區(qū),結(jié)合本院和廣州地區(qū)的實(shí)際情況,在公共數(shù)據(jù)庫中攜帶該變異的毒株構(gòu)成比上升可能與本地區(qū)輸入性病例增加有密切關(guān)系。
綜上所述,筆者對國內(nèi)外公共數(shù)據(jù)庫新型冠狀病毒序列進(jìn)行分析,闡述了攜帶S 蛋白D614G 變異的新型冠狀病毒毒株時(shí)間和空間分布特征。因病毒變異可能隨時(shí)間和空間而變化,應(yīng)繼續(xù)對該毒株進(jìn)行研究,進(jìn)一步了解其流行病學(xué)特征和變化規(guī)律。本研究僅對公共數(shù)據(jù)庫核酸序列進(jìn)行數(shù)據(jù)分析,其結(jié)果可能不一定完全代表真實(shí)情況,下一步應(yīng)采集臨床樣本進(jìn)行病毒變異檢測,進(jìn)一步對其變異株進(jìn)行驗(yàn)證。根據(jù)本研究的結(jié)果,攜帶D614G 變異的毒株目前呈上升趨勢,在新型冠狀病毒疫情常態(tài)化管理階段,應(yīng)繼續(xù)按疫情防控的要求對輸入性病例進(jìn)行嚴(yán)格管理[15-16],警惕和嚴(yán)防輸入性病例在國內(nèi)傳播的風(fēng)險(xiǎn)。