張立俊,于帆,陳科諺,湯希,國(guó)世星,袁新華,何海洪
南方醫(yī)科大學(xué)深圳醫(yī)院檢驗(yàn)科,廣東 深圳 518110
2019 年12 月,武漢出現(xiàn)不明原因的肺炎患者,我國(guó)科學(xué)家通過(guò)對(duì)肺炎患者的樣本進(jìn)行測(cè)序發(fā)現(xiàn)一種新型冠狀病毒。2020 年2 月11 日,世界衛(wèi)生組織(WHO)將該病毒命名為嚴(yán)重急性呼吸系統(tǒng)綜合征冠狀病毒2(SARS-CoV-2),并將此類病毒統(tǒng)稱為2019冠狀病毒(COVID-19)[1]。目前的疾病傳播學(xué)表明,該病毒的臨床癥狀或許不如SARS-CoV 以及MERS-CoV表現(xiàn)得嚴(yán)重,但其在病例數(shù)量上升速度以及傳播方式則更為嚴(yán)峻。例如,因家庭性聚集而導(dǎo)致的日益增加感染病例就表明了該病毒相比SARS-CoV 以及MERS-CoV更具有感染性與傳播性[2-3]。
盡管SARS-CoV-2 的病原體機(jī)制尚未查明,人們目前主要認(rèn)為,與SARS 的致病原理相似,ACE2 可作為刺突糖蛋白[spike(s) glycoprotein]的受體從而允許病毒與細(xì)胞薄膜相結(jié)合[4-5]。因此,人體中表達(dá)ACE2蛋白質(zhì)的細(xì)胞則更有容易被感染上SARS-CoV-2。多位學(xué)者所開(kāi)展的研究表明,對(duì)于SARS患者而言,血糖水平與糖尿病分別是發(fā)病率與死亡率的預(yù)測(cè)因素[6]。根據(jù)初步報(bào)告,在感染SARS-CoV-2 的41 例患者中,有8 例患者患有糖尿病,占感染人數(shù)的20%。而鐘南山醫(yī)學(xué)小組所得的數(shù)據(jù)則表明,在173 例重癥患者之中,28 例患有糖尿病,占總?cè)藬?shù)的16.2%[7-8]。以上研究都表明,糖尿病患者更容易感染SARS-CoV-2。而在那些COVID-19 的死亡病例中,糖尿病為其第三大常見(jiàn)病癥[9]。
現(xiàn)有研究表明,ACE2 在胰腺內(nèi)分泌腺體內(nèi)表達(dá)較少,而其在胰腺外分泌腺體內(nèi)則表達(dá)較多。此外,強(qiáng)陽(yáng)性細(xì)胞也相對(duì)集中[10]。人們目前也需要對(duì)特定細(xì)胞進(jìn)行更深一步的了解。而單細(xì)胞RNA 測(cè)序(scRNA-Seq)技術(shù)的快速發(fā)展則為人們揭示人體單獨(dú)組織中的每一細(xì)胞類型的ACE2 表達(dá)水平提供了可能,并提供了有關(guān)單細(xì)胞分辨的大量信息。目前,人們尚未針對(duì)胰腺外分泌腺細(xì)胞中的ACE2表達(dá)開(kāi)展系統(tǒng)性的研究。
為此,本研究首先對(duì)成年人胰腺中的單細(xì)胞分辨層面的ACE2的RNA表達(dá)信息進(jìn)行了研究。此外,其還利用了基因組富集分析(GESA)方法對(duì)與表達(dá)ACE2 的陽(yáng)性細(xì)胞中病毒轉(zhuǎn)錄相關(guān)的基因組表達(dá)進(jìn)行了分析,并對(duì)ACE2 陽(yáng)性標(biāo)記基因進(jìn)行了基因概念網(wǎng)絡(luò)分析。
1.1 倫理 本研究的數(shù)據(jù)主要來(lái)源于公開(kāi)數(shù)據(jù)庫(kù),故予以豁免患者知情同意。
1.2 基因數(shù)據(jù)庫(kù) 該研究使用了單細(xì)胞表達(dá)信息數(shù)據(jù)庫(kù)(https://www.ebi.ac.uk/gxa/sc/home)中的人體胰腺組織的單細(xì)胞測(cè)序數(shù)據(jù)來(lái)開(kāi)展表達(dá)ACE2的陽(yáng)性細(xì)胞的聚類分析[11]。根據(jù)初步篩選結(jié)果,對(duì)GEO數(shù)據(jù)庫(kù)中的人體胰腺導(dǎo)管細(xì)胞的scRNA-seq數(shù)據(jù)組進(jìn)行了系統(tǒng)性分析,且其基因庫(kù)序列號(hào)為GSE131886。
1.3 Scanpy 軟件分析 使用Scanpy 軟件(版本1.4.6)分析整個(gè)scRNA-seq 的下游數(shù)據(jù),其中Filter-Cells 和FilterGene 函數(shù)用于讀取過(guò)濾和作圖,而Kallisto 函數(shù)用于基因/轉(zhuǎn)錄本定量。采用t-分布隨機(jī)鄰居嵌入(t-SNE)算法降低歸一化后的標(biāo)準(zhǔn)化數(shù)據(jù)的維數(shù),進(jìn)行小區(qū)聚類,將“困惑度”值設(shè)置為20,Kinds(k)=7。細(xì)胞中的基因表達(dá)水平以每百萬(wàn)計(jì)(CPM)的形式所表示,并利用CellMarker (http://biocc.hrbmu.edu.cn/CellMarker)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行了比較,以識(shí)別出胰腺聚類細(xì)胞。
1.4 CellRanger 軟件分析 使用CellRanger(1.1.0版)將從每個(gè)樣本生成的原始基因表達(dá)矩陣導(dǎo)入R(4.0.0 版),并使用Seurat R 軟件包(3.1.5 版)進(jìn)行進(jìn)一步的數(shù)據(jù)分析。在數(shù)據(jù)集中測(cè)量的基因少于200個(gè)的細(xì)胞、少于3 個(gè)細(xì)胞的基因和線粒體基因表達(dá)率大于5%的細(xì)胞被過(guò)濾。FindVariableFeatures 函數(shù)可識(shí)別在細(xì)胞之間具有高度可變表達(dá)水平的基因。主成分分析(PCA)使用Seurat RunPCA 功能進(jìn)行。統(tǒng)一流形逼近和投影(Uniform manifold approximation and projection)非線性降維技術(shù)用于可視化和探索細(xì)胞聚類。然后,使用FindMarker函數(shù)識(shí)別用于細(xì)胞聚類的標(biāo)記基因,并基于這些標(biāo)記基因使用Panglao DB數(shù)據(jù)庫(kù)(https://panglaodb.se/)進(jìn)行細(xì)胞注釋。
1.5 群集細(xì)胞進(jìn)行基因本體(GO)功能分析 Org.Hs.eg.db(3.11.4 版)程序包和topGO(2.40.0 版)程序包(3.11.4 版)用于對(duì)群集細(xì)胞進(jìn)行基因本體(GO)功能分析。分子特征數(shù)據(jù)庫(kù)(MSigDB)上的基因集富集分析(GSEA)通過(guò)presto 軟件包(版本1.0.0)和fgsea 軟件包(版本1.14.0)執(zhí)行了GO 功能富集的C5 GO 基因集(版本7.0)。
1.6 基因概念網(wǎng)絡(luò)可視化 基于ACE2陽(yáng)性細(xì)胞標(biāo)記基因與疾病和基因注釋數(shù)據(jù)庫(kù)(DGA)數(shù)據(jù)資源相結(jié)合,對(duì)基因與疾病之間的基因概念網(wǎng)絡(luò)進(jìn)行了可視化。用來(lái)進(jìn)行可視化的R 軟件安裝包包括:Pathview軟件包(1.28.0版本),Enrichplot軟件包(1.8.1版本)以及DOSE軟件包(3.14.0版本)。
2.1 ACE2 在胰腺細(xì)胞中的表達(dá) 為了闡明ACE2 在胰腺細(xì)胞中的表達(dá),本次實(shí)驗(yàn)分析了來(lái)自單細(xì)胞表達(dá)圖譜數(shù)據(jù)庫(kù)的數(shù)據(jù)。細(xì)胞聚集后,胰腺細(xì)胞主要聚集成7種類型的細(xì)胞(圖1A)。進(jìn)一步的數(shù)據(jù)分析表明,ACE2 陽(yáng)性細(xì)胞主要集中在簇2 細(xì)胞中(圖1B)。通過(guò)注釋簇2細(xì)胞的細(xì)胞亞型,發(fā)現(xiàn)它們主要由胰腺腺泡細(xì)胞和胰腺導(dǎo)管細(xì)胞組成(圖1C)。比較腺泡細(xì)胞和導(dǎo)管細(xì)胞中ACE2陽(yáng)性表達(dá)的CPM值,發(fā)現(xiàn)胰腺導(dǎo)管細(xì)胞的CPM 值高于腺泡細(xì)胞的CPM 值,差異具有統(tǒng)計(jì)學(xué)意義(P=0.006 1),見(jiàn)圖1D。
圖1 胰腺與聚類2細(xì)胞中的ACE2陽(yáng)性表達(dá)的單細(xì)胞測(cè)序細(xì)胞聚類分析
2.2 ACE2陽(yáng)性細(xì)胞在腺泡細(xì)胞和導(dǎo)管內(nèi)皮細(xì)胞中富集 采用UMAP方法對(duì)570個(gè)細(xì)胞進(jìn)行細(xì)胞聚類分析。散點(diǎn)圖顯示總共形成了8 個(gè)簇(圖2A)。小提琴圖的結(jié)果表明,表達(dá)ACE2 的陽(yáng)性細(xì)胞主要富集在簇2和簇6中(圖2B)。群集2包含100個(gè)單元(圖2C),群集6包含36個(gè)單元(圖2D)。ACE2陽(yáng)性細(xì)胞約占聚類2 細(xì)胞的1%,約占聚類6 細(xì)胞的2.8%(圖2E)。對(duì)每個(gè)細(xì)胞簇的標(biāo)記基因進(jìn)行計(jì)數(shù)以注釋簇(圖2F),最后將簇2 確定為腺泡細(xì)胞,而簇6 確定為內(nèi)皮細(xì)胞(圖2G、2H)。
圖2 胰腺細(xì)胞的單細(xì)胞測(cè)序分析
2.3 ACE2陽(yáng)性細(xì)胞的功能富集分析 對(duì)腺泡細(xì)胞和內(nèi)皮細(xì)胞標(biāo)記基因進(jìn)行功能富集分析的結(jié)果表明,兩種類型細(xì)胞中最富集的前5 個(gè)GO 項(xiàng)為SRP 依賴的共翻譯蛋白,靶向膜易位,核轉(zhuǎn)錄mRNA 分解代謝過(guò)程無(wú)義介導(dǎo)的衰變、翻譯起始、病毒轉(zhuǎn)錄和細(xì)胞質(zhì)翻譯。
2.4 基因集富集分析(GSEA) 基于功能富集分析的結(jié)果,繼續(xù)分析腺泡細(xì)胞和內(nèi)皮細(xì)胞在病毒轉(zhuǎn)錄中的潛在功能,并應(yīng)用GSEA分析ACE2陽(yáng)性細(xì)胞富集的途徑。結(jié)果表明,ACE2 陽(yáng)性腺泡細(xì)胞中最豐富的4個(gè)基因組是靶向膜的共翻譯蛋白、胞漿核糖體、內(nèi)質(zhì)網(wǎng)蛋白質(zhì)定位的建立和核糖體的結(jié)構(gòu)成分(圖3A)。在對(duì)表達(dá)ACE2的陽(yáng)性細(xì)胞進(jìn)行GSEA分析后,前4個(gè)基因組中的3個(gè)與腺泡細(xì)胞相同,第四個(gè)基因組是內(nèi)質(zhì)網(wǎng)的蛋白質(zhì)定位,內(nèi)質(zhì)網(wǎng)不是核糖體的結(jié)構(gòu)成分(圖3B)。
圖3 使用了GSEA方法對(duì)ACE2陽(yáng)性細(xì)胞的基因組進(jìn)行了可視化處理
2.5 標(biāo)記基因與疾病的基因概念網(wǎng)絡(luò)分析 通過(guò)分析表達(dá)ACE2 的陽(yáng)性細(xì)胞的標(biāo)記基因,研究人員發(fā)現(xiàn),這些基因與多種胰腺炎有關(guān)。這其中,包括慢性胰腺炎、胰腺炎、急性胰腺炎和其他疾病(圖4A)。而Circos圖顯示了不同類型胰腺炎與基因之間的基因概念網(wǎng)絡(luò)關(guān)系(圖4B)。這其中,BNIP3、PNLIP、PRSS2、PRSS3、CLU、MUC1、ALB 與多種胰腺炎病發(fā)的聯(lián)系最為密切。對(duì)ACE2陽(yáng)性內(nèi)皮細(xì)胞標(biāo)記基因的分析表明,這些基因與膽管癌、癌前病變、胰腺腺癌等腫瘤疾病密切相關(guān)(圖4C)。Circos圖顯示了基因與疾病之間的基因概念網(wǎng)絡(luò)關(guān)系(圖4D)。其中,AGR2、ISG20、HMGA1、CIB1、MMP1、S1OOP 與腫瘤的發(fā)生關(guān)系最為密切。
圖4 ACE2陽(yáng)性細(xì)胞的基因-概念網(wǎng)絡(luò)分析
隨著疫情的進(jìn)一步蔓延,世界衛(wèi)生組織也在2020年3 月11 日對(duì)COVID-19 進(jìn)行了斷定,預(yù)測(cè)其為一種流行病[12]。自2020年5月以來(lái),美國(guó)、歐洲國(guó)家、韓國(guó)、伊朗、日本和其他國(guó)家的COVID-19 患者人數(shù)急劇上升,這表明該病毒具有潛在的風(fēng)險(xiǎn),可能會(huì)影響周圍人群的健康和生活。目前,COVID-19 的致病機(jī)制尚不清楚。有限的研究表明,它具有與SARS 相同的受體ACE2,而ACE2確實(shí)是SARS-CoV-2感染細(xì)胞所必需的分子[13]。
動(dòng)物模型表明,ACE2mRNA 在患有糖尿病的實(shí)驗(yàn)鼠的胰腺上高度表達(dá),并證實(shí)了ACE2 參與糖代謝的調(diào)節(jié)[14-15]。胰腺分為兩部分,即外分泌腺與內(nèi)分泌腺。其中,外分泌腺主要是由腺泡與腺管組成的,而內(nèi)分泌腺則主要是由胰島組成。而胰島則主要是由4種細(xì)胞組成:A細(xì)胞、B細(xì)胞、D細(xì)胞以及PP細(xì)胞[16]。目前胰腺組織細(xì)胞的異質(zhì)性相對(duì)具有典型性,而ACE2在人類不同胰腺細(xì)胞中的表達(dá)在相關(guān)研究中鮮有報(bào)道[17]。對(duì)2 209 個(gè)胰腺細(xì)胞的單細(xì)胞測(cè)序數(shù)據(jù)進(jìn)行了分析。經(jīng)tSNE 聚類分析,主要分為7 個(gè)細(xì)胞簇,其中ACE2則主要分布于簇2 中,而簇2 中的細(xì)胞主要由胰腺外分泌腺的腺泡細(xì)胞和導(dǎo)管細(xì)胞組成。2003 年爆發(fā)嚴(yán)重呼吸綜合征(SARS)時(shí),病理解剖顯示SARS 冠狀病毒存在于患者尸體的胰腺腺泡細(xì)胞中[18]。此外,其還在動(dòng)物實(shí)驗(yàn)中發(fā)現(xiàn),ACE2 在胰腺外分泌腺中高度表達(dá)[19-20]。進(jìn)一步研究胰腺導(dǎo)管細(xì)胞的scRNA-seq 數(shù)據(jù)表明,ACE2 再次在胰腺腺泡細(xì)胞和內(nèi)皮細(xì)胞中陽(yáng)性表達(dá),其陽(yáng)性表達(dá)率分別為1%和2.8%。這些數(shù)據(jù)結(jié)果增加了人類胰腺外分泌腺也是SARS-CoV-2感染的潛在途徑的可能性。
GO分析基于胰腺腺泡細(xì)胞和導(dǎo)管內(nèi)皮細(xì)胞的標(biāo)記基因,主要富集SRP 依賴性共翻譯蛋白,靶向膜易位、核轉(zhuǎn)錄mRNA分解代謝過(guò)程、無(wú)義介導(dǎo)的衰變、翻譯起始、病毒轉(zhuǎn)錄、細(xì)胞質(zhì)翻譯。通過(guò)分析ACE2在病毒轉(zhuǎn)錄過(guò)程中在胰腺導(dǎo)管細(xì)胞中的表達(dá)模式,與ACE2陰性細(xì)胞相比,ACE2陽(yáng)性腺泡細(xì)胞和導(dǎo)管內(nèi)皮細(xì)胞的基因組主要富集于靶向于膜的共翻譯蛋白、胞漿核糖體和內(nèi)質(zhì)網(wǎng)蛋白質(zhì)定位的建立。這些結(jié)果表明胰腺外分泌腺易受SARS-CoV-2 感染,感染細(xì)胞在病毒轉(zhuǎn)錄中起重要作用。
通過(guò)基因-概念網(wǎng)絡(luò)分析,對(duì)標(biāo)記基因與疾病病發(fā)率之間的相關(guān)性進(jìn)行了預(yù)測(cè),并發(fā)現(xiàn)BNIP3、PNLIP、PRSS2、PRSS3、CLU、MUC1、ALB基因與多種胰腺炎的病發(fā)率密切相關(guān)。而AGR2、ISG20、HMGA1、CIB1、MMP1、S1OOP基因則與腫瘤發(fā)生息息相關(guān)。這些數(shù)據(jù)表明,感染SARS-CoV-2 的胰腺外分泌腺細(xì)胞可能導(dǎo)致各種類型胰腺炎的發(fā)生和進(jìn)展,并且可能存在腫瘤的長(zhǎng)期潛在風(fēng)險(xiǎn)。
由多位學(xué)者所開(kāi)展的研究表明,在感染SARS 冠狀病毒的患者中,ACE2 在胰腺外分泌腺和胰島細(xì)胞中均有表達(dá)[21]。因此,猜測(cè)其原因可能是不同的組織和細(xì)胞來(lái)源可能導(dǎo)致結(jié)果的差異或ACE2 表達(dá)的變化[22-23]。根據(jù)最新文獻(xiàn),在缺氧的條件下,胰島細(xì)胞中ACE2 的表達(dá)將上調(diào)[24-26]。而COVID-19 所引起的呼吸衰竭也很有可能會(huì)導(dǎo)致缺氧,這意味著健康人中ACE2陰性表達(dá)的胰島細(xì)胞可能在SARS-CoV感染后引起胰島細(xì)胞中ACE2 陽(yáng)性表達(dá),但尚需進(jìn)一步研究來(lái)驗(yàn)證這一推測(cè)。
總之,本研究通過(guò)對(duì)單細(xì)胞測(cè)序數(shù)據(jù)的數(shù)據(jù)分析提供了生物信息學(xué)證據(jù),證明胰腺外分泌腺可能易受SARS-CoV-2 感染。該研究表明,那些感染COVID-2019的患者應(yīng)跟蹤并評(píng)估其胰腺外分泌腺功能,患者應(yīng)定期監(jiān)測(cè)康復(fù)后腫瘤發(fā)展的風(fēng)險(xiǎn)。
本文作者承諾本文不涉及任何利益沖突。
本研究所涉及的所有數(shù)據(jù)均可從EMBL-EBI(https://www.ebi.ac.uk/gxa/sc/home)及高通量基因表達(dá)數(shù)據(jù)庫(kù)處獲取(序列號(hào):GSE131886)。