王浩雨,付偉超,于文穎,梁昊岳
(中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院,中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所,實驗血液學(xué)國家重點實驗室,國家血液系統(tǒng)疾病臨床醫(yī)學(xué)研究中心,天津 300020)
急性髓細胞白血病(acute myelocytic leukemia,AML)是最為常見的一類急性白血病,這類疾病的發(fā)病機制十分復(fù)雜,患者預(yù)后情況普遍不理想。探究AML患者骨髓細胞的組成情況和比例,進而分析AML患者的骨髓細胞代謝情況,對AML發(fā)病機制的研究具有重要作用[1]。在目前常用的分析方法中,使用流式細胞儀可以準確地檢測樣本中各種細胞的組成和比例,因此流式細胞術(shù)是開展AML基礎(chǔ)和臨床研究不可或缺的方法[2-3]。在AML患者骨髓中,正常細胞和AML細胞主要以單細胞形式存在,即為天然單細胞懸液[4]。研究人員可以使用不同的熒光素耦聯(lián)抗體來分別標記AML患者骨髓中的淋巴細胞、單核細胞、粒細胞和AML細胞等細胞群[5]。傳統(tǒng)的流式分析方法以流式散點圖為依據(jù)來區(qū)分各種細胞群體,用散點圖的聚群程度來計算各細胞群體的比例[6]。目前,應(yīng)用包括t-分布鄰域嵌入(t-distributed stochastic neighbor embedding,t-SNE)算法、統(tǒng)一流形逼近與投影(uniform manifold approximation and projection,UMAP)算法和基于快速傅里葉變換加速插值的t-SNE(about fast Fourier transform-accelerated interpolation-based t-SNE,F(xiàn)lt-SNE)算法在內(nèi)的3種FlowJo生物信息學(xué)方法,可以直觀地描述淋巴細胞、單核細胞、粒細胞和AML細胞的分布和比例。與此同時,利用熱圖分析可以發(fā)現(xiàn)AML患者骨髓中各種細胞的抗原表達情況存在差異[7]。在基礎(chǔ)和臨床研究中,因具有快速靈敏、操作便捷、與生物信息學(xué)緊密結(jié)合的技術(shù)優(yōu)勢,基于流式細胞儀的多激光多色流式分析和高速高通量流式分選技術(shù)在白血病患者代謝研究中具有一定的應(yīng)用價值。
AML患者骨髓細胞代謝與糖代謝相關(guān)基因如醛縮酶B(ALDOB)、異檸檬酸脫氫酶(IDH)、蘋果酸脫氫酶2(MDH2)和琥珀酸脫氫酶B(SDHB),脂代謝相關(guān)基因如脂蛋白脂肪酶(LPL),酪氨酸激酶如髓過氧化物酶(MPO),維生素合成相關(guān)基因如視黃酸受體α(RARA)以及腫瘤相關(guān)基因如原癌基因(RET)密切相關(guān)。為了從基因水平探索AML患者骨髓細胞的代謝情況,本研究基于生物信息學(xué)方法,從美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)數(shù)據(jù)庫中獲取通過細胞測序儀采集的健康者和AML患者骨髓細胞的表達譜數(shù)據(jù),使用SeqGeqTM軟件對測序數(shù)據(jù)進行歸一化并整合分析,用t-SNE算法和UMAP算法降維方法分析各自的細胞分群情況,并分析骨髓細胞中與細胞代謝相關(guān)基因的表達情況?;诩毎麥y序儀采集的表達譜數(shù)據(jù)在研究AML患者的遺傳背景、細胞分化和物質(zhì)代謝等方面具有重要的作用,這些研究體現(xiàn)了以一代、二代和三代測序技術(shù)為基礎(chǔ)的細胞測序儀在白血病患者的精準診斷、規(guī)范治療和預(yù)后判定方面不可或缺的應(yīng)用價值。
本研究將AML患者的骨髓細胞進行流式分析,特別是通過t-SNE算法、UMAP算法和Flt-SNE算法3種降維分析方式,描述AML患者骨髓細胞的分群情況,彌補了傳統(tǒng)流式分析中因逐級圈門而不能直觀呈現(xiàn)細胞群體檢測結(jié)果的不足之處。同時,本研究側(cè)重分析AML患者和健康者骨髓細胞的代謝相關(guān)基因的表達水平差異,從而揭示AML患者在骨髓代謝方面的缺陷,為探索AML的發(fā)病機制和研發(fā)以代謝為靶點的相關(guān)藥物奠定基礎(chǔ)。
本文涉及的AML患者骨髓細胞來自本院病理中心,流式管(貨號352054)以及CD16-FITC、CD117-PE、CD34-PerCP-Cy5.5、CD38-PE-Cy7等抗體均購自美國碧迪公司。所使用儀器包括CantoⅡ流式細胞分析儀和LWA自動裂解儀,均購自美國碧迪公司。
收集1例AML患者的骨髓2~3 mL。取2支流式管,分別標記為對照管和測定管,對照管中加入同型對照抗體20μL,測定管分別加入標記CD16-FITC、CD117-PE、CD34-PerCP-Cy5.5、CD38-PE-Cy7、CD13-APC、HLA-DR-APC-Cy7、CD11b-BV421和CD45-V500抗體各20μL,每管分別加入AML患者的骨髓100μL;混勻后室溫避光孵育15~20 min;使用LWA自動裂解儀裂解細胞,固定,洗滌;采用流式細胞儀檢測;最后,使用FlowJoTMv10.6.1流式細胞分析軟件(美國碧迪公司)進行流式細胞分析和生物信息學(xué)分析。
AML患者和健康者的表達譜數(shù)據(jù)來自NCBI GEO數(shù)據(jù)庫,使用SeqGeqTMv1.7分析軟件(美國碧迪公司)進行代謝相關(guān)基因的表達分析。
通過FlowJoTM軟件對獲取的AML患者骨髓細胞的流式數(shù)據(jù)進行分析,發(fā)現(xiàn)CD45陰性區(qū)域細胞是AML細胞,占36.8%;CD45陽性并且顆粒度較小區(qū)域細胞是淋巴細胞,占12.9%;CD45陽性并且顆粒度較大區(qū)域細胞是粒細胞,占25.3%[如圖1(a)所示];CD16和CD11b雙陽區(qū)域細胞是單核細胞,占3.72%[如圖1(b)所示];CD117陽性區(qū)域細胞是AML細胞,占36.8%,CD117陰性并且顆粒度較大區(qū)域細胞是粒細胞,占25.3%[如圖1(c)所示];CD34和CD38雙陽區(qū)域的細胞是AML細胞,占36.5%[如圖1(d)所示]。依據(jù)CD45、CD117、CD34和CD38等表面標志圈選的AML細胞群比例具有一致性。
圖1 AML患者骨髓細胞的流式細胞分析
使用FlowJoTM的生物信息學(xué)分析模塊對流式數(shù)據(jù)進行t-SNE算法、UMAP算法和Flt-SNE算法分析,發(fā)現(xiàn)AML患者細胞中包含淋巴細胞、單核細胞、粒細胞和AML細胞4群細胞,其中AML細胞群體所占比例最高,表明AML患者骨髓中的腫瘤負荷較高。t-SNE算法、UMAP算法和Flt-SNE算法分析結(jié)果相近,表明3種生物信息學(xué)方法都可以有效地識別骨髓細胞的類群,實現(xiàn)對流式數(shù)據(jù)的降維分析功能[如圖2(a)~(c)所示]。但與UMAP算法和Flt-SNE算法相比,t-SNE算法分析對4種類群細胞的分群更為集中,淋巴細胞(藍色)和單核細胞(紅色)的各個亞群處在相近的位置區(qū)域,表明t-SNE算法可以很好地依據(jù)細胞亞群的異質(zhì)性對細胞類群進行區(qū)分。在3種分析結(jié)果中,AML細胞群體聚集性較好,體現(xiàn)出AML細胞的均一性和較低的異質(zhì)性。這些結(jié)果與AML細胞在患者骨髓中的分化過程具有較好的一致性,低分化的AML細胞對骨髓微環(huán)境中細胞代謝產(chǎn)生重要影響。
通過AML患者骨髓細胞的熱圖分析發(fā)現(xiàn),骨髓細胞被分為Pop0、Pop1、Pop2和Pop3 4群[如圖2(d)所示]。通過蛋白的表達情況分析,Pop0這類群細胞主要表達CD45蛋白,說明Pop0主要是淋巴細胞。Pop1這類群細胞主要表達CD45蛋白,且高表達HLA-DR蛋白,說明Pop1主要是粒細胞。Pop2這類群細胞主要表達CD34、CD38和CD117蛋白,說明Pop2主要是AML細胞。Pop3這類群細胞主要表達CD45、CD16和CD11b蛋白,說明Pop3主要是單核細胞。因此,Pop0、Pop1、Pop2和Pop3分別代表了淋巴細胞、粒細胞、AML細胞和單核細胞。
進一步通過FlowSOM聚類分析,發(fā)現(xiàn)與熱圖分析結(jié)果相同的Pop0、Pop1、Pop2和Pop3群體中Pop2(AML細胞)群體所占比例最高,其次為粒細胞、淋巴細胞和單核細胞,如圖2(e)所示,自下而上的細胞群體比例逐漸降低。FlowSOM聚類分析結(jié)果與傳統(tǒng)流式細胞分析的AML患者骨髓中AML細胞(36.8%)、粒細胞(25.3%)、淋巴細胞(12.9%)和單核細胞(3.72%)比例分布情況相符。
圖2 基于流式細胞術(shù)的AML患者骨髓細胞的生物信息學(xué)分析結(jié)果
基于NCBI數(shù)據(jù)庫的健康者和AML患者骨髓細胞的測序數(shù)據(jù),將SeqGeqTM測序分析軟件用于數(shù)據(jù)的歸一化和整合分析。根據(jù)表達譜得到的基因表達情況,應(yīng)用t-SNE算法和UMAP算法對骨髓細胞進行分類分析。通過t-SNE算法分析發(fā)現(xiàn),與健康者骨髓細胞群體相比,AML患者骨髓細胞群體明顯增加了一群細胞,將二者合并分析后,發(fā)現(xiàn)增加的細胞群體為AML細胞,并且所占細胞群比例較高[如圖3(a)~(c)所示]。UMAP算法分析也得到了類似的結(jié)果[如圖3(d)~(f)所示],可以看出由于AML細胞擠壓了骨髓微環(huán)境中正常細胞的生長空間,正常細胞群體比例出現(xiàn)了明顯的縮減,這將影響骨髓細胞代謝和骨髓造血的正常功能。
圖3 基于測序技術(shù)的AML患者和健康者的骨髓細胞生物信息學(xué)分析結(jié)果
通過對t-SNE算法結(jié)果中的不同細胞群體的表面標志物的識別,健康者的骨髓細胞可以被分為明顯的4群細胞,即紅細胞、淋巴細胞、單核細胞和粒細胞[如圖4(a)所示],并且發(fā)現(xiàn)健康者骨髓細胞中ALDOB基因不表達,IDH、MDH2、SDHB、MPO和RARA基因表達量較高,LPL和RET基因表達量較低[如圖4(b)所示]。
圖4 基于測序技術(shù)的健康者骨髓細胞的代謝相關(guān)基因表達分析結(jié)果
同時,AML患者的骨髓細胞可以被分為明顯的5群細胞,即紅細胞、淋巴細胞、單核細胞、粒細胞和AML細胞[如圖5(a)所示]。與健康者的骨髓細胞相比,AML患者的骨髓細胞中的LPL基因不表達,IDH、MDH2和SDHB基因的表達量明顯升高,MPO基因表達水平明顯降低,ALDOB和RET基因表達水平升高[如圖5(b)所示]。
圖5 基于測序技術(shù)的AML患者骨髓細胞的代謝相關(guān)基因表達分析結(jié)果
與健康者相比,AML患者的ALDOB、IDH、MDH2和SDHB基因的表達水平偏高,說明AML患者的糖代謝水平發(fā)生了顯著變化,特別體現(xiàn)在細胞有氧呼吸中的三羧酸循環(huán)反應(yīng)[如圖6(a)~(d)所示]。同時,AML患者的脂代謝相關(guān)基因LPL的表達水平明顯低于健康者,說明由于LPL不足,AML患者將富含甘油三酯的脂蛋白水解為游離脂肪酸的能力較差,導(dǎo)致患者存在高甘油三酯的風險,不利于患者的生存和預(yù)后[如圖6(e)所示]。作為酪氨酸激酶的一種,MPO的表達水平影響著參與特定反應(yīng)的氨基酸和蛋白質(zhì)的消費速度。AML患者的MPO基因表達水平明顯低于健康者,反映出AML患者骨髓細胞潛在的蛋白質(zhì)代謝異常[如圖6(f)所示]。AML患者中低表達的RARA基因不利于維生素和胡蘿卜素的合成,而較低的維生素水平不利于細胞的生長和分化[如圖6(g)所示]。腫瘤相關(guān)基因RET的高表達不僅影響著AML患者骨髓的糖脂代謝,還在細胞的分化、生長、遷移和存活中發(fā)揮作用[如圖6(h)所示]。
圖6 健康者和AML患者骨髓細胞的代謝相關(guān)基因表達結(jié)果
在AML的傳統(tǒng)診斷方法中,流式細胞儀發(fā)揮著重要的鑒別作用[8]。傳統(tǒng)流式分析結(jié)果表明,AML細胞的標志蛋白包括CD34、CD38和CD117等。在與正常血細胞(淋巴細胞、粒細胞和單核細胞)進行區(qū)分時,淋巴細胞和粒細胞的主要標志蛋白是CD45,但二者可依據(jù)顆粒度來進一步區(qū)分。單核細胞的標志蛋白主要為CD16、CD45和CD11b。本研究中,AML患者骨髓樣本中AML細胞、粒細胞、淋巴細胞和單核細胞所占比例分別為36.8%、25.3%、12.9%和3.72%,符合AML患者骨髓細胞分布的規(guī)律,反映了AML細胞在骨髓中大量增生造成對其他各系造血細胞生長的負面影響。這些結(jié)果表明,通過流式細胞儀可以很好地區(qū)分AML患者骨髓細胞中的正常和異常造血細胞群體,在此基礎(chǔ)上,流式細胞儀為惡性血液腫瘤患者的正常造血和惡性增殖性造血的比較研究提供了技術(shù)保障。
為了探索一種能更好地表征AML患者骨髓細胞分布情況的方式,基于流式細胞術(shù)的生物信息學(xué)分析方法(t-SNE算法、UMAP算法和Flt-SNE算法)被用于AML患者骨髓數(shù)據(jù)的分析[9]。結(jié)果表明,AML患者骨髓中AML細胞的比例最高,導(dǎo)致AML患者骨髓中的正常血細胞功能受損和血液系統(tǒng)功能紊亂。這一結(jié)果與經(jīng)典流式分析所得到的結(jié)論一致,說明基于流式細胞術(shù)的生物信息學(xué)分析可以彌補逐級圈門方式的不足,直觀地呈現(xiàn)骨髓細胞各群體的分布情況,提升了數(shù)據(jù)的可視化水平,很好地反映了AML患者骨髓異常造血的疾病狀態(tài)。
為了研究AML患者的骨髓代謝情況,本研究分析了與骨髓細胞代謝相關(guān)的ALDOB、IDH、MDH2、SDHB、LPL、MPO、RARA和RET基因的表達情況。其中,ALDOB基因表達醛縮酶B,ALDOB基因變異導(dǎo)致遺傳性果糖不耐受。IDH基因編碼產(chǎn)生異檸檬酸脫氫酶,催化異檸檬酸氧化脫羧為α-酮戊二酸,這是三羧酸循環(huán)的限速步驟。MDH2基因產(chǎn)生的蘋果酸脫氫酶,在檸檬酸循環(huán)中,催化蘋果酸轉(zhuǎn)變?yōu)椴蒗R宜醄10]。SDH是一種位于線粒體內(nèi)膜上的復(fù)合酶,催化琥珀酸氧化為延胡索酸[11],由4個核編碼亞基組成。SDHB是琥珀酸脫氫酶的一個亞基,其基因突變導(dǎo)致副神經(jīng)節(jié)瘤和嗜鉻細胞瘤[12]。LPL編碼的脂蛋白脂肪酶可將甘油三酯分解為游離脂肪酸和單酸甘油酯。LPL在心肌、骨骼肌、下丘腦等組織中表達的減少或缺失均可導(dǎo)致機體出現(xiàn)嚴重的糖脂代謝紊亂[13]。MPO是一種在髓系分化過程中合成的血紅素蛋白,是髓細胞的特異性標志[14],是中性粒細胞嗜苯胺藍顆粒中的主要成分。RARA基因產(chǎn)生維甲酸受體,其與早幼粒細胞白血病基因之間的易位與急性早幼粒細胞白血病有關(guān)[15-17]。急性早幼粒細胞白血病是一種經(jīng)全反式維甲酸治療后完全緩解率較高的AML。RET基因編碼的跨膜蛋白RET屬于一種受體酪氨酸激酶,其參與的信號通路包括PI3K-AKT-mTOR途徑[18-19]以及RASRAF-MEK-ERK途徑,而RET基因突變可能導(dǎo)致腫瘤的發(fā)生[20]。
本研究發(fā)現(xiàn),AML患者骨髓細胞的ALDOB基因表達量升高,醛縮酶B異常表達,導(dǎo)致AML患者骨髓細胞的糖代謝紊亂。AML患者骨髓細胞的IDH基因表達量異常升高,使異檸檬酸更多、更快地氧化脫羧為α-酮戊二酸。同時,AML患者骨髓細胞的MDH2和SDHB基因表達量也出現(xiàn)異常升高,使蘋果酸和琥珀酸更多、更快地轉(zhuǎn)變?yōu)椴蒗R宜岷脱雍魉?。這些基因的異常表達導(dǎo)致AML患者出現(xiàn)糖代謝途徑異常。在脂代謝方面,AML患者骨髓細胞的LPL基因不表達,使甘油三酯不能被分解為游離脂肪酸和單酸甘油酯,從而導(dǎo)致脂代謝途徑異常。同時,AML患者骨髓細胞的MPO基因表達量顯著下降,說明AML患者造血系統(tǒng)髓系細胞分化發(fā)生明顯異常。AML患者骨髓細胞的RARA基因表達異常下降,說明AML患者骨髓細胞中急性早幼粒細胞白血病誘導(dǎo)風險加劇。AML患者骨髓細胞的RET基因表達異常升高,說明AML患者骨髓中發(fā)生了腫瘤細胞的異常擴增。這些結(jié)果表明,細胞測序儀可以精確地采集AML患者骨髓細胞的基因表達信息,為從基因的轉(zhuǎn)錄和表達水平等角度研究AML患者在代謝方面的缺陷奠定堅實基礎(chǔ)。
綜上所述,本研究基于流式細胞術(shù)和生物信息學(xué)技術(shù),對AML患者的骨髓細胞分布和代謝情況進行分析。AML患者骨髓細胞與健康者骨髓細胞的代謝水平存在差異,這種差異可能來源于糖脂代謝等相關(guān)基因的異常表達。在未來的研究中,可以通過對骨髓代謝相關(guān)基因的序列進行進一步研究,探索AML患者骨髓細胞中與代謝相關(guān)基因的突變方式和數(shù)量,從而為AML等血液系統(tǒng)疾病的治療提供新靶點。因條件所限,本研究中樣本例數(shù)較少,但較好地反映了AML患者的骨髓代謝情況。在未來的工作中,將擴大樣本規(guī)模,進一步應(yīng)用流式細胞術(shù)和生物信息學(xué)分析,從遺傳學(xué)角度探索AML患者的骨髓細胞代謝情況,為血液學(xué)和細胞生物學(xué)相關(guān)研究奠定基礎(chǔ)。