嚴(yán)玉娟,趙 健,宋曉峰
(南京航空航天大學(xué) 自動化學(xué)院, 南京 211106)
卵巢癌是一種起源于卵巢的惡性腫瘤,常見于卵巢表面上皮細(xì)胞。雖然卵巢癌發(fā)病率僅次于宮頸癌和子宮內(nèi)膜癌,但其死亡率居所有婦科惡性腫瘤之首。國家癌癥中心統(tǒng)計數(shù)據(jù)顯示,近年來隨著我國醫(yī)療質(zhì)量和診療能力的提升,惡性腫瘤五年生存率提升近10%,但卵巢癌患者五年生存率僅提高0.4%,幾乎無明顯改善。卵巢癌仍是婦科癌癥中最危險、患者愈后表現(xiàn)最差的疾病之一,嚴(yán)重威脅著女性生命健康。在我國,每年約5萬余名女性被確診患有卵巢癌[1]。
卵巢癌具有極強(qiáng)的侵襲轉(zhuǎn)移特性,極易以血行轉(zhuǎn)移、淋巴轉(zhuǎn)移等方式將腫瘤細(xì)胞“運(yùn)輸”到全身多個臟器組織中,進(jìn)而引發(fā)各類不良癥狀,如血栓栓塞、血液并發(fā)癥和感染等,這些由癌癥轉(zhuǎn)移或侵襲引發(fā)的并發(fā)癥是導(dǎo)致卵巢癌患者死亡的主要原因[2-3]。因此,了解清楚卵巢癌侵襲轉(zhuǎn)移機(jī)制,對于卵巢癌的診治及預(yù)后意義重大,不僅有助于改善現(xiàn)有的臨床治療方法,還可為新藥研發(fā)提供有價值的科研線索,進(jìn)而提高卵巢癌患者的五年生存率。為此繪制了卵巢癌發(fā)生侵襲轉(zhuǎn)移的簡要示意圖,并對轉(zhuǎn)錄組和蛋白質(zhì)組層面的生物大分子調(diào)控因素、生信工具和數(shù)據(jù)庫進(jìn)行了總結(jié)(見圖1)。
圖1 卵巢癌侵襲轉(zhuǎn)移機(jī)制的生物信息學(xué)研究進(jìn)展Fig.1 Progress in bioinformatics research on the invasion and metastasis mechanisms of ovarian cancer
卵巢癌侵襲是指癌細(xì)胞離開原發(fā)卵巢部位向周圍組織進(jìn)攻的過程,其標(biāo)志是癌細(xì)胞突破基底膜?;啄な菄@大多數(shù)組織細(xì)胞外基質(zhì)的薄層,是一層物理屏障,其剛度是由關(guān)鍵因子Netrin-4所調(diào)節(jié)的[4]。癌細(xì)胞借助自身所形成的肌動蛋白和蛋白酶侵入體,以此突破基底膜[5]。此外,在上皮-間充質(zhì)轉(zhuǎn)化過程中,上皮細(xì)胞黏附分子如E-鈣黏蛋白、細(xì)胞角蛋白等上皮標(biāo)志物表達(dá)水平降低,波形蛋白、N-鈣黏蛋白等間質(zhì)標(biāo)志物表達(dá)水平升高。通過上皮-間充質(zhì)轉(zhuǎn)化,上皮細(xì)胞失去了細(xì)胞極性,失去了與基底膜的連接等上皮表型,而卵巢癌細(xì)胞在這一過程中獲得了部分干細(xì)胞的生理特征,提高了自身的侵襲能力[6]。
卵巢癌細(xì)胞擴(kuò)散到身體其它部位并形成新的轉(zhuǎn)移灶,這個過程稱為轉(zhuǎn)移。同樣地,卵巢癌細(xì)胞從病灶的脫落也與腫瘤上皮-間充質(zhì)轉(zhuǎn)化的機(jī)制密切相關(guān)。上皮-間充質(zhì)轉(zhuǎn)化是一種細(xì)胞重編程過程,與卵巢癌微環(huán)境有一定的相關(guān)性。轉(zhuǎn)化后基質(zhì)金屬蛋白酶表達(dá)上調(diào),加速細(xì)胞外基質(zhì)降解速度,細(xì)胞之間失去了相互黏附的作用,卵巢癌細(xì)胞從病灶脫落,導(dǎo)致了卵巢癌轉(zhuǎn)移灶[7]。脫落的卵巢癌細(xì)胞在自身或者間質(zhì)細(xì)胞分泌的蛋白質(zhì)水解酶的作用下降解新生血管的基底膜與內(nèi)皮,癌細(xì)胞得以進(jìn)入血液循環(huán)或者淋巴系統(tǒng)[8],形成循環(huán)的卵巢癌細(xì)胞。循環(huán)的卵巢癌細(xì)胞在一些運(yùn)動因子的作用下,通過信號傳導(dǎo)途徑到達(dá)新的轉(zhuǎn)移靶器官,并穿出血管,通過膜受體結(jié)合基質(zhì)蛋白,刺激血管增生,形成新的轉(zhuǎn)移灶[9],這些過程與黏附、降解、運(yùn)動等行為密切相關(guān)。
卵巢癌侵襲轉(zhuǎn)移機(jī)制是一個多因素參與的極其復(fù)雜的過程,涉及到多種生物學(xué)過程。目前已知的卵巢癌侵襲轉(zhuǎn)移相關(guān)調(diào)控因素有以下兩類。
惡性腫瘤能夠“掙脫”機(jī)體束縛,進(jìn)行無限增殖和分化,其中承擔(dān)主要作用的“角色”是腫瘤干細(xì)胞(Cancer stem cell,CSC)。CSC是存在于惡性腫瘤組織中的一小群具有干細(xì)胞特性的細(xì)胞,被認(rèn)為是腫瘤發(fā)生、發(fā)展、侵襲和轉(zhuǎn)移能力的根源。卵巢癌干細(xì)胞(Ovarian cancer stem cells,OCSC)于2005年被Bapat等[10]首次發(fā)現(xiàn),隨后Dean和Gupta等證實(shí)OCSC具有自我更新、增殖、分化和耐藥的能力[11-12]。研究發(fā)現(xiàn)卵巢癌干細(xì)胞特征基因在卵巢表面上皮細(xì)胞及輸卵管上皮細(xì)胞中均顯著表達(dá),預(yù)示卵巢表面上皮細(xì)胞和輸卵管上皮細(xì)胞可能是卵巢癌發(fā)生的根源所在[13]。Flesken-Nikitin等[14]進(jìn)一步通過小鼠實(shí)驗證實(shí)了上述推論,結(jié)果表明OCSC可能來源于卵巢表面上皮細(xì)胞、輸卵管上皮細(xì)胞及周圍組織中的多能干細(xì)胞。
Medema Jan Paul和Vermeulen Louis[15]發(fā)現(xiàn)卵巢上皮細(xì)胞不斷重復(fù)著損傷-修復(fù)過程,這一動態(tài)過程隨著女性月經(jīng)周期反復(fù)出現(xiàn)。中國科學(xué)院曾藝研究組近來發(fā)現(xiàn),成年小鼠卵巢的周期性排卵過程會誘導(dǎo)卵巢表面上皮細(xì)胞發(fā)生周期性破裂和再生修復(fù)[16]。這一過程往往伴隨著卵巢干細(xì)胞的增生分化,若受到炎性因子刺激、間質(zhì)內(nèi)皮轉(zhuǎn)化和缺氧等細(xì)胞環(huán)境變化的影響,則可能導(dǎo)致干細(xì)胞走向持續(xù)增生、停止分化的結(jié)局,引發(fā)癌變。
2.2.1 RNA
正常卵巢細(xì)胞失去機(jī)體對其的控制,逃脫免疫細(xì)胞的監(jiān)管,進(jìn)而變成不受控的癌細(xì)胞,這一過程必然少不了基因的調(diào)控。多個研究報道了新型癌基因S100A10參與調(diào)節(jié)細(xì)胞增殖、分化、凋亡、炎癥、血管生成、運(yùn)動、遷移和侵襲等多種生物學(xué)過程[17-20]。其表達(dá)量的增加會顯著增強(qiáng)卵巢癌細(xì)胞的增殖、遷移和侵襲能力。同時還發(fā)現(xiàn)S100A10基因表達(dá)下調(diào)的同時,卵巢癌細(xì)胞對卡鉑(卵巢癌患者最重要、最基本的治療藥物)的敏感性反而得到了提升[19]。作為卵巢癌中新發(fā)現(xiàn)的致癌基因PRR11(Proline-rich protein 11)[20],抑制其表達(dá),卵巢癌細(xì)胞的增殖和體外細(xì)胞遷移行為會受到抑制。Peng等[21]通過轉(zhuǎn)錄組測序技術(shù)鑒定出了多種與卵巢癌侵襲轉(zhuǎn)移過程相關(guān)的基因。其中,上調(diào)的基因有COL4A3、FGF18、LAMA3、SYK等關(guān)鍵基因,這些基因參與細(xì)胞外基質(zhì)-受體相互作用途徑[22-25]。而識別出的下調(diào)基因包括AKT3、DCN、ITGA2、TLR4、TP53,與PI3K-Akt信號傳導(dǎo)過程有著密切的聯(lián)系[26-29]。這些基因通過參與生物學(xué)過程對卵巢癌細(xì)胞的侵襲轉(zhuǎn)移能力進(jìn)行調(diào)控,可能會成為卵巢癌潛在的治療靶點(diǎn)。
研究報道,MTA1(Metastasis-associated gene1)基因與卵巢癌的侵襲轉(zhuǎn)移機(jī)制有著密切的關(guān)系。Song等[30]以20個原發(fā)性卵巢癌樣本、20個轉(zhuǎn)移到淋巴結(jié)的卵巢癌樣本和8個正常卵巢樣本為例,發(fā)現(xiàn)MTA1過表達(dá)率在有轉(zhuǎn)移的原發(fā)性卵巢癌中為100%,而在無轉(zhuǎn)移的卵巢癌中僅為38.5%。同樣地,來自慕尼黑大學(xué)的Christine Dannenmann等[31],通過對115個處于不同癌癥分期和FIGO分級的卵巢癌組織樣本分析,得到一致的結(jié)論:MTA1的表達(dá)在轉(zhuǎn)移性卵巢癌組織中顯著增強(qiáng)。隨著生物學(xué)檢測技術(shù)的不斷發(fā)展,華中科技大學(xué)團(tuán)隊[32]通過體外基因轉(zhuǎn)染技術(shù)將MTA1導(dǎo)入卵巢癌細(xì)胞株中,研究發(fā)現(xiàn)MTA1表達(dá)量的上調(diào)不影響癌細(xì)胞的生長活性,但是促進(jìn)了癌細(xì)胞的克隆形成、遷移和侵襲能力。
microRNA(miRNA)作為一類小的、非編碼RNA,被發(fā)現(xiàn)在細(xì)胞控制基因表達(dá)的過程中承擔(dān)著關(guān)鍵性的角色。Inoue等[33]對癌癥相關(guān)的miRNA進(jìn)行了綜述,發(fā)現(xiàn):miRNA不僅與腫瘤的發(fā)生、發(fā)展密切相關(guān),還參與腫瘤的細(xì)胞增殖、細(xì)胞存活和細(xì)胞侵襲過程,并且在多種腫瘤中存在miRNA表達(dá)異常的現(xiàn)象。Wang等[34]在探究卵巢癌侵襲轉(zhuǎn)移機(jī)制的過程中發(fā)現(xiàn),Hsa-miR-320與卵巢癌遷移和侵襲高度相關(guān),其高表達(dá)表征卵巢癌的不良預(yù)后和轉(zhuǎn)移高風(fēng)險。
2.2.2 蛋白質(zhì)
19世紀(jì)德國病理學(xué)之父魯?shù)婪颉ぞS爾肖提出腫瘤起源于慢性炎癥這一假說,認(rèn)為侵襲轉(zhuǎn)移傳導(dǎo)通路的激活源自炎性因子的上調(diào)。侵襲轉(zhuǎn)移傳導(dǎo)通路被激活后,進(jìn)一步促進(jìn)腫瘤細(xì)胞的侵襲、遷移和上皮間質(zhì)轉(zhuǎn)化(Epithelial-mesenchymal transition,EMT)。常見的重要炎性因子有細(xì)胞黏附分子、腫瘤壞死因子以及血管內(nèi)皮細(xì)胞生長因子等。
細(xì)胞黏附分子是一類細(xì)胞表面蛋白,起著粘附、識別的作用,能夠介導(dǎo)細(xì)胞間相互作用以及細(xì)胞和細(xì)胞外基質(zhì)之間的通訊,其數(shù)量眾多,種類繁雜,在多個生物學(xué)過程中都起著重要的作用[35]。近來,Nakamura K等[36]發(fā)現(xiàn)細(xì)胞黏附分子CD24在卵巢癌中高度表達(dá)。通過對手術(shù)切除的原發(fā)性卵巢癌的組織切片進(jìn)行免疫組織化學(xué)分析,CD24被發(fā)現(xiàn)在卵巢癌Ⅰ-Ⅳ期患者中高表達(dá),且在75%的卵巢癌轉(zhuǎn)移患者中均檢測到CD24,研究結(jié)果預(yù)示黏附分子CD24參與了卵巢癌細(xì)胞的增殖、侵襲轉(zhuǎn)移過程。
1975年發(fā)現(xiàn)了對體外培養(yǎng)的多種腫瘤細(xì)胞株均具有細(xì)胞毒性作用的腫瘤壞死因子α(Tumor necrosis factor alpha,TNF-α)。研究表明,TNF-α是由單核細(xì)胞和巨噬細(xì)胞產(chǎn)生的一種具有多種生物活性的因子。Jiang等檢測了20名惡性上皮性卵巢癌患者和20名良性卵巢囊腫患者中腫瘤組織的TNF-α的mRNA和蛋白質(zhì)表達(dá)量,發(fā)現(xiàn)在惡性上皮性卵巢癌患者中TNF-α的mRNA和蛋白質(zhì)的表達(dá)顯著升高[37]。Mamta Gupta研究團(tuán)隊[38]發(fā)現(xiàn),隨著上皮性卵巢癌患者體內(nèi)TNF-α的表達(dá)量增加,白細(xì)胞介素6(Interleukin 6,IL-6)的血清水平也在不斷地升高,而TNF-α和IL-6正是全身炎癥反應(yīng)標(biāo)志物。Kyeong A So等[39]深入探究了IL-6在上皮-間質(zhì)轉(zhuǎn)化過程中的作用,實(shí)驗結(jié)果表明卵巢腫瘤細(xì)胞在IL-6的刺激下,上皮細(xì)胞標(biāo)志物減少,間充質(zhì)細(xì)胞標(biāo)志物增加。此外,經(jīng)IL-6處理的癌細(xì)胞,基質(zhì)金屬蛋白酶(Matrix metalloproteinases,MMP-2和MMP-9)顯著增加,遷移能力顯著增強(qiáng)。上述結(jié)果說明IL-6可使癌細(xì)胞獲得間充質(zhì)特性,通過加速EMT過程促進(jìn)卵巢癌的侵襲轉(zhuǎn)移。
卵巢癌的生長和增殖往往伴隨著血管的新生,而后者需要血管生長因子的刺激。血管內(nèi)皮生長因子(Vascular endothelial growth factor,VEGF)是一種促血管生長因子,具有高度特異性,能夠通過促進(jìn)腫瘤血管新生來加快腫瘤的增殖生長,從而協(xié)助癌細(xì)胞進(jìn)入血液并轉(zhuǎn)移到其他組織,加速腫瘤的浸潤與轉(zhuǎn)移[40]。在卵巢癌細(xì)胞中,VEGF能夠刺激卵巢細(xì)胞中的血管內(nèi)皮細(xì)胞增生,誘導(dǎo)新血管的生成。同時還會增強(qiáng)血管通透性,加快血漿蛋白向外滲出,促使蛋白水解酶生成,降解細(xì)胞外基質(zhì),從而加快卵巢癌的浸潤與侵襲轉(zhuǎn)移。
癌癥作為一場“失控”的進(jìn)化過程必然涉及對蛋白質(zhì)的異常調(diào)控。Chen等[41]發(fā)現(xiàn)WAP四二硫鍵核心結(jié)構(gòu)域蛋白2(WAP four-disulfide core domain protein 2,WFCD2)能夠促進(jìn)卵巢癌的轉(zhuǎn)移。相比于原發(fā)性卵巢癌樣本,侵襲轉(zhuǎn)移到腹膜和淋巴結(jié)的卵巢癌樣本中的 WFCD2染色評分顯著升高;而敲除WFCD2后,則會減少卵巢癌細(xì)胞的遷移、侵襲。這些結(jié)果表明WFCD2可能在原發(fā)性卵巢癌細(xì)胞向腹膜和淋巴結(jié)轉(zhuǎn)移的過程中發(fā)揮著舉足輕重的作用,參與了卵巢癌腫瘤細(xì)胞的侵襲和轉(zhuǎn)移過程。已被多個研究報道過在多種腫瘤中起到重要作用的蛋白質(zhì)Rab23,是Rab GTPase家族的成員。在卵巢癌中,通過敲低Rab23會出現(xiàn)卵巢癌細(xì)胞增殖、侵襲和轉(zhuǎn)移能力下降的現(xiàn)象,并會抑制上皮間質(zhì)轉(zhuǎn)化的惡性過程[42],這表明Rab23與卵巢癌的增殖、侵襲轉(zhuǎn)移過程密切相關(guān)。同時Zhang等[43]還發(fā)現(xiàn)Rab23可以通過Shh-Gli1-ABCG2通路促進(jìn)卵巢癌細(xì)胞對鉑類藥物產(chǎn)生耐藥性,導(dǎo)致卵巢癌患者生存率低,生存質(zhì)量差。對于這些調(diào)控卵巢癌侵襲轉(zhuǎn)移機(jī)制的生物大分子因素,我們從種類、內(nèi)容和功能三個方面進(jìn)行了總結(jié)(見表1)。
表1 卵巢癌侵襲轉(zhuǎn)移機(jī)制的生物大分子調(diào)控因素Table 1 Biomolecular regulators of the mechanisms of ovarian cancer invasion and metastasis
測序技術(shù)的發(fā)展使得生物信息學(xué)工具也處于不斷更新的狀態(tài),目前已涌現(xiàn)出大量生物信息學(xué)工具可用于癌癥相關(guān)的蛋白質(zhì)組和單細(xì)胞轉(zhuǎn)錄組等多種組學(xué)數(shù)據(jù)的處理、分析與可視化。
蛋白質(zhì)組學(xué)是通過高通量檢測方法對蛋白質(zhì)的特征進(jìn)行研究,包括蛋白質(zhì)的表達(dá)水平、翻譯后修飾、蛋白間相互作用等。開展蛋白質(zhì)組學(xué)的研究不僅有助于更好地了解生命活動規(guī)律,同時也闡明了多種疾病的發(fā)病機(jī)制,為疾病的治療開拓了新的思路和方法。近年來,適用于分析癌癥相關(guān)蛋白質(zhì)組學(xué)數(shù)據(jù)的生物信息學(xué)工具逐漸成熟。
芝加哥大學(xué)研究團(tuán)隊[44]采用液相色譜-質(zhì)譜聯(lián)用/質(zhì)譜方法,使用顯微切割技術(shù)提取卵巢癌組織和基質(zhì)的蛋白質(zhì)組學(xué)數(shù)據(jù),發(fā)現(xiàn)NNMT蛋白是調(diào)控卵巢癌轉(zhuǎn)移過程中的關(guān)鍵蛋白。這為卵巢癌細(xì)胞的轉(zhuǎn)移過程提供了一個非常有價值的干預(yù)靶點(diǎn)。通過對蛋白組組學(xué)進(jìn)行可視化分析,將會使得研究人員對具有侵襲轉(zhuǎn)移性質(zhì)的癌癥的發(fā)病機(jī)制有著更加深入的理解。目前對蛋白質(zhì)的定量工具如下:2014年,George Rosenberger等[45]發(fā)現(xiàn):雖然相對定量已普遍用于蛋白質(zhì)組學(xué),但是很少有測量絕對蛋白質(zhì)數(shù)量的蛋白質(zhì)組學(xué)數(shù)據(jù)集被報道。然而對于生物樣品中蛋白質(zhì)的絕對量的測定對于多種類型的科學(xué)研究是非常有必要的。因此George Rosenberger團(tuán)隊設(shè)計了一款可支持從無標(biāo)記的液相色譜-質(zhì)譜聯(lián)用/質(zhì)譜(LC-MS/MS)方法獲得的蛋白質(zhì)組學(xué)數(shù)據(jù)來估計絕對蛋白質(zhì)數(shù)量的用戶友好型且透明的軟件。此軟件提供一個包括48種蛋白質(zhì),由8個蛋白質(zhì)組成的動態(tài)范圍為5個數(shù)量級的示例數(shù)據(jù)集。用戶可以輸入從各種質(zhì)譜測量模式和分析軟件工具所得到的輸入數(shù)據(jù),根據(jù)示例數(shù)據(jù)可將輸入數(shù)據(jù)變換成合適的格式。通過aLFQ軟件可實(shí)現(xiàn)無標(biāo)記的蛋白質(zhì)的絕對量。同樣地,2020年出現(xiàn)了由Thang V Pham團(tuán)隊開發(fā)的以實(shí)現(xiàn)基于無標(biāo)記數(shù)據(jù)獨(dú)立采集 (Data-independent acquisition,DIA) 質(zhì)譜的蛋白質(zhì)組學(xué)的準(zhǔn)確蛋白質(zhì)定量的iq軟件[46]、2022年更新的由Wolfgang Raffelsberger開創(chuàng)的wrProteo軟件[47]都是對基于LC-MS/MS方法產(chǎn)生的蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行蛋白質(zhì)的絕對量的測量。除此之外,wrProteo軟件還可以對由于某些樣品中給定肽的物理缺失、靈敏度限制或其他原因造成的定量蛋白質(zhì)組學(xué)測量中經(jīng)常出現(xiàn)的多個NA值進(jìn)行處理,提供了以圖形的方式來檢查數(shù)據(jù)。并且通過各自的重復(fù)測量來研究NA值的性質(zhì),并幫助確認(rèn)用低隨機(jī)值替換NA的選擇。2020年,Christian Panse等[48]創(chuàng)建了一款可以根據(jù)蛋白質(zhì)組學(xué)中質(zhì)譜相關(guān)數(shù)據(jù),可對數(shù)據(jù)進(jìn)行可視化操作與分析的軟件——protViz,大大完善了蛋白質(zhì)組學(xué)數(shù)據(jù)的分析體系。aLFQ和iq軟件還可以診斷和校正大規(guī)模蛋白質(zhì)組學(xué)數(shù)據(jù)中的批次效應(yīng)[49]。這些對蛋白質(zhì)組學(xué)數(shù)據(jù)分析的軟件可以在網(wǎng)絡(luò)上輕松獲取下載鏈接與幫助文檔。
單細(xì)胞測序技術(shù)能夠很好地分析腫瘤的異質(zhì)性、獲取腫瘤微環(huán)境中的細(xì)胞狀態(tài)以及細(xì)胞之間的通訊行為等這些可以揭示腫瘤侵襲轉(zhuǎn)移現(xiàn)象的機(jī)制。目前,用于處理、分析以及可視化單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)的生物信息學(xué)工具十分常見,數(shù)量眾多,且形成了一套相對較為固定的處理流程。
Pang等[50]針對具有高度侵襲轉(zhuǎn)移性質(zhì)的膠質(zhì)母細(xì)胞瘤的單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)進(jìn)行了侵襲轉(zhuǎn)移軌跡的構(gòu)建以及找尋分子機(jī)制,確定了控制腫瘤侵襲潛力的關(guān)鍵因素。整體的處理流程包括對于獲取到的膠質(zhì)母細(xì)胞瘤的單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù),先使用Bowtie2[51]將其與人類基因組數(shù)據(jù)進(jìn)行超快速和高效比對。Bowtie2允許CPU以每小時超過2 500萬次的讀取速度來對齊35個堿基對。在相同條件下,相較于同類型的讀取軟件Maq[52]、SOAP[53]分別提升了35倍和300倍。對于比對之后的數(shù)據(jù)使用RSEM[54]進(jìn)行轉(zhuǎn)錄本定量,將基因表達(dá)水平量化到每百萬轉(zhuǎn)錄本的量級。接著,以GTEx Consortium(Genotype-tissue expression consortium),基因型-組織表達(dá)研究聯(lián)盟)[55]中的腦組織正常樣本為參照,基于拷貝數(shù)變異篩選腫瘤細(xì)胞。最后,對篩選出的膠質(zhì)母細(xì)胞瘤細(xì)胞的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),通過閾值過濾進(jìn)行預(yù)處理,得到單細(xì)胞轉(zhuǎn)錄組表達(dá)矩陣,并用Seurat對其進(jìn)行深入處理。Seurat[56]作為最常用的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析工具,可對單細(xì)胞轉(zhuǎn)錄組表達(dá)矩陣進(jìn)行多種處理:包括使用特定的函數(shù)對數(shù)據(jù)進(jìn)行線粒體基因含量的檢測和每一細(xì)胞所處細(xì)胞周期的確定等預(yù)處理工作,以及對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、聚類和根據(jù)需要進(jìn)行可視化分析。
Kharchneko等[57]還采用了SCDE進(jìn)行了差異表達(dá)基因的鑒定與篩選。SCDE作為特定的用于分析單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)差異表達(dá)基因的分析工具,能夠解決單細(xì)胞測序中由于細(xì)胞本身不表達(dá)某些基因或者在測序過程中未測到而出現(xiàn)的許多零值的問題。同時為了評估不同特征與通路的活性,試圖采用GSVA[58]軟件。GSVA(Gene set variation analysis,基因集變異分析)軟件,采用了非參數(shù)、無監(jiān)督的算法,進(jìn)行數(shù)據(jù)特征和通路活性的描述。在重建細(xì)胞的偽時間軌跡時,使用公認(rèn)的Monocle軟件[59]。Monocle使用了一種簡單的、無偏的和高度可擴(kuò)展的統(tǒng)計程序來對細(xì)胞的偽時間軌跡進(jìn)行構(gòu)建。當(dāng)試圖描述膠質(zhì)母細(xì)胞瘤中干細(xì)胞入侵現(xiàn)象背后的分子事件,采用隱馬爾可夫算法[60](HMM)以無偏的方式確定每個基因的狀態(tài),同時使用ClueGO[61]進(jìn)行動態(tài)過程的分析。所形成的完整的分析流程可以應(yīng)用到任何一種具有侵襲轉(zhuǎn)移特性的癌癥的單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)上,卵巢癌也不例外。
對卵巢癌侵襲轉(zhuǎn)移機(jī)制研究方面常用的生物信息學(xué)工具進(jìn)行了列表總結(jié)(見表2)。
表2 卵巢癌侵襲轉(zhuǎn)移機(jī)制研究常用生物信息學(xué)工具Table 2 Bioinformatics tools commonly used in studies of the invasion and metastasis mechanisms of ovarian cancer
卵巢癌侵襲轉(zhuǎn)移的發(fā)生是多種因素復(fù)雜調(diào)控的結(jié)果,涉及基因組、轉(zhuǎn)錄組、蛋白質(zhì)組等多個組學(xué)層面。隨著新一代測序技術(shù)的出現(xiàn)和發(fā)展,癌癥相關(guān)組學(xué)測序數(shù)據(jù)近十年來呈指數(shù)型增長,特別是單細(xì)胞測序技術(shù)的出現(xiàn),使得人們得以更細(xì)微的從單細(xì)胞角度深入研究腫瘤細(xì)胞侵襲轉(zhuǎn)移的分子機(jī)制。目前已有大量卵巢癌相關(guān)組學(xué)數(shù)據(jù)存儲于各類數(shù)據(jù)庫中,可用于探索卵巢癌侵襲轉(zhuǎn)移的分子機(jī)制。此外,還有一些數(shù)據(jù)庫對目前已知的侵襲轉(zhuǎn)移相關(guān)調(diào)控因素進(jìn)行了整理歸納,方便研究人員查詢及進(jìn)一步研究(見表3)。
表3 卵巢癌侵襲轉(zhuǎn)移機(jī)制研究相關(guān)數(shù)據(jù)庫Table 3 Data resources related to the invasion and metastasis mechanisms of ovarian cancer
侵襲和轉(zhuǎn)移是腫瘤惡性發(fā)展的一個重要特征,相關(guān)研究大都基于TCGA數(shù)據(jù)庫(網(wǎng)址https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)中收集的組學(xué)數(shù)據(jù)。此外,華東師范大學(xué)董東教授團(tuán)隊 從GEO和TCGA數(shù)據(jù)庫以及7 081篇文獻(xiàn)中,收集了29種腫瘤、45種腫瘤亞型和38個轉(zhuǎn)移部位的測序數(shù)據(jù),構(gòu)建了HCMDB數(shù)據(jù)庫[62]。該數(shù)據(jù)庫共有124個數(shù)據(jù)集,涵蓋了mRNA、miRNA、lncRNA等多種RNA的表達(dá)數(shù)據(jù)。
哈爾濱醫(yī)科大學(xué)的李霞、肖云團(tuán)隊[63]在2019年開發(fā)了CancerSEA數(shù)據(jù)庫則旨在全面解碼癌細(xì)胞在單細(xì)胞水平上的不同功能狀態(tài),此數(shù)據(jù)庫提供了14種癌癥相關(guān)功能狀態(tài):血管生成、細(xì)胞凋亡、細(xì)胞周期、細(xì)胞分化、DNA損傷、DNA修復(fù)、EMT、細(xì)胞缺氧、炎癥發(fā)生、癌細(xì)胞侵襲、轉(zhuǎn)移、增殖、細(xì)胞靜息、干細(xì)胞特性。數(shù)據(jù)包括25種癌癥類型的900個癌癥單細(xì)胞,此數(shù)據(jù)庫允許查詢不同癌癥的不同功能狀態(tài)的相關(guān)基因。其中,可以查詢到54個與卵巢癌侵襲轉(zhuǎn)移過程相關(guān)的基因。
武漢科技大學(xué)的鄧文生教授課題組[64]于2020年開發(fā)了LncR2metasta數(shù)據(jù)庫,記錄了54種人類癌癥亞型中的304個lncRNAs和39個包括癌細(xì)胞侵襲、內(nèi)滲、外滲和增殖等過程的癌癥轉(zhuǎn)移事件(Cancer metastatic events,CME)之間的1 238個關(guān)聯(lián)。通過檢索此數(shù)據(jù)庫,共找到4個與卵巢癌轉(zhuǎn)移至淋巴結(jié)過程相關(guān)的lncRNA:SNHG20、DLX6-AS1、HOTTIP、LEF1-AS1。
自2009年湯富酬教授開創(chuàng)單細(xì)胞轉(zhuǎn)錄組測序技術(shù)[65]以來,該技術(shù)便開始井噴式地應(yīng)用于各個方面,現(xiàn)已成為研究腫瘤微環(huán)境、癌癥發(fā)病機(jī)制、侵襲轉(zhuǎn)移事件以及各種癌癥精準(zhǔn)治療與診斷方面必不可少的工具?;诖笠?guī)模的癌癥單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)出現(xiàn)爆炸式增長,迫切需要對這些數(shù)據(jù)進(jìn)行整合,據(jù)此中國科學(xué)院北京基因組研究所于2021年12月正式上線了CancerSCEM數(shù)據(jù)庫[66]。該數(shù)據(jù)庫整合分析了208個癌癥單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)集,涵蓋了卵巢癌(OV)、惡性膠質(zhì)瘤(GBM)等在內(nèi)的20種人類癌癥。通過標(biāo)準(zhǔn)化分析流程處理,獲得了癌癥的精確細(xì)胞類型注釋信息以及細(xì)胞類型間基因差異表達(dá)分析、細(xì)胞表面受體-配體基因?qū)Ρ磉_(dá)譜、樣本內(nèi)細(xì)胞互作網(wǎng)絡(luò)構(gòu)建等結(jié)果,可為用戶提供豐富的腫瘤微環(huán)境相關(guān)信息。利用此數(shù)據(jù)庫,可以進(jìn)一步從單細(xì)胞層面分析卵巢癌侵襲轉(zhuǎn)移的分子機(jī)制。
細(xì)胞特異性調(diào)控網(wǎng)絡(luò)的識別有助于加深對疾病病理學(xué)的理解,哈爾濱醫(yī)科大學(xué)李霞教授團(tuán)隊開發(fā)的單細(xì)胞層面的lncRNA相關(guān)內(nèi)源性競爭RNA(ceRNA)調(diào)控網(wǎng)絡(luò)數(shù)據(jù)庫LnCeCell[67]。總共包含卵巢癌在內(nèi)的25種癌癥類型,細(xì)胞數(shù)量大于94 000個,并提供超過9 000種由實(shí)驗支持與腫瘤轉(zhuǎn)移、復(fù)發(fā)、預(yù)后、循環(huán)和耐藥性等相關(guān)的lncRNA生物標(biāo)志物。該數(shù)據(jù)庫能夠?qū)γ糠N癌癥細(xì)胞展示ceRNA在細(xì)胞內(nèi)位置的全景圖,并描述其在單個癌細(xì)胞中的功能狀態(tài)。同時,LnCeCell還支持通過特定的細(xì)胞背景推斷ceRNA功能。
卵巢癌極強(qiáng)的侵襲轉(zhuǎn)移特性是其高致死率的重要原因,調(diào)控機(jī)理甚為復(fù)雜。已有研究表明,卵巢癌的侵襲轉(zhuǎn)移特性根源于卵巢癌腫瘤干細(xì)胞的無限增殖分化,并在炎性因子的刺激下得到活化和加強(qiáng)。近年來,隨著高通量測序技術(shù)出現(xiàn)和發(fā)展,以及分子純化方法的革新,又陸續(xù)在基因組層面發(fā)現(xiàn)諸如S100A10、MTA1等關(guān)鍵調(diào)控基因,在轉(zhuǎn)錄組層面發(fā)現(xiàn)與卵巢癌遷移和侵襲高度相關(guān)的Hsa-miR-320等非編碼RNA,以及在蛋白質(zhì)組層面發(fā)現(xiàn)WFCD2、Rab23等關(guān)鍵蛋白。然而,不同層面因素間的互作關(guān)系、協(xié)作模式及調(diào)控網(wǎng)絡(luò)仍然未知,這些問題的探討有助于我們更深入地理解卵巢癌侵襲轉(zhuǎn)移的分子機(jī)制。目前,已積累了相當(dāng)多的卵巢癌相關(guān)不同組學(xué)層面的高通量測序數(shù)據(jù),且已有部分成熟的生信分析工具及數(shù)據(jù)庫可供使用。相信隨著研究的更進(jìn)一步深入,未來將有更多的組學(xué)整合分析方法出現(xiàn),深入揭示卵巢癌的侵襲轉(zhuǎn)移機(jī)制,助力癌癥治療藥物的研發(fā),提高患者生存率。