渠茂林
作者單位:呼和浩特市蒙醫(yī)中醫(yī)醫(yī)院檢驗科,內(nèi)蒙古自治區(qū) 呼和浩特 010010
非小細胞肺癌(NSCLC)是最常見的一種肺癌,包括鱗狀細胞癌(鱗癌)、腺癌、大細胞癌,約占所有肺癌的 80%~85%,惡性程度高 ,易發(fā)生轉(zhuǎn)移和擴散。目前,NSCLC 病人主要采用手術(shù)聯(lián)合放化療,以期延長病人的生存時間,但術(shù)后易復(fù)發(fā)轉(zhuǎn)移,5年生存率很低。目前,NSCLC 發(fā)生發(fā)展的機制尚不清楚,從基因水平研究 NSCLC 的病理機制對提高早期診斷率、尋找治療靶點、改善預(yù)后至關(guān)重要。配對盒基因 8(PAX8)是一種細胞系限制性轉(zhuǎn)錄因子,可以與靶 DNA 結(jié)合,調(diào)控相關(guān)基因的轉(zhuǎn)移。已有研究顯示,PAX8 在乳腺癌、胃癌、腎癌以及肺癌等多種惡性腫瘤中均存在異常高表達,但 其 在NSCLC 中的表達研究報道較少。高通量基因表達數(shù) 據(jù) 庫(Gene expression Omnibus,GEO 數(shù)據(jù)庫)是目前最大的面向公眾提供數(shù)據(jù)查詢和可進行提交數(shù)據(jù)進行儲存交換的芯片公共數(shù)據(jù)庫之一。因此本研究于 2019年 6月至 2019年 8月利用 GEO 數(shù)據(jù)庫分析 PAX8 在 NSCLC 病人中的表達及其與病人預(yù)后的關(guān)系。
1.1 數(shù)據(jù)資料采集
利用在線工具 Oncomine(https:∕∕oncomine.org∕)選擇 TCGA Lung 2 數(shù)據(jù)集,其中包括 1 537 個樣本的基因表達譜數(shù)據(jù),正常肺組織 390例,肺癌組織共 721例,血液樣本 420例,無意義樣本 6例,分析 PAX8 在肺癌組織與正常肺組織中的 表達情況 。 再 從 GEO 公共數(shù)據(jù) 庫(https:∕∕www.ncbi.nlm.nih.gov∕gds)檢索 NSCLC 的差異基因表達譜及相關(guān)臨床數(shù)據(jù),檢索平臺 Platforms:GPL570,數(shù)據(jù)集:GSE77803。1.2 數(shù)據(jù)篩選及分組
下載 GSE77803(GPL570)基因表達 矩陣,156例NSCLC 病人 的數(shù)據(jù) 集包含 156例NSCLC 病人的基因表達譜數(shù)據(jù)和性別、年齡、病理類型、T 分期、N 分期和術(shù)后復(fù)發(fā)情況。根據(jù)矩陣中 PAX8(121_at)表達值的中位數(shù),將 NSCLC 臨床樣本分為 PAX8 低表達組(n
=78)和 PAX8 高表達組(n
=78),分析兩組 PAX8 基因表達水平與 NSCLC 病人臨床特征及預(yù)后之間的關(guān)系。1.3 PAX8 基因功能分析
采用基因本體(GO)注釋 分 析(https:∕∕bioportal.bioontology.org∕ontologies∕GO)PAX8 基因的功能,采用 KEGG PATHWAY 分析(https:∕∕www.kegg.jp∕kegg∕pathway.html)PAX8 可 能參與的信號通路。2.1 肺癌組織中 PAX8 的表達
采用 Oncomine 在線數(shù)據(jù)庫,選擇基因 PAX8,設(shè)置 foldchange 為 2,得到 PAX8 在不同腫瘤中的表達情況。TCGA Lung 2數(shù)據(jù)集共檢測了 1 537 個樣本,其中正常肺組織 390例,肺癌組織共 721例,血液樣本 420例,無意義樣本 6例。與正常肺組織(0.06±0.02)相比,PAX8 在肺腺癌(0.14±0.07)和肺鱗癌(0.15±0.09)中表達水平明顯升高(F
=217.130,P
<0.001)。2.2 NSCLC 癌組織中 PAX8 的表達與臨床特征之間的關(guān)系
NSCLC 癌組織中 PAX8 的表達水平與病人的T分期 、N分期和是否復(fù)發(fā)有關(guān)(P
<0.05),見表1。2.3 PAX8 的表達與 NSCLC 病人預(yù)后生存之間的關(guān)系
156例NSCLC 病人的隨訪時間范圍為6.2~64.8個月,中位隨訪時間為48.7個月。 癌 組 織 中PAX8 低表達病人的總生存率為 52.94%,中位生存期 為 54.6個月 ,顯著高于PAX8 高表達病人的(34.35%,48.6 個月)(log-rankχ
=
4.609,P
=0.032),見圖1A。癌組織中 PAX8 低表達的無病生存率為42.50%,中位生存期為 51.7 個月,顯著高于 PAX8 高表達病人的(28.71%,40.8 個月)(log-rankχ
=
5.712,P
=0.017),見圖1B。2.4 PAX8 的 GO 分 析
GO 分 析 PAX8 可 能 的 功能,結(jié)果顯示,在生物學(xué)過程水平上,PAX8 可能參與了泌尿系統(tǒng)、腎臟、中樞神經(jīng)系統(tǒng)、甲狀腺等多組織器官的生理生化過程,在細胞組成水平上,PAX8主要定位與細胞核;在分子功能水平上,PAX8 存在DNA 結(jié)合位點,可以與靶 DNA 結(jié)合,發(fā)揮其轉(zhuǎn)錄因子的作用,見表2。2.5 PAX8 的京都基因和基因組數(shù)據(jù)庫(KEGG)分析
KEGG 分 析 PAX8 可能參與的信號通路 ,map05216 和 map04918 顯示,PAX8 蛋白可能參與調(diào)節(jié)甲狀腺癌的發(fā)生發(fā)展以及甲狀腺激素的合成,map05202 和 map05200 顯示,PAX8 蛋白可能在腫瘤發(fā)生發(fā)展中發(fā)揮其轉(zhuǎn)錄因子的調(diào)節(jié)作用,見表3。表1 非小細胞肺癌癌組織中配對盒基因 8 的表達與臨床特征之間的關(guān)系∕例(%)
NSCLC 約占所有肺癌的 80%,是一種高度異質(zhì)性疾病,探索 NSCLC 的發(fā)病機制,分析 NSCLC 的特異性分子標志物具有重要臨床意義。Oncomine 數(shù)據(jù)庫整合了 GEO、TCGA 和已發(fā)表的文獻等來源的RNA 和 DNA-seq 數(shù)據(jù),是目前最常用的大型腫瘤基因芯片數(shù)據(jù)庫 ,可用于分析差異基因的表達。PAX8 蛋 白由 450 個氨基 酸組 成,位 于 2q12-14 染色體的基因編碼,在多種惡性腫瘤中均存在異常高表達。本研究采用 Oncomine 基因芯片數(shù)據(jù)庫檢索了 PAX8 在肺癌中的表達情況,發(fā)現(xiàn) PAX8 在大部分肺腺癌和肺鱗癌中均存在異常高表達,在少部分表達肺腺癌和肺鱗癌中出現(xiàn)異常低表達,肺腺癌和肺鱗癌均屬于 NSCLC,提示 PAX8 在大部分 NSCLC 中均存在異常高表達。宋艷等的研究顯示,PAX8在甲狀腺癌、腎細胞癌、子宮內(nèi)膜腺癌等多種衛(wèi)星腫瘤中存在高表達,提示 PAX8 在 NSCLC 的發(fā)生發(fā)展中具有重要意義。腫瘤 GEO 數(shù)據(jù)庫是目前世界上最全面的儲存高通量基因表達豐度數(shù)據(jù)的開源數(shù)據(jù)庫,收錄了多個物種,多種不同類型的高通量實驗數(shù)據(jù)。因此,本研究基于 GEO 數(shù)據(jù)庫分析了PAX8 的表達與 NSCLC 病人預(yù)后生存之間的關(guān)系。
表2 配對盒基因 8(PAX8)的基因本體(GO)分析
表3 配對盒基因 8(PAX8)的京都基因和基因組數(shù)據(jù)庫(KEGG)分析結(jié)果
圖1 配對盒基因 8(PAX8)的表達與非小細胞肺癌病人預(yù)后生存之間的關(guān)系:A 為 PAX8 的表達與總生存率;B 為 PAX8 的表達與無病生存率
本研究分析 GEO 數(shù)據(jù)庫數(shù)據(jù)集(GSE77803)中PAX8 的表達,發(fā)現(xiàn) PAX8 的表達與 NSCLC 病人的 T分期和 N 分期有關(guān)。T 分期主要反映了腫瘤的浸潤深度,N 分期主要反映了腫瘤的淋巴結(jié)轉(zhuǎn)移情況,是指導(dǎo)臨床治療的主要依據(jù),提示 PAX8 的表達與腫瘤的惡性程度有關(guān),參與了腫瘤的發(fā)生發(fā)展。研究顯示,PAX8 在腮腺癌組織表達與其術(shù)后復(fù)發(fā)、轉(zhuǎn)移有關(guān),可作為評估腮腺癌根治術(shù)預(yù)后的指標,提示 PAX8 與 NSCLC 病人的臨床病理特征有關(guān),可以反映 NSCLC 的病情發(fā)展。本研究分析 GEO 數(shù)據(jù)庫數(shù)據(jù)集(GSE77803)中 PAX8 的表達,PAX8 高表達NSCLC 病人術(shù)后復(fù)發(fā)的比例明顯高于 PAX8 低表達病人,提示 PAX8 的表達與 NSCLC 病人的術(shù)后復(fù)發(fā)有關(guān)。本研究發(fā)現(xiàn) PAX8 低表達病人的總生存率和無病生存率明顯高于 PAX8 高表達病人,提示 PAX8與 NSCLC 病人的預(yù)后生存有關(guān),有望作為其臨床預(yù)后的分子標志物。
GO 富集可以根據(jù) PAX8 蛋白的序列信息,分析其可能的功能,在基因功能的分析 中具有重要作用。GO 富集主要從分子功能本體論、生物學(xué)途徑本體論和細胞組件本體論三個層面分析基因的功能。本研究 GO 富集分析顯示,PAX8 蛋白參與機體多器官的生理生化過程,可以與相應(yīng)的靶 DNA結(jié)合,發(fā)揮其轉(zhuǎn)錄因子的調(diào)節(jié)作用。KEGG 分析是一種常用的生物信息學(xué)代謝通路分析工具之一,可以分析蛋白質(zhì)參與的最主要的代謝和信號轉(zhuǎn)導(dǎo)途徑。本研究 KEGG 分析顯示,PAX8 蛋白可能參與了甲狀腺癌等多種腫瘤發(fā)生發(fā)展的信號通路。Li等的研究顯示,PAX8 蛋白在 NSCLC 中異常高表達 ,參與調(diào)節(jié)了NSCLC細胞的生長和運動 ,提示PAX8 參與調(diào)控 NSCLC 的發(fā)生發(fā)展,有望成為其治療和預(yù)后的標志物。
綜上所述,PAX8 蛋白可能參與調(diào)節(jié) NSCLC 發(fā)生發(fā)展的信號通路,在大部分肺腺癌和肺鱗癌中均存在異常高表達,其表達與 NSCLC 病人的 T 分期、N分期以及術(shù)后復(fù)發(fā)有關(guān),PAX8 低表達病人具有更高的生存率。但 PAX8 蛋白作用于 NSCLC 發(fā)生發(fā)展的具體機制尚不清楚,有待于下一步研究。