郭佩,何寧寧,夏玉軍#
1青島大學基礎醫(yī)學院,山東 青島 266071
2煙臺毓璜頂醫(yī)院放射科,山東 煙臺 264000
結直腸癌又稱大腸癌,是結腸癌和直腸癌的總稱,是人類最常見的消化道惡性腫瘤之一。在中國,隨著經濟水平的提高以及生活方式的改變,結直腸癌的發(fā)病率逐年上升。目前,結直腸癌的主要診斷方法包括腸鏡檢查、磁共振成像(magnetic resonance imaging,MRI)和異常隱窩病灶(aberrant crypt foci,ACF)檢查。目前對結直腸癌的早期診斷仍然缺乏一種高敏感性的方法。腫瘤標志物存在于組織、血液、體液和尿液中,對腫瘤的早期診斷、預后和療效評估具有重要作用。組織激肽釋放酶家族(kallikrein-related peptidase,KLK)也稱為激肽釋放酶,屬于絲氨酸蛋白酶,它們廣泛存在于機體的各個組織中,主要參與調控心血管、腎臟、神經系統(tǒng)等的生理功能。KLK的異常表達與心臟病、腎病、炎癥反應、惡性腫瘤等疾病的發(fā)生有著密切聯(lián)系,尤其是在腫瘤中,KLK異常表達提示其可作為臨床上腫瘤早期診斷的標志物。已有研究證明,KLK5、KLK10、KLK11的異常表達與卵巢癌密切相關,KLK6的高表達與胃癌的增殖和遷移密切相關,KLK3可以作為前列腺癌診斷的生物標志物,KLK7的高表達與結腸癌細胞的增殖和侵襲密切相關。雖然人們對KLK與各種惡性腫瘤的關系進行了一些研究,但是對KLK家族基因在結直腸癌中的表達及與預后的關系未進行過系統(tǒng)分析。ONCOMINE數(shù)據(jù)庫是目前世界上最大的腫瘤基因芯片數(shù)據(jù)庫和整合數(shù)據(jù)提取平臺。TCGA數(shù)據(jù)庫是目前世界上最大的腫瘤基因組信息數(shù)據(jù)庫。STRING數(shù)據(jù)庫是一個搜尋蛋白質和蛋白質之間相互作用的系統(tǒng),以幫助研究人員更加深入地認清相關蛋白質的功能和其調控機制。GEO是功能基因組學的數(shù)據(jù)存儲庫,可以查詢和下載樣本信息以及基因組的表達概況。本研究利用ONCOMINE、TCGA及GEO數(shù)據(jù)庫進行數(shù)據(jù)挖掘,分析人KLK基因在結直腸癌中的表達和預后意義,以及KLK作為結直腸癌標志物的可能性,為研究KLK基因在結直腸癌發(fā)生發(fā)展中的作用機制提供線索和思路,現(xiàn)報道如下。
在ONCOMINE v4.5數(shù)據(jù)庫中進行注冊,獲得數(shù)據(jù)庫的使用權限。根據(jù)實驗要求設定搜索條件,設定篩選條件。①Gene:KLK1-KLK15(依次檢索KLK家族的基因);②THRESHOLD(P-VALUE):0.01;③THRESHOLD(FOLD CHANGE):2;④ THRESHOLD(GENE RANK):ALL;⑤ Data Type:All。
登錄TCGA數(shù)據(jù)庫(版本v71),獲得人KLK基因在結直腸癌組織和正常結直腸組織中的表達數(shù)據(jù)。
登錄UALCAN在線分析工具(http://ualcan.path.uab.edu/index.html),選擇TCGA數(shù)據(jù)庫的研究,設定篩選條件。①Select Cancer Study:Colorectal cancer;②Select Genomic Profiles:Expression;③Kaplan-Meier生存曲線:Survival。然后以PDF格式導出。
選擇GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)的GSE39582系列數(shù)據(jù),這個數(shù)據(jù)庫包括585個結直腸癌樣本。此數(shù)據(jù)系列還具有分子亞型分類以及臨床生存特征等信息。下載數(shù)據(jù)庫后,利用R軟件(https://www.r-project.org/,版本:3.5.3)分析KLK基因表達與結直腸癌患者預后的關系。根據(jù)基因的中位表達數(shù),分為高表達和低表達。
進入STRING在線數(shù)據(jù)庫(https://string-db.org/),設定查找條件。①基因名稱:KLK6、KLK8和KLK10;②物種:homo(人種);③證據(jù)來源(active interaction sources):選擇實驗數(shù)據(jù)(Experiments)。從而得到KLK基因相關的蛋白質-蛋白質作用網(wǎng)絡。
臨床組織樣本來自于煙臺毓璜頂醫(yī)院,且是在患者知情同意且簽署知情同意書的情況下取得的。研究方案得到了青島大學醫(yī)學部倫理委員會批準。2018年6月至2019年5月,共收集了24例組織樣本,包括20例結直腸癌組織和4例正常結直腸組織。手術之前,患者未進行任何化療或放療。在手術切除后,組織樣本立即被冷凍在液氮中,保存于-80℃,供后續(xù)研究。
根據(jù)mirVana miRNAIsolation kit(購自Thermo Fisher Scientific公司)的說明書進行操作,從組織中提取RNA。采用逆轉錄試劑盒[購自寶生物工程(大連)有限公司]進行cDNA的合成。采用Nanodrop測定cDNA的濃度。產物保存于-80℃,用于下一步的實驗。使用試劑盒Power SYBR-Green PCR Master Mix(購自Thermo Fisher Scientific公司)以及適當?shù)囊镞M行聚合酶鏈反應,采用ABI7500-fast thermocycler(購自Thermo Fisher Scientific公司)進行實驗數(shù)據(jù)的采集。以甘油醛-3-磷酸脫氫酶(glyceraldehyde-3-phosphate dehydrogenase,GAPDH)作為內參,引物見表1。
表1 KLK和GAPDH基因的引物序列
M
(Q
,Q
)]表示,組間比較采用非參數(shù)檢驗;符合正態(tài)分布的計量資料以均數(shù)±標準差(x-
±s
)表示,組間比較采用t
檢驗。采用Kaplan-Meier法繪制生存曲線,組間比較采用Logrank檢驗。采用AdobeIllustrator CS4軟件對圖片進行整理。以P
<0.05為差異有統(tǒng)計學意義。KLK6
、KLK8
、KLK10
和KLK11
基因在結直腸癌組織中具有高水平的表達,KLK7
和KLK12
具有相對較高的表達水平,KLK1
和KLK15
具有較低的表達水平。其中KLK6
在13組數(shù)據(jù)、KLK8
在6組數(shù)據(jù),KLK10
在17組數(shù)據(jù)、KLK11
在10組數(shù)據(jù)中顯示具有高水平的表達(且基因排序超過1%)。(圖1)圖1 ONCOMINE數(shù)據(jù)庫中人KLK 基因在各種腫瘤類型中的表達情況
KLK
基因在結直腸癌組織和正常結直腸組織中的表達結果,對具有顯著性差異的數(shù)據(jù)進行比較分析。結果顯示,結直腸癌組織中人KLK6
、KLK7
、KLK8
、KLK10
、KLK11
和KLK12
基因的表達水平均明顯高于正常結直腸組織,差異均有統(tǒng)計學意義(P
<0.01)。(表2)表2 TCGA數(shù)據(jù)庫中人KLK基因在結直腸癌組織和正常結直腸組織中的表達情況
KLK
基因表達與結直腸癌預后的關系,本研究利用UALCAN在線工具分析TCGA數(shù)據(jù)庫中人KLK
mRNA表達水平與結直腸癌預后的相關數(shù)據(jù)。結果表明,KLK
基因表達與結直腸癌預后無關。TCGA數(shù)據(jù)庫包括121例具有預后信息的結直腸癌組織,進一步選擇GEO數(shù)據(jù)庫中的GSE39582系列數(shù)據(jù),此系列數(shù)據(jù)包括578例具有預后信息的結直腸癌組織。利用R軟件進行數(shù)據(jù)處理和分析,結果顯示,KLK6
、KLK8
、KLK10
和KLK12
基因低表達患者的預后分別優(yōu)于上述基因高表達的患者,差異均有統(tǒng)計學意義(P
=0.0008、0.0392、0.0013、0.0203)(圖2)。圖2 人KLK 基因高表達與低表達結直腸癌患者的生存曲線
KLK
基因在結直腸癌組織中的表達情況,對臨床收集的20例結直腸癌組織和4例正常結直腸組織進行定量逆轉錄聚合酶鏈反應。結果顯示,結直腸癌組織中KLK1
基因的表達水平低于正常結直腸組織,KLK6
、KLK7
、KLK8
、KLK10
和KLK11
基因的表達水平均高于正常結直腸組織,差異均有統(tǒng)計學意義(P
<0.05)(表3)。綜合數(shù)據(jù)挖掘結果和臨床樣本驗證的結果,KLK6
、KLK8
和KLK10
基因具有很高的可能性作為結直腸癌標志物。表3 臨床樣本中人KLK基因在結直腸癌組織和正常結直腸組織中的表達水平
為了進一步明確與KLK6、KLK8和KLK10相互作用的蛋白,通過挖掘STRING數(shù)據(jù)庫構建KLK6、KLK8和KLK10蛋白質-蛋白質作用網(wǎng)絡。結果表明,KLK6和5個蛋白[YY1關聯(lián)因子2(YY1 associated factor 2,YAF2)、α-突觸核蛋白(alpha-synuclein,SNCA)、α2-巨球蛋白樣蛋白 1(alpha-2-macroglobulin like protein 1,A2ML1)、絲氨酸蛋白酶抑制劑Kazal型5(serine peptidase inhibitor Kazal type 5,SPINK5)和絲氨酸蛋白酶抑制劑Kazal 型 9(serine peptidase inhibitor Kazal type 9,SPINK9)]相關,KLK10 和 2 個蛋白(SPINK5 和KLK8)相關,KLK8和8個蛋白[SPINK5、SPINK9、KLK5、半胱天冬酶 1(caspase-1,CASP1)、半胱天冬酶募集結構域16(caspase recruitment domain 16,CARD16)、絲氨酸蛋白酶抑制劑B6(serine proteinase inhibitor B6,SERPINB6)、絲氨酸蛋白酶抑制劑B5(serine proteinase inhibitor B5,SERPINB5)和KLK10]相關。進一步對KLK6、KLK8和KLK10相關的10個相互作用蛋白的生物學功能進行分析,發(fā)現(xiàn)這些相互作用分子主要參與對細胞增殖和凋亡的調節(jié)。(圖3)
圖3 KLK6、KLK8和KLK10基因相關的蛋白質-蛋白質作用網(wǎng)絡圖
結直腸癌是臨床上一種常見的消化道腫瘤,對人類的健康和生命危害極大,并且經常伴隨多種并發(fā)癥。結直腸癌的醫(yī)學研究一直是腫瘤研究的熱點之一。目前治療結直腸癌的主要方法是外科手術和結腸鏡治療,結直腸癌可經手術治愈,但術后復發(fā)轉移率高,可達40%~50%。因此,早期發(fā)現(xiàn)是治療結直腸癌的關鍵,提前發(fā)現(xiàn)將會發(fā)生癌變的患者是醫(yī)學的研究重點。發(fā)現(xiàn)有效的結直腸癌標志物對了解腫瘤成因及患者預后具有關鍵作用。
20世紀90年代中期發(fā)展起來的基因組學是生物信息學的主要研究內容之一。在病理生理、疾病檢測、藥物開發(fā)、疾病預防和功能基因組方面得到了廣泛的應用。在腫瘤研究領域,利用公開的組學數(shù)據(jù)庫尋找腫瘤標志物成為目前科學研究的重要手段之一。本研究通過ONCOMINE數(shù)據(jù)庫的整合分析發(fā)現(xiàn),KLK6、KLK8、KLK10和KLK11基因在結直腸癌組織中具有高水平的表達,KLK7和KLK12基因具有相對較高的表達水平。通過TCGA數(shù)據(jù)庫收集KLK mRNA在結直腸癌組織和正常結直腸組織中的表達水平,結果發(fā)現(xiàn),結直腸癌組織中人 KLK6、KLK7、KLK8、KLK10、KLK11和KLK12基因的表達水平均明顯高于正常結直腸組織(P<0.01)。TCGA數(shù)據(jù)庫雖然是目前世界上最大的腫瘤基因組信息數(shù)據(jù)庫,但是它只有121例具有預后信息的結直腸癌組織,因此,本研究進一步選擇了GEO數(shù)據(jù)庫中包括578例具有預后信息的結直腸癌組織的GSE39582系列數(shù)據(jù)進行生存分析,采用Kaplan-Meier法繪制生存曲線。結果發(fā)現(xiàn),KLK6、KLK8、KLK10和KLK12基因低表達患者的預后分別優(yōu)于上述基因高表達的患者,差異均有統(tǒng)計學意義(P<0.05)。本研究還對臨床收集的結直腸癌組織和正常結直腸組織樣本中的KLK基因進行檢測,結果發(fā)現(xiàn),結直腸癌組織中KLK6、KLK7、KLK8、KLK10和KLK11基因的表達水平均高于正常結直腸組織,差異均有統(tǒng)計學意義(P<0.05)。綜合分析,KLK6、KLK8和KLK10基因具有很大的可能性作為結直腸癌標志物。之前的研究已經發(fā)現(xiàn)KLK6在結直腸癌中具有較高的表達水平以及靶向KLK6作為結直腸癌治療策略的可能性。另外,本研究通過挖掘STRING數(shù)據(jù)庫構建了KLK6、KLK8和KLK10基因相關的蛋白質-蛋白質作用網(wǎng)絡圖。通過分析相關的10個相互作用蛋白的生物學功能,進一步證明了KLK6、KLK8和KLK10對細胞增殖和凋亡具有調節(jié)作用。
綜上所述,本研究通過對公共數(shù)據(jù)庫中腫瘤相關基因信息和預后信息深入挖掘,發(fā)現(xiàn)KLK6、KLK8和KLK10基因在結直腸癌組織中高表達,且與結直腸癌患者的預后有關,將為進一步闡明KLK6、KLK8和KLK10在結直腸癌發(fā)生發(fā)展中的作用奠定理論基礎。