鄭燕芳 李紀強 姜茂竹 曾 融 麥仲倫 張積仁
(南方醫(yī)科大學附屬珠江醫(yī)院腫瘤中心,廣東 廣州 510282)
盡管近年來結(jié)直腸癌的治療手段有很大進展,但中晚期結(jié)直腸癌的5年生存率并無多大改觀〔1〕。早期診斷對提高結(jié)直腸癌患者的生存率、降低其病死率具有重要意義。隨著基因組學的研究逐漸深入,現(xiàn)已發(fā)現(xiàn)能比結(jié)直腸鏡及生化指標更早期診斷結(jié)直腸癌的基因標記物〔2〕。然而,目前國內(nèi)外還未見到結(jié)直腸癌診斷相關基因進行的大范圍文獻計量及生物信息學的研究。本研究采用文獻計量學及生物信息學方法對相關文獻進行量化及可視化分析,多角度、全面、科學的評價近10年來國內(nèi)外結(jié)直腸癌診斷相關基因研究。
1.1 文獻來源 Embase數(shù)據(jù)庫進行Emtree擴展檢索,輔以自由詞的題目及摘要字段的檢索;Pubmed/Medline數(shù)據(jù)庫進行MeSH檢索,輔以自由詞的題目及摘要字段的檢索。結(jié)直腸癌檢索詞:①MeSH詞:colorectal neoplasm,②EMtree詞:colorectal cancer;③自由詞檢索:colorectal cancer、colorectal tumor* 、colorectal neoplasm*、colorectal carcinoma*。診斷檢索詞:①MeSH詞:prognosis;②EMtree詞:cancer prognosis;③自由詞:colorectal cancer prognosis*、diagnosis of colorectal cancer*。基因檢索詞:gene。
1.2 文獻納入與排除 納入標準:①全部與結(jié)直腸癌患者診斷有關基因及基因產(chǎn)物的研究及系統(tǒng)綜述;②納入人類的臨床研究(包括腫瘤病人原代細胞產(chǎn)生的結(jié)果、根據(jù)臨床及生物信息學模型推導出的結(jié)果);③文獻形式為論著;④納入臨床研究文獻、會議論文;⑤納入文獻需包括能提供足夠信息的摘要,或可以獲取全文資料。⑥當文獻同時研究人類的臨床研究和動物體內(nèi)實驗或細胞株體外研究時,納入其中的臨床研究的數(shù)據(jù)。排除標準:①與診斷相關的非基因研究;②綜述、個案報道、通訊、回信、書籍及社論等;③細胞株體外研究、動物體內(nèi)實驗;④針對基因的結(jié)構(gòu)、機理等研究;⑤提供信息不全的會議摘要;⑥不同數(shù)據(jù)庫來源,作者、題目及出版年相同的文獻按1篇統(tǒng)計;⑦其他與研究目的不符的文獻;⑧研究內(nèi)容,既有會議摘要又有論著,以論著進行統(tǒng)計。
1.3 文獻計量分析 采用Endnote X3軟件對所檢索文獻管理,并借助Excel 2003軟件對最終符合納入標準的文獻分別進行出版年、國家、期刊、研究機構(gòu)、作者及所研究基因進行計量分析。
2.1 檢索結(jié)果 從Embase中檢出文獻11 496篇,Pubmed中檢出文獻10 968篇;其中綜述88篇,動物實驗類2 707篇,細胞水平的2 898,重復文獻8 382篇,經(jīng)過初篩后的得到2001~2010有關結(jié)腸癌基因相關文獻共有6 867篇,根據(jù)文章研究內(nèi)容確定設計結(jié)直腸癌診斷相關基因文獻共255篇。
2.2 文獻計量分析結(jié)果
2.2.1 文獻發(fā)表年限結(jié)果 結(jié)果顯示結(jié)直腸癌診斷相關基因相關文章在2006年以前呈逐年上升趨勢,自2006年后呈逐年下降。表明在2006年左右對結(jié)直腸癌分子診斷的研究具有重大突破。而在此后研究尚未見重大突破。見表1。
2.2.2 文獻第一作者所在國家結(jié)果 統(tǒng)計發(fā)現(xiàn)該領域研究國家或地區(qū)達37個。結(jié)果表明中國在此領域文章量最多,占該領域發(fā)文總量的21.57%。美國排名第2名,占該領域發(fā)文量的13.33%。日本有關結(jié)直腸癌診斷相關基因文章排名第3位,占該領域發(fā)文總量的10.98%。在此領域前十名的國家中,除中國、阿根廷兩個國家外,均為發(fā)達國家。見表1。
2.2.3 文獻期刊結(jié)果 對發(fā)表論文的期刊分布進行統(tǒng)計,可以確定該領域的核心出版物,為研究人員縮小關注范圍提供依據(jù)。納入的255篇論文發(fā)表在132種生物醫(yī)學期刊上,平均每刊發(fā)文1.93篇。其中以Anticancer Res文章量最多,總數(shù)的4.31%,Cancer Res次之。排前十名的期刊共發(fā)文量達71篇,且這些期刊多為腫瘤專業(yè)雜志,見表1。
2.2.4 文獻的研究機構(gòu)結(jié)果 本文以第一作者所在機構(gòu)作為統(tǒng)計對象,共統(tǒng)計出192個研究機構(gòu)進行結(jié)直腸癌診斷相關基因方面研究,見表1。其中發(fā)文量≥5篇的研究機構(gòu)有2個:中國的Zhejiang University(7篇)、中國的Guangxi Medical University(5篇)。中國的Fudan University排在第4位(4篇)。國外發(fā)文量較為分散,未見超過5篇的機構(gòu)。
2.2.5 文獻的第一作者結(jié)果 統(tǒng)計發(fā)現(xiàn)第一作者共有235名,其中以中國(49個)、美國(33個)和日本(27個)居多,核心作者共有17個,來自于8個不同國家。本研究發(fā)現(xiàn)瑞典的Dimberg J、我國的Yang L,Zhang Y在10年間發(fā)文量最大(3篇),為該領域做出了巨大貢獻。
表1 結(jié)直腸癌診斷相關基因的發(fā)文量及基因排名
表2 結(jié)直腸癌診斷基因GO分類Bayes Factor>20的基因
2.2.6 文獻所研究基因結(jié)果 在2001~2010年期間,結(jié)直腸癌診斷相關基因臨床研究中的非多基因模型研究提及193個基因。KRAS是其中最為熱點的基因,共有58篇文獻報道了其在結(jié)直腸癌診斷中的作用。對發(fā)文量較多的國家進行基因分析發(fā)現(xiàn),其中中國研究有47個基因,相對比較集中,以MLH1(7篇)、MSH2(6篇)為主;日本研究共涉及基因數(shù)量多達36個,以研究CDKN2A(6篇)、MLH1(4篇)基因為主。
2.2.7 結(jié)直腸癌診斷基因及其蛋白產(chǎn)物 采用STRING軟件對這193個結(jié)直腸癌診斷基因表達產(chǎn)物構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡,MLH1、PTGS2、TP53、CDH1、AKT1、EGFR、MYC、CTNNB1、VEGFA、CCND1、EGF等基因處于網(wǎng)絡的中心,這些基因之間以及與網(wǎng)絡周邊的基因之間存在著密切的相互作用關系。
2.2.8 結(jié)直腸癌診斷基因及產(chǎn)物分類 利用在線軟件GATHER分析,193個結(jié)直腸癌診斷相關基因共涉及不同分級的Bayes因子≥0的GO分類94類,Bayes因子≥10的GO分類24類。Bayes因子≥20的GO分類6類,見表2。利用GODAG軟件對Bayes因子≥10的24類GO分類進行可視化,了解其之間層次相互包含關系,去除過大或過細分類。這些相關基因產(chǎn)物涉及細胞生理過程調(diào)節(jié)、細胞增殖、細胞周期、細胞周期調(diào)控、細胞程序調(diào)節(jié)、凋亡調(diào)節(jié)、細胞周期負調(diào)控、程序性細胞死亡調(diào)節(jié)、細胞死亡、細胞生理過程負調(diào)節(jié)、凋亡、死亡、程序性細胞死亡、調(diào)節(jié)生理程序、壓力反應等。
2.2.9 關鍵基因(hub基因)及瓶頸基因(bottleneck基因)分析 為尋找hub基因及bottleneck基因,從STRING數(shù)據(jù)庫下載結(jié)直腸癌診斷相關基因網(wǎng)絡,利用Cytoscape將相互作用網(wǎng)絡可視化。結(jié)果表明網(wǎng)絡是由176個節(jié)點3 221條邊組成,網(wǎng)絡直徑為6,網(wǎng)絡的平均距離為2.42。度為節(jié)點連接的邊的總數(shù)目,最大度值為202,最小為2,平均為36.60,網(wǎng)絡中連接度高的節(jié)點對網(wǎng)絡的穩(wěn)定性起到重要的作用,本研究度數(shù)≥10的蛋白所對應的基因共有134個,本研究規(guī)定度數(shù)≥100的蛋白所對應的基因為 hub基因,共有 14個 TP53、CTNNB1、CDH1、AKT1、EGFR、MYC、CCND1、ESR1、BCL2 、PTGS2、MLH1、SP1、VEGFA、EGF,它們的功能改變可能對于整個網(wǎng)絡來說是至關重要的。Betweenness為網(wǎng)絡中所有的最短路徑中經(jīng)過該節(jié)點的數(shù)量比例,最大Betweenness值為3 808.01,最小為0,平均為249.23。相應的節(jié)點或者邊在整個網(wǎng)絡中的作用和影響力,本研究規(guī)定Betweenness大于等于均數(shù)+1×SD(標準差)的蛋白所對應的基因為bottleneck基因,bottleneck基因有12個VEGFA MYC EGF AKT1 CDH1 PTGS2 TP53 MGMT CTNNB1 EGFR CCND1 ESR1。
結(jié)直腸癌是遺傳因素最為顯著的惡性腫瘤之一,隨著基因組學的研究逐漸深入,已發(fā)現(xiàn)大量能夠比直腸指診、糞便隱血試驗、影像學檢查、血腫瘤標志物、結(jié)腸鏡檢查等常規(guī)指標更能早期診斷結(jié)直腸癌的基因標記物。從2001年至2010年結(jié)直腸癌診斷文獻中發(fā)現(xiàn),許多從血液或糞便中篩查某種特異性較高的結(jié)直腸癌相關基因或易感基因的甲基化相對特異地反映結(jié)直腸上皮癌變的進展程度,多屬于無創(chuàng)傷性檢測,更容易推廣。
文獻計量分析,結(jié)直腸癌主要研究國家為發(fā)達國家,表明經(jīng)濟發(fā)達的地區(qū)研究水平較高,同時與該地區(qū)結(jié)直腸癌發(fā)病率相對較高有關〔1〕。我國發(fā)文量最多,表明隨著生活方式的改變和飲食、環(huán)境污染,我國結(jié)直腸癌發(fā)病率逐年提高,加上我國人口基數(shù)巨大,造成我國在結(jié)直腸癌基因診斷成為熱點。各學者發(fā)表文獻均未超過10篇,尚無該領域的領軍人物,表明目前此領域研究較為分散,需要加強國家之間、機構(gòu)之間的相互協(xié)作,進行多中心、大樣本的研究。
STRING數(shù)據(jù)庫是一個蛋白質(zhì)相互作用數(shù)據(jù)庫。該數(shù)據(jù)庫收集了文獻報道的相互作用的蛋白質(zhì)信息和預測的相互作用蛋白質(zhì)信息〔3,4〕。本文所篩選出的基因及蛋白網(wǎng)絡同國外相關研究基本一致〔5,6〕。通過對結(jié)直腸癌診斷相關基因的相互作用、GO分類研究,進一步將通過生物信息學方法尋找研究基因中的關鍵基因(hub基因)及瓶頸基因(bottleneck基因),是結(jié)直腸癌診斷相關基因研究的重點〔7~9〕。本文初步篩選了一些研究較成熟、預測性好的基因,為建立高效的多基因預測模型奠定了基礎,為結(jié)直腸癌早期診斷提供了可能。
1 Jemal A,Siegel R,Ward E,et al.Cancer statistics,2009〔J〕.CA Cancer J Clin,2009;59(4):225-49.
2 Slattery ML,Lundgreen A,Herrick JS,et al.Genetic variation in the transforming growth factor-beta signaling pathway and survival after diagnosis with colon and rectal cancer〔J〕.Cancer,2011;117(18):4175-83.
3 Barker CM,Gomez J,Grotta JC,et al.Feasibility of carotid artery stenting in patients with angiographic string sign〔J〕.Catheter Cardiovasc Interv,2010;75(7):1104-9.
4 Schwartz R,Istrail S,King J.Frequencies of amino acid strings in globular protein sequences indicate suppression of blocks of consecutive hydrophobic residues〔J〕.Protein Sci,2001;10(5):1023-31.
5 De Oliveira LF,De Oliveira CH,Barrezueta LF,et al.Immunoexpression of inhibitors of apoptosis proteins and their antagonist SMAC/DIABLO in colorectal carcinoma:correlation with apoptotic index,cellular proliferation and prognosis〔J〕.Oncol Rep,2009;22(2):295-303.
6 Xie C,Song LB,Wu JH,et al.Upregulator of cell proliferation predicts poor diagnosis in hepatocellular carcinoma and contributes to hepatocarcinogenesis by downregulating FOXO3a〔J〕.PLoS One,2012;7(7):e40607.
7 Campbell C,Anandan C,Appleton S,et al.Avoiding inappropriate invitations to cancer screening programmes:the role of primary care〔J〕.JMed Screen,2011;18(1):12-7.
8 Miles A,Rainbow S,von Wagner C.Cancer fatalism and poor self-rated health mediate the association between socioeconomic status and uptake of colorectal cancer screening in England〔J〕.Cancer Epidemiol Biomarkers Prev,2011;20(10):2132-40.
9 Juan ME,Alfaras I,Planas JM.Colorectal cancer chemoprevention by trans-resveratrol〔J〕.Pharmacol Res,2012;65(6):584-91.