謝 菲,黃東蘭,岑東芝,張積仁
(南方醫(yī)科大學(xué)附屬珠江醫(yī)院腫瘤中心,廣州 510282)
乳腺癌是女性最常見的惡性腫瘤,其發(fā)病率占女性腫瘤的20%以上,隨著年齡的增加而增加,而且早期即有遠(yuǎn)處轉(zhuǎn)移,其死亡原因幾乎都是遠(yuǎn)處轉(zhuǎn)移所致。乳腺癌的轉(zhuǎn)移是一個(gè)較為復(fù)雜、由多基因參與及多步驟完成的過程。與腫瘤轉(zhuǎn)移密切相關(guān)的基因被認(rèn)為是抗轉(zhuǎn)移干預(yù)治療的潛在靶點(diǎn),深入闡述乳腺癌轉(zhuǎn)移的機(jī)制將為預(yù)測(cè)和阻止乳腺癌轉(zhuǎn)移提供堅(jiān)實(shí)的基礎(chǔ)。目前臨床上病理和免疫組化指標(biāo)不能準(zhǔn)確判斷乳腺癌患者轉(zhuǎn)移的風(fēng)險(xiǎn)[1],嚴(yán)重影響腫瘤患者治療的療效和預(yù)后。為了了解目前乳腺癌轉(zhuǎn)移相關(guān)基因的研究概況及發(fā)展趨勢(shì),本文對(duì)國際上2001~2010年10年間乳腺癌轉(zhuǎn)移相關(guān)基因研究的文獻(xiàn)進(jìn)行了計(jì)量學(xué)分析。
1.1 一般資料 數(shù)據(jù)庫的選擇以荷蘭Elsevier Science出版公司建立的Embase數(shù)據(jù)庫、美國國立醫(yī)學(xué)圖書館建立的Medline/Pubmed數(shù)據(jù)庫及美國生物科學(xué)信息服務(wù)社建立的世界上最大的有關(guān)生命科學(xué)的文摘和索引數(shù)據(jù)庫——BIOSIS Preview數(shù)據(jù)庫為數(shù)據(jù)源,統(tǒng)計(jì)這3個(gè)數(shù)據(jù)庫2001年1月至2010年12月收錄的有關(guān)乳腺癌轉(zhuǎn)移相關(guān)基因的文獻(xiàn),選擇這3個(gè)收錄范圍既有交叉又有區(qū)別的權(quán)威數(shù)據(jù)庫來確保數(shù)據(jù)的完整性及準(zhǔn)確性。
1.2 方法
1.2.1 檢索方法 為提高文獻(xiàn)的查準(zhǔn)率,對(duì)Embase數(shù)據(jù)庫進(jìn)行Emtree擴(kuò)展檢索,輔以自由詞的題目及摘要字段的檢索;對(duì)Pubmed/Medline數(shù)據(jù)庫進(jìn)行MeSH檢索,輔以自由詞的題目及摘要字段的檢索;對(duì)BIOSIS Preview數(shù)據(jù)庫進(jìn)行主題檢索。擬定的檢索詞為乳腺癌、轉(zhuǎn)移及基因。乳腺癌的檢索詞包括:(1)MeSH 詞breast neoplasm;(2)EMtree詞breast cancer;(3)自由詞檢索使用 breast cancer、breast tumor*、breast neoplasm*、breast carcinoma*、mammary neoplasm*。轉(zhuǎn)移的英文 檢索詞包括:(1)MeSH 詞 neoplasm metastasis;(2)EMtree詞檢索使用 metastasis、cancer recurrence、cancer relapse及metastasis inhibition;(3)自由詞檢索使用 metastasis、metastases?;虻挠⑽臋z索詞為gene。
1.2.2 文獻(xiàn)納入與排除 文獻(xiàn)形式主要為論著、會(huì)議論文及會(huì)議摘要,納入全部與乳腺癌轉(zhuǎn)移相關(guān)基因及基因產(chǎn)物相關(guān)且以人類為研究對(duì)象的臨床研究,能提供足夠信息的摘要或可以獲取全文資料的文獻(xiàn)。排除了綜述、個(gè)案報(bào)道、回信、書籍、社論、無法獲取摘要的文獻(xiàn)、與轉(zhuǎn)移相關(guān)的非基因研究、針對(duì)基因的結(jié)構(gòu)和機(jī)制等研究、細(xì)胞株體外研究、老鼠及其他動(dòng)物體內(nèi)試驗(yàn)及重復(fù)文獻(xiàn)與其他與研究目的不符的文獻(xiàn)。納入與排除的過程,由2名研究人員獨(dú)立進(jìn)行,最終結(jié)果互相比較,不一致的地方互相討論,或向臨床醫(yī)生、實(shí)驗(yàn)研究人員(研究員)請(qǐng)教。
1.2.3 文獻(xiàn)計(jì)量分析 采用NoteExpress X3軟件對(duì)所檢索文獻(xiàn)進(jìn)行管理,使用Excel 2007軟件對(duì)最終納入的文獻(xiàn)的出版年、作者、國家、研究機(jī)構(gòu)、發(fā)表期刊及基因進(jìn)行計(jì)量學(xué)分析。
2.1 檢索結(jié)果 Embase數(shù)據(jù)庫檢出文獻(xiàn)2246篇,其中論著1573篇,綜述353篇,會(huì)議論文105篇,會(huì)議摘要77篇,信件35篇,筆記33篇,社論31篇。Pubmed/Medline數(shù)據(jù)庫檢出文獻(xiàn)1009篇,其中綜述126篇。BIOSIS Preview數(shù)據(jù)庫檢出文獻(xiàn)1441篇,其中論著974篇,會(huì)議論文440篇,書籍目錄22篇,信件9篇。三庫共檢出文獻(xiàn)4696篇。根據(jù)前述的文獻(xiàn)納入排除標(biāo)準(zhǔn),最終納入研究的文獻(xiàn)共有363篇。
2.2 文獻(xiàn)發(fā)表年限分析 對(duì)最終納入的363篇文獻(xiàn)進(jìn)行發(fā)表年限分析,其年度發(fā)表數(shù)量及變化見圖1。從各年度的文獻(xiàn)量分布上可以看出,近10年乳腺癌轉(zhuǎn)移相關(guān)基因的臨床研究在2001~2007年間呈緩慢增長(zhǎng)趨勢(shì),研究處于萌芽階段,2008年總體開始呈現(xiàn)明顯上升趨勢(shì),2009~2010年間呈平穩(wěn)發(fā)展?fàn)顟B(tài),說明科研人員對(duì)該領(lǐng)域的研究越來越多,目前研究正處于穩(wěn)定發(fā)展的階段。由此推測(cè),今后知識(shí)研究文獻(xiàn)仍將會(huì)保持一定的增長(zhǎng)速度,進(jìn)一步達(dá)到研究的成熟階段。
圖1 乳腺癌轉(zhuǎn)移相關(guān)基因文獻(xiàn)年份分布
2.3 文獻(xiàn)發(fā)文量國別分析 通過對(duì)363篇文獻(xiàn)的發(fā)表國家的統(tǒng)計(jì)分析得知,共有45個(gè)國家發(fā)表了關(guān)于乳腺癌轉(zhuǎn)移相關(guān)基因方面的研究。發(fā)文量前20位的國家見圖2??梢园l(fā)現(xiàn),中國發(fā)文量為84篇,位列第1位,為發(fā)文量最多的國家,占據(jù)了文獻(xiàn)總數(shù)的23.1%,遙遙領(lǐng)先于其他國家。美國繼中國之后,發(fā)文量為65篇,占據(jù)了文獻(xiàn)總數(shù)的17.9%,德國、日本、意大利、英國、法國、波蘭、韓國及土耳其分列3~10位。以上表明,中國目前是研究乳腺癌轉(zhuǎn)移相關(guān)基因最活躍的國家,體現(xiàn)了我國在該領(lǐng)域研究的先進(jìn)地位和較高的科研能力,其他傳統(tǒng)型生物學(xué)領(lǐng)域研究大國也是這一領(lǐng)域的主要力量。發(fā)文量前10名的國家中,除中國外,均為高收入國家。除中國和美國外,在發(fā)文量前20名的國家中,半數(shù)為歐洲國家,說明歐洲在該領(lǐng)域研究中也占據(jù)了重要地位。從學(xué)術(shù)生產(chǎn)力方面分析[2],由于我國人口基數(shù)大,人均發(fā)文量與美、德、日等國相距甚遠(yuǎn),因此我國的研究者應(yīng)加大對(duì)該領(lǐng)域研究投入,吸取國外優(yōu)秀科研經(jīng)驗(yàn),加強(qiáng)與國外權(quán)威科研機(jī)構(gòu)合作,從而提高我國的學(xué)術(shù)生產(chǎn)力,增強(qiáng)我國的學(xué)術(shù)影響力。
2.4 文獻(xiàn)期刊分析 對(duì)最終納入的363篇論文進(jìn)行統(tǒng)計(jì)分析,共發(fā)表在140種生物醫(yī)學(xué)期刊上,平均每刊發(fā)文2.59篇。發(fā)文量達(dá)8篇的期刊有9種,根據(jù)2009年公布的SCI期刊目錄,上述期刊均為SCI收錄期刊,其發(fā)文量及影響因子見表1,其中Cancer Research的影響因子最高。根據(jù)布拉德福分散定律[4],從發(fā)文量的角度,Breast Cancer Research and Treatment是該研究領(lǐng)域核心的英文期刊。通過查閱以上9種期刊可以較快地了解該領(lǐng)域的研究動(dòng)態(tài)。
圖2 乳腺癌轉(zhuǎn)移相關(guān)基因文獻(xiàn)國家分布
表1 發(fā)文量達(dá)8篇及其以上的期刊
2.5 文獻(xiàn)發(fā)表的研究機(jī)構(gòu) 按第一作者所在單位進(jìn)行統(tǒng)計(jì),共統(tǒng)計(jì)出280個(gè)研究機(jī)構(gòu)在進(jìn)行乳腺癌轉(zhuǎn)移相關(guān)基因方面的研究,發(fā)文量達(dá)4篇的研究機(jī)構(gòu)有6個(gè),分別為Tianjin Medical University(12 篇),The Netherlands Cancer Institute(6篇),The University of Texas M.D.Anderson Cancer Center(4篇),General Hospital of Chinese People′s Liberation Army(4篇),University of Lodz(4篇),F(xiàn)u Dan University(4篇),University of Hong Kong(4篇),其中我國研究機(jī)構(gòu)有4個(gè),占據(jù)了主要地位,說明我國在乳腺癌轉(zhuǎn)移相關(guān)基因方面實(shí)力較強(qiáng)。但總體來講,在乳腺癌轉(zhuǎn)移相關(guān)基因研究領(lǐng)域,無論國際上還是國內(nèi),均未形成一些核心研究機(jī)構(gòu)。
2.6 核心作者分析 經(jīng)調(diào)研統(tǒng)計(jì)得知,Netherlands的Mook、Malaysia的Naidu在10年間以第一作者發(fā)表了乳腺癌轉(zhuǎn)移相關(guān)基因方面的論文3篇,為該領(lǐng)域發(fā)文量最大的作者。國外有學(xué)者主要研究MammaPrint70基因模型在預(yù)測(cè)乳腺癌預(yù)后及轉(zhuǎn)移風(fēng)險(xiǎn)方面的作用[4-6],也有很多學(xué)者研究方向?yàn)榛蚨鄳B(tài)性與乳腺癌患病風(fēng)險(xiǎn)的關(guān)系[7-9]。根據(jù)洛特卡和普賴斯對(duì)科學(xué)家的生產(chǎn)率和活動(dòng)規(guī)律的研究,發(fā)表論文為N篇以上的作者為該學(xué)科的杰出科學(xué)家,即核心作者。計(jì)算公式為:N=0.749×(ηmax)1/2。式中ηmax為發(fā)文量最多的作者發(fā)表的論文數(shù)量[10]。根據(jù)上述公式,發(fā)表論文達(dá)2篇的作者為該研究領(lǐng)域的核心作者。經(jīng)統(tǒng)計(jì)核心作者共有20位,對(duì)核心作者所在國家進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),美國、英國各有3位,日本、荷蘭、愛爾蘭、法國各有2位,馬來西亞、加拿大、德國、韓國、意大利、瑞典各有1位,所有核心作者均在發(fā)達(dá)國家,特別是歐美地區(qū),說明歐美的學(xué)者在該研究領(lǐng)域造詣?shì)^深。
2.7 乳腺癌轉(zhuǎn)移相關(guān)基因的文獻(xiàn)量分析 通過對(duì)最終納入的363篇文獻(xiàn)的詳細(xì)閱讀,共統(tǒng)計(jì)出567個(gè)乳腺癌轉(zhuǎn)移相關(guān)基因。其中研究文獻(xiàn)量達(dá)6篇的基因有18個(gè),它們的基因名稱及所涉及的文獻(xiàn)量如下:ERBB2(52)、TP53(26)、ESR1(23)、NME1(16)、KRT19(14)、PGR(12)、VEGFA(12)、EGFR(10)、PTGS2(10)、BRCA1(8)、CD44(8)、CDH1(8)、MMP9(7)、BCL2(6)、CCND1(6)、GSTP1(6)、MKI67(6)、PTEN(6)。其中對(duì)ERBB2基因研究的文獻(xiàn)量最多,共52篇,遠(yuǎn)遠(yuǎn)多于其他基因,TP53基因作為最早發(fā)現(xiàn)的抑癌基因,緊隨其后,有26篇文獻(xiàn)進(jìn)行研究。而在2006~2010年間文獻(xiàn)量達(dá)4篇的基因有19個(gè),ERBB2(33)、ESR1(14)、VEGFA(10)、TP53(10)、PTGS2(6)、PGR(6)、MMP9(6)、KRT19(6)、EGFR(6)、NME1(5)、BRCA1(5)、BCL2(5)、VEGFC(4)、TERT(4)、SCGB2A2(4)、GSTP1(4)、CXCL12(4)、CD44(4)、CCND1(4)??梢园l(fā)現(xiàn),近10年間與近5年間研究較多的基因稍有變化,ERBB2、TP53、ESR1、NME1、KRT19、PGR、VEGFA、EGFR、BRCA1、CD44、BCL2等基因仍然是研究的熱點(diǎn),CDH1、MKI67、PTEN基因在近5年的研究逐漸減少,對(duì)CXCL12、TERT、VEGFC基因的研究在近5年逐漸增多。
通過對(duì)最終納入的363篇乳腺癌轉(zhuǎn)移相關(guān)基因研究文獻(xiàn)的計(jì)量學(xué)分析,可以發(fā)現(xiàn),乳腺癌轉(zhuǎn)移相關(guān)基因方面的研究目前正處于穩(wěn)定發(fā)展階段。中國、美國、日本、英國、德國等國均已經(jīng)開展了這方面的研究,我國在發(fā)文量方面遙遙領(lǐng)先于其他國家,但在人均發(fā)文量方面遠(yuǎn)遠(yuǎn)落后于其他國家。在發(fā)文量達(dá)4篇的6個(gè)研究機(jī)構(gòu)中,有4個(gè)在中國,充分說明我國在乳腺癌轉(zhuǎn)移相關(guān)基因方面研究方面已經(jīng)形成了自己的優(yōu)勢(shì),并有形成核心研究機(jī)構(gòu)的趨勢(shì)。各研究機(jī)構(gòu)發(fā)文量均較少,目前尚未形成該研究領(lǐng)域的核心研究機(jī)構(gòu),迫切需要國內(nèi)外研究機(jī)構(gòu)間通力合作。各位學(xué)者發(fā)表文獻(xiàn)數(shù)也較少,尚無該領(lǐng)域的領(lǐng)軍人物。由此可見,目前的研究較為分散,多為單中心研究,樣本量較小,迫切需要進(jìn)行多中心、大樣本的研究,因此研究人員之間甚至是國家之間合作是乳腺癌轉(zhuǎn)移相關(guān)基因方面研究的趨勢(shì)。
基因檢測(cè)技術(shù)的發(fā)展,促使基因功能研究從基因產(chǎn)物表達(dá)檢測(cè)逐漸發(fā)展為基因突變、啟動(dòng)子甲基化、單核苷酸多態(tài)性檢測(cè)。而隨著基因芯片技術(shù)的發(fā)展,乳腺癌轉(zhuǎn)移相關(guān)基因的研究逐漸由單基因研究向多基因研究方向發(fā)展。多基因模型開始多用于評(píng)估乳腺癌預(yù)后,近年來開始有人把多基因模型用于評(píng)估乳腺癌轉(zhuǎn)移風(fēng)險(xiǎn),如國外已進(jìn)入臨床應(yīng)用的MammaPrint70基因模型[7],以及Oncotype Dx21基因模型[12],Tutt等[12]和Yau等[13]構(gòu)建的14基因模型,Culhane和 Quackenbush[14]及Landemaine等[15]建立的預(yù)測(cè)乳腺癌患者肺轉(zhuǎn)移風(fēng)險(xiǎn)的6基因模型。由于乳腺癌轉(zhuǎn)移是一個(gè)復(fù)雜的、由多基因參與及多步驟完成的過程,應(yīng)用單一基因預(yù)測(cè)乳腺癌的轉(zhuǎn)移風(fēng)險(xiǎn),其敏感度及精確度均欠佳,而應(yīng)用多基因模型可顯著提高其預(yù)測(cè)的敏感度及精確度。建立多基因預(yù)測(cè)模型的根本在于尋找預(yù)測(cè)價(jià)值高、性能穩(wěn)定的候選基因。本文通過對(duì)文獻(xiàn)的計(jì)量學(xué)分析,初步篩選了一些研究較成熟、預(yù)測(cè)性好的基因,為建立高效的多基因預(yù)測(cè)模型奠定了基礎(chǔ)。多基因預(yù)測(cè)模型為乳腺癌復(fù)發(fā)轉(zhuǎn)移風(fēng)險(xiǎn)預(yù)測(cè)、治療療效預(yù)測(cè)及個(gè)體化治療方案的制訂提供了可能,逐漸成為乳腺癌轉(zhuǎn)移研究的熱點(diǎn),顯示出巨大的潛力和廣泛的應(yīng)用前景。
[1]Fisher B,Jeong JH,Bryanl J,et al.Treatment of lymphnode-negative,oestrogen_receptor-positive breast cancer:long-term findings form National Surgical Adjuvant Breast and Bowel Project randomised clinical trials[J].Lancet,2004,364(9437):858-868.
[2]Swaminathan M,Phillips-Bute BG,Grichnik KP.Bibliometric analysis of global clinical research by anesthesia departments[J].Anesth Analy,2007(105):1741-1746.
[3]羅式勝.文獻(xiàn)計(jì)量學(xué)概論[M].廣州:中山大學(xué)出版社,1994:34-46.
[4]Mook S,Schmidt MK,Weigelt B,et al.The 70-gene prognosis profile predicts early metastases in postmenopausal breast cancer patients[J].Cancer Res,2009,69Suppl 2:S124.
[5]Mook S,Schmidt MK,Weigelt B,et al.The 70-gene prognosis signature predicts early metastasis in breast cancer patients between 55and 70years of age[J].Ann Oncol,2010,21(4):717-722.
[6]Mook S,Knauer M,Bueno-de-Mesquita JM,et al.Metastatic potential of T1breast cancer can be predicted by the 70-gene MammaPrint signature[J].Ann Surg Oncol,2010,17(5):1406-1413.
[7]Naidu R,Yip CH,Taib NA.Polymorphisms of HER2 Ile655Val and cyclin D1(CCND1)G870Aare not associated with breast cancer risk but polymorphic allele of HER2is associated with nodal metastases[J].Neoplasma(Bratislava),2008,55(2):87-95.
[8]Naidu R,Har YC,Taib NA.Polymorphism of FGFR4 Gly388Arg does not confer an increased risk to breast cancer development[J].Oncol Res,2009,18(2/3):65-71.
[9]Naidu R,Har YC,Taib NA.Associations between hypoxia-inducible factor-1(alpha)(HIF-1(alpha))gene polymorphisms and risk of developing breast cancer[J].Neoplasma,2009,56(5):441-447.
[10]邱均平.信息計(jì)量學(xué)[M].武漢:武漢大學(xué)出版社,2007:106-192.
[11]Cobleigh MA,Tabesh B,Bitterman P,et al.Tumor gene expression and prognosis in breast cancer patients with 10 or more positive lymph nodes[J].Clin Cancer Res,2005,11(24Pt 1):8623-8631.
[12]Tutt A,Wang A,Rowland C,et al.Risk estimation of distant metastasis in node-negative,estrogen receptor-positive breast cancer patients using an RT-PCR based prognostic expression signature[J].BMC Cancer,2008(8):339.
[13]Yau C,Esserman L,Moore DH,et al.A multigene predictor of metastatic outcome in early stage hormone receptor-negative and triple-negative breast cancer[J].Breast Cancer Res,2010,12(5):R85.
[14]Culhane AC,Quackenbush J.Confounding effects in“A six-gene signature predicting breast cancer lung metastasis”[J].Cancer Res,2009,69(18):7480-7485.
[15]Landemaine T,Jackson A,Bellahcene A,et al.A six-gene signature predicting breast cancer lung metastasis[J].Cancer Res,2008,68(15):6092-6099.