• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      用基因互作網(wǎng)絡(luò)識(shí)別胰腺導(dǎo)管腺癌基因生物標(biāo)記

      2016-11-25 05:03:26王新格田衛(wèi)東
      關(guān)鍵詞:癌癥顯著性樣本

      王新格,田衛(wèi)東

      (復(fù)旦大學(xué) 生命科學(xué)學(xué)院 生物統(tǒng)計(jì)學(xué)與計(jì)算生物學(xué)系,上海 200438)

      ?

      用基因互作網(wǎng)絡(luò)識(shí)別胰腺導(dǎo)管腺癌基因生物標(biāo)記

      王新格,田衛(wèi)東

      (復(fù)旦大學(xué) 生命科學(xué)學(xué)院 生物統(tǒng)計(jì)學(xué)與計(jì)算生物學(xué)系,上海 200438)

      胰腺導(dǎo)管腺癌(PDAC)是全球高致死率癌癥中的一種.PDAC基因生物標(biāo)記的識(shí)別可以通過構(gòu)建基因互作網(wǎng)絡(luò)完成.利用蛋白質(zhì)互作網(wǎng)絡(luò)來分析與研究基因表達(dá)芯片數(shù)據(jù),構(gòu)建出PDAC基因互作網(wǎng)絡(luò)并對(duì)其劃分基因模塊,進(jìn)而篩選出在模塊中的PDAC差異性表達(dá)基因.通過篩選在癌癥樣本和正常組織樣本中共表達(dá)的基因?qū)?,并利用STRING蛋白質(zhì)互作網(wǎng)絡(luò)評(píng)估基因功能相關(guān)性,構(gòu)建出具有PDAC特異性的基因互作網(wǎng)絡(luò).利用iNP算法進(jìn)行網(wǎng)絡(luò)模塊化分,在每一個(gè)模塊中,模塊內(nèi)基因都具有強(qiáng)的共表達(dá)特性和模塊功能相關(guān)性.通過篩選,獲得了34個(gè)基因模塊,其中20個(gè)在癌癥樣本中表達(dá)明顯上調(diào),14個(gè)在癌癥樣本中表達(dá)明顯下調(diào).從這些模塊中又篩選出在PDAC樣本中表達(dá)上調(diào)的10個(gè)基因生物標(biāo)記,如DMBT1、DSC3等和表達(dá)下調(diào)的10個(gè)基因生物標(biāo)記,如DLG5、NRCAM等.

      胰腺導(dǎo)管腺癌; 基因生物標(biāo)記; 基因互作網(wǎng)絡(luò); 功能富集分析

      胰腺導(dǎo)管腺癌(Pancreatic Ductal Adenocarcinoma, PDAC)是一種致死率很高的癌癥.作為消化道常見的惡性腫瘤,其多發(fā)生于胰腺頭部.其常見的致病原因?yàn)轱嬀坪吞悄虿?由于PDAC在早期沒有明顯的癥狀,因此在發(fā)現(xiàn)時(shí)一般患者已處于病程的晚期.其病情發(fā)展快且惡化迅速,最常見為上腹部飽脹不適、疼痛.患者平均存活時(shí)間為6個(gè)月,其中超過5年存活的患者只占6%[1].2011年美國(guó)的統(tǒng)計(jì)情況為新增病例約4萬(wàn),同時(shí)致死人數(shù)約3萬(wàn)人.由于PDAC的惡性程度高,診斷和治療都十分困難.只有20%的病人可以通過手術(shù)切除來獲得治愈的可能.手術(shù)切除后,80%的患者存活時(shí)間少于2年[2-3].然而,約12%的術(shù)后患者可以存活5年,這同所患癌癥所在階段和手術(shù)效果相關(guān).一線藥物吉西他濱是治療胰腺癌的典型藥物,但其療效只能達(dá)到12%[4].在最新的藥物實(shí)驗(yàn)當(dāng)中,像奧沙利鉑、依立替康、氟二氧嘧啶和甲酰四氫葉酸等藥物能夠顯著延長(zhǎng)受試者的存活時(shí)間[5].目前PDAC的活體檢測(cè)可以通過穿刺抽吸胰腺腫塊做細(xì)胞學(xué)檢查進(jìn)行.但此診斷常用于晚期病人,對(duì)于早期診斷并不便捷有效.鑒于PDAC死亡率和發(fā)病率近年來明顯上升,對(duì)它的致病機(jī)理的研究以及找到新的有效的藥物靶點(diǎn)都是臨床醫(yī)學(xué)迫切需要解決的問題.

      一種識(shí)別和發(fā)現(xiàn)PDAC潛在藥物靶點(diǎn)的方法就是通過分析PDAC基因芯片表達(dá)數(shù)據(jù)來篩選致病胰腺癌基因[6-8].一些研究已經(jīng)篩選出可能同PDAC相關(guān)的致病基因,并對(duì)其致病機(jī)理做了進(jìn)一步分析和研究[9-11].本研究通過對(duì)PDAC的基因芯片表達(dá)數(shù)據(jù)中共表達(dá)基因?qū)Φ暮Y選,結(jié)合STRING蛋白質(zhì)互作網(wǎng)絡(luò),構(gòu)建出胰腺癌特異性基因互作網(wǎng)絡(luò).通過iNP[12]算法對(duì)網(wǎng)絡(luò)進(jìn)行模塊化分,找出在PDAC中表達(dá)顯著差別的基因網(wǎng)絡(luò).最終篩選出20個(gè)模塊中的基因生物標(biāo)記,這些標(biāo)記可以作為預(yù)測(cè)和區(qū)分PDAC樣本和正常樣本的參考指標(biāo).

      1 數(shù)據(jù)和方法

      1.1 數(shù)據(jù)收集和處理

      本研究通過GEO query[13]工具,從GEO數(shù)據(jù)庫(kù)[14]中下載PDAC相關(guān)的基因芯片表達(dá)數(shù)據(jù).選取Affymetrix Human Gene 1.0 ST Array芯片為分析平臺(tái),芯片代碼為GDS4336[15].該芯片含有90個(gè)樣本,其中45個(gè)為PDAC樣本,另外45個(gè)為對(duì)應(yīng)的鄰近的正常組織樣本.通過Bioconductor中l(wèi)imma包[16]對(duì)芯片表達(dá)值進(jìn)行正態(tài)化后,我們可以整理得到2個(gè)數(shù)據(jù)集,分別為PDAC基因表達(dá)數(shù)據(jù)集和其對(duì)應(yīng)鄰近正常組織基因表達(dá)數(shù)據(jù)集.數(shù)據(jù)概況詳見表1.對(duì)于每一個(gè)數(shù)據(jù)集,計(jì)算其中每一對(duì)基因表達(dá)值之間的皮爾森相關(guān)系數(shù)(Pearson Correlation Coefficient, PCC)并排序,從而選取排名前1%和后1%的基因?qū)M(jìn)行后續(xù)分析.依據(jù)PCC排序結(jié)果篩選出在2個(gè)數(shù)據(jù)集中具有明顯相關(guān)性的基因?qū)?例如,按照PCC從大到小的順序,前1%的基因?qū)樵谠摂?shù)據(jù)集中具有明顯的正相關(guān)表達(dá)關(guān)系.相反地,后1%的基因?qū)t表明在該數(shù)據(jù)集中具有明顯的負(fù)相關(guān)表達(dá)關(guān)系.篩選后,將從2個(gè)數(shù)據(jù)集中篩選出的基因?qū)喜?,并?duì)應(yīng)到STRING在線數(shù)據(jù)庫(kù)[17]中進(jìn)行功能相關(guān)性評(píng)估.將功能相關(guān)性打分高于500的基因?qū)Y選出后,構(gòu)建了一個(gè)關(guān)于PDAC的特異性基因互作網(wǎng)絡(luò).接著,運(yùn)用iNP基因互作網(wǎng)絡(luò)模塊劃分算法將此網(wǎng)絡(luò)劃分為更為清晰的若干基因模塊,以利于后續(xù)進(jìn)一步分析.

      表1 PDAC樣本和正常樣本基因芯片數(shù)據(jù)分布

      1.2 識(shí)別PDAC特異性基因模塊

      經(jīng)過iNP算法將整個(gè)關(guān)于PDAC的特異性基因網(wǎng)絡(luò)劃分為若干小的基因模塊后,將分析各個(gè)模塊中的基因是否在癌癥和正常樣本中表達(dá)值有明顯區(qū)別.由于每個(gè)模塊是由一組功能顯著相關(guān)的基因所組成,我們可以將一個(gè)模塊看成是一條表達(dá)通路.證明一條通路在癌癥和正常樣本中是否有顯著區(qū)別的方法有很多,本研究采用一個(gè)簡(jiǎn)單的方法,中值對(duì)比檢驗(yàn)法.每個(gè)模塊中的每一個(gè)基因都可以找到其在45個(gè)PDAC樣本和45個(gè)正常組織中的表達(dá)值,因此每個(gè)基因都有一對(duì)分別來自癌癥樣本和正常樣本的基因表達(dá)中值.運(yùn)用t檢驗(yàn)進(jìn)行統(tǒng)計(jì)顯著性分析,由于每個(gè)模塊包含基因眾多,本研究通過對(duì)偽發(fā)現(xiàn)率(False Discovery Rate, FDR)的控制,定義P<0.01才構(gòu)成統(tǒng)計(jì)顯著性.除此條件外,log10(表達(dá)值)>2才構(gòu)成有意義的選取.經(jīng)過以上步驟,我們可以從一個(gè)關(guān)于PDAC的特異性基因大網(wǎng)絡(luò)中精選出具有統(tǒng)計(jì)顯著性的模塊集合.獲得模塊后,通過繪制ROC曲線,對(duì)每個(gè)模塊在PDAC樣本中表達(dá)值是上調(diào)還是下調(diào)進(jìn)行深度分析.利用ROC曲線下的面積AUC計(jì)算此調(diào)控方向.AUC數(shù)值分布從0到1,其中0和1代表該模塊在癌癥樣本中絕對(duì)的上調(diào)或者下調(diào),而0.5則代表模塊中的基因表達(dá)為隨機(jī).本研究中計(jì)算出的AUC數(shù)值如果大于0.5,則代表該模塊在癌癥中表達(dá)上調(diào),相反地,則代表模塊在癌癥樣本中表達(dá)下調(diào).通過Cytoscape 3.3.0軟件繪制模塊的結(jié)構(gòu).

      1.3 功能富集分析

      給定一基因模塊,對(duì)其中所包含基因進(jìn)行功能富集分析.先下載GO基因功能注釋文件[18]和GSEA[19]數(shù)據(jù)庫(kù)中的MSigDB分子標(biāo)簽數(shù)據(jù)庫(kù).本研究利用Fisher算法檢測(cè)GO注釋和MSigDB分子標(biāo)簽的富集情況.統(tǒng)計(jì)顯著性初始閾值選為0.01.由于功能富集出來的基因集重合過多,本研究通過聚類篩選的方法篩選去除冗余數(shù)據(jù).聚類時(shí)通過計(jì)算所有基因集合的關(guān)聯(lián)度(重合基因數(shù)/所有基因數(shù))來形成新的基因網(wǎng)絡(luò).進(jìn)而,利用iNP算法劃分網(wǎng)絡(luò)為若干基因模塊,其中基因集之間仍有高度重合.我們通過整合模塊特異性和基因表達(dá)值差異給模塊中基因打分.一個(gè)基因共表達(dá)差異值等于該基因在該模塊中所有互作共表達(dá)差異值的均值.一個(gè)互作共表達(dá)差異值等于兩個(gè)互作基因在癌癥樣本和正常樣本中的差異表達(dá)值.在篩選步驟中,將所有功能富集分析出的基因集對(duì)應(yīng)到劃分出的基因模塊中,同時(shí)篩選出模塊內(nèi)部基因富集統(tǒng)計(jì)顯著性最強(qiáng)的基因集作為該模塊代表基因集.可以取排名前10位的基因作為生物標(biāo)記的候選對(duì)象.最終,本研究收集出所有具有功能富集統(tǒng)計(jì)顯著性的基因模塊進(jìn)行研究.

      2 結(jié)果和分析

      2.1 構(gòu)建PDAC功能相關(guān)基因網(wǎng)絡(luò)

      本研究整理獲得兩個(gè)基因表達(dá)數(shù)據(jù)集,分別對(duì)應(yīng)正常胰腺組織(樣本個(gè)數(shù)為45)和PDAC組織(樣本個(gè)數(shù)為45).基因表達(dá)數(shù)據(jù)下載于GEO DataSets數(shù)據(jù)庫(kù)(http:/www.ncbi.nlm.nih.gov/go’s/,記錄號(hào)GDS4336),數(shù)據(jù)集概況見表1.經(jīng)過基因芯片表達(dá)值正態(tài)化后,計(jì)算每個(gè)數(shù)據(jù)中的每一對(duì)基因其皮爾森相關(guān)系數(shù).皮爾森相關(guān)系數(shù)數(shù)值介于-1至1.1代表基因?qū)Ρ磉_(dá)呈正相關(guān),-1則代表負(fù)相關(guān).對(duì)各個(gè)數(shù)據(jù)集中基因?qū)ζ柹嚓P(guān)系數(shù)從大到小排序后,挑選出排名前1%的基因?qū)Χx為表達(dá)正相關(guān),排名后1%則代表基因?qū)Ρ磉_(dá)值負(fù)相關(guān).合并兩個(gè)數(shù)據(jù)集中篩選出的具有強(qiáng)烈表達(dá)相關(guān)性的基因?qū)?,將其?duì)應(yīng)到STRING蛋白質(zhì)互作網(wǎng)絡(luò)中,從而獲得一個(gè)由篩選出基因?qū)λ鶚?gòu)建的關(guān)于PDAC的功能性相關(guān)網(wǎng)絡(luò).其中利用STRING蛋白質(zhì)互作網(wǎng)絡(luò)進(jìn)行功能性相關(guān)評(píng)估,選取分?jǐn)?shù)大于500的基因?qū)θダL制此網(wǎng)絡(luò).經(jīng)過上述步驟,本研究構(gòu)建出一個(gè)PDAC功能相關(guān)的基因網(wǎng)絡(luò),此網(wǎng)絡(luò)包含4460個(gè)基因作為網(wǎng)絡(luò)節(jié)點(diǎn)和 24633 條邊.

      2.2 劃分PDAC功能相關(guān)基因網(wǎng)絡(luò)中的癌癥相關(guān)基因模塊

      本研究運(yùn)用iNP基因模塊劃分算法劃分上述分析方法所獲得的PDAC功能相關(guān)基因網(wǎng)絡(luò).通過基因模塊劃分的方法,可以更加清晰地將一個(gè)大的基因網(wǎng)絡(luò)劃分為小的基因富集的模塊,從而有利于基因表達(dá)數(shù)據(jù)的分析.通過iNP算法,本研究所獲得的PDAC功能相關(guān)基因網(wǎng)絡(luò)可以被劃分為748個(gè)基因模塊,其模塊化選取閾值為0.556(一般閾值為0.3即可認(rèn)為是基因模塊).每個(gè)模塊中的基因數(shù)目大于3個(gè)對(duì)于后續(xù)分析才有意義,經(jīng)過篩選,所得基因模塊個(gè)數(shù)為452個(gè),各個(gè)模塊中基因數(shù)目分布情況見圖1.可以看出,90%以上的模塊所含有的基因數(shù)目在50個(gè)以下.

      對(duì)于每一個(gè)劃分出的基因模塊,其各模塊內(nèi)部所構(gòu)成基因相互間都有極強(qiáng)的表達(dá)相關(guān)性.為了檢驗(yàn)一個(gè)基因模塊在癌癥和正常樣本中表達(dá)值是否顯著區(qū)分,我們采用中值差異顯著性檢驗(yàn)方法.每個(gè)模塊中的基因都可以找到其在45個(gè)PDAC樣本和45個(gè)正常組織中的表達(dá)值,計(jì)算其在癌癥和正常樣本中的中值對(duì),運(yùn)用t檢驗(yàn)進(jìn)行統(tǒng)計(jì)顯著性分析.

      由于每個(gè)模塊包含基因眾多,要使模塊統(tǒng)計(jì)顯著性滿足條件,本研究通過對(duì)偽發(fā)現(xiàn)率的控制在0.05以內(nèi),計(jì)算并定義出P<0.01才構(gòu)成統(tǒng)計(jì)顯著性.除此外,其還要滿足表達(dá)值的log10值轉(zhuǎn)換大于2這一篩選條件.經(jīng)過篩選,本研究篩選出在癌癥樣本和正常組織樣本中具有表達(dá)顯著性區(qū)別的基因模塊個(gè)數(shù)為34.在這34個(gè)基因模塊中,對(duì)比于正常組織樣本,其中20個(gè)模塊在PDAC樣本中顯著上調(diào),14個(gè)相對(duì)顯著下調(diào).

      利用R語(yǔ)言中pheatmap包可以將模塊差異表達(dá)情況顯示如圖2.圖2左邊14個(gè)列代表代表在癌癥樣本中基因表達(dá)下調(diào)的模塊,右邊20列則代表在癌癥樣本中基因表達(dá)下調(diào)的基因模塊.所有模塊都是經(jīng)過P值篩選檢驗(yàn)后具有顯著性的模塊.圖2中右側(cè)顏色漸進(jìn)條表示各個(gè)模塊的表達(dá)中值.

      2.3 PDAC差異表達(dá)基因模塊的功能富集分析

      上述結(jié)果所得到的34個(gè)在PDAC差異表達(dá)的基因模塊中,我們想知道能否通過差異表達(dá)基因模塊去區(qū)分癌癥和正常樣本.本研究利用模塊表達(dá)值(模塊中所有基因表達(dá)值的中值)去劃分癌癥樣本和正常樣本,并畫出預(yù)測(cè)的ROC曲線圖.ROC曲線圖中曲線下方面積,即AUC的數(shù)值.其閾值為0到1,0.5代表隨機(jī)預(yù)測(cè).愈接近0或1則代表可以該模塊在癌癥樣本和正常樣本中差異表達(dá)愈顯著.本研究中接近1則代表相對(duì)于正常組織樣本,該模塊在PDAC中上調(diào),反之接近0,則代表下調(diào).上調(diào)的20個(gè)模塊中,其AUC中值為0.8315,其中有3個(gè)模塊AUC值高于0.9.這表示這3個(gè)模塊在癌癥樣本中表達(dá)值顯著的上調(diào).下調(diào)的14個(gè)模塊中,AUC模塊中值為0.21,其中最低AUC為0.117.這表示該模塊在癌癥樣本中表達(dá)值顯著的下調(diào).上調(diào)模塊和下調(diào)模塊AUC數(shù)值分布見圖3.

      對(duì)模塊整體分析后,本研究進(jìn)一步挑選出這些模塊中PDAC的顯著表達(dá)差異基因,作為gene biomarker來幫助臨床PDAC的鑒定.比如,兩個(gè)互作基因A和B,如果在癌癥樣本中表達(dá)正相關(guān),然而在正常樣本中表達(dá)負(fù)相關(guān),則共表達(dá)差異值為1-(-1)=2.如果兩個(gè)互作基因在樣本中相關(guān)性隨機(jī),則賦值1.如果在兩種樣本中都正相關(guān)或者負(fù)相關(guān),則為0.通過計(jì)算模塊中所有互作共表達(dá)差異值,我們可以通過計(jì)算均值來代表該基因在模塊中的共表達(dá)差異值.最終用該數(shù)值乘以所屬模塊在癌癥中的特異性便可計(jì)算該基因在癌癥樣本中的表達(dá)特異性.通過上述方法,我們篩選出上調(diào)模塊中333個(gè)差異表達(dá)基因,和下調(diào)模塊中270個(gè)差異表達(dá)基因.我們選取上調(diào)模塊和下調(diào)模塊中前10個(gè)差異表達(dá)的基因做重點(diǎn)分析.

      如圖4所示.條形圖中灰色條長(zhǎng)度代表每個(gè)基因能夠區(qū)分癌癥和正常樣本的分?jǐn)?shù)高低.基因分?jǐn)?shù)大于0則代表該基因在癌癥樣本中表達(dá)上調(diào),分?jǐn)?shù)小于0則代表該基因在癌癥樣本中表達(dá)下調(diào).各基因所屬模塊標(biāo)注于灰色條形部分.

      從挑選出的模塊及其對(duì)應(yīng)基因來看(圖4),其中2個(gè)上調(diào)基因來自M478模塊.圖5中可以看出該模塊在癌癥樣本和正常樣本中的基因互作網(wǎng)絡(luò),以及對(duì)應(yīng)模塊AUC的數(shù)值.圖5中網(wǎng)絡(luò)節(jié)點(diǎn)為基因,網(wǎng)絡(luò)的邊為互作PCC數(shù)值,網(wǎng)絡(luò)邊的粗細(xì)則代表PCC數(shù)值的大小.可看出M478模塊AUC高達(dá)0.926,證明該對(duì)比與正常組織樣本,該模塊在胰腺癌樣本中顯著上調(diào).其中DMBT1基因在張光斌等[20]的研究中證實(shí),其過表達(dá)對(duì)癌細(xì)胞系EC9706具有生物學(xué)行為的影響.

      其中1個(gè)上調(diào)的基因來自M57模塊.該模塊富集了表皮生長(zhǎng)因子相關(guān)功能.該模塊AUC的數(shù)值高達(dá)0.881,證明該對(duì)比與正常組織樣本,該模塊在胰腺癌樣本中顯著上調(diào).其中DSC3基因打分最高,在正常樣本中DSC3基因同DSG3基因表達(dá)呈現(xiàn)正相關(guān).然而在如圖5(見第646頁(yè))所示,在PDAC樣本中DSC3基因和DSG3基因并無(wú)互作.這說明,DSC3基因很有可能通過打亂表皮生長(zhǎng)因子相關(guān)功能而引起PDAC的產(chǎn)生.Hamidov等[21]研究結(jié)果顯示,DSC3作為15個(gè)通過臨床病理學(xué)篩選出的gene biomarker中的一個(gè)基因,其過量的表達(dá)可以通過影響細(xì)胞間粘附而對(duì)腫瘤產(chǎn)生產(chǎn)生影響.而在下調(diào)模塊的基因當(dāng)中M466中,其模塊AUC為0.156,說明該模塊在癌癥樣本中顯著下調(diào).M466模塊中的DLG5基因,在2005年Taniuchi[22]等人的研究中發(fā)現(xiàn),通過小RNA干擾RAB6KIFL基因在PDAC細(xì)胞系中的表達(dá),細(xì)胞系中的細(xì)胞大幅下降.而DLG5作為蛋白質(zhì)復(fù)合物的連接體,其與RAB6KIFL基因互作可以對(duì)胰腺癌的發(fā)生產(chǎn)生影響.

      3 結(jié) 論

      基因表達(dá)譜芯片為癌癥基因檢測(cè)帶來極大便捷.通過對(duì)基因表達(dá)芯片的數(shù)據(jù)分析,比對(duì)癌癥樣本和正常樣本中基因表達(dá)差異,所篩選的基因生物標(biāo)識(shí)對(duì)癌癥的致病機(jī)理以及輔助臨床診斷具有重要的參考作用.在本研究中,我們通過計(jì)算篩選出能夠用來區(qū)分PDAC和正常組織的基因生物標(biāo)記,可以為臨床檢測(cè)作參考.通過整理在癌癥樣本中和正常組織樣本中具有明顯正相關(guān)和負(fù)相關(guān)共表達(dá)基因?qū)Γ约霸u(píng)估它們的功能相關(guān)性,我們構(gòu)建出一個(gè)PDAC的特異性基因互作網(wǎng)絡(luò).通過網(wǎng)絡(luò)模塊識(shí)別劃分算法,將該網(wǎng)絡(luò)劃分為若干基因模塊.在每一個(gè)模塊中,模塊內(nèi)基因都具有共表達(dá)特性和模塊功能相關(guān)性.通過分析各個(gè)模塊在癌癥樣本和正常樣本中的表達(dá)中值,我們可以篩選出具有癌癥表達(dá)特異性的基因模塊.我們篩選出了34個(gè)基因模塊,其中20個(gè)為在癌癥樣本中明顯上調(diào)的模塊,另外14個(gè)為在癌癥樣本中表達(dá)值明顯下調(diào)的模塊.對(duì)篩選出的每個(gè)模塊中差異表達(dá)的基因進(jìn)行整合,得到20個(gè)可以作為生物標(biāo)記的基因,它們可以用來識(shí)別PDAC樣本和正常樣本.這些標(biāo)記可以為PDAC發(fā)生分子機(jī)制的研究、早期診斷和分子靶向治療提供線索.

      [1] JEMAL A, SIEGEL R, XU J,etal. Cancer Statistics [J].CA:ACancerJournalforClinicians, 2010,60(5):277-300.

      [2] YEH J J. Prognostic signature for pancreatic cancer:Are we close? [J].FutureOncol, 2009,5(3):313-321.

      [3] COLLISSON E A, SADANANDAM A, OLSON P,etal. Subtypes of pancreatic ductal adenocarcinoma and their differing responses to therapy [J].NatMed, 2011,17(4):500-503.

      [4] OETTLE H, POST S, NEUHAUS P,etal. Adjuvant chemotherapy with gemcitabine vs observation in patients undergoing curative-intent resection of pancreatic cancer:A randomized controlled trial [J].JAMA, 2007,297(3):267-277.

      [5] CONROY T, DESSEIGNE F, YCHOU M,etal. FOLFIRINOX versus gemcitabine for metastatic pancreatic cancer [J].NEnglJMed, 2011,364(19):1817-1825.

      [6] GOGGINS M. Identifying molecular markers for the early detection of pancreatic neoplasia [J].SeminOncol, 2007,34(4):303-10.

      [7] KOLBERT C P, KOLBERT C P, CHARI S,etal. Microarray technologies for gene transcript analysis in pancreatic cancer [J].TechnolCancerResTreat, 2008,7(1):55-59.

      [8] GRUTZMANN R, BORISS H, AMMERPOHL O,etal. Meta-analysis of microarray data on pancreatic cancer defines a set of commonly dysregulated genes [J].Oncogene, 2005,24(32):5079-5088.

      [9] CAMPAGNA D, COPE L, LAKKUR S S,etal. Gene expression profiles associated with advanced pancreatic cancer [J].IntJClinExpPathol, 2008,1(1):32-43.

      [10] KIM H N, CHOI D W, LEE K T,etal. Gene expression profiling in lymph node-positive and lymph node-negative pancreatic cancer [J].Pancreas, 2007,34(3):325-334.

      [11] STRATFORD J K, BENTREM D J, ANDERSON J M,etal. A six-gene signature predicts survival of patients with localized pancreatic ductal adenocarcinoma [J].PLoSMed, 2010,7(7):e1000307.

      [12] SUN S, DONG X, FU Y,etal. An iterative network partition algorithm for accurate identification of dense network modules [J].NucleicAcidsRes, 2012,40(3):e18.

      [13] DAVIS S, MELTZER P S. GEOquery:A bridge between the Gene Expression Omnibus(GEO) and BioConductor [J].Bioinformatics, 2007,23(14):1846-1847.

      [14] BARRETT T, TROUP D B, WILHITE S E,etal. NCBI GEO:Mining tens of millions of expression profiles—database and tools update [J].NucleicAcidsRes, 2007,35(Database issue):760-765.

      [15] ZHANG G, SCHETTER A, HE P,etal. DPEP1 inhibits tumor cell invasiveness, enhances chemosensitivity and predicts clinical outcome in pancreatic ductal adenocarcinoma [J].PLoSOne, 2012,7(2):e31507.

      [16] SMYTH G K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments [J].StatApplGenetMolBiol, 2004,3:Article3.

      [17] JENSEN L J, KUHN M, STARK M,etal. STRING 8-a global view on proteins and their functional interactions in 630 organisms [J].NucleicAcidsRes, 2009,37(Database issue):412-416.

      [18] ASHBURNER M, BALL C A, BLAKE J A,etal. Gene ontology:tool for the unification of biology. The Gene Ontology Consortium [J].NatGenet, 2000,25(1):25-29.

      [19] LIBERZON A, SUBRAMANIAN A, PINCHBACK R,etal. Molecular signatures database(MSigDB) 3.0 [J].Bioinformatics, 2011,27(12):1739-1740.

      [20] 張光斌,賀 濤,張 寧.DMBT1過表達(dá)對(duì)食管癌細(xì)胞系EC9706生物學(xué)行為的影響 [J].世界華人消化雜志,2009,17(17):5.

      [21] HAMIDOV Z, ALTENDORF-HOFMANN A, CHEN Y,etal. Reduced expression of desmocollin 2 is an independent prognostic biomarker for shorter patients survival in pancreatic ductal adenocarcinoma [J].JClinPathol, 2011,64(11):990-994.

      [22] TANIUCHI K, NAKAGAWA H, NAKAMURA T,etal. Down-regulation of RAB6KIFL/KIF20A, a kinesin involved with membrane trafficking of discs large homologue 5, can attenuate growth of pancreatic cancer cell [J].CancerRes, 2005,65(1):105-112.

      Identification of Gene Biomarkers for Distinguishing Pancreatic Ductal Adenocarcinoma from Normal Tissue Using a Network-based Approach

      WANG Xinge, TIAN Weidong

      (Department of Biostatistics and Computational Biology, School of Life Sciences,F(xiàn)udanUniversity,Shanghai200438,China)

      Pancreatic ductal adenocarcinoma(PDAC) is one of the most lethal cancers in the world. In this study, we have developed a network-based approach to identify gene biomarkers that can distinguish PDAC and normal tissues. By identifying strongly coexpression gene pairs in normal tissues and PDAC samples and applying functional association information from STRING network online, a PDAC-specific gene association network was constructed. Based on this network, gene modules was obtained in which genes are highly functionally associated using iNP algorithm. Then gene modules which are differentially expressed between PDAC and normal samples were identified. Finally, genes inside those modules were selected with discriminating coexpression patterns between PDAC and normal samples and those genes can be used as candidate biomarkers to facilitate clinicopathologic diagnose.

      pancreatic ductal adenocarcinoma; gene biomarker; gene coexpression network; function enrichment analysis

      0427-7104(2016)05-0642-07

      2016-01-14

      王新格(1989—),女,碩士研究生;田衛(wèi)東,男,教授,通訊聯(lián)系人,E-mail:weidong.tian@fudan.edu.cn.

      Q 332

      A

      猜你喜歡
      癌癥顯著性樣本
      用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
      留意10種癌癥的蛛絲馬跡
      基于顯著性權(quán)重融合的圖像拼接算法
      電子制作(2019年24期)2019-02-23 13:22:26
      基于視覺顯著性的視頻差錯(cuò)掩蓋算法
      推動(dòng)醫(yī)改的“直銷樣本”
      癌癥“偏愛”那些人?
      海峽姐妹(2018年7期)2018-07-27 02:30:36
      對(duì)癌癥要恩威并施
      特別健康(2018年4期)2018-07-03 00:38:08
      不如擁抱癌癥
      特別健康(2018年2期)2018-06-29 06:13:42
      一種基于顯著性邊緣的運(yùn)動(dòng)模糊圖像復(fù)原方法
      隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
      宾阳县| 金秀| 鹿泉市| 阿巴嘎旗| 寿阳县| 南汇区| 鄂伦春自治旗| 津南区| 娄底市| 建水县| 股票| 大冶市| 巍山| 凤阳县| 咸阳市| 依兰县| 孙吴县| 林口县| 九台市| 宝兴县| 哈巴河县| 泾川县| 敖汉旗| 白河县| 石林| 南投县| 葫芦岛市| 岐山县| 若尔盖县| 如东县| 丰原市| 烟台市| 余姚市| 大同市| 浪卡子县| 荣昌县| 武安市| 益阳市| 图片| 全南县| 永胜县|