• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      文本挖掘在藥物靶位研究中的應(yīng)用

      2017-03-21 10:49:46,
      關(guān)鍵詞:靶位網(wǎng)絡(luò)分析數(shù)據(jù)庫(kù)

      ,

      現(xiàn)代新藥開發(fā)與研究的關(guān)鍵,首先是尋找和篩選藥物靶位(drug target)。藥物靶位是指機(jī)體內(nèi)具有藥效功能并且能被藥物作用的生物大分子物質(zhì),如某些蛋白質(zhì)和核酸等。文本挖掘是目前發(fā)現(xiàn)潛在藥物靶位的新興手段之一,目前大多數(shù)文章都是通過定性和舉例來闡述文本挖掘技術(shù)在藥物靶位領(lǐng)域的研究成果。本文通過構(gòu)建詞篇矩陣等數(shù)學(xué)模型,以聚類方式更加直觀和科學(xué)地定量闡述了自1999-2015年該領(lǐng)域的發(fā)展情況,希望對(duì)相關(guān)領(lǐng)域的研究人員選擇參考文獻(xiàn)和研究方向有所幫助。

      1 資料來源與方法

      首先對(duì)該領(lǐng)域高被引論文進(jìn)行同被引聚類分析。按照?qǐng)D1所示流程,以((TS=drug target*) OR (TS=drug delivery system)) AND (TS=text mining))為檢索式在Web of Science中SCI核心文獻(xiàn)集進(jìn)行檢索,共下載88篇相關(guān)文獻(xiàn),里面包含了4 415篇參考文獻(xiàn)。

      圖1 利用文本挖掘技術(shù)進(jìn)行藥物靶位研究進(jìn)展的定量分析流程

      利用書目共現(xiàn)分析系統(tǒng)(Bibliographic Item Co-Occurrence Matrix Builder2.01, BICOMB2.01)對(duì)參考文獻(xiàn)被引頻次進(jìn)行統(tǒng)計(jì)后,將被引頻次高于5次的文獻(xiàn)作為高被引論文,使用gCLUTO聚類軟件對(duì)高被引論文進(jìn)行同被引聚類分析,得到5個(gè)類別(圖2)

      綜合評(píng)估文獻(xiàn)數(shù)量和同類文獻(xiàn)的緊密程度,對(duì)高被引論文的標(biāo)題和摘要進(jìn)行了人工分析和歸納(表1),總結(jié)出自1999-2015年該領(lǐng)域的研究狀況,并就每類文獻(xiàn)語(yǔ)義內(nèi)容進(jìn)行了分析和梳理。

      圖2 高被引論文聚類分析結(jié)果

      表1 高被引論文聚類結(jié)果

      (續(xù)表1)

      2 結(jié)果與分析

      結(jié)合軟件輸出內(nèi)容,我們將各類別按照學(xué)科領(lǐng)域的知識(shí)體系重新排列,將文本挖掘在藥物靶位研究中的應(yīng)用分成總體趨勢(shì)、理論基礎(chǔ)、主要方法和主要資源4個(gè)方面,具體內(nèi)容如下。

      2.1 當(dāng)前藥物靶位研究的總體趨勢(shì)

      綜合分析cluster 0后,發(fā)現(xiàn)當(dāng)前藥物靶位研究有兩個(gè)明顯的趨勢(shì):一是通過新藥檢測(cè)分析抗腫瘤藥的相關(guān)靶位,即將各種化學(xué)物質(zhì)與標(biāo)準(zhǔn)的腫瘤治療藥物放在一起,通過它們之間的聯(lián)系進(jìn)行靶位挖掘;二是多學(xué)科結(jié)合,通過計(jì)算機(jī)和專家配合進(jìn)行藥物研究[2]。Yoo Kyung Jeong等人使用第一種途徑,結(jié)合PubMed和ClinicalTrials數(shù)據(jù)庫(kù)中的抗腫瘤藥物相關(guān)文獻(xiàn)進(jìn)行綜合分析,發(fā)現(xiàn)不同的化學(xué)物質(zhì)和標(biāo)準(zhǔn)治療藥物放在一起時(shí),可以發(fā)現(xiàn)新的藥物靶位[1]。該方法很大程度上節(jié)約了藥物研究的成本和降低了開發(fā)的風(fēng)險(xiǎn)。

      2.2 文本挖掘預(yù)測(cè)藥物靶位的理論基礎(chǔ)

      基于cluster 1中Predicting new molecular targets for known drugs(預(yù)測(cè)已知藥物的新分子靶位)[3]和Drug target identification using side-effect similarity(基于藥物副作用相似性的靶位識(shí)別)[4]兩篇高被引文獻(xiàn)的關(guān)注方向,總結(jié)出利用文本挖掘預(yù)測(cè)藥物靶位有兩種常用的方法:一是通過化學(xué)結(jié)構(gòu)相似性進(jìn)行預(yù)測(cè),二是通過藥物副作用相似性進(jìn)行靶位識(shí)別。如Fechete, R等人研究糖尿病腎病的分子途徑、生物標(biāo)記物和識(shí)別藥物靶位時(shí),就基于第一種理論基礎(chǔ)進(jìn)行了深入研究。他們構(gòu)建了人類相關(guān)蛋白、基因的結(jié)構(gòu)相似性網(wǎng)絡(luò),分析后得出了約1 000個(gè)基因與糖尿病腎病病理和臨床特征相關(guān)[17]。

      2.3 利用文本挖掘技術(shù)預(yù)測(cè)藥物靶位的主要方法

      針對(duì)cluster 2分析后,我們發(fā)現(xiàn)網(wǎng)絡(luò)分析是預(yù)測(cè)藥物靶位的主要方法,通過網(wǎng)絡(luò)的構(gòu)建可以更加清晰、有效地揭示藥物靶位和致病基因間可能存在的聯(lián)系,從而預(yù)測(cè)新的藥物靶位,為進(jìn)一步靶向治療提供理論支持。其中,網(wǎng)絡(luò)藥理學(xué)(Network pharmacology)是常用的藥物發(fā)掘范式,多用于尋找新的藥物靶位和發(fā)掘相應(yīng)藥物結(jié)構(gòu)、活性間的關(guān)系。也可用于保持藥物屬性前提下新主導(dǎo)范式的構(gòu)建,進(jìn)而實(shí)現(xiàn)藥物的概念性設(shè)計(jì)[5]。在人類疾病研究過程中,人類疾病網(wǎng)絡(luò)常用于挖掘疾病和基因間的潛在聯(lián)系[7]。同時(shí),網(wǎng)絡(luò)分析依賴于一些平臺(tái)提供的數(shù)據(jù),如化合物-蛋白質(zhì)交互平臺(tái)STITCH[8]中提供的超過30,000個(gè)小分子化合物和來自近1 133個(gè)物種的260萬個(gè)蛋白質(zhì)之間的相互作用的數(shù)據(jù),就可用于交互式檢索或大規(guī)模數(shù)據(jù)分析。Vazquez等人開發(fā)了可用于研究藥物毒性和蛋白-疾病-化合物網(wǎng)絡(luò)分析的程序[18],使網(wǎng)絡(luò)分析更加智能化和高效化。

      2.4 文本挖掘在藥物靶位研究領(lǐng)域主要利用的資源

      2.4.1 常用數(shù)據(jù)庫(kù)

      在cluster 3 中,我們總結(jié)出兩個(gè)研究常用的數(shù)據(jù)庫(kù)Drugbank和OMIM。其中Drugbank是藥物學(xué)領(lǐng)域十分重要的數(shù)據(jù)庫(kù),提供了豐富的生物學(xué)信息和化學(xué)信息、藥物數(shù)據(jù)(如藥理和制藥信息)與藥物靶位(即序列、結(jié)構(gòu)和通路)的詳細(xì)信息,包含有8 206條藥物條目(涵蓋了美國(guó)食品和藥物管理局批準(zhǔn)的小分子藥物、生物技術(shù)藥品(如蛋白質(zhì)/肽)、保健品和超過6 000個(gè)實(shí)驗(yàn)藥物)[19]。

      人類孟德爾遺傳數(shù)據(jù)庫(kù)OMIM(網(wǎng)絡(luò)版)是一個(gè)關(guān)于人類基因和遺傳變異的數(shù)據(jù)庫(kù),主要著眼于人類遺傳疾病[12]。包括了文本信息和相關(guān)參考信息、序列紀(jì)錄、圖譜,提供了相關(guān)數(shù)據(jù)庫(kù)的跨庫(kù)檢索功能,內(nèi)容上涵蓋了已知的遺傳病、相應(yīng)遺傳基因及其決定的性狀。除了簡(jiǎn)略描述各種疾病的臨床特征、鑒別診斷、治療與預(yù)防外,還提供了已知的相關(guān)致病基因的連鎖關(guān)系、染色體定位、組成結(jié)構(gòu)、功能和一些實(shí)驗(yàn)動(dòng)物模型的數(shù)據(jù)。其中以O(shè)MIM數(shù)據(jù)庫(kù)、基因圖譜、OMIM 疾病基因圖譜利用最為廣泛。蛋白質(zhì)-蛋白質(zhì)相互作用的信息,可用來研究癌癥的體細(xì)胞突變、遺傳重疊現(xiàn)象和預(yù)測(cè)癌癥的高風(fēng)險(xiǎn)位點(diǎn)。

      2.4.2 重要軟件工具

      經(jīng)過對(duì)cluster 4中文獻(xiàn)標(biāo)題、摘要的總結(jié),得出常用的軟件工具主要有Cytoscape[13],Pharmspresso[14],RelEx[16],SuperTarget and Matador[15]。Cytoscape用于構(gòu)建生物分子相互作用的網(wǎng)絡(luò)模型,它能將生物分子的相互作用圖形化顯示并進(jìn)行分析和編輯,多用于研究基因表達(dá)、DNA損傷、基因關(guān)聯(lián)性等[13];Pharmspresso是一個(gè)提取藥物基因組學(xué)概念和關(guān)系的文本挖掘工具,可協(xié)助識(shí)別重要的藥物基因組學(xué)概念等相關(guān)信息,側(cè)重于基因組學(xué)概念的命名體識(shí)別和抽取[14];一站式數(shù)據(jù)倉(cāng)庫(kù)SuperTarget集成了藥品相關(guān)的醫(yī)療信息,包括藥物副作用、藥物代謝通路和藥物靶位、臨床指征等,方便了研究者進(jìn)行查詢;Matador是一個(gè)蛋白-化學(xué)物資源交互平臺(tái)。相比之下,DrugBank通常只包含蛋白質(zhì)或藥物相互作用的主要模式,而Matador則包含盡可能多的蛋白、藥物間直接和間接的交互信息。例如,在探究一個(gè)藥物代謝物和基因表達(dá)之間的關(guān)系時(shí),利用Matador中相應(yīng)的交互信息可以將盡可能多的相關(guān)研究對(duì)象組合在一起進(jìn)行討論[15]。

      3 討論

      隨著算法和技術(shù)的不斷發(fā)展,文本挖掘技術(shù)在藥物靶位領(lǐng)域的應(yīng)用也更加廣泛和深入。結(jié)合高被引論文的最新引用文獻(xiàn),我們對(duì)上述研究領(lǐng)域的未來可能發(fā)展方向進(jìn)行如下預(yù)測(cè)。

      藥物研究在未來可能趨向于利用整合后的臨床試驗(yàn)數(shù)據(jù)和現(xiàn)有軟件處理后的二次信息,即通過多個(gè)軟件的相互結(jié)合來抽取更加貼切的信息集。例如,實(shí)驗(yàn)人員利用臨床試驗(yàn)數(shù)據(jù)結(jié)合文本挖掘,對(duì)激酶抑制劑的不良事件進(jìn)行預(yù)測(cè),通過挖掘抑制效力不同的多個(gè)激酶和人類疾病間潛在聯(lián)系,從而為臨床診療做出一定指導(dǎo)[20]。

      目前藥物靶位挖掘主要使用網(wǎng)絡(luò)分析的方法。未來研究主要有3個(gè)可能發(fā)展方向:一是通過分子分類來探索潛在藥物靶位[21];二是根據(jù)蛋白可以直接或間接影響藥物間相互作用的理論基礎(chǔ),探索脫靶藥物和其下游藥物的反應(yīng)[22]以及它們之間的潛在聯(lián)系,這可能成為個(gè)性化醫(yī)療發(fā)展的又一新方向;三是將文本挖掘的信息與化學(xué)結(jié)構(gòu)信息進(jìn)行整合,實(shí)現(xiàn)全面的可視化表達(dá)。如通過由高到低的分子建模來搭建分子相互作用框架,以此來揭示信號(hào)分子、代謝通路的層次結(jié)構(gòu),從而獲得新的范式[23],或是構(gòu)建藥物靶位圖譜,使人類疾病的潛在靶位得以更加直觀和準(zhǔn)確的呈現(xiàn)[24]。

      我們推測(cè)今后幾年數(shù)據(jù)庫(kù)的數(shù)據(jù)優(yōu)化也將成為研究者關(guān)注的一大方向,人們將更加致力于提高數(shù)據(jù)的質(zhì)量、降低噪音。DrugBank數(shù)據(jù)庫(kù)中提供了藥物/化學(xué)數(shù)據(jù)、藥物靶位和蛋白質(zhì)數(shù)據(jù)的字段檢索,近年又添加了許多新的數(shù)據(jù)字段,如食物-藥物相互作用、藥物之間的相互作用等[9],未來也將不斷更新數(shù)據(jù)庫(kù)中的字段以滿足研究需要。

      藥物靶位挖掘的研究工具的開發(fā)也將隨著學(xué)科發(fā)展逐步細(xì)化。當(dāng)前研究分析主要依賴于一些平臺(tái)提供的數(shù)據(jù),如STITCH就是一個(gè)典型的用于檢索化合物-蛋白質(zhì)交互關(guān)系的平臺(tái)[8];接下來更多具有針對(duì)性的工具和平臺(tái)將應(yīng)用于藥物靶位領(lǐng)域,如專門針對(duì)腸道藥物[25]或者針對(duì)于心臟疾病藥物的靶位預(yù)測(cè)工具。此外,將有更多科學(xué)家致力于開發(fā)用于臨床藥物-基因相互作用的軟件[26],以滿足臨床工作者進(jìn)行精準(zhǔn)治療的需求。

      4 結(jié)論

      當(dāng)前該領(lǐng)域的研究主要以藥物靶位間化學(xué)結(jié)構(gòu)相似性和副作用相似性作為理論基礎(chǔ),通過復(fù)雜網(wǎng)絡(luò)分析的方法,結(jié)合大量藥物數(shù)據(jù)資源來進(jìn)行靶位預(yù)測(cè)。研究人員主要利用Cytoscape[13]、Pharmspresso[14]、RelEx[16]、SuperTarget and Matador[15]幾個(gè)軟件,以DrugBank、OMIM為主要數(shù)據(jù)來源進(jìn)行潛在藥物靶位的發(fā)掘。

      通過分析推測(cè)該領(lǐng)域未來的發(fā)展方向?qū)⑽谋就诰虻慕Y(jié)果與臨床實(shí)踐相互結(jié)合,綜合利用各類挖掘軟件工具,通過范式、網(wǎng)絡(luò)的可視化分析,對(duì)相應(yīng)藥理實(shí)驗(yàn)結(jié)果做出合理解釋,預(yù)測(cè)潛在的藥物靶位,為藥物研制提供指導(dǎo)性意見,切實(shí)為藥物生物學(xué)和臨床醫(yī)學(xué)提供幫助,以真正推動(dòng)精準(zhǔn)醫(yī)療的進(jìn)一步發(fā)展。

      猜你喜歡
      靶位網(wǎng)絡(luò)分析數(shù)據(jù)庫(kù)
      利用CRISPR/Cas9 技術(shù)靶向編輯青花菜BoZDS
      基于ISM模型的EPC項(xiàng)目風(fēng)險(xiǎn)網(wǎng)絡(luò)分析
      鐵路有線調(diào)度通信的網(wǎng)絡(luò)分析
      數(shù)據(jù)庫(kù)
      2016年社交網(wǎng)絡(luò)分析
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      大班幼兒同伴交往的社會(huì)網(wǎng)絡(luò)分析
      CT引導(dǎo)下靶位注射膠原酶治療腰椎間盤突出癥36例
      浮山县| 西平县| 海原县| 枣强县| 英德市| 乌拉特中旗| 常德市| 独山县| 子洲县| 连南| 崇礼县| 平陆县| 进贤县| 虹口区| 苍南县| 淮安市| 句容市| 南京市| 宁蒗| 哈巴河县| 申扎县| 石渠县| 马尔康县| 茶陵县| 保亭| 苗栗市| 双柏县| 台前县| 祁门县| 万荣县| 宝兴县| 信丰县| 新平| 长葛市| 隆子县| 辉县市| 石楼县| 罗山县| 福贡县| 睢宁县| 中宁县|