4
(1.廣州大學 計算科技研究院, 廣東 廣州 510006; 2.溫州職業(yè)技術學院 信息技術系, 浙江 溫州 325035;3.廣州大學 人事處, 廣東廣州 510006; 4.廣東省數(shù)學教育軟件工程技術研究中心, 廣東 廣州 510006)
非編碼RNA是一類不能編碼蛋白質(zhì)的RNA分子總稱,約占人類基因組總長度的97%,在過去很長一段時間內(nèi)被稱為“垃圾序列”或者“暗物質(zhì)”.根據(jù)序列長度的大小可以將非編碼RNA分為3類:<50 nt, 包括microRNA,siRNA,piRNA等等;50~500 nt,包括lncRNA,rRNA,snRNA,snoRNA等等;大于500 nt,包括長的mRNA-like 的非編碼RNA,長的不帶polyA 尾巴的非編碼RNA等等.隨著研究的深入,人們發(fā)現(xiàn)雖然非編碼RNA不能直接編碼蛋白質(zhì),但是其中一些對于維持細胞內(nèi)部的平衡,以及與疾病的產(chǎn)生和惡化有著密切的關系.
miRNAs(microRNAs)是一類重要的非編碼RNAs,是基因表達和蛋白翻譯過程中的調(diào)節(jié)因子.已有研究表明,miRNA廣泛參與細胞的增殖、凋亡及分化生物過程,在腫瘤的發(fā)生、形成過程中扮演著十分重要的角色.腫瘤的發(fā)生、發(fā)展是多條通路聯(lián)合破壞的結果,因此,腫瘤細胞中的“基因網(wǎng)絡特征”比“單分子特征”更能揭示疾病惡化和進展的機制[1-3].由于一個miRNA能夠調(diào)控多個基因的表達,影響多個信號通路的活性,因此,Chen[4]在著名的新英格蘭醫(yī)學期刊上預測認為,將miRNA當作腫瘤生物治療的靶分子或者藥物將比編碼基因更加有效.
權威數(shù)據(jù)庫miRBase收錄的miRNAs數(shù)目從創(chuàng)辦之初的218條,到目前已經(jīng)增加到38 589條,數(shù)量增加了177倍(圖1),這一定程度上反映了miRNAs研究領域發(fā)展之迅速.此外,筆者通過Web of Science檢索關鍵詞“miRNA OR microRNA”梳理了從2001 年至今的發(fā)表的相關文獻,結果表明,miRNA 相關的研究文章從2001 年8篇到2018年增加至15 587篇,數(shù)量增長倍數(shù)高達1 900 多倍.最近幾年有關miRNA的研究文章,仍處于逐年上升的趨勢,這說明miRNA領域的研究依然是當前的熱點課題.
目前miRNA研究領域主要集中在以下4個方面:①靶基因的預測.通過開發(fā)新的計算方法預測miRNA與基因之間的靶向關系;②miRNA生物學功能作用機制.通過生物學實驗的方式研究miRNA在生物體內(nèi)的功能作用;③疾病相關miRNAs的篩選方法.以miRNA表達譜數(shù)據(jù)為基礎,計算篩選與疾病密切相關的miRNAs;④miRNA小分子藥物的開發(fā)及應用.以miRNA為藥物或者藥物靶點,開發(fā)適用于治療特定疾病的新型藥物.本文擬從以上幾方面闡述疾病相關miRNAs的篩選方法研究進展.
圖1 miRNAs相關研究及已發(fā)現(xiàn)的miRNAs數(shù)量統(tǒng)計數(shù)據(jù)Fig.1 miRNAs related studies and the statistic data for miRNAs 數(shù)據(jù)檢索時間2019年1月6日
miRNAs是一類重要的內(nèi)源性非編碼微小RNAs分子,其長度大小約為18~25核苷酸(Nucleotide,nt).在細胞核內(nèi),miRNA基因的初始轉(zhuǎn)錄產(chǎn)物(pri-miRNA)在RNA聚合酶Ⅲ(RNase Ⅲ)Drosha的作用下切割成為前體miRNA即pre-miRNA[5-7].然后pre-miRNA在轉(zhuǎn)運蛋白(exportin-5)的作用下,從細胞核內(nèi)轉(zhuǎn)移到細胞質(zhì)中[8].最后,在另一種RNA聚合酶Ⅲ(RNase Ⅲ)Dicer的作用下,切割生成成熟的單鏈miRNAs[9].
miRNA在生物體內(nèi)發(fā)揮的功能作用是相當復雜的,總結起來有如下特性:①結合位點差異性.成熟的miRNAs能夠通過堿基互補配對的方式結合到靶基因mRNA 3’ 端非轉(zhuǎn)錄區(qū)域,當完全匹配時候,會促進靶基因的降解,而當非完全匹配時候,則會抑制其靶基因翻譯生成對應的蛋白質(zhì)[10-11];②時空動態(tài)特性.當細胞周期阻滯的時候,miRNA能夠引導AGO等蛋白與AREs(AU-rich elemens)相結合促進基因的翻譯,而在增殖細胞中miRNA對靶基因又起到抑制的作用[12];③位置的影響.除了在細胞質(zhì)中發(fā)揮功能,Xiao等[13]發(fā)現(xiàn)miR-24-1在細胞核內(nèi)通過與基因的增強子區(qū)域結合,從而促進基因的表達.
在研究miRNA之初,miRNA的名稱主要是根據(jù)其表型進行命名,如lin-4、let-7等等.隨著越來越多miRNA的出現(xiàn),為了方便注釋和研究,人們提出了一些關于miRNA的命名標準,目前最新版本的miRBase數(shù)據(jù)庫中關于miRNA的命名準則見圖2.
圖2 miRNA命名規(guī)則簡要示意圖Fig.2 A brief sketch of the naming rules for miRNA.
miRNA成熟體命名規(guī)則如下(以動物miRNA為例):
(1)在統(tǒng)一命名規(guī)則制定之前發(fā)現(xiàn)的miRNA,則繼續(xù)保留原來名字,如hsa-lin-4;
(2)miRNA的成熟體表示為miR,然后根據(jù)其物種類型,以及被發(fā)現(xiàn)的先后順序標注阿拉伯數(shù)字,如hsa-miR-21;
(3)若多個miRNAs高度同源,則在數(shù)字后面加上英文小寫字母(a,b,c,…),如hsa-miR-34a,hsa-miR-34b等;
(4)由不同染色體上的DNA序列轉(zhuǎn)錄加工而成的具有相同成熟體序列的miRNAs,就在后面添加上阿拉伯數(shù)字,如hsa-miR-199a-1和hsa-miR-199a-2;
(5)通常一個miRNA前體長度大約為70~80nt,有時候2個臂分別會產(chǎn)生成熟體miRNAs.在之前人們的做法是:表達量比較高的miRNA后面不添加任何符號,而對于表達量比較低的miRNA后面則加上*號,如rno-miR-9*.而最新版本的miRBase數(shù)據(jù)庫中則以“-5p”和“-3p”對成熟miRNAs分別命名.如hsa-miR-21-5p和hsa-miR-21-3p,分別表示從前體has-mir-21的5’端臂和3’端臂產(chǎn)生而來.
已有研究表明,人類相關基因中大約有三分之一的基因會受到miRNA的靶向調(diào)控.到目前為止,雖然陸續(xù)有生物學實驗證實了一些miRNAs與mRNAs之間的靶向調(diào)節(jié)關系,但是仍然還有許多靶基因沒有經(jīng)過生物學實驗驗證,這一定程度上阻礙了miRNAs生物學的功能被充分的發(fā)掘[10, 14-15].因此,關于miRNAs一項重要的研究內(nèi)容同時也是極具挑戰(zhàn)性的工作,就是如何快速、準確地預測以及驗證miRNAs的靶基因.該項研究對于探究miRNAs生物學功能作用、參與涉及的生物信號通路以及它在疾病的發(fā)展過程中扮演的角色具有重要的意義,與此同時,也能夠加快miRNAs作為一種治療靶點或者藥物走向臨床實踐.
借助計算生物學的專業(yè)優(yōu)勢,將其用來替代生物學家大量的分子克隆實驗工作,基于這種研究模式獲得了非常好的效果[16-18].但是,預測動物的miRNAs靶基因是一項極具挑戰(zhàn)性的工作,其主要原因是由于許多動物的miRNAs與其靶基因mRNAs結合位點并非完全互補的.除此以外,由于已知的經(jīng)過實驗驗證的靶向關系比較少,所以在評價預測結果的時候,沒有足夠的金標準來作為客觀的參考對象.到目前為止,對于計算機方法預測、推斷出來的靶基因,還沒有一個快速、可靠的高通量驗證鑒定方案,這在一定程度上影響了算法準確性的評價,也阻礙了計算預測算法的更進一步的優(yōu)化及改進[19].從成為生命科學界的研究熱點到目前為止,miRNAs相關生物學功能的探索發(fā)現(xiàn)研究工作已經(jīng)歷了10多年的發(fā)展歷程,關于miRNAs靶基因的預測方法已經(jīng)發(fā)展出數(shù)十種之多.這些靶基因預測計算方法主要可以劃分為2大類:ab initio計算方法和機器學習預測方法.總體上來說,剛開始提出的計算預測方法均屬于ab initio計算方法,這些預測方法都是基于實驗獲得的結構特征來引導預測方法的開發(fā).機器學習預測方法主要是基于實驗訓練集的相似度來預測潛在的靶向目標.
(1)miRanda[20-21]:MiRanda以及相應的網(wǎng)站microRNA.org是由美國著名的癌癥研究中心——斯隆-凱特琳研究所(Sloan-Kettering Institute,SKI)開發(fā)的在線查詢數(shù)據(jù)庫,該數(shù)據(jù)資源可以非常方便地免費在線獲取.miRanda的最新版本發(fā)布時間是在2010年8月,該最新版本也稱為mirSVR.該方法適用范圍廣,不受物種限制.MiRanda采用Smith-Whatman算法的思想[22],利用該方法來檢測互補匹配的序列(允許位于miRNA的5p端第2-7nt種子序列有一個G∶U匹配或者錯誤匹配的存在),除此以外,這一算法還增加了關于RNA二級結構預測的程序,從而可以從動力學的角度去考察miRNA與其候選靶基因之間的結合穩(wěn)定性;根據(jù)前面的準則得到了靶基因結合位點,然后考察這些結合位點在不同物種間的保守性,最后給出自由能(△G)以及序列匹配分數(shù)(Score).miRanda靶基因預測方法主要考慮了以下幾個方面因素:①靶向結合序列的互補性;②mRNA序列的二級結構對miRNA-mRNA結合穩(wěn)定性的影響;③靶基因結合位點在跨物種間的保守性.
(2)TargetScan[23-24]:是由Lewis等于2003年開發(fā)出來的miRNA靶基因預測工具,該方法首次引入假陽性率來評估預測結果.TargetScan靶基因預測算法主要考慮如下2個方面特點:①考察miRNA靶向基因mRNA的3p端非轉(zhuǎn)錄區(qū)序列在跨基因跨物種間的保守性;②研究miRNA與靶基因mRNA形成的miRNA-mRNA雙鏈結構的動力學穩(wěn)定性[25].該方法要求miRNA的5p端的第2-8位堿基(種子序列)與靶基因mRNA的3p端必須滿足互補匹配,然后要求種子序列完全互補的情況下從種子序列向兩端擴展,直到遇到不能配對的堿基為止,這個過程中允許G-U配對.該方法通過計算靶基因結合位點產(chǎn)生的自由能以及信噪比來評價計算機預測結果的準確性.
(3)PicTar[26]:該算法同樣要求miRNA 5P端1-7nt或者2-8nt種子序列在靶基因位點識別中的關鍵因素,主要強調(diào)miRNA與其靶基因形成的二聚體結合能在靶基因翻譯抑制過程中的影響.PicTar將種子序列分為2類:“完全匹配的種子序列”和“不完全匹配的種子序列”,前者需要種子序列與靶基因序列完全匹配,后者則可以在滿足miRNA靶基因二聚體結合能要求的情況下允許種子序列出現(xiàn)錯配(不允許G-U配對).
(4)DIANA-microT:基于實驗和計算預測方法,Kiriakidou等于2004年開發(fā)出一種“DIANA-microT”miRNA靶基因預測程序[27].該方法結合了實驗與計算機計算方法來預測哺乳動物的靶基因,這個方法的一大特點是它著重考慮了單一結合位點(miRNA∶mRNA)的miRNA靶基因.在篩選miRNA靶基因的過程中,DIANA-microT不僅考慮了重要的種子序列區(qū)域,而且考慮了miRNA的3p端與靶基因mRNA的結合.在識別靶基因時候,不僅考慮保守位點,而且也考察了非保守結合位點.
(5)PITA[28]:該算法由Kertesz等于2007年提出,考慮了特定二聚體互補匹配信息,并且引入了miRNA位點可接近性的概念.miRNA位點可接近性表示整個二聚體的最小自由能與互補匹配區(qū)域的原始能量之間的差值.用戶可以通過調(diào)整約束條件來選擇候選靶基因列表(種子序列最小長度,G∶U錯配與未配對個數(shù)).
(1)TargetBoost[29]:該算法采用GPboost模型,基于miRNA與候選靶基因mRNA形成的miRNA-mRNA二聚體的序列互補匹配程度、熱動力學穩(wěn)定性、以及跨物種保守性等特征,來推測線蟲和果蠅的miRNA的靶基因.該算法使用的正樣本為36個實驗驗證的miRNA-mRNA靶向關系數(shù)據(jù),而用于訓練的負樣本數(shù)據(jù)集為300個隨機生成長度為30 nt的基因序列.
(2)miTarget[30]:該算法使用支持向量機方法,以及徑向基函數(shù),預測miRNA靶基因.該方法考慮了miRNA-mRNA二聚體的結構特征、熱動力學性質(zhì)和堿基互補匹配程度等特征.miTarget算法沒有考慮靶基因在多種物種間的序列保守性.miTarget算法中用于訓練支持向量機的負樣本數(shù)據(jù)集,涉及83個經(jīng)過實驗驗證的miRNA-mRNA靶向關系,以及163個通過實驗數(shù)據(jù)推理得到的miRNA-mRNA靶向關系數(shù)據(jù),正樣本數(shù)據(jù)集包含152個miRNA-mRNA靶向關系數(shù)據(jù).
(3)MiRTif[31]:該方法首先整合miRanda、PicTar以及TargetScan這3種miRNA靶基因預測方法得到的各種特征得分,然后使用支持向量機方法預測miRNA候選靶基因,核函數(shù)采用徑向基函數(shù).MiRTif方法使用到的正樣本數(shù)據(jù)集由195個實驗驗證的miRNA-mRNA靶向關系數(shù)據(jù)構成,負樣本數(shù)據(jù)集囊括21個生物學實驗驗證的和17個假定的miRNA-mRNA靶向關系數(shù)據(jù).
(4)MTar[32]:該算法重點考慮了3類區(qū)域的靶基因結合位點:僅僅考慮5’端種子區(qū)域;以5’端種子區(qū)域為主;以及以3’端種子區(qū)域為主.首先計算相應區(qū)域miRNA-mRNA雙鏈的特征得分,然后采用人工神經(jīng)網(wǎng)絡方法計算預測miRNA靶向基因.Mtar算法使用了340個miRNA-mRNA靶基因數(shù)據(jù)作為正樣本數(shù)據(jù)集,隨機產(chǎn)生了400個miRNA-mRNA靶基因數(shù)據(jù)作為負樣本數(shù)據(jù)集.
(5)miRTDL[33]:該算法主要考慮了miRNA-mRNA之間的堿基互補匹配性、可接近性以及序列的保守性等特征.本方法選擇了1 297個實驗驗證的miRNA靶基因數(shù)據(jù)作為正樣本,309個實驗驗證負例樣本.因為該方法中負樣本遠少于正樣本的數(shù)量,所以該方法首先利用約束松弛方法構建了均衡的正、負樣本數(shù)據(jù)集,然后再利用深度學習模型,推測miRNA的靶基因.
miRNA從1993年被首次發(fā)現(xiàn),到成為研究熱點,持續(xù)至今已經(jīng)歷20多年的歷史,在這個過程中,圍繞miRNA,科研學者積累了大量的數(shù)據(jù)資源,并建立了數(shù)據(jù)庫供同行分享使用,以便人們能夠在miRNA研究道路上走的更好、更遠.關于miRNA的數(shù)據(jù)庫系統(tǒng)已有數(shù)十種甚至多達百種,本文總結了一些常用的數(shù)據(jù)庫(表1).這些數(shù)據(jù)庫中有些是關于miRNA功能注釋的(miRbase,miRDB),有些是有關miRNA靶基因信息預測的數(shù)據(jù)庫(miRanda,TargetScan,PITA等).
通過回顧總結miRNA靶基因計算預測的工作,可以發(fā)現(xiàn)這些方法都有如下一些特點:miRNA與其靶向mRNA序列跨物種、跨基因間的保守性;miRNA的5p端在miRNA-mRNA互補匹配中的重要作用;miRNA與靶基因mRNA形成的雙鏈的二級結構以及能量特征.不同的預測方法有其一定的使用范圍和獨特優(yōu)點,相信隨著實驗驗證方法的不斷發(fā)展,各種計算預測算法也可以相互補充完善,從而提高靶基因預測的精確度.
表1 miRNA靶基因預測數(shù)據(jù)庫
Lee等[34]于1993年在做篩選線蟲時序相關基因的研究時,發(fā)現(xiàn)了一個長度僅有22nt的RNA小分子——lin-4,這個小分子不編碼蛋白質(zhì),而是以堿基互補配對的方式結合到lin-14基因的3’端非轉(zhuǎn)錄區(qū)域(3’UTR)的特定位點,抑制lin-14對應mRNA的翻譯,最終使得其蛋白質(zhì)合成的量明顯降低,因此,稱其為轉(zhuǎn)錄后抑制,這是首次發(fā)現(xiàn)miRNA具有調(diào)控基因表達功能的研究.當時人們并不能完全理解為何如此微小的RNA分子會具有調(diào)控基因表達的功能,隨后關于該領域的研究一直沉寂了7年之久才再次有新的發(fā)現(xiàn).2000年,Reinhart等[35]同樣是在研究線蟲C.elegan時序數(shù)據(jù)時,發(fā)現(xiàn)了另一個長度只有21 nt小分子RNA——let-7,經(jīng)過研究發(fā)現(xiàn),該小分子能夠靶向基因lin-41,從而導致該基因?qū)牡鞍踪|(zhì)表達量減少.后來,隨著不斷的深入研究,生物學家總結出miRNA的功能作用機制,即成熟的miRNA能夠通過堿基互補配對的方式結合到靶基因mRNA上,當種子序列完全互補匹配時會促進靶基因的降解,而當不完全互補匹配時則會抑制靶基因的翻譯生成對應的蛋白質(zhì).
長期以來,人們一直認為miRNA對于靶基因的表達是起到負調(diào)控的作用,因此,在研究miRNA功能的時候會選擇性地忽略正相關的miRNA-Gene調(diào)控關系,僅僅考慮具有負相關的miRNA-Gene調(diào)控關系.然而也有一些打破傳統(tǒng)約束,揭示出令人驚喜的研究成果,Vasudevan實驗室2007年發(fā)表在Science雜志上的一篇文章,發(fā)現(xiàn)miRNA并非總是負調(diào)控基因的表達,在一些特定情況下miRNA能夠起到促進基因表達的作用.該課題組通過實驗發(fā)現(xiàn),miR369-3能夠引導AGO等蛋白與AREs(AU-rich elemens)相結合促進基因的翻譯,除此以外,該課題組還發(fā)現(xiàn)在靜態(tài)細胞中即G0期狀態(tài)下let-7能夠與人工合成的miRcxcr4協(xié)同促進靶基因的翻譯表達,而在增殖細胞中它們對靶基因又起到抑制作用[12].2017年復旦大學于文強課題組在RNA Biology上發(fā)表了一篇文章,表明miRNA在細胞核內(nèi)可以與增強子結合,從而改變增強子的染色質(zhì)狀態(tài),進一步達到激活基因的轉(zhuǎn)錄表達的結果[13].曾獲得諾貝爾生理學獎的Phillip Sharp同樣于2017年在Cell上提出了miRNA激活理論[36],文章指出miRNA在細胞核內(nèi)則會與增強子相互作用,這也一定程度上肯定了復旦大學于文強課題組的研究成果.
已有研究表明,包括腫瘤在內(nèi)的許多復雜疾病的發(fā)生、發(fā)展過程中往往伴隨著編碼基因以及非編碼基因尤其是miRNA的差異化表達,如何識別在疾病進展過程中異常表達的miRNAs,對于疾病的診斷以及新藥的開發(fā)具有十分重要的意義.生物學家通過實驗的方法發(fā)現(xiàn)了一些疾病相關的miRNAs,哈爾濱工業(yè)大學蔣慶華課題組[37],北京大學崔慶華課題組[38],以及Yang等[39]基于文獻搜索方式,人工整理了與疾病相關的miRNAs(表2).除了通過實驗的方法以外,近年來關于篩選疾病相關miRNAs,出現(xiàn)了多種基于計算的方法,本節(jié)主要分3個部分來敘述:基于miRNA表達濃度的分析方法;基于miRNA表達相對位置排序的分析方法;基于miRNA功能相似性網(wǎng)絡分析方法.
表2 人類疾病相關的miRNAs數(shù)據(jù)庫
(1)基于miRNA表達差異分析方法
直接法:直接法的意思是直接基于miRNA表達水平做差異表達分析,該方法假設如果某個miRNA差異表達,那么它對應的下游靶基因就是差異表達的.分析miRNAs表達譜最簡單常用的方法是倍數(shù)法(FC,F(xiàn)old Change)以及T-test差異檢驗方法[40-41].倍數(shù)法是基于miRNAs表達濃度計算變化的倍數(shù),選取變化大的miRNAs作為候選的疾病相關miRNAs.倍數(shù)方法操作簡單方便,同時它也有顯而易見的缺陷,就是這種方法缺少差異顯著性估計值,使得倍數(shù)閾值的選擇比較隨意,會受到主觀意愿的影響(到底是1.5倍、2倍或者還是3倍?).T-test差異檢驗方法可以彌補倍數(shù)法的不足,該方法可以通過設置顯著性閾值來獲得表達差異比較顯著的miRNAs.T-test差異檢驗方法是基于miRNAs的表達濃度呈正態(tài)分布假設為前提的.不管是倍數(shù)法還是T-test差異檢驗方法,他們都會受到實驗批次效應(Batch effect)和數(shù)據(jù)標準化過程的影響[42].
間接法:miRNA與靶基因mRNA之間是一種“多對多”靶向調(diào)控關系,因此,簡單地通過單個miRNA的表達變化情況來決定其靶基因是否差異變化存在明顯的不足之處,因此,一些綜合的分析方法被提出,即通過多個miRNAs的協(xié)同作用間接確定下游靶基因的差異變化.東南大學肖忠黨課題組于2016年提出了基于miRNA表達濃度以及miRNA-mRNA結合系數(shù),綜合評估m(xù)iRNA表達譜整體對下游靶基因的影響[43],為系統(tǒng)性篩選受miRNA表達譜全局性顯著調(diào)控的編碼基因提供了解決方案.Garcia-Garcia等[44]提出基于多個miRNAs表達變化疊加效應來確定下游靶基因是否差異表達,該模型中考慮了miRNA水平差異表達變化的方向(+/-)以及顯著性值P-value.
(2)基于miRNA表達量的排序方法
哈爾濱醫(yī)科大學顧云燕課題組等認為在個性化樣本內(nèi),一些miRNAs在正常樣本中是存在著相對穩(wěn)定排序的,而疾病狀態(tài)下有些miRNAs會發(fā)生排序的逆轉(zhuǎn),基于該設想,顧云燕課題組提出基于miRNA表達相對位置排序篩選差異變化的miRNAs.該課題組首先在正常樣本群體內(nèi)篩選具有穩(wěn)定表達順序的miRNAs基因?qū)?,然后檢驗個性化樣體中miRNA排序的差異變化來篩選差異表達的miRNAs[45].在編碼基因水平,已有研究指出,基于基因排序篩選差異表達基因的方法可以大大地降低對于實驗批次效應以及數(shù)據(jù)標準化過程帶來的負面影響[46-47].雖然該方法對于抵抗批次效應以及數(shù)據(jù)標準化過程帶來的負面影響,是個非常有效的方法,然而它卻是犧牲了表達譜中關于miRNA的精確的量化信息.
(3)基于miRNA功能相似性網(wǎng)絡方法
單個miRNA能夠靶向調(diào)控多個mRNAs的表達翻譯,這些mRNAs可能富集在某些GO功能模塊中.如果2個miRNAs能夠協(xié)同調(diào)控某一個公共的GO功能模塊,那么這2個miRNAs就被認為具有功能協(xié)同的作用.基于該思想,哈爾濱醫(yī)科大學李霞課題組等構建了miRNA-miRNA協(xié)同調(diào)控網(wǎng)絡,從miRNAs協(xié)同調(diào)控網(wǎng)絡的角度探究腫瘤疾病相關的miRNAs,為開發(fā)miRNAs藥物或者發(fā)現(xiàn)新的治療靶點提供了一個新的視角[48].Li等[49]采用多個miRNAs協(xié)同調(diào)控靶基因mRNAs的思想,基于miRNA、mRNA表達譜數(shù)據(jù)提出了一種構建miRNA-mRNA調(diào)控網(wǎng)絡的分析方法.功能相似的miRNAs 調(diào)控的疾病也應該比較相似,基于這樣的假設,郭茂祖等[50]提出了BNPDCMDA算法.該方法首先構建了miRNA-疾病雙層網(wǎng)絡;然后,通過miRNAs 的功能相似度對其進行基于密度的聚類;最終,將聚類后的miRNAs與疾病構成的miRNA-疾病雙層網(wǎng)絡,采用二分網(wǎng)絡投影方法預測miRNA-疾病關聯(lián).
除了以上3類從miRNAs表達譜數(shù)據(jù)出發(fā)逐步篩選疾病相關的miRNAs以外,也有一些從編碼基因表達譜數(shù)據(jù)出發(fā)的逆向反推導的方法.趙興明課題組僅利用編碼基因表達譜數(shù)據(jù),提出了篩選疾病相關miRNAs的研究方法[51].本課題組在前期的工作中提出基于基因子通路的方法篩選疾病相關miRNAs,該方法用到的數(shù)據(jù)是編碼基因表達譜數(shù)據(jù),首先對基因數(shù)據(jù)集做差異表達分析,然后對差異表達的基因做子通路富集分析,最后根據(jù)miRNA-mRNA作用關系篩選疾病相關的miRNAs[52].
已有研究表明,生物活性小分子或者藥物能夠調(diào)控miRNA的表達,這預示通過小分子藥物靶向調(diào)控miRNA或許能夠為疾病帶來新的治療方案.2008年Gumireddy實驗室開發(fā)了首個靶向miRNA的小分子抑制劑,該抑制劑被設計主要用來靶向抑制miR-21的表達[53].自此以后,人們利用高通量篩選或者通過計算機序列比對方法設計出大量的針對非編碼miRNA的小分子抑制劑.2012年哈爾濱醫(yī)科大學李霞課題組基于miRNA表達數(shù)據(jù)以及藥物對轉(zhuǎn)錄組的影響結果,提出一種方法,將miRNA與小分子藥物聯(lián)系起來,構建了一個網(wǎng)絡SMirN[54],為發(fā)現(xiàn)新的治療靶點或者治療藥物提供了輔助性工作.2013年哈爾濱醫(yī)科大學李霞課題組建立了一個miRNA與小分子藥物關系數(shù)據(jù)庫SM2miR,專門收集實驗驗證的能夠靶向調(diào)控miRNA表達的小分子藥物[55],該數(shù)據(jù)庫包含了2 925個作用關系(涉及151個小分子藥物,747個miRNAs以及17個物種).2017年上海同濟大學趙興明課題組構建了一個miRNA影響藥物治療效果的關系數(shù)據(jù)庫[56],該數(shù)據(jù)庫不僅存儲了miRNA與小分子藥物的對應關系,而且還給出了miRNA對藥物治療效果的影響.
隨著miRNA相關研究的不斷深入,一些針對包括腫瘤在內(nèi)的多種疾病的miRNAs藥物被開發(fā)出來,并且陸續(xù)有一些miRNA藥物從實驗室走向臨床試驗階段(表3).miRNA小分子藥物相關數(shù)據(jù)庫的構建必將有效地加速推進miRNA在臨床醫(yī)學中的具體應用.
表3 進入臨床試驗中的miRNAs藥物[57]
隨著miRNA研究的不斷深入以及高通量測序技術的發(fā)展,人們在靶基因預測、miRNA生物學功能機制的探究以及疾病相關miRNAs篩選等方面,發(fā)展了大量的分析研究方法,并發(fā)現(xiàn)了許多對疾病具有重要影響的miRNAs,其中一些對疾病治療極具潛力的miRNAs藥物已經(jīng)進入臨床試驗階段.
雖然關于miRNA的研究已有十幾年的歷史,并且取得了喜人的豐碩成果,但是還有一些方面有待繼續(xù)跟進:①靶基因預測方法普遍存在高假陽性的缺點,靶基因預測準確性對于miRNA功能的研究至關重要,因此,亟待發(fā)展具有突破性的計算方法來預測miRNA的靶向基因;②miRNA對靶基因調(diào)控的復雜性,miRNA與靶基因之間是一種多對多的靶向關系,且miRNA對靶基因具有抑制或者促進的雙重作用,因此,如何準確量化miRNA對其靶基因的影響是一個具有挑戰(zhàn)性的重要課題;③加速推進miRNA藥物走向臨床,篩選疾病相關的miRNAs,其重要目的在于將其推向臨床醫(yī)學實際應用,可喜的是已有些miRNAs藥物進入臨床試驗階段,遺憾的是目前還沒有一個合格的miRNA藥物被批準進入市場.因此,有待新的有效篩選方法被提出,從而加速miRNA藥物早日進入臨床治病救人.