劉海波,馬培,許利嘉,肖培根
中國醫(yī)學科學院 北京協(xié)和醫(yī)學院 藥用植物研究所 中草藥物質(zhì)基礎與資源利用教育部重點實驗室,北京 100193
藥用植物親緣學(pharmacophylogeny)是研究藥用植物的親緣關系-化學成分-療效(藥理活性及傳統(tǒng)療效)之間相關性的一門邊緣學科,是藥用植物資源開發(fā)利用的基礎工具[1];是在對我國藥用植物資源深入開發(fā)利用的實踐中逐步建立起來的,屬于多學科交叉的研究領域,兼具學術價值和應用價值。20 世紀50 年代,國外在蛇根木Rauvolfia serpentina(L.)Benth.ex Kurz.中發(fā)現(xiàn)了能夠治療高血壓的藥物利血平。肖培根等老一輩科研人員受命在國內(nèi)尋找替代性藥用植物資源。在此過程中發(fā)現(xiàn),親緣關系較近的植物所含的天然產(chǎn)物成分及藥用功效也接近。在這一發(fā)現(xiàn)的指導下,經(jīng)過不懈探索,最終在我國南方的蛇根木同屬植物蘿芙木R.verticillata(Lour.)Baill.中找到了藥效相似的生物堿。以此為契機,在很短的時間里,開發(fā)并生產(chǎn)出以“降壓靈”為代表的一批國產(chǎn)降壓制劑。此后,藥用植物親緣學又在胡黃連、安息香、阿拉伯膠、馬錢子、大風子、阿魏、矮莨菪等藥用植物資源研究開發(fā)中得到進一步的驗證和發(fā)展。
藥用植物親緣學的核心理念是臨近系統(tǒng)發(fā)育群中的植物物種具有較為接近的遺傳基因特征,這種基因序列上的相似性導致近緣植物體內(nèi)各類次生代謝物的合成途徑比較接近,最終表現(xiàn)為化學成分具有較高相似度,即:1)特定次生代謝物更可能分布于親緣學接近的多個植物物種中;2)近緣植物中天然產(chǎn)物在分子骨架構成方面具有較高的相似度和衍生關系。上述2 種化學成分相似性在臨床應用中表現(xiàn)為整體層面接近的生物活性或治療效果。在實踐中,藥用植物親緣學的理念有效指導了藥用植物資源的深度開發(fā)利用,特別是在新藥用植物物種的發(fā)現(xiàn)方面,可以避免傳統(tǒng)研究方法中的盲目性,開展有的放矢的研究。
藥用植物親緣學是從科學實踐中來,經(jīng)過提煉升華后應用于實踐的理論,其產(chǎn)生過程符合科學發(fā)展發(fā)現(xiàn)的總體規(guī)律。目前,我國在傳統(tǒng)藥物、植物化學、天然藥物等領域已經(jīng)走在了世界前列。在新時期,藥用植物親緣學正在不斷擴展應用范圍,在藥用植物資源開發(fā)、中藥質(zhì)量控制、種質(zhì)鑒定、藥食同源品種研究等方面繼續(xù)發(fā)揮著積極作用。
藥用植物親緣學在發(fā)展過程中,不斷吸納各學科領域新思想和新興技術方法,保持自身鮮活的生命力,學科理論得到了持續(xù)豐富、創(chuàng)新和發(fā)展。2014 年,以郝大程為代表的一批青年科研人員,提出了“藥用基因組親緣學”的新理論,這是藥用植物親緣學的一個新的發(fā)展里程碑。近年來,包括系統(tǒng)生物學、分子生物學、基因組和其他組學為主體的生物大數(shù)據(jù),以及以生物和化學信息學技術為代表的信息學技術,成功應用于藥用植物親緣學研究,產(chǎn)生了一批研究成果。藥用植物親緣學進入了又一個新的發(fā)展階段。本文匯總了近年來各類信息學方法及其應用,為科研人員學習和了解該學科的最新發(fā)展動態(tài)提供參考。
化學信息學(cheminformatics)是一門使用信息學方法解決化學問題、提高研究效率的學科。信息學方法已經(jīng)與化學等傳統(tǒng)學科深度融合,因此,化學信息學的研究領域不斷擴展,滲透進入化學科學的各個分支?;瘜W信息學包括以下幾個主要研究領域:化學文獻管理、化合物數(shù)據(jù)存儲與挖掘[2]、有機小分子結構與性質(zhì)關系、有機分子的合成設計[3]、不同尺度上的分子模擬計算、分子可視化、各類圖譜的分析和預測等。
化學信息學在生命科學領域主要用于新藥研發(fā),由此產(chǎn)生了計算機輔助藥物設計(computer aided drug design,CADD)這一子學科。目前,CADD 技術在化學藥、生物制品和中藥的上游研發(fā)過程中扮演著越來越重要的角色,促使藥物發(fā)現(xiàn)由以往“尋找發(fā)現(xiàn)”模式逐漸向“靶向設計”模式轉(zhuǎn)變[4],將個別藥物的研發(fā)周期由原來的20 年左右,縮短到3~5年。
隨著植物化學各類分離鑒定方法的發(fā)展,藥物學家從植物、真菌和其他藥用資源中得到越來越多的天然產(chǎn)物單體,但獲得的量一般較少,難以通過傳統(tǒng)實驗方法進行藥理檢測?;诮Y構的天然產(chǎn)物活性預測方法由此得到廣泛應用。天然產(chǎn)物的活性預測分為由靶點尋找活性化合物的虛擬篩選及由化合物結構預測其作用靶點的反向?qū)ぐ?。這2 種方法本質(zhì)都是評價“化合物-靶點”直接的作用強度及可靠性,因此具體算法基本一致。算法主要分為3 類,包括分子對接、藥效團匹配及小分子結構相似性。這3 種方法的理論基礎應用范圍均不相同,各具優(yōu)缺點。
分子對接是通過受體自身的特征及與配體分子之間的相互作用模式來進行藥物設計,其理論依據(jù)的基礎是配體與受體之間結合的鎖匙模型,通過計算兩者之間的靜電作用、氫鍵作用、疏水作用、分子間作用力等預測兩者間的結合模式和親和力,從而進行藥物的虛擬篩選。這一方法是目前虛擬篩選的主流方法[5]。藥效團泛指藥物小分子中對活性起重要作用的藥效特征元素的空間排列形式,主要包括氫鍵供體、氫鍵受體、正負電荷中心、芳環(huán)中心、疏水基團、親水基團及幾何構象體積限制。根據(jù)對這些藥效特征元素的歸納總結,能夠預測待測小分子的生物活性。小分子結構相似性是通過對具有相同機制的化合物先進行定量構象關系研究,再進行化合物數(shù)據(jù)庫搜索,本質(zhì)上是一種數(shù)據(jù)庫搜索技術。大量網(wǎng)上化合物活性預測平臺使用的都是這一算法。
分子對接方法和分子動力學模擬方法通常用于分析活性分子與特定靶點之間的作用方式,用于提高虛擬篩選正確率、減少假陽性。在此基礎上,可以對中、低活性分子提出結構優(yōu)化策略,設計出具有更高活性或選擇性的天然產(chǎn)物衍生物。其可能成為更適合的先導化合物候選分子。分子動力學模擬受體-配體復合分子體系的相互作用,研究結合模式,通過計算親和力預測配體的生物活性,與分子對接方法相比具有更高的可靠性,相關的軟件工具有Amber、GRMOACS、NAMD 等。近年來,超算技術的發(fā)展可以使各類分子動力學軟件工具的計算效率提高5~20倍。
組學是基于高通量分析的生物學方法集合,根據(jù)分析目標的不同可分為基因組、轉(zhuǎn)錄組、蛋白質(zhì)組和代謝組等,以整體角度去研究生物體內(nèi)DNA 轉(zhuǎn)錄、RNA 翻譯和修飾、蛋白質(zhì)修飾和代謝產(chǎn)物的功能及變化情況。多組學方法的產(chǎn)生是生物大數(shù)據(jù)研究的開端,開始階段一般水平單一或組學有效信息有限,后期逐步實現(xiàn)了不同水平上各類數(shù)據(jù)的互補集成。近年來,該方法成功應用于冠心病痰瘀互結證[6]、腫瘤耐藥性等的研究[7],為闡明其遺傳調(diào)控機制和微觀物質(zhì)基礎提供了有效途徑[8]。
組學及相關系統(tǒng)學是生命科學各分支和交叉學科的根基所在,具有“整體性”和“動態(tài)性”的特點,與中醫(yī)藥“整體觀”的指導思想十分契合,從而在中醫(yī)藥領域得到了廣泛應用。藥用植物親緣學引入組學方法后,拓展了藥用植物親緣學的方法和內(nèi)容,在生藥學和藥用生物學等藥學相關領域更能起到提綱挈領的作用[1]。強化各種組學方法在藥用植物親緣學中的應用,可有力推動藥用植物資源的開發(fā)和可持續(xù)利用。
各種組學方法在藥用植物親緣學的相關研究可以解決2 類問題,一是比較物種基原、道地產(chǎn)區(qū)、藥用部位在基因組、轉(zhuǎn)錄組、蛋白質(zhì)組水平上的差異,明確活性物質(zhì)調(diào)控功能蛋白表達及活性成分形成的分子機制[9];二是探索含有同類化合物、相似化合物類群的不同種中藥對疾病模型在基因和蛋白水平上的擾動調(diào)控模式,進而闡明其作用機制和差異。組學方法的引入可有效拓展植物藥用部位、發(fā)展中藥替代品,也能對發(fā)掘民間草藥資源和拓展外來藥材品種起到指導作用。
基因組學是由美國科學家Thomas Roderick 于1986 年提出的,是對物種全部或特定基因進行基因作圖、基因定位和功能分析的一門科學[10]。藥用植物相關基因組研究主要包括全基因組和葉綠體基因組2 類方法。前者用于揭示物種起源、進化、生長發(fā)育及活性成分合成代謝的遺傳信息,后者更多用于系統(tǒng)發(fā)育研究和物種進化?;蚪M方法在藥用植物領域有多方面的應用[11]:1)明確藥用植物類群間的系統(tǒng)發(fā)育和親緣關系;2)推測現(xiàn)存藥用植物/道地藥材的起源和空間分布格局及其形成機制;3)探討藥用植物的多樣化進程和成因;4)基于生物多樣性探討藥用化合物多樣性,促進生合途徑解析和創(chuàng)新藥物發(fā)現(xiàn);5)預測藥用植物多樣性動態(tài)變化,提出相應的保護性開發(fā)策略,促進人工栽培和分子育種。近年來,這一領域研究成果較多,如采用matK和rps16基因做DNA 條形碼序列,成功區(qū)分了黃精屬的主要藥用植物等[12]。
轉(zhuǎn)錄組是連接基因組與蛋白質(zhì)組的紐帶,研究特定發(fā)育階段或功能狀態(tài)下細胞中轉(zhuǎn)錄RNA 的總體情況,包括編碼蛋白的mRNA 和非編碼RNAs(rRNA、tRNA、lncRNA、microRNA)。通過轉(zhuǎn)錄組分析可獲取基因表達、可變剪接類型等信息,為功能基因挖掘、藥用植物活性成分的生物合成與調(diào)控、藥用植物種質(zhì)資源評估與擴大、探索藥材道地性分子機制提供了新的思路和方法。陳進芳等[13]針對漆酶基因挖掘唇形科8 種藥用植物的轉(zhuǎn)錄組數(shù)據(jù),為唇形科藥用植物藥效物質(zhì)的代謝調(diào)控及關鍵酶基因的定點突變提供參考。
蛋白質(zhì)組學研究特定生理或病理狀態(tài)下物種體內(nèi)蛋白質(zhì)的構成、表達及相互作用[14]。目前,主要采用多維液相色譜進行分離并采用質(zhì)譜技術進行鑒定。中藥藥效活性成分的合成和分布局限于植物特定的器官、組織或細胞內(nèi),并且在藥用植物生長發(fā)育過程中處于動態(tài)變化。這種變化由植物體內(nèi)差異表達蛋白質(zhì)組直接調(diào)控,展現(xiàn)出時間效應(不同發(fā)育階段)和空間效應(不同種屬或同一種屬、同一植物的不同藥用部位差異)。差異蛋白質(zhì)組還可以反映出遺傳物質(zhì)和環(huán)境因子(溫度、鹽分、紫外線照射等)的分子調(diào)控機制[15]。Yuan 等[16]基于蛋白質(zhì)組學研究了缺水脅迫對黃芩中黃酮類成分含量及組成變化的內(nèi)在影響機制,發(fā)現(xiàn)缺水可產(chǎn)生15 個上調(diào)蛋白和3個下調(diào)蛋白。
代謝組學研究生物體在病理生理刺激或遺傳因素改變的條件下,內(nèi)源性小分子代謝物種類、數(shù)量的動態(tài)變化規(guī)律及相互關系[17]。經(jīng)典分析方法有核磁共振、液相色譜-質(zhì)譜聯(lián)用、氣相色譜-質(zhì)譜聯(lián)用等技術。植物代謝組學方法可以揭示基因或環(huán)境對植物代謝物的影響,揭示中藥活性成分在機體內(nèi)的代謝機制,在藥材鑒別及質(zhì)量評價、中藥炮制機制、藥用植物次級代謝途徑機制、輔助育種、天然藥物開發(fā)方面有廣泛的應用[18]。龐溢媛等[19]通過超高效液相色譜串聯(lián)質(zhì)譜技術(UHPLC-MS/MS)明確了不同采收時期黃芩的差異代謝物及含量變化,有助于藥材采收及質(zhì)量評價。
系統(tǒng)生物學是一門研究生物系統(tǒng)組成成分的構成與相互關系的結構、動態(tài)與發(fā)生,以系統(tǒng)論和實驗、計算方法整合研究為特征的生物學。該學科是生物科學由“分析”思想主導,轉(zhuǎn)向“分析”與“綜合”并重的產(chǎn)物。系統(tǒng)生物學的思路與現(xiàn)代生物科學誕生以來不斷分解的思路不同,在繼續(xù)探究生物體每個結構單元的構成及功能的同時,開始研究基因、蛋白質(zhì)、核酸及其他生物體內(nèi)活性分子之間的相互作用,進而研究細胞內(nèi)代謝通路、信號傳導通路、基因調(diào)控網(wǎng)路、生物系統(tǒng)組成之間相互關系和功能。在這一思想指導下,人們對藥物研究的方法也發(fā)生了改變。
系統(tǒng)生物學的發(fā)展與組學方法有緊密聯(lián)系。單一組學發(fā)展到一定階段,對組學間的交叉融合研究提出了更高的要求。在某種程度上,系統(tǒng)生物學可以看作綜合研究組學的理論體系,對生物學、計算機科學、工程學、生物信息學、物理學等多學科進行交叉融合,通過研究生物系統(tǒng)中不同部分(基因、蛋白質(zhì)、代謝物等)之間的相互關系和相互作用,從整體性、動態(tài)性、多維度、多角度解析生命活動過程及機制,更有助于系統(tǒng)深入地揭示生物體遺傳和功能的關系。
2007 年,英國藥理學家Hopkins 提出網(wǎng)絡藥理學概念,突破了“一個基因,一種藥物,一種疾病”的范式,為創(chuàng)新藥物發(fā)現(xiàn)提供了新的框架。網(wǎng)絡藥理學屬于系統(tǒng)生物學、生物信息學和高通量組學分析的藥理學分支學科,通過網(wǎng)絡方法解析藥物、靶點和疾病之間的相互關系,根據(jù)分析結果研發(fā)和設計具有多種效應的藥物[20]。網(wǎng)絡藥理學具有整體性、系統(tǒng)性的特點,與中醫(yī)藥整體觀的原則不謀而合。因此,網(wǎng)絡藥理學方法的引入與中藥多成分、多靶點作用特點相結合,推動了中藥的現(xiàn)代化研究的進程[21-22]。
整合藥理學(integrative pharmacology)是研究多成分藥物與機體相互作用及其整合規(guī)律和作用原理的一門學科,可以視為網(wǎng)絡藥理學與中藥學深度融合的產(chǎn)物,強調(diào)“整體與局部”“體內(nèi)與體外”“體內(nèi)過程與活性評價”等多層次、多環(huán)節(jié)的整合研究[23-24]。中國中醫(yī)科學院還開發(fā)了中藥整合藥理學計算平臺[25],在此平臺基礎上開展了大量相關研究。
全球科學發(fā)展已進入大科學時代??茖W創(chuàng)新活動由過去科研人員小團體合作進入到廣域協(xié)作模式,大數(shù)據(jù)和信息技術的高速發(fā)展正在帶動各個科學領域研究范式發(fā)生革命性變化。在生物醫(yī)藥領域,在高通量篩選、高通量測序、高效色譜等技術的支持下,化學、藥理、生物、基因等各領域的數(shù)據(jù)總量突飛猛進。最新的L1000 技術可同時快速測定近千個基因表達差異,覆蓋評估3 萬多個基因變化情況??蒲袛?shù)據(jù)的存儲、傳輸和分析處理能力也在飛速提升,新藥研發(fā)由過去的實驗室“濕模式”正在向計算與實驗緊密結合的“干濕并重模式”轉(zhuǎn)變。藥用植物親緣學在這一大背景下,必須吸納各類新技術,充分利用各學科產(chǎn)生的數(shù)據(jù)資源,才能與時俱進,煥發(fā)新的生命力。
全球現(xiàn)存種子植物超過300 000 種,中國有超過10 000 種藥用植物,約87%的中藥材屬于植物藥。未來,對這一巨大資源寶庫的開發(fā)利用仍有很大空間。具有類藥結構的天然產(chǎn)物集中分布于特定的物種群。目前,已發(fā)現(xiàn)的活性分子有較大比例分布于144 個植物科中,說明具有活性的天然產(chǎn)物在植物和微生物中的分布是有規(guī)律可循的。藥用植物親緣學研究發(fā)現(xiàn),活性天然產(chǎn)物在木蘭亞綱(Magnoliidae)[26]、金縷梅亞綱(Hamamelidae)和石竹亞綱(Caryophyllidae)[27]的藥用植物中數(shù)量較多。這些規(guī)律對藥用植物學術研究和開發(fā)利用具有重要的指導作用。
在化學藥和天然藥物領域,天然產(chǎn)物及其衍生物具有較高的成藥性。因此,其在新藥研發(fā)中一直占據(jù)比較重要的地位,超過1/3臨床用藥來自天然產(chǎn)物和/或其衍生物。植物和微生物是活性天然產(chǎn)物的主要資源。近年來,來源于海洋生物的天然產(chǎn)物以其新穎的結構引起了藥物學家的關注[28-30]。目前,已解析的天然產(chǎn)物結構數(shù)量超過42 萬,篩選新活性天然產(chǎn)物的難度持續(xù)增加。CADD 技術及人工智能技術的廣泛應用有助于提高新藥研發(fā)效率。疾病研究和藥物治療進入多組學整合階段。多數(shù)疾病涉及多條生物途徑及功能蛋白的協(xié)同變化,這往往是單靶點藥物脫靶、無效或產(chǎn)生不良反應的原因。多組學整體評估藥物對多個疾病核心基因的調(diào)控,有望解決這些問題,是當前藥物研發(fā)的熱點。
30 年前,以肖培根院士為代表的老一代科研人員通過多年中藥資源開發(fā)的實踐,提出藥用植物親緣學理論并成功應用于藥用植物資源的研究和開發(fā),這是藥用植物親緣學的第一階段。基因組學的融入,深化了對藥用植物親緣關系的認識層次,這是藥用植物親緣學發(fā)展的第二階段。未來,以各類組學、高通量藥理活性篩選、天然產(chǎn)物化學等學科產(chǎn)生的大數(shù)據(jù)為基礎,結合化學信息學、生物信息學、分子模擬等信息技術,藥用植物親緣學的發(fā)展將進入一個新階段。
以往藥用植物親緣學的應用多根據(jù)“近緣物種具有相似的化學成分”這一基本設定。下一階段,近緣植物的內(nèi)涵將拓展為“近緣物種具有相似的基因、相似的功能蛋白、相似的生物合成途徑、相似的生物代謝/信號傳導網(wǎng)絡”。由此,能夠在轉(zhuǎn)錄水平上評估近源物種的化學成分對疾病模型的調(diào)控,發(fā)現(xiàn)活性化合物的協(xié)同調(diào)控作用,探究中藥基原植物在轉(zhuǎn)錄組和蛋白組上的變化與化學成分異質(zhì)性之間的相關性,進而拓展藥用植物親緣學理論在合成生物學等研究中的新應用。例如,中國科學院上海植物生理生態(tài)研究所與上海藥物研究所合作,已經(jīng)從親緣關系較近的人參和三七中克隆和鑒定了合成人參皂苷CK、人參皂苷Rh2、人參皂苷Rg3、人參皂苷Rh1和人參皂苷F1所需的關鍵糖基轉(zhuǎn)移酶和細胞色素P450 還原酶,很好地解析了人參和三七中皂苷的生物合成途徑。
大數(shù)據(jù)與信息學方法結合,拓寬了藥用植物親緣學的研究空間,并為這一理論探索出新的應用領域。藥用植物親緣學這一傳統(tǒng)交叉學科必將在新時期煥發(fā)新的生命力,繼續(xù)為我國傳統(tǒng)藥學發(fā)展作出貢獻。