摘要:中藥信息學是中藥科學與信息科學相結合的一門以中藥數(shù)據(jù)為研究對象的學科,是中藥研究信息化進程的必然產(chǎn)物。中藥信息學的蓬勃發(fā)展促進了中藥的現(xiàn)代化和國際化的發(fā)展。通過查閱2000~2014年發(fā)布的有關中藥信息學的文獻,總結了中藥信息學的研究方法與應用,并提及了國內外近幾年有突破性的中藥信息學科研成果,如《三維藥效團數(shù)據(jù)庫》的建立與應用、隨機森林等數(shù)據(jù)挖掘技術在中藥信息學中的應用,并指出為了加快中藥信息學的發(fā)展,較大程度的推進中藥現(xiàn)代化仍需解決的若干問題。
關鍵詞:中藥信息學;中藥現(xiàn)代化;中藥數(shù)據(jù)庫
1中藥信息學的產(chǎn)生背景
20世紀70年代前科學家主要對狹義信息論進行研究,信息論當時也主要被應用在通信領域;20 世紀70年代之后一些科學家通過不斷引入現(xiàn)代科學技術的最新成果,才開始研究廣義的信息論,物理、化學、生物學、計算機科學、心理學、管理學以及經(jīng)濟學等學科同時被廣泛的與有關的信息理論發(fā)生嵌合。中藥信息學在信息學向中藥學領域的逐漸滲透中產(chǎn)生?,F(xiàn)在,我們通過對中藥的研究,包括對中藥的原科植物、化學成分、藥理藥效作用及從古至今對中藥的傳統(tǒng)經(jīng)驗的理論研究,從中得出的許多有關中藥的適用范圍、功效等相關信息,中藥信息學通過分析整理這些信息,從而促進了中藥信息學的快速發(fā)展。
中藥信息學(TCM Informatics)由北京中醫(yī)藥大學喬延江教授最早提出, 2006年,喬延江教授及其研究室人員更加詳細的為中藥信息學的定義做了新的論述:應用數(shù)學、化學、計算機圖形學、生物學等技術方法,研究中藥各類信息的獲取、處理、存儲、共享、分析和解釋;同時闡述了中藥信息學研究所涉及的一些相關內容[1]。
2中藥信息學的研究方法
中藥信息學研究的相關內容包括從中藥復方到中藥化學物質基礎,蘊藏著對大量中藥學、化學、藥理學和生物醫(yī)學信息的文獻資料進行分析、歸類和整編[2]。中藥信息學①是從中醫(yī)藥學科的角度闡明并論述了解釋各部分相關信息的產(chǎn)生、獲取和分析等,②通過使用中藥信息學的相關論點及有效的手段來看待和研究中藥學領域中的信息獲取和處理問題,總結出一些有關中藥采集、炮制、置換、獲取、傳遞、分發(fā)、儲存、解釋及利用等過程中的一般規(guī)律。由于中藥系統(tǒng)表現(xiàn)的臨床療效遠遠超出其各組分療效的線性加和的復雜性[3],中醫(yī)用藥理論與中藥信息學研究的科學方法及其研究所依賴的整體準則和功能準則有很高的契合度,數(shù)據(jù)庫方法(如人工智能與專家系統(tǒng)、數(shù)據(jù)庫知識發(fā)現(xiàn))、化學計量學方法(包括因子分析、人工神經(jīng)網(wǎng)絡、遺傳算法、模擬退火、免疫算法等)、計算機輔助藥物設計方法等都被中藥信息學應用到對中藥的研究中,具體研究方法如下。
2.1信息的采集與加工存儲 這是信息化研究的基礎,收集信息并合理組織,建立數(shù)據(jù)庫。
2.2信息的提取 即數(shù)據(jù)庫知識發(fā)現(xiàn)。目前我國中醫(yī)藥信息資源建設已初有成效,建成了全文數(shù)據(jù)庫、主題數(shù)據(jù)庫、信息集成平臺等許多不同種類的中醫(yī)藥數(shù)據(jù)庫。所取得的成果有由喬延江教授帶領的研究室運用計算機模擬技術開展的計算中藥藥效分子的各種參數(shù)、確定中藥藥效團的搜尋研究,同時建立了《中藥化學成分數(shù)據(jù)庫》和《三維藥效團數(shù)據(jù)庫》。
2.3信息的處理 篩選、預測、評價從信息中總結的規(guī)律與模型,在中藥的科學研究與生產(chǎn)過程中實現(xiàn)中藥的現(xiàn)代化,必須建立通用規(guī)則,搭建科學平臺。
3中藥信息學的應用意義
中藥信息學是中藥與載體(環(huán)境和人體)之間進行的信息交換和相互作用,是應用現(xiàn)代信息技術來研究中藥本身所具有的各種特征信息。中藥信息學可廣泛用于在中醫(yī)藥研究應用及中醫(yī)藥基礎臨床研究數(shù)據(jù)的采集、處理、分析加工和管理等,極大推動中醫(yī)藥學發(fā)展。
3.1中藥設計研究 中藥信息學的研究不僅可以提供中藥活性成分結構、中藥性味、歸經(jīng)和功能以及配伍規(guī)律等信息,還能提供藥物所屬的歸經(jīng),藥物治療疾病的病因病機,治療疾病的有效機制及相關臨床療效等,通過中藥信息處理系統(tǒng)對相關數(shù)據(jù)進行自動分析處理,可以用計算機模擬進行自動化組方、工藝設計、質量控制、療效判斷等,從而加快中藥新藥的研究開發(fā)。
3.2中藥現(xiàn)代化 中醫(yī)藥學對現(xiàn)代技術的吸收融合需要中藥信息學的研究來催化,推動了中醫(yī)藥現(xiàn)代化。中醫(yī)走向世界就需要對東西方傳統(tǒng)的現(xiàn)代哲學和科學,特別是信息科學語言學等有所了解,同時必須對中醫(yī)學的信息學屬性有較深刻的了解。因此,中藥學與現(xiàn)代信息學相結合是中藥國際化必由之路。
3.3數(shù)據(jù)庫知識發(fā)現(xiàn) 數(shù)據(jù)庫知識發(fā)現(xiàn)(KnowledgeDISeoveryinDatabases,KDD)是從大量數(shù)據(jù)中獲取信息的有力工具[4]。其中中藥數(shù)據(jù)庫知識發(fā)現(xiàn)是是中藥信息學研究的重要內容,中藥進行信息化研究的重要過程。隨著中藥現(xiàn)代研究的加深及計算機技術迅速發(fā)展,中藥學領域的數(shù)據(jù)增長迅速,數(shù)據(jù)庫信息量也越來越大,包含著豐富的知識信息,需要應用現(xiàn)代的信息處理技術來獲取知識。近年來,在迅猛發(fā)展的化學信息學和生物信息的帶動下,中藥信息學出現(xiàn)了飛躍式的發(fā)展,并受到學術界的廣泛關注。目前在中藥創(chuàng)新藥物研發(fā)的各個環(huán)節(jié)中中藥信息學已經(jīng)具備信息支持的能力。分子對接、藥效團等化學信息學技術,可以對中藥活性成分進行尋靶研究,預測其生物活性;虛擬篩選天然產(chǎn)物庫,尋找先導化合物,通過研究構效關系指導結構優(yōu)化和天然藥物開發(fā)。在中藥品質鑒定、質量控制、資源開發(fā)等方面,基于中藥色譜、光譜、電泳和DNA 等指紋圖譜數(shù)據(jù)庫展開的數(shù)據(jù)挖掘和模式識別研究得到了廣泛的應用。
3.4中藥與其它信息科學聯(lián)系 中藥信息學可以將中藥研究與現(xiàn)代生物信息有機地結合起來,利用生物信息學的研究成果促進中藥學研究的發(fā)展;如中藥生物活性的虛擬篩選,隨機森林模型(random forest)的建立[5],利用模型產(chǎn)生了天然產(chǎn)物金絲桃苷是潛在的感冒 229E 抗原型冠狀病毒 3CL 蛋白酶的新型抑制劑[6]。
3.5中藥信息的客觀化、規(guī)范化 中藥在臨床中命名不統(tǒng)一,很多名稱。如常用中藥\"益母草\",梁·《名醫(yī)別錄》 與《神農(nóng)本草經(jīng)》 中稱其為\"茺蔚\",在處方中又稱紅花艾、坤草、甜麻萿(山東方言)、九塔花、山麻和九節(jié)草等別名;這些不規(guī)范的內容不僅給臨床、教學、科研帶來很多不便,在國際間的學術交流也帶來障礙。通過中藥信息學的相關處理后,名稱標準化,易區(qū)分,不導致誤用。
以上所述只是中藥信息學在某些方面的研究應用,更多領域的應用還有待進一步認識和研究。
4討論
中藥信息學的建立,可以廣泛地研究信息技術在中藥現(xiàn)代化研究中的應用,形成系統(tǒng)化的理論和應用技術,改變以往孤立分散的研究模式和傳統(tǒng)中藥學科的整體面貌。既要杜絕過多的沿襲傳統(tǒng)理論,也不能只注重信息科學技術的應用,而忽視了領域問題的背景知識。以中藥的復方研究為例,在獲得了中藥的所有化學組成而欲準確揭示中藥復方的組成和藥效的相關性的時候,仍須重視中藥獨特的多組份多靶點作用原理。近幾十年建立的中藥數(shù)據(jù)庫雖然數(shù)目眾多,但是還是存在一些問題:數(shù)據(jù)庫內容不夠豐富;如現(xiàn)代文獻數(shù)據(jù)庫多,古籍文獻數(shù)據(jù)庫少;題錄式或文摘式數(shù)據(jù)庫多,全文數(shù)據(jù)庫少[7];需建立與完善中藥基本數(shù)據(jù)庫系統(tǒng)、中藥研究開發(fā)信息系統(tǒng)、中藥市場信息系統(tǒng)等[8]。
中醫(yī)藥信息學內容豐富,它不僅包含了相應醫(yī)藥信息學科的相關門下內容,而且還囊括了許多中醫(yī)藥學獨特的內容、特殊的診療方法、我國的民族民間醫(yī)藥學的內容等。為了使中醫(yī)藥走向世界,中藥信息學在中藥信息的對象、方法、結構、范圍、應用等多方面還需進行大量的理論研究工作。此外,由于中藥信息學是一門交叉學科,需要中醫(yī)藥、數(shù)學、計算機和工程師等行業(yè)人員的參與,而他們各自專注的問題又不同,交流語言也不同,容易產(chǎn)生信息語言的各種歧義,所以需要彼此間相互溝通和協(xié)作。此外,我們還需對中藥信息及時的更新與維護,數(shù)據(jù)庫是需要不斷更新與擴充的,對有價值的中藥信息不斷地收集和整理是保持數(shù)據(jù)庫有效性、權威性和完整性的必要維護工作。
參考文獻:
[1]郭亦然.基于三維數(shù)據(jù)庫搜尋的中藥信息學研究[D].北京中醫(yī)藥大學,2006.
[2]程翼宇,范驍輝,瞿海斌.論建立與發(fā)展中藥信息學[J].中國中醫(yī)藥信息雜志,2003,02:84-86-92.
[3]王耘,史新元,喬延江.中藥復雜性研究的內容與方法[J].中國天然藥物,2005,3(5):262.
[4]喬延江.數(shù)據(jù)庫知識發(fā)現(xiàn)與中醫(yī)藥現(xiàn)代化研究初探[D].北京中醫(yī)藥大學博士后研究工作報告,1999.
[5]方睿.中藥信息學研究進展[J].中國中醫(yī)藥信息雜志,2009,01:2-7.
[6]賈琦,李劍,陳莉莉,等.感冒229E病毒3CL蛋白酶抑制劑金絲桃苷衍生物的合成及其構效關系研究[J].中國藥物化學雜志,2007,05:288-294.
[7]吳園園,章新友.我國中藥信息系統(tǒng)存在的問題與對策[J].時珍國醫(yī)國藥,2009,10:2583-2584.
[8]陳峰,崔蒙.中藥信息系統(tǒng)建立初探[J].中草藥,2000,11:81-83.編輯/肖慧