, ,
中醫(yī)藥信息資源建設(shè)是我國中醫(yī)藥事業(yè)的基礎(chǔ)性工作,也是中醫(yī)藥科技創(chuàng)新體系中不可缺少的重要組成部分。
隨著計(jì)算機(jī)、現(xiàn)代通訊技術(shù)和生物醫(yī)學(xué)信息技術(shù)等的飛速發(fā)展,中醫(yī)藥信息資源數(shù)字化已經(jīng)成為中醫(yī)藥事業(yè)發(fā)展的必然趨勢。本文在介紹我國中醫(yī)藥信息資源數(shù)字化建設(shè)取得成就及存在問題的基礎(chǔ)上,提出了下一步的發(fā)展對策和建議。
我國中醫(yī)藥信息資源數(shù)字化建設(shè)始于20世紀(jì)80年代[1],經(jīng)過幾十年的發(fā)展,已經(jīng)取得了不小成就,同時也存在不少問題。
1.1.1 以數(shù)據(jù)庫為主體的數(shù)字化資源類型多樣
中醫(yī)藥信息資源數(shù)字化產(chǎn)品包括數(shù)據(jù)庫、知識庫、電子期刊、電子圖書、網(wǎng)站等,而數(shù)據(jù)庫是目前中醫(yī)藥信息資源數(shù)字化建設(shè)的主體。
首先,建成數(shù)據(jù)庫數(shù)量可觀。我國的中醫(yī)藥信息資源非常豐富,根據(jù)上海辭書出版社出版的《中國中醫(yī)古籍總目》,我國共有中醫(yī)圖書13 000余種,其中產(chǎn)生于1911年以前的中醫(yī)古籍共8 927種[2]。
范為宇、崔蒙、陳守鵬等參照相關(guān)標(biāo)準(zhǔn),將我國中醫(yī)藥資源分為5個一級類目(主題域)、40個二級類目(主類)、143個三級類目(亞類),5個一級類目為:中醫(yī)藥事業(yè)、中醫(yī)、中藥、針灸、古籍[3]。中國大陸地區(qū)的代表性中藥主題數(shù)據(jù)庫見表1。
根據(jù)筆者的網(wǎng)絡(luò)調(diào)研,目前我國有37家中醫(yī)藥高等院校圖書館或圖文信息中心已將或者正在將自身中醫(yī)藥信息資源進(jìn)行數(shù)字化,如本校學(xué)位論文數(shù)據(jù)庫、教師論文數(shù)據(jù)庫、館藏目錄數(shù)據(jù)庫。不少院校建設(shè)了特色數(shù)據(jù)庫,如廣西中醫(yī)藥大學(xué)的壯醫(yī)壯藥數(shù)據(jù)庫、江西中醫(yī)藥大學(xué)的江西省道地藥材數(shù)據(jù)庫、福建中醫(yī)藥大學(xué)的閩港澳臺中草藥圖譜數(shù)據(jù)庫、云南中醫(yī)學(xué)院的云南地產(chǎn)中草藥(民族藥)數(shù)據(jù)庫及云南少數(shù)民族醫(yī)藥單驗(yàn)方數(shù)據(jù)庫等。
表1 中藥主題數(shù)據(jù)庫
另一方面,建成了多個具有代表性的數(shù)據(jù)庫,如中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所的“中國中醫(yī)藥數(shù)據(jù)庫檢索系統(tǒng)”(http://cowork.cintcm.com/engine/windex.jsp),該系統(tǒng)包括中醫(yī)藥數(shù)據(jù)庫48個,數(shù)據(jù)總量達(dá)120余萬條[4]。大力開發(fā)中醫(yī)藥數(shù)據(jù)庫,符合信息資源數(shù)字化的大趨勢。
1.1.2 資源內(nèi)容豐富,古籍資源得到有效開發(fā)
我國的中醫(yī)藥信息資源是一個巨大的知識寶庫,目前數(shù)字化建設(shè)涵蓋了古代與現(xiàn)代的中醫(yī)藥信息資源。其中,古籍資源得到了有效開發(fā),已經(jīng)建成的中醫(yī)藥古籍?dāng)?shù)字化產(chǎn)品有書目型數(shù)據(jù)庫、全文型數(shù)據(jù)庫、圖像型數(shù)據(jù)庫、圖文型數(shù)據(jù)庫、古籍知識庫[5]。中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所自2002年至今,已建成中醫(yī)藥珍善本古籍多媒體數(shù)據(jù)庫和中醫(yī)藥古籍資源數(shù)據(jù)庫,實(shí)現(xiàn)了部分中醫(yī)古籍的數(shù)字化保護(hù)與利用[6]。其中,“全國中醫(yī)藥珍善本古籍檔案管理系統(tǒng)”、“海外古籍書目數(shù)據(jù)庫”為書目型數(shù)據(jù)庫,“中醫(yī)藥珍善本古籍多媒體數(shù)據(jù)庫”為圖文型古籍?dāng)?shù)據(jù)庫。
古籍知識庫的建設(shè)突破了其他數(shù)據(jù)庫僅有的閱讀與查詢功能,“用戶可以進(jìn)行深層次的知識挖掘,實(shí)現(xiàn)由書目到全文等多個知識點(diǎn)的關(guān)聯(lián)檢索,也可以由一個作者檢索到其他相關(guān)作者等”[7],為深層次的知識挖掘開辟了新的道路。中國中醫(yī)科學(xué)院中國醫(yī)史文獻(xiàn)研究所中醫(yī)古籍?dāng)?shù)字化研究室的“中醫(yī)藥古文獻(xiàn)知識庫”是其中的代表。該知識庫目前已經(jīng)建成中醫(yī)古籍本草知識庫、中醫(yī)古籍方劑知識庫,以及張仲景、陳士鐸、新安醫(yī)學(xué)、婦科、醫(yī)案、蒙醫(yī)藥等6個中醫(yī)古籍專題知識庫[5]。中醫(yī)古籍知識庫的開發(fā)與應(yīng)用將促進(jìn)我國中醫(yī)藥信息資源的開發(fā)與運(yùn)用。
1.1.3 建設(shè)隊(duì)伍擴(kuò)大,部門合作加強(qiáng)
我國的中醫(yī)藥信息資源數(shù)字化建設(shè)已經(jīng)形成了多部門參與、協(xié)調(diào)合作的建設(shè)格局。研發(fā)隊(duì)伍得到了有效擴(kuò)充。以中醫(yī)藥院校圖書館和研究院所為主,中醫(yī)醫(yī)院、商業(yè)機(jī)構(gòu)等也都加入了開發(fā)的隊(duì)伍。如中醫(yī)醫(yī)院利用自身的臨床經(jīng)驗(yàn)、病歷等資源優(yōu)勢,開發(fā)了數(shù)據(jù)倉庫和平臺。多部門的加入,使中醫(yī)藥信息資源的數(shù)字化產(chǎn)品類型更為多樣、內(nèi)容更為豐富。機(jī)構(gòu)之間的交流與合作得到加強(qiáng),中醫(yī)藥類機(jī)構(gòu)之間合作建設(shè)數(shù)字化信息資源,如我國已經(jīng)建立了中醫(yī)藥虛擬研究院[8],在研究內(nèi)容與項(xiàng)目管理等方面具有極大優(yōu)勢[9]。在虛擬研究院中,組織了全國30余所省級中醫(yī)藥院校和研究院所的數(shù)百位中醫(yī)藥專業(yè)人員共同建設(shè)數(shù)據(jù)庫,并研制了中藥科技數(shù)據(jù)庫的技術(shù)規(guī)范、操作規(guī)程及遠(yuǎn)程管理模式,實(shí)現(xiàn)了在線人員監(jiān)控、數(shù)據(jù)安全管理、用戶權(quán)限控制;在虛擬管理控制下,建立了數(shù)據(jù)加工、初級審校與終審等不同職責(zé)管理制度,實(shí)現(xiàn)了無障礙遠(yuǎn)程辦公,超越了地域限制,成為直觀管理人員與數(shù)據(jù)的控制臺。同時單位之間資源共享,減少了重復(fù)開發(fā),目前很多中醫(yī)藥大學(xué)的圖書館機(jī)構(gòu)都購買了中國知網(wǎng)、萬方醫(yī)學(xué)網(wǎng)等電子期刊,以及讀秀、超星等電子圖書[10]。
1.2.1 資源開發(fā)深度有待提高
中醫(yī)藥信息資源數(shù)字化建設(shè)在開發(fā)的深度上有待提高。具體表現(xiàn)為具有深度挖掘、知識組織等功能的知識庫、數(shù)據(jù)倉庫、數(shù)據(jù)分析平臺的建設(shè)剛剛起步,僅有中國中醫(yī)科學(xué)院及其下屬醫(yī)院、北京中醫(yī)藥大學(xué)及其下屬醫(yī)院等少數(shù)機(jī)構(gòu)開發(fā)了一些數(shù)字化產(chǎn)品,其他機(jī)構(gòu)尚無具有應(yīng)用意義的產(chǎn)品。從中醫(yī)藥古籍知識庫建成的產(chǎn)品來看,具有挖掘功能的僅有以“中醫(yī)藥古文獻(xiàn)知識庫”為代表的少數(shù)幾種。萬方醫(yī)學(xué)網(wǎng)的“中醫(yī)藥系統(tǒng)”號稱“可以從癥狀、體征和證候檢索到其與什么疾病相關(guān),可查到同時包含幾味中藥、治療疾病的方劑群,可查到具有某種功效、性味、歸經(jīng)、藥理作用的中藥,包含有具有君臣佐使、方劑以及配伍等信息的經(jīng)典方;方劑數(shù)據(jù)庫中含有病癥對應(yīng)關(guān)系的經(jīng)典方與方劑歌訣,整理了方劑中加減中藥與癥的關(guān)系”[11],但該知識系統(tǒng)主要是整合了萬方醫(yī)學(xué)網(wǎng)的相關(guān)資源,并沒有完全達(dá)到知識組織的層面。中國知網(wǎng)的“中國醫(yī)院知識倉庫”也存在這方面的問題。
1.2.2 缺少音頻、視頻類產(chǎn)品
目前的數(shù)字化中醫(yī)藥信息資源以文字為主,音頻、視頻類產(chǎn)品非常少,代表性資源僅有萬方的“醫(yī)學(xué)視頻數(shù)據(jù)庫”。該數(shù)據(jù)庫雖然解決了權(quán)威性、版權(quán)糾紛等問題,但視頻數(shù)量有限且費(fèi)用較高。單靠看書、閱讀難以參透中醫(yī)藥知識,需要輔以口耳相傳等方式,學(xué)生大部分時間需要自學(xué),視頻與音頻是自學(xué)的重要資源,研發(fā)中醫(yī)藥的音頻與視頻產(chǎn)品可以促進(jìn)中醫(yī)藥繼續(xù)教育的發(fā)展。
1.2.3 資源的可獲取性較低
非公開獲取與收費(fèi)服務(wù)削弱了信息的可獲取性。目前權(quán)威、綜合的數(shù)字化資源多是收費(fèi)服務(wù),數(shù)字圖書館則除了收費(fèi)之外,還需要安裝特殊的閱讀器,這都影響了資源的可獲取性。該問題主要有兩方面的原因:一是研發(fā)這些數(shù)字化產(chǎn)品的多為商業(yè)機(jī)構(gòu),收費(fèi)服務(wù)是其生存的必然要求;二是技術(shù)標(biāo)準(zhǔn)尚未統(tǒng)一,目前電子期刊基本上采用CAJ或PDF閱讀器,電子圖書出版商多使用自身的閱讀器。數(shù)字化產(chǎn)品技術(shù)標(biāo)準(zhǔn)的不統(tǒng)一容易導(dǎo)致用戶放棄使用。
加強(qiáng)中醫(yī)藥信息資源的深度開發(fā),是中醫(yī)藥信息資源數(shù)字化建設(shè)的當(dāng)務(wù)之急。今后中醫(yī)藥信息資源的數(shù)字化建設(shè)應(yīng)該從中醫(yī)藥文獻(xiàn)的分類與匯總轉(zhuǎn)向智能分析。一是整理、評估現(xiàn)有資源。目前各建設(shè)機(jī)構(gòu)的資源之間存在孤立的現(xiàn)象,首先要整理自身的資源。在此基礎(chǔ)上,對其產(chǎn)品進(jìn)行相應(yīng)的質(zhì)量評估,以確定進(jìn)一步開發(fā)的對象。中醫(yī)藥信息資源的深度開發(fā)是一項(xiàng)大工程,各單位由于人力和財(cái)力的限制,需要有選擇地進(jìn)行深度開發(fā)。二是加強(qiáng)中醫(yī)藥信息資源數(shù)字化的理論研究。中醫(yī)藥與現(xiàn)代科技的融合尚有不少理論問題需要解決,中醫(yī)學(xué)的知識結(jié)構(gòu)、知識表示、知識獲取等理論尚未取得實(shí)質(zhì)性的突破,這制約了中醫(yī)藥信息資源的深度開發(fā)。以中醫(yī)藥本體研究為例,中醫(yī)藥本體的構(gòu)建非常復(fù)雜,僅國家知識基礎(chǔ)設(shè)施(CNKI)課題中,中醫(yī)本體劃分就有中醫(yī)診斷方法、中醫(yī)術(shù)語、中醫(yī)證、中醫(yī)脈象、中醫(yī)病機(jī)等30多個中醫(yī)本體類[12]。每一類本體的構(gòu)建都只能從其子領(lǐng)域進(jìn)行,工作量巨大。雖然有人進(jìn)行了基于歷史文獻(xiàn)的中醫(yī)藥本體的自動構(gòu)建研究[13],但其研究進(jìn)展較為緩慢,理論的滯后制約了應(yīng)用的發(fā)展。
各單位要在了解自身優(yōu)劣勢的基礎(chǔ)上,開發(fā)具有特色的數(shù)字化資源。如在教學(xué)視頻建設(shè)方面,中醫(yī)藥高校具有一定的優(yōu)勢,可攝制更多權(quán)威性、高品質(zhì)的中醫(yī)藥課程教學(xué)視頻。在道地藥材的數(shù)字化建設(shè)方面,各地區(qū)的信息資源建設(shè)機(jī)構(gòu)無疑具有先天的優(yōu)勢。
任何資源只有用戶使用才能顯示價值。用戶的閱讀習(xí)慣、信息需求、知識獲取行為等在不斷變化,需要我們充分了解。只有做好用戶研究工作,才能開發(fā)出用戶需要的產(chǎn)品。
中醫(yī)藥信息資源數(shù)字化能使中醫(yī)藥的海量信息得到全面、高效的存儲、采集、利用,有利于中醫(yī)藥知識的傳播。目前,我國中醫(yī)藥信息資源數(shù)字化建設(shè)已經(jīng)取得了一定成就,促進(jìn)了中醫(yī)藥事業(yè)發(fā)展,但由于中醫(yī)藥信息資源的特殊性,今后的數(shù)字化建設(shè)需要加強(qiáng)資源開發(fā)深度,做好用戶研究工作,并注重特色資源的建設(shè)。