李筱穎,李鴻濤,張偉娜,張磊,王程,佟琳
(中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所 北京 100700)
中醫(yī)古籍是中醫(yī)藥傳承精華的源頭活水。由于中醫(yī)古籍具有文物與應(yīng)用價(jià)值的雙重屬性,傳統(tǒng)保存與利用方式阻礙中醫(yī)古籍知識(shí)的有效利用。中醫(yī)古籍知識(shí)庫通過分析海量數(shù)據(jù)、深度開發(fā)內(nèi)容資源,幫助用戶短時(shí)高效地獲取知識(shí),能夠解決保存與檢索利用之間的矛盾,是實(shí)現(xiàn)中醫(yī)古籍保護(hù)與利用的重要途徑。
中醫(yī)古籍知識(shí)庫的建設(shè)尚處于初級(jí)階段,現(xiàn)有中醫(yī)古籍知識(shí)服務(wù)大多處于理論探討和初步實(shí)踐階段。進(jìn)入21世紀(jì),以大數(shù)據(jù)、云計(jì)算、數(shù)據(jù)挖掘、虛擬現(xiàn)實(shí)等為主要特征的新一代信息技術(shù)蓬勃發(fā)展,多元化、知識(shí)化成為人們獲取信息新的主要特點(diǎn),推動(dòng)古籍?dāng)?shù)字化研究邁進(jìn)以“古籍知識(shí)化”為研究重點(diǎn)的新階段。習(xí)近平總書記強(qiáng)調(diào):“要運(yùn)用現(xiàn)代科技手段加強(qiáng)古代典籍的保護(hù)修復(fù)和綜合利用,深入挖掘古籍蘊(yùn)含的哲學(xué)思想、人文精神、價(jià)值理念、道德規(guī)范,推動(dòng)中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展。”本文采用SWOT-PEST模型,深入分析中醫(yī)古籍知識(shí)庫建設(shè)的自身優(yōu)勢和劣勢,并從政治、經(jīng)濟(jì)、社會(huì)和技術(shù)等維度梳理其發(fā)展的外部機(jī)遇與威脅,針對(duì)性提出應(yīng)對(duì)策略,為中醫(yī)古籍知識(shí)庫建設(shè)提供決策參考。
表1 中醫(yī)古籍知識(shí)庫建設(shè)的SWOT-PEST模型
SWOT-PEST是現(xiàn)代戰(zhàn)略分析與決策制定的系統(tǒng)分析模型。SWOT分析從優(yōu)勢(Strength)、劣勢(Weakness)、機(jī)遇(Opportunity)和威脅(Threat)四個(gè)層面,客觀公正地評(píng)價(jià)組織“內(nèi)部”綜合情況。PEST分析從政策(Politics)、經(jīng)濟(jì)(Economy)、社會(huì)(Society)和技術(shù)(Technique)四個(gè)宏觀因素,對(duì)“外部”環(huán)境因素錯(cuò)綜復(fù)雜進(jìn)行全面深入地剖析。本研究基于SWOT-PEST模型綜合調(diào)查了中醫(yī)古籍知識(shí)庫建設(shè)的內(nèi)部和外部環(huán)境,有效識(shí)別了自身的優(yōu)勢與劣勢,判斷外部的機(jī)會(huì)與威脅,以達(dá)到利用優(yōu)勢把握機(jī)會(huì)、克服劣勢、應(yīng)對(duì)威脅并借助威脅克服劣勢的目的,為提高中醫(yī)古籍知識(shí)庫的應(yīng)用性、解決實(shí)際問題提供借鑒[1-2]。
1.1.1 政策優(yōu)勢
文化、中醫(yī)行業(yè)內(nèi)頒發(fā)了關(guān)于中醫(yī)古籍保護(hù)的系列政策?!吨嗅t(yī)藥發(fā)展戰(zhàn)略規(guī)劃綱要》提出了中醫(yī)藥服務(wù)體系、特色人才隊(duì)伍、傳承創(chuàng)新、產(chǎn)業(yè)和健康服務(wù)業(yè)、開放發(fā)展、治理水平等方面的具體發(fā)展目標(biāo)與提出了15項(xiàng)主要發(fā)展指標(biāo),強(qiáng)調(diào)提升中醫(yī)藥對(duì)公共衛(wèi)生事件的應(yīng)急處理能力。《中醫(yī)藥傳承創(chuàng)新發(fā)展建議》提及完善衛(wèi)生服務(wù)體系,提高對(duì)公眾健康問題的關(guān)注,提高規(guī)范化診療能力?!蛾P(guān)于推進(jìn)新時(shí)代古籍工作的意見》系統(tǒng)規(guī)劃新時(shí)代古籍工作,從總體要求、完善古籍工作體系、提升古籍工作質(zhì)量、加快古籍資源轉(zhuǎn)化利用、強(qiáng)化古籍工作保障五方面進(jìn)行論述,強(qiáng)調(diào)了提高研究水平、推進(jìn)古籍?dāng)?shù)字化、普及傳播、完善法治保障和政策支持等,為中醫(yī)古籍保護(hù)、整理、研究、利用提供了根本遵循。
1.1.2 經(jīng)濟(jì)因素
中醫(yī)藥文化與經(jīng)濟(jì)相互融合,形成了新型的經(jīng)濟(jì)形態(tài),為經(jīng)濟(jì)發(fā)展注入新鮮活力,優(yōu)化了中醫(yī)藥健康服務(wù)理念,成為新的經(jīng)濟(jì)增長點(diǎn)和重要支柱[3]。中醫(yī)藥結(jié)合現(xiàn)代科學(xué)方法,探索中醫(yī)藥文化產(chǎn)業(yè)新業(yè)態(tài),如中醫(yī)智能診斷系統(tǒng),利用信息化銜接遠(yuǎn)程診療,實(shí)現(xiàn)“點(diǎn)對(duì)點(diǎn)”的精確合作,實(shí)現(xiàn)醫(yī)療模式標(biāo)準(zhǔn)化、全過程數(shù)字化,提升基層醫(yī)療的臨床能力及質(zhì)量管控。
1.1.3 社會(huì)因素
知識(shí)庫利用人工智能與數(shù)據(jù)庫技術(shù)高速處理、準(zhǔn)確運(yùn)算,用戶既可以短時(shí)高效地檢索精確信息,又可深入挖掘,實(shí)現(xiàn)全方位、專業(yè)化的關(guān)聯(lián)檢索。遵循中醫(yī)藥發(fā)展規(guī)律,傳承精華,守正創(chuàng)新,深入發(fā)掘中醫(yī)藥寶庫中的精華,充分發(fā)揮中醫(yī)藥的獨(dú)特優(yōu)勢,切實(shí)把祖先留下的寶貴財(cái)富繼承好、發(fā)展好、利用好,讓中醫(yī)古籍薪火相傳,煥發(fā)新的光彩。人們對(duì)健康服務(wù)的需求呈現(xiàn)出多層次、多樣化的特點(diǎn),促使中醫(yī)藥服務(wù)機(jī)構(gòu)依托技術(shù)進(jìn)步和優(yōu)化升級(jí)服務(wù)來滿足人民需求。中醫(yī)藥學(xué)包含著豐富的健康養(yǎng)生理念和實(shí)踐經(jīng)驗(yàn),是中華文明的瑰寶,要堅(jiān)持古為今用,加強(qiáng)古典醫(yī)籍精華的梳理和挖掘,讓中醫(yī)古籍“活起來”,與現(xiàn)代健康理念相融相通,更好地護(hù)佑人民健康。
1.1.4 技術(shù)因素
中醫(yī)古籍知識(shí)庫的輔助功能提升了系統(tǒng)的實(shí)用性,如統(tǒng)計(jì)(頻數(shù)統(tǒng)計(jì)、聚類分析、關(guān)聯(lián)規(guī)則、因子分析)、歷史年表、古今紀(jì)年換算、干支/公元紀(jì)年換算、六十四卦表[4]。數(shù)字化展現(xiàn)古籍原版原貌或?qū)⑥D(zhuǎn)換為結(jié)構(gòu)化文檔,利于重版印刷,通過對(duì)原書進(jìn)行深度標(biāo)引,發(fā)現(xiàn)知識(shí)點(diǎn)間的內(nèi)在關(guān)聯(lián),實(shí)現(xiàn)對(duì)知識(shí)點(diǎn)的檢索。用戶行為智能分析與知識(shí)需求預(yù)測,能夠針對(duì)用戶實(shí)際或潛在的信息需求進(jìn)行推薦,通過個(gè)性化推送(電子郵件、系統(tǒng)消息發(fā)布),向其主動(dòng)提供可能需要但難以獲取的資源,提高知識(shí)的利用率,預(yù)判研究趨勢[5]。計(jì)算機(jī)輔助分詞技術(shù)將人工智能與醫(yī)療行業(yè)相結(jié)合,將含有大量術(shù)語的古籍內(nèi)容,精確分割成有明顯邊界的詞序列,為處理自然語言提供精確的語義,有助于醫(yī)療信息系統(tǒng)的搭建與發(fā)展,實(shí)現(xiàn)從多樣化、異構(gòu)化、碎片化、價(jià)值密度低的海量文本中高效抽取有價(jià)值的信息[6]。
1.2.1 政策因素
目前,我國知識(shí)庫政策研究發(fā)展相對(duì)滯后。宏觀層面多為非強(qiáng)制性政策,倡導(dǎo)學(xué)者在維護(hù)自身及他人合法權(quán)益的基礎(chǔ)上,共享知識(shí)勞動(dòng)成果;機(jī)構(gòu)層面政策相似度高,而識(shí)別度與靈活性低,涉及因素眾多、關(guān)系復(fù)雜,各機(jī)構(gòu)間的政策存在矛盾和抵觸的現(xiàn)象[7]。由于歷史原因、古籍保護(hù)難度大,我國中醫(yī)古籍保護(hù)形勢嚴(yán)峻,存在著認(rèn)知、資金、研究隊(duì)伍、技術(shù)能力不足與保護(hù)條件差等問題,需要政策的支持與推進(jìn)。
1.2.2 經(jīng)濟(jì)因素
持續(xù)的資金投入是知識(shí)庫穩(wěn)定運(yùn)營的保障。軟硬件配置、數(shù)據(jù)管理、系統(tǒng)維護(hù)、服務(wù)提供、平臺(tái)開發(fā)升級(jí)、員工培訓(xùn)等方面均需資金支持。知識(shí)庫建庫資金來源單一,主要由圖書館經(jīng)費(fèi)、國家項(xiàng)目支持,僅滿足前期建設(shè),無法保證其可持續(xù)發(fā)展。
1.2.3 社會(huì)因素
中醫(yī)古籍知識(shí)庫是中醫(yī)學(xué)、統(tǒng)計(jì)學(xué)、文獻(xiàn)學(xué)、目錄學(xué)、版本學(xué)、語義學(xué)、計(jì)算機(jī)與信息科學(xué)等多學(xué)科協(xié)作與交融的知識(shí)生態(tài),能夠?qū)崿F(xiàn)知識(shí)共享、交流與創(chuàng)新的平臺(tái)。若各知識(shí)庫閉門造車,將形成“信息孤島”,造成知識(shí)庫可持續(xù)性差、資源浪費(fèi)、后期維護(hù)成本增高的問題。
1.2.4 技術(shù)因素
信息化是中醫(yī)古籍知識(shí)庫建設(shè)的基礎(chǔ),即將自然語言轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別與理解的結(jié)構(gòu)化語言。中醫(yī)古籍由于病名、藥名、度量衡、字體(繁簡字、異體字、古今字、通假字)未統(tǒng)一,非結(jié)構(gòu)化的知識(shí)制約了信息化的效率與質(zhì)量,文本數(shù)據(jù)加工很大程度上受限于基礎(chǔ)語料庫與術(shù)語詞表的質(zhì)量及中醫(yī)藥知識(shí)關(guān)系的復(fù)雜性,通常必須采用人工審校的方式。當(dāng)前信息化手段以O(shè)CR識(shí)別為主、人工校讀輔助。OCR識(shí)別技術(shù)已相對(duì)成熟,但仍存在識(shí)別度低、標(biāo)注樣本少、錯(cuò)字漏字、識(shí)別豎排繁體字效果不佳、成本高等問題[8]。知識(shí)發(fā)現(xiàn)、關(guān)聯(lián)、推理、組織機(jī)制進(jìn)一步開發(fā)、落地、應(yīng)用、推廣有助于在知識(shí)共享的背景下,提高組織乃至行業(yè)的整體績效[9]。中醫(yī)藥領(lǐng)域缺乏業(yè)界統(tǒng)一認(rèn)可的語義本體,術(shù)語規(guī)范化、術(shù)語分類研究方法、概念間關(guān)系定義、同義詞處理等問題亟待解決[10]。
1.3.1 政策因素
國家政策保障了中醫(yī)藥信息化平穩(wěn)健康發(fā)展,從宏觀層面彌補(bǔ)了知識(shí)庫發(fā)展短板?!爸腥A古籍保護(hù)計(jì)劃”在古籍普查、修復(fù)保護(hù)、數(shù)字化、整理研究、人才培養(yǎng)、推廣普及等方面取得了一系列重要成果?!蛾P(guān)于進(jìn)一步加強(qiáng)古籍保護(hù)工作的意見》采用數(shù)字化、縮微等技術(shù)推進(jìn)古籍整理、出版與利用工作,加強(qiáng)古籍宣傳、開發(fā)特色文獻(xiàn),傳承發(fā)展中華優(yōu)秀傳統(tǒng)文化?!丁笆奈濉敝嗅t(yī)藥信息化發(fā)展規(guī)劃》強(qiáng)調(diào)持續(xù)推進(jìn)中醫(yī)藥業(yè)務(wù)與信息技術(shù)深度融合,促進(jìn)中醫(yī)藥信息化、體系化、集約化、精細(xì)化發(fā)展,完成數(shù)字化、網(wǎng)絡(luò)化、智能化的行業(yè)轉(zhuǎn)型升級(jí),推進(jìn)中醫(yī)古籍的保護(hù)、管理、研究與利用工作?!吨腥A人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要的決議》強(qiáng)調(diào)了中醫(yī)藥傳承保護(hù),實(shí)施中醫(yī)藥古籍文獻(xiàn)和特色技術(shù)傳承專項(xiàng),編纂出版中華醫(yī)藏,建立國家中醫(yī)藥古籍和傳統(tǒng)知識(shí)數(shù)據(jù)圖書館,加強(qiáng)對(duì)名老中醫(yī)學(xué)術(shù)經(jīng)驗(yàn)的活態(tài)傳承,建立中醫(yī)藥傳統(tǒng)知識(shí)數(shù)據(jù)庫、保護(hù)名錄和制度。
1.3.2 經(jīng)濟(jì)因素
用戶是知識(shí)的使用主體,Luca等[11]基于用戶對(duì)知識(shí)庫的體驗(yàn)和評(píng)價(jià)研究,重新設(shè)計(jì)、改善了平臺(tái)界面,既滿足用戶便捷獲取資源的需求,又控制了資源質(zhì)量,提升了知識(shí)利用率。中醫(yī)古籍是傳承發(fā)展中醫(yī)藥學(xué)術(shù)的主要載體,但由于其稀少性、珍貴性、難懂性,多是半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù),不能滿足現(xiàn)代社會(huì)對(duì)信息獲取的需求,難以充分發(fā)揮其價(jià)值[12]。
1.3.3 社會(huì)因素
各異構(gòu)數(shù)據(jù)庫如“孤島”分布,數(shù)據(jù)重復(fù)、失真、冗余,無法提供全面綜合的信息,降低了用戶獲取知識(shí)的效率。大多數(shù)信息系統(tǒng)可實(shí)現(xiàn)共享,需要考慮異構(gòu)數(shù)據(jù)庫之間的數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)添加、數(shù)據(jù)同步更新與共享等問題[13]。中醫(yī)古籍承載著中醫(yī)各家學(xué)術(shù)傳承與臨床經(jīng)驗(yàn)的歷史源流,凝聚了古代先賢的智慧和經(jīng)驗(yàn),是現(xiàn)代中醫(yī)防治疾病、臨床、科研、新藥研發(fā)的重要依據(jù),其中的治法、方藥沿用至今,當(dāng)代依然發(fā)揮實(shí)用價(jià)值,知識(shí)庫能夠連接中醫(yī)古籍信息孤島,促進(jìn)中醫(yī)藥學(xué)術(shù)的活化。
當(dāng)前,中醫(yī)藥優(yōu)質(zhì)醫(yī)療服務(wù)資源總體不足,基層中醫(yī)藥服務(wù)能力較薄弱。中醫(yī)古籍是中醫(yī)學(xué)術(shù)傳承的重要知識(shí)載體,是中醫(yī)學(xué)繼承、發(fā)展、創(chuàng)新的源頭、底氣和信心。中醫(yī)藥提倡“治未病”,滿足人民群眾全方位、多層次、多樣化的健康需求,提升疾病預(yù)防、治療、特色康復(fù)能力,建設(shè)優(yōu)質(zhì)高效服務(wù)體系,帶動(dòng)特色發(fā)展。
名醫(yī)傳承是中醫(yī)學(xué)術(shù)傳承的重要途徑,但多是個(gè)體傳授,周期較長、難以大規(guī)模培養(yǎng)人才、效率較低。名老中醫(yī)的臨床經(jīng)驗(yàn)、診療能力及技巧無法完全通過語言、文字、圖像、符號(hào)等方式表達(dá),多是難以表達(dá)、不易傳授的隱性知識(shí)。通過知識(shí)庫系統(tǒng),使名老中醫(yī)知識(shí)變成組織知識(shí)、隱性知識(shí)轉(zhuǎn)化為顯性知識(shí),通過融合與創(chuàng)新,使顯性知識(shí)成體系,解決了名醫(yī)學(xué)術(shù)傳承中的知識(shí)偏移、遺漏甚至失真等問題,為進(jìn)一步研究提供準(zhǔn)確依據(jù)。
中醫(yī)藥治療新型冠狀病毒肺炎的三方三藥,療效顯著,其中清肺排毒湯,取自《傷寒論》中的麻杏石甘湯、五苓散、小柴胡湯和《金匱要略》中的射干麻黃湯,中醫(yī)古籍知識(shí)仍為現(xiàn)代新藥研發(fā)提供思路。
1.3.4 技術(shù)因素
中醫(yī)古籍?dāng)?shù)字化是挖掘古醫(yī)籍精華的關(guān)鍵,對(duì)中醫(yī)古籍知識(shí)庫建庫的發(fā)展探究具有重要現(xiàn)實(shí)意義,我國古籍?dāng)?shù)字化研究始于20世紀(jì)70年代末,歷經(jīng)了緩慢增長期、加速開拓期、平穩(wěn)發(fā)展期三個(gè)主要發(fā)展階段,從最初的鍵盤文字錄入、圖形掃描、索引編制到大規(guī)模的古籍文獻(xiàn)全文數(shù)據(jù)庫建設(shè),從簡單的古籍題錄信息揭示到應(yīng)用文本挖掘,已取得了階段性成果,為中醫(yī)藥文化傳承和傳播提供了資源保障。
信息技術(shù)有助于深化中醫(yī)古籍的內(nèi)容揭示。數(shù)據(jù)挖掘、信息處理、人工智能等技術(shù),智能化變革助推中醫(yī)古籍?dāng)?shù)字化的深度與廣度,既有對(duì)大數(shù)據(jù)高效管理能力,又有人工智能的知識(shí)演繹推理能力,激發(fā)海量數(shù)據(jù)中蘊(yùn)含的潛在價(jià)值挖掘,提升中醫(yī)古籍內(nèi)容創(chuàng)造性轉(zhuǎn)化利用的深度與層次??梢暬蜗蟮乇磉_(dá)領(lǐng)域概念間關(guān)聯(lián),聯(lián)通分散的知識(shí)資源,由“知識(shí)點(diǎn)”變?yōu)椤爸R(shí)體”展示,支持交互式瀏覽和概念間跳轉(zhuǎn)[14]。將隱性知識(shí)按照一定規(guī)則編碼,實(shí)現(xiàn)知識(shí)體系的有序化,最大限度地解決知識(shí)孤島問題。將知識(shí)倉庫與診斷治療系統(tǒng)集成,在不同的診斷階段推送參考方案,提高基層診療水平。
1.4.1 政策因素
資源發(fā)展規(guī)劃是在一定時(shí)段內(nèi)發(fā)展諸要素、推動(dòng)高質(zhì)量發(fā)展、從而達(dá)到理想效果的綜合規(guī)劃和戰(zhàn)略布局。當(dāng)前,中醫(yī)古籍知識(shí)庫資源發(fā)展規(guī)劃尚不完善,發(fā)展遠(yuǎn)景模糊,缺乏統(tǒng)一的建庫標(biāo)準(zhǔn)與實(shí)施方案,兼容性和集成性差,各自為政、資源封閉,缺乏討論和意見征集,難以得到科研工作者的廣泛認(rèn)同、理解和支持。
1.4.2 經(jīng)濟(jì)因素
經(jīng)費(fèi)問題是知識(shí)庫開展緩慢甚至處于停滯狀態(tài)的重要原因。知識(shí)庫的社會(huì)公益屬性決定了投入產(chǎn)出比較低、市場投入低、營利性不足。中醫(yī)古籍知識(shí)庫建設(shè)多依靠項(xiàng)目經(jīng)費(fèi),對(duì)政府資金依賴性強(qiáng)、資金鏈易斷裂。一旦項(xiàng)目結(jié)題,資助隨之停止,知識(shí)庫建庫則進(jìn)入半停滯狀態(tài),服務(wù)更新迭代無法完成。
1.4.3 社會(huì)因素
獨(dú)立、專業(yè)、公正的知識(shí)庫評(píng)價(jià)有助于調(diào)整與改革知識(shí)庫工作。國內(nèi)中醫(yī)古籍知識(shí)庫建設(shè)質(zhì)量參差不齊,缺乏專業(yè)的技術(shù)指導(dǎo)、可操作性強(qiáng)且適用的評(píng)價(jià)指標(biāo)體系、客觀專業(yè)的第三方評(píng)價(jià)組織,評(píng)價(jià)體系通用性、靈活性和智能化不足,難以保障知識(shí)庫的科學(xué)性與良好的社會(huì)評(píng)價(jià)導(dǎo)向[15]。
1.4.4 技術(shù)因素
中醫(yī)古籍知識(shí)服務(wù)研究多屬于理論探討,缺乏基于調(diào)研與實(shí)證的量化研究。量化研究是一種理論檢驗(yàn)式的研究,客觀揭示知識(shí)庫內(nèi)在運(yùn)行規(guī)律、預(yù)測發(fā)展趨勢、評(píng)價(jià)影響因素,不僅能夠得出“有影響”,更能表示“影響有多大”,有效提升證據(jù)強(qiáng)度。高性能信息處理模型的缺乏也阻礙了中醫(yī)古籍知識(shí)庫的發(fā)展。
當(dāng)前中醫(yī)古籍知識(shí)庫建設(shè)工作機(jī)遇與威脅并存,必須結(jié)合具體情況,提出明確的發(fā)展思路與可操作的建設(shè)策略。
2.1.1 借鑒成功經(jīng)驗(yàn)
參考優(yōu)秀的知識(shí)庫實(shí)踐,借鑒其組織架構(gòu)、服務(wù)體系、運(yùn)行模式等,并結(jié)合自身優(yōu)勢和特點(diǎn),精準(zhǔn)定位,建立適合自身的發(fā)展模式。中醫(yī)養(yǎng)生數(shù)據(jù)庫已實(shí)現(xiàn)對(duì)110種養(yǎng)生古籍的多角度檢索,可瀏覽全文圖片;溫病大成數(shù)據(jù)庫能夠?qū)Α稖夭〈蟪伞?5種古籍進(jìn)行全文檢索、條文閱讀,實(shí)現(xiàn)對(duì)病、癥、方、藥的關(guān)聯(lián)檢索;中醫(yī)藥古代文獻(xiàn)知識(shí)庫經(jīng)過專家解析標(biāo)注,形成以知識(shí)元為關(guān)聯(lián)的知識(shí)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)知識(shí)庫中知識(shí)的有效查詢和發(fā)現(xiàn)[16]。丁侃等[17]將中醫(yī)古籍專題數(shù)據(jù)庫建設(shè)分為定制加工、簡單協(xié)作、深度合作三種模式。
2.1.2 促進(jìn)學(xué)科共建
中醫(yī)古籍知識(shí)與古代哲學(xué)、文學(xué)以及現(xiàn)代科學(xué)技術(shù)緊密相連,古籍知識(shí)庫的構(gòu)建旨在借助新技術(shù)、新理念來實(shí)現(xiàn)傳統(tǒng)學(xué)科拓展和深化,以繼承、跨界、創(chuàng)新為出發(fā)點(diǎn),聚焦同一核心目標(biāo),降低成本投入,實(shí)現(xiàn)降本增效、資源整合、共享與經(jīng)驗(yàn)交流[18],推動(dòng)現(xiàn)代技術(shù)與傳統(tǒng)知識(shí)資源的融合,打造集成集約、互聯(lián)互通、深度融合、共建共享的知識(shí)生態(tài)[19],為知識(shí)發(fā)現(xiàn)、知識(shí)生產(chǎn)提供新思路。
2.1.3 加強(qiáng)宣傳力度
用戶逐漸對(duì)知識(shí)庫有了正向認(rèn)知,但服務(wù)功能有限、資源利用率低等問題仍制約知識(shí)庫發(fā)展。首先,必須優(yōu)化基礎(chǔ)服務(wù),如交互界面應(yīng)簡潔美觀易操作;多種終端無差別訪問;用戶可便捷交流與勘誤反饋;加強(qiáng)系統(tǒng)安全性,增強(qiáng)用戶使用意愿,提升用戶信任感。其次,需加強(qiáng)宣傳,以新媒體為媒介,以熱點(diǎn)話題式營銷與“名人效應(yīng)”為方法,以優(yōu)秀學(xué)者或具有豐富知識(shí)庫使用經(jīng)驗(yàn)的用戶為切入點(diǎn),加強(qiáng)知識(shí)庫宣傳力度,擴(kuò)大影響力。
2.1.4 開展精準(zhǔn)服務(wù)
中醫(yī)古籍知識(shí)庫的構(gòu)建應(yīng)突破中醫(yī)古籍文獻(xiàn)本身的內(nèi)容,面向臨床實(shí)踐和科學(xué)研究的需求,模擬多場景應(yīng)用,針對(duì)??啤n}古籍文獻(xiàn)進(jìn)行深度的知識(shí)挖掘,多場景應(yīng)用驅(qū)動(dòng)中醫(yī)古籍知識(shí)深度利用,構(gòu)建多應(yīng)用場景、特色專題的知識(shí)庫。簡單的文獻(xiàn)信息服務(wù)難以滿足用戶深層次的信息需求,海量的中醫(yī)藥數(shù)據(jù)亟待挖掘利用。在環(huán)境威脅且自身存在劣勢的情況下,中醫(yī)古籍知識(shí)庫需要明確自身定位,應(yīng)用新技術(shù)和新理念來實(shí)現(xiàn)古籍蘊(yùn)涵的原創(chuàng)知識(shí)的提煉、展示與活化利用,開展精準(zhǔn)服務(wù),讓中醫(yī)古籍在“增進(jìn)人民健康福祉”中發(fā)揮更大的作用。專題知識(shí)庫可滿足用戶關(guān)聯(lián)主題導(dǎo)航、垂直檢索信息、便捷了解最新動(dòng)態(tài)等需求,實(shí)現(xiàn)知識(shí)應(yīng)用與創(chuàng)新的良性循環(huán)。中醫(yī)臨床輔助決策系統(tǒng)實(shí)現(xiàn)了病案數(shù)據(jù)化、分析自動(dòng)化和應(yīng)用智能化[20],為診療決策提供參考與優(yōu)化,也為名老中醫(yī)經(jīng)驗(yàn)傳承提供了可行路徑。知識(shí)庫問答系統(tǒng)接收用戶的自然語言提問,使其快速、精確地得到知識(shí)或答案。
2.2.1 發(fā)揮政策作用
政策對(duì)中醫(yī)古籍知識(shí)庫建設(shè)起到重要引導(dǎo)作用,需要綜合考慮我國知識(shí)庫發(fā)展情況,制定長遠(yuǎn)而具體的政策,確保其標(biāo)準(zhǔn)規(guī)范化與正常運(yùn)行,提高用戶參與古籍知識(shí)庫建設(shè)的積極性。首先,應(yīng)健全標(biāo)準(zhǔn)規(guī)范化體系,統(tǒng)籌中醫(yī)古籍?dāng)?shù)字化建設(shè),便于科研工作者對(duì)古籍?dāng)?shù)據(jù)庫的應(yīng)用,實(shí)現(xiàn)中醫(yī)古籍創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展,推動(dòng)集成與創(chuàng)新,豐富和發(fā)展中醫(yī)藥理論與實(shí)踐。其次,應(yīng)宣傳中醫(yī)古籍分級(jí)保護(hù)的理念,提高古籍整理研究能力,提升古籍整理出版水平,帶動(dòng)重要古籍文獻(xiàn)系統(tǒng)性保護(hù)、整理、研究和出版,推廣經(jīng)典古籍。
2.2.2 多方籌集資金
知識(shí)管理須以大規(guī)模投資為基礎(chǔ),維護(hù)其穩(wěn)定運(yùn)行、優(yōu)化知識(shí)生產(chǎn)[21]。應(yīng)鼓勵(lì)知識(shí)庫拓寬應(yīng)用場景,降低服務(wù)成本,實(shí)現(xiàn)持續(xù)優(yōu)化經(jīng)營。同時(shí),鼓勵(lì)科研單位將知識(shí)服務(wù)納入項(xiàng)目經(jīng)費(fèi)規(guī)劃,提高機(jī)構(gòu)或個(gè)人的工作效率[22]。通過多方籌集資金,如公開招標(biāo),聯(lián)合商業(yè)公司承接中醫(yī)古籍知識(shí)庫建庫工作,或多機(jī)構(gòu)聯(lián)合建設(shè),整合多方資源,制定長期計(jì)劃、激勵(lì)機(jī)制與資金支持計(jì)劃,保障知識(shí)庫透明有效地運(yùn)轉(zhuǎn)。
2.2.3 改革人才培養(yǎng)
工作人員是知識(shí)庫具體工作的承擔(dān)者,如組織資源、提供服務(wù)、教育培訓(xùn)、維護(hù)系統(tǒng)、升級(jí)軟硬件等,作為橋梁,還需溝通聯(lián)盟成員與用戶的意見。由于知識(shí)庫的工作重點(diǎn)在服務(wù)而非研究,工作人員無法介入具體研究、準(zhǔn)確感知用戶需求,從而造成知識(shí)庫與用戶間的隔膜[23]。知識(shí)庫應(yīng)積極與具體研究合作,及時(shí)更新職能人員的類型及對(duì)應(yīng)職責(zé),要求其具備信息技術(shù)、知識(shí)產(chǎn)權(quán)、數(shù)據(jù)治理、數(shù)字人文等方面的素養(yǎng)與知識(shí)儲(chǔ)備[24],加強(qiáng)知識(shí)與業(yè)務(wù)的宣傳,提高工作人員的認(rèn)知度和認(rèn)可度,培養(yǎng)工作人員與用戶間的合作伙伴關(guān)系。
2.3.1 建立統(tǒng)一標(biāo)準(zhǔn)
本體、語義網(wǎng)等技術(shù)使得概念更明晰、術(shù)語間關(guān)系更明確,符合中醫(yī)藥知識(shí)體系的形式化表達(dá)、知識(shí)資源語義互聯(lián)與共享應(yīng)用,有助于中醫(yī)知識(shí)資源的關(guān)聯(lián)與集成。以頂層本體為指引,以真實(shí)語料為底層依據(jù),結(jié)合基于語義關(guān)聯(lián)度的主題聚類方法,完成中醫(yī)知識(shí)的收集、抽取、融合,將其文本化、數(shù)據(jù)化、知識(shí)化,通過統(tǒng)一規(guī)范的知識(shí)表達(dá)促進(jìn)共享和重用,提高知識(shí)質(zhì)量。此外,注重?cái)U(kuò)充知識(shí)庫信息,提供多個(gè)異構(gòu)數(shù)據(jù)源整合的關(guān)聯(lián)訪問,實(shí)現(xiàn)整合的資源發(fā)現(xiàn)服務(wù)[25]。由權(quán)威組織或機(jī)構(gòu)牽頭,大力發(fā)展中醫(yī)藥領(lǐng)域本體研究與落地應(yīng)用,實(shí)現(xiàn)語義標(biāo)準(zhǔn)化。2014年國際標(biāo)準(zhǔn)化組織(ISO)已發(fā)布《中醫(yī)藥文獻(xiàn)元數(shù)據(jù)》國際標(biāo)準(zhǔn),為中醫(yī)藥文獻(xiàn)提供了通用的元數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)規(guī)范。
2.3.2 完善更新機(jī)制
知識(shí)內(nèi)容更新是為了融入最新知識(shí)、排除錯(cuò)誤信息,更好地發(fā)揮知識(shí)效能,對(duì)知識(shí)進(jìn)行補(bǔ)充,實(shí)現(xiàn)實(shí)時(shí)更新,使得內(nèi)容更全面準(zhǔn)確。深度學(xué)習(xí)技術(shù)能夠?qū)崿F(xiàn)中醫(yī)古籍知識(shí)庫快速更新,如卷積神經(jīng)模型、循環(huán)神經(jīng)網(wǎng)絡(luò)、長短時(shí)記憶網(wǎng)絡(luò)等技術(shù)。
2.3.3 補(bǔ)充質(zhì)量評(píng)價(jià)
知識(shí)質(zhì)量評(píng)價(jià)是碎片知識(shí)融合與知識(shí)庫構(gòu)建等應(yīng)用的重要環(huán)節(jié)[26]??茖W(xué)的評(píng)價(jià)指標(biāo)體系能夠充分發(fā)揮評(píng)價(jià)功能,從體系化的高度理解知識(shí)庫運(yùn)作,促進(jìn)政策落實(shí)、保證建設(shè)與管理工作科學(xué)化,實(shí)現(xiàn)知識(shí)庫的長效發(fā)展[27]。構(gòu)建評(píng)價(jià)指標(biāo)體系應(yīng)遵循科學(xué)性、系統(tǒng)性、可操作性、面向用戶的原則[28]。鄒金匯等[29]認(rèn)為從服務(wù)效能、業(yè)務(wù)建設(shè)、保障條件三方面評(píng)價(jià)知識(shí)庫建設(shè);李兵等[28]從內(nèi)容、檢索、支持功能和服務(wù)功能四方面評(píng)價(jià)中醫(yī)古籍?dāng)?shù)字化成果;郭翊等[27]提出知識(shí)庫可從知識(shí)獲取效率、自身價(jià)值、教育功能、知識(shí)組織能力、資源、虛擬空間、管理、人員、內(nèi)外部關(guān)系九部分評(píng)價(jià);尤瑞芳等[30]將知識(shí)庫分為檢索功能與成果管理兩個(gè)維度,以政策指南、系統(tǒng)平臺(tái)、存儲(chǔ)內(nèi)容、檢索功能、成果管理、成果評(píng)價(jià)為一級(jí)指標(biāo)進(jìn)行評(píng)價(jià)。
中醫(yī)古籍知識(shí)庫的服務(wù)對(duì)象是中醫(yī)古籍與文獻(xiàn)研究人員、中醫(yī)臨床與科研人員、中醫(yī)專業(yè)學(xué)生,評(píng)價(jià)主體應(yīng)由以上人員組成,加強(qiáng)評(píng)價(jià)結(jié)果反饋,提高知識(shí)庫建設(shè)質(zhì)量。
2.4.1 改進(jìn)基礎(chǔ)架構(gòu)
知識(shí)庫服務(wù)體系必須基于用戶的信息需求,整合優(yōu)化現(xiàn)有資源,為用戶提供技術(shù)、工具和方法支持[18]。知識(shí)庫的基礎(chǔ)架構(gòu)包括指導(dǎo)思想、落實(shí)規(guī)范與日常運(yùn)行?!爸笇?dǎo)思想”,即確定“建設(shè)什么樣的知識(shí)庫”、“如何建設(shè)”及“為誰服務(wù)”的根本問題,整體推進(jìn)建庫工作,加強(qiáng)各領(lǐng)域各環(huán)節(jié)的協(xié)同配合;“落實(shí)規(guī)范”保障知識(shí)庫持續(xù)健康發(fā)展,分為支持政策與運(yùn)行政策,包括開放獲取、績效評(píng)價(jià)、經(jīng)費(fèi)、技術(shù)、人員支持及知識(shí)產(chǎn)權(quán)保護(hù)六方面;日常運(yùn)行包括學(xué)術(shù)研究、員工培訓(xùn)、資源提供、學(xué)術(shù)交流等基礎(chǔ)活動(dòng)?;A(chǔ)架構(gòu)的充實(shí)與改進(jìn),將會(huì)帶給用戶更好的使用體驗(yàn)。
2.4.2 優(yōu)化性能模型
知識(shí)庫自下而上分別為數(shù)據(jù)獲取層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)處理層、分析應(yīng)用層、服務(wù)接口層。數(shù)據(jù)獲取層負(fù)責(zé)數(shù)據(jù)采集、篩選與整理;存儲(chǔ)層根據(jù)業(yè)務(wù)特點(diǎn)與應(yīng)用范圍,分層存儲(chǔ)數(shù)據(jù);數(shù)據(jù)處理層將非結(jié)構(gòu)化、半結(jié)構(gòu)化的雜亂數(shù)據(jù)清洗轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),使其操作性、針對(duì)性、系統(tǒng)性更強(qiáng);分析應(yīng)用層根據(jù)用戶需求進(jìn)行數(shù)據(jù)運(yùn)算,創(chuàng)建可視化圖表;服務(wù)接口層提供完善的檢索系統(tǒng),對(duì)分析層導(dǎo)出的數(shù)據(jù)進(jìn)行一站式的查詢調(diào)用,為用戶提供有差別的數(shù)據(jù)服務(wù)。此外,引入負(fù)反饋機(jī)制,可對(duì)性能低、輸出結(jié)果匹配度低等相關(guān)問題進(jìn)行反饋與改善,從而檢查文本信息、圖像信息,或調(diào)試程序、修飾數(shù)據(jù),以達(dá)到推進(jìn)模型優(yōu)化的目的,推進(jìn)知識(shí)庫準(zhǔn)確、高效工作[31-32]。創(chuàng)新利用信息處理技術(shù)、語義本體、知識(shí)圖譜等方法在中醫(yī)古籍知識(shí)發(fā)現(xiàn)與知識(shí)服務(wù)中的應(yīng)用,研發(fā)高性能古籍信息處理模型,實(shí)現(xiàn)內(nèi)容深度加工與整合,基于概念類型、語義關(guān)系等對(duì)知識(shí)進(jìn)行關(guān)聯(lián),立體呈現(xiàn)“理、法、方、藥”知識(shí)內(nèi)容。
2.4.3 加強(qiáng)技術(shù)創(chuàng)新
“知識(shí)”是知識(shí)庫建設(shè)的核心,涵蓋核心知識(shí)界定、知識(shí)組織、知識(shí)發(fā)現(xiàn)以及知識(shí)創(chuàng)新應(yīng)用等。加強(qiáng)知識(shí)聚合、挖掘、轉(zhuǎn)化的技術(shù)創(chuàng)新,活化中醫(yī)古籍知識(shí)。①來源于不同機(jī)構(gòu)、不同專題的資源如同“孤島”分布,難以被有效地利用,需研制符合中醫(yī)古籍資源特點(diǎn)的知識(shí)組織方法,將組織松散、異地分布的異構(gòu)資源進(jìn)行有序化再組織,優(yōu)化知識(shí)表示和知識(shí)組織方式,建立不同專題相通概念的關(guān)聯(lián),實(shí)現(xiàn)一體化獲取和利用,提高知識(shí)重用和共享能力。②中醫(yī)古籍文獻(xiàn)在文字、語言、檢索、開發(fā)等方面存在信息利用障礙,而其中蘊(yùn)含的理、法、方、藥及辨證診治等知識(shí)表示則更為復(fù)雜,針對(duì)中醫(yī)藥傳承發(fā)展特點(diǎn)構(gòu)建中醫(yī)知識(shí)庫,創(chuàng)新知識(shí)表示與挖掘利用方法,突破知識(shí)表示與組織、信息處理、應(yīng)用功能局限等障礙,發(fā)掘歷代醫(yī)家經(jīng)驗(yàn)等隱性知識(shí),輔助服務(wù)臨床與科學(xué)研究。③知識(shí)庫作為運(yùn)用知識(shí)的工具,應(yīng)結(jié)合自身特點(diǎn)、適應(yīng)用戶需求、改進(jìn)現(xiàn)有技術(shù),提高技術(shù)與自身的契合度,實(shí)現(xiàn)科技與古籍的碰撞與融合。促進(jìn)中醫(yī)古籍知識(shí)“四位一體”轉(zhuǎn)化,即隱性知識(shí)向顯性轉(zhuǎn)化、傳統(tǒng)經(jīng)驗(yàn)知識(shí)向現(xiàn)代知識(shí)轉(zhuǎn)化、醫(yī)學(xué)專業(yè)知識(shí)向普適性知識(shí)轉(zhuǎn)化、疾病知識(shí)向健康知識(shí)轉(zhuǎn)化。
基于SWOT-PEST模型,分析了中醫(yī)古籍知識(shí)庫建設(shè)的內(nèi)部與外部環(huán)境,針對(duì)性提出政策引導(dǎo)、優(yōu)化模型、借鑒經(jīng)驗(yàn)、促進(jìn)共建、擴(kuò)大宣傳、精準(zhǔn)服務(wù)、培養(yǎng)人才、技術(shù)創(chuàng)新、補(bǔ)充評(píng)價(jià)等策略,為中醫(yī)古籍知識(shí)庫建設(shè)提供參考。隨著知識(shí)經(jīng)濟(jì)的發(fā)展,中醫(yī)藥研究呈現(xiàn)出多學(xué)科、行業(yè)共建、古今知識(shí)互融的研究趨勢。推進(jìn)中醫(yī)古籍的知識(shí)服務(wù)是中醫(yī)藥文獻(xiàn)領(lǐng)域研究的重要目標(biāo)和方向,如何有效開發(fā)、利用中醫(yī)古籍知識(shí)庫,還需深入的理論探討與實(shí)踐。