郜 巒,王振國,張豐聰
(1.山東中醫(yī)藥大學中醫(yī)文獻研究所 濟南 250355;2.安徽中醫(yī)藥大學中醫(yī)臨床學院 合肥 230038)
近年來,隨著“大數(shù)據(jù)時代”的來臨,大數(shù)據(jù)的理念與技術(shù)應用于中醫(yī)藥領域的研究逐步開展。在中國,海量的中醫(yī)藥領域數(shù)據(jù)日益劇增[1],大數(shù)據(jù)技術(shù)的逐漸成熟也為中醫(yī)藥領域的數(shù)據(jù)分析帶來了新的思路,如何充分利用好積累的數(shù)據(jù)和信息,并把數(shù)據(jù)和信息的分析提升到前所未有的高度,是大數(shù)據(jù)時代的重大挑戰(zhàn)。
中醫(yī)學術(shù)流派是中醫(yī)學術(shù)發(fā)展與理論創(chuàng)新的重要形式,是中醫(yī)學發(fā)展史上的一個鮮明特色。不同的地域形成了不同的學術(shù)流派,其間的相互爭鳴與滲透,又進一步促進了中醫(yī)學術(shù)的發(fā)展,最終形成了中醫(yī)學“一源多流”的發(fā)展格局。
當前,中醫(yī)學術(shù)流派數(shù)據(jù)具有異構(gòu)性、廣分布、多樣性、海量性等特點。本文在既往研究的基礎上,以地域性中醫(yī)流派為切入點,探討在大數(shù)據(jù)背景下地域性中醫(yī)學術(shù)流派研究的思路和方法。
在信息日益普遍化的今天,正在興起的大數(shù)據(jù)技術(shù)革命為中醫(yī)藥走向現(xiàn)代化提供了有效的技術(shù)手段[2,3]。大數(shù)據(jù),即通過高速捕捉、發(fā)現(xiàn)或分析,從大容量數(shù)據(jù)中獲取價值的一種新的技術(shù)架構(gòu),具有大量(volume)、高速(velocity)、多樣(variety)、價值(value)等“4V”特點[4]。大數(shù)據(jù)技術(shù)革命給中醫(yī)的現(xiàn)代化帶來了前所未有的機遇,中醫(yī)藥信息具有模糊性和經(jīng)驗性的特點,有了大數(shù)據(jù)技術(shù),中醫(yī)藥信息的數(shù)據(jù)化和現(xiàn)代化就有了走向現(xiàn)實的可能性[5]。如何從凌亂、無模式和復雜的大數(shù)據(jù)中挖掘出有用的知識,需要使用到多種方法來實現(xiàn)數(shù)據(jù)的挖掘和處理,包括:機器學習與數(shù)據(jù)挖掘算法(關聯(lián)規(guī)則、決策樹、模糊理論、粗糙集、人工神經(jīng)網(wǎng)絡及遺傳算法等)、預測性分析、可視化分析、語義引擎、知識計算等[6-10]。
大數(shù)據(jù)時代技術(shù)的逐漸成熟也為中醫(yī)藥領域的數(shù)據(jù)分析帶來了新的思路,已經(jīng)廣泛運用到中醫(yī)藥文獻數(shù)據(jù)、中醫(yī)診斷客觀化數(shù)據(jù)、中藥及復方數(shù)據(jù)、中醫(yī)臨床數(shù)據(jù)等領域的相關研究。
中醫(yī)學在其歷史悠久的發(fā)展過程中,積累了海量的中醫(yī)藥文獻資源。如何有效提取非結(jié)構(gòu)化文本中的模式知識,是當前中醫(yī)藥文獻數(shù)據(jù)中需要處理的重要問題。如有研究建立的古今名醫(yī)辨治數(shù)據(jù)庫,將文獻分為古代、近現(xiàn)代、現(xiàn)代三個部分,古代和近現(xiàn)代部分為固態(tài)數(shù)據(jù)庫,現(xiàn)代研究進展部分借鑒云數(shù)據(jù)庫,建立動態(tài)數(shù)據(jù)庫,實現(xiàn)數(shù)據(jù)庫的開放式優(yōu)化[11]。而在中醫(yī)診治過程中,一方面依靠傳統(tǒng)的望、聞、問、切等手段來獲取疾病資料,同時隨著各種新興觸感器,如舌診議、脈診儀、可穿戴設備等出現(xiàn)和應用,以及醫(yī)院信息系統(tǒng)的普及,極大豐富了中醫(yī)診療數(shù)據(jù),如有學者[12]利用人神經(jīng)網(wǎng)絡構(gòu)建了中醫(yī)舌診知識庫等。中藥及復方數(shù)據(jù),更是紛繁復雜,通過分析靈活運用這些龐大、多類別的數(shù)據(jù),可以進一步完善中藥藥性理論、指導中藥復方開發(fā)[13]。中醫(yī)臨床數(shù)據(jù)研究中,有學者正在展開對名老中醫(yī)經(jīng)驗或相關地域流派的數(shù)據(jù)挖掘,獲得其臨床診療及用藥規(guī)律。如有學者對“吳門醫(yī)派”的相關數(shù)據(jù)挖掘,對其相關文獻、辨治特色、臨床經(jīng)驗等方面做了詳細的研究[14]。
在幾千年源遠流長的歷史發(fā)展進程中,中醫(yī)學界涌現(xiàn)出了眾多的醫(yī)學名家和學術(shù)流派[15]。不同中醫(yī)學術(shù)流派之間各種醫(yī)學學說的爭鳴與交融,不斷地補充和深化中醫(yī)藥學的理論體系,也不斷地完善和提高中醫(yī)藥學術(shù)水平和臨床療效,極大地促進了中醫(yī)藥學術(shù)的進步和發(fā)展[16-20]。國家對中醫(yī)學術(shù)流派的研究高度重視,自2006年起,國家中醫(yī)藥管理局設立“中醫(yī)學術(shù)流派研究”科技專項,2008年設立了“中醫(yī)學術(shù)流派研究室”,開展了一系列的研究,2012年12月又從全國500多家單位中遴選公布了第一批64個全國中醫(yī)學術(shù)流派傳承工作室,開啟了從國家層面上集中人力和物力對代表性中醫(yī)學術(shù)流派進行規(guī)范化建設,并對其進行研究、保護和傳承的新階段。
自20世紀七十年代至今,整理、發(fā)掘、研究地域性學術(shù)流派的趨勢已經(jīng)逐步趨向一個新的高潮[19]。目前對地域性學術(shù)流派的整理研究,主要涉及新安醫(yī)派、齊魯醫(yī)派、海派醫(yī)派、錢塘醫(yī)派、孟河醫(yī)派、嶺南醫(yī)派、永嘉醫(yī)派、湖湘醫(yī)派、閩臺醫(yī)派、吳中醫(yī)派、旴江醫(yī)派、御醫(yī)學派等[25]。而自稱流派者,達500多家。近年來每個流派都對自身的發(fā)展歷程進行了梳理,從形成因素、名醫(yī)名著、學術(shù)特色、臨床經(jīng)驗等不同角度展開了論述,發(fā)表了一系列的論文,出版了一系列的著作。
盡管地域性中醫(yī)學術(shù)流派的研究呈現(xiàn)百花齊放的繁榮局面,但仍存在以下幾個問題:①現(xiàn)有研究過分強調(diào)了個性,而忽略了流派之間的共性,學術(shù)流派資源需要深入整合研究;②各個流派的成果都在各個機構(gòu)分散保存,未能實現(xiàn)資源共享和協(xié)作;③各個地域性中醫(yī)學術(shù)流派缺乏統(tǒng)一的評價標準;④各個流派的學術(shù)價值需要進一步挖掘提升。
在大數(shù)據(jù)時代,應賦予流派研究以新的意義。可將大數(shù)據(jù)分析技術(shù)(機器學習與數(shù)據(jù)挖掘算法、預測性分析、可視化分析、語義引擎、知識計算、數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理等)與地域性中醫(yī)學術(shù)流派研究相結(jié)合,對當前散在的多類數(shù)據(jù)源載體中的海量信息和知識進行集中式管理,為中醫(yī)學術(shù)流派大數(shù)據(jù)環(huán)境提供堅實的支撐平臺,并提供高效、高精度的大數(shù)據(jù)分析與挖掘,實現(xiàn)地域性中醫(yī)學術(shù)流派數(shù)據(jù)的資源共享和知識發(fā)現(xiàn)。同時,構(gòu)建“地域性中醫(yī)學術(shù)流派評價方法學體系”中的一級、二級、三級評價要素,期望形成行業(yè)內(nèi)公認的標準和規(guī)范,進而推廣至地域性中醫(yī)學術(shù)流派的評價中。
3.2.1 調(diào)查梳理
針對當前分布于各個機構(gòu)、數(shù)據(jù)庫、知識庫等多類數(shù)據(jù)源載體中的有關中醫(yī)流派的信息和知識進行梳理調(diào)研。
3.2.2 平臺構(gòu)建
搭建hadoop平臺和相關上層應用系統(tǒng)。
3.2.3 知識管理
設計開發(fā)“基于hadoop技術(shù)的地域性中醫(yī)學術(shù)流派知識庫”數(shù)據(jù)平臺,將相關數(shù)據(jù)錄入并規(guī)范統(tǒng)一,數(shù)據(jù)維護包括對數(shù)據(jù)的容錯處理、容災備份,保障平臺數(shù)據(jù)的完整和一致性,實現(xiàn)中醫(yī)學術(shù)流派數(shù)據(jù)的可視化。
3.2.4 數(shù)據(jù)分析
以組件化的形式集成多種數(shù)據(jù)計算與處理模型,其中包括mapredue經(jīng)典并行計算模型,高效的數(shù)據(jù)抽取與查詢組件Hive和Spark SQL,并且可以集成內(nèi)存計算模型spark,對地域性中醫(yī)學術(shù)流派大數(shù)據(jù)進行分析處理。
3.2.5 系統(tǒng)應用
采用模塊化形式,如關聯(lián)計算、知識計算、語義分析、數(shù)據(jù)挖掘、機器學習、預測分析以及豐富的可視化模塊,實現(xiàn)系統(tǒng)應用。提煉不同流派之間的共性規(guī)律,挖掘各個流派的特色診療技術(shù),為臨床診療服務。
3.2.6 評價體系
研究中將遴選主要評價指標,采用專家訪談以及問卷調(diào)查的方法,擬定一級、二級、三級評價要素,構(gòu)建“地域性中醫(yī)學術(shù)流派評價方法學體系”。
3.3.1 數(shù)據(jù)存儲層
數(shù)據(jù)存儲層是整個平臺的基礎,主要功能是通過對分布于各個流派數(shù)據(jù)庫、文獻知識庫、web站點以及各個機構(gòu)中的多源數(shù)據(jù)進行抽取,并統(tǒng)一轉(zhuǎn)化存儲進hadoop集群中?;趆adoop的分布式文件系統(tǒng)hdfs,以及構(gòu)建于之上的hbase分布式數(shù)據(jù)庫對數(shù)據(jù)進行統(tǒng)一組織,并提供高容錯和靈活的拓展性,是平臺的中樞。
3.3.2 數(shù)據(jù)處理分析層
數(shù)據(jù)的處理與分析在平臺中起著管道的作用,主要為上層的業(yè)務應用提供支撐。以組件化的形式集成多種數(shù)據(jù)計算與處理模型。其中包括mapredue經(jīng)典并行計算模型,高效的數(shù)據(jù)抽取與查詢組件Hive和Spark SQL,并且可以集成內(nèi)存計算模型spark。是連接數(shù)據(jù)持久層和業(yè)務應用層的紐帶,并行計算模型保障了對中醫(yī)學術(shù)流派大數(shù)據(jù)快速,高效的處理能力。
3.3.3 業(yè)務應用層
業(yè)務應用層是平臺的關鍵,采用模塊化形式包括各類應用系統(tǒng),數(shù)據(jù)挖掘與機器學習引擎,以及豐富的可視化模塊,這些模塊可以根據(jù)需求靈活組織和拆分,實現(xiàn)中醫(yī)學術(shù)流派數(shù)據(jù)的集成和分析。
3.3.4 平臺架構(gòu)圖
大數(shù)據(jù)時代的來臨,帶來了挑戰(zhàn),也帶來了機遇,為中醫(yī)藥領域的研究打開了新的視角。地域性中醫(yī)學術(shù)流派是中醫(yī)學術(shù)發(fā)展與理論創(chuàng)新的重要形式,是中醫(yī)學發(fā)展史上的一個鮮明特色。然而當前地域性中醫(yī)學術(shù)流派數(shù)據(jù)具有異構(gòu)性、廣分布、多樣性、海量等特點。如果將大數(shù)據(jù)分析技術(shù)應用于地域性中醫(yī)學術(shù)流派研究,無疑能夠?qū)Ξ斍胺稚⒌闹嗅t(yī)流派數(shù)據(jù)實現(xiàn)資源和知識的共享,實現(xiàn)中醫(yī)學術(shù)流派數(shù)據(jù)的多維分析及可視化呈現(xiàn)。多學科方法的應用,豐富了地域性中醫(yī)學術(shù)流派研究方法學的內(nèi)容。而在此基礎上構(gòu)建的“地域性中醫(yī)學術(shù)流派評價方法學體系”,則可以為地域性中醫(yī)學術(shù)流派大數(shù)據(jù)環(huán)境提供一個堅實的支撐平臺,從而推動地域性中醫(yī)學術(shù)流派的傳承與發(fā)展。
1 韓雅麗,付先軍,張豐聰,等.文獻計量學視角的中醫(yī)藥文獻信息化研究現(xiàn)狀探討.世界科學技術(shù)—中醫(yī)藥現(xiàn)代化,2015,17(3):427-433.
2 黃義強.基于Hadoop的中醫(yī)數(shù)據(jù)儲存平臺設計與開發(fā).江西中醫(yī)學院學報,2011,23(6):10-14.
3 黃欣榮,張艷朋.大數(shù)據(jù)技術(shù)與中醫(yī)現(xiàn)代化.中醫(yī)雜志,2014,55(19):1621.
4 張華敏,王永炎.高概念大數(shù)據(jù)時代中醫(yī)理論研究的機遇.中國中醫(yī)基礎醫(yī)學雜志,2015,21(1):4-6.
5 黃欣榮.復雜性科學與中醫(yī).中醫(yī)雜志,2013,54(19):1621-1626.
6 夏于芬,梁光平.大數(shù)據(jù)背景下的中藥現(xiàn)代化.亞太傳統(tǒng)醫(yī)藥,2015,11(21):1-3.
7 何清,李寧,羅文娟,等.大數(shù)據(jù)下的機器學習算法綜述.模式識別與人工智能,2014,27(4):327-336.
8 張艷.大數(shù)據(jù)背景下的生物醫(yī)學信息處理.生命科學儀器,2014,12(10):17-20.
9 張春麗,成彧.大數(shù)據(jù)分析技術(shù)及其在醫(yī)藥領域中的應用.標記免疫分析與臨床,2016,23(3):327-333.
10林子雨,賴永炫,林琛,等.云數(shù)據(jù)庫研究.軟件學報,2012,23(5):1148-1166.
11李婧,吳立旗,童文新,等.基于數(shù)據(jù)挖掘分析《清宮醫(yī)案集成》止咳方藥的應用.中華中醫(yī)藥雜志,2015,30(1):270-273.
12周金海,楊濤,沈大慶,等.基于ANN的中醫(yī)舌診八綱辨證知識庫構(gòu)建與應用.計算機應用研究,2010,27(5):1771-1772.
13楊薇,崔英子,楊海淼.醫(yī)療大數(shù)據(jù)在中醫(yī)藥研究領域的應用與思考.長春中醫(yī)藥大學學報,2016,32(3):625-627.
14楊稅,吳夢婷,李輝.吳門醫(yī)派歷史發(fā)展初探.亞太傳統(tǒng)醫(yī)藥,2016,12(18):16-17.
15馬杰,嚴世蕓.近30年研究歷代中醫(yī)學術(shù)爭鳴之文獻述評.中國中醫(yī)基礎醫(yī)學雜志,2012,18(8):923.
16王琦.沒有新學說就沒有新流派.北京中醫(yī)藥大學學報,2011,34(5):293-297.
17中醫(yī)學術(shù)流派研究課題組.爭鳴與創(chuàng)新:中醫(yī)學術(shù)流派研究.北京:華夏出版社,2011:5.
18宋詠梅,王振國,劉更生.關于當代中醫(yī)學術(shù)流派評價的幾點認識.遼寧中醫(yī)雜志,2011,38(7):1349-1350.
19洪凈,吳厚新.對中醫(yī)學術(shù)流派傳承發(fā)展中一些關鍵性問題的思考.中華中醫(yī)藥雜志,2013,28(6):1641-1643.
20黃政德.論醫(yī)學流派對中醫(yī)學發(fā)展的影響.中醫(yī)雜志,2000,41(1):7-9.