胡綠慧 任玉蘭
摘要:針灸腧穴規(guī)律在針灸臨床治療中起著十分重要的作用,針對(duì)古今針灸臨床治療方案數(shù)據(jù)量大、關(guān)聯(lián)性強(qiáng)的特點(diǎn),運(yùn)用關(guān)聯(lián)分析中的Apriori算法,結(jié)合針灸學(xué)科特點(diǎn)和臨床診治規(guī)律,將經(jīng)過(guò)篩選轉(zhuǎn)換的數(shù)據(jù)在Weka平臺(tái)中分析,充分利用其中的類和可視化功能,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果。實(shí)驗(yàn)結(jié)果表明,基于WEKA的關(guān)聯(lián)規(guī)則挖掘技術(shù)能有效的為針灸腧穴規(guī)律研究提供信息支持。
關(guān)鍵詞: Weka;針灸腧穴規(guī)律;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)07-1361-03
針灸學(xué)是以中醫(yī)理論為指導(dǎo),在繼承和發(fā)揚(yáng)古代針灸學(xué)術(shù)思想和實(shí)踐經(jīng)驗(yàn)的基礎(chǔ)之上,運(yùn)用傳統(tǒng)和現(xiàn)代科學(xué)技術(shù)研究經(jīng)絡(luò)、腧穴、操作技能、治療法則、作用機(jī)制和防治疾病的一門(mén)學(xué)科,作為中醫(yī)學(xué)科體系中最具特色和優(yōu)勢(shì)的學(xué)科,以其獨(dú)特的治療方法和卓越的臨床療效得到了國(guó)內(nèi)外廣泛關(guān)注和高度重視。臨床上,由腧穴、施術(shù)方法和治療時(shí)間組成的針灸處方是實(shí)現(xiàn)針灸療效的重要條件,但在針灸臨床治療決策中,如何選取最優(yōu)化的針灸處方是針灸醫(yī)生面臨的一大難題。隨著信息技術(shù)的發(fā)展,醫(yī)學(xué)信息的迅猛增加,而人腦的儲(chǔ)存和處理信息的能力又有一定的局限性,因此會(huì)對(duì)臨床問(wèn)題的思考、信息的判斷、尋找解決問(wèn)題的辦法和制定臨床治療方案決策造成必然的困擾。
本文針對(duì)針灸臨床治療方案的數(shù)據(jù)特點(diǎn),借鑒循證醫(yī)學(xué)的理念和方法整理、加工、更新以及評(píng)價(jià)古今針灸治療疾病的臨床證據(jù),通過(guò)運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)、管理針灸診斷、治療疾病的古代和現(xiàn)代臨床證據(jù)以及相關(guān)針灸知識(shí),結(jié)合針灸學(xué)科特點(diǎn)和臨床診治規(guī)律;通過(guò)對(duì)關(guān)聯(lián)規(guī)則及相關(guān)算法進(jìn)行分析,將針灸穴位數(shù)據(jù)與關(guān)聯(lián)規(guī)則相結(jié)合,將歷代針灸數(shù)據(jù)在WEKA軟件中進(jìn)行挖掘,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果,從而指導(dǎo)醫(yī)生的臨床治療方案決策。
1 關(guān)聯(lián)規(guī)則挖掘算法
1.1 關(guān)聯(lián)規(guī)則挖掘的基本概念
關(guān)聯(lián)規(guī)則挖掘是指從事務(wù)數(shù)據(jù)庫(kù),關(guān)系數(shù)據(jù)庫(kù)和其他信息存儲(chǔ)中的大量數(shù)據(jù)的項(xiàng)集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關(guān)聯(lián)和相關(guān)性。
1.2 APRIORI算法
經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法是Agrawal R提出的Apriori算法,該算法是利用大項(xiàng)目集的任一子集也一定是大的這一性質(zhì)。使用逐層搜索的迭代方法,利用K項(xiàng)集探索K+1項(xiàng)集,將原始數(shù)據(jù)結(jié)構(gòu)分層。Apriori算法的基本思想是生成特定規(guī)模的候選項(xiàng)目集,然后掃描數(shù)據(jù)庫(kù)并進(jìn)行計(jì)數(shù),以確定這些候選項(xiàng)目集是大的。即掃描一次事務(wù)數(shù)據(jù)庫(kù),找出頻繁1-項(xiàng)集的集合L1,基于L1來(lái)尋找所有可能的候選2-項(xiàng)集集合L2,類似上一步,L2用于尋找 L3,如此循環(huán),直到不能找到頻繁項(xiàng)集。其中,候選項(xiàng)集的生成主要通過(guò)兩個(gè)步驟:連接和剪枝。即在第i趟掃描過(guò)程中,對(duì)候選項(xiàng)目集的集合Ci進(jìn)行計(jì)數(shù),也就是說(shuō)用大項(xiàng)目集的集合Li生成Ci+1。只有一個(gè)項(xiàng)目集的所有子集都是大的,它才被認(rèn)為是一個(gè)候選。為了生成大小為i+1的候選,要對(duì)前一趟掃描發(fā)現(xiàn)的大項(xiàng)目集進(jìn)行連接運(yùn)算。
2 Weka的框架結(jié)構(gòu)
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一個(gè)運(yùn)行于Java平臺(tái)的開(kāi)源系統(tǒng),是現(xiàn)今最完備的數(shù)據(jù)挖掘工具之一。
Weka主要提供了數(shù)據(jù)挖掘的框架結(jié)構(gòu),集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。這些算法一般是直接應(yīng)用于一個(gè)數(shù)據(jù)集上,還可以在其他的Java代碼中調(diào)用。在這些數(shù)據(jù)挖掘算法生成模型時(shí),用戶可以自定義算法的各個(gè)相關(guān)參數(shù),并且可以實(shí)現(xiàn)對(duì)測(cè)試集的驗(yàn)證, 和對(duì)算法的比較。Weka提供了可編程的接口,使我們可以通過(guò)拓展算法來(lái)實(shí)現(xiàn)新的功能,同時(shí)Weka也允許我們通過(guò)調(diào)用它的公用包,在自己的項(xiàng)目中利用包中的算法實(shí)現(xiàn)相應(yīng)的功能。使用WEKA不僅支持本身提供的ARFF格式的數(shù)據(jù),同時(shí)還提供了對(duì)CSV文件的支持,而這種格式是被很多其他軟件所支持的。此外,WEKA還提供了通過(guò)JDBC訪問(wèn)數(shù)據(jù)庫(kù)的功能。
3 Apriori算法在針灸腧穴規(guī)律中的應(yīng)用
在中醫(yī)藥領(lǐng)域,數(shù)據(jù)挖掘技術(shù)已應(yīng)用于中醫(yī)藥數(shù)據(jù)庫(kù)的建立、方劑配伍規(guī)律的研究、名老中醫(yī)經(jīng)驗(yàn)總結(jié)、中醫(yī)藥數(shù)據(jù)規(guī)范處理,以及臨床診斷、療效評(píng)價(jià)、處方分析、圖像識(shí)別等研究。目前,已有不少學(xué)者開(kāi)始將數(shù)據(jù)挖掘技術(shù)利用在臨床診療決策方面,而數(shù)據(jù)挖掘在針灸臨床決策的研究還處于起步階段,研究還比較少,主要是成都中醫(yī)藥大學(xué)的學(xué)者在從事這方面的研究,還有待進(jìn)一步的發(fā)展,使用數(shù)據(jù)挖掘方法來(lái)處理大量的針灸臨床數(shù)據(jù)已顯得十分重要。本研究挖掘工具采用Weka3.7開(kāi)放源代碼平臺(tái),用Apriori方法,以貝爾面癱病例數(shù)據(jù)為例,找出其中的用穴規(guī)律。
3.1 數(shù)據(jù)選擇與處理
對(duì)于古代文獻(xiàn)數(shù)據(jù)參照了《中國(guó)針灸文獻(xiàn)提要》、《中國(guó)醫(yī)籍大辭典》《中國(guó)針灸薈萃·現(xiàn)存針灸醫(yī)籍卷》等書(shū)籍,選取影響范圍較大、傳播范圍廣的著作;對(duì)于現(xiàn)代文獻(xiàn)數(shù)據(jù)采用計(jì)算機(jī)檢索和手工檢索;數(shù)據(jù)以針灸療法治療貝爾面癱1400條醫(yī)案為例,取每條數(shù)據(jù)病名、針灸方法、穴位、療程等字段?,F(xiàn)代數(shù)據(jù)分為篇名、作者、病名、取穴等數(shù)據(jù)項(xiàng)。文獻(xiàn)錄入要保證忠實(shí)原始文獻(xiàn)并進(jìn)行規(guī)范,對(duì)難以規(guī)范需要特殊處理的內(nèi)容填入“備注”項(xiàng)。部分?jǐn)?shù)據(jù)如表1所示。
通過(guò)WEKA平臺(tái)使用關(guān)聯(lián)規(guī)則挖掘結(jié)果得出:針灸治療面癱地倉(cāng)、頰車兩穴使用頻次最高,療效最好。其他具體穴位使用頻次見(jiàn)表2。針灸治療面癱腧穴配伍規(guī)律中,頰車與地倉(cāng)兩穴配伍使用最多,他們的支持度和置信度都達(dá)到最高。具體配伍、置信度見(jiàn)表3。
通過(guò)對(duì)針灸治療面癱數(shù)據(jù)庫(kù)進(jìn)行分析,從用關(guān)聯(lián)規(guī)則挖掘結(jié)果并結(jié)合針灸專業(yè)知識(shí)進(jìn)行分析,其結(jié)果顯示:應(yīng)用針灸療法治療貝爾面癱的經(jīng)絡(luò)腧穴的應(yīng)用有明顯的規(guī)律特征。首先,從腧穴使用頻次分析來(lái)看,重視局部取穴,地倉(cāng)、頰車、陽(yáng)白、合谷、翳風(fēng)等面部穴位的應(yīng)用,體現(xiàn)了“腧穴所在,主治所在”的治療規(guī)律;同時(shí)迎香、下關(guān)、四白等穴位的應(yīng)用也十分常見(jiàn),體現(xiàn)了“經(jīng)脈所過(guò)、主治所及”的治療規(guī)律;其用穴還體現(xiàn)了針灸辯證論治的特點(diǎn)以經(jīng)脈辨治為主,對(duì)經(jīng)脈的選擇中,特別重視對(duì)翳風(fēng)、合谷、風(fēng)池等祛風(fēng)解表穴位的應(yīng)用,體現(xiàn)了對(duì)病因辨證治療的原則。從分析結(jié)果可以看出,循經(jīng)取穴是針灸治療面癱的重要原則,特定穴的運(yùn)用是針灸處方的主要部分,這與針灸理論與臨床實(shí)踐是相符的。
5 結(jié)論
本文以大量針灸文獻(xiàn)為基礎(chǔ),采用關(guān)聯(lián)規(guī)則挖掘方法,得出針灸治療面癱的用穴規(guī)律和配伍規(guī)律,為臨床醫(yī)生的治療方案提供了決策依據(jù)。 數(shù)據(jù)挖掘技術(shù),對(duì)針灸臨床治療文獻(xiàn)海量數(shù)據(jù)的處理和分析有著重要的意義,其結(jié)果將為今后針灸臨床和科研提供新的思路和參考。
參考文獻(xiàn):
[1] 梁繁榮,余曙光,李瑛,等.針灸治療貝爾麻痹臨床多中心隨機(jī)對(duì)照試驗(yàn)研究[J].中醫(yī)雜志,2004,45(8):584.
[2] 馬麗偉.關(guān)聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應(yīng)用[M].南京:南京理工大學(xué),2009.
[3] 宋新葵.一種新的改進(jìn)的Apriori算法[J].微計(jì)算機(jī)信息,2009,12(45):78-81.
[4] Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[J].Advances in Knowledge Discovery and Data Mining,1996:327-328.
[5] Karaboga D,Basturk B.On the performance of Artificial Bee Colony(ABC) algorithm[J].Applied Soft Comprting, 2010,8(1):687-697.
摘要:針灸腧穴規(guī)律在針灸臨床治療中起著十分重要的作用,針對(duì)古今針灸臨床治療方案數(shù)據(jù)量大、關(guān)聯(lián)性強(qiáng)的特點(diǎn),運(yùn)用關(guān)聯(lián)分析中的Apriori算法,結(jié)合針灸學(xué)科特點(diǎn)和臨床診治規(guī)律,將經(jīng)過(guò)篩選轉(zhuǎn)換的數(shù)據(jù)在Weka平臺(tái)中分析,充分利用其中的類和可視化功能,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果。實(shí)驗(yàn)結(jié)果表明,基于WEKA的關(guān)聯(lián)規(guī)則挖掘技術(shù)能有效的為針灸腧穴規(guī)律研究提供信息支持。
關(guān)鍵詞: Weka;針灸腧穴規(guī)律;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)07-1361-03
針灸學(xué)是以中醫(yī)理論為指導(dǎo),在繼承和發(fā)揚(yáng)古代針灸學(xué)術(shù)思想和實(shí)踐經(jīng)驗(yàn)的基礎(chǔ)之上,運(yùn)用傳統(tǒng)和現(xiàn)代科學(xué)技術(shù)研究經(jīng)絡(luò)、腧穴、操作技能、治療法則、作用機(jī)制和防治疾病的一門(mén)學(xué)科,作為中醫(yī)學(xué)科體系中最具特色和優(yōu)勢(shì)的學(xué)科,以其獨(dú)特的治療方法和卓越的臨床療效得到了國(guó)內(nèi)外廣泛關(guān)注和高度重視。臨床上,由腧穴、施術(shù)方法和治療時(shí)間組成的針灸處方是實(shí)現(xiàn)針灸療效的重要條件,但在針灸臨床治療決策中,如何選取最優(yōu)化的針灸處方是針灸醫(yī)生面臨的一大難題。隨著信息技術(shù)的發(fā)展,醫(yī)學(xué)信息的迅猛增加,而人腦的儲(chǔ)存和處理信息的能力又有一定的局限性,因此會(huì)對(duì)臨床問(wèn)題的思考、信息的判斷、尋找解決問(wèn)題的辦法和制定臨床治療方案決策造成必然的困擾。
本文針對(duì)針灸臨床治療方案的數(shù)據(jù)特點(diǎn),借鑒循證醫(yī)學(xué)的理念和方法整理、加工、更新以及評(píng)價(jià)古今針灸治療疾病的臨床證據(jù),通過(guò)運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)、管理針灸診斷、治療疾病的古代和現(xiàn)代臨床證據(jù)以及相關(guān)針灸知識(shí),結(jié)合針灸學(xué)科特點(diǎn)和臨床診治規(guī)律;通過(guò)對(duì)關(guān)聯(lián)規(guī)則及相關(guān)算法進(jìn)行分析,將針灸穴位數(shù)據(jù)與關(guān)聯(lián)規(guī)則相結(jié)合,將歷代針灸數(shù)據(jù)在WEKA軟件中進(jìn)行挖掘,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果,從而指導(dǎo)醫(yī)生的臨床治療方案決策。
1 關(guān)聯(lián)規(guī)則挖掘算法
1.1 關(guān)聯(lián)規(guī)則挖掘的基本概念
關(guān)聯(lián)規(guī)則挖掘是指從事務(wù)數(shù)據(jù)庫(kù),關(guān)系數(shù)據(jù)庫(kù)和其他信息存儲(chǔ)中的大量數(shù)據(jù)的項(xiàng)集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關(guān)聯(lián)和相關(guān)性。
1.2 APRIORI算法
經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法是Agrawal R提出的Apriori算法,該算法是利用大項(xiàng)目集的任一子集也一定是大的這一性質(zhì)。使用逐層搜索的迭代方法,利用K項(xiàng)集探索K+1項(xiàng)集,將原始數(shù)據(jù)結(jié)構(gòu)分層。Apriori算法的基本思想是生成特定規(guī)模的候選項(xiàng)目集,然后掃描數(shù)據(jù)庫(kù)并進(jìn)行計(jì)數(shù),以確定這些候選項(xiàng)目集是大的。即掃描一次事務(wù)數(shù)據(jù)庫(kù),找出頻繁1-項(xiàng)集的集合L1,基于L1來(lái)尋找所有可能的候選2-項(xiàng)集集合L2,類似上一步,L2用于尋找 L3,如此循環(huán),直到不能找到頻繁項(xiàng)集。其中,候選項(xiàng)集的生成主要通過(guò)兩個(gè)步驟:連接和剪枝。即在第i趟掃描過(guò)程中,對(duì)候選項(xiàng)目集的集合Ci進(jìn)行計(jì)數(shù),也就是說(shuō)用大項(xiàng)目集的集合Li生成Ci+1。只有一個(gè)項(xiàng)目集的所有子集都是大的,它才被認(rèn)為是一個(gè)候選。為了生成大小為i+1的候選,要對(duì)前一趟掃描發(fā)現(xiàn)的大項(xiàng)目集進(jìn)行連接運(yùn)算。
2 Weka的框架結(jié)構(gòu)
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一個(gè)運(yùn)行于Java平臺(tái)的開(kāi)源系統(tǒng),是現(xiàn)今最完備的數(shù)據(jù)挖掘工具之一。
Weka主要提供了數(shù)據(jù)挖掘的框架結(jié)構(gòu),集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。這些算法一般是直接應(yīng)用于一個(gè)數(shù)據(jù)集上,還可以在其他的Java代碼中調(diào)用。在這些數(shù)據(jù)挖掘算法生成模型時(shí),用戶可以自定義算法的各個(gè)相關(guān)參數(shù),并且可以實(shí)現(xiàn)對(duì)測(cè)試集的驗(yàn)證, 和對(duì)算法的比較。Weka提供了可編程的接口,使我們可以通過(guò)拓展算法來(lái)實(shí)現(xiàn)新的功能,同時(shí)Weka也允許我們通過(guò)調(diào)用它的公用包,在自己的項(xiàng)目中利用包中的算法實(shí)現(xiàn)相應(yīng)的功能。使用WEKA不僅支持本身提供的ARFF格式的數(shù)據(jù),同時(shí)還提供了對(duì)CSV文件的支持,而這種格式是被很多其他軟件所支持的。此外,WEKA還提供了通過(guò)JDBC訪問(wèn)數(shù)據(jù)庫(kù)的功能。
3 Apriori算法在針灸腧穴規(guī)律中的應(yīng)用
在中醫(yī)藥領(lǐng)域,數(shù)據(jù)挖掘技術(shù)已應(yīng)用于中醫(yī)藥數(shù)據(jù)庫(kù)的建立、方劑配伍規(guī)律的研究、名老中醫(yī)經(jīng)驗(yàn)總結(jié)、中醫(yī)藥數(shù)據(jù)規(guī)范處理,以及臨床診斷、療效評(píng)價(jià)、處方分析、圖像識(shí)別等研究。目前,已有不少學(xué)者開(kāi)始將數(shù)據(jù)挖掘技術(shù)利用在臨床診療決策方面,而數(shù)據(jù)挖掘在針灸臨床決策的研究還處于起步階段,研究還比較少,主要是成都中醫(yī)藥大學(xué)的學(xué)者在從事這方面的研究,還有待進(jìn)一步的發(fā)展,使用數(shù)據(jù)挖掘方法來(lái)處理大量的針灸臨床數(shù)據(jù)已顯得十分重要。本研究挖掘工具采用Weka3.7開(kāi)放源代碼平臺(tái),用Apriori方法,以貝爾面癱病例數(shù)據(jù)為例,找出其中的用穴規(guī)律。
3.1 數(shù)據(jù)選擇與處理
對(duì)于古代文獻(xiàn)數(shù)據(jù)參照了《中國(guó)針灸文獻(xiàn)提要》、《中國(guó)醫(yī)籍大辭典》《中國(guó)針灸薈萃·現(xiàn)存針灸醫(yī)籍卷》等書(shū)籍,選取影響范圍較大、傳播范圍廣的著作;對(duì)于現(xiàn)代文獻(xiàn)數(shù)據(jù)采用計(jì)算機(jī)檢索和手工檢索;數(shù)據(jù)以針灸療法治療貝爾面癱1400條醫(yī)案為例,取每條數(shù)據(jù)病名、針灸方法、穴位、療程等字段?,F(xiàn)代數(shù)據(jù)分為篇名、作者、病名、取穴等數(shù)據(jù)項(xiàng)。文獻(xiàn)錄入要保證忠實(shí)原始文獻(xiàn)并進(jìn)行規(guī)范,對(duì)難以規(guī)范需要特殊處理的內(nèi)容填入“備注”項(xiàng)。部分?jǐn)?shù)據(jù)如表1所示。
通過(guò)WEKA平臺(tái)使用關(guān)聯(lián)規(guī)則挖掘結(jié)果得出:針灸治療面癱地倉(cāng)、頰車兩穴使用頻次最高,療效最好。其他具體穴位使用頻次見(jiàn)表2。針灸治療面癱腧穴配伍規(guī)律中,頰車與地倉(cāng)兩穴配伍使用最多,他們的支持度和置信度都達(dá)到最高。具體配伍、置信度見(jiàn)表3。
通過(guò)對(duì)針灸治療面癱數(shù)據(jù)庫(kù)進(jìn)行分析,從用關(guān)聯(lián)規(guī)則挖掘結(jié)果并結(jié)合針灸專業(yè)知識(shí)進(jìn)行分析,其結(jié)果顯示:應(yīng)用針灸療法治療貝爾面癱的經(jīng)絡(luò)腧穴的應(yīng)用有明顯的規(guī)律特征。首先,從腧穴使用頻次分析來(lái)看,重視局部取穴,地倉(cāng)、頰車、陽(yáng)白、合谷、翳風(fēng)等面部穴位的應(yīng)用,體現(xiàn)了“腧穴所在,主治所在”的治療規(guī)律;同時(shí)迎香、下關(guān)、四白等穴位的應(yīng)用也十分常見(jiàn),體現(xiàn)了“經(jīng)脈所過(guò)、主治所及”的治療規(guī)律;其用穴還體現(xiàn)了針灸辯證論治的特點(diǎn)以經(jīng)脈辨治為主,對(duì)經(jīng)脈的選擇中,特別重視對(duì)翳風(fēng)、合谷、風(fēng)池等祛風(fēng)解表穴位的應(yīng)用,體現(xiàn)了對(duì)病因辨證治療的原則。從分析結(jié)果可以看出,循經(jīng)取穴是針灸治療面癱的重要原則,特定穴的運(yùn)用是針灸處方的主要部分,這與針灸理論與臨床實(shí)踐是相符的。
5 結(jié)論
本文以大量針灸文獻(xiàn)為基礎(chǔ),采用關(guān)聯(lián)規(guī)則挖掘方法,得出針灸治療面癱的用穴規(guī)律和配伍規(guī)律,為臨床醫(yī)生的治療方案提供了決策依據(jù)。 數(shù)據(jù)挖掘技術(shù),對(duì)針灸臨床治療文獻(xiàn)海量數(shù)據(jù)的處理和分析有著重要的意義,其結(jié)果將為今后針灸臨床和科研提供新的思路和參考。
參考文獻(xiàn):
[1] 梁繁榮,余曙光,李瑛,等.針灸治療貝爾麻痹臨床多中心隨機(jī)對(duì)照試驗(yàn)研究[J].中醫(yī)雜志,2004,45(8):584.
[2] 馬麗偉.關(guān)聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應(yīng)用[M].南京:南京理工大學(xué),2009.
[3] 宋新葵.一種新的改進(jìn)的Apriori算法[J].微計(jì)算機(jī)信息,2009,12(45):78-81.
[4] Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[J].Advances in Knowledge Discovery and Data Mining,1996:327-328.
[5] Karaboga D,Basturk B.On the performance of Artificial Bee Colony(ABC) algorithm[J].Applied Soft Comprting, 2010,8(1):687-697.
摘要:針灸腧穴規(guī)律在針灸臨床治療中起著十分重要的作用,針對(duì)古今針灸臨床治療方案數(shù)據(jù)量大、關(guān)聯(lián)性強(qiáng)的特點(diǎn),運(yùn)用關(guān)聯(lián)分析中的Apriori算法,結(jié)合針灸學(xué)科特點(diǎn)和臨床診治規(guī)律,將經(jīng)過(guò)篩選轉(zhuǎn)換的數(shù)據(jù)在Weka平臺(tái)中分析,充分利用其中的類和可視化功能,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果。實(shí)驗(yàn)結(jié)果表明,基于WEKA的關(guān)聯(lián)規(guī)則挖掘技術(shù)能有效的為針灸腧穴規(guī)律研究提供信息支持。
關(guān)鍵詞: Weka;針灸腧穴規(guī)律;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)07-1361-03
針灸學(xué)是以中醫(yī)理論為指導(dǎo),在繼承和發(fā)揚(yáng)古代針灸學(xué)術(shù)思想和實(shí)踐經(jīng)驗(yàn)的基礎(chǔ)之上,運(yùn)用傳統(tǒng)和現(xiàn)代科學(xué)技術(shù)研究經(jīng)絡(luò)、腧穴、操作技能、治療法則、作用機(jī)制和防治疾病的一門(mén)學(xué)科,作為中醫(yī)學(xué)科體系中最具特色和優(yōu)勢(shì)的學(xué)科,以其獨(dú)特的治療方法和卓越的臨床療效得到了國(guó)內(nèi)外廣泛關(guān)注和高度重視。臨床上,由腧穴、施術(shù)方法和治療時(shí)間組成的針灸處方是實(shí)現(xiàn)針灸療效的重要條件,但在針灸臨床治療決策中,如何選取最優(yōu)化的針灸處方是針灸醫(yī)生面臨的一大難題。隨著信息技術(shù)的發(fā)展,醫(yī)學(xué)信息的迅猛增加,而人腦的儲(chǔ)存和處理信息的能力又有一定的局限性,因此會(huì)對(duì)臨床問(wèn)題的思考、信息的判斷、尋找解決問(wèn)題的辦法和制定臨床治療方案決策造成必然的困擾。
本文針對(duì)針灸臨床治療方案的數(shù)據(jù)特點(diǎn),借鑒循證醫(yī)學(xué)的理念和方法整理、加工、更新以及評(píng)價(jià)古今針灸治療疾病的臨床證據(jù),通過(guò)運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)、管理針灸診斷、治療疾病的古代和現(xiàn)代臨床證據(jù)以及相關(guān)針灸知識(shí),結(jié)合針灸學(xué)科特點(diǎn)和臨床診治規(guī)律;通過(guò)對(duì)關(guān)聯(lián)規(guī)則及相關(guān)算法進(jìn)行分析,將針灸穴位數(shù)據(jù)與關(guān)聯(lián)規(guī)則相結(jié)合,將歷代針灸數(shù)據(jù)在WEKA軟件中進(jìn)行挖掘,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果,從而指導(dǎo)醫(yī)生的臨床治療方案決策。
1 關(guān)聯(lián)規(guī)則挖掘算法
1.1 關(guān)聯(lián)規(guī)則挖掘的基本概念
關(guān)聯(lián)規(guī)則挖掘是指從事務(wù)數(shù)據(jù)庫(kù),關(guān)系數(shù)據(jù)庫(kù)和其他信息存儲(chǔ)中的大量數(shù)據(jù)的項(xiàng)集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關(guān)聯(lián)和相關(guān)性。
1.2 APRIORI算法
經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法是Agrawal R提出的Apriori算法,該算法是利用大項(xiàng)目集的任一子集也一定是大的這一性質(zhì)。使用逐層搜索的迭代方法,利用K項(xiàng)集探索K+1項(xiàng)集,將原始數(shù)據(jù)結(jié)構(gòu)分層。Apriori算法的基本思想是生成特定規(guī)模的候選項(xiàng)目集,然后掃描數(shù)據(jù)庫(kù)并進(jìn)行計(jì)數(shù),以確定這些候選項(xiàng)目集是大的。即掃描一次事務(wù)數(shù)據(jù)庫(kù),找出頻繁1-項(xiàng)集的集合L1,基于L1來(lái)尋找所有可能的候選2-項(xiàng)集集合L2,類似上一步,L2用于尋找 L3,如此循環(huán),直到不能找到頻繁項(xiàng)集。其中,候選項(xiàng)集的生成主要通過(guò)兩個(gè)步驟:連接和剪枝。即在第i趟掃描過(guò)程中,對(duì)候選項(xiàng)目集的集合Ci進(jìn)行計(jì)數(shù),也就是說(shuō)用大項(xiàng)目集的集合Li生成Ci+1。只有一個(gè)項(xiàng)目集的所有子集都是大的,它才被認(rèn)為是一個(gè)候選。為了生成大小為i+1的候選,要對(duì)前一趟掃描發(fā)現(xiàn)的大項(xiàng)目集進(jìn)行連接運(yùn)算。
2 Weka的框架結(jié)構(gòu)
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一個(gè)運(yùn)行于Java平臺(tái)的開(kāi)源系統(tǒng),是現(xiàn)今最完備的數(shù)據(jù)挖掘工具之一。
Weka主要提供了數(shù)據(jù)挖掘的框架結(jié)構(gòu),集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化。這些算法一般是直接應(yīng)用于一個(gè)數(shù)據(jù)集上,還可以在其他的Java代碼中調(diào)用。在這些數(shù)據(jù)挖掘算法生成模型時(shí),用戶可以自定義算法的各個(gè)相關(guān)參數(shù),并且可以實(shí)現(xiàn)對(duì)測(cè)試集的驗(yàn)證, 和對(duì)算法的比較。Weka提供了可編程的接口,使我們可以通過(guò)拓展算法來(lái)實(shí)現(xiàn)新的功能,同時(shí)Weka也允許我們通過(guò)調(diào)用它的公用包,在自己的項(xiàng)目中利用包中的算法實(shí)現(xiàn)相應(yīng)的功能。使用WEKA不僅支持本身提供的ARFF格式的數(shù)據(jù),同時(shí)還提供了對(duì)CSV文件的支持,而這種格式是被很多其他軟件所支持的。此外,WEKA還提供了通過(guò)JDBC訪問(wèn)數(shù)據(jù)庫(kù)的功能。
3 Apriori算法在針灸腧穴規(guī)律中的應(yīng)用
在中醫(yī)藥領(lǐng)域,數(shù)據(jù)挖掘技術(shù)已應(yīng)用于中醫(yī)藥數(shù)據(jù)庫(kù)的建立、方劑配伍規(guī)律的研究、名老中醫(yī)經(jīng)驗(yàn)總結(jié)、中醫(yī)藥數(shù)據(jù)規(guī)范處理,以及臨床診斷、療效評(píng)價(jià)、處方分析、圖像識(shí)別等研究。目前,已有不少學(xué)者開(kāi)始將數(shù)據(jù)挖掘技術(shù)利用在臨床診療決策方面,而數(shù)據(jù)挖掘在針灸臨床決策的研究還處于起步階段,研究還比較少,主要是成都中醫(yī)藥大學(xué)的學(xué)者在從事這方面的研究,還有待進(jìn)一步的發(fā)展,使用數(shù)據(jù)挖掘方法來(lái)處理大量的針灸臨床數(shù)據(jù)已顯得十分重要。本研究挖掘工具采用Weka3.7開(kāi)放源代碼平臺(tái),用Apriori方法,以貝爾面癱病例數(shù)據(jù)為例,找出其中的用穴規(guī)律。
3.1 數(shù)據(jù)選擇與處理
對(duì)于古代文獻(xiàn)數(shù)據(jù)參照了《中國(guó)針灸文獻(xiàn)提要》、《中國(guó)醫(yī)籍大辭典》《中國(guó)針灸薈萃·現(xiàn)存針灸醫(yī)籍卷》等書(shū)籍,選取影響范圍較大、傳播范圍廣的著作;對(duì)于現(xiàn)代文獻(xiàn)數(shù)據(jù)采用計(jì)算機(jī)檢索和手工檢索;數(shù)據(jù)以針灸療法治療貝爾面癱1400條醫(yī)案為例,取每條數(shù)據(jù)病名、針灸方法、穴位、療程等字段?,F(xiàn)代數(shù)據(jù)分為篇名、作者、病名、取穴等數(shù)據(jù)項(xiàng)。文獻(xiàn)錄入要保證忠實(shí)原始文獻(xiàn)并進(jìn)行規(guī)范,對(duì)難以規(guī)范需要特殊處理的內(nèi)容填入“備注”項(xiàng)。部分?jǐn)?shù)據(jù)如表1所示。
通過(guò)WEKA平臺(tái)使用關(guān)聯(lián)規(guī)則挖掘結(jié)果得出:針灸治療面癱地倉(cāng)、頰車兩穴使用頻次最高,療效最好。其他具體穴位使用頻次見(jiàn)表2。針灸治療面癱腧穴配伍規(guī)律中,頰車與地倉(cāng)兩穴配伍使用最多,他們的支持度和置信度都達(dá)到最高。具體配伍、置信度見(jiàn)表3。
通過(guò)對(duì)針灸治療面癱數(shù)據(jù)庫(kù)進(jìn)行分析,從用關(guān)聯(lián)規(guī)則挖掘結(jié)果并結(jié)合針灸專業(yè)知識(shí)進(jìn)行分析,其結(jié)果顯示:應(yīng)用針灸療法治療貝爾面癱的經(jīng)絡(luò)腧穴的應(yīng)用有明顯的規(guī)律特征。首先,從腧穴使用頻次分析來(lái)看,重視局部取穴,地倉(cāng)、頰車、陽(yáng)白、合谷、翳風(fēng)等面部穴位的應(yīng)用,體現(xiàn)了“腧穴所在,主治所在”的治療規(guī)律;同時(shí)迎香、下關(guān)、四白等穴位的應(yīng)用也十分常見(jiàn),體現(xiàn)了“經(jīng)脈所過(guò)、主治所及”的治療規(guī)律;其用穴還體現(xiàn)了針灸辯證論治的特點(diǎn)以經(jīng)脈辨治為主,對(duì)經(jīng)脈的選擇中,特別重視對(duì)翳風(fēng)、合谷、風(fēng)池等祛風(fēng)解表穴位的應(yīng)用,體現(xiàn)了對(duì)病因辨證治療的原則。從分析結(jié)果可以看出,循經(jīng)取穴是針灸治療面癱的重要原則,特定穴的運(yùn)用是針灸處方的主要部分,這與針灸理論與臨床實(shí)踐是相符的。
5 結(jié)論
本文以大量針灸文獻(xiàn)為基礎(chǔ),采用關(guān)聯(lián)規(guī)則挖掘方法,得出針灸治療面癱的用穴規(guī)律和配伍規(guī)律,為臨床醫(yī)生的治療方案提供了決策依據(jù)。 數(shù)據(jù)挖掘技術(shù),對(duì)針灸臨床治療文獻(xiàn)海量數(shù)據(jù)的處理和分析有著重要的意義,其結(jié)果將為今后針灸臨床和科研提供新的思路和參考。
參考文獻(xiàn):
[1] 梁繁榮,余曙光,李瑛,等.針灸治療貝爾麻痹臨床多中心隨機(jī)對(duì)照試驗(yàn)研究[J].中醫(yī)雜志,2004,45(8):584.
[2] 馬麗偉.關(guān)聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應(yīng)用[M].南京:南京理工大學(xué),2009.
[3] 宋新葵.一種新的改進(jìn)的Apriori算法[J].微計(jì)算機(jī)信息,2009,12(45):78-81.
[4] Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[J].Advances in Knowledge Discovery and Data Mining,1996:327-328.
[5] Karaboga D,Basturk B.On the performance of Artificial Bee Colony(ABC) algorithm[J].Applied Soft Comprting, 2010,8(1):687-697.