傅 爽,陳素玲,李運(yùn)倫
(1.山東中醫(yī)藥大學(xué)理工學(xué)院,山東 濟(jì)南 250355;2.山東中醫(yī)藥大學(xué)附屬醫(yī)院 心臟內(nèi)科,山東 濟(jì)南 250011
高血壓病又稱原發(fā)性高血壓,是一種常見(jiàn)的心血管疾病,而肝陽(yáng)上亢證是高血壓病最常見(jiàn)的證候類型。中醫(yī)藥在辨證論治高血壓病方面有自身的特色和優(yōu)勢(shì),然而自古至今大部分處方均為各醫(yī)家經(jīng)驗(yàn)用藥,帶有一定的主觀性和片面性。如何集各家所長(zhǎng),又能摒除個(gè)人用藥的偏倚,找到能夠達(dá)到最佳療效的藥物組方,是現(xiàn)今亟待解決的研究課題。數(shù)據(jù)挖掘的許多方法既能借鑒專家意見(jiàn),又能夠盡量消除主觀性等隨機(jī)誤差,所以可以利用其對(duì)用藥規(guī)律進(jìn)行較為科學(xué)的探討。本研究擬利用數(shù)據(jù)挖掘方法,從古今醫(yī)案中探尋中醫(yī)藥治療高血壓病肝陽(yáng)上亢證的用藥規(guī)律。
課題組從高血壓病(眩暈、頭痛)相關(guān)的古今醫(yī)案中搜集到治療高血壓病(眩暈、頭痛)肝陽(yáng)上亢證的處方776篇。由于產(chǎn)地、炮制、用藥部位的不同,即便同一品種的藥物也有不同的藥名,對(duì)此均做了統(tǒng)一處理,“生白芍”、“炒白芍”均作“白芍”,“釣藤”、“吊藤”、“釣鉤藤”、“鉤丁”、“倒掛金鉤”、“鉤耳”、“雙鉤藤”、“鉤藤皮”、“鉤藤莖枝”、“鉤藤鉤子”、“嫩鉤”均作“鉤藤”。在這776篇處方中,共得到藥物252種,從中選取出現(xiàn)頻率較高的藥物53種將其數(shù)字化,出現(xiàn)為“1”,不出現(xiàn)為“0”,并利用SPSS17.0生成數(shù)據(jù)庫(kù)。
單味藥在方劑中出現(xiàn)的頻數(shù)實(shí)際上是中藥常用程度的數(shù)量化標(biāo)準(zhǔn)。先利用 SPSS17.0中的“frequency”命令計(jì)算各藥物出現(xiàn)的頻數(shù)及頻率,將出現(xiàn)頻率大于15%的藥物按頻率高低次序列出。
系統(tǒng)中的屬性并不同等重要,有些甚至是冗余的。屬性約簡(jiǎn)就是在保持系統(tǒng)分類能力不變的條件下,刪除那些不相關(guān)或者不重要的屬性。若將這些屬性刪除,不僅不會(huì)改變決策表的分類或預(yù)測(cè)能力,反而會(huì)提高系統(tǒng)潛在知識(shí)的清晰度。而粗糙集理論〔1〕是處理模糊和不明確問(wèn)題的一種較新的數(shù)學(xué)工具,主要應(yīng)用于研究不完整數(shù)據(jù)、不確定知識(shí)的表達(dá)、學(xué)習(xí)及歸納。它無(wú)需提供問(wèn)題所需處理的數(shù)據(jù)集合之外的任何先驗(yàn)知識(shí)——避免了專家的主觀經(jīng)驗(yàn)。
由于數(shù)據(jù)庫(kù)中的數(shù)據(jù)來(lái)源于古今不同的醫(yī)案,而不同時(shí)期、不同的中醫(yī)都有自己的用藥習(xí)慣,不同的患者除了具有肝陽(yáng)上亢證的癥狀以外還有其他自身所特有的癥狀,所以在第一步利用頻數(shù)分析得到的出現(xiàn)頻率較高的藥物并不一定是對(duì)肝陽(yáng)上亢證的治療起關(guān)鍵作用的藥物,屬性約簡(jiǎn)能在一定程度上摒棄這樣一些隨機(jī)因素,保留實(shí)質(zhì)上重要的屬性,使我們能進(jìn)一步了解到治療肝陽(yáng)上亢證所常用的藥物。
對(duì)采用屬性約簡(jiǎn)以后保留下來(lái)的高頻藥物采用關(guān)聯(lián)規(guī)則的Apriori算法進(jìn)行分析,旨在找出已知和未知的藥對(duì)和藥組。
關(guān)聯(lián)規(guī)則〔2〕是一種簡(jiǎn)單但很實(shí)用的數(shù)據(jù)挖掘方法。關(guān)聯(lián)規(guī)則算法本質(zhì)上是一種對(duì)條件概率、聯(lián)合概率方法的簡(jiǎn)化,并在這個(gè)簡(jiǎn)化過(guò)程中增加了對(duì)數(shù)據(jù)庫(kù)掃描次數(shù)和效率的改進(jìn),從而使算法更加實(shí)用化。本文使用的是Apriori算法,算法利用了頻繁項(xiàng)集的子集必是頻繁項(xiàng)集,非頻繁項(xiàng)集的超集必是非頻繁項(xiàng)集的特點(diǎn)。算法的實(shí)現(xiàn)過(guò)程如下:
(1)通過(guò)單趟掃描事務(wù)數(shù)據(jù)庫(kù)D計(jì)算出所有1-項(xiàng)集的支持度,從而得到滿足最小支持度s%的頻繁1-項(xiàng)集構(gòu)成的集合 L1;(2)為產(chǎn)生k-項(xiàng)集構(gòu)成的集合Lk,先生成一個(gè)候選頻繁 k-項(xiàng)集的集合Ck。若 P,Q ∈ Lk-1,P ={p1,p2,…,pk-1},Q ={q1,q2,…qk-1},并且當(dāng) 1 ≤ i≤ k - 1 時(shí),pi=qi,當(dāng) i=k - 1 時(shí),pk-1≠ qk-1,則 P ∪ Q={p1,p2,…,pk-2,pk-1,qk-1}是候選頻繁 k - 項(xiàng)集的集合 Ck中的元素;(3)由于Ck是Lk的超集,可能有些元素不是頻繁的。由于任何非頻繁的k-1項(xiàng)集必定形不成頻繁k-項(xiàng)集的子集,所以當(dāng)候選k-項(xiàng)集的某個(gè)k-1子集不是Lk-1中的成員時(shí),則該候選頻繁項(xiàng)集不可能是頻繁的,可以從Ck中移去。通過(guò)單趟掃描事務(wù)數(shù)據(jù)庫(kù)D,計(jì)算Ck中各個(gè)項(xiàng)集的支持度,將Ck中不滿足最小支持度s%的項(xiàng)集刪除,形成由頻繁k-項(xiàng)集構(gòu)成的集合Lk;(4)通過(guò)迭代循環(huán),重復(fù)上述步驟(1)~(2),直到不能產(chǎn)生新的頻繁項(xiàng)集的集合為止。
表1顯示,在所收集的776例處方中,按照藥物出現(xiàn)頻數(shù)的高低進(jìn)行排序,出現(xiàn)頻率大于15%的前15味藥物如下:珍珠母、鉤藤、菊花、玄參、茯苓、白芍、黃芩、丹皮、甘草、牛膝、天麻、桑寄生、枸杞、牡蠣和酸棗仁。按照中藥學(xué)的功效分類標(biāo)準(zhǔn)對(duì)其功效進(jìn)行歸類。
表1 藥物出現(xiàn)的頻率和頻率統(tǒng)計(jì)表
表2顯示,采用粗糙集理論Johnson算法對(duì)所收集的776例處方藥物進(jìn)行屬性約簡(jiǎn),約簡(jiǎn)結(jié)果保留了以下16味藥物,即鉤藤、菊花、玄參、珍珠母、黃芩、茯苓、白芍、丹皮、懷牛膝、首烏、當(dāng)歸、龜板、石決明、桑寄生、桑葉和菖蒲,包括平肝潛陽(yáng)藥(鉤藤、菊花、珍珠母、龜板、石決明)、滋補(bǔ)肝腎陰液藥(玄參、白芍、懷牛膝、首烏、桑寄生)、健脾藥(茯苓)、清熱藥(黃芩、丹皮)、養(yǎng)血藥(當(dāng)歸)和祛風(fēng)藥(桑葉)。同時(shí)屬性約簡(jiǎn)結(jié)果還認(rèn)為,在藥物頻次出現(xiàn)較高的前15味藥物中,甘草、天麻、牡蠣、枸杞、酸棗仁并不重要,是可以被約簡(jiǎn)掉的。藥物分布的頻數(shù)分析和基于粗糙集理論的屬性約簡(jiǎn)均認(rèn)為,重要的藥物是珍珠母、鉤藤、菊花、玄參、茯苓、白芍、黃芩、懷牛膝、丹皮、桑寄生,2種數(shù)據(jù)挖掘方法所得出的結(jié)論基本上是吻合的。
3.3.1 藥對(duì)配伍結(jié)果 表2顯示,將以上保留的藥物通過(guò)頻繁項(xiàng)集挖掘出的藥對(duì),按照藥對(duì)出現(xiàn)頻數(shù)的高低進(jìn)行排序,出現(xiàn)頻數(shù)大于25%的藥對(duì)共10組,即:鉤藤 +珍珠母、鉤藤 +菊花、珍珠母 +白芍、珍珠母+菊花、珍珠母+玄參、鉤藤+黃芩、珍珠母+黃芩、珍珠母+茯苓、鉤藤+茯苓、鉤藤+白芍。
3.3.2 3味藥組配伍結(jié)果 表3顯示,將以上保留的藥物通過(guò)頻繁項(xiàng)集挖掘出的3味藥的藥組,按照藥組對(duì)出現(xiàn)頻數(shù)的高低進(jìn)行排序,出現(xiàn)頻數(shù)較高的藥組共8組,即:鉤藤 +珍珠母 +菊花、鉤藤 +珍珠母+黃芩、鉤藤+珍珠母+白芍、珍珠母+白芍+玄參、鉤藤+珍珠母 +茯苓、鉤藤 +菊花 +黃芩、鉤藤+菊花+茯苓、鉤藤+菊花+白芍。
表2 藥對(duì)統(tǒng)計(jì)分析
表3 3味藥組統(tǒng)計(jì)分析
3.3.3 4味藥組配伍結(jié)果 表4顯示,將以上保留的藥物通過(guò)頻繁項(xiàng)集挖掘出的四味藥的藥組,按照藥組對(duì)出現(xiàn)頻數(shù)的高低進(jìn)行排序,出現(xiàn)頻數(shù)較高的藥組共4組,即:鉤藤 +珍珠母 +菊花 +白芍、鉤藤+珍珠母+黃芩+菊花、鉤藤 +珍珠母 +菊花+茯苓、鉤藤+珍珠母+玄參+白芍、珍珠母+玄參+白芍+菊花。
3.3.4 5味藥組配伍結(jié)果 表5顯示,將以上保留的藥物通過(guò)頻繁項(xiàng)集挖掘出的5味藥的藥組,按照藥組對(duì)出現(xiàn)頻數(shù)的高低進(jìn)行排序,出現(xiàn)頻數(shù)較高的藥組共3組,即鉤藤+珍珠母+菊花+白芍+玄參、鉤藤+珍珠母+菊花+白芍+茯苓、鉤藤+珍珠母+菊花+白芍+黃芩。
表4 4味藥組統(tǒng)計(jì)分析
表5 5味藥組統(tǒng)計(jì)分析
數(shù)據(jù)挖掘[2]就是一門(mén)致力于從大量數(shù)據(jù)中提取或“挖掘”知識(shí)的學(xué)科。數(shù)據(jù)挖掘具有分類、估計(jì)與預(yù)測(cè)、聚類、關(guān)聯(lián)和序列發(fā)現(xiàn)、描述等功能。從大量的數(shù)據(jù)中挖掘有價(jià)值的模式或規(guī)律,常應(yīng)用決策樹(shù)理論、人工神經(jīng)網(wǎng)絡(luò)以及關(guān)聯(lián)規(guī)則等,挖掘到的知識(shí)和規(guī)律是否有用,除去相關(guān)領(lǐng)域?qū)<业闹笇?dǎo)和評(píng)價(jià)外,數(shù)據(jù)本身統(tǒng)計(jì)方面的特性也必不可少,特別是對(duì)挖掘到的模式和關(guān)系進(jìn)行解釋和評(píng)價(jià)時(shí),將更多地應(yīng)用到統(tǒng)計(jì)學(xué)的方法和思想。在數(shù)據(jù)挖掘過(guò)程中多種方法交互、混合使用,比單一方法更能有效挖掘出所需要的知識(shí)。
從上面藥味分布的頻數(shù)和知識(shí)約簡(jiǎn)結(jié)果統(tǒng)計(jì)中可以看出,治療高血壓病(眩暈、頭痛)肝陽(yáng)上亢證的藥味達(dá)252味,常用中藥10余味,因此中醫(yī)治療高血壓病(眩暈、頭痛)肝陽(yáng)上亢證組方用藥非常廣泛和靈活,不僅要考慮主癥,還要對(duì)很多兼癥加以辨證用藥。從各味常用藥味的功效來(lái)看,所用的藥類比例輕重有明顯不同,其中以平肝潛陽(yáng)藥和滋陰藥出現(xiàn)的頻率較高,如平肝潛陽(yáng)類藥物(珍珠母、鉤藤、菊花、天麻、牡蠣)共出現(xiàn)1539次/776方,平均1.98次/方,滋補(bǔ)肝腎陰液類藥物(玄參、白芍、枸杞、桑寄生、懷牛膝)共出現(xiàn)1123次/776方,平均1.44次/方,也從側(cè)面反映了高血壓病(頭痛、眩暈)肝陽(yáng)上亢證的“陰虛陽(yáng)亢”病機(jī)特征及證候歸屬。其他健脾藥、清熱藥和安神藥也是治療高血壓病肝陽(yáng)上亢證的常用藥物,是平肝潛陽(yáng)方劑的重要組成部分,如健脾藥(茯苓、甘草)共出現(xiàn)504次/776方,平均0.65次/方,清熱藥(黃芩、丹皮)共出現(xiàn)449次/776方,平均0.59次/方,安神藥(茯苓、棗仁)共出現(xiàn)453次/776方,平均0.58次/方。由此可見(jiàn),潛陽(yáng)藥、滋陰藥、健脾藥、清熱藥和安神藥的遣用是中醫(yī)治療高血壓病(頭痛、眩暈)肝陽(yáng)上亢證的基本配伍規(guī)律。
藥對(duì)或藥組是由2味或2味以上藥物組成,分析藥對(duì)藥組,對(duì)于深入探討治療高血壓病的中藥復(fù)方的配伍規(guī)律有重要意義,特別是通過(guò)關(guān)聯(lián)分析可以找出在臨床上高頻使用而還未載入中醫(yī)書(shū)籍的藥對(duì)和藥組〔3〕。表2、表3顯示,出現(xiàn)頻率大于 25%的10組藥對(duì)中有6組屬于潛陽(yáng)藥配伍潛陽(yáng)藥或潛陽(yáng)藥配伍滋陰藥,出現(xiàn)頻率大于14%的8組藥組中有4組屬于潛陽(yáng)藥配伍潛陽(yáng)藥或潛陽(yáng)藥配伍滋陰藥??梢?jiàn),潛陽(yáng)藥不論是使用次數(shù)還是與其他藥組成的藥對(duì)藥組都占有相當(dāng)大的比率,而同其配伍最多的藥類是潛陽(yáng)藥和滋陰藥。中醫(yī)學(xué)認(rèn)為,高血壓病肝陽(yáng)上亢證的病機(jī)特征陰虛陽(yáng)亢、肝腎陰液虧虛為本,亢陽(yáng)上擾為標(biāo),亢陽(yáng)上擾在高血壓病肝陽(yáng)上亢證的病機(jī)演變中占有特殊重要的地位,治療宜平潛亢陽(yáng)為主兼以滋補(bǔ)陰液〔4〕。因此,潛陽(yáng)藥配伍滋陰藥為主的藥對(duì)藥組是治療高血壓病(頭痛、眩暈)肝陽(yáng)上亢證方劑的基本結(jié)構(gòu)。
高血壓病肝陽(yáng)上亢證的基本病機(jī)是陰虛陽(yáng)亢,而亢陽(yáng)升騰太過(guò)可以化火、生熱,肝陽(yáng)、肝火可以影響脾導(dǎo)致脾氣虧虛,肝陽(yáng)、肝火上擾于心而導(dǎo)致神志不安,因此火熱熾盛、脾氣虧虛和神志不安也是高血壓病肝陽(yáng)上亢證病機(jī)演變的重要內(nèi)容。本研究發(fā)現(xiàn),清熱藥(黃芩、丹皮)、安神藥(棗仁)和健脾藥(茯苓)既是使用頻率比較高的藥物,也是藥對(duì)、藥組中常用的配伍藥物,在潛陽(yáng)、滋陰的基礎(chǔ)上,清火熱、健脾氣、安神志??梢?jiàn),健脾藥、清熱藥和安神藥的配伍既針對(duì)高血壓病肝陽(yáng)上亢證的病機(jī)演變過(guò)程,其配伍與否對(duì)治療效果也有一定的影響,是中醫(yī)治療高血壓病肝陽(yáng)上亢證不可忽視的配伍藥類。
本研究采用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則和鏈接分析工具,對(duì)中醫(yī)治療高血壓病(頭痛、眩暈)肝陽(yáng)上亢證的醫(yī)案進(jìn)行了分析,找到了中醫(yī)治療高血壓病(頭痛、眩暈)肝陽(yáng)上亢證的處方用藥規(guī)律,其結(jié)果與中醫(yī)理論一致,說(shuō)明數(shù)據(jù)挖掘技術(shù)是適合分析中醫(yī)臨床數(shù)據(jù)的一種科學(xué)有效的方法。
[1]張文修,吳偉業(yè),梁吉業(yè).粗糙集理論及方法[M].北京:科學(xué)出版社.2001.78-89.
[2]梁循.數(shù)據(jù)挖掘算法與應(yīng)用[M].北京:北京大學(xué)出版社.2006,56-63.
[3]周魯,周曉芳,李鵬志.中藥復(fù)方治療病毒性心肌炎用藥分析[J].遼寧中醫(yī)雜志.2005,32(8):827-828.
[4]李運(yùn)倫.滋陰潛陽(yáng)法在內(nèi)科雜病中的應(yīng)用[J].山東衛(wèi)生.2004,(5):31-32.