莊建波
(廣東省汕尾市汕尾皮膚醫(yī)院,廣東 汕尾 516600)
中醫(yī)在我國自古以來都是有很重要的地位,它是我國的民族文化遺產(chǎn),由于其具有悠久的歷史和顯著的療效,是對于我國幾千年的醫(yī)藥經(jīng)驗的傳承。在對于中醫(yī)在醫(yī)療實踐中的數(shù)據(jù)進行分析整理,對豐富中醫(yī)的理論體系和推動中醫(yī)的發(fā)展有著重要的作用。數(shù)據(jù)挖掘顧名思義是對于相關(guān)信息的提取過程,把原先不被人所知道卻又真實存在的知識,從數(shù)據(jù)龐大的信息庫中精準的提取出來的過程。所以在進行中醫(yī)藥數(shù)據(jù)分析時使用數(shù)據(jù)挖掘的技術(shù),可以更快速的獲得有效的有價值的數(shù)據(jù)。對中醫(yī)藥數(shù)據(jù)的挖掘是通過相關(guān)算法,對中醫(yī)藥數(shù)據(jù)信息的分析辯證而得出的有用信息知識,從而為我國的中醫(yī)研究提供理論知識支持。
數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中通過相關(guān)算法來獲取其中所隱藏的信息,這一過程也可以稱之為數(shù)據(jù)庫知識發(fā)現(xiàn)。數(shù)據(jù)挖掘的實現(xiàn)是依靠在計算機技術(shù)的情況下,通過統(tǒng)計處理,搜索學習等方法來實現(xiàn)數(shù)據(jù)的獲取。這項技術(shù)的實現(xiàn)難點在于挖掘數(shù)據(jù)時所采用的方法,當下最常用的方法是因子分析、遺傳算法、對應分析、模糊集等。這項技術(shù)的產(chǎn)生在當前最主要用于數(shù)據(jù)倉庫和復雜數(shù)據(jù)類型發(fā)面。
在進行數(shù)據(jù)挖掘時為了提高挖掘信息的效率,常常采用關(guān)聯(lián)規(guī)則這一技術(shù)來進行,關(guān)聯(lián)規(guī)則可以通過對大量數(shù)據(jù)進行分析來獲取所需要的知識,分析出相關(guān)數(shù)據(jù)下的關(guān)聯(lián)性從而可以達到提高挖掘效率。這項技術(shù)產(chǎn)生的原型是通過分析購物籃中的物品,來分析出消費者的購物習慣以此來達到營銷的優(yōu)化。
Apriori算法是一項經(jīng)典的算法。這項算法的核心思想是在進行算法匹配時,要想進行后一步算法的匹配必須先要滿足前一條結(jié)果的絕對一致。這項算法采用了逐層搜索的方法來獲得頻繁項集,在數(shù)據(jù)庫中對于數(shù)據(jù)進行連接剪枝的方法,利用循環(huán)的方法,直到?jīng)]有候選項集為止。因為在進行連接剪枝的過程中會導致項目集的個數(shù)不斷增加,隨后產(chǎn)生的選項集個數(shù)也大大增加,導致了這項算法的運行效率極速降低。由于這些情況的出現(xiàn),對于所出現(xiàn)的問題也加以改進,而且因為Apriori算法對于數(shù)據(jù)的準確挖掘的效率是很高的,相對的使用到的數(shù)據(jù)量對于這項算法來說是不值一提的,所以對于他的運行能力和效率沒有很大的影響,所以Apriori算法在中醫(yī)方劑數(shù)據(jù)方面的挖掘是最常被使用到的。
中醫(yī)治療皮膚科疾病方劑數(shù)據(jù)具有復雜性和多樣性,所以在進行數(shù)據(jù)挖掘時就要做好相對于的數(shù)據(jù)篩選和整理方面的工作。然后對于所收集到的信息進行規(guī)范化的處理并且進行錄入,采用規(guī)范的語言對數(shù)據(jù)進行處理,對采集到的無用信息進行去除,把相應的中藥的名字規(guī)范化。把數(shù)據(jù)挖掘所需要的數(shù)據(jù)通過數(shù)據(jù)預處理的方法將原始數(shù)據(jù)進行轉(zhuǎn)化。
在用Apriori算法進行數(shù)據(jù)挖掘時,得到了以下的結(jié)果,通過對結(jié)果進行分析得到茯苓是在治療皮膚科疾病時被使用的最多的一種中藥,有55%的使用頻率,當歸因為其具有“補血活血,潤腸通便”的功效使用頻率高達47%。而生地黃也因為其“滋陰清熱,涼血補血”的性能以45%的頻率位列第三。而其中生甘草、赤芍、川芎、牡丹皮、黃芩、梔子、澤瀉、防風、紅花等中藥在使用頻率上也是相當?shù)母叩?。由此而言,在進行中醫(yī)治療皮膚科疾病的時候,上述藥材的使用頻率越高說明它們對于疾病的療效是最有用的。在進行數(shù)據(jù)分析的時候發(fā)現(xiàn)出現(xiàn)的頻率越高對于疾病治愈的療效就越強,它們之間是有著必要的聯(lián)系的,所以在以后獲取到數(shù)據(jù)后,更加要注意數(shù)據(jù)所呈現(xiàn)出來的研究意義,這對于后續(xù)中醫(yī)的治療提供更加有價值的信息。
本篇文章內(nèi)容通過Apriori算法對中醫(yī)治療皮膚科疾病的用藥規(guī)律進行了深度的數(shù)據(jù)挖掘,在支持度為20%,置信度為70%的情況下獲取到了適合于皮膚病治療的中藥19味。這項數(shù)據(jù)為中醫(yī)臨床治療皮膚病提供了有利的用藥依據(jù),是有很大的參考價值的。在中醫(yī)用藥方面,單純的依靠用藥頻率并不能直接得出用藥的結(jié)果,所以在后續(xù)的探究中能夠?qū)τ谥嗅t(yī)的用藥規(guī)律有更深層次的探究。