數(shù)據(jù)挖掘(Data Mining)是應用一系列技術(shù)從大型數(shù)據(jù)庫和數(shù)據(jù)倉庫中提取人們事先未知而潛在有用的隱含信息和知識的過程[1]。常用的數(shù)據(jù)挖掘方法主要有關(guān)聯(lián)規(guī)則、人工神經(jīng)網(wǎng)絡(luò)、決策樹及聚類分析等[2]。在醫(yī)學領(lǐng)域,關(guān)聯(lián)規(guī)則常用來發(fā)現(xiàn)數(shù)據(jù)間隱含的關(guān)聯(lián)關(guān)系,如疾病與癥狀間的關(guān)聯(lián)規(guī)則[3]、疾病并發(fā)癥的關(guān)聯(lián)研究[4]、用藥和方劑配伍規(guī)則研究[5]、“病癥-辨證-處方”關(guān)聯(lián)研究[6]、分析藥物間的相互作用[7]、藥品分類和劑型關(guān)聯(lián)分析[8]、癥狀與藥物間的關(guān)聯(lián)關(guān)系[9]及利用關(guān)聯(lián)規(guī)則輔助檢測分析心理健康[10-11]等。近年來,中醫(yī)藥發(fā)展上升為國家戰(zhàn)略,為全面振興中醫(yī)藥,國家先后出臺了一系列政策促進和激勵經(jīng)典名方的現(xiàn)代化開發(fā)、利用和保護。2016年發(fā)布的《中醫(yī)藥發(fā)展戰(zhàn)略規(guī)劃綱要(2016-2030年)》強調(diào),要加強中醫(yī)藥傳統(tǒng)知識保護與技術(shù)挖掘[12]。中醫(yī)藥專利中蘊含著大量有價值的信息,因此本文擬通過對治療濕疹的中醫(yī)藥專利進行關(guān)聯(lián)規(guī)則挖掘分析,探尋其用藥規(guī)律,為濕疹的中醫(yī)藥治療提供客觀依據(jù)。
1.1.1 檢索策略
本文通過檢索國家知識產(chǎn)權(quán)局專利數(shù)據(jù)庫,得到基礎(chǔ)數(shù)據(jù),檢索式為“申請日≥20100101 AND 發(fā)明名稱=(濕疹) AND IPC分類號=(A61K36) AND 關(guān)鍵詞=(方劑 OR 制劑 OR 組合物)”。
1.1.2 數(shù)據(jù)規(guī)范
本文主要參照《中藥大辭典》[13],輔以藥標網(wǎng)的《中國藥典》2015年版為參考,對藥方中的中藥名稱進行規(guī)范化、標準化處理,即異名、俗名等統(tǒng)一修改為中藥正名,如將“生地”統(tǒng)一為“生地黃”,“雙花”統(tǒng)一為“金銀花”等。
1.2.1 關(guān)聯(lián)規(guī)則與關(guān)聯(lián)分析
關(guān)聯(lián)規(guī)則指出現(xiàn)在同一事件中的不同項的相關(guān)性,是形如X→Y的蘊含表達式。關(guān)聯(lián)規(guī)則的強度用支持度和置信度度量。支持度指關(guān)聯(lián)規(guī)則在總體中發(fā)生的頻率,反映規(guī)則出現(xiàn)的頻繁程度;置信度表示構(gòu)成關(guān)聯(lián)規(guī)則的前項集X發(fā)生時,后項集Y的發(fā)生概率[14]。此外,本文引入提升度這一衡量指標,用來表示關(guān)聯(lián)規(guī)則的準確度。提升度指置信度與后項集Y的比值,一般來講,只有當比值大于1時,所產(chǎn)生的規(guī)則才有意義[15]。
1.2.2 Apriori算法
Apriori算法是由Agrawal等人[16]提出的。該算法采用層次順序搜索的迭代方法來完成挖掘工作,具體過程是:首先找出符合支持度所設(shè)閾值的頻繁1-項集,記為L1;在L1的基礎(chǔ)上挖掘頻繁2-項集,記為L2;重復上述步驟直到無法挖掘更多的頻繁K-項集為止。每挖掘一層L1就需要將整個數(shù)據(jù)庫掃描一遍[17]。
1.2.3 具體關(guān)聯(lián)分析流程
摘錄濕疹藥方,將摘錄的藥方按標準篩選后,導入書目共現(xiàn)分析系統(tǒng)[18],對藥用頻次進行統(tǒng)計,生成詞篇矩陣,導出至Excel表格,對數(shù)據(jù)進行轉(zhuǎn)置,設(shè)置真值為T,反之為F,組成藥物事實表。將該表導入到SPSS Clementine 12.0源中的“Excel”節(jié)點,選取字段選項中的“類型”節(jié)點連接到數(shù)據(jù)源,然后將該節(jié)點連接到建模中的“Apriori”節(jié)點以及圖形中的“網(wǎng)絡(luò)”節(jié)點等,形成數(shù)據(jù)流。按順序執(zhí)行數(shù)據(jù)流,得到關(guān)聯(lián)規(guī)則結(jié)果。
本文將國家知識產(chǎn)權(quán)局數(shù)據(jù)庫中檢索到的治療濕疹專利數(shù)據(jù)按照納入、排除標準篩選后,共得藥方497首、藥物1 203味。藥物使用總頻次為5 887次,其中用藥頻次大于50次的藥物共有20味,具體結(jié)果如表1所示。按照使用頻次,前10味藥依次為苦參、黃柏、白鮮皮、地膚子、甘草、蛇床子、防風、金銀花、荊芥、蟬蛻。
表1 高頻藥物頻次頻率
參照《臨床中藥學》[19],按照功效對藥物(頻次≥40)進行分類(表2)。
表2 高頻藥物類別頻次
由表2可知,清熱藥使用頻次高居首位,包含清熱燥濕藥、清熱解毒藥、清熱涼血藥,具有清熱、燥濕、解毒、涼血等功效。有效針對濕疹的病因,是有效治療濕疹最常用的藥類。
解表藥有發(fā)散表邪之功效,依據(jù)主治病證的不同,又有發(fā)散風寒、發(fā)散風熱之別?!鞍W自風而來”“止癢必先疏風”,表證夾濕者,宜選用兼有祛風勝濕作用的解表藥,故諸方又多以防風、荊芥二者相配,以達祛風止癢之功效[20]。
由此可見,核心藥物以清熱藥、解表藥、利濕藥為主,這與該病的清熱、利濕、祛風三大重要治療方法相符合。
濕疹之邪傷陰耗氣,而且多用苦寒藥物,容易傷及脾胃,傷津耗液,陰損及陽,往往導致氣陰兩虛,故而濕疹的治療應以清熱疏風利濕為主,兼顧補虛[21]。
設(shè)置最小支持度及最小置信度閾值,分別為10%、60%,最大前項數(shù)設(shè)為5,按順序執(zhí)行數(shù)據(jù)流,共得到51條藥物關(guān)聯(lián)規(guī)則,提升度均大于1,即所得規(guī)則都有意義。其中關(guān)聯(lián)規(guī)則的含義為:當“→”左側(cè)的藥物出現(xiàn)時,右側(cè)可能會出現(xiàn)的藥物;“置信度”表示當“→”左側(cè)的藥物出現(xiàn)時,右側(cè)藥物出現(xiàn)的概率[22]。
2.3.1 兩味中藥關(guān)聯(lián)規(guī)則
設(shè)置閾值后,一共得到了15條藥對關(guān)聯(lián)規(guī)則 (表3) 。
表3 兩味中藥關(guān)聯(lián)規(guī)則
由表3可知,“黃柏→苦參”這一規(guī)則支持度最高,達到36.22%。二者同屬清熱燥濕藥,苦參藥性苦寒,有清熱燥濕、殺蟲止癢之功效;黃柏性味苦寒,有清熱燥濕兼瀉火解毒之功效。兩味藥相須而用以增強清熱燥濕之功效,提高療效[23]。置信度最高的關(guān)聯(lián)規(guī)則為“蛇床子→苦參”,達到71.76%。
2.3.2 三味中藥關(guān)聯(lián)規(guī)則
設(shè)置閾值后,共得到30條三味中藥關(guān)聯(lián)規(guī)則(表4)。從表4中可知,支持度最高的規(guī)則有“白鮮皮+苦參→地膚子”、“白鮮皮+苦參→黃柏”,達到23.74%;置信度最高的規(guī)則為“地膚子+黃柏→白鮮皮”,達到85.14%。
表4 三味中藥關(guān)聯(lián)規(guī)則
蛇床子,性辛、苦、溫燥,既善燥濕殺蟲,又善祛風,風濕除,蟲被滅,癢自可止,故對濕疹濕瘡療效甚佳。其性溫,尤宜于風寒濕邪所致者。對于郁久化熱或濕熱所致者,須與清熱燥濕解毒之品同用,以防其性溫助熱??鄥ⅰⅫS柏為清熱燥濕藥,白鮮皮為清熱解毒藥。
在表4中,含有蛇床子的規(guī)則為“蛇床子+苦參→黃柏”“蛇床子+黃柏→苦參”“蛇床子+白鮮皮→苦參”“蛇床子+白鮮皮→地膚子”“蛇床子+地膚子→白鮮皮”“蛇床子+地膚子→苦參”,由此可知符合蛇床子用于治療濕疹時的配伍特點。
地膚子,性辛、苦,寒,有清熱利濕、祛風止癢之功效。地膚子能祛除皮膚中濕熱與風邪而止癢,用于濕疹濕瘡、風疹瘙癢,常與白鮮皮、荊芥、蟬蛻等清熱燥濕、祛風止癢藥配伍。由“白鮮皮+苦參→地膚子”“地膚子+苦參→白鮮皮”“地膚子+白鮮皮→苦參”“地膚子+黃柏→白鮮皮”“荊芥+苦參→地膚子”“荊芥+白鮮皮→地膚子”“蟬蛻+白鮮皮→地膚子”關(guān)聯(lián)規(guī)則可知,本文所得藥物關(guān)聯(lián)規(guī)則符合地膚子的配伍特點。
2.3.3 四味中藥關(guān)聯(lián)規(guī)則
設(shè)置閾值后,共得到6條四味中藥關(guān)聯(lián)規(guī)則(表5)。從表5可知,“白鮮皮+黃柏+苦參→地膚子”這一關(guān)聯(lián)規(guī)則支持度最高,達到14.49%;“蛇床子+地膚子+白鮮皮→苦參”這一關(guān)聯(lián)規(guī)則置信度最高,達到78%。
表5 四味中藥關(guān)聯(lián)規(guī)則
2.3.4 藥物關(guān)聯(lián)網(wǎng)狀圖
網(wǎng)狀圖可對數(shù)據(jù)進行可視化挖掘,直觀、形象地反映出藥物之間的關(guān)聯(lián)強度。其中粗線表示強鏈接,細線表示中等鏈接,虛線表示弱鏈接。圖1顯示,與苦參、黃柏、白鮮皮、地膚子等相關(guān)的鏈接較多,與通過Apriori模型挖掘出的藥物關(guān)聯(lián)規(guī)則結(jié)果相似。
圖1 藥物關(guān)聯(lián)網(wǎng)狀圖
本文通過對國家知識產(chǎn)權(quán)局數(shù)據(jù)庫中治療濕疹的方劑進行檢索、挖掘、關(guān)聯(lián)分析,得出在497首方劑中使用頻次超過50次的藥物20種、關(guān)聯(lián)配伍規(guī)則51則。對中藥的關(guān)聯(lián)規(guī)律挖掘多達4味,即4-項集的挖掘分析,并按照功效對藥物(頻次≥40)進行分類,得出治療濕疹的核心藥物以清熱藥、解表藥、利濕藥為主,這與該病的清熱、利濕、祛風三大重要治療方法相符合。
在挖掘出的全部規(guī)則中,支持度最高的為“黃柏→苦參”,達到36.22%,說明黃柏、苦參常兩兩同時出現(xiàn)。該藥對均為清熱燥濕藥,兩味藥相須而用,有助于增強清熱燥濕效果;置信度最高的為“地膚子+黃柏→白鮮皮”,達到85.14%,說明當?shù)啬w子和黃柏被選入藥方使用時,白鮮皮被選入的概率為85.14%,顯示了較為密切的配伍關(guān)系。
在四味中藥關(guān)聯(lián)規(guī)則中,共涉及苦參、黃柏、白鮮皮、地膚子、蛇床子5味中藥,說明這些藥物在治療濕疹中配伍相對固定、較為可靠。每項藥物組合均含有苦參與白鮮皮這兩味藥,所屬范疇分別是清熱燥濕藥、清熱解毒藥,說明治療濕疹的藥方常以清熱藥為主要藥物。
本文通過對高頻藥物藥性及其關(guān)聯(lián)規(guī)律進行分析,得出在治療濕疹時最常使用的配伍藥物,符合濕疹治療的用藥特點,由此驗證了關(guān)聯(lián)規(guī)則分析在中醫(yī)藥方劑專利挖掘中的有效性,為中醫(yī)藥傳統(tǒng)知識保護與技術(shù)挖掘提供了可行性途徑。