王慧敏 龔慶悅 胡孔法 周作建 于興文 邵榮強
摘 ?要: 為了探尋層次聚類在失眠處方用藥分析上的應用情況,進而分析失眠處方的用藥規(guī)律,收集并整理了《方劑大辭典》中主治失眠的處方。對單味藥物的四氣、五味、歸經(jīng)及功效等數(shù)據(jù),根據(jù)單連接、全連接和平均連接這三種不同的相似性度量方法進行層次聚類分析并比較。結果顯示,基于全連接的層次聚類分組最為合理,將性味歸經(jīng)和功效有極大相似度的藥物聚為一類,其聚類結果符合一定的中醫(yī)理論。層次聚類結果客觀地反映了失眠處方中藥物間的關聯(lián)關系,間接體現(xiàn)了失眠用藥的藥物組合規(guī)律,為臨床用藥提供新的研究方法和思路。
關鍵詞: 失眠; 層次聚類; 全連接; 用藥規(guī)律
中圖分類號:TP3-05 ? ? ? ? ?文獻標識碼:A ? ? 文章編號:1006-8228(2020)03-28-04
Analyzing insomnia prescription drugs with hierarchical clustering
Wang Huimin, Gong Qingyue, Hu Kongfa, Zhou Zuojian, Yu Xingwen, Shao Rongqiang
(School of Information and Technology in Nanjing University of Chinese Traditional Medicine, Nanjing, Jiangsu 210023, China)
Abstract: In order to explore the application of hierarchical clustering in the analysis of insomnia prescription medication, and then analyze the medication rules of insomnia prescription, the prescriptions for insomnia in the “Dictionary of Prescriptions” were collected and compiled. The dataset of four natures, five flavors, meridian tropism and efficacy of single-drug was analyzed and compared by hierarchical clustering analysis according to three different similarity measures of single linkage, complete linkage and average linkage. Results show that, the classification by hierarchical clustering with the complete linkage is the most reasonable, the drugs with the great similarity of four natures, five flavors, meridian tropism and efficacy become a cluster, and the clustering results are consistent with certain TCM theory. Hierarchical clustering objectively reflects the relationship between drugs in insomnia prescriptions, indirectly reflects the drug combination rules of insomnia medication, and provides new research methods and ideas for clinical drug use.
Key words: insomnia; hierarchical clustering; complete linkage; medication rules
0 引言
失眠是指即使有合適的睡眠機會和睡眠環(huán)境,依然無法入睡或無法保持睡眠狀態(tài),進而影響日間活動的一種主觀體驗[1]。其癥狀特點有入睡困難、整夜覺醒數(shù)次、醒后意識混沌、日間困乏等。西醫(yī)將失眠歸為睡眠障礙范疇,而中醫(yī)常以“不寐”、“不得臥”、“目不暝”等稱之[2]。經(jīng)臨床研究證明,長期失眠不但會影響人們的日常生活,還會造成一系列的機體損害。臨床上西醫(yī)常使用鎮(zhèn)定催眠類藥物來治療失眠,但這些藥物通常副作用大,依賴性強,不能算作是治療失眠的良方。而中醫(yī)以其獨特的診療方式和中藥所具有的低毒副作用的特質受到廣大患者的青睞。
中醫(yī)對失眠的認識由來已久,最早出現(xiàn)在《黃帝內經(jīng)》中,“衛(wèi)行于陰二十五度,行于陽二十五度,分為晝夜,故氣至陽而起,至陰而止”,這說明營衛(wèi)失調會影響睡眠?!短绞セ莘健分刑岢觯骸胺蚰懱摬坏盟?,是五臟虛邪之氣干淫于心”。中醫(yī)認為,心主神明,心陰不足、心血不足等是導致失眠的主要原因。引起失眠的機制非常復雜,從身體內部結構上看,失眠與五臟的非正常運轉有著密不可分的關系;從外部環(huán)境來看,中醫(yī)講究陰陽調和。除此之外,情志也是影響睡眠的重要因素,如《雜病源流犀燭·不寐多寐源流》中記載“有心膽俱怯,觸事易驚,夢多不祥,虛煩不寐者”。更有研究表明,女性常在更年期時因情緒失調而患有失眠[3]。
鑒于失眠人數(shù)的逐年增長,診治失眠變得越來越重要。中醫(yī)治療失眠的方法主要包括改善睡眠的中藥、針灸、音樂療法等[4-6]。為尋找治療失眠的良方,研究中醫(yī)失眠處方中的用藥規(guī)律顯得尤為重要。不少學者采用關聯(lián)規(guī)則、改進互信息法、復雜熵聚類等數(shù)據(jù)挖掘技術研究失眠處方中的常用藥物、常用藥對等[7-9]。但這些方法多基于對藥物的頻數(shù)分析,以藥物使用的頻次為核心做關聯(lián)分析,并沒有將每種藥物的性味歸經(jīng)及功效這些因素考慮在內。而中藥的這些特質相互影響,相輔相成,才能對相應的癥狀起到有效的治療作用。
本文采用層次聚類算法對失眠處方進行用藥分析。層次聚類是一種基于原型的聚類方法,通過將每一個初始數(shù)據(jù)都視為一個單獨的簇,基于簇與簇之間的相似性而一層一層的聚在一起[10]。層次聚類克服了大多數(shù)聚類需要已知中心點和已知簇類數(shù)量要求的缺點。在中藥研究的藥物分析中,由于每一味藥有其特性,很難將其中一種藥或一種特征設定中心點。而層次聚類可以將每一味藥的性味歸經(jīng)及功效都考慮在內,自發(fā)的根據(jù)內在的相似性聚在一起。
1 材料與方法
1.1 數(shù)據(jù)收集
本研究的數(shù)據(jù)來源于《方劑大辭典》,使用“不寐”、“心神不安”、“心神失養(yǎng)”、“失眠”、“心腎不交”、“不得臥”、“水火不濟”、“臥不安”、“目不暝”等作為檢索詞,篩選出符合中醫(yī)語言定義的失眠組方,所選方劑有明確的藥物組成及其主治功能,治療方法以中藥治療為主且治療有效。將符合標準的藥物名稱、四氣、五味、歸經(jīng)、功效輸入至Excel中進行整理,如表1所示。
1.2 數(shù)據(jù)處理
清洗數(shù)據(jù)以規(guī)范藥物名稱,將多個異名的藥物名稱統(tǒng)一成一個正名,并修改不規(guī)范的藥名。整理方中各藥物的性、味、歸經(jīng)及其功效,以便統(tǒng)計分析。以數(shù)字化的形式對失眠高頻藥物的性、味、歸經(jīng)及功效進行賦值,以便進行藥物的層次聚類分析[11]。對于藥物的性味歸經(jīng)和功效這類字符型的數(shù)據(jù),不便于進行層次聚類分析。所以本文將這些藥物屬性數(shù)據(jù)轉化為布爾類型的數(shù)值,即用0和1組成的字符串來表示單味藥的四氣五味、歸經(jīng)和功效。根據(jù)中藥藥性理論,這四種屬性對于單味藥的影響占比應當不同。因此,本文為四種屬性劃分權重,以示各屬性的重要程度。性味影響歸經(jīng),所以將性、味、歸經(jīng)、功效的比例按3:3:2:2規(guī)定。設置總權重為1,則性、味、歸經(jīng)、功效的權重分別為0.3、0.3、0.2、0.2。
1.3 相似性度量
在層次聚類中,有多種判斷簇間相似性的度量方式。本文采用單連接(single linkage)、全連接(complete linkage)和平均連接(averagelinkage)這三種方式計算簇間的相似性并比較出對于該數(shù)據(jù)解釋性最好的方法。
簇間相似性通過計算簇間距離來衡量。在single-link中,只關注兩個簇彼此最接近的區(qū)域,取兩個簇中最近的兩個數(shù)據(jù)點間的距離作為這兩個簇的距離。也就是說,最近的兩個點之間的距離越小,則這兩個簇之間的相似度就越大。而complete-link恰恰相反,取兩個簇中最遠的兩個數(shù)據(jù)點間的距離作為這兩個簇的距離。顧名思義,average-link介于single-link和complete-link之間,即把兩個簇中的點兩兩的距離全部放在一起求平均值,將平均距離作為這兩個簇的距離。
簇與簇之間的距離采用歐氏距離計算。其定義如下:
該式表示N維空間下兩點之間的距離,x1i表示第一個點的第i維坐標,x2i表示第二個點的第i維坐標。在歐式空間下,通過簇質心或簇內平均點來表示簇,簇之間的距離為質心之間的歐氏距離。
1.4 層次聚類分析
將單味藥的四氣、五味、歸經(jīng)及功效數(shù)據(jù)作為輸入,使每味藥都初始化為一個聚類。根據(jù)上述三種相似性度量方法計算每兩個聚類間的相似度距離,分別生成三種不同的樣本間距離矩陣,以尋找最相似的兩個聚類。再將最相似的兩個聚類化為一個聚類,即用兩個聚類的均值點做為新聚類,替換原有的兩個聚類。每一步的計算結果以樹狀圖的形式展現(xiàn)出來,形成層次聚類樹。
2 結果
對使用頻次超過平均值的46味治療失眠的中藥經(jīng)過三種相似性度量方法分別進行層次聚類分析,生成基于單連接的層次聚類樹狀圖,如圖1;基于全連接的層次聚類樹狀圖,如圖2;以及基于平均連接的層次聚類樹狀圖,如圖3。
上述三幅圖中,橫坐標皆表示每一味中藥,縱坐標皆表示藥物間的相對距離,每一組連線都代表著將距離最近的兩種中藥聯(lián)系起來,而這一條連線的高度則表示兩點間的距離。從樹狀圖中可清晰的比較出這三種相似性度量方法下的聚類結果。
通過樹形圖可直觀的顯示每一步合并的過程,由圖1~圖3均可看出性味歸經(jīng)和功效有極大相似度的藥物聚在一起。基于單連接的層次聚類產(chǎn)生的聚類結果質量低,要么多種藥物聚在一起,而這些藥物相互之間并不是都有很強的關聯(lián)性;要么多種藥物相互獨立,無法聚合,不能很好的體現(xiàn)藥物間的關系。基于平均連接的層次聚類比單連接的更好的體現(xiàn)了類的層次關系,沒有出現(xiàn)多種藥物相互獨立的情況,僅包含個別稍微偏離中心的藥物。由圖2可知當藥物聚為10類時較為合理,符合一定的中醫(yī)診治理論;基于全連接的層次聚類效果表現(xiàn)最佳,劃分的聚類層次結構清晰,分布較前兩種更均勻一些,能較好地解釋失眠高頻藥物之間的關系,客觀地反應失眠處方的用藥規(guī)律。
由圖3可看出,聚為10類時效果最佳。綜合藥物的性味歸經(jīng)及功效分析,如人參、甘草、茯苓、茯神、山藥這一簇,性平味甘,主要歸心、肺、脾、腎四經(jīng),大多為補虛藥,這與中醫(yī)通過補虛瀉實,調節(jié)氣血失調的方法治療失眠相對應。酸棗仁、琥珀、柏子仁、龍骨這一簇,性平味甘,主歸心經(jīng),基本為安神藥,這與中醫(yī)通過安神養(yǎng)血的方法治療失眠相符合。遠志、石菖蒲、枳實、紫菀這一簇中,遠志與石菖蒲為治療失眠的常用藥對,兩藥相輔相成,有祛痰開竅,安神定志之功效[12]。
圖1~圖3中,無論基于哪一種相似性度量方式,某些藥物最終都會聚為一類。如生地、天冬、知母這一類,都為甘寒藥物,具有滋陰的功效,可用于治療陰虛煩躁導致的失眠;人參、茯苓、甘草這一類,益心膽之氣,可用于治療心膽氣虛導致的失眠;半夏、枳實、陳皮這一類具有健脾化痰、理氣和胃之效,可用于治療痰熱擾心導致的失眠。
由此可見,層次聚類無需提前指定具體的聚類數(shù)目,也沒有局部極小或是初始點選擇的問題。而是關注簇之間的遠近距離,即根據(jù)藥物間的相似性,一步步聚合最終形成層次樹狀圖,適合用于挖掘綜合考慮性、味、歸經(jīng)、功效相似度的藥對或藥組。
3 結束語
臟腑功能紊亂、氣血陰陽失調、神志不寧以及情志失調是發(fā)生失眠的基本病機。本研究結果顯示,失眠用藥多以調節(jié)陰陽、補虛瀉實、養(yǎng)血安神、鎮(zhèn)驚清心為治療原則。本研究將治療失眠藥物的四氣、五味、歸經(jīng)和功效按一定權重進行層次聚類分析,通過比較三種相似性度量方法下的層次聚類的效果發(fā)現(xiàn),挖掘結果最好的是基于全連接的層次聚類,其聚類結果更能體現(xiàn)中醫(yī)對證下藥的診治規(guī)律。聚類結果體現(xiàn)了藥物之間四種屬性的綜合相關聯(lián)性,而不是孤立的某個屬性的相關聯(lián)性,因而得到的藥物組合對臨床用藥更具參考性。
層次聚類對樣本的輸入順序不敏感,不需要事先設定類似K均值聚類的全局目標函數(shù),而只根據(jù)樣本間的相似度自發(fā)聚類。它將藥物本身的特性綜合考慮在內進行聚類,這也可以用于其他病癥的用藥規(guī)律研究,其在中醫(yī)藥物組合規(guī)律上的應用前景廣闊。進一步的研究將考慮將層次聚類與其他算法相結合,分析藥與癥狀之間的復雜關系。
參考文獻(References):
[1] 陳貴海.失眠的研究進展[J].中國臨床醫(yī)生雜志,2017.8.
[2] 武潤梅,王芝平,梁晶晶等.失眠綜述及臨證舉例[J].光明中醫(yī),2017.32(7):939-941
[3] 徐萍萍,喬會秀,耿嘉瑋.更年期失眠中西醫(yī)治療進展綜述[J].中西醫(yī)結合心血管病電子雜志,2019.7(1):48-49
[4] 廉治軍,張有民,劉波.應用解郁養(yǎng)血安神湯治療失眠臨床研究[J].遼寧中醫(yī)雜志,2017.1:102-105
[5] 張雯靜,王國華,王翹楚.落花安神口服液治療失眠癥療效的隨機雙盲安慰劑對照臨床試驗[J].中華中醫(yī)藥雜志,2017.6:2801-2804
[6] 洪秋陽,楊惠民,王世廣等.賀氏三通法治療亞急性失眠:隨機對照研究[J].中國針灸,2018.38(12):34-38
[7] 褚?guī)r珺,李運倫.基于文獻的從脾胃論治失眠用藥規(guī)律研究[J].中國中醫(yī)藥信息雜志,2016.23(7):51-53
[8] 田瑾.基于互信息的失眠用藥關聯(lián)性分析[J].中國中藥雜志,2015.40(19):3873-3877
[9] 鄒聰,郭蓉娟,袁清潔.基于關聯(lián)規(guī)則和復雜系統(tǒng)熵聚類的郭蓉娟治療失眠“晝夜兩方”用藥規(guī)律研究[J]. 中醫(yī)臨床研究,2016.8(13):33-36
[10] Gullo F, Ponti G, Tagarelli A, et al. An information-theoretic approach to hierarchical clustering of uncertain data[J].Information Sciences,2017.402:199-215
[11] 張博,張超偉.中藥方劑數(shù)據(jù)挖掘中的數(shù)據(jù)預處理研究[J].電腦知識與技術,2011.7(17):4016-4017
[12] 覃甘梅,覃驪蘭,藍毓營.治療失眠中藥藥對的應用原則[J].中醫(yī)藥導報,2018.