馬寧,郝秀霞,邢俊鳳,郭靜霞
(內(nèi)蒙古科技大學(xué)包頭醫(yī)學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,內(nèi)蒙古 包頭 014040)
分析方劑中的用藥配伍規(guī)律,對(duì)揭示中醫(yī)理論體系、樹(shù)立科學(xué)配伍標(biāo)準(zhǔn)、開(kāi)發(fā)復(fù)方用藥等具有重要的作用。當(dāng)前常用的方劑用藥規(guī)律分析方法包括基于出現(xiàn)頻率的統(tǒng)計(jì)學(xué)方法、關(guān)聯(lián)規(guī)則方法和基于復(fù)雜網(wǎng)絡(luò)的相關(guān)聚類(lèi)方法,但這些方法大部分主要依賴(lài)于一個(gè)或多個(gè)藥物組在方劑中出現(xiàn)的頻次進(jìn)行分析,結(jié)果有一定的不足之處。第一,方劑中如甘草、大棗等藥物作為佐使藥經(jīng)常出現(xiàn),因此頻率較高,在挖掘結(jié)果中經(jīng)常出現(xiàn),但佐使藥對(duì)于某一病癥的作用相對(duì)較弱,這對(duì)結(jié)果分析造成了一定的干擾。第二,基于頻次的分析方法忽略了藥物內(nèi)在及其之間的脈絡(luò)關(guān)系,根據(jù)方劑學(xué)理論,藥物性味、歸經(jīng)、相互間七情合和關(guān)系以及方劑中君臣佐使作用在治療中都有著重要的影響,而基于頻次的分析方法鮮少將這些屬性和方法進(jìn)行有效結(jié)合,發(fā)現(xiàn)過(guò)程相對(duì)膚淺和偏重表層。第三,關(guān)聯(lián)規(guī)則挖掘結(jié)果只局限于方劑內(nèi)部,無(wú)法向方劑外部延伸。
近年來(lái),憑借良好的擴(kuò)展性和內(nèi)在發(fā)掘機(jī)制,復(fù)雜網(wǎng)絡(luò)分析方法已成為用藥配伍規(guī)律分析的有效手段[1]。同時(shí)該方法也在持續(xù)改進(jìn),特別是在實(shí)際應(yīng)用角度,如周偉等[2]從藥物與病癥關(guān)系角度提出藥物效用度的概念,并進(jìn)行組網(wǎng)和核心藥物配伍規(guī)律挖掘;梁力偉等[3]定義藥物節(jié)點(diǎn)影響力進(jìn)行核心藥物社區(qū)的發(fā)現(xiàn)。這些改進(jìn)使得復(fù)雜網(wǎng)絡(luò)分析方法在應(yīng)用效果和針對(duì)性上有了很大的提升。此外,不斷有研究者嘗試將藥物的相關(guān)屬性與復(fù)雜網(wǎng)絡(luò)相結(jié)合進(jìn)行挖掘,旨在加強(qiáng)挖掘結(jié)果的內(nèi)涵和潛在關(guān)系。李茹等[4]以“性味”“歸經(jīng)”“功效”等屬性作為屬性節(jié)點(diǎn)并納入到復(fù)雜網(wǎng)絡(luò)中進(jìn)行用藥規(guī)律的挖掘;何菊等[5]將“性味”“歸經(jīng)”“功效”整合為屬性向量來(lái)設(shè)置屬性的相似度從而應(yīng)用到社團(tuán)發(fā)現(xiàn)過(guò)程當(dāng)中。本文基于藥物的各類(lèi)屬性特點(diǎn),通過(guò)建立多維復(fù)雜網(wǎng)絡(luò)模型,將藥物的性味、歸經(jīng)、功效等部署在不同的維度空間,通過(guò)綜合計(jì)算不同維度空間中藥物相似關(guān)聯(lián)關(guān)系,進(jìn)而實(shí)現(xiàn)藥物配伍規(guī)律的發(fā)掘。
傳統(tǒng)的復(fù)雜網(wǎng)絡(luò)模型是以實(shí)體為節(jié)點(diǎn)、實(shí)體間聯(lián)系為邊建立的二維拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu),但在現(xiàn)實(shí)世界中很多網(wǎng)絡(luò)關(guān)系不僅局限在二維空間下,例如人際關(guān)系網(wǎng)絡(luò)在不同時(shí)間維度下是不一致的,交通運(yùn)輸網(wǎng)絡(luò)在運(yùn)輸方式上又可劃分為海運(yùn)、空運(yùn)和陸運(yùn)等多個(gè)維度,多維度的出現(xiàn)對(duì)于最終計(jì)算結(jié)果有著重要的影響[6]。由于中醫(yī)用藥不僅在方劑內(nèi)部存在聯(lián)系,藥物之間在性味、歸經(jīng)、功效等方面也普遍存在共性和聯(lián)系,為有效獲取這些關(guān)系,加強(qiáng)中藥配伍規(guī)律的挖掘深度和潛在聯(lián)系,將傳統(tǒng)以藥物作為節(jié)點(diǎn)的中藥復(fù)雜網(wǎng)絡(luò)模型擴(kuò)展到多維空間,以藥物間功效、性味、歸經(jīng)關(guān)系作為擴(kuò)展維度空間,建立中醫(yī)方劑用藥多維復(fù)雜網(wǎng)絡(luò)模型。見(jiàn)圖1。
1.1.1 建立藥物基空間
該空間以方劑中藥物作為節(jié)點(diǎn),如果藥物在同一方劑中出現(xiàn),則兩藥物之間建立連邊構(gòu)建“藥物”復(fù)雜網(wǎng)絡(luò)模型(如圖1實(shí)心節(jié)點(diǎn)及連邊),將該網(wǎng)絡(luò)模型定義為基空間,因?yàn)槠渌S度空間中節(jié)點(diǎn)聯(lián)系需要依賴(lài)于該空間上的藥物節(jié)點(diǎn),同時(shí)復(fù)雜網(wǎng)絡(luò)模型社團(tuán)發(fā)現(xiàn)的過(guò)程也是基于該網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)。
由于方劑中部分藥物出現(xiàn)次數(shù)過(guò)低,對(duì)于結(jié)果證明的說(shuō)服力不強(qiáng),同時(shí)為了降低網(wǎng)絡(luò)的復(fù)雜度,如果節(jié)點(diǎn)出現(xiàn)次數(shù)小于3 則刪除該節(jié)點(diǎn)及它與其他節(jié)點(diǎn)的連邊。此外,為體現(xiàn)方劑中核心藥物的重要性,使得結(jié)果圍繞核心藥物有效聚集,采用文獻(xiàn)[7]中對(duì)應(yīng)的思想,以方劑中藥物君臣佐使的作用,來(lái)區(qū)分藥物重要程度,即構(gòu)建方劑子網(wǎng)。以方劑中藥物作為節(jié)點(diǎn),如果藥物為君臣藥,則與其他藥物均建立連邊,如果兩藥物為佐使藥,則節(jié)點(diǎn)之間不建立連邊。例如一首方劑中有4 味藥物,作用分別是君臣佐使,則其建立的方劑子網(wǎng)如圖2所示,可以明顯看出方劑中核心藥物(君臣藥)節(jié)點(diǎn)的度要大于非核心藥物(佐使藥)節(jié)點(diǎn)的度。
定義方劑中藥物數(shù)量為N,第i 味藥物的度為di,則該藥物的權(quán)重wi可如下定義:
藥物基空間復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)的核心度值可定義該藥物在所有出現(xiàn)的方劑子網(wǎng)中權(quán)重的和,如下公式所示:
1.1.2 建立“性味”“歸經(jīng)”“功效”等屬性維度空間
在構(gòu)建藥物屬性維度空間之前需要對(duì)“性味”“歸經(jīng)”“功效”等屬性進(jìn)行規(guī)范和分類(lèi),這里采用文獻(xiàn)[8]對(duì)應(yīng)的方法進(jìn)行標(biāo)準(zhǔn)化和分類(lèi)過(guò)程。見(jiàn)表1~表3,“性味”屬性可按四氣五味分為溫、熱、寒、涼等21 類(lèi),“歸經(jīng)”屬性可分為肝、肺、心、脾等14 類(lèi),功效可在歸納整理的基礎(chǔ)上分為“止痛”“清熱”“祛風(fēng)”等255類(lèi)。
表1 性味分類(lèi)表
表2 歸經(jīng)分類(lèi)表
表3 功效分類(lèi)表
以“歸經(jīng)”維度空間建立過(guò)程為例,按照歸經(jīng)類(lèi)別在該空間中建立歸經(jīng)節(jié)點(diǎn)(如圖1所示,左側(cè)平面代表“歸經(jīng)”維度空間,該平面上空心節(jié)點(diǎn)代表歸經(jīng)節(jié)點(diǎn)),屬性維度空間中節(jié)點(diǎn)之間不需要建立邊連接關(guān)系,因此在各屬性空間中均是以獨(dú)立節(jié)點(diǎn)的形式存在,“性味”“功效”空間的建立過(guò)程同理,這里不再詳細(xì)敘述。
1.1.3 建立基空間藥物節(jié)點(diǎn)與各屬性維度空間的關(guān)系
確定藥物與各維度空間中分類(lèi)節(jié)點(diǎn)的歸屬聯(lián)系,如果存在歸屬關(guān)系,則建立連邊。以“歸經(jīng)”維度空間為例,將藥物與所屬歸經(jīng)節(jié)點(diǎn)之間建立空間外部連邊(如圖1所示淺色虛線(xiàn)),由于一種藥物可能有多個(gè)歸經(jīng),因此藥物節(jié)點(diǎn)針對(duì)“歸經(jīng)”空間中節(jié)點(diǎn)的度值≥1?!靶晕丁薄肮πА钡染S度空間也按照相同的規(guī)則建立空間聯(lián)系。通過(guò)該方法建立起來(lái)的多維復(fù)雜網(wǎng)絡(luò)模型可利用節(jié)點(diǎn)與擴(kuò)展空間所連接的相鄰節(jié)點(diǎn)數(shù)量來(lái)確定節(jié)點(diǎn)間的相近關(guān)系。
藥物節(jié)點(diǎn)相似度即在多維復(fù)雜網(wǎng)絡(luò)中藥物節(jié)點(diǎn)對(duì)之間的相似程度,該相似度依賴(lài)于藥物在不同屬性維度之間的關(guān)聯(lián)性,以節(jié)點(diǎn)對(duì)之間在某一維度的相鄰節(jié)點(diǎn)為計(jì)算依據(jù)。在中藥復(fù)雜網(wǎng)絡(luò)中,每個(gè)藥物之間在“歸經(jīng)”“性味”“功效”等屬性方面有可能存在共同點(diǎn),即兩個(gè)節(jié)點(diǎn)共同鄰居多,則相似度高,反之則低。采用Jaccard 相似度方法來(lái)計(jì)算節(jié)點(diǎn)之間的相似度,如公式(3)所示,其中u∩v代表維度空間k上與藥物節(jié)點(diǎn)u和v都相連的節(jié)點(diǎn)個(gè)數(shù),u∪v代表維度空間k上與藥物節(jié)點(diǎn)u或v相連的節(jié)點(diǎn)個(gè)數(shù)和,由該公式可以得出若藥物u和v在某一屬性維度空間上分類(lèi)完全相同,則相似度值達(dá)到最大值1,若完全不同則相似度值為0。
進(jìn)而可定義多維網(wǎng)絡(luò)空間內(nèi)藥物節(jié)點(diǎn)相似度,這里采用文獻(xiàn)[9]中簡(jiǎn)單疊加模型,即將所有一維網(wǎng)絡(luò)相似度進(jìn)行簡(jiǎn)單相加求和得到多維網(wǎng)絡(luò)節(jié)點(diǎn)相似度,其相似度模型如公式(4)所示,其中n代表屬性維度空間的個(gè)數(shù)。
由于一種藥物有可能出現(xiàn)在多個(gè)組合結(jié)果當(dāng)中,因此采用重疊社團(tuán)發(fā)現(xiàn)算法來(lái)挖掘中藥配伍規(guī)律,常用的重疊社團(tuán)發(fā)現(xiàn)算法包括派系過(guò)濾算法、標(biāo)簽傳遞算法和最大適應(yīng)度算法等。本文選擇穩(wěn)定性相對(duì)較高,同時(shí)空間和時(shí)間占用率相對(duì)較低的最大適應(yīng)度算法FLM(fit local fitness)來(lái)進(jìn)行社團(tuán)發(fā)現(xiàn)。FLM 是一種貪心算法,以期望模塊度最大來(lái)完成社團(tuán)的組合過(guò)程,根據(jù)中藥配伍的思想,藥物組合應(yīng)當(dāng)依賴(lài)于藥物之間的連接緊密度關(guān)系以及藥物在各屬性上的共性,這里定義社團(tuán)局部密度函數(shù)如下:
|ε|表示社團(tuán)C內(nèi)部連邊的個(gè)數(shù),|C|表示社團(tuán)C內(nèi)部節(jié)點(diǎn)個(gè)數(shù),若C 當(dāng)中n個(gè)節(jié)點(diǎn)均兩兩相連,則ε 的值為n(n-1)/2,δ(C)將達(dá)到最大值1。
定義社團(tuán)藥物屬性共性函數(shù)如下:
其中Sim(u,v)表示社團(tuán)C當(dāng)中任意兩節(jié)點(diǎn)相似度值,如公式(4)定義。因此可定義如下的適應(yīng)度函數(shù)f(C),其中對(duì)γ(C)取對(duì)數(shù)是為了抑制該值過(guò)快增長(zhǎng),導(dǎo)致權(quán)重過(guò)大。
定義在當(dāng)前社團(tuán)加入新節(jié)點(diǎn)j后,適應(yīng)度函數(shù)的差值△f(C+j)如下,即加入新節(jié)點(diǎn)后適應(yīng)度函數(shù)與加入新節(jié)點(diǎn)之前適應(yīng)度函數(shù)的差值。
整個(gè)算法的具體計(jì)算過(guò)程見(jiàn)圖3。
圖3 整個(gè)算法的具體計(jì)算過(guò)程
搜集《中藥方劑大辭典》中關(guān)于治療小兒脾疳的方劑用藥數(shù)據(jù)信息共計(jì)131 首,包含藥物151 種,對(duì)相關(guān)數(shù)據(jù)進(jìn)行整理與規(guī)范,包括統(tǒng)一名稱(chēng),明確藥用、性味、歸經(jīng)、功效的分類(lèi),在此基礎(chǔ)上構(gòu)建小兒脾疳方劑用藥的知識(shí)數(shù)據(jù)庫(kù)。
按照“1.1”項(xiàng)中根據(jù)藥物作用確定的治療小兒脾疳的方劑核心藥物度值≥15 的核心藥物共計(jì)24 個(gè),見(jiàn)表4。
表4 小兒脾疳核心藥物信息表
建立“藥物”基空間復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)圖,同時(shí)刪除小于2的邊及獨(dú)立的藥物節(jié)點(diǎn),最終形成的復(fù)雜網(wǎng)絡(luò)模型共包含96個(gè)藥物節(jié)點(diǎn),758條邊,平均度值7.34。見(jiàn)圖4。
圖4 “藥物”基空間復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)圖
其他維度空間的網(wǎng)絡(luò)結(jié)構(gòu)以矩陣形式呈現(xiàn)和保存,其中每一行代表一種藥物,每一列代表一類(lèi)歸經(jīng),如果藥物i歸屬于歸經(jīng)j,則對(duì)應(yīng)矩陣中第i行第j列的值Cij=1,否則Cij=0。圖5為“歸經(jīng)”維度空間的矩陣存儲(chǔ)結(jié)構(gòu),該網(wǎng)絡(luò)空間中共包含藥物96個(gè),歸經(jīng)13類(lèi),故對(duì)應(yīng)矩陣C性味為一個(gè)96×13 的關(guān)系矩陣,同理可建立“性味”“功效”的矩陣存儲(chǔ)結(jié)構(gòu)。
圖5 “歸經(jīng)”維度空間的矩陣存儲(chǔ)結(jié)構(gòu)圖
基于本文構(gòu)建的方劑多維復(fù)雜網(wǎng)絡(luò)模型,利用Java 語(yǔ)言自編程實(shí)現(xiàn)本文提出的社團(tuán)發(fā)現(xiàn)算法,圍繞表4確定的核心藥物節(jié)點(diǎn)產(chǎn)生的計(jì)算。見(jiàn)表5。
表5 復(fù)雜網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)方法挖掘結(jié)果統(tǒng)計(jì)
脾疳是嬰幼兒較常見(jiàn)的疾病,尤其是1~5 歲兒童最常見(jiàn),多因喂養(yǎng)不合理、生病用藥過(guò)傷、蟲(chóng)積為患等導(dǎo)致脾胃受損而引起。臨床表現(xiàn)為小兒面黃肌瘦、困倦懶言、食少納呆、挑食、食后腹脹、四肢無(wú)力、少氣自汗、大便時(shí)干時(shí)稀等癥狀,與西醫(yī)所謂小兒慢性營(yíng)養(yǎng)不良癥相似[10]。中醫(yī)學(xué)認(rèn)為本病多因脾胃虛弱,乳食過(guò)度,積滯不消,蘊(yùn)結(jié)生熱而致[11]。通過(guò)表4數(shù)據(jù)結(jié)果可知,黃連、使君子、木香、陳皮、胡黃連、蘆薈、神曲、檳榔等是出現(xiàn)頻率較高的藥物,其中黃連、胡黃連等清熱降燥,使君子、蘆薈等殺蟲(chóng)療疳,神曲、山楂等消食化積,陳皮、木香等行氣化滯,通過(guò)表中數(shù)據(jù)可分析得出治療小兒脾疳的藥物以清熱降燥、消積理氣、消疳殺蟲(chóng)藥為主,輔以補(bǔ)氣、消食、解毒等藥物。
通過(guò)表5的藥物組合可以看出,其結(jié)果是圍繞一味或多味核心藥物產(chǎn)生的聚類(lèi)結(jié)果。例如{黃連、神曲、麥芽、木香}的組合,其中黃連清熱降燥,神曲消食健脾,搭配麥芽、木香可治脘腹脹痛、消化不良,此組合可見(jiàn)于《痘疹傳心錄》所載治療小兒疳疾的“六味肥兒丸”方中,亦可見(jiàn)于《楊氏家藏方》中治療小兒疳證的“祛疳消食丸”方中。又如{木香、黃連、丁香、蕪荑}的組合,其中木香行氣止痛、健脾消食,配黃連可祛積止痛,輔以丁香散寒止痛,蕪荑驅(qū)蟲(chóng)療疳,此組合可見(jiàn)于《醫(yī)統(tǒng)》中用于治療小兒脾胃受疳、面黃腹脹、多睡的“捉疳丸”方中。上述研究成果說(shuō)明了本研究成果的有效性和合理性。
本研究利用方劑中藥物的作用及使用劑量設(shè)計(jì)了一種基于核心藥物度的方劑用藥規(guī)律挖掘方法,其計(jì)算結(jié)果圍繞君臣藥及劑量大的藥物產(chǎn)生了眾多新穎的藥物組合規(guī)律,雖然本法還存在諸多不足之處,例如缺乏與證候、性味、歸經(jīng)等的有效結(jié)合,但研究結(jié)果可以為總結(jié)用藥規(guī)律,指導(dǎo)中藥復(fù)方開(kāi)發(fā)提供一定參考。本研究方法也可作為一種新的分析中醫(yī)用藥規(guī)律的工具和手段,為揭示配伍的科學(xué)內(nèi)涵和中醫(yī)臨床用藥特點(diǎn)提供有力的支撐。此外,本研究也有待進(jìn)一步的完善,如證候、癥狀等信息也可作為藥物屬性維度納入多維復(fù)雜網(wǎng)絡(luò)模型當(dāng)中進(jìn)行構(gòu)建;前期君臣佐使、性味、歸經(jīng)、功效等數(shù)據(jù)的劃分需要較多的人工輔助處理,未來(lái)可建立對(duì)應(yīng)的數(shù)據(jù)字典,通過(guò)計(jì)算機(jī)自動(dòng)完成識(shí)別與分類(lèi);多維復(fù)雜網(wǎng)絡(luò)各維度空間中節(jié)點(diǎn)之間也可建立聯(lián)系等。