肖 瑞,胡馮菊,裴 衛(wèi),別旻坤
(1.湖北中醫(yī)藥大學,湖北 武漢 430065;2.廣州中醫(yī)藥大學,廣東 廣州 510006;3.湖北省蘄春縣人民醫(yī)院,湖北 黃岡 435300;4.湖北省人才服務(wù)局,湖北 武漢 430065)
肝硬化是臨床常見的慢性進行性肝病,是一種或多種病因長期或反復(fù)作用形成的彌漫性肝損害,主要病因包括乙型肝炎、丙型肝炎、酒精性肝病、脂肪肝,以及自身免疫性肝病等[1]。肝硬化可歸屬于中醫(yī)“鼓脹”范疇,與“風”“癆”“膈”并稱為四大頑癥。本病最早見于《黃帝內(nèi)經(jīng)》[2],《靈樞·水脹》曰:“鼓脹何如?岐伯曰:腹脹身皆大,大與膚脹等也,色蒼黃,腹筋起,此其候也?!敝嗅t(yī)認為本病為本虛標實之證,病因多為飲食不節(jié)、情志刺激、蟲毒感染、黃疸久治不愈,病位主要在肝、脾、腎,病理因素包括水飲、痰濁、血瘀、濁毒,病機多為肝失疏泄,肝氣郁結(jié),脾失健運,后期波及腎,腎失氣化,水飲、濁毒內(nèi)犯,發(fā)為本病[3]。本研究查閱中部地區(qū)某三級甲等中醫(yī)院2015—2016年明確診斷為乙肝肝硬化的患者門診記錄數(shù)據(jù)700例,收集整理其處方中的中藥,在傳統(tǒng)組方規(guī)律數(shù)據(jù)挖掘的基礎(chǔ)上,結(jié)合中醫(yī)基礎(chǔ)理論構(gòu)建中藥知識圖譜,從性味歸經(jīng)角度進一步挖掘其內(nèi)在組方規(guī)律,從而深入探尋組方藥物之間的關(guān)聯(lián),為臨床治療本病提供參考,現(xiàn)報道如下。
1.1 數(shù)據(jù)來源 來源于中部地區(qū)某三級甲等中醫(yī)院2015—2016年的門診記錄700例,患者均符合《肝硬化腹水的中西醫(yī)結(jié)合診療共識意見》中的肝硬化診斷標準[4]。
1.2 納入標準 依據(jù)肝硬化Child-Pugh分級標準[5],計算患者的首次來院檢驗得分與最后一次來院檢驗得分,篩選診療前后評分下降的案例作為本研究的有效數(shù)據(jù)。
1.3 排除標準 患者門診號缺失;中藥處方信息缺失;缺少Child-Pugh分級標準所需的信息,包括肝性腦病、腹水、血清膽紅素、血清白蛋白和凝血酶原時間。
2.1 數(shù)據(jù)預(yù)處理 本研究數(shù)據(jù)預(yù)處理工作主要包括數(shù)據(jù)整理、數(shù)據(jù)清洗、中藥名稱規(guī)范化和樣本數(shù)據(jù)編碼等工作。數(shù)據(jù)整理按照納入和排除標準嚴格執(zhí)行,從700例原始案例中篩選出620例有效案例納入后續(xù)分析,剔除處方信息不全的數(shù)據(jù)(不含或部分不含劑量的數(shù)據(jù))后,最終獲得處方589首。數(shù)據(jù)清洗為剔除無用或缺失字段的數(shù)據(jù)。由于醫(yī)生書寫習慣不同,中藥名稱可能會出現(xiàn)錯別字或別名情況,將以上處方由臨床醫(yī)生進行校驗并按照中藥名稱規(guī)范化規(guī)則進行規(guī)范化,編碼方式采用one-hot編碼,所有工作均在湖北省中醫(yī)院肝病研究所臨床醫(yī)生的指導下,采用Python軟件進行編碼。
2.2 中藥名稱規(guī)范化 為避免因中藥名稱不規(guī)范影響分析結(jié)果,本研究參照《中藥方劑編碼規(guī)則及編碼》(GB/T31773—2015)[6]與《中華人民共和國藥典》2015年版[7]對處方數(shù)據(jù)中包含的407種中藥名稱(規(guī)范化的中藥名稱219種,不規(guī)范的中藥名稱188種,包括中藥別名97種、炮制中藥88種、中藥簡稱3種)進行規(guī)范化處理,最終獲得規(guī)范化的標準中藥名稱257種。
2.3 中藥網(wǎng)絡(luò)模型 基于中醫(yī)基礎(chǔ)理論與知識圖譜相關(guān)理論,構(gòu)建中藥知識圖譜基礎(chǔ)單元模型M(herb,connection,attribute),其中herb為中草藥節(jié)點,attribute為中草藥對應(yīng)的屬性節(jié)點,connection為中草藥節(jié)點與屬性節(jié)點之間的聯(lián)系[8]。構(gòu)建的模型遵循以下規(guī)則:任意1味中藥為1個節(jié)點;任意1個屬性值為1個節(jié)點;任意1味中藥與其相關(guān)聯(lián)的屬性形成連線,組成關(guān)系;任意1味中藥最少有1條關(guān)系。基于上述規(guī)則可以構(gòu)建出一個簡單的中藥知識圖譜基礎(chǔ)單元(圖1),圖中反映的是依據(jù)中醫(yī)基礎(chǔ)理論中的性味歸經(jīng)對白術(shù)構(gòu)建的知識圖譜基礎(chǔ)單元,其葉子節(jié)點為白術(shù)的性味歸經(jīng)屬性,連線為白術(shù)與屬性的關(guān)系,顏色表示不同的屬性,從圖1中可以發(fā)現(xiàn)白術(shù)味甘、苦,性溫;歸脾、胃經(jīng)。
圖1 白術(shù)知識圖譜基礎(chǔ)單元
2.4 工具說明 由研究人員參照《衛(wèi)生部、國家中醫(yī)藥管理局關(guān)于印發(fā)醫(yī)院中藥房基本標準的通知》[9],對某中醫(yī)藥大學附屬中醫(yī)門診中藥飲片品種目錄進行規(guī)范,整理出常用的537味中藥作為原始數(shù)據(jù)集,參照《中華人民共和國藥典》對中藥性味歸經(jīng)屬性進行整理,并嚴格按照四氣五味歸經(jīng)劃分(其中藥性分別為溫、熱、寒、涼、平5個類別;藥味分為辛、甘、酸、苦、咸、淡、澀7個類別;歸經(jīng)分為心、肝、脾、肺、腎、胃、大腸、小腸、膀胱、膽、心包、三焦經(jīng)12個類別),按照中藥知識圖譜基礎(chǔ)單元的構(gòu)建規(guī)則,將各類中藥進行構(gòu)建并將其持久化到數(shù)據(jù)庫中,使用Django框架和Ant V G6開發(fā)本研究使用的知識圖譜可視化軟件。
2.5 數(shù)據(jù)分析 首先用Excel軟件匯總數(shù)據(jù)集,并對組方中的中藥進行頻次分析,對使用頻次≥50次的中藥進行藥效分析,使用Python軟件mlxtend包中的Apriori算法對數(shù)據(jù)預(yù)處理后的257味中藥構(gòu)建onehot矩陣,設(shè)置最小支持度為0.1,進行關(guān)聯(lián)規(guī)則處理,對關(guān)聯(lián)規(guī)則結(jié)果(置信度≥0.9)中藥進行去重,采用Gephi軟件對去重后的中藥進行復(fù)雜網(wǎng)絡(luò)可視化展示以分析其關(guān)聯(lián)性,再通過構(gòu)建的知識圖譜模型從性味歸經(jīng)角度進行分析。
3.1 使用頻次分析 分析結(jié)果顯示,使用頻次≥50次的中藥有41味,其中使用頻次前5位的中藥依次為白術(shù)、茯苓、甘草、茵陳蒿、丹參(見表1)。41味中藥包括清熱藥9種,補虛藥8種,利水滲濕藥6種,消食藥4種,活血化瘀藥3種,理氣藥3種,化濕藥2種,化痰止咳平喘藥2種,解表藥2種,瀉下藥1種,止血藥1種。
表1 治療肝硬化的方劑中使用頻次≥50次的中藥
3.2 關(guān)聯(lián)規(guī)則分析 分析結(jié)果顯示,獲得置信度≥0.9的關(guān)聯(lián)規(guī)則34條,其中置信度較高的關(guān)聯(lián)規(guī)則包括陳皮-黨參-甘草→白術(shù)、陳皮-神曲-黨參→白術(shù)、神曲-黨參-甘草→白術(shù)、神曲-黨參→白術(shù)、白術(shù)-甘草-郁金→茯苓等。見表2。
表2 治療肝硬化的方劑中的中藥關(guān)聯(lián)規(guī)則(置信度≥0.9)
3.3 知識圖譜分析 對關(guān)聯(lián)規(guī)則分析結(jié)果去重后得到14味中藥,分別為白術(shù)、丹參、半夏、茯苓皮、甘草、黨參、茯苓、郁金、雞內(nèi)金、豬苓、神曲、澤瀉、車前子、陳皮。將以上中藥視為1個組方(見圖2),通過構(gòu)建的知識圖譜模型對14味中藥進行分析,其中節(jié)點顏色用于區(qū)分不同類別,節(jié)點大小由該節(jié)點入度決定,入度越多,節(jié)點越多,其屬性在改組方中的比重就越大,從圖中可見,14味中藥藥味以甘味為主,歸經(jīng)以歸脾經(jīng)為主,藥性以平、溫、寒為主(圖3)。
圖2 治療肝硬化藥物組成圖
圖3 肝硬化組方知識圖譜
自知識圖譜概念被提出以來,特定領(lǐng)域知識圖譜的構(gòu)建一直是研究熱點。從搜索引擎優(yōu)化到新藥發(fā)現(xiàn),知識圖譜已滲透到金融、工業(yè)和醫(yī)學等各領(lǐng)域[10]。知識圖譜具有知識語義化、數(shù)據(jù)易關(guān)聯(lián)、易擴充等特性,逐漸被國內(nèi)醫(yī)療界接受。中醫(yī)藥領(lǐng)域已開展了中醫(yī)結(jié)合知識圖譜的相關(guān)研究[11],如中國中醫(yī)科學院中醫(yī)藥信息研究所基于已有的中醫(yī)藥學語言系統(tǒng)構(gòu)建中醫(yī)藥知識圖譜[12-13]。于彤等[14]以中醫(yī)養(yǎng)生領(lǐng)域本體為骨架,搜集整理中醫(yī)養(yǎng)生相關(guān)的知識資源,進行中醫(yī)養(yǎng)生知識圖譜的構(gòu)建研究。楊秦等[15]采用共詞分析及社會網(wǎng)絡(luò)方法對中醫(yī)外科瘡瘍領(lǐng)域的研究主題及分布進行了探索。張燁等[16]應(yīng)用可視化分析技術(shù),全面分析新型冠狀病毒肺炎的研究現(xiàn)狀與熱點。尚爾鑫等[17]將中醫(yī)理論轉(zhuǎn)化為數(shù)字化的圖形,并從方劑性味歸經(jīng)挖掘配伍規(guī)律。楊霖等[18]采用WEKA軟件對《中藥學》中481味中藥的性、味、歸經(jīng)進行Apriori算法的關(guān)聯(lián)分析,從而探索中藥的關(guān)聯(lián)關(guān)系。本研究基于數(shù)據(jù)挖掘和知識圖譜分析中醫(yī)治療肝硬化組方規(guī)律,現(xiàn)討論如下。
4.1 使用頻次分析 頻次分析結(jié)果顯示,使用頻次≥50次的中藥有41味,包括清熱藥9種,補虛藥8種,利水滲濕藥6種,消食藥4種,活血化瘀藥3種,理氣藥3種,化濕藥2種,化痰止咳平喘藥2種,解表藥2種,瀉下藥1種,止血藥1種;使用頻次前5位的中藥依次為白術(shù)(349次)、茯苓(337次)、甘草(319次)、茵陳蒿(310次)、丹參(299次),表明治療肝硬化的中藥以健脾利水為主要功效?!夺t(yī)門法律》記載:“脹病亦不外水裹、氣結(jié)、血瘀?!敝嗅t(yī)認為肝硬化是由氣滯、血瘀、水濕等病理因素所導致的本虛標實之證,在治療上應(yīng)遵循標本兼治的原則。肝病失治日久,正氣虧虛,易感受外邪,邪毒入內(nèi),傷及肝脾,導致氣機升降失常,水濕停聚于體內(nèi),瘀阻脈絡(luò),營衛(wèi)氣弱,邪入血分,瘀而化熱[19]。故遣方時多用清熱藥、利水滲濕藥、化濕藥、活血化瘀藥、止血藥以清熱祛濕、活血化瘀,輔以理氣藥、消食藥健脾利氣,助有形實邪消散,同時以補虛藥補脾柔肝,輔以化痰止咳平喘藥、解表藥、瀉下藥,諸藥并用,達到“祛邪不傷正,扶正不留瘀”的目的。
4.2 關(guān)聯(lián)規(guī)則與知識圖譜分析 將關(guān)聯(lián)規(guī)則中前項與后項進行合并去重,得到主要關(guān)聯(lián)規(guī)則中藥14味,分別為白術(shù)、丹參、半夏、茯苓皮、甘草、黨參、茯苓、郁金、雞內(nèi)金、豬苓、神曲、澤瀉、車前子、陳皮,且使用頻次均≥50次。知識圖譜分析結(jié)果顯示,該組方藥味以甘味為主,歸經(jīng)以歸脾經(jīng)為主,藥性以平、溫、寒為主?!耙姼沃?知肝傳脾,當先實脾”,治療肝病時采用甘味藥物調(diào)補脾土,可增強脾氣,防止脾被肝氣克伐,阻斷傳變環(huán)節(jié),防止肝病的發(fā)展惡化。中醫(yī)認為在治療肝硬化時,應(yīng)以健脾利水、疏肝行氣為主,在置信度較高的關(guān)聯(lián)規(guī)則中,神曲-黨參-甘草→白術(shù)、神曲-黨參→白術(shù)以健脾利水為主,陳皮-黨參-甘草→白術(shù)、陳皮-神曲-黨參→白術(shù)、白術(shù)-甘草-郁金→茯苓以健脾利水,疏肝行氣為主。《黃帝內(nèi)經(jīng)》將五味配屬五臟,而甘味既是藥味,也具有健脾作用的藥效。歸經(jīng)是藥物作用定位,將人體的臟腑經(jīng)絡(luò)與藥物的作用相關(guān)聯(lián),說明藥物作用對機體某部分的選擇性。本研究結(jié)果顯示,治療的肝硬化中藥以甘味為主,歸經(jīng)以脾經(jīng)為主,反映了肝病實脾的用藥規(guī)律。
綜上所述,本研究通過數(shù)據(jù)挖掘及中醫(yī)藥知識圖譜及復(fù)雜網(wǎng)絡(luò)方法,結(jié)合中醫(yī)性味歸經(jīng)理論,構(gòu)建出的中藥知識圖譜模型等數(shù)據(jù)挖掘模型對中醫(yī)治療肝硬化的257味中藥組方進行分析,挖掘到中醫(yī)治療肝硬化組方藥物藥味多為味甘,歸脾經(jīng),功效以健脾利水為主。結(jié)合中醫(yī)理論,治療本病從肝、脾、腎入手,用藥應(yīng)以扶正祛邪為主,早期疏肝理氣、益氣健脾,佐以活血化瘀,中后期調(diào)理肝腎,佐以利水滲濕、柔肝緩甘,引入方劑的組方思路。用藥應(yīng)體現(xiàn)“肝苦急,急食甘以緩之”,即“肝為將軍之官,其志怒,其氣急,急則自傷,反為所苦,故宜食甘以緩之,則急者可平,柔能制剛也”[20]。對于中藥組方挖掘,結(jié)合中醫(yī)基礎(chǔ)理論的性味歸經(jīng)構(gòu)建的中藥知識圖譜模型,可以更深層次挖掘出肝硬化組方中的規(guī)律,對臨床新藥研究與經(jīng)方挖掘有較強的參考價值,能夠為經(jīng)方研究提供新的切入點。