展俊平,孟慶良,孟婉婷,谷慧敏,左瑞庭,馬俊福,苗喜云,范 圍
(1.河南中醫(yī)藥大學(xué)第二附屬醫(yī)院,河南 鄭州 450002; 2.河南中醫(yī)藥大學(xué),河南 鄭州 450046)
證候分類是中醫(yī)學(xué)的基礎(chǔ)理論,是對不同個體整體功能狀態(tài)進(jìn)行分類的一種方法,是中醫(yī)臨床診斷、治療的主要依據(jù)[1]。辨證論治的過程是為了據(jù)證立法,由法定方,使方劑具有明確的適應(yīng)證[2-3],提高臨床療效?!爱惒⊥C”是證候分類的代表性理論,是對不同疾病人群再分類的指導(dǎo)原則,與西醫(yī)學(xué)診斷疾病具有不同的維度,這種精細(xì)化的分類對提高臨床診療的精準(zhǔn)度舉足輕重[4]。如患有同一種疾病的患者,根據(jù)證候分類原則分成不同的證候群,接受不同的治療;同樣,不同疾病的患者,由于臨床表現(xiàn)相近而被辨證為相同證候,接受相同或相似的治療方案[5],這就是所謂的“異病同證”。“異病同證”中的因素有病和證,所以如何在疾病分類和證候分類中取得聯(lián)系是需要解決的關(guān)鍵問題。
病證結(jié)合是中醫(yī)臨床診療的常用模式,是證候分類研究比較現(xiàn)實的基礎(chǔ)運(yùn)用[6- 7]。本文選擇中醫(yī)代表性理論“異病同證”作為切入點,運(yùn)用文本挖掘技術(shù),對于臨床上典型關(guān)節(jié)性疾病(類風(fēng)濕關(guān)節(jié)炎、骨性關(guān)節(jié)炎、強(qiáng)直性脊柱炎)的中醫(yī)證候結(jié)果進(jìn)行分析,找出其基本證候的要素規(guī)律,并開展不同維度的對比分析,初步探討異病同證的基礎(chǔ)。
文本數(shù)據(jù)的收集來自中國生物醫(yī)學(xué)文獻(xiàn)服務(wù)系統(tǒng)(英文全稱:Chinese BioMedical Literature Database,簡稱CBM,網(wǎng)址http://sinomed.cintcm.ac.cn/index.jsp),分別以“類風(fēng)濕關(guān)節(jié)炎”“骨性關(guān)節(jié)炎”“強(qiáng)直性脊柱炎”為檢索關(guān)鍵詞進(jìn)行檢索,其結(jié)果中出現(xiàn)了相關(guān)文獻(xiàn)數(shù)、款目詞、主題詞、合并分別得到文獻(xiàn)26 492,12 998,16 969篇(檢索日期:2017年9月26日),依次下載文獻(xiàn)信息并保存。
首先按照下載的先后順序,把從CBM下載的文本數(shù)據(jù)合并到一個平面文件(后綴為txt)中,并以ANSI編碼進(jìn)行保存。然后對下載的數(shù)據(jù)結(jié)果進(jìn)行信息提取(文本挖掘提取工具-軟件著作權(quán),軟著登字第0261882號,登記號2010SR073409),并將結(jié)果格式化后保存到大型關(guān)系型數(shù)據(jù)庫(Microsoft SQL Server 2008 R2,以下簡稱SQL)中[8]。針對初步提取出來的數(shù)據(jù),采用噪音結(jié)果構(gòu)建算法進(jìn)行清洗[9]。對清洗結(jié)束后的數(shù)據(jù)按照文獻(xiàn)中出現(xiàn)的關(guān)鍵詞次數(shù)計算一維頻數(shù),或根據(jù)共同出現(xiàn)的原則計算二維關(guān)系頻數(shù),進(jìn)而抽出高頻的關(guān)鍵詞對,用軟件進(jìn)行可視化處理[10],生成關(guān)鍵詞網(wǎng)絡(luò)圖,然后結(jié)合相關(guān)中醫(yī)學(xué)知識進(jìn)行解析。如發(fā)現(xiàn)不合理的噪音結(jié)果,通過再次人工閱讀,即回溯結(jié)果相關(guān)的原文獻(xiàn)數(shù)據(jù)集,增加規(guī)則進(jìn)行降噪,使數(shù)據(jù)更客觀。
清洗完畢后的數(shù)據(jù)采取數(shù)據(jù)切片分層的形式,一維結(jié)果按照頻次的高低單獨以文字形式列出,二維頻次結(jié)果(即數(shù)據(jù)結(jié)果中出現(xiàn)的兩兩之間的關(guān)系分析)用Cytoscape 3.5軟件進(jìn)行可視化處理。文本中形成的二維網(wǎng)絡(luò)圖筆者采用了圖形大小以及連線的寬窄來展示,關(guān)聯(lián)越多的要素,其在圖形中的顯示面積越大,連線越寬,其在相關(guān)文獻(xiàn)中出現(xiàn)的頻次越高。
結(jié)果共提取到345個相關(guān)證型,根據(jù)前述相關(guān)證型的文獻(xiàn)篇數(shù)多少以頻次大小的形式依照順序體現(xiàn),即篇數(shù)=頻次。采用頻次切片方式選擇頻數(shù)較高的前10個列出(括號內(nèi)為文獻(xiàn)篇數(shù),以下同),痰瘀互結(jié)證(108)、肝腎陰虛證(105)、寒熱錯雜證(100)、風(fēng)寒濕痹證(98)、肝腎虧虛證(74)、寒濕阻絡(luò)證(56)、痰瘀痹阻證(53)、風(fēng)濕熱痹證(51)、氣血虧虛證(49)、濕熱阻絡(luò)證(47)。進(jìn)而構(gòu)建類風(fēng)濕關(guān)節(jié)炎證候兩兩之間的關(guān)系網(wǎng)絡(luò)圖(圖1):共提取到126項證候組合,根據(jù)權(quán)重高低選擇前20%(即證候組合頻次>11)參與構(gòu)建網(wǎng)絡(luò)圖。肝腎陰虛證、寒熱錯雜證、風(fēng)寒濕痹證的圓圈較大,代表其相關(guān)的文獻(xiàn)頻次較高,其他證候的頻次偏低。風(fēng)寒濕痹證與風(fēng)濕熱痹證的相關(guān)度較高,頻數(shù)為31。
注:圓圈越大,代表其相關(guān)的文獻(xiàn)頻次越高;證型間相關(guān)度越高,連線越粗圖1 類風(fēng)濕關(guān)節(jié)炎證候網(wǎng)絡(luò)圖
結(jié)果共提取到46個相關(guān)證型,采取頻次切片形式選擇頻數(shù)較高的前10個列出,肝腎虧虛證(124)、陽虛寒凝證(54)、風(fēng)寒濕痹證(45)、肝腎陰虛證(41)、瘀血阻滯證(31)、腎虛血瘀證(25)、寒濕阻絡(luò)證(21)、瘀血阻絡(luò)證(17)、腎虛髓虧證(15)、氣血兩虛證(11)。證候組合共有123項,為保持均衡,仍選前20%(頻次>6)的參與構(gòu)建網(wǎng)絡(luò)圖(圖2)。肝腎虧虛證與氣滯血瘀證、風(fēng)寒濕痹證的顯示度較高,陽虛寒凝證與腎虛髓虧證在關(guān)聯(lián)結(jié)果中的相關(guān)度比較高,頻數(shù)為21。
圖2 骨性關(guān)節(jié)炎證候網(wǎng)絡(luò)圖
結(jié)果共提取到80個相關(guān)證型,同上選擇前10個列出,肝腎虧虛證(36)、肝腎陰虛證(32)、風(fēng)寒濕痹證(14)、瘀血阻絡(luò)證(11)、氣血兩虛證(10)、痰瘀互結(jié)證(10)、痰瘀痹阻證(10)、腎虛血瘀證(8)、風(fēng)濕熱痹證(7)、濕熱阻絡(luò)證(6)。結(jié)果提取到的154項證候組合中選取前20%(頻次>3的證候組合)參與構(gòu)建的網(wǎng)絡(luò)圖(圖3)。肝腎陰虛證、風(fēng)寒濕痹證、瘀血阻絡(luò)證、肝腎虧虛證的顯示度較高。肝腎虧虛證與肝腎陰虛證相關(guān)度較高,頻數(shù)為6。
圖3 強(qiáng)直性脊柱炎證候網(wǎng)絡(luò)圖
類風(fēng)濕關(guān)節(jié)炎、強(qiáng)直性脊柱炎、骨性關(guān)節(jié)炎是3種臨床典型的關(guān)節(jié)性疾病,西醫(yī)學(xué)診斷相對明確,在中醫(yī)理論認(rèn)識中均屬“痹證”范疇。痹證的臨床主要表現(xiàn)為周身關(guān)節(jié)或肌肉的疼痛、腫脹、灼熱、麻木酸脹或活動受限,中醫(yī)理論認(rèn)為:其發(fā)病分為內(nèi)因和外因,內(nèi)因是正氣不足,陰陽失衡所致;外因是由于外邪(風(fēng)、寒、濕、燥、熱)侵犯機(jī)體,留于關(guān)節(jié),注于經(jīng)絡(luò),導(dǎo)致經(jīng)絡(luò)不通,血脈瘀阻,周身關(guān)節(jié)氣血痹阻所致[11]。歷代諸多醫(yī)家對其治療亦各有見地,總則以扶正祛邪、平衡陰陽為主,貫穿于祛風(fēng)通絡(luò)、散寒除濕、清熱散結(jié)等法[12]。
本文重點從3種臨床典型的關(guān)節(jié)性疾病的證候分布規(guī)律來分析,中醫(yī)辨證論治過程中因疾病不同而表現(xiàn)出的不同病理形態(tài)可能在同一證型中[13],或者不同疾病本身發(fā)展過程中出現(xiàn)的病因、病位、病勢、病性的相近是異病同證理論的基礎(chǔ)[14]。從挖掘結(jié)果來看,3種關(guān)節(jié)炎具有共同的病機(jī)、重疊的證候分型,如“肝腎陰虛證”“肝腎虧虛證”“肝腎陰虛證”“痰瘀互結(jié)證”等均可見于3種疾病之中,因此這3種疾病可以作為“異病同證”理論的案例。
“異病同證”中的“證”在病機(jī)基本相似的情況下,如果構(gòu)成證候的主次癥或兼癥不同,所處的地位也不相同[15],如果不辨證分析治療,其療效結(jié)果必然也是參差有別的。所以,在臨床實踐中“異病同證”的理論可以解決其共性;但需要重視更細(xì)微的病機(jī)變化,進(jìn)行選擇性的治療。
在“異病同證”的研究中,除其本身的研究,更多的需要融合多學(xué)科、多技術(shù)的支持,如數(shù)據(jù)挖掘、生物信息學(xué)等[16]。中醫(yī)學(xué)理論的產(chǎn)生源自臨床經(jīng)驗總結(jié)的升華,因此,利用現(xiàn)代技術(shù)進(jìn)行總結(jié)是中醫(yī)證候深入研究的重要內(nèi)容。文本挖掘(Text Mining)綜合了計算機(jī)、數(shù)學(xué)的理論基礎(chǔ),在生物信息、醫(yī)藥以及其他行業(yè)的文獻(xiàn)研究中發(fā)揮了舉足輕重的作用[17],是目前大數(shù)據(jù)時代背景下,在交叉學(xué)科研究中發(fā)現(xiàn)知識關(guān)聯(lián)的運(yùn)用較為廣泛的技術(shù)。本文選取高頻數(shù)的參與網(wǎng)絡(luò)關(guān)系圖的構(gòu)建,展示了臨床上常見疾病的的典型證候,較為直接且客觀的反映了臨床研究的現(xiàn)狀。
4 參考文獻(xiàn)
[1]張弛,張戈,陳可冀,等.從疾病中醫(yī)證候分類到分子模塊分類[J].中國中西醫(yī)結(jié)合雜志,2016,36(7):781-786.
[2]呂愛平.中醫(yī)證候研究:從疾病證候分類到臨床療效評價和組合藥物研發(fā)[J].中國中西醫(yī)結(jié)合雜志,2015,35(8):942-945.
[3]李兵,王忠,張瑩瑩,等.中醫(yī)證候分類研究常用方法與應(yīng)用概述[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2014,20(1):30-33,36.
[4]郭玉明,姜淼,呂愛平.中醫(yī)證候分類研究進(jìn)展[J].中國中醫(yī)藥信息雜志,2011,18(7):106-109.
[5]趙超群,劉暢,劉平,等.基于代謝組學(xué)方法的中醫(yī)證候分類研究進(jìn)展[J].世界中醫(yī)藥,2017,12(4):956-960.
[6]陳可冀, 宋軍.病證結(jié)合的臨床研究是中西醫(yī)結(jié)合研究的重要模式[J].世界科學(xué)技術(shù)——中醫(yī)藥現(xiàn)代化,2006,8(2):1-5.
[7]呂愛平, 陳可冀.疾病的證候分類研究思路[J].中國中西醫(yī)結(jié)合雜志,2005,26(9):843-845.
[8]李仲賢,鄭光,展俊平,等.基于文本挖掘技術(shù)探索強(qiáng)直性脊柱炎“理-法-方-藥”相應(yīng)規(guī)律[J].蘭州工業(yè)學(xué)院學(xué)報, 2013,20(2):23-26.
[9]展俊平,吳萍,郭洪濤,等.基于文本挖掘技術(shù)的慢性阻塞性肺疾病臨床用藥規(guī)律分析[J].中國中醫(yī)藥信息雜志,2011,18(12):27-30.
[10]沈姍姍,鄭光,展俊平,等.基于數(shù)據(jù)挖掘探討類風(fēng)濕關(guān)節(jié)炎證-癥-法-方藥規(guī)律[J].風(fēng)濕病與關(guān)節(jié)炎,2013,2(10):5-9.
[11]王倩,樊新榮,郭浩.中醫(yī)“治未病”思想指導(dǎo)“痹癥”防治[J].內(nèi)蒙古中醫(yī)藥,2017,36(3):157-158.
[12]張欣.中醫(yī)辨證治療痹證的臨床療效分析[J].中國醫(yī)藥指南,2014,12(36):250.
[13]王海平.探析中醫(yī)痹證的治療[J].首都醫(yī)藥,2014,21(14):76.
[14]徐慧.《中醫(yī)內(nèi)科學(xué)》“異病同治”用方規(guī)律探析[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2015,21(6):737-738.
[15]楊娜,趙京紅.基于中醫(yī)理論指導(dǎo)下異病同治(痰瘀互阻證)的臨床研究[J].中國實用醫(yī)藥,2014,9(26):245-246.
[16]桑海龍,李建中.基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)信息分析方法[J].智能計算機(jī)與應(yīng)用,2018,8(1):183-187.
[17]ANANIADOU S,THOMPSON P,NAWAZ R,et al.Event-based text mining for biology and functional genomics[J]. Brief Funct Genomics,2015,14(3):213-230