展俊平,張 彤,鄭 光,呂 誠,蔡 峰,楊 靜,何曉鵑,梁 非,5,呂愛平,姜 淼△
(1.上海中醫(yī)藥大學(xué),上海 201203;2.中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700;3.南陽醫(yī)學(xué)高等專科學(xué)校,河南 南陽 473061;4.蘭州大學(xué)數(shù)學(xué)院,蘭州 730000;5.北京化工大學(xué)生命科學(xué)與技術(shù)學(xué)院,北京 100029)
抑郁癥(Depression)是一種常見的心境障礙,可由各種原因引起,以顯著而持久的心境低落為主要臨床特征。迄今為止,抑郁癥病因與發(fā)病機制還不明確,也無明顯的體征和實驗室指標(biāo)異常,概括地說是生物、心理、社會(文化)因素相互作用的結(jié)果,屬中醫(yī)學(xué)“郁證”、“百合病”范疇。中醫(yī)藥配合西藥治療抑郁癥為臨床常用方案。中西醫(yī)治療抑郁癥的文獻在醫(yī)學(xué)文獻數(shù)據(jù)庫中已大量存在。本文利用課題組逐漸成熟的文本挖掘技術(shù)[1],探索抑郁癥證藥相應(yīng)規(guī)律。
在中國生物醫(yī)學(xué)文獻數(shù)據(jù)庫(CBM,http://sinomed.cintcm.ac.cn/index.jsp)中,以“缺省”狀態(tài)下檢索“抑郁癥”共得到文獻27509篇(檢索日期:2011年12月19日),依次下載所有文獻并保存。
將收集來的數(shù)據(jù)按照下載的先后順序整合到一個平面文件(后綴txt)里面,以ANSI編碼格式保存。然后利用專有的文本提取工具(軟件著作權(quán),軟著登字第0261882號,登記號2010SR073409),對下載的非結(jié)構(gòu)化的txt文本數(shù)據(jù)進行信息提取,保存成格式化的、便于大型關(guān)系型數(shù)據(jù)庫(Microsoft SQL Server,以下簡稱 SQL)處理的格式,導(dǎo)入 SQL中進行下一步的挖掘分析,據(jù)此構(gòu)建算法進行數(shù)據(jù)清洗工作[1]。清洗完畢后的數(shù)據(jù)即可以提取。
假設(shè)每一篇文獻的貢獻度是相同的,一篇文獻中重復(fù)出現(xiàn)的關(guān)鍵詞,只需要計挖掘?qū)ο蟮囊痪S頻次,也可以得到挖掘?qū)ο蟮亩S關(guān)系,進行可視化呈現(xiàn)。抽出不同頻次的關(guān)鍵詞對,用Cytoscape 2.8軟件進行可視化處理,形成可視化的網(wǎng)絡(luò)圖,然后結(jié)合專業(yè)知識進行解析。一旦發(fā)現(xiàn)不合理的結(jié)果,即回溯原文獻數(shù)據(jù)集,如果是噪音,仍按算法進行噪音清洗,直至噪音降到滿意為止。最后的結(jié)果可視化成圖,結(jié)合專業(yè)知識進行解析。
文本挖掘共提取到110個證型,選擇前15個列出(括號內(nèi)為文獻篇數(shù),以下同):肝氣郁結(jié)(195)、肝郁脾虛(76)、心脾兩虛(74)、肝郁氣滯(52)、腎陰虛(34)、肝腎陰虛(29)、痰濕阻肺(26)、腎陽虛(19)、氣滯血瘀(16)、心腎不交(15)、心神不寧(12)、氣郁化火(11)、氣滯證(11)、脾腎陽虛(11)、膽氣虛(11)。由于構(gòu)建詞表及挖掘詞的包含關(guān)系,出現(xiàn)以上結(jié)果重復(fù)的現(xiàn)象,挖掘詞越短,挖掘到的頻次越高。結(jié)果基本反映了抑郁癥證候的特征,肝氣郁結(jié)、肝郁脾虛最多,其次為心脾兩虛和肝郁氣滯。
進而構(gòu)建抑郁癥證候兩兩之間網(wǎng)絡(luò)關(guān)系圖(圖1):圖中圓圈內(nèi)為證型名稱,連線代表證候兩兩之間的聯(lián)系。證候的連線越多,代表該證型與疾病的關(guān)聯(lián)程度越高,越處于核心的位置;圓圈越大,代表該證型在文獻中出現(xiàn)的頻次越高,其權(quán)重越大。
圖1 抑郁癥證候網(wǎng)絡(luò)圖
文本挖掘共提取到540項證候組合,圖1為頻次大于6的證候組合參與構(gòu)建的網(wǎng)絡(luò)圖。圖1顯示,心脾兩虛、肝郁氣滯、肝氣郁結(jié)、肝郁脾虛的圓圈最大,其相應(yīng)的文獻頻次最高,其中肝氣郁結(jié)-肝郁脾虛的頻次為44。左上側(cè)橢圓內(nèi)為陰虛證候,包括肝腎陰虛、腎陰虛、陰虛證、陰虛火旺及重復(fù)的證候;左下側(cè)橢圓為陽虛證候,包括腎陽虛、脾腎陽虛及重復(fù)的證候;右側(cè)橢圓為肝郁證候,包括肝郁氣滯、肝郁脾虛、肝氣郁結(jié)及重復(fù)的證候,兩個橢圓交匯于陰陽兩虛證等,其他證候頻次較低。歸納這些證候,抑郁癥虛實夾雜,主要以肝郁和陰虛為主;相關(guān)臟腑以肝為主,涉及心、脾、腎。
文本挖掘的癥狀,既包含西醫(yī)臨床也包含中醫(yī)臨床報告的癥狀。文本挖掘共提取到癥狀185項,選擇前15項列出:失眠(575)、功能障礙(489)、情緒低落(436)、消極(293)、頭痛(272)、惡心(238)、悲觀(236)、口干(212)、自責(zé)(189)、絞痛(173)、便秘(170)、頭暈(157)、抽搐(147)、煩躁(141)、精神抑郁(124)?;厮菰墨I發(fā)現(xiàn),其中“功能障礙”為認知或者執(zhí)行功能障礙/內(nèi)分泌功能障礙、某種激素受體的功能障礙,是對抑郁癥癥狀或者病因的總體解釋;“絞痛”為冠心病或者不穩(wěn)定型心絞痛合并抑郁癥出現(xiàn)的癥狀,屬合并疾病的癥狀;“抽搐”大多為無抽搐電休克/痙攣(MECT/ECT)治療,為抑郁癥治療方式中的一個關(guān)鍵詞。由上可知,抑郁癥是一種以精神障礙為主,伴發(fā)其他系統(tǒng)癥狀的疾病。
進一步文本挖掘共提取到1891項癥狀組合,選取頻次大于等于30的組合構(gòu)建癥狀網(wǎng)絡(luò)圖如下(圖2)。
圖2 抑郁癥癥狀網(wǎng)絡(luò)圖
圖2顯示,失眠、情緒低落、悲觀、惡心、頭暈(頭昏、頭痛)等為頻次較高的癥狀,其他主要涉及嘔吐、口干、食欲不振、便秘等消化系統(tǒng)癥狀(左橢圓內(nèi))。消化系統(tǒng)癥狀多為抑郁癥最常見的伴隨癥狀,而頭暈、頭痛、乏力、煩躁等神經(jīng)系統(tǒng)癥狀表現(xiàn)亦較為顯著,為抑郁癥常見軀體周邊癥狀。由此可見,抑郁癥是以精神障礙為主,同時伴隨神經(jīng)和消化系統(tǒng)兩大軀體癥狀表現(xiàn)的疾病,這些癥狀和前面挖掘的主要證候肝郁和陰虛相一致。
文本挖掘共提取到相關(guān)湯藥名稱84個,選擇前15個排序為:逍遙散(154)、柴胡疏肝散(59)、溫膽湯(40)、甘麥大棗湯(35)、銀杏葉(27)、歸脾湯(26)、越鞠丸(24)、小柴胡湯(24)、血府逐瘀湯(19)、半夏厚樸湯(18)、加味逍遙散(15)、疏肝解郁湯(14)、百合地黃湯(13)、滋水清肝飲(10)、黃連溫膽湯(9),其中銀杏葉多為銀杏葉片、銀杏葉提取物等,聯(lián)合西藥治療抑郁癥。
文本挖掘共提取到中藥組合1001項,選取頻次大于等于8的中藥組合構(gòu)湯藥網(wǎng)絡(luò)圖(圖3)。
圖3 抑郁癥湯藥治療網(wǎng)絡(luò)圖
圖3顯示,湯藥聯(lián)合運用中,高頻數(shù)的以逍遙散為核心,此方劑疏肝解郁、養(yǎng)血健脾,主治肝郁血虛脾弱證,與前面挖掘出來的證候結(jié)果相一致(其中肝氣郁結(jié)-肝郁脾虛的頻次為44);歸脾湯、甘麥大棗湯聯(lián)合主治心脾兩虛,用以養(yǎng)心安神(肝氣郁結(jié)-心脾兩虛頻數(shù)為42);百合地黃湯、六味地黃湯、天王補心丹主治陰虛證候。
文本挖掘共提取到相關(guān)中藥名稱157個,選擇前 15個排序為:海馬(319)、柴胡(174)、艾葉(133)、百合(49)、郁金(42)、天冬(41)、大棗(41)、半夏(40)、龍骨(38)、連翹(36)、生牡蠣(36)、生地黃(33)、杏仁(32)、白芍(30),其中海馬、杏仁、天冬為異常中藥?;厮菰墨I發(fā)現(xiàn),“海馬”大多為海馬神經(jīng)元或者海馬組織;“杏仁”多為腦組織的杏仁核體,用以對抑郁癥病變機理的研究;“天冬”多為 N-甲基-D-天冬氨酸受體(NMDAR1)含量,用以檢測藥物作用及其作用機制。通過降噪,抑郁癥中藥飲片以柴胡、百合、郁金、大棗等為核心藥物,這些藥物以疏肝解郁安神為主。
文本挖掘共提取到中藥組合1001項,選取頻次大于等于8的中藥組合構(gòu)建中藥網(wǎng)絡(luò)圖(圖4)。
圖4 抑郁癥中藥網(wǎng)絡(luò)圖
圖4顯示,柴胡、茯苓、半夏、郁金頻次最高,為治療抑郁癥的核心藥物,其他如菖蒲、當(dāng)歸、白芍等次之。挖掘到的藥物按配伍組方來區(qū)分,中間運用最廣的是柴胡、茯苓、白芍、當(dāng)歸、甘草為方劑逍遙散的主藥,而柴胡、白芍、香附、川芎、甘草為柴胡疏肝散的主藥,左邊橢圓內(nèi)石菖蒲、半夏、竹茹、陳皮、枳實、厚樸均為溫膽湯的主要組方,這3個方劑和上述湯藥文本挖掘中的一維頻數(shù)結(jié)果相一致,說明是抑郁癥的常用藥。從藥性上來解讀,以疏肝解郁理氣藥柴胡、香附、川芎、陳皮、厚樸、郁金為主,養(yǎng)陰藥以當(dāng)歸、白芍、為核心,安神藥以龍骨、生牡蠣、百合為主。
文本挖掘(Text Mining)技術(shù)是以統(tǒng)計數(shù)理分析、計算語言學(xué)為理論基礎(chǔ),服務(wù)于醫(yī)藥、生物、文獻研究等學(xué)科的新興交叉學(xué)科[2]。在中醫(yī)藥領(lǐng)域,此方法從某種層次上促進了中醫(yī)臨床研究和中藥復(fù)方研發(fā)等多個方面[3],為中西醫(yī)結(jié)合研究提供了新的思路和途徑,且結(jié)果更加客觀,可重復(fù)性強[4]。
抑郁癥屬中醫(yī)學(xué)郁證范疇,中醫(yī)認為郁證的發(fā)生多因郁怒、思慮、悲哀、憂愁等七情之所傷,導(dǎo)致肝失疏泄、脾失運化、心神失常,臟腑陰陽氣血失調(diào)而成,主要表現(xiàn)為心情抑郁、情緒不寧、脅肋脹痛或易怒善哭以及咽中如有異物梗阻、失眠等各種復(fù)雜癥狀[5]。中醫(yī)根據(jù)辨證施治的原則,或?qū)⒁钟舭Y分為虛證、實證或者虛實夾雜,或?qū)⑵浞譃楦螝庥艚Y(jié)、郁久化火、氣滯血瘀、心脾兩虛、陰虛火旺等若干證型,治療則以疏肝理氣解郁為主[6]。
本研究針對從CBM收集到相關(guān)抑郁癥的27509篇文獻,采用課題組逐漸成熟的文本挖掘技術(shù)[1],結(jié)合回溯原文獻、人工閱讀降噪,對抑郁癥從證候、癥狀、湯藥、中藥規(guī)律等方面進行挖掘,挖掘的結(jié)果既看到它們在文獻中的頻次,又可以發(fā)現(xiàn)它們各自在關(guān)聯(lián)網(wǎng)絡(luò)中的分布規(guī)律。從挖掘的結(jié)果來看,抑郁癥虛實夾雜,日久以虛證多見,涉及氣、血、濕、痰等,相關(guān)臟腑以肝為主,涉及心、脾、腎;證候方面以心脾兩虛、肝氣郁結(jié)、肝郁脾虛為主,從二維圖形來看,主要分為肝郁和陰虛兩大類;核心癥狀為失眠、情緒低落、悲觀厭世等精神障礙,伴隨惡心、乏力、頭暈、頭痛等軀體周邊癥狀,其中精神抑郁、煩躁易怒為肝氣郁結(jié)的體現(xiàn),而頭暈、頭痛、乏力、口干、便秘等主要為陰虛和脾虛癥狀;湯藥和中藥的使用均以疏肝解郁、健脾養(yǎng)心安神為主,臨床遣方用藥以逍遙散、柴胡疏肝散為主,與挖掘出的證候結(jié)果肝氣郁結(jié)、肝郁脾虛相互對應(yīng),證候-癥狀-湯藥-中藥3個方面互相呼應(yīng)和印證,基本反映了抑郁癥這種疾病的證藥相應(yīng)規(guī)律。
文本挖掘的結(jié)果,選取高頻數(shù)的參與網(wǎng)絡(luò)關(guān)系圖的構(gòu)建,展示臨床上的常見證候、常用藥物的使用,直接客觀地反映臨床研究的現(xiàn)狀。回溯原文獻,人工閱讀評價,使得結(jié)果更加客觀,一維頻次和二維網(wǎng)絡(luò)構(gòu)圖,從不同角度顯示挖掘?qū)ο笤谖墨I數(shù)據(jù)集中的分布,均有不同的意義。如中藥結(jié)果中,一維頻次海馬最高,其大多為大腦海馬神經(jīng)區(qū);而在二維網(wǎng)絡(luò)中就很低,這是因為海馬很少參與二維網(wǎng)絡(luò)的構(gòu)建。因此,通過這種優(yōu)化的文本挖掘組合,能夠比較客觀地總結(jié)中醫(yī)病、證、藥的規(guī)律,可以為中醫(yī)客觀化以及中醫(yī)臨床提供有益的參考。
[1]Zheng G ,et al,Discrete derivative:a data slicing algorithm for exploration of sharingbiological networks between rheumatoid arthritis and coronary heart disease[J].BioData Min,2011,4(18):1-21.
[2]薛為民,等.文本挖掘技術(shù)研究[J].北京聯(lián)合大學(xué)學(xué)報(自然科學(xué)版),2005,19(4):59-63.
[3]Zheng G,et al,Two Dimensions Data Slicing Algorithm,a New Approach in Mining Rules of Literature in Traditional Chinese Medicine,in Communicationsin Computerand Information Science,2011,Springer-Verlag Berlin Heidelberg:161-174.
[4]Li S, etal, UnderstandingZHENG in traditionalChinese medicine in the context of neuro-endocrine-immune network[J].IET Syst Biol,2007.1(1):51-60.
[5]韓翠欣,等,抑郁癥的中醫(yī)治療現(xiàn)狀[J].河北中醫(yī),2007,29(8):767-768.
[6]馮廣玲,中西醫(yī)結(jié)合治療抑郁癥[J].中醫(yī)藥管理雜志,2006,14(4):55.