盧恩仕,韓明光,劉祖發(fā)
1.中國中醫(yī)科學院望京醫(yī)院,北京 100102;2.北京大學數(shù)學科學學院,北京 100871
中醫(yī)藥以其獨特的理論和實踐體系在疾病診療中發(fā)揮著重要作用,但中醫(yī)辨證多依靠主觀經(jīng)驗,缺乏客觀標準,這在一定程度上阻礙了中醫(yī)藥現(xiàn)代化的發(fā)展。相較于傳統(tǒng)研究方法,數(shù)據(jù)挖掘技術能夠較好地處理模糊、非線性、不完整的數(shù)據(jù)[1],有利于促進中醫(yī)藥標準化、數(shù)字化及信息化發(fā)展[2-3]。利用數(shù)據(jù)挖掘技術進行中醫(yī)藥現(xiàn)代化研究,已成為推動中醫(yī)藥發(fā)展不可或缺的環(huán)節(jié)。
目前,基于貝葉斯網(wǎng)絡的概率圖模型已廣泛應用于人工智能、生物信息學和醫(yī)療大數(shù)據(jù)等眾多領域[4-5]。貝葉斯網(wǎng)絡能夠根據(jù)先驗知識及概率統(tǒng)計,對未知事件進行預測[6],其推理是在推導數(shù)理、計算概率、設定閾值等基礎上建立起來的,具有明確的推理過程及精確度較高的結論表達。
貝葉斯網(wǎng)絡作為一種信念網(wǎng)絡[7],具有有向無環(huán)性,能夠利用有向邊的連接表示各節(jié)點之間的因果關系。這種有向邊能夠直觀地表達變量之間的依存關系,即直接連接兩個節(jié)點的邊表示兩節(jié)點有直接依賴關系。貝葉斯網(wǎng)絡的理論基礎是條件獨立性假設和貝葉斯定理,是一種利用不確定性問題中各變量之間邏輯依賴關系建模的概率圖模型,在處理不確定問題時具有較強的穩(wěn)定性能。
(1)
(2)
式(2)中:x1,x2,L,xn是節(jié)點集合,pa(xi)是節(jié)點xi的父節(jié)點集合,p(x1,x2,L,xn)是網(wǎng)絡所有節(jié)點的聯(lián)合分布。
如圖1所示,有向無環(huán)圖即典型的貝葉斯網(wǎng)絡[8]。它包含一個結構模型和與該結構相關的條件概率密度函數(shù),節(jié)點為隨機變量,表示對事件、狀態(tài)等特征抽象表示;直接連接兩個節(jié)點的邊表示兩節(jié)點有直接依賴關系,該關系常常是一種因果關系??紤]隨機變量集合U={x1,x2,L,xn},每個變量xi的狀態(tài)有限,P是網(wǎng)絡節(jié)點處的條件概率分布,表征各隨機變量之間關系的強弱。根據(jù)條件獨立性應用于鏈式規(guī)則,圖1貝葉斯網(wǎng)絡的聯(lián)合概率分布為
圖1 典型的貝葉斯網(wǎng)絡
p(x9|x6)p(x8|x5,x6)p(x7|x5)p(x6|x3,x4)g
p(x5|x2,x3)p(x4|x1)p(x2|x1)p(x1)
(3)
2.1 基于貝葉斯網(wǎng)絡探究中醫(yī)證候規(guī)律中醫(yī)“辨證”是指通過分析癥狀、體征等證候規(guī)律,提取病位、病性等證候要素,并在此基礎上診斷中醫(yī)證型的思維過程?!氨孀C”的關鍵在于辨證候要素,但中醫(yī)辨證多取決于臨床醫(yī)師的個人經(jīng)驗,受主觀因素影響,難以形成客觀統(tǒng)一的辨證標準。而貝葉斯網(wǎng)絡能夠模擬人腦思維過程,學習醫(yī)師在臨床中積累經(jīng)驗的方式,在此基礎上挖掘數(shù)據(jù)中的隱藏變量[9-10],通過概率分析其可能性,提取證候要素,展現(xiàn)癥狀、證候要素及證型間的相互關系[11],從而使復雜且高度非線性的中醫(yī)辨證系統(tǒng)可量化。
孫文軍等[12]通過建立閾下焦慮抑郁患者的貝葉斯網(wǎng)絡模型,從中提取肝郁脾虛、心腎不交、心脾兩虛3種常見證型及其主次癥狀。Zhang等[13]運用貝葉斯網(wǎng)絡探究男性不育癥的中醫(yī)證候特征,通過建立隱樹模型,發(fā)現(xiàn)男性不育患者的基本中醫(yī)證候特征為腎陽虛、腎氣虛、脾陽虛、肝氣郁結、氣滯血瘀等,證型多為脾腎陽虛、肝氣郁滯證型,而非單一證型。薛亞靜[14]利用貝葉斯網(wǎng)絡探究523例焦慮抑郁共病患者的中醫(yī)證候規(guī)律,從中獲得17個證候要素及7個證候類型。楊洋等[15]建立了胃癌證型間的貝葉斯網(wǎng)絡,從中提取6種證型,并與專家的辨證結果進行比較,發(fā)現(xiàn)二者有著較高的吻合率,證實了貝葉斯網(wǎng)絡在中醫(yī)辨證中的有效性。
在中醫(yī)證候研究中,相較于其他數(shù)據(jù)挖掘方法,貝葉斯網(wǎng)絡技術準確率更高。吳宏進等[16]利用貝葉斯網(wǎng)絡算法、支持向量機算法、K最近鄰(k-nearest neighbor,KNN)分類算法3種數(shù)據(jù)挖掘方法探究圍絕經(jīng)期綜合征中醫(yī)證型,經(jīng)比較,發(fā)現(xiàn)貝葉斯網(wǎng)絡有著最高的正確率及最小的標準誤差,在證型分類方面效果優(yōu)于另外2種算法。李仕進等[17]分別運用貝葉斯算法及KNN算法進行古方“癥-證”間的關聯(lián)性研究,實驗表明貝葉斯算法的正確率高于KNN算法,在中醫(yī)“癥-證”分析研究中更加具有優(yōu)勢。
2.2 貝葉斯網(wǎng)絡在名老中醫(yī)經(jīng)驗傳承的應用貝葉斯網(wǎng)絡技術可將名老中醫(yī)的辨證經(jīng)驗轉化為客觀定量的數(shù)據(jù)表達[18],從中提取證候要素并運用條件概率分析相關癥狀的貢獻度,展現(xiàn)名老中醫(yī)的辨證思路,為名老中醫(yī)經(jīng)驗傳承提供新方式。
吳榮等[18]利用貝葉斯網(wǎng)絡探究名老中醫(yī)治療冠狀動脈粥樣硬化性心臟病的中醫(yī)證候規(guī)律,從中提取8個證候要素,發(fā)現(xiàn)其中最主要的證型為血瘀證,最常見的證候為氣虛痰濁血瘀證。甘小金等[19]運用貝葉斯網(wǎng)絡探討王子瑜教授治療子宮內(nèi)膜異位癥的辨證規(guī)律,其中最常見的單一證候要素為血瘀證,最常見的證素組合為氣滯血瘀及腎虛血瘀,這與王子瑜教授的學術思想相吻合。
2.3 貝葉斯網(wǎng)絡在中藥藥性研究中的應用中藥藥性理論是中醫(yī)藥理論的重要組成部分,但中藥具有成分復雜、功效多樣及靶點多的特點[20],傳統(tǒng)研究方法多為局部研究,缺乏整體性及系統(tǒng)性,貝葉斯網(wǎng)絡能夠直觀地展現(xiàn)中藥藥性與功效間、功效與藥理間的復雜網(wǎng)絡關系[21],探究其背后的因果規(guī)律,為中藥組分藥性及分子水平的研究奠定了基礎[22]。
邢雁輝等[23]建立中風中藥組方的貝葉斯模型,以探究中藥、證候與療效間的相互關系,對單味中藥藥效進行預測,并提取在疾病治療中具有良好功效的中藥,為新藥研發(fā)提供了相關的技術支持。沈忱等[24]運用貝葉斯網(wǎng)絡建立活血化瘀類中藥及其藥理作用間的數(shù)據(jù)模型,通過計算二者間的概率值,并利用所構建的數(shù)據(jù)模型對疑似有活血化瘀作用的中藥進行預測,驗證其功效。齊方等[25]運用貝葉斯網(wǎng)絡探究中藥的整體藥性與物質(zhì)成分間的關系,發(fā)現(xiàn)由偏最小二乘判別模型選擇出的37個藥性特征標記作為節(jié)點所構建的中藥整體藥性貝葉斯模型具有較高的靈敏度、特異性以及較強的中藥藥性判別能力。張培等[26]建立中藥有效組分五味與藥理間關系的貝葉斯網(wǎng)絡模型,在此基礎上進行中藥五味的預測,有利于促進中藥組分藥性及組分配伍的進一步研究。
2.4 貝葉斯網(wǎng)絡在疾病干預措施療效評價中的應用近年來,貝葉斯網(wǎng)絡多與Meta分析相結合,用于對疾病多種干預措施的系統(tǒng)評價。相較于傳統(tǒng)Meta分析,網(wǎng)狀Meta分析準確性、穩(wěn)定性及靈活性更高,且能對不同的療法進行療效及安全性排序[27-28],使評價更加客觀、全面。
貝葉斯網(wǎng)狀Meta分析常用于分析不同中藥注射劑在疾病中的療效,并從中進行最優(yōu)選擇。黃培穎等[29]運用貝葉斯網(wǎng)絡Meta分析探究6種中藥注射劑與抗病毒類西藥聯(lián)合應用于流行性感冒的治療效果,發(fā)現(xiàn)在退熱、鎮(zhèn)咳、住院時間及不良反應方面,喜炎平、清開靈及熱毒清注射液分別發(fā)揮了最佳的療效。Tan等[30]利用貝葉斯網(wǎng)狀Meta分析探究銀杏注射液聯(lián)合常規(guī)治療冠狀動脈粥樣硬化性心臟病心絞痛的臨床療效及安全性,研究顯示銀杏注射液聯(lián)合常規(guī)治療冠狀動脈粥樣硬化性心臟病心絞痛優(yōu)于單純常規(guī)治療。Liu等[31]運用貝葉斯網(wǎng)狀Meta分析探究雷公藤甲素治療特應性濕疹的療效及安全性,研究表明雷公藤甲素在與其他藥物聯(lián)合治療特應性濕疹時協(xié)同作用較強,具有一定的臨床療效,但不良反應較為明顯。
此外,貝葉斯網(wǎng)狀Meta分析也常用于針灸、推拿及傳統(tǒng)運動等中醫(yī)療法的綜合評價中。Pang等[32]利用貝葉斯網(wǎng)狀Meta分析探究8種針灸方法治療神經(jīng)性耳鳴的臨床療效,發(fā)現(xiàn)這些干預措施對神經(jīng)性耳鳴的治療均有效果,其中艾灸的療效呈上升趨勢。Li等[33]利用貝葉斯網(wǎng)狀Meta分析探究八段錦、六字訣、太極拳及氣功4種中國傳統(tǒng)運動對認知功能障礙患者的治療效果,發(fā)現(xiàn)4種中國傳統(tǒng)運動對患者整體認知功能均有改善作用,其中八段錦效果最為明顯。
傳統(tǒng)中醫(yī)四診的辨別多取決于主觀經(jīng)驗,缺乏客觀標準,而以貝葉斯網(wǎng)絡等為主體的現(xiàn)代計算機技術為四診信息的采集提供了客觀依據(jù),促進了舌診、脈診等中醫(yī)特色診斷的標準化發(fā)展以及中醫(yī)診斷方法的客觀化、規(guī)范化。
Wang等[34]提出了一種定量的人體脈搏信號自動識別方法。通過提取特征參數(shù),構建基于貝葉斯網(wǎng)絡的識別模型,結果證實該方法可有效識別脈搏信號的深度、頻率、節(jié)律、強度和形狀,有利于推動脈搏診斷的現(xiàn)代化。Pang等[35]建立了一種新的計算機化舌診系統(tǒng),利用貝葉斯網(wǎng)絡對色度量和紋理度量這兩種定量特征與疾病之間的關系進行建模,在455名患有13種常見疾病的患者和70名健康志愿者身上測試了該方法,并證實了其有效性。Yan等[36]基于貝葉斯網(wǎng)絡等計算機方法提出了基于像素及低對比度的彩色舌下圖像的舌下靜脈分割算法,實驗結果表明該算法對彩色舌下圖像的舌下靜脈分割具有較好的效果,且該框架量化的寬度和顏色特征與舌診總結的診斷標準基本一致。
中醫(yī)診療強調(diào)辨證論治,個體化診療一直是中醫(yī)學的優(yōu)勢所在,貝葉斯網(wǎng)絡技術能夠模擬人腦的學習和思維的過程,探究癥狀、證候要素、證型及方藥間的關聯(lián)性,使復雜且高度非線性的中醫(yī)臨床數(shù)據(jù)可量化,因此已廣泛應用于中醫(yī)藥數(shù)據(jù)挖掘中[37]。除此之外,以四診技術為核心的現(xiàn)代診斷技術逐漸向數(shù)據(jù)化及標準化發(fā)展[38],舌診儀、脈診儀、色診儀[39]等診療儀器的研發(fā)促進了中醫(yī)診療客觀化發(fā)展,這些都為中醫(yī)輔助診療系統(tǒng)的建立奠定了良好的基礎。在此基礎上,利用貝葉斯網(wǎng)絡建立中醫(yī)輔助診療系統(tǒng),有利于促進中醫(yī)智能化診療的發(fā)展。
基于貝葉斯網(wǎng)絡的中醫(yī)疾病輔助診斷系統(tǒng)的構建大致可分為四步:①確定網(wǎng)絡變量。根據(jù)專家經(jīng)驗和收集到的數(shù)據(jù),將與該疾病相關的病位和癥狀進行統(tǒng)計,作為疾病發(fā)生的依據(jù),然后把這些依據(jù)作為網(wǎng)絡變量,對其數(shù)據(jù)進行量化處理。②建立模型。依據(jù)所選取的數(shù)據(jù)選擇相應的貝葉斯網(wǎng)絡結構學習算法,獲得貝葉斯網(wǎng)絡疾病診斷網(wǎng)絡。利用數(shù)據(jù)選擇相應的參數(shù)學習方法對網(wǎng)絡進行參數(shù)學習,獲得具有最佳參數(shù)設置的貝葉斯網(wǎng)絡。③網(wǎng)絡推理,后驗查詢。采集多組患者信息,運用貝葉斯網(wǎng)絡進行推理,對可能存在的各類疾病進行概率計算。④疾病診斷分析。比較各類疾病發(fā)生的后驗概率,概率最大的疾病即為診斷得出的疾病類型。
目前,已有部分學者對此進行了相關探索。賈小飛[40]利用貝葉斯網(wǎng)絡建立中西醫(yī)結合疼痛康復管理系統(tǒng),對疾病進行中醫(yī)辨證、病理因素的診斷及最佳治療方案的推薦,以對康復過程進行智能化、精準化管理。孫亞男等[41]利用貝葉斯算法建立了冠狀動脈粥樣硬化性心臟病的中醫(yī)證型診斷模型,發(fā)現(xiàn)貝葉斯模型在中醫(yī)診斷中有著較好的分類性能,可提高臨床辨證的準確性。陳曦等[42]建立了基于貝葉斯網(wǎng)絡的中醫(yī)輔助診療模型,為患者進行自我早期疾病診斷提供了有效的技術支持。
貝葉斯網(wǎng)絡技術在中醫(yī)藥研究的諸多領域均已發(fā)揮了重要作用,但仍具有不足之處,首先,實現(xiàn)數(shù)據(jù)分析的客觀性需要大樣本數(shù)據(jù)的支持,擴大樣本量、提高樣本質(zhì)量是進一步實現(xiàn)數(shù)據(jù)分析客觀性的必要選擇。其次,貝葉斯網(wǎng)絡算法利用頻率進行,一旦出現(xiàn)頻率較低的癥狀、證候要素及證型,算法會在變量篩選的過程中將其舍棄,導致信息獲取不夠全面,使結果的準確性受到影響[6],因此如何更多地獲取高質(zhì)量樣本和精進算法仍然是今后需要不斷研究及探索的方向。
貝葉斯網(wǎng)絡技術的信息處理過程與中醫(yī)辨證思維相吻合,目前已廣泛應用于中醫(yī)藥數(shù)據(jù)挖掘及現(xiàn)代化中醫(yī)診斷技術中,將復雜多樣的中醫(yī)數(shù)據(jù)轉變成客觀、可量化的標準。在此基礎上,中醫(yī)輔助診療系統(tǒng)建立并不斷完善,促進了臨床輔助診療及遠程醫(yī)療的發(fā)展[43-44]。隨著貝葉斯網(wǎng)絡技術在中醫(yī)藥研究中的不斷深入,建立智能化的中醫(yī)藥診療系統(tǒng)將是下一步的發(fā)展目標。通過智能化的診療系統(tǒng),進行疾病診斷并提供個體化的治療處方及調(diào)理建議,有助于充分發(fā)揮中醫(yī)藥“未病先防,既病防變”的診療優(yōu)勢,實現(xiàn)精準化的個體診療,同時緩解醫(yī)療資源緊缺的狀況。今后需進一步加強貝葉斯網(wǎng)絡在中醫(yī)藥現(xiàn)代化健康管理中的應用,真正發(fā)揮中醫(yī)藥在新時代健康管理中的作用。