余 欽, 余 宋, 洪 靖, 魯 健, 梁淑芳, 劉 群, 程彬彬,陳建國,5, 郭曉冬△, 翟笑楓,△
(1.上海中醫(yī)藥大學(xué)附屬岳陽中西醫(yī)結(jié)合醫(yī)院, 上海 200437;2.中國人民解放軍海軍軍醫(yī)大學(xué)中醫(yī)系,上海 200433;3.江蘇省啟東肝癌防治研究所,江蘇 啟東 226200;4.中國人民解放軍海軍軍醫(yī)大學(xué)第一附屬醫(yī)院, 上海 200433;5.南通大學(xué)附屬腫瘤醫(yī)院,江蘇 南通 226231)
中醫(yī)證候辨證規(guī)范化研究一直是中醫(yī)發(fā)展現(xiàn)代化及中西醫(yī)有效結(jié)合的重要問題,中醫(yī)辨證涉及到對患者進(jìn)行分類[1,2]。聚類分析(cluster analysis)是根據(jù)事物自身的特性,對被聚類對象進(jìn)行類別劃分的統(tǒng)計(jì)分析方法,屬于探索性無監(jiān)督統(tǒng)計(jì)方法[3];因子分析是運(yùn)用降維的思想通過消除數(shù)據(jù)的多元共線性,探索能綜合所有指標(biāo)主要信息相對獨(dú)立的潛在變量分析方法[4]。聚類分析和因子分析均屬于多元統(tǒng)計(jì)分析方法,在挖掘從癥狀到證候的關(guān)系時,單個方法只能從單一角度進(jìn)行分析,在癥狀屬于多種證候或患者具有兼夾證候的情況下無法進(jìn)行多角度分析,不符合中醫(yī)辨證的臨床實(shí)際[5]。隱結(jié)構(gòu)分析是基于統(tǒng)計(jì)學(xué)和概率知識對癥狀數(shù)據(jù)進(jìn)行分析的方法,找出隱變量并建立相應(yīng)的隱結(jié)構(gòu)模型(latent structure model,LSM),再根據(jù)模型對患者進(jìn)行聚類劃分,不僅可以辨析癥狀之間的復(fù)雜關(guān)系,對癥狀進(jìn)行分類、挖掘特征人群,彌補(bǔ)其他方法的不足,還可以揭示病種的證候特點(diǎn),發(fā)掘出新的中醫(yī)學(xué)理論知識,更接近中醫(yī)的辨證論治體系,優(yōu)于上述其他統(tǒng)計(jì)方法[6,7]。
本研究利用Latern 5.0軟件(香港科技大學(xué)計(jì)算機(jī)科學(xué)及工程學(xué)系.孔明燈隱結(jié)構(gòu)分析軟件.http://www.cse.ust.hk/~lzhang/tcm/resource.html.)中的最優(yōu)雙步隱樹分析聚類模型[8],通過建立690例慢性乙型肝炎病毒(hepatitis B virus,HBV)感染伴脂肪肝患者中醫(yī)癥狀的隱結(jié)構(gòu)模型,評價該類人群的證候要素特征,為臨床辨證施治提供指導(dǎo)。
研究對象來源于江蘇省啟東地區(qū)“肝癌早診早治”隊(duì)列,乙肝表面抗原(hepatitis B surface antigen,HBsAg)陽性者,利用B超診斷脂肪肝。
慢性乙型肝炎病毒(hepatitis B virus,HBV)感染診斷參照《慢性乙型肝炎防治指南(2019版)》[9]。
脂肪肝診斷參照《非酒精性脂肪性肝病防治指南(2018更新版)》[10]:B超顯示肝臟前場回聲增強(qiáng)(“明亮肝”),回聲強(qiáng)于腎臟;肝內(nèi)管道結(jié)構(gòu)顯示不清楚;遠(yuǎn)場回聲衰減。具備以上3項(xiàng)中任意2項(xiàng)者即能做出脂肪肝診斷。
同時符合HBV慢性感染以及脂肪肝的臨床診斷;基線及問診資料完整;年齡>18歲;簽署知情同意書。
合并有其他類型肝炎病毒、Epstein-Barr(EB)病毒、人類免疫缺陷病毒等;有嚴(yán)重心、腦、腎等其他臟器器質(zhì)性疾病者;精神異常不能配合者。
使用本課題組前期通過文獻(xiàn)檢索、專家討論等制定出的中醫(yī)證候調(diào)查問卷表[11,12],由經(jīng)過培訓(xùn)的中醫(yī)師(主治及以上職稱)依據(jù)問卷內(nèi)容逐一問診。問診結(jié)果分為“無、有”兩類分別賦值“0、1”,用Epidata錄入建立數(shù)據(jù)庫。根據(jù)出現(xiàn)頻率(>10%)和數(shù)據(jù)分析后確定善太息、胸悶、便溏等61個問診信息參與隱結(jié)構(gòu)分析。
參考慢性乙型肝炎[13-15]、脂肪肝[16,17]各版指南對證型分類及證候要素的描述規(guī)范,對癥狀名稱、證候名稱進(jìn)行相應(yīng)的規(guī)范化處理。
采用Latern5.0軟件的最優(yōu)雙步隱樹分析聚類模型,采用人機(jī)結(jié)合模式對數(shù)據(jù)進(jìn)行聚類分析。
690例患者年齡(62.73±7.37)歲,男性329例,女性361例。通過隱結(jié)構(gòu)模型,根據(jù)數(shù)據(jù)分布特點(diǎn)引入12個隱變量(Y0~Y11),25個隱類(如圖1)。
注:隱變量Y旁邊的數(shù)字表示該隱變量經(jīng)數(shù)據(jù)分析分成的隱類個數(shù),變量之間連線的粗細(xì)代表變量關(guān)聯(lián)的強(qiáng)弱,如Y3與便溏、泄瀉的關(guān)系密切,但是與胃脘喜按的關(guān)系更弱。圖1 HBV慢性感染合并脂肪肝隱結(jié)構(gòu)模型
從上述隱結(jié)構(gòu)模型可以看出,各顯變量被不同的隱變量(癥狀)分成不同的類別,通過Latern5.0軟件的直連分析可以詮釋每個隱變量的內(nèi)涵,包括每一隱變量與關(guān)系密切癥狀之間的定性定量關(guān)系,關(guān)聯(lián)程度用互信息表示。
經(jīng)軟件分析后得出信息曲線圖(圖2),隱變量Y11由與之關(guān)系最密切的煩躁易怒、情志抑郁、發(fā)熱3個顯變量詮釋,3個顯變量累積信息覆蓋率為97%(如表1)。
注:橫軸是隱變量Y11所對應(yīng)的顯變量,左右縱軸分別表示互信息(單位bit)的絕對值和信息覆蓋度(取值0%~100%)。橫坐標(biāo)上的癥狀是按其在隱類Y11的相關(guān)度大小依次排列。紅色曲線:各顯變量與隱變量Y11的兩兩互信息大小,由大到小從左至右排列;藍(lán)色曲線:各顯變量與隱變量Y11的累積互信息的大小,由大到小從左至右排列,累積互信息逐漸增大,當(dāng)?shù)竭_(dá)所要求的95%時,所截取的顯變量到此為止,曲線便也在這里停止圖2 Y11隱類信息曲線圖
表1 隱變量Y11互信息及信息覆蓋率比較
隱變量與顯變量之間的定性定量關(guān)系,還體現(xiàn)在隱類在此研究人群中出現(xiàn)的概率(用顯變量在該隱變量中出現(xiàn)的概率表示)。如果定義Y11的癥狀屬于肝郁氣滯,隱類S1各癥狀出現(xiàn)概率普遍高于隱類S0,故隱類S1為具有肝郁氣滯癥狀的人群,發(fā)生概率為12%。由此可知,肝郁氣滯在總體人群證候中的概率為12%(見表2圖3)。
表2 隱變量Y11中顯變量出現(xiàn)的條件概率比較
圖3 隱變量Y11類概率直方圖
其余隱變量的模型詮釋參照Y11,如Y4、Y9也可詮釋為肝郁氣滯證人群,Y1、Y8詮釋為濕熱證人群,Y3為脾虛證人群等。由此看出,同一證候類型不止1個隱變量與之對應(yīng)。如氣滯證有Y4、Y9、Y11反映其不同的側(cè)面,Y4反映胸中氣滯伴有胃氣上逆癥狀,Y11反映情志方面氣滯不暢伴有氣郁化火癥狀,Y9反映氣滯在脈象上的表現(xiàn)。而從臨床角度分析,不同側(cè)面都是氣滯證的表現(xiàn),也都對氣滯證證候診斷有價值?;诖?,進(jìn)一步通過latent 5.0軟件的綜合聚類模型,將Y4、Y9、Y11反映的不同癥狀進(jìn)一步綜合,從而得到一個新的隱變量Z1,并對其進(jìn)行中醫(yī)詮釋(見圖4)。
圖4 隱變量Z1綜合聚類隱結(jié)構(gòu)模型
Z1是2個主癥加兼癥對隱變量特征的刻畫,主癥善太息情況(0.19/0.19)、胸悶情況(0.13/0.27);再加上兼癥煩躁易怒情況(0.06/0.29)、情志抑郁情況(0.05/0.32),其特點(diǎn)是首2個癥狀的互信息相對較高,余顯著降低(見表3圖5)。
表3 隱變量Z1兩兩互信息及信息覆蓋率比較
圖5 肝郁氣滯證(Z1)的信息曲線
隱變量Z1可以解釋為肝郁氣滯,則S0為非肝郁氣滯人群,S1為肝郁氣滯人群,在總體人群中的概率為30%(見表4圖6)。
表4 隱變量Z1中顯變量出現(xiàn)的條件概率比較
圖6 隱變量Z1類概率直方圖
同理,其他綜合聚類隱變量也重新歸納,新產(chǎn)生的綜合聚類模型(Z2~Z6)(如圖7)。
各綜合聚類模型在人群中出現(xiàn)的概率和對應(yīng)的癥狀,以及中醫(yī)病理病機(jī)闡釋(如表5)。
圖7 綜合聚類隱結(jié)構(gòu)模型Z2~Z6
表5 綜合聚類分析結(jié)果
綜合聚類模型與癥狀之間的互信息與信息覆蓋率(如表6)。
表6 綜合聚類后各證候類型與問診信息之間的概率及互信息表
隱結(jié)構(gòu)模型屬于樹狀貝葉斯網(wǎng)[18],是特殊聚類算法[19],不僅可以辨析癥狀之間的復(fù)雜關(guān)系,對癥狀進(jìn)行分類、挖掘特征人群,還可以揭示病種的證候特點(diǎn),發(fā)掘出新的中醫(yī)學(xué)理論知識,促進(jìn)中醫(yī)學(xué)的現(xiàn)代化發(fā)展進(jìn)程[6]。香港科技大學(xué)的張連文對該模型進(jìn)行推廣及應(yīng)用[20-24],揭示了腎虛證的證候結(jié)構(gòu)和內(nèi)容,與中醫(yī)傳統(tǒng)理論及臨床認(rèn)識十分吻合。而且更為重要的是,隱結(jié)構(gòu)分析是基于客觀的臨床癥狀,用概率這種量化數(shù)據(jù)來解釋癥狀和癥狀、證候和癥狀、證候和證候之間的關(guān)系,沒有加入任何人為的經(jīng)驗(yàn)和判斷。
HBV慢性感染和脂肪肝的證候類型只分別見于相關(guān)指南和《中藥新藥臨床研究指導(dǎo)原則(試行)》[25],且HBV慢性感染又因所處疾病階段不同(慢性乙肝攜帶、肝纖維化、肝硬化等)而有不同的證候辨證標(biāo)準(zhǔn),難以統(tǒng)一,如果是醫(yī)生判定又帶有主觀性和不確定性。而本研究借助隱結(jié)構(gòu)模型評價HBV慢性感染伴脂肪肝患者的主要證候要素相對客觀,且針對特定的HBV慢性感染伴脂肪肝人群專門分析特異性強(qiáng),有助于更精準(zhǔn)地辨證施治和統(tǒng)計(jì)分析。從本研究隱結(jié)構(gòu)模型結(jié)果來看,氣滯、脾虛、濕熱、血瘀是其主要的證候要素特征,其中尤以氣滯和脾虛表現(xiàn)最為重要,較為客觀地反映了HBV慢性感染伴脂肪肝的中醫(yī)證候要素特征。同時,每一證候的對應(yīng)癥狀與臨床實(shí)際比較吻合,如喜太息、胸悶、煩躁易怒、抑郁均能幫助診斷肝郁氣滯證,值得臨床證候規(guī)范化的進(jìn)一步探索與應(yīng)用。
目前隱結(jié)構(gòu)模型仍有一定的局限性,數(shù)據(jù)條目不宜過多或過少,且建立模型時變量太多會導(dǎo)致分析過程緩慢。另外,分析的結(jié)果中可能也會出現(xiàn)個別癥狀在證候歸類上與中醫(yī)理論不一致等問題,導(dǎo)致該變量的詮釋困難,一定程度上影響了對隱結(jié)構(gòu)模型可信度的評價。當(dāng)前這些問題的解決,有賴于中醫(yī)從業(yè)者結(jié)合中醫(yī)理論和臨床專家的經(jīng)驗(yàn)進(jìn)行綜合考慮與判斷數(shù)據(jù)特征的中醫(yī)臨床意義。同時,更新的統(tǒng)計(jì)分析技術(shù)及相關(guān)模型的探索運(yùn)用,也是未來的研究方向之一。