張琳婷,張根明
1.北京中醫(yī)藥大學(xué),北京100029;2.北京中醫(yī)藥大學(xué)東直門醫(yī)院,北京100700
證候的研究一直是中醫(yī)的熱點(diǎn)和難點(diǎn),包括對于各個疾病的證候研究[1-3]、證候研究的新思路[4]、證候的規(guī)范化研究[5-7]等。如何將中醫(yī)證候模糊語言敘述轉(zhuǎn)化為現(xiàn)代醫(yī)學(xué)所能理解的科學(xué)語言是證候研究中的重要問題。為此,近年來中醫(yī)證候研究中引入了越來越多的數(shù)據(jù)分析和挖掘的方法[8-11]。本研究采用了因子分析、聚類分析、Logistic回歸分析、Fisher判別分析4種方法對出血性中風(fēng)證候進(jìn)行分析研究。因子分析和聚類分析屬于無監(jiān)督的數(shù)據(jù)分析方法,對原始數(shù)據(jù)信息依據(jù)樣本本身特征進(jìn)行歸類,把具有相似特征的目標(biāo)數(shù)據(jù)歸在同源的類別,并采用相應(yīng)的可視化技術(shù)直觀地表達(dá)出來。Logistic回歸分析和Fisher判別分析屬于有監(jiān)督的數(shù)據(jù)分析方法,利用先驗(yàn)因素(專家經(jīng)驗(yàn)辨證)對數(shù)據(jù)進(jìn)行辨識、歸類和預(yù)測。本研究從無監(jiān)督和有監(jiān)督的數(shù)據(jù)分析方法中各選取兩種,以探討不同方法在中醫(yī)證候分析與挖掘中的差異。
1.1 一般資料研究病例來源于“國家中醫(yī)藥管理局國家中醫(yī)臨床研究基地業(yè)務(wù)建設(shè)科研專項(xiàng)——出血性中風(fēng)證候要素診斷量表編制研究”,2016年6月至2019年1月于北京中醫(yī)藥大學(xué)東直門醫(yī)院、太原市中醫(yī)院、長春中醫(yī)藥大學(xué)附屬醫(yī)院門診及住院收治的腦出血患者499例。
1.2 診斷標(biāo)準(zhǔn)西醫(yī)診斷標(biāo)準(zhǔn):采用《中國腦出血診治指南(2014)》腦出血診斷標(biāo)準(zhǔn)[12]。①急性起??;②局灶神經(jīng)功能缺損癥狀(少數(shù)為全面神經(jīng)功能缺損),常伴有頭痛、嘔吐、血壓升高及不同程度意識障礙;③頭顱CT或MRI顯示出血灶;④排除非血管性腦部病因。
中醫(yī)診斷標(biāo)準(zhǔn):采用1995年中國中醫(yī)學(xué)會內(nèi)科學(xué)會腦病專業(yè)委員會提出的《中風(fēng)病診斷與療效評定標(biāo)準(zhǔn)》[13]。
1.3 病例納入與排除標(biāo)準(zhǔn)納入標(biāo)準(zhǔn):①符合腦出血診斷標(biāo)準(zhǔn)[12-13]的患者;②發(fā)病在90 d以內(nèi);③年齡>18歲;④自愿參加本研究并簽署知情同意書。排除標(biāo)準(zhǔn):①蛛網(wǎng)膜下腔出血、腦外傷引起的腦出血患者;②梗死后出血患者;③合并其他器官的嚴(yán)重疾??;④精神障礙或嚴(yán)重癡呆。
1.4 研究方法將出血性中風(fēng)臨床常見的四診信息(包括癥狀、舌、脈)編制成統(tǒng)一的調(diào)查表。參照《中風(fēng)病診斷與療效評定標(biāo)準(zhǔn)》,分為風(fēng)、火、痰、血瘀、氣虛、陰虛、陽亢7個基本證候要素。分析2000年之后有關(guān)出血性中風(fēng)的證候?qū)W相關(guān)研究,整理其中提到的證候要素出現(xiàn)頻率進(jìn)行排序,將出現(xiàn)頻率≥10%的證候要素作為研究備選證候要素,增加濕、氣滯、陽虛3個證候要素。選擇有臨床經(jīng)驗(yàn)的中醫(yī)神經(jīng)內(nèi)科醫(yī)師,按統(tǒng)一要求填寫調(diào)查表格,記錄患者四診信息,同時由固定的3位臨床醫(yī)師背對背做出證候要素是否存在的判斷,每位患者允許同時存在多個證候要素。
1.5 統(tǒng)計學(xué)方法采用EpiData3.1數(shù)據(jù)庫錄入數(shù)據(jù),采用SPSS 20.0進(jìn)行統(tǒng)計分析處理。計量資料以均數(shù)±標(biāo)準(zhǔn)差(±s)表示;計數(shù)資料以頻數(shù)(百分比)表示。檢驗(yàn)水準(zhǔn)為雙側(cè)α=0.05。主要統(tǒng)計方法包括:因子分析、聚類分析、Fisher判別分析、Logistic回歸分析。
2.1 因子分析對217個四診信息進(jìn)行頻率分析,保留頻率≥10%的89個變量用于進(jìn)一步數(shù)據(jù)分析。進(jìn)行KMO 檢驗(yàn)和Bartlett球形檢驗(yàn),結(jié)果顯示KMO=0.848,Bartlett球形檢驗(yàn)P=0.000,數(shù)據(jù)可以做因子分析。采用主成分分析法,最大方差法旋轉(zhuǎn),保留因子載荷系數(shù)>0.3的變量,因子分析結(jié)果見圖1、表1。
圖1 因子分析碎石圖
表1 因子分析
2.2 聚類分析對89個變量分別進(jìn)行層次聚類分析和K-means聚類分析,K-means聚類過程中K值分別取4~10,K值為5時效果相對較好,聚類結(jié)果見圖2、表2。
2.3 Logistic回歸分析以89個四診信息為協(xié)變量,10個證候要素分別作為因變量,采用“向前:條件”方法做Logistic回歸分析,結(jié)果見表3。
2.4 Fisher判別分析以89個四診信息為自變量,10個證候要素分別作為分組變量,采用步進(jìn)式方法做Fisher判別分析,結(jié)果見表4。
表2 K-means聚類分析
表3 Logistic回歸分析
表4 Fisher判別分析
圖2 層次分析樹狀圖
本研究表明,因子分析更多的是基于出血性中風(fēng)整個疾病的降維分析,代表了出血性中風(fēng)出現(xiàn)頻次多的證候,而出現(xiàn)頻次少的證候則難以體現(xiàn)。公因子F1、F2的特征值及方差貢獻(xiàn)度遠(yuǎn)大于其他的公因子,F(xiàn)1、F2中的變量數(shù)量都比較多,就其臨床意義而言并沒有代表單一證候要素,而是多個證候要素的組合,大體而言,F(xiàn)1代表了實(shí)證、F2代表了虛證。因子分析并沒有如我們所預(yù)期的出現(xiàn)多個相對大的且能被中醫(yī)理論解釋的公因子。從公因子F3以后,每個公因子中所含的變量數(shù)目急劇減少,其對總方差的貢獻(xiàn)度也很小,但某些公因子也仍然很有意義,例如公因子F7中的消瘦、瘦薄舌、脈細(xì)按中醫(yī)理論都是陰虛的表現(xiàn),而僅就數(shù)據(jù)自身的特征也確實(shí)被分到同一公因子,代表了理論與實(shí)際的統(tǒng)一。
聚類分析效果不佳,層次聚類沒有很清晰地分為幾個大的類別,K-means聚類較層次聚類稍好一些。一個患者同時具有幾個證候要素兼夾,而層次聚類和K-means聚類的過程中都只能將1個患者分類到1個證候類型,導(dǎo)致每一個聚類組中可能有多個證候要素,而非單一的證候要素,使得每個聚類中的證候特征顯得并不明確。K-means聚類過程取K值>5發(fā)現(xiàn)聚類組彼此會有明顯的重復(fù)和相似性,表明更多的分類可能是不合理的,將出血性中風(fēng)證候分為10個證候要素可能分類過于細(xì)致。
Fisher判別分析、Logistic回歸分析在出血性中風(fēng)的不同證候的表現(xiàn)類似,但不完全一致。兩者在內(nèi)火證、痰證、濕證、血瘀證、陰虛證均表現(xiàn)較好,內(nèi)風(fēng)證、氣滯證、陽虛證、陽亢證均表現(xiàn)相對差一些,而在氣虛證Logistic回歸優(yōu)于Fisher判別。在Fisher判別分析、Logistic回歸分析中,先驗(yàn)因素(專家經(jīng)驗(yàn)辨證)對最終的結(jié)果影響會非常大。以內(nèi)風(fēng)證為例,不同專家對內(nèi)風(fēng)證的認(rèn)識存在差異性,尤其在中風(fēng)病中,有相當(dāng)一部分專家認(rèn)為急性起病、病情波動大符合風(fēng)善行數(shù)變的特點(diǎn),屬于風(fēng)的表現(xiàn)。這就把風(fēng)的概念擴(kuò)大和類推,從而認(rèn)為中風(fēng)病必有風(fēng)的存在,導(dǎo)致最終進(jìn)入內(nèi)風(fēng)證的四診信息多種多樣且與傳統(tǒng)認(rèn)識中的風(fēng)證并不一致。此外,用這兩種分析方法得到的血瘀證的四診信息是一致的,但均見口唇淡白、氣短、神疲乏力這3個明顯為氣虛的癥狀,考慮在出血性中風(fēng)中血瘀常伴見氣虛,從而難以將血瘀完全獨(dú)立出來。氣滯證、陽虛證、陽亢證在499例患者證候中出現(xiàn)頻率相對較少,且?guī)缀醵技鎶A內(nèi)火證、痰證等,幾乎很少單獨(dú)出現(xiàn),導(dǎo)致Fisher判別分析和Logistic回歸分析的結(jié)果相對差一些。
總體而言,有監(jiān)督的數(shù)據(jù)分析方法比無監(jiān)督的數(shù)據(jù)分析方法更有效率,更加符合傳統(tǒng)中醫(yī)的認(rèn)識。無監(jiān)督的數(shù)據(jù)分析方法則和傳統(tǒng)的認(rèn)識有一定的差距,可能有以下幾個方面的原因:①無監(jiān)督的方法需要更長時間、更多數(shù)據(jù)的訓(xùn)練,僅憑499例患者的分析、訓(xùn)練肯定是難以達(dá)到幾千年中醫(yī)認(rèn)識的水平;②中醫(yī)的很多證候不完全是根據(jù)臨床經(jīng)驗(yàn)歸納而來的,融入了哲學(xué)的思維[14-16],不僅是理性的思考,也是感性的認(rèn)知;③證候具有動態(tài)時空、內(nèi)實(shí)外虛、多維界面的特征[17],證候的“內(nèi)實(shí)”能夠在數(shù)據(jù)分析的過程中被歸為一類,但“外虛”可能反而與其他的證候關(guān)系更為緊密而歸到其他類別。但是,無監(jiān)督的方法對于進(jìn)一步發(fā)展中醫(yī)的理論是非常有益的,通過無監(jiān)督的方法可能是驗(yàn)證過去的已有的中醫(yī)理論,也可能是完善和修改已有的結(jié)論,也可能是發(fā)現(xiàn)潛在的未被認(rèn)識到的證候規(guī)律;而有監(jiān)督的方法則只能把我們現(xiàn)有的中醫(yī)認(rèn)識通過數(shù)據(jù)分析方法規(guī)范化、清晰明了地展現(xiàn)出來。此外,有監(jiān)督的數(shù)據(jù)分析方法也有其難以克服的缺陷,就是其受先驗(yàn)因素(專家經(jīng)驗(yàn)辨證)的影響很大。目前,中醫(yī)證候研究缺乏統(tǒng)一的金標(biāo)準(zhǔn)。目前,證候研制往往以臨床醫(yī)師或?qū)<遗袛嘧鳛閰⒖紭?biāo)準(zhǔn),依據(jù)個體的知識水平和臨床經(jīng)驗(yàn),辨證結(jié)果必然存在差異,可靠性難以保證。本研究選用3位臨床醫(yī)師背對背做出證候要素是否存在的判斷也考慮到這方面的原因。在這種情況下,基于這種“金標(biāo)準(zhǔn)”進(jìn)行有監(jiān)督方法的數(shù)據(jù)分析、挖掘結(jié)果往往缺乏說服力,很難得到廣泛認(rèn)可與應(yīng)用,導(dǎo)致很多的證候研究會不夠客觀以及難以擺脫先入為主的經(jīng)驗(yàn)框架。
綜上所述,每種數(shù)據(jù)分析方法各有優(yōu)勢,單一的數(shù)據(jù)分析方法不能同時滿足我們證候研究中的多種需求。在中醫(yī)證候研究的過程中,應(yīng)當(dāng)根據(jù)自己的研究實(shí)際選用多種數(shù)據(jù)分析方法,取其優(yōu)勢,或者引入其他更復(fù)雜的數(shù)據(jù)分析方法。