張 毅,王宏宇,呂朝磊,張 倩,賈聰敏,王 耘
(北京中醫(yī)藥大學(xué)中藥信息工程研究中心 北京 100102)
中醫(yī)體質(zhì)學(xué)說體現(xiàn)了中醫(yī)因人制宜、辨證論治等核心理念。把握不同人群體質(zhì)的特征和差異,及由此所決定的發(fā)病傾向和對(duì)某些病因的易感性,對(duì)制定個(gè)性化的治療、預(yù)防、養(yǎng)生方法具有重要意義。因此,需要將個(gè)體復(fù)雜的體質(zhì)予以辨識(shí)。體質(zhì)辨識(shí)是制定個(gè)性化預(yù)防保健措施的依據(jù)及基礎(chǔ),是擺脫亞健康、實(shí)現(xiàn)“治未病”的前提[1,2]。但目前的體質(zhì)辨識(shí)方法還有一定的不足:①中醫(yī)資源稀缺,不能滿足亞健康人群體質(zhì)辨識(shí)的需求;②通過《中醫(yī)體質(zhì)分類和判定標(biāo)準(zhǔn)》體質(zhì)量表進(jìn)行自測(cè),易受測(cè)試者主觀因素影響[3];③基因分類器、經(jīng)絡(luò)知熱感度測(cè)量法[4]、中醫(yī)四診等幾種辨識(shí)方法,成本及技術(shù)要求較高,不利于普及應(yīng)用等。因此,建立操作簡(jiǎn)便、能廣而用之的體質(zhì)自動(dòng)辨識(shí)系統(tǒng)輔助亞健康人群進(jìn)行體質(zhì)辨識(shí)具有重要意義。
光電容積脈搏波描記法(Photoplethysmography,PPG)是借光電手段在活體組織中檢測(cè)血液容量變化的一種無創(chuàng)檢測(cè)方法[5],可以得到連續(xù)的光電容積脈搏波。脈搏波蘊(yùn)含機(jī)體豐富的生理病理信息,對(duì)其波形信號(hào)變化的研究可以實(shí)現(xiàn)對(duì)心血管、呼吸、心理等[6,7]進(jìn)行無創(chuàng)連續(xù)檢測(cè),臨床上已廣泛應(yīng)用于心率及血氧飽和度的監(jiān)測(cè)[8]。因其檢測(cè)方法操作簡(jiǎn)便和成本低廉等特點(diǎn)在家庭保健中顯示出特有的優(yōu)勢(shì)。
本研究將光電容積脈搏波頻域分析應(yīng)用于中醫(yī)體質(zhì)辨識(shí),建立中醫(yī)體質(zhì)辨識(shí)模型,并進(jìn)一步構(gòu)建中醫(yī)體質(zhì)自動(dòng)辨識(shí)系統(tǒng),以實(shí)現(xiàn)在家庭保健中對(duì)體質(zhì)的輔助辨識(shí)。氣虛體質(zhì)是最常見、最基本的非生理性體質(zhì)類型之一[9],張?bào)薜萚10]研究表明氣虛體質(zhì)是大學(xué)新生中最常見的體質(zhì)類型,陳潤(rùn)東等[11]討論了廣州地區(qū)中醫(yī)體質(zhì)類型的分布狀況,結(jié)果表明氣虛質(zhì)比例最高。因此本研究以氣虛體質(zhì)為例,對(duì)不同氣虛體質(zhì)脈搏波頻譜之間的差異進(jìn)行分析,闡明基于脈搏波頻域分析建立氣虛體質(zhì)判定模型實(shí)現(xiàn)氣虛體質(zhì)自動(dòng)辨識(shí)的可行性,為構(gòu)建中醫(yī)體質(zhì)自動(dòng)辨識(shí)系統(tǒng)提供基礎(chǔ)。
測(cè)試對(duì)象主要為北京中醫(yī)藥大學(xué)的大學(xué)生及研究生。對(duì)志愿者分別進(jìn)行體質(zhì)辨識(shí)及脈搏波的數(shù)據(jù)采集。志愿者用《中醫(yī)體質(zhì)分類和判定》標(biāo)準(zhǔn)下體質(zhì)量表以自我報(bào)告的形式進(jìn)行體質(zhì)辨識(shí)。根據(jù)疾病的臨床診斷標(biāo)準(zhǔn)排除各種急慢性疾病患者,并且排除調(diào)查期間服用任何藥物、脈搏波信息缺失、調(diào)查問卷質(zhì)量不佳的受試者,最終納入研究對(duì)象112例(非氣虛組與氣虛組各56例),其中男性40例,女性72例,年齡18-30歲,平均年齡19.41±2.4歲。
調(diào)查問卷根據(jù)中華中醫(yī)藥學(xué)會(huì)《中醫(yī)體質(zhì)分類和判定標(biāo)準(zhǔn)》[12]體質(zhì)量表制定,并包括調(diào)查對(duì)象的性別、年齡、身高、體重、既往病史等內(nèi)容。王琦教授將中醫(yī)體質(zhì)分為平和質(zhì)、氣虛質(zhì)、陽虛質(zhì)、陰虛質(zhì)、痰濕質(zhì)、濕熱質(zhì)、瘀血質(zhì)、氣郁質(zhì)、特稟質(zhì)等9種基本類型。體質(zhì)量表根據(jù)不同體質(zhì)共有9個(gè)亞量表,分別計(jì)算原始分及轉(zhuǎn)化分,依標(biāo)準(zhǔn)判定體質(zhì)類型。
原始分=各個(gè)條目分值相加
轉(zhuǎn)化分?jǐn)?shù)=[(原始分-條目數(shù))/(條目數(shù)×4)]×100
氣虛體質(zhì)亞量表共有8個(gè)條目,每一問題按5級(jí)評(píng)分(從1(沒有發(fā)生)至5(總是發(fā)生)),總分從8到40(本研究中總分從8到35),轉(zhuǎn)化分從0到100(本研究中轉(zhuǎn)化分從0到85)。轉(zhuǎn)化分≥40判定為氣虛體質(zhì),轉(zhuǎn)化分在30~39分則判定為傾向氣虛體質(zhì),轉(zhuǎn)化分<30判定為非氣虛體質(zhì)。
1.3.1 數(shù)據(jù)采集
利用光電反射式脈搏波傳感器與Arduino單片機(jī)搭建脈搏波檢測(cè)設(shè)備,檢測(cè)實(shí)驗(yàn)在溫度適宜的安靜室內(nèi)進(jìn)行,檢測(cè)開始前要求受試者心情平靜,脈搏波檢測(cè)過程中受試者保持靜坐。將傳感器用綁帶固定在受試者右手食指處,綁帶的松緊程度保持適中,在保證傳感器不脫離的情況下避免施加壓力過大導(dǎo)致脈搏波的波形形變和采集失真。檢測(cè)過程持續(xù)約1 min,并需要獲得至少20 s的穩(wěn)定波形數(shù)據(jù),采樣率為50 Hz,存儲(chǔ)單元為5 bit。圖1為采集到的PPG信號(hào)。
1.3.2 脈搏波的頻域分析
脈搏波頻譜由脈搏波所具有的全部頻率分量的集合形式表示,保留了脈搏波的全部信息,可以獲得時(shí)域分析中無法得到的特征信息。
對(duì)脈搏波信號(hào)進(jìn)行Welch功率譜分析,然后經(jīng)過hamming窗平滑,得到信號(hào)的功率譜如圖2所示。發(fā)現(xiàn)主要功率集中在0-11 Hz之間,因此只對(duì)這一范圍的功率譜進(jìn)行研究。
A點(diǎn)在功率譜中幅值最大(基波),頻率約為1.17 Hz,對(duì)應(yīng)測(cè)試者的脈率;B點(diǎn)和C點(diǎn)對(duì)應(yīng)的頻率分別是A點(diǎn)頻率的整數(shù)倍(2倍和3倍),因此可以認(rèn)為是基波的諧波。研究發(fā)現(xiàn),一般人的脈搏波成分主要都集中在基波(第1次諧波)到5-6次諧波內(nèi)[13]。因?yàn)槭懿蓸勇实南拗?,本研究只取到脈搏波功率譜的第6個(gè)諧波。計(jì)算得到各脈搏波功率譜的6諧波峰值,利用SAS軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
提取各脈搏波功率譜0-11 Hz的相位及幅值,利用8種常用數(shù)據(jù)挖掘分類算法(貝葉斯網(wǎng)絡(luò)算法、支持向量機(jī)算法、K最近鄰算法、KStar算法、決策樹算法、隨機(jī)森林算法、AdaBoost算法和Bagging算法)挖掘氣虛體質(zhì)與脈搏波頻譜之間可能存在的關(guān)系,建立氣虛體質(zhì)判定模型。以上所有分類算法通過數(shù)據(jù)挖掘平臺(tái)Weka實(shí)現(xiàn)。
本研究所有分類算法均在10折交叉驗(yàn)證的環(huán)境下運(yùn)行。交叉驗(yàn)證是數(shù)據(jù)建模中常用且有效的一種內(nèi)部驗(yàn)證方法,常用來測(cè)試模型或算法的準(zhǔn)確性。
圖1 光電容積脈搏波描記法信號(hào)
模型預(yù)測(cè)性能的評(píng)價(jià)指標(biāo)主要包括準(zhǔn)確性(ACC)、靈敏度(SE)、特異性(SP)、平衡精度(BACC),受試者工作特征曲線曲線下面積(AUC)。靈敏度和特異性通常分別被用來評(píng)估模型正確識(shí)別真陽性樣本和真陰性樣本的能力。在本研究中,靈敏度指實(shí)際為氣虛體質(zhì),按照本研究所建模型被正確地判斷為氣虛體質(zhì)的概率;特異性指實(shí)際為非氣虛體質(zhì),并被模型正確地判斷為非氣虛體質(zhì)的概率。平衡精度為靈敏度和特異性的平均值,是模型訓(xùn)練過程中評(píng)價(jià)模型性能的重要指標(biāo)[14,15]。ROC(receiver operator characteristic)稱為受試者工作特征曲線,又稱為接收者操作特征曲線[16,17]。ROC曲線下面積(AUC)介于0.5-1.0之間。AUC越接近于1,說明模型越可靠。AUC介于0.5-0.7之間時(shí),表明模型具有較低的可靠性。AUC介于0.7-0.9之間時(shí),表明模型具有一定的可靠性。AUC在0.9以上時(shí),表明模型據(jù)有較高的可靠性。AUC=0.5時(shí),說明模型完全不起作用,無診斷價(jià)值。為了對(duì)該模型的預(yù)測(cè)性能作出合理而全面的評(píng)估,本研究將綜合考慮以上幾項(xiàng)指標(biāo)。
所有參與人員均完成了體質(zhì)調(diào)查問卷的填寫,氣虛體質(zhì)亞量表轉(zhuǎn)化分平均值為29.24±16.19。根據(jù)體質(zhì)判定標(biāo)準(zhǔn)篩選出非氣虛體質(zhì)與氣虛體質(zhì)各56例。研究參與人員均為青年群體,平均年齡19.41±2.4歲,以避免兼夾體質(zhì)過多及疾病的干擾,如衰老和慢性炎癥。BMI均在正常范圍內(nèi)。
脈搏波頻域豐富的諧波幅度與頻率對(duì)應(yīng)著不同的時(shí)域形態(tài),包含了人體健康的絕大多數(shù)信息,中醫(yī)理論中的脈象實(shí)際上在頻域上的反應(yīng)就是諧波幅度的不同[18]。
經(jīng)過計(jì)算,分別得到非氣虛組及氣虛組的6個(gè)脈搏波諧波的峰值(p1,p2,…,p6),分析結(jié)果如下所示。從表2和圖3分析可以看出:(1)不同體質(zhì)的脈搏波諧波峰值均隨頻率的增加而逐漸下降。(2)氣虛體質(zhì)的諧波峰值均明顯大于非氣虛體質(zhì),其中除p6外均具有顯著差異(P<0.05)。
從比較結(jié)果可以得出脈搏波諧波峰值與不同氣虛體質(zhì)之間存在一定關(guān)系,諧波峰值:氣虛體質(zhì)>非氣虛體質(zhì),即氣虛體質(zhì)的諧波峰值幅度要大于非氣虛體質(zhì)。僅提取諧波峰值,信息較少,因此提取各脈搏波功率譜0-11 Hz的相位及幅值來進(jìn)一步分析。
圖2 脈搏波的功率譜
表1 調(diào)查問卷結(jié)果(±s)
表1 調(diào)查問卷結(jié)果(±s)
表2 非氣虛組和氣虛組脈搏波諧波峰值比較(±s,n=56)
表2 非氣虛組和氣虛組脈搏波諧波峰值比較(±s,n=56)
注:與非氣虛比較,*P<0.05
圖3 非氣虛組和氣虛組脈搏波諧波峰值比較
本研究選取AUC值在0.7以上,ACC值最大的模型為最優(yōu)模型。綜合比較8種分類算法,分類方法為隨機(jī)森林算法時(shí)模型最優(yōu),相關(guān)指標(biāo)如表3所示。模型10折交叉驗(yàn)證測(cè)試的準(zhǔn)確性達(dá)到80.4%,識(shí)別真陽性樣本的正確率即靈敏度達(dá)到73.2%,特異性、平衡精度及受試者工作特征曲線下面積均在0.8以上,表明本研究所建模型具有一定的可靠性。
表3 最優(yōu)模型評(píng)價(jià)相關(guān)指標(biāo)
圖4 最優(yōu)模型受試者工作特征曲線
對(duì)所建立的模型進(jìn)行了ROC曲線分析。ROC曲線將靈敏度與特異性以圖示化的方法結(jié)合在一起,從而實(shí)現(xiàn)模型的無偏估計(jì),是試驗(yàn)準(zhǔn)確性的綜合代表。通常情況下,一次隨機(jī)的預(yù)測(cè)返回的點(diǎn)將會(huì)落在圖中虛線的對(duì)角線上,而理想的預(yù)測(cè)返回的點(diǎn)將會(huì)落在圖中左上角的區(qū)域,越靠近左上角說明模型的預(yù)測(cè)性能越理想。圖4中ROC曲線整體均呈現(xiàn)向左上角區(qū)域靠攏的趨勢(shì),表明本研究建立的氣虛體質(zhì)判定模型具有一定的可靠性。
本研究所建模型目前只適用于年齡18至30歲的青年人群。而大學(xué)生中亞健康狀態(tài)普遍存在[19],氣虛體質(zhì)更是大學(xué)新生中最常見的體質(zhì)類型[10]。氣虛體質(zhì)判定模型方便了青年人群如大學(xué)生群體對(duì)不同氣虛體質(zhì)的輔助辨識(shí),為制定健康干預(yù)計(jì)劃提供一定的依據(jù),對(duì)改善亞健康狀態(tài)具有重要作用。
本研究?jī)H是建立基于光電容積脈搏波頻域分析的中醫(yī)體質(zhì)自動(dòng)辨識(shí)系統(tǒng)的初次嘗試。對(duì)112名參與者的不同氣虛體質(zhì)脈搏波頻譜之間的差異進(jìn)行了分析,建立了氣虛體質(zhì)判定模型,實(shí)現(xiàn)了利用脈搏波的頻譜分析對(duì)不同氣虛體質(zhì)的自動(dòng)辨識(shí)。表明利用光電容積脈搏波的頻域分析實(shí)現(xiàn)氣虛體質(zhì)辨識(shí)的方法是可行的,為下一步建立中醫(yī)體質(zhì)自動(dòng)辨識(shí)系統(tǒng)提供一定的基礎(chǔ)。將光電容積脈搏波頻域分析引入中醫(yī)體質(zhì)辨識(shí)是一種新的探索,筆者尚未見相關(guān)報(bào)道。
在今后的工作中,筆者將在氣虛體質(zhì)判定模型的基礎(chǔ)上完善九種體質(zhì)判定模型并進(jìn)一步擴(kuò)大樣本量,建立網(wǎng)上平臺(tái)構(gòu)建中醫(yī)體質(zhì)自動(dòng)辨識(shí)系統(tǒng),輔助用戶對(duì)中醫(yī)體質(zhì)的辨識(shí)。光電容積脈搏波采集設(shè)備價(jià)格低廉,操作簡(jiǎn)便,無需復(fù)雜的裝置,非常適合非醫(yī)療技術(shù)人員甚至用戶自己操作,有利于在家庭中推廣使用。有研究表明脈搏波信號(hào)的最高頻率成分一般不超過20 Hz,在實(shí)際分析中采樣頻率取50-100 Hz即可滿足要求[13]。本研究采樣率為50 Hz,保證了脈搏波信號(hào)的質(zhì)量,同時(shí)對(duì)脈搏波傳感器的要求不高,降低成本,方便脈搏波檢測(cè)設(shè)備的開發(fā)。
1 王琦.體質(zhì)辨識(shí)是“治未病”的“抓手”.環(huán)球中醫(yī)藥,2008,03:5-6.
2 孫理軍,柏云飛.體質(zhì)辨識(shí)在“治未病”中的地位及作用.現(xiàn)代中醫(yī)藥,2015,06:58-61.
3 柳璇,王琦.《中醫(yī)體質(zhì)分類與判定》標(biāo)準(zhǔn)修改建議及分析.北京中醫(yī)藥大學(xué)學(xué)報(bào),2013,36(5):300-304.
4 冼益民.運(yùn)用經(jīng)絡(luò)知熱感度測(cè)量法探討氣虛質(zhì)人群的經(jīng)絡(luò)體質(zhì)特性.廣州:廣州中醫(yī)藥大學(xué)碩士學(xué)位論文,2011.
5 Allen J.Photoplethysmography and its application in clinical physiologi?cal measurement.Physiol Meas,2007,28(3):R1-39.
6 Sugo Y,Ukawa T,Takeda S,et al.A Novel Continuous Cardiac Output Monitor Based on Pulse Wave Transit Time.IEEE engineering in medi?cine and biology society,2010,1:2853-2856.
7 Mcgrath S P,Ryan K L,Wendelken S M,et al.Pulse Oximeter Pethys?mographic Waveform Changes in Awake,Spontaneously Breathing,Jour?nal of the American Medical Informatics Association.Anesth Analg,2011,112(2):368-374.
8 Cennini G,Arguel J,Ak?it K,et al.Heart rate monitoring via remote photoplethysmography with motion artifacts reduction.Optics Express,2010,18(5):4867-75.
9 王琦,朱燕波.中國(guó)一般人群中醫(yī)體質(zhì)流行病學(xué)調(diào)查——基于全國(guó)9省市21948例流行病學(xué)調(diào)查數(shù)據(jù).中華中醫(yī)藥雜志,2009(1):7-12.
10張?bào)?陳志軍,劉磊,等.2296例大學(xué)新生氣虛體質(zhì)狀況調(diào)查.中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2015,21(3):310-311.
11陳潤(rùn)東,楊志敏,林嬿釗,等.中醫(yī)體質(zhì)分型6525例調(diào)查分析.南京中醫(yī)藥大學(xué)學(xué)報(bào),2009,25(02):104-106.
12中華中醫(yī)藥學(xué)會(huì).中醫(yī)體質(zhì)分類與判定(ZYYXH/T157-2009).世界中西醫(yī)結(jié)合雜志,2009,4(4):303
13羅志昌,張松,楊益民.脈搏波的工程分析與臨床應(yīng)用.北京:科學(xué)出版社,2006.
14 Baldi P,Brunak S,Chauvin Y,et al.Assessing the accuracy of predic?tion algorithms for classification:an overview.Bioinformatics,2000,16(5):412-424.
15 Peng J,Lu J,Shen Q,et al.In silico site of metabolism prediction for hu?man UGT-catalyzed reactions.Bioinformatics,2014,30(3):398-405.
16 Liu H,Wu T.Estimating the Area under a Receiver Operating Characteris?tic Curve For Repeated Measures Design.J Stat Softw,2003,08(i12):1-18.
17 Hanley J A,Mcneil B J.The meaning and use of the area under a receiv?er operating characteristic(ROC)curve.Radiology,1982,143(1):29-36.
18孟兆輝,白凈,王蘇中,等.高血壓病人的光電容積脈搏波的頻域分析.北京生物醫(yī)學(xué)工程,2002,21(1):1-4.
19李明今,李丹.基于中醫(yī)體質(zhì)理論的女大學(xué)生亞健康狀態(tài)現(xiàn)狀調(diào)查.延邊大學(xué)醫(yī)學(xué)學(xué)報(bào),2012,35(2):126-128.