陳春鳳 王憶勤 徐琎 顏建軍
(1.上海市徐匯區(qū)凌云街道社區(qū)衛(wèi)生服務(wù)中心,上海 200237;2.上海中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院,上海 201203;3.華東理工大學(xué)機(jī)械與動(dòng)力工程學(xué)院,上海 200237)
聲診是中醫(yī)聞診的重要組成部分。通過聽聲音來診察疾病,是中醫(yī)臨床診斷和辨證的重要手段之一?!峨y經(jīng)》曰:“聞而知之為之圣”,聞聲診病在臨床中具有重要地位。但因受到醫(yī)家個(gè)人診療經(jīng)驗(yàn)的不同,以及人的聽力易受心理、年齡、疲勞和外界環(huán)境等因素的影響,傳統(tǒng)聲診方法往往缺乏客觀標(biāo)準(zhǔn),難以重復(fù)驗(yàn)證,這限制了聲診的繼承發(fā)揚(yáng)和臨床應(yīng)用。聲診的客觀化、標(biāo)準(zhǔn)化研究將會(huì)有利于聲診的傳承發(fā)展,發(fā)揮聲診的臨床應(yīng)用價(jià)值。本研究運(yùn)用中醫(yī)聲診客觀化采集和分析方法,以與發(fā)聲關(guān)系最為密切的肺系病證作為切入點(diǎn),對(duì)肺系常見疾病及其不同中醫(yī)證型的語音信號(hào)進(jìn)行現(xiàn)代聲學(xué)參數(shù)分析,尋找肺系疾病語音的辨病和辨證特征。
收集2010年1月至2020年1月上海市龍華醫(yī)院、上海市曙光醫(yī)院、上海市強(qiáng)生職工醫(yī)院、上海市徐匯區(qū)凌云街道社區(qū)衛(wèi)生服務(wù)中心呼吸科、腫瘤科、中醫(yī)科門診及住院的肺系疾病患者342例。按疾病類型可分為慢性支氣管炎(慢支)組、支氣管哮喘(哮喘)組、原發(fā)性支氣管癌(肺癌)組,符合《支氣管哮喘防治指南》[1]《全國慢性支氣管炎臨床診斷及療效判斷標(biāo)準(zhǔn)》[2]《中國常見惡性腫瘤診治規(guī)范》[3]及《中醫(yī)內(nèi)科學(xué)》[4]中相關(guān)診斷標(biāo)準(zhǔn);按中醫(yī)證型可分為肺氣虛證、腎氣虛證、肺氣陰兩虛證、實(shí)證(包括痰濕蘊(yùn)肺證和痰熱郁肺證)組,符合《中醫(yī)臨床診療術(shù)語證候部分》[5]《中醫(yī)診斷學(xué)》[6]《中醫(yī)內(nèi)科學(xué)》[4]中的中醫(yī)證型診斷標(biāo)準(zhǔn)。見表1。疾病和證型診斷標(biāo)準(zhǔn)均由兩名副主任醫(yī)師以上職稱的中醫(yī)醫(yī)師判讀,取結(jié)果一致者。各組間樣本在性別、年齡等方面差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。正常對(duì)照組102名為上海中醫(yī)藥大學(xué)在校師生,全身各系統(tǒng)無器質(zhì)性病變。所有受試者均知情并自愿接受試驗(yàn)。排除:合并嚴(yán)重的心、肝、脾、腎、腦等臟器疾病及其他肺系嚴(yán)重疾病者,合并精神疾病者,有鼻部、咽喉部、頸部手術(shù)史者,臨床資料缺失嚴(yán)重者。
表1 研究對(duì)象的疾病類型和中醫(yī)證型分布
運(yùn)用華東理工大學(xué)研發(fā)的“中醫(yī)聞診采集系統(tǒng)”采集聲音樣本。被采集者在獨(dú)立安靜的診室內(nèi)(外界噪聲<30 dB),采取自然舒適坐姿,處于放松狀態(tài),帶耳麥一體式電熔式話筒,口唇距耳麥話筒約10 cm,在采樣人員指導(dǎo)下由系統(tǒng)自動(dòng)領(lǐng)讀被采集者朗讀元音[a:],平穩(wěn)發(fā)音1~3 s。采樣頻率為16 kHz,量化位數(shù)16位(16 Bit),聲道為單聲道。聲音樣本以WAV文件形式保存。
采集的聲音信號(hào)經(jīng)小波包分解后計(jì)算不同頻段的近似熵值。運(yùn)用小波包變換結(jié)合近似熵的非線性分析方法對(duì)樣本進(jìn)行處理分析,提取樣本各頻段的近似熵值。語音信號(hào)分類識(shí)別:將小波包分解提取的小波包能量和Shannon熵值特征進(jìn)行優(yōu)化選擇,分別運(yùn)用支持向量機(jī)(support vector machine,SVM)和BP(back propagation)神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行分類識(shí)別。
運(yùn)用SPSS軟件Mann-Whitey U檢驗(yàn),對(duì)提取的參數(shù)作總體狀況和分布狀況的統(tǒng)計(jì)分析,P≤0.05表示差異有統(tǒng)計(jì)學(xué)意義,P≤0.01表示差異有顯著性統(tǒng)計(jì)學(xué)意義。
肺氣虛、腎氣虛、肺氣陰兩虛、實(shí)證和正常對(duì)照五組樣本比較,有較多頻段的小波包能量和Shannon熵值差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)。小波包分解7層254個(gè)頻段中,小波包能量差異項(xiàng)共97項(xiàng),Shannon熵值差異項(xiàng)共17項(xiàng)。以小波包第四層上五組樣本的小波包能量和Shannon熵值特征的比較為例,結(jié)果如下:
(1)五組樣本的小波包能量特征有較多頻段的差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。差異頻段項(xiàng)集中在5 500~7 500 Hz(見表2、表3)。差異頻段區(qū)各組小波包能量的比較顯示:實(shí)證組>腎氣虛組>肺氣陰兩虛組>肺氣虛組>正常組(見圖1)。
表2 肺系三病不同中醫(yī)證型的小波包能量比較(±s,×10-4)
表2 肺系三病不同中醫(yī)證型的小波包能量比較(±s,×10-4)
注:僅列出差異有統(tǒng)計(jì)學(xué)意義的小波包能量項(xiàng),P<0.05。
頻段/Hz 肺氣虛組 腎氣虛組 肺氣陰兩虛組 實(shí)證組 正常對(duì)照組5 500~6 000 2.50±2.93 3.16±4.224 3.00±5.07 3.43±4.98 1.84±2.90 6 000~6 500 2.23±2.86 2.84±4.22 2.65±5.22 2.96±4.80 1.64±2.90 6 500~7 000 1.60±2.32 2.19±3.74 2.22±4.74 2.33±4.18 1.41±2.90 7 000~7 500 0.80±1.87 1.25±3.30 1.15±3.77 1.49±3.89 0.65±2.90
表3 肺系三病不同中醫(yī)證型的小波包Shannon熵值比較(±s)
表3 肺系三病不同中醫(yī)證型的小波包Shannon熵值比較(±s)
注:僅列出差異有統(tǒng)計(jì)學(xué)意義的小波包Shannon熵值項(xiàng),P<0.05。
頻段/Hz 肺氣虛組 腎氣虛組 肺氣陰兩虛組 實(shí)證組 正常對(duì)照組0~500 2.40±5.08 2.65±6.01 2.85±6.94 1.97±4.29 1.61±2.04 500~1 000 2.75±7.95 2.70±6.40 3.40±8.09 2.05±5.03 2.42±5.54 2 500~3 000 8.66×10-2±4.71×10-1 6.12×10-2±1.64×10-1 1.21×10-1±3.34×10-1 6.53×10-2±2.43×10-1 1.70×10-3±7.98×10-3 4 000~4 500 5.40×10-5±1.89×10-4 4.57×10-5±1.01×10-4 1.62×10-4±6.10×10-4 3.48×10-5±8.32×10-5 3.19×10-6±1.05×10-5 4 500~5 000 7.84×10-4±4.04×10-3 6.64×10-4±1.58×10-3 1.75×10-3±6.09×10-3 5.57×10-4±1.89×10-3 2.21×10-5±9.63×10-5
圖1 差異頻段處肺系三病不同中醫(yī)證型的小波包能量分布(P<0.05)
(2)五組樣本的小波包Shannon熵值特征比較,有較多頻段差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。差異頻段區(qū),肺氣陰兩虛組的小波包Shannon熵值最高,正常對(duì)照組最低。肺氣陰兩虛組的總熵值最高,其次為肺氣虛組、腎氣虛組、實(shí)證組,正常對(duì)照組最低。見圖2。
圖2 肺系三病不同中醫(yī)證型的總熵值
采用小波包分解提取的小波包能量和Shannon熵值兩種特征,對(duì)7層254個(gè)頻段上提取的所有特征進(jìn)行優(yōu)化選擇,分別運(yùn)用SVM和BP神經(jīng)網(wǎng)絡(luò)對(duì)肺系不同病證樣本進(jìn)行分類識(shí)別,并比較兩者的分類識(shí)別效果,結(jié)果如下:
2.2.1 肺系三病的語音分類識(shí)別結(jié)果
運(yùn)用SVM對(duì)肺癌、慢支、哮喘和正常對(duì)照四組樣本進(jìn)行分類識(shí)別的總準(zhǔn)確率為76.29%,肺癌、慢支、哮喘、正常對(duì)照的判別準(zhǔn)確率分別為79.49%、73.95%、66.67%和90.20%。運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)肺癌、慢支、哮喘和正常對(duì)照四組樣本進(jìn)行分類識(shí)別的總準(zhǔn)確率為61.17%,肺癌、慢支、哮喘和正常對(duì)照的判別準(zhǔn)確率分別為:52.56%、54.62%、64.58%和70.59%。SVM的分類效果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
2.2.2 肺系三病不同中醫(yī)證型的語音分類識(shí)別結(jié)果
運(yùn)用SVM對(duì)肺氣虛、腎氣虛、肺氣陰兩虛、實(shí)證和正常對(duì)照五組樣本進(jìn)行分類識(shí)別的總準(zhǔn)確率為83.67%,肺氣虛、腎氣虛、肺氣陰兩虛、實(shí)證和正常對(duì)照組的判別準(zhǔn)確率分別為84.48%、80.56%、79.17%、80.82%和90.20%。運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)肺氣虛、腎氣虛、肺氣陰兩虛、實(shí)證和正常對(duì)照五組樣本進(jìn)行分類識(shí)別的總準(zhǔn)確率為71.95%,肺氣虛、腎氣虛、肺氣陰兩虛、實(shí)證和正常對(duì)照組的判別準(zhǔn)確率分別為:75.00%、56.94%、66.67%、67.12%和70.59%。SVM的分類效果明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
聲診理論歷史悠久,在長期臨床實(shí)踐中發(fā)揮著獨(dú)特而重要的應(yīng)用價(jià)值。隨著科學(xué)技術(shù)的不斷發(fā)展,運(yùn)用現(xiàn)代聲學(xué)儀器和方法對(duì)臨床常見疾病和證型的聲學(xué)參數(shù)進(jìn)行研究和探討,對(duì)語音進(jìn)行定性、定量分析,為研究聲診的客觀方法和標(biāo)準(zhǔn)提供了可能。聲診客觀化研究起步較晚,但經(jīng)過研究者們不斷地探索,在聲音的客觀采集、描記方法與儀器以及聲音信號(hào)特征提取和分類識(shí)別的研究方面都取得一些進(jìn)展。一方面,基于聲學(xué)、空氣動(dòng)力學(xué)、頻譜分析、聲圖儀等理論和方法,研制開發(fā)的聲音傳感器和聲音采集分析系統(tǒng)和儀器,例如數(shù)字式通用語音頻譜儀、二十五音分析儀、寬頻帶聲音傳感器等已開始相繼見于一些文獻(xiàn)報(bào)道[7-8],能較為客觀地采集和描記聲音信號(hào)的波形;另一方面,運(yùn)用各種信號(hào)處理和分析技術(shù)對(duì)聲音信號(hào)進(jìn)行分析,如頻域分析法、時(shí)域分析法、小波分析法等,提取得到更多聲音的定量參數(shù)[9-12],并運(yùn)用統(tǒng)計(jì)學(xué)、人工神經(jīng)網(wǎng)絡(luò)、SVM等方法進(jìn)行聲音信號(hào)的分類識(shí)別研究。這些技術(shù)和方法為中醫(yī)借鑒和運(yùn)用現(xiàn)代聲學(xué)技術(shù)方法進(jìn)行聲診的客觀化研究提供了基礎(chǔ)。
辨病和辨證是中醫(yī)學(xué)從不同角度對(duì)疾病本質(zhì)進(jìn)行認(rèn)識(shí)的方法,是中醫(yī)診療理論體系的兩個(gè)重要部分。本研究對(duì)肺系三種疾?。?、哮喘、肺癌)的四種常見證型(肺氣虛、腎氣虛、肺氣陰兩虛、實(shí)證)和正常人語音信號(hào)進(jìn)行客觀檢測與分析,結(jié)果顯示小波包能量和Shannon熵值特征的差異項(xiàng)分別有97項(xiàng)和17項(xiàng)。小波包能量的差異項(xiàng)集中在5 500~7 500Hz頻段區(qū)。運(yùn)用小波包分解方法提取的小波包能量和Shannon熵值兩個(gè)特征可以初步區(qū)分肺系四種常見證型患者之間的語音差異,以及肺系不同病證患者和正常人之間的語音差異。這一結(jié)果初步證明了小波包能量和Shannon熵值等現(xiàn)代聲學(xué)參數(shù)在中醫(yī)診斷辨證中可以提供一定的輔助作用。
模式識(shí)別是20世紀(jì)60年代初在計(jì)算機(jī)科學(xué)、人工智能等學(xué)科基礎(chǔ)上迅速發(fā)展而來的一門新學(xué)科,近年來被引入到聲診研究中。在模式識(shí)別過程中,特征的提取與選擇、分類器的設(shè)計(jì)都是非常關(guān)鍵的兩個(gè)方面。在聲診信號(hào)的特征提取方面,有時(shí)域分析、頻域分析、小波包分析等多種方法,其中小波包分析是一種時(shí)頻結(jié)合的分析方法,在時(shí)域和頻域都能較好的表征信號(hào)局部信息,具有多分辨率的特性。對(duì)分析和處理語音信號(hào)等非平穩(wěn)隨機(jī)信號(hào)非常適合。在分類器方面,BP神經(jīng)網(wǎng)絡(luò)是基于對(duì)人腦組織結(jié)構(gòu)、活動(dòng)機(jī)制的初步認(rèn)識(shí)提出的一種新型信息處理體系,是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。SVM[13]是一種非常有潛力的分類識(shí)別技術(shù),它是建立在VC維和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理之上的基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法。SVM可以根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,具有很好的泛化能力,在解決小樣本、非線性以及高維模式識(shí)別問題中有很大優(yōu)勢。本研究運(yùn)用小波包分解提取了小波包能量和Shannon熵值特征,分別運(yùn)用SVM和BP神經(jīng)網(wǎng)絡(luò),進(jìn)行肺系不同疾病和證型的聲診分類識(shí)別,結(jié)果發(fā)現(xiàn)SVM對(duì)肺系病證的分類識(shí)別準(zhǔn)確率分別為76.29%和83.67%,而BP神經(jīng)網(wǎng)絡(luò)對(duì)肺系病證的分類識(shí)別準(zhǔn)確率分別為61.17%和71.95%??梢娫趯?duì)肺系病證的聲診分類識(shí)別中,SVM和BP神經(jīng)網(wǎng)絡(luò)均有較好的識(shí)別率,SVM的分類識(shí)別效果更優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。同時(shí)初步證明了以小波包能量和Shannon熵值特征為代表的小波包特征參數(shù)在肺系病證的分類識(shí)別具中有一定的貢獻(xiàn),為中醫(yī)聲診信號(hào)的特征提取和分類識(shí)別提供一種有效的新方法和思路。