金龍娥,黃澤好,2,陳華語,鄒艾宏,陳 寶
(1.重慶理工大學(xué) 車輛工程學(xué)院, 重慶 400054;2.重慶理工大學(xué) 汽車零部件先進(jìn)制造技術(shù)教育部重點實驗室, 重慶 400054;3.重慶金康賽力斯新能源汽車設(shè)計院有限公司, 重慶 401120)
汽車關(guān)門聲的聲品質(zhì)是表征汽車品質(zhì)的重要指標(biāo),因此研究其聲品質(zhì)具有重要意義。為快速而高效評價汽車關(guān)門聲聲品質(zhì),國內(nèi)眾多學(xué)者進(jìn)行了研究[1-3],趙麗路[4]基于經(jīng)驗?zāi)B(tài)分解和Hilbert-Huang變換提出新的關(guān)門聲聲品質(zhì)評價參數(shù),并通過多元線性回歸建立了關(guān)門聲聲品質(zhì)評價模型;楊川等[5]基于偽WIGNER-VILLE分布提出一種新的關(guān)門聲聲品質(zhì)評價參數(shù),并與主觀績效值做相關(guān)分析,結(jié)果表明新的評價參數(shù)與主觀績效值的相關(guān)性比傳統(tǒng)心理聲學(xué)參數(shù)更高,更能準(zhǔn)確評價關(guān)門聲聲品質(zhì);張福運[6]采用集合經(jīng)驗?zāi)B(tài)方法處理關(guān)門聲信號,引入能量概念構(gòu)造特征向量作為關(guān)門聲聲品質(zhì)評價的輸入,結(jié)果表明以能量特征向量為輸入的聲品質(zhì)評價模型的精度高于以心理聲學(xué)客觀參數(shù)為輸入的評價模型;王巖松等[7]提出一種將最優(yōu)小波包變換與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的聲品質(zhì)識別方法。國外的汽車聲品質(zhì)研究多側(cè)重于車內(nèi)聲品質(zhì)領(lǐng)域[8-11],而對汽車關(guān)門聲聲品質(zhì)關(guān)注較少。
汽車關(guān)門聲作為非平穩(wěn)信號[12],具有較強(qiáng)的時頻變化特征,文獻(xiàn)[12]針對平穩(wěn)信號和非平穩(wěn)信號的心理客觀參數(shù)進(jìn)行研究,發(fā)現(xiàn)平穩(wěn)信號的心理聲學(xué)客觀參數(shù)基本維持在一定幅度內(nèi)不會改變,而非平穩(wěn)信號的心理聲學(xué)客觀參數(shù)在短短幾秒內(nèi)會發(fā)生劇烈變化,并且信號的時長會影響心理聲學(xué)客觀參數(shù)的均值。因此,僅在頻域內(nèi)計算非平穩(wěn)聲信號的心理聲學(xué)客觀參數(shù)均值并不能準(zhǔn)確描述人的主觀感受[12]。為準(zhǔn)確分析和描述人對非平穩(wěn)聲信號的主觀感受,本文以乘用車關(guān)門聲為研究對象,采用小波包時頻分析方法對其進(jìn)行研究,分別建立基于心理聲學(xué)客的關(guān)門聲聲品質(zhì)評價模型和基于頻帶聲能量的關(guān)門聲聲品質(zhì)評價模型,并對2個模型的評價結(jié)果進(jìn)行分析。
聲樣本采集環(huán)境為半消聲室,本底噪聲17 dB,應(yīng)用HEAD人工頭測量,三腳架支撐人工頭頭頂距離地面、車門把手中心和車門外沿分別為1 715、300、400 mm,試驗工況為關(guān)門速度(1.0±0.02)m/s、(1.2±0.02)m/s、(1.4±0.02)m/s。為保證采集到有效信號,對9款車每個工況采集3個聲樣本,從開始關(guān)門前2 s進(jìn)行采集,每個聲樣本采集時間為10 s,剔除有噪聲干擾的聲樣本,每款車每個工況選擇一個有效聲樣本,得到有效聲樣本27個。考慮到主觀評價試驗中,聽音時間過長會使聽音者產(chǎn)生疲勞,而降低主觀評價的準(zhǔn)確性,因此在不影響聲樣本完整性的前提下,在Artemis軟件中將聲樣本截取成2.5 s。為保證截取的2.5 s聲信號能代表原信號,截取時保留峰值部分,對截取的2.5 s信號進(jìn)行時頻分析,主沖擊時間、峰值聲壓級、低頻延續(xù)時間等所有特征[13]與10 s信號對照一致。
汽車關(guān)門聲是汽車關(guān)門撞擊時產(chǎn)生的非平穩(wěn)信號[12],其持續(xù)時間較短,這里僅以其中一個信號為例分析,該聲壓曲線如圖1所示,曲線中最高峰值由關(guān)門時發(fā)生第一次碰撞產(chǎn)生,約7.5 Pa;聲壓曲線經(jīng)過不斷振蕩,后面的峰值大小表征聲音的衰減程度,持續(xù)1 s,聲壓衰減到0 Pa。
圖1 樣本序號1.6聲樣本聲壓曲線
圖2為該聲樣本時頻圖,縱軸為頻率,橫軸為時間,顏色表示聲音的強(qiáng)度,時頻圖可以表征各個頻率下的聲音強(qiáng)度與車門部件模態(tài)特征之間的關(guān)系[14]。由圖2可知汽車關(guān)門聲覆蓋的頻率范圍寬,高頻成分主要由門鎖碰撞產(chǎn)生,最高頻率在10 kHz以上,并且隨著時間推移各頻率成分逐漸衰減;聲音強(qiáng)度以低頻成分為主,低頻成分主要由車門與車身的碰撞及輻射產(chǎn)生,其強(qiáng)度也隨時間逐漸衰減。汽車關(guān)門聲樣本所包含的頻率成分及聲音強(qiáng)度均表現(xiàn)出較強(qiáng)的時變特征,說明運用時頻分析方法對其進(jìn)行研究非常有必要。
圖2 樣本序號1.6聲樣本時頻圖
主觀偏好性是用來描述人對聽到的聲音的喜愛程度,將其作為本試驗的主觀評價指標(biāo)。成對比較法因具有操作簡單、適用于無經(jīng)驗聽音者的優(yōu)點,被廣泛應(yīng)用于主觀評價試驗。本試驗一共27個聲樣本,采用成對比較法進(jìn)行聽音,將聲樣本隨機(jī)兩兩配對進(jìn)行比較,共有729個比較組。邀請24位聽音者進(jìn)行主觀評價試驗,試驗前為所有聽音者進(jìn)行培訓(xùn),使其了解試驗內(nèi)容及規(guī)則。
考慮到聽音時間過長會使聽音者產(chǎn)生疲勞和分心,從而降低評價的準(zhǔn)確性和一致性,對評價結(jié)果進(jìn)行誤判分析,結(jié)合3個類型的誤判(相同聲樣本對、交換聲樣本對、三角循環(huán)聲樣本對)計算計權(quán)一致性系數(shù),并按照誤判剔除原則[15]對計權(quán)一致性系數(shù)低于0.75的聽音者的評價數(shù)據(jù)予以剔除,如表1所示,剔除R5、R8、R21、R24。
表1 計權(quán)一致性系數(shù)
對余下20位聽音者的評價數(shù)據(jù)進(jìn)行處理,經(jīng)過算術(shù)平均得到如表2所示的主觀評價結(jié)果。由表2可以看出,隨著關(guān)門速度的提高,主觀偏好值普遍降低。
表2 主觀評價結(jié)果
BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一[16]。該網(wǎng)絡(luò)采用誤差回傳的方式來調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,但網(wǎng)絡(luò)權(quán)值和閾值初始值的確定會影響網(wǎng)絡(luò)學(xué)習(xí)的好壞。遺傳算法(genetic algorithms,GA)是一種模擬自然界遺傳機(jī)制和生物進(jìn)化論的并行隨機(jī)搜索最優(yōu)化方法,具有良好的隨機(jī)性、并行性和全局尋優(yōu)能力[16]。鑒于以上優(yōu)良特性,采用遺傳算法對BP神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值初始值進(jìn)行全局尋優(yōu),提高BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的準(zhǔn)確性。
GA-BP神經(jīng)網(wǎng)絡(luò)模型搭建步驟如下:
第1步:確定網(wǎng)絡(luò)初始結(jié)構(gòu),由此確定GA算法中染色體長度;
第2步:將BP神經(jīng)網(wǎng)絡(luò)的權(quán)值、閾值編碼為染色體,產(chǎn)生初始種群,并選用合適的適應(yīng)度函數(shù)對個體進(jìn)行適應(yīng)度值計算;
第3步:通過選擇、交叉、變異操作,不斷產(chǎn)生和篩選新的染色體,直到得到滿足條件的個體;
第4步:對滿足條件的個體進(jìn)行解碼,并將解碼后的權(quán)值、閾值賦予BP神經(jīng)網(wǎng)絡(luò);
第5步:對經(jīng)GA算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直至滿足條件。
GA-BP神經(jīng)網(wǎng)絡(luò)模型流程如圖3所示。
圖3 GA-BP神經(jīng)網(wǎng)絡(luò)模型流程框圖
響度、尖銳度、粗糙度、波動度等心理聲學(xué)參數(shù)是汽車聲品質(zhì)評價的常用客觀參數(shù),用以描述聲音特征,目前僅響度與尖銳度有國家計算標(biāo)準(zhǔn),在Artemis軟件中,導(dǎo)入聲樣本進(jìn)行心理聲學(xué)客觀參數(shù)的計算,提取關(guān)注較多的6個參數(shù)[1,4,6,12,16]:響度、尖銳度、A計權(quán)聲壓級、粗糙度、語言清晰度、波動度,如表3所示。
表3 心理聲學(xué)客觀參數(shù)
將表3中的6個心理聲學(xué)客觀參數(shù)作為輸入,主觀偏好值作為輸出,基于Matlab環(huán)境建立GA-BP關(guān)門聲聲品質(zhì)評價模型,將27個聲樣本導(dǎo)入模型后,劃分為訓(xùn)練集(22個聲樣本)和測試集(5個聲樣本)。
基于心理聲學(xué)客觀參數(shù)的關(guān)門聲聲品質(zhì)評價模型(evaluation model of door closing sound quality based on psychoacoustic objective parameters,EMDCSQ-POP)采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖4所示,輸入層(input)、隱含層(hidden layer)與輸出層(output layer)節(jié)點數(shù)分別為:6、10、1,隱含層選用logsig傳遞函數(shù),輸出層選用purelin傳遞函數(shù),W代表各層之間的權(quán)值矩陣,b代表各層之間的閾值向量。
圖4 基于心理聲學(xué)客觀參數(shù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
如圖5所示,訓(xùn)練集與測試集的均方誤差分別為1.685 6、0.694 96,擬合系數(shù)R2分別為0.939 9、0.789 7,雖然模型整體預(yù)測精度較高,預(yù)測值與真實值之間表現(xiàn)出較好的相關(guān)性,但由圖5可以看出針對部分樣本仍存在較大誤差。
圖5 基于心理聲學(xué)客觀參數(shù)的關(guān)門聲聲品質(zhì)評價模型結(jié)果曲線
小波變換又稱多分辨率分析,在時域和頻域都具有良好的局部化特性,適宜于分析任意尺度的信號。小波包變換作為小波變換的推廣,能夠?qū)π盘柕牡皖l部分和高頻部分進(jìn)行分解,具有更強(qiáng)的時頻局部化分析能力,其理論與方法在信號處理、語音分析等領(lǐng)域已廣泛應(yīng)用[17-18],但在聲品質(zhì)領(lǐng)域應(yīng)用較少。
根據(jù)人耳的聽覺多頻帶濾波特性,將頻域進(jìn)行重新劃分,形成24Bark域,每個Bark域形成一個臨界頻帶,在一個帶寬內(nèi)人耳的聽覺感知是相同的,臨界頻帶能很好地反映人腦對聽力的特征[14]。借鑒24 Bark域的頻率劃分方式,應(yīng)用小波包變換構(gòu)造濾波器組模擬人耳聽覺特征頻帶濾波功能[19],選擇db35小波作為基函數(shù),在Matlab環(huán)境下對聲樣本進(jìn)行分解,并對小波包樹中的節(jié)點進(jìn)行再分解和合并,在Matlab中進(jìn)行小波包變換存在高頻翻轉(zhuǎn)的現(xiàn)象[20],考慮到此原因其頻帶分布如表4所示。
表4 小波包變換下的頻帶分布
小波包變換將原本的非平穩(wěn)信號分解為多個頻帶的信號分量,每個信號分量表征該頻帶內(nèi)的頻率成分隨時間的變化。小波包變換從全頻域、全時域?qū)π盘栠M(jìn)行分解,更有利于非平穩(wěn)信號的分析。
為評價關(guān)門聲聲品質(zhì),需構(gòu)造聲樣本的特征向量,引入能量概念來表征各個頻帶在全時域范圍內(nèi)的聲音強(qiáng)度,計算每個頻帶內(nèi)的聲能量(如表5所示),從而構(gòu)造聲樣本能量特征向量。
表5 各頻帶聲能量
將聲樣本能量特征向量作為聲品質(zhì)評價模型的輸入,主觀偏好值作為輸出,構(gòu)建基于頻帶聲能量的GA-BP關(guān)門聲聲品質(zhì)評價模型(evaluation model of door closing sound quality of frequency band sound energy,EMDCSQ-FBSE),其訓(xùn)練集和測試集的劃分與3.1節(jié)一樣。
基于頻帶聲能量的關(guān)門聲聲品質(zhì)評價模型采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖6所示,輸入層(input)、隱含層(hidden layer)與輸出層(output layer)節(jié)點數(shù)分別為:24、12、1,隱含層選用logsig傳遞函數(shù),輸出層選用purelin傳遞函數(shù),W代表各層之間的權(quán)值矩陣,b代表各層之間的閾值向量。
圖6 基于小波包變換的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
如圖7所示,訓(xùn)練集與測試集的均方誤差分別為0.065 9、0.002 8,擬合系數(shù)R2分別為0.998 1、0.999 4,表明模型預(yù)測精度高,預(yù)測值與真實值之間表現(xiàn)出更好的相關(guān)性,預(yù)測值能夠較好地反映真實值的變化趨勢,說明小波包變換下的頻帶聲能量與主觀偏好性之間呈現(xiàn)較好的映射關(guān)系,使模型在學(xué)習(xí)后能夠呈現(xiàn)更好的預(yù)測效果。
圖7 基于小波包變換的關(guān)門聲聲品質(zhì)評價模型結(jié)果曲線
對模型性能評價通常采用平均絕對誤差、均方誤差、擬合系數(shù)等來指標(biāo)進(jìn)行評價[6,12,15],平均絕對誤差能夠避免誤差間相互抵消,可以準(zhǔn)確反映預(yù)測數(shù)據(jù)與原始數(shù)據(jù)之間的誤差大小;均方誤差常用來表征數(shù)據(jù)的變化程度,均方誤差值越小,表明模型對原始數(shù)據(jù)的描述精確度更好;擬合系數(shù)是表征回歸時擬合程度的指標(biāo),其值越大說明擬合得越好。對3.1節(jié)、3.2節(jié)2個模型的評價數(shù)據(jù)如表6所示。可知基于頻帶聲能量的關(guān)門聲聲品質(zhì)評價模型其誤差絕對值均值、均方誤差、擬合系數(shù)分別為0.046 6、0.002 8和0.999 5,與基于客觀參數(shù)的模型相比,分別降低0.553 1,降低0.692 2,提高0.209 8。
表6 測試集誤差分析
由圖5、圖7可知,相比基于客觀參數(shù)的關(guān)門聲聲品質(zhì)評價模型,基于頻帶聲能量的關(guān)門聲聲品質(zhì)評價模型在訓(xùn)練集、測試集上的表現(xiàn)都更好。由于汽車關(guān)門聲信號是非平穩(wěn)信號,傳統(tǒng)心理聲學(xué)的參數(shù)曲線會隨時間推移產(chǎn)生較大變化,當(dāng)取值方式不同時會對聲品質(zhì)評價結(jié)果產(chǎn)生影響。而運用小波包變換將關(guān)門聲樣本基于24Bark域分解為24個信號分量,完全覆蓋圖2所示的頻率范圍,并且基于小波包變換構(gòu)造的能量特征向量將圖2中涵蓋的能量分布信息進(jìn)行量化,表征了聲信號各頻帶在全時域上的能量分布情況,可基于關(guān)門聲樣本自身的信息對其進(jìn)行評價,更適合汽車非平穩(wěn)聲信號的聲品質(zhì)評價。
考慮到關(guān)門聲的非平穩(wěn)特性,應(yīng)用小波包時頻分析方法構(gòu)建了符合人耳聽覺特征的濾波器組;借鑒24Bark域劃分頻帶,并計算各頻帶內(nèi)的聲能量,構(gòu)造了聲樣本能量特征向量;建立了基于頻帶聲能量的GA-BP神經(jīng)網(wǎng)絡(luò)關(guān)門聲聲品質(zhì)評價模型。模型性能指標(biāo)表明,基于頻帶聲能量的關(guān)門聲聲品質(zhì)評價模型在誤差絕對值均值、均方誤差、擬合系數(shù)方面均優(yōu)于以傳統(tǒng)心理聲學(xué)客觀參數(shù)為輸入的聲品質(zhì)評價模型,以頻帶聲能量為輸入的聲品質(zhì)評價模型在預(yù)測精度上有明顯提高。因此,基于頻帶聲能量的聲品質(zhì)評價方法更適合于汽車非平穩(wěn)聲信號的聲品質(zhì)評價,可運用于汽車關(guān)門聲聲品質(zhì)評價工作中。