王增政, 王巖松, 郭 輝, 袁 濤, 鄭立輝, 孫 裴
(上海工程技術大學 機械與汽車工程學院, 上海 201620)
目前,針對高速列車車內(nèi)聲品質(zhì)評價方式的研究,大多數(shù)還是沿用傳統(tǒng)的問卷調(diào)查和主觀評價實驗等評價形式。 而高速列車車內(nèi)噪聲信號具有復雜性、多特征性,這種簡易的評價方式用于評價高速列車車內(nèi)聲品質(zhì)的準確性和合理性有待商榷。 因此,通過結(jié)合信號本身的心理聲學參數(shù)特性和人的主觀評價結(jié)果,利用多參數(shù)建立可以預測人的主觀評價結(jié)果的評價模型是非常有必要的。
高速列車車內(nèi)聲品質(zhì)主觀評價研究中,一般會根據(jù)評價對象和評價目標進行評價方法和評價模型的改進。 Hardy采用了多種評價內(nèi)部噪聲環(huán)境的標準,如:噪聲準則(NC)、首選噪聲準則(PNC)、噪聲等級(NR)、房間準則(RC),研究軌道車輛噪聲抑制過程中的固有問題,確定了該噪聲與乘客響應之間的關系;周家中基于交通網(wǎng)絡距離重新劃分影響范圍,用分距離影響帶的線型和指數(shù)型空間權(quán)重系數(shù)方程,構(gòu)建軌道列車交通客流的LS-SVM 預測模型,結(jié)果顯示,模型不僅可以簡化數(shù)據(jù)的需求量,還能明顯提高客流量的預測精度,但受地域因素影響較大;孟凡雨以高速列車車內(nèi)噪聲聲品質(zhì)的評價參量和主觀評價結(jié)果分別作為輸入和輸出,確定網(wǎng)絡的結(jié)構(gòu)和參數(shù),建立具有預測主觀評價結(jié)果功能的BP 神經(jīng)網(wǎng)絡模型,研究聲音的物理屬性和心理聲學屬性之間的關系;鄭德署開發(fā)了一個基于NET 平臺的噪聲預測系統(tǒng),通過圖形化的形式展現(xiàn),實現(xiàn)了對噪聲的計算分析功能; Park 等利用具有不同語音噪聲比和背景噪聲水平的噪聲源與隔間噪聲進行了兩次實驗,結(jié)果顯示語音隱私和煩惱受聲噪比的影響顯著。
而對于高速列車車內(nèi)聲音信號的聲音特性的篩選,以期用有效心理聲學參數(shù)量化表征主觀評價結(jié)果的研究還是相對較少,大部分還是用線性回歸模型進行分析,難以很好地表達復雜的數(shù)據(jù),而且對于具有相關性的特征數(shù)據(jù)難以建模。 在此基礎上,區(qū)別于最小二乘支持向量機,本文中的最小二乘法—支持向量機回歸(LS-SVR)首先利用最小二乘法(LS) 篩選得到樣本,再通過支持向量機回歸(SVR),建立高速列車車內(nèi)聲品質(zhì)預測模型。
車廂噪聲信號由數(shù)字人工頭記錄采集,并由LMS Test.lab 軟件同步記錄噪聲數(shù)據(jù)。 每個測點記錄4 種不同工況類型的信號,根據(jù)ISO 3381:2005并結(jié)合實際情況選擇5 個測點,人工頭在車廂內(nèi)安裝位置如圖1 和圖2 所示。 圖1 中人工頭的站姿高度為1.6 m,圖2 中人工頭的坐姿高度為1.2 m。 采集前用吊錘校準人耳與車廂地面的垂直度。
圖1 人工頭站姿 Fig.1 Standing pose
圖2 人工頭坐姿Fig.2 Sitting pose
列車不同工況平穩(wěn)運行時,原始信號被記錄,每次記錄時長17 s。 根據(jù)實驗需要和標準要求,截取樣本時長為5 s,目的是挑選合適的短時信號,用于評價實驗。 本著信號不重疊的原則,先由原始信號截取出每種工況下的3 個樣本,再根據(jù)每個樣本的A 計權(quán)值進行擬合,常用的擬合方法有插值擬合和曲線擬合,插值擬合適合于理想測量情況(沒有測量誤差)的數(shù)據(jù)擬合,曲線插值則允許誤差存在。而在實際測量中有不可避免的系統(tǒng)誤差,所以選用曲線擬合。 曲線擬合的原理是最小二乘法原理,即根據(jù)樣本數(shù)據(jù)點擬合后,再反向挑選出與擬合線誤差平方最小的樣本點所在的樣本,即為實驗聽音樣本。 這里對加速和減速工況下的原始樣本進行截取時,雖然速度區(qū)間有差異,但是本質(zhì)都是同一原始信號截取的,速度作為一個維度可以進行比較。 而且5 s內(nèi)速度變化引起的變化量可以忽略,如勻速240 km/h 情況下,原始信號的3 個不同時間段內(nèi)的樣本點擬合,如圖3 所示。
圖3 同源信號不同時間段擬合Fig.3 Fitting of homologous signals of different time periods
目的是明確一階(直線)擬合和二階(曲線)擬合哪種擬合方式得到的擬合殘差平方和更低,即確定樣本中的時間和聲壓級之間的函數(shù)關系。 分別計算了擬合后各樣本點與擬合點間的殘差平方和,見表1。 由表1 可知,同源不同時間段的一階擬合殘差平方和最低。 故選擇原始信號的2~7 s 時間段作為實驗樣本。 同理,按照此方法依次選取30 個實驗樣本,得到樣本后分別計算樣本的聲壓級、粗糙度、尖銳度、抖動度和指數(shù)等心理聲學參數(shù)值,見表2。
表1 殘差平方和Tab.1 Sum of squares of residuals
表2 樣本的心理聲學參數(shù)值Tab.2 Psychoacoustic parameter values of samples
首先,設計9 級語義評分表,結(jié)合數(shù)字等級評分法,賦予形容詞數(shù)字屬性,評分間隔為單位間隔。 在區(qū)分對聲音的“情感反應”和“情感評價”的詞匯中,常用的有尖銳度、愉悅度、煩惱度。 尖銳度是可以通過人的分析能力判斷得出的,也就是對聲音情感上的評價;而煩惱度在情感表達上則較復雜,是對聲音情感上的反應,這兩個都是主觀感覺的量化體現(xiàn)。 但是尖銳度在主觀的基礎上略微偏客觀。主觀評價指標選擇“煩躁度”,相比于其他噪聲評價指標,高鐵內(nèi)部復雜噪聲給人帶來的煩躁程度更明顯,同時還設置具有“中性感覺”的樣本作為參照,避免評分差距過大,評分等級為“5”,主觀評價見表3。 參考聲樣本由課題組聲學專家在聽完所有樣本后根據(jù)聲學經(jīng)驗選出,選出的所有參照樣本被試聽完后都認同這種“中性感覺”。 30 個聲音打亂順序隨機呈現(xiàn),聽者獨自坐在隔音室,待聽者情緒平靜后,被指示用具有9 個等級的評分表對樣本進行打分,從非常嘈雜到非常安靜。 30 個樣本由21 名評價者評價打分,21 名評價者中有14 位男性,7 位女性,每位評價者均沒有聽力障礙。 評價實驗后,最終得到30×21 維數(shù)值矩陣,進而將抽象復雜的主觀感受量化成數(shù)值,對聲音定量判斷的評價結(jié)果通??梢宰鳛橐粋€區(qū)間尺度被認可。 評價實驗前,對所有被試進行聽音訓練,訓練的聲音在實驗中不使用,被試會被告知這些聲音來自高鐵車廂噪聲。
表3 主觀評價表Tab.3 Subjective evaluation form
以30 個樣本作為橫向維度,21 名評價者作為縱向維度,并由這21 名評價者根據(jù)表3 對樣本進行打分,最終得到30×21 維評價結(jié)果數(shù)值矩陣,對每個樣本的橫向主觀得分求和,并計算其算術平均值。30 個樣本的煩躁度得分均值,如圖4 所示。
圖4 樣本的實際得分均值Fig.4 Actual mean scores of the samples
支持向量機(SVM)是一類按監(jiān)督學習方式對數(shù)據(jù)進行二元分類的廣義線性分類器,是建立在統(tǒng)計學習理論VC(Vapanik-Cher-vonenkis)維理論和結(jié)構(gòu)風險最小原理的基礎上的。 通過尋求最小結(jié)構(gòu)化風險來提高學習機泛化能力,實現(xiàn)經(jīng)驗風險和置信范圍的最小化,從而達到在統(tǒng)計樣本較少的情況下,亦能獲得良好統(tǒng)計規(guī)律的目的,SVR 在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多獨有的優(yōu)勢。 高速列車本身的特殊構(gòu)造決定列車內(nèi)部噪聲特性的復雜性,在對其做評價研究過程中,精確的選取噪聲數(shù)據(jù)樣本對分析心理聲學參量與評價結(jié)果之間的關系尤為重要,本文用最小二乘法對截取的車廂噪聲樣本進行精確篩選后,再通過SVR預測分析,建立高速列車車內(nèi)聲品質(zhì)預測的最小二乘法——支持向量機回歸LS-SVR 評價模型。
將SVM 由分類問題推廣至回歸問題可以得到支持向量回歸(SVR)。
由最小二乘法反向篩選出的樣本計算的客觀參數(shù)和樣本的得分均值組成訓練樣本{x,y},1,2,3,…,,x∈R,且∈,對于傳統(tǒng)回歸模型通常直接基于模型輸出() 與真實輸出之間的差別來計算損失,當且僅當() 與完全相同時,損失才為0。 而SVR 假設() 與之間最多有的偏差,即僅當兩者之間的差別絕對值大于時才計算損失,相當于以() 為中心,構(gòu)建了一個寬度為2的間隔帶,于是SVR 問題可形式化,如式(1)所示:
其中,(,,,…,ω) 為法向量;為正則化常數(shù);l為不敏感損失函數(shù),如式(2)所示:
其中,為自變量,l() 為因變量。
再由式(3)分別對,,ξ和^求偏導為0,可得SVR 的對偶問題,如式(4)所示:
對于上述不等式約束優(yōu)化問題,需要滿足前提KKT 條件,KKT 條件是解決最優(yōu)化問題時用到的約束方法,其一是對拉格朗日函數(shù)取極值時的必要條件;其二是對拉格朗日系數(shù)的約束優(yōu)化;KKT 條件公式表達,如式(5)所示:
在滿足KKT 條件下,將式(2)對的偏導為0帶入到式(6)可得SVR 解,如式(7)所示:
由于高鐵噪聲中復雜的聲學特性,輸入的心理聲學參數(shù)和輸出的主觀評價結(jié)果之間存在復雜的非線性關系,所以引入核函數(shù)將原始空間映射到一個更高維的非線性特征空間進行分析,常用的核函數(shù)有線性核、多項式核、高斯核等,由于本文中的樣本數(shù)據(jù)點具有多維度特征,而高斯核函數(shù)具有優(yōu)越的可分性和局域性,因此本文選用更穩(wěn)定且泛化能力更強的高斯核函數(shù),如式(8)所示:
則最后得到SVR 的非線性高維解,如下所示:
以上過程在代碼實現(xiàn)前,首先要設置好參數(shù),其中,種群數(shù)量設置為15;交叉概率設置為0.8;迭代次數(shù)設置為100;初始的,,由交叉驗證后直接得到默認值。 對原始樣本進行多次訓練預測,最終的訓練集預測結(jié)果如圖5 所示。
圖5 訓練集樣本預測結(jié)果Fig.5 Training sample prediction results
為了進一步驗證LS-SVM 模型預測結(jié)果的準確性,再隨機選取12 個噪聲樣本作為測試集,并與傳統(tǒng)多元回歸模型進行比較。 12 個樣本都來自同一數(shù)據(jù)源,測試集中的數(shù)據(jù)點與訓練集樣本中數(shù)據(jù)點的獲取方法相同。 測試集的預測值與實際值之間的預測結(jié)果對比如圖6 所示。 圖6 中測試集預測的達到0.85,說明測試集的預測效果較理想。
圖6 測試集樣本預測結(jié)果對比Fig.6 Comparison of testing sample prediction results
多元線性回歸是用多個影響因素作為自變量來解釋因變量的變化,通常用來研究自變量與因變量之間的線性關系。 LS-SVM 預測模型與多元回歸模型之間的測試集預測誤差率對比見表4,可以看出LS-SVM 模型的預測誤差率比多元回歸模型低,而且線性回歸模型的預測誤差率最大達到21.9%,進而說明高鐵噪聲信號的心理聲學特性與主觀評價結(jié)果之間的非線性關系更明確,證明LS-SVM 評價模型針對高鐵噪聲評價時是適用的。
表4 模型測試集預測對比Tab.4 Comparison of prediction results of testing samples
高速列車車內(nèi)噪聲評價預測是高鐵噪聲評價中極為重要的一部分,不僅可以明確噪聲特性和人耳聽覺之間的關系,還能對車內(nèi)聲品質(zhì)的改善提供實際工程意義。 為得到更精準的噪聲樣本集,本文首先通過最小二乘法對截取的噪聲樣本進行曲線擬合;再反向挑選出原始樣本的樣本點與擬合點誤差平方和最小的樣本點所在的時間段,作為實驗樣本。分別計算實驗樣本的聲壓級、響度、粗糙度、尖銳度、抖動度和AI 指數(shù)6 個心理聲學參數(shù)的算術平均值;結(jié)合語義細分法,并賦予每個詞性數(shù)字屬性,建立主觀評價表,對樣本進行主觀評價實驗,得到評價結(jié)果;最后,結(jié)合SVR 建立高速列車的車內(nèi)聲品質(zhì)主觀評價LS-SVR 預測模型,并對模型進行對比驗證。實驗結(jié)果說明LS-SVR 模型針對高速列車車內(nèi)聲品質(zhì)預測是適用有效的。