范欣欣,祁樂(lè)融,楊釗陽(yáng),王 鑫
(中國(guó)傳媒大學(xué) 音樂(lè)與錄音藝術(shù)學(xué)院,北京 100024)
三維聲,又稱(chēng)沉浸式音頻,在平面環(huán)繞聲的基礎(chǔ)上增加了高度聲道,能夠更好地還原真實(shí)三維空間的聲音,提升人們的沉浸式聽(tīng)覺(jué)體驗(yàn)。然而,受三維聲聽(tīng)音環(huán)境及設(shè)備的限制,基于揚(yáng)聲器重放的三維聲系統(tǒng)很難普及,現(xiàn)今的主流形式是將三維聲信號(hào)經(jīng)過(guò)雙耳渲染處理,用耳機(jī)進(jìn)行重放。因此,如何在耳機(jī)重放的前提下,讓人們獲得有效的三維聲體驗(yàn)越發(fā)具有研究?jī)r(jià)值。
隨著三維聲的普及,很多學(xué)者都開(kāi)始探究如何有效地評(píng)價(jià)三維聲聽(tīng)感效果。不同于傳統(tǒng)雙聲道聲音的評(píng)價(jià),三維聲既強(qiáng)調(diào)固有的音質(zhì)維度,亦關(guān)注對(duì)聲源定位及空間感的塑造。Rumsey等[1]讓專(zhuān)業(yè)被試對(duì)揚(yáng)聲器重放的多聲道信號(hào)進(jìn)行聽(tīng)評(píng),考察總體評(píng)價(jià)與音質(zhì)、定位和空間保真度的關(guān)系;Bagousse等[2]從總體質(zhì)量、音質(zhì)、空間等方面對(duì)5.1揚(yáng)聲器系統(tǒng)重放的空間聲進(jìn)行主觀(guān)評(píng)價(jià);張建東等[3]提出進(jìn)行三維聲雙耳渲染主觀(guān)評(píng)價(jià)時(shí)的評(píng)價(jià)術(shù)語(yǔ)應(yīng)包括物理屬性(音色、明亮度等)、雙耳渲染特點(diǎn)(如聲源位置)、空間感等內(nèi)容。綜合眾多學(xué)者的觀(guān)點(diǎn)可知,目前在三維聲評(píng)價(jià)研究中,音質(zhì)、定位和空間感是3個(gè)主要的評(píng)價(jià)維度。
三維聲雙耳渲染算法是對(duì)制作好的多聲道三維聲節(jié)目源進(jìn)行渲染處理,最終輸出雙耳信號(hào),達(dá)到能使用普通立體聲耳機(jī)聆聽(tīng)三維聲的目的。目前,國(guó)內(nèi)外均有較為成熟的三維聲雙耳渲染算法,很多學(xué)者都開(kāi)始關(guān)注對(duì)雙耳渲染算法聽(tīng)感效果的主觀(guān)評(píng)價(jià)。Reardon等[4-6]分別從音質(zhì)(包括音質(zhì)平衡、清晰度、自然度和語(yǔ)言可懂度等)、聲源定位(包括前后混淆和上下混淆)和聲音外化感3個(gè)角度出發(fā),對(duì)6種商用雙耳渲染算法進(jìn)行了主觀(guān)評(píng)價(jià)實(shí)驗(yàn),分析不同渲染算法的聽(tīng)感效果。Ueno等[7]從聲源清晰度、聲音空間寬度、混響、定位清晰度、聲源寬度、環(huán)境感等9個(gè)方面比較了不同雙耳渲染算法的表現(xiàn)。Nawfal等[8]讓被試對(duì)比揚(yáng)聲器重放和雙耳渲染后耳機(jī)重放信號(hào)的相似度,評(píng)估不同渲染技術(shù)的優(yōu)劣。Lee等[9-10]提出了一種雙耳渲染算法——虛擬半球幅度平移(Virtual Hemispherical Amplitude Panning,VHAP),并在外化感和距離感知方面做了主觀(guān)評(píng)價(jià)實(shí)驗(yàn)。
雖然目前已經(jīng)存在一些雙耳渲染算法主觀(guān)評(píng)價(jià)的研究成果,但是在這些研究中,關(guān)于評(píng)價(jià)術(shù)語(yǔ)的選擇仍存在一些問(wèn)題: 評(píng)價(jià)術(shù)語(yǔ)之間存在一定的冗余,導(dǎo)致實(shí)驗(yàn)結(jié)果不夠準(zhǔn)確;不同評(píng)價(jià)術(shù)語(yǔ)之間可能存在包含關(guān)系,彼此之間的上下級(jí)關(guān)系并不明確;需要建立更加完備和細(xì)致的評(píng)價(jià)術(shù)語(yǔ)體系,以便今后對(duì)渲染算法的改進(jìn)給出更加明確的指導(dǎo)。因此,本文設(shè)計(jì)了一套三維聲雙耳渲染算法的主觀(guān)評(píng)價(jià)體系,對(duì)各個(gè)評(píng)價(jià)術(shù)語(yǔ)進(jìn)行歸類(lèi)和分層,基于帶有隱藏參考和錨點(diǎn)的多激勵(lì)(Multiple Stimuli with Hidden Reference and Anchor,MUSHRA)測(cè)試方法對(duì)不同實(shí)驗(yàn)素材的雙耳渲染信號(hào)進(jìn)行主觀(guān)評(píng)價(jià)實(shí)驗(yàn),探究影響感知結(jié)果的主要因素和各個(gè)評(píng)價(jià)術(shù)語(yǔ)之間的權(quán)重關(guān)系,以期對(duì)雙耳渲染算法的改進(jìn)提供科學(xué)參考。
實(shí)驗(yàn)素材參考了前人研究的信號(hào)種類(lèi),選擇了古典音樂(lè)、流行音樂(lè)、影視聲音等近百條素材,由十余位專(zhuān)業(yè)聽(tīng)音人員進(jìn)行篩選,最終選定6個(gè)素材,如表1所示,按內(nèi)容可分為影視(序號(hào)1、2、5)和音樂(lè)(3、4、6)兩類(lèi)。原始素材均為5.1.4或5.0.4的三維聲信號(hào),經(jīng)過(guò)5種不同的雙耳渲染算法,最終形成30個(gè)雙耳實(shí)驗(yàn)信號(hào)。5種雙耳渲染算法如表2所示,均為國(guó)內(nèi)外公司或科研機(jī)構(gòu)發(fā)布的較為成熟的渲染算法。這5種渲染算法的選取依據(jù)是盡量涵蓋不同的渲染處理方法,且聽(tīng)感具有一定差異,最終由專(zhuān)業(yè)聽(tīng)音人員反復(fù)聽(tīng)辨確定。其中,算法E并沒(méi)有進(jìn)行渲染處理,但其音質(zhì)劣化最不明顯,因此也作為一種算法進(jìn)行對(duì)比評(píng)測(cè)。
表1 三維聲雙耳渲染算法主觀(guān)評(píng)價(jià)的實(shí)驗(yàn)素材Tab.1 The experimental materials for subjective evaluation of 3D sound binaural rendering algorithms
本實(shí)驗(yàn)在中國(guó)傳媒大學(xué)電視臺(tái)三維聲混錄棚進(jìn)行,房間面積為22 m2,形狀對(duì)稱(chēng),混響時(shí)間為0.3 s,本底噪聲小于NR15。實(shí)驗(yàn)重放系統(tǒng)包括5.1.4揚(yáng)聲器監(jiān)聽(tīng)系統(tǒng)和耳機(jī)監(jiān)聽(tīng)系統(tǒng)兩部分。揚(yáng)聲器監(jiān)聽(tīng)系統(tǒng)用于播放多聲道三維聲參考信號(hào),由真力80系列專(zhuān)業(yè)監(jiān)聽(tīng)揚(yáng)聲器組成,采用ITU5.1.4標(biāo)準(zhǔn)擺放;耳機(jī)監(jiān)聽(tīng)系統(tǒng)用于播放雙耳實(shí)驗(yàn)信號(hào),由筆記本電腦連接RME Fireface UCX聲卡,采用森海塞爾的HD650監(jiān)聽(tīng)耳機(jī)進(jìn)行重放。為保證不同雙耳實(shí)驗(yàn)信號(hào)之間的響度一致性,首先在工作站中采用ITU 1770-4的響度標(biāo)準(zhǔn)進(jìn)行調(diào)整,隨后由5名專(zhuān)業(yè)聽(tīng)音人員進(jìn)行人工微調(diào)[13]。為保證兩個(gè)重放系統(tǒng)的響度一致,使用人工頭錄得揚(yáng)聲器和耳機(jī)的重放信號(hào),仍然采用ITU 1770-4響度標(biāo)準(zhǔn)對(duì)分別錄制的雙耳信號(hào)進(jìn)行響度校準(zhǔn),之后請(qǐng)5名聽(tīng)音專(zhuān)業(yè)的人員聽(tīng)音并進(jìn)行人工微調(diào)。最終用全頻帶粉紅噪聲測(cè)得的重放聲壓級(jí)約為80 dB(A)。
經(jīng)過(guò)梳理三維聲評(píng)價(jià)相關(guān)的參考文獻(xiàn),總結(jié)了用于主觀(guān)評(píng)價(jià)的術(shù)語(yǔ),由實(shí)驗(yàn)人員進(jìn)行篩選、整理和歸類(lèi);對(duì)于可能存在歧義或定義不清晰的術(shù)語(yǔ)則咨詢(xún)了具有三維聲混錄經(jīng)驗(yàn)的資深錄音師,進(jìn)行相應(yīng)替換和刪減。最終評(píng)價(jià)術(shù)語(yǔ)分成3個(gè)層級(jí),層級(jí)越高描述的內(nèi)容越具象,如表3所示。
表3 三維聲雙耳渲染算法的主觀(guān)評(píng)價(jià)術(shù)語(yǔ)Tab.3 The subjective evaluation terms of 3D sound binaural rendering algorithms
本次實(shí)驗(yàn)共招募被試約160名,年齡均在18~24歲之間,其中男生50人,女生110人。所有被試為中國(guó)傳媒大學(xué)的在校學(xué)生,專(zhuān)業(yè)以音樂(lè)學(xué)和錄音藝術(shù)為主,均有6年及以上專(zhuān)業(yè)音樂(lè)學(xué)習(xí)背景或錄音混音經(jīng)驗(yàn),能夠較好地理解所有評(píng)價(jià)維度的含義。正式實(shí)驗(yàn)前,以5人為一組進(jìn)行主觀(guān)評(píng)價(jià)實(shí)驗(yàn)培訓(xùn)。主試對(duì)被試進(jìn)行實(shí)驗(yàn)內(nèi)容、評(píng)測(cè)術(shù)語(yǔ)及打分頁(yè)面使用的介紹,之后分別通過(guò)揚(yáng)聲器和耳機(jī)播放培訓(xùn)素材,讓被試熟悉實(shí)驗(yàn)流程、實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)信號(hào)。
實(shí)驗(yàn)采用MUSHRA測(cè)試的方法,以揚(yáng)聲器重放的多聲道三維聲信號(hào)作為參考信號(hào),將經(jīng)過(guò)不同渲染算法處理后的雙耳信號(hào)作為實(shí)驗(yàn)信號(hào),被試通過(guò)比較各個(gè)實(shí)驗(yàn)信號(hào)與參考信號(hào)在不同評(píng)價(jià)術(shù)語(yǔ)方面的感知差異,從0到100分進(jìn)行打分。雖然揚(yáng)聲器重放與耳機(jī)重放存在很明顯的差異,但是當(dāng)被試都以揚(yáng)聲器版本為最佳版本進(jìn)行不同雙耳信號(hào)的比較時(shí),被試會(huì)更容易進(jìn)行評(píng)判,而且被試間的一致性也會(huì)更好。為了避免視頻引導(dǎo)對(duì)影視類(lèi)信號(hào)聽(tīng)感的影響,本次主觀(guān)評(píng)價(jià)實(shí)驗(yàn)全部采用無(wú)畫(huà)面引導(dǎo)的方式進(jìn)行。根據(jù)預(yù)實(shí)驗(yàn)的情況,我們將實(shí)驗(yàn)按二級(jí)評(píng)價(jià)術(shù)語(yǔ)分成3個(gè)小組,分別是音質(zhì)組、定位組和空間組。每組都包含一級(jí)和所有二級(jí)評(píng)價(jià)術(shù)語(yǔ),以及該二級(jí)組別下的多個(gè)三級(jí)評(píng)價(jià)術(shù)語(yǔ)。定位組別的主觀(guān)評(píng)價(jià)實(shí)驗(yàn)界面如圖1所示,是采用JavaScript開(kāi)發(fā)的基于WEB的實(shí)驗(yàn)操作界面。為了對(duì)被試進(jìn)行重復(fù)信度檢驗(yàn),根據(jù)預(yù)實(shí)驗(yàn)結(jié)果,將在各個(gè)評(píng)價(jià)術(shù)語(yǔ)方面打分比較居中的渲染信號(hào)C進(jìn)行重復(fù),因此被試需要對(duì)6個(gè)實(shí)驗(yàn)信號(hào)給出每個(gè)評(píng)價(jià)術(shù)語(yǔ)的打分。每位被試單獨(dú)進(jìn)行實(shí)驗(yàn),每次實(shí)驗(yàn)只對(duì)一個(gè)實(shí)驗(yàn)素材就一個(gè)評(píng)價(jià)小組進(jìn)行評(píng)價(jià),時(shí)長(zhǎng)約1 h左右。實(shí)驗(yàn)期間被試可隨意切換參考信號(hào)與不同的實(shí)驗(yàn)信號(hào),有一位主試人員全程跟隨引導(dǎo)。為了避免被試持續(xù)聽(tīng)音造成聽(tīng)感疲勞,在被試完成前4個(gè)評(píng)價(jià)術(shù)語(yǔ)打分后,休息10 min,并完成被試的問(wèn)卷調(diào)查。問(wèn)卷調(diào)查結(jié)果以備后期的進(jìn)一步數(shù)據(jù)分析使用。
圖1 定位組主觀(guān)評(píng)價(jià)實(shí)驗(yàn)界面Fig.1 The subjective evaluation experiment interface of location group
對(duì)被試進(jìn)行信度檢驗(yàn),用以篩選有效數(shù)據(jù)。首先檢驗(yàn)被試的重復(fù)信度,計(jì)算被試對(duì)算法C的重復(fù)信號(hào)在各個(gè)評(píng)價(jià)術(shù)語(yǔ)上兩次打分的標(biāo)準(zhǔn)偏差均值,如果該值小于10,則認(rèn)為該被試個(gè)人信度良好,數(shù)據(jù)可靠,可作后續(xù)分析處理。為了消除不同被試打分的差異性,對(duì)經(jīng)過(guò)重復(fù)信度檢驗(yàn)后的數(shù)據(jù)進(jìn)行歸一化處理[14]。隨后計(jì)算克朗巴哈系數(shù),進(jìn)行被試間一致性信度檢驗(yàn),剔除一致性差的被試結(jié)果,最終保證所有實(shí)驗(yàn)信號(hào)的克朗巴哈系數(shù)都在0.7以上。經(jīng)重復(fù)信度檢驗(yàn)和一致性信度檢驗(yàn)后,最終保留的有效被試共115人次,其中音質(zhì)組39人次,定位組39人次,空間組37人次。
本文采用實(shí)驗(yàn)信號(hào)(6水平)×渲染算法(5水平)的兩因素方差分析(Analysis of Variance,ANOVA),比較不同渲染算法的感知差異。所有統(tǒng)計(jì)分析都使用雙側(cè)檢驗(yàn),且顯著性水平為0.05,事后檢驗(yàn)采用Bonferroni修正法,用來(lái)估算效應(yīng)量。
2.2.1 渲染算法的主效應(yīng)分析
不同渲染算法的一級(jí)維度和二級(jí)維度評(píng)價(jià)結(jié)果如圖2所示。不同渲染算法在所有一級(jí)和二級(jí)評(píng)價(jià)術(shù)語(yǔ)上的得分均存在顯著性差異,如總體評(píng)價(jià):F(4,370)=22.79,p<0.001,=0.20;音質(zhì)維度:F(4,165)=11.30,p<0.001,=0.22;定位與距離維度:F(4,165)=7.63,p<0.001,=0.16;空間感維度:F(4,155)=6.86,p<0.001=0.15。事后檢驗(yàn)結(jié)果表明,算法D,A和E在總體評(píng)價(jià)上顯著優(yōu)于算法C和B;對(duì)于音質(zhì)評(píng)價(jià)而言,算法E和A顯著優(yōu)于其他3個(gè)算法;在定位感知上,算法B是最差的,其他4個(gè)渲染算法之間無(wú)顯著差異;在空間感知上,算法D是最好的,顯著優(yōu)于算法C和B,其他渲染算法之間無(wú)顯著差異。總體而言,算法B在各個(gè)評(píng)價(jià)維度上都是最差的,算法C次之,其他3個(gè)算法在不同評(píng)價(jià)術(shù)語(yǔ)上各有優(yōu)劣,算法E在音質(zhì)評(píng)價(jià)上最優(yōu),這與之前的預(yù)設(shè)相符。
圖2 不同渲染算法在一級(jí)和二級(jí)評(píng)價(jià)術(shù)語(yǔ)的主觀(guān)結(jié)果Fig.2 The subjective results of different rendering algorithms in the primary and secondary evaluation terms
2.2.2 實(shí)驗(yàn)信號(hào)與渲染算法的交互效應(yīng)分析
實(shí)驗(yàn)信號(hào)與渲染算法的交互效應(yīng)結(jié)果如表4所示。從結(jié)果可以看出,除了低頻厚重感,實(shí)驗(yàn)信號(hào)與渲染算法的交互效應(yīng)在其他所有評(píng)價(jià)術(shù)語(yǔ)上均存在顯著性差異。從效應(yīng)量來(lái)看,不同渲染算法在不同實(shí)驗(yàn)信號(hào)上的得分差異很大。由于本次實(shí)驗(yàn)評(píng)價(jià)的術(shù)語(yǔ)較多,本文僅對(duì)有明顯規(guī)律的實(shí)驗(yàn)結(jié)果進(jìn)行分析。
表4 實(shí)驗(yàn)信號(hào)與渲染算法的交互效應(yīng)Tab.4 The interactive effects of experimental signals and rendering algorithms
實(shí)驗(yàn)信號(hào)和渲染算法在總體評(píng)價(jià)上的交互效應(yīng)結(jié)果如圖3所示。從圖3可以看出,采用直接下混的算法E在不同實(shí)驗(yàn)信號(hào)上的得分差異非常大,在信號(hào)2,4,6上的得分最高,而在信號(hào)1和5上的得分最低。信號(hào)4和6都是屬于古典音樂(lè),強(qiáng)調(diào)音質(zhì)和廳堂感,算法E的特點(diǎn)正好符合古典音樂(lè)的聽(tīng)感要求;而信號(hào)1和5都屬于定位變化明顯、存在移動(dòng)聲源的節(jié)目類(lèi)型,算法E導(dǎo)致的頭中定位會(huì)影響被試的整體聽(tīng)感,從而得分最低。算法A和D在信號(hào)1和5上得分最高,可見(jiàn)雙耳渲染算法對(duì)于強(qiáng)調(diào)定位變化的聲音信號(hào)有顯著的優(yōu)化作用。
圖3 實(shí)驗(yàn)信號(hào)和渲染算法在總體評(píng)價(jià)上的交互效應(yīng)結(jié)果Fig.3 Interactive effect results of experimental signal and rendering algorithm in overall evaluation
圖4顯示了清晰度和明亮度的交互效應(yīng)結(jié)果。由圖可知,對(duì)于清晰度而言,除了實(shí)驗(yàn)信號(hào)1,算法E在其他所有實(shí)驗(yàn)信號(hào)上的得分都相對(duì)較高,而比較注重音質(zhì)、減少劣化的算法A在所有信號(hào)上的得分也相對(duì)較高。這說(shuō)明除非在算法上特意進(jìn)行音質(zhì)的優(yōu)化,否則雙耳渲染算法會(huì)較為明顯地影響信號(hào)在清晰度上的聽(tīng)感。從明亮度的交互效應(yīng)結(jié)果可以看出,算法E和A的得分在大部分實(shí)驗(yàn)信號(hào)上亦普遍較高。事后檢驗(yàn)結(jié)果表明,這兩種算法的明亮度評(píng)分顯著高于其他3種渲染算法。從結(jié)果上可以推斷,算法A和算法E在渲染過(guò)程中會(huì)保留較多的高頻,增加明亮度,這對(duì)聽(tīng)感的清晰度起到一定的提升作用。
圖4 清晰度和明亮度的交互效應(yīng)結(jié)果Fig.4 Interactive effect results of clarity and brightness
圖5顯示了水平定位和移動(dòng)聲源定位連續(xù)性的交互效應(yīng)結(jié)果。從結(jié)果可以看出,算法D在大部分實(shí)驗(yàn)信號(hào)上都可以獲得較好的得分,算法B普遍得分較低。其他3種算法在不同實(shí)驗(yàn)信號(hào)上的得分存在較大差異。觀(guān)察算法E的結(jié)果發(fā)現(xiàn),就實(shí)驗(yàn)信號(hào)3,4和6而言,算法E在這兩個(gè)評(píng)價(jià)維度上的結(jié)果并不差,這也進(jìn)一步說(shuō)明對(duì)于定位變化少的音樂(lè)類(lèi)信號(hào),雙耳渲染算法的優(yōu)勢(shì)并不明顯。而對(duì)于定位變化明顯的信號(hào)1和5,大部分雙耳渲染算法會(huì)明顯提升定位方面的聽(tīng)感。
圖5 水平定位和移動(dòng)聲源定位連續(xù)性的交互效應(yīng)結(jié)果Fig.5 Interactive effect results of horizontal location and mobile sound source location continuity
沉浸感和聲音外化感的交互效應(yīng)結(jié)果如圖6所示。由圖6可知,算法D在這兩個(gè)評(píng)價(jià)維度上,對(duì)不同實(shí)驗(yàn)信號(hào)都具有較好的適用性;算法C和E除了在實(shí)驗(yàn)信號(hào)4和6上的得分略好,在其他信號(hào)的得分都較差。這說(shuō)明在沉浸感和聲音外化感這兩個(gè)評(píng)價(jià)維度上,總體評(píng)價(jià)較好的算法具有一定的信號(hào)普適性。對(duì)于實(shí)驗(yàn)信號(hào)4(古典弦樂(lè)四重奏)而言,算法E在這兩個(gè)評(píng)價(jià)維度的得分與算法D的并沒(méi)有顯著差異,這進(jìn)一步說(shuō)明對(duì)于古典音樂(lè)而言,雙耳渲染對(duì)沉浸感及外化感的提升不明顯。而對(duì)于其他強(qiáng)調(diào)定位變化及環(huán)繞感的信號(hào),雙耳渲染則有較明顯的提升作用。
圖6 沉浸感和聲音外化感的交互效應(yīng)結(jié)果Fig.6 Interactive effect results of immersion and sound externalization
采用逐步線(xiàn)性回歸分析,研究不同層級(jí)評(píng)價(jià)術(shù)語(yǔ)之間的關(guān)系,結(jié)果如表5所示。從結(jié)果可以看出,對(duì)于總體評(píng)價(jià)而言,音質(zhì)是最重要的影響因素,其次是空間感。而音質(zhì)的感知主要受動(dòng)態(tài)范圍、清晰度和噪聲與失真的影響。定位的感知主要與聲源寬度和移動(dòng)聲源定位連續(xù)性有關(guān)。對(duì)于空間感而言,沉浸感是最重要的影響因素,聲音外化感也是較為重要的影響因素。
表5 不同層級(jí)評(píng)價(jià)術(shù)語(yǔ)的回歸分析Tab.5 Regression analysis of evaluation terms at different levels
2.4.1 5種雙耳渲染算法的對(duì)比分析
從主觀(guān)評(píng)價(jià)實(shí)驗(yàn)結(jié)果來(lái)看,5種不同的雙耳渲染算法在不同評(píng)價(jià)術(shù)語(yǔ)上的得分存在顯著差異。由一級(jí)和二級(jí)評(píng)價(jià)術(shù)語(yǔ)的結(jié)果可以看出,算法B在各個(gè)評(píng)價(jià)維度上都是最差的。提出算法B的學(xué)者曾經(jīng)采用簡(jiǎn)單的音效信號(hào),例如雷聲、雨聲和直升機(jī)等在總體評(píng)價(jià)、聲源寬度和聲源高度3個(gè)評(píng)價(jià)維度上,與原始的5.1.4實(shí)驗(yàn)信號(hào)進(jìn)行對(duì)比評(píng)測(cè),發(fā)現(xiàn)算法B的效果并不差[10]。之所以與本文的測(cè)試結(jié)果存在出入,原因一是兩次實(shí)驗(yàn)使用的素材不同,本實(shí)驗(yàn)使用的聲音素材更加復(fù)雜和多元化,算法B對(duì)于復(fù)雜信號(hào)的處理效果可能不夠理想;原因二是本實(shí)驗(yàn)采用耳機(jī)重放,而非揚(yáng)聲器重放。算法C是將多聲道信號(hào)先經(jīng)過(guò)Ambisonics7階的編解碼處理,再變換為雙耳信號(hào)。從實(shí)驗(yàn)結(jié)果來(lái)看,這種Ambisonics的處理并沒(méi)有在各個(gè)評(píng)價(jià)維度上帶來(lái)優(yōu)化的效果,甚至在總體評(píng)價(jià)和音質(zhì)上會(huì)造成顯著的劣化。相對(duì)而言,算法A和D的評(píng)測(cè)結(jié)果都相對(duì)較好,算法A在音質(zhì)上更優(yōu),而算法D在定位和空間感知上更勝一籌。算法E的特點(diǎn)是音質(zhì)損失最少,但是有明顯的頭中定位問(wèn)題,然而從總體評(píng)價(jià)上來(lái)看效果并不差,這可能是因?yàn)榭傮w評(píng)價(jià)的評(píng)判深受音質(zhì)的影響。
進(jìn)一步分析渲染算法和實(shí)驗(yàn)信號(hào)的交互效應(yīng)可發(fā)現(xiàn),不同渲染算法在不同實(shí)驗(yàn)信號(hào)上各個(gè)評(píng)價(jià)維度的得分存在顯著差異,很難找到某種渲染算法可以適用于所有實(shí)驗(yàn)信號(hào)。對(duì)于實(shí)驗(yàn)信號(hào)4和6,算法E在大部分評(píng)價(jià)維度上的得分都不差。實(shí)驗(yàn)信號(hào)4是一首在音樂(lè)廳錄制的弦樂(lè)四重奏,而實(shí)驗(yàn)信號(hào)6是在教堂錄制的阿卡貝拉,都屬于古典音樂(lè)。對(duì)于古典音樂(lè)這類(lèi)更強(qiáng)調(diào)音質(zhì)和廳堂感的聲音信號(hào),由于雙耳渲染算法導(dǎo)致音質(zhì)的劣化,可能會(huì)進(jìn)而影響定位和空間感維度的評(píng)價(jià)。因此對(duì)于這一類(lèi)信號(hào),進(jìn)行雙耳渲染處理并沒(méi)有太大必要。反觀(guān)實(shí)驗(yàn)信號(hào)1和5,這種更加強(qiáng)調(diào)定位變化以及空間感知的聲音信號(hào),對(duì)其進(jìn)行雙耳渲染處理會(huì)有顯著的優(yōu)化作用。
2.4.2 不同評(píng)價(jià)維度的關(guān)系分析
本文根據(jù)前人的研究成果,將主觀(guān)評(píng)價(jià)實(shí)驗(yàn)的多個(gè)評(píng)價(jià)術(shù)語(yǔ)按照逐層遞進(jìn)的關(guān)系,分成3個(gè)層級(jí)。第1個(gè)層級(jí)是最為綜合和概括的評(píng)價(jià)維度,讓被試對(duì)聲音信號(hào)進(jìn)行總體評(píng)價(jià);第2個(gè)層級(jí)是根據(jù)三維聲信號(hào)的特點(diǎn),將影響總體評(píng)價(jià)的因素分成3個(gè)大的維度,分別是音質(zhì)、定位和空間感知,這與很多學(xué)者的研究思路相吻合[1-3,15-16]。第3個(gè)層級(jí)包含第2層評(píng)價(jià)維度下更加具象的評(píng)價(jià)術(shù)語(yǔ)。本文實(shí)驗(yàn)結(jié)果表明,影響總體評(píng)價(jià)最顯著的因素為音質(zhì),其次是空間感,定位的影響最小。Rumsey等[17]考察了專(zhuān)業(yè)被試對(duì)多聲道信號(hào)總體評(píng)價(jià)與音質(zhì)、定位和空間保真度的關(guān)系,兩次實(shí)驗(yàn)結(jié)果都發(fā)現(xiàn)音質(zhì)是影響總體評(píng)價(jià)最為重要的參數(shù),但是在定位和空間的權(quán)重比例存在較大的差異。造成差異的原因可能是因?yàn)镽umsey實(shí)驗(yàn)采用揚(yáng)聲器重放,不同處理方式導(dǎo)致定位上的區(qū)分度更加明顯,也更容易引起專(zhuān)業(yè)被試的關(guān)注。而本文的實(shí)驗(yàn)是對(duì)雙耳渲染算法進(jìn)行評(píng)測(cè),由于采用耳機(jī)重放,在定位的區(qū)分度上并不是特別明顯,因此專(zhuān)業(yè)被試會(huì)更加關(guān)注空間感的維度。由此推斷,今后關(guān)于雙耳渲染算法的改進(jìn),首先要保證音質(zhì)不要有明顯的劣化,其次應(yīng)該增加雙耳信號(hào)的空間感知。
從二級(jí)和三級(jí)評(píng)價(jià)維度的結(jié)果上可以看出,若想在音質(zhì)維度上評(píng)價(jià)較好,雙耳信號(hào)應(yīng)該盡量保持較好的動(dòng)態(tài),聲源清晰可辨,信號(hào)不存在明顯的噪聲或者失真;在定位維度的評(píng)價(jià)上,雙耳信號(hào)的優(yōu)劣主要與聲源感知寬度和移動(dòng)聲源定位連續(xù)性有關(guān);在空間感的評(píng)價(jià)上,具有明顯的沉浸感,且聲源外化感明顯的雙耳信號(hào)往往會(huì)帶來(lái)更好的聽(tīng)感體驗(yàn)。
本文針對(duì)三維聲雙耳渲染算法設(shè)計(jì)了主觀(guān)評(píng)價(jià)實(shí)驗(yàn),以多聲道揚(yáng)聲器重放信號(hào)為參考音頻,采用MUSHRA主觀(guān)實(shí)驗(yàn)方法對(duì)不同渲染算法在不同評(píng)價(jià)維度上進(jìn)行打分,通過(guò)方差分析和回歸分析,對(duì)比了不同渲染算法的特點(diǎn)和信號(hào)適用性,并探究了不同層級(jí)評(píng)價(jià)術(shù)語(yǔ)的權(quán)重關(guān)系。本文的主要結(jié)論如下:
1) 為了讓雙耳渲染算法的改進(jìn)有明確的方向,感知評(píng)價(jià)維度應(yīng)該分層,通過(guò)獲得不同層級(jí)評(píng)價(jià)術(shù)語(yǔ)的權(quán)重關(guān)系,明確被試在進(jìn)行感知綜合評(píng)價(jià)時(shí),哪些子維度是被試更加關(guān)注的要素。
2) 被試在進(jìn)行總體評(píng)價(jià)時(shí),最重要的影響因素是音質(zhì),其次是空間感。因此雙耳渲染算法在權(quán)衡音質(zhì)和聲音外化感時(shí),應(yīng)首先考慮避免明顯的音質(zhì)劣化。
3) 對(duì)于強(qiáng)調(diào)音質(zhì)和廳堂感的古典音樂(lè)信號(hào),雙耳渲染算法并不會(huì)帶來(lái)明顯的優(yōu)化;而對(duì)于強(qiáng)調(diào)定位變化和環(huán)繞感的影視或音效類(lèi)聲音,雙耳渲染算法形成空間及定位上的變化,會(huì)帶來(lái)明顯的優(yōu)化效果。
在現(xiàn)有工作的基礎(chǔ)上,未來(lái)工作可包括: 對(duì)比分析專(zhuān)業(yè)被試與非專(zhuān)業(yè)被試的感知差異;三級(jí)評(píng)價(jià)術(shù)語(yǔ)的細(xì)化以及探究不同三級(jí)評(píng)價(jià)術(shù)語(yǔ)之間的關(guān)系;研究適用于渲染及算法評(píng)價(jià)的信號(hào)類(lèi)型;采用非線(xiàn)性回歸方法,探究不同層級(jí)評(píng)價(jià)維度的權(quán)重關(guān)系等。