王 松,張 聰
武漢輕工大學(xué) 數(shù)學(xué)與計算機學(xué)院,武漢430048
隨著3D 電影的流行,三維音視頻技術(shù)越來越受到大家的歡迎和重視。當(dāng)前3D音頻技術(shù)主要有:波場合成(Wave Field Synthesis,WFS)[1-2]、頭相關(guān)傳輸函數(shù)(Head Related Transfer Function,HRTF)[3-4]、Ambisonics[5-8]、基于矢量的幅度平移技術(shù)(Vector Based Amplitude Panning,VBAP)[9]。所有這些技術(shù)中,VBAP相對使用簡單。VBAP 是一種從矢量角度描述虛擬聲源定位的Amplitude Panning技術(shù)[9]。VBAP技術(shù)計算效率較高,重建聲像位置較為準(zhǔn)確。
VBAP 技術(shù)使用3 個揚聲器合成一個虛擬聲源,可以看成是正弦法則的推廣。如果重建過程中使用揚聲器的數(shù)目多于3 個,VBAP 技術(shù)將會按照3 個揚聲器一組的原則,對所有的揚聲器陣列進(jìn)行分組。Wang 等發(fā)展了VBAP 技術(shù),使用4~5 個揚聲器合成一個虛擬聲源,在他們的方法中,當(dāng)使用4個或者5個揚聲器合成一個虛擬聲源時不需要對揚聲器陣列進(jìn)行分組[10-11]。針對傳統(tǒng)panning 技術(shù)當(dāng)聽音者頭部發(fā)生偏轉(zhuǎn),聲像定位不準(zhǔn)的問題,Menzies 等提出CAP(Compensated Amplitude Panning)技術(shù),CAP技術(shù)通過考慮聽音者頭部方向來調(diào)整增益,進(jìn)而修正ITD(Interaural Time Difference)線索,其頻率適用范圍大約為1 000 Hz,只需使用2個揚聲器[12]。VBAP 要想達(dá)到最佳效果,對聲源的相對位置具有一定的限制,針對此問題,F(xiàn)ranck基于優(yōu)化理論提出一種面向二維揚聲器擺放的panning算法用于控制聲源傳播,該算法不需要實時優(yōu)化,計算復(fù)雜度與VBAP相當(dāng)[13]。
22.2 多聲道系統(tǒng)由日本的NHK 提出,它是一種重要的三維音頻系統(tǒng),基于VBAP 技術(shù)產(chǎn)生虛擬聲像。22.2 多聲道系統(tǒng)的廣播應(yīng)用在文獻(xiàn)[14-17]中進(jìn)行了研究。但是在家庭環(huán)境中擺放24個揚聲器比較麻煩,同時價格較為昂貴。因此Ando提出了一種將22聲道精簡到10 聲道或者8 聲道的方法(兩個低頻效果聲道未做處理)[18]。2016年,Shin提出一種質(zhì)點速度匹配方法(Particle Velocity Matching Method,PVMSZ),該方法使用在原始多聲道系統(tǒng)和重建多聲道系統(tǒng)的同一區(qū)域內(nèi)部匹配質(zhì)點速度[19]。從理論上來講,它可以用于中心區(qū)域或者非中心區(qū)域聲場重建。文獻(xiàn)[19]的實驗基于PVMSZ方法使用5個和22個揚聲器在中心區(qū)域重建聲場。
文獻(xiàn)[18-19]中的22聲道系統(tǒng)或者其相關(guān)系統(tǒng)可以用于在中心點或者中心區(qū)域保持聲音的物理性質(zhì)不變。因此在中心點處或者中心區(qū)域,聽音者可以獲得最佳的聽音體驗。但是在實際情況下,當(dāng)多于一個聽音者在重建聲場中聽音時,多個聽音者不能同時獲得最佳聽音體驗,因為最佳聽音位置位于中心點處或者中心聽音區(qū)域內(nèi)部。
由于兩個聽音點是多個聽音者聽音的基礎(chǔ)情形,因此本文先研究兩個聽音點處三維聲場重建方法。針對上述問題,本文以10聲道系統(tǒng)重建22聲道系統(tǒng)為例,提出一種兩點處三維聲場重建方法。該方法同時保持重建前后兩點處的聲音物理性質(zhì)不變,可以讓兩個聽音者在同一個聲場中同時獲得最佳聽音體驗。為了驗證提出方法的有效性,本文從重建區(qū)域大小,重建區(qū)域之間的距離,重建區(qū)域之間的角度對重建誤差的影響方面,對比分析了傳統(tǒng)方法與提出方法的優(yōu)劣。仿真實驗結(jié)果表明提出方法在兩個聽音區(qū)域聲場重建中是一種可供選擇的方法。
其中,k為波數(shù),G為比例系數(shù),,f為聲音信號頻率,c為聲音在空氣中的傳播速度。
首先考慮多個揚聲器替換一個點聲源時,求解這些揚聲器的信號分配系數(shù)。在笛卡爾坐標(biāo)系中,假設(shè)一個點聲源和q個揚聲器位于同一個球面上,球面的中心為點O,也就是坐標(biāo)系的原點,其坐標(biāo)為,球面半徑為R。點聲源坐標(biāo)為q個揚聲器的坐標(biāo)為:聲場中存在任意兩個聽音點A1和A2,其坐標(biāo)為
假設(shè)點聲源在點A1處產(chǎn)生的聲壓與q個揚聲器在點A1處產(chǎn)生的聲壓相等,同時點聲源在點A2處產(chǎn)生的聲壓與q個揚聲器在點A2處產(chǎn)生的聲壓相等,可以得到方程組如下:
其中:
假設(shè)點聲源在點A1處產(chǎn)生的質(zhì)點速度與q個揚聲器在點A1處產(chǎn)生的質(zhì)點速度相等,同時點聲源在點A2處產(chǎn)生的質(zhì)點速度與q個揚聲器在點A2處產(chǎn)生的質(zhì)點速度相等,可以得到方程組如下:
讓式(5)兩邊的實部與實部,虛部與虛部分別相等,可以得到:
其中:
將方程(4)與方程(6)聯(lián)合構(gòu)造方程,可以得到:
其中:
然后可以得到如下方程:
式(8)可以使用現(xiàn)有多種方法求解。
當(dāng)使用q個揚聲器替換m個點聲源時,假設(shè)m個點聲源的信號為S1,S2,…,Sm。假設(shè)當(dāng)q個揚聲器替換第i個點聲源時,,使用本文1.2節(jié)的方法,可以求出q個揚聲器的信號分配系數(shù)為則可以得到:
兩區(qū)域三維聲場重建實驗測試了Ando 方法[18]、PVMSZ 方 法[19]和SPPVTLP 方 法 的 表 現(xiàn)。NHK22.2 多聲道系統(tǒng)(不帶兩個低頻效果聲道)以及其10聲道重建系統(tǒng)的揚聲器擺放位置如圖1 所示。揚聲器陣列的中心為點O,兩個關(guān)注區(qū)域為區(qū)域1、區(qū)域2,它們的中心點坐標(biāo)分別為因此區(qū)域1為一個非中心區(qū)域,區(qū)域2 為一個中心區(qū)域,假設(shè)聲音在空氣中的傳播速度為340 m/s,人頭半徑為0.085 m。700 Hz的單頻信號作為原始22聲道的原始信號。
相對均方誤差(Relative Mean Square Error,RMSE)的定義為:
圖1 揚聲器位置擺放圖
其中,積分區(qū)域V是一個半徑為α,中心為點A的球體,為V中任意一點,分別為原始聲壓和重建的聲壓。相對均方誤差的對比參見圖2。
當(dāng)α=0.085 m 時,Ando 方 法、PVMSZ 方 法 和SPPVTLP 方法產(chǎn)生的相對均方誤差如表1。對于10聲道揚聲器擺放,在一個人頭大小的區(qū)域內(nèi)(區(qū)域1)SPPVTLP 方法產(chǎn)生的相對均方誤差比Ando 方法和PVMSZ 方法分別降低10.53 和10.33 個百分點;在另一個人頭大小的區(qū)域內(nèi)(區(qū)域2)SPPVTLP 方法產(chǎn)生的相對均方誤差比Ando 方法高0.67 個百分點(少于0.01),SPPVTLP 方法產(chǎn)生的相對均方誤差比PVMSZ 方法降低0.33 個百分點(少于0.01)。這是因為Ando 方法和PVMSZ方法僅僅關(guān)注中心聽音點或者中心聽音區(qū)域內(nèi)聲場的恢復(fù),并不關(guān)注非中心聽音點或者非中心聽音區(qū)域內(nèi)聲場的恢復(fù)情況。然而,SPPVTLP 的方法同時關(guān)注中心聽音點A2與非中心聽音點A1處的聲場恢復(fù),所以SPPVTLP方法在非中心聽音點A1附近區(qū)域(區(qū)域1)產(chǎn)生的相對均方誤差低于傳統(tǒng)方法,同時保證了中心聽音點A2附近區(qū)域(區(qū)域2)產(chǎn)生的相對均方誤差與傳統(tǒng)方法差不多(誤差小于0.01)。
圖2 相對均方誤差比較
表1 α=0.085 m,f=700 Hz 時的相對均方誤差
由圖2 可知,當(dāng)α大于0.425 0 m(約5 個人頭半徑)時,在區(qū)域1范圍內(nèi),SPPVTLP方法產(chǎn)生的相對均方誤差大于Ando方法產(chǎn)生的相對均方誤差;當(dāng)α大于0.255 0 m(約3 個人頭半徑)時,在區(qū)域1 范圍內(nèi),SPPVTLP 方法產(chǎn)生的相對均方誤差大于PVMSZ方法產(chǎn)生的相對均方誤差。當(dāng)α大于0.510 0 m(約6個人頭半徑)時,在區(qū)域2 范圍內(nèi),SPPVTLP 方法產(chǎn)生的相對均方誤差比Ando方法產(chǎn)生的相對均方誤差大得較多;當(dāng)α大于0.340 0 m(約4 個人頭半徑)時,在區(qū)域2 范圍內(nèi),SPPVTLP方法產(chǎn)生的相對均方誤差比PVMSZ方法產(chǎn)生的相對均方誤差大得較多。這意味著當(dāng)區(qū)域1 的半徑為單個人頭半徑大小時,與Ando 方法和PVMSZ 方法相比,SPPVTLP方法能夠減少區(qū)域1 范圍內(nèi)的相對均方誤差。與此同時,當(dāng)區(qū)域2 的半徑為單個人頭半徑大小時,SPPVTLP方法在區(qū)域2 范圍內(nèi)可以獲得與Ando 方法和PVMSZ方法差不多的相對均方誤差。只有當(dāng)區(qū)域1和區(qū)域2的半徑變得足夠大時,SPPVTLP 方法產(chǎn)生的相對均方誤差才大于Ando 方法和PVMSZ 方法。這是因為在聲場重建的過程中,SPPVTLP 方法比傳統(tǒng)方法具有更多的約束條件,接收點距離點A1或A2越遠(yuǎn),接收點處的重建誤差將會變得越大。因此,當(dāng)區(qū)域1 或者區(qū)域2 的半徑變得足夠大時,SPPVTLP 方法產(chǎn)生的相對均方誤差大于Ando方法和PVMSZ方法。
本部分研究兩區(qū)域之間間隔距離對兩區(qū)域范圍內(nèi)相對均方誤差的影響。相對均方誤差的公式參見式(10)。兩個區(qū)域為區(qū)域1 和區(qū)域2,由于原始系統(tǒng)和重建系統(tǒng)包含的聲場直徑為4 m,因此可以假設(shè)兩個區(qū)域之間距離的變化范圍是0~4 m。區(qū)域1和區(qū)域2的半徑都是0.085 m,即人頭半徑大小。
當(dāng)區(qū)域1 和區(qū)域2 的中心點位于x軸上,并且對稱時,兩個區(qū)域的相對均方誤差與兩區(qū)域之間間隔距離的關(guān)系如圖3 所示;當(dāng)區(qū)域1 和區(qū)域2 的中心點位于y軸上,并且對稱時,兩個區(qū)域的相對均方誤差與兩區(qū)域之間間隔距離的關(guān)系如圖4 所示;當(dāng)區(qū)域1 和區(qū)域2 的中心點位于z軸上,并且對稱時,兩個區(qū)域的相對均方誤差與兩區(qū)域之間間隔距離的關(guān)系如圖5所示。
圖3 區(qū)域中心點位于x 軸上時,相對均方誤差與區(qū)域間隔距離的關(guān)系圖
從圖3、圖4 和圖5 可以看出,所有的方法產(chǎn)生的相對均方誤差都是隨著兩區(qū)域之間間隔距離的變化而變化的。但是對于大多數(shù)區(qū)域1與區(qū)域2之間的間隔距離而言,SPPVTLP 方法產(chǎn)生的相對均方誤差都低于Ando方法和PVMSZ 方法產(chǎn)生的相對均方誤差。這表明SPPVTLP方法重建聲場的表現(xiàn)比傳統(tǒng)方法穩(wěn)定。這是因為Ando 方法和PVMSZ 方法只關(guān)注中心聽音點或者中心聽音區(qū)域聲場的最佳恢復(fù),并不關(guān)心非中心聽音點或者非中心聽音區(qū)域聲場的恢復(fù)。但是,SPPVTLP 方法同時關(guān)注兩個聽音點(即區(qū)域1和區(qū)域2的中心點)處聲場的恢復(fù),因此SPPVTLP方法在區(qū)域1和區(qū)域2內(nèi)產(chǎn)生的相對均方誤差在大多數(shù)兩區(qū)域間隔距離情況下低于傳統(tǒng)方法。
圖4 區(qū)域中心點位于y 軸上時,相對均方誤差與區(qū)域間隔距離的關(guān)系圖
圖5 區(qū)域中心點位于z 軸上時,相對均方誤差與區(qū)域間隔距離的關(guān)系圖
圖6 相對均方誤差與兩區(qū)域之間夾角的關(guān)系圖
從圖6(a)可以看出,SPPVTLP方法和Ando方法產(chǎn)生的相對均方誤差都低于PVMSZ方法產(chǎn)生的相對均方誤差。對于大多數(shù)兩區(qū)域之間的夾角而言,SPPVTLP方法產(chǎn)生的相對均方誤差都低于Ando 方法,除了兩區(qū)域之間夾角位于區(qū)間之內(nèi)。當(dāng)兩區(qū)域之間夾角在之間變化時,SPPVTLP 方法產(chǎn)生的相對均方誤差比Ando方法高0.10~0.54個百分點(少于0.01),這表明這兩種方法的重建表現(xiàn)差不多。當(dāng)兩區(qū)域之間夾角在之間變化時,SPPVTLP方法產(chǎn)生的相對均方誤差比Ando 方法高2.08~4.05 個百分點。這是因為兩區(qū)域之間的夾角引起方程(8)中的矩陣的條件數(shù)變大。
從圖6(b)可以看出,對于所有的兩區(qū)域之間的夾角,SPPVTLP方法產(chǎn)生的相對均方誤差都低于PVMSZ方法產(chǎn)生的相對均方誤差。雖然對于所有的兩區(qū)域之間的夾角,SPPVTLP 方法產(chǎn)生的相對均方誤差都高于Ando 方法,但是SPPVTLP 方法和Ando 方法產(chǎn)生的相對均方誤差都低于1個百分點,它們之間最大的差值為0.68個百分點,少于0.01。這一結(jié)果表明,在區(qū)域2范圍內(nèi),SPPVTLP方法產(chǎn)生的相對均方誤差與Ando方法產(chǎn)生的相對均方誤差相當(dāng)。PVMSZ 方法和Ando 方法在區(qū)域2 范圍內(nèi)產(chǎn)生的相對均方誤差隨著兩區(qū)域之間角度的變化趨勢是兩條直線,這表明它們產(chǎn)生的相對均方誤差并不隨著兩區(qū)域之間角度的變化而改變。原因是PVMSZ 方法和Ando 方法只關(guān)注區(qū)域2(也即中心聽音區(qū)域)內(nèi)部聲場的恢復(fù),并不關(guān)注區(qū)域1(也即非中心聽音區(qū)域)內(nèi)部聲場的恢復(fù)情況。
假設(shè)寬帶信號(50~1 000 Hz)被選作為22聲道系統(tǒng)的原始信號。兩個聽音區(qū)域為區(qū)域1 和區(qū)域2,它們的中心點分別為區(qū)域1 和區(qū)域2 的半徑的變化范圍是0~0.1 m,剛好可以容納一個聽音者的頭部。寬帶信號的相對均方誤差定義為:
圖7 相對均方誤差與區(qū)域半徑之間的關(guān)系圖
其中,f1和f2分別為頻率的下界和上界。圖7 展示了使用不同方法產(chǎn)生的寬帶信號相對均方誤差隨著區(qū)域1和區(qū)域2半徑的變化情況。
從圖7(a)可以看到,區(qū)域半徑的變化范圍是0~0.1 m,SPPVTLP方法產(chǎn)生的寬帶信號相對均方誤差低于Ando方法和PVMSZ 方法。SPPVTLP 方法產(chǎn)生的寬帶信號相對均方誤差與Ando 方法產(chǎn)生的相對均方誤差的差異范圍是[0.029 4,0.044 9],與PVMSZ 方法產(chǎn)生的相對均方誤差的差異范圍是[0.018 3,0.029 3]。這是因為SPPVTLP 方法同時關(guān)注區(qū)域1 和區(qū)域2 的聲場恢復(fù)情況,然而傳統(tǒng)方法只關(guān)注區(qū)域2 的聲場恢復(fù)情況,沒有關(guān)注區(qū)域1的聲場恢復(fù)情況。
從圖7(b)可以看到,區(qū)域半徑的變化范圍是0~0.1 m,SPPVTLP 方法產(chǎn)生的寬帶信號相對均方誤差低于PVMSZ 方法。SPPVTLP 方法產(chǎn)生的寬帶信號相對均方誤差與PVMSZ方法產(chǎn)生的寬帶信號相對均方誤差的差異范圍是[0.002 2,0.025 3]。當(dāng)區(qū)域半徑的變化范圍是0~0.1 m時,SPPVTLP方法產(chǎn)生的寬帶信號相對均方誤差高于Ando 方法。SPPVTLP 方法產(chǎn)生的寬帶信號相對均方誤差與Ando方法產(chǎn)生的寬帶信號相對均方誤差的差異范圍是[0.004 7,0.014 3]。當(dāng)區(qū)域2的半徑變化范圍是0.07~0.1 m 時,SPPVTLP 方法產(chǎn)生的寬帶信號相對均方誤差與Ando方法產(chǎn)生的寬帶信號相對均方誤差的差大于0.01。這是因為聲場重建效果與聲音信號頻率、揚聲器數(shù)目、重建區(qū)域的大小是相關(guān)的。Ando方法使用10個揚聲器,只關(guān)注中心區(qū)域2范圍內(nèi)聲場的重建效果,因此在區(qū)域2 范圍內(nèi),Ando 方法產(chǎn)生的寬帶信號相對均方誤差低于SPPVTLP 方法。SPPVTLP 方法在重建聲場時同樣使用10 個揚聲器,但是既需要關(guān)注中心區(qū)域2范圍內(nèi)聲場的重建情況,也需要關(guān)注非中心區(qū)域1 范圍內(nèi)聲場的重建情況。因此,SPPVTLP 方法產(chǎn)生的寬帶信號相對均方誤差在區(qū)域2 范圍內(nèi)高于Ando 方法,在區(qū)域1 范圍內(nèi)低于Ando方法。這一結(jié)果表明,同時關(guān)注兩個區(qū)域的聲場重建效果,將會輕微地削弱SPPVTLP 方法在中心區(qū)域2 范圍內(nèi)的重建效果,但是增強了SPPVTLP 方法在非中心區(qū)域1 范圍內(nèi)的重建效果。同時,增強的程度高于削弱的程度。
為了讓多于一個的聽音者在聲場中可以獲得較好的聽音體驗,本文提出了一種兩聽音點處三維聲場重建方法:SPPVTLP,它可以讓兩個聽音者所在位置處的聲壓和質(zhì)點速度在重建前后保持不變。SPPVTLP方法可以讓兩個聽音者在同一聲場中同時獲得最佳聽音體驗。仿真實驗測試了不同方法,比較分析了聲壓的相對均方誤差變化,兩區(qū)域之間距離對相對均方誤差的影響,兩區(qū)域之間夾角對相對均方誤差的影響,兩區(qū)域半徑大小對寬帶信號相對均方誤差的影響。實驗結(jié)果表明,相對于傳統(tǒng)方法,SPPVTLP方法是一種有效的可供選擇的方法,還可用于其他的多聲道系統(tǒng)進(jìn)行任意選取的兩聽音點處聲場重建。