韓思清, 顏新青
(中國人民大學(xué)附屬中學(xué),北京 100080)
人耳具有對聲音定位的功能. 從物理學(xué)角度分析,水平向的定位比較容易理解,基于雙耳定位的原理,人耳通過分辨聲音信號到達雙耳的時間差和聲級差,可以確定聲源在水平向的位置[1]. 當聲源具有相同水平角度時,對于不同垂直角度的聲源,聲音信號到達雙耳的時間差和聲級差是相同的,基于時間差和聲級差定位的原理無法解釋人可以分辨出聲源的垂直向角度. 1968年,美國科學(xué)家K. Roffler和 A. Butler的研究,從生理上揭示了人耳對垂直方向角度的感知能力是基于聲音信號的高頻部分[2],1969年,E.A.G. Shaw和R. Teranishi的研究證明了人耳垂直向的定向能力來源于耳廓效應(yīng)[3]. 針對人耳垂直面定向?qū)嶒?,設(shè)計了簡易的研究人耳垂直面定向原理實驗裝置,并利用該裝置進行了實驗研究和分析.
根據(jù)文獻[2-5]的解釋,來自不同垂直向的聲波與耳廓交互作用,會出現(xiàn)折射、反射和衍射現(xiàn)象,等效為與垂直向方向有關(guān)的濾波效應(yīng),不同垂直向角度的聲音經(jīng)過耳廓時,得到不同的濾波作用,如圖1所示[6],只要能區(qū)分出濾波后的聲音信號,就可分辨垂面聲源的方向,實現(xiàn)垂直面定向.
圖1 耳廓對聲音的濾波作用示意圖
Lopez-Poveda等對耳廓濾波作用進行了深入分析,提出了基于耳廓物理結(jié)構(gòu)的聲音衍射反射模型對耳道入口聲信號的物理解釋,如圖2所示[5].
圖2 聲音信號入射耳廓漩渦結(jié)構(gòu)的二維示意圖
Lopez-Poveda等認為,耳道的聲音入口處聲音信號來自3部分:入射波、入射波的反射波和入射波的衍射波的反射波,這3部分波基于波的相干疊加原理形成耳道入口的聲音信號.
Parham Mokhtari等基于人工耳廓開展了耳廓對不同垂直向濾波作用的研究工作[7],聲源位于正前方垂直向角-45°~90°,以約為5°的間隔,對采集的信號進行頻譜分析,如圖3所示[7].
圖3 聲源在不同垂直角度時的耳廓濾波作用
由圖3可見,耳廓濾波作用出現(xiàn)在5 kHz以上的頻段,音頻信號頻譜波峰和波谷隨聲源高度角變化呈有規(guī)律地變化.
人耳耳廓的濾波器作用,對不同垂直角度方向的聲音信號,形成了在不同頻帶的波峰和波谷變化,人耳耳蝸神經(jīng)可以感受到這種頻率變化,進而得以感知聲源在垂直面的角度.
為了開展人耳垂直面定向研究和實驗,設(shè)計了人耳垂直面定向原理研究的簡易裝置. 實驗裝置的組成框圖如圖4所示. 實驗裝置主要包括人工耳廓、旋轉(zhuǎn)支架、外置聲卡、麥克風(fēng)、有源音箱和計算機.
圖4 人耳垂直面定向原理實驗裝置框圖
人工耳廓采用了醫(yī)用硅膠注塑的等比人耳模型,旋轉(zhuǎn)支架采用安裝了量角器的可旋轉(zhuǎn)的顯示器支架,外置聲卡為雅馬哈USB聲卡,麥克風(fēng)為百靈達電容麥克風(fēng),有源音箱為BOSE便攜式音箱. 實驗裝置的工作原理示意圖如圖5所示.
圖5 實驗工作原理示意圖
在實驗中,聲源(音箱)位于接收裝置(人工耳廓和麥克風(fēng))的正前方,通過調(diào)節(jié)旋轉(zhuǎn)支架上的轉(zhuǎn)動軸,使聲源與人工耳廓之間的垂直向的角度在0°~180°之間變化,對應(yīng)人耳與聲源之間的垂直向的角度在0°(對應(yīng)頭頂指向聲源)~180°(對應(yīng)下顎指向聲源)之間變化.
圖6是實驗裝置接收端的工作照片,接收端包括人工耳廓和旋轉(zhuǎn)支架,旋轉(zhuǎn)支架能夠在垂直向旋轉(zhuǎn),帶動人工耳廓調(diào)節(jié)其垂直向的角度,如圖7所示. 圖8是聲卡和音箱的照片.
(a)側(cè)面
(b)正面圖6 實驗裝置的接收端照片
圖7 實驗時旋轉(zhuǎn)支架在不同垂直向角度的狀態(tài)
圖8 實驗裝置的聲卡和音箱照片
在實驗中,聲源與人工耳廓之間的垂直向的角度在0°~180°之間調(diào)整,以5°為間隔采集數(shù)據(jù),在采集時,調(diào)整旋轉(zhuǎn)支架,使人工耳廓定位在預(yù)定角度,然后聲卡發(fā)送500~20 000 Hz的線性調(diào)頻聲音信號,由音箱將聲音信號播出,聲音信號經(jīng)實驗裝置的接收端的人工耳廓作用,由麥克風(fēng)采集聲音信號,經(jīng)聲卡輸入到計算機,再對采集的信號進行頻譜分析.
實驗裝置的數(shù)據(jù)采集通過Matlab程序?qū)崿F(xiàn),以下是數(shù)據(jù)采集代碼.
for nn=1:100
fs=44000;
t = 0:1/fs:6;
y = chirp(t,500,6,20000);
soundsc(y,fs);
R = audiorecorder(fs, 24 ,2) ;
disp(‘Start of Recording.’);
recordblocking(R, 7);
disp(‘End of Recording.’);
myspeech(nn,:,:) = getaudiodata(R);
nn
pause
end
以下給出了對采集到的數(shù)據(jù)進行處理與繪圖顯示的Matlab代碼.
nn=100
d=4000;
cut=d/2;
m=1;
aa=[51 93 57 25 63 19 69 13 75 7 81 1 37];
de=[0 105 15 120 30 135 45 150 60 165 75 180 90];
for nn=1:length(aa)
num=length(myspeech(aa(nn),:,2));
fspeech=abs(fft(myspeech(aa(nn),:,2)));
cut_fspeech=fspeech(cut:length(fspeech)-cut-1);
z=reshape(cut_fspeech,d,(num-cut*2)/d);
z=max(z);
subplot(ceil(length(aa)/2),2,m);
x=1:44000/length(z):22000;
plot(x,z(1:length(z)/2));
title(strcat(num2str(de(m)),‘?’));xlabel(‘frequency/Hz’);
axis([0 25000 0 60]);
grid on;
ylabel(‘a(chǎn)mplitude’);
m=m+1;
end
程序中首先對所采集的數(shù)據(jù)進行傅里葉變換,其頻譜如圖9所示,然后提取頻譜包絡(luò).
圖9 采集數(shù)據(jù)的頻譜分布圖
圖9的橫軸為頻率,縱軸為傅里葉變換后的頻譜幅度,因?qū)溈孙L(fēng)和聲卡的增益未進行標定,頻譜幅度為相對值. 對頻譜圖提取包絡(luò)后,由于頻譜的對稱性,只需要保留正頻率部分的頻譜就可以用于分析聲源方向.
為驗證實驗系統(tǒng)的穩(wěn)定性,在固定角度重復(fù)采集,圖10為在105°采集8次數(shù)據(jù)處理后得到的頻譜包絡(luò),可以看出同樣角度下,頻譜包絡(luò)相似,實驗具有可重復(fù)性.
圖10 人耳垂直面定向原理實驗105°的頻譜分析
圖11所示為部分數(shù)據(jù)(間隔15°)頻譜圖. 從圖11中可以看出,不同垂直向角的頻譜有很大差異,可以從頻譜的形狀上區(qū)分聲源的垂直向角度.
以頻譜幅度為例,從采集到數(shù)據(jù)的頻譜包絡(luò)可以看出,在0~75°的區(qū)間內(nèi)5 kHz附近處受到了濾波作用,整體的振幅不超過50. 在90°~105°的區(qū)間內(nèi)5 kHz處受到的濾波作用相對較弱,最高振幅達到并超過了50. 而在120°~180°間,5 kHz附近所受到的濾波效果逐漸增強,圖像所呈現(xiàn)的峰值受到較大程度的削減.
位于10 kHz至15 kHz處的較小峰值同樣會因為角度的不同而受到不同的濾波作用. 從120°開始到180°峰值的振幅逐漸增加.
圖11耳廓對聲源濾波形成的頻譜輪廓與圖3有一定差異,分析主要原因是由于縱軸坐標的差異和簡易實驗裝置的整體幅度頻率響應(yīng)不平坦造成的.
圖11 人耳垂直面定向原理實驗不同角度的頻譜分析
通過對人耳聲源垂直角度的辨別原理的學(xué)習(xí),搭建了簡易的人耳垂直面定向原理研究裝置,并利用該裝置進行人耳垂直面定向的實驗. 通過該實驗,驗證了人耳垂直向的定向能力來源于耳廓效應(yīng),驗證了在利用非平坦幅度頻譜的實驗裝置,可以區(qū)分出聲源在垂直向的方向. 對于實驗可以做進一步的改進,一種方法是采用更高的頻率響應(yīng)性能的聲卡、麥克風(fēng)和音箱構(gòu)建實驗系統(tǒng),這樣可以獲得更好的實驗結(jié)果;另一種方法是采用頻譜幅度補償處理的方法,通過補償測量數(shù)據(jù)頻譜幅度的平坦性.