關(guān)鍵詞:聽覺距離感知,聽覺主觀評價,聽覺事件相關(guān)電位,聲源定位
中圖分類號:O429 文獻(xiàn)標(biāo)志碼:A
聽覺距離感知主觀評價對于深入理解人類聽覺系統(tǒng)的運作機制至關(guān)重要. 該評價揭示了個體在聽覺距離感知方面的差異,并評估不同環(huán)境因素對感知能力的影響. 這些發(fā)現(xiàn)對于城市規(guī)劃和建筑設(shè)計具有重要的參考價值,能促進(jìn)更為先進(jìn)的音頻系統(tǒng)的開發(fā),或準(zhǔn)確評估新提出的聲音距離重構(gòu)算法.
隨著立體聲技術(shù)的不斷進(jìn)步,研究者可以借助耳機或揚聲器復(fù)現(xiàn)不同的聲學(xué)場景,并開展多樣化的主觀聽音實驗[1]. 虛擬聽覺技術(shù)在精確操控直達(dá)聲場與混響聲場的同時,能實現(xiàn)對房間環(huán)境聲音的高度自然模擬[2]. 在進(jìn)行相關(guān)主觀評價實驗時,頭部相關(guān)脈沖響應(yīng)(Head ? Related Im?pulse Responses,HRIRs) [3]和涉及環(huán)境因素的雙耳房間脈沖響應(yīng)(Binaural Room Impulse Re?sponses,BRIRs)[4-5]是虛擬聽音研究最常見的技術(shù)手段. 一些研究者提出了創(chuàng)新性算法來重構(gòu)聲音距離,并通過主觀聽音實驗來驗證這些算法的有效性. 除了通過耳機重構(gòu)的虛擬聲外,使用揚聲器播放的聲音也是一種普遍的做法. 在評價過程中,為了模擬不同的聲源距離,揚聲器被同時擺放在多個預(yù)定位置[6],或借助電動滑軌系統(tǒng)來實現(xiàn)在同一實驗中對不同距離點的連續(xù)變換[7].
在進(jìn)行聽覺距離感知的主觀實驗時,選擇的聲音刺激通常會根據(jù)實驗的具體目標(biāo)而有所不同. 在單純的距離聽音實驗中,可以直接使用噪聲[5-6]或點擊聲[5]作為刺激. 當(dāng)選擇不同的刺激時,實驗結(jié)果存在一定的差異. 以語音作為刺激的實驗也很常見. 語音實驗研究可以引入更多的變量,如不同語言[8]、對說話者和環(huán)境的熟悉程度[4,9]、說話力度[10]等,以探究不同因素對聽覺距離感知的影響. 同樣,可以針對音樂的不同屬性進(jìn)行相應(yīng)的聽音實驗,也可以直接選擇音樂信號進(jìn)行距離重構(gòu)算法評價或其他主觀評價.
聽覺距離感知主觀評價的實驗方法大致分四類:識別任務(wù)、辨別任務(wù)、絕對量度任務(wù)、等分任務(wù). 在聽覺距離感知的主觀評價中,識別任務(wù)相對簡單,被試只需選擇所感知的距離[11],辨別任務(wù)要求被試判斷兩個連續(xù)呈現(xiàn)的刺激是否存在差異. 在聽覺距離感知領(lǐng)域,最小聽覺距離分辨(Minimum Audible Distance Discrimination,MADD)任務(wù)十分常見[6],還可以計算不同距離和方向處的可辨差(Just Noticeable Difference,JND)[7]. 絕對量度任務(wù)要求被試對單一刺激進(jìn)行量化評估,如強度或大小,聽覺距離感知的絕對量度任務(wù)可以通過多種方式記錄數(shù)據(jù),例如在觸摸屏上使用視覺模擬量表(Visual Analog Scales,VASs)[3]或垂直滑塊[4]來表示感知到的距離,也可以直接使用數(shù)字記錄[12]的方法獲得結(jié)果. 在聽覺距離等分任務(wù)中,A,B,C 三種聲音在不同距離條件下呈現(xiàn),B 被放置于A 和C 之間,被試需要判斷B 更接近A 還是C[5-6].
在認(rèn)知科學(xué)和心理學(xué)領(lǐng)域的研究中,EEG(Electroencephalography)技術(shù)是一項廣泛應(yīng)用的神經(jīng)生理測量工具,它通過安置在頭皮上的電極,檢測并記錄大腦的電活動. 聽覺誘發(fā)電位(Audi?tory Evoked Potentials,AEPs)是由聽覺刺激呈現(xiàn)而誘發(fā)的大腦反應(yīng),而大腦反應(yīng)通常不僅僅反映由感官刺激引起的活動,因此被稱為事件相關(guān)電位(Event?Related Potential,ERP). ERPs 是與特定事件同步的大腦反應(yīng),該事件可能發(fā)生于單一感覺模態(tài)內(nèi),或跨越多個模態(tài),可以是一個物理刺激、一系列刺激的變化、一個缺失的刺激,或者被指定為“目標(biāo)”刺激的刺激[13]. 目前,ERP 技術(shù)被廣泛運用于聽覺方位定位[14-16]、動態(tài)聲源定位[17-18]等聽覺定位領(lǐng)域.
在聽覺距離感知的ERP 實驗研究中,有研究者采用了“真實環(huán)境”和“虛擬環(huán)境”(BRIRs),以模擬2 m( 近偏差)、4 m( 標(biāo)準(zhǔn))和8 m( 遠(yuǎn)偏差)三種不同的聲源距離. 此外,考慮了“自然”和“匹配”兩種不同的響度條件. 通過將位于FCz,Cz,C1,C2,F(xiàn)C1,F(xiàn)C2 六個電極位置的信號進(jìn)行平均處理,研究者著重分析了MMN,P3a 和P3b 三種ERP 成分的變化情況[19]. 值得注意的是,與聲音定位的方位研究相比,針對聽覺距離感知的研究較為有限.
本研究采用主觀評價(包括識別任務(wù)和絕對量度任務(wù))和ERP 分析技術(shù)(考慮無注意力狀態(tài)和引入注意力狀態(tài)),通過行為學(xué)實驗和EEG 生理測量,探究了聽覺距離感知的現(xiàn)象及其潛在機制. 本研究旨在揭示聽覺距離感知的心理物理關(guān)系、影響因素和聽覺距離感知背后的認(rèn)知和神經(jīng)機制,以及探究個體差異、注意力狀態(tài)和聲音特性對潛在機制的影響.
1方法
1. 1實驗
1主觀評價識別任務(wù) 主觀評價識別任務(wù)在南京大學(xué)聲學(xué)研究所的試聽實驗室進(jìn)行,其建筑特性如下:體積為123. 75 m3,高3. 0 m,長7. 5 m,寬5. 5 m,穿孔飾面板,平均混響時間約為0. 3 s. 采用10 只揚聲器,經(jīng)測量,它們的頻響曲線相似,實驗開始前均通過聲壓級校準(zhǔn). 實驗中使用的聲卡型號為Antelope Audio Orion32,功放型號為Anty PA 3002. 試聽人員共30 人,其中女19 人,男11 人,均為在校學(xué)生,年齡19~27歲,平均年齡23 歲. 其中,有6人曾參與其他類型的聽音實驗,但所有人員均未有過距離相關(guān)的聽音經(jīng)驗. 刺激是頻率為20~20000 Hz 的寬帶粉紅噪聲,采樣率為44. 1 kHz,持續(xù)時間為3 s,在1 m 距離處A 計權(quán)聲壓級為65 dB.
在識別實驗中,選擇0. 5~5 m 的距離區(qū)間.將10只揚聲器在被試坐下時的雙耳高度處擺放成一條直線,兩兩間隔為0. 5 m,地面處標(biāo)注編號(1~10)以進(jìn)行視覺指引,具體實驗系統(tǒng)如圖1 所示. 在整個實驗過程中,被試需集中注意力識別音頻的距離,避免大幅度地移動頭部或身體.
在正式實驗開始前,被試首先進(jìn)行一個訓(xùn)練過程. 在訓(xùn)練中,聲源刺激從距被試最遠(yuǎn)的位置處開始播放,并逐步向被試移動,從遠(yuǎn)到近,再從近到遠(yuǎn),重復(fù)兩次. 完成訓(xùn)練后,主試將隨機播放三只揚聲器的聲音,被試需口頭回答揚聲器的位置,即在近區(qū)(編號1~3)、中區(qū)(編號4~7)或遠(yuǎn)區(qū)(編號8~10). 回答正確則完成訓(xùn)練,否則將重復(fù)訓(xùn)練過程. 訓(xùn)練完成后,首先進(jìn)行三條不計入數(shù)據(jù)統(tǒng)計的聽音,幫助被試熟悉正式實驗的過程. 在正式實驗中,聲源刺激將隨機播放. 每種距離的聲源刺激重復(fù)10 次,總計100 次聽音. 正式實驗中的每個音頻時長為3 s. 每次播放完一個刺激后,被試有5 s 的時間填寫他們感知到的揚聲器編號(1~10). 每完成10 次聽音,被試可以休息一次. 被試若覺得沒有出現(xiàn)聽覺疲勞的現(xiàn)象,可示意跳過休息,進(jìn)行下一組聽音. 正式實驗的總時長約為20 min.
1. 2 實驗2:主觀評價絕對量度任務(wù) 主觀評價絕對量度任務(wù)也在南京大學(xué)聲學(xué)研究所的試聽實驗室中進(jìn)行. 使用識別實驗中的一只揚聲器,通過借助電動滑軌系統(tǒng),實現(xiàn)對不同距離點的連續(xù)變換. 聲卡型號為Yamaha Steinberg UR242,功放型號為Anty PA 3002. 試聽人員共15 人,其中女11 人,男4 人. 他們均參與了之前的識別實驗,并且識別實驗中的數(shù)據(jù)符合以下條件:冪函數(shù)擬合方差R2 大于0. 85;在2 m 內(nèi)識別準(zhǔn)確率超過50%. 刺激選擇與識別任務(wù)相同.
在絕對量度實驗中,根據(jù)識別實驗的結(jié)果,選擇準(zhǔn)確率較高的0. 5~2 m 的距離區(qū)間. 實驗中主試借助電動滑軌將揚聲器移動至不同的距離. 只有一只揚聲器,所以在揚聲器和被試之間添加簾幕以防止視覺影響. 具體實驗系統(tǒng)如圖2 所示.
絕對量度實驗的訓(xùn)練過程相對簡單. 主試在最遠(yuǎn)處(2 m)與最近處(0. 5 m)分別播放三次刺激,以告知被試本次實驗涉及的距離區(qū)間. 在0. 5~2 m 的距離區(qū)間內(nèi),每隔0. 2 m 設(shè)置一處距離,以隨機順序播放. 在正式實驗中,共進(jìn)行76 次聽音. 每聽完一個刺激,被試記錄感知到的揚聲器距離(以m 為單位,保留兩位小數(shù),末端保留至雙數(shù)). 每個音頻時長3 s,每組包含10 次聽音. 被試在每組實驗結(jié)束后,自行選擇休息時間. 實驗時長約為20 min.
1. 3實驗3:無注意力狀態(tài)ERP 實驗 無注意力狀態(tài)ERP實驗在南京大學(xué)聲學(xué)研究所的試聽實驗室進(jìn)行. 使用與先前實驗相似的三只揚聲器.聲卡型號為Rstech2232,功放型號為Anty PA3002. 腦電帽使用Emotiv 公司的EPOC Flex(32通道),采樣率為128 Hz,通道定位如圖3 所示(10~20 系統(tǒng)). 試聽人員共15 人,其中,11 人參與前期兩次實驗(女8 人、男3 人),1 人只參與識別實驗(女),1 人參與前期兩次實驗的預(yù)實驗(女),2 人是本次新招募的人員(均為男性). 刺激時長為200 ms,其余設(shè)置與主觀評價任務(wù)相同.
實驗開始前,主試協(xié)助被試正確佩戴腦電帽,并為每個電極注入生理鹽水來降低阻抗和確保信號采集的質(zhì)量. ERP 實驗中使用oddball 實驗范式,標(biāo)準(zhǔn)刺激的距離為1 m,近偏差刺激的距離為0. 5 m,遠(yuǎn)偏差刺激的距離設(shè)為2 m. 為了防止視覺影響,使用簾幕隔離被試和實驗系統(tǒng). 實驗系統(tǒng)如圖4 所示,包括揚聲器的位置和被試的位置.實驗中采用的刺激為持續(xù)200 ms 的粉紅噪聲,每次刺激間的起始間隔設(shè)為1 s,即刺激呈現(xiàn)的間隔時間(Interstimulus Interval,ISI)為800 ms.
每次實驗隨機播放500 次刺激,其中標(biāo)準(zhǔn)刺激出現(xiàn)的概率為0. 84 (即420 次),遠(yuǎn)、近偏差刺激出現(xiàn)的概率各為0. 08( 即各40次). 此外,每次偏差刺激出現(xiàn)之前,至少存在三次標(biāo)準(zhǔn)刺激. 實驗中被試觀看無聲電影并被要求不要注意聲音,因此本次實驗被稱為被動實驗. 此外,實驗中被試被要求放松并盡量保持靜止,以防止肌電等偽跡對實驗結(jié)果造成負(fù)面影響. 數(shù)據(jù)記錄采用EmotivPRO 軟件. 腦電數(shù)據(jù)的處理分析通過MATLAB 中的工具箱EEGLAB[20]進(jìn)行.
1. 4 實驗4:引入注意力狀態(tài)ERP 實驗 引入注意力狀態(tài)ERP 實驗同樣在南京大學(xué)聲學(xué)研究所的試聽室中進(jìn)行. 實驗設(shè)備、試聽人員、刺激均與無注意力狀態(tài)ERP 實驗相同. 該實驗在上述忽視聲音刺激的實驗之后進(jìn)行. 在上述實驗完成后,被試短暫休息,期間主試對腦電帽中的電極進(jìn)行補充生理鹽水的操作,以確保數(shù)據(jù)采集質(zhì)量.
實驗刺激的相關(guān)設(shè)置與上述實驗相同,兩次ERP 實驗只存在是否引入注意力的差異. 本次實驗中被試需要關(guān)注聲音刺激并辨別偏差刺激. 主試會給被試提供一個鍵盤,在聽見偏差刺激后,被試需要通過按鍵作出響應(yīng). 在聽見近偏差刺激時按數(shù)字鍵“1”,在聽見遠(yuǎn)偏差刺激時按數(shù)字鍵“2”,在聽見標(biāo)準(zhǔn)刺激時不作出響應(yīng). 此外,被試同樣被要求放松并盡量保持靜止,以防止肌電等偽跡對實驗造成負(fù)面影響. 本實驗中被試需要關(guān)注聲音刺激并對偏差刺激作出響應(yīng),因此本次實驗被稱為主動實驗.
2 實驗結(jié)果和討論
2. 1實驗1:主觀評價識別任務(wù) 圖5 展示了不同距離條件下被試的感知結(jié)果. 圖5a 為一位對聽覺距離感知較為敏感的被試的結(jié)果(Sub 24),圖5b 為一位對聽覺距離感知較為不敏感的被試的結(jié)果(Sub 25). 橫坐標(biāo)為揚聲器實際距離,縱坐標(biāo)為被試感知到的揚聲器編號對應(yīng)的距離. 紅色圓圈的大小表示被試在某一揚聲器位置處感知到不同編號的次數(shù)的多少,圓圈越大,表示次數(shù)越多. 對角線上的圓圈表示被試正確感知到目標(biāo)揚聲器的編號(距離).
由圖可見,圖5a 的圓圈較大且集中,表明對于同一揚聲器發(fā)出的聲音,被試多次作出相同的反應(yīng),對聽覺的距離感知較為敏感. 圖5b 的圓圈較小且分散,表明被試在不同時間聽到同一揚聲器的聲音時,感知到的距離不一致,對聽覺的距離感知不敏銳. 此外,在近距離條件下,對角線上的圓圈更大,整體分布也更加集中于對角線上,說明被試聽覺距離感知更為準(zhǔn)確;在較遠(yuǎn)的距離條件下,圓圈較小且分散,說明被試難以正確感知到發(fā)聲揚聲器的距離.
在聽覺距離感知較為敏感的被試的數(shù)據(jù)中,可以在遠(yuǎn)距離條件下觀察到目標(biāo)聲源被近估的現(xiàn)象,這符合聽覺距離感知的心理物理關(guān)系. 部分研究人員認(rèn)為,這種近估現(xiàn)象可能預(yù)示著聽覺邊界的存在,代表了最大的感知距離[2,21]. 也有研究人員認(rèn)為,低估更遠(yuǎn)的聲源距離可能是由于適應(yīng)性調(diào)整,可以在自然環(huán)境中為人們避讓物體提供額外的“安全邊際”[2,22].
箱線圖如圖6 所示. 圖6a 為一位對聽覺距離感知較為敏感的被試的結(jié)果(Sub 24),圖6b 為一位對聽覺距離感知較為不敏感的被試的結(jié)果(Sub 25). 橫坐標(biāo)為揚聲器實際距離,縱坐標(biāo)為被試感知到的揚聲器編號的距離. 箱體上邊緣線代表第75 百分位數(shù)(P75),下邊緣線代表第25 百分位數(shù)(P25),中間線代表中位數(shù)(P50). 箱體外的上下緣表示去除離群值/極端值后的實驗結(jié)果的最大值和最小值. 離群值定義為超出箱體1. 5 倍四分位距(Interquartile Range,IQR) (gt; P75 +1.5 倍箱體,或lt; P25 - 1.5 倍箱體)的數(shù)據(jù)點,圖6 中的數(shù)字標(biāo)注了這些離群值在數(shù)據(jù)中的具體位置. 這些數(shù)據(jù)在后續(xù)分析中被排除,以防止對總體結(jié)果的解釋產(chǎn)生誤導(dǎo).
如圖6 所示,對聽覺距離感知較為敏感的被試的數(shù)據(jù)離群值較少. 此外,較為敏感的被試在近距離條件下去除離群值后,距離判斷準(zhǔn)確性逼近完全準(zhǔn)確. 在遠(yuǎn)距離條件下,觀察到與氣泡圖相似的更為不集中和近估的現(xiàn)象.
人類估計聲源距離的能力通常比確定聲源角度方向的能力要低得多,聽者通常會顯著地低估遠(yuǎn)處聲源的距離,并且會高估距離1 m 以內(nèi)的聲源的距離[2]. 相關(guān)研究人員研究了物理聲源距離和感知距離之間的心理物理關(guān)系,并證明了這種關(guān)系可以很好地近似為一個壓縮冪函數(shù),如下式所示[2,23]:
r′ = kra
其中,r ′是估計的感知距離,r 是聲源的物理距離,k 和a 是冪函數(shù)的擬合參數(shù).
圖7展示了30 名被試冪函數(shù)擬合的參數(shù)與方差統(tǒng)計. 由圖可見,本實驗中大部分的擬合函數(shù)的指數(shù)a 處于0. 8~1,僅有一位被試的a 大于1;擬合常數(shù)值k 整體接近1,平均值略大于1;R2 整體較高,接近1. R2 越大,a和k 越接近1,表明擬合冪函數(shù)越接近y =x的直線,感知結(jié)果越準(zhǔn)確. 與其他統(tǒng)計結(jié)果相比,本實驗中被試感知的距離更接近實際揚聲器的距離,這一現(xiàn)象可歸因于本研究所設(shè)定的距離區(qū)間整體上不遠(yuǎn),因此在遠(yuǎn)距離條件下的距離低估傾向沒有表現(xiàn)得特別突出.
圖8展示了30名被試平均的識別準(zhǔn)確率圖像,包括完全準(zhǔn)確的結(jié)果、允許前后一只揚聲器(前后0. 5m)偏差的結(jié)果和允許前后兩只揚聲器(前后1m)偏差的結(jié)果. 由圖可見,除了0. 5 m處,被試感知完全準(zhǔn)確的概率較低,并且隨著源距離的增加,準(zhǔn)確率快速下降. 在允許前后有輕微誤差的情況下,準(zhǔn)確率會明顯升高. 當(dāng)允許前后0. 5 m 的誤差時,30 名被試平均的準(zhǔn)確率在所有位置均超過75%;當(dāng)允許前后1 m 的誤差時,30名被試平均的準(zhǔn)確率在所有位置均超過87%.
圖9展示了不同編號的揚聲器播放刺激時被試處感知到的聲壓級,其中,AM為中央傳聲器記錄結(jié)果,AL和AR為仿真人工頭記錄的左耳和右耳結(jié)果. 由圖可見,2m內(nèi)前四只揚聲器的聲壓級變化較為明顯,直達(dá)聲占據(jù)主導(dǎo)地位. 而較遠(yuǎn)的區(qū)域受房間混響的影響,整體聲壓級變化不是很大. 主觀識別實驗的準(zhǔn)確率在2 m 后明顯下降,表明人耳對聲音距離的感知受到聲強因素的強烈影響,而其他影響聽覺距離感知的聲學(xué)線索如直達(dá)聲與混響聲能量比(Direct?to?Reverberant Ra?tio,DRR)的變化,對于沒有相關(guān)聽音經(jīng)驗且對聲源和環(huán)境均不熟悉的被試來說難以明顯感知. 遠(yuǎn)處揚聲器的聲壓級與中間區(qū)域揚聲器的聲壓級相似,因此,被試傾向于認(rèn)為遠(yuǎn)處揚聲器與中間區(qū)域揚聲器處于相似的距離處,從而出現(xiàn)了遠(yuǎn)處的聲源距離被近估的現(xiàn)象.
2. 2 實驗2:主觀評價絕對量度任務(wù) 在絕對量度實驗中,將被試數(shù)據(jù)進(jìn)行冪函數(shù)擬合,并統(tǒng)計擬合參數(shù)與方差的結(jié)果,如圖10所示. 本實驗中擬合函數(shù)的指數(shù)a 的平均值為1. 06,標(biāo)準(zhǔn)差為0. 09,常數(shù)k 的平均值為0. 86,標(biāo)準(zhǔn)差為0. 068,即絕大多數(shù)的a接近1,k 略小于1,這說明在絕對量度實驗中,感知到的距離整體沒有顯示出明顯的高估、低估傾向(整體輕微近估). 該結(jié)果符合我們的預(yù)期,這是由于在絕對量度實驗中,選擇了在識別實驗中較為準(zhǔn)確和小規(guī)模的距離區(qū)間.
此外,k 的值在整體上小于1,即在1 m 處出現(xiàn)了聽覺感知距離被近估的現(xiàn)象. 這可能與聽音環(huán)境有著密切的關(guān)系,本次實驗雖然在試聽室中進(jìn)行,存在一定的混響,但混響相對較小,混響時間約為0. 3 s. 由圖9 可見,0. 5~1 m 的距離加倍的聲壓級衰減量接近6 dB,這類似于消聲室自由場的情況. 這表明在較近的距離區(qū)間內(nèi),被試感知到的聲音幾乎由直達(dá)聲主導(dǎo),而直達(dá)聲占比越大,DRR 越大,被試感覺聲音越近.
與識別任務(wù)相比,絕對量度任務(wù)對被試來說更具挑戰(zhàn)性,因此R2 相對較低. 其中一名被試的R2 只有0. 6 左右,小于本次實驗中R2 的平均值減去一個標(biāo)準(zhǔn)差的數(shù)值. 后續(xù)分析中將這位被試的數(shù)據(jù)舍棄,其他被試的R2 均大于0. 7.
本研究將被試感知到的距離D 減去揚聲器實際距離D0的值稱為誤差. 圖11 展示了兩位R2較大的被試(Sub 04,Sub 06)的誤差,橫坐標(biāo)為實際揚聲器的距離D0,縱坐標(biāo)為誤差D - D0. 由圖可見,遠(yuǎn)距離的誤差比近距離的誤差更大,當(dāng)聲源距離增加到大約1 m及以上時,誤差明顯增大.圖12 展示了14 名被試(去除Sub 01)感知距離與實際距離誤差的平均值. 由圖可見,平均誤差幾乎都小于0,這表明在幾乎整個距離區(qū)間(0. 5~2 m)內(nèi)均表現(xiàn)出了聲源距離被低估的現(xiàn)象,即被試認(rèn)為聲音整體離自己較近. 在14 名被試76 個距離的1064 個數(shù)據(jù)中,誤差大于0 的有267 個,二項檢驗結(jié)果的p = 2.2e-16,表明正數(shù)顯著較少,即在此距離區(qū)間內(nèi),被試明顯傾向于低估聽覺距離. 這可能是因為本研究的聽音環(huán)境混響相對較?。ɑ祉憰r間約為0. 3 s),直達(dá)聲占據(jù)主導(dǎo),DRR 較大,被試感覺聲音較近. 也可能是由于實驗處于安靜環(huán)境,在沒有其他聲音干擾的情況下,被試更容易感覺到聲音距離較近. 這與上述冪函數(shù)擬合結(jié)果(整體上k lt; 1)一致.
2. 3 實驗3:無注意力狀態(tài)ERP 實驗 由于Sub07 的腦電數(shù)據(jù)質(zhì)量較差,在后續(xù)分析中被舍棄.圖13 是14 名被試32 電極平均的ERP 波形(負(fù)波向上). 橫軸為時間,覆蓋刺激前200 ms 至刺激后800 ms 的區(qū)間,縱軸表示腦電波的幅度.
如圖13 所示,標(biāo)準(zhǔn)刺激(紅線)的ERP 波形幅值明顯較小,而近偏差刺激(黑線)與遠(yuǎn)偏差刺激(藍(lán)線)的幅值明顯增大. 偏差刺激的幅度的增大主要受對變化敏感的ERP 成分的影響,如MMN和N1. 由于MMN 和N1 均表現(xiàn)為負(fù)波,因此遠(yuǎn)、近偏差刺激的波形整體處于橫軸的上方.
與近偏差刺激相比,盡管遠(yuǎn)偏差刺激的曲線趨勢與近偏差刺激相似,但出現(xiàn)了更顯著的負(fù)波增強的現(xiàn)象. 近偏差刺激的聲音強度更大,應(yīng)當(dāng)表現(xiàn)為N1 的時延減小、幅度增大,但實驗結(jié)果沒有表現(xiàn)出近偏差刺激的ERP 波形在N1 時延處更負(fù),這可能是由于認(rèn)知負(fù)荷的影響. 雖然被試被要求忽略聲音刺激,但無聲電影也許并不能完全轉(zhuǎn)移被試的注意力,安靜的聽音環(huán)境使得聲音刺激較為突出. 此外,即使在無注意力條件下,被試可能仍能識別聲源的大致位置,因為即便在不需有意識注意的情況下,大腦也可以自動處理聲源的空間信息. 這種能力會受到認(rèn)知負(fù)荷的影響,對于較難識別的聲音(例如遠(yuǎn)處或聲強較小的聲音),個體的認(rèn)知負(fù)荷會增加,自動化處理的效率可能下降,導(dǎo)致聲源定位能力減弱. 對心理聲學(xué)資源加工需求的增加可能導(dǎo)致ERP波形中的一些成分(如N1,N2或MMN)的幅度增大或時延增加,使ERP波形中出現(xiàn)更加顯著的負(fù)波. 盡管沒有具體案例直接表示認(rèn)知負(fù)荷會導(dǎo)致ERP 的負(fù)波增強,但已經(jīng)有研究顯示,認(rèn)知負(fù)荷的變化會影響腦電頻譜活動,如導(dǎo)致不同波段功率的變化,這些變化可能與ERP 的某些成分相關(guān).
如圖13 所示,在約50 ms 處,無論是對標(biāo)準(zhǔn)刺激還是遠(yuǎn)、近偏差刺激,在ERP 波形中均可觀察到一個輕微向下凹陷的正波,即P1.P1 主要反映了大腦對初始刺激的基本響應(yīng),與后續(xù)ERP 成分相比,刺激的偏差對P1 的影響相對較小. 雖然某些條件下的刺激特性變化,如強度和注意力狀態(tài),也可以影響其幅度.
由于生成器的不應(yīng)期,刺激的重復(fù)會導(dǎo)致N1振幅減小. 對于標(biāo)準(zhǔn)刺激,100ms 左右向上的負(fù)波N1 的幅度明顯小于偏差刺激. 對于遠(yuǎn)、近偏差刺激,在100 ms 處可以觀察到一個向上的較大的負(fù)波N1. N1成分被認(rèn)為是對聲音變化敏感的聽覺皮層反應(yīng)[24-25],可由聲強、頻率或空間位置的變化引發(fā),因此,它對遠(yuǎn)、近偏差刺激的出現(xiàn)尤為敏感. 雖然N1 成分是進(jìn)行聲音辨別的必要條件,也確實提供了“潛在可辨別”的信息到達(dá)聽覺皮層的證明[30],但其出現(xiàn)本身并不直接等同于已經(jīng)完成了聲音的辨識過程[26-29].
隨后,大約在200 ms 處,無論是對遠(yuǎn)偏差刺激還是近偏差刺激,在ERP波形中均可觀察到一個比P1更明顯的向下凹陷的正波P2,而由標(biāo)準(zhǔn)刺激引發(fā)的P2 波相對較弱. 在聽覺領(lǐng)域,P2 波通常與基礎(chǔ)的感知處理相關(guān),反映對刺激特征的注意. P2 成分也會受到聲音變化的影響,雖然不如MMN 明顯,不是用來直接反映聽覺偏差檢測的主要ERP成分,但P2 的變化可能反映了對這些偏差的高級感知處理.
在聽見刺激后的早期時間段內(nèi),本研究觀察到P1?N1?P2復(fù)合體的存在,Martin et al[29-31]稱這些為“ 聲學(xué)變化復(fù)合體”(Acoustic Change Com?plex,ACC).
除此之外,對于遠(yuǎn)、近偏差刺激,ERP 波形還存在MMN 成分. MMN 是由重復(fù)(即標(biāo)準(zhǔn))的聽覺刺激或聽覺刺激特征序列的不頻繁變化(即偏差刺激)引起的[32-33],通常在N1 峰之后和P2期間的時延區(qū)域顯示出負(fù)性增強,在刺激開始后的100~300 ms 達(dá)到峰值,可以看作是放大的N1 波、第二個負(fù)峰或P2波的衰減[13]. MMN 與行為上的刺激辨別緊密相關(guān),其產(chǎn)生表明聽覺皮層中的變化檢測系統(tǒng)已經(jīng)能區(qū)分標(biāo)準(zhǔn)與偏差刺激,可能表明個體具備分辨不同刺激的能力. 然而,MMN 的出現(xiàn)并不意味著個體已經(jīng)有意識地感知到這些變化,這還需要激活注意力觸發(fā)機制[13,34].
在近偏差刺激的ERP 波形中,大約在300ms處,還可觀察到一個向下凹陷的正波P3a,此波可能表明刺激已被注意到( 即注意力的轉(zhuǎn)換)[13,35-36]. 當(dāng)被試忽略標(biāo)準(zhǔn)刺激和偏差刺激時,只有在偏差的幅度相當(dāng)大的情況下,才能觀測到P3a 成分. 因此,在標(biāo)準(zhǔn)刺激和遠(yuǎn)偏差刺激的ERP 波形中,沒有出現(xiàn)P3a 成分.
2. 4實驗4:引入注意力狀態(tài)ERP 實驗 表1 統(tǒng)計了行為學(xué)實驗的相關(guān)結(jié)果. 其中,“NR” (NoResponse)表示應(yīng)該響應(yīng)而未響應(yīng)的情況,“ER”(Erroneous Response)表示進(jìn)行了錯誤的響應(yīng). 15名被試近偏差刺激和遠(yuǎn)偏差刺激的trials 各600次,標(biāo)準(zhǔn)刺激的trials 為6300 次.
統(tǒng)計結(jié)果表明,被試對近偏差刺激未進(jìn)行響應(yīng)的概率為0. 67%,進(jìn)行錯誤響應(yīng)(即選擇了遠(yuǎn))的概率為0. 83% ,總錯誤率為1. 50%. 其中,有一名被試因為不熟悉實驗流程,對聲音序列最開始的兩次偏差刺激(均為近)沒有進(jìn)行任何響應(yīng),若考慮這一點,實際錯誤率應(yīng)更低. 對于遠(yuǎn)偏差刺激,未進(jìn)行響應(yīng)的概率明顯增高,達(dá)到了4. 33%,沒有被試進(jìn)行了錯誤響應(yīng),總錯誤率為4. 33%,明顯高于在近距離條件下的總錯誤率.對于標(biāo)準(zhǔn)刺激,按照要求被試應(yīng)當(dāng)不進(jìn)行響應(yīng),而被試錯誤進(jìn)行了響應(yīng)的概率為0. 10%.
ERP分析只考慮被試在2 s 內(nèi)正確按下按鍵的偏差刺激數(shù)據(jù)與沒有進(jìn)行按鍵的標(biāo)準(zhǔn)刺激數(shù)據(jù). 在進(jìn)行腦電相關(guān)分析前,所有錯誤響應(yīng)與未響應(yīng)的trials 均被刪除. 因此,最終進(jìn)行腦電分析的數(shù)據(jù)包括近偏差刺激591次trials( 占原始近偏差刺激數(shù)據(jù)的98. 50%)、遠(yuǎn)偏差刺激574 次trials(占原始遠(yuǎn)偏差刺激數(shù)據(jù)的95. 67%)、標(biāo)準(zhǔn)刺激6294次trials( 占原始標(biāo)準(zhǔn)刺激數(shù)據(jù)的99. 90%).
反應(yīng)時間定義為被試按下按鍵的響應(yīng)時間與刺激發(fā)出的時間的差值. 表2 匯總了15 名被試對近偏差刺激與遠(yuǎn)偏差刺激的平均反應(yīng)時間(avg )與中位數(shù)(med).
本研究對總體的反應(yīng)時間進(jìn)行了統(tǒng)計分析. 15 名被試對近偏差刺激的平均反應(yīng)時間為0. 58 s,中位數(shù)為0. 55 s;對遠(yuǎn)偏差刺激的平均反應(yīng)時間為0. 74 s,中位數(shù)為0. 69 s. 通過方差分析(Analysis of Variance,ANOVA)進(jìn)行統(tǒng)計檢驗,發(fā)現(xiàn)被試對于遠(yuǎn)偏差刺激和近偏差刺激的反應(yīng)時間存在顯著差異( plt; 0.001),具體表現(xiàn)為被試對于遠(yuǎn)偏差刺激的反應(yīng)時間顯著長于對于近偏差刺激的反應(yīng)時間. 這一結(jié)果驗證了遠(yuǎn)偏差刺激引起的認(rèn)知負(fù)荷較大的假設(shè).
Sub 07 和Sub 09 的腦電數(shù)據(jù)因為質(zhì)量較差,在后續(xù)分析中被舍棄. 圖14 是13 名被試32 電極平均的ERP 波形(負(fù)波向上). 橫軸表示時間,覆蓋刺激前200 ms 至刺激后800 ms 的區(qū)間,縱軸表示腦電波的幅度.
如圖14 所示,與無注意力狀態(tài)的實驗相同,標(biāo)準(zhǔn)刺激(紅線)的ERP 波形幅值明顯較小,而近偏差刺激(黑線)與遠(yuǎn)偏差刺激(藍(lán)線)的ERP 波形幅值明顯增大. 同樣,與近偏差刺激相比,遠(yuǎn)偏差刺激產(chǎn)生的ERP 波形出現(xiàn)明顯的負(fù)波增強的現(xiàn)象,這可能是由于認(rèn)知負(fù)荷的增加.
N1( 100 ms)成分和MMN( 100~300 ms)成分與在無注意力狀態(tài)的實驗中有相似的存在. 但在引入注意力后,雖然遠(yuǎn)偏差刺激產(chǎn)生的ERP 波形整體處于橫坐標(biāo)的上方,但近偏差刺激產(chǎn)生的ERP 波形正波較為明顯. 與無注意力狀態(tài)的實驗相比,遠(yuǎn)偏差刺激和近偏差刺激產(chǎn)生的P1( 50ms)幅值更大(更向下),近偏差刺激產(chǎn)生的P2(180~200 ms)幅值也更大,這反映更多的神經(jīng)資源被分配到處理相關(guān)刺激上. 由于注意過程中會出現(xiàn)一些令人困惑的重疊成分如N1,P2,P3a 等,MMN 在引入注意力后的觀測中并不顯著.
對于近偏差刺激,在引入注意力狀態(tài)的實驗中也觀察到了P3a (200~250 ms)成分. 但在引入注意力的條件下,對于遠(yuǎn)偏差刺激,P3a 也能被觀測到. 只是與近偏差刺激相比,由于遠(yuǎn)偏差刺激的辨別難度更高,P3a 的時延較大,約為300~400 ms. P3a 的出現(xiàn)可能表明刺激被某些注意力觸發(fā)機制注意到,也可能反映注意監(jiān)控的重新定向[37],它并不一定表明“有意識”地感知到變化.
當(dāng)注意力被引入,被試被指示去識別偏差刺激時,在P3a 之后,可以在ERP 波形中觀察到一個負(fù)波N2b 和一個明顯的正波P3b. N2b可能代表刺激變化的前意識知覺登記,也可能是刺激評價和分類過程的早期階段,通常發(fā)生在注意力參與的條件下,幾乎總是緊隨P3a[35,38].
P3b 波也被稱為P3 或P300,它是最明顯的波,也可能是第一個既反映刺激為偏差又識別刺激是目標(biāo)的ERP 波[13,39]. P3b 時延通常獨立于(盡管相關(guān))響應(yīng)選擇時間,且通常發(fā)生在反應(yīng)時間之后,因此有研究人員認(rèn)為,它反映了在一系列標(biāo)準(zhǔn)刺激中對偏差刺激的決策后評價,并且可能反映了終止過程[36,40]. 有研究提出,P3b 時延可以用來評估刺激分類/評價過程的相對時間,包括辨別、識別和分類等認(rèn)知任務(wù)[41],并且通常與認(rèn)知效率相關(guān)[42]. 由圖14 可見,近偏差刺激的P3b 時延較短,約為400~800 ms,而遠(yuǎn)偏差刺激的P3b 時延約在600 ms 以后. 這與表2 中被試對近偏差刺激與遠(yuǎn)偏差刺激反應(yīng)時間的統(tǒng)計相符. 此外,實驗觀察到近偏差刺激產(chǎn)生的P3b 的振幅較大,而遠(yuǎn)偏差刺激產(chǎn)生的P3b 振幅較小. 這表明P3b 時延的增加和P3b 振幅的下降會伴隨刺激強度下降顯現(xiàn),同樣會由任務(wù)難度的增加導(dǎo)致.
2. 5 大腦半球特異化 聲音的定位與識別等聽覺過程是大腦處理聽覺信息的一個復(fù)雜過程,依賴于雙側(cè)聽覺皮層的共同努力,涉及多個大腦區(qū)域的協(xié)作. 但在許多情形下,在處理空間位置信息的任務(wù)中,大腦的左右半球展現(xiàn)出不同的激活模式. 這種大腦半球特異性在個體中也可能有所不同,會受到任務(wù)類型、聲音刺激的特點以及個人的神經(jīng)解剖結(jié)構(gòu)等因素的影響.
Mathiak et al[43],Kop?o et al[44],Altmann etal[45]關(guān)于功能性磁共振成像(Functional" MagneticResonance Imaging,fMRI)和腦磁圖(Magnetoen?cephalography,MEG)的研究均表明,右半球特別是右側(cè)顳葉,更善于感知聲強和混響等聲學(xué)線索的變化,在處理分析空間聽覺信息如聲源的方位和距離時,可能更加活躍[43-45]. 為了探究大腦左右半球在處理聽覺距離信息時的差異,本研究將腦電帽的32 個電極按照奇數(shù)與偶數(shù)平均分成兩個部分,即左半球與右半球(各16 個電極),并繪制左、右半球的ERP 波形圖,如圖15 所示. 其中,圖15a 和圖15b 分別為無注意力狀態(tài)右半球和左半球的結(jié)果,圖15c 和圖15d 分別為引入注意力狀態(tài)右半球和左半球的結(jié)果.
由圖15 可見,無論在有無注意力的情況下,右半球ERP 分量的幅值比左半球的幅值均更為顯著,這表明右半球?qū)τ诰嚯x相關(guān)的聽覺刺激有更強的反應(yīng). 此外,除了認(rèn)知負(fù)荷的增加導(dǎo)致的遠(yuǎn)偏差刺激產(chǎn)生的ERP 波形的負(fù)波增強,左半球?qū)畲碳づc標(biāo)準(zhǔn)刺激的反應(yīng)在有無注意力的條件下均不太明顯,這意味著左半球?qū)τ诼犛X距離相關(guān)的感知沒有那么敏感. 這與大腦分區(qū)的基礎(chǔ)認(rèn)識一致,即左半球更擅長處理語言和邏輯任務(wù)以及順序和分析性任務(wù),而右半球則對于空間關(guān)系和整體圖像處理更為敏感.
盡管本研究的實驗結(jié)果顯示右半球在處理聽覺距離感知方面發(fā)揮著較為重要的作用,但要注意的是,大腦處理聽覺信息的系統(tǒng)相當(dāng)復(fù)雜,通常涉及多個腦區(qū)的協(xié)作. 因此,不同的任務(wù)可能會激活不同的腦區(qū),對于聲音距離的識別也并不是右半球某一區(qū)域的獨立功能.
3 結(jié)論
本研究通過識別實驗與絕對量度實驗進(jìn)行了聽覺距離感知主觀評價研究,并在無注意力和引入注意力兩種條件下進(jìn)行了ERP 相關(guān)研究. 主觀評價結(jié)果表明,被試在近距離條件下的距離感知較為準(zhǔn)確,而在遠(yuǎn)距離條件下,感知準(zhǔn)確性下降,呈現(xiàn)出與冪函數(shù)擬合一致的低估現(xiàn)象. 行為學(xué)實驗結(jié)果表明,與近偏差刺激相比,被試對遠(yuǎn)偏差刺激的響應(yīng)錯誤率與反應(yīng)時間均顯著增加. 在ERP實驗結(jié)果中,觀察到了P1?N1?P2復(fù)合體的存在.在無注意力條件下,P3a 成分僅在偏差更明顯的近偏差刺激處出現(xiàn);在引入注意力后,無論遠(yuǎn)偏差刺激還是近偏差刺激,P3a成分均有顯現(xiàn). P3b 成分僅在引入注意力的條件下顯著,并且隨著刺激強度降低和任務(wù)難度增加,其時延增加且振幅下降. 此外,ERP 圖像揭示了大腦半球特異化的現(xiàn)象,結(jié)果表明右半球?qū)τ诰嚯x相關(guān)的聽覺刺激更為敏感.
本研究發(fā)現(xiàn)人耳對聲音距離的感知受到聲強因素的強烈影響,但聲強、DRR等因素的影響權(quán)重尚未明確,這需要實施更嚴(yán)格的變量控制. 在絕對量度實驗中,每個指定距離只在實驗過程中出現(xiàn)一次,因此,本研究暫未去除被試內(nèi)部可能異常的數(shù)據(jù). 此外,為了減少頭部運動產(chǎn)生的偽跡,在實驗過程中要求被試盡量保持靜止. 然而,頭部的運動能提供額外的雙耳線索,如ITD,從而幫助被試進(jìn)行距離判斷. 已有研究表明,與聽覺感知相關(guān)的ERP 成分與大腦中的具體區(qū)域有關(guān),例如,N1 在額中央電極處記錄得最大,MMN 生成器在聽覺皮層內(nèi)的確切位置取決于正在處理的聲音的感覺特征(如強度、頻率、持續(xù)時間等),各種P3 波的頭皮分布在不同的實驗中也有所不同,因此,對大腦具體腦區(qū)的分析需要進(jìn)一步細(xì)化和完善,以更精確地理解ERP 成分與腦功能的關(guān)聯(lián).
(責(zé)任編輯 高善露)