陳 彧
(1.河南師范大學(xué) 文學(xué)院,河南新鄉(xiāng)453007;2.維多利亞大學(xué) 語(yǔ)言學(xué)系,加拿大 維多利亞 V8T IR6)
在語(yǔ)言生活中,人的言語(yǔ)總是伴隨著特定情感的,而特定情感也總是投射到具體言語(yǔ)活動(dòng)中。日常生活經(jīng)驗(yàn)告訴人們,人在生氣的時(shí)候語(yǔ)速較快、聲音含混;在悲傷的時(shí)候則語(yǔ)速緩慢、聲音清晰。顯然,當(dāng)人處于喜悅、悲傷、憤怒等不同情感狀態(tài)下時(shí),其言語(yǔ)的清晰程度是不同的。這種直觀的言語(yǔ)清晰程度,在一定程度上是可以通過(guò)言語(yǔ)清晰度(或譯言語(yǔ)可懂度)的測(cè)量來(lái)量化的。在通過(guò)對(duì)漢語(yǔ)情感語(yǔ)音數(shù)據(jù)庫(kù)中不同情感狀態(tài)下普通話語(yǔ)音言語(yǔ)清晰度相關(guān)聲學(xué)參數(shù)進(jìn)行測(cè)量的基礎(chǔ)上,觀察言語(yǔ)清晰度與不同情感狀態(tài)的相互關(guān)系。其意義在于,除了在國(guó)內(nèi)外率先從言語(yǔ)清晰度的角度考察情感語(yǔ)音問(wèn)題、檢驗(yàn)和發(fā)展元音清晰度的聲學(xué)空間特征參數(shù)理論外,還能夠有助于進(jìn)一步弄清情感語(yǔ)音的聲學(xué)特性,為言語(yǔ)工程提供更多的有效合成參數(shù),從而有助于改進(jìn)語(yǔ)音合成效果,提高合成語(yǔ)音識(shí)別率。
言語(yǔ)清晰度是語(yǔ)言學(xué)、言語(yǔ)工程、心理學(xué)、耳鼻喉科臨床醫(yī)學(xué)等眾多學(xué)科的重要研究?jī)?nèi)容。在言語(yǔ)工程領(lǐng)域,言語(yǔ)清晰度常被用作設(shè)計(jì)和評(píng)價(jià)言語(yǔ)通訊系統(tǒng)的評(píng)測(cè)工具。心理學(xué)家利用言語(yǔ)清晰度研究?jī)和Z(yǔ)言發(fā)展、言語(yǔ)與肢體語(yǔ)言的相互關(guān)系等問(wèn)題。臨床醫(yī)學(xué)關(guān)注發(fā)音和聽力器官缺陷、語(yǔ)音糾正、聽力喪失等。
在語(yǔ)言研究領(lǐng)域,學(xué)者很早就開始關(guān)注言語(yǔ)清晰度的問(wèn)題。一些研究關(guān)注語(yǔ)言學(xué)信息在清晰度感知中的作用。Black指出,即使在理想化的發(fā)音和感知條件下,由于受到發(fā)音人個(gè)體因素的影響,不同說(shuō)話人所發(fā)語(yǔ)音在感知上也存在言語(yǔ)清晰度差異[1]。Mullennix等的研究表明,對(duì)于相同的文本,言語(yǔ)清晰度的感知結(jié)果隨著發(fā)音人個(gè)體變異的增多而下降[2];Nygaard發(fā)現(xiàn),對(duì)于發(fā)音人語(yǔ)音的熟悉程度越高,聽音人越傾向于在感知實(shí)驗(yàn)中給予更高的清晰度得分[3]。另一些研究著眼于發(fā)音人受特定交際需要而系統(tǒng)化轉(zhuǎn)換言語(yǔ)模式對(duì)其言語(yǔ)清晰度造成的影響。Picheny等發(fā)現(xiàn),對(duì)于同一名發(fā)音人用“清晰的”言語(yǔ)和“交際的”言語(yǔ)兩種模式說(shuō)話時(shí),前者能獲得更高的言語(yǔ)清晰度得分,并被認(rèn)為言語(yǔ)語(yǔ)速更慢、存在更少的音系刪節(jié)現(xiàn)象[4-5]。Bond&Moore分析了言語(yǔ)清晰度得分不同的三名發(fā)音人言語(yǔ)材料的聲學(xué)參數(shù),發(fā)現(xiàn)得分較高的發(fā)音人所發(fā)語(yǔ)音與前述“清晰的言語(yǔ)模式”存在較多的共同點(diǎn)[6],該結(jié)果證明Picheny等所提二元言語(yǔ)模式對(duì)于分析多名發(fā)音人的言語(yǔ)清晰度問(wèn)題同樣適用。還有一些研究關(guān)注與言語(yǔ)清晰度相關(guān)的聲學(xué)參數(shù)的提取和應(yīng)用。例如,Bradlow等通過(guò)分析印第安納多語(yǔ)者語(yǔ)句數(shù)據(jù)庫(kù)(Indiana Multi—Talker Sentence Database),致力于尋找與言語(yǔ)清晰度密切相關(guān)的精細(xì)的、反映即時(shí)發(fā)音情況的元音聲學(xué)空間特征參數(shù)(Vowel space characteristics)[7]。數(shù)年后,Pierrehumbert等運(yùn)用這些參數(shù)分析了不同性取向美語(yǔ)母語(yǔ)者的言語(yǔ)清晰度,確證了性取向與元音發(fā)音的相互關(guān)系[8]。
目前,國(guó)內(nèi)有關(guān)言語(yǔ)清晰度的研究多集中在言語(yǔ)工程和臨床醫(yī)學(xué)領(lǐng)域,從語(yǔ)言學(xué)界、心理學(xué)等其他學(xué)科關(guān)注言語(yǔ)清晰度的研究報(bào)告還暫未看到。
對(duì)于情感語(yǔ)音的研究可以幫助人類認(rèn)識(shí)其在信息表達(dá)和信息提取的運(yùn)作機(jī)制,進(jìn)而合成更為自然流暢的人工語(yǔ)音并應(yīng)用于實(shí)踐,因此是語(yǔ)言學(xué)、心理學(xué)、言語(yǔ)工程等學(xué)科的重要課題。特別是在言語(yǔ)工程領(lǐng)域,聲音中的情感信息逐漸成為語(yǔ)音工程的研究熱點(diǎn)。近二十年來(lái),隨著相關(guān)領(lǐng)域的長(zhǎng)足進(jìn)步,言語(yǔ)工程對(duì)于參數(shù)化合成語(yǔ)音的自然度提出了更高的要求。在實(shí)現(xiàn)人工語(yǔ)音的較好的可懂度的基礎(chǔ)上,人們還要求人工語(yǔ)音能夠以一種合乎人類情感特征的方式被表達(dá)出來(lái)。目前,以各主要語(yǔ)言包括普通話[9-13]的情感語(yǔ)音為對(duì)象的研究不勝枚舉。概括來(lái)說(shuō),大部分研究均采用建立情感語(yǔ)音庫(kù)、提取語(yǔ)音參數(shù)并予以分析、進(jìn)行參數(shù)化合成和語(yǔ)音識(shí)別的步驟進(jìn)行,總體上合成效果和研究方法還有待提高。
然而,有關(guān)情感語(yǔ)音的研究在國(guó)內(nèi)外語(yǔ)言學(xué)界卻一直未能得到足夠的重視。在漢語(yǔ)語(yǔ)言學(xué)界,趙元任較早地提出了中性語(yǔ)調(diào)與表情語(yǔ)調(diào)的概念,并指出情感表達(dá)的語(yǔ)音手段包括音質(zhì)、音強(qiáng)、音高和語(yǔ)速[14]。此后,徐世榮、沈炯、吳宗濟(jì)的相關(guān)研究對(duì)于普通話情感語(yǔ)音亦有所涉及[15]。近年來(lái),李愛軍等也對(duì)諸如友好語(yǔ)音等與情感語(yǔ)音密切相關(guān)的表現(xiàn)力語(yǔ)音進(jìn)行了試驗(yàn)性的探討分析[16-17]。目前,漢語(yǔ)語(yǔ)言學(xué)界目前尚無(wú)其他有關(guān)普通話或方言的情感語(yǔ)音研究見諸報(bào)端。
從漢語(yǔ)情感語(yǔ)音庫(kù)中選取四名發(fā)音人(男女各2人)在中性、驚奇、喜悅、悲傷、憤怒五種情感狀態(tài)下的語(yǔ)音樣品,實(shí)施聽感實(shí)驗(yàn)并進(jìn)行言語(yǔ)清晰度計(jì)算;接下來(lái),對(duì)所選語(yǔ)音樣品進(jìn)行聲學(xué)數(shù)據(jù)提取;進(jìn)而,運(yùn)用Bradlow等的方法進(jìn)行元音聲學(xué)空間特征參數(shù)計(jì)算;最后,結(jié)合感知實(shí)驗(yàn)和聲學(xué)實(shí)驗(yàn)結(jié)果進(jìn)行分析、探討。
本文所用的語(yǔ)音樣品源于清華大學(xué)開發(fā)的漢語(yǔ)情感語(yǔ)音數(shù)據(jù)庫(kù)。該語(yǔ)音庫(kù)依據(jù)PAD情感模型[18],從P愉悅度(Pleasure—Displeasure)、A激活度(Arousal—Nonarousal)和D優(yōu)勢(shì)度(Dominance—Submissiveness)三個(gè)維度區(qū)分了11種情感狀態(tài);對(duì)于每一種情感狀態(tài),各設(shè)計(jì)10段錄音文本,每段錄音文本大致包括100左右的音節(jié);數(shù)據(jù)庫(kù)共有發(fā)音人20人,其中男女各10名,錄音時(shí)年齡在18至25歲之間;錄音過(guò)程同時(shí)進(jìn)行了相關(guān)生理數(shù)據(jù)的提取,最后共得到包括7維聲學(xué)參數(shù)和9維生理參數(shù)共16維參數(shù)[19]。
筆者首先運(yùn)用拉丁方(Latin square)對(duì)各發(fā)音人的語(yǔ)音樣品進(jìn)行偽隨機(jī)編排處理,再采用交叉法對(duì)聽音人進(jìn)行分組,以保證每組聽音人對(duì)兩個(gè)發(fā)音人的語(yǔ)音樣品進(jìn)行評(píng)判。聽音人共計(jì)6組,每組10人(5男5女),年齡18~22周歲,由天津市兩所高校的非語(yǔ)言學(xué)專業(yè)的學(xué)生組成,日常以普通話為交際語(yǔ)言,并報(bào)告無(wú)聽力障礙及相關(guān)疾病史。
實(shí)驗(yàn)在語(yǔ)音實(shí)驗(yàn)室進(jìn)行。語(yǔ)音樣品由控制臺(tái)統(tǒng)一播放,在每段錄音開始之前會(huì)插入提示音;在該段錄音播放之后、下個(gè)提示音之前,會(huì)有3秒時(shí)間以供聽音人做出判斷。評(píng)判由聽音人在紙質(zhì)評(píng)判量表上完成。評(píng)判表由50道題目組成,評(píng)判標(biāo)準(zhǔn)從完全聽不清楚至清晰共分五檔,其結(jié)果轉(zhuǎn)為百分制顯示(見表1)。
Bradlow等在考察言語(yǔ)清晰度與元音聲學(xué)空間特征參數(shù)的相互關(guān)系時(shí),共提取了美語(yǔ)頂點(diǎn)元音/a、i、o/360個(gè)樣品的前兩個(gè)共振峰數(shù)值,進(jìn)行了從赫茲值(Hz)到鎂值(Mel)的換算并進(jìn)行了八維參數(shù)的計(jì)算。其結(jié)果表明,元音空間面積(Vowel space,單位為mels2),元音空間離差(Vowel space dispersion,單位為mels),/i/的第一第二共振峰差值(F2-F1/i/,單位為mels)與言語(yǔ)清晰度結(jié)果呈正相關(guān)關(guān)系;范疇聚類(Category clustering,單位為mels),/a/的第一第二共振峰差值(F2-F1/a/,單位為mels)與言語(yǔ)清晰度結(jié)果呈負(fù)相關(guān)關(guān)系;其余參數(shù)與言語(yǔ)清晰度的統(tǒng)計(jì)關(guān)系不明顯。
在本文中,筆者在Praat5.1.26環(huán)境下編寫腳本,對(duì)漢語(yǔ)情感語(yǔ)音庫(kù)中四名發(fā)音人的語(yǔ)音樣品進(jìn)行了切分、標(biāo)注。圖1示例了一個(gè)經(jīng)過(guò)自動(dòng)切分和手工標(biāo)注的情感語(yǔ)音片段。
圖1 情感語(yǔ)音切分標(biāo)注示意
然后,找出各發(fā)音人在各情感狀態(tài)下所發(fā)語(yǔ)音中前五個(gè)包含以頂點(diǎn)元音/a、i、u/單獨(dú)做韻母的句子①Bradlow等所選取的頂點(diǎn)元音為/a、i、o/,本文所選取的頂點(diǎn)元音為/a、i、u/,這是由美語(yǔ)和漢語(yǔ)普通話的差異造成的。Bradlow指出,美語(yǔ)中的/u/由于存在過(guò)多變體,故不宜作為頂點(diǎn)元音進(jìn)行元音聲學(xué)空間特征參數(shù)的提取,因而以/o/代之。相反,漢語(yǔ)中的/u/則是穩(wěn)定的頂點(diǎn)元音,用來(lái)進(jìn)行聲學(xué)空間特征參數(shù)的計(jì)算是沒(méi)有問(wèn)題的。因?yàn)榘?a、i、u/單獨(dú)做韻母例字的句子較多,且各元音符合要求的句子數(shù)量不均;所以我們統(tǒng)一為各元音選取符合要求的前五個(gè)句子,使得各元音的樣品數(shù)目相等,便于下一步的分析探討。如果同一個(gè)句子中包含兩個(gè)及以上以/a、i、u/單獨(dú)做韻母的音節(jié),則只取其中最先出現(xiàn)的那個(gè)音節(jié)的韻母進(jìn)行考察?!,F(xiàn)將中性情感狀態(tài)下包含/a、i、u/單獨(dú)做韻母的前五個(gè)句子示例如下。
/a/
我不由得說(shuō),啊……
該語(yǔ)料庫(kù)面向語(yǔ)音合成的理論研究、技術(shù)開發(fā)和系統(tǒng)評(píng)測(cè)。
赫魯曉夫在蘇共二十大揭露斯大林的暴行時(shí)……
數(shù)字熒光管、發(fā)光二極管,數(shù)字顯示器等……
下午記得把昨天的會(huì)議記錄拿過(guò)來(lái)……
/i/
這是因?yàn)槎M(jìn)制數(shù)的基數(shù)為二……
它只有零和一兩個(gè)數(shù)字……
每一個(gè)細(xì)胞都仿佛呼吸著一種叫做中性的情緒……
語(yǔ)音合成多采用基于語(yǔ)料庫(kù)的拼接合成……
臺(tái)下有人遞條子上去……
/u/
在數(shù)字系統(tǒng)中常常采用二進(jìn)制數(shù)……
這是因?yàn)槎M(jìn)制數(shù)的基數(shù)為二……
它只有零和一兩個(gè)數(shù)字……
便于電路實(shí)現(xiàn)……
二進(jìn)制數(shù)也采用位置計(jì)數(shù)法……
接下來(lái),對(duì)所選取句子當(dāng)中的頂點(diǎn)元音進(jìn)行相關(guān)數(shù)據(jù)的提取。每位發(fā)音人的樣品數(shù)量為3×5×5個(gè),四位發(fā)音人共計(jì)300個(gè)。對(duì)于每個(gè)樣品,分別提取其前兩個(gè)共振峰(即F1、F2)的平均值,并轉(zhuǎn)為相應(yīng)的Mel值。最后,進(jìn)行元音聲學(xué)空間特征參數(shù)的計(jì)算并進(jìn)行相應(yīng)分析。
利用所得數(shù)據(jù),筆者對(duì)上述五個(gè)參數(shù)進(jìn)行了計(jì)算(見表1)。
表1 四名發(fā)音人言語(yǔ)清晰度得分和元音聲學(xué)空間特征參數(shù)表
筆者先求取各發(fā)音人在不同情感狀態(tài)下/i/、/a/、/u/五次發(fā)音F1、F2數(shù)據(jù)的平均值,再依據(jù)海倫定理計(jì)算出相應(yīng)的元音空間面積(見表1),并繪制出聲學(xué)元音圖(如圖2所示)。
觀察該圖可以看到,圖2a所示女1在不同情感狀態(tài)下的元音聲學(xué)空間分布離散、各種情感狀態(tài)下的元音聲學(xué)空間面積相對(duì)較大;而圖2d所示男2在不同情感狀態(tài)下的元音聲學(xué)空間分布集中、同時(shí)各種情感狀態(tài)下的元音聲學(xué)空間面積較小;圖2b和圖2c所示的男1和女1的情況則處于中間狀態(tài)。這個(gè)情況說(shuō)明,發(fā)音人女1在不同情感狀態(tài)下所發(fā)語(yǔ)音的區(qū)分程度,在整體上好于男1和女2,而男1和女2又好于男2。
由于元音聲學(xué)空間的計(jì)算基于頂點(diǎn)元音參數(shù)的平均值計(jì)算之上,不能反映發(fā)音人某次發(fā)音活動(dòng)的實(shí)際情況。因此,要更好地觀察某發(fā)音人不同情感狀態(tài)下言語(yǔ)清晰度間的差異,還需計(jì)算相應(yīng)的言語(yǔ)空間離差。圖3反映了女1在驚奇、喜悅、悲傷、憤怒狀態(tài)下的言語(yǔ)空間離差情況。
圖2 四名發(fā)音人不同情感狀態(tài)下的聲學(xué)元音圖
圖3 發(fā)音人女1在不同情感狀態(tài)下的言語(yǔ)空間離差圖
圖3顯示,3c所反映的悲傷情感中,不同頂點(diǎn)元音的分布間距較大,而同一元音的各次發(fā)音之間則相對(duì)集中;同時(shí),中點(diǎn)距歷次發(fā)音中各頂點(diǎn)元音的距離較遠(yuǎn)且波動(dòng)不大。因而,在此情況下的不同元音的區(qū)分度較好,清晰程度更高。與之形成鮮明對(duì)比的是反映憤怒情緒的3d,元音/a/、/u/存在相混的情況,中點(diǎn)距各采樣點(diǎn)的距離亦波動(dòng)甚劇,因此區(qū)分度不夠好、元音的清晰度相對(duì)較低。
總體上對(duì)元音聲學(xué)空間、言語(yǔ)空間離差和言語(yǔ)清晰度數(shù)據(jù)分別進(jìn)行相關(guān)分析,結(jié)果分別為:元音聲學(xué)空間與言語(yǔ)清晰度的皮爾遜相關(guān)系數(shù)為0.686**(p<0.001);言語(yǔ)空間離差與言語(yǔ)清晰度的皮爾遜相關(guān)系數(shù)為0.729**(p<0.001),二者皆與言語(yǔ)清晰度密切正相關(guān),與Bradlow等所得結(jié)果一致。該結(jié)果說(shuō)明,總體上元音聲學(xué)空間和言語(yǔ)空間離差數(shù)據(jù)較大的情感狀態(tài),其言語(yǔ)清晰度往往好于相關(guān)數(shù)據(jù)較小的情感。描述統(tǒng)計(jì)的結(jié)果顯示,五種情感的元音聲學(xué)空間和言語(yǔ)空間離差數(shù)據(jù)均依次為悲傷>驚奇≈喜悅>中性>憤怒;而相應(yīng)的言語(yǔ)清晰度排序?yàn)橹行裕颈瘋倔@奇≈喜悅>憤怒。如果除去中性狀態(tài),兩個(gè)序列的順序是完全對(duì)應(yīng)的。對(duì)于中性情感狀態(tài)的問(wèn)題,筆者將在下文中專門討論。
具體到各發(fā)音人,其情況也基本符合上述規(guī)則。這里有兩點(diǎn)需要單獨(dú)說(shuō)明的是:其一,發(fā)音人在驚奇和喜悅狀態(tài)下的相關(guān)數(shù)據(jù)存在互有參差的情況,這可能和二者在PAD情感量表上較為接近有關(guān)。同時(shí),兩者在言語(yǔ)活動(dòng)中的區(qū)別,可能更多的體現(xiàn)在語(yǔ)調(diào)而非音質(zhì)上,因而在元音聲學(xué)空間參數(shù)方面區(qū)分不夠明顯。其二,發(fā)音人男2的情況與總體趨勢(shì)不相吻合,這可能與其自身的言語(yǔ)活動(dòng)個(gè)性相關(guān)。由于其各種情感狀態(tài)下的相關(guān)參數(shù)變化不大、區(qū)分不明顯,可能造成其各種情感狀態(tài)下的清晰度得分接近,言語(yǔ)清晰度總體水平偏下。
范疇聚類的計(jì)算方式是,先求取某情感狀態(tài)下各頂點(diǎn)內(nèi)各次發(fā)音數(shù)據(jù)的空間離差,再對(duì)三頂點(diǎn)的空間離差的進(jìn)行求平均值計(jì)算。Bradlow等人的研究表明,這個(gè)參數(shù)可以顯示元音發(fā)音時(shí)的內(nèi)部變異,其值越大,元音變異越大,發(fā)音越不穩(wěn)定,言語(yǔ)清晰度越低;反之,則言語(yǔ)清晰度越高。
在考察各發(fā)音人自身的情況時(shí)發(fā)現(xiàn),雖然各發(fā)音人間的數(shù)據(jù)相差較大,但在各發(fā)音人內(nèi)部,悲傷和中性情感狀態(tài)下的范疇聚類都小于驚奇和喜悅,而憤怒情感下的范疇聚類則是最大的。在對(duì)情感狀態(tài)和范疇聚類進(jìn)行描述統(tǒng)計(jì)時(shí)發(fā)現(xiàn),范疇聚類的排序?yàn)橹行裕急瘋俭@奇≈喜悅<憤怒,但相關(guān)分析的結(jié)果卻顯示言語(yǔ)清晰度和范疇聚類不存在明顯的相關(guān)關(guān)系。
再來(lái)看元音/i/、/a/的共振峰差值的情況。依據(jù)Bradlow等人的研究結(jié)論,/i/的F2-F1越大,/a/的F2-F1越小,則言語(yǔ)清晰度越高。而本文所作的相關(guān)分析顯示,/i/的共振峰差值與言語(yǔ)清晰度存在密切的正相關(guān)關(guān)系(相關(guān)系數(shù)為0.782**,p<0.001),而/a/的共振峰差值與言語(yǔ)清晰度不存在相關(guān)關(guān)系。
筆者認(rèn)為,造成/a/的共振峰差值分布雜亂,進(jìn)而使其與言語(yǔ)清晰度不能形成相關(guān)關(guān)系的可能原因有兩個(gè):第一,正常情況下/a/的F1、F2就因?yàn)榫嚯x較近,容易彼此產(chǎn)生干擾,會(huì)對(duì)其共振峰數(shù)值的測(cè)定產(chǎn)生不利影響[20]。在附帶各種情感的情況下,/a/的音質(zhì)更易受到不同情感狀態(tài)的影響而產(chǎn)生劇變?nèi)绮烈艋龋斐蒔raat軟件判斷函數(shù)周期波檢測(cè)的困難,從而使得共振峰數(shù)據(jù)測(cè)量困難、數(shù)據(jù)失真。第二,Monsen&Engebretson的研究表明,無(wú)論采用譜圖觀測(cè)法還是線性預(yù)測(cè)法,基頻的抬高會(huì)造成共振峰數(shù)據(jù)測(cè)量的失真,特別是當(dāng)基頻高于350Hz以后,該現(xiàn)象將更為顯著[21]。在本研究中,受到驚奇、喜悅、憤怒等情感的影響,基頻存在被大幅抬高的可能,從而造成共振峰數(shù)據(jù)測(cè)量的困難。雖然/i/、/a/都會(huì)受到基頻的影響,但后果顯然不同。假設(shè)在測(cè)量/a/、/i/的F1時(shí),均因基頻的干擾而出現(xiàn)了150Hz的測(cè)量誤差。對(duì)于兩個(gè)共振峰間距較小的/a/而言,150Hz的測(cè)量誤差就可能造成共振峰差值計(jì)算結(jié)果的較大偏誤;而同等情況下,/i/的F1、F2間距較大,因此150Hz的測(cè)量誤差造成的偏誤影響要比/a/小得多。當(dāng)然,上述觀點(diǎn)只是筆者對(duì)于這個(gè)現(xiàn)象的一種推測(cè),要想搞清這個(gè)問(wèn)題,仍需進(jìn)一步研究、驗(yàn)證。
通過(guò)對(duì)不同發(fā)音人不同情感狀態(tài)下言語(yǔ)清晰度及其元音聲學(xué)空間進(jìn)行觀察,確實(shí)可以看到情感狀態(tài)確實(shí)會(huì)對(duì)言語(yǔ)清晰度產(chǎn)生相應(yīng)的影響。在所考察的五種情感中,其言語(yǔ)清晰度確實(shí)存在一定規(guī)律,激活程度較低的情感狀態(tài)下的語(yǔ)音,其言語(yǔ)清晰度往往高于激活程度較高的情感狀態(tài)下的語(yǔ)音??傮w而言,本文所考察的五種情感言語(yǔ)清晰度的次序是:中性>悲傷>驚奇≈喜悅>憤怒。
與言語(yǔ)清晰度相對(duì)應(yīng)的是,情感狀態(tài)確實(shí)對(duì)元音聲學(xué)空間參數(shù)產(chǎn)生了影響。本文的研究結(jié)果表明,激活程度較低的情感如悲傷,往往整體上聲學(xué)空間面積較大、不同元音分布較為離散,而在各元音內(nèi)部,則分布較為集中,離散程度低;反之,激活度較高的元音如憤怒,則整體上空間較小而各元音內(nèi)部離散程度較高。因此,本文的結(jié)果也基本上證實(shí)了Bradlow等人的看法,并進(jìn)一步證明了該理論運(yùn)用于情感語(yǔ)音研究的可能。當(dāng)然,本文的一些結(jié)論與Bradlow等人的結(jié)果相左。例如,在范疇聚類和/a/的共振峰差值上,并未發(fā)現(xiàn)它們與言語(yǔ)清晰度的負(fù)相關(guān)關(guān)系。這可能是由于情感語(yǔ)音的復(fù)雜性或不可控的測(cè)量誤差造成的,因此現(xiàn)在對(duì)這些現(xiàn)象下結(jié)論還為之過(guò)早。
在結(jié)束本文之前,仍需對(duì)中性語(yǔ)音現(xiàn)象做一些說(shuō)明。作為情感語(yǔ)音研究的參照系,中性語(yǔ)音實(shí)際上是一種人造情感語(yǔ)音。因此,在對(duì)中性語(yǔ)音的實(shí)現(xiàn)上,發(fā)音人的把握也可以是有所不同的。既可以像本文中兩名女發(fā)音人那樣,發(fā)得字正腔圓,由此產(chǎn)生較大的元音聲學(xué)空間和元音空間離差;又可以像兩名男發(fā)音人那樣,發(fā)音器官常常處于自然狀態(tài),共鳴腔變化幅度較小,由此元音聲學(xué)空間和元音空間離差很小。當(dāng)然,不管采用何種方法,中性語(yǔ)音在產(chǎn)生時(shí)都因發(fā)音不受情感的影響而不產(chǎn)生各種復(fù)雜的音質(zhì)改變,從而元音內(nèi)部的變異較小,因此范疇聚類在各種情感語(yǔ)音中最小。也正是由于中性語(yǔ)音不產(chǎn)生各種復(fù)雜的變化,在清晰度感知中也往往能夠獲得較高評(píng)分。因此,言語(yǔ)清晰度的聲學(xué)空間參數(shù)分析在用來(lái)分析中性語(yǔ)音時(shí),可能會(huì)出現(xiàn)一定困難。
[1]BLACK J W.Multiple-choice Intelligibility Tests[J].J.Speech and Hearing Disorders,1957(22):213 -235.
[2]MULLENNIX J W,PISONI D B,MARTIN C S.Some Effects of Talker Variability on Spoken Word Recognition[J].J.Acoust.Soc.Am.,1989(85):365-378.
[3]NYGAARD L C,SOMMERS M S,PISONI D B.Effects of Stimulus Variability on Perception and Representation of Spoken Words in Memory[J].Perception and Psychophysics,1995(57):989 -1001.
[4]PICHENY M A,DURLACH N I,BRAIDA L D.Speaking Clearly for the Hard of Hearing I:Intelligibility Differences Between Clear and Conversational speech[J].J.Speech and Hearing Research,1985(28):96 -103.
[5]PICHENY M A,DURLACH N I,BRAIDA L D.Speaking Clearly for the Hard of HearingⅢ:An attempt to Determine the Contribution of Speaking Rate to Difference in Intelligibility Between Clear and Conversational Speech[J].J.Speech and Hearing Research,1989(32):600-603.
[6]BOND Z S,MOORE T J.A Note on the Acoustic-phonetic Characteristics of Inadvertently Clear Speech[J].Speech Communication,1994,14(4):325-327.
[7]BRADLOW A R,TORRETTA G M,PISONI D B.Intelligibility of Normal Speech I:Global and Fine-grained Acoustic-phonetic Talker Characteristics[J].Speech Communication,1996,20(3-4):255-272.
[8]PIERREHUMBERT J B,BENT T,MUNSON B,et al.The Influence of Sexual Orientation on Vowel Production(L)[J].J.Acoust.Soc.Am.,2004,116(4):1905-1908.
[9]趙力,鄒采榮,吳鎮(zhèn)揚(yáng).語(yǔ)音識(shí)別中基于MCE準(zhǔn)則的CHMM學(xué)習(xí)方法[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2000(3):21-25.
[10]趙力,鄒采榮,吳鎮(zhèn)揚(yáng).基于3維空間Viterbi算法的漢語(yǔ)連續(xù)語(yǔ)音識(shí)別方法[J].電子學(xué)報(bào),2000(7):67-69.
[11]蔣丹寧,蔡蓮紅.漢語(yǔ)疑問(wèn)語(yǔ)氣的聲學(xué)特征研究[C]∥第六屆全國(guó)現(xiàn)代語(yǔ)音學(xué)術(shù)會(huì)議論文集,2003:186-191.
[12]蔣丹寧,蔡蓮紅.基于語(yǔ)音聲學(xué)特征的情感信息識(shí)別[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2006,46(1):86-89.
[13]金學(xué)成.基于語(yǔ)音信號(hào)的情感識(shí)別研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2007.
[14]趙元任.漢語(yǔ)的字調(diào)跟語(yǔ)調(diào)[M]∥吳宗濟(jì),趙那新.趙元任語(yǔ)言學(xué)論文集.北京:商務(wù)印書館,2002:734-749.
[15]李愛軍.友好語(yǔ)音的聲學(xué)分析[J].中國(guó)語(yǔ)文,2005(5):418-431.
[16]LI A,WANG H.Friendly Speech Analysis and Perception in Standard Chinese[M].ICSLP2004,JEJU,Korea,2004:49-52.
[17]CHEN F,LI A,WANG H,et al.Acoustic Analysis of Friendly Speech[M].ICASSP2004-5,Montreal,Canada,2004:53-56.
[18]MEHRABIAN A.Framework for a Comprehensive Description and Measurement of Emotional States[J].Genetic,Social,General,and General Psychology Monographs,1995(121):339 -361.
[19]CUI D,CAI L.Acoustic and Physiological Feature Analysis of Affective Speech[M].ICIC 2006,Kunming,China,2006:912-917,
[20]林燾,王理嘉.語(yǔ)音學(xué)教程[M].北京:北京大學(xué)出版社,1992:54.
[21]MONSEN R B,ENGEBRETSON A M.The Accuracy of Formant Frequency Measurements:A Comparison of Spectrographic Analysis and Linear Prediction[J].J.Speech Hears,1983(26),89 -97.