曹洪林,孔江平
(1.北京大學(xué) 中文系,北京 100871;2.中國(guó)政法大學(xué) 證據(jù)科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100088)
共振峰是聲紋鑒定中最重要的特征之一,它能夠提供很多發(fā)音人的個(gè)性特征。目前,對(duì)于共振峰的利用,鑒定人員經(jīng)常從定量和定性兩個(gè)角度進(jìn)行分析。定量分析共振峰頻率的方法有很多,其中最為經(jīng)典的還是測(cè)量元音(穩(wěn)定段)共振峰中心頻率值的方法。McDougall[1-2]提出了一種定量分析共振峰動(dòng)態(tài)特性的新方法,即對(duì)復(fù)合元音和響音的共振峰進(jìn)行多項(xiàng)式擬合,引入判別式對(duì)共振峰和擬合系數(shù)進(jìn)行判別分析;李敬陽(yáng)等[3]利用類似的方法,對(duì)漢語(yǔ)普通話復(fù)合元音共振峰的動(dòng)態(tài)特性進(jìn)行了定量分析研究,而在此之前許多有關(guān)音節(jié)內(nèi)和音節(jié)間共振峰動(dòng)態(tài)特性的研究一直停留在定性比較層面(有時(shí)候也會(huì)結(jié)合測(cè)量元音共振峰最低點(diǎn)和最高點(diǎn)的頻率值進(jìn)行分析)。最近,Nolan與Grigoras[4]提出了第三種測(cè)量共振峰頻率的方法,即長(zhǎng)時(shí)共振峰分布測(cè)量法(Long-Term Formant Distribution,縮寫為L(zhǎng)TF)。與前兩種定量分析方法不同,該方法不是分析具體的目標(biāo)元音,而是提取一整段語(yǔ)音中的全部元音信息進(jìn)行分析,得出每條共振峰的整體分布情況,該分布特征不僅可以概括發(fā)音人聲道的整體共鳴特點(diǎn),還能反映出發(fā)音人一定的發(fā)音習(xí)慣,可以用于區(qū)分不同發(fā)音人。該方法已在德國(guó)聯(lián)邦調(diào)查局(BKA)的語(yǔ)音分析實(shí)驗(yàn)室得到廣泛應(yīng)用[5]。Jessen與 Becker[6]以及 Jessen[7]研究發(fā)現(xiàn),LTF方法有很多優(yōu)點(diǎn):分析高效省時(shí)、不同鑒定人員之間測(cè)量同一語(yǔ)料的一致性較高、LTF數(shù)值(如LTF2和LTF3的均值,另見[5])與發(fā)音人的身高呈負(fù)相關(guān)關(guān)系以及LTF數(shù)值在不同語(yǔ)言之間的差異性較小等。Becker等[8-9]還發(fā)現(xiàn),LTF的均值和帶寬參數(shù)可以應(yīng)用到說話人自動(dòng)識(shí)別系統(tǒng)中,并能有效地提高識(shí)別率。Moos[10-11]則對(duì)71位德語(yǔ)男性發(fā)音人的LTF分布進(jìn)行了測(cè)量分析,建立了一個(gè)較有價(jià)值的參考數(shù)據(jù)庫(kù),同時(shí)發(fā)現(xiàn)朗讀時(shí)的LTF數(shù)值要比自然說話時(shí)的稍高。
上述有關(guān)LTF方法的研究主要是針對(duì)英語(yǔ)和德語(yǔ)等語(yǔ)言的男性發(fā)音人展開的,迄今未見有關(guān)漢語(yǔ)的研究。本文將以漢語(yǔ)普通話為對(duì)象,介紹并分析LTF方法在聲紋鑒定中的應(yīng)用。
20位男性發(fā)音人,年齡在19~36歲之間(均值27.9,方差4.8),20位女性發(fā)音人,年齡在21~30歲之間(均值23.2,方差2.4),所有發(fā)音人均能說比較標(biāo)準(zhǔn)的普通話,錄音時(shí)身體健康,無(wú)嗓音疾病、感冒等癥狀。
錄音材料分為兩個(gè)部分,一部分是普通話的4個(gè)單元音[a]、[i]、[u]和[?],另一部分是長(zhǎng)篇語(yǔ)料《北風(fēng)和太陽(yáng)》。
在北京大學(xué)語(yǔ)言學(xué)專業(yè)錄音室中,使用SONY ECM-44B領(lǐng)夾式麥克風(fēng)錄音,采樣頻率為22kHz,精度為16位。在錄音過程中,首先讓發(fā)音人熟悉語(yǔ)料,并朗讀一遍,然后再使用正常的語(yǔ)速和音量將語(yǔ)料自然說出,盡量避免使用朗讀的方式。發(fā)單元音時(shí),要求發(fā)音人持續(xù)發(fā)音3s以上,兩部分錄音材料均錄制兩遍。
圖1 使用WaveSurfer軟件提取一段元音的共振峰。其中,自下往上的紅線、綠線、藍(lán)線和黃線分別表示F1、F2、F3和F4的數(shù)據(jù)
使用WaveSurfer[12]軟件進(jìn)行切音、提取共振峰數(shù)據(jù),提取過程見圖1。具體設(shè)置如下:哈明窗,LPC系數(shù):12,共振峰數(shù)量:4,截止采樣頻率:10kHz(其中,部分男聲采用8kHz,部分女聲采用11kHz)①視在何種設(shè)置下能夠?qū)⒋蟛糠衷舻腇1~F4自動(dòng)準(zhǔn)確地提取出來(lái)而定。由于一般情況下女性的聲道比男性的聲道短,共振峰頻率整體偏高,故在此處針對(duì)女聲的截止采樣頻率會(huì)高一些。。提取單元音的共振峰時(shí),選擇中間1~2s的穩(wěn)定段進(jìn)行測(cè)量,取兩次發(fā)音的平均值進(jìn)行分析。針對(duì)長(zhǎng)篇語(yǔ)料,選擇第二次錄音進(jìn)行分析,為了獲得清晰準(zhǔn)確的共振峰結(jié)構(gòu),筆者只對(duì)語(yǔ)料中共振峰結(jié)構(gòu)明顯的元音、邊音[l]、語(yǔ)流中間濁化的[x]等濁音進(jìn)行了分析,而將原始語(yǔ)料中的無(wú)聲段、呼吸聲、清輔音、鼻音以及共振峰結(jié)構(gòu)不明顯的元音部分剪切掉,保存為新的wav文件作為分析對(duì)象。語(yǔ)料剪切前后的時(shí)長(zhǎng)信息見表1。當(dāng)自動(dòng)提取的共振峰數(shù)據(jù)不正確時(shí),采用手動(dòng)調(diào)整加以修正。
表1 篇章《北風(fēng)和太陽(yáng)》剪切前后時(shí)長(zhǎng)對(duì)比
使用Matlab程序?qū)Ψ治龅玫降母鳁l共振峰(F1~F4)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,做出直方圖(分箱間隔為25Hz),并用Fourier 6階擬合函數(shù)進(jìn)行曲線擬合。
5位男性發(fā)音人和5位女性發(fā)音人的長(zhǎng)時(shí)共振峰分布情況見圖2。圖中的藍(lán)色部分是第1至4條共振峰(F1~F4)每個(gè)頻率段的累積直方圖,圖中從左至右的黃色、紅色、綠色和紫色4條曲線分別是對(duì)F1~F4直方圖中的頻數(shù)(達(dá)到一定頻率范圍的次數(shù))進(jìn)行擬合得到的曲線,該擬合曲線清晰地反映了各條共振峰的整體分布情況。由于語(yǔ)料中存在不同的元音,其共振峰結(jié)構(gòu)不同,擬合曲線之間存在重疊現(xiàn)象。每條共振峰分布曲線的峰值基本上代表了該共振峰分布的眾數(shù)(即出現(xiàn)次數(shù)最多的頻率段。例外情況見圖2中 M5和 Fe5的 LTF4)。
比較圖2中5位男性發(fā)音人(M1~M5)的數(shù)據(jù),可以發(fā)現(xiàn)他們LTF1-LTF4分布曲線的峰值均不相同。比如,M1 的 LTF3 峰值為 2437Hz(眾數(shù) 2475Hz),M3的LTF3峰值卻相對(duì)較高為2656Hz(眾數(shù) 2650Hz);M2的 LTF4峰值為 3517Hz(眾數(shù) 3525Hz),比 M4的LTF4 峰值(3817Hz,眾數(shù) 3800Hz)要低 300Hz。 同時(shí),各條曲線的形狀也有很大差異,有的出現(xiàn)單峰,有的出現(xiàn)雙峰或3個(gè)峰。比如,M1的LTF4表現(xiàn)為雙峰,而M4的LTF4則為單峰,M1的LTF2有3個(gè)強(qiáng)度(對(duì)應(yīng)的縱軸數(shù)值,即出現(xiàn)次數(shù))較低的峰,而M4的LTF2則有兩個(gè)比較強(qiáng)的尖峰。
整體而言,LTF1的分布范圍最小,也最為集中,均有比較突出的“尖峰”(leptokurtic)出現(xiàn);LTF2 的分布則較為分散,少有比較突出的“尖峰”出現(xiàn),常常表現(xiàn)出比較“扁平”(platykurtic)的特點(diǎn);LTF3 的分布范圍也比較大,但與LTF2不同,LTF3常常出現(xiàn)“尖峰”,強(qiáng)度常略小于LTF1;LTF4與 LTF3的情況比較類似。
不同人LTF分布的峰度(kurtosis)存在較大差異,當(dāng)某條共振峰的變化范圍較大時(shí),其LTF的分布形狀就比較扁平,相反,有些人的高次共振峰比較穩(wěn)定,變化較小,其分布形狀多會(huì)出現(xiàn)“尖峰”。從圖2中10位發(fā)音人的LTF分布可知,分布曲線接近對(duì)稱分布的較少(如Fe2的LTF3),多數(shù)都是非對(duì)稱性分布,其斜度(skewness)參數(shù)之間也有較大差異。當(dāng)LTF的峰值(眾數(shù))較大,高頻數(shù)據(jù)出現(xiàn)數(shù)量多于低頻數(shù)據(jù)時(shí),曲線往往向高頻方向傾斜(如M4的LTF4、Fe5的LTF3),相反,曲線就會(huì)偏向低頻方向 (如M4的LTF3、Fe4的LTF3)。圖2中男性、女性發(fā)音人LTF1-LTF4的分布情況類似。不同的是,相比之下,女性發(fā)音人LTF1-LTF4的峰值數(shù)據(jù)和分布范圍均有明顯的提高。這與女性發(fā)音人的聲道長(zhǎng)度一般比男性發(fā)音人的短,女聲的共振峰頻率更高等特點(diǎn)是相吻合的。
圖2 5位男性發(fā)音人(M1~M5)和5位女性發(fā)音人(Fe1~Fe5)的LTF1-LTF4分布(圖中的黃線、紅線、綠線和紫線分別表示F1、F2、F3和F4的長(zhǎng)時(shí)分布情況)
圖3 20位男性發(fā)音人(1~20)與20位女性發(fā)音人(21~40)LTF均值、中位數(shù)與眾數(shù)比較
圖3顯示的是40位發(fā)音人LTF分布數(shù)值的均值、中位數(shù)和眾數(shù)(如前文所述,該參數(shù)多數(shù)情況下與LTF擬合曲線的“峰值”相對(duì)應(yīng))。由于LTF1-LTF4均非對(duì)稱性分布,上述3個(gè)參數(shù)值并不重合,三者越接近,其對(duì)應(yīng)的LTF分布(或其中的一部分)就越接近對(duì)稱性分布,比較圖2中發(fā)音人Fe2、Fe3的LTF3分布情況與圖3中對(duì)應(yīng)女性發(fā)音人(22、23,黑色圓圈內(nèi))LTF3的3個(gè)參數(shù)的重合情況。整體觀察可知,圖3中LTF的均值和中位數(shù)比較接近(重合性較好),而眾數(shù)與前兩者的差異較大(重合性較差),這種差異性的存在正說明了不同發(fā)音人LTF分布的獨(dú)特性。
圖4顯示的是兩位男性發(fā)音人兩次說長(zhǎng)篇語(yǔ)料的LTF分布情況。很明顯,在M13的兩次發(fā)音中,F(xiàn)3和F4比較穩(wěn)定,對(duì)應(yīng)LTF3和LTF4均出現(xiàn)單個(gè)比較突出的“尖峰”,而M11的LTF3和LTF4的變化范圍則更大一些,在曲線形狀上也一致表現(xiàn)的比較“扁平”,出現(xiàn)多個(gè)不太突出的 “小峰”。兩人兩次發(fā)音LTF1-LTF4的均值、中位數(shù)、眾數(shù)和標(biāo)準(zhǔn)差見表2。由圖4和表2可以看出,同一人相同狀態(tài)下發(fā)音的LTF分布變化較小,較為接近。
圖4 兩位男性發(fā)音人兩次發(fā)音的LTF分布情況
表2 兩位男性發(fā)音人兩次發(fā)音LTF1-LTF4的均值(m1)、中位數(shù)(m2)、眾數(shù)(m3)和標(biāo)準(zhǔn)差(sd)
顧名思義,長(zhǎng)時(shí)共振峰分布是對(duì)一段語(yǔ)料中全部元音的各條共振峰(F1~F4)的所有數(shù)值分別進(jìn)行平均,查看其整體的分布情況。從圖3顯示的結(jié)果來(lái)看,發(fā)音人LTF1-LTF4相鄰共振峰之間的距離比較平均,如20位男性發(fā)音人LTF1-LTF4均值參數(shù)的平均值分別為 524Hz、1436 Hz、2523 Hz及 3600 Hz, 與成年男性理想狀態(tài)下簡(jiǎn)單均勻聲管模型的央元音的共振峰結(jié)構(gòu)相似(第n條共振峰的頻率為500*(2n-1)Hz,參考[13])。圖5比較了20位男性發(fā)音人的LTF均值、中位數(shù)和眾數(shù)3個(gè)參數(shù)的平均值在聲學(xué)元音圖中的位置,可以看出,LTF1-LTF2的均值、中位數(shù)和眾數(shù)均位于元音三角形內(nèi)部,分布在比較中間的位置,與央元音[?]比較接近,與[?]的 F1 和 F2 相比,LTF1 稍低,LTF2稍高。眾所周知,不同元音的共振峰結(jié)構(gòu)不同,發(fā)元音[i]時(shí),前腔面積小、后腔面積大,[i]的F1最低、F2最高,發(fā)元音[a]時(shí),前腔面積大、后腔面積小,[a]的F1與F2最為接近。在連續(xù)語(yǔ)流中,如果時(shí)長(zhǎng)足夠長(zhǎng),語(yǔ)料中出現(xiàn)大量的單元音、復(fù)元音時(shí)(不同元音的出現(xiàn)概率相近),盡管有的元音能夠達(dá)到其目標(biāo)值,有的不能,但總體平均后的結(jié)果都應(yīng)該是一個(gè)類似央元音的“音”,其前腔、后腔的面積相當(dāng),聲道形狀應(yīng)該與自然狀態(tài)下發(fā)[?]時(shí)的聲道形狀類似。
圖5 LTF在聲學(xué)元音圖中的位置(基于20位男性發(fā)音人的平均數(shù)據(jù))
在聲紋鑒定中,任何長(zhǎng)時(shí)特征的利用,都有幾個(gè)共同的問題需要加以明確,LTF方法也不例外。第一,要合理利用該特征,最少需要多長(zhǎng)的語(yǔ)料?Catalina推薦的時(shí)長(zhǎng)標(biāo)準(zhǔn)是不少于10s[14],需要注意的是,Catalina提到的時(shí)長(zhǎng)是原始語(yǔ)料的長(zhǎng)度,其中包含了輔音等非元音的成分。Moos研究認(rèn)為,根據(jù)共振峰和說話狀態(tài)的不同,對(duì)于只包含元音的語(yǔ)料,比較合理的時(shí)長(zhǎng)下限是5~8s左右,作者同時(shí)還強(qiáng)調(diào),在不同人之間,該標(biāo)準(zhǔn)會(huì)發(fā)生變化[10]。盡管本文語(yǔ)料的長(zhǎng)度在9~18s左右(見表1),能夠滿足Moos的標(biāo)準(zhǔn)要求,但鑒于兩項(xiàng)研究的語(yǔ)種不同,應(yīng)該對(duì)基于漢語(yǔ)普通話的時(shí)長(zhǎng)標(biāo)準(zhǔn)做進(jìn)一步的分析。第二,是否與文本內(nèi)容有關(guān)?本文與Moos研究的朗讀語(yǔ)料(德語(yǔ))均為《北風(fēng)和太陽(yáng)》的寓言故事,內(nèi)容都是固定的(與文本有關(guān))。盡管Nolan與Grigoras在提出LTF方法的時(shí)候,曾將案件的樣本語(yǔ)音拆分成兩部分(將樣本K分為兩半:K1與K2)進(jìn)行分析[4],發(fā)現(xiàn)原始樣本與拆分后的前后兩部分的LTF1-LTF4有很好的一致性,但作者并未交代前后兩部分的內(nèi)容是否一致,即使不一致,也只有單個(gè)人的數(shù)據(jù),若要增加可信度,則需要進(jìn)行更多發(fā)音人的測(cè)試。可以設(shè)想當(dāng)一段語(yǔ)料足夠長(zhǎng),其中出現(xiàn)各個(gè)元音的概率相當(dāng)時(shí)(與文本無(wú)關(guān)),LTF分布應(yīng)該會(huì)趨于穩(wěn)定,當(dāng)然這還需要作進(jìn)一步的研究。第三,是否與語(yǔ)言/方言有關(guān)?LTF分布主要反映了發(fā)音人聲道的整體共鳴特性,如果語(yǔ)料足夠長(zhǎng),同一人說不同語(yǔ)言/方言時(shí),由于其LTF反映的是同一人的整體聲道特性,這些被體現(xiàn)出來(lái)的聲道特性之間的差異性應(yīng)該不大。當(dāng)然,不同語(yǔ)言/方言之間音系結(jié)構(gòu)上的差別有可能會(huì)成為較大的影響因素。如果LTF在不同語(yǔ)言/方言之間的差異性足夠小的話,那么由一種語(yǔ)言/方言得到的LTF數(shù)據(jù)便可以推廣利用到另外一種語(yǔ)言/方言中去,這便為實(shí)踐中不同語(yǔ)言之間、方言與普通話之間的語(yǔ)音比對(duì)提供了新的途徑。Jessen與Becker[6]的研究已經(jīng)發(fā)現(xiàn),LTF在德語(yǔ)、俄語(yǔ)和阿爾巴尼亞語(yǔ)之間的差異性較小。有必要針對(duì)漢語(yǔ)普通話與方言及其他語(yǔ)言之間LTF的差異性展開進(jìn)一步的研究。
在實(shí)際辦案中大多數(shù)案件語(yǔ)料都是電話 (或手機(jī))錄音,由于電話信道的帶寬限制(300~3400Hz左右),多數(shù)情況下只能顯示前3條共振峰(在錄音質(zhì)量較差的情況下,有時(shí)只能顯示兩條共振峰)。從圖2-圖4中也能看出多數(shù)F4的數(shù)值超過此范圍,不能或不能完全顯示出來(lái)(可以導(dǎo)致F4的提取不準(zhǔn)確),因此,實(shí)踐中可以測(cè)量前3條共振峰的長(zhǎng)時(shí)分布特征 (LTF1-LTF3)。但是對(duì)于一些由性能較好的錄音設(shè)備(如安全機(jī)關(guān)使用的部分專業(yè)監(jiān)聽設(shè)備或部分民事案件中當(dāng)事人使用的錄音筆)錄制的采樣頻率較高的語(yǔ)料,可以測(cè)量到LTF4。當(dāng)然該方法也可以用來(lái)進(jìn)行普通語(yǔ)音學(xué)的研究,測(cè)量的共振峰數(shù)量可視研究目的而定。
由于F3、F4高次共振峰的穩(wěn)定性最強(qiáng),個(gè)體差異性最大,在鑒定中更有價(jià)值,因此LTF3與LTF4的數(shù)值及分布特征應(yīng)該能更好地體現(xiàn)發(fā)音人之間的個(gè)性差異。至于哪條共振峰分布特征的價(jià)值更高,則需要進(jìn)行更深入的研究。當(dāng)然,在鑒定中比較明智的做法是對(duì)LTF1-LTF3/4進(jìn)行綜合分析,而不是只看某條共振峰的分布特征。
如上文所述,使用LTF方法的前提是被研究語(yǔ)料的錄音質(zhì)量較好,能夠反映出比較清晰的共振峰結(jié)構(gòu),在此基礎(chǔ)上對(duì)各條共振峰的分布進(jìn)行統(tǒng)計(jì)分析,才能夠顯示出共振峰整體分布的情況。由此得到的LTF分布不僅在峰數(shù)和形狀(峰度、斜度)上能夠較好地體現(xiàn)出發(fā)音人的個(gè)性特征,而且還能提供各條共振峰整體分布的多維數(shù)據(jù),如均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差等,這些數(shù)據(jù)為研究發(fā)音人的聲道特性提供了新的素材。正如Jessen對(duì)該方法的評(píng)價(jià):“此方法的優(yōu)點(diǎn)是使用相對(duì)高效省時(shí),適用范圍廣,甚至連鑒定專家自己都不會(huì)講的語(yǔ)言都能夠適用(因?yàn)樵摲椒o(wú)需對(duì)元音的音系范疇進(jìn)行辨別和切分,僅需要具備較好的普通聲學(xué)語(yǔ)音學(xué)的知識(shí)即可);缺點(diǎn)是,由于該方法集中了所有的元音信息,與分析單個(gè)元音相比,對(duì)結(jié)果進(jìn)行解釋變得更加困難。對(duì)不同的元音進(jìn)行集中分析,很可能會(huì)忽略一些更有價(jià)值的個(gè)性特征。[7]”的確如此,由于LTF只是一個(gè)靜態(tài)特征,因此在聲紋鑒定中不應(yīng)該單獨(dú)使用它,而是要結(jié)合其他特征進(jìn)行綜合分析,特別是要與單元音的共振峰頻率、音節(jié)內(nèi)及音節(jié)間共振峰的動(dòng)態(tài)特征結(jié)合起來(lái)一起使用。
本文對(duì)20位男性發(fā)音人和20位女性發(fā)音人的普通話語(yǔ)料進(jìn)行了研究,通過對(duì)其元音部分共振峰頻率的統(tǒng)計(jì)分析,得出了第1至4條共振峰(F1-F4)的長(zhǎng)時(shí)分布情況(LTF1-LTF4),發(fā)現(xiàn)相比男性發(fā)音人而言,女性發(fā)音人的LTF數(shù)據(jù)和分布范圍均有明顯的提高,這與女性發(fā)音人的聲道長(zhǎng)度較短、共振峰頻率較高等特征是相吻合的。利用LTF分布的均值、中位數(shù)、眾數(shù)(相當(dāng)于峰值)、峰數(shù)和形狀(峰度和斜度)等參數(shù)可以較好地區(qū)分不同發(fā)音人。
通過比較LTF均值分布與央元音[?]的共振峰的關(guān)系發(fā)現(xiàn),相鄰LTF均值分布之間的距離比較平均,LTF1-LTF4均值的整體分布結(jié)構(gòu)與央元音的共振峰結(jié)構(gòu)類似。由此可以推測(cè),在連續(xù)語(yǔ)流中,如果語(yǔ)料的時(shí)長(zhǎng)足夠長(zhǎng),其所有元音平均后的結(jié)果都應(yīng)該是一個(gè)類似央元音的“音”。
盡管LTF方法可以用來(lái)區(qū)分個(gè)人,但不可否認(rèn)的是,LTF分布只是一個(gè)靜態(tài)參數(shù),鑒定中不宜單獨(dú)使用,而應(yīng)該與其他動(dòng)態(tài)特征結(jié)合起來(lái)做綜合分析。本文僅對(duì)LTF分布特征做了概括性的介紹,今后有必要對(duì)LTF分布特征與時(shí)長(zhǎng)、文本內(nèi)容及語(yǔ)言的關(guān)系等問題進(jìn)行進(jìn)一步的探討。
致謝
感謝Michael Jessen對(duì)LTF方法在BKA實(shí)驗(yàn)室中使用情況的介紹,感謝王英利、李英浩、董理對(duì)本文初稿提出的很有價(jià)值的修改意見。
[1]McDougall K.Speaker-specific formant dynamics:an experiment on Australian English/ai/[J].International Journal of Speech, Language and the Law, 2004,11(1):103-130.
[2]McDougall K.Dynamic features of speech and the characterization of speakers:towards a new approach using formant frequencies[J].International Journal of Speech,Language and the Law, 2006, 13(1): 89-126.
[3]李敬陽(yáng),王莉,崔杰,等.發(fā)音人漢語(yǔ)普通話復(fù)合元音共振峰動(dòng)態(tài)特征分析[A].第一屆全國(guó)聲像資料檢驗(yàn)鑒定技術(shù)交流會(huì)論文選[C].北京:中國(guó)人民公安大學(xué)出版社,2011:612-615.
[4]Nolan F,Grigoras C.A case for formant analysis in forensic speaker identification[J].International Journal of Speech,Language and the Law, 2005,12(2):143-173.
[5]Jessen M.The forensic phonetician forensic speaker identification by experts.In: Coulthard M, Johnson A.(eds)[M].The RoutledgeHandbook of Forensic Linguistics, 2010:378-394.
[6]Jessen M,Becker T.Long-term formant distribution as a forensic-phonetic feature[J].The Journal of the Acoustical Society of America, 2010,(128):2378.
[7]Jessen M.法庭語(yǔ)音學(xué)[J].曹洪林,王英利.譯.證據(jù)科學(xué),2010,(6):712-738.
[8]Becker T,Jessen M,Grigoras C.Forensic Speaker Verification Using Formant Features and Gaussian Mixture Models[M].In proceeding of Interspeech, Brisbane, 2008:1505-1508.
[9]Becker T,Jessen M,Grigoras C.Speaker Verification Based on Formants Using Gaussian Mixture Models[C].In proceeding of NAG/DAGA International Conference on Acoustics,Rotterdam,2009.
[10]Moos A.Long-Term Formant Distribution (LTF) based on German spontaneous and read speech[C].In proceeding of IAFPA, Lausanne, 2008:5-6.
[11]Moos A.Forensische Sprechererkennung mit der Messmethode LTF (long-term formant distribution)[D].MA thesis,Universit?t des Saarlandes.2008.
[12]The WaveSurfer software[CP].http://www.speech.kth.se/wavesurfer/,2007-11-20/2011-12-31.
[13]Ladefoged, P.Elements of Acoustic Phonetics, 2nd ed[M].Chicago: University of Chicago Press, 1996.
[14]Catalina Forensic Audio Toolbox[K].http://www.forensicav.ro/download/CatalinaManual3h.pdf,2007-11-20/2011-12-31.