彭去桀, 張智勇, 駱建新, 張 帥
(1.中國人民公安大學(xué)刑事科學(xué)技術(shù)學(xué)院, 北京 100038; 2. 常德市澧縣公安局, 湖南澧縣 415500;3.鄭州市公安局犯罪偵查局, 河南鄭州 450000)
語音檢材自動比對樣本召回率初探
彭去桀1,2, 張智勇3, 駱建新3, 張 帥3
(1.中國人民公安大學(xué)刑事科學(xué)技術(shù)學(xué)院, 北京 100038; 2. 常德市澧縣公安局, 湖南澧縣 415500;3.鄭州市公安局犯罪偵查局, 河南鄭州 450000)
使用高質(zhì)量聲紋采集終端采集10名自然人的方言和普通話樣本并存入聲紋樣本庫,使用不同的錄音方式錄制多種方言的檢材,在現(xiàn)有聲紋庫中對每個檢材建立自動比對任務(wù),考察聲紋檢材的目標(biāo)召回率。通過實驗總結(jié)出:一般案件中涉及到的手機錄制的語音證據(jù),可以使用聲紋庫綜合應(yīng)用平臺服務(wù)于案件偵辦工作或者作為串并案的依據(jù);文本相同與否對比對結(jié)果有些微影響,相同文本的檢材和樣本之間相似度更大;同一人說的同一種語言能夠準(zhǔn)確召回?;谶`法犯罪人員聲紋庫進(jìn)行語音檢材自動比對實驗是對聲紋庫應(yīng)用的積極探索,旨在總結(jié)一些應(yīng)用技巧以服務(wù)于實戰(zhàn)、并為聲紋庫的建設(shè)和應(yīng)用提供有益的參考。
聲紋庫; 目標(biāo)召回率; 聲紋自動檢索比對; 電信詐騙
近年來,隨著電信網(wǎng)絡(luò)、互聯(lián)網(wǎng)語音的飛速發(fā)展,電信詐騙、綁架、敲詐勒索等涉及語音案件的數(shù)量及案件中的語音物證也在不斷增加。我國的聲紋技術(shù)經(jīng)過20年的發(fā)展,在語音同一認(rèn)定方面已積累了大量專家資源和工作經(jīng)驗。在網(wǎng)絡(luò)、通信、信息融合技術(shù)快速發(fā)展的今天,聲紋技術(shù)必須與信息化技術(shù)相融合,必須由個案和局部走向總體和全局才能夠適應(yīng)實戰(zhàn)的需求。聲紋數(shù)據(jù)庫的建立,能夠在有效支撐打擊犯罪的同時,拓展我國聲紋技術(shù)整體水平和應(yīng)用能力,是我國聲紋技術(shù)新時期發(fā)展的必然選擇。聲紋庫是繼指紋、DNA庫后又一個生物特征庫,將為案件偵破提供一種新的技術(shù)手段,為各警種提供一套新的個體識別應(yīng)用平臺。通過預(yù)先建立的重點人員聲紋庫和應(yīng)用基于智能語音技術(shù)的語音監(jiān)控系統(tǒng)能快速確認(rèn)說話人身份、語種和方言口音以及檢測通話中的敏感內(nèi)容,在反恐、維穩(wěn)以及打擊刑事犯罪工作中具有非常重要的意義。
(1) 全國聲紋庫建設(shè)和應(yīng)用現(xiàn)狀
近幾年,我國逐步啟動聲紋數(shù)據(jù)庫相關(guān)的研究和建設(shè)工作,智能語音技術(shù)公安部重點實驗室針對智能語音技術(shù)在公安領(lǐng)域的實戰(zhàn)應(yīng)用,重點在聲紋識別、語種識別、語音內(nèi)容識別、語音信號處理技術(shù)4個方向開展研究。2011年5月,智能語音技術(shù)公安部重點實驗室已經(jīng)完成了聲紋數(shù)據(jù)庫建設(shè)的技術(shù)儲備工作,建立了聲紋庫標(biāo)準(zhǔn)體系,完成了高質(zhì)量聲紋專用采集工具的研發(fā),提高了聲紋檢索引擎的性能[1]。
目前,北京市、安徽省、福建省、河南省、山東省、江蘇省等地公安機關(guān)建立了重點人員或者違法犯罪人員聲紋庫,工作重心在于擴大樣本采集、迅速增加聲紋庫存量,部分地區(qū)將聲紋庫與傳統(tǒng)的聲紋鑒定技術(shù)結(jié)合起來摸索前進(jìn),邊建設(shè)、邊應(yīng)用。
(2) 語音檢材自動比對研究現(xiàn)狀
語音檢材自動比對實質(zhì)上是在一定聲紋庫庫存的情況下系統(tǒng)對說話人的識別、對可疑目標(biāo)進(jìn)行同一認(rèn)定打分排序的結(jié)果。
語音自動比對技術(shù)在歐美等西方國家深受重視,如美國國家標(biāo)準(zhǔn)技術(shù)署(NIST)舉辦的說話人識別評測,就是針對實際應(yīng)用需求設(shè)計多樣化的測試,這些測試能夠準(zhǔn)確體現(xiàn)被測系統(tǒng)在接近真實環(huán)境中的實際表現(xiàn),被公認(rèn)為是國際上水平最高、最嚴(yán)謹(jǐn)、最公平、結(jié)果最權(quán)威的說話人語音識別系統(tǒng)測試。而受邀參加該評測的都是世界頂級專業(yè)研究開發(fā)機構(gòu),包括美國麻省理工大學(xué)、意大利都靈理工大學(xué)、法國科學(xué)研究中心等等。最近幾年,我國清華大學(xué)、中國科學(xué)院聲學(xué)研究所、科大訊飛語音實驗室也參加了測試。根據(jù)2008、2010年美國國家標(biāo)準(zhǔn)技術(shù)署(NIST)舉辦的說話人識別評測結(jié)果,以科大訊飛公司為代表的我國聲紋自動識別技術(shù)已經(jīng)達(dá)到國際領(lǐng)先水平[1]。
然而,語音檢材無論是在實驗室環(huán)境設(shè)立的小型聲紋庫中準(zhǔn)確自動比對成功,還是各種模擬實際情況、高水平的國際評測中準(zhǔn)確召回,都只能說明我國完全擁有了這項技術(shù)。目前,公安實戰(zhàn)中語音檢材的自動比對研究十分稀少。原因諸多,主要有以下幾點:當(dāng)前語音為關(guān)鍵證據(jù)的案件在案件總體中比較少,而這些少數(shù)案件依靠傳統(tǒng)的專家鑒定就能消化;而大量涉及語音的電信詐騙等案件,犯罪地域遍及全國,公安機關(guān)獲取到的語音檢材比較少、質(zhì)量差;另外,使得聲紋自動比對有用武之地的聲紋數(shù)據(jù)庫還在建設(shè),庫存量正在累積中,而各地的聲紋庫建設(shè)進(jìn)度參差不齊。
(3) 鄭州市公安局聲紋庫建設(shè)情況和應(yīng)用
鄭州市公安局于2013年底參與了國家公安部金盾二期的聲紋庫建設(shè),在全市所有執(zhí)法辦案中心及執(zhí)法辦案區(qū)安裝了99套聲紋采集終端,按照“打一建一”的原則采集違法犯罪人員聲紋信息,并在聲紋采集規(guī)范化方面國內(nèi)首創(chuàng)了閱讀樣本提示牌。通過近3年的收集,鄭州市公安局的聲紋采集量已達(dá)到44 474條(截止到2016年12月19日,且包括少量檢材)。目前,鄭州市公安局違法犯罪人員聲紋庫庫存聲紋樣本數(shù)據(jù)分別從方言和年齡兩個角度進(jìn)行分類分析。
按方言分類。鄭州市是河南省省會,這里的居民大多使用鄭州市本地方言,鄭州方言和普通話均屬北方方言,占樣本庫總數(shù)的67.6%;隨著經(jīng)濟(jì)發(fā)展、交通便利,違法犯罪人員的流動性也隨之加大,比如湘方言、吳方言、贛方言、客家話、閩南語和粵語等均有涉及;另外,工作人員在錄入樣本時忽略或者存在沒有對方言種類進(jìn)行主觀判斷的情況,系統(tǒng)中“未知”項達(dá)到了31%。
圖1 按方言分類聲紋庫樣本
按照年齡來分類。樣本庫里20~50歲之間的人最多,其他年齡段均有涉及,且“未知”年齡的人是極其少量的個別現(xiàn)象。
圖2 按年齡分類聲紋庫樣本
1.1 聲紋檢索比對系統(tǒng)
聲紋檢索比對系統(tǒng)是在聲紋數(shù)據(jù)存儲系統(tǒng)的基礎(chǔ)上實現(xiàn)在海量聲紋數(shù)據(jù)庫中的聲紋排查等功能。聲紋檢索比對系統(tǒng)是聲紋庫的一個重要應(yīng)用,其功能是對于任意給定的一個可疑的錄音數(shù)據(jù),該系統(tǒng)通過聲紋識別技術(shù)并結(jié)合聲紋鑒定,實現(xiàn)從聲紋庫中檢索出與可疑錄音聲紋最為相近的候選人名單以及各自的聲紋相似程度,并將結(jié)果展現(xiàn)給用戶,縮小人工鑒別的范圍。
1.2 聲紋檢索比對機制介紹
聲紋檢索比對功能是基于聲紋自動識別(也稱語音信號處理法),其基本原理是由系統(tǒng)對說話人語音的特征參數(shù)進(jìn)行分離提取,并進(jìn)行線性或非線性處理,建立語音模型,然后由系統(tǒng)運算進(jìn)行模式匹配,確定出與其最接近的若干已知說話人錄音,得出相似度的結(jié)果,其結(jié)果是多選的(見圖3)。
圖3 聲紋數(shù)據(jù)自動化檢索比對機制
聲紋檢索自動比對功能的實現(xiàn)及其可靠性取決于聲紋模型的建立和聲紋檢索引擎技術(shù)。本實驗聲紋庫技術(shù)是來源于科大訊飛公司基于聯(lián)合因子分析技術(shù)框架[7]開發(fā)的,該公司前后研發(fā)了基于高階泰勒展開的噪聲估計[8]、基于正反例的敏感區(qū)域得分規(guī)整算法、基于多通道錄音的穩(wěn)定聲紋提取、以及基于語音識別結(jié)果的文本相關(guān)聲紋比對等各項核心技術(shù)。該公司設(shè)計的最終聲紋檢索引擎順利通過了公安部物證鑒定中心2011年5月組織的基于100起真實案例的聲紋識別模擬實戰(zhàn)測試,達(dá)到了實用水平。
2.1 實驗?zāi)康?/p>
本實驗考察的主要是不同信道、不同方言在當(dāng)前聲紋庫中的目標(biāo)召回率,旨在為聲紋庫的建設(shè)和具體應(yīng)用提供有益的參考。
2.2 實驗設(shè)計
2.2.1 聲紋檢索的目標(biāo)召回率釋義及影響因素
聲紋檢索的目標(biāo)召回率是指在自然人聲紋的聲紋庫中30S以上有效語音檢材,聲紋檢索引擎所給出的前100候選中,包含真正目標(biāo)人的樣本出現(xiàn)在候選中的內(nèi)容幾率。聲紋檢索的目標(biāo)召回率在實際應(yīng)用中與文本、聲紋相似性、信道和庫容4個方面相關(guān)。
2.2.2 實驗設(shè)計
實驗所依托的鄭州市公安局違法犯罪人員聲紋數(shù)據(jù)庫樣本量已達(dá)到44 474條,且每周以平均1 000條的速度在累積增加。此庫容量下使用智能語音技術(shù)公安部重點實驗室專門研發(fā)的高質(zhì)量聲紋采集終端采集違法犯罪人員聲紋樣本,該聲紋采集終端可以同時生成包括電信CDMA、固定電話、手機GSM、聯(lián)通WCDMA、高保真、錄音筆、移動TD-SDMA和其他在內(nèi)的8個信道的聲音樣本并上傳存儲在樣本庫中。
實驗擬使用該終端采集10名自然人(A-J)的聲音生成21個聲紋樣本,并同時注冊上傳至鄭州市公安局違法犯罪人員聲紋數(shù)據(jù)庫,具體采樣設(shè)計如表1。
表1 實驗用樣本采集計劃表
實驗1:考察檢材和樣本是同文本的情況下,同一人同一信道分別使用方言和普通話作為檢材入庫比對的情況。
實驗2:考察檢材和樣本是同文本的情況下,同一人不同信道分別使用方言和普通話作為檢材入庫比對的情況。
實驗3:考察檢材和樣本是不同文本的情況下,同一人不同信道分別用方言和普通話作為檢材入庫比對的情況。
實驗4:考察檢材和樣本是不同文本的情況下,同一人偽裝聲音后使用方言作為檢材入庫比對的情況。
實驗5:考察檢材和樣本是不同文本的情況下,同一人在不同環(huán)境下記錄聲音作為檢材入庫比對的情況。
實驗6:考察檢材和樣本是不同文本的情況下,多人分別用方言和普通話作為檢材入庫比對的情況。
根據(jù)以上實驗設(shè)計,分別使用錄音筆和手機采集10名自然人(A-J)的聲紋檢材共49個上傳至聲紋檢索比對系統(tǒng)各自執(zhí)行比對任務(wù),檢材采集計劃如表2。
表2 實驗用檢材采集計劃表
2.3 實驗結(jié)果
實驗1:同文本手機錄音檢材召回實驗
實驗對象檢材錄音工具是否處理處理手段檢材內(nèi)容實驗結(jié)果是否排名前100比中樣本得分排名A手機否無鄭州方言是鄭州方言74 051是鄭州方言73 622是普通話73 283手機否無普通話是鄭州方言77 231是普通話76 292
實驗2:同文本手機、錄音筆兩種信道檢材召回實驗
實驗對象檢材錄音工具是否處理處理手段檢材內(nèi)容實驗結(jié)果是否排名前100比中樣本得分排名A手機否無鄭州方言是鄭州方言73 672是鄭州方言72 33是普通話71 84手機否無普通話是普通話78 861是鄭州方言74 873C手機否無湖南常德方言是湖南常德方言75 271是普通話61 1915A錄音筆否無鄭州方言否錄音筆否無普通話否錄音筆是降采樣鄭州方言否錄音筆是降采樣普通話否錄音筆否降采樣、降噪、語音增益鄭州方言是鄭州方言73 051是鄭州方言71 962是普通話70 074錄音筆否降采樣、降噪、語音增益普通話是普通話72 631是鄭州方言71 242
實驗3:不同文本、不同信道檢材召回實驗
實驗對象檢材錄音工具是否處理處理手段檢材內(nèi)容實驗結(jié)果是否排名前100比中樣本得分排名B手機否無河南安陽林州是林州方言63 521是普通話57 735錄音筆否無河南安陽林州是普通話61 5916是林州方言61 4518錄音筆是降采樣、降噪、語音增益河南安陽林州是林州方言63 13是普通話59 7314C手機否無湖南常德方言是常德方言64 099是普通話63 3912手機否無普通話是普通話70 971否常德方言錄音筆否無湖南常德方言是常德方言65 919是普通話64 3518錄音筆否無普通話是普通話62 6257否常德方言錄音筆是降采樣、降噪、語音增益湖南常德方言是常德方言65 827是普通話64 5315錄音筆是降采樣、降噪、語音增益普通話是普通話62 1955否常德方言
現(xiàn)象:此次實驗中實驗對象C的手機和錄音筆錄入的同一人普通話檢材均未召回C的方言樣本,但在未召回的3次比對任務(wù)中前100名候選均在60分以上。
分析:考慮庫中與實驗對象C聲紋特征模型相近的人比較多,且實驗對象C 所說的湖南常德方言也屬于北方方言,并與普通話區(qū)別不大。
實驗4:不同文本同一人偽裝前后檢材召回實驗
實驗對象檢材錄音工具是否偽裝偽裝手段檢材內(nèi)容實驗結(jié)果是否排名前100比中樣本得分排名A手機是手捂喉嚨鄭州方言是普通話71 021是普通話67 816~8是鄭州方言64 8726手機是手捏緊喉嚨鄭州方言否
實驗5:不同文本同一人不同環(huán)境下檢材召回實驗
實驗對象檢材錄音工具環(huán)境是否處理處理手段檢材內(nèi)容實驗結(jié)果是否排名前比中樣本得分排名A手機,微信語音實驗室否無普通話是普通話74 111是普通話72 912~5是鄭州方言71 296手機,微信語音實驗室否無鄭州方言是鄭州方言70 771是普通話70 152手機,微信語音辦公室否無鄭州方言是鄭州方言68 143是鄭州方言68 054是鄭州方言66 288是普通話65 2921~23是普通話65 5317手機,微信語音大街上否無鄭州方言是鄭州方言65 251是鄭州方言62 556是鄭州方言61 4411手機,微信語音大街上是降噪50%、語音增益2點鄭州方言是鄭州方言65 021手機,微信語音大街上是降噪20%、語音增益2點鄭州方言是鄭州方言66 331是鄭州方言61 4412是鄭州方言59 8124手機,微信語音大街上是委托科大訊飛公司處理鄭州方言是鄭州方言65 082是鄭州方言63 275是鄭州方言61 878
實驗6:不同文本多人方言、普通話檢材召回實驗
實驗對象檢材錄音工具是否處理處理手段檢材內(nèi)容實驗結(jié)果是否排名前100比中樣本得分排名D手機通話錄音否無浙江湖州方是湖州方言701普通話69 722手機通話錄音否無普通話是普通話78 851湖州方言65 125E手機否無藏語是藏語74 471普通話63 3519手機否無普通話是普通話74 311藏語62 3334F手機否無福建蒲田方言是蒲田方言73 871普通話63 593手機否無普通話是普通話76 341蒲田方言62 5910G手機否無維語是維語74 641否普通話手機否無普通話是普通話75 191否維語H手機否無陜西咸陽方言是咸陽方言76 061是普通話71 712是英語56 7337手機否無普通話是普通話77 071是咸陽方言72 752是英語61 8217手機否無英語是英語79 81是咸陽方言62 272是普通話61 853I手機否無客家話是客家話77 451是普通話75 812手機否無普通話是普通話82 591是客家話80 682J手機否無廣東省粵語是粵語83 421是普通話59 762手機否無廣東省粵語是粵語83 421是粵語70 052
現(xiàn)象:實驗對象G的維語檢材未能召回G的普通話樣本、G的普通話檢材未能召回G的維語樣本。
分析:觀察不同語種和方言的比對結(jié)果,發(fā)現(xiàn)方言(語種)與普通話的差異越大,樣本庫中同一人的兩種樣本在召回時排名差距越大(維語>英語>藏語>莆田方言>一般方言),說明同一人在說不同語言時整體改變程度不同從而影響模型的生成??紤]比對結(jié)果與樣本庫中某語種(或者某方言)的庫存量有關(guān),相似或相同的方言樣本越少,檢材比對時越容易“脫穎而出”。
3.1 結(jié)論
(1) 在檢材和樣本為同一文本的情況下,手機錄音作為檢材對目標(biāo)的召回率是100%,且排名均在前50,得分均在60分以上;錄音筆錄音檢材一般情況下直接入庫比對效果有待商榷,經(jīng)過降采樣、降噪、語音增益的處理后的檢材能夠達(dá)到100%的召回率,且排名均在前50 ,得分均在60分以上。
(2) 檢材和樣本文本不同的情況下,普通話檢材能準(zhǔn)確召回普通話樣本、方言檢材能準(zhǔn)確召回方言樣本。手機檢材的比對結(jié)果要比錄音筆檢材的比對結(jié)果普遍靠前,且經(jīng)過降采樣、降噪、語音增益處理后的錄音筆檢材要比沒有處理過的錄音筆檢材排名靠前。
(3) 檢材和樣本是不同文本的情況下,同一人偽裝聲音后使用方言作為檢材入庫比對的情況是不可預(yù)測的,這與偽裝手段有關(guān)系,不同的偽裝手段對檢材生成模型的影響不同。
(4) 檢材和樣本是不同文本的情況下,手機微信語音檢材能夠準(zhǔn)確召回普通話和方言兩種樣本,且排名在前50,得分均在60分以上,說明微信語音算法疊加在手機信道上對比對結(jié)果的影響不大。噪音比較大的環(huán)境下錄制的手機微信方言語音檢材對同一實驗對象的普通話樣本難以召回,且比相對安靜環(huán)境下錄制的檢材的得分更低,排名也更靠后。對噪音較大的檢材使用不同的噪音處理方法處理后入庫比對,會得到不同的比對結(jié)果(得分和排名均會發(fā)生改變)。
(5) 一般來說,方言和語種在檢材和樣本文本不同的情況下,均能準(zhǔn)確召回樣本庫里的兩種或兩種以上同一人注冊的樣本。同一人所說同一種語言的目標(biāo)召回率是100%,且排名均在第一。
綜上所述,本文通過實驗得出在當(dāng)前聲紋庫規(guī)模下可以逐步開展服務(wù)于實戰(zhàn)的檢材聲紋自動檢索比對,并能較好地縮小偵查范圍,極大地減少專家鑒別犯罪嫌疑人的工作量。實驗中手機錄音的目標(biāo)召回率達(dá)到86.8%,錄音筆錄音的目標(biāo)召回率為58.3%,錄音筆錄入語音文件最好是處理之后再入庫檢索。這意味著一般案件中涉及到的語音證據(jù)均可使用聲紋庫綜合應(yīng)用平臺服務(wù)于案件偵辦工作或者作為串并案的依據(jù)。文本相同與否對比對結(jié)果有些微影響,相同文本的檢材和樣本之間相似度更大。
3.2 存在的問題及建議
目前,鄭州市公安局違法犯罪嫌疑人員聲紋庫的儲存量在低于5萬時自動檢索比對的速度還是比較快的,比對任務(wù)通過審核后30秒內(nèi)出結(jié)果。但隨著庫容上升,比對速度可能會隨之下降,建議開設(shè)專題子庫,辦案時選擇相應(yīng)子庫做初次比對篩選,縮小比對基數(shù),加速比對工作。另外,自動檢索比對速度與后臺聲紋庫存儲服務(wù)器、電腦配置等硬件以及公安內(nèi)網(wǎng)網(wǎng)速也有關(guān)系。
在庫容量不大的情況下,相似的聲紋模型較少;庫容量上升,相似模型也會隨之增多。此次實驗中湖南常德人的普通話檢材的比對結(jié)果中就出現(xiàn)了前100名均在60分以上的情況,僅有該實驗對象的普通話樣本排名第一,湖南常德方言檢材排到了100名以后,無法進(jìn)入專家鑒定的視野,所以,當(dāng)比對結(jié)果出現(xiàn)前100名均在60分以上的情況時也在提醒民警有可能檢材聲紋模型的區(qū)分度比較小,而相似模型比較多,進(jìn)行個體鑒別時需要更加謹(jǐn)慎。
本實驗中,同一實驗對象的方言檢材比中樣本庫里方言樣本以及普通話檢材比中樣本庫里普通話樣本的概率是100%,且排名均是第一;當(dāng)方言和普通話之間差別大時,單一檢材難以跨過壁壘找到同一人的另一種語言樣本,這是存在的問題??紤]到犯罪嫌疑人有可能在不同案件中說不同方言的情況,比對結(jié)果中有可能錯失,所以,建議在采集樣本和檢材時盡可能地采集違法犯罪嫌疑人所有會說的語言。
另外,針對電信詐騙案中犯罪團(tuán)伙“廣撒網(wǎng)”的特性,一部分防詐騙意識高的群眾能夠較快地意識到自己接的電話是詐騙電話,建議鄭州市局在官方微信公眾號和其他官方公開宣傳平臺上開設(shè)專門端口,用于收集群眾舉報的詐騙電話錄音,在專業(yè)民警的鑒別和語音處理之后匯入聲紋檢材庫,加速串并案碰撞,震懾電信詐騙違法犯罪。
3.3 展望
目前,聲紋樣本的采集工作還停留在室內(nèi)或者固定的辦公場所里,為了加快樣本采集工作,鄭州市局正在嘗試和科大訊飛公司進(jìn)行聲紋采集軟件的兼容性和自動化的研發(fā),希望聲紋采集終端能夠更方便攜帶、更加簡單實用;民警能夠攜帶新的采集終端深入基層,以最快的速度采集海量語音匯入聲紋庫,實現(xiàn)聲紋庫由量變到質(zhì)變,使聲紋庫應(yīng)用盡快成為打擊刑事犯罪新的增長點,推動打擊刑事犯罪工作再上新臺階。
[1] 李敬陽,胡國平,王莉.聲紋自動識別技術(shù)與聲紋庫建設(shè)應(yīng)用[J].警察技術(shù),2012(4).
[2] 王英利,李敬陽,曹紅林.聲紋鑒定技術(shù)綜述[J].警察技術(shù),2012(4).
[3] 劉勇,劉夢蓮.聲紋認(rèn)證在呼叫中心的應(yīng)用[J].廣東通信技術(shù),2009(10).
[4] 王英利.關(guān)于聲紋鑒定技術(shù)的若干問題[C]∥第九屆中國語音學(xué)學(xué)術(shù)會議論文集,2010.
[5] 李敬陽,胡國平,劉浩.全國重點人員聲紋庫建設(shè)[C]∥第一屆全國聲像資料檢驗鑒定技術(shù)交流會論文集,2011.
[6] 付新立,靳業(yè),吳銳,張海東,朱云龍.聲紋數(shù)據(jù)庫建設(shè)與應(yīng)用[C]∥第一屆全國聲像資料檢驗鑒定技術(shù)交流會論文集,2011.
[7] KENNY P, BOULIANNE G, OULLET P, et al. Joint factor analysis versus eigenchannes in speaker recognition[J]. IEEE Transactions on Audio, Speech, and Language Processing,2007,15(4):1435-1447.
[8] HU Y, HUO Q. Irrelevant variability normalization based HMM training using VTS approximation of an explicit model of environmental distortions[C]∥INTERSPEECH 2007. 2007:1042-1045.
[9] 呂亮.基于深度學(xué)習(xí)的說話人識別方法的研究[D].南京:東南大學(xué),2016.
[10] 熊冰峰.基于聽覺特征參數(shù)的說話人識別技術(shù)[D].湘潭:湘潭大學(xué),2016.
(責(zé)任編輯陳小明)
D918.9
彭去桀(1988—),女,湖南澧縣人, 碩士研究生,民警。研究方向為文件檢驗、聲紋技術(shù)。