向 菲
(湖北省恩施州公安局,湖北 恩施 445000)
人類的機(jī)體構(gòu)成十分復(fù)雜難以解釋,俗話說(shuō)“世界上沒(méi)有兩片相同的葉子”,無(wú)論是人臉?lè)治?,還是指紋、DNA等標(biāo)志性的分析,都是經(jīng)過(guò)了長(zhǎng)期發(fā)展而產(chǎn)生的技術(shù)。人類的發(fā)聲是一個(gè)神奇復(fù)雜的生理功能,每個(gè)人的聲帶構(gòu)成不同,所形成的聲線也完全不同,受到神經(jīng)系統(tǒng),基因等多個(gè)復(fù)雜因素的共同控制。同時(shí),每個(gè)人的聲線,還與成長(zhǎng)環(huán)境,外界因素等影響息息相關(guān),使得每個(gè)人的聲音構(gòu)成都完全不同,且聲學(xué)上的聲譜特征穩(wěn)定且唯一。從這個(gè)角度來(lái)看,對(duì)個(gè)人的聲線進(jìn)行分析并進(jìn)行身份識(shí)別是可行的。此外,近年來(lái),人工智能技術(shù)不斷地發(fā)展,云計(jì)算、大數(shù)據(jù)處理等技術(shù)不斷涌現(xiàn),因此,從技術(shù)上,聲紋識(shí)別和語(yǔ)音識(shí)別技術(shù)應(yīng)用到公安領(lǐng)域,可行性就大大增加了。
不僅如此,該技術(shù)不僅用于政府單位,也被企業(yè)家們發(fā)掘并商用。在國(guó)家的積極投入下,近年來(lái)培養(yǎng)出了大批的大數(shù)據(jù)應(yīng)用人才,技術(shù)在不斷提升,聲紋識(shí)別和語(yǔ)音識(shí)別技術(shù)正在逐步商業(yè)化,經(jīng)典的應(yīng)用場(chǎng)景有:公安偵查、智能家電、手機(jī)語(yǔ)音識(shí)別、金融保密行業(yè)等,代替復(fù)雜難記的密碼,安全高效。
近年來(lái),在公安機(jī)關(guān)偵辦電信詐騙、涉恐涉毒等復(fù)雜案件時(shí),語(yǔ)音識(shí)別和聲紋識(shí)別技術(shù)起到了相當(dāng)大的輔助作用,相關(guān)技術(shù)人員對(duì)案件偵破作出了重大貢獻(xiàn)。[1]
綜上所述,相比現(xiàn)在比較完善發(fā)達(dá)的語(yǔ)音交互來(lái)說(shuō),聲紋識(shí)別的技術(shù)需要更高的入行門檻,目前處在穩(wěn)步發(fā)展的階段。通過(guò)該技術(shù),可以精準(zhǔn)識(shí)別人與人之間的區(qū)別。本文將介紹該技術(shù)的原理和目前的應(yīng)用現(xiàn)狀,并闡述其在公安領(lǐng)域發(fā)揮的重大作用。
聲紋指的是經(jīng)過(guò)相關(guān)儀器測(cè)試現(xiàn)實(shí)的攜帶語(yǔ)言信息的聲波頻譜,有波長(zhǎng)頻率等多種特征組成,受到發(fā)聲器官(舌頭,口腔,牙齒,肺,鼻腔尺寸)、心理、環(huán)境干擾等多種因素的影響。盡管如此,每個(gè)人的具體構(gòu)造不同,因此在一般情況下,還是能通過(guò)聲音特征和聲譜來(lái)判斷是否是同一個(gè)人。在這個(gè)角度上,聲紋識(shí)別的意義就是獲取一個(gè)人具體的發(fā)聲方式和發(fā)生特征。主要體現(xiàn)在人的發(fā)聲共鳴方式特征、嗓音純度特征、音高特征以及音域特征等。語(yǔ)音識(shí)別略有不同,主要體現(xiàn)的是識(shí)別語(yǔ)言中的字符和語(yǔ)言信息,并加以解讀,從本質(zhì)上不是為了識(shí)別說(shuō)話人的身份,關(guān)注的是傳達(dá)的信息內(nèi)涵。兩者相結(jié)合,能通過(guò)聲音對(duì)說(shuō)話的人有一個(gè)基本輪廓的了解。目前兩個(gè)技術(shù)應(yīng)用都各自形成了較為完善的應(yīng)用流程和方式:
聲紋識(shí)別的應(yīng)用主要經(jīng)過(guò)三個(gè)步驟:預(yù)處理,特征提取以及識(shí)別。預(yù)處理指的是從一段語(yǔ)音信息中提取出干凈便于數(shù)字識(shí)別的人聲信息,將非人聲的信息過(guò)濾掉,防止后期分析時(shí)候造成不必要的干擾,是整個(gè)識(shí)別過(guò)程中最基礎(chǔ)的部分。往往最基礎(chǔ)的部分是最重要的,可以分為數(shù)字信號(hào)處理以及機(jī)器學(xué)習(xí)。第二部分就是進(jìn)行特征提取,通過(guò)專業(yè)的技術(shù)分析人員的操作,識(shí)別過(guò)程進(jìn)入到核心部分,進(jìn)行信息提取,提取后再進(jìn)行分析。該部分需要的信息包括上文所提到的所有基本特征信息,聲音特征的提取一般具有泛化特征,在較長(zhǎng)時(shí)間跨度下還能表現(xiàn)出一定的穩(wěn)定性,因此對(duì)于公安領(lǐng)域的應(yīng)用來(lái)說(shuō)是十分有利的。
最后一步就是識(shí)別部分,作為壓軸流程,所需要的技術(shù)就比較關(guān)鍵,要求具有較高的準(zhǔn)確性,需要通過(guò)模型對(duì)提取出的聲紋進(jìn)行分析,目前也已經(jīng)存在較為成熟的幾種模型和技術(shù)。
綜上所述,語(yǔ)音識(shí)別與聲紋識(shí)別的主要區(qū)別在于語(yǔ)音識(shí)別是提取內(nèi)容信息,聲紋識(shí)別是針對(duì)特征提取身份信息。語(yǔ)音識(shí)別技術(shù)的核心是將聲音內(nèi)容變?yōu)槲谋具M(jìn)行輸出,以便公安系統(tǒng)在進(jìn)行案件偵辦時(shí)作為參考。包括語(yǔ)音合成、識(shí)別和理解三個(gè)方面的內(nèi)容。
第一部分要在技術(shù)限制內(nèi)盡可能地提取并保留完整的原始語(yǔ)音,保證清晰度,是整個(gè)識(shí)別工作的基礎(chǔ);第二部分是要進(jìn)行語(yǔ)音的識(shí)別,基于內(nèi)容對(duì)語(yǔ)音進(jìn)行處理,將復(fù)雜的語(yǔ)境轉(zhuǎn)換為能夠理解的文本或命令,作為可識(shí)別的參考證據(jù);第三部分工作作為收尾,前兩步已經(jīng)基本將所有的前期基本工作鋪墊好,最后的理解部分就是在相應(yīng)的語(yǔ)境之中,對(duì)應(yīng)邏輯關(guān)系,通過(guò)不斷地變化語(yǔ)境進(jìn)行語(yǔ)義推理。
兩者在單獨(dú)使用的時(shí)候,是針對(duì)不同的內(nèi)容和效果,但是在公安領(lǐng)域內(nèi)的應(yīng)用,通常是兩者結(jié)合應(yīng)用。在公安領(lǐng)域中,利用兩種技術(shù)的結(jié)合,以及實(shí)戰(zhàn)時(shí)的信息采集技術(shù),幾乎可以達(dá)到聲音找人、聲音定人的效果。隨著大數(shù)據(jù)的不斷發(fā)展,我國(guó)的公安系統(tǒng)也形成了龐大的內(nèi)部數(shù)據(jù)庫(kù),將收集、分析過(guò)的聲音數(shù)據(jù)和聲音信息作為歷史檔案儲(chǔ)存與數(shù)據(jù)庫(kù),再次利用時(shí)可以直接進(jìn)行匹配對(duì)比,節(jié)省了大量的翻閱檔案的人力物力和時(shí)間資源。提升了公安辦案的效率、便捷度和可信度。
兩者相結(jié)合不僅僅是各司其職,一般兩項(xiàng)內(nèi)容會(huì)對(duì)同一則音頻同時(shí)進(jìn)行,兩者需要實(shí)現(xiàn)同一且真實(shí)。與此同時(shí),對(duì)公安內(nèi)部技術(shù)人員的要求也更高,需要盡到維護(hù)系統(tǒng)安全、保證系統(tǒng)健康運(yùn)行的職責(zé),并且在進(jìn)行數(shù)據(jù)分析的時(shí)候,要盡量做到快速準(zhǔn)確,減少操作失誤,以對(duì)案件偵辦盡到相應(yīng)的責(zé)任。
關(guān)于聲音處理的相關(guān)技術(shù)最早出現(xiàn)于40年代末的美國(guó)貝爾實(shí)驗(yàn)室,其最早開發(fā)的目的是將其應(yīng)用于軍事情報(bào)領(lǐng)域。此后,技術(shù)不斷成熟發(fā)展,不少人發(fā)現(xiàn)了其中的潛力,將其應(yīng)用于商業(yè)等其他領(lǐng)域。[2]如,60年代后期應(yīng)用于美國(guó)的法證領(lǐng)域,經(jīng)過(guò)幾十年的發(fā)展,該項(xiàng)技術(shù)的成熟程度已經(jīng)可以達(dá)到公安部的標(biāo)準(zhǔn),其可信度是可以作為證據(jù)進(jìn)行當(dāng)庭提供的。目前較為成熟的應(yīng)用方法是模板匹配法、最近鄰方法、神經(jīng)元網(wǎng)絡(luò)方法以及聚類法等。
以上提到的幾種方法,雖然操作方式上存在差異,但本質(zhì)上沒(méi)有什么變化,采用的基本原理都是相似的,目前公安系統(tǒng)采用的就是將聲譜圖提取出來(lái),并將其與已存在的數(shù)據(jù)對(duì)比進(jìn)行聲紋識(shí)別。目前無(wú)論是國(guó)內(nèi)還是國(guó)外都有不少企業(yè)在相關(guān)領(lǐng)域進(jìn)行研究,設(shè)備的先進(jìn)程度得到不斷提高,公安部專門為采購(gòu)相關(guān)設(shè)備頒布了《安防聲紋識(shí)別應(yīng)用系統(tǒng)技術(shù)要求》的行業(yè)標(biāo)準(zhǔn),以識(shí)別市面上設(shè)備是否達(dá)到公安部的采購(gòu)要求。
聲音的識(shí)別技術(shù)分為動(dòng)態(tài)檢測(cè)和靜態(tài)檢測(cè)兩個(gè)方式,目前應(yīng)用的許多靜態(tài)檢測(cè)的方法存在很大的弊端,其實(shí)時(shí)性是無(wú)法與動(dòng)態(tài)方法相比較的,很顯然動(dòng)態(tài)檢測(cè)的實(shí)際需求更大。
上文提到的識(shí)別過(guò)程中,十分關(guān)鍵的一步是對(duì)聲音進(jìn)行提前處理,目的不是檢測(cè)聲音,而是將音頻降噪和排除環(huán)境干擾,該步驟對(duì)于語(yǔ)音識(shí)別來(lái)說(shuō)至關(guān)重要,這一步出現(xiàn)問(wèn)題,將會(huì)對(duì)識(shí)別內(nèi)容的有效性產(chǎn)生巨大影響。無(wú)論是進(jìn)行聲紋識(shí)別還是語(yǔ)音識(shí)別,都要事先建立數(shù)據(jù)庫(kù),目前最為龐大的就是公安系統(tǒng)下的聲紋庫(kù)。然而,該識(shí)別方式存在兩個(gè)局限性:龐大數(shù)據(jù)庫(kù)不易建立和管理和聲音處理是否順利進(jìn)行存在很多不確定因素。此外,還存在許多不確定的物理和計(jì)算等相關(guān)問(wèn)題。
即使聲音存在唯一性,音頻數(shù)據(jù)的穩(wěn)定性也非常好,但是目前的技術(shù)局限性下,還是存在很多難以掌握的因素,比如人聲的易變性很強(qiáng),與年齡性別甚至情緒都息息相關(guān);上文也提到,若音頻錄制所處的環(huán)境以及采集數(shù)據(jù)的設(shè)備不利于分析,聲音特征的建模和分析也存在局限性。因此,筆者認(rèn)為這種技術(shù)不應(yīng)單獨(dú)使用,應(yīng)結(jié)合相關(guān)認(rèn)證手段一并,提高數(shù)據(jù)的可信度。
在國(guó)家的大力扶持下,公安系統(tǒng)在案件偵破上可以使用的技術(shù)手段越來(lái)越多,也越來(lái)越先進(jìn),然而相應(yīng)的犯罪手段也在不斷現(xiàn)代化,存在很多的涉網(wǎng)新型犯罪手段。如語(yǔ)音電信詐騙、恐嚇、涉黑涉毒涉恐等案件類型,都涉及聲音數(shù)據(jù)的收集,聲音數(shù)據(jù)都可以用于案件的辦理。新型犯罪頻發(fā)的當(dāng)代社會(huì),公安系統(tǒng)不斷迎來(lái)全新的挑戰(zhàn)。因此,先進(jìn)的鑒定技術(shù)是以上幾類刑事案件偵破的關(guān)鍵一步,也是取證的重要手段:
筆者查閱資料,了解到目前該技術(shù)應(yīng)用較多的案件類型有敲詐勒索,綁架勒索,陷害恐嚇等性質(zhì)惡劣的事件。以上提到的案件多以音頻和電話錄音為關(guān)鍵性證據(jù),不僅僅是通過(guò)通信手段對(duì)犯罪分子的所在地點(diǎn)進(jìn)行確定,對(duì)未知的犯罪分子身份確定的唯一途徑就是聲音鑒別,包括電話背景音、環(huán)境音。運(yùn)用聲紋和語(yǔ)音識(shí)別技術(shù),判斷是否是再犯人員,判斷人的性別年齡體態(tài)等多種特征,進(jìn)行畫像描述,刻畫特征,為刑偵人員的判斷提供依據(jù)。
除了上述的基本信息以外,還可以根據(jù)聲譜和語(yǔ)言內(nèi)容的分析,進(jìn)行說(shuō)話習(xí)慣,口音,受教育級(jí)別等特征的分析,是案件進(jìn)一步偵查的關(guān)鍵道路。
隨著技術(shù)的進(jìn)步,犯罪手段不斷創(chuàng)新,變聲器等干擾措施層出不窮,通過(guò)上文提到的幾個(gè)步驟的處理,通過(guò)對(duì)已經(jīng)變異過(guò)的聲音提取出聲譜,獲取較為穩(wěn)定不變的聲音特征,得到一定的規(guī)律,識(shí)別聲音材料是否有偽造的可能性,以確保證據(jù)的真實(shí)性。在與犯罪分子斗智斗勇的同時(shí),我國(guó)的公安系統(tǒng)也在不斷提升和突破。
根據(jù)上文所述,語(yǔ)音識(shí)別技術(shù)要將語(yǔ)音材料經(jīng)過(guò)精密的處理,鑒于犯罪證據(jù)的特殊性,大量的語(yǔ)音材料并不是那么完美,存在很多噪音和錄音設(shè)備質(zhì)量問(wèn)題,導(dǎo)致達(dá)不到刑偵工作所需的標(biāo)準(zhǔn)。經(jīng)過(guò)處理之后,將語(yǔ)音內(nèi)涵從音頻之中提取出來(lái),并將關(guān)鍵信息進(jìn)行聲音放大和清晰處理,從而解決上述問(wèn)題,改善證據(jù)的質(zhì)量,使其成為刑偵過(guò)程中的得力助手。
所謂聲音辨別,就是同一性的另一種表達(dá)方式,先前熱播的《人民的名義》真實(shí)地反映了識(shí)別技術(shù)在同一性方面的作用。通過(guò)語(yǔ)音材料的分析對(duì)比,確定該證據(jù)是否對(duì)應(yīng)正確的嫌疑人。[3]該技術(shù)的應(yīng)用在確定嫌疑人身份上起到了很大作用,為刑偵人員下結(jié)論提供了多一條道路,在龐大的公安機(jī)關(guān)數(shù)據(jù)庫(kù)中查詢是否存在再犯的情況,為判斷量刑提供了又一依據(jù)。
在一些恐嚇陷害的惡性事件中,當(dāng)事人會(huì)將語(yǔ)音材料作為證據(jù)提供。為了保證法律的公平公正性,公安機(jī)關(guān)的職責(zé)是分辨該音頻的真實(shí)性,不僅要進(jìn)行上述的同一性檢測(cè),分析音頻是否為人工合成。是否存在增加刪減惡行剪輯等情況。利用相關(guān)技術(shù)進(jìn)行聲譜的識(shí)別,檢查音頻是否為合理存在,從技術(shù)上辨別真?zhèn)危C明數(shù)據(jù)的真實(shí)性。
以上僅為大致的應(yīng)用,實(shí)際上該技術(shù)有更多的益處,如提高應(yīng)用語(yǔ)音材料的案件偵破速度??梢詫⒄Z(yǔ)音作為數(shù)據(jù)材料跨區(qū)域進(jìn)行傳輸,更高效率地協(xié)助跨區(qū)域辦案,不斷豐富公安機(jī)關(guān)的數(shù)據(jù)庫(kù),作為歷史數(shù)據(jù),能加強(qiáng)對(duì)有案底的相關(guān)人員的監(jiān)控和管理,快速檢索嫌疑人身份,減少了大量的人工成本及物資耗費(fèi),但同時(shí)對(duì)于技術(shù)人員的培養(yǎng)要求也更高。
綜上,已知本文提到的相關(guān)技術(shù)已經(jīng)廣泛應(yīng)用于公安領(lǐng)域,但鑒于技術(shù)發(fā)展存在局限性,其普及度也有待提高,為了讓科技在助力案件偵破、提高公安系統(tǒng)智能化方面繼續(xù)做貢獻(xiàn),[4]將相關(guān)技術(shù)在公安領(lǐng)域中廣泛普及是十分有必要的:
警務(wù)的主要任務(wù)還是為人民服務(wù),為基層人民提供安全健康的區(qū)域管理,是區(qū)域警務(wù)的最基本要求,理應(yīng)達(dá)到“案件量少,秩序好,社會(huì)安全,群眾安心”等基本目標(biāo)。將相關(guān)技術(shù)普及到社區(qū)警務(wù),對(duì)于區(qū)域人口的信息管理方面,有助于警務(wù)人員更加全面便捷地了解區(qū)域人口的情況,對(duì)于安全事故的處理效果也會(huì)大幅提高。構(gòu)建區(qū)域該技術(shù)數(shù)據(jù)庫(kù),豐富智慧社區(qū)警務(wù)的建設(shè),方便群眾配合警務(wù)工作,完善公安系統(tǒng)服務(wù)機(jī)制。
該技術(shù)數(shù)據(jù)庫(kù)的建立,方便警務(wù)人員在日常治安巡邏中,發(fā)現(xiàn)并確定在逃嫌疑人,消除社區(qū)安全隱患,有助于通過(guò)設(shè)備進(jìn)行身份確認(rèn),及時(shí)處理相關(guān)事務(wù)。
根據(jù)涉恐涉毒等數(shù)據(jù)庫(kù)的信息,以及隨身配備的語(yǔ)音識(shí)別設(shè)備,集中管理集中查詢,助力公安機(jī)關(guān)有效打擊犯罪分子,維持管轄區(qū)域的和諧穩(wěn)定,保證居民人身安全。
總而言之,筆者認(rèn)為聲紋識(shí)別和語(yǔ)音識(shí)別技術(shù)在公安領(lǐng)域中,是傳統(tǒng)偵辦手段與現(xiàn)代科技融合的成果,是公安領(lǐng)域與高科技犯罪不斷斗智斗勇得出來(lái)的智慧結(jié)晶,是預(yù)防犯罪、快速結(jié)果犯罪的有效手段之一。語(yǔ)音材料數(shù)據(jù)庫(kù)的構(gòu)建,為公安領(lǐng)域的工作減少了許多錯(cuò)誤的發(fā)生以及人力物力資源的浪費(fèi)。本文結(jié)合應(yīng)用場(chǎng)景進(jìn)行描述,探究了該技術(shù)具體如何發(fā)揮作用。
綜上,雖然該技術(shù)上還存在一些缺陷,但是為了進(jìn)一步實(shí)現(xiàn)普及和高效使用,應(yīng)該不斷完善設(shè)備和數(shù)據(jù)庫(kù)的建設(shè),助力公安領(lǐng)域與科技進(jìn)步的結(jié)合,為廣大公民爭(zhēng)取幸福平安的生活環(huán)境。