• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    對(duì)通信終端智能語(yǔ)音處理技術(shù)的研究

    2014-12-31 00:00:00趙宏洲李陽(yáng)張強(qiáng)
    數(shù)字化用戶 2014年7期

    【摘 要】隨著科學(xué)技術(shù)的快速發(fā)展,現(xiàn)代通信也得到大力的發(fā)展,特別是趨向于數(shù)字化方向發(fā)展,由此現(xiàn)代通信終端趨于高性能、智能化的發(fā)展是新的挑戰(zhàn)和更高的要求。本文作者結(jié)合自己的工作經(jīng)驗(yàn)對(duì)通信終端智能化語(yǔ)音處理技術(shù)進(jìn)行分析和研究,具體的從終端智能化的語(yǔ)音接口、語(yǔ)音合成、語(yǔ)音門戶等技術(shù)方面著手,進(jìn)一步提高語(yǔ)音技術(shù)的發(fā)展。

    【關(guān)鍵詞】通信終端 智能化 語(yǔ)音 技術(shù)

    智能化的終端是當(dāng)代通信技術(shù)的發(fā)展方向,實(shí)現(xiàn)視覺(jué)、聽(tīng)覺(jué)、語(yǔ)言、思維、推理的功能,通信功能不斷趨于人性化、擬人化的人機(jī)接口,核心的關(guān)鍵技術(shù)主要是語(yǔ)音處理。智能化的語(yǔ)音處理技術(shù),主要是對(duì)語(yǔ)言、文字的識(shí)別和合成技術(shù),通過(guò)實(shí)際操作過(guò)程的經(jīng)驗(yàn)總結(jié),不斷的完善語(yǔ)音處理功能。

    一、智能化語(yǔ)音接口技術(shù)

    所謂的智能接口就是模擬人的行為功能,建立起來(lái)的人機(jī)交互環(huán)境,語(yǔ)音是人類最基本的通信手段,智能化的語(yǔ)音接口,利用通信、計(jì)算機(jī)科學(xué)、電子、語(yǔ)言識(shí)別等技術(shù)的結(jié)合來(lái)實(shí)現(xiàn)擬人化的信息交流。世界上有70%的人通過(guò)語(yǔ)音通信實(shí)現(xiàn)信息交流,這也是最為普遍的通信方式。由此通信終端的主體結(jié)構(gòu)是基于語(yǔ)音通信來(lái)實(shí)現(xiàn)的。

    1.1語(yǔ)音識(shí)刪。通信終端是基于語(yǔ)音建立的,由此語(yǔ)音識(shí)別是智能化通信終端的關(guān)鍵技術(shù)之一。早期的語(yǔ)音識(shí)別僅限于模版識(shí)別,詞匯量偏少、有特定限制,不能夠進(jìn)行連續(xù)語(yǔ)音識(shí)別,無(wú)法滿足人們對(duì)詞匯量的需要。智能通信技術(shù)的不斷發(fā)展,也是對(duì)語(yǔ)音識(shí)別技術(shù)提出更高的要求。

    (1)電話語(yǔ)音識(shí)別。電話語(yǔ)音處理技術(shù)是計(jì)算機(jī)中文信息處理領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù),它是把語(yǔ)音信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),然后進(jìn)行壓縮存儲(chǔ),或把壓縮的數(shù)字信號(hào)解壓還原成語(yǔ)音信號(hào).在當(dāng)代高速數(shù)據(jù)通信環(huán)境中,我們利用傳統(tǒng)的電話語(yǔ)音處理技術(shù),然而由于各種環(huán)境因素的影響,干擾數(shù)字信號(hào)傳輸,產(chǎn)生了電話語(yǔ)音信號(hào)的變化。因此,我們?cè)诖螂娫挄r(shí),不論處于那種嘈雜的環(huán)境中,電話語(yǔ)音識(shí)別都不會(huì)被影響.由此噪聲背景下的語(yǔ)音識(shí)別也是我們將要解決的重要問(wèn)題。

    (2)語(yǔ)音識(shí)別的增強(qiáng)性。對(duì)語(yǔ)音系統(tǒng)使用環(huán)境進(jìn)行測(cè)試,我們可以分析發(fā)現(xiàn)電話背景噪聲的干擾,導(dǎo)致電話信號(hào)產(chǎn)生信道和編碼噪聲干擾,噪聲干擾是識(shí)別原始語(yǔ)音信號(hào)的一大干擾因素,且此類干擾是隨機(jī)發(fā)生。所以,我們需要對(duì)每一種噪聲干擾環(huán)境進(jìn)行識(shí)別和增強(qiáng)技術(shù)。目前,針對(duì)我國(guó)用戶群隨機(jī)的情況,需要建立普適度更高的模型或?qū)Σ煌谝糇詣?dòng)適應(yīng)性。

    1.2語(yǔ)音合成。語(yǔ)音合成技術(shù)是使電腦或通信終端具有類似于人一樣的說(shuō)話能力,是當(dāng)今時(shí)代信息產(chǎn)業(yè)的重要研究領(lǐng)域。和語(yǔ)音識(shí)別相比,語(yǔ)音合成技術(shù)更成熟一些。是最有希望首先在智能通信終端中得到普遍應(yīng)用并形成帶動(dòng)作用的一項(xiàng)關(guān)鍵技術(shù)。目前。語(yǔ)音合成有高自然度、芯片級(jí)、多語(yǔ)種、分步式和口語(yǔ)式的語(yǔ)音合成等發(fā)展方向。按照智能化程度的不同層次,語(yǔ)音合成可分為三個(gè)層次:從文字到語(yǔ)音;概念到語(yǔ)音;意向到語(yǔ)音的合成。為合成出高質(zhì)量的語(yǔ)音,除依賴于各種規(guī)則,還必須對(duì)文字內(nèi)容進(jìn)行很好的理解。文字,語(yǔ)音的轉(zhuǎn)換系統(tǒng)。

    (1)文本分析。對(duì)文本的格式、詞語(yǔ)、句子進(jìn)行分析識(shí)別,確定每一個(gè)字的發(fā)音。具體的文本分析主要是通過(guò)分詞、識(shí)別、發(fā)音處理等環(huán)節(jié)實(shí)現(xiàn)。

    (2)語(yǔ)音合成器。目前,最流行的語(yǔ)音合成器是采用基音同步的重疊相加(PSOLA)方法來(lái)實(shí)現(xiàn)波形拼接。PSOLA算法的基本思想是以語(yǔ)音信號(hào)基音周期為分析對(duì)象,在基音同步基礎(chǔ)上對(duì)信號(hào)聲調(diào)和時(shí)長(zhǎng)進(jìn)行修改。

    二、智能終端與語(yǔ)音門戶

    語(yǔ)音門戶,是指基于互聯(lián)網(wǎng)平臺(tái)。應(yīng)用語(yǔ)音識(shí)別、合成和轉(zhuǎn)換技術(shù),為固定和移動(dòng)電話用戶提供用語(yǔ)音訪問(wèn)互聯(lián)網(wǎng)并獲取網(wǎng)上信息的門戶,是全球互聯(lián)網(wǎng)發(fā)展的最新趨勢(shì)之一。語(yǔ)音門戶應(yīng)用計(jì)算機(jī)網(wǎng)絡(luò)、語(yǔ)音、Web、電信、等技術(shù),建立為語(yǔ)音識(shí)別服務(wù)的網(wǎng)絡(luò)平臺(tái)。為更多的用戶提供各類通信終端服務(wù),同時(shí)此項(xiàng)技術(shù)也為企業(yè)的發(fā)展,帶來(lái)了新的機(jī)遇和業(yè)務(wù)。隨著近年來(lái)語(yǔ)音識(shí)別技術(shù)的發(fā)展和廣泛應(yīng)用,主要有以上所提到的自動(dòng)語(yǔ)音識(shí)別(AsR)、文本轉(zhuǎn)語(yǔ)音、口語(yǔ)對(duì)話等人機(jī)交互技術(shù)、信息處理技術(shù)的發(fā)展,以及像語(yǔ)音瀏覽器、嵌入式語(yǔ)音瀏覽器等Voice Web技術(shù)的成熟.為用戶終端服務(wù)提供了保障,并且語(yǔ)音門戶在通信終端的應(yīng)用種類也得到了增多,確保了語(yǔ)音門戶在通信終端的有效作用。

    2.1分布式語(yǔ)音處理:(1)分布式語(yǔ)音識(shí)別在智能通信終端中。語(yǔ)音識(shí)別的主要目標(biāo)是實(shí)現(xiàn),廣大用戶利用語(yǔ)音既可以訪問(wèn)計(jì)算機(jī)服務(wù)系統(tǒng),便于操作和使用。當(dāng)前我們將語(yǔ)音識(shí)別系統(tǒng)的分布使用在移動(dòng)通信端,通過(guò)預(yù)處理、提取有效參數(shù),隨之通過(guò)數(shù)據(jù)信道將其傳輸?shù)秸Z(yǔ)音識(shí)別系統(tǒng)的遠(yuǎn)程端。這樣就完成了語(yǔ)音識(shí)別系統(tǒng)的傳輸,并且不會(huì)干擾語(yǔ)音識(shí)別的正確率,從而實(shí)現(xiàn)信道不變形的目的?;谡Z(yǔ)音識(shí)別系統(tǒng)的應(yīng)用,主要是用于網(wǎng)絡(luò)分布式的語(yǔ)音識(shí)別。如當(dāng)前的呼叫中心,并在基于包交換的VOIP網(wǎng)絡(luò)進(jìn)行了測(cè)試;(2)分布式語(yǔ)音合成在基于網(wǎng)絡(luò)應(yīng)用。當(dāng)前,分布式語(yǔ)音服務(wù)的模式主要是客戶機(jī),在服務(wù)端和終端之間總是存在差異,加之信道和用戶體驗(yàn)功能的綜合影響。語(yǔ)音合成分布式主要是將傳統(tǒng)的合成環(huán)節(jié)轉(zhuǎn)化為標(biāo)準(zhǔn)的模塊(語(yǔ)音合成、文本分析)。

    2.2語(yǔ)音瀏覽器。所謂的語(yǔ)音游覽器,就是不用接觸鍵盤運(yùn)用語(yǔ)音進(jìn)行語(yǔ)言識(shí)別游覽,也是基于XML國(guó)際標(biāo)準(zhǔn)的語(yǔ)音可擴(kuò)展標(biāo)識(shí)語(yǔ)言.像HTML定義圖形化網(wǎng)頁(yè)界面一樣定義了語(yǔ)音界面內(nèi)容,并通過(guò)Transcoder服務(wù)器直接瀏覽網(wǎng)上HTML格式的內(nèi)容。它主要包括Voice XML、電話語(yǔ)音接人、TIS/AsR資源及Transcoder服務(wù)器。

    2.3嵌入式語(yǔ)音瀏覽器。嵌人式語(yǔ)音瀏覽器支持WAP等傳輸協(xié)議及Javascript、擴(kuò)展XML、Vdcc XML等標(biāo)記語(yǔ)言,可完成網(wǎng)頁(yè)潮覽功能;適合在非PC的嵌人式信息設(shè)備中存在、運(yùn)行。并完整實(shí)現(xiàn)通信傳輸協(xié)議、標(biāo)記語(yǔ)言所規(guī)定的功能;根據(jù)嵌入式設(shè)備的多樣性需求進(jìn)行裁減和修改。并滿足信息設(shè)備使用者方便地獲取文字、圖像、聲音、視頻等信息;可廣泛應(yīng)用到各種非PC設(shè)備或通信終端,如電視上的機(jī)頂盒、交互式數(shù)字電視、手持上網(wǎng)設(shè)備(移動(dòng)電話、掌上電腦、個(gè)人數(shù)字助理等)、互聯(lián)網(wǎng)電話、網(wǎng)絡(luò)終靖、電子圖書閱讀器、公共信息查詢系統(tǒng)等。

    三、結(jié)語(yǔ)

    簡(jiǎn)單來(lái)看,通信終端智能語(yǔ)音處理技術(shù)的不斷發(fā)展,在一定程度上可以滿足人們對(duì)于信息交流的需求,不斷的研究創(chuàng)新更多的語(yǔ)音處理技術(shù)。未來(lái)智能通信終端語(yǔ)音處理技術(shù)不再局限于一種語(yǔ)言,將向著多種語(yǔ)言通信發(fā)展。

    參考文獻(xiàn):

    [1]王廣科.Wang Guangke 幾種常用的音頻處理方法-物理教學(xué)探討2011,29(4)

    [2]徐波 海量音頻處理及嵌入式語(yǔ)音交互-2011

    [3]隋文紅 論數(shù)字技術(shù)與電影聲音空間感的建立-現(xiàn)代電影技術(shù)2011(11)

    乐山市| 万源市| 尼玛县| 静宁县| 海伦市| 长乐市| 宜兰县| 成武县| 高淳县| 普安县| 乌拉特中旗| 石家庄市| 万荣县| 斗六市| 滨海县| 增城市| 贵定县| 新河县| 全南县| 汕尾市| 赫章县| 台东县| 洪洞县| 北海市| 宁陕县| 台中县| 福清市| 夹江县| 屯门区| 嘉义县| 张家港市| 通州市| 康平县| 江源县| 定边县| 塘沽区| 沾益县| 吉首市| 邛崃市| 沙田区| 枞阳县|