張曉潔
隨著排在美國(guó)第五大道的火車站店門外和蜂擁到蘋果官網(wǎng)預(yù)購(gòu)iPhone5的人群再次搶購(gòu)一空,全新的iOS6.0系統(tǒng)也被蘋果粉絲們熱烈追捧。其中最受到關(guān)注的就是iOS6.0中Siri支持的15個(gè)國(guó)家和地區(qū)語(yǔ)音中,特別增加了中國(guó)普通話,粵語(yǔ)和閩南語(yǔ)。自從去年10月蘋果公司在iPhone4S上推出Siri這款語(yǔ)音控制應(yīng)用之后,Siri代表的語(yǔ)音控制和人工智能就被科技界備加推崇。事實(shí)上,Siri的價(jià)值遠(yuǎn)遠(yuǎn)超過(guò)一個(gè)語(yǔ)音識(shí)別軟件,而是用戶的私人生活助手,用戶可以通過(guò)手機(jī)讀短信、詢問(wèn)天氣、語(yǔ)音設(shè)置鬧鐘等,還可以通過(guò)Siri搜索餐廳、電影院等生活信息,直接收看各種相關(guān)評(píng)論,并且進(jìn)行預(yù)定,而且Siri越來(lái)越智能,針對(duì)用戶詢問(wèn)給出的回答,不斷學(xué)習(xí)心得聲音和語(yǔ)調(diào),Siri的巨大提升以及Siri的無(wú)限量應(yīng)用都顯示出未來(lái)將迎來(lái)爆炸性的增長(zhǎng)。
無(wú)獨(dú)有偶,今年谷歌也面向移動(dòng)領(lǐng)域推出了足夠令業(yè)界震撼的Google Now語(yǔ)音識(shí)別搜索服務(wù),這是谷歌繼Google Voice Search之后面向移動(dòng)互聯(lián)網(wǎng)的又一戰(zhàn)略性產(chǎn)品,而微軟也在Win8中整合了語(yǔ)音識(shí)別技術(shù)的全新系統(tǒng),希望借助Kinect軟件開發(fā)包作為微軟明年最重要的利潤(rùn)增長(zhǎng)點(diǎn)之一。就連三星、聯(lián)想等終端廠商也開始推出類似Siri的語(yǔ)音輔助軟件,顯然語(yǔ)音已經(jīng)是各大平臺(tái)公司集結(jié)的戰(zhàn)場(chǎng),而語(yǔ)音戰(zhàn)爭(zhēng)的逐漸升溫不僅是因?yàn)檎Z(yǔ)音將掌控未來(lái)移動(dòng)互聯(lián)網(wǎng)的入口,更重要的是語(yǔ)音所代表的人機(jī)交互將讓人們未來(lái)的移動(dòng)生活變得無(wú)限可能。
科技公司對(duì)語(yǔ)音的探索可以追溯到上世紀(jì)90年代末IBM公司發(fā)布的ViaVoice 98 連續(xù)語(yǔ)音識(shí)別產(chǎn)品,利用突破性的技術(shù)達(dá)到返璞歸真的目的,使個(gè)人使用電腦更加簡(jiǎn)便, 而比爾.蓋茨在2006年也提出過(guò)未來(lái)將在操作系統(tǒng)中實(shí)現(xiàn)自然語(yǔ)音的人機(jī)交互,微軟還收購(gòu)了TeLLMEe,平臺(tái)每年執(zhí)行110億次以上語(yǔ)音識(shí)別的請(qǐng)求。但是由于計(jì)算機(jī)硬件條件和網(wǎng)絡(luò)條件的限制,語(yǔ)音的控制僅限于單個(gè)計(jì)算機(jī)和實(shí)驗(yàn)室概念,無(wú)法真正步入人們的互聯(lián)網(wǎng)生活。不過(guò)今天,日益成熟的移動(dòng)互聯(lián)網(wǎng)環(huán)境、云計(jì)算和大規(guī)模數(shù)據(jù)的積累,以及大量智能終端的普及都讓語(yǔ)音的世界真正臨近爆發(fā)。不久前,IBM超級(jí)計(jì)算機(jī)“沃森”(Watson)在智力競(jìng)答節(jié)目《危機(jī)邊緣》中擊敗了人類對(duì)手,沃森在競(jìng)答節(jié)目中對(duì)海量數(shù)據(jù)信息迅速完成分析的能力,讓人不禁對(duì)語(yǔ)音和人工智能軟件嵌入到流行電子消費(fèi)產(chǎn)品后的前景充滿期待。
“隨著今年新一代iPhone正式發(fā)布,Google 開始推動(dòng)語(yǔ)音云技術(shù);加上百度、騰訊等互聯(lián)網(wǎng)廠商推出相關(guān)產(chǎn)品,用戶教育過(guò)程會(huì)很快。到明年上半年,最遲明年年中,哪個(gè)手機(jī)沒(méi)有語(yǔ)音交互的功能,就會(huì)很奇怪了”,科大訊飛副總裁江濤的樂(lè)觀代表了很大一部分業(yè)內(nèi)人士的想法。
事實(shí)上,基于語(yǔ)音的產(chǎn)品已經(jīng)成為今年最火熱的產(chǎn)品,不管是Siri、語(yǔ)音搜索還是語(yǔ)音的應(yīng)用,這些產(chǎn)品都將語(yǔ)言交流的特性或者聲音識(shí)別技術(shù)都巧妙地融入超越了簡(jiǎn)單的問(wèn)答卻產(chǎn)生意外的效果,比如,日本運(yùn)營(yíng)商N(yùn)TT DoCoMo已經(jīng)為用戶提供自動(dòng)語(yǔ)言翻譯服務(wù)的手機(jī),用戶對(duì)手機(jī)說(shuō)話就能立刻轉(zhuǎn)成翻譯好的文字顯現(xiàn)在手機(jī)屏幕上,受到了出國(guó)旅行游客的歡迎,而在國(guó)內(nèi)微信用語(yǔ)音替代了文本的短信,用短短一年時(shí)間就輕松地吸引了超過(guò)1億用戶,像唱吧這樣利用語(yǔ)音和聲波識(shí)別技術(shù)開發(fā)相關(guān)應(yīng)用也成為今年最受歡迎的產(chǎn)品之一。
語(yǔ)音新紀(jì)元也在給未來(lái)的創(chuàng)業(yè)公司提供無(wú)限想象空間,當(dāng)更多的中國(guó)科技企業(yè)和創(chuàng)業(yè)公司在語(yǔ)音這條路上面進(jìn)行開發(fā)延展之旅,人們的移動(dòng)生活將會(huì)更加隨心所欲,語(yǔ)音和智能機(jī)器人不再是實(shí)驗(yàn)室和娛樂(lè)概念,而未來(lái)的手機(jī)、汽車、電視每個(gè)終端都可以通過(guò)聲音進(jìn)行各種個(gè)性化的操作。