本質(zhì)上來說,語音也是一種入口,就像瀏覽器、搜索引擎、微信一樣?;ヂ?lián)網(wǎng)大佬們都深信一點(diǎn),既然在PC端發(fā)了財(cái)?shù)亩际前盐兆∪肟诘墓?,那么把這一點(diǎn)移植到移動互聯(lián)網(wǎng)上一定也行得通。
在做游戲語音工具的YY成功上市,并且股價一路飆升的情況下,語音的重要性就是傻子都知道的了。以前認(rèn)為語音沒必要做的人算錯了一點(diǎn):在某些特定的情境下,語音是比文字或視頻更方便的溝通方式。比如當(dāng)用戶醉心于游戲時,再比如在移動互聯(lián)網(wǎng)世界。
觸摸屏的廣泛普及讓在手機(jī)上打字變得不舒服,而移動網(wǎng)絡(luò)帶寬的拓展又讓實(shí)時信息傳輸速度變得更快,兩相比較之下,語音的效率確實(shí)比文字更高。
而作為一個入口,語音識別技術(shù)也是必不可少的。信息真正的價值在它被服務(wù)器解析之后,計(jì)算機(jī)顯然是無法直接理解音頻的,這時將聲音變成文字再轉(zhuǎn)化成代碼就是必不可少的一步。
再者,單獨(dú)的語音技術(shù)可能沒有太多可用之處。但當(dāng)它與LBS、人工智能、廣告結(jié)合起來的時候,就像發(fā)生了化學(xué)反應(yīng)一樣,會突然成為新技術(shù)中不可或缺的一環(huán)。相信微信的成功已經(jīng)讓用戶感受到了語音的力量。
跟搜索結(jié)合之后,就是語音搜索;跟LBS結(jié)合,就可能做成車載語音導(dǎo)航;跟廣告結(jié)合就成了VoiceAds。其巨大的想象空間在未來有多大發(fā)展令人神往。
單說其中的車載語音導(dǎo)航,因?yàn)榻夥帕擞脩舻氖趾脱?,又可以將?shù)據(jù)實(shí)時轉(zhuǎn)化成文字,一旦連入移動互聯(lián)網(wǎng),那么將為未來的汽車行業(yè)帶來巨大革命性創(chuàng)新可能。
這就是所謂的兵家必爭之地。目前國內(nèi)主要的玩家是科大訊飛的靈犀、搜狗語音助手、智能360、蟲洞、盛大前不久剛發(fā)布的“百靈語音助手”。
科大訊飛的主營業(yè)務(wù)其實(shí)是to B的,營收的主要來源是國家安全應(yīng)用等業(yè)務(wù)。難怪科大訊飛董事長劉慶峰在接受采訪時笑稱,工信部對于微信中的一些信息有安全方面的擔(dān)心,要馬化騰聯(lián)系科大訊飛。其旗下的軟件“訊飛語點(diǎn)”與“訊飛語音助手”、和中移動聯(lián)合發(fā)布的“靈犀”隸屬于科大訊飛的“移動互聯(lián)網(wǎng)事業(yè)部”。該事業(yè)部是科大訊飛旗下六大事業(yè)部中唯一參與To C業(yè)務(wù)的,也是科大訊飛最年輕的事業(yè)部。
這樣半官方的背景使得科大訊飛一直被認(rèn)為是“慢吞吞”的科技公司,科大訊飛主攻語音識別和語義處理,缺乏人工智能分析能力。
百度和搜狗則是后起之秀。語音識別是一項(xiàng)難度非常大,對技術(shù)積累要求很高的技術(shù)。但兩者憑著多年的搜索數(shù)據(jù)積累以及服務(wù)數(shù)據(jù)積累建立了自己的優(yōu)勢:搜索引擎起家的語音識別技術(shù)能夠引入許多開放的數(shù)據(jù),比如天氣預(yù)報、航班信息、美食數(shù)據(jù)等。再者,多年對用戶使用習(xí)慣的分析能夠使廠商建立自己的知識圖譜系統(tǒng),做到精準(zhǔn)演化推算。這一點(diǎn)連Siri也做不到。
而沖動、智能360和盛大語音、云知聲則是完全的新秀。
盛大語音和云知聲更多投入在前端的語音識別上,羅永浩的錘子ROM演示時使用的就是云知聲的技術(shù),從演示效果來看,雖然受到ROM不穩(wěn)定造成的干擾,但其表現(xiàn)仍然亮眼。而蟲洞和智能360則更多在后端發(fā)力。
縱觀這幾家語音識別技術(shù)公司,科大訊飛雖然憑借多年的技術(shù)優(yōu)勢取得了一定優(yōu)勢,但互聯(lián)網(wǎng)各大公司都頗不愿意將這么重要的新業(yè)務(wù)假手外人。騰訊之前就曾澄清,為微信提供技術(shù)支持的并不是科大訊飛。
搜狗和百度熟悉用戶市場,長期面向一線用戶的經(jīng)驗(yàn)讓他們更容易開發(fā)出直接面向用戶的產(chǎn)品。再者,百度地圖和語音識別技術(shù)的結(jié)合已經(jīng)開始,后續(xù)能夠產(chǎn)生多大能量還有待時間驗(yàn)證。