霍娜
“人工智能在將來的5到10年,就像我們現(xiàn)在的水、電和互聯(lián)網一樣,在我們的生活中成為我們的必需品。以語音為主、鍵盤觸摸為輔的人機交互正逐漸成為剛需,人工智能產業(yè)迎來第三次發(fā)展浪潮”。 11月23日,在人工智能學科誕生60周年之際,以“人工智能+ 共創(chuàng)新世界”為主題的科大訊飛2016年度發(fā)布會在北京國家會議中心隆重舉行,科大訊飛董事長劉慶峰暢談人工智能。
語音識別與合成
去年,科大訊飛推出的訊飛聽見產品,實時將語音轉寫成文字,速度和準確率遠超人工速記,現(xiàn)場識別正確率達到99%以上。今年的發(fā)布會上,訊飛聽見進行實時語音轉寫,并以字幕形式呈現(xiàn),再次將這一剛需產品進行了推廣。
另外,訊飛聽見在實時中文語音轉寫的基礎上,融合全新的多語種翻譯技術,實時將中文演講翻譯成英語、日語、韓語以及維吾爾語并同步展示在大屏幕上,引發(fā)現(xiàn)場的一個高潮,這也是全球首次基于人工智能技術的實時機器多語種翻譯技術在大型活動上的展示,準確率比肩同傳翻譯。
會上,科大訊飛推出了兩款語音合成技術相關的產品——訊飛快聽和配音閣。訊飛快聽APP,通過打造個性化音庫,為用戶提供個性化語音合成服務,能隨時隨地朗讀任何文章,并有每日好文推薦,解放雙眼,想聽就聽,滿足用戶個性化需求,特別是在老人、戀人、兒童等人群有著廣泛的應用空間。比如,空巢老人可以每天聽到使用自己兒女的聲音播報的新聞以及生活提醒,拉近時空距離,增進親情。配音閣,致力于為用戶提供智能語音合成、真人配音及各種特色化、個性化配音服務。
科大訊飛還發(fā)布了中英互譯神器——“曉譯翻譯機”和完全自主產權的智能客服機器人——曉曼。曉曼機器人是一款專用于銀行業(yè)務的接待機器人,集成了AIUI人工智能技術,以及人臉、聲紋、遠場識別等科技,可以識別已登記過的顧客、提供個性化的推薦。目前,已有20多臺曉曼機器人在徽商銀行、建設銀行等地試點上崗,可以獨立辦理超過70%的業(yè)務。
發(fā)布會上,科大訊飛也展示了訊飛輸入法的新功能:可直接將紙上的文字轉錄,并支持手勢修改。臺上演示人員先是在一張白紙上手寫了一段“我現(xiàn)在有點緊張,發(fā)布會結束后,我晚上請大家吃飯”的文字,然后他舉著這張紙正對著機器人說“啟動拍攝”,機器在進行掃描后迅速將紙上的文字錄入了進去。此時響起了由衷的掌聲。
他接下來演示如何在這段文字里添加文字。他用手勢的體感交互在這段文字上進行光標定位,嵌入了“六點”倆字。然后他手輕輕一劃,屏幕上的文字就被清理干凈。然后他用語音輸入了一長段文字,先是發(fā)出口令“開始聽寫”,然后輸入“請慶峰幫我訂好火車票,把慶峰修改成慶豐包子鋪的慶豐,另外請慶峰幫我?guī)б槐緞?chuàng)新者的窘境,把創(chuàng)新者的窘境翻譯成英文,并加上書名號。”此時,屏幕上根據口令,將“創(chuàng)新者的窘境”瞬間改成《The Innovator's Dilemma》,場下頓時響起如雷掌聲。它不僅能識別“慶峰”和“慶豐”,還能從一長串語音中精準找到書名并根據指令進行修改,著實讓人吃驚。
科大訊飛輪值總裁胡郁透露了這套輸入法的奧秘:“首先得益于我們領先的離線手寫輸入的引擎,可以讓各種各樣的智能設備識別手寫文字。同時,我們知道要完成輸入,必須有一個確定性內容、確定性的功能保證,而語音在達到99.99%以后,剩下的0.01很難達到,我們看到,在沒有觸摸屏的情況下,用上帝賜給我們的自然的雙手(解決了這個問題)?!敝悄芗揖?/p>
在智能家居方面,科大訊飛推出了新款家庭智能盒子超腦魔盒,想要打造一個通過語音控制整個家具的智能生活。這款超腦魔盒涵蓋了影音、家居、英語學習、生活百科等多方面的功能,使之使用的場景基本覆蓋了家居生活的方方面面。而根據現(xiàn)場的演示情形來看,超腦魔盒可以通過語音操控來支持切換、快進等設置,而且沒有反應與操作的延遲。
當然,智能家居并不是一個新潮的概念,而近年來也出現(xiàn)了越來越多的智能家居產品。比如谷歌在今年的年度I/O開發(fā)者大會上,推出了能通過語音助理“聲控”的Google Home。谷歌是希望用Google Home來建立一個生態(tài)系統(tǒng),畢竟在它龐大的系統(tǒng)下,有著YouTube,有著Google Play這樣可以融入到生活中的產品。
智能駕駛
至于智能駕駛領域,科大訊飛則是對智能車載系統(tǒng)進行了升級,推出了全新的飛魚助理。通過將遠場識別、方言識別等技術應用于汽車,駕駛者則可以通過語音進行通訊、導航的操作,也可以對車身進行控制和信息查詢。據透露,科大訊飛目前已與30多個汽車廠商建立了長期合作,并已在100多款量產車型中搭載產品。
這套語音識別系統(tǒng)最大特點是訊飛人工智能在上下文理解方面的表現(xiàn),尤其在汽車里的語音助手演示,很多時候,老司機并沒有給它明確的指令,但它會給出一些你想要的結果。
比如說去長城,它會問你去八達嶺還是慕田峪長城;比如你問附近有什么酒店,它會自動搜索八達嶺長城附近的酒店并給出不同的價位段;比如你想在車里聽一首《甜蜜蜜》,它能夠調出鄧麗君的,你想聽鹿晗版的,它立馬切換,當你想聽“他和陶喆合唱的”,它會理解這個“他”指的是鹿晗,并且調出鹿晗和陶喆合唱的《請到長城來滑雪》;比如你晚上想去“中央財大”附近吃東西,它會搜索“中央財經大學”附近的參觀,你說想吃火鍋還想看電影,它就鎖定了大鐘寺的海底撈。
在汽車領域,有著太多的巨頭裹挾著資本與人才融入進來,正如今年一直處在輿論浪尖的無人駕駛。像是特斯拉選擇拋開一直合作的無人駕駛技術公司,自己投入巨大的人力物力,開發(fā)擁有“第5級自動駕駛的能力”的Autopilot 2.0;百度從載狗參加駕校測試,到在烏鎮(zhèn)的互聯(lián)網大會期間,高調宣傳“云驍”無人駕駛汽車,在無人駕駛領域也力圖謀得一方天下;更有谷歌無人駕駛汽車,行程已經突破了200萬英里;Uber的無人駕駛汽車,也已經在美國上路測試。
總的來說,智能化是汽車領域未來的方向,而力圖在車載環(huán)境下,通過語音實現(xiàn)多種控制的飛魚助理,也是一種變相的解放駕駛員的智能方式。
科大訊飛的遠景是人工智能,并且也提出了“訊飛超腦”計劃,直接對谷歌大腦和百度大腦發(fā)起挑戰(zhàn)。但更可以明確的是,科大訊飛在發(fā)展人工智能遠景的同時,把握住了人工智能的落地入口,這就是語音交互,這是比無人車、機器人更能呈現(xiàn)人工智能的剛需入口。
谷歌和百度在人工智能、腦科技方面發(fā)力已久,科大訊飛憑什么能挑戰(zhàn)巨頭?劉慶峰認為,科大訊飛最大的優(yōu)勢在于專注,專注于語音交互技術、專注于語音技術與智能家居硬件的結合。
正如劉慶峰所認為,人工智能的發(fā)展不會是一蹴而就的,創(chuàng)業(yè)者要有堅守的心態(tài)、毅力和恒心。這一領域未來的趨勢,是通過人機協(xié)同技術,聚焦人類智慧,提高各行業(yè)工作效率。