孟晉
人工智能正在成為新經(jīng)濟(jì)領(lǐng)域的核心技術(shù),智能語音助手作為人工智能的最佳切入點(diǎn),正在成為各大公司布局人工智能市場領(lǐng)域的關(guān)鍵。比如蘋果的Siri,微軟的Cortana、亞馬遜的Echo以及谷歌的谷歌助理。雖然智能語音助手尚處發(fā)展期,但智能語音助手已開始逐步滲透入人們的生活之中。智能語音助手逐漸從被動(dòng)變?yōu)橹鲃?dòng),通過搶占AI入口市場,很多服務(wù)和商業(yè)行為都可以通過語音識別技術(shù)來實(shí)現(xiàn)智能化操作,特別是與物聯(lián)網(wǎng)硬件的結(jié)合,能夠?yàn)橛脩籼峁└尤娴姆?wù)。
從蘋果的SIRI到星巴克的語音點(diǎn)單
提到智能語音助手,我們首先想到的應(yīng)該是這項(xiàng)技術(shù)的先驅(qū)—蘋果Siri 。自從蘋果 2010 年收購 Siri 公司為蘋果設(shè)備開發(fā)虛擬助理后,Siri就成為蘋果手機(jī)的賣點(diǎn)之一。Siri的出現(xiàn)也是消費(fèi)電子界第一次向市場科普性地介紹智能語音助手。
Siri可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排、搜索資料等應(yīng)用,還能夠不斷學(xué)習(xí)新的聲音和語調(diào),提供對話式的應(yīng)答。Siri可以令iPhone4S及以上手機(jī)(iPad 3以上平板)變身為一臺智能化機(jī)器人,利用Siri用戶可以通過手機(jī)讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等。
在技術(shù)的不斷追逐中,人們看到智能語音助手展現(xiàn)的巨大價(jià)值。雖然蘋果的 Siri 自面世以來就成為了智能語音助手的代言人,但更多的公司希望用新的人工智能技術(shù)來超越現(xiàn)有的智能語音助手所覆蓋的領(lǐng)域。
2014年,微軟官方發(fā)布了 Cortana(小娜)這個(gè)類似 Siri 的個(gè)人語音助理平臺。微軟的小娜不僅可直接與微軟搜索引擎必應(yīng)相連,還能真正的充當(dāng)個(gè)人助理。這意味著,它可以為主人做很多事情,比如安排會(huì)議、訂購機(jī)票、設(shè)置鬧鈴,甚至能夠講笑話。
2014年3月,谷歌宣布Google Now語音服務(wù)正式登陸Windows和Mac桌面版Chrome瀏覽器。但是由于推廣效果不佳,2016年初,谷歌又推出了基于人工智能技術(shù)的語音數(shù)字助理“谷歌助理”(Google Assistant)、家用智能硬件“谷歌家庭”(Google Home)以及智能短信和視頻通信應(yīng)用等最新產(chǎn)品。
從2015年起,國內(nèi)也陸續(xù)出現(xiàn)了靈犀語音助手、百度語音助手、出門問問、歐拉蜜等多種應(yīng)用。比如靈犀是由中國移動(dòng)和科大訊飛聯(lián)合推出的智能語音助手,既能為您語音打電話、發(fā)短信、查天氣、設(shè)置提醒,又能幫你查話費(fèi)、查流量、買彩票、訂購彩鈴,還可以陪你語音聊天
如今,越來越多的公司希望將將智能語音助手背后的自然語言解析技術(shù)運(yùn)用到包括電子商務(wù)、娛樂行業(yè)等領(lǐng)域,使各個(gè)領(lǐng)域的客戶能夠創(chuàng)建自己的語音助手。
比如全球最大的語音識別公司Nuance針對企業(yè)市場也不斷推陳出新。Nuance的虛擬客服助理Nina集成了語音識別、語音合成以及自然語言理解技術(shù)。很多品牌都采用了由Nina平臺提供技術(shù)支持的虛擬助理,其中包括達(dá)美樂比薩的Dom、荷蘭國際集團(tuán)的INGE、捷星航空的Jess以及美國聯(lián)合服務(wù)汽車協(xié)會(huì)網(wǎng)站和澳大利亞稅務(wù)局(ATO)新推出的虛擬助理。
Nuance進(jìn)入中國市場后在國內(nèi)市場早已和HTC、華為、宏碁和上汽等知名公司在移動(dòng)終端設(shè)備和汽車領(lǐng)域建立了良好的合作關(guān)系。在中國企業(yè)客戶自助服務(wù)方面,中國移動(dòng)江蘇省在10086客服號使用了由Nuance及華為合作實(shí)施的自然語言導(dǎo)航應(yīng)用,浦發(fā)銀行信用卡中心也同樣部署Nuance自然語言理解(NLU)以及來電導(dǎo)航技術(shù)(小浦隨心聽),為客戶提供更加直觀、擬人對話式的用戶體驗(yàn),成為了國內(nèi)信用卡行業(yè)首家提供語音導(dǎo)航服務(wù)的銀行。
2017年,咖啡連鎖巨頭星巴克在公司的移動(dòng)應(yīng)用My Starbucks里推出了一項(xiàng)新的語音助手功能,方便用戶通過語音點(diǎn)單和支付。借助該功能,用戶便可修改自己的訂單,就像在現(xiàn)實(shí)世界中與真的咖啡師交流一樣。
通過硬件搶占AI入口市場
智能語音助手真正的付費(fèi)用戶還是企業(yè)級用戶,正如星巴克利用語音技術(shù)來點(diǎn)單一樣。多以圍繞著企業(yè)級用戶群體,新的商業(yè)合作馬上就如雨后春筍一般開始成長。
2016年Alphabet推出了能通過語音助理“聲控”的Google Home。Google Home可以讓你聽音樂,處理很多的任務(wù),只需要跟Google Home對話就可以了。在CES 2017展會(huì)上,Alphabet圍繞Google Home發(fā)布了新消息,將虛擬助手放進(jìn)了現(xiàn)代、克萊斯勒汽車;Alphabet還收購了Limes Audio,這家公司專門開發(fā)語音通信系統(tǒng),未來Limes Audio的技術(shù)可能會(huì)植入Google Home、Hangouts及其它產(chǎn)品。
微軟也與日產(chǎn)合作,將Cortana裝進(jìn)汽車。根據(jù)CES 2017上日產(chǎn)發(fā)布的概念視頻來看,Cortana 現(xiàn)階段的功能僅限于通過語音修改日程表、路線規(guī)劃等簡單任務(wù)。概念視頻還展示了 Cortana 在到達(dá)目的地后詢問駕駛員是否需要開啟自動(dòng)泊車,預(yù)示了 Cortana 日后可以更多地參與汽車操控。
同時(shí),為了搶占AI入口,微軟公布了一系列有關(guān)語音助手的開發(fā)工具,包括 Cortana Skills Kit 和 Cortana Devices SDK,極大地?cái)U(kuò)展了 Cortana虛擬助理的適用范圍。這些工具將讓物聯(lián)網(wǎng)領(lǐng)域的OEM 和 ODM 廠商能夠圍繞 Cortana 輕松打造第三方智能物聯(lián)網(wǎng)設(shè)備,以及開發(fā)與這些物聯(lián)網(wǎng)設(shè)備相關(guān)的應(yīng)用程序。微軟表示,Windows 10 的遠(yuǎn)場語音交互正在完善中,未來將能夠讓用戶在房間的另一端,直接向微軟小娜提問或者讓它播放一首歌,再或者語音喚醒和關(guān)閉電腦。與此同時(shí),物聯(lián)網(wǎng)版本的 Windows 10 IoT Core 在 Creators Update 更新中將加入 Cortana。
未來廠商基于 Windows 10 IoT Core 所打造的冰箱、洗衣機(jī)、恒溫器、智能鏡子等物聯(lián)網(wǎng)設(shè)備,無論是有屏幕還是沒有屏幕都將支持與 Cortana 進(jìn)行交互。
蘋果也在開發(fā)受虛擬語音助手Siri支持的智能家居設(shè)備。據(jù)悉,蘋果開發(fā)的智能家居設(shè)備能夠通過語音控制屋內(nèi)的各種電器、開關(guān)、燈光等。該設(shè)備的測試階段還使用了面部識別技術(shù)。不同的是,Siri智能語音控制家居設(shè)備制勝的法寶分別是高質(zhì)量的麥克風(fēng)和語音處理技術(shù)。另有消息人士稱,蘋果還添加了臉部識別傳感器。
同時(shí),蘋果開始向外界授權(quán)Siri技術(shù)。2016年6月,蘋果宣布開放Siri后臺代碼,通過API提供給第三方開發(fā)者,用戶可以用語音Siri命令激活A(yù)PP,還可以為Siri增加新功能和新數(shù)據(jù),避免犯下當(dāng)年蘋果將操作系統(tǒng)的蛋糕讓給了微軟的錯(cuò)誤。
谷歌則將“谷歌助理”與家庭產(chǎn)品結(jié)合,推出了名為“谷歌家庭”的家用智能硬件?!肮雀杓彝ァ豹q如一只胖肚花瓶,是一款無線聲控小型音響,可以連接電視、燈具和空調(diào)等家用電器?!肮雀杓彝ァ边@款家用智能硬件設(shè)備可通過與用戶雙向?qū)υ挼男问介_展持續(xù)“互動(dòng)”,幫助用戶完成一系列家庭日?;顒?dòng)。融合“機(jī)器學(xué)習(xí)”和在線搜索等技術(shù),“谷歌家庭”可以對用戶的語音指令作出反應(yīng),執(zhí)行一系列家庭日常任務(wù),比如播放音樂、關(guān)閉房間的照明、回答知識性問題、查詢交通狀況、幫用戶修改預(yù)約等。用戶通過自然說法的方式即可控制設(shè)備。
目前谷歌正在 Pixel 中為 Google Assistant 添加全新功能,允許用戶通過 Google Assistant 虛擬助理來控制智能家居設(shè)備,該功能被稱為“Home Control”,而目前支持的智能家居廠商和產(chǎn)品包括貝爾金的 Wemo,谷歌的 Nest,飛利浦 Hue 以及三星的 SmartThings 系列。此次讓 Pixel 擁有智能家居控制功能無疑帶來許多便利:用戶無需針對某個(gè)智能設(shè)備去單獨(dú)下載操作該設(shè)備的 APP。而且這種通用性也讓用戶無需購買 Google 自家的智能家居設(shè)備就能享受到語音控制的便利。如果家中的智能設(shè)備支持,用戶能夠向 Pixel 發(fā)出語音指令,就能調(diào)節(jié)屋內(nèi)溫度,控制照明,切換電視頻道,播放音樂等。
位于愛爾蘭都柏林的Voysis公司則希望通過自己的AI平臺來切入企業(yè)級語音助手市場。2017年初,Voysis公司獲得了800萬美元A輪投資,由Polaris Partners領(lǐng)投。Voysis公司開發(fā)了一個(gè)深度學(xué)習(xí)引擎,專門用于模擬語音和語言任務(wù)。不同于Google Assistant,Voysis公司開發(fā)的Voysis Search可以直接集成到網(wǎng)站或應(yīng)用程序中,用戶可以直接與品牌的網(wǎng)站或應(yīng)用程序交互,瀏覽可使用的產(chǎn)品。
據(jù)悉,Voysis平臺可以獲取所有相關(guān)數(shù)據(jù),包括產(chǎn)品名稱、類別、描述、評價(jià)以及元數(shù)據(jù)等,以創(chuàng)建用于強(qiáng)化語音體驗(yàn)的強(qiáng)大模型。即使在初始問題已經(jīng)提出后,Voysis還可以細(xì)化搜索,這是其他虛擬助手在今天還無法實(shí)現(xiàn)的。目前,Voysis的平臺支持16種語言,包括普通話、俄語、阿拉伯語和其他歐洲語言。
市場咨詢公司Tractica發(fā)布的報(bào)告稱,雖然目前最流行的還是智能手機(jī)消費(fèi)者虛擬數(shù)字助手,但是虛擬助手技術(shù)已經(jīng)開始進(jìn)入其它設(shè)備,比如智能手表、健身追蹤器、PC、智能家庭系統(tǒng)、汽車。
亞馬遜Alexa的成功之道
在使用智能語音助手搶占AI入口市場的戰(zhàn)斗中,美國電商巨頭亞馬遜公司推出的內(nèi)置“亞歷克薩”(Alexa)語音助理功能的“亞馬遜回聲”(Amazon Echo)智能音箱獲得了巨大成功。該產(chǎn)品是貝索斯在2014年11月推出的,可以接受各種語音命令,使用的時(shí)候,只要說一聲“Alexa”。
亞馬遜在語音技術(shù)方面的投入算來有些晚,亞馬遜2011年收購語音識別公司Yap,這家公司成立于2006年,主攻語音轉(zhuǎn)換文本的技術(shù)。2012年,亞馬遜又收購了語音技術(shù)公司Evi,其在商品搜索的語音識別上有獨(dú)特技術(shù)。2013年亞馬遜又收購Ivona Software,做文本語音轉(zhuǎn)換技術(shù)。
Alexa的主要功能是讓用戶可以通過Echo的語音識別功能,操控任何一項(xiàng)具有聯(lián)網(wǎng)功能的設(shè)備,比如電燈、電視、空調(diào)等等。得益于高效率的語音識別功能,Alexa可以幫助用戶通過語音指令迅速驅(qū)動(dòng)相關(guān)軟件。據(jù)亞馬遜的數(shù)據(jù),Alexa在2014年最初發(fā)布時(shí)只有13個(gè)內(nèi)嵌的技能,到了2016年11月,這項(xiàng)功能已經(jīng)兼容6000款應(yīng)用,包括連接Uber、Twitter等應(yīng)用程序。到2017年3月,亞馬遜宣布其Alexa智能語音助手平臺的功能已經(jīng)突破了一萬種?;蛟S你覺得一萬算不了什么,但你知道嗎,2016年1月,這個(gè)數(shù)字才不過130,而2016年11月也才6000,如今才過了不到4個(gè)月的時(shí)間,就已經(jīng)翻倍到一萬,這種增速讓人大為吃驚。
是什么讓亞馬遜的Alexa取得了成功?答案是高質(zhì)量、低價(jià)格和開放的推廣策略。Alexa平臺的高質(zhì)量體現(xiàn)在其獨(dú)特的語音識別技術(shù)上,低價(jià)格體現(xiàn)在其建立用戶群的思維中。2016年下半年,亞馬遜推出Echo Dot二代產(chǎn)品,售價(jià)僅50美元,成為去年假日購物季最熱賣的產(chǎn)品之一。據(jù)悉,2016年,亞馬遜Alexa成為最炙手可熱的語音助手,在2016年12月的假日購物季,Echo的銷量同比增長了9倍。
所謂的開放性,那就是開放自己的Alexa智能平臺,允許第三方開發(fā)者和第三方硬件廠商在該平臺上開發(fā)各種基于語音的技術(shù)功能。這是一項(xiàng)非常了不起的舉措。
正是通過對第三方的免費(fèi)開放策略,Alexa吸引了大量的個(gè)人開發(fā)者和廠商,也獲得了日益豐富的功能。Alexa幫助各種硬件設(shè)備連接、控制家居設(shè)備,幫助打造一個(gè)完整的生態(tài)閉環(huán),進(jìn)而成為萬物互聯(lián)的智能樞紐和控制中心。這種開放策略與當(dāng)年谷歌開放Android技術(shù)類似,從這種策略我們可以窺測出亞馬遜的野心和意圖,那就是通過開放,把Alexa打造成智能家居、萬物互聯(lián)版的安卓。
據(jù)悉,如果你是Echo用戶,就會(huì)知道每周Alexa APP都會(huì)增加新功能,隨著第三方開發(fā)者越來越多,Alexa會(huì)的本領(lǐng)技能越來越廣泛,除了基本功能、訂餐、購物、打車、控制電器等功能外,新聞、游戲、教育等方面的技能也日益凸顯,亞馬遜甚至還建立了一個(gè)Alexa技能商店,頗有點(diǎn)想建立另外一個(gè)“蘋果帝國”的意圖。
2016年12月,英特爾與亞馬遜聯(lián)合宣布,雙方未來將在一系列智能家庭項(xiàng)目上合作。汽車生產(chǎn)商福特在CES2017上也宣布與亞馬遜合作,未來車主將能夠在福特的車輛上體驗(yàn)Alexa語音服務(wù),實(shí)現(xiàn)聲控購物、搜索導(dǎo)航,甚至車主在家就可以通過語音指令啟動(dòng)引擎、鎖定或解鎖車門。華為也宣布今年1月6日在美國開售的Mate 9智能手機(jī)成為第一個(gè)預(yù)裝Alexa虛擬助手的智能手機(jī)。Mate 9將于1月6日在美國市場發(fā)售,售價(jià)為600美元。
亞馬遜已經(jīng)成為通過智能語音助手搶占AI入口的真正大贏家,它與LG、Dish Network、惠爾浦、華為、英特爾、福特的合作,不斷擴(kuò)大了Alexa的版圖。
智能語音助手將成為AI的主戰(zhàn)場
人工智能將成為人機(jī)互動(dòng)的砥柱,語言是人類用來交流的最廣泛的一種工具。人類在地球上的成功,很大程度上依賴于復(fù)雜的語言和如此多樣的詞匯。而且語言交流迅速、直接,是布局人工智能市場的最佳切入點(diǎn)。
2016年被認(rèn)為是主流科技公司迎接智能語音助理的發(fā)展元年,近期在歐美持續(xù)走紅的亞馬遜Echo更凸顯了該趨勢,通過Echo的智能語音助理Alexa,用戶直接說話,即可完成設(shè)置鬧鐘、叫車、訂餐等。用戶需要調(diào)整什么業(yè)務(wù),這些事情都可以通過虛擬助理來完成。
如果智能語音助手技術(shù)成熟,Echo將有望替代目前的人工客服。亞馬遜的云服務(wù)部門AWS正在為常設(shè)客服崗位的各類企業(yè)開發(fā)一套云端軟件,讓Alexa接聽用戶打進(jìn)來的電話,或者用文字回復(fù)顧客咨詢。這個(gè)內(nèi)部開發(fā)代號為Lily的軟件,據(jù)稱包括了亞馬遜去年推出的文本和語音互轉(zhuǎn)服務(wù)Lex和Polly,預(yù)計(jì)在今年3月中旬發(fā)布。
伴隨著諸多科技企業(yè)紛紛涉足虛擬助手技術(shù),社交網(wǎng)絡(luò)霸主Facebook也欲憑借著語音助手“Moneypenny”進(jìn)入該領(lǐng)域,這項(xiàng)綜合功能能夠幫助消費(fèi)者完成產(chǎn)品購買和在線服務(wù)等在內(nèi)的多項(xiàng)任務(wù)操作。據(jù)報(bào)道該項(xiàng)目正處于內(nèi)部測試階段,聲稱為現(xiàn)代化數(shù)字助手服務(wù)帶來人性化體驗(yàn),例如用戶可要求Moneypenny對目前市場HDTV市場行情作為判斷和研究,并下單購買。
諾基亞也在準(zhǔn)備推出自己的虛擬助手,名字可能為“Viki”。諾基亞在歐盟為“Viki”申請了注冊商標(biāo)。在應(yīng)用程序的產(chǎn)品描述部分,公司描述Viki“用于創(chuàng)建和監(jiān)控使用數(shù)字知識的移動(dòng)和Web助手,并將所有數(shù)據(jù)源合并在單獨(dú)的語音界面顯示。這也意味著諾基亞也即將加入激戰(zhàn)正酣的虛擬助理大戰(zhàn)。
雖然智能虛擬助理技術(shù)已經(jīng)歷了較長時(shí)間發(fā)展,但科技巨頭們都認(rèn)為,智能虛擬助理尚處發(fā)展期,未來智能助理發(fā)展的道路仍任重而道遠(yuǎn)。