文/本刊記者 陳平
鄔霄云 Naturali 奇點機智創(chuàng)始人兼CEO
紐約州立大學計算機博士,擁有8年Google研究院、1年Yahoo實驗室工作經驗,回國前負責美國應用搜索公司Quixey.com搜索部門。擁有深度學習、自然語言處理、互聯(lián)網(wǎng)大數(shù)據(jù)、分布式計算的經驗。
鄔霄云是一名海歸,Naturali奇點機智語音對話平臺“對話流”的靈感來自于一次開車發(fā)生碰撞之后。面對繁瑣的車輛定損、保險索賠等流程,如果有一個平臺可以用對話交互的形式獲取下一步操作指示、案件進展,整個流程就會變得簡單、清晰。
本著“將對話與服務連接起來,打造更加自然的語言交互體驗”的初心,2015年2月,Naturali奇點機智在北京成立。
作為當前AI三種形態(tài)之一的智能語音交互技術,涉及語音識別、自然語言理解、對話管理、自然語言生成、語音合成等技術及綜合運用,其中自然語言理解、對話管理、自然語言生成的流程又被稱為智能對話系統(tǒng),是整個智能語音交互過程中的核心技術難點。也就是說,讓機器不僅僅做到識別語音中的字,還要能夠理解語音表達的意思,在“聽懂—理解—回答”的閉環(huán)下完成多輪對話、意圖推理、個性化及情感互動。
盡管目前的語音交互尚未完全成熟,但對話式交互已是大勢所趨,國內外互聯(lián)網(wǎng)巨頭普遍認為此項技術前景可期,將其作為人工智能戰(zhàn)略的重要組成部分深度研發(fā)。
作為國家高新技術企業(yè),奇點機智創(chuàng)辦3年來著力深耕此項技術的研發(fā)和應用,通過在自然語言處理(NLP)、深度學習(Deep Learning)、移動搜索領域的深度探索,努力為企業(yè)、開發(fā)者提供垂直場景下的智能語音對話交互解決方案。
“生活在信息社會當中,人們需求的是服務,而非獲取APP?!编w霄云說,人們并不關心服務來自哪個APP,只關心怎樣得到服務。他向記者演示了企業(yè)早期開發(fā)的“語音助手”:在安裝了語音助手的手機中,只需打開語音助手,說一句“我要訂外賣”,手機界面就能直接打開外賣APP選擇訂餐。如果說“我要訂麻辣燙”,則手機直接就能將外賣APP中提供麻辣燙的商家界面打開,省去了4、5步的點擊流程。
奇點機智最近又研發(fā)出了功能更加強大的語音對話平臺“對話流”,創(chuàng)造了從識別用戶意圖到完成相關操作的完整體驗,不僅僅能夠定義對話體驗,也可以幫用戶完成后續(xù)操作。鄔霄云告訴記者,“對話流”以需求、服務為搜索對象,即搜即得、即說即用,實現(xiàn)了“從需求到服務”的完整閉環(huán),為企業(yè)提供個性化、靈活、深度服務,讓對話到服務快而有效。
“對話流”具有三大核心優(yōu)勢:
1、直達服務。目前市面上的大多數(shù)互聯(lián)網(wǎng)產品是基于GUI(圖形用戶界面)的,需要用戶層層點擊完成相關操作。例如點外賣時,至少需要點擊五步才能到達最終的服務界面。而CUI對話用戶界面只需要一步就可以直達服務,用自然的語言去表達需求,沒有任何學習成本。
2、降低成本。目前傳統(tǒng)的對話開發(fā)平臺普遍面向有技術背景的開發(fā)者進行二次開發(fā),而對于NLP、機器學習技術相對薄弱的企業(yè)或是沒有開發(fā)人員的企業(yè)來說,打造定制化語音交互體驗是一大難題?!皩υ捔鳌贝蟠蠼档土碎_發(fā)門檻,每個企業(yè)都能定義語音對話交互體驗。對話流的可視化、模塊化界面操作簡單,不需要寫代碼或自然語言處理領域專業(yè)知識即可輕松創(chuàng)建語音對話體驗,并且創(chuàng)建后可以根據(jù)業(yè)務需求隨時修改調整。不僅面向開發(fā)者,產品運營人員也可以定義操作。以智能客服為例,據(jù)統(tǒng)計,智能機器人客服可以解決85%的常見客服問題,而一個機器人坐席的花費只相當于一個人工坐席花費的10%。
3、理解精準。以訂餐為例,當用戶說“幫我訂一份小龍蝦”“叫一份小龍蝦外賣”“我想點份小龍蝦”時,其實都對應到了“訂小龍蝦外賣”這個意圖。多數(shù)語音對話交互系統(tǒng)并不智能的主要原因,是面對用戶的不同說法,無法識別用戶意圖,從而出現(xiàn)與“對不起,您說的我聽不懂哦”類似的回答。表達一個含義、用戶說法卻千變萬化,如何理解客戶的意圖,將各種形式的表達歸一化,是奇點機智突破的一大技術難點。利用自主研發(fā)的自然語言理解NLU技術支持,攻克中文語義理解難題,準確理解用戶不同的表達方式并匹配到相關意圖,只需提供幾個用戶說法的例子,對話流即可擴展識別多種問法,使用少量數(shù)據(jù),即可快速訓練有效模型,完成意圖識別、說法泛化和實體擴展,上述問題迎刃而解。
為研發(fā)人員分享機器閱讀理解技術
對話式UI
“對話流”的出現(xiàn)解決了企業(yè)長期以來的痛點,在很多環(huán)節(jié)都為企業(yè)帶來了事半功倍的效果,例如節(jié)約人工成本、使企業(yè)24x7在線、提升用戶體驗、增加轉化效率、多渠道與用戶互動等,讓打造跨平臺、跨設備的語音對話體驗變得簡單、高效。
鄔霄云告訴記者,企業(yè)用戶可以通過該平臺為企業(yè)內部服務、客服、應用助手、聊天機器人等產品創(chuàng)建即時可用的智能對話體驗??缙脚_、跨設備,該體驗可廣泛集成于WEB、APP、小程序、微信公眾號、智能硬件等終端。無需編程,企業(yè)沒有自然語言處理 NLP 技術積累,也能直接創(chuàng)建。
“需要什么樣的服務,就能用機器把意思表達出來,真正提升了用戶的體驗度、增強了用戶黏性?!编w霄云說。
據(jù)了解,“對話流”可以為企業(yè)的各類平臺打造智能客服、語音助手、聊天機器人等,并且能夠在很大程度上賦能傳統(tǒng)行業(yè),企業(yè)用戶可以通過該平臺創(chuàng)建精準、個性化的智能對話體驗。
舉例來說,奇點機智正在為唯品會APP定制語音助手,除了語音快捷搜索相關商品外,還可以通過語音對話的形式獲取一些隱藏比較深的服務,比如查詢快遞狀態(tài)、開發(fā)票、申請退款、開啟指紋支付等功能,一句話就能直達最終頁面。
近兩年,百余家銀行、證券、保險公司上線智能客服系統(tǒng),用戶通過語音對話的形式得到了更加精準、個性化的咨詢和服務,大大節(jié)省了呼叫中心人工坐席的成本。招商、中信、光大、工商銀行等都能夠通過語音對話完成日常金融交易。
而在醫(yī)療領域,初次就診的患者往往不清楚就醫(yī)流程,不懂怎么回答醫(yī)生的問題。門診醫(yī)生看診任務繁重,每位病人每次看診幾乎只能與醫(yī)生溝通幾分鐘。醫(yī)患信息嚴重不對等、就醫(yī)體驗差也導致了醫(yī)患關系的緊張。鄔霄云說,如果醫(yī)院借助“對話流”,搭建一套完善的導診服務,既可以有效引導患者掛號、分診,也可以協(xié)助醫(yī)生對患者進行“預問診”,為醫(yī)生提供“預問診報告”,提前掌握患者的基本資料和病情,提升診療的準確率和效率。
目前,奇點機智已經為國內大型電商、手機廠商等企業(yè)提供了靈活定制的語音對話交互解決方案,合作伙伴包括唯品會、聯(lián)想、國美、樂視、度秘等。
鄔霄云表示,未來“對話流”還將繼續(xù)深耕電商、金融、零售、醫(yī)療、教育等諸多領域,在推動經濟高質量競爭發(fā)展中嶄露頭角。
Naturali 奇點機智有一支技術驅動型精銳創(chuàng)業(yè)團隊,在移動搜索引擎和自然語言處理領域擁有多項國際專利,團隊成員來自于Google、Microsoft、Facebook等企業(yè),其中有多位工程師獲得ACM國際競賽金牌。
鄔霄云是擁有1年雅虎實驗室、8年谷歌研究院工作經驗的資深科學家,公司自然形成了一種輕松自由、熱愛創(chuàng)造、挑戰(zhàn)極限的硅谷文化。
談起回國創(chuàng)業(yè)的初衷,鄔霄云表示起初并沒有太崇高的想法,只是覺得創(chuàng)業(yè)就好比做一個實驗,想去做一件事情然后達到一個目標而已,很單純。而他的目標就是基于自然語言處理技術來優(yōu)化人機交互體驗。
鄔霄云認為,在當今的AI行業(yè)中,計算機人臉識別已經有了剛需應用場景,比如商湯、曠視等企業(yè)在安防、銀行等場景中都有了顛覆性的表現(xiàn),自動駕駛也出現(xiàn)了pony.ai等企業(yè),唯獨在大家都看好的智能語音交互和自然理解領域仍在挖掘剛需場景,獨角獸企業(yè)相對較少。分析原因,他認為主要是技術距離應用場景還比較遠,離真正的實用還有距離?!耙驗榈侥壳盀橹?,國內從事智能語音交互的AI公司仍然沒有琢磨出到底什么樣的場景下更適用這項技術,讓應用更加自然?!?/p>
創(chuàng)辦僅3年時間,Naturali奇點機智已經獲得了“2017新智造成長榜50強明星企業(yè)”“NVIDIA中國人工智能初創(chuàng)公司挑戰(zhàn)賽5強”等多項殊榮,語音對話平臺“對話流”榮登AI企業(yè)級應用產品實力榜單。在2017年人工智能先行者大會上,奇點機智躋身于年度“最具商業(yè)價值AI公司TOP 50”中。今年5月,在目前國內最大、最具挑戰(zhàn)性的中文閱讀理解數(shù)據(jù)集“2018 機器閱讀理解技術競賽”上,憑借自然語言處理(NLP)領域多年的積累與沉淀,奇點機智從國內外 800 多支報名隊伍中脫穎而出,獲得了“機器閱讀理解技術大賽冠軍”。
多年間深耕這一領域,鄔霄云越發(fā)覺得語音交互有著得天獨厚的條件,從世界范圍來看這都是一個前沿技術?!耙驗樽匀徽Z言的表達對人們來說是沒有學習成本的,人機交互將會變得非常舒服?!编w霄云表示,人類在當前的條件下,在尊重原理和定律的前提下,但凡有可能,我們就一定能夠在這個領域做到最好。
2014年,Naturali奇點機智完成了真格基金100萬美元天使輪融資,2016年完成襄禾資本、NEA 500萬美元A輪聯(lián)合投資,并已于近期完成了A+輪融資。目前入駐中關村智造大街,并代表智造大街參展2018北京雙創(chuàng)周。
在資本的助力下,Naturali奇點機智將不斷致力于智能語音交互的場景深度融合,努力推動自然語言理解技術的變革。隨著智能語音各項技術的發(fā)展,相信將會有越來越多的產品走進人們的生活、影響人們的行為習慣,甚至帶來新的產業(yè)革命。
團隊2018年韓國漢拿山團建活動