趙文聰
2018年,物流業(yè)、金融業(yè)、零售業(yè)等重資產(chǎn)傳統(tǒng)行業(yè);城市管理、交通運輸、政務(wù)工業(yè)等國民生計各個方面;游戲、醫(yī)療、電商、視頻、在線教育等新產(chǎn)業(yè)的各個領(lǐng)域,都充斥著“智能+”的身影。
近日,《陸家嘴》雜志接觸到快商通COO劉曉葳,作為“智能+”市場領(lǐng)域的參與者,這家公司已將自主研發(fā)的聲紋識別技術(shù)落地應(yīng)用在金融、安防、社保、智能家居、物聯(lián)網(wǎng)等領(lǐng)域,推出“金融信貸身份反欺詐”、“社保異地生存驗證”等行業(yè)解決方案。
此前,智研咨詢發(fā)布《2018-2024年中國聲紋識別技術(shù)行業(yè)市場運營態(tài)勢及發(fā)展前景預(yù)測報告》指出,2017年聲紋識別技術(shù)的全球收入為1.32億美元,而這一數(shù)值在幾年后將增至1.59億美元,增速達(dá)到20.5%,預(yù)計到2021年,聲紋識別技術(shù)的全球收入將達(dá)到2.64億美元。僅從這一數(shù)值來看,聲紋識別的市場預(yù)期樂觀。
《陸家嘴》:快商通是一家于2009年成立的AI公司,你覺得快商通在金融領(lǐng)域布局的核心競爭力是什么? 可以從技術(shù)和商業(yè)兩個維度分別與大家分享一下嗎?
劉曉葳:我們現(xiàn)在主要提供兩方面的技術(shù),一是自然語言處理,一是聲紋識別,剛好這兩方面是前后端關(guān)系。
聲紋識別是通過收集不同人的聲音特征,再根據(jù)聲音特征去識別人的身份,這項技術(shù)可以廣泛地應(yīng)用于反欺詐、身份確認(rèn)等方面。
對于自然語言處理,它是在人工智能領(lǐng)域里面最難的一個部分,面對前端一些語言的構(gòu)成,先要由語音識別,再通過聲紋識別確認(rèn)身份以后,接著通過語音識別做一些文字的轉(zhuǎn)化,它最終服務(wù)的才是自然語言處理。
在銀行的應(yīng)用場景下,本身也有很多具有文本化的結(jié)構(gòu)信息。小到一個合同,一些紙質(zhì)文本的數(shù)據(jù),所以整個技術(shù)方面是提供這兩項技術(shù)。
這兩項技術(shù)可以服務(wù)于怎樣的商業(yè)場景呢?在風(fēng)控方面,聲紋識別幫助我們從源頭識別人的身份,然后更多地應(yīng)用到其他場景,例如電話場景,以前在電話場景下沒有辦法做風(fēng)控,但由于目前聲紋識別可做身份確認(rèn),所以已可以應(yīng)用。
另外,在銀行整體經(jīng)營效率的改進(jìn)和優(yōu)化中,通過自然語言處理的方式,也可以讓計算機(jī)更多理解和處理這些文本信息,從對應(yīng)信息中提取出一些高度結(jié)構(gòu)化的東西,或者發(fā)現(xiàn)一些敏感的內(nèi)容。從而在降低風(fēng)險、降低成本、提升效率等方面服務(wù)于銀行。
《陸家嘴》:那你認(rèn)為人類語言信息(和聽覺信息)在金融各場景中產(chǎn)生的價值有多大?
劉曉葳:我認(rèn)為價值有以下幾點,首先人類跟其他動物的最大區(qū)別,我認(rèn)為在于語言能力,而語言能力又轉(zhuǎn)化為書面能力、口頭表達(dá)能力,所以我們在整個金融場景中會留存很多結(jié)構(gòu)。其實以前數(shù)據(jù)分析只是聚焦在可量化的數(shù)值化行為數(shù)據(jù),一大部分?jǐn)?shù)據(jù)實際都被放棄掉,我們沒有辦法從中挖掘出任何東西。
現(xiàn)在這部分?jǐn)?shù)據(jù)無論對我們整體的風(fēng)控還是提高銀行的效率、完善經(jīng)營控制等方面都是一個補(bǔ)全。
《陸家嘴》:快商通是如何用聲紋識別作為切入的?
劉曉葳:所謂的切入點,是這個口可以切。例如以前沒有做過的領(lǐng)域或者相對較少覆蓋的領(lǐng)域。在我看來,金融科技領(lǐng)域是一個類似盲區(qū)的點。此外,想要切入,說明業(yè)務(wù)對應(yīng)的需求開始迫切。
我們可以立足這兩點逐步分析一下,業(yè)務(wù)切口對于聲紋需求的迫切性表現(xiàn)在哪里?
我們第一步聲紋識別選擇的切入點是電話貸款業(yè)務(wù),電話貸款業(yè)務(wù)雖然在很多金融機(jī)構(gòu)已有較大企業(yè)規(guī)模量,但是,這些企業(yè)在此業(yè)務(wù)上主要流通的是語音數(shù)據(jù),沒有任何所謂的行為數(shù)據(jù),也沒有數(shù)字化數(shù)據(jù),僅僅有的就是語音。
我們以前通過電話通信角度想要知道一個人的真實身份,沒有辦法對身份做一些較為精準(zhǔn)的確認(rèn)。但目前在使用電話通道的時候,對于一些具體的場景,比如銀行中個人在申請貸款,我們可以通過聲紋識別更為準(zhǔn)確地判斷對方身份。
目前已有的一些大公司,在電話場景下已有很多像信用卡、貸款等方面的應(yīng)用,還有大量小型的機(jī)構(gòu)、地方銀行,都在逐步拓展這個業(yè)務(wù)線,因為它們的零售業(yè)務(wù)量一定是越來越大,所以從現(xiàn)在開始搭建聲紋識別的聲紋庫和聲紋識別引擎是一個好的時機(jī),以免未來金融機(jī)構(gòu)自身業(yè)務(wù)量非常大的時候,他們要重新收集這些東西將會是很困難的。所以這是一個切入點。
除了“盲區(qū)”和需求迫切之外,切入點還有第三個特性,即它是一個入口,或者叫做一個起點。
我們現(xiàn)在的布局就是以聲紋識別為輻射中心,在完成對應(yīng)身份確認(rèn)的過程,后續(xù)會展開對應(yīng)人的一系列行為數(shù)據(jù),在判斷屬于同一個人的行為數(shù)據(jù)后,后續(xù)其他連帶領(lǐng)域還有很多東西可以進(jìn)一步發(fā)展。
《陸家嘴》:金融“科技化”中用戶體驗與安全風(fēng)控如何平衡?
劉曉葳:其實根本上還是要符合業(yè)務(wù)的需要。業(yè)務(wù)需要是什么?舉兩個具體的場景。
第一個場景就是支付。以華為為例,華為新發(fā)布的手機(jī)Mate 20系列,搭載了聲紋識別,但是解鎖手機(jī)的安全隱私性就類似于支付的場景。
所以在對應(yīng)支付場景下的體驗對安全性的要求非常高,會降低用戶體驗。例如要利用聲紋識別進(jìn)行支付,那么聲紋的技術(shù)則要求錯誤率極低,幾乎為零,才能通過,否則我必須加一個驗證的標(biāo)準(zhǔn),所以對于類似場景使用,體驗便相對不流暢。
除此之外,銀行中的遠(yuǎn)程柜員機(jī),用人臉活體檢測的方式通過驗證,其實只是80%以下的通過率,通過率相對較低。用戶體驗可能就沒那么好,因為它是支付場景,要相對提高警惕。
第二個場景如線上貸款,當(dāng)然要進(jìn)行風(fēng)控,但是前提首先需要將業(yè)務(wù)做起來。所以從這個角度來講,聲紋識別的應(yīng)用中,我寧可說有幾個真正的我要抓的黑中介被漏過去了,我也不要將本來是我的目標(biāo)客戶,但是被我認(rèn)定成黑中介。因此,總體來看主要還是在于業(yè)務(wù)的設(shè)計。