程夢瑤
以B端用戶為面向,久其小久智能分析機器人激活了久其軟件多年積累的行業(yè)應(yīng)用場景化優(yōu)勢。久其小久智能分析機器人首次將語音識別、自然語言處理與豐富的分析模型庫進行結(jié)合,打造了服務(wù)于高端行業(yè)用戶的AI創(chuàng)新樣本。
設(shè)想一種場景,一家大型企業(yè)的高層決策者想查看本年度各單位銷售收入的變化情況,只需要對著久其小久智能分析機器人說出想要查詢或分析的內(nèi)容,小久可以做到秒級響應(yīng),系統(tǒng)立即自動生成圖、文、表格并茂的分析主題展示出來。
這種場景其實并不陌生,有很多種暢想,也有很多種實現(xiàn)的可能。
但在這種應(yīng)用場景的背后,卻需要有大量的技術(shù)手段作為支撐,如何自動進行語音識別?如何自動進行文本語義理解?如何自動從海量數(shù)據(jù)中快速檢索適合的數(shù)據(jù),并匹配合適的分析展現(xiàn)模型?這些問題,都成為了實現(xiàn)這種場景化應(yīng)用的難點和痛點。
在互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、傳感器技術(shù)飛速發(fā)展的今天,面對海量的大數(shù)據(jù)資源,如何快速有效地獲取自己想要的數(shù)據(jù),是很多行業(yè)客戶提出的自主需求?!艾F(xiàn)在很多用戶的自主分析能力越來越強,在客戶現(xiàn)場,我們經(jīng)常聽到客戶的反饋,希望能夠?qū)崿F(xiàn)快速、智能化、自動化的數(shù)據(jù)查詢和分析?!北本┚闷滠浖煞萦邢薰井a(chǎn)品中心副總經(jīng)理兼大數(shù)據(jù)平臺事業(yè)部總經(jīng)理李紀洲談到。
從行業(yè)經(jīng)驗出發(fā),使數(shù)據(jù)分析智能化、大眾化
構(gòu)成久其小久智能分析機器人的技術(shù)體系涵蓋數(shù)據(jù)可視化、語音識別、自然語言處理、智能分析模型、大數(shù)據(jù)存儲和訪問、數(shù)據(jù)可視化等目前最前沿的技術(shù)領(lǐng)域,為了形成真正的、一站式的交互式智能分析應(yīng)用,久其軟件的研發(fā)團隊做了多年的探索和嘗試。
久其小久智能分析機器人的后端其實是通用的大數(shù)據(jù)分析平臺,“做大數(shù)據(jù)平臺研發(fā),其實最早是從2009年開始的。最早我們做商業(yè)智能,也就是大家比較熟悉的BI的概念?;诰闷湓贐I領(lǐng)域和分析展現(xiàn)方面的豐富經(jīng)驗,以及多年積累的BI項目經(jīng)驗,我們總結(jié)和積累了完善的分析模型庫,針對不同行業(yè)和不同業(yè)務(wù)都設(shè)計出完善的分析模型?!崩罴o洲表示,正是基于這些分析模型,再結(jié)合自然語言處理能力,久其小久智能分析機器人可以滿足用戶絕大多數(shù)的分析場景。
智能分析模型庫是久其小久智能分析機器人的核心特點之一,也融入了久其軟件多年的行業(yè)經(jīng)驗。建立豐富的分析模型庫還只是一個必不可少的基礎(chǔ)條件,如何向用戶智能地推薦合適的分析模型和展現(xiàn)模式,使用戶在不具備分析能力的前提下仍然可以進行自主的數(shù)據(jù)分析,這才是關(guān)鍵所在。
“如果你能提供一些更人性化、更簡化的方式,他們就可以很快上手?!崩罴o洲所說的“他們”代表了久其軟件目前所服務(wù)的多個行業(yè)領(lǐng)域的政企客戶,這個需求歸根結(jié)底也是一種共性需求?!霸谶@些客戶群體中有著大量的數(shù)據(jù)分析展現(xiàn)方面的應(yīng)用需求,未來都將逐步地使用久其交互式智能分析機器人進行升級和替代,使數(shù)據(jù)分析工作不再是專業(yè)人士的工作,越來越多的人可以參與到數(shù)據(jù)分析中來,使數(shù)據(jù)分析越來越智能化、大眾化。”李紀洲補充道。
具體來說,久其小久智能分析機器人是如何做到的呢?久其小久智能分析機器人為用戶提供了專業(yè)的分析模型推薦算法,精準地為用戶推薦合適的分析模型,使用戶日常的數(shù)據(jù)分析能夠更輕松準確地進行。分析模型的主要分類包括:趨勢分析、對比分析、占比分析、結(jié)構(gòu)分析、相關(guān)性分析、排名分析、定值分析、明細查詢、轉(zhuǎn)化率分析、均衡性分析以及一些財務(wù)分析模型如財務(wù)預(yù)算完成情況分析、償債能力分析、營運能力分析、盈利能力分析、發(fā)展能力分析、現(xiàn)金流量分析、財務(wù)杜邦分析等。
語義識別引擎:滿足不同場景的解析需求
進行智能分析的前提是要獲取用戶的查詢需求,作為一款交互式的智能分析機器人,久其小久智能分析機器人獨創(chuàng)的自然語言處理能力構(gòu)成了其堅強的后盾。
采用特征查詢要素的提取識別方式對自然語言進行處理,并通過語義識別引擎定義了語義特征、識別文法,用于描述自然語言的語義特征,并解析出有用的語義要素。
“語義識別引擎構(gòu)成了久其小久智能分析機器人的核心模塊,這是我們自研的一塊重要內(nèi)容。”李紀洲談到。
從定義上看,久其小久智能分析機器人采用的語義識別引擎是久其自主設(shè)計、研發(fā)的自然語言處理引擎。引擎解析分為兩個部分:第一部分是對語句進行分詞。分詞采用的是訓(xùn)練模型和詞典分詞相結(jié)合的技術(shù),既能滿足對分詞效率上的支持,又能處理從未遇到過的生僻詞的分詞場景。分詞引擎采用Double Array Trie Tree的數(shù)據(jù)結(jié)構(gòu)對字典進行存儲,保證字典查找效率的同時,又有效地避免了內(nèi)存的過多占用。
第二個部分是對分詞結(jié)果進行要素的定位。引擎定義的基于語義特征識別的文法,稱作F語言(即Semantic Feature Recognition Grammar)。相比于其他通用的自然語言處理引擎,F(xiàn)語言能夠基于特定環(huán)境進行更有針對性的解析。比如F語言更關(guān)注用戶錄入的語句中包含的時間要素、維度要素、指標要素、分析方法等相關(guān)要素,而對于語句中輔助性的詞匯,F(xiàn)語言可以進行忽略而不進行解析。F語言中用于描述語義結(jié)構(gòu)的F腳本,可以進行修改以滿足其他場景的不同解析需求,而不僅限于機器人的解析。
“目前,我們引擎最大的特點是不關(guān)注語法的細節(jié)規(guī)則,而是通過從句式中尋找關(guān)鍵詞抽取指標。有了語義識別引擎之后,再去做數(shù)據(jù)查詢、數(shù)據(jù)處理以及疏通數(shù)據(jù)集的工作?!崩罴o洲介紹道。
語義識別引擎從接收用戶輸入的語句到最終生成推薦的分析結(jié)果,有一整套完備的運轉(zhuǎn)流程,包括語音識別、自然語言處理、數(shù)據(jù)實體定位、分析模型推薦、數(shù)據(jù)集生成、可視化展示等,流程的每一步都有完整的解決方案用于實現(xiàn)該步驟。
輔助決策者進行決策分析,為用戶創(chuàng)造價值
從產(chǎn)品層面看,在對久其小久智能分析機器人進行產(chǎn)品定義時,就提出了要求—產(chǎn)品必須對用戶的所有的語音請求做到“有問必答”,不管用戶表達是否準確、全面。即便用戶語言表達不夠全面,產(chǎn)品也可盡可能地去猜測用戶的真實意圖,根據(jù)語義分析的結(jié)果給用戶呈現(xiàn)最可能符合意圖的分析結(jié)果。
如果用戶語音表達含混,產(chǎn)品無法識別其語音,產(chǎn)品也可與用戶語音交互,引導(dǎo)用戶發(fā)出語音指令,且交互深度不超過3層(因為沒完沒了地確認響應(yīng),可能導(dǎo)致用戶放棄對產(chǎn)品的使用)。
作為一款能廣泛應(yīng)用于各行各業(yè)并輔助決策者進行決策分析的產(chǎn)品,久其小久智能分析機器人將為客戶創(chuàng)造價值,放在了首位。因此,它從四個方面對用戶的價值實現(xiàn)進行了提升。
第一,用戶體驗全面升級:簡潔的搜索界面、酷炫的分析結(jié)果、高效的查詢響應(yīng)、智能的需求理解、強大的交互能力都為用戶帶來了全新的操作體驗。
第二,自助查詢分析:以往數(shù)據(jù)分析系統(tǒng)都是先定義后查看的模式,配置過程復(fù)雜繁瑣,大大降低了用戶使用數(shù)據(jù)的效率,使用本產(chǎn)品用戶可以根據(jù)需要隨時自主地獲取信息。
第三,大大降低實施成本:由于無需實施人員定義分析模型,實施周期短、見效快、成本低。
第四,自主學(xué)習(xí):通過深度學(xué)習(xí)可以不斷完善分析模型庫,可以更加準確地匹配用戶需求。
或許AI的價值并不僅僅在AI技術(shù)本身,而是更多地體現(xiàn)在用戶的應(yīng)用場景之中。久其軟件的AI賦能,以提升用戶體驗、為用戶創(chuàng)造價值為出發(fā)點,在司法、財經(jīng)、交通和民生等領(lǐng)域已經(jīng)取得了成效。
縱觀國內(nèi)市場,AI在各個行業(yè)、領(lǐng)域的滲透才剛剛開始,仍要經(jīng)歷一段相當(dāng)長的技術(shù)溢出和效用遞增階段。AI的應(yīng)用前景十分廣闊,但一言以蔽之,技術(shù)只是工具,業(yè)務(wù)才是本質(zhì)。
訪談實錄
Q:中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟、《軟件和集成電路》雜志社
A:北京久其軟件股份有限公司產(chǎn)品中心副總經(jīng)理兼大數(shù)據(jù)平臺事業(yè)部總經(jīng)理李紀洲
Q:久其小久智能分析機器人的數(shù)據(jù)存儲是如何進行管理的?
A:久其小久智能分析機器人的數(shù)據(jù)存儲不僅限于關(guān)系型數(shù)據(jù)庫,還可以存儲于久其的BigDB中。BigDB是久其基于Hadoop體系打造的大數(shù)據(jù)分布式存儲和處理的產(chǎn)品。BigDB將分布式存儲的數(shù)據(jù)結(jié)構(gòu)適配成類關(guān)系型數(shù)據(jù)庫模型,支持滿足SQL2003標準的SQL語句,使前端對BigDB的調(diào)用無縫集成。
Q:久其小久智能分析機器人是如何改善傳統(tǒng)的分析應(yīng)用產(chǎn)品中的不足之處的?
A:在傳統(tǒng)的分析應(yīng)用產(chǎn)品中,要想做好一個分析主題,用戶需要了解系統(tǒng)內(nèi)的數(shù)據(jù)結(jié)構(gòu),掌握相關(guān)的分析領(lǐng)域模型,熟悉對應(yīng)的制表操作等,用戶的使用門檻較高。通過該產(chǎn)品的應(yīng)用,用戶可以在零基礎(chǔ)的條件下自助進行數(shù)據(jù)分析,用戶僅僅用語言或者文字描述出自己想要看的東西,機器人會通過語義分析、查詢要素分析、數(shù)據(jù)定位、分析模型定位等一系列的處理后,自動推薦給用戶相關(guān)的圖表,由用戶選擇。
Q:久其小久智能分析機器人在可視化方面有哪些優(yōu)勢?
A:久其在分析展現(xiàn)上擁有一套完整的可視化套件??梢暬准▋x表盤、快速分析表、數(shù)據(jù)導(dǎo)航、數(shù)據(jù)地圖,能將分析模型以豐富的形式展現(xiàn)出來。作為數(shù)據(jù)可視化套件的底層數(shù)據(jù)提供引擎,久其的數(shù)據(jù)處理引擎不僅支持滿足三范式的關(guān)系型數(shù)據(jù)庫的訪問,還可以自動通過元數(shù)據(jù)模型以及模型之間的關(guān)系生成相應(yīng)的查詢語句,對數(shù)據(jù)進行關(guān)聯(lián)、匯總消維等操作。
與此同時,數(shù)據(jù)處理引擎還支持在Hadoop體系下的數(shù)據(jù)存儲和數(shù)據(jù)處理,滿足在大規(guī)模數(shù)據(jù)分析應(yīng)用上的數(shù)據(jù)處理需求。
Q:這款產(chǎn)品的問世可以帶來哪些值?
A:久其是一家具有技術(shù)情結(jié)的公司。我們研發(fā)這款產(chǎn)品一方面是為了方便用戶,另一方面也是為了方便我們自己。因為我們每年的項目很多,如果我們可以通過AI技術(shù)提升我們自身的實施效率和實施質(zhì)量,就可以給更多用戶提供更快、更好的服務(wù)。
行業(yè)應(yīng)用案例
案例名稱: 某建筑行業(yè)央企總裁桌面分析系統(tǒng)
核心特點:
整合集團全業(yè)務(wù)數(shù)據(jù),構(gòu)建建筑行業(yè)知識圖譜,徹底改變了傳統(tǒng)的數(shù)據(jù)分析模式,以更自然的語言交互方式進行數(shù)據(jù)探索分析,對用戶的分析需求給出實時的結(jié)果反饋。除此之外,久其小久智能分析機器人內(nèi)置了豐富的分析模型和行業(yè)知識庫,與普通水平的數(shù)據(jù)分析人員相比,推送的結(jié)果更加精準。該系統(tǒng)的建設(shè)大大提升了用戶的分析效率和質(zhì)量,為用戶日常的數(shù)據(jù)分析、特別是經(jīng)營分析會帶來了極大的便利。
應(yīng)用解讀:
在建設(shè)系統(tǒng)之前,集團領(lǐng)導(dǎo)有一次去歐洲考察,臨行前信息部門在五一節(jié)期間日夜加班了一周準備數(shù)據(jù),但在實際考察過程中卻發(fā)現(xiàn),所準備的數(shù)據(jù)仍然不夠充分,而國內(nèi)臨時查詢數(shù)據(jù)又耗費大量時間,根本不能及時提供。
在該系統(tǒng)建設(shè)之后,幾乎所有的分析請求都可以在第一時間得到響應(yīng)。特別是在經(jīng)營分析會上,在固定的分析主題之外,領(lǐng)導(dǎo)經(jīng)常會提出很多相關(guān)指標的查詢需求,這些都可以通過久其小久智能分析機器人快速查詢得到。
隨著這些年信息化的發(fā)展,各個企業(yè)都積累了大量的數(shù)據(jù)資產(chǎn),而在數(shù)據(jù)的分析上又都面臨著很多問題:
1.數(shù)據(jù)繁多,“找數(shù)據(jù)”難,“找對數(shù)據(jù)”更難;
2.分析需求越來越多,而且對分析的時效性要求也越來越高,很多需求都是“馬上想看”“現(xiàn)在就要”;
3.分析人員匱乏,企業(yè)很難招聘到足夠的數(shù)據(jù)分析師。
久其小久智能分析機器人很好解決了企業(yè)數(shù)據(jù)的這些痛點問題,能夠從大量的企業(yè)數(shù)據(jù)中,快速定位出所需的數(shù)據(jù)內(nèi)容,并結(jié)合自身內(nèi)置的模型知識庫,為用戶實時推送高質(zhì)量的分析主題。
應(yīng)用價值:
1.改進了用戶的數(shù)據(jù)分析體驗,可以隨時、隨需進行分析,實時獲取分析結(jié)果,因為久其小久智能分析機器人帶來的便利性,用戶對總裁桌面系統(tǒng)的使用頻度明顯高于以往的數(shù)據(jù)分析系統(tǒng);
2.提升了數(shù)據(jù)分析質(zhì)量,久其小久智能分析機器人結(jié)合建筑行業(yè)進行了大量的數(shù)據(jù)分析模型優(yōu)化,分析結(jié)果比普通的數(shù)據(jù)分析師更優(yōu);
3.減少數(shù)據(jù)分析工作量,把大量的人工數(shù)據(jù)分析工作智能化、自動化,把信息部門原有十幾個人的工作縮減為三五個人完成。