金玲春 ,陳 波 ,吳立選 ,李 嵐
(1.浙江省臺(tái)州市公安局, 臺(tái)州318000;2.浙江省公安廳, 杭州310009;3.哈爾濱商業(yè)大學(xué) 計(jì)算機(jī)與信息工程學(xué)院, 哈爾濱,150020 )
中臺(tái)其實(shí)是個(gè)外來概念,在英文中,它所對(duì)應(yīng)的單詞和“平臺(tái)”是相同的,都是platformm,作用主要是連接、溝通.最初,中臺(tái)主要被用在軍事指揮上.美軍率先發(fā)明了指揮中臺(tái),對(duì)前方作戰(zhàn)單位進(jìn)行統(tǒng)一協(xié)調(diào).在國內(nèi)企業(yè)中,阿里巴巴是最早采用數(shù)字中臺(tái)的.2015年,該集團(tuán)創(chuàng)始人馬云參觀了著名游戲公司Supercell(超級(jí)細(xì)胞).在參觀期間,它被這個(gè)僅有200人公司的高效所深深震撼.于是,他決定學(xué)習(xí)Supercell的做法,對(duì)阿里巴巴進(jìn)行中臺(tái)化改造,組建了共享業(yè)務(wù)事業(yè)部(Shared Services Platform),通過這一部門溝通前端的業(yè)務(wù)部門和后端的云平臺(tái),極大提升了阿里巴巴內(nèi)部各部門間的協(xié)調(diào)能力.阿里巴巴的做法,很快被其他企業(yè)所效仿,由此催生了現(xiàn)在的“中臺(tái)熱”[1-2].
在傳統(tǒng)的企業(yè)組織架構(gòu)之下,企業(yè)各部門之間的數(shù)據(jù)往往是不流通的,甚至數(shù)據(jù)的搜集和存儲(chǔ)也各有各的規(guī)矩,“數(shù)據(jù)孤島”現(xiàn)象十分明顯.這樣一來,企業(yè)就很難綜合利用自己搜集到的數(shù)據(jù)信息來進(jìn)行決策.而數(shù)據(jù)中臺(tái)的建設(shè)以如何簡單快速地使用數(shù)據(jù)為中心,通過數(shù)據(jù)治理,消除編碼不一致、數(shù)據(jù)冗余、業(yè)務(wù)邏輯錯(cuò)誤等問題,從而打破內(nèi)部壁壘,盤活數(shù)據(jù)資產(chǎn),深挖數(shù)據(jù)價(jià)值,對(duì)內(nèi)對(duì)外提供統(tǒng)一的數(shù)據(jù)服務(wù).
數(shù)據(jù)中臺(tái)更多的是業(yè)界在大數(shù)據(jù)平臺(tái)發(fā)展到一定階段后的一種思維升級(jí),大數(shù)據(jù)平臺(tái)是一種“技術(shù)優(yōu)先”的思維,而數(shù)據(jù)中臺(tái)則是“數(shù)據(jù)優(yōu)先”的思維[3].數(shù)據(jù)中臺(tái)是指通過智能數(shù)據(jù)技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、計(jì)算、加工、應(yīng)用的數(shù)據(jù)“大腦”生態(tài)系統(tǒng),具有服務(wù)重用、服務(wù)進(jìn)化、數(shù)據(jù)積累、快速響應(yīng)、降低成本、效能提升等優(yōu)點(diǎn),通過統(tǒng)一數(shù)據(jù)形式來形成標(biāo)準(zhǔn)數(shù)據(jù),提供高效能數(shù)據(jù)服務(wù)[1].
數(shù)據(jù)中臺(tái)有狹義和廣義之分.狹義的數(shù)據(jù)中臺(tái)是指通過數(shù)據(jù)技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、加工、服務(wù).數(shù)據(jù)中臺(tái)依據(jù)數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行存儲(chǔ),形成數(shù)據(jù)資源池,進(jìn)而為客戶提供高效服務(wù).廣義的數(shù)據(jù)中臺(tái)除了擁有一系列數(shù)據(jù)技術(shù)棧之外,還包括數(shù)據(jù)模型、算法服務(wù)、數(shù)據(jù)產(chǎn)品、應(yīng)用管理等能力[4].
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、5G、人工智能等新技術(shù)的不斷發(fā)展應(yīng)用,公安機(jī)關(guān)擁有的數(shù)據(jù)量大幅增加,特別是感知類數(shù)據(jù)量呈井噴式增長趨勢(shì),如何有效應(yīng)用這些實(shí)效性高、更新快的海量數(shù)據(jù),以及對(duì)現(xiàn)有的業(yè)務(wù)數(shù)據(jù)進(jìn)行融合應(yīng)用,公安機(jī)關(guān)進(jìn)行了大量的探索,成效明顯.但在數(shù)據(jù)應(yīng)用過程中,還存在不少問題,一是感知類數(shù)據(jù)未和已有公安業(yè)務(wù)數(shù)據(jù)充分融合,導(dǎo)致無法深度刻畫業(yè)務(wù)對(duì)象屬性;二是各類應(yīng)用可能由不同單位單獨(dú)建設(shè)封閉應(yīng)用,造成一定程度上的重復(fù)建設(shè)和資源浪費(fèi);三是數(shù)據(jù)應(yīng)用模型創(chuàng)建的復(fù)雜程度高,決定了只有技術(shù)型民警才能靈活創(chuàng)建模型,而業(yè)務(wù)型民警難以在應(yīng)用中將業(yè)務(wù)經(jīng)驗(yàn)快速轉(zhuǎn)化為模型來求證;四是大量模型的應(yīng)用成果沒有轉(zhuǎn)換為全警共有的應(yīng)用資產(chǎn),開發(fā)成果不能很快形成可對(duì)外提供共享服務(wù)的資產(chǎn).
針對(duì)上述警務(wù)數(shù)據(jù)應(yīng)用中存在的難點(diǎn),本文提出基于積木思維的警務(wù)數(shù)據(jù)應(yīng)用中臺(tái)設(shè)計(jì)思路,為更好地應(yīng)用警務(wù)數(shù)據(jù)提供一條可行路徑.類似風(fēng)靡全球的樂高積木搭建做法,數(shù)據(jù)應(yīng)用中臺(tái)讓數(shù)據(jù)應(yīng)用模型創(chuàng)建像搭積木那樣簡單快捷,圍繞海量警務(wù)數(shù)據(jù),可以隨需而動(dòng)快速配置實(shí)戰(zhàn)應(yīng)用模型.
應(yīng)用中臺(tái)在整體架構(gòu)上分為四層,如圖1所示,分別是數(shù)據(jù)接入層、原子算法層、業(yè)務(wù)模型層和前臺(tái)展示層.數(shù)據(jù)接入層是基礎(chǔ),接入各類數(shù)據(jù),經(jīng)數(shù)據(jù)治理后形成數(shù)據(jù)資產(chǎn),這是業(yè)務(wù)數(shù)據(jù)化的過程;原子算法層和業(yè)務(wù)模型層構(gòu)成應(yīng)用中臺(tái)的核心,是數(shù)據(jù)業(yè)務(wù)化的過程,前者用于定義、編排算子,后者通過算子的組合來構(gòu)建應(yīng)用模型;應(yīng)用展示層通過可視化服務(wù)調(diào)用、API調(diào)用等形式為第三方應(yīng)用提供服務(wù)[5-8].
1)數(shù)據(jù)接入層:整合包括感知類數(shù)據(jù)、公安業(yè)務(wù)數(shù)據(jù)和其他數(shù)據(jù)等在內(nèi)的所有警務(wù)數(shù)據(jù),為原子算法層提供基礎(chǔ)數(shù)據(jù)支撐.在數(shù)據(jù)的組織及定義上,將把數(shù)據(jù)資源劃分為感知類數(shù)據(jù)、業(yè)務(wù)類數(shù)據(jù)和空間類數(shù)據(jù).在數(shù)據(jù)接入層,關(guān)鍵是做好數(shù)據(jù)治理,讓數(shù)據(jù)更加準(zhǔn)確完整,并且安全合規(guī),才能釋放出大數(shù)據(jù)的無限潛能,挖掘出更多有價(jià)值的數(shù)據(jù)應(yīng)用.通過數(shù)據(jù)治理,從設(shè)計(jì)、開發(fā)、部署和使用上保障數(shù)據(jù)口徑的規(guī)范和統(tǒng)一,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)全鏈路管理,并提供標(biāo)準(zhǔn)數(shù)據(jù)輸出[9-12].
2)原子算法層:原子算法層以數(shù)據(jù)接入層的數(shù)據(jù)資源為數(shù)據(jù)基礎(chǔ),根據(jù)各類數(shù)據(jù)特性及算法場(chǎng)景要求構(gòu)建不同類型的數(shù)據(jù)基本算法集,形成原子算法池.算子猶如積木,為業(yè)務(wù)模型搭建提供最小引用單元.在算法上,通過對(duì)算法共性應(yīng)用需求的精準(zhǔn)分析,并對(duì)各類數(shù)據(jù)資源的感知屬性、時(shí)間屬性、空間屬性等方面進(jìn)行規(guī)則定義,生成可被模型引用的共性特征算法.
3)業(yè)務(wù)模型層:提供模型定義功能.根據(jù)具體業(yè)務(wù)需求,從原子算法層的算法集中選取合適算子進(jìn)行交、并、差等數(shù)據(jù)集合操作或數(shù)據(jù)清洗、過濾、分組等數(shù)據(jù)操作,以得到最終所需的數(shù)據(jù).業(yè)務(wù)模型層通過各原子算法的靈活組合運(yùn)算,可按需定制并封裝成可對(duì)外提供服務(wù)的業(yè)務(wù)模型集.
4)前臺(tái)展示層:業(yè)務(wù)模型集通過開放可視化服務(wù)調(diào)用或API服務(wù)調(diào)用接口,為第三方應(yīng)用提供業(yè)務(wù)模型服務(wù).第三方應(yīng)用側(cè)重于最終數(shù)據(jù)展現(xiàn),復(fù)雜的邏輯判斷規(guī)則不再是模型實(shí)現(xiàn)的技術(shù)壁壘,同時(shí)敏捷的開發(fā)及應(yīng)用模式也避免了同類算法同類模型的重復(fù)建設(shè)[13-15].
根據(jù)各類業(yè)務(wù)目標(biāo)整合所需數(shù)據(jù)資源并根據(jù)業(yè)務(wù)邏輯判斷規(guī)則構(gòu)建數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,使之成為可被引用的業(yè)務(wù)模型最小單元.原子算法除具備通用模型工具共性的數(shù)據(jù)實(shí)體關(guān)聯(lián)、交差并運(yùn)算、相關(guān)性運(yùn)算等通用算法外,還具備可視化編輯、拖拉拽配置連線、各模型因子準(zhǔn)確性測(cè)試與驗(yàn)證等功能.在應(yīng)用中將各類業(yè)務(wù)目標(biāo)對(duì)應(yīng)的最小數(shù)據(jù)分析單元進(jìn)行業(yè)務(wù)提取并生成可組裝、可配置、可構(gòu)建的原子算法,最終用戶可通過組合原子算法來構(gòu)建符合業(yè)務(wù)需求的分析模型.
3.2.1 原子算法構(gòu)建過程
原子算法構(gòu)建過程包含四個(gè)方面,如圖2所示.
①確認(rèn)算法應(yīng)用場(chǎng)景.根據(jù)感知類數(shù)據(jù)的最小算法單元對(duì)應(yīng)用場(chǎng)景進(jìn)行分析,以切片化構(gòu)建應(yīng)用場(chǎng)景算法需求.
②明確接入數(shù)據(jù)資源.根據(jù)算法應(yīng)用場(chǎng)景,明確需要哪些數(shù)據(jù)資源進(jìn)行支撐,按照數(shù)據(jù)資源進(jìn)行定義,如沒有標(biāo)準(zhǔn)則通過創(chuàng)建數(shù)據(jù)模板進(jìn)行標(biāo)準(zhǔn)化數(shù)據(jù)導(dǎo)入.
③明確分析規(guī)則.根據(jù)算法應(yīng)用場(chǎng)景需求、數(shù)據(jù)資源范圍對(duì)算法的規(guī)則進(jìn)行輸出,明確算法規(guī)則,保證業(yè)務(wù)分析的唯一性和準(zhǔn)確性;
④明確輸入輸出參數(shù).根據(jù)算法的應(yīng)用場(chǎng)景要求,明確算法的輸入?yún)?shù)及輸出結(jié)果信息.
3.2.2 原子算法創(chuàng)建方法
利用“五度法”來構(gòu)建一個(gè)原子算法,即從感知的維度、時(shí)間的精度、空間的緯度、活動(dòng)的密度和關(guān)聯(lián)的集成度等五個(gè)角度來進(jìn)行設(shè)計(jì).如圖3所示.
圖3 “五度法”設(shè)計(jì)原子算法
①感知的維度:由各類感知設(shè)備采集的數(shù)據(jù)構(gòu)成多感知的數(shù)據(jù)維度.
②時(shí)間的精度:由各類數(shù)據(jù)的時(shí)間屬性構(gòu)成時(shí)間的精度,這些時(shí)間因素按照區(qū)間段及特定時(shí)間段等方式進(jìn)行規(guī)則制定.
③空間的緯度:由各類數(shù)據(jù)采集地點(diǎn)構(gòu)成空間的維度.這些空間因素按照指定區(qū)域或特定采集點(diǎn)進(jìn)行規(guī)則制定.
④活動(dòng)的密度:由各類數(shù)據(jù)的特性相關(guān)聯(lián)的行為構(gòu)成活動(dòng)的密度,按照人、車、物等不同數(shù)據(jù)屬性進(jìn)行定義,如出現(xiàn)、消失等行為活動(dòng)因素.
⑤關(guān)聯(lián)的集成度:由感知數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和其他數(shù)據(jù)等構(gòu)成數(shù)據(jù)融合的集成度.
3.2.3 原子算法設(shè)計(jì)說明示例
下面以“車牌號(hào)碼相同卻不同車輛”的算子設(shè)計(jì)為例進(jìn)行說明.
算法簡要描述:針對(duì)卡口通行數(shù)據(jù)中相同車牌號(hào)碼但是不同車輛特征的車輛進(jìn)行比對(duì)分析,查找出車牌號(hào)碼相同卻是不同車輛的通行及基本信息.
使用數(shù)據(jù)資源說明:車輛卡口通行信息、車輛基本信息
算法分析規(guī)則說明:通過對(duì)相同車牌的卡口通行數(shù)據(jù)進(jìn)行比對(duì),在車牌號(hào)碼、車牌顏色相同的基礎(chǔ)上而其他數(shù)據(jù)項(xiàng)不匹配則視為相同車牌不同車輛.并同車輛基本信息進(jìn)行比對(duì),輸出車牌號(hào)碼和車輛特征信息匹配和不匹配的通行記錄和車輛信息.
輸入?yún)?shù)說明:兩種方式,一是輸入車輛通過卡口的起止時(shí)間;二是輸入車輛通行卡口起止時(shí)間和車牌號(hào)碼.
輸出結(jié)果說明:針對(duì)輸入?yún)?shù)兩種方式輸出結(jié)果,第一種輸出在通過卡口起止時(shí)間的所有存在車牌號(hào)碼相同但車輛特征不同的通行記錄并標(biāo)識(shí)是否登記車輛;第二種輸出特定車牌號(hào)碼是否存在車牌號(hào)碼相同但不同車輛特征的通行記錄.
這個(gè)簡單示例采用“五度法”設(shè)計(jì),即從感知的維度、時(shí)間的精度、空間的緯度和關(guān)聯(lián)的集成度等四個(gè)角度來考慮的.
建原子算法集的目的是為了快速便捷地組裝實(shí)戰(zhàn)應(yīng)用模型.模型應(yīng)用管理具備可配置可定義的全可視化編排、調(diào)試、運(yùn)行和發(fā)布功能,以及業(yè)務(wù)模型API接口封裝功能,以便上層應(yīng)用調(diào)用展示.原子算法管理將各個(gè)業(yè)務(wù)邏輯進(jìn)行語義級(jí)的封裝,模型應(yīng)用管理則通過面向業(yè)務(wù)人員的人機(jī)交互界面,快速組裝生產(chǎn)業(yè)務(wù)模型做數(shù)據(jù)分析.
在業(yè)務(wù)模型構(gòu)建過程中,警務(wù)工作人員可以根據(jù)業(yè)務(wù)應(yīng)用需求,選擇合適的原子算法,并利用與、或、非等運(yùn)算算子進(jìn)行關(guān)聯(lián)運(yùn)算,對(duì)中間結(jié)果或最終結(jié)果數(shù)據(jù)可做各種數(shù)據(jù)處理操作,如分組、過濾、增加字段、增加正則表達(dá)式等.已注冊(cè)發(fā)布的業(yè)務(wù)模型,通過可視化界面、API等接口服務(wù)開放給第三方平臺(tái),第三方平臺(tái)根據(jù)業(yè)務(wù)模型使用說明開展應(yīng)用.
用戶定義的算子和創(chuàng)建的模型要能支持復(fù)制式共享,其他用戶可以克隆這些算子和模型,然后根據(jù)需要進(jìn)行再編排、再組裝.這種克隆功能實(shí)現(xiàn)了共建共享,有效解決了經(jīng)驗(yàn)傳承和應(yīng)用創(chuàng)新的問題.
以積木式思維實(shí)現(xiàn)的警務(wù)數(shù)據(jù)應(yīng)用中臺(tái)已在警務(wù)工作實(shí)戰(zhàn)中發(fā)揮了重要價(jià)值.其特點(diǎn)有:1)中臺(tái)式管理,串連應(yīng)用前臺(tái)和數(shù)據(jù)后臺(tái),使復(fù)雜多樣的前端通用業(yè)務(wù)和技術(shù)能力下沉到中臺(tái)層,賦予前端應(yīng)用更高的靈活度和更強(qiáng)的能力支撐;2)積木式建模,降低技術(shù)門坎,在畫布上拖拉拽算子即可組裝模型,構(gòu)建模型隨需而動(dòng),業(yè)務(wù)經(jīng)驗(yàn)可以得到快速驗(yàn)證,適于推廣;3)克隆式共享,各類算子和模型共享后可被其他用戶克隆,進(jìn)行再編排、再組裝,充分體現(xiàn)眾智、眾創(chuàng)、眾惠理念,避免建設(shè)上的重復(fù)投資浪費(fèi),最大化提升應(yīng)用成效.