涂志敏
摘 要:商業(yè)銀行內(nèi)部審計(jì)注重挖掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,知識(shí)圖譜技術(shù)使得銀行大量的數(shù)據(jù)以一種圖關(guān)聯(lián)的形式展現(xiàn)出來(lái)。本文基于知識(shí)圖譜的應(yīng)用研究,探討現(xiàn)有非現(xiàn)場(chǎng)審計(jì)系統(tǒng)面臨的困境,研究非現(xiàn)場(chǎng)審計(jì)系統(tǒng)知識(shí)圖譜引擎的構(gòu)建流程及應(yīng)用場(chǎng)景。研究發(fā)現(xiàn),知識(shí)圖譜在商業(yè)銀行內(nèi)部審計(jì)應(yīng)用中可對(duì)審計(jì)知識(shí)構(gòu)建知識(shí)平臺(tái),也可在業(yè)務(wù)審計(jì)中對(duì)被審計(jì)對(duì)象進(jìn)行關(guān)聯(lián)關(guān)系挖掘。但目前仍需從數(shù)據(jù)治理,自然語(yǔ)言處理技術(shù)應(yīng)用,提高內(nèi)審人員能力等方面著手,以促進(jìn)非現(xiàn)場(chǎng)審計(jì)系統(tǒng)知識(shí)圖譜引擎落地。
關(guān)鍵詞:商業(yè)銀行;非現(xiàn)場(chǎng)審計(jì);知識(shí)圖譜
中圖分類號(hào):F830.33 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2021)01(a)--02
1 知識(shí)圖譜研究綜述
2012年5月17日谷歌公司正式提出知識(shí)圖譜,引領(lǐng)了現(xiàn)代知識(shí)圖譜的研究與應(yīng)用。知識(shí)圖譜將客觀世界中真實(shí)存在的各種概念或?qū)嶓w及其之間的關(guān)系用語(yǔ)義網(wǎng)絡(luò)圖的形式表現(xiàn)出來(lái),形成一種類人腦的知識(shí)庫(kù),提供了一種理解和管理海量信息的能力。2012年至今是知識(shí)圖譜的快速發(fā)展期,目前知識(shí)圖譜已廣泛應(yīng)用于搜索引擎、營(yíng)銷、醫(yī)療、電商、教育、司法、金融等領(lǐng)域。
對(duì)于知識(shí)圖譜在金融行業(yè)的應(yīng)用研究,張旭[1]指出,知識(shí)圖譜技術(shù)落地金融行業(yè)需經(jīng)歷知識(shí)構(gòu)建、知識(shí)計(jì)算、知識(shí)存儲(chǔ)、知識(shí)應(yīng)用等關(guān)鍵四個(gè)步驟;陳大值[2]針對(duì)商業(yè)銀行當(dāng)前面臨的知識(shí)管理及應(yīng)用問(wèn)題,分析知識(shí)圖譜的邏輯和技術(shù)框架及在銀行業(yè)的應(yīng)用場(chǎng)景;姚琥[3]提到農(nóng)業(yè)銀行以建設(shè)金融大腦為切入點(diǎn),構(gòu)建了知識(shí)圖譜以應(yīng)對(duì)當(dāng)前互聯(lián)網(wǎng)沖擊下的商業(yè)銀行信貸業(yè)務(wù)轉(zhuǎn)型。
還有一些學(xué)者研究知識(shí)圖譜技術(shù)在審計(jì)中的應(yīng)用,但目前主要集中在醫(yī)保審計(jì)工作中,如樊世昊[4]、周紅宇[5]等,指出基于知識(shí)圖譜的大數(shù)據(jù)審計(jì)方法可以有效解決醫(yī)保審計(jì)中的數(shù)據(jù)分散、利用率不高、查詢復(fù)雜度高、精確度低等問(wèn)題,提高醫(yī)保審計(jì)項(xiàng)目的質(zhì)量。也有一些學(xué)者從技術(shù)層面研究知識(shí)圖譜在審計(jì)中的應(yīng)用,如王瑞萍等[6]基于Neo4j圖數(shù)據(jù)庫(kù)進(jìn)行審計(jì)知識(shí)數(shù)據(jù)的清洗、知識(shí)三元組的構(gòu)建、存儲(chǔ),并完成審計(jì)領(lǐng)域的知識(shí)圖譜,有利于提高審計(jì)效率,挖掘不易發(fā)現(xiàn)的數(shù)據(jù)式審計(jì)證據(jù)。本文從商業(yè)銀行內(nèi)部審計(jì)非現(xiàn)場(chǎng)審計(jì)系統(tǒng)面臨的困境出發(fā),研究非現(xiàn)場(chǎng)審計(jì)系統(tǒng)中知識(shí)圖譜構(gòu)建流程、應(yīng)用場(chǎng)景,及需要解決的問(wèn)題。
2 現(xiàn)有非現(xiàn)場(chǎng)審計(jì)系統(tǒng)面臨的困境
傳統(tǒng)非現(xiàn)場(chǎng)審計(jì)系統(tǒng)已不能適應(yīng)審計(jì)方式的變化。隨著金融科技在各領(lǐng)域的應(yīng)用領(lǐng)跑,內(nèi)部審計(jì)方式方法產(chǎn)生了前所未有的變化,傳統(tǒng)的內(nèi)部審計(jì)模式與手段明顯已不符合當(dāng)前的審計(jì)形勢(shì)。以往的非現(xiàn)場(chǎng)的審計(jì)系統(tǒng)僅可支持現(xiàn)場(chǎng)審計(jì)環(huán)節(jié)信息的錄入與傳閱,在審計(jì)查詢功能方面僅支持小范圍數(shù)據(jù)的查詢,模型建設(shè)也不夠完善,對(duì)于關(guān)聯(lián)關(guān)系的深度挖掘主要靠審計(jì)人員的經(jīng)驗(yàn)判斷。
傳統(tǒng)非現(xiàn)場(chǎng)審計(jì)系統(tǒng)已不能滿足審計(jì)業(yè)務(wù)需求。數(shù)據(jù)已經(jīng)成為商業(yè)銀行重要的資產(chǎn),有效提升數(shù)據(jù)資產(chǎn)應(yīng)用是關(guān)鍵。商業(yè)銀行內(nèi)部審計(jì)是數(shù)據(jù)應(yīng)用部門,主要工作是通過(guò)數(shù)據(jù)分析與挖掘,建立風(fēng)險(xiǎn)評(píng)估方法論和可量化的內(nèi)控評(píng)價(jià)指標(biāo)體系,前瞻性識(shí)別內(nèi)控缺陷,提升內(nèi)控有效性。而非現(xiàn)場(chǎng)審計(jì)系統(tǒng)是內(nèi)部審計(jì)人員進(jìn)行審計(jì)依托的主要系統(tǒng),在當(dāng)前大數(shù)據(jù)審計(jì)時(shí)代其在整合內(nèi)外部數(shù)據(jù)資源、數(shù)據(jù)建模等方面存在劣勢(shì),極大地影響審計(jì)的效率和質(zhì)量。
隨著商業(yè)銀行結(jié)構(gòu)化數(shù)據(jù)的日益積累,半結(jié)構(gòu)化及結(jié)構(gòu)化數(shù)據(jù)的提取技術(shù)的快速發(fā)展,商業(yè)銀行金融數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng)。要適應(yīng)新形勢(shì)下的審計(jì)變化,必須加強(qiáng)審計(jì)數(shù)據(jù)應(yīng)用基礎(chǔ),對(duì)非現(xiàn)場(chǎng)審計(jì)信息系統(tǒng)及模型工具進(jìn)行優(yōu)化,充分運(yùn)用科技手段提升非現(xiàn)場(chǎng)審計(jì)效率。知識(shí)圖譜的構(gòu)建是實(shí)現(xiàn)數(shù)字化審計(jì)的基礎(chǔ)工程,要解決目前非現(xiàn)場(chǎng)審計(jì)的困境,在非現(xiàn)場(chǎng)審計(jì)系統(tǒng)中對(duì)多源異構(gòu)數(shù)據(jù)構(gòu)建知識(shí)圖譜是必經(jīng)之路。
3 非現(xiàn)場(chǎng)審計(jì)系統(tǒng)知識(shí)圖譜引擎的構(gòu)建研究
知識(shí)圖譜的構(gòu)建分為自底向上法和自頂向下法,谷歌知識(shí)圖譜架構(gòu)采用的就是自底向上法,包括數(shù)據(jù)獲取、知識(shí)抽取、知識(shí)融合、知識(shí)加工等環(huán)節(jié)。其中,數(shù)據(jù)獲取包括結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù);知識(shí)抽取包括實(shí)體提取、關(guān)系提取、屬性提取;知識(shí)融合包括對(duì)結(jié)構(gòu)化數(shù)據(jù)和第三方數(shù)據(jù)庫(kù)的知識(shí)融合,及半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的共指解析和實(shí)體消歧;知識(shí)加工包括本體構(gòu)建、知識(shí)推理和質(zhì)量評(píng)估,最后形成知識(shí)圖譜。
商業(yè)銀行非現(xiàn)場(chǎng)審計(jì)系統(tǒng)知識(shí)圖譜的架構(gòu)與自底向上法的架構(gòu)基本一致,但也具有商業(yè)銀行自身的特色。構(gòu)建的主要環(huán)節(jié)包括數(shù)據(jù)收集、數(shù)據(jù)組織、數(shù)據(jù)標(biāo)識(shí)、數(shù)據(jù)關(guān)聯(lián)等環(huán)節(jié)。第一步是數(shù)據(jù)收集,根據(jù)業(yè)務(wù)需求,明確數(shù)據(jù)來(lái)源、更新頻率等,將多源異構(gòu)數(shù)據(jù)提取并接入數(shù)據(jù)中心;第二步是數(shù)據(jù)組織,對(duì)清洗過(guò)的數(shù)據(jù)按照統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行分庫(kù)管理,包括知識(shí)庫(kù)、資源庫(kù)、業(yè)務(wù)庫(kù)等;第三步是數(shù)據(jù)標(biāo)識(shí),根據(jù)標(biāo)簽對(duì)數(shù)據(jù)、文本信息進(jìn)行比對(duì),并為其打上標(biāo)識(shí),為后續(xù)應(yīng)用奠定基礎(chǔ);第四步是數(shù)據(jù)關(guān)聯(lián),對(duì)數(shù)據(jù)進(jìn)行知識(shí)提取,并挖掘?qū)嶓w、關(guān)系、屬性間的深度關(guān)聯(lián),形成知識(shí)圖譜。
4 非現(xiàn)場(chǎng)審計(jì)系統(tǒng)知識(shí)圖譜引擎的應(yīng)用場(chǎng)景
知識(shí)圖譜應(yīng)用的首要環(huán)節(jié)是確認(rèn)業(yè)務(wù)需求,即模型開發(fā)過(guò)程中的業(yè)務(wù)場(chǎng)景的選擇,主要是涉及關(guān)系分析的場(chǎng)景,本文主要分析涉及內(nèi)部審計(jì)知識(shí)管理的知識(shí)平臺(tái)和業(yè)務(wù)審計(jì)中的應(yīng)用。
4.1 知識(shí)平臺(tái)
知識(shí)圖譜的基礎(chǔ)應(yīng)用需求來(lái)源于對(duì)知識(shí)的管理,商業(yè)銀行內(nèi)部審計(jì)也存在知識(shí)管理的需求。知識(shí)平臺(tái)實(shí)質(zhì)就是一種文本知識(shí)圖譜,將文本作為研究對(duì)象,采用知識(shí)推理和知識(shí)標(biāo)識(shí)等分析文本知識(shí)。每個(gè)審計(jì)項(xiàng)目都要經(jīng)歷審計(jì)準(zhǔn)備、審計(jì)實(shí)施、審計(jì)報(bào)告、后續(xù)審計(jì)四個(gè)階段,存在大量的重復(fù)勞動(dòng),耗費(fèi)審計(jì)資源,也體現(xiàn)了審計(jì)機(jī)構(gòu)內(nèi)部對(duì)審計(jì)知識(shí)管理不到位。內(nèi)部審計(jì)知識(shí)平臺(tái)整合審計(jì)工作中的各類審計(jì)報(bào)告、具體審計(jì)問(wèn)題及審計(jì)依據(jù)等,通過(guò)知識(shí)圖譜技術(shù)將內(nèi)部審計(jì)中的實(shí)體、屬性和關(guān)系進(jìn)行梳理并建立邏輯關(guān)聯(lián),實(shí)現(xiàn)具體審計(jì)方案自動(dòng)生成,審計(jì)風(fēng)險(xiǎn)點(diǎn)與制度依據(jù)關(guān)聯(lián),知識(shí)智能問(wèn)答等多層面的需求解決方案,解決同一問(wèn)題定性引用制度五花八門,同一審計(jì)重點(diǎn)的關(guān)注點(diǎn)千差萬(wàn)別等問(wèn)題。根據(jù)建立使用目標(biāo)不同,可以分為審計(jì)方案庫(kù)、審計(jì)風(fēng)險(xiǎn)庫(kù)、審計(jì)制度庫(kù)等。
4.2 審計(jì)應(yīng)用
商業(yè)銀行業(yè)務(wù)審計(jì)按照被審計(jì)對(duì)象劃分,可以劃分為對(duì)人的審計(jì)和對(duì)事的審計(jì),即經(jīng)濟(jì)責(zé)任審計(jì)和業(yè)務(wù)審計(jì),在兩類審計(jì)過(guò)程中,都可以考慮構(gòu)建知識(shí)圖譜來(lái)提升審計(jì)質(zhì)效。
4.2.1 經(jīng)濟(jì)責(zé)任審計(jì)知識(shí)圖譜
對(duì)于經(jīng)濟(jì)責(zé)任審計(jì)中存在的畫像不夠準(zhǔn)確,責(zé)任界定不清晰等問(wèn)題可以依靠知識(shí)圖譜來(lái)提供清晰的關(guān)聯(lián)關(guān)系。被審計(jì)對(duì)象經(jīng)濟(jì)活動(dòng)的橫縱向分析,業(yè)務(wù)問(wèn)題的關(guān)聯(lián)性分析,應(yīng)承擔(dān)的責(zé)任類型都可以通過(guò)基于知識(shí)圖譜的知識(shí)庫(kù)來(lái)直觀展現(xiàn)。一是從個(gè)人履歷、各階段分管業(yè)務(wù)、業(yè)務(wù)的橫縱向?qū)Ρ葦?shù)據(jù)、相關(guān)的內(nèi)外部檢查問(wèn)題等設(shè)置關(guān)聯(lián)規(guī)則;二是對(duì)以往審計(jì)發(fā)現(xiàn)的問(wèn)題,與被審計(jì)對(duì)象決策能力、經(jīng)營(yíng)能力、執(zhí)行能力、廉政能力相關(guān)的維度進(jìn)行責(zé)任界定;三是基于經(jīng)濟(jì)責(zé)任履行能力評(píng)價(jià)指標(biāo)體系、政策制度等形成知識(shí)庫(kù)。通過(guò)經(jīng)濟(jì)責(zé)任審計(jì)知識(shí)圖譜,可以為被審計(jì)人員“畫像”提供更齊全的素材。
4.2.2 風(fēng)控領(lǐng)域知識(shí)圖譜
(1)信用風(fēng)險(xiǎn)防控。面對(duì)復(fù)雜的市場(chǎng)環(huán)境以及企業(yè)間多重的關(guān)聯(lián)關(guān)系,審計(jì)人員若通過(guò)傳統(tǒng)審計(jì)手段對(duì)其中的關(guān)系進(jìn)行抽絲剝繭,耗時(shí)耗力且容易存在誤差。金融監(jiān)管的要求越來(lái)越高,銀行業(yè)金融機(jī)構(gòu)面對(duì)自身快速增長(zhǎng)的數(shù)據(jù),如何在海量的關(guān)聯(lián)數(shù)據(jù)中識(shí)別出企業(yè)潛在的風(fēng)險(xiǎn)。內(nèi)部審計(jì)人員必須借助科技的力量,提升多源異構(gòu)數(shù)據(jù)處理和分析能力,從企業(yè)級(jí)數(shù)據(jù)中獲取完整的企業(yè)關(guān)系網(wǎng)及資金流轉(zhuǎn)關(guān)系,準(zhǔn)確挖掘企業(yè)間千絲萬(wàn)縷的關(guān)聯(lián)關(guān)系,識(shí)別出潛在的信用風(fēng)險(xiǎn)。目前商業(yè)銀行內(nèi)部審計(jì)需要集成的企業(yè)外部數(shù)據(jù)包括工商、投資、訴訟、擔(dān)保等;實(shí)體包括自然人、賬號(hào)、機(jī)構(gòu)、合同、押品等;屬性包括ID、姓名、身份證號(hào)等;關(guān)系包括員工與授信客戶、外包商關(guān)聯(lián)、融資擔(dān)保關(guān)聯(lián)等,從而防范多頭授信、重復(fù)抵押、擔(dān)保圈、圍標(biāo)等外部欺詐風(fēng)險(xiǎn)。
(2)洗錢風(fēng)險(xiǎn)防控。傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的反洗錢模型通常只能關(guān)注1度的交易行為,在當(dāng)前海量客戶數(shù)據(jù)、賬戶交易數(shù)據(jù)面前顯得力不從心。知識(shí)圖譜技術(shù)可以通過(guò)交易數(shù)據(jù)挖掘賬戶之間的關(guān)聯(lián)關(guān)系,并構(gòu)建拆分模型、匯聚模型等反洗錢模型,通常可以進(jìn)行5度分析范圍的數(shù)據(jù)分析,對(duì)客戶賬戶進(jìn)行深度分析與管理。相較于傳統(tǒng)的反洗錢模型,基于知識(shí)圖譜的反洗錢模型能進(jìn)行更深層次的關(guān)聯(lián)關(guān)系,更有效地防范洗錢風(fēng)險(xiǎn)。
5 知識(shí)圖譜在商業(yè)銀行內(nèi)部審計(jì)中的應(yīng)用展望
知識(shí)圖譜技術(shù)應(yīng)用到商業(yè)銀行內(nèi)部審計(jì)工作中,能有效提升非現(xiàn)場(chǎng)審計(jì)的工作效率和質(zhì)量,但鑒于知識(shí)圖譜技術(shù)應(yīng)用到審計(jì)領(lǐng)域還處于初級(jí)嘗試階段,能夠成功落地實(shí)施還需要解決一些實(shí)際的問(wèn)題。
5.1 提高源數(shù)據(jù)質(zhì)量
知識(shí)圖譜構(gòu)建時(shí)涉及多系統(tǒng)數(shù)據(jù)的融合,商業(yè)銀行系統(tǒng)存在分時(shí)分階段建立的特點(diǎn),多個(gè)系統(tǒng)之間采用不同的數(shù)據(jù)標(biāo)準(zhǔn)或技術(shù)規(guī)范,導(dǎo)致數(shù)據(jù)不一致,數(shù)據(jù)質(zhì)量較差。知識(shí)圖譜其實(shí)是一種基于數(shù)據(jù)融合應(yīng)用的分析技術(shù),數(shù)據(jù)從孤島狀態(tài)走向數(shù)據(jù)融合,必須要對(duì)數(shù)據(jù)進(jìn)行分類歸集、開放共享等形成良好的數(shù)據(jù)資源管理體系,做好數(shù)據(jù)治理。
5.2 強(qiáng)化自然語(yǔ)言處理技術(shù)的應(yīng)用
自然語(yǔ)言處理(NLP)是知識(shí)圖譜的關(guān)鍵技術(shù),主要研究人與計(jì)算機(jī)之間使用人類自然語(yǔ)言進(jìn)行有效溝通的理論和方法。NLP最常應(yīng)用于知識(shí)圖譜中的能力是對(duì)自然語(yǔ)言中信息的抽取,通過(guò)分詞、詞性標(biāo)注和句法分析等方式完成對(duì)自然語(yǔ)言到實(shí)體、關(guān)系、屬性的知識(shí)抽取。NLP技術(shù)在商業(yè)銀行非現(xiàn)場(chǎng)審計(jì)系統(tǒng)中的落地實(shí)施,是各類知識(shí)圖譜構(gòu)建的關(guān)鍵。
5.3 加強(qiáng)內(nèi)部審計(jì)人員能力培養(yǎng)
金融科技賦能內(nèi)部審計(jì),同時(shí)也對(duì)內(nèi)部審計(jì)人員的能力提出了更高的要求。內(nèi)部審計(jì)隊(duì)伍的知識(shí)結(jié)構(gòu)、能力素質(zhì)難以在短期內(nèi)全面適應(yīng)數(shù)字化轉(zhuǎn)型的工作需要。內(nèi)部審計(jì)人員不僅是非現(xiàn)場(chǎng)審計(jì)系統(tǒng)的被動(dòng)使用者,更需要發(fā)揮主觀能動(dòng)性積極提升自身數(shù)據(jù)分析能力、新技術(shù)應(yīng)用能力、模型研發(fā)使用能力等。
參考文獻(xiàn)
張旭.知識(shí)圖譜技術(shù)落地金融行業(yè)的關(guān)鍵四步[J].金融電子化,2017(11):92.
陳大值.知識(shí)圖譜在銀行業(yè)的應(yīng)用場(chǎng)景及可行性研究[J].中國(guó)金融電腦,2019(02):31-35.
姚琥.“AI+知識(shí)圖譜”在信用風(fēng)險(xiǎn)管理領(lǐng)域的探索[J].金融電子化,2019(05):55-57.
樊世昊. 基于知識(shí)圖譜的審計(jì)方法研究[D].南京:南京審計(jì)大學(xué),2018.
周紅宇. 知識(shí)圖譜在醫(yī)療保險(xiǎn)基金審計(jì)中的應(yīng)用研究[D].南京:南京審計(jì)大學(xué),2019.
王瑞萍,劉峰,楊媛琦,等.審計(jì)知識(shí)圖譜的構(gòu)建與研究——基于Neo4j的圖譜技術(shù)[J].中國(guó)注冊(cè)會(huì)計(jì)師,2020(09):109-113.