李 碩,李鳳至,雷 鵬,李 揚
(中國郵政儲蓄銀行股份有限公司山東省分行,濟南 250101)
(1)OCR 技術(shù)成功應(yīng)用于諸多領(lǐng)域。光學(xué)字符識別(Optical Character Recognition,簡稱OCR),是指電子設(shè)備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字。OCR 技術(shù)已應(yīng)用于很多領(lǐng)域,如證件識別、銀行卡識別、車牌識別、名片識別、汽車VIN 碼識別、票據(jù)識別、圖片文件識別等,其應(yīng)用場景還在逐步擴展。營改增后增值稅發(fā)票樣式的統(tǒng)一和財務(wù)報賬影像系統(tǒng)的應(yīng)用,為OCR 技術(shù)在財務(wù)審計領(lǐng)域的應(yīng)用創(chuàng)造了客觀條件。
(2)財務(wù)審計現(xiàn)狀分析。一是財務(wù)審計工作量大。傳統(tǒng)的銀行財務(wù)審計工作中,一個財務(wù)審計或經(jīng)濟責(zé)任審計項目中,涉及財務(wù)會計憑證抽樣的科目多達幾十個,財務(wù)審計人員需要針對每個科目抽查一定筆數(shù)的會計憑證,并對這些會計憑證及其附件逐筆逐張查看比對,審查其合規(guī)性、真實性、完備性,但無法快速高效地將同類費用或同一時段報銷憑證進行批量比對核查。目前財務(wù)審計領(lǐng)域的非現(xiàn)場分析技術(shù)有限,針對報賬憑證圖片等非結(jié)構(gòu)化數(shù)據(jù),審計人員無法快速定位相關(guān)信息位置和快速提取報賬影像的關(guān)鍵要素,耗費大量時間,抽樣量較為有限,審計效率亟待提升。二是審計人員有限。審計隊伍面臨的最大困難是人員不足、人才短缺。財務(wù)類高水平復(fù)合型審計人才較少,人員知識結(jié)構(gòu)單一、精力有限,針對繁雜的財務(wù)憑證,在有限的現(xiàn)場審計時間內(nèi)完成規(guī)定審計任務(wù)存在一定的困難,審計的深度和精準度也受到制約。
(3)OCR 技術(shù)的逐漸成熟為提升財務(wù)審計價值提供了可行方案。一是通過OCR 技術(shù)實現(xiàn)發(fā)票信息自動提取,審計人員可以在非現(xiàn)場分析階段對財務(wù)報賬影像系統(tǒng)中的非結(jié)構(gòu)化發(fā)票影像進行識別,并將發(fā)票中的有用信息歸集輸出,形成非常有價值的結(jié)構(gòu)化數(shù)據(jù)表,通過對此數(shù)據(jù)表進行充分的數(shù)據(jù)挖掘,可以在非現(xiàn)場階段鎖定問題線索,節(jié)約大量的現(xiàn)場審計時間,更快速、高效地完成審計要點,靶向施力、精準審計。二是借助OCR 通用文本識別技術(shù)定位關(guān)鍵字,在海量憑證影像中快速搜索出有用信息,實現(xiàn)批量財務(wù)憑證分析,進一步拓展審計廣度和深度,有效降低審計風(fēng)險。如果在非現(xiàn)場審計分析平臺嵌入相關(guān)審計模型,還能夠敏銳識別風(fēng)險、發(fā)揮預(yù)警作用,及早揭示問題,促進內(nèi)控機制及時完善,提升審計時效性和審計成果價值,維護企業(yè)資金安全。
由于報賬系統(tǒng)中同一單位的憑證按時間順序排列,財務(wù)審計人員往往需要對抽樣憑證逐個查看,對同類報賬事項的綜合性分析不足。以銀行財務(wù)報賬影像系統(tǒng)為切入點,利用OCR 技術(shù)提取增值稅發(fā)票關(guān)鍵信息形成數(shù)據(jù)表進行穿透式分析,可嘗試實現(xiàn)如下應(yīng)用流程及場景。
(1)自動下載財務(wù)憑證影像并命名。審計人員結(jié)合審計重點,按照相關(guān)科目在報賬系統(tǒng)中下載由逐個報銷單匯總的統(tǒng)計表(簡稱《報銷查詢表》),利用RPA(機器人流程自動化)工具根據(jù)《報銷查詢表》中的“報銷單號”字段從報賬系統(tǒng)逐筆下載報賬憑證影像,將報賬憑證影像保存至《20××年×月—20××年×月報賬憑證影像查詢》總文件夾內(nèi),每筆報賬憑證影像以“報銷單號”字段為文件夾名保存至文件夾內(nèi)。
(2)自動識別增值稅發(fā)票影像并生成相關(guān)審計數(shù)據(jù)表。從增值稅發(fā)票影像中提取“購買方名稱”“銷售方名稱”“銷售方地址”“銷售方電話”“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”“規(guī)格型號”“單位”“數(shù)量”“單價”“金額”“稅率”“價稅合計”“開票日期”“發(fā)票代碼”“發(fā)票號碼”信息。將提取的信息按發(fā)票代碼和號碼,自動回填到《報銷查詢表》對應(yīng)的行,若一張發(fā)票中含多行貨物,則在對應(yīng)的發(fā)票代碼和號碼行下方插入新的行填入。
(3)OCR 發(fā)票信息提取應(yīng)用場景。結(jié)合審計要點可針對回填之后生成的《報銷查詢表》,進行數(shù)據(jù)挖掘和匯總分析。
①費用入賬的及時性。如:從《報銷查詢表》中2020年計列費用科目的事項中,篩選發(fā)票“開票日期”非2020 年度的事項,可以發(fā)現(xiàn)跨年度計列費用、調(diào)節(jié)損益的項目。
②單價的合規(guī)合理性。如:從《報銷查詢表》中篩選“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”為住宿費的事項,通過“單價”批量篩查差旅費中是否存在超標準住宿的情況。再如:按“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”“規(guī)格型號”兩個字段進行分類匯總,對報銷的同類物品單價進行分析,篩選相同貨物名稱和規(guī)格型號但單價相差較大報銷事項,可結(jié)合現(xiàn)場審計對采購價格差異較大的原因進一步核實。又如:對單價超過一定標準的物品,按照固定資產(chǎn)管理辦法應(yīng)建立固定資產(chǎn)卡片予以資本化核算,通過單價篩選可以有效發(fā)現(xiàn)資本性支出費用化的情況。
③資金流向的合規(guī)性。如:從《報銷查詢表》中篩選發(fā)票“銷售方名稱”與報銷資金實際收款方不一致的報銷事項,核查是否存在資金流向不合規(guī)的情形。再如:篩選“購買方名稱”與報賬單位不匹配的事項,核查是否存在單位報銷個人應(yīng)承擔的費用等情況。
④采購數(shù)量的合理性。如:對一段時間內(nèi),同一單位報銷的修理費等按“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”“數(shù)量”分類匯總,分析是否存在數(shù)量不合理的情況。對數(shù)量異常偏高的情況,結(jié)合現(xiàn)場審計訪談、盤點等方法進一步核查。
⑤集中采購制度執(zhí)行情況。如:對“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”中屬于上級集中采購范圍內(nèi)的事項,核查其供應(yīng)商是否在集中采購準入的供應(yīng)商范圍內(nèi),精準發(fā)現(xiàn)違反集中采購制度的情況。
由于銀行報賬影像系統(tǒng)中,費用類報賬憑證居多,一筆報賬憑證往往有十幾張甚至幾十張憑證附件的影像,且系統(tǒng)中影像多為單張獨立的影像,要對一筆憑證進行審查,需要逐張影像查看,耗時費力。為了幫助審計人員從大量的憑證影像中快速搜索定位所需查找的關(guān)鍵信息,OCR 關(guān)鍵字識別技術(shù)可嘗試應(yīng)用如下流程及場景。
(1)憑證影像搜索關(guān)鍵字。在導(dǎo)出的報賬影像中,搜索有某一特定字樣的影像,比如“預(yù)算”。對有此字樣的影像,將此字樣按報賬單號標注在《報銷查詢表》中,若可行提取字段后對應(yīng)的信息,將有此字樣的圖片的路徑(含所在文件夾名和圖片名)按報銷單號列入《報銷查詢表》對應(yīng)行中,作為重點抽樣關(guān)注對象。
(2)OCR 關(guān)鍵字識別技術(shù)應(yīng)用場景。對于不同會計科目的入賬事項,財務(wù)審計時往往有不同的關(guān)注點。采用關(guān)鍵字識別技術(shù),有利于針對特定類別的審計事項,按照審計人員指定的關(guān)鍵字搜索信息,進行精準抽樣。
①對公務(wù)接待等事項是否嚴格落實中央“八項規(guī)定”精神的核查。如:在公務(wù)招待費報賬影像中搜索含有“特產(chǎn)”“煙”“酒”的報銷事項,結(jié)合招待清單等其他報銷單據(jù)進行重點核查。再如:在差旅費報賬影像中搜索含有火車票一等座的報銷事項,結(jié)合差旅費報銷審批單等信息進行比對,核查是否存在超標準乘坐交通工具的行為。
②對費用預(yù)算執(zhí)行情況的核查。如:對于會議費報銷影像,通過OCR 技術(shù)搜索含有“預(yù)算”金額的會議審批單或簽報所在的影像,輔助審計人員快速查找出關(guān)鍵信息,與實際報銷金額進行比對,判斷有無超預(yù)算支出的情形。
③對審批手續(xù)完備性的核查。如:對應(yīng)有上級行批復(fù)文件的重要事項,在其報賬影像中搜索“批復(fù)”字樣,如果OCR 反饋未查找到含此字樣的影像,則須作為重點進行進一步核查,關(guān)注是否存在超越權(quán)限實施的財務(wù)事項。
④對合同執(zhí)行情況的核查。如:對于附有合同的大額報賬事項,通過OCR 技術(shù)在其報賬影像中搜索含有“標的額”“履行期”等字樣的影像,與實際報銷金額、費用期間進行比對,判斷是否存在超出合同金額采購、逆流程實施等情況。
(1)要識別的影像清晰度不統(tǒng)一影響OCR 技術(shù)識別結(jié)果。就增值稅專用發(fā)票而言,雖然發(fā)票格式及關(guān)鍵信息統(tǒng)一,但每張發(fā)票打印的字跡深淺不統(tǒng)一、發(fā)票專用章加蓋的位置及深淺不統(tǒng)一,可能造成發(fā)票關(guān)鍵信息識別統(tǒng)計有誤或缺漏,這就要求提高發(fā)票打印或掃描留存影像的質(zhì)量,便于后續(xù)識別提取關(guān)鍵信息。
(2)銀行財務(wù)報賬系統(tǒng)中各類憑證影像機打、手寫不統(tǒng)一,影響關(guān)鍵字提取效果。由于財務(wù)憑證附件有機打、有手寫,特別是手寫字跡不統(tǒng)一、難以辨認等因素將影響關(guān)鍵字提取結(jié)果,從而造成影像信息提取不完整、不準確,進而影響審計效果。
(3)系統(tǒng)安全及影像下載存儲合規(guī)性問題。為了擴大審計面、使審計結(jié)果更具全面性,往往會審查更多的抽樣憑證,或針對同類事項進行專項抽樣審查,就會造成更多的影像憑證被下載留存,且以財務(wù)報賬系統(tǒng)為切入點融入OCR 技術(shù)應(yīng)用,也同時存在著系統(tǒng)安全、影像安全及信息泄露的風(fēng)險,這就要求OCR 技術(shù)的應(yīng)用要以合規(guī)安全為前提。
(4)研發(fā)投入和實踐經(jīng)驗尚需不斷積累。由于OCR技術(shù)在財務(wù)審計中的應(yīng)用處于探索階段,成熟系統(tǒng)的應(yīng)用解決方案尚未形成,相關(guān)領(lǐng)域的研究開發(fā)仍需要加大投入。同時,現(xiàn)有內(nèi)審人員接觸OCR 新技術(shù)、新工具的時間不長,實踐經(jīng)驗仍需不斷積累和豐富。
(1)提高發(fā)票打印或掃描留存影像的質(zhì)量,制定影像留存設(shè)備標準和人員操作規(guī)范,從源頭上提高影像質(zhì)量,為后續(xù)識別工作奠定基礎(chǔ)。在實現(xiàn)OCR 技術(shù)過程中,添加判斷影像質(zhì)量的功能,對質(zhì)量較低的影像,采用相應(yīng)的影像增強技術(shù)提高影像清晰度。在數(shù)據(jù)識別后,從技術(shù)上給出數(shù)據(jù)的識別可信度,對識別可信度較低的關(guān)鍵數(shù)據(jù),在數(shù)據(jù)后面添加相應(yīng)的備注提示,以便審計人員重點關(guān)注。
(2)加入各類憑證影像的機打、手寫分類功能。由于機打字體較規(guī)范,只要清晰度滿足要求,相對較容易識別,而手寫字體形式多樣,可采用機器學(xué)習(xí)的方式,采集大量訓(xùn)練樣本,訓(xùn)練出識別率較高的識別器。因此,需要對不同種類的影像憑證(機打或手寫)采取不同的識別處理技術(shù)和流程。在識別結(jié)果中,對識別可行度較低的信息,可給出備注提示,以便審計人員重點關(guān)注。
(3)制定相應(yīng)的OCR 技術(shù)在財務(wù)審計方面的應(yīng)用規(guī)范,對相關(guān)從業(yè)人員進行應(yīng)用前的上崗培訓(xùn),從制度上保障數(shù)據(jù)的安全性。可將影像資料按照重要性程度分為多種保密等級,數(shù)據(jù)使用者也分為多種等級,不同等級的用戶對數(shù)據(jù)有不同的下載應(yīng)用權(quán)限,即對于保密等級高的數(shù)據(jù),只有高級別的用戶才有下載使用權(quán)限。系統(tǒng)中應(yīng)留存關(guān)鍵影像的下載記錄,保存下載人的信息,為資料泄露追責(zé)保存證據(jù)。
(4)加大基于OCR 技術(shù)的財務(wù)審計研發(fā)投入,從財政上提供足夠的支持。抽調(diào)專門的審計人員作為OCR系統(tǒng)的用戶,與研發(fā)人員對接,通過雙方充分溝通交流,進一步明確需求和技術(shù)細節(jié),提高OCR 系統(tǒng)操作的便捷性和識別的準確性。系統(tǒng)研發(fā)成型后,開展多種影像的應(yīng)用試點工作,測試系統(tǒng)的性能及操作的便捷性,及時發(fā)現(xiàn)并反饋使用過程中遇到的問題,不斷積累經(jīng)驗,完善升級系統(tǒng)。
在人工智能、大數(shù)據(jù)等技術(shù)迅速發(fā)展的時代,加強審計技術(shù)創(chuàng)新研究、運用科技手段推進審計深度轉(zhuǎn)型和價值提升,是內(nèi)部審計機構(gòu)和人員順應(yīng)審計工作發(fā)展新形勢、新要求,履行好審計監(jiān)督評價咨詢職責(zé),促進企業(yè)高質(zhì)量可持續(xù)發(fā)展的必然要求。相信OCR 技術(shù)在審計領(lǐng)域的應(yīng)用探索,定能推動審計信息化智能化水平再上新臺階。在商業(yè)銀行審計工作中,OCR 技術(shù)不僅可應(yīng)用于財務(wù)報賬憑證審計,也會對信貸業(yè)務(wù)審計、合規(guī)操作性審計等涉及影像資料的其他專項審計提供便捷。除了在現(xiàn)場審計項目中發(fā)揮作用外,在非現(xiàn)場審計工作中開發(fā)OCR 相關(guān)模型或工具,能夠優(yōu)化監(jiān)控預(yù)警模型,結(jié)合風(fēng)險監(jiān)測實現(xiàn)對數(shù)據(jù)的自動分析、違規(guī)行為的自動監(jiān)測及審計邏輯的自動提煉,為發(fā)現(xiàn)審計疑點、評估風(fēng)險等也會提供有力支撐。
展望未來,OCR 技術(shù)、大數(shù)據(jù)分析技術(shù)、文本挖掘、商業(yè)智能等先進技術(shù)的應(yīng)用,將進一步提高審計作業(yè)和審計管理的智能化、自動化程度,實現(xiàn)審計工作模式轉(zhuǎn)型和審計流程升級改造,降低審計人員工作強度,不斷拓展審計廣度和深度,促進審計質(zhì)效和價值持續(xù)提升。