ACS(中央銀行會計核算數(shù)據(jù)集中系統(tǒng))在中央銀行會計集中核算系統(tǒng)(ABS)的基礎(chǔ)上,對央行會計核算業(yè)務(wù)處理進(jìn)行了流程再造,采取“分散受理、集中處理”的模式,處理流程整體上是“憑證掃描切片,集中并發(fā)處理,流程授權(quán)監(jiān)控,后臺實時記賬”。ACS柜臺發(fā)起業(yè)務(wù)是由各級營業(yè)部門生成影像信息,全國兩個業(yè)務(wù)處理中心集中業(yè)務(wù)錄入,系統(tǒng)完成賬務(wù)記載的處理流程,提高業(yè)務(wù)處理集中度和效率。但由于業(yè)務(wù)處理中心集中人工錄入,無法實現(xiàn)憑證影像輸入系統(tǒng)后完全意義上的自動化處理,既耗費大量的人力物力,也不利于ACS業(yè)務(wù)處理效率提升。
OCR(光學(xué)字符識別技術(shù))技術(shù)通俗講就是讓計算機(jī)“認(rèn)字”,其原理是將影像信息輸入計算機(jī),通過OCR系統(tǒng)影像前處理,包括影響正規(guī)化、去除噪聲、影像矯正等,將含有文字的圖像按字切割成可獨立識別的單元,然后運(yùn)用各種算法分析每個圖像單元中文字的形態(tài)特征,通過比對標(biāo)準(zhǔn)特征數(shù)據(jù)庫,判斷識別出相應(yīng)字符,按通用格式輸出保存在文本文件中。
在ACS系統(tǒng)中引入OCR技術(shù),可實現(xiàn)“無干預(yù)”交易驅(qū)動并發(fā)處理一站到底,具備較好的應(yīng)用前景。
近年來,工商銀行、建設(shè)銀行、交通銀行、華夏銀行以及某些農(nóng)村商業(yè)銀行等均將OCR引入業(yè)務(wù)處理系統(tǒng),并根據(jù)銀行系統(tǒng)的業(yè)務(wù)處理特點進(jìn)行流程改進(jìn),在提高自動化程度的同時,也擴(kuò)展了業(yè)務(wù)范圍,完善了管理機(jī)制。以國內(nèi)較早應(yīng)用OCR的銀行——中國工商銀行哈爾濱分行為例,該行的會計、儲蓄綜合業(yè)務(wù)影像縮微系統(tǒng),通過OCR技術(shù)實現(xiàn)了自動識別憑證影像,并根據(jù)憑證的類型進(jìn)行自動處理。系統(tǒng)投產(chǎn)后,減輕了操作員的勞動強(qiáng)度,提高了工作效率。
根據(jù)目前ACS人工錄入模式,網(wǎng)點掃描上傳的憑證影像經(jīng)過切片拆分(部分影像無需拆分)后由專業(yè)錄入人員錄入,每一項要素至少經(jīng)過兩人錄入,兩人錄入要素比對一致后方進(jìn)入系統(tǒng)校驗等自動處理環(huán)節(jié)。這種人工錄入模式因節(jié)點多、影像申領(lǐng)慢、易受人為延誤影響而效率較低。根據(jù)ACS日常業(yè)務(wù)憑證,假定一張憑證可拆分為10個切片,每個切片6個字,按照國際打字速度評級標(biāo)準(zhǔn),專業(yè)人員每分鐘僅能輸入150—240個字,按照240個字/分鐘,一個人錄完一張憑證需要15秒;OCR每分鐘識別6000個字,一張憑證轉(zhuǎn)換需要0.01秒。兩者的處理效率高低顯而易見。OCR技術(shù)與ACS業(yè)務(wù)的有機(jī)結(jié)合,將大幅提升ACS系統(tǒng)的處理效率和精確度,增強(qiáng)ACS的業(yè)務(wù)承載能力和自動化水平。
OCR技術(shù)代替人工錄入能夠大幅節(jié)約人工成本,減輕內(nèi)控管理的壓力,規(guī)避一定程度的道德風(fēng)險。一是錄入人員報酬和機(jī)器設(shè)備投入較大。ACS在全國推廣上線后,業(yè)務(wù)處理中心將會有近200名錄入人員需求,按照每人月均2000元投入,每年僅人工費用投入為480萬元;同時還應(yīng)配備相應(yīng)規(guī)模的錄入設(shè)備。二是為保證錄入人員的最優(yōu)配置,并且考慮到錄入工作機(jī)械重復(fù)、人員流動性較大的因素,業(yè)務(wù)處理中心將要承擔(dān)較高的內(nèi)部管理成本。三是人工錄入情況下,基本消除了串謀作案的隱患,但仍存在一定的道德風(fēng)險。OCR技術(shù)與ACS整合以后,將會避免以上問題的存在。
目前,ACS業(yè)務(wù)處理流程包括影像掃描上傳、影像拆分、影像切片錄入、業(yè)務(wù)撮合校驗、賬務(wù)處理等。若OCR技術(shù)在ACS中應(yīng)用,將改進(jìn)ACS處理流程為影像掃描上傳、OCR影像識別、要素信息輸入、業(yè)務(wù)撮合校驗以及賬務(wù)處理等,不需“影像拆分”環(huán)節(jié),業(yè)務(wù)處理環(huán)節(jié)減少,處理時效大為提高。盡管OCR識別需要“人工校正”輔助處理,但基本實現(xiàn)了柜臺掃描發(fā)起后,系統(tǒng)的全自動化業(yè)務(wù)處理。
目前鑒于技術(shù)原因,ACS檔案子系統(tǒng)對憑證影像的歸檔作用僅僅局限于“存儲”,未能真正實現(xiàn)對影像的分類檢索,導(dǎo)致電子檔案的調(diào)閱、查詢僅限于“逐張翻閱”。引入OCR技術(shù)后,ACS檔案子系統(tǒng)可借助特殊技術(shù)實現(xiàn)原始圖像與識別結(jié)果共同存儲的功能。
鑒于OCR技術(shù)在ACS中應(yīng)用的諸多優(yōu)勢,建議在ACS系統(tǒng)中引入OCR技術(shù)識別模塊。對于央行營業(yè)網(wǎng)點掃描上傳的會計憑證影像信息,推送至系統(tǒng)的OCR識別模塊,經(jīng)計算機(jī)自動提取會計憑證影像信息,進(jìn)行影像信息識別、輸入識別結(jié)果等過程,將會計憑證的要素信息提交系統(tǒng)進(jìn)行賬務(wù)處理。其核心工作是保證自動識別效率、正確率以及完整性。
影像預(yù)處理包含兩個方面:一是在影像導(dǎo)入ACS系統(tǒng)前進(jìn)行控制或處理。相比商業(yè)銀行憑證由社會大眾填寫,ACS作為中央銀行會計核算數(shù)據(jù)集中系統(tǒng),其憑證填寫人員為人民銀行內(nèi)部人員或者開戶單位專業(yè)人員,憑證填寫相對專業(yè)和規(guī)范。二是影像導(dǎo)入系統(tǒng)后,進(jìn)行字符識別前處理,包括影像校正、去除噪聲,比如對加蓋印章的憑證進(jìn)行識別時,通過去除噪聲技術(shù)去除印章對憑證要素識別的干擾。三是按照憑證和業(yè)務(wù)種類設(shè)計識別模板,排除無關(guān)字符,對憑證中相應(yīng)要素進(jìn)行選擇性識別。
由于人工填寫的憑證影像千差萬別,難免會出現(xiàn)識別錯誤的情況,為減小影像識別出錯率,建議使用兩套不同廠家的OCR軟件,保證選購軟件的差異度,設(shè)計雙OCR串行識別校對方式,起到相互校正、優(yōu)益互補(bǔ)的效果。只有兩套程序識別均認(rèn)為正確的情況,才能視為正確識別的字符。即使可能會降低識別通過率,但確保了影像識別質(zhì)量。
人工校正是彌補(bǔ)系統(tǒng)識別錯誤的有效環(huán)節(jié),也是影像識別的最后關(guān)卡。一般來說,OCR對于不能完全確定或識別認(rèn)為有誤的字符,會對字符進(jìn)行差異化顯示,轉(zhuǎn)人工處理。通過字符識別校正平臺,人工判斷或補(bǔ)充識別結(jié)果。但是值得注意的是,在沒有提示出錯的地方也可能有錯誤,故應(yīng)輔助提供人工監(jiān)測平臺,使用者盡力找尋發(fā)現(xiàn)OCR出錯的地方,及時予以人工校正。
整合OCR技術(shù)與ACS檔案子系統(tǒng),采用“雙層PDF技術(shù)”即實現(xiàn)一個圖像包含兩層,上層是掃描所得到原始圖像,下層是OCR識別的文字結(jié)果,實現(xiàn)憑證影像檔案的分類檢索,提高電子檔案的查閱或調(diào)閱效率。OCR技術(shù)與檔案子系統(tǒng)的有效整合,將大幅改善目前檔案系統(tǒng)“半電子化”存儲的現(xiàn)狀。