楊靜雅
(中建絲路建設(shè)投資有限公司,陜西,西安 710000)
目前大多數(shù)企業(yè)仍然利用人工的方式錄入電子財(cái)務(wù)報(bào)銷入賬憑證,這種工作方式的效率主要是由工作人員的業(yè)務(wù)熟練程度決定的,人力成本較大[1-2]。為了提高企業(yè)的工作效率,需要對(duì)電子財(cái)務(wù)報(bào)銷入賬憑證錄入方法進(jìn)行分析和研究。
王凱麗等[3]提出基于二維局部二值模式的電子財(cái)務(wù)報(bào)銷入賬憑證錄入方法,該方法基于LBP特征圖,引入LBP模式和滑動(dòng)窗口統(tǒng)計(jì)會(huì)計(jì)財(cái)務(wù)報(bào)銷入賬憑證中的上下文信息,獲得2DLBP特征,將其輸入支持向量機(jī)中,完成電子財(cái)務(wù)報(bào)銷入賬憑證的分類錄入,該方法在特征提取過(guò)程中沒(méi)有消除信息中存在的噪聲,受噪聲干擾憑證錄入所用時(shí)間較長(zhǎng),存在錄入效率低的問(wèn)題。譚潔帆等[4]提出基于卷積神經(jīng)網(wǎng)絡(luò)的電子財(cái)務(wù)報(bào)銷入賬憑證錄入方法,該方法將電子財(cái)務(wù)報(bào)銷入賬憑證通過(guò)卷積神經(jīng)網(wǎng)絡(luò)映射到歐幾里得空間中進(jìn)行編碼,利用采樣方法構(gòu)建數(shù)據(jù)集,并對(duì)其進(jìn)行平衡化處理,通過(guò)CSSVM分類算法對(duì)憑證賦予對(duì)應(yīng)的代價(jià)因子,實(shí)現(xiàn)電子財(cái)務(wù)報(bào)銷入賬憑證的分類錄入,該方法沒(méi)有消除信息之間存在冗余,降低了電子財(cái)務(wù)報(bào)銷憑證錄入的精準(zhǔn)度。孫勁光等[5]提出基于概率圖模型的電子財(cái)務(wù)報(bào)銷入賬憑證錄入方法,該方法將電子財(cái)務(wù)報(bào)銷入賬憑證劃分為5個(gè)區(qū)域,在概率圖模型分類方法理論的基礎(chǔ)上通過(guò)Softmax分類層和5個(gè)分類子網(wǎng)絡(luò)構(gòu)建憑證分類模型,完成電子財(cái)務(wù)報(bào)銷入賬憑證的分類錄入,該方法獲取的特征信息不準(zhǔn)確,降低了電子財(cái)務(wù)報(bào)銷入賬憑證錄入的完整度。
為了解決上述方法中存在的問(wèn)題,提出電子財(cái)務(wù)報(bào)銷入賬憑證自動(dòng)錄入方法,在電子化智能填單系統(tǒng)中,提取錄入電子財(cái)務(wù)報(bào)銷入賬憑證中的文字信息,在財(cái)務(wù)管控系統(tǒng)中錄入提取的文字信息,獲得管控單據(jù)。通過(guò)Gabor濾波器對(duì)錄入數(shù)據(jù)進(jìn)行降噪和去冗處理,提高了財(cái)務(wù)報(bào)銷入賬憑證錄入的效率、錄入精準(zhǔn)度和錄入完整度。
電子財(cái)務(wù)報(bào)銷入賬憑證自動(dòng)錄入方法設(shè)計(jì)一個(gè)Gabor濾波器組,對(duì)電子財(cái)務(wù)報(bào)銷入賬憑證圖像進(jìn)行濾波,二維Gabor函數(shù)在時(shí)域中屬于高斯函數(shù)調(diào)制的復(fù)數(shù)正弦函數(shù)[6-7],在時(shí)域中通過(guò)式(1)描述二維Gabor函數(shù)的一般形式,
(1)
式中,(x′,y′)代表時(shí)域坐標(biāo)旋轉(zhuǎn)結(jié)果,σx、σy代表尺度參數(shù),γ代表高斯函數(shù)對(duì)應(yīng)的橫縱比,φ代表尺度參數(shù),f代表Gabor函數(shù)余弦部分中的頻率。
二維Gabor函數(shù)根據(jù)坐標(biāo)軸旋轉(zhuǎn)的傅里葉變換法在電子財(cái)務(wù)報(bào)銷入賬憑證圖像頻域中通過(guò)式(2)進(jìn)行描述,
(2)
式中,(u′,v′)代表頻域坐標(biāo)旋轉(zhuǎn)結(jié)果,e代表濾波系數(shù)。
應(yīng)對(duì)不同的空間方向和頻率,將錄入的電子財(cái)務(wù)報(bào)銷入賬憑證圖像分解為若干個(gè)濾波圖像,采用Gabor變換對(duì)電子財(cái)務(wù)報(bào)銷入賬憑證圖像ζ(x,y)進(jìn)行變化[8],獲得式(3),
r(x,y)=g(x,y)*ζ(x,y)
(3)
式中,*描述的是卷積運(yùn)算。
分析式(3)可知,通過(guò)計(jì)算f、γ、σ、θ可以確定Gabor濾波器對(duì)電子財(cái)務(wù)報(bào)銷入賬憑證圖像進(jìn)行濾波的計(jì)算式。并通過(guò)式(4)確定參數(shù)f、σ,
(4)
式中,f代表濾波器對(duì)應(yīng)的中心頻率。
濾波器通常情況下存在幾個(gè)濾波,在本文中,區(qū)分電子財(cái)務(wù)報(bào)銷入賬憑證圖像的基礎(chǔ)是濾波之間存在的信號(hào)響應(yīng)關(guān)系[9],通過(guò)式(5)選擇憑證圖像的離散旋轉(zhuǎn)角度,
(5)
式中,n代表旋轉(zhuǎn)角度,θl代表第l個(gè)角度。
電子財(cái)務(wù)報(bào)銷入賬憑證自動(dòng)錄入方法采用Gabor能量描述電子財(cái)務(wù)報(bào)銷入賬憑證圖像的紋理特征,如式(6),
(6)
式中,rζ,f,θ,0、rζ,f,θ-(1/2)π為相互對(duì)稱的濾波。
將濾波后的電子財(cái)務(wù)報(bào)銷入賬憑證圖像的S型調(diào)制轉(zhuǎn)變?yōu)檎叫握{(diào)整[10],如式(7),
(7)
在實(shí)際中,Gabor濾波效果會(huì)受到紋理特征起伏變化的影響,包括玫瑰斑、偽紋理等噪聲的引入,為了解決上述問(wèn)題,對(duì)Gabor濾波輸出的電子財(cái)務(wù)報(bào)銷入賬憑證圖像進(jìn)行Gauss低通濾波處理,如式(8),
(8)
式中,σs代表高斯窗口函數(shù)對(duì)應(yīng)的標(biāo)準(zhǔn)差。
為了改善電子財(cái)務(wù)報(bào)銷入賬憑證分類的效果,提高運(yùn)算效率,降低特征維數(shù),需要對(duì)憑證數(shù)據(jù)進(jìn)行特征提取。采用順序向前搜索算法將平均入賬憑證J-M距離作為指標(biāo)實(shí)現(xiàn)特征提取,平均J-M距離如式(9),
(9)
式中,JM代表平均距離,pi、pj代表類別i和類別j對(duì)應(yīng)的先驗(yàn)概率,JMij代表類別i和類別j之間存在的J-M距離,Bij代表B氏距離,Mi、Mj分別代表i和類別j對(duì)應(yīng)的樣本均值向量,Vi、Vj代表類別i和類別j對(duì)應(yīng)的矩陣樣本別方差,n代表類別總數(shù)。根據(jù)上述計(jì)算,提取電子財(cái)務(wù)報(bào)銷入賬憑證特征,為實(shí)現(xiàn)憑證自動(dòng)錄入做基礎(chǔ)。
為實(shí)現(xiàn)憑證自動(dòng)錄入,通過(guò)支持向量機(jī)在高維解空間中構(gòu)造一個(gè)可以劃分兩類,并使間隔最大的最優(yōu)線性分類面,構(gòu)建憑證自動(dòng)錄入決策函數(shù)。
通過(guò)式(10)描述憑證自動(dòng)錄入線性判別函數(shù),
g(x)=w·x+b
(10)
分類面為g(x)=0,設(shè)xi代表輸入向量,yi代表分類標(biāo)記值,當(dāng)分類標(biāo)記值為1時(shí)表示屬于,當(dāng)分類標(biāo)記值為-1時(shí)表示不屬于。
通過(guò)帶約束條件的極值問(wèn)題代替線性分類問(wèn)題,解決原有憑證自動(dòng)錄入無(wú)法實(shí)現(xiàn)最優(yōu)線性路徑的問(wèn)題,如式(11),
(11)
在上述過(guò)程的基礎(chǔ)上建立Lagrange方程,如式(12)。
(12)
利用式(13)對(duì)參數(shù)b和參數(shù)w求偏導(dǎo),
(13)
支持向量即為取值不為零的ai,建立憑證自動(dòng)錄入決策函數(shù),如式(14),
(14)
式中,(x·xi)代表核函數(shù),描述的是x和xi之間的相似度,針對(duì)非線性變換φ(x),重新構(gòu)建憑證自動(dòng)錄入決策函數(shù),如式(15)。
(15)
將提取的特征輸入上述憑證自動(dòng)錄入決策函數(shù)中,完成電子財(cái)務(wù)報(bào)銷入賬憑證分類和自動(dòng)錄入。
為了驗(yàn)證電子財(cái)務(wù)報(bào)銷入賬憑證自動(dòng)錄入方法的整體有效性,需要對(duì)電子財(cái)務(wù)報(bào)銷入賬憑證自動(dòng)錄入方法進(jìn)行測(cè)試,本次測(cè)試采用Matlab R2013a軟件,在聯(lián)想ThinkStation P310 64位Windows旗艦版操作系統(tǒng)上實(shí)現(xiàn),選用某公司的電子財(cái)務(wù)報(bào)銷費(fèi)用作為實(shí)驗(yàn)數(shù)據(jù)。分別采用電子財(cái)務(wù)報(bào)銷入賬憑證自動(dòng)錄入方法(方法1)、基于二維局部二值模式的電子財(cái)務(wù)報(bào)銷入賬憑證錄入方法(方法2)和基于卷積神經(jīng)網(wǎng)絡(luò)的電子財(cái)務(wù)報(bào)銷入賬憑證錄入方法(方法3)進(jìn)行測(cè)試,將錄入效率、錄入精準(zhǔn)度、錄入完整度作為測(cè)試指標(biāo)。
(1)錄入效率
錄入效率測(cè)試結(jié)果如圖1所示。
圖1 錄入效率測(cè)試結(jié)果
分析圖1可知,在多次迭代中方法1錄入電子財(cái)務(wù)報(bào)銷入賬憑證所用的時(shí)間均在10 s以下,采用方法2和方法3在多次迭代中錄入電子財(cái)務(wù)報(bào)銷入賬憑證所用的時(shí)間均高于15 s。通過(guò)上述對(duì)比分析可知,方法1錄入電子財(cái)務(wù)報(bào)銷入賬憑證所用的時(shí)間最少,這是因?yàn)榉椒?在特征提取過(guò)程中采用Gauss低通濾波器消除噪聲等干擾信息,縮短了特征提取所用的時(shí)間,進(jìn)而縮短了電子財(cái)務(wù)報(bào)銷入賬憑證所用的時(shí)間,提高了方法1的錄入效率。
(2)錄入精準(zhǔn)度
錄入精準(zhǔn)度測(cè)試結(jié)果如圖2所示。
圖2 錄入精準(zhǔn)度測(cè)試結(jié)果
通過(guò)圖2可知,方法1的錄入精度在多次迭代中均在80%以上,遠(yuǎn)遠(yuǎn)高于方法2和方法3的錄入精準(zhǔn)度,因?yàn)榉椒?通過(guò)Gabor濾波器對(duì)待錄入的憑證數(shù)據(jù)進(jìn)行降噪和去冗處理,消除了特征之間存在的冗余和干擾,提高了電子財(cái)務(wù)報(bào)銷入賬憑證錄入的精準(zhǔn)度。
(3)錄入完整度
錄入完整度測(cè)試結(jié)果如圖3所示。
對(duì)圖3中的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析可知,方法1在多次迭代中錄入的電子憑證報(bào)銷入賬憑證的完整度均在90%以上,方法2和方法3在多次迭代中錄入的電子憑證報(bào)銷入賬憑證的完整度在70%附近波動(dòng),根據(jù)測(cè)試結(jié)果可知,方法1的電子賬務(wù)報(bào)銷入賬憑證錄入完整度較高,因?yàn)榉椒?采用順序向前搜索方法在多通道的濾波特征圖像中提取憑證數(shù)據(jù)特征,將J-M距離作為評(píng)價(jià)指標(biāo),實(shí)現(xiàn)特征空間的優(yōu)化,提高了電子賬務(wù)報(bào)銷入賬憑證的完整度。
圖3 錄入完整度測(cè)試結(jié)果
記賬憑證的源頭經(jīng)濟(jì)業(yè)務(wù)隨著信息化水平的提高逐漸向電子化流轉(zhuǎn),人工記賬逐漸被計(jì)算機(jī)記賬代替。使用計(jì)算機(jī)記賬方式可以從日常繁雜的會(huì)計(jì)核算中解放財(cái)務(wù)人員,同時(shí)解決了業(yè)務(wù)流程和會(huì)計(jì)流程的分離問(wèn)題,實(shí)現(xiàn)會(huì)計(jì)的管理、監(jiān)督職責(zé)。目前電子財(cái)務(wù)報(bào)銷入賬憑證錄入方法存在錄入效率低、錄入精準(zhǔn)度低和錄入完整度低的問(wèn)題。提出電子財(cái)務(wù)報(bào)銷入賬憑證自動(dòng)錄入方法,提取電子財(cái)務(wù)報(bào)銷入賬憑證的特征,根據(jù)特征對(duì)其進(jìn)行分類,完成電子財(cái)務(wù)報(bào)銷入賬憑證的自動(dòng)錄入,解決了目前方法中存在的問(wèn)題。