摘要:為提高財(cái)務(wù)數(shù)據(jù)處理的自動化水平,本文設(shè)計(jì)了一種基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動化分類系統(tǒng)。該系統(tǒng)在收集財(cái)務(wù)數(shù)據(jù)后,根據(jù)分類規(guī)則進(jìn)行自動化分類,并將結(jié)果存儲于數(shù)據(jù)庫中。分類規(guī)則基于財(cái)務(wù)數(shù)值、文本和業(yè)務(wù)邏輯構(gòu)成,并采用RPA技術(shù)進(jìn)行參數(shù)設(shè)置,執(zhí)行邏輯編寫。數(shù)據(jù)建模使用Apriori算法挖掘數(shù)據(jù)模式,生成關(guān)聯(lián)規(guī)則,并直接應(yīng)用于財(cái)務(wù)機(jī)器人的數(shù)據(jù)自動化分類系統(tǒng)中。經(jīng)測試,基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類的需求。
關(guān)鍵詞:RPA技術(shù);財(cái)務(wù)機(jī)器人;數(shù)據(jù)自動化;分類系統(tǒng)設(shè)計(jì)
中圖分類號:F273""""""""" 文獻(xiàn)標(biāo)志碼:A
隨著信息技術(shù)飛速發(fā)展,企業(yè)對財(cái)務(wù)數(shù)據(jù)處理的自動化和智能化需求日益增長。為提高財(cái)務(wù)數(shù)據(jù)的處理效率和準(zhǔn)確性,本文設(shè)計(jì)了一種基于機(jī)器人流程自動化(Robotic Process Automation,RPA)技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)。該系統(tǒng)利用RPA技術(shù),可實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的自動收集、清洗和轉(zhuǎn)換,并采用Apriori算法挖掘數(shù)據(jù)模式,生成關(guān)聯(lián)規(guī)則,從而實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的自動化分類。此外,除了對財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)進(jìn)流程、數(shù)據(jù)建模、應(yīng)用與監(jiān)控等方法進(jìn)行設(shè)計(jì)外,還對多個用戶同時向財(cái)務(wù)機(jī)器人輸入數(shù)據(jù)后的情況進(jìn)行了測試分析。測試結(jié)果表明,基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類的需求。本文基于RPA的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)旨在推動企業(yè)財(cái)務(wù)管理現(xiàn)代化進(jìn)程,提升企業(yè)的核心競爭力。
1流程設(shè)置
1.1數(shù)據(jù)處理
設(shè)計(jì)該系統(tǒng)時,首要任務(wù)是對財(cái)務(wù)數(shù)據(jù)進(jìn)行處理。機(jī)器人會應(yīng)用RPA技術(shù)自動收集、清洗和轉(zhuǎn)換各種類型的財(cái)務(wù)數(shù)據(jù),確保數(shù)據(jù)的完整性和準(zhǔn)確性[1]?;赗PA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類流程如圖1所示。
在確保機(jī)器人有權(quán)限訪問并連接財(cái)務(wù)數(shù)據(jù)源的情況下,機(jī)器人能夠應(yīng)用RPA技術(shù)自動從會計(jì)軟件、銀行對賬單、發(fā)票、工資單等多個財(cái)務(wù)數(shù)據(jù)源中收集數(shù)據(jù),并對數(shù)據(jù)進(jìn)行清洗,以消除重復(fù)、不完整、不準(zhǔn)確或無關(guān)數(shù)據(jù)。去除重復(fù)記錄、填補(bǔ)缺失值、糾正錯誤和標(biāo)準(zhǔn)化數(shù)據(jù)格式后,將清洗的數(shù)據(jù)轉(zhuǎn)換為適合分類的格式。采用RPA編譯將數(shù)據(jù)轉(zhuǎn)換為適合機(jī)器學(xué)習(xí)模型的格式。轉(zhuǎn)換后,財(cái)務(wù)機(jī)器人可對數(shù)據(jù)信息進(jìn)行驗(yàn)證,以確保其完整性和準(zhǔn)確性。再將不同來源的數(shù)據(jù)集成到一個統(tǒng)一的數(shù)據(jù)集中,處理數(shù)據(jù)源間的沖突和重復(fù)問題,并將數(shù)據(jù)存儲到數(shù)據(jù)庫中,以支持后續(xù)的數(shù)據(jù)分析。
1.2設(shè)置分類規(guī)則
在基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動化分類系統(tǒng)中,處理規(guī)則是保證數(shù)據(jù)正確分類的關(guān)鍵[2]。RPA數(shù)據(jù)自動化分類系統(tǒng)處理規(guī)則流程如圖2所示。
在基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動化分類系統(tǒng)中,明確財(cái)務(wù)數(shù)據(jù)分類的需求和目標(biāo)可識別出具體的分類規(guī)則[3]。分類規(guī)則由具體財(cái)務(wù)數(shù)值、財(cái)務(wù)發(fā)票文本、財(cái)政年度以及其他業(yè)務(wù)邏輯構(gòu)成。設(shè)置參數(shù)時,需要根據(jù)定義好的規(guī)則編寫具體的執(zhí)行邏輯,并為每個規(guī)則設(shè)置相應(yīng)的參數(shù)。參數(shù)設(shè)定為固定值——金額、變量——日期以及外部源數(shù)據(jù)——市場利率。設(shè)計(jì)數(shù)據(jù)驗(yàn)證流程可保證輸入數(shù)據(jù)符合預(yù)設(shè)格式標(biāo)準(zhǔn)。對于不符合要求的數(shù)據(jù),需要記錄異常、觸發(fā)警報(bào),并對其進(jìn)行異常處理。確定規(guī)則并驗(yàn)證數(shù)據(jù)后,財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)將設(shè)計(jì)自動化分類流程,使用循環(huán)結(jié)構(gòu)遍歷所有數(shù)據(jù)并應(yīng)用分類規(guī)則。最后根據(jù)配置結(jié)果輸出報(bào)告,生成詳細(xì)財(cái)務(wù)數(shù)據(jù)信息,并根據(jù)報(bào)告結(jié)果進(jìn)行反饋循環(huán),以持續(xù)優(yōu)化、調(diào)整分類規(guī)則,滿足企業(yè)的財(cái)務(wù)數(shù)據(jù)分類需求。
2數(shù)據(jù)建模
2.1Apriori算法挖掘
在基于RPA的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)中,Apriori算法有助于識別數(shù)據(jù)中的模式和關(guān)聯(lián),從而輔助生成分類規(guī)則[4]。掃描數(shù)據(jù)集,并統(tǒng)計(jì)每個項(xiàng)的支持度計(jì)數(shù),可生成頻繁1-項(xiàng)集。基于頻繁k-1項(xiàng)集,可連接產(chǎn)生候選k-項(xiàng)集。對候選k-項(xiàng)集進(jìn)行剪枝,即可去除不滿足最小支持度要求的候選項(xiàng)。計(jì)算每個候選項(xiàng)集在數(shù)據(jù)集中出現(xiàn)的支持度,可識別出頻繁項(xiàng)集,即在數(shù)據(jù)集中經(jīng)常出現(xiàn)的物品組合。支持度計(jì)算過程如公式(1)所示。
(1)
式中:x為一個物品或物品組合,即要計(jì)算支持度的項(xiàng)集;Sx為物品x的支持度,即物品x在所有交易中出現(xiàn)的概率;Tc為所含物品x的交易數(shù),即數(shù)據(jù)集中所含物品x的交易數(shù)量;Tt為總交易數(shù),即數(shù)據(jù)集中的總交易數(shù)量。
得到支持度后,根據(jù)最小支持度閾值篩選出頻繁k-項(xiàng)集,作為下一輪迭代的基礎(chǔ),并重復(fù)進(jìn)行連接、剪枝、計(jì)算支持度和篩選頻繁項(xiàng)集的步驟,直到無法生成新的頻繁k-項(xiàng)集為止。最后,基于挖掘到的頻繁項(xiàng)集生成關(guān)聯(lián)規(guī)則,并計(jì)算置信度等指標(biāo)。置信度指標(biāo)計(jì)算過程如公式(2)所示。
(2)
式中:(x→y)為關(guān)聯(lián)規(guī)則,其中x是規(guī)則的前提部分,y是規(guī)則的結(jié)論部分,表示在購買物品x的情況下也購買物品y;S(x,y)為同時含有物品x和y的交易數(shù),即數(shù)據(jù)集中同時含有物品x和y的交易數(shù)量;S(x)為物品x的支持度,即物品x在所有交易中出現(xiàn)的概率,在此處可用于計(jì)算購買物品x時也購買物品y的概率;Cd(x→y)為關(guān)聯(lián)規(guī)則的置信度,即在購買物品x時也購買物品y的概率,該值可衡量關(guān)聯(lián)規(guī)則的強(qiáng)度和可靠性。
置信度指標(biāo)可評估關(guān)聯(lián)規(guī)則中前提部分與結(jié)論部分間的相關(guān)性。高置信度表明在前提條件下出現(xiàn)結(jié)論的概率較高,規(guī)則更可靠。
2.2生成關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則可由頻繁項(xiàng)集推導(dǎo)得出[5]。根據(jù)最小支持度和最小置信度閾值,從頻繁項(xiàng)集中選擇具有較高支持度和置信度的項(xiàng)集,將其作為關(guān)聯(lián)規(guī)則的候選項(xiàng)。對于每一個頻繁項(xiàng)集,生成所有可能的關(guān)聯(lián)規(guī)則。假設(shè)頻繁項(xiàng)集為{A,B,C},可以生成的關(guān)聯(lián)規(guī)則包括A≥B,C;B≥AC;C≥A,B;A≥B;A≥C;B≥A;B≥C;C≥A;C≥B。計(jì)算生成的每個關(guān)聯(lián)規(guī)則的置信度。如果置信度大于等于最小置信度閾值,則將該關(guān)聯(lián)規(guī)則保存下來。對于每個保存下來的關(guān)聯(lián)規(guī)則,根據(jù)規(guī)則的前置條件和結(jié)論部分進(jìn)行規(guī)則命名和描述。如規(guī)則A≥B中,C可以命名為“購買A通常伴隨購買B和C”,并對其進(jìn)行解釋和注釋,以便于后續(xù)理解使用。根據(jù)增加或減少頻繁項(xiàng)集的選擇調(diào)整最小支持度和最小置信度閾值,以獲得更符合實(shí)際需求的關(guān)聯(lián)規(guī)則。最后將生成的關(guān)聯(lián)規(guī)則應(yīng)用于財(cái)務(wù)機(jī)器人的數(shù)據(jù)自動化分類系統(tǒng)中,輔助分類規(guī)則的生成和優(yōu)化。
3應(yīng)用與監(jiān)控
3.1關(guān)聯(lián)規(guī)則應(yīng)用
在應(yīng)用過程中,利用生成的關(guān)聯(lián)規(guī)則幫助財(cái)務(wù)機(jī)器人更好地理解數(shù)據(jù)并進(jìn)行自動化分類,從而提高分類系統(tǒng)的準(zhǔn)確性、效率和智能化水平[6]。同時,計(jì)算余弦相似度可衡量2個向量間的相似程度,進(jìn)而在關(guān)聯(lián)規(guī)則挖掘中評估規(guī)則間的相似性,以更好地理解數(shù)據(jù)間的關(guān)系和模式。余弦相似度是指將2個向量在空間中進(jìn)行投影并計(jì)算二者間夾角的余弦值來衡量其相似程度。分子表示2個向量間的內(nèi)積,分母表示各自長度的乘積。對于任意2條關(guān)聯(lián)規(guī)則對應(yīng)的向量,余弦相似度計(jì)算過程如公式(3)所示。
(3)
式中:x和y分別為2條關(guān)聯(lián)規(guī)則對應(yīng)的向量;xi和yi分別為2個向量在第i個維度上的取值;Σi xi. yi為2個向量x和y中對應(yīng)維度值的乘積之和,此部分計(jì)算了2個向量在每個
維度上的相似程度為2個向量各自每個維度值的平方和開根號后的乘積,此部分計(jì)算了2個向量在每個維度上的長度。
余弦相似度值范圍為[-1,1],其中1為完全相同,-1為完全不同,0為無相關(guān)性。計(jì)算余弦相似度,比較不同規(guī)則間的方向關(guān)系,從而更好地理解數(shù)據(jù)間的關(guān)系和模式。
3.2性能監(jiān)控
在完成財(cái)務(wù)數(shù)據(jù)的自動化分類流程和關(guān)聯(lián)規(guī)則的生成后,為了確保系統(tǒng)的穩(wěn)定性、準(zhǔn)確性并適應(yīng)可能的變化,需要對系統(tǒng)進(jìn)行性能監(jiān)控與調(diào)優(yōu)。首先,應(yīng)持續(xù)監(jiān)控?cái)?shù)據(jù)清洗的質(zhì)量,確保數(shù)據(jù)的準(zhǔn)確性和完整性。通過抽樣檢查或全量檢查相結(jié)合的方式,可驗(yàn)證數(shù)據(jù)質(zhì)量。其次,采用交叉驗(yàn)證測試來評估分類系統(tǒng)的準(zhǔn)確率。將財(cái)務(wù)數(shù)據(jù)中的原始數(shù)據(jù)集劃分為訓(xùn)練集和測試集,并使用訓(xùn)練集數(shù)據(jù)訓(xùn)練分類模型。將訓(xùn)練集數(shù)據(jù)劃分為K個等份,每次保留一個份作為測試集,其余(K-1)份作為訓(xùn)練集,重復(fù)k次,得到k個模型評估結(jié)果。最后,統(tǒng)計(jì)每次交叉驗(yàn)證的分類結(jié)果,計(jì)算分類系統(tǒng)的準(zhǔn)確率。分類系統(tǒng)的準(zhǔn)確率計(jì)算過程如公式(4)所示。
×100%(4)
式中:Ac為準(zhǔn)確率;Cs為模型正確預(yù)測的樣本數(shù)量;Ts為總的測試樣本數(shù)量。
將k次交叉驗(yàn)證的準(zhǔn)確率取平均值,即可得到最終準(zhǔn)確率評估結(jié)果,計(jì)算過程如公式(5)所示。
Acyi(5)
式中:Fa為最終準(zhǔn)確率;k為交叉驗(yàn)證的折數(shù),表示數(shù)據(jù)集被劃分為子集進(jìn)行驗(yàn)證的子集數(shù)量;Acyi為在第i折驗(yàn)證所得的準(zhǔn)確率。
在交叉驗(yàn)證過程中,對每一次驗(yàn)證得到的準(zhǔn)確率進(jìn)行求和,并取平均值作為最終的準(zhǔn)確率評估指標(biāo),由此可以綜合考慮所有折的表現(xiàn),更全面地評估分類系統(tǒng)的性能。
4測試評估
4.1測試準(zhǔn)備
基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動化分類系統(tǒng)的集成測試以Windows Server2019為操作系統(tǒng),部署Intel Core i7-10700KF處理器,以滿足系統(tǒng)快速處理大量財(cái)務(wù)數(shù)據(jù)的基礎(chǔ)需求。同時,采用Corsair Vengeance LPX16GB(2×8GB)、DDR43200MHz內(nèi)存,以便系統(tǒng)能夠同時處理多個任務(wù)和數(shù)據(jù)集,并便于機(jī)器人與不同的財(cái)務(wù)系統(tǒng)快速進(jìn)行數(shù)據(jù)交換。服務(wù)器還設(shè)置有Intel X550-AT210GbE SFP+Network Interface Card網(wǎng)絡(luò)接口。建立高速穩(wěn)定的網(wǎng)絡(luò)環(huán)境,以確保機(jī)器人可以無障礙地在不同系統(tǒng)間傳輸數(shù)據(jù)。完成測試環(huán)境搭建后,根據(jù)功能測試驗(yàn)證財(cái)務(wù)機(jī)器人在高并發(fā)情況下的數(shù)據(jù)收集性能。模擬多個用戶同時向數(shù)據(jù)源輸入數(shù)據(jù),并運(yùn)行數(shù)據(jù)收集任務(wù),測量收集任務(wù)的響應(yīng)時間和系統(tǒng)資源占用情況,從而驗(yàn)證系統(tǒng)在高并發(fā)情況下能否保持性能的穩(wěn)定性。
4.2測試結(jié)果
為驗(yàn)證基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)情況下的數(shù)據(jù)收集性能,模擬多個用戶同時向數(shù)據(jù)源輸入數(shù)據(jù),并運(yùn)行數(shù)據(jù)收集任務(wù),系統(tǒng)響應(yīng)時間和資源占用情況見表1。
經(jīng)測試,隨著用戶數(shù)增加,系統(tǒng)響應(yīng)時間基本保持在2s左右,表明系統(tǒng)在高并發(fā)情況下仍能保持較快的數(shù)據(jù)收集速度。TC-6(60個用戶)的響應(yīng)時間為2.5s,略高于其他測試用例,但仍然在可接受范圍內(nèi)。另外,CPU利用率隨著用戶數(shù)增加而逐漸上升,但利用率始終保持在60%以下,證明CPU資源沒有達(dá)到滿載,仍有余力處理更多的任務(wù)。同時,內(nèi)存利用率同樣隨著用戶數(shù)增加而上升,但總體保持在55%~63%,表明內(nèi)存利用率的增加幅度也相對平穩(wěn),系統(tǒng)內(nèi)存管理得當(dāng),表明基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類需求。
5結(jié)語
基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)為企業(yè)提供了一種高效、準(zhǔn)確的財(cái)務(wù)數(shù)據(jù)處理解決方案,有助于提升企業(yè)的財(cái)務(wù)管理水平和核心競爭力。設(shè)計(jì)了基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng),可實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)處理的自動化和智能化,有效提高企業(yè)財(cái)務(wù)數(shù)據(jù)處理的效率和準(zhǔn)確性。利用RPA技術(shù),可實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的自動收集、清洗、轉(zhuǎn)換和分類功能,采用Apriori算法挖掘數(shù)據(jù)模式并生成關(guān)聯(lián)規(guī)則,可滿足大規(guī)模數(shù)據(jù)分類的需求。經(jīng)測試,在高并發(fā)環(huán)境下,系統(tǒng)表現(xiàn)穩(wěn)定,響應(yīng)迅速,并且資源利用率在可接受范圍內(nèi)。表明基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動化分類系統(tǒng)具備處理大量財(cái)務(wù)數(shù)據(jù)和快速交換數(shù)據(jù)的能力,可用于企業(yè)日常財(cái)務(wù)數(shù)據(jù)處理、分析和報(bào)告。
參考文獻(xiàn)
[1]彭雪妍. 基于財(cái)務(wù)數(shù)字化轉(zhuǎn)型背景下的國企集團(tuán)司庫管理體系建設(shè)路徑探析[J]. 國際商務(wù)財(cái)會,2023(23):49-52.
[2]徐強(qiáng)艷,李璐涵. 數(shù)字化轉(zhuǎn)型背景下RPA財(cái)務(wù)機(jī)器人在中小型企業(yè)財(cái)務(wù)管理中的應(yīng)用探究[J]. 老字號品牌營銷,2023
(23):98-100.
[3]黃月薪,陳兵,王耀東,等. 機(jī)器人流程自動化技術(shù)驅(qū)動科技期刊數(shù)字化創(chuàng)新發(fā)展的應(yīng)用路徑——出版流程轉(zhuǎn)型升級視角[J]. 科技管理研究,2023,43(23):241-246.
[4]張曉瑋,劉波,戈姍姍,等. 基于人工智能的財(cái)務(wù)管理創(chuàng)新——財(cái)務(wù)機(jī)器人在XH醫(yī)院的應(yīng)用[J]. 財(cái)會月刊,2022
(23):119-126.
[5]黃成慶,董文宇. 基于RPA技術(shù)的醫(yī)院醫(yī)療收入核算流程優(yōu)化研究——以FY醫(yī)院為例[J]. 會計(jì)之友,2022(16):40-46.
[6]張媛. 基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動化分類系統(tǒng)[J]. 自動化與儀器儀表,2022(1):168-171.