【關(guān)鍵詞】審計法治;數(shù)字化治理;審計法專家系統(tǒng);科技強審
審計法擔負著服務經(jīng)濟社會發(fā)展、推進國家治理能力現(xiàn)代化的歷史重任,中央審計委員會第一次會議強調(diào):“要堅持‘科技強審’,加強審計信息化建設,建立審計大數(shù)據(jù)中心和大數(shù)據(jù)審計綜合分析管理平臺”[1]。中央審計委員會辦公室及審計署也將“提升信息化支撐業(yè)務能力、提升數(shù)據(jù)管理水平、加強數(shù)據(jù)資源分析利用”列入《“十四五”國家審計工作發(fā)展規(guī)劃》,對此,本文將以審計法專家系統(tǒng)構(gòu)建的一般步驟為脈絡,論證構(gòu)建審計法專家系統(tǒng)的可能性與法治意義。從專家系統(tǒng)有效運行的必要步驟分析出其組件自身的固有局限,分析人工智能中的自動建模、對象分類模型、增量技術(shù)等思想在審計法專家系統(tǒng)構(gòu)建過程中的應用價值。
(一)強化審計法治共識
人工智能的法律推理難點在于用自然語言表述的法律本身的模糊、多義性[2]。比如,《審計法》第37條第3款規(guī)定審計機關(guān)查詢權(quán)的行使需要一個前提,就是“有證據(jù)證明”。但用于證明的證據(jù)種類繁多,此處到底是指法律證據(jù)還是既包括法律證據(jù)又包括審計證據(jù)?由于形式邏輯的非此即彼,在專家系統(tǒng)將《審計法》條文代碼化的過程中,“證據(jù)”的內(nèi)涵和類別將會被界定。Otto(2007)指出信息技術(shù)人員在對《美國健康保險便攜性和責任法案》進行文本處理時,必須就“保護受保護的健康信息免受任何合理預期的安全或者完整性威脅或危害”中的“合理預期”做出準確界定。Toval等人創(chuàng)建了一個可重復使用的法律要求目錄,將該技術(shù)運用到審計法規(guī)中可以讓分析人員更容易發(fā)現(xiàn)歧義和不一致,在分析的過程中,目錄的質(zhì)量也會隨著分析次數(shù)的增加而提高。專家系統(tǒng)的建立不僅能夠?qū)ο蟮膬?nèi)涵和類別進行界定,而且可以在解釋歧義之后建立可重復使用的法律要求目錄,使得發(fā)現(xiàn)歧義的過程更加容易,通過對其不斷維護和更新可以實時追蹤法律法規(guī)的最新動態(tài),回答用戶的疑問,在此基礎(chǔ)上統(tǒng)一審判機關(guān)、審計機關(guān)以及企事業(yè)單位對審計法規(guī)的認知,并提示立法者在今后的法律修正案中解決已知的模棱兩可的問題。
(二)規(guī)避模糊地帶的處罰
專家系統(tǒng)可以幫助用戶判斷自己是否違規(guī),避免模糊地帶的處罰,Massacci等人在生成定義后根據(jù)參與者、參與者之間的依賴關(guān)系、信任關(guān)系、委托關(guān)系和目標細化來建模,用于評估大學是否遵守《意大利數(shù)據(jù)保護法》。僅以對行政單位進行政府審計為例,《行政事業(yè)單位資金、資產(chǎn)管理法規(guī)行為》《違反票據(jù)管理法規(guī)行為》《違法行政事業(yè)單位預算管理法規(guī)行為》《違法行政事業(yè)單位業(yè)務管理法規(guī)行為》中規(guī)定的違規(guī)行為共四大類469項,其中難免存在模糊地帶,如果能將這些信息輸入專家系統(tǒng),由專家系統(tǒng)判定該行為是否違規(guī),那么審計主客體都可以將此作為模糊地帶的通行標準作為參考。這樣一來,行政單位工作人員作為審計客體,其因業(yè)務不熟悉而違規(guī)的風險就會減小,而審計人員只需要進行程序操作就可以得出審計客體是否違規(guī)的輔助性結(jié)論,大幅度提高審計效率。
(三)統(tǒng)一審計法規(guī)體系
審計法規(guī)的立法分散且更新快,法規(guī)之間存在沖突或者下位法有規(guī)定但上位法卻空白時常發(fā)生。例如,2017年《軍隊審計條例》第六十六條規(guī)定了軍隊審計人員審計工作受干預時,應將干預審計工作的行為強制登記并歸入審計檔案。天津市、福建省、重慶市等審計廳(局)都用“辦法”的方式建立了干預審計工作行為登記報告制度,如2016年印發(fā)的《福建省登記報告干預審計工作行為辦法》等政策性文件。但是,在2021年新頒布的《中華人民共和國審計法》及《審計法實施條例》中,卻不見關(guān)于“有干預審計工作的行為,應強制報告登記”的規(guī)定,《審計法》和《審計實施條例》作為上位法出現(xiàn)這樣的空白,不僅使得地方立法實踐于法無據(jù),而且與《軍隊審計條例》的相關(guān)條文不相協(xié)同,也不利于強化審計機關(guān)和審計工作人員依法獨立履職。審計法專家系統(tǒng)能夠?qū)徲嫹ㄒ?guī)體系進行整合梳理,通過邏輯編程使用事件演算來跟蹤法律文本隨時間的變化,Martinek已經(jīng)創(chuàng)建出一個知識庫,用于維護并監(jiān)管文本何時變化,將這個數(shù)據(jù)庫運用于審計法專家系統(tǒng)中,可以在上位法與下位法不相對應的地方做出提示與修改,既維護了審計法制的統(tǒng)一性,也保證了法律體系的協(xié)同和地方審計法規(guī)實踐的可操作性。
(一)建立審計法專家知識庫
1.專業(yè)知識的收集是專家系統(tǒng)的基礎(chǔ)。這里的知識不僅包括從憲法到民法等各個制定法的知識,還包括為了解決某一審計法相關(guān)案件作出的判決,甚至是存在于法律工作者頭腦中的隱性知識以及為解釋上述知識所做的注釋。將這些知識收集起來是法律專家系統(tǒng)構(gòu)筑的第一步。
2.確定語言分析對象。專家系統(tǒng)的錄入對象是形式化的法律,但是由于語言本身的模糊性以及法律適用者的主觀性,對同一法律的解釋是多元的。鑒于此,吉野一(日本研發(fā)法律專家系統(tǒng)的主導者)建立了邏輯法學并認為“制定出來并經(jīng)過法律使用者解釋的法”才是法理學討論的客觀對象,因此,專家系統(tǒng)進行語言分析的對象是法律專家對“法的印象”。
3.法律語句分析。語言分析是在專家系統(tǒng)中進行法律推理的前提,法律語句由一定的符號組成,按照一定的標準被區(qū)分為規(guī)則語句與事實語句、法律對象語句與法律元語句、基本語句和復合語句三種;法律語句的效力就是在邏輯上的真假,語句有效則邏輯命題為真,語句無效則邏輯命題為假,語句的效力通過法律推理來判斷。
(二)形成審計法知識結(jié)構(gòu)
1.確定知識表現(xiàn)形式。選擇知識表示方式需要滿足以下幾個標準:第一,該方式易于法律工作者理解和學習;第二,可以清晰地表述各項法律要素;第三,其邏輯基礎(chǔ)與之后進行形式化推理所使用的技術(shù)適配。
2.使用邏輯流程圖搭建框架。使用邏輯流程圖表示知識的優(yōu)勢在于:表達形式易理解、有利于法律知識的體系化,另外,對流程圖的編寫還可以解釋法律工作者在進行法律判斷時遵循的時間和邏輯順序。
3.使用CPF(復合謂詞邏輯),CPF的優(yōu)勢在于可以將傳統(tǒng)一階邏輯語言無法表示的代詞(如“這”、“該”等指代詞)通過引入自然語言中代詞功能的ID符號對單獨的法律行為作出表述,彌補邏輯流程圖在知識表達方面的不足之處。
(三)進行審計法推理,生成答案
為了滿足用戶不同的功能需求,專家系統(tǒng)需要結(jié)合應用場景添加不同的推理方法,常用于專家系統(tǒng)的經(jīng)典推理方法有前向推理、后向推理以及模糊推理。
1.前向推理。前向推理從已知的事實和規(guī)則出發(fā),逐步得出新的結(jié)論,主要用于自動化決策和問題解決場景。前向推理回答問題的策略是使用前向推理的引擎會搜索結(jié)論,直到滿足前件式“if”時進行推理,然后將推理結(jié)果添加到數(shù)據(jù)組的新信息中,通過考慮所有事實和規(guī)則并進行整理,最終得出解決方案。
2.后向推理從目標出發(fā),反向追蹤規(guī)則和知識,以找到滿足目標的事實或者結(jié)論。后向推理在低層次概念之前定義高層次概念,這保證了在知識提煉過程的每個階段,知識的當前狀態(tài)都與解決的問題類別相關(guān)并適用。
3.模糊推理在經(jīng)典的邏輯命題中,只有是或者否,不存在中間值。專家系統(tǒng)用模糊集來表達語言變量,用模糊成員函數(shù)和規(guī)則將前提和結(jié)論聯(lián)系起來,通過模糊的事實和規(guī)則生成模糊的結(jié)論,從而處理一些不精確的數(shù)據(jù)。除了以上三種主流推理方法,審計法專家系統(tǒng)的成功實踐還需要根據(jù)不同的應用場景對多種推理方法進行集成,如基于案例的推理、基于邏輯的推理以及基于知識圖譜的推理等。
(一)數(shù)據(jù)挖掘、增量技術(shù)提高知識庫質(zhì)量
專家系統(tǒng)的構(gòu)建過程被稱為知識工程。在此過程中,知識工程師需要從專家或者其他來源獲取要建模的知識,這不僅要求工程師和專家持續(xù)合作,而且工程師需要長時間從事對新增知識的采集和新舊知識之間的匹配兩項工作。例如,MYCIN系統(tǒng)是一個用于診斷細菌感染的經(jīng)典專家系統(tǒng),雖然在知識表示和規(guī)則推理方面表現(xiàn)優(yōu)異,但是每一次的知識更新都需要知識工程師從專家領(lǐng)域中手動抽取,而且需要用戶手動錄入患者疾病的所有信息。由于無法及時獲得足夠準確和完整的領(lǐng)域知識,系統(tǒng)的決策能力和問題解決能力受到限制,用戶的需求無法滿足?,F(xiàn)有的數(shù)據(jù)挖掘技術(shù)和增量技術(shù)可以用于解決這一問題。
數(shù)據(jù)挖掘可以實現(xiàn)對審計法知識的自動獲取。數(shù)據(jù)挖掘旨在從大規(guī)模數(shù)據(jù)中自動發(fā)現(xiàn)有用的模式、關(guān)系和知識,以支持決策和知識發(fā)現(xiàn)。研究人員就解決人類智識與專家系統(tǒng)之間的知識轉(zhuǎn)移問題進行了大量研究,但都或多或少存在缺陷。例如,Crowther提出的再現(xiàn)網(wǎng)格技術(shù)根據(jù)概念對對象進行排序,以減少知識獲取過程中的內(nèi)生阻力,卻缺少對知識生成過程的研究。Rybina提出了一種基于ATTECHNOLOGY工作臺和面向問題的方法論的自動時態(tài)知識獲取技術(shù),但是只解決了時態(tài)數(shù)據(jù)的知識轉(zhuǎn)移問題。Oladipupo使用 Apriori 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法從歷史數(shù)據(jù)集中挖掘知識,但未使用數(shù)據(jù)挖掘算法確定其相關(guān)性與有效性。在總結(jié)以往研究的經(jīng)驗與局限的基礎(chǔ)上,穆罕默德提出“通過模糊規(guī)則驅(qū)動的數(shù)據(jù)挖掘框架”,不僅可以利用數(shù)據(jù)挖掘技術(shù)自動獲取知識(甚至隱性知識),而且能夠根據(jù)人類專家的感知和咨詢,定義成員函數(shù)和后果規(guī)則,以盡量減少專家系統(tǒng)中的知識錯誤。
增量學習技術(shù)則可以使新增知識與原有知識庫適配。增量技術(shù)通過連續(xù)學習對新數(shù)據(jù)持續(xù)改進,避免對整個模型重新訓練。專家系統(tǒng)的有效運行依賴于數(shù)據(jù)庫的實時更新,這意味著數(shù)據(jù)庫中的記錄以幾何倍數(shù)增長,且時常會出現(xiàn)現(xiàn)有的數(shù)據(jù)與原來規(guī)定的規(guī)則相沖突或者現(xiàn)有的規(guī)則無法支配新輸入的數(shù)據(jù)的情況。為了解決動態(tài)數(shù)據(jù)庫問題,信息技術(shù)人員在決策樹、神經(jīng)網(wǎng)絡、關(guān)聯(lián)規(guī)則等領(lǐng)域開發(fā)了各種數(shù)據(jù)挖掘的算法,但是這些方法在使用時需要進行統(tǒng)計假設,且無法捕捉非線性數(shù)據(jù)的關(guān)鍵信息。而增量技術(shù)的運用可以解決這一問題,Yu-Neng Fan等人提出利用增量規(guī)則抽取算法,當信息系統(tǒng)中添加新對象時,不必從一開始重新計算規(guī)則集,這就解決了新增數(shù)據(jù)的問題。此外,增量規(guī)則算法還不受數(shù)據(jù)挖掘算法需要統(tǒng)計假設的前提限制,在捕捉非線性數(shù)據(jù)的關(guān)鍵信息時表現(xiàn)優(yōu)異。
由于全球化和跨國公司的存在,審計法相較于其他法律需要在國際層面進行協(xié)調(diào),例如,我國注冊會計師準則屬于廣義的審計法規(guī),這一規(guī)定應與國際審計準則(如國際財務報告準則)相銜接并不斷更改,以適應政策環(huán)境以及貿(mào)易環(huán)境的變化。將數(shù)據(jù)挖掘技術(shù)和增量技術(shù)應用于審計法專家系統(tǒng),不僅有利于我國審計法與國際審計法規(guī)接軌做到實時更新,而且可以為各國審計法的交流合作提供一個去國家化、去社會化的技術(shù)平臺。
(二)對象分類、自動建模、混合推理規(guī)則降低規(guī)則維護成本
經(jīng)典專家系統(tǒng)的維護需要對底層邏輯進行增刪修改,這一過程成本高昂且衍生出對知識工程師和領(lǐng)域?qū)<议L期合作的強烈需求,Deshmukh (1998)在開發(fā)評估審計舞弊風險的專家系統(tǒng)時就表示,開發(fā)一個完整的模糊專家系統(tǒng)時不僅成本高昂,而且需要強有力的持續(xù)合作。如果專家系統(tǒng)的維護者不是一開始的開發(fā)者,那么難度就會進一步加大。Gill(1995)通過對早期專家系統(tǒng)的調(diào)查發(fā)現(xiàn),持續(xù)的高成本維護是導致專家系統(tǒng)難以為繼的重要原因,例如,美國數(shù)字設備公司(DEC)研發(fā)的專家系統(tǒng)XCON可以幫助客戶定制計算機硬件和軟件,這個系統(tǒng)早期在計算機行業(yè)得以廣泛適用,但是隨著XCON中的規(guī)則從1980年的850條增加到1988年的10000多條,對于系統(tǒng)規(guī)則庫的維護和更新就變成了一項艱巨的任務。對象分類模型、自動建模技術(shù)以及混合推理規(guī)則可以有效解決這一問題。
對象分類模型是一種在計算機視角和機器學習領(lǐng)域中常用的模型,可以對圖像或其他感知數(shù)據(jù)中的對象進行分類,將其運用于專家系統(tǒng)可以降低維護規(guī)則庫的時間成本。大多數(shù)開發(fā)人員通過專家與知識工程師的互動對專家系統(tǒng)的知識庫進行更新,知識數(shù)據(jù)和決策規(guī)則被碎片式地添加到系統(tǒng)中,Higa(1998)在模塊化思想的指導下建立對象分類模型來維護規(guī)則庫,這種方法基于圖形將大量數(shù)據(jù)和信息轉(zhuǎn)化為可視化的形式,再將對象的各個方面和特殊因素納入關(guān)系圖中,使得用戶可以感知信息的含義和關(guān)系,將其與編程范式的模塊化優(yōu)勢結(jié)合起來可以顯著提高知識工程師維護規(guī)則庫的實效,降低維護規(guī)則庫的時間成本。
基于用戶的行為特征自動建模是機器學習和數(shù)據(jù)科學領(lǐng)域的常用技術(shù),能夠根據(jù)用戶在互聯(lián)網(wǎng)上的行為構(gòu)建模型。Bieliková等人(2009)提出基于自動獲取用戶行為及其規(guī)則自動建模方法,將所有與審計領(lǐng)域有關(guān)的邏輯都通過日志事件的形式存儲在外部規(guī)則中,再運用基于本體的用戶模型方法,就可以大幅降低對用戶建模過程的執(zhí)行及維護成本。另外,在基于用戶的行為特征自動建模的語境中,推理的規(guī)則存儲了代理處理事件日志和更新用戶模型所需要的所有信息,從而使代理具有高度的可配置性和可重用性,為其他領(lǐng)域?qū)<蚁到y(tǒng)的構(gòu)建提供技術(shù)基礎(chǔ)。
混合推理規(guī)則是一種將不同類型的推理規(guī)則和方法結(jié)合使用以解決復雜問題的方法。Ioannis 和 Jim(2003)注意到傳統(tǒng)的混合專家系統(tǒng)通常集成兩種智能技術(shù),在研究相關(guān)項目的基礎(chǔ)上提出將基于規(guī)則的推理、神經(jīng)計算和基于案例的推理結(jié)合的混合規(guī)則,一方面神經(jīng)網(wǎng)絡即使在審計專家缺席時也可以自動從訓練實例中獲取知識,另一方面神經(jīng)元可以由符號規(guī)則中產(chǎn)生,從而驗證符號規(guī)則產(chǎn)生的知識是否完整。另外,使用這種規(guī)則構(gòu)建的知識還因以神經(jīng)元為組成單位保留了自然性,與等效的符號規(guī)則庫相比,有神經(jīng)元參與構(gòu)建的知識庫的規(guī)模大大縮小,可以顯著提高推理效率。
(三)XAI技術(shù)、徑向基神經(jīng)網(wǎng)絡打破黑箱效應
“黑箱效應”是指模型或系統(tǒng)的內(nèi)部操作對外部用戶或者開發(fā)者不透明、涉及系統(tǒng)內(nèi)部復雜的模型、用戶對代碼的陌生以及數(shù)據(jù)之間的非線性關(guān)系,將導致其生成的法律建議或者答案失去可解釋性。專家系統(tǒng)乃至人工智能的黑箱效應導致社會公眾無法理解代碼社會的運行邏輯,進而擔心被人工智能的生產(chǎn)者暗中操控,法律領(lǐng)域的專家系統(tǒng)尤其需要滿足決策過程的透明性與可解釋性要求。歐洲電信標準化協(xié)會下轄的人工智能安全規(guī)范小組(ISG SAI)在2023年3月發(fā)布的ETSI GR SAI 007號報告中詳細規(guī)定了“透明”和“可解釋”的含義?!巴该鳌钡暮诵暮x是“開放供檢查”或者“沒有可隱藏的部分”,“可解釋”一詞簡單來說就是能夠顯示任何結(jié)果是如何實現(xiàn)的,與透明度結(jié)合起來,就可以保證沒有任何隱藏的部分。但是,經(jīng)典專家系統(tǒng)面臨著知識表示與過程解釋的兩難抉擇,線性模型易于解釋但知識表示能力有限,非參數(shù)方法可以表征豐富的函數(shù)卻難以解釋。隨著深度學習的興起,多層神經(jīng)網(wǎng)絡學習的權(quán)重如何解釋更是一大難題。XAI技術(shù)與徑向基神經(jīng)網(wǎng)絡的運用提供解決這一問題的可能途徑。
XAI(可解釋的人工智能)是人工智能領(lǐng)域可用于解決黑箱效應的技術(shù),XAI方法試圖通過直接傳達模型的工作原理或者證明模型為何會得出預測結(jié)果來提高模型的可解釋性(事后解釋)。事后解釋的一種類型是舉例說明,通過提供實例或者事例證明模型得出特定預測的路徑。例如,在測試圖像分類系統(tǒng)時,6很可能被分類為0,證據(jù)是其他被分類為0的圖像與這張圖像極其相似。Kenny等人提出通過實例進行事后解釋的人工智能(XAI)方法,大致運行過程如下:找到一個待解釋的目標模型和一個相對更透明的代理模型,通過參考透明的代理模型(如基于案例的推理器)來解釋目標模型,這種方法的基礎(chǔ)是對代理模型的權(quán)重分析,在利用透明度更高的代理模型找到可解釋的案例后從目標模型中提取權(quán)重,最后將提取到的特征權(quán)重用于探測目標實例的可解釋性領(lǐng)域。
徑向基神經(jīng)網(wǎng)絡(簡稱RBFNN)是一種人工神經(jīng)網(wǎng)絡,可以抵抗非線性數(shù)據(jù)的干擾降低黑箱效應。得益于在特征映射階段的非線性性質(zhì),RBFNN在處理非線性問題方面非常有效,被廣泛用于專家系統(tǒng)的構(gòu)建中。例如,Pang,Hui等人將徑向基神經(jīng)網(wǎng)絡與最小參數(shù)學習方法相結(jié)合,開發(fā)基于雙曲線函數(shù)的自適應滑動姿態(tài)模式控制器,以消除非線性外部干擾對兩輪移動機器人的影響。
審計法關(guān)注審計活動的公正性,既要關(guān)注審計對象的公平對待,也要關(guān)注審計規(guī)則的公開透明,還要關(guān)注審計活動是否最大程度讓民眾參與,接受民眾監(jiān)督。審計法專家系統(tǒng)對以上技術(shù)的運用可以打破黑箱效應,允許不熟悉代碼知識的社會公眾通過該系統(tǒng)理解審計法決策過程,實現(xiàn)對審計權(quán)的再監(jiān)督,從而保證審計活動的公正性。將上述多種技術(shù)融合于一個專家系統(tǒng)中是可以實現(xiàn)的,在以prolog推理語言為主導的前提下,信息工程研究員以黑板系統(tǒng)作為中央處理工具,通過擴展C++語言的功能為黑板系統(tǒng)設計多種專家模塊提供框架,并將這種理論成功運用于涉及多個專家系統(tǒng)的“數(shù)據(jù)融合”方案,這一實踐為延展專家系統(tǒng)的適用場景與生命周期提供現(xiàn)實可能。