陳旭 陳紅平
【摘 要】 孤立點分析作為一種無監(jiān)督方法,在結(jié)合具體審計業(yè)務(wù)選擇適當(dāng)審計指標的基礎(chǔ)上,能夠自主發(fā)現(xiàn)審計疑點。在自主學(xué)習(xí)并發(fā)現(xiàn)價值信息的過程中,孤立點分析方法既兼顧了對海量數(shù)據(jù)的總體分析,又可作為審計經(jīng)驗補充,輔助審計工作人員發(fā)現(xiàn)審計疑點,并實現(xiàn)疑點的精確定位。文章在分析孤立點研究現(xiàn)狀及常用審計疑點發(fā)現(xiàn)方法的基礎(chǔ)上,提出了基于孤立點分析的審計疑點發(fā)現(xiàn)方法,構(gòu)建了基于孤立點分析的審計疑點發(fā)現(xiàn)框架,并嘗試結(jié)合Y上市公司實際案例數(shù)據(jù),利用Python語言實現(xiàn)建模分析,以探討孤立點分析方法對于輔助審計疑點發(fā)現(xiàn)、提高審計工作效率的意義,為審計人員挖掘?qū)徲嬕牲c提供了新思路。
【關(guān)鍵詞】 孤立點; 審計疑點; 審計數(shù)據(jù)分析; Python語言
【中圖分類號】 F239.45 ?【文獻標識碼】 A ?【文章編號】 1004-5937(2019)17-0072-05
信息技術(shù)的蓬勃發(fā)展伴隨著信息數(shù)據(jù)的迅速增長,為了有效收集并利用這些數(shù)據(jù),企業(yè)不斷提升管理信息化水平,許多單位紛紛建立起了TB甚至PB級數(shù)據(jù)庫,從而導(dǎo)致審計數(shù)據(jù)呈現(xiàn)出量化的趨勢[1]。面對海量數(shù)據(jù),如何實現(xiàn)“審計全覆蓋”并從中快速有效地發(fā)現(xiàn)疑點,運用“整體分析、系統(tǒng)研究、疑點發(fā)現(xiàn)、分散核驗、精確定位”的數(shù)字化審計方式,充分發(fā)揮審計“免疫系統(tǒng)”作用,是目前審計人員面臨的全新挑戰(zhàn)。
在以風(fēng)險為導(dǎo)向的審計模式下,審計人員充分考慮被審計單位經(jīng)濟環(huán)境、治理結(jié)構(gòu)等因素,在合理職業(yè)懷疑基礎(chǔ)上,系統(tǒng)地對審計風(fēng)險進行識別與評估,制定并實施與風(fēng)險相適應(yīng)的審計計劃,執(zhí)行審計程序,搜集審計證據(jù)。常用審計數(shù)據(jù)分析方法要求審計人員具有相關(guān)的先驗知識,在數(shù)據(jù)量暴增環(huán)境下,難以從海量數(shù)據(jù)中快速發(fā)現(xiàn)疑點。鑒于此,本文嘗試對提高審計疑點發(fā)現(xiàn)效率的方法進行探討。
一、研究現(xiàn)狀
近年,關(guān)于聚類及孤立點分析方法在審計工作中的應(yīng)用研究,許多專家學(xué)者進行了一些探索和嘗試。楊松[2]改進了基于單元的異常檢測算法,并給出了算法流程,討論了異常算法如何應(yīng)用于審計證據(jù)的獲取,以醫(yī)用注射器數(shù)據(jù)為例,詳細介紹了在審計系統(tǒng)中使用孤立點算法的方法,證明了該方法的高效性。劉巍[3]設(shè)計編寫了基于DBSCAN聚類的孤立點發(fā)現(xiàn)程序,并以某救災(zāi)資金審計項目數(shù)據(jù)為例,對程序進行驗證,通過該程序,發(fā)現(xiàn)了一些孤立點,為審計人員提供了審計疑點分析新方向。孫等[4]以某高?;üこ探Y(jié)算審計項目為例,分析了聚類技術(shù)及其對電子政務(wù)審計的意義,利用相關(guān)財務(wù)及非財務(wù)指標展示了孤立點分析審計抽樣模型的實施原理,驗證了該模型對于快速確定可疑樣本、提高審計效率的作用。程平等[5]根據(jù)電子政務(wù)抽樣審計對多維數(shù)據(jù)進行分層處理的需求,提出在分層算法中融入基于主次屬性劃分的聚類方法,以適應(yīng)多維數(shù)據(jù)分層抽樣的需要,為電子政務(wù)審計分層抽樣系統(tǒng)的實現(xiàn)提供了一種新的解決方案。楊蘊毅等[6]基于“在單一的聚類結(jié)果中,具有較低可疑性的點通常會被具有較高可疑性的點所掩蓋”這一發(fā)現(xiàn),建議使用迭代聚類方法分析審計疑點,并在篩除明顯的小聚類之后,實行重復(fù)聚類,以獲得更多信息,然后利用上市公司財報數(shù)據(jù)進行測試,對比可疑數(shù)據(jù)與證監(jiān)會等機構(gòu)的查處信息,驗證了方法的可行性。譚艷娜[7]提出將局部異常因子(LOF)算法用于DBSCAN聚類的核心對象判定,對核心對象進行重新定義,并利用社保審計數(shù)據(jù)進行測試,驗證了在不具備審計政策及法規(guī)知識等情況下,該算法快速有效地實現(xiàn)了數(shù)據(jù)疑點分析。郭洪建(2015)采用K-means聚類算法獲得了10家商業(yè)銀行的信用風(fēng)險狀況以及相應(yīng)監(jiān)管指標等級劃分,經(jīng)相關(guān)專家驗證,該結(jié)果合理有效,得出了利用K-means聚類算法能提高審計分析質(zhì)量的結(jié)論。
二、常用審計疑點發(fā)現(xiàn)方法分析
審計人員如何在采集的原始數(shù)據(jù)中發(fā)現(xiàn)審計疑點,對審計目標的實現(xiàn)有直接影響。在審計的整個實施階段,審計疑點發(fā)現(xiàn)效率是審計項目質(zhì)量和審計成果體現(xiàn)的重要保障,因此,審計人員應(yīng)當(dāng)重點關(guān)注如何利用高效的數(shù)據(jù)分析方法發(fā)現(xiàn)審計疑點。
目前,常用的審計數(shù)據(jù)分析方法包括利用SQL語句進行查詢分析以及利用Excel、Access、審計軟件等進行統(tǒng)計分析[8]。其中,SQL語句查詢、審計軟件等常用于政府部門及事業(yè)單位內(nèi)部審計;會計師事務(wù)所常用Excel以及會計賬表相關(guān)審計軟件進行數(shù)據(jù)分析;大型企業(yè)在進行內(nèi)部審計時往往采用專門的審計平臺或在管理信息系統(tǒng)中嵌入審計模塊,而中小企業(yè)則更依賴于利用Excel及Access進行審計數(shù)據(jù)分析。
常用的審計疑點發(fā)現(xiàn)方法需要審計人員具備一定的業(yè)務(wù)邏輯思維,了解數(shù)據(jù)勾稽關(guān)系,有明確的審計規(guī)則,用數(shù)據(jù)去驗證先驗知識,審計結(jié)果具有可預(yù)期性。這些基于審計人員經(jīng)驗的審計數(shù)據(jù)方法可以發(fā)現(xiàn)問題,卻也存在一定的缺陷。首先,利用這些方法來發(fā)現(xiàn)問題是基于審計人員的經(jīng)驗及現(xiàn)有知識,一旦審計人員缺乏相關(guān)認識,就難以發(fā)現(xiàn)相應(yīng)問題。其次,每個審計人員專業(yè)水平存在不一致性,經(jīng)驗存在主觀性,對同一問題的判斷也可能不一致。最后,審計經(jīng)驗的累積相對于數(shù)據(jù)發(fā)展往往較為滯后,導(dǎo)致問題的發(fā)現(xiàn)不能滿足及時性需求,而這種不同步性也在一定程度上加大了審計風(fēng)險。
三、基于K-Means聚類的孤立點分析方法
基于K-Means聚類的孤立點分析方法在模型應(yīng)用前不需要利用訓(xùn)練集進行訓(xùn)練,是自主式學(xué)習(xí),不以經(jīng)驗知識為基礎(chǔ),一定程度上彌補了常用審計疑點發(fā)現(xiàn)方法的缺陷。
(一)算法原理分析
K-Means聚類的主要原理是將n項數(shù)據(jù)對象分到k個分區(qū)中,而k需要預(yù)先確定,每個分區(qū)都視為一個聚類。首先,從n項數(shù)據(jù)對象中隨機選擇k項數(shù)據(jù)點作為初始聚類中心點,根據(jù)剩余對象與初始聚類中心點之間的相似度,按就近原則將各數(shù)據(jù)項分配給最近距離分區(qū);然后重新計算各聚類中心點,并通過迭代方法持續(xù)修改直至所有聚類保持不變,形成最終聚類結(jié)果。
定義1:中位數(shù)m。假設(shè)一維空間中的n項數(shù)據(jù)按從小到大的順序排列為m1,m2,m3,…,mn,如果n是偶數(shù),則這n項數(shù)據(jù)中位數(shù)m=mn/2;反之,如果n是奇數(shù),則m=[mn/2]+1,其中[ ]表示取整運算,如[1.2]=1。
定義2:孤立點判斷標準。設(shè)數(shù)據(jù)集X經(jīng)聚類后被劃分為k個不相交的數(shù)據(jù)集V1,V2,V3,…,Vk,則V1,V2,V3,…,Vk分別是這k個數(shù)據(jù)集的樣本數(shù),其中假定樣本數(shù)滿足V1 (二)算法描述 從上述原理可知,孤立點集即分類之后具有較少樣本的聚類,其中閾值參數(shù)需預(yù)先確定,并且不同閾值參數(shù)對探測到的孤立點數(shù)量有影響?;贙-Means聚類的孤立點分析算法描述如下: 輸入給定的數(shù)據(jù)集X,判斷是否是孤立的閾值參數(shù)?漬; 輸出孤立點樣本G; 步驟1:初始化聚類個數(shù)和初始聚類中心; 步驟2:按照K-Means算法聚類,得到k個聚類V1,V2,V3,…,Vk; 步驟3:分別計算k個聚類的樣本數(shù),即V1,V2,V3,…,Vk,并根據(jù)從小到大的順序?qū)颖緮?shù)進行排序,得到V'1,V'2,V'3,…,V'k,其中V'1,V'2,V'3,…,V'k是經(jīng)重新排序的聚類; 步驟4:計算中位數(shù)m; 步驟5:按照下列方式計算臨界參數(shù)b: For i=1 to m If m/V'i≥?漬 then i=i+1 else b=i end if end; 步驟6:輸出孤立點集合V'1,V'2,V'3,…,V'b。 (三)孤立點分析的應(yīng)用 孤立點分析在許多領(lǐng)域都受到了重視,例如信用卡與電信欺詐檢測、貸款審批、天氣及地震預(yù)測、客戶分類等。其中,對信用卡與電信欺詐檢測時,將每個客戶用卡歷史數(shù)據(jù)運用欺詐模型進行分析,當(dāng)發(fā)現(xiàn)客戶近期交易行為與歷史記錄不一致時,則認為可能存在欺詐,若經(jīng)相關(guān)人員及時證實其具有欺詐性,則可一定程度上避免損失。 在許多數(shù)據(jù)挖掘技術(shù)中,孤立點被認為是影響數(shù)據(jù)挖掘技術(shù)效果的“噪聲”數(shù)據(jù),并且是在早期數(shù)據(jù)預(yù)處理過程中應(yīng)該被剔除的數(shù)據(jù)。但是,對于審計工作來說,孤立點數(shù)據(jù)則是關(guān)鍵部分,審計實施過程中發(fā)現(xiàn)的孤立點能夠為審計人員發(fā)現(xiàn)審計線索提供有利幫助。審計工作實踐證明,在審計分析過程中,可疑數(shù)據(jù)往往是“孤立點”,這些數(shù)據(jù)通常隱藏在大量正常數(shù)據(jù)中,因而使用有效的孤立點發(fā)現(xiàn)技術(shù)來檢測和發(fā)現(xiàn)這些數(shù)據(jù)可以為詳細審計創(chuàng)造條件,進一步提高審計效率。 基于K-Means聚類的孤立點檢測算法的優(yōu)點是時間和空間的復(fù)雜度是線性或接近線性的,適用于大規(guī)模數(shù)據(jù)集分析,所以利用這種算法進行孤立點挖掘是高度有效的。因此,本文將基于K-Means的孤立點分析方法應(yīng)用于審計疑點發(fā)現(xiàn),為探索新的審計疑點發(fā)現(xiàn)方法做出嘗試。 四、基于孤立點分析的審計疑點發(fā)現(xiàn)模型 基于K-Means聚類的孤立點分析方法有利于審計疑點發(fā)現(xiàn)以及審計線索挖掘,鑒于此,本文提出了一種基于孤立點分析的審計疑點發(fā)現(xiàn)模型(如圖1所示)。 (一)數(shù)據(jù)采集與預(yù)處理 根據(jù)審計目標和內(nèi)容,審計人員利用SQL語句編程、ETL技術(shù)、MapReduce編程等方法從被審計單位處獲得需要的原始審計數(shù)據(jù)。 在對數(shù)據(jù)進行預(yù)處理之前,審計人員應(yīng)首先分析具體的審計項目,綜合數(shù)據(jù)字典和數(shù)據(jù)庫描述文檔分析數(shù)據(jù)的含義以及業(yè)務(wù)流程等,查找與實現(xiàn)審計目標相關(guān)的數(shù)據(jù)表和字段。換句話說,審計人員需要找到恰當(dāng)?shù)臄?shù)據(jù)屬性或數(shù)據(jù)屬性組合進行孤立點挖掘。然后利用數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸約等技術(shù)對審計數(shù)據(jù)進行處理,減少數(shù)據(jù)的不一致、冗余、異常等問題,將數(shù)據(jù)轉(zhuǎn)換為易于分析的形式,以保證數(shù)據(jù)分析的高效性。 (二)孤立點檢測 對于處理好的數(shù)據(jù)集,通過孤立點分析模型區(qū)分正常數(shù)據(jù)與異常數(shù)據(jù),并利用可視化技術(shù)展示檢測結(jié)果,有助于審計人員快速鎖定異常數(shù)據(jù)。 (三)孤立點分析 在此步驟中,審計人員需要分析所有孤立點以確定它們是否是可疑數(shù)據(jù),雖然發(fā)現(xiàn)的孤立點是挖掘的目標,但對于審計目標來說,它們不一定都具備利用價值。比如,有些孤立點雖然異常但卻合理;而有些孤立點雖然異常,但其造成的影響很小,達不到重要性水平等。這些都需要審計工作人員根據(jù)審計目標對孤立點進行專業(yè)性判斷,最后利用相關(guān)審計疑點確認方法發(fā)現(xiàn)審計線索??梢蓴?shù)據(jù)的專業(yè)判斷可以使用的常規(guī)技術(shù)有函證法、復(fù)算法、審閱法、盤存法和鑒定法等。 五、基于孤立點分析的審計疑點發(fā)現(xiàn)模型的Python應(yīng)用實現(xiàn) 本文嘗試利用Y上市公司實際業(yè)務(wù)數(shù)據(jù),驗證基于K-Means聚類的孤立點分析方法在審計疑點發(fā)現(xiàn)中的應(yīng)用效果,同時利用Python語言,選擇盡可能簡單靈活的方式,以方便該方法的實際應(yīng)用和推廣。 (一)Python語言優(yōu)勢 本文利用Python語言進行孤立點分析,其語法簡潔功能強大,應(yīng)用廣泛,數(shù)據(jù)分析庫較為全面,同時可實現(xiàn)跨平臺操作,能高效實現(xiàn)數(shù)據(jù)可視化。 (二)案例背景 Y企業(yè),主營電子相關(guān)商品銷售業(yè)務(wù),有多家銷售門店。在對Y企業(yè)進行年度審計時,審計人員對資產(chǎn)負債表日前后銷售業(yè)務(wù)進行截止性測試,測試過程中發(fā)現(xiàn)該企業(yè)12月20日的一筆銷售記錄沒有與之對應(yīng)的銷售合同,且缺乏財務(wù)負責(zé)人簽字。通過查看其他相關(guān)記錄發(fā)現(xiàn),12月20日的發(fā)貨記錄顯示有1 000余件商品離庫發(fā)出至購貨方,通過對比被審計單位該期間貨車出入記錄,審計人員發(fā)現(xiàn)這筆發(fā)貨記錄與貨車出入記錄不符。經(jīng)進一步調(diào)查發(fā)現(xiàn),該企業(yè)上一年度被列為ST上市公司,為保住上市資格,將該批商品存放至臨時租用庫房,并虛構(gòu)銷售收入。 為了發(fā)現(xiàn)這一審計疑點,審計人員通常需要了解被審計單位可能出現(xiàn)提前或延后確認銷售收入以調(diào)整資產(chǎn)負債表日前后收益的情況,甚至?xí)x擇虛構(gòu)銷售收入。在具備這個先驗知識基礎(chǔ)上,審計人員需要對被審計單位進行針對性測試,進而發(fā)現(xiàn)審計疑點。但是,對于被審計單位的許多其他業(yè)務(wù),審計人員往往不太了解情況,缺乏相關(guān)的規(guī)律性經(jīng)驗。這種情況下,審計人員根據(jù)抽樣需求,從海量數(shù)據(jù)中抽取一定數(shù)量的樣本進行分析,耗時耗力,而且可能獲取不到有價值的審計疑點。本文試圖使用基于K-means聚類的孤立點分析方法對Y企業(yè)銷售業(yè)務(wù)數(shù)據(jù)進行挖掘分析,以驗證該方法挖掘?qū)徲嬕牲c的有效性。 (三)數(shù)據(jù)預(yù)處理 一是利用SQL語句從被審計單位管理信息系統(tǒng)數(shù)據(jù)庫中獲取幾個典型門店2018年1月1日到2018年12月31日的銷售財務(wù)記錄,并提取門店編號、日期、單據(jù)號、商品編號、數(shù)量、金額等字段數(shù)據(jù)作為分析樣本數(shù)據(jù)。二是利用Pandas工具包將數(shù)據(jù)以object形式導(dǎo)入(如圖2所示),以防止部分數(shù)據(jù)因類型問題存在無法導(dǎo)入的情況,利用dtypes屬性查看導(dǎo)入數(shù)據(jù)類型,如圖3所示,除日期外的所有字段類型均為object。三是將數(shù)量、金額等字段數(shù)據(jù)類型利用astype()函數(shù)轉(zhuǎn)換為float形式(如圖4所示),方便后續(xù)分析。四是利用count()函數(shù)查看數(shù)據(jù)匯總情況,判斷是數(shù)據(jù)是否存在缺失值等情況,樣本數(shù)據(jù)匯總情況如圖5所示,各字段的數(shù)據(jù)量相同,說明不存在缺失值情況。五是進行數(shù)據(jù)標準化處理(如圖6所示)。 (四)孤立點挖掘及分析 由于該孤立點分析方法幾乎不基于任何先驗知識,筆者嘗試將標準化后的數(shù)據(jù)聚類類別分別設(shè)置為2、3、4、5、6、7,觀察其聚類及孤立點分析結(jié)果(代碼如圖7所示),并借助matplotlib工具包中的plot函數(shù)以散點圖的形式顯示孤立點分析結(jié)果(如圖8所示),有利于審計人員更直觀地觀察到孤立數(shù)據(jù)。 經(jīng)對比發(fā)現(xiàn),將數(shù)據(jù)聚為5類時,其聚類及孤立點檢測結(jié)果較為合理,因此,筆者分析了聚類類別為5的孤立點分析結(jié)果。圖9顯示了數(shù)據(jù)聚類為5的孤立點分析散點圖效果。 圖9散點位置代表著對應(yīng)序列號數(shù)據(jù)與中心點之間的距離。其中,黑點屬于正常范圍之類,即距離小于預(yù)定的閾值,而帶標注灰點的距離則大于預(yù)設(shè)閾值,將其視為孤立點。因此,分析結(jié)果為第239、3 176、4 264及7 889條記錄可能存在異常。其中,第7 889條記錄經(jīng)進一步查驗,其對應(yīng)的日期是12月20日,門店編號是1010003,商品編號為A012920030000,確認為案例背景中被發(fā)現(xiàn)的疑點記錄。此外,第239條經(jīng)查驗是1010002號門店在2月26日發(fā)生的一筆編碼為A011846660000的商品銷售退回記錄,金額較大,且與一般銷售退回業(yè)務(wù)存在差異,考慮被審計單位是否在上一個會計年度也虛構(gòu)了銷售收入,然后這一年按銷售退回進行處理,并沖銷對應(yīng)的主營營業(yè)收入與應(yīng)收賬款等,若能結(jié)合上一年的銷售業(yè)財數(shù)據(jù)進行分析,發(fā)現(xiàn)這一事實,也應(yīng)將其作為審計疑點。第3 176與第4 264條記錄分別是1010002號門店在10月3日與12月10日發(fā)生的金額較大的銷售記錄,其中10月3日該企業(yè)為慶祝公司周年慶及國慶,做了促銷活動,刺激了銷量,該記錄屬于正常數(shù)據(jù)。第4 264條記錄屬于年末大額銷售,應(yīng)予以一定關(guān)注。 需要注意的是,利用該方法分析出的異常數(shù)據(jù)未必都是問題數(shù)據(jù),需要審計人員進一步分析排查,以確定審計疑點。利用該算法分析出的結(jié)果僅作為一種參考或思路,可以將其理解為被挖掘出的孤立數(shù)據(jù)大概率是問題數(shù)據(jù),有助于審計人員縮小審計疑點排查范圍。 六、結(jié)語 本文分析了常用審計疑點發(fā)現(xiàn)方法及其存在的缺陷,提出了一種K-Means聚類孤立點分析的審計疑點發(fā)現(xiàn)方法。以Y上市公司實際銷售數(shù)據(jù)為樣本,利用Python語言驗證了K-Means聚類孤立點分析方法發(fā)現(xiàn)審計疑點的可行性和有效性,為審計人員提供了一種有效的數(shù)據(jù)分析方法。與常用審計疑點發(fā)現(xiàn)方法相比,該方法具有以下優(yōu)點: (一)更好地體現(xiàn)了審計人員專業(yè)性水平 與常用的審計疑點發(fā)現(xiàn)方法相比,該方法在發(fā)現(xiàn)疑點時不需要審計人員具備行業(yè)知識基礎(chǔ),不用依賴審計經(jīng)驗及業(yè)務(wù)知識等建立的審計分析模型進行數(shù)據(jù)分析。而對于異常情況的進一步分析則需要審計人員具備相當(dāng)豐富的業(yè)務(wù)知識和審計經(jīng)驗,有助于提高審計人員的專業(yè)水平,提升行業(yè)人才競爭力。 (二)通用性較強 孤立點分析方法不需要利用訓(xùn)練集進行模型訓(xùn)練,在使用時只需要根據(jù)數(shù)據(jù)特征選擇合適的檢測算法,就能適用于不同的審計業(yè)務(wù)中,并高效檢測出被審計數(shù)據(jù)中的孤立點。 (三)提高了審計效率 該方法首先利用孤立點檢測算法對數(shù)據(jù)集進行初步檢測,然后審計人員對檢測出的孤立點數(shù)據(jù)進行分析判斷,確定可疑孤立點,最后針對可疑孤立點進行專業(yè)判斷,這種方法很大程度上縮小了審查數(shù)據(jù)量,從而提高了審計效率。 本文提出的方法為審計人員提供了疑點發(fā)現(xiàn)及數(shù)據(jù)分析的新思路,接下來需要不斷完善這個方法,將其與其他數(shù)據(jù)挖掘算法結(jié)合,使其能更有效地應(yīng)用到實際審計工作中。 【參考文獻】 [1] 秦榮生.大數(shù)據(jù)、云計算技術(shù)對審計的影響研究[J].審計研究,2014(6):23-28. [2] 楊松.基于關(guān)聯(lián)規(guī)則和孤立點算法的審計證據(jù)獲取研究[J].工業(yè)控制計算機,2017(2):98-99. [3] 劉巍.基于聚類的孤立點發(fā)現(xiàn)技術(shù)研究及其在審計中的應(yīng)用[D].青島:中國海洋大學(xué)碩士學(xué)位論文,2010. [4] 宋迪.大數(shù)據(jù)環(huán)境下基于孤立點分析的審計抽樣方法[J].財務(wù)與會計,2015(14):71-73. [5] 程平,崔納牟倩.大數(shù)據(jù)時代基于財務(wù)共享服務(wù)模式的內(nèi)部審計[J].會計之友,2016(16):122-125. [6] 楊蘊毅,孫中和,盧靖.基于迭代式聚類的審計疑點發(fā)現(xiàn)——以上市公司財報數(shù)據(jù)為例[J].審計研究,2015(4):60-66. [7] 譚艷娜.面向?qū)徲嬵I(lǐng)域的聚類離群點檢測研究[D].哈爾濱:哈爾濱工程大學(xué)碩士學(xué)位論文,2011. [8] 陳國珍,趙婧.信息化環(huán)境下內(nèi)部審計技術(shù)方法研究[J].會計之友,2013(22):98-100.