鄭捷 李一軍
摘 要:目前稅收遵從風(fēng)險的研究大多聚焦于企業(yè)自身的風(fēng)險狀態(tài),忽視了廣泛存在的風(fēng)險關(guān)聯(lián)傳導(dǎo)現(xiàn)象。本文通過挖掘整合多源數(shù)據(jù),構(gòu)建了企業(yè)稅收遵從風(fēng)險相關(guān)的知識圖譜,研究了以欠稅風(fēng)險為代表的稅收遵從風(fēng)險在企業(yè)內(nèi)外部的關(guān)聯(lián)傳導(dǎo)問題。結(jié)果表明:同一企業(yè),不同稅收遵從風(fēng)險傳導(dǎo)特征較為明顯,稅收遵從風(fēng)險與失信風(fēng)險因政府監(jiān)管而呈現(xiàn)負(fù)相關(guān)特征;不同企業(yè),具有相同法人代表、相同聯(lián)系方式的情形下,稅收遵從風(fēng)險的關(guān)聯(lián)度顯著提升,其與失信風(fēng)險的關(guān)聯(lián)度也隨之提高。本研究擴(kuò)展了稅收遵從風(fēng)險的理論研究視野,并為稅收管理實踐提供了新的理念和思路。
關(guān)鍵詞:稅收遵從風(fēng)險;知識圖譜;風(fēng)險關(guān)聯(lián)
中圖分類號:C931.6 文獻(xiàn)標(biāo)識碼:A 文章編號:2097-0145(2022)01-0048-08 doi:10.11847/fj.41.1.48
Abstract:Most of existing research on tax compliance risk only focused on a single enterprise, ignored the widespread phenomenon of risk correlation transmission. This paper integrates multi-source data to construct a knowledge graph of enterprise tax compliance risk. Based on the knowledge graph, the correlation of tax compliance risks inside and outside enterprises are studied from multiple perspectives. Research shows that tax compliance risk does not exist in isolation. Within the enterprise, the tax compliance risk conduction characteristic is obvious. Externally, the same legal representative and contact method can improve the correlation of tax compliance risks among different enterprises, and also improve the correlation between tax compliance risk and trust-breaking risk. This study expands the theoretical research field of tax compliance risk, even provides new ideas for tax management practice.
Key words:tax compliance risk; knowledge graph; risk correlation
1 引言
稅收是國家公共財政最主要的收入來源和形式,其本質(zhì)是國家憑借公共權(quán)力參與國民收入分配的一種特殊分配關(guān)系,對于調(diào)節(jié)經(jīng)濟(jì)利益、維護(hù)國家權(quán)益、促進(jìn)社會發(fā)展有著極其重要的意義。
稅收遵從(Tax Compliance)是與稅收緊密相關(guān)的一個概念,經(jīng)濟(jì)合作組織OECD將其定義為納稅人遵守其所在國家稅收法規(guī)的程度,例如,納稅人及時申報和繳納稅款。稅收遵從風(fēng)險是指納稅人受各種負(fù)面的不確定因素的影響,未依法履行納稅義務(wù)或者未服從稅務(wù)機(jī)關(guān)及稅務(wù)人員合法合規(guī)管理,而造成的國家稅收流失風(fēng)險和納稅人利益損失風(fēng)險。企業(yè)欠稅行為就是一種典型的稅收不遵從行為,也是稅收遵從風(fēng)險的典型表現(xiàn)形式,在全世界普遍存在且影響重大[1,2]。
當(dāng)前國內(nèi)外學(xué)者對稅收遵從風(fēng)險的研究主要從企業(yè)的個體狀況切入,基于企業(yè)各項財務(wù)指標(biāo),研究企業(yè)自身的經(jīng)營狀況與稅收遵從風(fēng)險之間的關(guān)系。Hglund[3]針對芬蘭的欠稅現(xiàn)象,構(gòu)建了一類能夠分析欠稅的通用決策支持模型,綜合考慮企業(yè)的償債能力、流動性、付款周期等多方面信息,對企業(yè)潛在的欠稅行為進(jìn)行識別。Su等[4]構(gòu)建了集成學(xué)習(xí)模型,通過營業(yè)利潤、投資額、經(jīng)營成本、凈利潤等多項財務(wù)指標(biāo)對企業(yè)的欠稅行為進(jìn)行了分析。
根據(jù)稅收契約理論,稅收在本質(zhì)上是所有納稅人與政府之間建立的一種契約,稅收不遵從行為具有明顯的違約行為特征,因此稅收遵從風(fēng)險也是一種廣義的違約風(fēng)險[5,6]。實證研究表明,企業(yè)的違約行為可能導(dǎo)致其關(guān)聯(lián)的企業(yè)以更大的概率發(fā)生同類風(fēng)險[7]。例如,美國銀行業(yè)、汽車業(yè)和房地產(chǎn)業(yè)間存在著明顯的違約風(fēng)險傳染現(xiàn)象[8]。陳作華[9]基于2212個我國上市企業(yè)樣本研究了企業(yè)關(guān)聯(lián)與避稅行為之間的關(guān)系,結(jié)果表明異常關(guān)聯(lián)交易是控股股東和上市公司掏空國家稅收的重要途徑,是公司避稅的重要手段。在稅收遵從風(fēng)險的實踐監(jiān)管過程中,各種稅收違法事件之間也體現(xiàn)出不同形式的關(guān)聯(lián),例如,2021年查處的湖南“1·23”增值稅發(fā)票虛開案中,5名犯罪嫌疑人通過控制22家相關(guān)聯(lián)的空殼公司虛開發(fā)票金額6億元;杭州稅務(wù)局在2020年通過某商貿(mào)公司的重大發(fā)票虛開疑點,一舉查處62家違法關(guān)聯(lián)企業(yè)。由此可知,包括稅收遵從風(fēng)險在內(nèi)的違約風(fēng)險能夠在企業(yè)間關(guān)聯(lián)傳導(dǎo),當(dāng)前對于企業(yè)稅收遵從風(fēng)險的單點研究模式已不能充分反映風(fēng)險的特征和變化規(guī)律。
因此對于稅收遵從風(fēng)險的研究,還需引入新的理念和工具方法,更加全面地分析不同主體之間的關(guān)聯(lián)影響。知識圖譜概念與方法的提出,恰好能夠為稅收遵從風(fēng)險研究提供新的途徑。本文基于網(wǎng)絡(luò)數(shù)據(jù)建立稅收遵從風(fēng)險相關(guān)的知識圖譜,并從群體關(guān)系角度研究企業(yè)稅收遵從風(fēng)險的內(nèi)外部關(guān)聯(lián)。研究試圖達(dá)到以下目標(biāo):(1)引入先進(jìn)的大數(shù)據(jù)分析理論與技術(shù),豐富稅收遵從風(fēng)險研究的方法體系。(2)擴(kuò)展稅收遵從風(fēng)險相關(guān)的研究框架,實現(xiàn)從單點研究向關(guān)聯(lián)關(guān)系研究的延伸。(3)將稅收遵從風(fēng)險與其他類型的風(fēng)險進(jìn)行協(xié)同研究,在更廣闊的研究視野下探討不同風(fēng)險之間的關(guān)聯(lián)傳導(dǎo)。
2 研究對象界定
稅收遵從風(fēng)險有基于企業(yè)和監(jiān)管兩個角度,本文主要針對后一種進(jìn)行研究。從監(jiān)管的角度出發(fā),OECD將納稅遵從風(fēng)險分為四類:(1)未正確登記納稅人數(shù);(2)未按規(guī)定提交納稅文件;(3)未正確申報應(yīng)納稅款;(4)未按期繳納稅款。根據(jù)OECD的調(diào)查,80%以上的風(fēng)險為第三類和第四類風(fēng)險,因此理論和實踐上對這兩類風(fēng)險的關(guān)注程度也相對集中。
其中第三類風(fēng)險更為隱性和復(fù)雜。對于這類風(fēng)險的識別和研究,主要依據(jù)企業(yè)申報的財務(wù)數(shù)據(jù)及其他相關(guān)信息,結(jié)合一定的評價指標(biāo)體系和算法,估算出企業(yè)的應(yīng)納稅額,并將其與企業(yè)實際申報的納稅額進(jìn)行比較,從而判斷是否存在可能的稅收遵從風(fēng)險。此類研究存在以下困難:一是數(shù)據(jù)的真實性,企業(yè)提交虛假財務(wù)數(shù)據(jù)申報稅款是逃稅的主要手段之一,因此依據(jù)財務(wù)數(shù)據(jù)進(jìn)行稅收遵從風(fēng)險分析結(jié)果可靠性較低。二是數(shù)據(jù)的可獲得性,非上市公司的財務(wù)報表由企業(yè)自愿公開,工商、稅務(wù)等政府部門中備案的企業(yè)財務(wù)報表也很難隨意獲取,因此在不具有大量合法授權(quán)的財務(wù)數(shù)據(jù)的情況下,第三類風(fēng)險的相關(guān)研究很難開展。
第四類風(fēng)險則更為直觀和顯性。一方面,欠稅行為具有“發(fā)生即可感知”的明顯特征,一經(jīng)發(fā)生即可100%識別。另一方面,企業(yè)的欠稅信息具有良好的可獲得性和真實性,根據(jù)國家稅務(wù)總局《欠稅公告辦法》,稅務(wù)機(jī)關(guān)將按季度公告欠稅企業(yè)的名稱、納稅人識別號、法定代表人或負(fù)責(zé)人姓名、證件號碼、經(jīng)營地點、欠稅稅種、欠稅余額和當(dāng)期新發(fā)生的欠稅金額,數(shù)據(jù)來源可靠,能夠為第四類風(fēng)險的研究提供充分的支撐。
綜上分析,本文將從監(jiān)管的角度,聚焦欠稅行為對應(yīng)的稅收遵從風(fēng)險,對企業(yè)間的欠稅風(fēng)險關(guān)聯(lián)傳導(dǎo),及欠稅風(fēng)險和失信風(fēng)險之間的關(guān)聯(lián)傳導(dǎo)進(jìn)行分析。
3 稅收遵從風(fēng)險知識圖譜構(gòu)建
知識圖譜(Knowledge Graph)通過圖的形式來描述人、事物、概念等實體以及這些實體之間的關(guān)系。由于其同時包含了圖的屬性信息和結(jié)構(gòu)信息,知識圖譜對于現(xiàn)實世界中的復(fù)雜關(guān)系能夠提供相對更好的表現(xiàn)方式[10]。在具體的知識圖譜構(gòu)建過程中,主要涉及模式圖與數(shù)據(jù)圖設(shè)計、知識抽取、知識圖譜存儲等環(huán)節(jié)[11,12]。
3.1 模式圖與數(shù)據(jù)圖設(shè)計
構(gòu)建知識圖譜有自頂向下和自底向上兩種模式。自頂向下是通用知識圖譜的主要模式,即先定義本體與數(shù)據(jù)模式,再將相應(yīng)的實體加入圖譜。自底向上是行業(yè)知識圖譜的主要模式,即先從數(shù)據(jù)中提取實體,再進(jìn)一步構(gòu)建頂層的本體[13,14]。本文所要構(gòu)建的知識圖譜主要關(guān)注稅收遵從風(fēng)險,具有行業(yè)知識圖譜的特征,因此選擇自底向上的模式。
“相同法人”既包括了不同企業(yè)擁有相同法人,也包括同一企業(yè)擁有“相同法人”兩種情形。同理,“相同聯(lián)系電話”既包括了不同企業(yè)擁有相同聯(lián)系電話,也包括同一企業(yè)擁有“相同聯(lián)系電話”;“相同電子郵件”既包括了不同企業(yè)擁有相同電子郵件,也包括同一企業(yè)擁有“相同電子郵件”。為了避免混亂,后續(xù)將“相同法人”、“相同聯(lián)系電話”、“相同電子郵件”均限定為不同企業(yè)間的關(guān)系,而對于上述同一企業(yè)擁有“相同法人”、“相同聯(lián)系電話”、“相同電子郵件”的情形統(tǒng)一歸為“相同企業(yè)”。此時式將變成如下形式
3.2 知識抽取
本文數(shù)據(jù)主要包括企業(yè)基本信息、風(fēng)險事件信息、企業(yè)內(nèi)外關(guān)聯(lián)信息等,有直接的一級數(shù)據(jù)來源和間接的二級數(shù)據(jù)來源。其中一級數(shù)據(jù)來源主要為半結(jié)構(gòu)化網(wǎng)頁數(shù)據(jù),涉及全國企業(yè)信用信息公示、中國裁判文書網(wǎng)、中國執(zhí)行信息公開網(wǎng)、企業(yè)欠稅信息公告等。二級數(shù)據(jù)來源主要為企查查、天眼查等數(shù)據(jù)服務(wù)商,他們對企業(yè)部分信息已進(jìn)行較為系統(tǒng)的收集、清洗和整合,可以顯著提高數(shù)據(jù)獲取效率,但由于各廠商業(yè)務(wù)重點不同,數(shù)據(jù)往往不能覆蓋全部研究需求。鑒于此,本文將采用一二級整合的數(shù)據(jù)采集方式:首先從天眼查、企查查等二級數(shù)據(jù)源采集已結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù),進(jìn)一步從一級數(shù)據(jù)源抽取更為直接的原始數(shù)據(jù)作為補(bǔ)充,最終形成研究樣本數(shù)據(jù)集合。
在數(shù)據(jù)獲取技術(shù)方面,通常情況下優(yōu)先考慮通過爬蟲程序從網(wǎng)頁上提取所需數(shù)據(jù)。對于允許自由爬取的非商業(yè)性的公開數(shù)據(jù)源(例如企業(yè)欠稅公告、失信被執(zhí)行案件信息等),方法成熟,不做進(jìn)一步討論。問題的難點是二級數(shù)據(jù)源知識抽取,數(shù)據(jù)服務(wù)商提供的企業(yè)信用報告為PDF格式,信息主要以表格的形式體現(xiàn)。但在PDF文件規(guī)范中并沒有明確的內(nèi)部表格表示方式,這為提取PDF的表格信息造成了技術(shù)障礙[17]。針對不同類型的PDF文件,研究者提出了多種表格提取方法[18,19],開發(fā)了多種表格識別工具,camelot是其中具有代表性的一種[20]。
然而開源工具camelot對于PDF中跨多個頁面的較大表格,只能識別出表格首頁信息。而批量獲取的企業(yè)信用報告中,大量的信息以跨頁表格的形態(tài)呈現(xiàn),camelot并未提供有效的處理方法。因此,需要對camelot算法做出進(jìn)一步的改進(jìn)與優(yōu)化。方法要點如下:
(1)分析所要提取表格的具體特征,利用章節(jié)標(biāo)題對表格進(jìn)行定位。例如,對于失信被執(zhí)行人的列表,將其所在章節(jié)標(biāo)題“失信被執(zhí)行人”作為表格開始標(biāo)記,將其后續(xù)章節(jié)標(biāo)題“限制高消費”作為表格終止標(biāo)記。(2)明確表格定位算法之后,采用如下方法逐頁識別表格:對于第i頁文件,先在頁面中搜索表格起始標(biāo)記(本例中為“失信被執(zhí)行人”字段),如果發(fā)現(xiàn)該標(biāo)記,則獲得表格起始頁碼page_start和表格在該頁的定位坐標(biāo)。繼續(xù)向后搜索表格結(jié)束標(biāo)記(本例中為“限制高消費”字段),如果發(fā)現(xiàn)該標(biāo)記,則獲得表格結(jié)束頁碼page_end和表格在該頁的定位坐標(biāo),并結(jié)束搜索。(3)基于NumPy的開源Python庫Pandas對數(shù)據(jù)進(jìn)行分析,并用Pandas的DataFram儲存獲取的表格內(nèi)容數(shù)據(jù),采用Pandas庫中的cancat方法進(jìn)行合并。
基于上述要點,可以給出算法優(yōu)化關(guān)鍵流程,具體如圖2所示。
3.3 知識圖譜的存儲
知識圖譜常用的存儲方式有關(guān)系型數(shù)據(jù)庫和圖數(shù)據(jù)庫。選用關(guān)系型數(shù)據(jù)庫時,需要將數(shù)據(jù)中的關(guān)系分解為多個三元組形式,并將三元組與關(guān)系表進(jìn)行映射,然后將關(guān)系表存儲在關(guān)系型數(shù)據(jù)庫中。具體可以采用三元組表、整合存儲、分割存儲等映射存儲方式,但這些方式會導(dǎo)致查詢時運(yùn)算請求的大幅增長,及后期更新和維護(hù)難度的增加[10]。
圖數(shù)據(jù)庫是一種以節(jié)點和關(guān)系(連接節(jié)點的邊)為基礎(chǔ)結(jié)構(gòu)的數(shù)據(jù)庫,基于圖的結(jié)構(gòu)數(shù)據(jù)存儲實體以及實體間的關(guān)系[21]。不同于關(guān)系型數(shù)據(jù)庫,圖數(shù)據(jù)庫節(jié)點之間的關(guān)系無需通過大量連接查詢關(guān)聯(lián)節(jié)點“計算”,而是直接“讀取”出來的,效率大幅提升。本文采用圖數(shù)據(jù)庫Neo4j實現(xiàn)知識圖譜的存儲與查詢?;趫D結(jié)構(gòu),Neo4j只需從起始節(jié)點開始,遍歷節(jié)點的鄰邊就能夠?qū)崿F(xiàn)對所有關(guān)聯(lián)節(jié)點的訪問。最終形成的知識圖譜可視化效果如圖3和圖4所示。
鑒于所構(gòu)建的知識圖譜規(guī)模較大,本文選擇部分子圖進(jìn)行展示。圖3為包含392個企業(yè)節(jié)點的圖譜以及其中四個節(jié)點構(gòu)成的子圖。圖4為包含2000個風(fēng)險事件節(jié)點的圖譜以及其中三個節(jié)點構(gòu)成的子圖。
4 基于知識圖譜的稅收遵從風(fēng)險關(guān)聯(lián)數(shù)值分析
4.1 風(fēng)險關(guān)聯(lián)判定指標(biāo)計算
從企業(yè)特征設(shè)定角度,研究涉及的企業(yè)基本信息包括20余項,其中能較為直接地作為企業(yè)之間關(guān)系的包括納稅人識別號、企業(yè)名稱、法定代表人、所屬省市地區(qū)、聯(lián)系電話、電子郵件地址、企業(yè)類型、所屬行業(yè)、企業(yè)地址、經(jīng)營范圍等10項。通過所屬省市地區(qū)、企業(yè)類型、所屬行業(yè)所建立起的企業(yè)關(guān)聯(lián)過于寬泛,導(dǎo)致圖譜的復(fù)雜性大幅增加,但實質(zhì)上有價值的關(guān)聯(lián)信息卻未得到明顯體現(xiàn)。企業(yè)地址、經(jīng)營范圍信息條目中的內(nèi)容較為復(fù)雜,不同企業(yè)間能夠相互匹配的情形很少,構(gòu)建出的關(guān)系數(shù)量不足以支撐研究。因此,研究主要選取納稅人識別號、企業(yè)名稱、法定代表人、聯(lián)系電話、電子郵件地址等信息,構(gòu)建“相同企業(yè)”、“相同法人”、“相同聯(lián)系電話”、“相同電子郵件”等關(guān)系,作為研究的主要關(guān)注點。
從時間范圍設(shè)定角度,一方面,理論研究表明,不同企業(yè)之間風(fēng)險的關(guān)聯(lián)存在不同程度的潛伏期[22];另一方面,從實踐數(shù)據(jù)來看,能夠相互關(guān)聯(lián)傳導(dǎo)的違約風(fēng)險,90%的傳導(dǎo)潛伏期都不超過12個月[23]。因此將欠稅事件與欠稅事件、欠稅事件與失信被執(zhí)行事件之間的關(guān)聯(lián)傳導(dǎo)潛伏期限定在12個月(365天)以內(nèi)(即|Δt|365天)。
根據(jù)上述方法,對知識圖譜中的數(shù)量關(guān)系進(jìn)行實際計算。從一二級數(shù)據(jù)源獲取2014年1月1日至2021年6月30日,黑龍江省所有發(fā)生欠稅、失信被執(zhí)行的企業(yè)信息,以及對應(yīng)的欠稅、失信被執(zhí)行事件信息,對原始數(shù)據(jù)進(jìn)行清洗加工后,最終得到符合本文研究需求的企業(yè)信息共計20862條、事件信息共計177668條,其中欠稅企業(yè)信息11851條、失信被執(zhí)行企業(yè)信息9011條,欠稅事件信息154717條、失信被執(zhí)行事件信息22951條?;谶@些基礎(chǔ)數(shù)據(jù),采用neo4j圖數(shù)據(jù)庫工具生成各類企業(yè)節(jié)點間的關(guān)系共計46832條、各類事件節(jié)點間的關(guān)系共計17388935條,如表1所示。
基于1700余萬條事件之間的關(guān)系,分別計算欠稅事件之間、欠稅事件和失信被執(zhí)行事件之間共16條關(guān)聯(lián)規(guī)則的置信度和提升度。
最終得出的各項指標(biāo)數(shù)值如表2所示。
4.2 風(fēng)險關(guān)聯(lián)程度分析
(1)“欠稅事件——欠稅事件”的關(guān)聯(lián)
這一組別中,提升度最大的是A1B1,提升度為1.373。意味著節(jié)點之間存在“相同企業(yè)”關(guān)系時,欠稅風(fēng)險關(guān)聯(lián)傳導(dǎo)的潛在發(fā)生概率提升了37.3%。這一結(jié)果可以解釋為:欠稅風(fēng)險更容易在企業(yè)內(nèi)部產(chǎn)生關(guān)聯(lián)傳導(dǎo),已經(jīng)欠稅的企業(yè)更容易在1年內(nèi)再次欠稅。
該組別其他關(guān)聯(lián)規(guī)則提升度均超過1.2,“相同法人”、“相同聯(lián)系電話”、“相同電子郵件”中的任意一個或多個關(guān)系的存在,皆使欠稅風(fēng)險在不同企業(yè)之間關(guān)聯(lián)傳導(dǎo)概率增加20%以上,且多個關(guān)系的組合比單一關(guān)系對關(guān)聯(lián)傳導(dǎo)的提升更為顯著。
以上結(jié)論與已有“會計欺詐風(fēng)險關(guān)聯(lián)”的研究結(jié)論類似[25]?!跋嗤髽I(yè)”、“相同法人”、“相同聯(lián)系電話”、“相同電子郵件”對欠稅風(fēng)險在企業(yè)內(nèi)部或者企業(yè)之間的關(guān)聯(lián)傳導(dǎo)具有較為明顯的解釋能力或支持作用。
(2)“欠稅事件——失信被執(zhí)行事件”的關(guān)聯(lián)
這一組別中,最小和最大的提升度分別為0.960和1.459,對應(yīng)的關(guān)聯(lián)規(guī)則分別是A1B1和(A2,A3,A4)B1。
A1B1提升度小于1意味著已經(jīng)欠稅的企業(yè)發(fā)生失信被執(zhí)行事件的概率更小,這一結(jié)論似乎有悖于常情。然而政府監(jiān)管力量使得該現(xiàn)象在現(xiàn)實中卻是成立的。我國對稅收違法行為實施了系統(tǒng)的、廣泛的聯(lián)合懲戒措施,對欠稅企業(yè)的經(jīng)營、投融資、銀行授信、進(jìn)出口審批、工程招投標(biāo)、參加政府采購、申請生產(chǎn)許可等多方面活動進(jìn)行了不同程度的限制,由此減少了相關(guān)失信事件的發(fā)生。監(jiān)管力量的介入在不同程度上切斷了欠稅風(fēng)險與失信風(fēng)險在企業(yè)內(nèi)部的關(guān)聯(lián)傳導(dǎo),最終使得企業(yè)欠稅后失信事件發(fā)生概率反而降低。
綜合分析該組別除A1B1以外的其他7條關(guān)聯(lián)規(guī)則,我國在對欠稅、失信等事件進(jìn)行監(jiān)管懲戒時,其范圍大多覆蓋了欠稅、失信企業(yè)本身以及法定代表人,較少牽涉到法定代表人名下的其他企業(yè)。即對于欠稅、失信等事件,政府等外部監(jiān)管力量并不會通過“相同法人”、“相同聯(lián)系電話”、“相同電子郵件”等關(guān)系進(jìn)行延伸?!跋嗤ㄈ恕薄ⅰ跋嗤?lián)系電話”、“相同電子郵件”均能提升欠稅風(fēng)險和失信風(fēng)險在不同企業(yè)間的關(guān)聯(lián)概率。但單一的關(guān)系對于關(guān)聯(lián)的影響較弱,兩種或兩種以上關(guān)系組合提升效果較為明顯,尤其是三個關(guān)系同時存在時,欠稅風(fēng)險和失信風(fēng)險在不同企業(yè)間關(guān)聯(lián)概率的提升幅度最大,高達(dá)45.9%。
5 結(jié)論與啟示
本文通過挖掘整合多源數(shù)據(jù),構(gòu)建了企業(yè)稅收遵從風(fēng)險的知識圖譜,并通過這一圖譜研究了以欠稅風(fēng)險為代表的稅收遵從風(fēng)險在企業(yè)內(nèi)外部的關(guān)聯(lián)傳導(dǎo)問題,得到如下結(jié)論:(1)稅收遵從風(fēng)險并不孤立存在,在不同企業(yè)之間,稅收遵從風(fēng)險與其他類型風(fēng)險(失信風(fēng)險)之間都表現(xiàn)出不同程度的關(guān)聯(lián)傳導(dǎo)特征。(2)同一企業(yè)內(nèi),不同稅收遵從風(fēng)險之間關(guān)聯(lián)傳導(dǎo)特征較為明顯,發(fā)生過欠稅事件的企業(yè)更容易再次欠稅。企業(yè)發(fā)生欠稅行為后,以稅收違法聯(lián)合懲戒為典型代表的外部監(jiān)管力量的介入,使企業(yè)的銀行授信、參與招投標(biāo)等經(jīng)營活動受到不同程度的限制,從而減小了失信行為的發(fā)生概率。因此稅收遵從風(fēng)險與失信風(fēng)險之間存在負(fù)向關(guān)聯(lián)的特征。(3)不同企業(yè)間,相同法人代表、相同聯(lián)系方式(電話、電子郵件)均能在不同程度上提升企業(yè)間稅收遵從風(fēng)險的關(guān)聯(lián)傳導(dǎo)程度,同時也能提升企業(yè)間稅收遵從風(fēng)險和失信風(fēng)險的關(guān)聯(lián)傳導(dǎo)程度。企業(yè)間的關(guān)系數(shù)量越多,關(guān)聯(lián)傳導(dǎo)的提升程度越大。
本文研究的政策啟示:稅收遵從風(fēng)險在不同企業(yè)之間,稅收遵從風(fēng)險與其他類型風(fēng)險之間皆存在關(guān)聯(lián)傳導(dǎo)可能性,稅務(wù)機(jī)關(guān)對市場主體監(jiān)督管理時需要對這一現(xiàn)象進(jìn)行關(guān)注并采取相應(yīng)措施。在擁有充分?jǐn)?shù)據(jù)支持的前提下,監(jiān)管部門可利用知識圖譜等工具充分挖掘企業(yè)之間的各類關(guān)系,從孤立的企業(yè)稅收遵從風(fēng)險防范推進(jìn)為相關(guān)風(fēng)險的全局把控,有助于實現(xiàn)保障國家財政收入、提高稅收征管水平、降低稅收監(jiān)管成本等多方面的稅收遵從風(fēng)險管理目標(biāo)。
參 考 文 獻(xiàn):
[1] 李曉曼.稅收遵從風(fēng)險管理[M].北京:電子工業(yè)出版社,2016.7-10.
[2] Alm J, Bahl R, Murray M N. Tax structure and tax compliance[J]. The Review of Economics and Statistics, 1990, 72(4): 603-613.
[3] Hglund H. Tax payment default prediction using genetic algorithm-based variable selection[J]. Expert Systems with Applications, 2017, 88: 368-375.
[4] Su A, He Z, Su J, et al.. Detection of tax arrears based on ensemble learning model[A]. Proceedings of the 2018 International Conference on Wavelet Analysis and Pattern Recognition[C]. Piscataway, NJ, 2018. 270-274.
[5] Lukason O, Abdresson A. Tax arrears versus financial ratios in bankruptcy prediction[J]. Journal of Risk and Financial Management, 2019, 12(4): 187-200.
[6] 蔡昌.稅收原理[M].北京:清華大學(xué)出版社,2010.256-259.
[7] 李永奎,周宗放.基于小世界網(wǎng)絡(luò)的企業(yè)間的關(guān)聯(lián)信用風(fēng)險傳染延遲效應(yīng)[J].系統(tǒng)工程,2015,33(9):74-79.
[8] 趙微,劉玉濤,周勇.金融風(fēng)險中違約傳染效應(yīng)的研究[J].數(shù)理統(tǒng)計與管理,2014,33(6):983-990.
[9] 陳作華.關(guān)聯(lián)交易與公司避稅——來自中國上市公司的經(jīng)驗數(shù)據(jù)[J].證券市場導(dǎo)報,2017,(5):21-31.
[10] 黃恒琪,于娟,廖曉,等.知識圖譜研究綜述[J].計算機(jī)系統(tǒng)應(yīng)用,2019,28(6):1-12.
[11] 陳曉軍,向陽.企業(yè)風(fēng)險知識圖譜的構(gòu)建及應(yīng)用[J].計算機(jī)科學(xué),2020,47(11):237-243.
[12] Song D, Schilder F, Hertz S, et al.. Building and querying an enterprise knowledge graph[J]. IEEE Transactions on Services Computing, 2019, 12(3): 356-369.
[13] 徐增林,盛泳潘,賀麗榮,等.知識圖譜技術(shù)綜述[J].電子科技大學(xué)學(xué)報,2016,45(4):589-606.
[14] 楊玉基,許斌,胡家威,等.一種準(zhǔn)確而高效的領(lǐng)域知識圖譜構(gòu)建方法[J].軟件學(xué)報,2018,29(10):2931-2947.
[15] Ruan T, Xue L, Wang H, et al.. Building and exploring an enterprise knowledge graph for investment analysis[A]. International Semantic Web Conference 2016[C]. Springer, Cham, 2016. 418-436.
[16] Lee J, Park J. An approach to constructing a knowledge graph based on Korean open-government data[J]. Applied Sciences, 2019, 9: 1-12.
[17] Zanibbi R, Blostein D, Gordy J R. A survey of table recognition: models, observations, transformations, and inferences[J]. Document Analysis and Recognition, 2004, 7(1): 1-16.
[18] Khusro S, Latif A, Vllah I. On methods and tools of table detection, extraction and annotation in PDF documents[J]. Journal of Information Science, 2015, 11(1): 41-57.
[19] Shigarov A, Mikhailov A, Altaar A. Configurable table structure recognition in untagged PDF documents[A]. 2016 ACM Symposium on Document Engineering[C]. Association for Computing Machinery, New York, 2016. 119-122.
[20] Fayyaz N, Khusro S, Ullah S. Accessibility of tables in PDF documents[J]. Information Technology and Libraries, 2021, 40(3): 1-20.
[21] Angles R, Gutierrez C. Survey of graph database models[J]. ACM Computing Surveys, 2008, 40(1): 1-39.
[22] 徐凱,周宗放,錢茜.考慮潛伏期的關(guān)聯(lián)信用風(fēng)險傳染機(jī)理研究[J].運(yùn)籌與管理,2020,29(3):190-197.
[23] 薛銀.基于關(guān)聯(lián)關(guān)系的企業(yè)風(fēng)險模型[J].金融電子化,2021,(4):74-76.
[24] Han J, Kamber M, Pei J. Data mining concepts and techniques[M]. San Francisco: Morgan Kaufmann, 2012. 243-247.
[25] 陳強(qiáng),代仕婭.基于金融知識圖譜的會計欺詐風(fēng)險識別方法[J].大數(shù)據(jù),2021,7(3):116-129.
3741500338290