文/李沁穎 李智芬 龍雨婷
國(guó)家經(jīng)濟(jì)實(shí)力是國(guó)家強(qiáng)大的重要依靠之一,其主要來源是依靠納稅人無償上繳的資金,政府使用這些資金進(jìn)行各項(xiàng)工作項(xiàng)目的投資開發(fā),保證了資金的利潤(rùn)和國(guó)家建設(shè)的完善。
隨著社會(huì)環(huán)境的穩(wěn)定和社會(huì)經(jīng)濟(jì)實(shí)力的發(fā)展,政府越發(fā)注注重保護(hù)財(cái)政資金安全,不斷本著為人民服務(wù)的宗旨,使得納稅人繳納的資金可以得到保護(hù)。另外一方面,隨著互聯(lián)網(wǎng)的廣泛應(yīng)用和信息化辦公的發(fā)展,政府也投入了大量資金用于信息化管理,這不僅是加強(qiáng)資金使用管理的重要手段,也是保證中國(guó)廉政建設(shè),改善社會(huì)環(huán)境以及保障民生質(zhì)量的重要措施。
如今,政府資金監(jiān)管中存在諸多不良現(xiàn)象,如:擅自更改申請(qǐng)項(xiàng)目;挪用項(xiàng)目資金;多個(gè)單位套用項(xiàng)目資金等。
現(xiàn)有的人工監(jiān)管手段單一,對(duì)于每一類型的項(xiàng)目申請(qǐng)沒有統(tǒng)一規(guī)范的衡量標(biāo)準(zhǔn),使得資金審批時(shí)效性差。在政府的職能分工下資金監(jiān)管工作主要是由財(cái)政、審計(jì)部門負(fù)責(zé)。各個(gè)單位大部分更加注重項(xiàng)目資金的獲取,反而忽略了一些資金的回報(bào)率。
關(guān)于項(xiàng)目資金所存在的現(xiàn)有問題,如何進(jìn)行資金監(jiān)管是需要考慮的問題。對(duì)項(xiàng)目資金監(jiān)管主要是考慮單位內(nèi)部和各單位之間兩個(gè)方面。
首先,項(xiàng)目資金所涉及的數(shù)據(jù)庫在格式、內(nèi)容等方面不同于一般類型的數(shù)據(jù)庫,我們要先對(duì)項(xiàng)目之間的相似程度進(jìn)行判斷,根據(jù)每一類型項(xiàng)目所具有的共性進(jìn)行分類,再對(duì)每一類型的項(xiàng)目提取其中的主要影響因素,作為之后項(xiàng)目資金預(yù)測(cè)和項(xiàng)目比對(duì)的主要衡量標(biāo)準(zhǔn)。
對(duì)于單位內(nèi)部主要對(duì)其申請(qǐng)的項(xiàng)目以及申請(qǐng)的項(xiàng)目資金進(jìn)行監(jiān)督,防止出現(xiàn)重復(fù)申請(qǐng)項(xiàng)目或申請(qǐng)項(xiàng)目資金超標(biāo)的現(xiàn)象。對(duì)于新申請(qǐng)的項(xiàng)目需要和以往本單位申請(qǐng)的項(xiàng)目進(jìn)行比對(duì),防止出現(xiàn)完全一致或相似度極高的項(xiàng)目。在比對(duì)項(xiàng)目?jī)?nèi)容之后,需要對(duì)項(xiàng)目申請(qǐng)資金進(jìn)行核實(shí),首先判斷該項(xiàng)目的類型,再根據(jù)之前對(duì)每一類型的項(xiàng)目資金預(yù)測(cè)進(jìn)行比對(duì),如若超出資金預(yù)測(cè)區(qū)間則提出預(yù)警。
對(duì)于各個(gè)單位之間,主要考慮合作單位與非合作單位之間的關(guān)系。對(duì)于那些有合作的單位,要考慮兩個(gè)單位之間是否存在重復(fù)申請(qǐng),每個(gè)單位合作的項(xiàng)目都有各自負(fù)責(zé)的領(lǐng)域。其次,主要考慮非合作單位之間是否存在申請(qǐng)已審批或其他單位所申請(qǐng)的項(xiàng)目,占用項(xiàng)目資金。
數(shù)據(jù)中有項(xiàng)目具體屬性表和項(xiàng)目資金屬性表。由于數(shù)據(jù)量較大,因此需要對(duì)數(shù)據(jù)做出一系列的分析和篩選。對(duì)于標(biāo)稱數(shù)據(jù),通過卡方檢驗(yàn)(公式1)來判斷兩個(gè)屬性的相關(guān)性。對(duì)于數(shù)值數(shù)據(jù),通過皮爾森相關(guān)系數(shù)(公式2)來判斷兩個(gè)表中是否存在不同屬性名的屬性,從而對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步處理。
公式1
公式2
在完成上述所有的數(shù)據(jù)處理之后,對(duì)數(shù)據(jù)進(jìn)行規(guī)范化整理,很多數(shù)據(jù)因?yàn)椴煌膬?nèi)容對(duì)結(jié)果也會(huì)產(chǎn)生不一樣的影響。
2.3.1 項(xiàng)目聚類算法
在處理項(xiàng)目數(shù)據(jù)的過程中,首先要對(duì)數(shù)據(jù)的類別進(jìn)行一個(gè)分析,采用的是遵循同一簇內(nèi)中對(duì)象的相似度較高,而不同簇內(nèi)中的對(duì)象相似度較小的K-means文本聚類算法。
2.3.2 提取項(xiàng)目主要影響因素算法
在數(shù)據(jù)處理時(shí),需要對(duì)每個(gè)簇類數(shù)據(jù)的特征值方法進(jìn)行重要特征值提取,主要采用的是隨機(jī)森林方法。特征X是根據(jù)隨機(jī)森林中的決策樹計(jì)算每一棵樹的袋外誤差,記為errOOB1。再次隨機(jī)修改特征值,再次計(jì)算袋外誤差,記為errOOB2,即可得到特征X的重要性(公式3),對(duì)每一棵樹的特征值進(jìn)行計(jì)算,再對(duì)特征重要性進(jìn)行排序,逐步剔除不重要的特征值。
公 式3 X的 重 要 性=∑(errOOB2-errOOB1)/N
2.3.3 項(xiàng)目資金預(yù)測(cè)算法
針對(duì)項(xiàng)目的特征選取,可以對(duì)每一類型的項(xiàng)目進(jìn)行資金區(qū)間估計(jì)。通過從總體中抽取的樣本,根據(jù)一定的正確度與精確度的要求,構(gòu)造出適當(dāng)?shù)膮^(qū)間,以作為總體的分布參數(shù)(或參數(shù)的函數(shù))的真值所在范圍的估計(jì),一般使用的估計(jì)某個(gè)指定值的區(qū)間方法是區(qū)間預(yù)測(cè)。
本文區(qū)間預(yù)測(cè)主要采用的是一元線性回歸預(yù)測(cè)法,先選取一元線性回歸模型的變量,再根據(jù)最小二乘法來確定自變量X和因變量Y的相關(guān)關(guān)系,建立X與Y的線性回歸方程。一元線性回歸方程(公式4)中X代表自變量的取值;Y代表因變量的取值;a、b代表一元線性回歸方程的參數(shù)。這一直線是利用直線到各點(diǎn)的距離最近來確定的,之后再用這條直線進(jìn)行預(yù)測(cè)。
公式4 Y=a+bX
當(dāng)前是大數(shù)據(jù)盛行的年代,對(duì)于成千上萬的數(shù)據(jù),我們需要充分利用好,不能忽視數(shù)據(jù)之間的聯(lián)系,不能忽視數(shù)據(jù)背后真正的意義所在。本方案針對(duì)政府項(xiàng)目資金管理中遇到的問題給出相應(yīng)解決方案,使得相關(guān)管理人員對(duì)于數(shù)據(jù)的管理更加簡(jiǎn)單的同時(shí),可以幫助他們加強(qiáng)對(duì)政府事務(wù)的監(jiān)督。不僅可以通過系統(tǒng)判斷之前是否出現(xiàn)過相同或類似項(xiàng)目申請(qǐng)的同時(shí),還可以判定所申項(xiàng)目資金分配是否合理,這加強(qiáng)了對(duì)政府部門工作的監(jiān)督,是具有重大意義的。