摘要:近些年來,我國綜合國力發(fā)展迅速,在全球經(jīng)濟發(fā)展中發(fā)揮著重要的作用,這得益于我國政府的宏觀調(diào)控以及各大企業(yè)的積極響應(yīng)。其中,企業(yè)信用評估工作是保障我國經(jīng)濟發(fā)展的一個重要因素,有助于切實提高我國經(jīng)濟發(fā)展的速率。但是在開展數(shù)據(jù)采集工作的時候,由于有關(guān)企業(yè)信息的隱私保護工作不到位,導(dǎo)致企業(yè)內(nèi)部信息的泄露,進而對企業(yè)的實際發(fā)展產(chǎn)生一定的影響。所以,需要通過技術(shù)拓展,利用分布式隱私保護數(shù)據(jù)挖掘結(jié)構(gòu)開展相應(yīng)的信用評估工作,從而確保企業(yè)在接受信用評估的過程中信息不會泄露。本文主要介紹數(shù)據(jù)挖掘工作的主要內(nèi)容,以及分布式隱私保護架構(gòu)的原理和具體實施的流程。
關(guān)鍵詞:企業(yè)信用評估;分布式隱私保護;數(shù)據(jù)挖掘
引言:
資源信息共享是推動我國有效發(fā)展的主要因素之一。在我國主要的幾個經(jīng)濟大省中,政府主管財務(wù)的部門,以及相應(yīng)的職能部門和企業(yè)存儲了大量的數(shù)據(jù)資源,但是各個部門之間卻并沒有很好的利用相應(yīng)的信息資源,從而無法從其中提取出有助于推動整個城市發(fā)展的信息和知識。所以,為了滿足城市發(fā)展的需求,數(shù)據(jù)挖掘應(yīng)運而生。通過對大量的經(jīng)濟數(shù)據(jù)進行系統(tǒng)的分析工作,發(fā)掘出其中潛在的、有用的信息,最終可以為企業(yè)制定發(fā)展戰(zhàn)略的時候提供強有力的數(shù)據(jù)支持。在實際開展數(shù)據(jù)挖掘工作的時候,要注重對各個部門信息隱私的保護,進而打消其顧慮,使其愿意和其他部門進行資源共享。
一、重要性淺析
對數(shù)據(jù)挖掘進行隱私保護可以切實提高整個數(shù)據(jù)挖掘工作的效率以及數(shù)據(jù)挖掘工作的普及范圍,對企業(yè)而言,隱私保護數(shù)據(jù)挖掘可以將企業(yè)內(nèi)部所有部門有價值的數(shù)據(jù)信息進行整合,從而為企業(yè)制定發(fā)展方案提供理論依據(jù)。對我國整體經(jīng)濟發(fā)展而言,可以有效的推動國家經(jīng)濟的發(fā)展。在全球化大背景下,只有做好相應(yīng)的隱私保護數(shù)據(jù)挖掘才能順應(yīng)時代的發(fā)展。
二、隱私保護數(shù)據(jù)挖掘簡介
(一)主要內(nèi)容簡介
目前大多數(shù)企業(yè)內(nèi)部部門之間以及企業(yè)和企業(yè)之間不愿意將自己獨有的數(shù)據(jù)分享出來,主要的原因還是出于對自身隱私的保護,尤其是對于一些帶有敏感信息的部門而言,一旦相應(yīng)的敏感信息泄露,就會對整個企業(yè)的發(fā)展造成極大的影響。而數(shù)據(jù)挖掘?qū)ν苿悠髽I(yè)發(fā)展以及金融詐騙分析,乃至我國經(jīng)濟發(fā)展具有十分重要的戰(zhàn)略意義,所以,要通過大力開發(fā)隱私保護體系,進而調(diào)動企業(yè)內(nèi)部數(shù)據(jù)共享的積極性。隱私保護數(shù)據(jù)挖掘主要是通過對知識庫中的所有數(shù)據(jù)進行加密,或者通過算法將相應(yīng)的數(shù)據(jù)進行轉(zhuǎn)化,實現(xiàn)對用戶信息的保護功能。通過使用隱私保護數(shù)據(jù)挖掘,可以在進行數(shù)據(jù)挖掘的同時保障每位用戶信息的安全,確保敏感信息不會泄露。
(二)衡量隱私保護質(zhì)量的主要指標
1.安全性
安全性是衡量隱私保護數(shù)據(jù)挖掘構(gòu)架的重要指標之一。只有確保每位用戶的數(shù)據(jù)信息不會在挖掘期間泄露出去,才能促使用戶愿意將數(shù)據(jù)共享出來。安全性是開展數(shù)據(jù)挖掘工作的前提,如果無法保障用戶的隱私,則后續(xù)的工作是沒有任何意義的。
2.準確性
前文提到過,數(shù)據(jù)挖掘只有在一定基數(shù)數(shù)據(jù)基礎(chǔ)上進行才有意義,但是數(shù)據(jù)的基數(shù)越大,挖掘工作的難度也就越大。而且在整個數(shù)據(jù)群中,大部分的數(shù)據(jù)是沒有任何意義的。所以,在注重隱私保護數(shù)據(jù)挖掘安全性的同時,還要從隱私保護數(shù)據(jù)挖掘架構(gòu)的準確性考慮,要對構(gòu)架進行優(yōu)化,從而提高所挖掘出來的數(shù)據(jù)的價值。
3.效率
效率是衡量隱私保護數(shù)據(jù)挖掘的指標之一,主要通過優(yōu)化算法以及硬件設(shè)施提高整個數(shù)據(jù)挖掘構(gòu)架的效率。在實際開展隱私保護數(shù)據(jù)挖掘工作的過程中,對數(shù)據(jù)的計算、篩選,對有用數(shù)據(jù)的提取,以及對所有數(shù)據(jù)的加密,都需要花費大量的時間進行。但是金融市場瞬息萬變,效率較低的隱私保護數(shù)據(jù)挖掘構(gòu)架顯然無法滿足現(xiàn)實需求,所以就要通過優(yōu)化構(gòu)架提高整個挖掘工作的效率。
三、Agrent淺析
Agent技術(shù)是搭建數(shù)據(jù)挖掘構(gòu)架使用的技術(shù)手段之一。在實際應(yīng)用的過程中,首先Agent技術(shù)沒有中心控制,所有子網(wǎng)絡(luò)的數(shù)據(jù)都會直接上傳到知識庫中,從而有效的提高了整個數(shù)據(jù)挖掘工作的效率;其次,基于Agent技術(shù)搭建的系統(tǒng)具有動態(tài)性的特點,在數(shù)據(jù)挖掘工作開展的過程中可以根據(jù)企業(yè)的需求,通過技術(shù)手段對整個架構(gòu)做出相應(yīng)的調(diào)整;最后,基于Agent技術(shù)的隱私保護數(shù)據(jù)挖掘架構(gòu)實現(xiàn)透明化的特定。除此以外,Agent技術(shù)采取的是局部通信的方式進行數(shù)據(jù)挖掘,這一通信模式進一步提高了企業(yè)內(nèi)部各個用戶隱私的安全系數(shù)。如圖1 所示,即為基于Agent技術(shù)的模型圖:
四、實施方案
分布式架構(gòu)主要利用了安全多方計算技術(shù),該技術(shù)主要將局域網(wǎng)劃分成多個子網(wǎng)絡(luò),各個子網(wǎng)絡(luò)之間的信息不會傳遞,每位用戶都有一個獨立的子網(wǎng)絡(luò)用于上傳數(shù)據(jù),每位用戶將數(shù)據(jù)上傳完畢后,相應(yīng)的數(shù)據(jù)信息會直接上傳到局域網(wǎng)中,其他用戶無法訪問或者下載,也就保障了每位用戶的隱私安全。但是隨著計算基數(shù)的發(fā)展,安全多方技術(shù)的缺點也逐漸暴露了出來。由于只有在所有用戶將數(shù)據(jù)信息上傳完畢后,分布式構(gòu)架才能進行數(shù)據(jù)挖掘,整個計算的流程過于復(fù)雜,導(dǎo)致整個數(shù)據(jù)挖掘工作的效率較低,所以,通過對安全多方技術(shù)的改造升級研發(fā)出了效率更高的挖掘算法,該組件可以有效的提高數(shù)據(jù)挖掘工作的隱私保護效果,以及整個數(shù)據(jù)挖掘工作的效率。而且整個組件較為靈活,可以根據(jù)企業(yè)的實際情況制定出具有一定針對性的企業(yè)信用評估模型。
如下圖所示,即為隱私保護數(shù)據(jù)挖掘架構(gòu)的模型和實際實施流程。
1.基于Agent技術(shù),構(gòu)建數(shù)據(jù)挖掘架構(gòu),該架構(gòu)可以滿足企業(yè)信用評估工作開展的時候?qū)Ψ植际綌?shù)據(jù)處理的需求。在搭建架構(gòu)的時候,要注意對企業(yè)進行系統(tǒng)、深入的分析工作,對原有的架構(gòu)進行一定的調(diào)整,使整個架構(gòu)更具有針對性。
2.基于安全多方計算技術(shù)以及數(shù)字信息安全防護技術(shù),設(shè)計出能夠切實保障企業(yè)內(nèi)部各個部門信息的安全。在此基礎(chǔ)上,將企業(yè)內(nèi)部所有用戶的信息匯總,并上傳到知識庫中。
3.根據(jù)“問題定義”和“數(shù)據(jù)收集”,并咨詢有關(guān)專家的意見建立一個模型庫,將知識庫中的信息按照模型庫的格式進行挖掘整理,對于沒有價值的信息則自動進行加密處理。
4.在挖掘數(shù)據(jù)后,知識庫將挖掘完成的信息上傳到信用評估系統(tǒng)中,由系統(tǒng)對相應(yīng)的數(shù)據(jù)信息進行分析,最終生成相應(yīng)的信用評估結(jié)果。
參考文獻
[1]王金龍. 面向企業(yè)信用評估的分布式隱私保護數(shù)據(jù)挖掘[J]. journal6,2006,44(35):243-245.
[2]蔣云良,徐從富,王金龍,et al. 基于分布式隱私保護數(shù)據(jù)挖掘的企業(yè)信用評估方法:.
[3]葛新景,朱建明. 基于博弈論的隱私保護分布式數(shù)據(jù)挖掘[J]. 計算機科學(xué),2011,38(11):161-166.
[4]劉英超. 面向分布式的數(shù)據(jù)挖掘隱私保護方法研究[D]. 哈爾濱工程大學(xué).
作者簡介:徐志高,1959年8月,男,漢,碩士,首冠信用評估有限公司全國市場開發(fā)與管理總監(jiān),中國國際經(jīng)濟合作學(xué)會商務(wù)誠信工作委員會副秘書長,高級信用管理師,高級信用評估師,電氣工程師,英國商報FT中文網(wǎng)特邀嘉賓,IBM年度嘉賓;國際人力資本網(wǎng)發(fā)言嘉賓、ISO9001認證復(fù)檢專家、信用行業(yè)管理帶頭人、國家級雜志發(fā)表過多篇論文、中國LED工程聯(lián)盟專家組成員、北大EMBA同學(xué)會“一帶一路”信用課程應(yīng)邀講師、商場銷售管理銷售技巧全程講師;集建筑、工業(yè)、商業(yè)、教育、商貿(mào)于一身的綜合型高級管理人才。
(作者單位:首冠信用評估有限公司)