閆佳銘
摘要:我國社會信用體系建設發(fā)展前景廣闊,基于數(shù)據(jù)共享打造信用產(chǎn)品,成為未來發(fā)展的重要趨勢。大數(shù)據(jù)時代,社會信用體系建設不斷深入的過程中面臨許多挑戰(zhàn),如非格式化數(shù)據(jù)應用不足、信用應用場景少、數(shù)據(jù)分析挖掘能力不足等。充分利用大數(shù)據(jù)技術的高擴展性、數(shù)據(jù)處理能力和數(shù)據(jù)分析能力,可以促進社會信用體系更好更快發(fā)展。
關鍵詞:大數(shù)據(jù)技術;社會信用體系建設;信用應用
信用數(shù)據(jù)是推動社會信用體系發(fā)展的基礎力量,大數(shù)據(jù)技術既能夠改變信用數(shù)據(jù)分析和判斷方式,又能引起社會信用生產(chǎn)理念和應用產(chǎn)品設計發(fā)生變化。全面建成社會信用體系是一項長期性工作,需要深入研究和技術突破,社會信用平臺和應用要持續(xù)更新以適應新環(huán)境、新要求,發(fā)揮大數(shù)據(jù)的技術優(yōu)勢用于信用建設勢在必行。
一、社會信用體系建設的發(fā)展趨勢
(一)信用數(shù)據(jù)海量增長,數(shù)據(jù)格式多樣化發(fā)展
信用數(shù)據(jù)是社會信用體系建設的重要組成部分,為提高信用監(jiān)管的針對性和信用評價的準確性,信用評價指標和數(shù)據(jù)量將不斷豐富。海量數(shù)據(jù)由多種數(shù)據(jù)結構構成,既包含由二維表來表現(xiàn)的結構化數(shù)據(jù),又包含圖片、視頻、報表等非結構化數(shù)據(jù)。豐富的信息資源為信用體系建設奠定了堅實的數(shù)據(jù)基礎樁,也為眾多機構參與建設創(chuàng)造了條件,數(shù)據(jù)量的豐富和數(shù)據(jù)結構的復雜給數(shù)據(jù)存儲、查詢、分析、清洗帶來更多挑戰(zhàn)。
(二)信用主體增加,系統(tǒng)覆蓋面更廣
國家和各省市區(qū)逐步建立橫向到邊、縱向到底的覆蓋全社會的公共信用網(wǎng)站,信用主體可以在網(wǎng)站上查詢或打印信用報告、查詢行政處罰或行政許可信息,失信主體可以申請信用修復或提出信用異議。隨著社會對信用建設的理解逐漸深入,信用元素所涉及領域將逐漸增多,更多的信用主體會在國家和地方信用網(wǎng)站中查詢信息和使用功能,信用網(wǎng)站的并發(fā)性壓力日益增大。
(三)數(shù)據(jù)分析能力提升,信用應用產(chǎn)品更加豐富
在獲取海量、多樣化信用數(shù)據(jù)基礎上,信用應用產(chǎn)品的設計與開發(fā)也將不斷深入,應用范圍逐漸拓寬。各省市區(qū)采用不同技術手段挖掘分析信用數(shù)據(jù),鼓勵信用服務企業(yè)參與進來,獲取數(shù)據(jù)間的關聯(lián)特性,提取高質量的信用信息,支持更多信用應用需求落地。
二、社會信用體系建設的現(xiàn)實障礙
(一)信用數(shù)據(jù)來源不全,非格式化數(shù)據(jù)應用不足
現(xiàn)階段,公共信用數(shù)據(jù)的主要來源是各行政部門在工作過程中所產(chǎn)生的監(jiān)管數(shù)據(jù),包含雙公示信息、紅黑名單、基本登記信息等。在數(shù)據(jù)采集過程中,部分信息無需市場主體提供或者工作人員對某些數(shù)據(jù)項沒有足夠重視,導致出現(xiàn)數(shù)據(jù)字段缺失的情況,例如漏填法人或其他組織統(tǒng)一社會信用代碼,唯一識別碼缺失會影響信用評價的科學性和準確性。同時,公共信用數(shù)據(jù)由結構化數(shù)據(jù)和非結構化數(shù)據(jù)組成,但實際上以傳統(tǒng)的結構化數(shù)據(jù)為主,缺少對互聯(lián)網(wǎng)抓取數(shù)據(jù)、視頻音頻等非結構化數(shù)據(jù)的應用。
(二)信用應用場景偏少,信用產(chǎn)品落地難
從各地區(qū)信用應用推進情況看,信用應用場景普遍偏少。以聯(lián)合獎懲為例,國家已組織各行政部門簽署涉及多領域的備忘錄,但在實際執(zhí)行過程中卻因獎懲措施不明確、針對性不強,導致陷入難以落地的窘境。除現(xiàn)有應用難以推動的情況外,基于大數(shù)據(jù)分析的應用產(chǎn)品明顯不足,在實際應用中以銀行信用貸款、法院對失信人核查監(jiān)督和工程領域招投標等為主[1]。
(三)數(shù)據(jù)割裂,數(shù)據(jù)分析挖掘能力不足
信用數(shù)據(jù)的歸集是數(shù)據(jù)共享的前提,各省市采用獨立建設信用平臺的方式開展,產(chǎn)生信用信息割裂現(xiàn)象,信用主體的數(shù)據(jù)完整性難以保證,會出現(xiàn)同一主體可能具有不一樣的信用評價,影響評價結果的科學性。在數(shù)據(jù)存儲上看,傳統(tǒng)架構下的信用平臺建設多采用關系數(shù)據(jù)庫進行存儲,而這種數(shù)據(jù)庫中的二維表數(shù)據(jù)模型難以支撐對多維數(shù)據(jù)的處理,特別是當平臺數(shù)據(jù)朝著多樣化、高并發(fā)訪問交互發(fā)展的情況。
三、大數(shù)據(jù)技術在社會信用體系建設中的應用研究
相比于傳統(tǒng)架構,大數(shù)據(jù)技術具有高擴展性和強大的存儲、挖掘、分析、處理數(shù)據(jù)的能力,充分發(fā)揮大數(shù)據(jù)的技術優(yōu)勢,向社會提供更加精準的信用服務和更加科學的信用監(jiān)管。
(一)高擴展性解決信用信息歸集問題
大數(shù)據(jù)技術的高擴展性,能夠高質量實現(xiàn)信用信息歸集和共享機制。按照信用目錄需求,廣泛征集各領域、多種格式的信用數(shù)據(jù)進行統(tǒng)一歸集,在大數(shù)據(jù)架構下,系統(tǒng)可以實現(xiàn)兼容多種類型的數(shù)據(jù)格式。如果數(shù)據(jù)量龐大,可以通過添加服務器節(jié)點實現(xiàn)性能大幅度提升,而且服務器節(jié)點數(shù)量的變化不會影響已有的應用程序,而且多臺服務器可以實現(xiàn)相互間冗余備份,單個節(jié)點出現(xiàn)故障并不會對整個系統(tǒng)造成影響,系統(tǒng)仍能保持運行。
(二)分布式架構集群提升數(shù)據(jù)存儲和處理能力
傳統(tǒng)架構中數(shù)據(jù)具有關系特性,大數(shù)據(jù)架構能夠規(guī)避這一點,數(shù)據(jù)庫結構比較簡單,采用分布式集群架構或內(nèi)存數(shù)據(jù)庫來滿足系統(tǒng)對龐大數(shù)據(jù)總量、高并發(fā)的需要,在用戶訪問壓力大、交互頻次高的情況下,不會出現(xiàn)響應遲緩或宕機的現(xiàn)象。傳統(tǒng)關系型數(shù)據(jù)庫在處理海量數(shù)據(jù)時,需要幾個小時或更長時間,這種效率是用戶無法接受的,用傳統(tǒng)數(shù)據(jù)查詢技術處理海量信用數(shù)據(jù)難以為繼。大數(shù)據(jù)時代下,這種強大的數(shù)據(jù)存儲和處理能力為信用體系建設的發(fā)展提供了技術保障,使信用平臺的服務范圍更廣泛、服務內(nèi)容更豐富。
(三)挖掘分析信用數(shù)據(jù)關聯(lián)關系,創(chuàng)新應用產(chǎn)品
大數(shù)據(jù)和云計算技術能夠推動信用應用產(chǎn)品的設計與開發(fā),通過深入挖掘信用數(shù)據(jù),獲得數(shù)據(jù)之間的關聯(lián)關系,并分析其中蘊含的價值,產(chǎn)生內(nèi)容豐富、適合推廣的信用產(chǎn)品。同時,預測是大數(shù)據(jù)的一個核心特性,在現(xiàn)有海量數(shù)據(jù)環(huán)境下,大數(shù)據(jù)技術可以通過垂直檢索、語義分析、機器學習等技術手段產(chǎn)生更高效、精準的協(xié)同過濾推薦方法。通過多維度實現(xiàn)信用數(shù)據(jù)分析,既可以改善信用評價的準確度,又可以更有針對性進行聯(lián)合獎懲,提升信用監(jiān)管成效。大數(shù)據(jù)技術對結構化和非結構化信用數(shù)據(jù)進行分析,可以產(chǎn)生信用業(yè)務決策、風險評估、安全生產(chǎn)風險預警等應用產(chǎn)品,創(chuàng)新信用應用服務范圍,提供精準服務,提升產(chǎn)品多樣化和適應性。
參考文獻:
[1]陳海盛,白小虎,郭文波,吳淑君.大數(shù)據(jù)背景下信用監(jiān)管機制構建研究[J].征信,2019(5):11-16.
[2]吳克文·大數(shù)據(jù)技術在社會信用體系建設中的應用研究[J].農(nóng)家參謀,604(24):280.