韓 光,周崇毅,郝東林,劉 偉
(中國電子數(shù)據(jù)產(chǎn)業(yè)有限公司,廣東 深圳 518057)
數(shù)據(jù)要素化的加速和數(shù)據(jù)要素市場的不斷完善與成熟,為我國發(fā)展數(shù)字經(jīng)濟和建設數(shù)字中國注入強大動力。而金融行業(yè)目前是數(shù)字經(jīng)濟中對數(shù)據(jù)要素的需求最大、價值發(fā)揮最高的行業(yè)。
金融行業(yè)挖掘數(shù)據(jù)要素潛能走在各行業(yè)前列。中國人民銀行《金融科技發(fā)展規(guī)劃(2019—2021年)》指出:“在切實保障個人隱私、商業(yè)秘密與敏感數(shù)據(jù)前提下,強化金融與司法、社保、工商、稅務、海關、電力、電信等行業(yè)數(shù)據(jù)資源融合應用,建立健全數(shù)據(jù)融合應用機制,實現(xiàn)數(shù)據(jù)資源有效整合與深度利用”[1]。
在《金融科技發(fā)展規(guī)劃(2022-2025年)》進一步就發(fā)揮數(shù)據(jù)要素價值明確:“把握數(shù)字經(jīng)濟發(fā)展新趨勢,發(fā)揮數(shù)據(jù)要素倍增作用,將數(shù)字元素注入金融服務全流程,將數(shù)字思維貫穿于業(yè)務運營全鏈條、強化金融創(chuàng)新的科技武裝,數(shù)據(jù)加持,加快金融數(shù)字化轉型步伐,全面提升我國金融業(yè)綜合實力和核心競爭力”[2]。
《2022年金融業(yè)數(shù)據(jù)流通交易市場研究報告》顯示,按照最保守估計,金融行業(yè)年交易量在數(shù)百億以上[3]。
盡管金融行業(yè)在數(shù)據(jù)要素化探索上取得了較為顯著的成果,然而,由于缺乏數(shù)據(jù)確權與定價等基礎性制度改革,數(shù)據(jù)獲取存在壁壘,數(shù)據(jù)質量與金融實際需求匹配差異大等問題仍然較突出。數(shù)據(jù)要素全周期、體系性、安全技術產(chǎn)品創(chuàng)新等方面,仍然存在諸多堵點,尚未取得根本性突破[4]。距離“數(shù)據(jù)高效流通使用、賦能實體經(jīng)濟”的目標,仍有較大的差距。
國家、地方法規(guī)和行業(yè)標準如何有效銜接,是當前面臨的一個難題。國家頂層法規(guī)方面,“三法三條例”的數(shù)據(jù)安全制度框架已經(jīng)基本成型。三法分別是《網(wǎng)絡安全法》《數(shù)據(jù)安全法》《個人信息保護法》,三條例分別是《關鍵信息基礎設施安全保護條例》《網(wǎng)絡安全等級保護條例(征求意見)》《網(wǎng)絡數(shù)據(jù)安全管理條例(征求意見)》。地方法規(guī)方面,初步統(tǒng)計,截止到2023年2月,各地出臺的數(shù)據(jù)相關地方性法規(guī)合計也超過40部。行業(yè)標準方面,2023年7月24日,中國人民銀行起草了《中國人民銀行業(yè)務領域數(shù)據(jù)安全管理辦法(征求意見稿)》[5],初步銜接《中華人民共和國數(shù)據(jù)安全法》,并細化明確了中國人民銀行業(yè)務領域數(shù)據(jù)安全合規(guī)底線要求,填補了本領域數(shù)據(jù)安全管理制度保障空白,指導數(shù)據(jù)處理者優(yōu)質高效合規(guī)開展中國人民銀行業(yè)務領域數(shù)據(jù)處理活動,履行數(shù)據(jù)安全保護義務。如地方文件根據(jù)國家“三法三條例”也都提到了數(shù)據(jù)分類分級,但并未進一步提出具體的分級規(guī)范以及數(shù)據(jù)全生命周期的數(shù)據(jù)安全管理要求,因此各主體參與數(shù)據(jù)流通時找不到明確的依據(jù),顧慮重重。
《證券日報》曾在2022年初報道,我國數(shù)據(jù)黑市交易的市場規(guī)模已經(jīng)超過1 500億元?;钴S的數(shù)據(jù)黑市,導致了網(wǎng)絡爬取隱私數(shù)據(jù)、數(shù)據(jù)泄露等事件頻發(fā)。根據(jù)Proxyrack統(tǒng)計,我國在2022年發(fā)生超過5 000萬起數(shù)據(jù)泄露事件。盡管對該數(shù)據(jù)的準確性需要進一步確認,但該數(shù)據(jù)在一定程度上顯示出當前我國數(shù)據(jù)安全的發(fā)展態(tài)勢仍然較為嚴峻。2022年,7省份數(shù)字政務系統(tǒng)受攻擊,近4億公民數(shù)據(jù)受威脅;40多家國內金融機構的內網(wǎng)交易數(shù)據(jù)庫遭入侵,交易指令和多條內幕信息被非法獲取[6]。
數(shù)據(jù)要素化存在確權難、定價難、計量難的三個深層次問題。數(shù)據(jù)要素“確權難”,主要體現(xiàn)在數(shù)據(jù)要素屬于“財產(chǎn)權”還是“人格權”的范疇,如何平衡保護與利用的矛盾?!皵?shù)據(jù)二十條”提出探索“建立數(shù)據(jù)資源持有權、數(shù)據(jù)加工使用權、數(shù)據(jù)產(chǎn)品經(jīng)營權等分置的產(chǎn)權運行機制”,也僅僅是淡化了數(shù)據(jù)的所有權。由于數(shù)據(jù)產(chǎn)權的模糊性、數(shù)據(jù)生產(chǎn)的復雜性以及數(shù)據(jù)價值事前評估困難和數(shù)據(jù)要素被分析利用的“零邊際成本”等特性,導致“定價難”。數(shù)據(jù)要素“計量難”,體現(xiàn)在原始數(shù)據(jù)無法規(guī)?;灰?,數(shù)據(jù)交易市場缺乏合適的交易標的物,因此只能將數(shù)據(jù)資源轉化為數(shù)據(jù)產(chǎn)品,采用“按次計量”或“按月計量”,而這種轉化勢必犧牲數(shù)據(jù)要素的通用性和規(guī)模性。
金融行業(yè)數(shù)據(jù)要素化在數(shù)據(jù)要素化的三個深層次問題之外,存在以下三方面的行業(yè)挑戰(zhàn):
第一,數(shù)據(jù)源合規(guī)監(jiān)管難。數(shù)據(jù)交易呈現(xiàn)出交易分散、供應商多、數(shù)據(jù)質量參差不齊、溯源難的特點,缺乏第三方保障。截至2022年10月,金融行業(yè)數(shù)據(jù)供應商共2 216家[3]。
第二,數(shù)據(jù)接入時間冗長。數(shù)據(jù)尋找與協(xié)調周期長、數(shù)據(jù)接入測試繁瑣和數(shù)據(jù)質量無法達到要求,需要花費大量時間二次治理等原因,導致數(shù)據(jù)接入時間長、效率不高。
第三,數(shù)據(jù)采購分散。各總行、分行采購分散,數(shù)據(jù)對接需要逐家談判,存在價格不統(tǒng)一、重復采購問題。
金融領域數(shù)據(jù)流通需求旺盛且迫切,部分地方已基于政務數(shù)據(jù)探索建設金融服務平臺,但主要以信息發(fā)布和智能匹配為主,且在數(shù)據(jù)應用方面未做市場細分,對數(shù)據(jù)的挖掘和利用尚待進一步提升。
目前,金融行業(yè)的數(shù)據(jù)采購主要有以下三種模式。
截至目前,多家金融機構與數(shù)據(jù)資源方、數(shù)據(jù)交易所等機構均在探索“數(shù)據(jù)可用不可見”的隱私計算、聯(lián)邦學習或者多方安全計算等計算技術路徑,如圖1所示。盡管隱私計算模式已經(jīng)取得了一定的價值,但現(xiàn)階段的最大瓶頸是各隱私計算廠商之間不能互聯(lián)互通。不同企業(yè)機構部署的不同隱私計算產(chǎn)品都有一套自己相對獨立的技術標準,很難實現(xiàn)彼此之間的共享與信息交互。
圖1 隱私計算采購模式
另外,數(shù)據(jù)共享的成本也大幅提升。根據(jù)多家金融機構部署隱私計算平臺后反饋,隱私計算成本是正常計算技術的幾十倍以上,效率的瓶頸難以滿足高并發(fā)、高實施的業(yè)務要求。再加上法律合規(guī)等原因,導致市場對隱私計算技術仍舊存在較大的爭議,因此,隱私計算模式的完善與推廣,還有相當長的落地探索時間與周期。
政府部門牽頭的部分金融服務平臺,主流的方式是提供從數(shù)據(jù)資源到數(shù)據(jù)應用的“一條龍”黑盒模式,如圖2所示。該模式的不足之處在于一方面形成業(yè)務壟斷,造成數(shù)據(jù)質量低、服務不及時等;另一方面金融機構真正想要的高價值數(shù)據(jù)不一定能夠安全合規(guī)獲取到,而獲取到的數(shù)據(jù),發(fā)揮的價值卻很有限。
圖2 一條龍授權模式
基于目前金融行業(yè)數(shù)據(jù)采購量大、場外交易多,目前的數(shù)據(jù)要素流通存在諸多局限等原因,本研究提出了基于數(shù)據(jù)元件與數(shù)據(jù)金庫的安全可信金融數(shù)據(jù)空間采購模式,如圖3所示。
圖3 可信安全數(shù)據(jù)空間采購模式
該方案以“一元兩網(wǎng)、三類市場”為核心理念,通過“數(shù)據(jù)元件”實現(xiàn)原始數(shù)據(jù)和數(shù)據(jù)應用的解耦;“三類市場”結合傳統(tǒng)四大要素市場化配置規(guī)律,將數(shù)據(jù)要素市場科學合理地切分為數(shù)據(jù)資源市場、數(shù)據(jù)元件市場、數(shù)據(jù)產(chǎn)品市場,實現(xiàn)數(shù)據(jù)“資源化、資產(chǎn)化、資本化”。打造金融行業(yè)安全可信數(shù)據(jù)空間,形成符合經(jīng)濟學原理的市場化配置體系。
“一元”就是數(shù)據(jù)元件,數(shù)據(jù)元件是通過對數(shù)據(jù)脫敏處理后,根據(jù)需要由若干相關字段形成的數(shù)據(jù)集或由數(shù)據(jù)的關聯(lián)字段通過建模形成的數(shù)據(jù)特征。
“兩網(wǎng)”是數(shù)據(jù)金庫網(wǎng)與數(shù)據(jù)要素網(wǎng)。重要數(shù)據(jù)存儲在數(shù)據(jù)金庫中,數(shù)據(jù)金庫是在政府監(jiān)管下采用全面自主安全的技術產(chǎn)品建設的高安全數(shù)據(jù)存儲措施,主要部署在政府、重要組織行業(yè)和大型企業(yè),存儲原始數(shù)據(jù)中可能承載國家安全、公共利益、商業(yè)機密和個人隱私的敏感信息,如果需要進入流通環(huán)節(jié),需要開展分類分級認定工作[7]。
多個數(shù)據(jù)金庫會形成數(shù)據(jù)金庫網(wǎng),“數(shù)據(jù)金庫(內)網(wǎng)”主要用于實現(xiàn)核心數(shù)據(jù)和重要數(shù)據(jù)脫敏脫密形成數(shù)據(jù)元件的內部流程(類似于專網(wǎng));數(shù)據(jù)要素(外)網(wǎng)是基于數(shù)據(jù)元件,用于實現(xiàn)要素形態(tài)數(shù)據(jù)的社會面流通。
數(shù)據(jù)金庫與數(shù)據(jù)要素兩網(wǎng)之間通過集數(shù)據(jù)加工與交易于一體的平臺進行單向聯(lián)結,數(shù)據(jù)要素加工交易平臺是橫跨數(shù)據(jù)金庫網(wǎng)與要素網(wǎng)節(jié)點的平臺。原始數(shù)據(jù)經(jīng)過該平臺的加工和審核,形成可計量、可定價且風險可控的數(shù)據(jù)元件。這就將低價值密度、高安全風險的原始數(shù)據(jù)轉變成高價值密度、低安全風險的數(shù)據(jù)要素。再往上,通過數(shù)據(jù)產(chǎn)權登記平臺,實現(xiàn)全國互認的數(shù)據(jù)確權,然后進入數(shù)據(jù)空間交易[8]。
總結來說,數(shù)據(jù)金庫(內)網(wǎng)可以實現(xiàn)“數(shù)據(jù)資源+數(shù)據(jù)元件存儲”,數(shù)據(jù)要素(外)網(wǎng)實現(xiàn) “數(shù)據(jù)元件搜索+交易”。這套體系保證了統(tǒng)籌數(shù)據(jù)安全與要素化流通兩大核心問題,支撐數(shù)據(jù)要素安全、高效和跨域流通。
所謂安全可信金融數(shù)據(jù)空間,是以數(shù)據(jù)元件和數(shù)據(jù)金庫為基礎,以可信計算和合規(guī)措施為支撐,融合原有數(shù)據(jù)基礎設施和數(shù)據(jù)資源,通過數(shù)據(jù)空間操作系統(tǒng)和安全治理機制打造金融行業(yè)數(shù)據(jù)空間,實現(xiàn)跨機構、跨地域、跨行業(yè)的數(shù)據(jù)安全合規(guī)、共享流通、業(yè)務創(chuàng)新,充分釋放數(shù)據(jù)要素倍增效應。
傳統(tǒng)的計算機網(wǎng)絡分成五層結構,分別是應用層、傳輸層、網(wǎng)絡層、數(shù)據(jù)鏈路層、物理層。
安全可信金融數(shù)據(jù)空間,同樣是以五層架構和數(shù)據(jù)空間操作系統(tǒng)為核心,共同構建統(tǒng)一的數(shù)據(jù)空間技術體系,如圖4所示。其中,五層架構包含數(shù)據(jù)資源層、數(shù)據(jù)組織層、本體孿生層、決策推演層以及業(yè)務應用層,包含了數(shù)據(jù)歸集、存儲、加工、融合計算、共享、使用、管理等各數(shù)據(jù)要素相關完整流程;數(shù)據(jù)空間操作系統(tǒng)負責對空間資源、任務、調度、交互、權限等進行統(tǒng)一管理,是統(tǒng)籌管理和協(xié)作中心。
圖4 安全可信金融數(shù)據(jù)空間架構圖
3.2.1 數(shù)據(jù)資源層
數(shù)據(jù)資源層整合來自政府、組織、企業(yè)、個人等多個主體的數(shù)據(jù),實現(xiàn)將原有數(shù)據(jù)基礎設施數(shù)據(jù)(如數(shù)據(jù)中心、各行業(yè)不同業(yè)務域、互聯(lián)網(wǎng)等)與數(shù)據(jù)金庫的數(shù)據(jù)以數(shù)據(jù)資源、模型結果集、數(shù)據(jù)元件等方式歸集存儲,實現(xiàn)融合計算與共享。
3.2.2 數(shù)據(jù)組織層
數(shù)據(jù)組織層包含元件資源融合平臺和數(shù)據(jù)組件。
元件資源融合平臺:支撐數(shù)據(jù)資源與數(shù)據(jù)元件安全合規(guī)的融合共享。從數(shù)據(jù)產(chǎn)品的定義到發(fā)布,保障生產(chǎn)到共享過程的安全合規(guī),以數(shù)據(jù)元件的方式對外提供共享,并針對空間運營以及共享情況進行統(tǒng)計。
數(shù)據(jù)組件:數(shù)據(jù)組件由來自數(shù)據(jù)空間基礎設施的基礎數(shù)據(jù)元件、數(shù)據(jù)半成品、低密級數(shù)據(jù)經(jīng)融合計算構成,通過數(shù)據(jù)的組織實現(xiàn)共享利用。它包含兩大類數(shù)據(jù)來源,一類是數(shù)據(jù)金庫生產(chǎn)出來的元件,另一類是原有數(shù)據(jù)基礎設施的數(shù)據(jù)資源經(jīng)過加工后形成的數(shù)據(jù)半成品,如數(shù)據(jù)元件、數(shù)據(jù)模型等。
3.2.3 本體孿生層
本體孿生層包含空間資源管理平臺和技術與本體組件層。
空間資源管理平臺:包含空間數(shù)據(jù)資源的需求對接、資源目錄、參與主體以及使用存證等功能,為技術組件、本體組件的開發(fā)使用提供統(tǒng)一的管理功能。
技術與本體組件層:構建一系列技術組件以及本體組件,提供非結構化解析、指標管理、標簽管理、知識圖譜、分類分級、本體建模以及可信鏈等功能,通過本體孿生技術消除信息不對稱。
3.2.4 決策推演層
決策推演層包括決策推演平臺和業(yè)務組件。
決策推演平臺:為以業(yè)務目標為導向的數(shù)據(jù)挖掘和仿真推演提供搜索研判、時空分析以及本體可視化等相關功能支撐,滿足面向不同行業(yè)需求的決策推演需求,支撐不同行業(yè)的數(shù)據(jù)產(chǎn)品開發(fā)與應用分析。
業(yè)務組件層:利用數(shù)據(jù)空間的數(shù)據(jù)資源,在技術組件以及本體組件的基礎上,構建包含搜索、全息檔案、規(guī)則組件、研判模型、智能報告、業(yè)務圖譜、智能規(guī)則等業(yè)務組件,支撐決策推演。
3.2.5 業(yè)務應用層
數(shù)據(jù)融合共享的目的是為了支撐銀行、證券、保險等各金融機構的數(shù)據(jù)應用,數(shù)據(jù)空間內各參與主體通過業(yè)務應用層提供的營銷、風控、審計、輿情等多領域應用將空間內的數(shù)據(jù)產(chǎn)品應用到各自領域的業(yè)務經(jīng)辦和管理活動中。
安全可信金融數(shù)據(jù)空間與各地大數(shù)據(jù)局建設的金融專區(qū)以及全國數(shù)十家數(shù)據(jù)交易所、數(shù)據(jù)交易中心會形成互補關系,是基于共同商定原則的去中心化的數(shù)據(jù)生態(tài)系統(tǒng)基礎設施,提供數(shù)據(jù)交易、數(shù)據(jù)商服務、運營管理、信息存證、安全保障等服務,實現(xiàn)金融行業(yè)企業(yè)安全可信的數(shù)據(jù)流通[9]。
首先,通過建立主體管理、設施管理、數(shù)據(jù)管理和監(jiān)督考核等制度,完善確權登記、數(shù)據(jù)流通、定價與分配、糾紛調解及仲裁等機制,以及《金融可信數(shù)據(jù)空間建設標準》《金融可信數(shù)據(jù)空間數(shù)據(jù)安全合規(guī)標準》等標準,構建合規(guī)治理制度環(huán)境。其次,在空間要素上,多技術方式共舉,實現(xiàn)空間可信、安全、融合、共享。通過身份認證、存證、追溯和監(jiān)管、規(guī)則與協(xié)議,實現(xiàn)空間可信;通過數(shù)據(jù)元件、數(shù)據(jù)金庫、數(shù)據(jù)安全與合規(guī)審核,實現(xiàn)空間安全;通過目錄與分類分級、資源元件融合計算,實現(xiàn)空間數(shù)據(jù)融合;通過供需對接、流通計量、考核,實現(xiàn)空間數(shù)據(jù)共享。第三,在技術原理上,按照“數(shù)據(jù)不動計算動、數(shù)據(jù)可用不可見、數(shù)據(jù)可控可計量”的技術實現(xiàn)邏輯[10],實現(xiàn)高效率、多主體在線供需對接、多對多數(shù)據(jù)安全融合共享?;跀?shù)據(jù)元件的融合計算解決空間內原始數(shù)據(jù)不出域,多主體跨域安全可信融合共享;基于數(shù)據(jù)金庫實現(xiàn)數(shù)據(jù)資源與元件結果安全存儲;基于區(qū)塊鏈聯(lián)邦集成技術,構建數(shù)據(jù)空間可信聯(lián)盟鏈,實現(xiàn)身份、目錄、行為、合約上鏈,全程留痕,數(shù)據(jù)可信可追溯[11]。
通過打造以金融行業(yè)為核心的多個行業(yè)數(shù)據(jù)空間,豐富金融數(shù)據(jù)要素的場景,實現(xiàn)深化賦能產(chǎn)業(yè)的目的。比如,聚焦國家關注的重點實體經(jīng)濟、創(chuàng)業(yè)創(chuàng)新類企業(yè)、鄉(xiāng)村振興等重點類產(chǎn)業(yè)及客群,通過制度、機制、技術三點互為支撐的創(chuàng)新,激活企業(yè)數(shù)據(jù)信托、個人數(shù)據(jù)信托等方式,實現(xiàn)數(shù)據(jù)二十條中的持有權、加工權和經(jīng)營權的分離。真正實現(xiàn)以“可計量”為核心的數(shù)據(jù)資產(chǎn)化落地,打破現(xiàn)有的服務邊界,推動數(shù)據(jù)要素價值的復用與金融機構服務的升級,更好地賦能實體經(jīng)濟[12]。
通過建立金融行業(yè)數(shù)據(jù)空間,還可以有效帶動跨行業(yè)、跨領域、跨層級數(shù)據(jù)的流通共享,從而激發(fā)更為廣泛的數(shù)據(jù)價值[13]。以金融行業(yè)數(shù)據(jù)空間為示范,牽引不同的行業(yè)數(shù)據(jù)空間建設模式趨于成熟,未來會實現(xiàn)其他各行業(yè)數(shù)據(jù)空間的融合互通,以及行業(yè)數(shù)據(jù)空間與通用型、區(qū)域性數(shù)據(jù)交易市場的銜接。
金融行業(yè)數(shù)據(jù)空間不僅定義數(shù)據(jù)生態(tài)系統(tǒng)中各方之間的可信賴數(shù)據(jù)關系,而且創(chuàng)新提出基于“數(shù)據(jù)元件”和“數(shù)據(jù)金庫”的新五層架構,數(shù)據(jù)組織層、本體孿生層、決策推演層的研究、探索和應用將極大促進數(shù)據(jù)的要素化、市場化運作,激活數(shù)據(jù)流通的新模式和技術創(chuàng)新。
希拉·賈薩諾夫在《發(fā)明的倫理:技術與人類的未來》中提出:“新涌現(xiàn)的技術已經(jīng)不僅僅是一系列無生命的工具,也不僅僅是相互聯(lián)結、輔助完成任務的系統(tǒng),而是重新劃分了自我與他人、自然與人工之間的界限。技術發(fā)明已經(jīng)滲入了我們的身體、思想和社會交往,改變了我們與其他人和非人的關系”。[14]當前,數(shù)據(jù)資源作為新時代推動經(jīng)濟發(fā)展的“新石油”,已經(jīng)被提升為與土地、勞動力、技術和資本并列的第五大生產(chǎn)要素。打造安全可信金融數(shù)據(jù)空間,以“數(shù)據(jù)元件”和“數(shù)據(jù)金庫”為核心支撐,建立健全權責明晰、分級管理的決策、監(jiān)管、運營系統(tǒng)化的金融數(shù)據(jù)空間管理體系,以及以數(shù)據(jù)組織層、本體孿生層、決策推演層為核心的新五層架構體系,推動公共數(shù)據(jù)和社會數(shù)據(jù)安全合規(guī)融合計算,不僅對推動數(shù)據(jù)空間的研究、落地、促進產(chǎn)業(yè)創(chuàng)新具有深遠意義,而且將數(shù)字元素注入金融服務全流程,極大發(fā)揮了數(shù)據(jù)要素倍增作用,實現(xiàn)數(shù)據(jù)資源有效整合與深度利用,真正促進普惠金融與鄉(xiāng)村振興,全面提升我國金融業(yè)綜合實力和核心競爭力。