摘 ?要:針對當(dāng)前政務(wù)數(shù)據(jù)開放共享存在的障礙和問題,文章提出將多方安全計(jì)算技術(shù)應(yīng)用到政務(wù)數(shù)據(jù)開放共享領(lǐng)域,設(shè)計(jì)新型政務(wù)數(shù)據(jù)開放開發(fā)模型,從政務(wù)數(shù)據(jù)匯聚共享、開發(fā)開放和數(shù)據(jù)交易市場發(fā)展三個(gè)方面設(shè)計(jì)基于多方安全計(jì)算的政務(wù)數(shù)據(jù)開發(fā)開放解決方案,攻克政務(wù)數(shù)據(jù)開發(fā)開放過程中的數(shù)據(jù)安全和隱私保護(hù)問題,實(shí)現(xiàn)跨部門數(shù)據(jù)的融合共享及開發(fā)利用,充分發(fā)揮政務(wù)數(shù)據(jù)資產(chǎn)的價(jià)值。
關(guān)鍵詞:多方安全計(jì)算;政務(wù)數(shù)據(jù)開發(fā)開放;數(shù)據(jù)資產(chǎn)目錄;數(shù)據(jù)產(chǎn)品;聯(lián)合模型
中圖分類號(hào):TP309;TP311.13 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)23-0144-03
A New Design for Opening and Development Model of Government Affair Data
——A Multi-Party Secure Computing Design Scheme to Solve the Difficult Problem for Developing and Opening of Government Affair Data
WU Min
(Fujian Nebula Big Data Application Service Co.,Ltd.,F(xiàn)uzhou ?350003,China)
Abstract:In view of the obstacles and problems existing in opening and sharing of government affair data at present,this paper proposes to apply multi-party secure computing technology to the opening and sharing domain of government affair data,designs a new opening and development model of government affair data,and designs an opening and development solution of government affair data based on multi-party secure computing from three aspects of government affair data aggregation and sharing,opening and development,and data trading market development. It solves the problems of data security and privacy protection in the process of opening and development of the government affair data,realizes the integration,sharing,development and utilization of data across multiple departments,and plays fully the value of government affair data assets.
Keywords:secure multi-party computation;opening and development of government affair data;data asset catalog;data product;joint model
0 ?引 ?言
2020年4月,中共中央、國務(wù)院印發(fā)《關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》,首次將數(shù)據(jù)同土地、勞動(dòng)力、資本、技術(shù)等傳統(tǒng)要素并列作為新生產(chǎn)要素,并明確要求“推進(jìn)政府?dāng)?shù)據(jù)開放共享”。中國80%以上的數(shù)據(jù)資源掌握在各級政府部門手里,發(fā)揮數(shù)據(jù)的應(yīng)用價(jià)值離不開政府?dāng)?shù)據(jù)的開放共享。政府?dāng)?shù)據(jù)的開放共享程度和數(shù)據(jù)的開放共享管理機(jī)制直接影響到數(shù)據(jù)利用效果,進(jìn)而影響社會(huì)經(jīng)濟(jì)的整體利益最大化。但是當(dāng)前的政務(wù)數(shù)據(jù)開發(fā)開放還停留在初級階段,出現(xiàn)諸多難題阻礙了政務(wù)數(shù)據(jù)開發(fā)開放工作的順利進(jìn)行,成為我國實(shí)施大數(shù)據(jù)戰(zhàn)略、發(fā)展數(shù)字經(jīng)濟(jì)的最大桎梏。
1 ?政務(wù)數(shù)據(jù)開發(fā)開放存在的問題
當(dāng)前,政務(wù)數(shù)據(jù)開發(fā)開放成為電子政務(wù)信息化建設(shè)的熱點(diǎn),推進(jìn)政務(wù)數(shù)據(jù)開發(fā)開放,是加快培育數(shù)據(jù)要素市場,推進(jìn)政府?dāng)?shù)據(jù)開放共享、提升社會(huì)數(shù)據(jù)資源價(jià)值、加強(qiáng)數(shù)據(jù)資源整合和安全保護(hù)的重要途徑。當(dāng)前,政務(wù)數(shù)據(jù)開放工作還面臨一些問題、存在一些挑戰(zhàn):
(1)政務(wù)數(shù)據(jù)開發(fā)開放缺少數(shù)據(jù)基礎(chǔ)。政府原有的信息管理系統(tǒng)主要是國家的金稅、金關(guān)、金財(cái)、金審、金盾等“金字”信息工程以及各部門自建的信息管理系統(tǒng),由于組織管理體制的條塊化,決定了業(yè)務(wù)系統(tǒng)的條塊化,形成一個(gè)一個(gè)“信息壁壘”,客觀上造成數(shù)據(jù)共享障礙。
(2)數(shù)據(jù)所有權(quán)和使用權(quán)無法分離。當(dāng)前,將初級數(shù)據(jù)掛在政府網(wǎng)站或者直接提供給企業(yè)、社會(huì)的政務(wù)數(shù)據(jù)共享方式,在企業(yè)和社會(huì)獲得了政務(wù)數(shù)據(jù)使用權(quán)的同時(shí)也就相當(dāng)于獲得了政務(wù)數(shù)據(jù)的所有權(quán),導(dǎo)致政府難以管控開發(fā)開放出去的初級數(shù)據(jù)的使用范圍、用途、用量和有效期,使政務(wù)數(shù)據(jù)的開發(fā)開放受到嚴(yán)重制約。
(3)數(shù)據(jù)開放技術(shù)存在不足。當(dāng)前在數(shù)據(jù)處理方面,存在數(shù)據(jù)格式和質(zhì)量參差不齊、沒有統(tǒng)一的標(biāo)準(zhǔn)等問題,導(dǎo)致數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)分類不清晰、數(shù)據(jù)更新不及時(shí)、數(shù)據(jù)格式不規(guī)范;另外,開放數(shù)據(jù)平臺(tái)功能相對簡單,數(shù)據(jù)互操作功能和個(gè)性化服務(wù)、可視化服務(wù)等功能不完善,未能滿足使用者需求。
(4)個(gè)人隱私保護(hù)造成數(shù)據(jù)不流通。個(gè)人數(shù)據(jù)正在成為一種新的資產(chǎn),政府機(jī)構(gòu)對其持有的個(gè)人數(shù)據(jù)必須給予充分的保護(hù),以對抗黑客的信息竊取,但隱私政策使得數(shù)據(jù)在政府部門之間難以流通,政府部門難以利用分散的個(gè)人信息來進(jìn)行分析,提供決策支持。
因此,目前亟須一個(gè)覆蓋從政務(wù)數(shù)據(jù)共享到政務(wù)數(shù)據(jù)開發(fā)開放,既能保護(hù)數(shù)據(jù)隱私又能實(shí)現(xiàn)數(shù)據(jù)流動(dòng)起來最大化其價(jià)值的解決方案。
2 ?多方安全計(jì)算技術(shù)可行性論證
多方安全計(jì)算(Secure Multi-Party Computation,MPC),
是一種保護(hù)數(shù)據(jù)安全隱私的多方計(jì)算算法,主要解決無可信第三方的情況下,如何安全地計(jì)算一個(gè)約定函數(shù)的問題。在整個(gè)計(jì)算協(xié)議執(zhí)行過程中,每一個(gè)物理隔離的參與方對己方數(shù)據(jù)始終擁有控制權(quán),數(shù)據(jù)在不泄露的情況下聯(lián)合其他各方的數(shù)據(jù)進(jìn)行計(jì)算并得到明文計(jì)算結(jié)果,并且參與各方拿到計(jì)算結(jié)果后也無法推斷出其他參與方的原始數(shù)據(jù)。
安全多方計(jì)算經(jīng)過多年的發(fā)展和研究,技術(shù)和應(yīng)用上都比較成熟。安全多方計(jì)算效率已初見成效,行業(yè)中涌現(xiàn)了大批的多方安全計(jì)算平臺(tái),比較出名的有阿里系螞蟻集團(tuán)的螞蟻鏈摩斯多方安全計(jì)算平臺(tái)、百度系百度安全的MesaTEE安全計(jì)算平臺(tái)等等。
采用多方安全計(jì)算的優(yōu)勢有以下幾點(diǎn):
(1)保護(hù)數(shù)據(jù)隱私。用戶將計(jì)算節(jié)點(diǎn)部署到本地,多方安全計(jì)算平臺(tái)作為代理,節(jié)點(diǎn)間通過代理進(jìn)行加密通信。各個(gè)計(jì)算節(jié)點(diǎn)在數(shù)據(jù)和模型不離開本地的前提下,協(xié)同進(jìn)行模型更新和迭代。整個(gè)計(jì)算過程無私密數(shù)據(jù)的明文信息或原始數(shù)據(jù)集的傳播。
(2)打破部門壁壘。公安、人社、醫(yī)療等政府部門各自建設(shè)的信息化系統(tǒng)在為各部門工作帶來便利的同時(shí)也形成各行業(yè)數(shù)據(jù)孤島。多方安全計(jì)算使得各部門在保證自身私密信息不泄露的前提下,安全利用跨行業(yè)的數(shù)據(jù)資源,為本部門創(chuàng)造更大的價(jià)值。
(3)模型訓(xùn)練與預(yù)測分析。使用MPC技術(shù)將多方數(shù)據(jù)聯(lián)合在一起,通過MPC預(yù)處理保證數(shù)據(jù)格式統(tǒng)一和數(shù)據(jù)的隱私性,在多方數(shù)據(jù)基礎(chǔ)上訓(xùn)練出的模型將更加準(zhǔn)確,從而對未知情形提供更加合理的預(yù)測。
3 ?應(yīng)用于政務(wù)數(shù)據(jù)開發(fā)開放的多方安全計(jì)算解決方案設(shè)計(jì)
福建省星云大數(shù)據(jù)公司于2020年規(guī)劃分布式超融合大數(shù)據(jù)運(yùn)營總體框架并依據(jù)此框架規(guī)劃了數(shù)據(jù)資源中心產(chǎn)品,目前產(chǎn)品正在不斷研發(fā)迭代過程中。筆者在公司主要負(fù)責(zé)以數(shù)據(jù)為核心的行業(yè)應(yīng)用規(guī)劃和頂層設(shè)計(jì)工作,在分布式超融合大數(shù)據(jù)運(yùn)營總體框架規(guī)劃過程中,提出用多方安全計(jì)算框架破解政務(wù)數(shù)據(jù)開發(fā)開放難題,并研究設(shè)計(jì)了應(yīng)用于政務(wù)數(shù)據(jù)開發(fā)開放的多方安全計(jì)算解決方案。
3.1 ?基于多方安全計(jì)算的政務(wù)數(shù)據(jù)匯聚共享體系設(shè)計(jì)
政務(wù)數(shù)據(jù)匯聚共享中采用多方安全計(jì)算整體解決方案,解決傳統(tǒng)的政務(wù)數(shù)據(jù)匯聚共享數(shù)據(jù)必須“拷貝搬家,數(shù)據(jù)存儲(chǔ)多套”的做法,在確保數(shù)據(jù)不離開部門的前提下,充分整合數(shù)據(jù),實(shí)現(xiàn)跨多部門數(shù)據(jù)的融合共享以及開發(fā)利用,實(shí)現(xiàn)“1+1>2”的效果。該方案可以有效解決政務(wù)數(shù)據(jù)匯聚共享中的難點(diǎn),即滿足部門數(shù)據(jù)安全性、敏感性不離部門管轄要求,又能充分整理利用數(shù)據(jù)價(jià)值,并為下一步的政務(wù)數(shù)據(jù)開發(fā)開放奠定基礎(chǔ)。整體架構(gòu)模型如圖1所示。
在每個(gè)行業(yè)部門建設(shè)行業(yè)數(shù)據(jù)資源中心,部署行業(yè)多方安全計(jì)算(MPC)節(jié)點(diǎn),負(fù)責(zé)對接省級多方安全計(jì)算(MPC)樞紐節(jié)點(diǎn),接收樞紐節(jié)點(diǎn)發(fā)布的模型,執(zhí)行模型訓(xùn)練任務(wù),形成數(shù)據(jù)產(chǎn)品反饋給樞紐節(jié)點(diǎn)。MPC安全節(jié)點(diǎn)還負(fù)責(zé)對接行業(yè)部門業(yè)務(wù)系統(tǒng),具備實(shí)時(shí)從業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)的能力,參與模型訓(xùn)練的數(shù)據(jù)可以實(shí)時(shí)從相關(guān)業(yè)務(wù)系統(tǒng)獲得。
在省級數(shù)據(jù)資源中心建設(shè)多方安全計(jì)算(MPC)樞紐節(jié)點(diǎn),包括數(shù)據(jù)資產(chǎn)目錄、模型發(fā)布管理、聯(lián)合模型訓(xùn)練、數(shù)據(jù)產(chǎn)品管理、產(chǎn)品績效管理等方面功能。數(shù)據(jù)資產(chǎn)目錄,負(fù)責(zé)整合各個(gè)行業(yè)數(shù)據(jù)資源中心的數(shù)據(jù)資源目錄,形成省級數(shù)據(jù)資源目錄,省級數(shù)據(jù)資源目錄包括初級數(shù)據(jù)目錄和數(shù)據(jù)產(chǎn)品目錄,在此基礎(chǔ)上對初級數(shù)據(jù)和數(shù)據(jù)產(chǎn)品進(jìn)行賦權(quán)形成數(shù)據(jù)資產(chǎn)目錄,理清省級政務(wù)數(shù)據(jù)的家底,為下一步的政務(wù)數(shù)據(jù)資產(chǎn)開放目錄建設(shè)奠定基礎(chǔ)。模型發(fā)布管理,負(fù)責(zé)生成并發(fā)布數(shù)據(jù)模型到相關(guān)的行業(yè)MPC安全節(jié)點(diǎn)。聯(lián)合模型訓(xùn)練,負(fù)責(zé)整合多個(gè)行業(yè)MPC模型訓(xùn)練成果,修訂參數(shù),完善模型,形成數(shù)據(jù)產(chǎn)品。數(shù)據(jù)產(chǎn)品管理,對MPC樞紐節(jié)點(diǎn)運(yùn)行生成數(shù)據(jù)產(chǎn)品進(jìn)行賦權(quán)、登記、發(fā)布等方面的管理。產(chǎn)品績效管理即對數(shù)據(jù)產(chǎn)品的應(yīng)用情況,各個(gè)行業(yè)MPC貢獻(xiàn)情況進(jìn)行管理,為下一步的數(shù)據(jù)產(chǎn)品運(yùn)營收入分成奠定基礎(chǔ)。
3.2 ?基于多方安全計(jì)算的政務(wù)數(shù)據(jù)開發(fā)開放體系設(shè)計(jì)
政務(wù)數(shù)據(jù)開發(fā)開放作為政務(wù)數(shù)據(jù)價(jià)值實(shí)現(xiàn)的主要方式,應(yīng)在確保國家利益、公共安全、商業(yè)秘密、個(gè)人隱私等重要數(shù)據(jù)安全的前提下,破解公共數(shù)據(jù)資源開發(fā)利用體制機(jī)制障礙,主動(dòng)釋放政務(wù)數(shù)據(jù)資源的經(jīng)濟(jì)價(jià)值和社會(huì)價(jià)值,釋放更多數(shù)據(jù)紅利,有效推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。基于多方安全計(jì)算框架可以有效支撐政務(wù)數(shù)據(jù)開發(fā)開放,其整體業(yè)務(wù)邏輯如圖2所示。
省級政務(wù)數(shù)據(jù)開發(fā)開放平臺(tái)部署在互聯(lián)網(wǎng)上,負(fù)責(zé)發(fā)布開放數(shù)據(jù)資產(chǎn)目錄、開放數(shù)據(jù)產(chǎn)品管理、模型發(fā)布管理、聯(lián)合模型訓(xùn)練、產(chǎn)品計(jì)費(fèi)管理等功能。開放數(shù)據(jù)資產(chǎn)目錄,列出可以開放的初級數(shù)據(jù)和數(shù)據(jù)產(chǎn)品目錄,根據(jù)“政務(wù)數(shù)據(jù)可用不可見”的要求,可以開放的初級數(shù)據(jù)也不允許以數(shù)據(jù)的形式直接提供給企業(yè),需要加工成數(shù)據(jù)產(chǎn)品后方可提供。開放數(shù)據(jù)產(chǎn)品管理,對MPC開放節(jié)點(diǎn)運(yùn)行生成數(shù)據(jù)產(chǎn)品進(jìn)行賦權(quán)、登記、發(fā)布等方面的管理。模型發(fā)布管理,企業(yè)可以在MPC開發(fā)開放節(jié)點(diǎn)上研發(fā)、測試和發(fā)布數(shù)據(jù)分析模型。
企業(yè)根據(jù)MPC開發(fā)開放節(jié)點(diǎn)上的開放數(shù)據(jù)資產(chǎn)目錄結(jié)合MPC企業(yè)節(jié)點(diǎn)的企業(yè)數(shù)據(jù)資產(chǎn)目錄設(shè)計(jì)數(shù)據(jù)分析模型,并將數(shù)據(jù)分析模型在MPC開發(fā)開放節(jié)點(diǎn)上開發(fā)、部署和發(fā)布。MPC開發(fā)開放節(jié)點(diǎn)將發(fā)布的數(shù)據(jù)分析模型分別發(fā)往MPC樞紐節(jié)點(diǎn)和MPC企業(yè)節(jié)點(diǎn)。MPC樞紐節(jié)點(diǎn)和MPC企業(yè)節(jié)點(diǎn)收到模型后,根據(jù)模型匹配自身數(shù)據(jù)進(jìn)行訓(xùn)練,將訓(xùn)練所得參數(shù)提交到MPC開發(fā)開放節(jié)點(diǎn)。MPC開發(fā)開放節(jié)點(diǎn)將兩方(也可以是多方)的參數(shù)進(jìn)行聯(lián)合訓(xùn)練,輸出訓(xùn)練結(jié)果,形成數(shù)據(jù)產(chǎn)品,提供給企業(yè)。企業(yè)可以根據(jù)輸出的數(shù)據(jù)產(chǎn)品開展經(jīng)營活動(dòng)。
3.3 ?基于多方安全計(jì)算的數(shù)據(jù)開發(fā)開放市場發(fā)展模式設(shè)計(jì)
采用多方安全計(jì)算框架(MPC)進(jìn)行政府、企業(yè)多方數(shù)據(jù)融合分析挖掘的過程中,能確保政務(wù)數(shù)據(jù)不出政務(wù)網(wǎng),企業(yè)數(shù)據(jù)不出企業(yè)的數(shù)據(jù)資源中心,物理上隔離了參與方的初級數(shù)據(jù)的傳遞,為數(shù)據(jù)使用的數(shù)據(jù)確權(quán)問題奠定技術(shù)基礎(chǔ),使數(shù)據(jù)的所有權(quán)和使用權(quán)可以實(shí)現(xiàn)分離,從而具備了將政務(wù)數(shù)據(jù)作為一種重要資產(chǎn)在數(shù)據(jù)市場上進(jìn)行交易的條件,也為政務(wù)數(shù)據(jù)開發(fā)開放鋪平了道路?;贛PC開放開發(fā)節(jié)點(diǎn),政府部門可以規(guī)定開放政務(wù)數(shù)據(jù)的用途、用量、有效期等使用屬性,企業(yè)在拿到MPC輸出的數(shù)據(jù)產(chǎn)品后只能在授權(quán)范圍內(nèi)合理地使用數(shù)據(jù),并能夠?qū)?shù)據(jù)產(chǎn)品的使用權(quán)再次轉(zhuǎn)讓給第三人。多方安全計(jì)算框架(MPC)應(yīng)用于政務(wù)數(shù)據(jù)開發(fā)開放上將極大提升政務(wù)數(shù)據(jù)開發(fā)開放的水平,將政務(wù)數(shù)據(jù)開發(fā)、開放、交易的本質(zhì)由數(shù)據(jù)所有權(quán)轉(zhuǎn)移轉(zhuǎn)向數(shù)據(jù)使用權(quán)授權(quán),重構(gòu)政務(wù)數(shù)據(jù)交易模式,從而有效遏制初級政務(wù)數(shù)據(jù)泄漏,降低政務(wù)數(shù)據(jù)泄漏引起的數(shù)據(jù)流通風(fēng)險(xiǎn)。
4 ?結(jié) ?論
發(fā)展數(shù)字經(jīng)濟(jì)要加快推進(jìn)政務(wù)數(shù)據(jù)資產(chǎn)化,政務(wù)數(shù)據(jù)資產(chǎn)化、資本化是數(shù)字經(jīng)濟(jì)發(fā)展的必然趨勢,數(shù)據(jù)財(cái)政將成為驅(qū)動(dòng)政府開發(fā)政務(wù)數(shù)據(jù)資源主要力量。采用多方安全計(jì)算框架(MPC)可以加快推進(jìn)政務(wù)數(shù)據(jù)資產(chǎn)化,推動(dòng)建立數(shù)據(jù)的產(chǎn)權(quán)規(guī)則和數(shù)據(jù)要素市場體系,方便政務(wù)數(shù)據(jù)資源進(jìn)行確權(quán)、定價(jià),妥善解決政務(wù)數(shù)據(jù)開發(fā)開放過程中的難題,快速建設(shè)政務(wù)數(shù)據(jù)開發(fā)開放體系。
參考文獻(xiàn):
[1] 新華社.中共中央 ?國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見 [J].中華人民共和國國務(wù)院公報(bào),2020(11):5-8.
[2] 孟顯印,楊超.我國開放政府?dāng)?shù)據(jù)應(yīng)用開發(fā)的現(xiàn)狀與問題 ——基于開放政府?dāng)?shù)據(jù)平臺(tái)的分析 [J].情報(bào)雜志,2020,39(3):163-171+197.
[3] 王婷.安全多方計(jì)算理論研究綜述 [J].信息安全與技術(shù),2014,5(5):41-44.
[4] 蘇冠通,徐茂桐.安全多方計(jì)算技術(shù)與應(yīng)用綜述 [J].信息通信技術(shù)與政策,2019(5):19-22.
[5] 邵曉紅.政府?dāng)?shù)據(jù)開放的概念辨析、公共價(jià)值和先進(jìn)實(shí)踐 [J].通信與信息技術(shù),2020(3):76-78.
作者簡介:吳敏(1985—),女,漢族,福建寧德人,中級工程師,本科,研究方向:政府信息化頂層規(guī)劃與信息系統(tǒng)設(shè)計(jì)。