陳言勝
近日,為進一步加速推動我國數據智能轉型進程,推動“十四五”期間數據智能產業(yè)交流與合作,由中國信息通信研究院、中國通信標準化協會指導,中國通信標準化協會大數據技術標準推進委員會(CCSA TC601)主辦的2022大數據產業(yè)峰會在京召開。在峰會主論壇上,中國信通院云大所所長何寶宏發(fā)布了《2022大數據十大關鍵詞》,本年度十大關鍵詞涉及數據從計算機語言到成為生產要素的全生命周期。
數據庫作為支撐數據存儲、計算的核心技術產品,為了適應數據要素相關需求,正快速進行技術革新。
一方面AI數據庫、Serverless云原生數據庫推動對于數據的價值挖掘從“陽春白雪”變?yōu)椤跋吕锇腿恕?,利用數據不再是金融、電信等數據密集型行業(yè)的特色,而是變成全社會、全行業(yè)的普適性行為。這導致數據的加工利用過程需要更加平民化、高效化。AI數據庫具備自動運維、智能開發(fā)等能力,Serverless云原生數據庫具備按量計費、彈性擴容等能力,均可實現數據加工利用過程的降本增效,正成為甲骨文、亞馬遜、阿里、華為等巨頭供應商的研發(fā)熱點。
另一方面防篡改數據庫、全密態(tài)數據庫支撐數據完成高效確權定價、便捷合規(guī)流通。防篡改數據庫在高效存儲計算基礎上,提供數據防篡改和操作防篡改功能,從而支撐數據確權定價。全密態(tài)數據庫能夠實現數據在加密狀態(tài)下的高效存儲和計算,從而支撐數據合規(guī)流通。二者均成為MIT等學術機構的研究熱點,以及華為、阿里等供應商的研發(fā)熱點。
圖數據與傳統行列式數據不同,通過點、邊模型,高效描述實體、屬性和關系的數據模型,近年來被廣泛用于企業(yè)智能營銷風控等必要數據應用中。隨著行業(yè)數據智能轉型的深入,圖數據在數據總量中的比例也正在快速上升。
Gartner預計,到2025年圖技術在數據和分析創(chuàng)新中的占比將從2021年的10 %上升到80 %。隨著圖數據規(guī)模的變大,開啟了圖數據的大數據時代,起源于80年代的傳統關系型數據庫,以及起源于2000年左右的專用圖數據庫已經無法支撐大規(guī)模圖數據的高效存儲與計算。圖計算平臺通過抽象計算層和集成層,在圖數據庫基礎上增強了兼容性和大規(guī)模數據計算能力,實現了多種存儲介質中圖數據的高效匯聚以及多跳情況下的復雜計算能力。目前該領域政策扶持力度不斷加大,開源體系發(fā)展迅猛,商用產品層出不窮,從而快速支撐了圖數據這一重要要素類型的價值釋放。
隨著企業(yè)數字化轉型的加深,數據相關系統、組織逐漸復雜、冗余,壁壘逐漸增多。為在組織或企業(yè)內部構建一套可復用的數據和分析能力,減少數據本身及相關技術架構的冗余,打通不同系統數據間的壁壘,數據中臺應運而生。其理論體系從發(fā)展初期的百家爭鳴,逐漸聚焦和明確,并在業(yè)內達成共識,即數據中臺構建了數據資源與業(yè)務價值間的骨干網,是企業(yè)數智化轉型的核心引擎。
近年來,由于數字化轉型政策的持續(xù)推動,數據中臺發(fā)展迅猛,Gartner在成熟度曲線中將其標記為期望值最高。國內該領域供給側迅速發(fā)展、供應商不斷豐富,除概念提出者阿里巴巴外,華為、騰訊、網易、星環(huán)等大數據企業(yè)紛紛入場。應用側相關落地案例迅速增多,中國移動、中國聯通、工商銀行、農業(yè)銀行等大型央企、金融機構以及各地方政府紛紛立項招標,并形成自身實踐案例。
DCMM是我國數據管理領域的首個國家標準,為企業(yè)數據管理工作提供客觀的評價依據,指導企業(yè)體系化構建數據管理框架、持續(xù)優(yōu)化數據管理能力。
經過近3年的發(fā)展,DCMM已得到廣泛認可,貫標評估的工作成效正加速顯現。在數據要素統一大市場的培育過程中,DCMM貫標評估可以提升各類市場主體的數據能力和數據活力,彌合地區(qū)間差異、拉齊行業(yè)間水平,擴大數據資源優(yōu)質供給,從而提高數據要素流通效率,引導數據資源的高效積累和有序聚集。
為持續(xù)推動企業(yè)數據管理能力提高,工信部印發(fā)“企業(yè)數據管理國家標準貫標工作方案”,全國各地配套產業(yè)補貼政策,推動重點地區(qū)、重點行業(yè)的貫標評估工作,預計到2025年,貫標評估企業(yè)超1萬家,宣貫培訓人員超15萬人。
數據估值探索歷程伴隨著企業(yè)數字化轉型的發(fā)展而發(fā)展。Gartner于2015年提出信息價值評價框架,從信息內在價值、信息商業(yè)價值、信息績效價值、信息成本價值、信息市場價值和信息經濟價值六大維度進行衡量。但是,這一框架多停留在理念層面,僅明確了主要影響因子,未提出具體的測算指標和方法。
中國企業(yè)的全面數字化轉型大致始于2015年,然后在2017年后進入爆發(fā)期。企業(yè)在意識到數據價值的同時,投入了巨大的人力、物力和財力,因此,亟需一套估值指標清晰量化數據價值,評價數字化轉型的成效。自2021年初起,光大銀行、南方電網、浦發(fā)銀行等企業(yè)陸續(xù)進行數據估值的研究與實踐。
但是同時也應認識到,數據估值仍處于發(fā)展初期,估值目的、估值框架有待在具體場景中探索驗證。在分析業(yè)界數據估值的成果后,認為可以將數據產品作為估值對象。而估值實際上是在衡量數據對于業(yè)務發(fā)展貢獻的間接經濟價值,以及將數據視為商品進行交易獲得的直接經濟收益。因此,數據估值是一項涵蓋了數據管理、數據應用、數據交易和AI建模的綜合性工作。
DataOps的概念最早在2014年由國外學者提出,隨后業(yè)界逐步對其內涵進行補充。其在2018年正式被納入Gartner的數據管理技術成熟度曲線當中,由此進入了國際的視野當中。
2022年中國信通院正式牽頭啟動了DataOps的標準建設工作,以此為基礎推動我國大數據產業(yè)的多元化發(fā)展。DataOps作為協助企業(yè)完成數智化轉型的良藥,供給側和需求側都在爭相嘗鮮。
廠商中,諸如騰訊、阿里、亞信、海南數造等公司紛紛采納DataOps的理念構建新一代數據研發(fā)工具平臺。企業(yè)中的一些頭部機構,例如工商銀行、農業(yè)銀行、中國移動等也在對DataOps進行實踐,并取得了不小的成果。在標準化方面,2022年信通院牽頭聯合各行業(yè)30余家單位開展標準制定工作。標準包括了7個模塊25個環(huán)節(jié),旨在推動我國數據文化扎實發(fā)展。
2022年是隱私計算落地應用元年,多個場景應用加速落地,隱私計算一體機為應用開辟新路徑。
一是作為軟硬結合一體的專用設備,利用硬件特性增強軟件實現方案,其安全加固、性能加速和易用性增強的三大優(yōu)勢,使得隱私計算一體機從眾多工程優(yōu)化方案中脫穎而出,降低了用戶的使用技術門檻和綜合成本。
二是一體機的技術實現方式不唯一,各家產品百花齊放,可基于可信硬件或加密卡,同時利用計算加速卡或網絡加速卡,也可預裝應用服務場景組件,組合方案多樣化。多硬件多角度組合提升成為軟硬結合發(fā)展趨勢,并在金融政務醫(yī)療等場景嶄露頭角。
三是產品形態(tài)多樣,標準化需求迫切,國內外已有多個標準帶頭規(guī)范技術研發(fā)和應用。但也值得注意,并非僅有隱私計算一體機可以突破應用瓶頸,擴大應用規(guī)模,面對數據安全流通巨大的需求,仍要繼續(xù)探索更多好用易用的落地方案。
2022年年初,十四五數字經濟規(guī)劃、要素市場化配置改革方案2份文件對數據要素的專門布局,讓數據要素領域的探索再掀熱潮,政策推進、產業(yè)實踐都在不斷深入、不斷創(chuàng)新。
一是頂層設計逐步細化,國家站在全國統一大市場的高度對數據要素發(fā)展做出安排,又針對深圳示范區(qū)的數據要素市場準入做出具體部署,數據基礎制度體系建設也在加快推進。二是地方法規(guī)陸續(xù)出臺,目前已有19個省市公布了相關數據條例,以促進數據利用和產業(yè)發(fā)展為基本定位,多以公共數據為抓手,結合地方實際和特色進一步激發(fā)市場主體活力。三是交易模式不斷創(chuàng)新,各地數據交易所優(yōu)化經營結構,貴陽制定交易規(guī)則、上海建設數商體系、深圳打造開源社區(qū)等探索讓數據交易有了更實在的依托。
但是我們離數據要素價值的充分釋放還很遠,數據權屬、定價的共識還未建立,數據泄露、越權濫用等問題加劇人們的不信任感。如何建立有效的規(guī)則體系和監(jiān)管機制,如何利用前沿技術破解難題,仍需政產學研用各界共同發(fā)力。
隨著2021年兩法的頒布實施,各行各業(yè)的數據安全監(jiān)管力度不斷加強,合規(guī)工作也邁入新的階段。首先,為了正確理解監(jiān)管內容,有效落實監(jiān)管要求,各行各業(yè)廣泛掀起了政策法規(guī)的學習浪潮;其次,數據分類分級作為數據安全領域的重要工作,也是實現精細化安全管理的必要能力,同樣成為這一輪學習熱潮的重點關注對象;再次,為推動本行業(yè)企業(yè)數據安全的貫徹落實,部分行業(yè)主管單位啟動監(jiān)管報送工作;最后,在供應側市場,部分企業(yè)開始著手開發(fā)合規(guī)管理工具,以協助需求方實現監(jiān)管應對的自動化實現。
數據分類分級作為數據安全工作的基礎內容,是數據安全精細化管理的必要前提,需要在數據安全治理工程中率先落地。
首先,分類分級作為《數據安全法》明確提到的概念之一,引起地方、行業(yè)、企業(yè)的研究探討,并逐漸形成從建立組織保障到落實對應級別數據安全管控策略的“七步走”方法論共識。
其次,為指導企業(yè)分類分級工作的推進落實,各行業(yè)通過制定標準規(guī)范,明確分類分級工作的原則、方法、定義,進一步細化相關要求。
最后,自動化分類分級工具或咨詢服務在數據安全供方市場蓬勃發(fā)展。據中國信通院“可信數安”評估體系統計,2022年分類分級工具或服務的參評企業(yè)從2021年的4項增加至14項。