縱覽數(shù)據(jù)全貌,由組織數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)構成的大體量、多類型、高實時、自生長的大數(shù)據(jù)作為生產(chǎn)要素,有效整合了多維海量的數(shù)據(jù)資源。
—浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司總經(jīng)理徐宏偉
當前,發(fā)展新基建已成為國家戰(zhàn)略部署重點,而大數(shù)據(jù)對新基建發(fā)展有著重要的作用,不管是在5G、大數(shù)據(jù)中心,還是人工智能、工業(yè)互聯(lián)網(wǎng)等領域,大數(shù)據(jù)企業(yè)都扮演著重要的角色。在大數(shù)據(jù)領域,我們主要圍繞三個數(shù)據(jù)要素,即企業(yè)內(nèi)部數(shù)據(jù)、消費互聯(lián)網(wǎng)的數(shù)據(jù)、工業(yè)互聯(lián)網(wǎng)的數(shù)據(jù)進行研究。
具體來看,浪潮卓數(shù)圍繞著數(shù)據(jù)在五個方面進行了探索:數(shù)據(jù)資源、數(shù)據(jù)平臺建設、大數(shù)據(jù)應用、數(shù)據(jù)交易和數(shù)據(jù)流通、數(shù)據(jù)產(chǎn)業(yè)生態(tài)。我們還推出了大數(shù)據(jù)的操作系統(tǒng),通過與合作伙伴一起學習、完善,提高數(shù)據(jù)匯聚、集成、建模、互相交換的頻率。
我們認為大數(shù)據(jù)企業(yè)不需要與同業(yè)伙伴進行大范圍的競爭,因為在不同的領域,平臺的使用需求是不一樣的。在互聯(lián)網(wǎng)數(shù)據(jù)處理領域,平臺需要對大量數(shù)據(jù)進行并發(fā)處理并采集內(nèi)容;在政務領域,企業(yè)的需求主要圍繞著數(shù)據(jù)目錄的管理和數(shù)據(jù)標準體系的建設。不同的內(nèi)容有不同的解釋和含義,因此,數(shù)據(jù)平臺的建設應該是個性化、多樣化的,這樣才能滿足不同行業(yè)的需求。
為了解決數(shù)據(jù)來源的問題,我們建立了采集、使用數(shù)據(jù)的流程,即采集公開數(shù)據(jù)、服務宏觀決策、服務行業(yè)智庫、進行經(jīng)濟分析。我們采集的數(shù)據(jù)不涉及個人、企業(yè)的隱私數(shù)據(jù)。
對于一些涉及隱私的數(shù)據(jù),我們建立隱私保障體系。在建立了這個體系后,我們開始著手開發(fā)數(shù)據(jù)應用。由于爬蟲很難把互聯(lián)網(wǎng)的數(shù)據(jù)全部抓取,我們采用采樣的方式,抽取互聯(lián)網(wǎng)數(shù)據(jù)整體約50%~60%的樣本。基于這個樣本,我們利用一些算法和機器學習的技術進行全量預測,將得出的結果用于行業(yè)的宏觀分析。傳統(tǒng)的統(tǒng)計模式是對每個統(tǒng)計課題做一次調查,而由于我們收集了50%~60%的互聯(lián)網(wǎng)數(shù)據(jù)樣本,這個樣本可以完成很多課題,智庫、咨詢機構也可以直接通過分析這個樣本得出結果。
按照主管部門的委托,我們?yōu)檎块T提供數(shù)據(jù)統(tǒng)計和數(shù)據(jù)管理的支撐。我們曾在抗擊新冠肺炎疫情期間幫助商務部收集全國商品價格變化數(shù)據(jù),幫助其了解供需波動以及價格變化的趨勢;采集企業(yè)和個人征信牌照數(shù)據(jù);推廣工業(yè)互聯(lián)網(wǎng),采集互聯(lián)網(wǎng)數(shù)據(jù),通過產(chǎn)業(yè)鏈協(xié)同需求,不斷完善采集內(nèi)容。針對一些具體的企業(yè)數(shù)據(jù),我們建立了兩授權一服務機制。這個機制就是將管理者數(shù)據(jù)主體的數(shù)據(jù)通過單位的服務協(xié)議進行連接,并借助區(qū)塊鏈技術,形成相關的方案,保證數(shù)據(jù)做到“無授權不用”。
在企業(yè)信息數(shù)據(jù)領域也有很多大數(shù)據(jù)的應用場景,如查詢企業(yè)信用、企業(yè)評價等。浪潮主要聚焦于政府監(jiān)管領域,如國資監(jiān)管、招商部門、市場監(jiān)管部門、稅務監(jiān)管部門,通過分析這些數(shù)據(jù)產(chǎn)生的成果,建構信用模型算法,形成相關的數(shù)據(jù)體系。
在技術方面,為了拓展技術體系,我們開始把聯(lián)邦學習、對偶學習等技術列入使用清單。浪潮卓數(shù)的業(yè)務核心是把算法、技術連接在一起,形成相關的產(chǎn)品,如征信報告、風險判斷的技術和指標、銀行風控模型的把控、準入和反欺詐初期的評分和評比、精準營銷、貸后預警等。2019年我們已經(jīng)幫助12家銀行完成了這些業(yè)務內(nèi)容。2019年我們還通過算法解決了數(shù)據(jù)的可用可見問題。
浪潮卓數(shù)還提供了一些圍繞中小企業(yè)融資服務的解決方案,處理了來自政府、企業(yè)相關的數(shù)據(jù),協(xié)助96個城市小企業(yè)進行數(shù)字金融放貸。傳統(tǒng)的貸款業(yè)務營業(yè)額較少,但意義重大,浪潮卓數(shù)銜接的貸款產(chǎn)品大部分是這種來自銀行的普惠性產(chǎn)品,利率較低。但很多銀行需要建立一個線上化的貸款系統(tǒng),我們將這些業(yè)務銜接起來,幫助小型金融機構實現(xiàn)線上貸款。
下面介紹一下我們在數(shù)據(jù)流通領域的一個案例。從2019年開始,我們圍繞行業(yè)場景的數(shù)據(jù)流通交易體系進行探索,開展了基于電力數(shù)據(jù)的交易體系研究。電力行業(yè)與數(shù)據(jù)交易系統(tǒng)很像,電力是自然流動的交易系統(tǒng)。一些企業(yè)在價格相對便宜的時候買電,在用電高峰的時候減少自己的用電量。這個交易體系能天然地和數(shù)據(jù)銜接在一起。內(nèi)蒙電力和我們在這一領域進行了合作和探索,把售電和數(shù)據(jù)交易結合起來,在多風的內(nèi)蒙,按時段來看,由風能產(chǎn)生的電力,用戶早上9點買電可能10點才能使用,因此氣象數(shù)據(jù)非常有價值。但是由于很多氣象數(shù)據(jù)的采集要依托于電力設備、電力網(wǎng)絡,數(shù)據(jù)要沉淀到電網(wǎng)中,而電網(wǎng)又在政府監(jiān)管之下,我們不能輕易地把電網(wǎng)數(shù)據(jù)提取出來。數(shù)據(jù)安全合規(guī)和使用的問題還需要進一步探索。目前我們建立了一個交易體系,將相關的電力系統(tǒng)、風能設備、設備維護公司、相關的電力規(guī)劃研究院、氣象部門、氣象服務公司等一系列機構聚集在一起,形成了一個交易體系。這個項目目前還處于探索階段,沒有大規(guī)模地推廣,但是基本上形成了一個工作機制,進行數(shù)據(jù)的采集、數(shù)據(jù)的交易、相關數(shù)據(jù)的評估以及二次使用這些數(shù)據(jù)以支撐場景應用。
在這一領域還有很多方面需要研究,電力系統(tǒng)中還存在著很多待發(fā)掘、激活的數(shù)據(jù),如挖掘設備公司的設備數(shù)據(jù),這些都需要我們不斷地研究和探索。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)