◎ 文/劉永平
大數(shù)據(jù)視角下的產(chǎn)業(yè)安全監(jiān)管
◎ 文/劉永平
全球化背景下,競爭泛化遍及全球經(jīng)濟,時有競爭不可避免地演化為對抗,形成毒害世界經(jīng)濟的貿(mào)易摩擦現(xiàn)象。同時,產(chǎn)業(yè)的國際依存度日益提高,特別是金融危機尚未消散,全球同舟共濟成為共識。如此,“競合”成為全球化背景下產(chǎn)業(yè)競爭的總體走向。由于合作訴求的存在,抑制了競爭中的對抗,因而產(chǎn)業(yè)安全的基本特征就表現(xiàn)為低烈度對抗。對抗的早期發(fā)現(xiàn),及時救助調(diào)整,快速達成新的平衡,甚至將對抗消弭于萌芽時期,使競爭各方獲得最大公約數(shù),減少對經(jīng)濟的沖擊,被視為產(chǎn)業(yè)安全監(jiān)管的最高境界。對抗的早期發(fā)現(xiàn)和控制屬于政府產(chǎn)業(yè)安全的監(jiān)管范疇。政府監(jiān)管的效率則取決于監(jiān)管系統(tǒng)的數(shù)據(jù)化水平,在數(shù)據(jù)爆炸的時代,則取決于對大數(shù)據(jù)的處理能力。
產(chǎn)業(yè)安全監(jiān)管達到數(shù)據(jù)化水平的重要特征就是系統(tǒng)運行的自動化與即時響應(yīng)。數(shù)據(jù)化的系統(tǒng)具有自動聚集信息、自動響應(yīng)、自動反饋、自動解析問題、自主啟動救助程序的能力。但目前我國的產(chǎn)業(yè)安全政府監(jiān)管系統(tǒng)中實實在在存在著影響監(jiān)管系統(tǒng)數(shù)據(jù)化的缺陷。
1.數(shù)據(jù)孤島現(xiàn)象
個人、企業(yè)、政府部門在自我保護的目的下,或在技術(shù)約束下(結(jié)構(gòu)和非結(jié)構(gòu)),形成了一個個數(shù)據(jù)孤島,孤立的數(shù)據(jù)自然減少了組合的總量,人們對數(shù)據(jù)間的關(guān)系沒有了“聯(lián)想”,數(shù)據(jù)價值就失去了升值的潛力。
我國與產(chǎn)業(yè)安全相關(guān)的數(shù)據(jù)類型多樣、分布很廣。筆者僅從其獲取方式上,將其分為兩大類,傳統(tǒng)專業(yè)化統(tǒng)計類數(shù)據(jù)和公眾活動聚集類數(shù)據(jù)。
(1)傳統(tǒng)專業(yè)化統(tǒng)計類數(shù)據(jù),由兩大部分構(gòu)成。其一是以政府部門為主建立的數(shù)據(jù)庫,以政府部門主管的商會、協(xié)會、學(xué)會建立的信息數(shù)據(jù)庫以及由政府主導(dǎo)的各產(chǎn)業(yè)自發(fā)建立的分布極廣的大量數(shù)據(jù)庫。其共同特征是政府背景,采用一致的統(tǒng)計制度,共享程度較高;其二是以企業(yè)為主建立的數(shù)據(jù)庫,包括了企業(yè)內(nèi)部統(tǒng)計數(shù)據(jù)和社會專業(yè)盈利機構(gòu)收集加工的數(shù)據(jù)。其特征是信息龐雜,統(tǒng)計口徑多樣,受利益約束而共享化程度較低。
(2)公眾活動聚集類數(shù)據(jù),也由兩大部分構(gòu)成。其一是會議類數(shù)據(jù),提供的是信息加工機構(gòu)的解析信息。此類數(shù)據(jù)庫常見于政府、學(xué)術(shù)機構(gòu)、大專院校、公辦研究機構(gòu)舉辦的年度論壇和研討會。其特征是方向上有連續(xù)性,內(nèi)容上差異極大;其二是基于互聯(lián)網(wǎng)的公眾活動統(tǒng)計數(shù)據(jù)。其特征是數(shù)量巨大、結(jié)構(gòu)多樣,壟斷性高。
無論傳統(tǒng)和新型數(shù)據(jù),在利益和管理慣性的作用下,都被分割成一個個數(shù)據(jù)孤島。
2.數(shù)據(jù)單向輸出
無論傳統(tǒng)和新型數(shù)據(jù),都是單向交換,為傳統(tǒng)銷售型交換模式,極大地影響了數(shù)據(jù)公益性的發(fā)揮。問題產(chǎn)生的根本原因就是利益,數(shù)據(jù)統(tǒng)計單位為了保障利益,只能選擇一次性完成交易,這就形成一種守“數(shù)”待購的局面,影響了數(shù)據(jù)傳播的速度與廣度,數(shù)據(jù)的社會效益極低。問題產(chǎn)生的另一個原因就是安全,在安全的旗幟下,公益數(shù)據(jù)被利益化到局部。甚至在保密的要求下,需要用戶到現(xiàn)場拷貝。
在數(shù)據(jù)單向輸出的突破上,互聯(lián)網(wǎng)的公眾活動統(tǒng)計模式是個進步,能夠從公眾反饋中獲益。如從點擊率中發(fā)現(xiàn)客戶的傾向性、潛在需求,但不是統(tǒng)計的徹底進步。數(shù)據(jù)交互式輸出才是理念上的徹底突破,互聯(lián)網(wǎng)的魅力就是多對多,通過交互挖掘,活躍創(chuàng)新。
3.計算低效運行
數(shù)據(jù)孤島和單向輸出形成的數(shù)據(jù)格局,從根本上造成了數(shù)據(jù)中心林立的后果。獨立的中心,甚至只是一臺個人計算機的運轉(zhuǎn),必然是效率低、效能低、投入高。
當今是數(shù)據(jù)大爆炸時代,大到現(xiàn)有存取、運算、傳輸設(shè)備以及數(shù)理模型不能處理的程度。大數(shù)據(jù)理論的誕生,為的是從結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)、邏輯和非表面邏輯的數(shù)據(jù)中發(fā)現(xiàn)規(guī)律、預(yù)測未來。產(chǎn)業(yè)安全監(jiān)管數(shù)據(jù)依據(jù)的是大量經(jīng)貿(mào)數(shù)據(jù)。大而言之,人類的所有活動幾乎都商品化了,衣食住行、教育娛樂;小而言之,所有法人的經(jīng)貿(mào)生產(chǎn)活動產(chǎn)生的數(shù)據(jù),也都達到了大數(shù)據(jù)的量級,都是產(chǎn)業(yè)安全政府監(jiān)管的題中之義。尋求低成本、高速度、綠色的計算手段,是大數(shù)據(jù)時代實現(xiàn)產(chǎn)業(yè)安全監(jiān)管數(shù)據(jù)化的必然選擇。
1.多快好省的云計算
云計算是基于互聯(lián)網(wǎng)的超級計算模式,在遠程的數(shù)據(jù)計算中心,散布在互聯(lián)網(wǎng)上的成千上萬臺電腦和服務(wù)器連接成一片電腦云,實現(xiàn)了大規(guī)模資源整合。云計算具有計算速度快、專業(yè)水平高、一直在線、環(huán)保節(jié)能的優(yōu)勢。這些特征非常符合產(chǎn)業(yè)安全實時監(jiān)控的技術(shù)要求。
我國的云計算已進入實質(zhì)發(fā)展階段,除北京、上海、杭州、無錫、深圳五個試點城市外,各地云計算建設(shè)風起云涌,云計算理念深入人心,推動云計算的有形建設(shè)已沒有障礙。
云計算大開大合的數(shù)據(jù)處理特征,對中央政府在應(yīng)用、示范引導(dǎo)方面十分依賴。企業(yè)的逐利本性和生存壓力,決定了其無法完全開放自有數(shù)據(jù);區(qū)域、部門的行政機構(gòu)局限性大,一般收集不到海量數(shù)據(jù)來滿足云計算的經(jīng)濟規(guī)模,即使數(shù)據(jù)規(guī)模夠大,也無法構(gòu)成的大數(shù)據(jù),其權(quán)威性、安全性離不開中央政府的授權(quán)和監(jiān)管。而產(chǎn)業(yè)安全政府監(jiān)管的廣泛性和安全性的高端特征,正好能滿足云計算的需要。
2.已具規(guī)模的大數(shù)據(jù)
經(jīng)過多年發(fā)展,我國建立了大量的數(shù)據(jù)中心。數(shù)據(jù)中心可分為部門級數(shù)據(jù)中心、企業(yè)級數(shù)據(jù)中心、互聯(lián)網(wǎng)數(shù)據(jù)中心以及主機托管數(shù)據(jù)中心等。部門級數(shù)據(jù)中心以國家作后盾,實力最強。在中辦發(fā)布的《2006-2020年國家信息化發(fā)展戰(zhàn)略》中,專門強調(diào)重視數(shù)據(jù)中心災(zāi)難備份建設(shè),增強信息基礎(chǔ)設(shè)施和重要信息系統(tǒng)的抗毀能力和災(zāi)難恢復(fù)能力。電力行業(yè)、交通行業(yè)、保險行業(yè)、銀行業(yè)等的信息化“十二五”規(guī)劃當中,專門強調(diào)了要強化數(shù)據(jù)中心的基礎(chǔ)設(shè)施。在這些數(shù)據(jù)中心沉淀了大量數(shù)據(jù),特別是政府統(tǒng)計的數(shù)據(jù)含金量雖然較高,但開發(fā)不足。同時,公眾活動聚集類數(shù)據(jù)不斷生成,中國互聯(lián)網(wǎng)2011年年底持有的數(shù)據(jù)量1.9EB(1EB約等于4462個美國國會圖書館的數(shù)據(jù)存儲量),新浪微博每天上傳量超過1億條。另一個數(shù)據(jù)表明,截至2013年底,我國擁有6.18億互聯(lián)網(wǎng)用戶,手機用戶突破12億,互聯(lián)網(wǎng)和手機產(chǎn)生的數(shù)據(jù)正潮涌而來。隨著國人數(shù)據(jù)收集意識的增強,數(shù)據(jù)量會日益龐大。我國大數(shù)據(jù)所具備的量級規(guī)模,為將大數(shù)據(jù)管理引入產(chǎn)業(yè)安全監(jiān)管創(chuàng)造了條件。
3.成熟的數(shù)據(jù)挖掘術(shù)
大數(shù)據(jù)理論既是海量數(shù)據(jù)孕育的產(chǎn)物,又是海量數(shù)據(jù)的解決者。大數(shù)據(jù)挖掘術(shù)在提高計算速度、促進創(chuàng)新、提高預(yù)測水平方面,展現(xiàn)了無限的可能性。
常見的數(shù)據(jù)挖掘技術(shù)大致可歸結(jié)為關(guān)聯(lián)規(guī)則分析、分類和預(yù)測、聚類分析、推薦技術(shù)、鏈接分析、孤立點分析、數(shù)據(jù)演變分析等,這其中很多方法在大數(shù)據(jù)概念產(chǎn)生前使用已久,不僅在實踐中得到廣泛應(yīng)用,也給應(yīng)用方帶來了收益。
要想讓海量數(shù)據(jù)對產(chǎn)業(yè)安全監(jiān)管產(chǎn)生價值,先要把數(shù)據(jù)如水般蒸發(fā)到“云”上,“云”把數(shù)據(jù)帶到需要的地方,再把數(shù)據(jù)在“云”里加工成需要的“雨”。實施起來大致要分成三個方面:上“云”要進行技術(shù)規(guī)范、下什么“雨”要明確監(jiān)測對象,云來雨去要不受阻礙。
1.技術(shù)規(guī)范
要想大數(shù)據(jù)上“云”,統(tǒng)一技術(shù)標準是個基礎(chǔ)。否則,分散的數(shù)據(jù)無法凝聚成“云”,也就更不能成“雨”。
(1)制定標準,由政府來規(guī)定,數(shù)據(jù)持有者來完成。建立標準這是必須首先完成的,以往的信息是多介質(zhì)的信息,必須進行電子化,對入庫數(shù)據(jù)必須標準化、制式化才能進行加工比較。標準化的數(shù)據(jù)上傳,要由政府平臺歸集、調(diào)配資源。
(2)專業(yè)分類,由政府來規(guī)定,政府根據(jù)產(chǎn)業(yè)安全需要對數(shù)據(jù)進行理解。由數(shù)據(jù)中心進行歸類,完成對數(shù)據(jù)的粗淘,保證后續(xù)精加工數(shù)據(jù)具有實用性。
(3)建立模型,用于精煉數(shù)據(jù)。政府建立基準模型,處理商業(yè)價值極高的機密數(shù)據(jù);同時,政府免費提供工具或推薦模型引導(dǎo)社會從更廣的視野挖掘數(shù)據(jù),也接納社會創(chuàng)新模型。
(4)擴散成果,對大數(shù)據(jù)挖掘成果實施知識產(chǎn)權(quán)保護。政府主要將上傳成果用于公益事業(yè),但無權(quán)對外發(fā)布;如果社會對成果有商業(yè)需求,需與成果產(chǎn)出者協(xié)議購買。
2.監(jiān)測對象
監(jiān)測對象是某一時期,政府在浩瀚的大數(shù)據(jù)里重點關(guān)注的目標。因為社會化的監(jiān)測,熱點可能十分散亂,政府必須劃出一條主線,既是施政的目標,也是對社會挖掘數(shù)據(jù)的方向性指引。
當前產(chǎn)業(yè)安全監(jiān)測的對象主要包括:
(1)幼稚產(chǎn)業(yè),是經(jīng)濟增長的新動力,是后發(fā)國家追趕世界先進水平的加速器,重點要關(guān)注其價格、技術(shù)、專利方面的數(shù)據(jù)。
(2)戰(zhàn)略產(chǎn)業(yè),是經(jīng)濟實力的支柱,是穩(wěn)定、支持其他產(chǎn)業(yè)發(fā)展的基礎(chǔ),重點要關(guān)注其規(guī)模、增速、競爭方面的數(shù)據(jù)。
(3)規(guī)模產(chǎn)業(yè),是經(jīng)濟穩(wěn)定器,重點要關(guān)注其就業(yè)、稅收利潤情況,特別監(jiān)視該產(chǎn)業(yè)利潤率與社會平均利潤率的相對變化。
(4)跨國產(chǎn)業(yè),是產(chǎn)業(yè)安全的敏感地帶,需要全面關(guān)注技術(shù)、經(jīng)濟指標數(shù)據(jù)的變化,密切注意價格波動超過2%、數(shù)量波動超過3%時的情勢演變。
3.開放數(shù)據(jù)
大數(shù)據(jù)只有“全”才能言其大。數(shù)據(jù)規(guī)模達到一定程度,似乎都可以稱為大,事實則不然。大不一定容納事物的全部關(guān)系,但是“全”必然包含全部關(guān)系,才最有可能在千絲萬縷中揭示出事物的規(guī)律或作出預(yù)見性判斷。要做到“全”,必須開放,充分的開放數(shù)據(jù)是激發(fā)社會強大創(chuàng)新潛力的前提。
雖然,數(shù)據(jù)安全讓數(shù)據(jù)持有者很緊張,但大數(shù)據(jù)要做的是預(yù)測而不是保護本身。事實上,只要數(shù)據(jù)用于商業(yè)銷售,其安全性就是個偽命題。與其積“數(shù)”不化,何如與人共享,廣泛的參與度能夠孕育無盡的組合潛力,產(chǎn)生比“數(shù)”更有價值的預(yù)測結(jié)果。
從系統(tǒng)論、控制論角度觀察開放的另一層意義,由于公眾參與,使單向信息擴散有了良好的反饋機制,形成信息交互往來、往復(fù)修正的機理,徹底改變了數(shù)據(jù)單向輸出的低效率和被動性。2009年,門戶網(wǎng)站Data.gov上線,旨在全面開放美國聯(lián)邦政府擁有的數(shù)據(jù)。截至2011年12月,在這個政府主導(dǎo)的數(shù)據(jù)開放網(wǎng)站上,匯集了1140個應(yīng)用程序和軟件工具、85個手機插件。其中有近300個應(yīng)用程序由民間的程序員、公益組織自發(fā)開發(fā)。截至2012年11月,Data.gov統(tǒng)計的訪問客戶來源國家中,來自中國最多。一方面反映出我國公眾對大數(shù)據(jù)表現(xiàn)出的積極性,同時也說明我國對數(shù)據(jù)的開放程度還很不夠。
開放數(shù)據(jù)必須進行資源整合。由國家安全委員會牽頭,整合各部門資源,選擇云計算服務(wù)商,將數(shù)據(jù)放置云端。
開放數(shù)據(jù)應(yīng)是雙向開放終端。大數(shù)據(jù)是終端取勝的機制,終端數(shù)據(jù)上傳,會增加數(shù)據(jù)活性、及時性,通過建立企業(yè)報、行業(yè)審、國家規(guī)制的審查機制,入庫高品質(zhì)數(shù)據(jù)。云端數(shù)據(jù)下載,放手公眾參與,能夠最大限度獲取多重組合的觀察結(jié)果,將產(chǎn)業(yè)安全尚處萌芽中的隱患消弭于無形。
新技術(shù)革命的浪潮是實現(xiàn)信息化。只有對產(chǎn)業(yè)體系進行數(shù)據(jù)化,才能實現(xiàn)信息化。大數(shù)據(jù)、云計算、互聯(lián)網(wǎng)為信息化時代提供了技術(shù)基礎(chǔ),產(chǎn)業(yè)安全監(jiān)管的數(shù)據(jù)化居于社會信息化管理的塔尖,是信息化時代的縮影。推進產(chǎn)業(yè)安全監(jiān)管的數(shù)據(jù)化,是全球化、精細化管理產(chǎn)業(yè)的要求,也是對國際競爭低烈度對抗的現(xiàn)實回應(yīng)。
(作者單位:北京交通大學(xué))
編輯:張涵