◎記者 郝 昱
2014年7月,巴西世界杯進入白熱化階段,與此前“預(yù)測全靠章魚哥”不同,那年,谷歌通過大數(shù)據(jù)分析,準確地預(yù)測了世界杯16強比賽的勝利者。據(jù)了解,谷歌運用了實時體育比賽數(shù)據(jù)公司Opta Sports的數(shù)據(jù),以及由Big Query工程師開發(fā)的實力排行榜,再加入觀眾熱情度數(shù)據(jù),最終計算出主隊優(yōu)勢與戰(zhàn)果。谷歌還使用這一系統(tǒng)來預(yù)測世界杯8強的比賽,結(jié)果也驚人地準確。
事實上,谷歌并不是唯一做出完美預(yù)測的公司,百度、微軟也依據(jù)云計算數(shù)據(jù)系統(tǒng)的綜合分析進行了賽果預(yù)測,結(jié)果同樣精準。這無疑為2014年世界杯增加了不少技術(shù)樂趣。
回到今天的中國,從對概念的認識到技術(shù)應(yīng)用,雖然只經(jīng)歷了十幾年,但大數(shù)據(jù)技術(shù)的發(fā)展如火如荼。時至今日,很多工業(yè)企業(yè)家手中都不缺少數(shù)據(jù),但他們想知道如何讓數(shù)據(jù)“開口說話”。
對此,《網(wǎng)信軍民融合》記者采訪了航空工業(yè)信息技術(shù)中心(以下簡稱金航數(shù)碼)副總工程師梁建交。在他看來,要讓數(shù)據(jù)開口說話,數(shù)據(jù)治理是前提,數(shù)據(jù)安全是保障。然而,缺乏數(shù)據(jù)管理卻是很多工業(yè)企業(yè)存在的共性問題,成了中國工業(yè)企業(yè)挖掘大數(shù)據(jù)寶藏的“門檻”?!靶畔⒒瘞资?,很多企業(yè)積累了大量的數(shù)據(jù),卻不知怎么用,說到底是數(shù)據(jù)管理體系缺失的問題?!绷航ń恢毖圆恢M。
國務(wù)院2015年印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》和工信部今年1月發(fā)布的《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》分別強調(diào),數(shù)據(jù)是國家戰(zhàn)略性資產(chǎn),是21世紀的“鉆石礦”。對中國工業(yè)企業(yè)而言,大數(shù)據(jù)時代的到來既是機遇,也是挑戰(zhàn)。
“十三五”期間,隨著智能制造的加速推進和新一代信息技術(shù)的深化應(yīng)用,工業(yè)企業(yè)必將迎來數(shù)據(jù)種類的增加和數(shù)據(jù)量的急劇增長,企業(yè)數(shù)據(jù)技術(shù)體系和數(shù)據(jù)治理范式也必將發(fā)生變化,該如何應(yīng)對?據(jù)梁建交介紹,金航數(shù)碼早在2009年就開始將EA(復(fù)雜組織體架構(gòu))和IRP(信息資源規(guī)劃)相結(jié)合,研究企業(yè)數(shù)據(jù)分類與數(shù)據(jù)規(guī)劃的方法。近幾年,通過研究DAMA(國際數(shù)據(jù)管理協(xié)會)相關(guān)框架和DMM(數(shù)據(jù)管理成熟度)相關(guān)模型,在數(shù)據(jù)管理方面摸索出了一套體系化的構(gòu)建方法。另一方面,將傳統(tǒng)的BI(商務(wù)智能)相關(guān)技術(shù)和大數(shù)據(jù)技術(shù)相結(jié)合,提出了一套數(shù)據(jù)中心和數(shù)據(jù)資源開發(fā)利用的方法。所有這些,目的只有一個——讓數(shù)據(jù)“說話”。
在為企業(yè)提供咨詢服務(wù)的過程中,金航數(shù)碼的顧問和工程師們發(fā)現(xiàn)很多企業(yè)在信息化方面投入了大量資金卻收效甚微,想了各種辦法信息化水平仍止步不前,其根本原因是始終沒有邁過數(shù)據(jù)治理這道“門檻”。例如:國內(nèi)某飛機制造廠構(gòu)建了大量的信息系統(tǒng),卻豎起了一個個煙囪,面對此種情況,企業(yè)借助統(tǒng)一門戶平臺開發(fā)了異構(gòu)系統(tǒng)之間的集成接口,建立了信息共享通道,但流程并沒有實現(xiàn)貫通。金航數(shù)碼的顧問們通過調(diào)研發(fā)現(xiàn),根本原因是缺乏統(tǒng)一的數(shù)據(jù)標準,數(shù)據(jù)質(zhì)量存在很多問題,也就說,“路”是修好了,“車”卻跑不起來。
梁建交認為,要想全面、系統(tǒng)地解決企業(yè)數(shù)據(jù)問題,讓數(shù)據(jù)“說話”,建議實施“三步走”策略。第一階段,開展總體數(shù)據(jù)規(guī)劃,建立或完善數(shù)據(jù)管理體系。主要工作內(nèi)容包括對企業(yè)的數(shù)據(jù)資源進行分類、明確各類數(shù)據(jù)的責(zé)任主體、建立數(shù)據(jù)的標準規(guī)范、構(gòu)建數(shù)據(jù)管理體系(組織、流程和制度)等。第二階段,構(gòu)建數(shù)據(jù)中心,加強數(shù)據(jù)管控。這里說的數(shù)據(jù)中心是邏輯上而不是物理上的數(shù)據(jù)中心,側(cè)重于數(shù)據(jù)而不是硬件環(huán)境。本階段主要工作是實現(xiàn)多源數(shù)據(jù)的集成、建立數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全管理機制,構(gòu)建數(shù)據(jù)倉庫。第三階段,充分利用大數(shù)據(jù)與數(shù)據(jù)分析工具,做好數(shù)據(jù)資源開發(fā)利用。本階段的重心是分析管理決策的信息需求,建立分析模型,按照不同的分析主題對業(yè)務(wù)系統(tǒng)數(shù)據(jù)進行重新組織,利用報表、查詢、聯(lián)機分析處理、數(shù)據(jù)挖掘等技術(shù)和工具,向不同層次的管理決策人員提供手段上的充分支持。
那么,是不是說企業(yè)推進數(shù)據(jù)管理和大數(shù)據(jù)應(yīng)用,只有上述按部就班的“三步走”這一條路呢?梁建交表示,考慮企業(yè)信息化問題的輕重緩急和資金、時間等成本因素,可以選擇不同的切入點。無非是沿著兩個方向找切入點,一是自頂向下從總體數(shù)據(jù)規(guī)劃入手,先建立完整藍圖,然后再分步實施,各個突破。二是自底而上,立足于解決實際問題,快速見效,如:編碼問題、集成問題、數(shù)據(jù)分析利用等。但需要注意的是,很多問題之間是存在依賴關(guān)系的,數(shù)據(jù)標準問題不解決,集成就無從談起。跨系統(tǒng)數(shù)據(jù)不集成,數(shù)據(jù)分析利用就會受很大限制。有些企業(yè)選擇從建立數(shù)據(jù)治理體系入手,先建章立制,落實流程和責(zé)任,也不無道理。
在采訪過程中,梁建交也提到一些讓數(shù)據(jù)“說話”的例子。如,航空工業(yè)西飛的快響中心就是將大數(shù)據(jù)和數(shù)據(jù)分析技術(shù)應(yīng)用于民機客戶服務(wù)領(lǐng)域的很好的例子,“新舟”系列飛機運行數(shù)據(jù)管理平臺通過對飛機設(shè)計、制造、銷售客服、試飛以及維修等數(shù)據(jù)的采集和管理,可實現(xiàn)對各類服務(wù)請求的分類處理、處理進度的跟蹤和監(jiān)管,應(yīng)急支援異地服務(wù)請求,對飛機的狀態(tài)和故障進行快速預(yù)判和警示,對已經(jīng)出現(xiàn)的排故請求能迅速通過分析和相關(guān)算法進行故障定位,取得解決方案,并推送到移動設(shè)備,幫助外場維修人員快速解決。美國派克漢尼汾公司,通過對其積累的100多萬套設(shè)備的維修記錄進行分析,發(fā)現(xiàn)某款干燥機產(chǎn)品常壞的貴重零件的壽命都與一種至六種便宜零件的磨損有關(guān),由此對售后服務(wù)做出一項決定:提前換“齒輪組”、“軸套”等易損件,達到保護貴重零件的目的。僅在這一種產(chǎn)品上,這種做法每年為企業(yè)節(jié)省的維修費達上百萬美元。
自動駕駛汽車在我們的生活中開始扮演著越來越重要的角色。信息技術(shù)研究和分析公司Gartner認為,到2030年無人駕駛汽車將會占據(jù)25%的汽車市場份額。電影《速度與激情8》中有這樣一段情節(jié):賽弗(Cipher)利用互聯(lián)網(wǎng)入侵在路上行駛的私家車自動無人駕駛系統(tǒng),通過控制這些車輛來制造交通事故,以奪取核潛艇啟動密碼。有人不禁會問:將來在現(xiàn)實中這類事件真的會發(fā)生嗎?
據(jù)了解,自動駕駛是通過在汽車外安裝感應(yīng)器,以自動判斷和感應(yīng)道路狀況,將這些感應(yīng)數(shù)據(jù)傳輸?shù)娇刂浦行模ㄟ^控制中心對這些數(shù)據(jù)的計算來實現(xiàn)自動駕駛。會不會真的出現(xiàn)惡意網(wǎng)絡(luò)攻擊,導(dǎo)致數(shù)據(jù)中心內(nèi)的自動駕駛的數(shù)據(jù)被惡意篡改?我們無法預(yù)測,但確保駕駛員免受網(wǎng)絡(luò)威脅已成為汽車安全產(chǎn)業(yè)發(fā)展的重點和挑戰(zhàn)。
同樣,目前越來越多的工業(yè)企業(yè)將利用CPS(賽博物理系統(tǒng))相關(guān)技術(shù)實現(xiàn)基于人-機-物互聯(lián)的智能制造,在提高生產(chǎn)柔性、產(chǎn)品質(zhì)量和個性化服務(wù)品質(zhì)的同時,必將帶來巨大的數(shù)據(jù)安全隱患。不論是工業(yè)大數(shù)據(jù)還是工業(yè)機器人被不法分子所控制,后果都將不堪設(shè)想。
全球頂級會計師事務(wù)所普華永道發(fā)布的《2017全球信息安全狀況調(diào)查》顯示,2016年,中國內(nèi)地及中國香港企業(yè)監(jiān)測到的信息安全事件平均數(shù)量高達2577起,是2015年的2倍多,較2014年上升了969%。除金融機構(gòu)和互聯(lián)網(wǎng)企業(yè)外,工業(yè)企業(yè)近年來也成了被攻擊的重點對象。有互聯(lián)網(wǎng)安全專家表示,由于金融、互聯(lián)網(wǎng)和工業(yè)企業(yè)一方面服務(wù)廣大用戶,另一方面又和經(jīng)濟運行息息相關(guān),因此,很容易成為不法分子攻擊的對象。
梁建交指出,安全保密和業(yè)務(wù)便利永遠是一對矛盾。數(shù)據(jù)安全涉及數(shù)據(jù)的保密性、完整性和可用性,大家對數(shù)據(jù)安全的理解不能局限于傳統(tǒng)的保密,泄密對于企業(yè)是風(fēng)險,數(shù)據(jù)不完整、不可用對于企業(yè)同樣也是風(fēng)險。數(shù)據(jù)的安全防范需要從應(yīng)用安全、主機安全、網(wǎng)絡(luò)安全、物理安全等多層次來共同保障,數(shù)據(jù)處于多層防護圈的中心。在他看來,萬物互聯(lián)勢不可擋,企業(yè)不可能因噎廢食,應(yīng)積極研究未來新一代信息技術(shù)的廣泛而深入應(yīng)用所帶來的數(shù)據(jù)安全新問題,了解相關(guān)技術(shù),提前做好預(yù)案?;ヂ?lián)網(wǎng)安全技術(shù)發(fā)展迅速,工業(yè)企業(yè)可研究借鑒,少走彎路。