苗 放
1.成都理工大學(xué) 地球物理學(xué)院,成都 610059
2.地質(zhì)災(zāi)害防治與地質(zhì)環(huán)境保護(hù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,成都 610059
面向數(shù)據(jù)的軟件體系結(jié)構(gòu)初步探討*
苗放1,2+
1.成都理工大學(xué) 地球物理學(xué)院,成都 610059
2.地質(zhì)災(zāi)害防治與地質(zhì)環(huán)境保護(hù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,成都 610059
受軟件體系結(jié)構(gòu)的限制,信息技術(shù)領(lǐng)域長(zhǎng)期存在的問(wèn)題在大數(shù)據(jù)時(shí)代愈發(fā)突出:系統(tǒng)間的信息難以共享;已建系統(tǒng)功能擴(kuò)展困難;海量、異構(gòu)、多源、動(dòng)態(tài)、實(shí)時(shí)變化和爆發(fā)式增長(zhǎng)的大數(shù)據(jù)難管理,難分析,難挖掘;面向業(yè)務(wù)的軟件工程開發(fā)過(guò)程復(fù)雜,維護(hù)困難,生命周期短;在互聯(lián)網(wǎng)開放環(huán)境下的信息安全、數(shù)據(jù)安全問(wèn)題面臨挑戰(zhàn);數(shù)據(jù)所有者利益得不到保障等。面向數(shù)據(jù)的軟件體系結(jié)構(gòu)(data-oriented software architecture,DOA),采用“面向數(shù)據(jù)和以數(shù)據(jù)為核心”的思想,通過(guò)數(shù)據(jù)注冊(cè)中心(data register center,DRC)、數(shù)據(jù)權(quán)限中心(data authority center,DAC)和數(shù)據(jù)異常中心(data exception control center,DEC)統(tǒng)一定義數(shù)據(jù)、管理數(shù)據(jù)和提供數(shù)據(jù)服務(wù);通過(guò)數(shù)據(jù)應(yīng)用單元(data application units,DAUs)對(duì)各種應(yīng)用進(jìn)行管理和服務(wù),建立了一種數(shù)據(jù)大平臺(tái)與碎片化應(yīng)用的數(shù)據(jù)生態(tài)系統(tǒng),為構(gòu)建大數(shù)據(jù)時(shí)代從數(shù)據(jù)保護(hù)到授權(quán)應(yīng)用整套機(jī)制的軟件體系結(jié)構(gòu),進(jìn)行了有益的探索。
大數(shù)據(jù);軟件體系結(jié)構(gòu);面向數(shù)據(jù)的體系結(jié)構(gòu);數(shù)據(jù)生態(tài)系統(tǒng);數(shù)據(jù)注冊(cè)中心;數(shù)據(jù)權(quán)限中心
以大數(shù)據(jù)為特征的新時(shí)代已經(jīng)來(lái)臨。2011年12月,趙國(guó)棟等人發(fā)布了《大數(shù)據(jù)時(shí)代的即將到來(lái)》的報(bào)告,這是中國(guó)關(guān)于大數(shù)據(jù)的第一聲吶喊;2012年,《大數(shù)據(jù)》和《大數(shù)據(jù)時(shí)代》先后出版;同年12月,鄂維南院士組織召開了第一屆數(shù)據(jù)科學(xué)及產(chǎn)業(yè)發(fā)展大會(huì),中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟也成立了;直到2015年5月,貴陽(yáng)國(guó)際大數(shù)據(jù)博覽會(huì)成功舉辦,形成全國(guó)性的影響力;2015年9月,國(guó)務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,發(fā)展大數(shù)據(jù)正式成為國(guó)家意志,也標(biāo)志著大數(shù)據(jù)時(shí)代來(lái)臨。
大數(shù)據(jù)時(shí)代下,大數(shù)據(jù)技術(shù)、大數(shù)據(jù)分析和挖掘,以及數(shù)據(jù)管理、信息共享、信息安全、軟件工程、系統(tǒng)擴(kuò)展等[1-5],已經(jīng)成為政府、企業(yè)界和科技界關(guān)注的熱點(diǎn)和面臨的挑戰(zhàn)[6-11]。李國(guó)杰院士在關(guān)于大數(shù)據(jù)應(yīng)用與研究所面臨的問(wèn)題與挑戰(zhàn)中指出,大數(shù)據(jù)時(shí)代,“需要考慮對(duì)整個(gè)IT架構(gòu)進(jìn)行革命性的重構(gòu)”。廣義上講,革命指推動(dòng)事物發(fā)生根本性變革,引起事物從舊制到新制的飛躍。IT架構(gòu)的革命性重構(gòu)本文認(rèn)為應(yīng)該從硬件和軟件兩個(gè)方面來(lái)考慮。云計(jì)算已經(jīng)較好地解決了硬件方面的問(wèn)題[12-16],是目前公認(rèn)非常高效的處理大數(shù)據(jù)的方法之一[17]。亞馬遜的彈性計(jì)算云(elastic compute cloud,EC2)和簡(jiǎn)單存儲(chǔ)服務(wù)(simple storage service,S3)是云計(jì)算發(fā)展的典范;OpenStack憑借開放先進(jìn)的架構(gòu)、高效的社區(qū)開發(fā)、靈活的部署模式獲得了業(yè)界的廣泛認(rèn)可,成為當(dāng)今最有影響力的云計(jì)算開源項(xiàng)目[18];OpenStack和Hadoop的融合,既最大限度提高了服務(wù)器的資源利用率,又大大降低了大數(shù)據(jù)儲(chǔ)量的準(zhǔn)入門檻;NoSQL技術(shù)系統(tǒng)解決了類型多樣的大數(shù)據(jù)的管理、處理和分析問(wèn)題;以MapReduce、Hadoop、Spark等為代表的非關(guān)系數(shù)據(jù)分析技術(shù),快速地借助云計(jì)算平臺(tái)和大數(shù)據(jù)處理技術(shù)把數(shù)據(jù)轉(zhuǎn)換為商業(yè)價(jià)值,在互聯(lián)網(wǎng)搜索和其他大數(shù)據(jù)分析領(lǐng)域取得了重大進(jìn)展。
云計(jì)算為軟件方面的革命性重構(gòu)奠定了重要基礎(chǔ),但在軟件的體系結(jié)構(gòu)上,目前還沒(méi)有很好的解決方案。加拿大實(shí)時(shí)創(chuàng)新公司(Real-Time Innovation,Inc)的Joshi博士提交了“面向數(shù)據(jù)的體系結(jié)構(gòu):松散耦合的實(shí)時(shí)SOA”白皮書。該作者曾指出:數(shù)據(jù)是第一位的,對(duì)數(shù)據(jù)的操作是第二位的[19-20]。但作者只是從系統(tǒng)集成角度開展研究,沒(méi)有在面向數(shù)據(jù)方面的后續(xù)研究。Mohanty等人在“Big Imperatives,Enterprise Big Data Warehouse,BI Implementations and Analytics”一書中,討論了傳統(tǒng)的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)倉(cāng)庫(kù)儲(chǔ)存大數(shù)據(jù)時(shí)面臨的挑戰(zhàn),提出通過(guò)設(shè)計(jì)一個(gè)混合數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)來(lái)實(shí)現(xiàn)數(shù)據(jù)平臺(tái)生態(tài)系統(tǒng),體現(xiàn)了部分面向數(shù)據(jù)的思維[21]。Sawant等人在“Big DataApplicationArchitecture Q&A”一書中,較深入地探討了大數(shù)據(jù)的應(yīng)用體系結(jié)構(gòu)設(shè)計(jì)原則和實(shí)現(xiàn)方法,明確提出數(shù)據(jù)作為服務(wù)(data as a service,DaaS)對(duì)于大數(shù)據(jù)下的應(yīng)用架構(gòu)具有較重要的指導(dǎo)意義[22]。Llopis等人也在游戲設(shè)計(jì)領(lǐng)域采用面向數(shù)據(jù)的設(shè)計(jì)思想實(shí)現(xiàn)產(chǎn)品設(shè)計(jì)[23]。國(guó)內(nèi)外還有一些相關(guān)研究,都不同程度地體現(xiàn)了一些面向數(shù)據(jù)的思想、大數(shù)據(jù)的應(yīng)用架構(gòu)及相關(guān)技術(shù)[24-25],但均未提出較完整的面向數(shù)據(jù)的軟件理論和方法體系。
本文在云計(jì)算的硬件架構(gòu)之上,采用“面向數(shù)據(jù)和以數(shù)據(jù)為核心”的思想,構(gòu)建一種適應(yīng)于大數(shù)據(jù)時(shí)代的面向數(shù)據(jù)的軟件體系結(jié)構(gòu)(data-oriented software architecture,DOA)。DOA通過(guò)數(shù)據(jù)注冊(cè)中心(data register center,DRC)、數(shù)據(jù)權(quán)限中心(data authority center,DAC)、數(shù)據(jù)異常控制中心(data exception control center,DEC)來(lái)統(tǒng)一定義數(shù)據(jù)、管理數(shù)據(jù)和提供數(shù)據(jù)服務(wù),通過(guò)數(shù)據(jù)應(yīng)用單元(data application units,DAUs)對(duì)各種應(yīng)用進(jìn)行管理和服務(wù),建立一種數(shù)據(jù)大平臺(tái)與碎片化應(yīng)用的可持續(xù)發(fā)展的數(shù)據(jù)生態(tài)系統(tǒng),并構(gòu)建從數(shù)據(jù)保護(hù)到授權(quán)應(yīng)用的整套機(jī)制,為有效解決大數(shù)據(jù)時(shí)代所面臨的問(wèn)題和挑戰(zhàn)提供基礎(chǔ)理論和方法技術(shù)支撐。云計(jì)算與DOA分別從硬件和軟件兩個(gè)方面,共同構(gòu)建起大數(shù)據(jù)時(shí)代的IT基礎(chǔ)架構(gòu),其特點(diǎn)和優(yōu)勢(shì)如表1所示。
Table 1 Advantages and characteristics of cloud computing and DOA表1 云計(jì)算與DOA的特點(diǎn)和優(yōu)勢(shì)
受軟件體系結(jié)構(gòu)的限制,信息技術(shù)領(lǐng)域長(zhǎng)期存在的問(wèn)題在大數(shù)據(jù)時(shí)代愈發(fā)突出:
(1)信息共享。經(jīng)過(guò)數(shù)十年來(lái)信息技術(shù)發(fā)展和信息化應(yīng)用的積累,政府部門和企業(yè)中建立的各種業(yè)務(wù)信息系統(tǒng)越來(lái)越多,但系統(tǒng)間很難實(shí)現(xiàn)信息共享,甚至新建的信息系統(tǒng)也難以和其他系統(tǒng)共享信息。信息“孤島”和信息“煙囪”現(xiàn)象普遍存在,而且問(wèn)題越來(lái)越嚴(yán)重[22-23]。采用“接口”和“信息交換平臺(tái)”或“數(shù)據(jù)交換平臺(tái)”等方案,不能從根本上解決問(wèn)題。
(2)系統(tǒng)擴(kuò)展。信息系統(tǒng)建設(shè)完成后,應(yīng)用需求發(fā)生變化就要重新修改代碼才能實(shí)現(xiàn)功能更改,造成應(yīng)用信息系統(tǒng)對(duì)軟件開發(fā)者的依賴。一旦需求變化成為常態(tài),系統(tǒng)的功能擴(kuò)展問(wèn)題就變得非常突出。
(3)數(shù)據(jù)管理[26-27]。過(guò)去的信息系統(tǒng)涉及的多是結(jié)構(gòu)化數(shù)據(jù),通過(guò)關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(relational data base management system,RDBMS)就能很好地對(duì)數(shù)據(jù)進(jìn)行管理?,F(xiàn)在,面臨的大數(shù)據(jù)具有海量、異構(gòu)、多源、動(dòng)態(tài)、實(shí)時(shí)變化和爆發(fā)式增長(zhǎng)的特點(diǎn)[28],數(shù)據(jù)來(lái)源多樣,種類繁多,動(dòng)態(tài)變化,包括來(lái)自物聯(lián)網(wǎng)的物理空間數(shù)據(jù),社交網(wǎng)絡(luò)的網(wǎng)絡(luò)空間數(shù)據(jù)等,至今沒(méi)有統(tǒng)一的數(shù)據(jù)定義和管理辦法。
(4)大數(shù)據(jù)分析和挖掘支持[29]。大數(shù)據(jù)需要通過(guò)處理、分析和挖掘才能產(chǎn)生價(jià)值,才能為決策提供支持。目前,對(duì)具有上述特點(diǎn)的大數(shù)據(jù)缺乏符合數(shù)據(jù)密集型模式的數(shù)據(jù)管理機(jī)制和平臺(tái)[30],因而對(duì)大數(shù)據(jù)的處理、分析和挖掘難以獲得具有持續(xù)、全面、科學(xué)和客觀的大數(shù)據(jù)分析和挖掘結(jié)果。
(5)軟件工程。傳統(tǒng)的面向業(yè)務(wù)的軟件開發(fā)過(guò)程復(fù)雜,開發(fā)和維護(hù)成本高,無(wú)法應(yīng)對(duì)處于常態(tài)的業(yè)務(wù)應(yīng)用需求變更,軟件生命周期短,更新、淘汰和重新開發(fā)投入大。在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代,強(qiáng)調(diào)一切業(yè)務(wù)數(shù)據(jù)化[31],意味著要采集、記錄、存儲(chǔ)和管理一切業(yè)務(wù)過(guò)程中產(chǎn)生的數(shù)據(jù),這對(duì)于需求分析、數(shù)據(jù)模型和業(yè)務(wù)應(yīng)用等,都充滿了不確定性,也和傳統(tǒng)的軟件開發(fā)中要盡量有一個(gè)穩(wěn)定、明確的需求正好相反,給傳統(tǒng)的面向業(yè)務(wù)的軟件工程帶來(lái)了嚴(yán)峻的挑戰(zhàn)。
(6)信息安全。信息安全涉及國(guó)家安全、社會(huì)穩(wěn)定、企業(yè)利益和個(gè)人隱私。傳統(tǒng)的信息安全多是封閉環(huán)境下的信息安全,強(qiáng)調(diào)的是網(wǎng)絡(luò)安全、系統(tǒng)安全和應(yīng)用安全[32]。在信息安全上,我國(guó)采用的是分級(jí)保護(hù)和等級(jí)保護(hù)的信息安全制度。傳統(tǒng)的數(shù)據(jù)安全,多強(qiáng)調(diào)的是數(shù)據(jù)中心的安全,雖然有備份、災(zāi)備等技術(shù)保障數(shù)據(jù)的安全,但還存在著越權(quán)訪問(wèn)等數(shù)據(jù)泄露隱患。在云計(jì)算、互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)應(yīng)用以及大數(shù)據(jù)時(shí)代下,環(huán)境更為開放,對(duì)數(shù)據(jù)安全的要求更高,給信息安全帶來(lái)了更為嚴(yán)峻的挑戰(zhàn)。因此,信息安全除了網(wǎng)絡(luò)安全和系統(tǒng)安全保障之外,在安全的軟件體系結(jié)構(gòu)和安全的數(shù)據(jù)進(jìn)行保護(hù)機(jī)制等方面還要有更深入的研究。
(7)數(shù)據(jù)所有者利益保障。在大數(shù)據(jù)時(shí)代,以數(shù)據(jù)建設(shè)和提供信息(數(shù)據(jù))服務(wù)的企業(yè)和部門越來(lái)越多,對(duì)這類數(shù)據(jù)提供者的利益保護(hù)愈發(fā)重要。但由于信息具有易復(fù)制、易傳輸、難保護(hù)的特點(diǎn),現(xiàn)有的技術(shù)體系缺乏對(duì)數(shù)據(jù)進(jìn)行保護(hù)和授權(quán)使用的機(jī)制,不足以保障數(shù)據(jù)所有者的利益,不利于這類企業(yè)或部門的發(fā)展。
3.1SOA與DOA
現(xiàn)有的軟件體系結(jié)構(gòu)如圖1所示,是隨應(yīng)用需求不斷演變而產(chǎn)生的。
Fig.1 Software architecture圖1 軟件體系結(jié)構(gòu)
SOA(service-oriented architecture)為利用網(wǎng)絡(luò)提供軟件服務(wù)起到了至關(guān)重要的作用。SOA實(shí)施過(guò)程中,模塊化服務(wù)模式使得不同又相互連接的系統(tǒng)之間安全性變得非常復(fù)雜;SOA的標(biāo)準(zhǔn)以及兼容性方面不能適應(yīng)市場(chǎng)上業(yè)務(wù)和功能的擴(kuò)展,造成發(fā)展受限。加拿大博士Joshi在松散耦合的實(shí)時(shí)SOA白皮書中針對(duì)集成系統(tǒng)的擴(kuò)展性和復(fù)雜性要求,采用面向數(shù)據(jù)的思想,來(lái)建立大規(guī)模系統(tǒng)集成的可行范式,并指出數(shù)據(jù)是第一位的,對(duì)數(shù)據(jù)的操作是第二位的,但沒(méi)有進(jìn)行更深入的研究。面向數(shù)據(jù)的軟件體系結(jié)構(gòu)DOA[33-34]不同于SOA(見(jiàn)表2),與具體的硬件平臺(tái)和軟件系統(tǒng)無(wú)關(guān),通過(guò)數(shù)據(jù)的分類體系和訪問(wèn)權(quán)限、數(shù)據(jù)注冊(cè)和登記中心,建立一種可持續(xù)發(fā)展的數(shù)據(jù)生態(tài)系統(tǒng)。
網(wǎng)絡(luò)技術(shù)出現(xiàn)以后,形成了C/S、B/S、P2P模式?,F(xiàn)在發(fā)展為由云計(jì)算支持的G/S(general browser/services cloud)模式[35-36],也稱端/云模式,以解決空間信息的網(wǎng)絡(luò)服務(wù)應(yīng)用問(wèn)題。DOA和端/云模式示意圖如圖2所示。
“端”表示利用面向人的客戶端,通過(guò)碎片化應(yīng)用,隨時(shí)隨地、隨心隨意地和“云”互動(dòng);“云”表示包括物理世界數(shù)據(jù)采集云,網(wǎng)絡(luò)世界數(shù)據(jù)采集云,數(shù)據(jù)存儲(chǔ)云,DOA的數(shù)據(jù)注冊(cè)中心以及分布式、虛擬化引擎在內(nèi)的后臺(tái),為隨時(shí)隨地的碎片化應(yīng)用提供支撐,其中“物理”云、“網(wǎng)絡(luò)”云和“存儲(chǔ)”云是DOA概念里廣義數(shù)據(jù)的表現(xiàn)方式。只有站在數(shù)據(jù)的角度上,才能把“云物移大智”融合在一起。DOA采用“面向數(shù)據(jù)和以數(shù)據(jù)為核心”的思想,有效解決了大數(shù)據(jù)時(shí)代面臨的軟件體系結(jié)構(gòu)方面的諸多問(wèn)題。
Table 2 Difference between DOAand SOA表2 軟件體系結(jié)構(gòu)DOA與SOA的區(qū)別
3.2以數(shù)據(jù)為核心和面向數(shù)據(jù)的思維
大數(shù)據(jù)時(shí)代,數(shù)據(jù)思維至關(guān)重要。2015年,馬云在全球大數(shù)據(jù)時(shí)代貴陽(yáng)峰會(huì)上講到從IT到DT的變革,不單單是技術(shù)的變革,要高度重視DT時(shí)代的數(shù)據(jù)思維,數(shù)據(jù)是未來(lái)制造業(yè)最大的能源。
“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃帶給人們兩點(diǎn)啟示:一是以互聯(lián)網(wǎng)為代表的信息技術(shù)集合由過(guò)去的行業(yè)特征,轉(zhuǎn)變?yōu)榭梢灾胃餍袠I(yè)發(fā)展的基礎(chǔ);二是只有互聯(lián)網(wǎng)+數(shù)據(jù),才能把傳統(tǒng)行業(yè)加到互聯(lián)網(wǎng)上去發(fā)展。
隨著人類的發(fā)展,在地球上構(gòu)建了不同的皮膚,讓人們賴以生存、生活和發(fā)展,如表3所示。在由互聯(lián)網(wǎng)構(gòu)成的新皮膚上,承載著數(shù)據(jù),使人類得到更好的發(fā)展。
從人類文明演進(jìn)軌跡上看,人類文明進(jìn)入到信息社會(huì)和數(shù)據(jù)時(shí)代的文明3,是利用計(jì)算機(jī)、互聯(lián)網(wǎng)等技術(shù),對(duì)人類自己思想和智慧的提升,利用數(shù)據(jù)為人類服務(wù),如表4所示。
Fig.2 Data oriented architecture and end/cloud model圖2 面向數(shù)據(jù)的體系結(jié)構(gòu)與端/云模式
Table 3 Earth?s skin concept of data thinking表3 數(shù)據(jù)思維之地球皮膚概念
Table 4 Evolution of human history and civilization of data thinking表4 數(shù)據(jù)思維之人類文明演進(jìn)軌跡
而文明3的核心就是數(shù)據(jù)。從映射真實(shí)世界的虛擬世界,到信息、知識(shí)、智慧的根本,都是數(shù)據(jù);從數(shù)據(jù)出發(fā),才有信息、知識(shí)、智慧和決策;從網(wǎng)絡(luò)連接傳輸?shù)膬?nèi)容,到服務(wù)器、云主機(jī)、終端所存儲(chǔ)、處理和展示的內(nèi)容,都是數(shù)據(jù)。數(shù)據(jù)是人類認(rèn)識(shí)世界、溝通交流、獲得知識(shí)、智慧決策的本源。一切技術(shù)、業(yè)務(wù)、功能、流程都是為了數(shù)據(jù)和圍繞數(shù)據(jù)而開展的。因此,一切均回歸本質(zhì),回歸數(shù)據(jù),以數(shù)據(jù)為核心。
數(shù)據(jù)是有生命的,具有生命周期,生命過(guò)程需要全記錄。數(shù)據(jù)是有屬性的,具有安全屬性、身份屬性、時(shí)間和空間屬性。數(shù)據(jù)要加密呈現(xiàn),并且具有不同的加密級(jí)別和深度。數(shù)據(jù)獨(dú)立于系統(tǒng),是應(yīng)用的基礎(chǔ),不依賴于特定的硬件和軟件環(huán)境。同一數(shù)據(jù)可以支撐不同的應(yīng)用。數(shù)據(jù)的訪問(wèn)和應(yīng)用是基于授權(quán)的,特定的訪問(wèn)者,特定的場(chǎng)合(環(huán)境),特定的時(shí)間(時(shí)段)。
數(shù)據(jù)系統(tǒng)是生態(tài)、變化和發(fā)展的,是可持續(xù)發(fā)展的,自生長(zhǎng)、自管理、自適應(yīng)的。建立數(shù)據(jù)生態(tài)系統(tǒng),就要面向數(shù)據(jù)和以數(shù)據(jù)為核心。數(shù)據(jù)生態(tài)系統(tǒng)包括生態(tài)的各種應(yīng)用,是“肥沃的”數(shù)據(jù)“土壤”上生長(zhǎng)著“茂盛的”應(yīng)用“森林”。數(shù)據(jù)生態(tài)系統(tǒng)需要構(gòu)建邏輯的數(shù)據(jù)資源池,支持?jǐn)?shù)據(jù)大平臺(tái)與碎片化和不斷增長(zhǎng)的應(yīng)用,支持?jǐn)?shù)據(jù)共享和系統(tǒng)可擴(kuò)展。
面向數(shù)據(jù)的體系結(jié)構(gòu)(DOA)建立在云計(jì)算的硬件架構(gòu)之上,采用“面向數(shù)據(jù)和以數(shù)據(jù)為核心”的思想,通過(guò)數(shù)據(jù)注冊(cè)中心、數(shù)據(jù)權(quán)限中心、數(shù)據(jù)異??刂浦行膩?lái)統(tǒng)一定義數(shù)據(jù)、管理數(shù)據(jù)和提供數(shù)據(jù)服務(wù),通過(guò)數(shù)據(jù)應(yīng)用單元對(duì)各種應(yīng)用進(jìn)行管理和服務(wù),構(gòu)建起從數(shù)據(jù)保護(hù)到授權(quán)應(yīng)用的整套機(jī)制,為有效解決大數(shù)據(jù)時(shí)代所面臨的軟件體系結(jié)構(gòu)問(wèn)題提供基礎(chǔ)理論和方法技術(shù)支撐,建立一種數(shù)據(jù)大平臺(tái)與碎片化應(yīng)用的數(shù)據(jù)生態(tài)系統(tǒng)。一個(gè)生態(tài)系統(tǒng)的好壞取決于這個(gè)生態(tài)系統(tǒng)的構(gòu)成和運(yùn)行機(jī)制,而面向數(shù)據(jù)的軟件體系結(jié)構(gòu)就是探索一種解決數(shù)據(jù)與應(yīng)用之間自生長(zhǎng)、自適應(yīng)、自管理和可持續(xù)發(fā)展的機(jī)制,也包括數(shù)據(jù)的安全機(jī)制和應(yīng)用中數(shù)據(jù)的授權(quán)使用機(jī)制。數(shù)據(jù)是大數(shù)據(jù)時(shí)代下的廣義數(shù)據(jù),是真實(shí)世界映射成虛擬世界的各種類型的數(shù)據(jù),應(yīng)用則是根據(jù)政府、企業(yè)和個(gè)人在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)中隨時(shí)隨地、隨心隨意的各種需求產(chǎn)生出的碎片化和個(gè)性化的應(yīng)用。數(shù)據(jù)生態(tài)系統(tǒng)可以簡(jiǎn)單形象地比喻為“肥沃的數(shù)據(jù)土壤上生長(zhǎng)著茂盛的應(yīng)用森林”。從不同視角理解DOA如表5所示,DOA主要內(nèi)容如圖3所示。
Table 5 Different perspectives to understand DOA表5 不同視角理解DOA
Fig.3 DOAmain content圖3 DOA主要內(nèi)容
4.1面向數(shù)據(jù)的軟件體系結(jié)構(gòu)的機(jī)制
(1)大數(shù)據(jù)時(shí)代對(duì)體系結(jié)構(gòu)的需求。馬云提出,人類已經(jīng)從IT時(shí)代走向DT時(shí)代,IT時(shí)代是以自我控制、自我管理為主,而DT時(shí)代,它是以服務(wù)大眾、激發(fā)生產(chǎn)力為主的技術(shù)[37-38]。數(shù)據(jù)技術(shù)包括信息技術(shù),數(shù)據(jù)技術(shù)范圍更廣,內(nèi)涵更豐富;信息技術(shù)更具體,針對(duì)性更強(qiáng)。數(shù)據(jù)技術(shù)時(shí)代需要新的世界觀,即數(shù)據(jù)世界觀,數(shù)據(jù)安全觀需要相適應(yīng)的軟件體系結(jié)構(gòu),支持?jǐn)?shù)據(jù)安全,支持一切業(yè)務(wù)數(shù)據(jù)化,管理海量、異構(gòu)、復(fù)雜、變化和爆發(fā)式增長(zhǎng)的大數(shù)據(jù),并為挖掘有價(jià)值信息提供支持,同時(shí)需要重新審視數(shù)據(jù),站在數(shù)據(jù)的角度審視技術(shù)、架構(gòu)、安全體系。
(2)數(shù)據(jù)的定義和分類。大數(shù)據(jù)時(shí)代的數(shù)據(jù)是廣義數(shù)據(jù),是真實(shí)世界映射成虛擬世界的內(nèi)容。除了理解的計(jì)算機(jī)可以直接處理的數(shù)據(jù)外,還可以是能被注冊(cè)的各類事物,如設(shè)備、服務(wù)、APP、人、物等。這就需要研究大數(shù)據(jù)時(shí)代下的數(shù)據(jù)定義或廣義數(shù)據(jù)定義??梢詮牟煌嵌葋?lái)分類數(shù)據(jù):結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù),關(guān)系型數(shù)據(jù)庫(kù)/NoSQL,動(dòng)態(tài)數(shù)據(jù)/靜態(tài)數(shù)據(jù),變化的數(shù)據(jù)/歷史數(shù)據(jù),簡(jiǎn)單數(shù)據(jù)/復(fù)雜數(shù)據(jù),自有數(shù)據(jù)/共享數(shù)據(jù)/公開數(shù)據(jù),不斷變化和不斷積累增長(zhǎng)的大數(shù)據(jù)等。
(3)數(shù)據(jù)的載體及與云計(jì)算的關(guān)系。本質(zhì)上云計(jì)算就是云服務(wù)。從數(shù)據(jù)角度,云計(jì)算更多是數(shù)據(jù)的存儲(chǔ)服務(wù),是IaaS和DaaS,通過(guò)分布式和虛擬化技術(shù),將基礎(chǔ)設(shè)施與數(shù)據(jù)融為一體(infrastructure plus data,I+D),為終端用戶提供彈性、可計(jì)量、個(gè)性化的數(shù)據(jù)和計(jì)算服務(wù),可以簡(jiǎn)稱“云”。一切皆在云中,包括所有的數(shù)據(jù)、網(wǎng)絡(luò)世界和物理世界的數(shù)據(jù)等。以數(shù)據(jù)為內(nèi)容定義云,可以分為存儲(chǔ)云、網(wǎng)絡(luò)云和物理云(見(jiàn)圖2)。
(4)數(shù)據(jù)生態(tài)系統(tǒng)的含義及DOA的作用。數(shù)據(jù)生態(tài)系統(tǒng)是“肥沃的數(shù)據(jù)土壤上生長(zhǎng)著茂盛的應(yīng)用森林”,DOA是數(shù)據(jù)與應(yīng)用之間可持續(xù)發(fā)展的關(guān)系描述。一個(gè)數(shù)據(jù)生態(tài)系統(tǒng)能夠成立,關(guān)鍵是要建立一種有效的作用機(jī)制,這就是面向數(shù)據(jù)的體系結(jié)構(gòu)。
(5)DOA與數(shù)據(jù)和應(yīng)用的關(guān)系。DOA就是建立在云計(jì)算支撐的數(shù)據(jù)和各種應(yīng)用之間的,分別可以對(duì)數(shù)據(jù)和應(yīng)用進(jìn)行管理和服務(wù)的一種機(jī)制、一個(gè)平臺(tái),形成一個(gè)以這種機(jī)制和平臺(tái)的相對(duì)不變來(lái)應(yīng)對(duì)萬(wàn)變的數(shù)據(jù)和應(yīng)用的生態(tài)系統(tǒng)。這種關(guān)系和機(jī)制,也可以實(shí)現(xiàn)從實(shí)時(shí)數(shù)據(jù)到實(shí)時(shí)應(yīng)用的支持。數(shù)據(jù)、DOA平臺(tái)和應(yīng)用所構(gòu)成的三層架構(gòu)見(jiàn)圖4。
Fig.4 Three-layer architecture of data,DOAplatform and application圖4 數(shù)據(jù)、DOA平臺(tái)和應(yīng)用所構(gòu)成的三層架構(gòu)
(6)DOA對(duì)數(shù)據(jù)的管理和服務(wù)模式。DOA面對(duì)的數(shù)據(jù)是廣義數(shù)據(jù)。要對(duì)廣義數(shù)據(jù)進(jìn)行管理和服務(wù),首先要解決對(duì)各種類型數(shù)據(jù)的統(tǒng)一標(biāo)識(shí)和管理問(wèn)題。其次,要考慮數(shù)據(jù)的價(jià)值保護(hù),對(duì)數(shù)據(jù)進(jìn)行屬性管理,并對(duì)數(shù)據(jù)進(jìn)行權(quán)限和授權(quán)管理。第三,在分布式應(yīng)用和有數(shù)據(jù)冗余的情況下,要考慮數(shù)據(jù)的唯一性和一致性問(wèn)題。據(jù)此提出DRC、DAC和DEC,互相配合實(shí)現(xiàn)對(duì)各種類型數(shù)據(jù)的統(tǒng)一管理,并為應(yīng)用提供數(shù)據(jù)服務(wù)。
(7)DOA與應(yīng)用的業(yè)務(wù)邏輯和數(shù)據(jù)邏輯關(guān)系。傳統(tǒng)的應(yīng)用信息系統(tǒng)構(gòu)建邏輯大都是面向業(yè)務(wù)的邏輯,要求信息處理流程、數(shù)據(jù)結(jié)構(gòu)等都按照業(yè)務(wù)過(guò)程的要求進(jìn)行設(shè)計(jì)。好處是:信息流程與業(yè)務(wù)流程比較一致;缺點(diǎn)是:今后業(yè)務(wù)流程一旦發(fā)生變化,信息處理流程、數(shù)據(jù)結(jié)構(gòu)等都要做相應(yīng)的變化,給系統(tǒng)開發(fā)和維護(hù)帶來(lái)不可預(yù)測(cè)的困難。DOA要求面向數(shù)據(jù),即要將應(yīng)用的業(yè)務(wù)邏輯轉(zhuǎn)換為數(shù)據(jù)邏輯,這樣就要求將業(yè)務(wù)流程按照對(duì)數(shù)據(jù)資源池訪問(wèn)的周期梳理成一個(gè)個(gè)小的面向數(shù)據(jù)的流程,最后再將這些面向數(shù)據(jù)的流程整合成面向業(yè)務(wù)的流程,完成應(yīng)用信息系統(tǒng)的開發(fā)。好處是:一旦構(gòu)建了數(shù)據(jù)資源池,構(gòu)建面向數(shù)據(jù)的業(yè)務(wù)流程會(huì)比較便捷,而且業(yè)務(wù)流程發(fā)生變化,不會(huì)影響整個(gè)數(shù)據(jù)邏輯和數(shù)據(jù)流程,只需增加變化的部分或調(diào)整一些數(shù)據(jù)流程去適應(yīng)新的變化即可;難點(diǎn)是:要將業(yè)務(wù)邏輯轉(zhuǎn)換為數(shù)據(jù)邏輯。
(8)DOA下數(shù)據(jù)安全的基本原理。傳統(tǒng)的信息安全,首先是建立一個(gè)封閉和相對(duì)安全的環(huán)境,通過(guò)各種方式來(lái)保證這個(gè)封閉環(huán)境是安全的或可信的,但在這里面的數(shù)據(jù)卻大多是“裸露”的,一旦有不速之客通過(guò)漏洞進(jìn)入到這個(gè)環(huán)境,“裸露”的數(shù)據(jù)就面臨著極大的危險(xiǎn)。在互聯(lián)網(wǎng)和云計(jì)算的開放環(huán)境下,按照這種封閉環(huán)境下的信息安全策略進(jìn)行數(shù)據(jù)保護(hù),將面臨著越權(quán)訪問(wèn)帶來(lái)的極大挑戰(zhàn)。DOA是面向數(shù)據(jù)和以數(shù)據(jù)為核心的。數(shù)據(jù)具有安全屬性,即數(shù)據(jù)的身份屬性,明確數(shù)據(jù)的主人、朋友、陌生人和敵人。從數(shù)據(jù)角度考慮安全問(wèn)題,要保證數(shù)據(jù)的完整性、機(jī)密性和可用性。數(shù)據(jù)要“天生加密,授權(quán)使用”。數(shù)據(jù)具有自保護(hù)功能,要穿戴盔甲,以加密方式呈現(xiàn),具有不同的加密級(jí)別和深度。數(shù)據(jù)的使用要經(jīng)過(guò)授權(quán)。數(shù)據(jù)具有兩種狀態(tài):存儲(chǔ)和傳輸時(shí)的“數(shù)據(jù)態(tài)”以及授權(quán)使用中的“應(yīng)用態(tài)”。“數(shù)據(jù)態(tài)”是加密狀態(tài),“應(yīng)用態(tài)”是解密狀態(tài)。當(dāng)完成“應(yīng)用”或離開了應(yīng)用環(huán)境,數(shù)據(jù)應(yīng)立即“變”為加密的“數(shù)據(jù)態(tài)”。DOA提供一種加解密機(jī)制和授權(quán)使用機(jī)制,使得數(shù)據(jù)在存儲(chǔ)和傳輸時(shí)是不可訪問(wèn)和使用的,而經(jīng)過(guò)授權(quán)的用戶在訪問(wèn)數(shù)據(jù)或通過(guò)應(yīng)用使用數(shù)據(jù)時(shí),是透明的,即感覺(jué)不到數(shù)據(jù)的加密和解密過(guò)程。因此,DOA下的數(shù)據(jù)安全策略是,“數(shù)據(jù)態(tài)”的數(shù)據(jù),既適合于封閉環(huán)境,也適合于開放環(huán)境,而“應(yīng)用態(tài)”的數(shù)據(jù),僅適合于“封閉”環(huán)境。這樣,數(shù)據(jù)安全問(wèn)題就化解為數(shù)據(jù)加密和授權(quán)使用機(jī)制、數(shù)據(jù)自我保護(hù)和自動(dòng)加解密機(jī)制、應(yīng)用環(huán)境安全等幾個(gè)關(guān)鍵問(wèn)題了。
4.2面向數(shù)據(jù)的軟件體系結(jié)構(gòu)的組成
(1)面向數(shù)據(jù)的體系結(jié)構(gòu)(DOA)的組成及完備性。作為協(xié)調(diào)數(shù)據(jù)和應(yīng)用之間的關(guān)系以及構(gòu)建數(shù)據(jù)生態(tài)系統(tǒng)的一種機(jī)制,DOA具有對(duì)廣義數(shù)據(jù)進(jìn)行全面管理和服務(wù)的功能,以及對(duì)各類應(yīng)用進(jìn)行全面管理和服務(wù)的功能。DOA組成包括:對(duì)廣義和各類數(shù)據(jù)進(jìn)行登記注冊(cè)管理的DRC,對(duì)數(shù)據(jù)進(jìn)行授權(quán)、認(rèn)證和計(jì)帳(授權(quán)及訪問(wèn)過(guò)程記錄)管理的DAC,對(duì)數(shù)據(jù)的一致性進(jìn)行管理的DEC,以及對(duì)各類應(yīng)用進(jìn)行管理、服務(wù)提供支持的DAUs。它們之間既相互獨(dú)立,又相互關(guān)聯(lián),形成一個(gè)有機(jī)的整體。相互獨(dú)立,體現(xiàn)在它們的任務(wù)和功能互不相同;相互關(guān)聯(lián),體現(xiàn)在它們之間的互為依賴。
(2)數(shù)據(jù)注冊(cè)中心(DRC)基本功能。數(shù)據(jù)注冊(cè)中心對(duì)各種類型的數(shù)據(jù)和廣義數(shù)據(jù)進(jìn)行登記注冊(cè),形成邏輯的數(shù)據(jù)資源池,方便應(yīng)用對(duì)數(shù)據(jù)的訪問(wèn)。其功能涉及但不限于:數(shù)據(jù)注冊(cè)信息定義,數(shù)據(jù)屬性信息,數(shù)據(jù)分類,元數(shù)據(jù)標(biāo)準(zhǔn),元數(shù)據(jù)分類,不同類型數(shù)據(jù)的注冊(cè)方法,數(shù)據(jù)索引,元數(shù)據(jù)索引,數(shù)據(jù)檢索,廣義數(shù)據(jù)模式識(shí)別,分布式部署等。
(3)數(shù)據(jù)權(quán)限中心(DAC)基本功能。數(shù)據(jù)權(quán)限中心對(duì)數(shù)據(jù)進(jìn)行權(quán)限管理,功能涉及但不限于:數(shù)據(jù)安全屬性定義,數(shù)據(jù)合法性鑒別,數(shù)據(jù)訪問(wèn)權(quán)限定義,用戶權(quán)限認(rèn)證,應(yīng)用授權(quán),用戶授權(quán),數(shù)據(jù)授權(quán)與PKI(public key infrastructure),計(jì)帳算法及機(jī)制,數(shù)據(jù)透明加解密機(jī)制,高效數(shù)據(jù)加解密算法等。
(4)數(shù)據(jù)異??刂浦行模―EC)基本功能。數(shù)據(jù)異??刂浦行膶?duì)分布式環(huán)境下有數(shù)據(jù)冗余時(shí)的數(shù)據(jù)一致性進(jìn)行處理,功能涉及但不限于:數(shù)據(jù)維護(hù),自適應(yīng)管理,異常探測(cè)與處理,巡檢,異常與沖突發(fā)現(xiàn),同步處理,冗余處理,負(fù)載均衡等。
(5)數(shù)據(jù)應(yīng)用單元(DAUs)基本功能。數(shù)據(jù)應(yīng)用單元是在數(shù)據(jù)資源池之上的一系列應(yīng)用單元模塊,針對(duì)應(yīng)用管理和服務(wù),通過(guò)類似于基于構(gòu)件的軟件開發(fā)模式的搭積木方式和應(yīng)用程序接口(application programming interface,API)調(diào)用,以“數(shù)據(jù)驅(qū)動(dòng)應(yīng)用”,快速滿足用戶的各種應(yīng)用功能需求。其功能根據(jù)各種具體應(yīng)用的需求,涉及但不限于:根據(jù)不同數(shù)據(jù)類型提供不同功能的數(shù)據(jù)功能單元(data function unit,DFU),以推送方式提供服務(wù)的數(shù)據(jù)服務(wù)單元(data service unit,DSU),數(shù)據(jù)加解密單元(data encryption unit,DEU),數(shù)據(jù)授權(quán)調(diào)用單元(data invocation unit,DIU),數(shù)據(jù)應(yīng)用組合單元(data combination unit,DCU),數(shù)據(jù)可視化單元(data visualization unit,DVU),數(shù)據(jù)處理單元(data processing unit,DPU)等。
(6)面向數(shù)據(jù)的軟件工程原理初步探索。面向數(shù)據(jù)的體系結(jié)構(gòu)(DOA)為軟件開發(fā)提供了新的方法。區(qū)別于傳統(tǒng)的面向業(yè)務(wù)的軟件工程,新的面向數(shù)據(jù)的軟件工程需要研究:具有生命周期的應(yīng)用軟件與數(shù)據(jù)生態(tài)系統(tǒng)的關(guān)系,業(yè)務(wù)邏輯轉(zhuǎn)化為數(shù)據(jù)邏輯的開發(fā)過(guò)程,邏輯的數(shù)據(jù)資源池建設(shè)和運(yùn)行維護(hù)機(jī)制,基于成長(zhǎng)型數(shù)據(jù)生態(tài)系統(tǒng)的應(yīng)用軟件開發(fā)模式,基于DAUs的面向數(shù)據(jù)的應(yīng)用軟件快速構(gòu)建機(jī)制,已有系統(tǒng)的數(shù)據(jù)整合方法等。
4.3數(shù)據(jù)注冊(cè)中心機(jī)制
數(shù)據(jù)注冊(cè)中心(DRC)是DOA的核心部件,通過(guò)它來(lái)構(gòu)建邏輯的數(shù)據(jù)資源池,并管理數(shù)據(jù)和提供數(shù)據(jù)服務(wù)。DRC按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì),可以將各個(gè)行業(yè)或不同規(guī)模的DRC進(jìn)行互聯(lián)和關(guān)聯(lián),從而構(gòu)成更大規(guī)模的DOA系統(tǒng)。
(1)數(shù)據(jù)注冊(cè)內(nèi)容定義及元數(shù)據(jù)標(biāo)準(zhǔn)。廣義數(shù)據(jù)包括云中存儲(chǔ)的各種類型的數(shù)據(jù),也包括互聯(lián)網(wǎng)中傳遞的實(shí)時(shí)變化的數(shù)據(jù),還包括物理世界存在的實(shí)體對(duì)象和狀態(tài)所表征的數(shù)據(jù)。數(shù)據(jù)注冊(cè)的內(nèi)容包括數(shù)據(jù)特征、數(shù)據(jù)名稱、存在位置、數(shù)據(jù)描述、數(shù)據(jù)屬性、數(shù)據(jù)權(quán)限等。需要制定統(tǒng)一的數(shù)據(jù)注冊(cè)元數(shù)據(jù)標(biāo)準(zhǔn)。
(2)數(shù)據(jù)屬性信息定義。數(shù)據(jù)具有屬性,例如數(shù)據(jù)權(quán)人(數(shù)據(jù)主人)、數(shù)據(jù)的生命周期、數(shù)據(jù)權(quán)限、數(shù)據(jù)狀態(tài)、數(shù)據(jù)性質(zhì)、數(shù)據(jù)合法性、數(shù)據(jù)質(zhì)量等。
(3)數(shù)據(jù)分類及分類標(biāo)準(zhǔn)。包括數(shù)據(jù)分類的標(biāo)準(zhǔn)、分類的方法、分類的類別和分類的應(yīng)用等。
(4)數(shù)據(jù)注冊(cè)方法。包括數(shù)據(jù)注冊(cè)方法,分為手動(dòng)注冊(cè)、半自動(dòng)注冊(cè)和全自動(dòng)注冊(cè)。在數(shù)據(jù)注冊(cè)的同時(shí),建立數(shù)據(jù)索引。應(yīng)用產(chǎn)生的數(shù)據(jù)應(yīng)自動(dòng)進(jìn)行注冊(cè)。
(5)元數(shù)據(jù)索引和檢索方法。數(shù)據(jù)注冊(cè)中心是為應(yīng)用提供數(shù)據(jù)訪問(wèn)服務(wù)的,訪問(wèn)效率取決于索引和檢索方法。要建立高效的元數(shù)據(jù)索引和檢索機(jī)制,開發(fā)高效的索引和檢索方法。
(6)廣義數(shù)據(jù)模式識(shí)別。數(shù)據(jù)注冊(cè)中心注冊(cè)的內(nèi)容可以是廣義數(shù)據(jù),例如物理世界的實(shí)體。要快速檢索這些廣義數(shù)據(jù),需要采取新的識(shí)別技術(shù),例如可以采用基于模糊理論的模式識(shí)別技術(shù)來(lái)建立索引等方法。
(7)數(shù)據(jù)注冊(cè)中心分布式部署模式。數(shù)據(jù)注冊(cè)中心的數(shù)據(jù)注冊(cè)信息可以非常大,因此數(shù)據(jù)注冊(cè)中心也要部署到云的分布式環(huán)境中。
DRC數(shù)據(jù)自動(dòng)注冊(cè),數(shù)據(jù)注冊(cè)內(nèi)容隨需自適應(yīng),并對(duì)歷史數(shù)據(jù)進(jìn)行注冊(cè)與管理,鑒定數(shù)據(jù)來(lái)源及保障數(shù)據(jù)唯一性。
4.4數(shù)據(jù)權(quán)限中心機(jī)制
數(shù)據(jù)權(quán)限中心(DAC)是DOA的關(guān)鍵部件,對(duì)數(shù)據(jù)的安全存儲(chǔ)、傳輸及應(yīng)用授權(quán)進(jìn)行管理。對(duì)數(shù)據(jù)實(shí)行“天生加密,授權(quán)使用”的機(jī)制,將數(shù)據(jù)分成存儲(chǔ)和傳輸時(shí)保持加密的“數(shù)據(jù)態(tài)”和在應(yīng)用中授權(quán)使用時(shí)解密的“應(yīng)用態(tài)”,充分保證數(shù)據(jù)的安全及使用的授權(quán)。DOA從架構(gòu)角度通過(guò)DAC來(lái)保障數(shù)據(jù)的安全性。DAC通過(guò)數(shù)據(jù)權(quán)限的管理對(duì)數(shù)據(jù)進(jìn)行保護(hù),并提供數(shù)據(jù)授權(quán)使用的機(jī)制,也可以保護(hù)數(shù)據(jù)擁有者的利益。
(1)開放環(huán)境下數(shù)據(jù)安全基本理論。開放環(huán)境下,要做到數(shù)據(jù)本身的安全,并能夠安全使用,首先就是數(shù)據(jù)應(yīng)該具有“天生加密,授權(quán)使用”的特性。假設(shè)數(shù)據(jù)在使用中是不加密狀態(tài),那么數(shù)據(jù)不在使用中就應(yīng)該保持加密狀態(tài)。因此,設(shè)定數(shù)據(jù)具有兩種狀態(tài):存儲(chǔ)和傳輸時(shí)處于加密狀態(tài)的“數(shù)據(jù)態(tài)”以及授權(quán)使用中處于解密狀態(tài)的“應(yīng)用態(tài)”。DOA作為一種機(jī)制,就要保證數(shù)據(jù)能夠在這兩種狀態(tài)中與授權(quán)和加解密技術(shù)關(guān)聯(lián)起來(lái)。目前有關(guān)數(shù)據(jù)安全的理論和方法體系,網(wǎng)絡(luò)的授權(quán)、認(rèn)證和計(jì)帳的AAA技術(shù),CA技術(shù),PKI技術(shù),密鑰體系,加解密技術(shù)等,以及網(wǎng)絡(luò)安全技術(shù)、系統(tǒng)安全技術(shù)、應(yīng)用環(huán)境安全技術(shù)等,都是適用的,但要從面向數(shù)據(jù)和以數(shù)據(jù)為核心的角度進(jìn)行重新梳理,從數(shù)據(jù)安全的理念、理論、方法和受保護(hù)數(shù)據(jù)的應(yīng)用機(jī)制等方面,進(jìn)行適應(yīng)性研究和更進(jìn)一步的探討。
(2)數(shù)據(jù)的狀態(tài)機(jī)制。以面向?qū)ο蟮挠^點(diǎn)來(lái)看待數(shù)據(jù),數(shù)據(jù)除了其自身應(yīng)具有的價(jià)值外,還具有內(nèi)部屬性和外部狀態(tài)。從外部看,數(shù)據(jù)應(yīng)具有“數(shù)據(jù)態(tài)”和“應(yīng)用態(tài)”兩種狀態(tài)。要研究數(shù)據(jù)狀態(tài)的定義,數(shù)據(jù)狀態(tài)的設(shè)置和獲取,數(shù)據(jù)狀態(tài)的轉(zhuǎn)化,數(shù)據(jù)狀態(tài)的作用,數(shù)據(jù)狀態(tài)對(duì)環(huán)境的要求,數(shù)據(jù)狀態(tài)與數(shù)據(jù)加解密關(guān)系及作用機(jī)制等。
(3)數(shù)據(jù)固有安全屬性。數(shù)據(jù)的內(nèi)部屬性包括關(guān)鍵的數(shù)據(jù)安全屬性。要研究數(shù)據(jù)安全屬性的定義,數(shù)據(jù)安全屬性的內(nèi)容,數(shù)據(jù)具有的訪問(wèn)權(quán)限,數(shù)據(jù)安全性說(shuō)明,數(shù)據(jù)狀態(tài),數(shù)據(jù)的主人(數(shù)據(jù)權(quán)人)、朋友(被授權(quán)人)、陌生人(未授權(quán)人)和敵人(不受權(quán)人),數(shù)據(jù)讀寫權(quán)利,數(shù)據(jù)追加歷史記錄,數(shù)據(jù)的數(shù)字水印與防偽鑒別,數(shù)據(jù)授權(quán)記錄等。
(4)數(shù)據(jù)訪問(wèn)控制權(quán)限及管理機(jī)制。數(shù)據(jù)訪問(wèn)控制依賴于數(shù)據(jù)安全屬性,又與數(shù)據(jù)的加解密關(guān)系密切。過(guò)去的數(shù)據(jù)訪問(wèn)控制權(quán)限是由軟件所控制,由訪問(wèn)軟件控制數(shù)據(jù)的訪問(wèn),而數(shù)據(jù)本身則有可能加密也有可能不加密。當(dāng)另外的軟件訪問(wèn)數(shù)據(jù)時(shí),有可能繞過(guò)權(quán)限控制,例如越權(quán)訪問(wèn)數(shù)據(jù),造成對(duì)數(shù)據(jù)的非法訪問(wèn)和重要信息泄露。本文立足于數(shù)據(jù)“天生加密,授權(quán)使用”的觀念,數(shù)據(jù)的訪問(wèn)依據(jù)數(shù)據(jù)的安全屬性和訪問(wèn)者的身份,通過(guò)應(yīng)用授權(quán)、用戶授權(quán),再確定數(shù)據(jù)授權(quán),依據(jù)授權(quán)的方式和應(yīng)用的環(huán)境,提供解密密鑰或解密算法,實(shí)現(xiàn)數(shù)據(jù)的安全使用。其研究涉及數(shù)據(jù)的使用,還有數(shù)據(jù)的讀寫權(quán)限、修改權(quán)限、追加權(quán)限,數(shù)據(jù)的獲取,數(shù)據(jù)權(quán)人的確定,以及按照數(shù)據(jù)權(quán)人的身份信息進(jìn)行數(shù)據(jù)自動(dòng)加密和自動(dòng)注冊(cè)等。依照不同的應(yīng)用類型、不同的應(yīng)用場(chǎng)景、不同的用戶表現(xiàn)方式,這種數(shù)據(jù)訪問(wèn)控制方法及權(quán)限管理機(jī)制,需要深入開展研究。
(5)數(shù)據(jù)權(quán)限中心的作用和運(yùn)作機(jī)制。數(shù)據(jù)權(quán)限中心負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行安全保護(hù),并對(duì)數(shù)據(jù)的使用進(jìn)行授權(quán)管理和應(yīng)用安全管理。因此,數(shù)據(jù)權(quán)限中心要管理數(shù)據(jù)安全屬性,鑒別數(shù)據(jù)的合法性,設(shè)定數(shù)據(jù)的訪問(wèn)權(quán)限,認(rèn)證用戶和應(yīng)用,對(duì)數(shù)據(jù)進(jìn)行用戶和應(yīng)用授權(quán),對(duì)授權(quán)過(guò)程進(jìn)行記錄和計(jì)帳,對(duì)數(shù)據(jù)進(jìn)行加解密等。數(shù)據(jù)權(quán)限中心要與數(shù)據(jù)注冊(cè)中心配合,有關(guān)數(shù)據(jù)的屬性和權(quán)限等數(shù)據(jù),需要在數(shù)據(jù)注冊(cè)中心進(jìn)行注冊(cè)和登記;數(shù)據(jù)權(quán)限中心根據(jù)注冊(cè)的信息,對(duì)數(shù)據(jù)進(jìn)行監(jiān)控、授權(quán)、回收權(quán)利、認(rèn)證、計(jì)帳、加解密和新數(shù)據(jù)安全屬性注冊(cè)等操作。從內(nèi)部看,數(shù)據(jù)的使用過(guò)程就是數(shù)據(jù)的授權(quán)和不斷擴(kuò)大授權(quán)范圍的過(guò)程,計(jì)帳就是對(duì)這些授權(quán)的記錄,可以為后續(xù)的商業(yè)應(yīng)用奠定基礎(chǔ)。未來(lái)任何一個(gè)DOA平臺(tái),在提供數(shù)據(jù)管理和服務(wù)的同時(shí),也具備了數(shù)據(jù)商業(yè)運(yùn)作的基本能力。
(6)用戶認(rèn)證機(jī)制及證書授權(quán)(certificate authority,CA)技術(shù)。數(shù)據(jù)應(yīng)用授權(quán)是建立在用戶認(rèn)證的基礎(chǔ)上的。用戶認(rèn)證與用戶的屬性相關(guān),認(rèn)證過(guò)程是用戶注冊(cè)和管理維護(hù)過(guò)程。登記用戶信息是數(shù)據(jù)注冊(cè)中心重要的數(shù)據(jù)注冊(cè)內(nèi)容,也是數(shù)據(jù)權(quán)限中心需要用到的重要數(shù)據(jù)。用戶認(rèn)證技術(shù),可以采用傳統(tǒng)的CA技術(shù),需要有第三方權(quán)威中心或局部中心向用戶頒發(fā)用戶證書(私鑰)。同時(shí),數(shù)據(jù)和用戶之間通過(guò)數(shù)據(jù)安全屬性建立關(guān)聯(lián)關(guān)系。
(7)數(shù)據(jù)授權(quán)機(jī)制及與公鑰基礎(chǔ)設(shè)施(PKI)的關(guān)系。向用戶授權(quán)使用數(shù)據(jù),就需要將經(jīng)數(shù)據(jù)權(quán)人(數(shù)據(jù)的主人)公鑰加密的數(shù)據(jù)轉(zhuǎn)變成用被授權(quán)用戶(數(shù)據(jù)的朋友)公鑰加密的數(shù)據(jù),再提供給被授權(quán)用戶下載使用。當(dāng)遇到體量較大的數(shù)據(jù)時(shí),為提高加解密效率,用公鑰加密的應(yīng)該是對(duì)數(shù)據(jù)進(jìn)行對(duì)稱加密的密鑰,而不是數(shù)據(jù)本身。數(shù)據(jù)權(quán)限中心要提供這種基于PKI的加解密授權(quán)機(jī)制和方法。
數(shù)據(jù)權(quán)限中心的研究?jī)?nèi)容包括:數(shù)據(jù)合法性鑒定,數(shù)據(jù)使用記錄及溯源,數(shù)據(jù)計(jì)帳,多級(jí)授權(quán)及認(rèn)證,單個(gè)數(shù)據(jù)與批量數(shù)據(jù)或大數(shù)據(jù)量授權(quán)使用,密鑰體系,數(shù)據(jù)透明加解密策略和算法,加解密效率與安全性及授權(quán)過(guò)程的妥協(xié)關(guān)系,傳統(tǒng)數(shù)據(jù)傳輸加密技術(shù)適應(yīng)性,應(yīng)用環(huán)境安全保障,數(shù)據(jù)非法使用識(shí)別及數(shù)字水印技術(shù),數(shù)據(jù)權(quán)人權(quán)利和知識(shí)產(chǎn)權(quán)相關(guān)問(wèn)題等。
面向數(shù)據(jù)的體系結(jié)構(gòu)還將研究數(shù)據(jù)異常控制中心(DEC)機(jī)制和數(shù)據(jù)應(yīng)用單元機(jī)制。DEC是DOA的主要部件,對(duì)數(shù)據(jù)資源池進(jìn)行自適應(yīng)管理,也是數(shù)據(jù)生態(tài)系統(tǒng)的主要構(gòu)成,主要用于數(shù)據(jù)維護(hù),保證數(shù)據(jù)的唯一性、一致性、數(shù)據(jù)的自適應(yīng)管理和異常檢測(cè)與處理。研究?jī)?nèi)容具體包括數(shù)據(jù)一致性維護(hù)機(jī)制、數(shù)據(jù)動(dòng)態(tài)變化自適應(yīng)管理機(jī)制、數(shù)據(jù)一致性異常探測(cè)與處理機(jī)制、數(shù)據(jù)巡檢算法、數(shù)據(jù)異常與沖突發(fā)現(xiàn)算法、數(shù)據(jù)同步處理算法、數(shù)據(jù)冗余處理算法、熱數(shù)據(jù)自動(dòng)復(fù)制技術(shù)、冷數(shù)據(jù)自動(dòng)刪除技術(shù)、系統(tǒng)負(fù)載均衡技術(shù)等。
數(shù)據(jù)應(yīng)用單元(DAUs)是DOA的關(guān)鍵部件,關(guān)聯(lián)應(yīng)用對(duì)數(shù)據(jù)的訪問(wèn),對(duì)各種應(yīng)用提供支持。類似于構(gòu)件系統(tǒng),在數(shù)據(jù)資源池上,以模塊和積木方式提供API,供應(yīng)用系統(tǒng)直接調(diào)用,可以由易到難,由簡(jiǎn)到繁地構(gòu)建生態(tài)的應(yīng)用系統(tǒng)。DAUs以“數(shù)據(jù)驅(qū)動(dòng)應(yīng)用”的方式快速滿足用戶的應(yīng)用功能需求,包括若干數(shù)據(jù)應(yīng)用單元“DAU”組件。DFU為數(shù)據(jù)功能單元,根據(jù)不同的數(shù)據(jù)類型,提供不同的數(shù)據(jù)功能API;DSU為數(shù)據(jù)服務(wù)單元,以服務(wù)和推送提供不同需求的服務(wù)支持API;DVU為數(shù)據(jù)訪問(wèn)單元,根據(jù)權(quán)限,提供數(shù)據(jù)訪問(wèn)API;DCU為數(shù)據(jù)組合單元,提供服務(wù)聚合、功能和應(yīng)用組合的API;DUU為數(shù)據(jù)用戶單元,提供個(gè)性化應(yīng)用和可視化用戶界面API;DPU為數(shù)據(jù)處理單元,根據(jù)各種不同的應(yīng)用要求,集成一些專門的數(shù)據(jù)處理功能API。DAUs研究?jī)?nèi)容具體包括數(shù)據(jù)應(yīng)用單元的結(jié)構(gòu)規(guī)范、程序調(diào)用參數(shù)規(guī)范、數(shù)據(jù)訪問(wèn)規(guī)范、應(yīng)用注冊(cè)管理規(guī)范、應(yīng)用擴(kuò)展機(jī)制、授權(quán)數(shù)據(jù)訪問(wèn)機(jī)制、非授權(quán)數(shù)據(jù)訪問(wèn)識(shí)別、數(shù)據(jù)功能單元、數(shù)據(jù)服務(wù)單元、數(shù)據(jù)加解密單元、數(shù)據(jù)授權(quán)調(diào)用單元、數(shù)據(jù)應(yīng)用組合單元、數(shù)據(jù)可視化單元、數(shù)據(jù)處理單元等。
(1)大數(shù)據(jù)時(shí)代,信息技術(shù)領(lǐng)域長(zhǎng)期存在信息共享難,功能擴(kuò)展難,數(shù)據(jù)管理、分析和挖掘難,及軟件工程開發(fā)過(guò)程復(fù)雜,維護(hù)難,生命周期短,信息安全無(wú)法保障等問(wèn)題愈發(fā)突出[39],亟待解決。
(2)DOA是數(shù)據(jù)思維和數(shù)據(jù)世界觀的產(chǎn)物,在云計(jì)算的支撐下,從軟件體系結(jié)構(gòu)上解決問(wèn)題,突破現(xiàn)有軟件體系結(jié)構(gòu)的局限性,為大數(shù)據(jù)的研究、發(fā)展和應(yīng)用奠定了重要的基礎(chǔ)。
(3)DOA采用“面向數(shù)據(jù)和以數(shù)據(jù)為核心”的思想,通過(guò)DRC、DAC、DEC實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一定義和管理,通過(guò)DAUs實(shí)現(xiàn)各種應(yīng)用的管理和服務(wù),建立數(shù)據(jù)大平臺(tái)與碎片化應(yīng)用的數(shù)據(jù)生態(tài)系統(tǒng);通過(guò)數(shù)據(jù)“天生加密,授權(quán)使用”,建立從數(shù)據(jù)保護(hù)到授權(quán)應(yīng)用的整套機(jī)制。
(4)基于DOA的示范項(xiàng)目初步應(yīng)用表明,面向數(shù)據(jù)的體系結(jié)構(gòu)能有效解決大數(shù)據(jù)時(shí)代面臨的信息共享、系統(tǒng)功能擴(kuò)展、數(shù)據(jù)管理、大數(shù)據(jù)分析和挖掘支持、軟件工程、信息安全等軟件體系結(jié)構(gòu)方面的問(wèn)題和挑戰(zhàn)。
[1]Li Guojie.The scientific value of big data research[J].Communications of CCF,2012,8(9):8-15.
[2]Lee J,Lee G G.A data-driven grapheme-to-phoneme conversion method using dynamic contextual converting rules for Korean TTS systems[J].Computer Speech and Language,2009,23(4):423-434.
[3]Eskandarpour M,Dejax P,Miemczyk J,et al.Sustainable supply chain network design:an optimization-oriented review[J].Omega,2015,54:11-32.
[4]Jung S,Lee C,Kim K,et al.Data-driven user simulation for automated evaluation of spoken dialog systems[J].Computer Speech and Language,2009,23(4):479-509.
[5]Ma Yinglong,Zhang Xiaolan,Lu Ke.A graph distance based metric for data oriented workflow retrieval with variable time constraints[J].Expert Systems with Applications,2014,41 (4):1377-1388.
[6]Li Guojie,Cheng Xueqi.Research status and scientific thinking of big data[J].Bulletin of Chinese Academy of Science, 2012,27(6):647-657.
[7]Mayer-Schonberger V,Cukjer K.Arevolution that will transform how we live,work,and think[M].Hangzhou:Zhejiang People?s Publishing House,2013:1-23.
[8]Wu Hequan.Opportunities and challenges of big data era[J]. Weishi,2013(4):47-49.
[9]Zhu Yangyong.Big data data science and industry[R/OL]. Guilin:CCF Young Computer Scientists&Engineers Forum, 2013[2015-08-30].http://www.gliet.edu.cn/ExtGuetWeb/News/ Details?newID=90471.
[10]Zhang Hongli.Big data privacy protection problems[C/OL]// Second CCF Big Data Conference,Beijing,2014[2015-08-30].http://pasa-bigdata.nju.edu.cn/ccf-bigdata2014/.
[11]Hu Chunming,Gao Wen.Big data core technology and the application of BBS[C/OL]//Sixth China Cloud Computing Conference,Beijing,2014[2015-08-30].http://special.csdncms. csdn.net/ciecloud2014/.
[12]Ma Yun.Human being is from IT era to DT era[N/OL].Beijing Daily,2014-03-03[2015-08-30].http://bjrb.bjd.com.cn/ html/2014-03/03/content_156985.htm.
[13]Chen Xiang.The power of open source cloud computing on OpenStack[N].China Computer News,2012-04.
[14]Wang H M.Integration of OpenStack and Hadoop[EB/OL]. [2015-08-30].http://wenku.baidu.com/link?url=oJkSq33ZphugUSLL_EQUnVhOlVn6FFIr5Y0Rp-vhLgAtL-YsHAH-0Jo5B2JhyFyGHy-BmbXn3oBBUWeYoGC4xx_s1WtnA3ap-WkE7LoHEK2ga.
[15]Zhao Yongli,He Ruiying,Yang Hui,et al.Data center application oriented control architecture in multi-domain optical networks[J].Optik,2013,124(20):4260-4265.
[16]García-Valls M,Uriol-Resuela P,Ibá?ez-Vázquez F,et al. Low complexity reconfiguration for real-time data-intensive service-oriented applications[J].Future Generation Computer Systems,2014,37:191-200.
[17]Miao Fang.Data oriented architecture(DOA)[EB/OL].(2014-03)[2015-08-30].http://baike.baidu.com/subview/649092/ 12822804.htm#viewPageContent.
[18]Li Song,Qi Wenhua.Data-oriented architecture for system integration[J].Journal of Computer Applications,2012,32 (S2):85-88.
[19]Joshi R.Data-oriented architecture:a loosely-coupled realtime SOA[R/OL].(2007-08)[2015-08-30].http://rtcgroup. com/whitepapers/files/RTI_DataOrientedArchitecture_White-Paper.pdf.
[20]Joshi R.Data-oriented architecture:loosely coupling systems into“systems of systems”[R/OL].(2008-01)[2015-08-30].http://www.rtcmagazine.com/articles/view/100926.
[21]Liu Runda,Sun Jiulin,Liao Shunbao.Preliminary research on data licensing in scientific data sharing[J].Journal of Intelligence,2010,29(12):15-18.
[22]Li Xiaobo,Zhu Kongqiang,Jia Guangyu,et al.The idea of science data sharing technology platform[J].China Basic Science,2003(1):52-54.
[23]Sun Wei,Luo Zhilan,Zhang Wei.Research on management of science data sharing platform[J].Science of Science and Management,2005,26(12):32-36.
[24]Bryant R E,Katz R H,Lazowska E D.Big data computing: creating revolutionary breakthroughs in commerce,science and society[EB/OL].(2008-12-22)[2015-08-30].http://cra. org/ccc/wp-content/uploads/sites/2/2015/05/Big_Data.pdf.
[25]Ginsberg J,Mohebbi M H,Patel R S,et al.Detecting influenza epidemics using search engine query data[J].Nature, 2009,457(7232):1012-1014.
[26]Dean J,Ghemawat S.MapReduce:simplified data processing on large clusters[J].Communications of the ACM,2008,51 (1):107-113.
[27]Llopis N.Data-oriented design(or why you might be Shooting yourself in the foot with OOP)[EB/OL].(2009-04)[2015-08-30].http://gamesfromwithin.com/data-oriented-design.
[28]Li Qingquan,Li Deren.Big data GIS[J].Geomatics and Information Science of Wuhan University,2014,39(6):641-644.
[29]UN Global Pulse.Big data for development:challenges& opportunities[R/OL].(2012-10-02)[2015-08-30].http://www. unglobalpulse.org/sites/default/files/BigDataforDevelopment-UNGlobalPulseJune2012.pdf.
[30]Hey T,Tansley S,Tolle K.The fourth paradigm:data-intensive scientific discovery[M].[S.l.]:Microsoft Research,2009.
[31]Tu Zipei.All business digitization:specific ideas of traditional business transformation[EB/OL].(2015-02)[2015-08-30].http://tuzipei.baijia.baidu.com/article/47068.
[32]Agrawal D,Bernstein P,Bertino E,et al.Challenges and opportunities with big data—a community white paper developed by leading researchers across the United States[R/OL]. (2012-10-02)[2015-08-30].http://www.cra.org/ccc/files/docs/ init/bigdatawhitepaper.pdf.
[33]Chen Ken,Miao Fang,Yang Wenhui,et al.Design and implementation of emergency management system based on the DOA architecture[J].The Chinese Journal of Geological Hazard and Control,2013,24(3):94-99.
[34]Cheng Fuchao,Miao Fang,Yang Wenhui,et al.Designing and implementation of the distributed computing framework of massive remote sensing image[J].Computing Techniques for Geophysical and Geochemical Exploration,2014 (3):358-361.
[35]Guo Xirong,Miao Fang,Wang Huajun,et al.The research on digital tourism services platform based on G/S model architecture[J].Remote Sensing Technology and Appplication,2009,20(4):490-495.
[36]Guo Xirong,Miao Fang,Wang Huajun,et al.Preliminary on architecture of a spatial information network access model-G/S[J].Computer Applications and Software,2009, 26(10):72-74.
[37]Pete.Developing quality health care software since 1982 [EB/OL].Data-oriented System,Inc.[2015-08-30].http:// dataoriented.com/.
[38]Fan Wei,Chen Zhenyong,Xiong Zhang,et al,The Internet of data:a new idea to extend to the IOT in the digital world [J].Frontiers of Computer Science,2012,6(6):660-667.
[39]Shen Rongjun.Digital earth,making progress through applications[J].Journal of the Academy of Equipment Command&Technology,2009,20(1):1-6.
附中文參考文獻(xiàn):
[1]李國(guó)杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(9):8-15.
[6]李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國(guó)科學(xué)院院刊,2012,27(6):647-657.
[7]邁耶-舍恩伯格,庫(kù)克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社, 2013:1-23.
[8]鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].唯實(shí),2013(4):47-49.
[9]朱揚(yáng)勇.大數(shù)據(jù)數(shù)據(jù)科學(xué)與數(shù)據(jù)產(chǎn)業(yè)[R/OL].桂林:中國(guó)計(jì)算機(jī)學(xué)會(huì)青年計(jì)算機(jī)科技論壇,2013[2015-08-30].http:// www.gliet.edu.cn/ExtGuetWeb/News/Details?newID=90471.
[10]張宏莉.大數(shù)據(jù)隱私保護(hù)問(wèn)題[C/OL]//第二屆CCF大數(shù)據(jù)學(xué)術(shù)會(huì)議,北京,2014[2015-08-30].http://pasa-bigdata. nju.edu.cn/ccf-bigdata2014/.
[11]胡春明,高文.大數(shù)據(jù)核心技術(shù)與應(yīng)用論壇[C/OL]//第六屆中國(guó)云計(jì)算大會(huì),北京,2014[2015-08-30].http://special.csdncms.csdn.net/ciecloud2014/.
[12]馬云.人類正從IT時(shí)代走向DT時(shí)代[N/OL].北京日?qǐng)?bào),2014-03-03[2015-08-30].http://bjrb.bjd.com.cn/html/2014-03/03/content_156985.htm.
[13]陳翔.OpenStack開源云計(jì)算的力量[N].中國(guó)計(jì)算機(jī)報(bào), 2012-04.
[17]苗放.面向數(shù)據(jù)的體系結(jié)構(gòu)[EB/OL].(2014-03)[2015-08-30].http://baike.baidu.com/subview/649092/12822804.htm-#viewPageContent.
[18]李松,齊文華.面向數(shù)據(jù)的系統(tǒng)集成架構(gòu)[J].計(jì)算機(jī)應(yīng)用, 2012,32(S2):85-88.
[21]劉潤(rùn)達(dá),孫九林,廖順寶.科學(xué)數(shù)據(jù)共享中數(shù)據(jù)授權(quán)問(wèn)題初探[J].情報(bào)雜志,2010,29(12):15-18.
[22]李曉波,祝孔強(qiáng),賈光宇,等.科學(xué)數(shù)據(jù)共享技術(shù)平臺(tái)構(gòu)想[J].中國(guó)基礎(chǔ)科學(xué),2003(1):52-54.
[23]孫衛(wèi),羅之蘭,張蔚.科學(xué)數(shù)據(jù)共享平臺(tái)的數(shù)據(jù)管理研究[J].科學(xué)與科學(xué)技術(shù)管理,2005,26(12):32-36.
[28]李清泉,李德仁.大數(shù)據(jù)GIS[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2014,39(6):641-644.
[33]陳墾,苗放,楊文暉,等.基于DOA的應(yīng)急管理指揮系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].中國(guó)地質(zhì)災(zāi)害與防治學(xué)報(bào),2013,24(3): 94-99.
[34]程付超,苗放,楊文暉,等.適用于海量遙感影像的分布式計(jì)算框架設(shè)計(jì)與實(shí)現(xiàn)[J].物探化探計(jì)算技術(shù),2014(3): 358-361.
[35]郭曦榕,苗放,王華軍,等.基于G/S模式架構(gòu)的數(shù)字旅游服務(wù)平臺(tái)研究[J].遙感技術(shù)與應(yīng)用,2009,20(4):490-495.
[36]郭曦榕,苗放,王華軍,等.空間信息G/S網(wǎng)絡(luò)訪問(wèn)模式體系架構(gòu)初探[J].計(jì)算機(jī)應(yīng)用與軟件,2009,26(10):72-74.
[39]沈榮駿.數(shù)字地球,在應(yīng)用中求發(fā)展[J].裝備指揮技術(shù)學(xué)院學(xué)報(bào),2009,20(1):1-6.
MIAO Fang was born in 1958.He received the Ph.D.degree in geophysics from Chengdu University of Technology in 1990.Now he is a professor and Ph.D.supervisor at Chengdu University of Technology.His research interests include computer applications,spatial information technology,earth detection and information technology,cloud computing and big data management,etc.
苗放(1958—),男,北京人,1990年于成都理工大學(xué)獲得工學(xué)博士學(xué)位,現(xiàn)為成都理工大學(xué)教授、博士生導(dǎo)師,主要研究領(lǐng)域?yàn)橛?jì)算機(jī)應(yīng)用,空間信息技術(shù),地球探測(cè)與信息技術(shù),云計(jì)算,大數(shù)據(jù)等。發(fā)表學(xué)術(shù)論文160余篇,主持國(guó)家自然科學(xué)基金、國(guó)家863計(jì)劃、973計(jì)劃子課題等項(xiàng)目。
Discussion of Data-Oriented SoftwareArchitecture*
MIAO Fang1,2+
1.College of Geophysics,Chengdu University of Technology,Chengdu 610059,China
2.State Key Laboratory of Geohazard Prevention and Geoenvironment Protection,Chengdu 610059,China
E-mail:mf@cdut.edu.cn
The problems existing in the field of information technology for a long time are more and more serious due to the limitation of software architecture.Information between different systems is burdensome to share,and it is difficult to expand the built-up systems.Besides,data in massiveness,heterogeneity,various sources,real-time,dynamic and in explosive growth,are unmanageable,difficult to analyzing and mining.There are several problems in businessoriented software engineering,notably,it is hard to manage the process of developing and maintaining.The software life-cycle is not usually sustained.What is more,the problem of information security and data security is facing a challenge in network-opening environment.And more,the benefits of data owner will not usually be protected.This paper brings up a new architecture called data-oriented software architecture(DOA),which is designed by the ideology of“orienting data”and“data as kernel”.The DOA systems define,manage data and provide services through data register center(DRC),data authority center(DAC)and data exception control center(DEC).In addition,the data application units(DAUs)are designed to realize the management of various kinds of applications.The destination is to set up a data ecosystem for big data platforms and fragmented applications.This paper explores the architecture which consideringthe mechanism of data protection and authorization in the age of big data.
big data;software architecture;data-oriented architecture;data ecosystem;data register center;data authority center
2015-10,Accepted 2016-02.
10.3778/j.issn.1673-9418.1510042
A
TP31;TP39
*The National Natural Science Foundation of China under Grant No.61071121(國(guó)家自然科學(xué)基金);the Program of State Key Laboratory of Geohazard Prevention and Geoenvironment Protection(地質(zhì)災(zāi)害防治與地質(zhì)環(huán)境保護(hù)國(guó)家重點(diǎn)實(shí)驗(yàn)室項(xiàng)目).
CNKI網(wǎng)絡(luò)優(yōu)先出版:2016-02-03,http://www.cnki.net/kcms/detail/11.5602.TP.20160203.1126.012.html
MIAO Fang.Discussion of data-oriented software architecture.Journal of Frontiers of Computer Science and Technology,2016,10(10):1351-1364.