(浙江工業(yè)大學(xué)圖書館,浙江杭州310023)
云計(jì)算是以互聯(lián)網(wǎng)和計(jì)算機(jī)技術(shù)為基礎(chǔ)發(fā)展形成的新計(jì)算模式,實(shí)現(xiàn)了對(duì)共享可配置計(jì)算資源(網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、應(yīng)用和服務(wù)等)的方便、按需訪問;這些資源可以通過極小的管理代價(jià)或者與服務(wù)提供者的交互被快速地準(zhǔn)備和釋放[1]。自2007年谷歌提出云計(jì)算的理念以來,谷歌、IBM、微軟等IT巨頭紛紛把云計(jì)算作為自己未來發(fā)展的戰(zhàn)略核心,引發(fā)了新一輪IT技術(shù)的重大變革;而學(xué)術(shù)界也紛紛對(duì)云計(jì)算的技術(shù)、平臺(tái)、應(yīng)用、管理、安全等問題進(jìn)行了深入研究[2]。本文選取ISI Web of Science數(shù)據(jù)庫(kù)所收錄的云計(jì)算研究文獻(xiàn)數(shù)據(jù),借助CiteSpace II分析軟件繪制國(guó)際云計(jì)算研究的科學(xué)知識(shí)圖譜,分析有關(guān)云計(jì)算研究的國(guó)家分布情況、研究前沿、研究熱點(diǎn)及跨學(xué)科屬性問題,并探討云計(jì)算給高校帶來的機(jī)遇和挑戰(zhàn)。
在CiteSpaceII軟件界面內(nèi),網(wǎng)路節(jié)點(diǎn)選擇國(guó)家(Countuy),主題詞來源(Term Source)選擇文獻(xiàn)標(biāo)題(title)、摘要(abstract)、關(guān)鍵詞(descriptor)和標(biāo)識(shí)符(identifiers),算法選擇路徑搜索(pathfinder)算法,數(shù)據(jù)抽取對(duì)象為 top30,設(shè)置“Time Scaling”的值為1,即將2007-2013年分成7個(gè)時(shí)段進(jìn)行處理,閥值引文數(shù)量(C)、共被引頻次(CC)、共被引系數(shù)(CCC)分別設(shè)定為(2,2,20),(4,3,20),(3,3,20),運(yùn)行 CiteSpaceII,繪制國(guó)際云計(jì)算研究的國(guó)家分布知識(shí)圖譜。如圖1所示,其中圓形節(jié)點(diǎn)代表國(guó)家,發(fā)文量越多,節(jié)點(diǎn)越大[3]。
圖1 云計(jì)算研究的國(guó)家分布圖譜
表1 云計(jì)算研究的國(guó)家分布
由圖1和表1可以看出,按發(fā)文頻次排在前5位的國(guó)家分別為美國(guó)、中國(guó)、澳大利亞、英國(guó)和日本。這些國(guó)家在云計(jì)算發(fā)展中紛紛開展了一系列的戰(zhàn)略部署:美國(guó)聯(lián)邦政府于2011年2月正式發(fā)布了首份關(guān)于云計(jì)算的戰(zhàn)略報(bào)告——《聯(lián)邦政府云計(jì)劃戰(zhàn)略》,明確提出美國(guó)政府信息技術(shù)應(yīng)用向云遷移;中國(guó)國(guó)家發(fā)展和改革委員會(huì)于2010年5月發(fā)布的《關(guān)于當(dāng)前推進(jìn)高技術(shù)服務(wù)業(yè)發(fā)展有關(guān)工作的通知》中強(qiáng)調(diào)要發(fā)展面向市場(chǎng)的高性能計(jì)算和云計(jì)算服務(wù);澳大利亞政府于2011年出臺(tái)云計(jì)算戰(zhàn)略;英國(guó)政府在2011年11月宣布啟動(dòng)政府云服務(wù)G-Cloud,并投入6000萬英鎊建立公共云服務(wù)網(wǎng)絡(luò);日本于2010年8月發(fā)布了《云計(jì)算與日本競(jìng)爭(zhēng)力研究》報(bào)告等[4]。中國(guó)的云計(jì)算發(fā)展非常迅猛,2007年3月中國(guó)移動(dòng)啟動(dòng)了“大云”計(jì)劃;2008年6月IBM與無錫市共同建立了中國(guó)第一個(gè)云計(jì)算中心;2008年7月瑞星公司推出了基于互聯(lián)網(wǎng)的全新安全模式“云安全”計(jì)劃;同時(shí)用友推出了新一代在線營(yíng)銷服務(wù)“客盈門”云計(jì)算平臺(tái);2009年10月中國(guó)第一個(gè)自主產(chǎn)權(quán)的“云計(jì)算”平臺(tái)在廣東電子工業(yè)研究院投入使用;2010年1月北京市計(jì)算中心建成的20萬億次公共云計(jì)算平臺(tái)投入使用,等[5]。此外,從圖譜中可以看出,國(guó)家節(jié)點(diǎn)的連線非常少,或處于網(wǎng)絡(luò)的邊緣區(qū)域,且網(wǎng)絡(luò)密度僅為0.0151,說明目前還沒有形成廣泛的國(guó)際合作規(guī)模,各國(guó)關(guān)于云計(jì)算的學(xué)術(shù)交流和科研合作有待加強(qiáng)。
利用CiteSpace軟件中提供的突現(xiàn)詞探測(cè)(burstdetection)技術(shù)和算法,通過考察詞頻從大量的主題詞中探測(cè)出來,依據(jù)詞頻的變動(dòng)趨勢(shì),而不僅僅是頻次的高低,來揭示云計(jì)算研究的前沿領(lǐng)域和發(fā)展趨勢(shì)[6]。選擇突現(xiàn)詞(burst terms),其他策略不變,運(yùn)行CiteSpaceII后,檢測(cè)到云計(jì)算研究的5個(gè)突現(xiàn)詞,grid computing(網(wǎng)格計(jì)算)、distributed computing(分布式計(jì)算)、system(體系)、design(設(shè)計(jì))、measurement(評(píng)估)。因此,可以判斷云計(jì)算研究的前沿趨勢(shì)為:云計(jì)算的相關(guān)計(jì)算形式(分布式計(jì)算和網(wǎng)格計(jì)算)、云計(jì)算的體系結(jié)構(gòu)設(shè)計(jì)及評(píng)估等。
云計(jì)算是分布式計(jì)算、網(wǎng)格計(jì)算和并行計(jì)算的最新發(fā)展,或者說是這些計(jì)算機(jī)科學(xué)概念的商業(yè)實(shí)現(xiàn)。分布式計(jì)算是一門計(jì)算機(jī)科學(xué),它研究如何把一個(gè)需要非常巨大的計(jì)算能力才能解決的問題分成許多小的部分,然后把這些部分分配給許多計(jì)算機(jī)進(jìn)行處理,最后把這些計(jì)算結(jié)果綜合起來得到最終的結(jié)果。網(wǎng)格計(jì)算強(qiáng)調(diào)的是一個(gè)由多機(jī)構(gòu)組成的虛擬組織,多個(gè)機(jī)構(gòu)的不同服務(wù)器構(gòu)成一個(gè)虛擬組織為用戶提供一個(gè)強(qiáng)大的計(jì)算資源。很顯然,云計(jì)算屬于分布式計(jì)算的范疇,是以提供對(duì)外服務(wù)為導(dǎo)向的分布式計(jì)算形式。云計(jì)算把應(yīng)用和系統(tǒng)建立在大規(guī)模廉價(jià)服務(wù)器集群之上,通過基礎(chǔ)設(shè)施與上層應(yīng)用程序的協(xié)同構(gòu)建以達(dá)到最大效率地利用硬件資源的目的,以及通過軟件的方法容忍多個(gè)節(jié)點(diǎn)的錯(cuò)誤,達(dá)到了分布式計(jì)算系統(tǒng)可擴(kuò)展性和可靠性兩個(gè)方面的目標(biāo)[7]。
云計(jì)算的體系結(jié)構(gòu)是由5個(gè)主要部分構(gòu)成,分別為應(yīng)用層、平臺(tái)層、資源層、用戶訪問層、管理層。云計(jì)算的本質(zhì)是通過網(wǎng)絡(luò)提供服務(wù),因而其體系結(jié)構(gòu)的構(gòu)成以服務(wù)為核心。應(yīng)用層、平臺(tái)層、資源層這三層是云計(jì)算提供的不同層次的服務(wù)。資源層是指基礎(chǔ)架構(gòu)層面的云計(jì)算服務(wù),它把基礎(chǔ)架構(gòu)的各種功能提供給用戶,使得用戶可以基于這些服務(wù)搭建自己的應(yīng)用。這種服務(wù)可以提供虛擬化的資源,從而隱藏物理資源的復(fù)雜性;平臺(tái)層為用戶提供對(duì)資源層服務(wù)的封裝,使得用戶可以使用更高級(jí)的服務(wù)構(gòu)建自己的應(yīng)用;應(yīng)用層為用戶提供軟件服務(wù);用戶訪問層是方便用戶使用云計(jì)算服務(wù)所需的各種支撐服務(wù),針對(duì)每個(gè)層次的云計(jì)算服務(wù)都需要提供相應(yīng)的訪問接口;管理層是提供對(duì)所有層次云計(jì)算服務(wù)的管理功能[8]。
文獻(xiàn)的關(guān)鍵詞是文章的核心與精髓,是作者對(duì)文章主題的高度概括和凝練,有著很強(qiáng)的代表性。因此,對(duì)文章的關(guān)鍵詞進(jìn)行分析,頻次高的關(guān)鍵詞常被用來確定一個(gè)研究領(lǐng)域的熱點(diǎn)問題。另外,從文章中提取的名詞短語(yǔ)也可以在一定程度上代表某個(gè)學(xué)科領(lǐng)域的研究熱點(diǎn)[9]。在CiteSpaceII軟件界面,網(wǎng)絡(luò)節(jié)點(diǎn)選擇“Keyword”,并選定名詞短語(yǔ)(nonm phrase)作為節(jié)點(diǎn)類型,其他策略不變,運(yùn)行CiteSpaceII軟件,得到由關(guān)鍵詞和名詞短語(yǔ)組成的云計(jì)算研究熱點(diǎn)知識(shí)圖譜,如圖2所示,并提取相關(guān)高頻熱點(diǎn)詞匯。如表2。
由圖2和表2可以看出,出現(xiàn)頻次最高的關(guān)鍵詞是云計(jì)算(cloud computing),出現(xiàn)頻次高達(dá)491次。云計(jì)算這一關(guān)鍵詞表征云計(jì)算的理論研究,理論研究作為一個(gè)學(xué)科的基石,一直以來都是一個(gè)學(xué)科的研究核心,云計(jì)算也不例外。除cloud computing外,主要熱點(diǎn)詞匯還有管理(management)、虛擬化技術(shù)(virtualization)、系統(tǒng)(systems)、性能(performance)、網(wǎng)格計(jì)算(grid computing)、安全(security)、編程模型 MapReduce、設(shè)計(jì)(design)、建模(model)等。綜合起來可以判斷,國(guó)際云計(jì)算研究熱點(diǎn)問題主要有以下方面:云計(jì)算的管理、云計(jì)算的虛擬化技術(shù)、云計(jì)算與網(wǎng)格計(jì)算、云計(jì)算的安全、云計(jì)算的編程模型MapReduce和云計(jì)算的性能等。(1)云計(jì)算的管理:云計(jì)算資源規(guī)模龐大,服務(wù)器數(shù)量眾多并分布在不同的地點(diǎn),同時(shí)運(yùn)行著數(shù)百種應(yīng)用,如何有效地管理這些服務(wù)器,保證整個(gè)系統(tǒng)提供不間斷的服務(wù)是巨大的挑戰(zhàn)。(2)云計(jì)算的虛擬化技術(shù):虛擬化技術(shù)是實(shí)現(xiàn)云計(jì)算的最重要的技術(shù)基礎(chǔ),虛擬化技術(shù)實(shí)現(xiàn)了物理資源的邏輯抽象和統(tǒng)一表示。通過虛擬化技術(shù)可以提高資源的利用率,并能夠根據(jù)用戶業(yè)務(wù)需求的變化,快速、靈活地進(jìn)行資源部署。云計(jì)算實(shí)現(xiàn)包括服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、應(yīng)用等在內(nèi)的全系統(tǒng)虛擬化,對(duì)所有資源進(jìn)行統(tǒng)一管理、調(diào)配和監(jiān)控,進(jìn)而提高系統(tǒng)整體的靈活性并使之產(chǎn)生最大化的效益。(3)云計(jì)算與網(wǎng)格計(jì)算:網(wǎng)格計(jì)算是HPC發(fā)展到高級(jí)階段的一種技術(shù),云計(jì)算是HPC和網(wǎng)格計(jì)算技術(shù)在商業(yè)應(yīng)用領(lǐng)域的最新發(fā)展,可以說云計(jì)算是網(wǎng)格計(jì)算的擴(kuò)展和延伸,從云計(jì)算所必須具備的三個(gè)要素(瘦客戶端、網(wǎng)格計(jì)算、效用計(jì)算)可以看出網(wǎng)格計(jì)算在云計(jì)算中起到的關(guān)鍵作用。(4)云計(jì)算的安全:在云計(jì)算時(shí)代,信息安全面臨著更多的挑戰(zhàn)和機(jī)會(huì)。云計(jì)算一方面面臨著更多的安全威脅,需要云計(jì)算服務(wù)提供者和用戶根據(jù)自身情況建立相應(yīng)程度的信任并達(dá)成適宜的方案;另一方面云計(jì)算也可以集中安全相關(guān)資源,為用戶提供更優(yōu)質(zhì)、更廉價(jià)、更全面的云安全服務(wù)。MapReduce是Google開發(fā)的Java、Python、C++編程模型,它是一種簡(jiǎn)化的分布式編程模型和高效的任務(wù)調(diào)度模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算,嚴(yán)格的編程模型使云計(jì)算環(huán)境下的編程十分簡(jiǎn)單。
圖2 云計(jì)算研究熱點(diǎn)知識(shí)譜圖
表2 云計(jì)算研究高頻熱點(diǎn)詞匯
在CiteSpaceII軟件界面內(nèi),網(wǎng)路節(jié)點(diǎn)選擇Category(學(xué)科主題),其它策略不變,重新運(yùn)行CiteSpaceII,繪制國(guó)際云計(jì)算研究領(lǐng)域的學(xué)科主題共現(xiàn)知識(shí)圖譜(如圖3),圖中的圓圈代表節(jié)點(diǎn),節(jié)點(diǎn)的出現(xiàn)頻次代表所對(duì)應(yīng)學(xué)科的發(fā)文數(shù)量,頻次越高,節(jié)點(diǎn)越大,并提取相關(guān)高頻學(xué)科信息。如表3。
圖3 國(guó)際云計(jì)算研究的學(xué)科主題共現(xiàn)圖譜
表3 云計(jì)算研究所屬學(xué)科按被引頻次≥20由高到低排序
結(jié)合圖3和表3可以看出,云計(jì)算研究的主要學(xué)科領(lǐng)域按被引頻次排序?yàn)椋河?jì)算機(jī)科學(xué)、工程學(xué)、通信技術(shù)、圖書館情報(bào)學(xué)、生物技術(shù)和應(yīng)用微生物學(xué)、生化研究方法學(xué)、管理學(xué)、運(yùn)籌學(xué)與管理科學(xué)等。計(jì)算機(jī)科學(xué)、工程學(xué)和通信技術(shù)中的云計(jì)算研究主要集中在相關(guān)技術(shù)問題,比如虛擬化技術(shù)、網(wǎng)格計(jì)算、模型、管理和安全等。圖書館情報(bào)學(xué)中的云計(jì)算研究主要探討云計(jì)算給圖書館帶來的一些機(jī)遇和挑戰(zhàn),以及云計(jì)算技術(shù)結(jié)合數(shù)字圖書館的應(yīng)用等;而生物技術(shù)和應(yīng)用微生物學(xué)的云計(jì)算主要探討有關(guān)云計(jì)算的高速計(jì)算能力、高存儲(chǔ)量以及使用方便等特性在生物技術(shù)和應(yīng)用微生物學(xué)領(lǐng)域的應(yīng)用等。除此之外,我們可以看出云計(jì)算研究已經(jīng)深入到物理學(xué)、數(shù)學(xué)、醫(yī)療信息學(xué)、自動(dòng)化與控制系統(tǒng)等各個(gè)學(xué)科領(lǐng)域,是一門應(yīng)用性和綜合性非常強(qiáng)的學(xué)科。因此,加強(qiáng)學(xué)科之間的交流合作,充分利用各學(xué)科的學(xué)科優(yōu)勢(shì),是未來云計(jì)算研究的發(fā)展方向。
云計(jì)算將大大減少高校在軟硬件等基礎(chǔ)設(shè)施方面的一次性資金投入:云計(jì)算可以有效整合高?,F(xiàn)有的數(shù)據(jù)與計(jì)算資源,或者選擇性地將部分服務(wù)外包給專業(yè)云計(jì)算服務(wù)提供商,特別是對(duì)于一些常用辦公軟件、殺毒軟件等,可選擇云計(jì)算的服務(wù)模式以減少需要許可證的購(gòu)買量。云計(jì)算能夠促進(jìn)高校教育信息資源共享,真正實(shí)現(xiàn)資源整合:云計(jì)算可將繁重的高校教育信息的存儲(chǔ)與管理等工作外包出去,這樣現(xiàn)有分散孤立的、本地化的網(wǎng)絡(luò)信息平臺(tái)將轉(zhuǎn)變成為一個(gè)與具體IT基礎(chǔ)設(shè)施無關(guān)的強(qiáng)大的統(tǒng)一的通用信息平臺(tái)。云計(jì)算促進(jìn)高等教育遠(yuǎn)程化,提供全天侯且高質(zhì)量的教育服務(wù):利用云計(jì)算技術(shù),高??梢蕴峁┙?jīng)濟(jì)靈活的、定制可擴(kuò)展的租用式教育服務(wù),有利于提高高校信息化資源的利用率,為遠(yuǎn)程教育機(jī)構(gòu)以及終端學(xué)生提供多種形式的、全天候的、高質(zhì)量的服務(wù)。云計(jì)算能以較低的投入保證高校師生數(shù)據(jù)信息的可靠與安全:利用云計(jì)算技術(shù),可通過購(gòu)買服務(wù)(即云殺毒服務(wù)),而不是購(gòu)買軟件許可證的方式來實(shí)現(xiàn)校園內(nèi)部的計(jì)算機(jī)病毒防控工作。
云計(jì)算的應(yīng)用能夠很好地促進(jìn)高校信息化建設(shè)的經(jīng)濟(jì)性、有效性、便捷性、安全性等,但仍然面臨一定的挑戰(zhàn)。
從云計(jì)算的技術(shù)層面來看,云計(jì)算的許多相關(guān)技術(shù)如資源虛擬化技術(shù)、針對(duì)海量數(shù)據(jù)的有效管理、密集計(jì)算的有效調(diào)度、數(shù)據(jù)及計(jì)算資源的安全保證等目前仍處于發(fā)展中。具體可以包括:以云計(jì)算模式提供的計(jì)算服務(wù)和數(shù)據(jù)存儲(chǔ)服務(wù)的可用性;針對(duì)云存儲(chǔ)數(shù)據(jù)的丟失、破壞等的安全防范技術(shù);海量數(shù)據(jù)的傳輸瓶頸問題等。從云計(jì)算周邊環(huán)境來看,高校對(duì)于云計(jì)算的認(rèn)識(shí)還存在一定的局限,對(duì)于租用式服務(wù)以及托管業(yè)務(wù)數(shù)據(jù)等云使用方式還存在誤區(qū),特別是針對(duì)數(shù)據(jù)的安全性、服務(wù)的可靠性和收費(fèi)的延續(xù)性等方面還有著很多疑慮。另外,云計(jì)算面臨的最大挑戰(zhàn)還包括相關(guān)立法的滯后性,云計(jì)算模式中軟件的功用將通過大規(guī)模的計(jì)算能力和存儲(chǔ)能力加以放大,軟件不再是最主要的因素。傳統(tǒng)針對(duì)軟件類產(chǎn)品的版權(quán)保護(hù)模式已經(jīng)不再適用,針對(duì)云計(jì)算模式的軟件許可證等制度亟待出臺(tái)。
[1]雷萬云.云計(jì)算技術(shù)、平臺(tái)及應(yīng)用案例[M].北京:清華大學(xué)出版社,2011.7-8.
[2]李喬,鄭嘯.云計(jì)算研究現(xiàn)狀綜述[J].計(jì)算機(jī)科學(xué),2011,(4):32-37.
[3]Chen C.CiteSpace II:Detecting and visualizing emerging trends and transiend patterns in scientific literature[J].Journal of the American Society for Information Science and Technology,2006,(3):359-377.
[4]邱剛,李軍.主要國(guó)家云計(jì)算戰(zhàn)略及啟示[J].物聯(lián)網(wǎng)技術(shù),2012,(2):1-3.
[5]郎為民,等.中國(guó)云計(jì)算發(fā)展現(xiàn)狀研究[J].電信快報(bào),2011,(10):3-6.
[6]欒春娟,等,國(guó)際科技政策研究熱點(diǎn)與前沿的可視化分析[J].科學(xué)學(xué)研究,2009,(2):240-243.
[7]雷保華.云計(jì)算解碼技術(shù)架構(gòu)和產(chǎn)業(yè)運(yùn)營(yíng)[M].北京:電子工業(yè)出版社,2010.231-232.
[8]雷萬云,等.云計(jì)算企業(yè)信息化建設(shè)策略與實(shí)踐[M].北京:清華大學(xué)出版社,2010.24-26.
[9]侯海燕,等.當(dāng)代國(guó)際科學(xué)學(xué)研究熱點(diǎn)演進(jìn)趨勢(shì)知識(shí)圖譜[J].科研管理,2006,(3):90-96.
浙江工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2013年1期