李強(qiáng),劉曉峰
1.太原理工大學(xué),山西 太原 030024
2.山西省財(cái)政稅務(wù)專(zhuān)科學(xué)校 信息學(xué)院,山西 太原 030024
伴隨著云計(jì)算技術(shù)的國(guó)內(nèi)發(fā)展,在未來(lái)15年的國(guó)家信息發(fā)展戰(zhàn)略中,將政務(wù)云平臺(tái)的建設(shè)作為實(shí)現(xiàn)資源整合的一個(gè)重要任務(wù)[1]。在此政策的鼓勵(lì)下,政務(wù)云的建設(shè)如雨后春筍般蓬勃發(fā)展,先后在幾個(gè)重點(diǎn)示范城市建立完成。同時(shí),國(guó)家工信部和其它部委聯(lián)合頒布了《國(guó)家電子政務(wù)“十二五規(guī)劃”》和《基于云計(jì)算的電子政務(wù)公共平臺(tái)頂層設(shè)計(jì)指南》,以及中央網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組制定了《電子政務(wù)云平臺(tái)服務(wù)考核評(píng)估方法》和《電子政務(wù)云平臺(tái)計(jì)費(fèi)參考標(biāo)準(zhǔn)》,為我國(guó)的政務(wù)云的建設(shè)指明了方向[2]。
隨著我國(guó)信息化技術(shù)的提高,為了更好地為科研工作提供基礎(chǔ)條件,科技部已經(jīng)陸續(xù)完成覆蓋實(shí)驗(yàn)基地和大型科學(xué)儀器設(shè)備、自然科技資源、科學(xué)數(shù)據(jù)、科技文獻(xiàn)等六大領(lǐng)域的科研基礎(chǔ)條件平臺(tái)的建設(shè)[3-5]。
隨著山西經(jīng)濟(jì)發(fā)展方向的轉(zhuǎn)型,山西省政府在2013年提出了《山西科技創(chuàng)新城建設(shè)總體方案》,為山西新的發(fā)展戰(zhàn)略方向指明方向,也為山西科技創(chuàng)新城提供規(guī)劃藍(lán)圖[6]。為了山西科技發(fā)展,山西省科技廳積極組織各方力量,逐步建設(shè)完成了山西省自然科技資源平臺(tái)、大型科學(xué)儀器協(xié)作共享平臺(tái)、技術(shù)轉(zhuǎn)讓服務(wù)平臺(tái)等[7],完善了山西科技創(chuàng)新城的內(nèi)容,推動(dòng)了太原市智慧城市建設(shè)的發(fā)展。
本文正是在全國(guó)云計(jì)算的推廣和山西省科技創(chuàng)新城的發(fā)展階段,提出一種云計(jì)算架構(gòu)方案來(lái)解決當(dāng)前科技系統(tǒng)存在的共享問(wèn)題。該方案不僅可以解決科研數(shù)據(jù)的海量存儲(chǔ),而且可以規(guī)范整個(gè)平臺(tái)的發(fā)展,使科研系統(tǒng)的開(kāi)發(fā)更加合理、更加科學(xué)。
科技信息系統(tǒng)主要包括數(shù)據(jù)、文獻(xiàn)、應(yīng)用軟件等軟資源。其使用對(duì)象主要包括高等院校、研究所、科技管理部門(mén)和高新技術(shù)企業(yè)和其它中介機(jī)構(gòu)。
現(xiàn)有的科技系統(tǒng)的主要特點(diǎn)主要有:一、數(shù)據(jù)量龐大,數(shù)據(jù)的生產(chǎn)很快,數(shù)據(jù)背后隱藏的價(jià)值很高。二、異構(gòu)應(yīng)用很多,并且要求互聯(lián)。如農(nóng)業(yè)科技應(yīng)用系統(tǒng)需要調(diào)用氣象或水利系統(tǒng)。三、專(zhuān)業(yè)化程度高,維護(hù)成本大。四、缺乏統(tǒng)一的開(kāi)發(fā)框架,設(shè)計(jì)需要規(guī)范指導(dǎo)。
當(dāng)前仍然存在一些問(wèn)題于我省的科技資源共享平臺(tái),雖然科技資源共享問(wèn)題在一定程度上通過(guò)科技共享網(wǎng)絡(luò)可以實(shí)現(xiàn),但是各個(gè)平臺(tái)之間仍然是孤立的,仍然處于“信息孤島”狀態(tài)。也就是說(shuō),傳統(tǒng)技術(shù)下無(wú)法徹底實(shí)現(xiàn)跨專(zhuān)業(yè)、跨學(xué)科的協(xié)同和共享,科技資源更廣范圍內(nèi)的共享仍然困難。云成為新技術(shù)發(fā)展出來(lái)的一種服務(wù)模式,具有突破傳統(tǒng)技術(shù)限制的優(yōu)勢(shì),更準(zhǔn)確地說(shuō),該技術(shù)將給科技資源共享帶來(lái)新的突破[8]。通過(guò)分析,當(dāng)前的科技系統(tǒng)的限制問(wèn)題可以按以下四點(diǎn)概括:
(1) 海量大數(shù)據(jù)如何存放和管理
隨著我省科技的不斷發(fā)展,不同部門(mén)、行業(yè)和研究院所將產(chǎn)生大量的數(shù)據(jù),現(xiàn)有的存儲(chǔ)方式已經(jīng)不能滿足科技資源信息的存儲(chǔ)的需要。以湖北省科技信息研究院擁有的文獻(xiàn)資源為例,清華同方在湖北的機(jī)構(gòu)數(shù)字圖書(shū)館擁有原文38T,維普10T,并以每年3~5T的速度增長(zhǎng)。
最直接的辦法是給服務(wù)器增加硬盤(pán),但是經(jīng)驗(yàn)告訴我們會(huì)有以下問(wèn)題出現(xiàn):①配套的硬盤(pán)可能已經(jīng)停產(chǎn),不易購(gòu)買(mǎi);②有限的硬盤(pán)槽數(shù)并不能隨意擴(kuò)展;③如果硬盤(pán)數(shù)量過(guò)多對(duì)主機(jī)的壓力會(huì)增大,影響系統(tǒng)的穩(wěn)定運(yùn)行;④對(duì)原有的磁盤(pán)陣列會(huì)產(chǎn)生丟數(shù)據(jù)的風(fēng)險(xiǎn)[9]。
為了適應(yīng)大數(shù)據(jù)存儲(chǔ)需喲啊滿足兩個(gè)條件:一個(gè)是對(duì)原有的設(shè)備不會(huì)產(chǎn)生影響;另一個(gè)是增加的存儲(chǔ)可以被系統(tǒng)能夠管理。這就需要存儲(chǔ)設(shè)備具備管理自己空間的能力,如磁盤(pán)陣列技術(shù)的兼容、磁盤(pán)的劃分等技術(shù)的支持。從原有的設(shè)備角度看,新的存儲(chǔ)空間應(yīng)與原有的管理空間保持一致[9]。
(2) 在海量數(shù)據(jù)中快速檢索數(shù)據(jù)
海量數(shù)據(jù)如何存儲(chǔ)問(wèn)題解決后,緊跟的問(wèn)題是如何在這些數(shù)據(jù)中快速并準(zhǔn)確檢索出需要的數(shù)據(jù)將是一個(gè)新的挑戰(zhàn)。
(3) 實(shí)現(xiàn)不同現(xiàn)有系統(tǒng)的信息共享
建立科技資源共享平臺(tái)的主旨是要實(shí)現(xiàn)各個(gè)現(xiàn)有系統(tǒng)的數(shù)據(jù)共享,并保護(hù)現(xiàn)有的IT資產(chǎn),最大的實(shí)現(xiàn)重復(fù)利用。實(shí)現(xiàn)現(xiàn)有系統(tǒng)的之間的互聯(lián)互通,信息共享是實(shí)現(xiàn)該平臺(tái)的最終目標(biāo),也是該平臺(tái)技術(shù)實(shí)現(xiàn)的難點(diǎn)。
(4) 設(shè)計(jì)總體架構(gòu)和方案
信息孤島,重復(fù)建設(shè),資源利用率不高,科技資源配置“碎片化”的形成是由于各個(gè)地區(qū)、部門(mén)之間科技資源發(fā)展不平衡,沒(méi)有具體統(tǒng)一的規(guī)劃方案和系統(tǒng)架構(gòu)所導(dǎo)致,避免該問(wèn)題的再次發(fā)生,就需要從整體和全局的角度上進(jìn)行一次徹底的規(guī)劃。
海量數(shù)據(jù)的存儲(chǔ)不僅僅是存儲(chǔ)設(shè)施的改變,更是技術(shù)整體方面的革新,它可以關(guān)系到整個(gè)系統(tǒng)的上層建設(shè),所以必須變革系統(tǒng)的整體架構(gòu),重新設(shè)計(jì)一套支持整體建設(shè)的技術(shù)方案是勢(shì)在必行的。
科技云平臺(tái)的實(shí)現(xiàn)將具有以下特點(diǎn):(1) 海量數(shù)據(jù)的存儲(chǔ),并滿足科技數(shù)據(jù)快速增長(zhǎng)的需求,存儲(chǔ)能力具備彈性。(2) 支持異構(gòu)系統(tǒng),可以實(shí)現(xiàn)跨平臺(tái)的訪問(wèn)。(3) 統(tǒng)一的維護(hù)、廉價(jià)設(shè)備的兼容將極大的降低建設(shè)期和維護(hù)期的費(fèi)用和成本。(4) 通過(guò)虛擬化管理,實(shí)現(xiàn)統(tǒng)一的訪問(wèn)接口,影藏了底層的異構(gòu)性,方便用戶(hù)使用。(5) 存儲(chǔ)算法使用副本冗余技術(shù),提高了系統(tǒng)在宕機(jī)時(shí)的恢復(fù)能力。(6) 具備不斷改進(jìn)的存儲(chǔ)算法和檢索算法,極大的提高了檢索海量數(shù)據(jù)的能力。(7) 使用池化技術(shù),將同類(lèi)同構(gòu)廉價(jià)設(shè)備虛擬成整體,提高了系統(tǒng)的整體新,統(tǒng)一的使用方式,透明了設(shè)備差異。
科技云平臺(tái)建設(shè)的必要性可以從兩方面來(lái)分析:第一方面,面向日益數(shù)據(jù)海量增長(zhǎng)的科技數(shù)據(jù)需要云存儲(chǔ)技術(shù)來(lái)解決。另一方面,大數(shù)據(jù)時(shí)代給科技資源的共享帶來(lái)新的問(wèn)題,需要云計(jì)算技術(shù)的支持。當(dāng)前,我國(guó)科技資源各個(gè)平臺(tái)獨(dú)立運(yùn)行、部門(mén)各自成塊,在此條件環(huán)境下科技資源的共享仍然存在一些問(wèn)題。云存儲(chǔ)技術(shù)在解決海量數(shù)據(jù)的存儲(chǔ)和共享方面具有的技術(shù)優(yōu)勢(shì)給科技資源共享帶來(lái)了機(jī)遇。結(jié)合科技資源具有的大數(shù)據(jù)特征和大數(shù)據(jù)帶來(lái)的機(jī)遇玉挑戰(zhàn),以及大數(shù)據(jù)需要云技術(shù)支持的關(guān)系,可以得出當(dāng)代的科技資源共享平臺(tái)必須由云計(jì)算技術(shù)來(lái)實(shí)現(xiàn),所以科技云平臺(tái)的建設(shè)是非常有必要的,是時(shí)代發(fā)展的要求[8]。
科技云平臺(tái)建設(shè)的意義主要有以下三點(diǎn): (1) 科技云平臺(tái)為科技系統(tǒng)的建設(shè)提供整體框架,可以通過(guò)該框架將現(xiàn)有的數(shù)據(jù)和應(yīng)用整合起來(lái),規(guī)范應(yīng)用開(kāi)發(fā)的接口。(2) 科技云平臺(tái)為海量科技數(shù)據(jù)的存儲(chǔ)提供支持。(3) 科技云平臺(tái)為跨應(yīng)用的使用提供統(tǒng)一的接入規(guī)范。
依據(jù)國(guó)建電子政務(wù)開(kāi)發(fā)指南,將系統(tǒng)的開(kāi)發(fā)分層設(shè)計(jì)以滿足不同應(yīng)用的設(shè)計(jì)要求和用戶(hù)的使用,同時(shí)滿足系統(tǒng)設(shè)計(jì)的靈活性[10-11]。如圖1所示,科技云平臺(tái)的架構(gòu)將規(guī)范化為多個(gè)層次,主要包括物理層、虛擬層、應(yīng)用支持層、應(yīng)用層和用戶(hù)層。
以上平臺(tái)架構(gòu)中,物理層存在于最底層,包括整個(gè)平臺(tái)建設(shè)和運(yùn)行中必須的硬件設(shè)施,包括硬件服務(wù)器、網(wǎng)絡(luò)設(shè)施和存儲(chǔ)設(shè)施。物理層上的虛擬層,主要通過(guò)池化技術(shù)將底層的異構(gòu)同類(lèi)設(shè)備整合成整體,為上層屏蔽底層細(xì)節(jié)差異。中間的應(yīng)用支撐層主要為應(yīng)用層提供獨(dú)立的功能,實(shí)現(xiàn)設(shè)計(jì)上靈活性。應(yīng)用層是直接為不同用戶(hù)需求量身定做的應(yīng)用,是整個(gè)平臺(tái)開(kāi)發(fā)的核心。
圖 1 中的用戶(hù)層里,企業(yè)、高等學(xué)校和科研機(jī)構(gòu)是該云平臺(tái)的主要使用對(duì)象,科研管理機(jī)構(gòu)不僅負(fù)責(zé)指導(dǎo)和規(guī)范該科技平臺(tái)的建設(shè),而且負(fù)責(zé)系統(tǒng)的管理和維護(hù)工作。此外,中介機(jī)構(gòu)也是使用該系統(tǒng)一類(lèi)的用戶(hù),負(fù)責(zé)技術(shù)和產(chǎn)品的推廣和轉(zhuǎn)化工作。
根據(jù)系統(tǒng)需求分析,科技云系統(tǒng)中的服務(wù)應(yīng)用可以分為五類(lèi),主要有:
第一類(lèi)是通用應(yīng)用,為平臺(tái)提供一般的通用應(yīng)用,其目的在于方便用戶(hù)使用該平臺(tái),主要有全文檢索、通知公告等。
第二類(lèi)實(shí)現(xiàn)知識(shí)應(yīng)用,為科研用戶(hù)提供基礎(chǔ)條件服務(wù),提供智力支持,主要包括文獻(xiàn)檢索和專(zhuān)家咨詢(xún)服務(wù)。用戶(hù)可以通過(guò)關(guān)鍵字、主題、題名等主要特征查詢(xún)研究過(guò)程中的重要文獻(xiàn)。專(zhuān)家咨詢(xún)提供一種互動(dòng)平臺(tái),實(shí)現(xiàn)用戶(hù)和專(zhuān)家溝通交流,為用戶(hù)提供專(zhuān)業(yè)上的指導(dǎo)和啟發(fā),其形式可以是留言板或“專(zhuān)家網(wǎng)上咨詢(xún)”的互動(dòng)方式。
第三類(lèi)是行政管理類(lèi)應(yīng)用,主要是輔助科研管理機(jī)構(gòu)實(shí)現(xiàn)科技部門(mén)的行政審批業(yè)務(wù),完成科研用戶(hù)的項(xiàng)目或獎(jiǎng)項(xiàng)的申報(bào)、審批、評(píng)審等流程。專(zhuān)家服務(wù)是科研機(jī)構(gòu)為組織和管理專(zhuān)家的而設(shè)立的輔助軟件,可以完成專(zhuān)家的申報(bào)、單位的核實(shí)和科研管理機(jī)構(gòu)的審批。
圖1 系統(tǒng)的總體架構(gòu)Fig.1 Overall architecture of the system
圖2 平臺(tái)應(yīng)用Fig.2 Platform application
圖3 系統(tǒng)的虛擬化Fig.3 System virtualization
第四類(lèi)完成了科研資源管理,為科研活動(dòng)提供基礎(chǔ)條件支持,設(shè)計(jì)科研數(shù)據(jù)的共享、設(shè)備信息的公開(kāi)等。其中數(shù)據(jù)共享涉及自然科學(xué)數(shù)據(jù)、社會(huì)科學(xué)數(shù)據(jù)以及衍生數(shù)據(jù),是為完成科學(xué)活動(dòng)的前提條件。設(shè)備公開(kāi),為全社會(huì)實(shí)現(xiàn)設(shè)備共享使用提供信息先導(dǎo),實(shí)現(xiàn)了全社會(huì)的資源分配,降低了重復(fù)投資的成本。此外,科研資源管理還包括科研條件的六大條件基礎(chǔ)服務(wù),實(shí)現(xiàn)全面的科研支持。
第五類(lèi)是為中介機(jī)構(gòu)開(kāi)發(fā)的具體應(yīng)用,主要包括技術(shù)推廣服務(wù)和產(chǎn)品專(zhuān)利成果轉(zhuǎn)化服務(wù)。技術(shù)推廣為專(zhuān)家技術(shù)和科研用戶(hù)之間建立了橋梁,為科研活動(dòng)中的難題提供了支持。產(chǎn)品專(zhuān)利的轉(zhuǎn)化也為科研的成果市場(chǎng)化提供了平臺(tái),實(shí)現(xiàn)了科研壽命提供了資金支持。
科研活動(dòng)是一個(gè)涉及研發(fā)、推廣、使用和轉(zhuǎn)化等一系列的活動(dòng)構(gòu)成,也是智力、資金和人力等資源組合過(guò)程,其資源的配置往往決定了該科研的進(jìn)程甚至命運(yùn),所以可以科技云平臺(tái)將實(shí)現(xiàn)資源的科學(xué)快速配置,為科研的社會(huì)化提供支持。
虛擬化技術(shù)是云計(jì)算中的一項(xiàng)關(guān)鍵技術(shù),其平臺(tái)在虛擬層中將存儲(chǔ)集群、網(wǎng)絡(luò)設(shè)施、服務(wù)器和其它同類(lèi)設(shè)施通過(guò)虛擬化技術(shù),將同類(lèi)設(shè)施實(shí)現(xiàn)池化,即形成對(duì)用戶(hù)的透明的整體。如下圖3中描述,存儲(chǔ)1和存儲(chǔ)2集群通過(guò)池化技術(shù)形成一致化統(tǒng)一整體,同時(shí)屏蔽了廉價(jià)設(shè)備的差異。
本文首先通過(guò)云計(jì)算特點(diǎn)的歸納和當(dāng)前科技信息共享系統(tǒng)中存在的問(wèn)題,然后提出一種基于云計(jì)算的架構(gòu)方案實(shí)現(xiàn)規(guī)范化科技共享平臺(tái)的開(kāi)發(fā),不僅解決了海量科研數(shù)據(jù)的存儲(chǔ)問(wèn)題,而且統(tǒng)一了系統(tǒng)未來(lái)的發(fā)展方向。
此外,云計(jì)算平臺(tái)上存在的問(wèn)題還有很多,例如信息安全問(wèn)題,新舊系統(tǒng)的信息共享等。如何實(shí)現(xiàn)現(xiàn)有系統(tǒng)的互聯(lián)互通,將是我們下一個(gè)研究問(wèn)題。