馬曉亭 (蘭州商學院信息工程學院 甘肅蘭州 730020)
陳 臣 (蘭州商學院網絡中心 甘肅蘭州 730020)
云計算是一種新的數據計算、處理與管理模式,是一種多用戶條件下數據密集型的超級計算。用戶可根據云服務需求,按照“共享、按需、安全、經濟、透明、可擴展”的原則從云服務提供商購買云服務。Google宣稱,由于使用了云計算技術,其計算成本僅為競爭對手的1/100,存儲成本僅為競爭對手的1/30。
隨著云計算技術的發(fā)展與成熟,依靠云計算技術構建數字圖書館,為用戶提供高效、安全、經濟、個性化的云服務成為必然。在云圖書館建設中,效率、安全、成本、服務是決定云圖書館建設水平的四個關鍵要素。如何依據圖書館云用戶數量和云業(yè)務需求,提供相應的圖書館云服務風險管理,確保云圖書館較高的服務效率與用戶滿意度的前提下,加強以收益率為核心的云基礎設施采購、管理、運營、維護建設,不斷降低云圖書館建設與運營成本,是關系到云圖書館未來發(fā)展的重要問題。[1]
基于云計算技術的數字圖書館主要經歷建設、運營、維護、更新四個生命周期流程,生命周期流程中的投資主要包括硬件成本、軟件成本、帶寬成本、空間成本、電力成本、以及維護成本。不同云圖書館建設、運營、服務規(guī)模與管理理念的差異,導致云圖書館整體收益率不同。結合云圖書館四個生命周期流程對云圖書館成本構成進行有效劃分,并依據收益率最優(yōu)化原則分配資金及制定有效的資源分配及基礎設施管理策略,是提高云圖書館成本效率、安全及最優(yōu)化運營的保證。
為降低云圖書館建設、管理、運營、維護成本,確保在世界區(qū)域內為用戶提供安全、高效、滿意的云服務,基于云計算的數字圖書館在基礎設施建設中,應租賃具備較高信譽度、安全標準、技術水平的云服務提供商基礎設施資源。
世界上具備較高水準的云服務供應平臺有Google和Amazon的公有云計算平臺和IBM企業(yè)的私有云計算平臺。為確保數字圖書館云用戶不會因為地域、網絡接入方式、租賃費用及云個性化服務要求而影響云服務質量,云圖書館在建設中主要以租賃公有云基礎設施資源及云技術服務為主,結合自身云服務目標建設自己的云圖書館。我們依據地域最近和價格性能最優(yōu)化原則,選擇Amazon彈性云計算新加坡地區(qū)云基礎設施租賃數據,分析我國圖書館租賃Amazon云基礎設施資源建設云圖書館的成本問題 (Amazon彈性云計算新加坡地區(qū)云計算基礎設施資源包租收費情況見表1)。
表1 Amazon彈性云計算新加坡地區(qū)包租收費表
首先,根據2008年1月1日實施的《中華人民共和國企業(yè)所得稅稅法》,電子設備折舊年限最低為3年,因此將自購硬件系統(tǒng)的折舊周期定為3年。其次,由于基礎設施資源技術更新、OEM廠商的質保年限要求及設備折舊等因素,Amazon彈性云計算服務提供了以一至三年為基準的年度租賃方式。云圖書館可根據自身云業(yè)務與用戶云服務需求,選擇投資、收益比最高的租賃方式。
對表1數據分析可得,云計算基礎設施資源租賃費用是云圖書館建設、運營投資的主要方面。對租賃成本、效率分析,以年度為單位方式租賃基礎設施資源,其成本遠遠低于其它租賃方式,且數字圖書館以3年期為標準租賃方式是最經濟、高效的。
云圖書館數字服務具有并發(fā)用戶數海量及云計算高速、即時、準確的要求,因此,較快的CUP計算速度與較高的內存儲容量是云圖書館對云計算服務特有的要求。在云基礎設施資源服務購買上,特別要加強在CUP與內存儲容量方面的投資,防止因數字圖書館云計算速度過慢,而不能應對云圖書館數字用戶并發(fā)訪問數量過多、云個性化服務信息處理量過大等問題,導致云服務瓶頸現(xiàn)象的出現(xiàn)。[2]
云圖書館網絡帶寬是影響用戶云服務的關鍵性因素,在云圖書館建設、運營投資比例中僅次于基礎設施資源租賃成本,占有較大的投資比重。即使云數據中心基礎設施資源有較高的云計算、存儲、傳輸效能,云圖書館網絡帶寬傳輸瓶頸的出現(xiàn),也會導致用戶方產生云系統(tǒng)運行、應答緩慢,個性化云服務因數據傳輸量巨大而出現(xiàn)拒絕服務的現(xiàn)象。因此,云圖書館網絡具有較高的網絡傳輸帶寬租賃需求與數據流量海量特點 (Amazon彈性云計算新加坡地區(qū)數據流入/流出計費標準見表2)。
表2 Amazon彈性云計算新加坡地區(qū)數據流入/流出計費標準
對表2分析得出,Amazon對經Internet網絡傳輸的數據按照流入和流出云數據中心分別計費,并且流入云數據中心的數據傳輸費用為零。對于流出云數據中心數據的傳輸費用,隨著云用戶租賃數據中心每月數據流出量的增大,數據傳輸投資與傳輸數據量之比呈下降趨勢,云網絡傳輸投資效率呈級數上升狀態(tài)。當網絡每月數據傳輸量高于524TB時,云數字資源用戶可根據實際使用量與Amazon協(xié)商獲得更大優(yōu)惠,且優(yōu)惠幅度與數據傳輸量呈級數上升趨勢。因此,云圖書館利用較低的費用增加網絡傳輸帶寬及數據傳輸流量,可大幅提高云圖書館數據傳輸性能與云用戶服務滿意度,有較高的投資收益比。[3]
EBS是Amazon EC2(彈性云計算)的一種持久存儲特性,是為用戶在云中提供相當大的計算容量的基礎設施服務。利用Amazon EBS,云圖書館可以編程方式創(chuàng)建存儲容量,并附加到Amazon EC2實例上。甚至在需要更高的持久性時,還可以利用快照備份到Amazon簡單服務存儲上。
Elastic IP(EIP)是為動態(tài)云計算而設計的靜態(tài)IP。一個EIP地址關聯(lián)用戶賬號,EIP地址可以通過編程方式重新映射Public IP地址到用戶賬號關聯(lián)的任何一個實例。因此,允許用戶掩蓋實例或者Availablity Zone的錯誤,而不用重新配置或者替換新的主機。Amazon EC2通過編程方式重新映射用戶EIP地址到一個替換實例,達到處理實例或軟件問題(Amazon彈性云計算新加坡地區(qū)EBS存儲與彈性IP地址費用見表3)。
表3 Amazon彈性云計算新加坡地區(qū)EBS存儲與彈性IP地址費用
對表3數據分析可得,云圖書館可根據用戶彈性云計算的規(guī)模與需求選擇EBS存儲方式。在云計算環(huán)境下,云圖書館為用戶開放了許多高計算能力、大存儲容量的即時個性化云計算服務,從未來發(fā)展趨勢看,這種個性化云計算服務模式會成為圖書館云服務的主流與核心。因此,云圖書館采用以用戶請求次數作為EBS付費方式可以大幅節(jié)省云存儲成本。[4]
Amazon對正在使用的彈性IP地址不計費,未使用的IP地址每小時收費$0.01,每個月的頭100次IP的RemaP不計費,額外的RemaP每次收費$0.10。
Amazon云系統(tǒng)監(jiān)測可以對圖書館云資源和運行的云應用程序實施監(jiān)控。圖書館云系統(tǒng)開發(fā)人員和云系統(tǒng)管理員可以通過編程方式檢索監(jiān)測數據,查看采樣數值圖形并設置警報點。通過云監(jiān)控系統(tǒng),圖書館云系統(tǒng)管理員可及時對云系統(tǒng)資源利用率、云應用、服務指標、數據傳輸和存儲磁盤使用活動進行收集和跟蹤管理,并結合監(jiān)測數據及時對云系統(tǒng)安全、效率、業(yè)務參數進行配置,確保圖書館云系統(tǒng)、各項云應用程序和業(yè)務平穩(wěn)運行。[5]
Amazon云負載均衡采取資源統(tǒng)一管理與調度原則,將單個重負載的運算、存儲分擔到多臺節(jié)點設備上并行處理,計算結點設備將所得結果匯總。存儲節(jié)點設備根據業(yè)務繁重程度共同分擔存儲數據。當出現(xiàn)故障節(jié)點時,存儲任務均衡遷移到其它正常節(jié)點,確保云系統(tǒng)計算與存儲能力得到大幅度提高。通過彈性云負載均衡技術,可以解決圖書館云計算中應用系統(tǒng)的可用性和可靠性,提高云計算數據的訪問速度。Amazon彈性云計算新加坡地區(qū)云系統(tǒng)監(jiān)測與彈性負載均衡費用如表4所示:
表4 Amazon彈性云計算新加坡地區(qū)云系統(tǒng)監(jiān)測與彈性負載均衡費用
對表4分析可得,為確保云圖書館為用戶提供安全、高效、經濟、不間斷的云服務,在云系統(tǒng)監(jiān)測項目中,必須選擇對圖書館云中心采用較高監(jiān)測頻率的細節(jié)監(jiān)控方式。監(jiān)控內容包括云圖書館站點、服務器性能、網站安全掃描服務、故障分析、用戶訪問速度、警告通知等方面,且必須進行不間斷高標準監(jiān)控。雖然所采用的監(jiān)控方式為價格最高模式,但有性能與云安全最優(yōu)化的投資收益比。
圖書館提供的云計算數字服務以各種編碼方式的海量高速數據傳輸為主,數據傳輸具有海量、即時、安全、經濟的要求。因此,從收益率最大化出發(fā),在彈性負載均衡方面應選擇以每小時為單位的計費方式。[6]
云圖書館建設其它方面的成本主要包括機房建設成本、云應用軟件成本、電力及維護成本、人員工資及培訓成本等。機房建設成本與云圖書館建設規(guī)模和云服務方式成正比,基礎設施租用費用一般按照機架支付。軟件成本主要為基礎設施即服務(Infrastructure as a Service)的應用服務,主要有虛擬化平臺軟件、客戶端操作系統(tǒng)、存儲管理軟件及系統(tǒng)監(jiān)控管理軟件。在云圖書館總體成本中占有較小的比例,但對云用戶服務滿意度影響較大。因此,對云應用軟件較小的投入可得到較高的用戶滿意度收益率。電力及維護成本主要包括數據中心的IT負載、制冷、照明、UPS的耗電成本及維護成本,并隨著季節(jié)、云用戶服務數量、服務器工作效率呈周期性變化。隨著云計算系統(tǒng)集成復雜度及運營維護、安全標準的提高,電力及維護成本在未來云圖書館建設、運營中將逐步提高。人員工資及培訓成本在云圖書館建設投入中所占比例較小,但技術水平優(yōu)秀的員工對云系統(tǒng)高效、安全運營影響較大,因此,要加強云圖書館人員工資及培訓成本的投入。[7]
基于云計算的數字圖書館與傳統(tǒng)圖書館在建設、管理、運營、維護模式上相比,最大的優(yōu)勢在于大幅度降低能源消耗和有較低的成本效用,在確保低碳運營前提下提高了用戶滿意度與市場競爭力。如何加強云圖書館業(yè)務與規(guī)模建設,在提高云服務質量與效率前提下降低能源消耗,關系到未來云圖書館的發(fā)展與社會責任。
對表1云圖書館基礎設施租賃情況分析可得出,在云數據中心規(guī)模小、用戶數少、基礎設施結構簡單的情況下,利用虛擬化技術對云圖書館進行整合,會得到較小甚至負面的投資收益。當云數據中心規(guī)模較大、服務用戶數較多、云服務資源環(huán)境要求高、基礎設施結構復雜和數據存儲管理難度大的情況下,合理的虛擬化資源管理策略會提高系統(tǒng)投資收益率,并降低運營成本。
首先,要提高基礎設施(主要為計算與存儲服務器)資源虛擬化的規(guī)模、程度和所占基礎設施資源設備的比例,實現(xiàn)虛擬化和物理基礎設施資源管理的高度可視化和可管控性。其次,通過虛擬化技術對計算和存儲資源進行整合,提升服務器資源的利用效率。根據圖書館云用戶需求動態(tài)分配云系統(tǒng)資源,提高云計算速度和成本效率,通過降低電力等能耗降低云圖書館運營成本。[8]
為了提高圖書館用戶云個性化服務水平,云圖書館應基于云租賃商基礎設施平臺,自主或與第三方合作開發(fā)各種云用戶滿意的個性化應用程序。圖書館云應用程序的可操作性、個性化、便捷性、經濟性是影響用戶滿意度的關鍵因素。因此,在圖書館云應用軟件系統(tǒng)建設中,要以圖書館云用戶個性化服務需求為指導,加強云圖書館應用程序與云租賃商云系統(tǒng)的融合,提高圖書館云系統(tǒng)內不同云應用程序間的整合。同時,應提高云圖書館自主或與第三方共同開發(fā)、運營云應用程序的效率,提升圖書館個性化云應用系統(tǒng)的可操作性與服務水平,降低程序開發(fā)成本與周期。[9]
由于云圖書館基礎設施具有規(guī)模龐大、結構復雜的特點,集群內部設備的性能、管理模式和系統(tǒng)資源利用率性能差異較大,會出現(xiàn)云系統(tǒng)不能將用戶提出的服務請求均衡交付服務器的情況,造成服務器有的過載有的空閑,最終導致云集群系統(tǒng)整體性能大幅下降。因此,必須采用科學、有效的負載均衡算法,將云圖書館用戶服務請求合理、均衡地分配給后臺各個服務器,當個別設備發(fā)生軟、硬件故障時,通過負載遷移確保云服務的不間斷性。
對云圖書館基礎設施租賃成本分析得出,云圖書館系統(tǒng)規(guī)模與集成化程度與投資收效率、云用戶服務滿意度成正比關系,與云系統(tǒng)維護成本、資源損耗收益率成反比關系。因此,在云圖書館建設中,要租賃大規(guī)模、高安全性的云服務提供商云系統(tǒng)服務,并選擇以3年為周期的租賃方式。在云系統(tǒng)集成中,即要考慮目前云用戶服務需求與高峰時期云系統(tǒng)負載量,同時又要兼顧未來圖書館系統(tǒng)云服務的可擴展性,確保在云服務租賃模式上有適當的基礎設施資源冗余度。[10]
在世界上不同的地域、季節(jié)與一天內不同時段,云圖書館數字用戶訪問量及服務負載有較大不同。云圖書館在云服務高峰期有較高的資源占用率和能源損耗,在云服務低峰值階段,如果不采取有效的云系統(tǒng)資源管理策略,則會造成不必要的云基礎設施資源及能源(云中心能耗以服務器及空調設備耗電為主)損耗。通過云系統(tǒng)資源精細管理策略,利用云系統(tǒng)軟件或者人工方法設置功耗管理的智能邏輯,可對服務器資源池進行合理調配。通過設備監(jiān)控系統(tǒng)將空閑服務器關機或者休眠,對冗余的云服務器資源暫時關機斷電,使其成本效用達到最優(yōu)化狀態(tài),在降低功耗基礎上提升云資源的可管理性。
對表2數據分析可得,網絡帶寬是影響云圖書館運營成本與服務質量的關鍵因素。網絡傳輸帶寬較小不能滿足用戶個性化云服務數據傳輸高速、安全、即時、準確的要求,導致數據傳輸速度遠遠低于云系統(tǒng)數據處理能力,降低了云基礎設施資源利用效率。網絡傳輸帶寬過高甚至超過云系統(tǒng)接收、發(fā)送與數據處理能力,會導致較高的網絡租賃費用而增加云圖書館運營成本。因此,為確保云圖書館網絡帶寬與云基礎設施資源使用效率達到最優(yōu)化均衡,必須認真分析云圖書館用戶網絡傳輸帶寬需求與云系統(tǒng)基礎設施資源接收、處理能力,通過最優(yōu)化均衡策略確保云圖書館網絡帶寬與基礎設施資源數據處理、存儲能力均衡。
影響云圖書館網絡使用用戶滿意度的幾個主要因素為云用戶連接數、云系統(tǒng)響應時間、數據傳輸量、傳輸穩(wěn)定性。決定基礎設施資源使用效率的因素為云計算能力、云系統(tǒng)讀取數據的速度、網絡傳輸帶寬。云系統(tǒng)應針對不同圖書館云應用、SLA(云計算服務級別協(xié)議)或者數字用戶云服務需求,將提升網絡帶寬與基礎設施資源使用效率均衡相結合,提升云網絡傳輸帶寬與基礎設施資源租賃的成本綜合效用。[11]
云計算技術在數字圖書館建設、運營、管理、維護中的應用,實現(xiàn)了云數字圖書館對信息系統(tǒng)資源與效率的自主可控管理。通過云基礎設施資源的智能化管理與按照云用戶需求智能化分配云系統(tǒng)資源,在降低能耗的基礎上大幅提高了數字圖書館云IT資源利用率。隨著未來云計算技術的產業(yè)化、規(guī)?;l(fā)展,云計算成本必將大幅降低。只有堅持以數字圖書館云用戶滿意度為目標,以高效投資收效率為指導,不斷加強基礎設施資源的虛擬化管理與云系統(tǒng)整合,才能建設用戶滿意的高效、經濟、安全、低碳的云數字圖書館。[12]
[1]王鵬.走進云計算[M].北京:人民郵電出版社,2009:121-135.
[2]馮丹.網絡存儲關鍵技術的研究及進展[J].移動通信,2009,33(11):35-38.
[3]陳康,鄭維民.云計算:系統(tǒng)實例與研究現(xiàn)狀[J].軟件學報,2009,20(5):1337-1348.
[4]Amazon.Amazon Elastic ComPute Cloud(AmazonEC2).2011[EB/OL].[2011-07-20].http://aws.amazon.eom/eeZ/.
[5]陳康,鄭緯民,云計算:系統(tǒng)實例與研究現(xiàn)狀[J],軟件學報,2009,5(5):57-58.
[6]屈志毅,蘇文洲,趙玲.一種基于信息分散算法的分布式數據存儲方案[J].計算機應用,2006,26(5):1102-1105.
[7]王慶波等.虛擬化與云計算[M].北京:電子工業(yè)出版社,2009:181-184.
[8]嚴莊.高校數字圖書館存儲整合研究[J].圖書館學研究,2010,(2):34-36.
[9]孫健,賈曉菁.Google云計算平臺的技術架構及對其成本的影響研究[J].電信科學,2010,(1):38-44.
[10]吳吉義等.云數據管理研究綜述[J].電信科學,2010,26(5):34-41.
[11]何國偉.IBM:虛擬化是“云計算”關鍵能力[J].計算機應用,2009,32( 11):35-36.
[12]周舒,張嵐嵐.云計算改善數字圖書館用戶體驗初探[J].圖書館學研究,2009,(4):28-30.