摘要:通過論述P2P技術(shù)引出了網(wǎng)格(Grid)的概念,采用生活中電力資源的例子形象地解釋了網(wǎng)格技術(shù)這個(gè)新生事物,接著進(jìn)一步探討了網(wǎng)格技術(shù)的起源與發(fā)展、體系結(jié)構(gòu)、所面臨的問題以及網(wǎng)格(Grid)的發(fā)展現(xiàn)狀,最后通過分析P2P技術(shù)和網(wǎng)格技術(shù)的優(yōu)缺點(diǎn),提出兩者相互融合的觀點(diǎn)。
關(guān)鍵詞:P2P;分布式計(jì)算;網(wǎng)格;虛擬組織;資源共享;協(xié)作;標(biāo)準(zhǔn);優(yōu)質(zhì)服務(wù)
中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)04-1018-02
Exploration from the P2P Technology to Grid Technology
YUAN Xiu-li
(Department of Computer Jining College,Qufu 2731155,China)
Abstract:This thesis puts forword the grid concept through the elaboration of P2P technology, then vividly explains this newly-emerged thing-grid technolody using the example of electric power resources in our life. After that it further explores the origin and development of grid technology; the architecture of grid; the problems it faces now and its present situation. Finally this thesis analyzes the advantages and disadvantages of the P2P technology and the grid technology, and proposed the fused viewpoint mutually.
Key words:P2P;distributed computing;grid;hypothesized organization;resource sharing;cooperation;sandard;high-quality service
現(xiàn)在使用P2P技術(shù)的軟件比比皆是, 例如我們所熟悉的電騾(eMule)、迅雷(Thunder) 、酷狗(KuGoo)、易載(ezpeer)等下載軟件。P2P技術(shù)究竟意味著什么呢?關(guān)于P2P技術(shù)的兩種解釋或許可以說明這個(gè)問題。
一種是在1對(duì)1的終端上進(jìn)行數(shù)據(jù)交換的點(diǎn)對(duì)點(diǎn)(peer to peer),另一種是個(gè)人對(duì)個(gè)人(person to person)。這兩種沒有特別的區(qū)分,在技術(shù)類的書刊或雜志上,前者用得比較多,大眾化的網(wǎng)絡(luò)雜志上后者出現(xiàn)的比較多。不管哪一種,P2P就是客戶端之間直接交換信息的意思。
對(duì)等(P2P)計(jì)算是在Internet上實(shí)施分布式計(jì)算的新模式。在這種模式下,服務(wù)器與客戶端的界限消失了,網(wǎng)絡(luò)上的所有節(jié)點(diǎn)都可以“平等”共享其他節(jié)點(diǎn)的計(jì)算資源。IBM為對(duì)等(P2P)下了如下定義:對(duì)等系統(tǒng)由若干互聯(lián)協(xié)作的計(jì)算機(jī)構(gòu)成,且至少具有如下特征之一:系統(tǒng)依存于邊緣化(非中央式服務(wù)器)設(shè)備的主動(dòng)協(xié)作,每個(gè)成員直接從其他成員而不是從服務(wù)器的參與中受益;系統(tǒng)中成員同時(shí)扮演服務(wù)器與客戶機(jī)的角色;系統(tǒng)應(yīng)用的用戶能夠意識(shí)到彼此的存在,構(gòu)成一個(gè)虛擬或?qū)嶋H的群體。
現(xiàn)代的P2P技術(shù)具有非集中式、可擴(kuò)展性、健壯性、高性能/價(jià)格比、隱私保護(hù)、負(fù)載均衡等優(yōu)點(diǎn)。
P2P 系統(tǒng)一般要構(gòu)造一個(gè)非集中式的拓?fù)浣Y(jié)構(gòu),在構(gòu)造過程中需要解決系統(tǒng)中所包含的大量節(jié)點(diǎn)如何命名、組織以及確定節(jié)點(diǎn)的加入、離開方式、出錯(cuò)恢復(fù)等問題。
最新的成果都是基于DHT(Distributed Hash Table)的分布式查找和路由算法,通過分布式哈希函數(shù),將輸入的關(guān)鍵字惟一映射到某個(gè)節(jié)點(diǎn)上,然后通過某些路由算法同該節(jié)點(diǎn)建立連接。典型的這一類P2P網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)模型有網(wǎng)格(Grid)等案例。
網(wǎng)格(Grid)又稱網(wǎng)格計(jì)算(Grid Computing),在新世紀(jì)一開始就已經(jīng)慢慢的流行起來(lái)。然而他就像1993年的web技術(shù)一樣,給人們的印象是模糊不清的。人們對(duì)他的狂熱,可能更是源于網(wǎng)格技術(shù)神話般的前景:2020年的某個(gè)星期六晚上,無(wú)聊的你走到了一個(gè)類似現(xiàn)在顯示器一樣的東西面前,把網(wǎng)格專用線插進(jìn)了網(wǎng)格接口,你便開始了你的太空探索。你不需要擁有一個(gè)天文望遠(yuǎn)鏡,你不需要任何天文和圖像處理軟件,甚至你根本沒有CPU,或者顯卡,但你仍然可以觀測(cè)太空,找到一個(gè)星球,判斷它的年齡。而這一切,都源于網(wǎng)格。那時(shí)的網(wǎng)格,就像現(xiàn)在的電網(wǎng)(electric power grid)一樣,讓所有計(jì)算資源,甚至設(shè)備硬件,都像(analogy)現(xiàn)在的電力資源一樣,即插即用。
1 網(wǎng)格(Grid)的概念
網(wǎng)格(Grid)至今為止沒有一個(gè)標(biāo)準(zhǔn)的定義,簡(jiǎn)單的說,網(wǎng)格(Grid)是把整個(gè)互聯(lián)網(wǎng)整合成一臺(tái)巨大的超級(jí)計(jì)算機(jī),實(shí)現(xiàn)計(jì)算資源、存儲(chǔ)資源、數(shù)據(jù)資源、信息資源、知識(shí)資源、專家資源的全面共享。
網(wǎng)格計(jì)算主要研究在分布、異構(gòu)、自制的網(wǎng)絡(luò)資源環(huán)境上動(dòng)態(tài)建構(gòu)虛擬組織并實(shí)現(xiàn)跨自治域的資源共享與協(xié)同工作,資源的匯聚和共享是網(wǎng)格(Grid)最重要的特征,共享與協(xié)作是網(wǎng)格(Grid)的基本概念。
網(wǎng)格(Grid)被認(rèn)為是繼傳統(tǒng)Internet、Web之后的第三次浪潮,通俗地說,Internet實(shí)現(xiàn)了計(jì)算機(jī)系統(tǒng)與網(wǎng)絡(luò)設(shè)施的互連,Web實(shí)現(xiàn)了網(wǎng)頁(yè)的聯(lián)通, 使得信息的共享與獲取不受時(shí)空限制,而網(wǎng)格(Grid)則試圖實(shí)現(xiàn)在全球Internet范圍按需共享與整合各種IT資源,除了通常的信息與設(shè)備資源共享外,計(jì)算資源、數(shù)據(jù)資源和服務(wù)資源的有效聚和與廣泛共享是網(wǎng)格(Grid)區(qū)分以往共享技術(shù)的本質(zhì)特征,顯然,從WWW到Grid的發(fā)展導(dǎo)致了從信息共享到資源共享的飛躍。
2 網(wǎng)格(Grid)技術(shù)的起源與發(fā)展
網(wǎng)格(Grid)是在20世紀(jì)90年代中期為構(gòu)建先進(jìn)科學(xué)和工程分布式計(jì)算實(shí)施而引入的概念。
為什么叫網(wǎng)格(Grid)呢,這個(gè)詞是從電網(wǎng)(power grid)轉(zhuǎn)化過來(lái)的。就是說在網(wǎng)格的世界里,所有的計(jì)算機(jī)資源也像電力資源一樣,即插即用。 大家想當(dāng)你在用電的時(shí)候,你只需要把插頭插入插座就可以了。你不需要了解電從何方來(lái),電力在電網(wǎng)中有是怎么分配的。你什么都不用知道,你只要付給電力公司一筆錢,你就可以用電了。同樣的,網(wǎng)格也嘗試想實(shí)現(xiàn)這種模式。當(dāng)人們想用計(jì)算資源的時(shí)候,只需要插入網(wǎng)格插口,然后付錢就可以了。
網(wǎng)格的發(fā)展經(jīng)歷了三個(gè)階段,如圖1所示。
3 網(wǎng)格(Grid)體系結(jié)構(gòu)
網(wǎng)格的體系結(jié)構(gòu)用五層沙漏模型表示,它定義了每一層的運(yùn)行機(jī)制、接口、模式和協(xié)議等,支持資源提供者和用戶之間通過協(xié)商建立資源共享關(guān)系。如圖2所示
基礎(chǔ)結(jié)構(gòu)層(fabric):定義本地(共享)資源接口,包括計(jì)算資源、數(shù)據(jù)存儲(chǔ)資源、網(wǎng)絡(luò)資源、軟件模塊或者其他系統(tǒng)資源等。
連接層:(connectivity):定義基本的通信和認(rèn)證協(xié)議,這些協(xié)議是針對(duì)專門的網(wǎng)格服務(wù)定義的。
資源層(resource):在連接層的通信和安全協(xié)議之上,該層定義了單個(gè)資源的共享操作協(xié)議,包括安全協(xié)商、初始化、監(jiān)測(cè)、控制、記賬和付費(fèi)等。
匯聚層(collective):負(fù)責(zé)全局資源的管理和資源集之間的交互。
應(yīng)用層(application):通過不同的協(xié)作和資源訪問協(xié)議使用網(wǎng)格資源。
GT2(Globus Toolkit 2.0)是上述五層體系結(jié)構(gòu)的一個(gè)典型實(shí)現(xiàn),它在異構(gòu)系統(tǒng)互聯(lián)協(xié)議、資源管理和協(xié)同工作幾個(gè)層次上解決了一些關(guān)鍵問題,為用戶創(chuàng)建和部署虛擬組織和網(wǎng)格系統(tǒng)提供資源管理、信息服務(wù)、數(shù)據(jù)管理、文件傳輸和安全機(jī)制等基本服務(wù)。
4 網(wǎng)格技術(shù)所面臨的問題
虛擬組織是網(wǎng)格(Grid)的核心概念,它由資源共享規(guī)則和約束條件定義的一組個(gè)體和機(jī)構(gòu)動(dòng)態(tài)構(gòu)成,虛擬組織的成員為了共享資源,需要按照這些規(guī)則和約束條件進(jìn)行協(xié)商。如何將這些跨區(qū)域的擁護(hù)、組織、服務(wù)和異構(gòu)資源映射到相應(yīng)的虛擬組織,是網(wǎng)格計(jì)算面臨的基本問題之一。
迄今為止,網(wǎng)格計(jì)算還沒有正式的標(biāo)準(zhǔn),但在核心技術(shù)上,相關(guān)機(jī)構(gòu)與企業(yè)已達(dá)成一致:由美國(guó)Argonne國(guó)家實(shí)驗(yàn)室與南加州大學(xué)信息科學(xué)學(xué)院(ISI)合作開發(fā)的Globus Toolkit已成為網(wǎng)格計(jì)算事實(shí)上的標(biāo)準(zhǔn),包括Entropia、IBM、Microsoft、Compaq、Cray、SGI、Sun、Veridian、Fujitsu、Hitachi、NEC在內(nèi)的12家計(jì)算機(jī)和軟件廠商已宣布將采用Globus Toolkit。作為一種開放架構(gòu)和開放標(biāo)準(zhǔn)基礎(chǔ)設(shè)施,Globus Toolkit提供了構(gòu)建網(wǎng)格應(yīng)用所需的很多基本服務(wù),如安全、資源發(fā)現(xiàn)、資源管理、數(shù)據(jù)訪問等。目前所有重大的網(wǎng)格項(xiàng)目都是基于Globus Tookit提供的協(xié)議與服務(wù)建設(shè)的。
除了標(biāo)準(zhǔn)以外,安全和可管理性、IT人才的缺乏也是網(wǎng)格技術(shù)亟待解決的一個(gè)問題??磥?lái)在網(wǎng)格技術(shù)實(shí)現(xiàn)商業(yè)應(yīng)用之前,還有很多的問題需要解決。
5 網(wǎng)格技術(shù)離我們有多遠(yuǎn)
網(wǎng)格技術(shù)憑借其獨(dú)特的計(jì)算力聯(lián)合和分布式計(jì)算模式,在學(xué)科研究、企業(yè)信息處理、電子政務(wù)、個(gè)人娛樂方面擁有廣泛的應(yīng)用前景。
現(xiàn)階段網(wǎng)格(Grid)主要用于解決復(fù)雜的計(jì)算問題,網(wǎng)格(Grid)最初也是為這個(gè)目的而發(fā)展起來(lái)的。很多研究項(xiàng)目(比如研究人類基因)需要大量的運(yùn)算,這些都可以在網(wǎng)格上輕松完成。網(wǎng)格計(jì)算技術(shù)已經(jīng)在物理學(xué)、地球科學(xué)、氣象科學(xué)和生物科學(xué)等科學(xué)研究領(lǐng)域得到應(yīng)用。網(wǎng)格能夠?yàn)榭绲赜颉⒖鐚W(xué)科的大型科學(xué)研究活動(dòng)提供協(xié)同工作支撐環(huán)境。
有觀點(diǎn)認(rèn)為,網(wǎng)格(Grid)進(jìn)入實(shí)際應(yīng)用離我們很遙遠(yuǎn),這一過程可能需要10~20年的時(shí)間。來(lái)自國(guó)內(nèi)生物醫(yī)藥、航空航天制造、勞動(dòng)與社會(huì)保障、國(guó)土資源、鐵路、政府等應(yīng)用部門的專家與從事網(wǎng)格技術(shù)研究的專家從應(yīng)用需求出發(fā)共同探討了我國(guó)網(wǎng)格研究的方向,認(rèn)為我國(guó)一些應(yīng)用部門正在做的事雖然所用的名詞不同,但是與網(wǎng)格技術(shù)的思路是一致的。網(wǎng)格(Grid)的應(yīng)用可以從一些具體的應(yīng)用做起,其中一些有較好應(yīng)用基礎(chǔ)的應(yīng)用項(xiàng)目,在兩三年之內(nèi)就有可能取得成效。
在我國(guó),已經(jīng)完成的網(wǎng)格(Grid)研究項(xiàng)目主要有清華大學(xué)的先進(jìn)計(jì)算基礎(chǔ)設(shè)施ACI(AdvancedComputational Infrastructure)和以中科院計(jì)算為主的國(guó)家高性能計(jì)算環(huán)境NHPCE(National High Performance Computing Environment)。
目前正在進(jìn)行的網(wǎng)格(Grid)研究項(xiàng)目有:
863 計(jì)劃支持的“中國(guó)網(wǎng)格(China Grid)”建設(shè),有多家單位參加。
“上海教育科研網(wǎng)格”,多所上海的大學(xué)參加。
“仿真網(wǎng)格”的研究,由航天二院和清華大學(xué)共同開展。
“織女星網(wǎng)格”,由中科院計(jì)算所領(lǐng)銜開發(fā)。
另外,全國(guó)還有幾十所大學(xué)和研究機(jī)構(gòu)已經(jīng)開展各種網(wǎng)格研究。
總之,在網(wǎng)格還沒成形的當(dāng)今,任何組織和研究人員都可能會(huì)對(duì)網(wǎng)格計(jì)算有不同的定義。但是不管怎樣,網(wǎng)格發(fā)展的本質(zhì)永不會(huì)變:
1)資源的共享:計(jì)算資源、存儲(chǔ)資源、數(shù)據(jù)資源、信息資源、知識(shí)資 源、專家資源
2)標(biāo)準(zhǔn)化,如web 的TCP/IP協(xié)議
3)優(yōu)質(zhì)的服務(wù)(QoS):包括快速,安全,高輸出,異構(gòu)性,容錯(cuò)能力等等
我想,理解了上面這三點(diǎn),你就真正懂得了什么是網(wǎng)格。
6 結(jié)束語(yǔ)
縱觀P2P技術(shù)和網(wǎng)格(Grid)技術(shù),兩者的優(yōu)缺點(diǎn)總結(jié)如圖3。
基于網(wǎng)格和 P2P 系統(tǒng)提供的互補(bǔ)優(yōu)點(diǎn),我們可以期望這兩種方法最終會(huì)殊途同歸,尤其是當(dāng)網(wǎng)格(Grid)達(dá)到 “網(wǎng)格件” 的開發(fā)階段時(shí),屆時(shí)這兩種技術(shù)都將成為一些公共工具。
參考文獻(xiàn):
[1] 許駿.網(wǎng)格計(jì)算與e-Learning Grid:體系結(jié)構(gòu) 關(guān)鍵技術(shù) 示范應(yīng)用.北京:科學(xué)出版社,2005.
[2] 田口美帆.互聯(lián)網(wǎng)技術(shù)[M].費(fèi)珍嵐 譯.科學(xué)出版社,2004.
[3] 王慶波.P2P計(jì)算技術(shù)所面臨的典型問題[M].2007.
[4] Matt Haynos.網(wǎng)格觀點(diǎn): 網(wǎng)格計(jì)算 —— 下一代分布式計(jì)算[M].2007.