李 勁,程秀峰,宋紅文,張 華
(1.湖北民族學(xué)院 信息工程學(xué)院,湖北恩施445000;2.華中師范大學(xué) 信息管理學(xué)院,湖北武漢430079;3.華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院,湖北武漢430079)
經(jīng)歷10多年的建設(shè)和發(fā)展,當(dāng)前國(guó)內(nèi)圖書(shū)館建設(shè)取得了長(zhǎng)足的進(jìn)步.隨著一系列數(shù)字圖書(shū)館建設(shè)項(xiàng)目的實(shí)施,在分布式環(huán)境下我國(guó)各級(jí)各類(lèi)圖書(shū)館累積了大量的實(shí)體館藏資源和虛擬館藏資源,以及基于這些館藏資源的服務(wù)系統(tǒng),逐步形成了以數(shù)字圖書(shū)館為主、實(shí)體圖書(shū)館為補(bǔ)充的復(fù)合圖書(shū)館形態(tài)[1].然而,隨著圖書(shū)館建設(shè)的發(fā)展,一方面,受到管理體制的相對(duì)孤立和陳舊的理念影響,使圖書(shū)館界長(zhǎng)期以來(lái)難以有效地開(kāi)展文獻(xiàn)資源共建共享工作,各圖書(shū)館都試圖通過(guò)加大其規(guī)模來(lái)滿足讀者的信息需求,結(jié)果導(dǎo)致各自為政、彼此孤立且難以協(xié)調(diào)的現(xiàn)象,館藏資源的重復(fù)建設(shè)造成嚴(yán)重的浪費(fèi),形成“館藏資源孤島”和“館藏資源超載”的現(xiàn)象;另一方面,用戶的需求發(fā)生了變化,由分散式獲取到集中式獲取,甚至一站式獲取,由對(duì)信息的需求轉(zhuǎn)變?yōu)閷?duì)知識(shí)的需求,用戶需求的這些變化迫切需要揭示和挖掘館藏信息資源中蘊(yùn)含的知識(shí)內(nèi)容及知識(shí)邏輯關(guān)系,以滿足用戶的需求.面對(duì)館藏資源建設(shè)存在的上述困境,迫切需要對(duì)數(shù)量龐大的異構(gòu)館藏資源進(jìn)行聚合與重組,同時(shí)將館藏資源及其語(yǔ)義關(guān)聯(lián)高效的提供給用戶,實(shí)現(xiàn)檢索過(guò)程與檢索結(jié)果的可視化.為解決這一問(wèn)題,本文在對(duì)Super-P2P、語(yǔ)義網(wǎng)格等技術(shù)進(jìn)行深入分析的基礎(chǔ)上,針對(duì)館藏資源建設(shè)的現(xiàn)狀,對(duì)館藏資源語(yǔ)義層次的深度集合進(jìn)行了深入的研究,提出了一個(gè)基于語(yǔ)義的館藏資源深度聚合模型,以滿足用戶獲取館藏資源中所蘊(yùn)含規(guī)律、模式、特色等知識(shí)性?xún)?nèi)容以及信息之間的語(yǔ)義關(guān)聯(lián)的需要.
David De Roure等人于2001年首次使用了語(yǔ)義網(wǎng)格(Semantic Grid)這一概念[2].語(yǔ)義網(wǎng)格技術(shù)作為一種新興的技術(shù),是對(duì)網(wǎng)格技術(shù)在語(yǔ)義能力上的一種擴(kuò)展[3].語(yǔ)義網(wǎng)格以O(shè)GSA和WSRF為基礎(chǔ),采用面向服務(wù)的體系結(jié)構(gòu),提供知識(shí)服務(wù)、基于知識(shí)的信息服務(wù)、基于知識(shí)的數(shù)據(jù)計(jì)算服務(wù)等,提供了更高級(jí)的知識(shí)共享和管理平臺(tái)[4].事實(shí)上,語(yǔ)義網(wǎng)格技術(shù)綜合了語(yǔ)義網(wǎng)技術(shù)、Web service技術(shù)、網(wǎng)格技術(shù)等長(zhǎng)處,集成了語(yǔ)義網(wǎng)的機(jī)器可理解能力和網(wǎng)格強(qiáng)大的計(jì)算能力,使得其產(chǎn)生很多綜合優(yōu)勢(shì),如規(guī)范組織、語(yǔ)義互聯(lián)和智能聚合等.語(yǔ)義網(wǎng)格技術(shù)的應(yīng)用可以為館藏資源構(gòu)建一個(gè)良好的中間環(huán)境,一方面,能形式化地描述知識(shí),使計(jì)算機(jī)理解語(yǔ)義,另一方面,使知識(shí)實(shí)現(xiàn)負(fù)載均衡與松散耦合,進(jìn)而有效地與服務(wù)和用戶整合[5].
P2P(Peer-to-Peer)也即“點(diǎn)對(duì)點(diǎn)”或“對(duì)等網(wǎng)”,其是一個(gè)以資源共享為目的的分布式的自組織資源系統(tǒng).在P2P系統(tǒng)中,每一節(jié)點(diǎn)同時(shí)具有客戶端和服務(wù)器的雙重角色,節(jié)點(diǎn)之間可以直接進(jìn)行點(diǎn)對(duì)點(diǎn)的通信,具有一定程度的自治性.P2P系統(tǒng)具有多方面的優(yōu)點(diǎn),主要體現(xiàn)在:可擴(kuò)展性、健壯性、負(fù)載均衡等[6].依據(jù)P2P網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)的不同,可將P2P網(wǎng)絡(luò)分為:純分散式P2P網(wǎng)絡(luò)、混合P2P網(wǎng)絡(luò)和超級(jí)P2P(Super-P2P)網(wǎng)絡(luò)三種類(lèi)型[7].在純分散式P2P網(wǎng)絡(luò)中沒(méi)有服務(wù)器,節(jié)點(diǎn)之間直接進(jìn)行互聯(lián);混合P2P網(wǎng)絡(luò)是結(jié)構(gòu)化P2P網(wǎng)絡(luò)和無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的一種折中選擇,其的構(gòu)建需要通過(guò)服務(wù)器進(jìn)行集中認(rèn)證,并建立相應(yīng)的索引機(jī)制;而在Super-P2P網(wǎng)絡(luò)結(jié)構(gòu)中,各節(jié)點(diǎn)在超級(jí)節(jié)點(diǎn)的控制下進(jìn)行互聯(lián).Super-P2P網(wǎng)絡(luò)與純分散式P2P網(wǎng)絡(luò)相比具有更強(qiáng)的可控性和安全性,網(wǎng)絡(luò)節(jié)點(diǎn)也比較容易發(fā)現(xiàn);而與混合P2P網(wǎng)絡(luò)相比,其具有較強(qiáng)的容錯(cuò)性和較好的可擴(kuò)展性[8].
圖1 基于語(yǔ)義的館藏資源深度聚合基本思想Fig.1 The basic idea of library resources polymerization based on deep semantic
當(dāng)前,我國(guó)館藏資源分布存儲(chǔ)在各公共圖書(shū)館和高校圖書(shū)館之中,受條塊分割的管理體制的影響,館藏資源孤島日益增多,館藏資源異構(gòu)性、資源語(yǔ)義的多重性日益嚴(yán)重,這就需要對(duì)不同區(qū)域的、各系統(tǒng)的圖書(shū)館間的異構(gòu)的、不同形式的館藏資源進(jìn)行整合,將知識(shí)管理的思想融入到館藏資源的構(gòu)建和組織過(guò)程之中,從語(yǔ)義層次上對(duì)館藏資源進(jìn)行深度聚合,以達(dá)到對(duì)館藏資源的優(yōu)化配置和充分利用[9].若要實(shí)現(xiàn)館藏資源語(yǔ)義層次上的聚合,首先,要解決館藏資源的語(yǔ)義揭示、存儲(chǔ)、計(jì)算和推理等問(wèn)題.然而,由于語(yǔ)義存儲(chǔ)、語(yǔ)義計(jì)算、語(yǔ)義推理等都需要消耗大量的計(jì)算和存儲(chǔ)資源,單靠集中式處理很難滿足需求,為突破集中式語(yǔ)義存儲(chǔ)瓶頸,本文在對(duì)館藏資源進(jìn)行語(yǔ)義聚合時(shí)融入了語(yǔ)義網(wǎng)格技術(shù)、Super-P2P技術(shù)的基本思想,提出建立在Super-P2P結(jié)構(gòu)和語(yǔ)義網(wǎng)格技術(shù)基礎(chǔ)上的館藏資源深度聚合的基本思路(如圖1所示).
從圖1可以看出,對(duì)館藏資源進(jìn)行基于語(yǔ)義的深度聚合的基本思路是:首先,根據(jù)本地區(qū)館藏資源的數(shù)量建設(shè)本地區(qū)語(yǔ)義網(wǎng)格節(jié)點(diǎn),該語(yǔ)義網(wǎng)格節(jié)點(diǎn)管理本地節(jié)點(diǎn)用戶為它們提供服務(wù),并與其他地區(qū)的Super-peer互聯(lián);而后,每個(gè)語(yǔ)義網(wǎng)格節(jié)點(diǎn)提供有本地區(qū)特色的知識(shí)服務(wù)體系;接著,多個(gè)語(yǔ)義網(wǎng)格節(jié)點(diǎn)互連為Super-P2P結(jié)構(gòu);最后,整個(gè)結(jié)構(gòu)可以擴(kuò)展,館藏機(jī)構(gòu)進(jìn)行申請(qǐng),獲準(zhǔn)后可以加入平臺(tái).
基于語(yǔ)義的館藏資源深度聚合的基本思路充分發(fā)揮了語(yǔ)義網(wǎng)格、Super-peer技術(shù)的技術(shù)優(yōu)勢(shì).由于語(yǔ)義網(wǎng)格技術(shù)一方面結(jié)合了網(wǎng)格計(jì)算研究領(lǐng)域的標(biāo)準(zhǔn)和技術(shù),另一方面結(jié)合了語(yǔ)義Web中有關(guān)網(wǎng)絡(luò)資源語(yǔ)義建模的標(biāo)準(zhǔn)和技術(shù),因此,能夠有效實(shí)現(xiàn)館藏資源的標(biāo)準(zhǔn)化和規(guī)范組織、語(yǔ)義互聯(lián)和智能聚合,以支持各自治圖書(shū)館的異構(gòu)應(yīng)用之間的無(wú)縫集成、語(yǔ)義互操作,實(shí)現(xiàn)館藏資源語(yǔ)義層次上的深度聚合,并能夠有效地支持語(yǔ)義查詢(xún)和知識(shí)資源的職能檢索和利用,以達(dá)到更好地滿足用戶需求的目的;而Super-peer技術(shù)則使得系統(tǒng)具有更強(qiáng)的可控性、容錯(cuò)性與可擴(kuò)展性,增強(qiáng)了系統(tǒng)的語(yǔ)義存儲(chǔ)和處理能力.因此,基于Super-P2P拓?fù)浣Y(jié)構(gòu)和語(yǔ)義網(wǎng)格技術(shù)的館藏資源深度聚合的基本思路,具有高效的語(yǔ)義存儲(chǔ)特性,強(qiáng)大的計(jì)算服務(wù)功能、良好的容錯(cuò)功能和可靠性以及較強(qiáng)的安全服務(wù)措施,使得建立在該基本思路之上的系統(tǒng)能夠更可靠、更安全地為用戶提供優(yōu)質(zhì)服務(wù).
圖2 基于語(yǔ)義的館藏資源深度聚合模型Fig.2 The model of library resources aggregation based on deep semantic
依據(jù)基于語(yǔ)義的館藏資源深度聚合的上述基本思想,本文設(shè)計(jì)了如圖2所示的基于語(yǔ)義的館藏資源深度聚合模型.從圖2可以看出該模型主要包括三個(gè)層次:聚合結(jié)構(gòu)層、網(wǎng)格結(jié)構(gòu)層和客戶端.具體來(lái)說(shuō),這三個(gè)層次之間的基本任務(wù)與相互關(guān)系如下:
1)聚合結(jié)構(gòu)層
聚合結(jié)構(gòu)層位于模型的最底層.首先,它由分布在不同區(qū)域的各圖書(shū)館對(duì)自己的館藏資源進(jìn)行語(yǔ)義標(biāo)注與索引,建立館藏資源編目、生成館藏資源對(duì)象;接著,建立反映本館館藏資源特征的本體資源庫(kù);然后,采取本體集成技術(shù)對(duì)各圖書(shū)館異構(gòu)的館藏資源本體進(jìn)行映射、對(duì)齊與合并,生成一個(gè)綜合的館藏資源本體庫(kù);最終,實(shí)現(xiàn)館藏資源語(yǔ)義層次上的聚合.需要指出的是,為提高語(yǔ)義聚合的效果,本文在語(yǔ)義聚合操作中,對(duì)于大量非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行處理時(shí)使用的是動(dòng)態(tài)聚合模式,而對(duì)于結(jié)構(gòu)化的館藏資源,采用的是靜態(tài)聚合模式.
2)網(wǎng)格結(jié)構(gòu)層
網(wǎng)格結(jié)構(gòu)層主要實(shí)現(xiàn)對(duì)現(xiàn)有的館藏資源體系進(jìn)行網(wǎng)格擴(kuò)展,搭建語(yǔ)義網(wǎng)格擴(kuò)展模型,在此基礎(chǔ)上構(gòu)建真正面向服務(wù)的深度聚合平臺(tái)可視化展示.具體來(lái)說(shuō),首先,配置網(wǎng)絡(luò)節(jié)點(diǎn);而后,對(duì)網(wǎng)格單元分配語(yǔ)義相似度等計(jì)算任務(wù),使用相關(guān)算法實(shí)現(xiàn)對(duì)查詢(xún)單元相關(guān)聯(lián)的語(yǔ)義單元實(shí)行調(diào)用,可以歸納為平臺(tái)任務(wù)分配模塊.該模塊主要負(fù)責(zé)根據(jù)語(yǔ)義數(shù)據(jù)計(jì)算與響應(yīng),將不同的語(yǔ)義數(shù)據(jù)分配到不同網(wǎng)格單元中進(jìn)行數(shù)據(jù)處理,并且通過(guò)Web服務(wù)讓遠(yuǎn)程節(jié)點(diǎn)獲得響應(yīng)后將語(yǔ)義信息通過(guò)XML-RPC或者SOAP等標(biāo)準(zhǔn)化信息交換傳輸?shù)侥康木W(wǎng)格單元.
3)客戶端
客戶端是滿足用戶需求的接口,位于模型的最頂層.為實(shí)現(xiàn)用戶對(duì)館藏資源的基于語(yǔ)義的知識(shí)檢索和館藏資源知識(shí)結(jié)構(gòu)的可視化展示,該模型提供的用戶檢索接口.不但,能夠記錄用戶提出的查詢(xún)信息,并將用戶信息存入本地內(nèi)存,以便于實(shí)現(xiàn)基于語(yǔ)義的情景檢索和知識(shí)導(dǎo)航;而且,在客戶端為用戶提供了各種面向用戶需求的實(shí)用工具,以實(shí)現(xiàn)館藏資源知識(shí)結(jié)構(gòu)的可視化展示,例如語(yǔ)義分析工具、分類(lèi)檢索工具、可視化展示工具等.借助于語(yǔ)義分析工具,用戶可以看到關(guān)聯(lián)信息的語(yǔ)義解釋?zhuān)约案鶕?jù)該語(yǔ)義解釋挖掘到的全部館藏資源;而借助于分類(lèi)檢索工具,用戶可以找到不同類(lèi)別下與檢索主題語(yǔ)義相關(guān)聯(lián)的數(shù)據(jù)資源;此外,借助于可視化展示工具,用戶可以通過(guò)對(duì)可視化功能的調(diào)整了解館藏資源語(yǔ)義分布、實(shí)體分布、內(nèi)容分布情況并根據(jù)分布情況進(jìn)行查詢(xún)導(dǎo)航.
面對(duì)館藏資源建設(shè)存在的困境,迫切需要對(duì)數(shù)量龐大的異構(gòu)館藏資源進(jìn)行聚合與重組,以消除“資源孤島”與“資源超載”現(xiàn)象,同時(shí)將館藏資源及其語(yǔ)義關(guān)聯(lián)高效的提供給用戶,實(shí)現(xiàn)檢索過(guò)程與檢索結(jié)果的可視化.因此,館藏資源的深度聚合正是館藏資源建設(shè)發(fā)展到一定規(guī)模與程度的必然要求,也是適應(yīng)信息環(huán)境和用戶需求變化的必然結(jié)果.為解決這一問(wèn)題,本文在對(duì)Super-P2P,語(yǔ)義網(wǎng)格等技術(shù)進(jìn)行深入分析的基礎(chǔ)上,針對(duì)館藏資源建設(shè)的現(xiàn)狀,對(duì)館藏資源語(yǔ)義層次的深度集合進(jìn)行了深入的研究,提出了一個(gè)基于語(yǔ)義的館藏資源深度聚合模型.該模型以用戶需求為導(dǎo)向,運(yùn)用相關(guān)的理論、方法與技術(shù)規(guī)范,揭示館藏資源內(nèi)部知識(shí)對(duì)象以及知識(shí)對(duì)象的語(yǔ)義關(guān)系,通過(guò)類(lèi)聚、融合和重組使分散無(wú)序、相對(duì)獨(dú)立的館藏資源重新組織為一個(gè)新的有機(jī)整體,以滿足用戶獲取館藏資源中所蘊(yùn)含規(guī)律、模式、特色等知識(shí)性?xún)?nèi)容以及信息之間的語(yǔ)義關(guān)聯(lián)的需要.
[1] 夏立新.復(fù)合圖書(shū)館:數(shù)字圖書(shū)館建設(shè)的新戰(zhàn)略[J].華中師范大學(xué)學(xué)報(bào):人文社會(huì)科學(xué)版,2011,50(5):120-129.
[2] 毛淑賢,朱桂鳳.一種新的資源管理技術(shù)-語(yǔ)義網(wǎng)格[J].現(xiàn)代電子技術(shù),2009(22):16-19.
[3] 朱愛(ài)華.基于語(yǔ)義網(wǎng)格的內(nèi)容管理系統(tǒng)[J].廣播與電視技術(shù),2009(1):34-39.
[4] 李明生.語(yǔ)義網(wǎng)格:語(yǔ)義網(wǎng)技術(shù)和網(wǎng)格的結(jié)合[J].情報(bào)雜志,2005(10):46-48.
[5] 畢強(qiáng),牟冬梅.語(yǔ)義網(wǎng)格環(huán)境下數(shù)字圖書(shū)館知識(shí)組織理論、方法及其過(guò)程研究[J].圖書(shū)情報(bào)工作,2007,51(8):6-9.
[6] 周文莉,吳曉非.P2P 技術(shù)綜述[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(1):76-79.
[7] 張聯(lián)峰,劉乃安,錢(qián)秀檳,等.綜述:對(duì)等網(wǎng)(P2P)技術(shù)[J].計(jì)算機(jī)工程與應(yīng)用,2003(12):142-145.
[8] 夏立新,程秀峰,桂思思.基于電子政務(wù)平臺(tái)查詢(xún)關(guān)鍵詞基礎(chǔ)多維護(hù)可視化聚類(lèi)分析研究[J].情報(bào)學(xué)報(bào),2012,31(4):352-361.
[9] 王文兵.2001-2010年國(guó)內(nèi)圖書(shū)館人力資源管理研究論文的計(jì)量分析[J].湖北民族學(xué)院學(xué)報(bào):自然科學(xué)版,2012,30(1):116-120.