周 宇 魏太亮 廖思琴
(1.南京大學(xué)信息管理學(xué)院,江蘇 南京 210023;2.西南科技大學(xué)圖書(shū)館,四川 綿陽(yáng) 621010;
3.中共四川省委黨校圖書(shū)館,四川 成都 610071)
?
·應(yīng)用研究·
基于Drupal的圖書(shū)館知識(shí)交流共享平臺(tái)構(gòu)建
周 宇1,2魏太亮3廖思琴2
(1.南京大學(xué)信息管理學(xué)院,江蘇 南京 210023;2.西南科技大學(xué)圖書(shū)館,四川 綿陽(yáng) 621010;
3.中共四川省委黨校圖書(shū)館,四川 成都 610071)
當(dāng)前國(guó)內(nèi)圖書(shū)館知識(shí)交流共享平臺(tái)少有針對(duì)讀者提交資源(如科研數(shù)據(jù)、讀者使用和生成內(nèi)容)的存儲(chǔ)、監(jiān)管和服務(wù),也沒(méi)有將上述數(shù)據(jù)與開(kāi)放數(shù)據(jù)云進(jìn)行整合。研究利用社會(huì)開(kāi)源內(nèi)容管理系統(tǒng)Drupal構(gòu)建圖書(shū)館知識(shí)交流共享平臺(tái)的方法,用以提供讀者學(xué)術(shù)信息交流、科研數(shù)據(jù)監(jiān)管、讀者生成和使用內(nèi)容管理和服務(wù)。研究過(guò)程包括:(1)分析圖書(shū)館和讀者對(duì)平臺(tái)的需求;(2)平臺(tái)功能和體系結(jié)構(gòu)設(shè)計(jì);(3)介紹用Drupal來(lái)構(gòu)建平臺(tái)的方法;(4)探討利用平臺(tái)進(jìn)行科研數(shù)據(jù)監(jiān)管和數(shù)據(jù)語(yǔ)義描述和關(guān)聯(lián)的方法。針對(duì)圖書(shū)館知識(shí)交流平臺(tái)在大數(shù)據(jù)和開(kāi)放數(shù)據(jù)云環(huán)境下的未來(lái)發(fā)展提出一系列對(duì)策和建議。
Drupal;知識(shí)共享;知識(shí)服務(wù);信息系統(tǒng)開(kāi)發(fā)
Web2.0環(huán)境下,圖書(shū)館不僅要提供各種海量的經(jīng)過(guò)有效集成的數(shù)字化信息資源,還要積極考慮針對(duì)科研數(shù)據(jù)、讀者生成內(nèi)容、讀者使用內(nèi)容等讀者提交內(nèi)容的管理和服務(wù),同時(shí)讓讀者基于上述數(shù)據(jù)進(jìn)行有效的讀者與館員、讀者與專(zhuān)家、讀者與讀者之間的信息和知識(shí)交流。科研數(shù)據(jù)指科學(xué)研究中通過(guò)測(cè)算、計(jì)量、觀察、訪談、調(diào)查、設(shè)計(jì)、建模等方法獲得的,并能以現(xiàn)代信息技術(shù)保存和獲取的記錄[1],譬如在線問(wèn)卷調(diào)查的原始記錄、新型材料性能測(cè)試的中間記錄等。 英國(guó)聯(lián)合信息系統(tǒng)委員會(huì)JISC列舉了對(duì)科研數(shù)據(jù)進(jìn)行管理的7個(gè)原因,包括(1)為新研究重用數(shù)據(jù);(2)從大量數(shù)據(jù)集中發(fā)現(xiàn)新的科學(xué)知識(shí);(3)保護(hù)獨(dú)一無(wú)二的不可重現(xiàn)的觀察數(shù)據(jù);(4)保留通過(guò)昂貴手段獲取的數(shù)據(jù);(5)加強(qiáng)當(dāng)前數(shù)據(jù)對(duì)科研項(xiàng)目的可用性;(6)保管法律要求保護(hù)的重要數(shù)據(jù);(7)驗(yàn)證公開(kāi)發(fā)布的研究結(jié)論[2]。讀者生成內(nèi)容指以任何形式在網(wǎng)絡(luò)上發(fā)表的由讀者創(chuàng)作的文字、圖片、音頻、視頻等內(nèi)容[3]。讀者使用內(nèi)容指讀者在學(xué)習(xí)和科研活動(dòng)中利用的各種圖書(shū)館尚未保存的參考資料和軟件。根據(jù)長(zhǎng)尾理論,當(dāng)讀者具有獨(dú)特信息資源需求并且可以創(chuàng)建和交流這些信息資源的時(shí)候,雖然單個(gè)讀者所創(chuàng)建和交流的信息資源量并不多,但所有讀者所創(chuàng)建和使用的信息資源總量所占據(jù)的份額,可以和主流信息資源市場(chǎng)份額相當(dāng),甚至更大[4]。這些信息資源,再加上讀者的解讀、描述、評(píng)價(jià)和建議,變成了可資利用的知識(shí)。因此,如何管理和傳播讀者創(chuàng)建和使用的信息或知識(shí)是圖書(shū)館的一項(xiàng)重要工作。隨著網(wǎng)絡(luò)傳播技術(shù)的發(fā)展,讀者對(duì)知識(shí)共享的要求日益提升,讀者只有通過(guò)知識(shí)的交流才能實(shí)現(xiàn)知識(shí)創(chuàng)新,知識(shí)也只有通過(guò)共享才能實(shí)現(xiàn)其價(jià)值。美國(guó)科學(xué)社會(huì)學(xué)家羅伯特·默頓(Robert K.Merton) 指出,任何科研成果都是社會(huì)協(xié)作的產(chǎn)物,并且應(yīng)該分配給全體社會(huì)成員,發(fā)現(xiàn)者和發(fā)明者不應(yīng)據(jù)為私有[5]。圖書(shū)館是國(guó)家和政府為滿足人們知識(shí)共享的需要而提供的一種制度性公共產(chǎn)品[6],為了營(yíng)造一種高效率的知識(shí)共享空間,知識(shí)交流共享平臺(tái)的建設(shè)就被提上了議程。知識(shí)交流共享平臺(tái)是指圖書(shū)館提供的以現(xiàn)代信息技術(shù)為基礎(chǔ),集合信息資源的加載、審核、發(fā)布、查閱、檢索、管理、交流等功能為一體的信息資源共享系統(tǒng),是用戶存儲(chǔ)和交流知識(shí)的重要工具[7]。知識(shí)交流共享平臺(tái)也可以理解為知識(shí)共享空間,是基于知識(shí)整合,以知識(shí)為共享對(duì)象,以人為中心,以泛在知識(shí)服務(wù)為特征,以知識(shí)管理為目的交互式網(wǎng)絡(luò)虛擬空間[8]。廣大的圖書(shū)館,尤其是中小型圖書(shū)館,面臨著經(jīng)費(fèi)、設(shè)備和技術(shù)方面的壓力,在構(gòu)建知識(shí)交流共享平臺(tái)的時(shí)候,各種開(kāi)源內(nèi)容管理系統(tǒng)是一種重要的備選技術(shù)方案,而Drupal是其中比較優(yōu)秀的一種。Drupal允許用戶在后臺(tái)主界面發(fā)布、編輯、修改內(nèi)容,支持協(xié)作環(huán)境中工作流的創(chuàng)建,對(duì)內(nèi)容結(jié)構(gòu)的定義有著完善的支持。Drupal經(jīng)初始安裝后,僅提供基本的功能框架,需要進(jìn)行個(gè)性化定制,萬(wàn)維網(wǎng)上有大量的模塊應(yīng)用于網(wǎng)站的個(gè)性化定制,截至2015年4月,全球有3萬(wàn)多名Web專(zhuān)家在更新Drupal并貢獻(xiàn)超過(guò)31 000個(gè)模塊,大量知名機(jī)構(gòu)采用Drupal構(gòu)建網(wǎng)站,支持RSS、BLOG、Wiki、語(yǔ)義網(wǎng)等Web2.0關(guān)鍵技術(shù)[9]。
本研究的目的:(1)從圖書(shū)館員和讀者兩個(gè)維度對(duì)知識(shí)交流共享平臺(tái)進(jìn)行需求分析;(2)對(duì)圖書(shū)館知識(shí)交流共享平臺(tái)進(jìn)行功能設(shè)計(jì)和結(jié)構(gòu)設(shè)計(jì);(3)制定一套科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述建議,探討利用Drupal語(yǔ)義支持模塊,把科研數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù)的方法;(4)針對(duì)大數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)云環(huán)境下的知識(shí)交流共享平臺(tái)建設(shè),提出對(duì)策和建議。
在知識(shí)交流共享平臺(tái)設(shè)計(jì)理念方面,曾群提出了泛在網(wǎng)絡(luò)環(huán)境下高校知識(shí)共享平臺(tái)資源建設(shè)系統(tǒng)架構(gòu)和遵循整體化、系統(tǒng)化、特色化、實(shí)用化的信息資源建設(shè)思想[7]。熊回香提出一個(gè)基于Web3.0的虛擬團(tuán)隊(duì)知識(shí)共享平臺(tái)架構(gòu)模型,包括多平臺(tái)跨語(yǔ)言知識(shí)交互、個(gè)性化知識(shí)服務(wù)、知識(shí)存儲(chǔ)3個(gè)模塊。并認(rèn)為Web3.0的特征(如跨平臺(tái)多終端信息交互、個(gè)性化信息聚合、跨語(yǔ)言服務(wù)等)可以為知識(shí)共享平臺(tái)建設(shè)提供技術(shù)支撐[10]。張?jiān)藕陀谛惴覙?gòu)建了高校教師隱性知識(shí)交流的掌上虛擬社區(qū),核心是針對(duì)專(zhuān)業(yè)前沿、交叉學(xué)科和教育技能,按照隱性知識(shí)交流主題確立、建立交流關(guān)系、隱形知識(shí)存儲(chǔ)流程來(lái)構(gòu)建平臺(tái)[11]。
在知識(shí)交流共享平臺(tái)設(shè)計(jì)實(shí)踐方面,劉會(huì)婷等人基于Drupal構(gòu)建了護(hù)理學(xué)學(xué)科信息服務(wù)平臺(tái),整合醫(yī)院圖書(shū)館館藏資源,為護(hù)理人員提供文獻(xiàn)資源推送、標(biāo)簽云揭示、個(gè)性化定制等Web2.0信息服務(wù)[12]。趙乃瑄和王海燕運(yùn)用Drupal和第三方模塊構(gòu)建了圖書(shū)館“學(xué)海拾貝”專(zhuān)欄,實(shí)現(xiàn)了新聞、娛樂(lè)和信息素質(zhì)教育視聽(tīng)資源的內(nèi)容管理[13]。李丹等人利用Drupal及其擴(kuò)展模塊,實(shí)現(xiàn)了一個(gè)混搭(Mashup)平臺(tái),及時(shí)發(fā)布來(lái)自異構(gòu)數(shù)據(jù)源(如OPAC、RSS新聞、Google圖書(shū))的數(shù)據(jù)[14]。當(dāng)前少有知識(shí)交流共享平臺(tái)用于語(yǔ)義擴(kuò)展研究實(shí)踐,夏翠娟等人利用Drupal和3組關(guān)聯(lián)數(shù)據(jù)支持模塊,將“中國(guó)歷史紀(jì)年和公元紀(jì)年對(duì)照表”發(fā)布成關(guān)聯(lián)數(shù)據(jù)[15]。任瑞娟等人使用Drupal7工具,利用各種語(yǔ)義網(wǎng)模塊,實(shí)現(xiàn)了學(xué)位論文、書(shū)目信息等多類(lèi)型學(xué)術(shù)資源的語(yǔ)義層面的集成[16]。
從國(guó)內(nèi)的研究進(jìn)展可以看出,當(dāng)前圖書(shū)館重視知識(shí)交流共享系統(tǒng)的構(gòu)建,有意識(shí)地建立讀者和各領(lǐng)域?qū)<抑g的交流,建立讀者和圖書(shū)館信息資源之間的連接,但國(guó)內(nèi)圖書(shū)館知識(shí)交流共享平臺(tái)少有針對(duì)科研數(shù)據(jù)、讀者使用和生成內(nèi)容的存儲(chǔ)、監(jiān)管和服務(wù),也沒(méi)有將上述數(shù)據(jù)進(jìn)行語(yǔ)義化擴(kuò)展并與開(kāi)放數(shù)據(jù)云進(jìn)行整合。Drupal內(nèi)容管理系統(tǒng)在圖書(shū)館中的應(yīng)用是當(dāng)前研究熱點(diǎn),遵循著從各種模塊安裝到通過(guò)混搭(Mashup)平臺(tái)集成異構(gòu)數(shù)據(jù)源,再到利用語(yǔ)義網(wǎng)模塊實(shí)現(xiàn)多類(lèi)型學(xué)術(shù)資源的語(yǔ)義關(guān)聯(lián)的發(fā)展路徑,從封閉發(fā)展到開(kāi)放,從數(shù)據(jù)集成發(fā)展到語(yǔ)義集成。本文研究利用Drupal開(kāi)源內(nèi)容管理系統(tǒng)來(lái)構(gòu)建一個(gè)主要針對(duì)科研數(shù)據(jù)、讀者使用和生成內(nèi)容的存儲(chǔ)、監(jiān)管和服務(wù)的圖書(shū)館知識(shí)交流共享平臺(tái)。
2.1 讀者的需求
知識(shí)交流共享平臺(tái)對(duì)讀者的價(jià)值主要體現(xiàn)在:(1)隨著萬(wàn)維網(wǎng)上的免費(fèi)信息資源越來(lái)越少,大量參考資料、工具性軟件、在線交流記錄和科研活動(dòng)過(guò)程中產(chǎn)生的數(shù)據(jù)需要存儲(chǔ)并重復(fù)使用;(2)不少科研項(xiàng)目資助機(jī)構(gòu)要求所有實(shí)驗(yàn)數(shù)據(jù)和研究成果必須呈繳到圖書(shū)館并被他人共享;(3)為讀者提供一個(gè)知識(shí)交流和協(xié)作創(chuàng)新的環(huán)境。
讀者對(duì)知識(shí)交流平臺(tái)的需求包括:(1)能夠存取日常學(xué)習(xí)中用到的學(xué)習(xí)資料(如課件、視頻、音頻、圖形圖像、軟件);(2)能夠存取科研過(guò)程中產(chǎn)生的研究數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù);(3)能夠上傳自己的創(chuàng)意(如論文、算法、模型、模擬等)并能和有相同興趣愛(ài)好的同學(xué)分享,通過(guò)協(xié)作開(kāi)發(fā),集合多人智力進(jìn)行完善;(4)能在線交流,交流內(nèi)容可以保存。
2.2 圖書(shū)館的需求
作為數(shù)字圖書(shū)館資源檢索平臺(tái)的輔助系統(tǒng),圖書(shū)館在構(gòu)建知識(shí)交流共享平臺(tái)時(shí)考慮的因素有:(1)操作維護(hù)簡(jiǎn)便、可擴(kuò)展性強(qiáng)、節(jié)約經(jīng)費(fèi)和人力、面向Web2.0技術(shù)、存儲(chǔ)安全和長(zhǎng)期保存;(2)能夠?qū)ψx者上傳的數(shù)據(jù)進(jìn)行審核、編輯和發(fā)布;(3)能夠以此為契機(jī),進(jìn)一步對(duì)讀者創(chuàng)建內(nèi)容中最具價(jià)值的部分—科研過(guò)程中產(chǎn)生的研究數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)進(jìn)行數(shù)據(jù)管理;(4)能夠提供對(duì)系統(tǒng)和數(shù)據(jù)的安全保障;(5)隨著資源數(shù)量的激增,引入分布式云存儲(chǔ)以及能夠提供對(duì)大數(shù)據(jù)的分析;(6)能夠?qū)⒖蒲袛?shù)據(jù)以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布。另外,圖書(shū)館有意愿保存和監(jiān)管的數(shù)據(jù)包括讀者生成內(nèi)容中的學(xué)術(shù)興趣型數(shù)據(jù)(不包括娛樂(lè)型、社交型、商業(yè)型和輿論型數(shù)據(jù))、準(zhǔn)確、完整、非拷貝的科研數(shù)據(jù)、無(wú)知識(shí)產(chǎn)權(quán)糾紛的參考資料和軟件。
3.1 平臺(tái)目標(biāo)
本文設(shè)計(jì)的圖書(shū)館知識(shí)交流共享平臺(tái)的目標(biāo)是提供讀者在學(xué)習(xí)和科研活動(dòng)中產(chǎn)生和使用數(shù)據(jù)的存儲(chǔ)、審核、發(fā)布、檢索、下載,提供支持讀者知識(shí)交流的環(huán)境以及多人協(xié)作創(chuàng)新環(huán)境,支持知識(shí)的有效集成以及在此基礎(chǔ)上的知識(shí)創(chuàng)新,此外,還包括對(duì)讀者創(chuàng)建內(nèi)容生命周期的數(shù)據(jù)監(jiān)管。平臺(tái)的使用者和資源建設(shè)者是讀者,平臺(tái)的管理者和數(shù)據(jù)的集成者是圖書(shū)館員。
3.2 功能和結(jié)構(gòu)設(shè)計(jì)
根據(jù)圖書(shū)館和讀者的需求,交流共享平臺(tái)根據(jù)功能被劃分為服務(wù)層、數(shù)據(jù)管理層和數(shù)據(jù)存儲(chǔ)層,見(jiàn)圖1。在服務(wù)層,軟件管理模塊提供讀者上傳和下載各種軟件或者自己開(kāi)發(fā)的信息系統(tǒng),“系統(tǒng)仿真”是一個(gè)衍生功能,用于在服務(wù)器上真實(shí)安裝讀者開(kāi)發(fā)的信息系統(tǒng),可在線進(jìn)行運(yùn)行和演示;經(jīng)典文獻(xiàn)模塊提供讀者上傳和下載各種參考文獻(xiàn),這些文獻(xiàn)可能與圖書(shū)館文獻(xiàn)資源重復(fù);科研數(shù)據(jù)模塊提供讀者上傳和下載科研數(shù)據(jù),由數(shù)據(jù)提供者通過(guò)接口進(jìn)行語(yǔ)義描述,確保科研數(shù)據(jù)可被其他讀者進(jìn)行運(yùn)行、驗(yàn)證和使用;檢索模塊提供讀者一站式檢索平臺(tái)中的所有內(nèi)容;論壇模塊發(fā)布重點(diǎn)熱點(diǎn)問(wèn)題提供讀者討論;博客/文章模塊提供讀者創(chuàng)建自己的博客或者發(fā)布一些自創(chuàng)的文章;在線交流模塊提供讀者利用PC端或者移動(dòng)終端進(jìn)行在線交流,所有交流記錄被保存在知識(shí)庫(kù)中。在數(shù)據(jù)管理層,平臺(tái)提供一系列功能用于讀者創(chuàng)建內(nèi)容、科研數(shù)據(jù)、讀者使用內(nèi)容的管理,包括審核、創(chuàng)建索引、數(shù)據(jù)集成、數(shù)據(jù)監(jiān)管等。在數(shù)據(jù)存儲(chǔ)層,系統(tǒng)針對(duì)潛在有價(jià)值的記錄進(jìn)行保存,除了讀者上傳的數(shù)據(jù),還包括讀者交流記錄和論壇留言,這些數(shù)據(jù)經(jīng)過(guò)整合并鏈接至關(guān)聯(lián)數(shù)據(jù)云。
圖1 平臺(tái)功能設(shè)計(jì)圖
在平臺(tái)的系統(tǒng)架構(gòu)方面,如果基于傳統(tǒng)的集中式訪問(wèn)模式,所有的讀者都集中訪問(wèn)一個(gè)站點(diǎn),勢(shì)必造成主站點(diǎn)不堪重負(fù),而且各學(xué)科知識(shí)交叉混合,不方便管理。圖2為本文設(shè)計(jì)的主分式圖書(shū)館知識(shí)交流共享平臺(tái)體系結(jié)構(gòu),該結(jié)構(gòu)的特點(diǎn)是建立多個(gè)子站點(diǎn),每個(gè)子站點(diǎn)只針對(duì)某個(gè)讀者群進(jìn)行服務(wù),使用單獨(dú)的存儲(chǔ)空間,每個(gè)子站點(diǎn)安裝在單獨(dú)的子站點(diǎn)或虛擬機(jī)上。最后,所有子站點(diǎn)的訪問(wèn)接口都集中在一臺(tái)服務(wù)器,即知識(shí)交流共享門(mén)戶,統(tǒng)一對(duì)外提供服務(wù)。知識(shí)交流共享門(mén)戶會(huì)定期從各子站點(diǎn)采集元數(shù)據(jù)和建立索引,提供針對(duì)各子站點(diǎn)的統(tǒng)一檢索界面。
每個(gè)子站點(diǎn)面對(duì)單獨(dú)的讀者群提供服務(wù),對(duì)子站點(diǎn)的劃分也就是對(duì)讀者群進(jìn)行劃分,有多種劃分方法,如高校圖書(shū)館的讀者群可按照學(xué)院和專(zhuān)業(yè)劃分,公共圖書(shū)館的讀者群可按照學(xué)科領(lǐng)域進(jìn)行劃分,劃分的時(shí)候應(yīng)大致保持子站點(diǎn)的負(fù)載均衡。
圖2 體系結(jié)構(gòu)設(shè)計(jì)圖
4.1 初始系統(tǒng)安裝
(1)配置服務(wù)器環(huán)境。下載和安裝Apache+PHP+MySQL服務(wù)器環(huán)境,啟動(dòng)Apache和MySQL服務(wù)。
(2)安裝Drupal。到官網(wǎng)下載最新版Drupal,將其解壓縮到Apache的dtdocs文件夾中;進(jìn)入MySQL管理端,新建一個(gè)數(shù)據(jù)庫(kù);打開(kāi)瀏覽器,輸入“http:∥服務(wù)器IP/drupal7/”進(jìn)入drupal的安裝界面進(jìn)行安裝。
4.2 模塊選擇
剛安裝好的Drupal系統(tǒng)功能簡(jiǎn)單,需要進(jìn)行個(gè)性化定制。功能模塊有兩個(gè)來(lái)源:一是Drupal系統(tǒng)內(nèi)置的模塊;二是互聯(lián)網(wǎng)上WEB開(kāi)發(fā)專(zhuān)家編寫(xiě)的第三方模塊。第三方模塊是為了彌補(bǔ)Drupal內(nèi)置的模塊功能欠缺,由Web專(zhuān)家開(kāi)發(fā)的具有特定功能的模塊。KCSP平臺(tái)需要用到的模塊及功能說(shuō)明見(jiàn)表1。
表1 知識(shí)交流共享平臺(tái)所需模塊及對(duì)應(yīng)功能(部分)
4.3 模塊配置
4.3.1 自帶核心模塊的配置
以管理員身份登錄后,選擇“Modules”,在核心模塊的列表中選擇需要的模塊并保存,回到管理控制臺(tái),選擇“內(nèi)容”,再選擇“添加內(nèi)容”的時(shí)候,就能夠選擇和使用新添加的模塊了,模塊創(chuàng)建好之后,可以將其訪問(wèn)入口放置在首頁(yè)的導(dǎo)航條或任意級(jí)別的目錄中。
4.3.2 第三方模塊的配置
在安裝模塊的界面,選擇“下載其他用戶貢獻(xiàn)的模塊”,輸入模塊的名稱(chēng)進(jìn)行檢索,檢索到模塊后有兩條路徑進(jìn)行安裝:①直接下載模塊,將文件解壓后拷貝到站點(diǎn)的“sitesallmodules”路徑中,然后在后臺(tái)“模塊”界面,啟用新安裝的模塊;②將模塊下載地址復(fù)制到“安裝新模塊”界面,點(diǎn)擊“安裝”即可,見(jiàn)圖3。
4.3.3 個(gè)性化配置
在一些特殊情況下,對(duì)于安裝好的模塊需要一些個(gè)性化配置。比如對(duì)于讀者撰寫(xiě)的文章以及上傳的經(jīng)典文獻(xiàn),數(shù)量太多,需要進(jìn)行分類(lèi)目錄管理。以“文章”目錄管理為例,需要按照如下4個(gè)步驟進(jìn)行配置:
①到“結(jié)構(gòu)”——“分類(lèi)”里創(chuàng)建需要的文章分類(lèi)列表;
②到“結(jié)構(gòu)”——“內(nèi)容類(lèi)型”——“字段管理”里為所需要的內(nèi)容類(lèi)型(Article)添加字段,字段包括想要設(shè)立的
圖3 第三方模塊下載界面
分類(lèi),字段類(lèi)型選“術(shù)語(yǔ)來(lái)源”;
③建立多個(gè)視圖(views),每個(gè)視圖包含一個(gè)術(shù)語(yǔ)類(lèi)目下的所有文章,每個(gè)視圖對(duì)應(yīng)一個(gè)網(wǎng)頁(yè),有單獨(dú)的訪問(wèn)地址;
④建立一個(gè)page,里面建立各類(lèi)目鏈接,鏈接到各個(gè)視圖。
圖4展示了文章分類(lèi)列表界面,用于發(fā)表讀者的原創(chuàng)性文章,作者可以為文章添加標(biāo)簽,上傳附件和指定類(lèi)別,標(biāo)簽以標(biāo)簽云的形式可視化,點(diǎn)擊標(biāo)簽打開(kāi)包含該標(biāo)簽的文章列表。按照同樣的操作,結(jié)合圖1的功能設(shè)計(jì)和表1中對(duì)應(yīng)的第三方程序模塊,可以很容易開(kāi)發(fā)出論壇、經(jīng)典文獻(xiàn)、軟件管理、在線交流等核心功能模塊。
圖4 利用視圖構(gòu)建的文章分類(lèi)列表
科研數(shù)據(jù)圖書(shū)館知識(shí)交流共享平臺(tái)中最有價(jià)值的知識(shí)資產(chǎn),針對(duì)科研數(shù)據(jù)的管理又叫數(shù)據(jù)監(jiān)管、數(shù)據(jù)策管、數(shù)據(jù)監(jiān)護(hù)或者Data Curation。VanHorik認(rèn)為應(yīng)認(rèn)真對(duì)待具有長(zhǎng)期利用價(jià)值的科研數(shù)據(jù):(1)科研數(shù)據(jù)必須可以分類(lèi)查找,體現(xiàn)關(guān)聯(lián)性;(2)必須是可獲取的;(3)必須以可使用的數(shù)據(jù)格式存在,讓常用軟件可以處理;(4)數(shù)據(jù)必須是權(quán)威可靠的,未經(jīng)過(guò)變動(dòng)的;(5)數(shù)據(jù)必須可持久地信賴,數(shù)據(jù)要有一個(gè)唯一標(biāo)識(shí)符,并且保存在可信任數(shù)據(jù)倉(cāng)儲(chǔ)中[17],即要考慮科研數(shù)據(jù)的可用性、準(zhǔn)確性、完整性、可追溯性和關(guān)聯(lián)性。要達(dá)到以上目標(biāo),首先需要對(duì)科研數(shù)據(jù)進(jìn)行完善地描述,表2是本文設(shè)計(jì)的科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述建議,重點(diǎn)揭示科研數(shù)據(jù)的起源、數(shù)據(jù)關(guān)聯(lián)、利用方式、修訂細(xì)節(jié)、資源字符集、存儲(chǔ)位置、適用軟硬件等。
表2 科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述建議
表2(續(xù))
注:@prefix dc=http:∥purl.org/dc/elements/1.1 @prefix dcterms=http:∥purl.org/dc/terms/ @prefix rdc=http:∥rdc.example.org/
其次,需要對(duì)讀者提供提交元數(shù)據(jù)的接口界面,元數(shù)據(jù)以RDF格式描述,方便后續(xù)語(yǔ)義檢索并發(fā)布為關(guān)聯(lián)數(shù)據(jù)。從表2可以看出,對(duì)科研數(shù)據(jù)的語(yǔ)義描述是比較復(fù)雜的,讀者沒(méi)有動(dòng)力來(lái)完成所有的描述,描述工作主要由圖書(shū)館員承擔(dān)。而對(duì)科研人員提供的是相對(duì)簡(jiǎn)單的接口(如圖7所示),屏蔽語(yǔ)義標(biāo)注的細(xì)節(jié)[18]。在語(yǔ)義標(biāo)注時(shí),針對(duì)表2中對(duì)象屬性(譬如BaseSet、RelSet、RelSet等),需要列舉其他數(shù)據(jù)集的URI,從而關(guān)聯(lián)到外部數(shù)據(jù)集??蒲袛?shù)據(jù)可以以文本、電子表格、圖形圖像、動(dòng)畫(huà)、音頻視頻的格式上傳。
對(duì)科研數(shù)據(jù)進(jìn)行語(yǔ)義化描述并支持語(yǔ)義檢索和語(yǔ)義關(guān)聯(lián),需要用到一些語(yǔ)義支持模塊(見(jiàn)表1)。安裝好這些模塊之后,需要做的工作還包括構(gòu)建科研數(shù)據(jù)監(jiān)管本體、利用evoc導(dǎo)入本體、定義科研數(shù)據(jù)描述字段與本體屬性的對(duì)應(yīng)關(guān)系(見(jiàn)圖5)、對(duì)科研數(shù)據(jù)進(jìn)行語(yǔ)義標(biāo)注(見(jiàn)圖6)。
當(dāng)讀者利用知識(shí)交流平臺(tái)獲得一份科研數(shù)據(jù)的時(shí)候,可以通過(guò)資源屬性列表跳轉(zhuǎn)到外部數(shù)據(jù)集,也可以獲取一份RDF文檔,讀者可以利用該文檔的詳細(xì)描述短時(shí)間內(nèi)就能夠應(yīng)用于科研實(shí)驗(yàn),進(jìn)行驗(yàn)證、測(cè)試和模擬。RDF文檔如果被計(jì)算機(jī)通過(guò)網(wǎng)絡(luò)獲取,那么文檔信息可以被自動(dòng)化處理。平臺(tái)同時(shí)提供對(duì)外的SPARQL查詢終端,為本地站點(diǎn)的RDF數(shù)據(jù)向互聯(lián)網(wǎng)開(kāi)放提供支持。
圖5 定義科研數(shù)據(jù)描述字段與本體屬性的對(duì)應(yīng)關(guān)系
6.1 加強(qiáng)數(shù)據(jù)的搜集和整理工作,提高數(shù)據(jù)質(zhì)量監(jiān)管水平
圖書(shū)館需要設(shè)計(jì)一套激勵(lì)機(jī)制鼓勵(lì)讀者上傳資源。在讀者上傳的資源當(dāng)中,有一部份是不成熟、不完整甚至錯(cuò)
圖6 科研數(shù)據(jù)語(yǔ)義標(biāo)注界面
誤的實(shí)驗(yàn)方法和數(shù)據(jù),有一部份是受版權(quán)保護(hù)的文獻(xiàn)和軟件,那么需要經(jīng)過(guò)專(zhuān)業(yè)人員鑒別,當(dāng)有新的研究成果時(shí)需要對(duì)老舊數(shù)據(jù)進(jìn)行更新、防止錯(cuò)誤數(shù)據(jù)隨著大范圍使用和數(shù)據(jù)關(guān)聯(lián)蔓延開(kāi)來(lái)[19],最終目標(biāo)是實(shí)現(xiàn)數(shù)據(jù)必須持久地可信賴[20]。重復(fù)提交數(shù)據(jù)的現(xiàn)象時(shí)有發(fā)生,如何發(fā)現(xiàn)重復(fù)性資料,是直接刪除還是維持一定的冗余,這也是值得考慮的問(wèn)題。在所有讀者上傳的資料中,有一部份資料是常規(guī)資料,如網(wǎng)上下載的軟件或引用別人的資料,而另外一部份是獨(dú)有的原始資料,對(duì)于后者,要進(jìn)行深入的揭示和長(zhǎng)時(shí)間的積累,如針對(duì)讀者上傳的研究數(shù)據(jù),系統(tǒng)要求讀者進(jìn)行詳細(xì)的描述,以確保這些科學(xué)研究數(shù)據(jù)能被他人有效利用,另外,獨(dú)有的原始資料需要經(jīng)過(guò)長(zhǎng)時(shí)間的積累才能產(chǎn)生一定的效用和價(jià)值。
6.2 加強(qiáng)與開(kāi)放數(shù)據(jù)云的關(guān)聯(lián)和集成
2007年W3C發(fā)起的Linking Open Data(關(guān)聯(lián)開(kāi)放數(shù)據(jù)運(yùn)動(dòng))項(xiàng)目已經(jīng)實(shí)現(xiàn)了將各種開(kāi)放數(shù)據(jù)源(如DBpedia、GeoNames、MusicBrainz、WordNet、DBLP等)在Web上發(fā)布并進(jìn)行語(yǔ)義關(guān)聯(lián),用戶可以無(wú)縫跳轉(zhuǎn)到關(guān)聯(lián)開(kāi)放數(shù)據(jù)云(LOD Cloud)中的任意數(shù)據(jù),而不用關(guān)心這些數(shù)據(jù)來(lái)自于哪個(gè)數(shù)據(jù)集。截止2014年8月,互聯(lián)網(wǎng)上已經(jīng)有1 000余個(gè)開(kāi)放數(shù)據(jù)集合[21]。讀者生成內(nèi)容和科研數(shù)據(jù)集中的知識(shí)單元如果能和開(kāi)放數(shù)據(jù)云中相關(guān)的知識(shí)單元進(jìn)行關(guān)聯(lián),讓知識(shí)交流共享平臺(tái)成為開(kāi)放數(shù)據(jù)云中的一部分,那么將極大地增強(qiáng)平臺(tái)的知識(shí)價(jià)值和吸引力。Drupal的關(guān)聯(lián)數(shù)據(jù)發(fā)布模塊已經(jīng)比較成熟,難點(diǎn)是如何將實(shí)例對(duì)象屬性自動(dòng)化連接到外部相關(guān)知識(shí)單元,此外,語(yǔ)義互操作中的本體融合和配準(zhǔn)也是需要解決的問(wèn)題。
6.3 開(kāi)發(fā)具有大數(shù)據(jù)分析和處理功能的模塊
隨著時(shí)間的積累,讀者生成內(nèi)容、科研數(shù)據(jù)、讀者使用內(nèi)容的數(shù)據(jù)量將變得非常龐大,達(dá)到PB級(jí),此時(shí)需要成熟的大數(shù)據(jù)分析和處理框架來(lái)處理這些數(shù)據(jù),從而提供數(shù)據(jù)推薦、海量數(shù)據(jù)挖掘(含分類(lèi)和聚類(lèi))、協(xié)作網(wǎng)絡(luò)識(shí)別、影響力評(píng)估等個(gè)性化信息服務(wù)。但目前Drupal還沒(méi)有相關(guān)的模塊發(fā)布,可以考慮用第三方工具如Solr、ZooKeeper、Hadoop框架等來(lái)開(kāi)發(fā)。Solr是開(kāi)放源碼的企業(yè)搜索服務(wù)器軟件,在全文檢索、分布式搜索和緩存方面表現(xiàn)良好;Apache ZooKeeper為大型分布式計(jì)算提供開(kāi)源的分布式配置服務(wù)、同步服務(wù)和命名注冊(cè);Hadoop是一個(gè)由Apache基金會(huì)所開(kāi)發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu),包含一個(gè)開(kāi)源的MapReduce框架,可以將PB級(jí)數(shù)據(jù)劃分到由多臺(tái)計(jì)算機(jī)構(gòu)成的集群上并行處理,提高處理速度。
隨著互聯(lián)網(wǎng)上讀者交流意愿的提升,各種網(wǎng)絡(luò)社區(qū)的活躍和進(jìn)一步發(fā)展,圖書(shū)館讀者迫切需要一個(gè)平臺(tái)提供對(duì)科研數(shù)據(jù)、讀者生成內(nèi)容、讀者使用內(nèi)容的管理和服務(wù),同時(shí)讀者需要利用這個(gè)平臺(tái),以平臺(tái)中的讀者提供資源為基礎(chǔ)進(jìn)行知識(shí)交流和共享活動(dòng)。
本文從圖書(shū)館員和讀者兩個(gè)角度對(duì)知識(shí)交流共享平臺(tái)進(jìn)行需求分析,并以此為基礎(chǔ)設(shè)計(jì)了系統(tǒng)的功能結(jié)構(gòu)和體系結(jié)構(gòu)。以圖書(shū)館知識(shí)交流共享平臺(tái)的構(gòu)建為例,介紹了使用Drupal來(lái)開(kāi)發(fā)知識(shí)交流共享平臺(tái)的方法,重點(diǎn)介紹了各種功能模塊的特點(diǎn)及其配置和使用方法??蒲袛?shù)據(jù)是知識(shí)交流共享平臺(tái)中最重要的知識(shí)資產(chǎn),為了保證科研數(shù)據(jù)的完整性、可用性和準(zhǔn)確性,圖書(shū)館需要提供針對(duì)科研數(shù)據(jù)的監(jiān)管服務(wù),包括制定元數(shù)據(jù)描述標(biāo)準(zhǔn),提供數(shù)據(jù)描述接口,將科研數(shù)據(jù)集成到開(kāi)放數(shù)據(jù)云。為了保證科研數(shù)據(jù)的可靠性和完整性,本文設(shè)計(jì)了一套推薦性科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述規(guī)范,包括針對(duì)學(xué)科數(shù)據(jù)內(nèi)容的描述性元數(shù)據(jù)和針對(duì)數(shù)據(jù)監(jiān)管的管理性元數(shù)據(jù)兩個(gè)部分,介紹了該描述規(guī)范在科研數(shù)據(jù)監(jiān)管、語(yǔ)義描述、科研數(shù)據(jù)語(yǔ)義關(guān)聯(lián)中的具體應(yīng)用。最后,本文針對(duì)知識(shí)交流共享平臺(tái)的未來(lái)發(fā)展提供一系列的對(duì)策和建議,包括加強(qiáng)數(shù)據(jù)的搜集和整理工作,提高數(shù)據(jù)質(zhì)量監(jiān)管水平、加強(qiáng)和開(kāi)放數(shù)據(jù)云的關(guān)聯(lián)和集成、開(kāi)發(fā)具有大數(shù)據(jù)分析和處理功能的模塊。
[1]楊鶴林.數(shù)據(jù)監(jiān)護(hù):美國(guó)高校圖書(shū)館的新探索[J].中國(guó)圖書(shū)館學(xué)報(bào),2011(2):18-21,41.
[2]Radovan Vrana.Supporting e-Science:Scientific Research Data Curation[J].Future of Information Sciences Infuture,2011:407-416.
[3]趙宇翔,范哲,朱慶華.用戶生成內(nèi)容(UGC)概念解析及研究進(jìn)展[J].中國(guó)圖書(shū)館學(xué)報(bào),2012,(5):68-81.
[4]Chris Anderson.長(zhǎng)尾巴理論[M].北京:中信出版社,2006,12.
[5]王大珩,于光遠(yuǎn).論科學(xué)精神[M].北京:中央編譯出版社,2001:31-37.
[6]沈小玲.論圖書(shū)館的經(jīng)濟(jì)學(xué)屬性——公共物品[J].中國(guó)圖書(shū)館學(xué)報(bào),2001,(1):80-82.
[7]曾群.泛在網(wǎng)絡(luò)環(huán)境下高校知識(shí)共享平臺(tái)資源建設(shè)研究[J].情報(bào)理論與實(shí)踐,2013,(9):83-87,77.
[8]吳云珊.泛在圖書(shū)館知識(shí)共享空間(KC)研究[J].圖書(shū)情報(bào)知識(shí),2013,(1):114-121.
[9]Drupal[EB/OL].https:∥en.wikipedia.org/wiki/Drupal,2015-11-09.
[10]熊回香,王學(xué)東,許穎穎.基于Web3.0的虛擬團(tuán)隊(duì)知識(shí)共享平臺(tái)建設(shè)研究[J].情報(bào)科學(xué),2009,(12):1770-1775.
[11]張?jiān)?于秀芬.基于掌上虛擬社區(qū)的高校教師隱性知識(shí)交流平臺(tái)實(shí)踐研究[J].圖書(shū)館學(xué)研究,2015,(9):19-25.
[12]劉會(huì)婷,魏青山,李丹.泛在圖書(shū)館知識(shí)共享空間(KC)研究[J].圖書(shū)情報(bào)知識(shí),2013,(1):114-121.
[14]李丹,閆曉第,魏青山.Drupal的混搭技術(shù)在圖書(shū)館的應(yīng)用[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2013,(10):79-84.
[15]夏翠娟,劉煒,趙亮,等.關(guān)聯(lián)數(shù)據(jù)發(fā)布技術(shù)及其實(shí)現(xiàn)——以Drupal為例[J].中國(guó)圖書(shū)館學(xué)報(bào),2012,(1):49-57.
[16]任瑞娟,濮德敏,王劍宏,等.基于Drupal實(shí)現(xiàn)多類(lèi)型學(xué)術(shù)資源的語(yǔ)義化組織與關(guān)聯(lián)化聚合[J].情報(bào)科學(xué),2015,(5):63-67.
[17]Van Horik,Rene.Data curation.A Driver’s Guide to European Repositories.Amsterdam:Amsterdam University press,2008:131-152.
[18]Huda Khan,Brian Caruso,Jon Corson-Rikert etc.DataStaR:Using the Semantic Web approach for Data Curation[A].6th International Digital Curation Conference[C].Cornell University,December,2010:1-12.
[19]Antony J.Williams,Sean Ekins.A quality alert and call for improved curation of public chemistry databases[J].Drug Discovery Today,2011,16(17-18):747-750.
[20]Van Horik,Rene.Data curation,A Driver’s Guide to European Repositories.Amsterdam:Amsterdam University press,2008:131-152.
[21]State of the LOD Cloud 2014[EB/OL].http:∥linkeddatacatalog.dws.informatik.uni-mannheim.de/state/,2015-09-10.
(本文責(zé)任編輯:郭沫含)
The Construction of Drupal Based Library Knowledge Exchange and Sharing Platform
Zhou Yu1,2Wei Tailiang3Liao Siqin2
(1.School of Information Management,Nanjing University,Nanjing 210023,China;2.Library,Southwest University of Science and Technology,Mianyang 621010,China;3.Library,Sichuan Party School,Chengdu 610071,China)
Domestic Library Knowledge Exchange and Sharing Platform rarely providing services of storage and curation for readers’ uploaded data such as research data,used data and created data,which is not integrated with open data cloud too.In order to providing services of academic information communication and reader uploaded data management,this paper mainly studied the method of building the Library knowledge exchange and sharing platform by using Drupal,which is an open source content management system.The research process included:(1)Analyzing the requirements of the library and readers for the platform;(2)Designing the function and architecture of the platform;(3)Introducing the method of building the platform with Drupal.(4)Discussing the method of research data curation,semantic prescription and its semantic linking to other dataset.Finally,this paper put forward a series of suggestions on future development of Library knowledge exchange and sharing platform in large data and open data cloud environment.
Drupal;knowledge sharing;knowledge service;information system development
2015-12-20
本文的研究受西南科技大學(xué)圖書(shū)館基金項(xiàng)目“科大機(jī)構(gòu)知識(shí)庫(kù)構(gòu)建研究”資助。
周 宇(1982-),男,博士研究生,助理研究員,研究方向:語(yǔ)義網(wǎng)與數(shù)字圖書(shū)館。
10.3969/j.issn.1008-0821.2016.03.009
G250.73
A
1008-0821(2016)03-0053-08