陳寧 徐志明
關(guān)鍵詞:Web3.0;網(wǎng)絡(luò)原生數(shù)字資源;開(kāi)發(fā)利用;可行性分析
摘要:文章從網(wǎng)絡(luò)原生數(shù)字資源開(kāi)發(fā)利用的可行性方面入手,分別從理論可行性、現(xiàn)實(shí)基礎(chǔ)、實(shí)踐基礎(chǔ)、技術(shù)基礎(chǔ)等方面作了相關(guān)探討。
中圖分類號(hào):G252文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2014)12-0100-03
收稿日期:2014-11-10
作者簡(jiǎn)介:陳寧(1982-),景德鎮(zhèn)學(xué)院圖書(shū)館館員;徐志明(1985-),景德鎮(zhèn)學(xué)院圖書(shū)館助理館員。
*本文系2013年江西省高校人文社會(huì)科學(xué)研究項(xiàng)目“陶瓷文化網(wǎng)絡(luò)原生數(shù)字資源的開(kāi)發(fā)與利用”的研究成果之一,課題編號(hào):TQ1307。1網(wǎng)絡(luò)原生數(shù)字資源建設(shè)可行性的理論研究
1.1西方國(guó)家的經(jīng)驗(yàn)與方法
西方一些國(guó)家如美國(guó)、加拿大、以色列等早已開(kāi)始了對(duì)網(wǎng)絡(luò)原生數(shù)字資源的研究,并已經(jīng)開(kāi)始了實(shí)踐。如美國(guó)弗吉尼亞大學(xué)數(shù)字資源研究領(lǐng)域的學(xué)者Hung Nam Kim,在2008年就博客如何在教育領(lǐng)域中的合理運(yùn)用進(jìn)行了比較系統(tǒng)地研究[1],并且研究和開(kāi)發(fā)了一個(gè)可在教育環(huán)境中使用博客的系統(tǒng)模型;以色列開(kāi)放大學(xué)的Ina Blau, Nili Mor and Tami Neuthal,就高等教育中利用博客促進(jìn)人際關(guān)系和群體交互方面也作了比較翔實(shí)的研究;Olga Vechtomova[2]作為加拿大滑鐵盧大學(xué)的學(xué)者,就博客中的觀點(diǎn)檢索進(jìn)行了研究;Jonathan Elsas、Jaime Arguello等作為卡內(nèi)基·梅隆大學(xué)[3]的學(xué)者,就博客精華發(fā)現(xiàn)開(kāi)展了研究。
1.2我國(guó)網(wǎng)絡(luò)原生數(shù)字資源研究現(xiàn)狀
1.2.1博客、微博方面。武漢大學(xué)科學(xué)評(píng)價(jià)研究中心的邱均平基于博客計(jì)量學(xué)和PageRank算法提出了BlogRank算法[4]。他將PageRank算法中的實(shí)質(zhì)性鏈接與非實(shí)質(zhì)性鏈接區(qū)分開(kāi)來(lái),在鏈接分析算法的計(jì)算中只使用實(shí)質(zhì)性鏈接,從而提高了網(wǎng)頁(yè)和檢索關(guān)鍵詞的相關(guān)度,使查準(zhǔn)率也相應(yīng)得到了提高。
1.2.2BBS、網(wǎng)絡(luò)論壇方面。長(zhǎng)春醫(yī)學(xué)高等??茖W(xué)校的栗久珍提出一種基于網(wǎng)絡(luò)論壇FAQ生成的網(wǎng)絡(luò)論壇情報(bào)收集與處理系統(tǒng)[5],并通過(guò)建立與此系統(tǒng)相應(yīng)的實(shí)驗(yàn)環(huán)境,驗(yàn)證了網(wǎng)絡(luò)論壇情報(bào)收集與處理系統(tǒng)的應(yīng)用性能。其實(shí)驗(yàn)結(jié)果表明,此系統(tǒng)無(wú)論是在召回率還是在精確率上都取得了相當(dāng)高的滿意度。
北京信息科技大學(xué)中文信息處理研究中心的劉莉建了一個(gè)模型系統(tǒng),是基于RSS的博客信息資源采集系統(tǒng)[6]。通過(guò)雙爬蟲(chóng)設(shè)計(jì),實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶RSS地址的獲取并進(jìn)一步跟蹤檢測(cè),檢索用戶的博客內(nèi)容是否有了更新,以增量方式將更新的信息資源納入相關(guān)的數(shù)據(jù)庫(kù),并對(duì)國(guó)內(nèi)博客用戶最多的網(wǎng)站如百度、搜狐、天涯和新浪等進(jìn)行了博客數(shù)據(jù)的采集工作,取得了很好的效果。
中國(guó)科學(xué)技術(shù)大學(xué)的蔣凡、高俊波、張敏、王煦法對(duì)廣大網(wǎng)民獲取信息、交流意見(jiàn)的重要場(chǎng)所之一的網(wǎng)絡(luò)論壇[7],提出了一種通過(guò)詞語(yǔ)聚類方法挖掘論壇中那些有著較高影響力的主題,進(jìn)而設(shè)計(jì)出BBS中主題發(fā)現(xiàn)原型系統(tǒng)。此系統(tǒng)將詞語(yǔ)在BBS論壇回帖傳播鏈上的影響力進(jìn)行計(jì)算,使廣大網(wǎng)民及各論壇管理人員可以及時(shí)、準(zhǔn)確地獲取重要網(wǎng)絡(luò)原生數(shù)字資源的主題信息。其通過(guò)抽取任意有代表性的網(wǎng)站進(jìn)行了相應(yīng)地實(shí)驗(yàn),實(shí)驗(yàn)的結(jié)果證明,該系統(tǒng)可以從BBS論壇每天的主題數(shù)據(jù)中檢索出當(dāng)天此論壇中最具影響力的主題。
1.2.3其他。麗水學(xué)院的闕曉萌、施強(qiáng)從高校圖書(shū)館網(wǎng)絡(luò)原生數(shù)字資源的自身特點(diǎn)出發(fā),以提高網(wǎng)絡(luò)原生數(shù)字資源學(xué)術(shù)價(jià)值、社會(huì)價(jià)值、經(jīng)濟(jì)價(jià)值為目的,提出機(jī)構(gòu)知識(shí)庫(kù)(Institutional Repository,簡(jiǎn)稱IR)模式[8]。
這些系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)雖然只是從微觀方面對(duì)網(wǎng)絡(luò)原生數(shù)字資源的某一種形式進(jìn)行搜集、整合與利用,但如果將這些經(jīng)驗(yàn)與設(shè)計(jì)應(yīng)用到更廣的網(wǎng)絡(luò)原生數(shù)字資源領(lǐng)域,將會(huì)加快網(wǎng)絡(luò)原生數(shù)字資源的開(kāi)發(fā)與利用。
2網(wǎng)絡(luò)原生數(shù)字資源建設(shè)可行性的現(xiàn)實(shí)基礎(chǔ)
2.1網(wǎng)民數(shù)量的增加
有需求才會(huì)有建設(shè),正因?yàn)閺V大網(wǎng)民對(duì)網(wǎng)絡(luò)原生數(shù)字資源的需求不斷提高,才使得信息網(wǎng)絡(luò)迅速發(fā)展。高速信息網(wǎng)絡(luò)的建設(shè)也為網(wǎng)絡(luò)數(shù)字資源的開(kāi)發(fā)、利用提供了有力的保障。筆者認(rèn)為,在現(xiàn)代網(wǎng)絡(luò)技術(shù)發(fā)達(dá)的時(shí)代,更應(yīng)加強(qiáng)網(wǎng)絡(luò)虛擬環(huán)境的建設(shè),發(fā)揮虛擬環(huán)境的滲透?jìng)鞑スδ堋?jù)Internet World Stats的最近統(tǒng)計(jì),世界網(wǎng)民數(shù)量已超過(guò)24億人,全球的互聯(lián)網(wǎng)普及率也已超過(guò)30%。中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)在京發(fā)布第33次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,我國(guó)網(wǎng)民規(guī)模達(dá)到6.18億,互聯(lián)網(wǎng)普及率為45.8%。我國(guó)網(wǎng)民職業(yè)結(jié)構(gòu)組成及比例。
2.2網(wǎng)民追求保障信息資源的公平獲取
從網(wǎng)絡(luò)原生數(shù)字資源的定義中可以得知,其在產(chǎn)生和交流過(guò)程中對(duì)相應(yīng)的技術(shù)和設(shè)備是有一定要求的。隨著各項(xiàng)技術(shù)及設(shè)備的更新,其展現(xiàn)的形式也在發(fā)生著變化,因此可以說(shuō),網(wǎng)絡(luò)原生數(shù)字資源對(duì)技術(shù)與設(shè)備還是有一定的依賴性的。這種依賴性也就導(dǎo)致其密集于技術(shù)強(qiáng)、設(shè)備完善的區(qū)域,進(jìn)而產(chǎn)生數(shù)字資源密集與稀疏兩個(gè)極端,從而產(chǎn)生信息不公?,F(xiàn)今社會(huì)是一個(gè)信息的時(shí)代,信息的擁有即財(cái)富的擁有,信息的不公平分配就會(huì)產(chǎn)生貧富不均的現(xiàn)象。信息過(guò)密的區(qū)域在網(wǎng)絡(luò)上就會(huì)出現(xiàn)信息浪費(fèi)、信息冗余等數(shù)字信息資源利用低的現(xiàn)象;而在信息稀疏的區(qū)域就會(huì)在某些領(lǐng)域出現(xiàn)信息盲點(diǎn)。因此,本著保障網(wǎng)絡(luò)數(shù)字信息資源的總體平衡,消除“數(shù)字鴻溝”,使其發(fā)揮出最大效益的目的,正確的設(shè)備配置和技術(shù)開(kāi)發(fā)是必需的,從而保障信息資源的公平。
陳寧,徐志明:Web3.0時(shí)代網(wǎng)絡(luò)原生數(shù)字資源開(kāi)發(fā)利用可行性分析*陳寧,徐志明:Web3.0時(shí)代網(wǎng)絡(luò)原生數(shù)字資源開(kāi)發(fā)利用可行性分析*2.3亟須杜絕網(wǎng)絡(luò)環(huán)境中不良信息
網(wǎng)絡(luò)數(shù)字資源的傳播往往是超越國(guó)界的,不會(huì)因?yàn)楦鲊?guó)制度的不同而影響其產(chǎn)生與交流。網(wǎng)絡(luò)原生數(shù)字資源作為一種虛擬的信息資源,廣大讀者既可以是其接受者、傳播者,也可以是其生產(chǎn)者。由于廣大讀者常識(shí)水平及價(jià)值觀、世界觀的不一,且尚未在網(wǎng)絡(luò)中建成標(biāo)準(zhǔn)一致的社會(huì)評(píng)價(jià)和控制機(jī)制,導(dǎo)致了網(wǎng)絡(luò)原生數(shù)字資源的繁雜與混亂,規(guī)范及精度的缺乏等現(xiàn)象屢見(jiàn)不鮮。因此,杜絕不良網(wǎng)絡(luò)原生信息資源,對(duì)各類網(wǎng)絡(luò)原生數(shù)字資源進(jìn)行去偽存真的過(guò)濾式建設(shè),減少信息資源污染顯得尤為必要。endprint
3可借鑒的已經(jīng)開(kāi)展的數(shù)字資源建設(shè)實(shí)踐全國(guó)高校專題特色數(shù)據(jù)庫(kù)是中國(guó)高等教育文獻(xiàn)保障系統(tǒng)(CALIS)建設(shè)的子項(xiàng)目之一,通過(guò)重點(diǎn)支持和擇優(yōu)獎(jiǎng)勵(lì)相結(jié)合的資助方式已經(jīng)開(kāi)展了兩期項(xiàng)目建設(shè)。主要目的就是鼓勵(lì)那些有著自身學(xué)科優(yōu)勢(shì)及地方特色文獻(xiàn)資源基礎(chǔ)的高校,共同參與到特色系列專題數(shù)據(jù)庫(kù)的建設(shè)之中。目前,CALIS已初步建成適用于全國(guó)高校統(tǒng)一遵循的CALIS標(biāo)準(zhǔn)和規(guī)范以及技術(shù)先進(jìn)、方便實(shí)用且各具特色的系列專題文獻(xiàn)數(shù)據(jù)庫(kù)群,目前已經(jīng)向全國(guó)各高校提供層次多樣和方向不一的特色資源服務(wù)。
2011年2月,CALIS三期全國(guó)高校專題特色數(shù)據(jù)庫(kù)子項(xiàng)目正式啟動(dòng),由 CALIS 華中地區(qū)中心武漢大學(xué)圖書(shū)館牽頭組織實(shí)施,通過(guò)對(duì)未開(kāi)發(fā)利用的資源進(jìn)行挖掘并整理,從而達(dá)到擴(kuò)展補(bǔ)充 CALIS 資源體系的目的。遵循的主體建設(shè)思路沒(méi)變,重點(diǎn)加強(qiáng)獨(dú)有及稀缺資源的數(shù)字化建設(shè)以及網(wǎng)絡(luò)原生數(shù)字資源的挖掘和整理;繼續(xù)支持具有良好前期成果,學(xué)科特色、地方特色或民族特色鮮明的專題庫(kù)建設(shè)。目前,已進(jìn)入特色庫(kù)項(xiàng)目申報(bào)階段,特色庫(kù)子項(xiàng)目各項(xiàng)工作在CALIS管理中心的具體指導(dǎo)下,按項(xiàng)目進(jìn)度逐步實(shí)施。
作為 CALIS 三期建設(shè)子項(xiàng)目之一的電子科技大學(xué)圖書(shū)館成都專題特色數(shù)據(jù)庫(kù),其初衷便是通過(guò)對(duì)未開(kāi)發(fā)利用的資源如網(wǎng)絡(luò)原生數(shù)字資源進(jìn)行挖掘整理,以達(dá)到補(bǔ)充 CALIS資源體系的目的。電子科技大學(xué)圖書(shū)館作為一個(gè)本身特色專業(yè)突出的大學(xué)圖書(shū)館,根據(jù)本校特色學(xué)科和本館數(shù)字資源館藏特點(diǎn),有計(jì)劃、有組織地將其重點(diǎn)學(xué)科網(wǎng)絡(luò)原生數(shù)字資源納入到館藏?cái)?shù)字資源建設(shè)中。在前期一些成果積累的基礎(chǔ)上,電子科技大學(xué)圖書(shū)館在 CALIS 三期專題特色庫(kù)子項(xiàng)目——“物理電子學(xué)與光電子學(xué)網(wǎng)絡(luò)原生數(shù)字資源建設(shè)”申請(qǐng)中獲得成功。目前,該項(xiàng)目已成功實(shí)施,并取得了良好的效果。各類型網(wǎng)絡(luò)原生數(shù)字資源所占比例見(jiàn)表2。表2各類型網(wǎng)絡(luò)原生數(shù)字資源所占比例表
網(wǎng)絡(luò)原生數(shù)字資源類型網(wǎng)絡(luò)原生數(shù)字論文網(wǎng)絡(luò)原生數(shù)字期刊科研機(jī)構(gòu)專家學(xué)者其他所占比例79%7%4%3%7%4相關(guān)技術(shù)基礎(chǔ)
4.1互聯(lián)網(wǎng)基礎(chǔ)技術(shù)
數(shù)字時(shí)代,網(wǎng)絡(luò)技術(shù)的發(fā)展尤其重要。網(wǎng)絡(luò)系統(tǒng)技術(shù)的發(fā)展又取決于信息基礎(chǔ)設(shè)施的建設(shè),因此,一個(gè)國(guó)家的信息基礎(chǔ)設(shè)施完善與否、發(fā)達(dá)與否決定了其網(wǎng)絡(luò)系統(tǒng)技術(shù)先進(jìn)與否。只有網(wǎng)絡(luò)系統(tǒng)技術(shù)達(dá)到了一定程度,其數(shù)字信息傳輸?shù)恼系K才越易被打破,各類數(shù)字信息資源在網(wǎng)絡(luò)中的運(yùn)行也就越流暢,從而保證整個(gè)國(guó)家各個(gè)機(jī)構(gòu)與部門(mén)運(yùn)行通暢。我國(guó)的信息基礎(chǔ)設(shè)施建設(shè)隨著全球信息高速公路的逐漸完善而逐步推進(jìn),目前中國(guó)的互聯(lián)網(wǎng)已形成四大骨干網(wǎng) CSTNET(China Science Technology Network)、CHINANET(China Network)、CERNET(China Education & Research Network)、CHINAGBN(China Golden Bridge Network),其分別歸屬于中國(guó)科學(xué)院、郵電部、國(guó)家教育委員會(huì)、信息產(chǎn)業(yè)部,涵蓋了科技、教育、科研、公用事業(yè)及經(jīng)濟(jì)等各個(gè)領(lǐng)域。由中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)起的互聯(lián)網(wǎng)基礎(chǔ)技術(shù)開(kāi)放實(shí)驗(yàn)室(DNSLAB)[9],其目的是在基礎(chǔ)資源技術(shù)體系研究、基礎(chǔ)安全技術(shù)體系、互聯(lián)網(wǎng)數(shù)據(jù)分析等領(lǐng)域形成核心競(jìng)爭(zhēng)力,從而促進(jìn)政府主管部門(mén)、科研機(jī)構(gòu)、高校和互聯(lián)網(wǎng)產(chǎn)業(yè)界等的合作。由上可知,我國(guó)目前的信息網(wǎng)絡(luò)環(huán)境是相當(dāng)優(yōu)越的,網(wǎng)絡(luò)原生數(shù)字信息資源在時(shí)間、空間上的配置建設(shè)是可行的。
4.2Web2.0技術(shù)
Web2.0相應(yīng)理念中,最重要的便是自組織理論的引入,這使原本屬于物理學(xué)中的理論移接到互聯(lián)網(wǎng)領(lǐng)域,再通過(guò)相應(yīng)的網(wǎng)絡(luò)技術(shù),使網(wǎng)絡(luò)用戶作為個(gè)體參與網(wǎng)絡(luò)資源發(fā)布和傳播的技術(shù)要求得以降低,從而為廣大網(wǎng)絡(luò)用戶搭建了一個(gè)主體參與式架構(gòu)的網(wǎng)絡(luò)平臺(tái)。Web2.0其核心著重于交互,即廣大網(wǎng)絡(luò)用戶不再單單作為網(wǎng)頁(yè)的閱讀者,也可以成為某些網(wǎng)頁(yè)內(nèi)容的創(chuàng)造者,實(shí)現(xiàn)了從“單一”到“雙向”的信息資源交流模式。Web2.0技術(shù)支持允許松散結(jié)合系統(tǒng)的輕量型的編程模型,考慮聚合(syndication)而不是協(xié)調(diào)(coordination),可編程性和可混合性的設(shè)計(jì),為創(chuàng)造對(duì)等的、自由的、鏈性的、有利于自組織發(fā)生的體系奠定了基礎(chǔ)。RSS、Trackback、XML等主要技術(shù)的使用,首先通過(guò)系統(tǒng)自動(dòng)的或者用戶自發(fā)的鏈接、分類、標(biāo)簽及動(dòng)態(tài)聚合,一個(gè)在數(shù)字資源用戶之間相互信任的虛擬社區(qū)得以形成;其次利用這種應(yīng)用平臺(tái)開(kāi)放性、交互性強(qiáng)的特點(diǎn),讓數(shù)字資源與數(shù)字資源之間形成主題相同的數(shù)字資源集以及博客群的聚合,實(shí)現(xiàn)數(shù)字資源的聚類和序化。因此,網(wǎng)絡(luò)數(shù)字資源自組織技術(shù)可以匯聚全世界范圍內(nèi)所有信息用戶個(gè)人的智慧,并利用于Web2.0搭建的適應(yīng)性服務(wù)平臺(tái),實(shí)現(xiàn)全球范圍內(nèi)形成同類數(shù)字資源和網(wǎng)絡(luò)用戶群的內(nèi)在聯(lián)系和序化[10]。4.3開(kāi)源技術(shù)
隨著技術(shù)產(chǎn)業(yè)周期的轉(zhuǎn)換,以移動(dòng)智能終端為業(yè)務(wù)主要載體的移動(dòng)互聯(lián)網(wǎng)開(kāi)啟了信息產(chǎn)業(yè)新的周期,移動(dòng)智能終端操作系統(tǒng)取代 PC 操作系統(tǒng)成為當(dāng)今信息產(chǎn)業(yè)基礎(chǔ)技術(shù)發(fā)展主線,這其中最具代表性的便是移動(dòng)智能終端操作系統(tǒng)的開(kāi)源開(kāi)放。因此,開(kāi)源技術(shù)在網(wǎng)絡(luò)數(shù)字資源開(kāi)發(fā)與利用方面引起了相當(dāng)多的關(guān)注。開(kāi)源協(xié)議對(duì)某些軟件或操作系統(tǒng)源代碼開(kāi)放,允許廣大用戶根據(jù)自身應(yīng)用及功能發(fā)展需求進(jìn)行修改和定制,開(kāi)源技術(shù)和Web2.0相應(yīng)技術(shù)結(jié)合起來(lái)能夠有效地讓網(wǎng)絡(luò)原生數(shù)字資源自組織得以實(shí)行。另外,作為一種高度集成網(wǎng)絡(luò)數(shù)字信息管理系統(tǒng)——機(jī)構(gòu)知識(shí)庫(kù)(如DSpace),其是基于開(kāi)源軟件建立起來(lái)的,可以實(shí)現(xiàn)搜索技術(shù)、數(shù)字資源采集、數(shù)字對(duì)象存儲(chǔ)與管理、信息傳遞技術(shù)和權(quán)限認(rèn)證等功能。在互聯(lián)網(wǎng)中深入、廣泛地應(yīng)用這種技術(shù),必將提高網(wǎng)絡(luò)原生數(shù)字資源建設(shè)成效。
參考文獻(xiàn):
[1]Kim H N. The Phenomenon of Blogs and Theoretical Model of Blog Use in Educational Contexts[J].Computers&Education,200(83).
[2]VechtomovaO.Using Subjective Adjectives in Opinion Retrieval from Blogs[EB/OL].[2008-08-16].http://trec.nist.gov/pubs/trec16/papers/uwaterloo.blog.final.pdf.
[3]ElsasJ,ArguelloJ,CallanJ,etal.Retrievaland Feedback Models for Blog Distillation[EB/OL].[2008-08-15].http://trec.nist.gov/pubs/trec16/papers/cmu-callan.blog.final.pdf.
[4]邱均平,徐蓓,李江. BlogRank算法及其在圖書(shū)館博客中的應(yīng)用[J].圖書(shū)情報(bào)知識(shí),2008(1):68-72.
[5]栗久珍.網(wǎng)絡(luò)論壇情報(bào)收集系統(tǒng)研究[J].現(xiàn)代情報(bào),2007(12):136-138.
[6]劉莉等.基于RSS的博客采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2007(11):45-48.
[7]蔣凡等. BBS中主題發(fā)現(xiàn)原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2005(31):151-153.
[8]闕曉萌,施強(qiáng).論大學(xué)圖書(shū)館原生數(shù)字信息資源服務(wù)平臺(tái)的構(gòu)建[J].現(xiàn)代情報(bào),2006(6):173-175.
[9]互聯(lián)網(wǎng)基礎(chǔ)技術(shù)開(kāi)放實(shí)驗(yàn)室[EB/OL].http://www.dnslab.cn/shouye/201202/t20120206_23729.htm.
[10]鄧冠文.中國(guó)互聯(lián)網(wǎng)寬帶技術(shù)的歷史與發(fā)展方向[J].中國(guó)新技術(shù)新產(chǎn)品,2011(9):26-27.
(編校:周雪芹)endprint