李娟 張雪蕾 陳楠楠 楊峰
(西安交通大學(xué)圖書館,西安 710049)
“一帶一路”倡議(以下簡稱“倡議”)自提出以來,取得了一系列顯著成果。用戶對與之相關(guān)的特色文獻(xiàn)信息資源的需求也呈激增狀態(tài)。高校圖書館作為文獻(xiàn)資源中心,亟待構(gòu)建起較為完善的“一帶一路”知識服務(wù)體系,以更好地服務(wù)教學(xué)科研,滿足不同服務(wù)主體(如研究學(xué)者、留學(xué)生、企業(yè)從業(yè)人員等)的信息需求。與此同時,“一帶一路”信息資源內(nèi)容呈多元化趨勢,涵蓋新聞、學(xué)術(shù)動態(tài)、學(xué)術(shù)期刊、會議、專利等,涉及多個學(xué)科領(lǐng)域,因此圖書館常規(guī)采購的數(shù)據(jù)庫與學(xué)科文獻(xiàn)已不能滿足多元化服務(wù)對象的實際需求,需要通過構(gòu)建新的知識服務(wù)平臺將相關(guān)信息資源進(jìn)行整合、補(bǔ)充與完善。
目前,政府、高校、科研院所和企業(yè)等紛紛利用自身特色資源優(yōu)勢構(gòu)建“一帶一路”專題數(shù)據(jù)庫,為“一帶一路”發(fā)展提供知識服務(wù)。優(yōu)質(zhì)的信息資源對于推動“一帶一路”倡議具有重大作用,同時也對資源選取、采集與深度挖掘提出了挑戰(zhàn)。國內(nèi)眾多的“一帶一路”專題數(shù)據(jù)庫依據(jù)各自功能定位和資源優(yōu)勢,配置了不同內(nèi)容的核心信息資源。表1梳理了部分較為知名的“一帶一路”專題數(shù)據(jù)庫,并對其功能定位與核心資源進(jìn)行介紹。
可以看出,專題數(shù)據(jù)庫的服務(wù)對象可滿足多領(lǐng)域用戶需求,如中國一帶一路網(wǎng)、“一帶一路”研究與決策支撐平臺,涉及領(lǐng)域廣泛、資源類型多樣,能夠為各級政府部門戰(zhàn)略決策、政策制定提供支持。同時,專題數(shù)據(jù)庫特色內(nèi)容側(cè)重分明,如列國志數(shù)據(jù)庫重點關(guān)注國家基礎(chǔ)信息,新華絲路側(cè)重于經(jīng)濟(jì)貿(mào)易,但尚未有關(guān)于“一帶一路”沿線國家和地區(qū)深入、全面和系統(tǒng)的專題數(shù)據(jù)庫,特別是對沿線國家和地區(qū)的歷史文化、工業(yè)經(jīng)濟(jì)、人口環(huán)境、國情咨文、政策法規(guī)等的研究和認(rèn)識都較為模糊。要實現(xiàn)倡議提出的“五通”愿景,就必須發(fā)揮高校人力資源、學(xué)術(shù)資源等優(yōu)勢,立足自身特色和學(xué)科優(yōu)勢,兼顧“一帶一路”沿線國家和地區(qū)發(fā)展及國內(nèi)研究需要,構(gòu)建特色數(shù)字資源,全方位地提供沿線國家和地區(qū)有關(guān)信息資源,剖析沿線國家潛在機(jī)遇與挑戰(zhàn),為我國國家戰(zhàn)略實施提供人才支撐、交流服務(wù)和智力支持。
西安交通大學(xué)作為“新絲綢之路大學(xué)聯(lián)盟”的發(fā)起者,推動了“新絲綢之路經(jīng)濟(jì)帶”沿線國家和地區(qū)大學(xué)在校際交流、人才培養(yǎng)、科研合作、文化溝通、政策研究、醫(yī)療服務(wù)等方面的交流與合作。2015年,中國工程院、西安交通大學(xué)、西安高新區(qū)三方共建絲路學(xué)院,旨在為國家“一帶一路”倡議的實施培養(yǎng)國際化、專業(yè)化、實用性人才[7]。通過一系列行動和政策保障,西安交通大學(xué)承接了“中國工程科技知識中心建設(shè)項目”子項目“絲路科技知識服務(wù)系統(tǒng)”,該系統(tǒng)基于“一帶一路”沿線國家和地區(qū)知識共享及人才培養(yǎng)的需求建設(shè),知識服務(wù)將作為重要功能模塊為國內(nèi)從業(yè)人員、“一帶一路”沿線國家和地區(qū)技術(shù)人員及留學(xué)生提供資源信息。
表1 部分“一帶一路”專題數(shù)據(jù)庫內(nèi)容梳理
絲路科技知識服務(wù)系統(tǒng)(以下簡稱“系統(tǒng)”)是在聯(lián)合國教科文組織框架協(xié)議下,中國工程院委托西安交通大學(xué)建設(shè)的國際工程科技知識中心。系統(tǒng)通過各類科技資源匯集,建成知識共享平臺,有效地凝聚絲路工程科技力量,銜接“新絲綢之路大學(xué)聯(lián)盟”盟校教育、教學(xué)實踐,溝通國家政策與院校改革等,為絲路沿線國家相關(guān)研究、人才培養(yǎng)、創(chuàng)新創(chuàng)業(yè)提供知識服務(wù)。其中,“一帶一路”專題數(shù)據(jù)庫作為系統(tǒng)建設(shè)重點,支撐整個系統(tǒng)知識圖譜、個性化推薦等特色資源服務(wù)。
借助系統(tǒng)建設(shè)契機(jī),西安交通大學(xué)圖書館積極參與系統(tǒng)專題數(shù)據(jù)庫建設(shè)工作,通過數(shù)據(jù)挖掘和信息整合構(gòu)建專題數(shù)據(jù)庫。系統(tǒng)專題數(shù)據(jù)庫與“一帶一路”專題數(shù)據(jù)庫相較,其共同點在于提供的資源能夠滿足“一帶一路”沿線國家和地區(qū)知識共享及人才培養(yǎng)需求;不同點在于系統(tǒng)所建“一帶一路”專題數(shù)據(jù)庫是依托西安交通大學(xué)圖書館建設(shè),圖書館在資源采購甄選和信息整合方面更加專業(yè)和系統(tǒng),提供的特色數(shù)據(jù)資源覆蓋范圍更為廣泛,其服務(wù)對象更多,因此資源更新速度及時;資源以英文為主,也提供俄語、阿拉伯語等小語種;內(nèi)容除“一帶一路”相關(guān)資源外,也包括大量高質(zhì)量教育資源等。系統(tǒng)專題數(shù)據(jù)包括國情咨文數(shù)據(jù)庫、政策法規(guī)數(shù)據(jù)庫、歷史文化數(shù)據(jù)庫、人口環(huán)境數(shù)據(jù)庫、工業(yè)經(jīng)濟(jì)數(shù)據(jù)庫、教育科技數(shù)據(jù)庫。數(shù)字資源建于2016年3月—2018年9月,建成的數(shù)據(jù)庫共包含各類特色資源230余萬條,資源類型涵蓋期刊、會議、圖書、專利、國家報告、學(xué)位論文、視頻等。
2.2.1 面向不同用戶開展需求分析,制定數(shù)字資源建設(shè)規(guī)劃
由于服務(wù)對象對資源需求各異,有必要規(guī)劃數(shù)字資源建設(shè),調(diào)研數(shù)字資源類型、分布和流動狀況,最終確定系統(tǒng)專題數(shù)據(jù)庫資源建設(shè)內(nèi)容和類型。本文將專題數(shù)據(jù)庫的服務(wù)對象分為高校、科研院所或政府機(jī)關(guān)的研究人員,“一帶一路”沿線國家和地區(qū)留學(xué)生,以及企業(yè)單位從業(yè)人員,通過線上、線下調(diào)研了解各類服務(wù)對象的信息資源需求,將主要信息資源需求整理見表2。
通過需求分析與主題數(shù)據(jù)庫數(shù)字資源內(nèi)容對接,同時對數(shù)字資源建設(shè)應(yīng)達(dá)到何種水平作出規(guī)定,如數(shù)量目標(biāo)、質(zhì)量目標(biāo)和特色化目標(biāo)等內(nèi)容。數(shù)量目標(biāo),即一定時期內(nèi)數(shù)字資源增量或?qū)W科覆蓋率;質(zhì)量目標(biāo),即對采集的數(shù)字資源廣度、深度和新度提出明確要求;特色化目標(biāo),即構(gòu)建何種特色數(shù)字資源,根據(jù)目標(biāo)制定出科學(xué)、切實可行的數(shù)字資源建設(shè)規(guī)劃。
表2 服務(wù)對象資源需求分析
表3 專題數(shù)據(jù)庫下設(shè)六大特色數(shù)據(jù)庫情況
2.2.2 篩選數(shù)字資源內(nèi)容,涵蓋多樣化資源類型
圖書館在篩選數(shù)字資源時著重強(qiáng)調(diào)資源的廣度、深度、新度和特色性,通過提供不同知識應(yīng)用滿足個性化需求,提供多語言支持和擴(kuò)展。服務(wù)對象的資源需求各異,因此承載信息資源類型也應(yīng)非常豐富,須從不同渠道獲取,從不同來源實現(xiàn)資源提取與整合。表3為六大特色數(shù)據(jù)庫的內(nèi)容、資源類型及采集建設(shè)方式。
2.2.3 多渠道開展資源獲取,保障高質(zhì)量數(shù)據(jù)資源
除遴選已購買電子資源外,圖書館應(yīng)充分發(fā)掘和利用現(xiàn)有專題數(shù)據(jù)庫,重視開放性網(wǎng)站資源信息整理,完善專題數(shù)據(jù)庫建設(shè)。目前,系統(tǒng)專題數(shù)據(jù)庫的數(shù)據(jù)獲取方式主要包括:一是對已購數(shù)據(jù)庫資源進(jìn)行深度挖掘;二是通過自建數(shù)據(jù)庫采集;三是通過外部數(shù)字資源采集,主要包括開放獲取資源和互聯(lián)網(wǎng)資源;四是適當(dāng)購置“一帶一路”特色數(shù)字資源。數(shù)據(jù)通過API、XML推送、OAI協(xié)議、Z39.50協(xié)議等方式,從不同數(shù)據(jù)源采集,具體采集方式見圖1。同時,從專業(yè)數(shù)據(jù)庫中獲取數(shù)據(jù)字典,將數(shù)字資源按照數(shù)據(jù)字典進(jìn)行數(shù)據(jù)轉(zhuǎn)換,對轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行加工、標(biāo)引和整合,最后在絲路科技服務(wù)平臺進(jìn)行揭示。
(1)已購數(shù)據(jù)庫采集。西安交通大學(xué)圖書館已購置了國內(nèi)外電子資源110個平臺約311個子庫,中外文全文電子期刊近60萬種,電子圖書150萬余種[8]。包括Elsevier出版社全文電子期刊、EBSCO學(xué)術(shù)與商業(yè)信息數(shù)據(jù)庫、劍橋大學(xué)出版社電子期刊及“一帶一路”專題圖書等資源。已購數(shù)據(jù)庫均有獨有資源,并形成了較為完善的體系,各自具有優(yōu)勢。因此,在已購高質(zhì)量優(yōu)質(zhì)數(shù)字資源基礎(chǔ)上,利用數(shù)據(jù)挖掘技術(shù)或與數(shù)據(jù)庫商合作,對資源進(jìn)行充分利用與挖掘,在建設(shè)特色資源的同時,通過多途徑的揭示與發(fā)現(xiàn),提高館藏數(shù)據(jù)資源利用率。
(2)圖書館自建特色數(shù)據(jù)庫采集。國內(nèi)眾多高校圖書館根據(jù)學(xué)校建設(shè)情況、學(xué)科特色、區(qū)域特點及自身資源建設(shè)等優(yōu)勢,建立了內(nèi)容豐富、廣泛的自建特色庫,如碩博學(xué)位論文數(shù)據(jù)庫、學(xué)科導(dǎo)航數(shù)據(jù)庫、機(jī)構(gòu)知識庫、學(xué)者庫等。這些自建庫學(xué)科針對性強(qiáng),學(xué)術(shù)利用價值較高,數(shù)據(jù)著錄格式規(guī)范,元數(shù)據(jù)質(zhì)量較高。如西安交通大學(xué)機(jī)構(gòu)知識庫[9]自2009年建設(shè)以來,累計保存、管理本機(jī)構(gòu)期刊、會議論文、專著、學(xué)位論文等各類型成果產(chǎn)出32萬余條,可遴選出相關(guān)的學(xué)術(shù)文獻(xiàn)作為專題數(shù)據(jù)庫數(shù)字資源建設(shè)的重要補(bǔ)充。此外,學(xué)位論文庫、文庫及本校其他特色自建數(shù)據(jù)庫也均為專題數(shù)據(jù)庫提供了特色資源。
圖1 數(shù)字資源的采集來源及方式
(3)外部數(shù)字資源采集。對互聯(lián)網(wǎng)資源,尤其對“一帶一路”專題網(wǎng)站進(jìn)行充分發(fā)掘,如表1中提及的專題數(shù)據(jù)庫和北京大學(xué)“一帶一路”數(shù)據(jù)分析平臺等。在系統(tǒng)專題數(shù)據(jù)庫建設(shè)過程中,搜集整合此類專題平臺的可用信息,通過專題網(wǎng)站提供的英文摘要、來源出處等線索尋求原始出處,將這類資源納入專題數(shù)據(jù)庫。
除互聯(lián)網(wǎng)資源外,開放獲取資源也是重要組成部分。開放獲取運動促進(jìn)了科學(xué)信息的分享、傳播利用和知識創(chuàng)新,有利于沿線國家免費獲取全文。目前,越來越多的機(jī)構(gòu)愿意開放共享,比較有影響力的如DOAB[10]、DOAJ[11]等,允許通過OAI協(xié)議獲取,用戶可下載元數(shù)據(jù);如英國劍橋大學(xué)機(jī)構(gòu)典藏庫提供部分全文下載;Etd.Oliolink收錄聯(lián)盟大學(xué)約9.3萬篇博碩論文的免費數(shù)據(jù),還提供專利、報告等資源[12]。上述開放獲取資源學(xué)術(shù)價值與元數(shù)據(jù)質(zhì)量較高,并提供免費使用的接口或協(xié)議。教育科技數(shù)據(jù)庫與開放獲取資源相結(jié)合,從眾多開放獲取資源中優(yōu)選學(xué)術(shù)價值較高、適合“一帶一路”沿線國家和地區(qū)各類用戶的教育科技類資源。
所有獲取的數(shù)字資源均由圖書館負(fù)責(zé)內(nèi)容篩選和質(zhì)量評價,優(yōu)先遴選權(quán)威出版社電子期刊和電子圖書,如歷史文化數(shù)據(jù)庫主要收集的資源是以iGroup Publishing和EBSCO出版商關(guān)于“一帶一路”沿線國家和地區(qū)相關(guān)的區(qū)域政治、文化和發(fā)展策略為主的電子圖書。此外,圖書館在專題數(shù)據(jù)庫中,還對元數(shù)據(jù)進(jìn)行標(biāo)引與加工,通過提供高質(zhì)量的元數(shù)據(jù),方便用戶通過瀏覽元數(shù)據(jù)信息就可以基本判斷信息資源是否符合需求。
2.2.4 數(shù)字資源加工與整合揭示
專題數(shù)據(jù)庫按照不同資源類型制定自定義數(shù)據(jù)字典,按照統(tǒng)一的標(biāo)準(zhǔn)規(guī)范加工創(chuàng)建標(biāo)準(zhǔn)元數(shù)據(jù),保證入庫后元數(shù)據(jù)質(zhì)量,為后期數(shù)據(jù)復(fù)用、揭示與傳播奠定基礎(chǔ)。對于異構(gòu)數(shù)據(jù)庫資源,依據(jù)統(tǒng)一標(biāo)準(zhǔn),采用物理或邏輯方式格式轉(zhuǎn)換與處理,形成元數(shù)據(jù);對于外部互聯(lián)網(wǎng)資源,根據(jù)相應(yīng)組織體系進(jìn)行清洗、加工、標(biāo)引等。處理后的數(shù)據(jù)資源統(tǒng)一存放于數(shù)據(jù)倉儲,最終在絲路科技服務(wù)平臺專題數(shù)據(jù)庫中展示,提供導(dǎo)航、檢索與個性化信息服務(wù)。資源整合邏輯架構(gòu)見圖2。
2.2.5 使用效果評估
圖2 數(shù)字資源整合邏輯架構(gòu)
資源使用效果評估是資源建設(shè)的重要環(huán)節(jié),資源是否被合理和充分使用、投入產(chǎn)出比等是資源建設(shè)質(zhì)量評估的主要內(nèi)容。專題數(shù)據(jù)庫對已購數(shù)據(jù)庫中資源使用效果評估,主要通過SHSUI協(xié)議收割數(shù)據(jù)庫商基于COUNTER標(biāo)準(zhǔn)的數(shù)據(jù)使用量統(tǒng)計報告;對自建特色數(shù)據(jù)庫、開放獲取資源及網(wǎng)絡(luò)資源,借助西安交通大學(xué)電子資源利用與統(tǒng)計系統(tǒng)對資源進(jìn)行評估,通過訪問量、下載量、被拒訪問量等評估資源使用效果,通過價格模型評估單篇資源成本,為下一期采購經(jīng)費使用提供依據(jù)。合理使用方面,利用電子資源流量訪問控制系統(tǒng)[13]設(shè)置下載量閾值,對用戶使用電子資源行為進(jìn)行預(yù)警提醒,避免過量下載行為,對惡意超量下載行為利用黑名單機(jī)制限制違規(guī)用戶繼續(xù)使用。
數(shù)字資源的元數(shù)據(jù)理應(yīng)免費開放,但仍應(yīng)要求用戶引用時必須提供元數(shù)據(jù)URL;至于全文,對于不同數(shù)據(jù)源作品應(yīng)分級開放,且提供多種全文獲取路徑。此外,專著或報告等的著作權(quán)也是不容忽視的問題;非PDF格式的數(shù)字資源(如流媒體、XLS等),合理使用量的界定并不明確;部分國外數(shù)據(jù)庫,出于對資源保護(hù)或其他目的采用動態(tài)鏈接技術(shù),因此無法為用戶提供一個長期有效的訪問地址,只能提供數(shù)據(jù)庫全庫地址供用戶使用,從便捷性角度來講用戶體驗感較差。
在資源建設(shè)過程中,可選擇購買學(xué)術(shù)價值較高的數(shù)據(jù)源庫,如EBSCO、Elsevier、Scopus等優(yōu)質(zhì)數(shù)據(jù)庫,將其作為教育科技資源建設(shè)的重點數(shù)據(jù)源;與沿線國家相關(guān)的歷史文化資源,可選擇Burma Research Society(緬甸研究學(xué)會)、Nordic Institute of Asian Studies(北歐亞研究所)等知名機(jī)構(gòu)的出版物作為數(shù)據(jù)源;對于政策法規(guī)、人口環(huán)境、工業(yè)經(jīng)濟(jì)等內(nèi)容,可從Gale、ABI、IEEE等數(shù)據(jù)庫資源遴選,并將高質(zhì)量的開放獲取資源如DOAJ、DOAB、機(jī)構(gòu)知識庫等作為各類學(xué)術(shù)資源的補(bǔ)充。沿線國家的風(fēng)土人情、人文歷史等領(lǐng)域的音頻視頻、拓片、博物館相關(guān)文物展示、手稿等資源較少,在未來可擴(kuò)大此類數(shù)據(jù)源采集范圍。同時,在數(shù)據(jù)源選擇時應(yīng)盡量避免資源內(nèi)容重復(fù),合理利用采購經(jīng)費,降低檢索及下載成本,通過評估試用數(shù)據(jù)庫來制定采購決策。
目前“一帶一路”專題數(shù)據(jù)庫以中文為主,資源建設(shè)極少覆蓋沿線國家主要語種??v觀我國學(xué)術(shù)界和高等教育界對現(xiàn)有信息的涉獵和積淀,對沿線國家和地區(qū)的研究十分缺失和薄弱。長期以來,教育和研究圍繞在歐美等發(fā)達(dá)國家和地區(qū)[14],且?guī)缀鯇⒔^大多數(shù)精力聚焦美國,因此對沿線各國、各民族的全方位了解極為不足。以往的忽略和缺失,導(dǎo)致倡議推進(jìn)過程中智力支持乏力,也使許多快速推進(jìn)的經(jīng)濟(jì)和外交行為受到諸多未知因素的制約。在“一帶一路”專題數(shù)據(jù)庫建設(shè)時,需要特別重視小語種原版資料的引進(jìn),從沿線國家的機(jī)構(gòu)知識庫或?qū)W科庫中獲取所需要的開放資源,進(jìn)而整合到相關(guān)數(shù)據(jù)庫中。
同“新絲綢之路大學(xué)聯(lián)盟”盟校開展合作,將盟校優(yōu)勢資源整合揭示,如優(yōu)勢專業(yè)信息、學(xué)科資源、線上學(xué)習(xí)資源等,通過共建共享實現(xiàn)信息資源互通。此外,還可以與同區(qū)域“一帶一路”研究機(jī)構(gòu)(如西北大學(xué)絲綢之路研究所)建立合作,深入了解用戶資源建設(shè)需求,補(bǔ)充完善及確定資源建設(shè)內(nèi)容,使所建資源真正為用戶所需所用,從而提高資源利用率來開展細(xì)致的知識服務(wù)。