[摘 要]隨著大數(shù)據(jù)時(shí)代的到來(lái),圖書館信息資源服務(wù)面臨新的機(jī)遇和挑戰(zhàn),如何高效利用圖書館豐富的信息資源來(lái)提升圖書館服務(wù)功能,成為圖書館領(lǐng)域的研究熱點(diǎn)。本文在分析大數(shù)據(jù)背景下圖書館信息資源融合面臨的若干現(xiàn)實(shí)問(wèn)題以及對(duì)信息資源融合五種模式進(jìn)行對(duì)比的基礎(chǔ)上,提出相應(yīng)的融合策略和融合路徑,最后介紹了融合的具體步驟。同時(shí),對(duì)圖書館信息資源融合進(jìn)行思考和展望,認(rèn)為今后圖書館信息資源融合應(yīng)在知識(shí)資源整合、定制化服務(wù)、預(yù)見(jiàn)性溝通等方面多做努力。
[關(guān)鍵詞]大數(shù)據(jù);圖書館;信息資源;信息融合
[中圖分類號(hào)]G250.7[文獻(xiàn)標(biāo)志碼]A[文章編號(hào)]1005-6041(2023)03-0033-07
1 引 言
隨著我國(guó)社會(huì)文化領(lǐng)域改革的深化和知識(shí)經(jīng)濟(jì)的發(fā)展以及現(xiàn)代信息技術(shù)融入社會(huì)生活各個(gè)領(lǐng)域,我國(guó)的圖書館事業(yè)發(fā)生了很大的變化。圖書館作為文獻(xiàn)信息服務(wù)、知識(shí)文化傳播、人才培養(yǎng)的重要場(chǎng)所,在快速發(fā)展的大數(shù)據(jù)技術(shù)背景下,海量信息聚集和更新速度加快,圖書館的信息資源服務(wù)面臨新的機(jī)遇和挑戰(zhàn)。通過(guò)運(yùn)用大數(shù)據(jù)技術(shù),對(duì)圖書館信息服務(wù)模式進(jìn)行升級(jí)和優(yōu)化,有針對(duì)性地進(jìn)行信息整理、整合,從而實(shí)現(xiàn)合理利用圖書館信息資源和讓信息服務(wù)更具個(gè)性化的目標(biāo),已成為當(dāng)今圖書館事業(yè)發(fā)展的一個(gè)趨勢(shì)和重點(diǎn)。
如何把大數(shù)據(jù)思維應(yīng)用到圖書館建設(shè)當(dāng)中,已成為圖情學(xué)界需要研究的一個(gè)新課題,其重要意義在于:首先,由于信息技術(shù)的高速發(fā)展,信息資源已成為一種重要的戰(zhàn)略資源,而大數(shù)據(jù)則是知識(shí)創(chuàng)新和社會(huì)資源的重要來(lái)源。網(wǎng)絡(luò)背景下國(guó)內(nèi)外對(duì)圖書館信息資源的研究已取得了較為豐碩的研究成果。大數(shù)據(jù)時(shí)代,圖書館信息資源具有全新的內(nèi)涵,在大數(shù)據(jù)背景下對(duì)圖書館信息資源整合目標(biāo)、融合的策略與方法以及融合的路徑等方面的理論論述有助于在大數(shù)據(jù)的語(yǔ)境中找到圖書館數(shù)據(jù)共享、信息開(kāi)放的路徑,為資源融合提供理論依據(jù)。其次,在對(duì)大數(shù)據(jù)理論以及圖書館信息資源理論進(jìn)行詳細(xì)說(shuō)明的基礎(chǔ)上,論述了大數(shù)據(jù)時(shí)代圖書館整合信息資源的策略與具體做法,并提出了大數(shù)據(jù)時(shí)代下圖書館信息資源整合的路徑及保障措施,有助于打破圖書館信息資源的“信息孤島”“數(shù)據(jù)孤島”現(xiàn)象,為圖書館服務(wù)方式的革新提供了新的思路,發(fā)揮積極指導(dǎo)作用,具有重要的實(shí)踐意義。最后,通過(guò)理論、實(shí)踐和應(yīng)用研究為圖書館在大數(shù)據(jù)環(huán)境下實(shí)現(xiàn)信息資源融合與創(chuàng)新、提升用戶服務(wù)價(jià)值提供指導(dǎo),有利于提高圖書館的核心競(jìng)爭(zhēng)力,進(jìn)一步提升圖書館的知識(shí)影響力和社會(huì)地位[1]。
2 相關(guān)文獻(xiàn)綜述
2.1 國(guó)外研究現(xiàn)狀
筆者于2022年10月5日在Web of Science中以“‘Information Integration’and‘Library’and‘Big Data’”為主題檢索字段,選擇所有數(shù)據(jù)庫(kù),時(shí)間跨度為所有年份,檢索出769條記錄;2017—2022年,54項(xiàng)研究成果被記錄在案。選Core Collection子庫(kù),也是用上述主題檢索字段,檢索到77項(xiàng)記錄。按年份的被引頻次和出版物分布見(jiàn)圖1。
國(guó)外對(duì)“圖書館信息資源融合”的研究,主要集中在“圖書館合作”“合作藏書發(fā)展”“圖書館網(wǎng)絡(luò)”和“圖書館聯(lián)盟”等主題領(lǐng)域。S.Mutula認(rèn)為圖書館人員需掌握大數(shù)據(jù)技術(shù),
了解大數(shù)據(jù)對(duì)基礎(chǔ)研究的重要性;通過(guò)深入挖掘大數(shù)據(jù)對(duì)圖情領(lǐng)域的意義,解析大數(shù)據(jù)分析對(duì)學(xué)術(shù)研究領(lǐng)域的輔助作用。A.Waqur等對(duì)ISI Web of Knowledge數(shù)據(jù)庫(kù)收錄的論文進(jìn)行分析,探討圖書館和信息管理領(lǐng)域大數(shù)據(jù)研究的趨勢(shì)。其結(jié)論表明未來(lái)的一段時(shí)間,大數(shù)據(jù)技術(shù)下的圖書館信息服務(wù)將成為研究熱點(diǎn),大數(shù)據(jù)時(shí)代的圖書館將進(jìn)行一次重大的信息化轉(zhuǎn)型。利用大數(shù)據(jù)技術(shù),圖書館將突破原有的傳統(tǒng)框架,構(gòu)造全新的信息服務(wù)模式,為資源整合研究提供新的研究視角[2]。
2.2 國(guó)內(nèi)研究現(xiàn)狀
在CNKI中以“大數(shù)據(jù)”和“圖書館”為篇名檢索字段進(jìn)行跨庫(kù)檢索,截止到2022年10月5日檢索出3 502條記錄,在此基礎(chǔ)上,以“資源聚合”“資源整合”“資源共享”“資源融合”為主題檢索字段在3 052條結(jié)果里檢索,得到文獻(xiàn)163篇??傮w趨勢(shì)分析(見(jiàn)圖2)、研究主題(見(jiàn)圖3)、學(xué)科分布(見(jiàn)圖4)、研究熱點(diǎn)(見(jiàn)圖5)相關(guān)情況如下。
根據(jù)檢索結(jié)果分析,目前國(guó)內(nèi)關(guān)于“大數(shù)據(jù)”“信息資源融合”“信息資源整合”的研究成果和學(xué)術(shù)論文還較少。國(guó)內(nèi)最早開(kāi)展這方面研究的學(xué)者是肖希明,其在《文獻(xiàn)資源共享模式與實(shí)踐理論》(廣西教育出版社1997年版)中從系統(tǒng)論的角度對(duì)信息資源共建共享的機(jī)制、模式進(jìn)行了廣泛的分析討論。此后許多學(xué)者都投入到了該領(lǐng)域的研究中,并在研究中考慮了網(wǎng)絡(luò)因素,圖書館信息資源共建共享理論得到深入的研究和論證。
近幾年,研究大數(shù)據(jù)背景下的圖書館服務(wù)更加著重發(fā)展信息服務(wù),并不斷創(chuàng)新服務(wù)手段,將信息服務(wù)、知識(shí)服務(wù)、個(gè)性化服務(wù)、學(xué)科服務(wù)、智慧服務(wù)作為重點(diǎn)研究方向。國(guó)內(nèi)圖情學(xué)界對(duì)圖書館信息資源方面的研究主要以理論研究為主,整合、聚合、共享的方法和技術(shù)研究為次;研究服務(wù)模式、服務(wù)創(chuàng)新、個(gè)性化服務(wù)等理論較多,應(yīng)用與實(shí)踐研究較少。
2.3 研究述評(píng)
梳理國(guó)內(nèi)外相關(guān)研究發(fā)現(xiàn),國(guó)外圖書館在信息資源建設(shè)中非常重視服務(wù)質(zhì)量和服務(wù)模式,在進(jìn)行文獻(xiàn)資源管理和知識(shí)管理的同時(shí),給予讀者一種參與式的閱讀體驗(yàn),以滿足讀者的需要。國(guó)內(nèi)圖書館更傾向于知識(shí)獲取和圖書館基本功能的實(shí)現(xiàn),服務(wù)與國(guó)外相比還有進(jìn)一步提升的空間。國(guó)內(nèi)注重“圖書館”相關(guān)問(wèn)題的研究,國(guó)外則偏向信息領(lǐng)域的研究[3]。整體來(lái)說(shuō),目前國(guó)內(nèi)外同時(shí)涵蓋“大數(shù)據(jù)”和“信息資源融合”的研究還比較少,許多文獻(xiàn)對(duì)國(guó)內(nèi)圖書館科學(xué)數(shù)據(jù)“共享—集成—整合—聚合”進(jìn)行研究,但大多集中于某一具體環(huán)節(jié),且以理論研究為主,而對(duì)于大數(shù)據(jù)背景下整體的科學(xué)融合研究和實(shí)踐研究則為數(shù)不多。
利用大數(shù)據(jù)技術(shù)提取圖書館信息資源系統(tǒng)內(nèi)部各層次的整合,結(jié)合向外延伸的整合,實(shí)現(xiàn)信息資源整合與服務(wù)創(chuàng)新的有效轉(zhuǎn)化,是未來(lái)圖書館發(fā)展的必然趨勢(shì)?;诖耍疚慕榻B國(guó)內(nèi)外圖書館信息資源融合與資源共享方面研究和實(shí)踐情況,從概念、意義、作用等角度分析當(dāng)前研究中存在的主要問(wèn)題,介紹基于大數(shù)據(jù)的圖書館信息資源內(nèi)部融合和向外延伸融合的五種深度融合模式。在此基礎(chǔ)上提出融合策略和融合路徑,最后對(duì)圖書館信息資源融合進(jìn)行展望。
3 現(xiàn)實(shí)問(wèn)題及融合模式
3.1 大數(shù)據(jù)對(duì)圖書館發(fā)展的影響
大數(shù)據(jù)背景下圖書館資源可無(wú)限擴(kuò)展,除了其本身具有的海量數(shù)字資源,還有全文本、影像、聲音、超媒體以及其他非結(jié)構(gòu)化的復(fù)雜信息。海量的信息數(shù)據(jù)的增長(zhǎng)和資源結(jié)構(gòu)的改變使用戶的需求也發(fā)生了變化。不同用戶在文化、年齡、素養(yǎng)、專業(yè)等方面存在顯著差異,單純的數(shù)字化資源獲取與網(wǎng)絡(luò)化資源存取已無(wú)法滿足大多數(shù)用戶。圖書館大數(shù)據(jù)資源的擴(kuò)展、用戶需求的變化和圖書館服務(wù)要求的提升都對(duì)館員素質(zhì)、圖書館管理、業(yè)務(wù)流程和服務(wù)水平提出了巨大挑戰(zhàn)。傳統(tǒng)圖書館與大數(shù)據(jù)圖書館的比較見(jiàn)表1。
3.2 融合面對(duì)的現(xiàn)實(shí)問(wèn)題
圖書館信息資源的融合面臨組織管理理念不足,信息技術(shù)平臺(tái)不健全,專業(yè)人才匱乏、數(shù)字安全性能無(wú)法保證、用戶信息素養(yǎng)欠缺等諸多問(wèn)題。首先是理論因素方面。國(guó)外對(duì)信息資源整合的研究較早,尤其是發(fā)達(dá)國(guó)家,相關(guān)的理論比較完善,實(shí)現(xiàn)的技術(shù)也比較成熟。但國(guó)內(nèi)該領(lǐng)域理論研究不夠深入,沒(méi)有較為全面和系統(tǒng)的研究成果。理論是對(duì)實(shí)踐的指導(dǎo),理論研究的不完善會(huì)限制信息資源整合的實(shí)踐發(fā)展。其次是文化和主體因素方面。目前,圖書館信息資源融合研究主體以高校圖書館和公共圖書館為主,參與機(jī)構(gòu)的范圍與數(shù)量都較少。并且進(jìn)行資源整合的類型還主要集中在圖書情報(bào)等范圍,博物館、藝術(shù)館等其他文化機(jī)構(gòu)對(duì)資源整合的研究還稍有欠缺。在進(jìn)行融合的各方面合作中,不同領(lǐng)域、制度、運(yùn)行機(jī)制的作用和機(jī)構(gòu)的合作意愿、認(rèn)同等需要來(lái)自上層管理方的主導(dǎo)和支持。要實(shí)現(xiàn)圖書館信息資源深度融合,打破不同管理體系與管理方式的阻隔是前提條件。此外,還要成立統(tǒng)一的協(xié)調(diào)機(jī)構(gòu),組織建立統(tǒng)一的標(biāo)準(zhǔn)處理各項(xiàng)數(shù)據(jù),從而解決館藏差異的問(wèn)題。再次是技術(shù)和標(biāo)準(zhǔn)因素方面。從統(tǒng)計(jì)的研究文獻(xiàn)來(lái)看,信息資源整合的標(biāo)準(zhǔn)研究較少。由于技術(shù)差異較大,各區(qū)域之間圖書館信息資源整合非標(biāo)準(zhǔn)化因素較多,圖書館服務(wù)資源異地交互技術(shù),圖書館服務(wù)決策支持系統(tǒng)本體技術(shù)、圖書館異地資源融合和智能規(guī)范處理技術(shù)等成為大數(shù)據(jù)背景下圖書館信息服務(wù)必須具備的關(guān)鍵技術(shù)。最后是法律因素方面。圖書館信息資源融合目前沒(méi)有一套完整的管理制度和統(tǒng)一標(biāo)準(zhǔn),參與各方的權(quán)利義務(wù)尚未明確,融合過(guò)程中缺乏對(duì)版權(quán)的有效保護(hù),一旦出現(xiàn)數(shù)據(jù)安全問(wèn)題,難以界定責(zé)任和追責(zé),使得圖書館在進(jìn)行數(shù)據(jù)融合過(guò)程中保持謹(jǐn)慎保守的態(tài)度。
3.3 融合模式
目前,信息資源整合模式主要有以下5種:基于OPAC的匯合整合模式、基于信息資源導(dǎo)航的整合模式、基于跨庫(kù)檢索的信息資源組合整合模式、基于超鏈接系統(tǒng)的信息資源整合模式、基于信息應(yīng)用系統(tǒng)的重組整合模式。1)基于OPAC的匯合整合模式。OPAC是圖書館重要的數(shù)字資源系統(tǒng),也是讀者訪問(wèn)館藏資源的入口及平臺(tái),其基礎(chǔ)內(nèi)容是館藏書目數(shù)據(jù)。整合方式主要有兩種:一是通過(guò)執(zhí)行Z39.50協(xié)議實(shí)現(xiàn),匯集各個(gè)資源平臺(tái)及機(jī)構(gòu)的OPAC數(shù)據(jù)庫(kù),搭建文獻(xiàn)資源整合檢索系統(tǒng),讀者只需登錄任意一個(gè)OPAC檢索系統(tǒng),就可查閱到匯合后的其他圖書館的OPAC內(nèi)容。二是利用數(shù)據(jù)服務(wù)機(jī)構(gòu)提供的MARC數(shù)據(jù),將網(wǎng)絡(luò)數(shù)字資源導(dǎo)入OPAC,整合實(shí)體館藏與虛擬資源,形成更完整的資源檢索系統(tǒng)。該模式的優(yōu)勢(shì)是較完整地綜合了不同平臺(tái)的資源,兼顧傳統(tǒng)文獻(xiàn)資源與虛擬數(shù)字資源,有效提高了資源的訪問(wèn)率和使用率。該模式存在的主要問(wèn)題:一是各館藏資源僅進(jìn)行簡(jiǎn)單的相加合并,用戶通過(guò)統(tǒng)一檢索界面僅能查到各館對(duì)符合檢索要求的文獻(xiàn)目錄,還需逐一對(duì)查詢到的信息進(jìn)行篩選。二是數(shù)字資源獲取不穩(wěn)定。由于部分?jǐn)?shù)據(jù)庫(kù)不完全支持Open RUL標(biāo)準(zhǔn),使得數(shù)據(jù)庫(kù)中的信息資源常會(huì)發(fā)生更新和地址變動(dòng),用戶在獲取資源時(shí)會(huì)遇到資源地址無(wú)法訪問(wèn)的情況,影響使用感受。三是系統(tǒng)維護(hù)更新成本較高。如需擴(kuò)大OPAC系統(tǒng)的功能權(quán)限,需要系統(tǒng)開(kāi)發(fā)商的配合,為此將增加更多的經(jīng)費(fèi)。2)基于信息資源導(dǎo)航的整合模式。通過(guò)信息資源的URL建立數(shù)字資源的導(dǎo)航系統(tǒng),將資源檢索入口進(jìn)行整合,搭建一個(gè)導(dǎo)航庫(kù)。提供的檢索途徑可包括資源名稱、標(biāo)識(shí)、關(guān)鍵詞等,其主要功能是為用戶提供統(tǒng)一的導(dǎo)航檢索入口。該模式的優(yōu)勢(shì)是有效整合了館藏資源和網(wǎng)絡(luò)資源,使得用戶對(duì)資源的獲取更完整更全面,提高了資源的利用效率。該模式存在的不足:一是其整合的是信息資源系統(tǒng)表現(xiàn)層,仍處于較低層次的整合階段,尚未能實(shí)現(xiàn)對(duì)資源內(nèi)容的整合。二是仍無(wú)法讓用戶“一鍵”獲得資源,僅是提供了較為高效的檢索入口服務(wù),用戶還需對(duì)查詢到的數(shù)據(jù)進(jìn)行重復(fù)性的閱讀和篩選。三是導(dǎo)航成功率不穩(wěn)定。館藏資源的調(diào)整、數(shù)據(jù)庫(kù)地址的改變等都會(huì)直接導(dǎo)致導(dǎo)航鏈接地址失效,降低了資源檢索效率。3)基于跨庫(kù)檢索的信息資源組合整合模式。即指建立HDB(Heterogeneous DataBase)的統(tǒng)一檢索平臺(tái),實(shí)現(xiàn)一個(gè)界面、多庫(kù)檢索。通過(guò)對(duì)檢索界面和數(shù)據(jù)庫(kù)內(nèi)容的雙重整合,極大地提升用戶對(duì)信息資源的獲取效率。該模式的主要優(yōu)勢(shì)是:數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)一、操作方便快捷、檢索效率較高。由于該模式還對(duì)數(shù)據(jù)庫(kù)內(nèi)容進(jìn)行了查重處理,相較于前兩種模式,省去了用戶對(duì)查詢內(nèi)容的去重操作,大大節(jié)省了用戶的時(shí)間和精力。跨庫(kù)檢索系統(tǒng)的整合理念較為先進(jìn),但由于技術(shù)的限制,仍存在一些問(wèn)題。一是檢索系統(tǒng)受到各個(gè)數(shù)據(jù)庫(kù)原有的搜索引擎的限制,無(wú)法完全調(diào)用數(shù)據(jù)庫(kù)的檢索功能,如不支持高級(jí)檢索等,導(dǎo)致統(tǒng)一檢索平臺(tái)的檢索精度和廣度仍然不足。二是受到各個(gè)數(shù)據(jù)庫(kù)使用權(quán)限的限制,僅能在小部分的數(shù)據(jù)庫(kù)中實(shí)現(xiàn),未能廣泛普及推廣。4)基于超鏈接系統(tǒng)的信息資源整合模式。該模式也可稱為超鏈接整合模式,是指運(yùn)用網(wǎng)絡(luò)超文本鏈接方式,鏈接館藏信息資源的相關(guān)知識(shí)點(diǎn),形成一個(gè)具有內(nèi)在聯(lián)系的整體,構(gòu)建一個(gè)系統(tǒng)的資源體系,有效增強(qiáng)資源之間的信息緊密度。以CNKI為例,其運(yùn)用的“知網(wǎng)節(jié)”技術(shù)就是將文獻(xiàn)按內(nèi)容相關(guān)度鏈接成一個(gè)信息網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)。其優(yōu)勢(shì)主要為信息資源依據(jù)知識(shí)點(diǎn)有機(jī)整合后,構(gòu)成了聯(lián)系緊密、邏輯清晰的信息資源體系,以便用戶更全面地掌握知識(shí)網(wǎng)絡(luò),提高了信息資源的利用率。其存在的主要問(wèn)題:一是復(fù)雜的知識(shí)網(wǎng)絡(luò)容易導(dǎo)致用戶在檢索時(shí)隨著鏈接層次的深入而迷失檢索方向。二是使用范圍較窄,由于需要對(duì)信息資源的檢索機(jī)制進(jìn)行鏈接整合,在現(xiàn)今的技術(shù)條件下,仍無(wú)法在更廣泛的數(shù)據(jù)庫(kù)之間協(xié)同處理。5)基于信息應(yīng)用系統(tǒng)的重組整合模式。這是一種基于應(yīng)用系統(tǒng)的整合模式,通過(guò)對(duì)信息資源從內(nèi)容到結(jié)構(gòu)的重組,組成一個(gè)具有內(nèi)在邏輯關(guān)系的、立體的、交叉網(wǎng)狀的知識(shí)資源體系,運(yùn)用跨庫(kù)技術(shù),搭建一個(gè)資源整合的平臺(tái)。系統(tǒng)一般由信息資源建設(shè)、信息資源存儲(chǔ)管理和用戶服務(wù)三大模塊組成。其優(yōu)勢(shì)主要有:一是能夠整合多種渠道不同載體的各類信息資源,如紙質(zhì)文獻(xiàn)、音頻、視頻等。二是能夠?qū)崿F(xiàn)不同層次、不同類型信息資源間的鏈接,建立相關(guān)資源之間的聯(lián)系。三是通過(guò)資源整合,能夠形成新的知識(shí)網(wǎng)絡(luò)和資源功能系統(tǒng)。其存在的主要問(wèn)題是由于建設(shè)系統(tǒng)的投入成本較高,建設(shè)周期長(zhǎng),需要協(xié)調(diào)的資源較多,中小型的圖書館難以使用此項(xiàng)整合模式,一般由國(guó)家級(jí)圖書館牽頭完成。
4 融合策略與路徑
4.1 融合策略
4.1.1 科學(xué)合理規(guī)劃資源整合。信息資源的整合應(yīng)做到科學(xué)統(tǒng)籌、合理規(guī)劃,以用戶需求為導(dǎo)向,結(jié)合圖書館的實(shí)際情況制定建設(shè)目標(biāo)。建設(shè)方案應(yīng)遵循資源整合的原則,標(biāo)準(zhǔn)規(guī)范,切實(shí)可行,避免重復(fù)建設(shè)和資源浪費(fèi)。在資源建設(shè)方面應(yīng)重點(diǎn)整合特色資源,優(yōu)先建設(shè)特色數(shù)據(jù)庫(kù)。在系統(tǒng)建設(shè)方面,應(yīng)以滿足用戶需求,提高用戶使用資源效率為目標(biāo),扎實(shí)推進(jìn)信息資源整合工作,全面提升圖書館的信息服務(wù)水平。
4.1.2 建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),采用先進(jìn)的科學(xué)技術(shù)。要整合分布在不同數(shù)據(jù)庫(kù)及信息系統(tǒng)中的數(shù)據(jù),實(shí)現(xiàn)資源的共享,就需建立一套標(biāo)準(zhǔn)化的規(guī)范體系和統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。采用科學(xué)標(biāo)準(zhǔn)的體系進(jìn)行資源整合,才可保證信息在各系統(tǒng)和數(shù)據(jù)庫(kù)之間準(zhǔn)確調(diào)用、實(shí)現(xiàn)共享。同時(shí),還應(yīng)搭建起信息資源整合的交流平臺(tái),加強(qiáng)技術(shù)隊(duì)伍建設(shè),探索更先進(jìn)的技術(shù)手段,從而更好地實(shí)現(xiàn)信息資源的有效融合。
4.1.3 建立開(kāi)放式的整合機(jī)制。高效準(zhǔn)確的信息檢索系統(tǒng),依賴于開(kāi)放式的資源共享模式。建立開(kāi)放式的信息資源整合機(jī)制,包括數(shù)據(jù)庫(kù)的開(kāi)放、數(shù)據(jù)接口的開(kāi)放、規(guī)范服務(wù)接口、制定系統(tǒng)的開(kāi)放描述等。只有開(kāi)放的整合機(jī)制與科學(xué)的管理機(jī)制相結(jié)合,才能實(shí)現(xiàn)信息資源融合系統(tǒng)的有效管理。
4.1.4 提高數(shù)字資源鏈接的穩(wěn)定性。數(shù)據(jù)庫(kù)資源的更新與整合容易導(dǎo)致用戶檢索到的資源鏈接地址失效,而采用動(dòng)態(tài)虛擬資源鏈接技術(shù),可在現(xiàn)有數(shù)據(jù)庫(kù)的基礎(chǔ)上,將相關(guān)的信息資源根據(jù)制定的規(guī)則標(biāo)準(zhǔn)重新整合,形成有序的信息鏈和資源集合,有效提升信息資源鏈接的可靠性和穩(wěn)定性。
大數(shù)據(jù)背景下,圖書館數(shù)字資源的融合必須以最新、最先進(jìn)的數(shù)據(jù)處理技術(shù)為基礎(chǔ),通過(guò)數(shù)據(jù)采集、數(shù)據(jù)挖掘、數(shù)據(jù)存儲(chǔ)、云計(jì)算、可視化技術(shù)、知識(shí)發(fā)現(xiàn)等技術(shù)共同完成數(shù)據(jù)資源的融合,為資源融合平臺(tái)的構(gòu)建提供充分的數(shù)據(jù)支持,從而實(shí)現(xiàn)良好的數(shù)據(jù)共享[4]。
4.2 融合路徑
4.2.1 構(gòu)建圖書館信息數(shù)字資源融合平臺(tái)。圖書館信息數(shù)字資源融合平臺(tái)通過(guò)融合完整的各類圖書館大數(shù)據(jù),將高校圖書館、檔案館、博物館、美術(shù)館、展覽館等多方資源有機(jī)組合成一個(gè)整體,有利于實(shí)現(xiàn)大數(shù)據(jù)資源的共建共享。通過(guò)引入“數(shù)字人文”理念,運(yùn)用專業(yè)的技術(shù)手段對(duì)既有的信息數(shù)字資源進(jìn)行處理、分析和重構(gòu),挖掘資源的潛在價(jià)值,充分發(fā)揮資源的利用率,增強(qiáng)圖書館的管理水平、改善圖書館的業(yè)務(wù)流程、創(chuàng)新圖書館的服務(wù)模式,提升用戶體驗(yàn)。
融合平臺(tái)構(gòu)建的總體思路應(yīng)當(dāng)以技術(shù)為支撐、以大數(shù)據(jù)全過(guò)程管理為核心、以信息資源應(yīng)用為主導(dǎo),注重安全性及經(jīng)濟(jì)性。平臺(tái)的主體功能包括資源融合、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用三個(gè)功能,分別對(duì)應(yīng)數(shù)據(jù)獲取、數(shù)據(jù)存儲(chǔ),數(shù)據(jù)處理,數(shù)據(jù)應(yīng)用等標(biāo)準(zhǔn)化步驟。圖書館所有信息數(shù)字資源最終要通過(guò)融合平臺(tái)連接起來(lái),以一套嚴(yán)格的標(biāo)準(zhǔn)化管理體系和安全運(yùn)行機(jī)制貫穿其中,實(shí)現(xiàn)大數(shù)據(jù)資源融合和在此基礎(chǔ)上的大數(shù)據(jù)應(yīng)用。整個(gè)平臺(tái)在數(shù)據(jù)獲取和存儲(chǔ)中實(shí)現(xiàn)資源融合,在數(shù)據(jù)處理中實(shí)現(xiàn)管理融合,在數(shù)據(jù)應(yīng)用中實(shí)現(xiàn)服務(wù)融合。圖書館信息數(shù)字資源融合平臺(tái)構(gòu)建框架見(jiàn)圖6。
4.2.2 圖書館信息資源融合具體步驟。1)圖書館信息資源的獲取。在數(shù)據(jù)獲取環(huán)節(jié),圖書館通常以閱讀終端技術(shù)、視頻技術(shù)、爬蟲、RFID、AI技術(shù)等方式,廣泛收集并整理各類來(lái)自社會(huì)各個(gè)領(lǐng)域、行業(yè)的館藏書目數(shù)據(jù)、業(yè)務(wù)工作(采編、借閱、咨詢)數(shù)據(jù)、社交網(wǎng)絡(luò)(自媒體、抖音、微博)數(shù)據(jù)、用戶個(gè)人數(shù)據(jù)等等。例如,百度、搜狗等大型互聯(lián)網(wǎng)信息服務(wù)機(jī)構(gòu)借用數(shù)據(jù)庫(kù)供應(yīng)商資源共享,運(yùn)用OAI-PMH(元數(shù)據(jù)獲取協(xié)議)的元數(shù)據(jù)收割技術(shù),以強(qiáng)大搜索引擎技術(shù)為輔助,利用Python技術(shù)對(duì)擬采集數(shù)據(jù)進(jìn)行檢索、收集、處理、解析等。對(duì)于收集到的數(shù)據(jù),利用ETL工具完成整個(gè)圖書館大數(shù)據(jù)的跟蹤、采集、加工、描述、分類等預(yù)處理工作,以提高數(shù)據(jù)的可用性、可存儲(chǔ)性、可靠性和準(zhǔn)確性。數(shù)據(jù)獲取為數(shù)據(jù)后續(xù)存儲(chǔ)、分析和處理提供有效的數(shù)據(jù)資源,為融合平臺(tái)有效運(yùn)轉(zhuǎn)奠定良好基礎(chǔ)。2)圖書館信息資源的存儲(chǔ)。在獲取所需信息資源后,需要對(duì)資源進(jìn)行存儲(chǔ)。信息資源存儲(chǔ)是信息分析處理的前提和基礎(chǔ),存儲(chǔ)管理水平將直接影響資源質(zhì)量和后續(xù)的處理效率。一個(gè)好的圖書館大數(shù)據(jù)存儲(chǔ)平臺(tái)應(yīng)滿足以下條件:一是存儲(chǔ)容量足夠大,且可擴(kuò)展性強(qiáng),能存儲(chǔ)至少FB級(jí)別的海量數(shù)據(jù);二是具備強(qiáng)勁的處理運(yùn)算能力,能實(shí)時(shí)處理數(shù)據(jù);三是能處理多樣化的數(shù)據(jù);四是有適應(yīng)融合技術(shù)的集中數(shù)據(jù)平臺(tái)(Hadoop架構(gòu))。即能在同一系統(tǒng)內(nèi)實(shí)現(xiàn)存、取、歸檔等功能,并開(kāi)放數(shù)據(jù)接口,能連接數(shù)據(jù)分析應(yīng)用軟件。具體做法是將數(shù)據(jù)獲取到的元數(shù)據(jù)經(jīng)過(guò)抽取、分類、清洗、描述等預(yù)處理工作后分別存儲(chǔ)于不同的介質(zhì)內(nèi)(數(shù)據(jù)倉(cāng)庫(kù)),“倉(cāng)庫(kù)”按照數(shù)據(jù)分級(jí)原則存儲(chǔ)數(shù)據(jù),主數(shù)據(jù)倉(cāng)庫(kù)和分布式數(shù)據(jù)倉(cāng)庫(kù)分工協(xié)作,有序傳遞數(shù)據(jù)。分布式數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)單多維關(guān)聯(lián)、加工、分類數(shù)據(jù),不做關(guān)聯(lián)勾稽,主倉(cāng)在分布式倉(cāng)庫(kù)推送的匯總數(shù)據(jù)基礎(chǔ)上再次提煉高度匯總數(shù)據(jù),提供多維分析數(shù)據(jù)、綜合決策模型數(shù)據(jù),減少數(shù)據(jù)垃圾沉積,有效解決海量數(shù)據(jù)異構(gòu)異地異質(zhì)等問(wèn)題,便于數(shù)據(jù)處理與應(yīng)用。3)圖書館信息資源的處理。信息資源的處理技術(shù)是圖書館信息資源管理的重點(diǎn)及核心環(huán)節(jié)。此步驟以用戶的特定需求、業(yè)務(wù)開(kāi)展需要為出發(fā)點(diǎn),利用特殊的算法對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)分析、多維分析、關(guān)聯(lián)分析和數(shù)據(jù)挖掘等多項(xiàng)操作。例如,MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。Map即“分解”,Reduce即“合并”。平臺(tái)算法是把計(jì)算作業(yè)拆分成若干個(gè)Map任務(wù),每個(gè)任務(wù)完成自己分配到的輸入數(shù)據(jù),當(dāng)Map任務(wù)完成后,會(huì)生成一些中間文件,這些中間文件將會(huì)作為Reduce任務(wù)的輸入數(shù)據(jù),最后將Reduce任務(wù)輸出結(jié)果匯總后得到最終結(jié)果。圖書館數(shù)字資源融合平臺(tái)中的圖書館大數(shù)據(jù)處理通過(guò)數(shù)據(jù)訪問(wèn)接口從數(shù)據(jù)存儲(chǔ)層獲得所需數(shù)據(jù),通過(guò)MapReduce分布式并行處理數(shù)據(jù),得出所需計(jì)算結(jié)果。圖書館資源數(shù)據(jù)的使用分析、用戶行為特征分析、業(yè)務(wù)流程分析等都可以通過(guò)MapReduce解決。MapReducer的數(shù)據(jù)處理流程具體見(jiàn)圖7。4)圖書館信息資源的應(yīng)用。應(yīng)用是大數(shù)據(jù)技術(shù)的根本落腳點(diǎn)。基于數(shù)據(jù)處理結(jié)果,針對(duì)不同群體大數(shù)據(jù)需求提供針對(duì)性的服務(wù)內(nèi)容和形式,提升客戶決策質(zhì)量,精準(zhǔn)高效地滿足數(shù)字服務(wù)需求。關(guān)聯(lián)分析能將特定領(lǐng)域內(nèi)所有相關(guān)的要素?cái)?shù)據(jù)完全關(guān)聯(lián)并進(jìn)行關(guān)聯(lián)分析,為決策者提供決策支持。比如在開(kāi)展汽車行業(yè)競(jìng)爭(zhēng)情況分析時(shí),就要對(duì)競(jìng)爭(zhēng)個(gè)體、競(jìng)爭(zhēng)產(chǎn)品、營(yíng)銷方案、營(yíng)利模式等不同企業(yè)、不同時(shí)段的多維數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,從而為行業(yè)進(jìn)入者和退出者制定競(jìng)爭(zhēng)策略提供信息支撐。數(shù)據(jù)可視化服務(wù)的形式是數(shù)據(jù)分析結(jié)果的展示,圖書館可利用可視化工具進(jìn)行學(xué)科服務(wù)。
5 思考與展望
隨著現(xiàn)代社會(huì)的發(fā)展,大數(shù)據(jù)技術(shù)的廣泛應(yīng)用使信息資源獲取方式變得越來(lái)越高效、便捷,用戶對(duì)于信息的需求也逐漸增加。對(duì)于圖書館而言,在未來(lái)發(fā)展中應(yīng)重點(diǎn)關(guān)注大數(shù)據(jù)技術(shù)對(duì)自身發(fā)展的影響,即將大數(shù)據(jù)技術(shù)廣泛應(yīng)用于圖書館信息資源建設(shè)中。
5.1 開(kāi)展面向知識(shí)的資源整合服務(wù)
現(xiàn)階段的文獻(xiàn)信息資源組織技術(shù)與揭示深度表明,圖書館信息資源整合重心由以元數(shù)據(jù)為主轉(zhuǎn)變?yōu)橐灾R(shí)關(guān)聯(lián)為主。因此,今后要增加對(duì)再生資源的生產(chǎn)、匯集和存儲(chǔ),真正擴(kuò)展數(shù)字圖書館的數(shù)據(jù)資源范疇。同時(shí),不斷加強(qiáng)元數(shù)據(jù)關(guān)聯(lián)關(guān)系庫(kù)建設(shè),多維度聚合展示資源,逐步將館藏信息資源整理與揭示的重心由文獻(xiàn)層向內(nèi)容層、關(guān)系層轉(zhuǎn)移,確立以內(nèi)容為本,立體化、多元化的知識(shí)網(wǎng)絡(luò),使資源揭示服務(wù)將真正實(shí)現(xiàn)由獲得文獻(xiàn)線索和文獻(xiàn)內(nèi)容的服務(wù)進(jìn)化到獲取知識(shí)體系的服務(wù)。
5.2 從同質(zhì)化到定制化的服務(wù)轉(zhuǎn)變
在傳統(tǒng)圖書館服務(wù)中,沒(méi)有足夠的技術(shù)和人力實(shí)現(xiàn)定制化服務(wù),服務(wù)的精細(xì)化程度不夠。當(dāng)今,圖書館用戶期待更大的自主權(quán)和主動(dòng)權(quán),需要獲得量身打造的定制化服務(wù),能實(shí)現(xiàn)從形式到內(nèi)容一對(duì)一的匹配。定制化服務(wù)是個(gè)性化服務(wù),服務(wù)從同質(zhì)化到定制化的轉(zhuǎn)變也是信息服務(wù)從粗放到精細(xì)的轉(zhuǎn)變。用戶更在意自己在服務(wù)過(guò)程中的主導(dǎo)地位,享受到的服務(wù)與需求的匹配度越高,用戶體驗(yàn)越好。大數(shù)據(jù)時(shí)代,用戶面前的備選項(xiàng)眾多,對(duì)于服務(wù)的要求也在提高。普適化服務(wù)缺乏競(jìng)爭(zhēng)力,以用戶為中心的定制化體驗(yàn)才是最優(yōu)選項(xiàng)。如果服務(wù)過(guò)程得到用戶認(rèn)可,之后的口碑傳播也會(huì)產(chǎn)生放大效應(yīng)。
5.3 從模式化溝通到預(yù)見(jiàn)性溝通
傳統(tǒng)圖書館功能相對(duì)單一,讀者與館員的溝通方式相對(duì)簡(jiǎn)單,模式相對(duì)固定,形式相對(duì)被動(dòng)。隨著工作節(jié)奏的加快,信息索取需求增大,用戶希望付出更少的溝通成本來(lái)享受到更高質(zhì)量的服務(wù)。智慧服務(wù)要求懂得用戶的心思,會(huì)預(yù)判用戶的行為,這就需要預(yù)見(jiàn)性的溝通。
預(yù)見(jiàn)性溝通要求館員能設(shè)身處地為用戶著想、充分理解用戶,盡快促成“一致”。溝通形式嵌入用戶信息利用全過(guò)程,信息素養(yǎng)較高的館員能引導(dǎo)用戶高度的參與和交互,解析用戶未來(lái)的需要,有預(yù)見(jiàn)性地提供服務(wù)方向。預(yù)見(jiàn)性溝通可以更高效地描摹用戶群的特征,感知甚至發(fā)掘用戶需求,對(duì)于服務(wù)內(nèi)容的解析和分配也具有重要意義。
5.4 積極發(fā)展特色館藏
大數(shù)據(jù)環(huán)境中,為避免資源的低質(zhì)重復(fù)、低效建設(shè),圖書館在進(jìn)行館藏資源數(shù)據(jù)化時(shí),不需將全部館藏進(jìn)行數(shù)字化處理,可優(yōu)先對(duì)本館的某一方面已經(jīng)具有一定規(guī)模、結(jié)構(gòu)完整、獨(dú)特性差異性顯著的文獻(xiàn)資源進(jìn)行有系統(tǒng)有組織的整理開(kāi)發(fā),以充分發(fā)揮本館的資源特色。特色資源數(shù)據(jù)庫(kù)的建設(shè)是大數(shù)據(jù)時(shí)代圖書館數(shù)字資源建設(shè)的新方向,對(duì)特色資源進(jìn)行深挖和梳理能有效提升各圖書館信息資源融合的質(zhì)量和水平。
[參考文獻(xiàn)]
[1]劉曉英,文庭孝.大數(shù)據(jù)時(shí)代的數(shù)字資源融合研究[J].圖書館,2015(2):58-61.
[2]黃傳慧.大數(shù)據(jù)時(shí)代數(shù)字圖書館研究述評(píng)[J].圖書情報(bào)工作,2018,62(23):142-148.
[3]賈玉文,黃小淋,王康.大數(shù)據(jù)環(huán)境下國(guó)內(nèi)圖書館服務(wù)研究熱點(diǎn)及發(fā)展趨勢(shì)[J].新世紀(jì)圖書館,2019(1):49-55.
[4]范家巧.大數(shù)據(jù)時(shí)代圖書館數(shù)字資源的融合與轉(zhuǎn)化[J].圖書館論壇,2020,40(5):38-44.
[收稿日期]2023-03-02
[作者簡(jiǎn)介]鄧 堅(jiān)(1966—),男,碩士,副研究員,廣西社會(huì)科學(xué)院圖書館。
[說(shuō) 明]本文系2022年度廣西社會(huì)科學(xué)院課題“大數(shù)據(jù)背景下圖書館信息資源深度融合研究”(項(xiàng)目編號(hào):2022-N-008)的研究成果。