◎黃秋萍 吳 銳 鄧芳芳
目前,查收查引已經(jīng)成為大多數(shù)高校圖書館學科服務的基礎服務工作,根據(jù)查收查引的服務方式主要分為以下幾類。
一是通過自主開發(fā)或購買的商業(yè)化查收查引系統(tǒng)開展服務。袁浩等學者指出清華大學、中國科學院文獻情報中心、北京大學、北京郵電大學、武漢大學等重點知名高校和研究所通過自建或合作建設的方式開發(fā)了查收查引系統(tǒng),在很大程度上節(jié)約了人力物力,提高了查收查引的工作效率。但是大多數(shù)系統(tǒng)平臺只具備電子化在線委托、辦理進度查詢、網(wǎng)上支付費用、報告下載等功能,只能算半自動化、半人工的工作模式。
二是利用文獻管理軟件、數(shù)據(jù)分析軟件、機構(gòu)知識庫等工具開發(fā)查收查引軟件。張雪娟、樊亞芳等學者提出用Note Express等文獻管理軟件輔助人工檢索的方法完成查收查引工作,極大地減少了重復性操作步驟,提高了工作效率和服務質(zhì)量。劉艷民等學者開發(fā)出了基于機構(gòu)知識庫CSpace的查收查引功能模塊,可達到95%的收錄引用準確率,能有效滿足高峰期用戶的檢索需求。這類軟件雖優(yōu)化了人工檢索的流程,但仍需以郵件的方式接受檢索委托,處理委托的實時性和反饋結(jié)果的便捷性不佳,有的需要機構(gòu)知識庫的支撐才能實現(xiàn)。
三是許多地方高校由于經(jīng)費不足、人員有限等因素仍然沿用傳統(tǒng)的人工查收查引方法。委托人需要到圖書館現(xiàn)場填寫查收查引委托或在線下載并填寫查收查引委托表,然后將其發(fā)至檢索人員郵箱,由檢索人員在數(shù)據(jù)庫中對委托項目逐條檢索并人工生成報告后,再以電話或者郵件方式通知委托人領取檢索證明。
綜上所述,各高校圖書館采用的查收查引服務方式不盡相同,在服務過程中不同程度地存在各種問題。一是委托檢索流程煩瑣,服務效率低。委托檢索步驟繁多,占用了委托人過多的時間與精力,另外,檢索人員需要在多個數(shù)據(jù)庫中進行檢索和比對,多次反復檢索,容易導致工作人員身心疲憊。二是檢索數(shù)據(jù)難以保存和管理,多年累積的檢索數(shù)據(jù)得不到有效保存和管理,檢索最終成為一次性勞動。三是委托高峰期人手嚴重不足。在每年的科研工作量考核、科研獎勵、職稱評聘、聘期考核期往往出現(xiàn)委托高峰,檢索人員工作量激增,檢索耗時較長。針對以上問題,研究開發(fā)出便捷高效的查收查引服務平臺對地方高校圖書館來說尤為迫切。
華東交通大學圖書館為了提高查收查引工作效率,積極轉(zhuǎn)變查收查引服務工作思路,優(yōu)化傳統(tǒng)檢索工作流程,將原來觸發(fā)性的常規(guī)工作轉(zhuǎn)變?yōu)橛幸?guī)律的周期性工作,將等待用戶上門委托的被動式服務轉(zhuǎn)變?yōu)椴皇軙r空限制、提供自助檢索和檢索證明下載的主動式服務。
華東交通大學圖書館利用現(xiàn)代化信息技術,采用JSP編程技術和SQL Server數(shù)據(jù)庫搭建基于B/S結(jié)構(gòu)的非結(jié)構(gòu)化文檔管理的查收查引服務平臺。平臺以論文索引自建數(shù)據(jù)庫為核心,整合多個數(shù)據(jù)庫的論文收錄引用數(shù)據(jù),提供多種途徑的檢索,并管理論文檢索證明文檔,支持網(wǎng)頁動態(tài)發(fā)布,實現(xiàn)權(quán)限分級管理,包括數(shù)據(jù)存取模塊、內(nèi)容管理模塊、數(shù)據(jù)加工模塊、資源檢索模塊、信息發(fā)布模塊等。整個平臺的運行流程從內(nèi)容管理模塊創(chuàng)建論文索引自建數(shù)據(jù)庫開始,對用戶角色、資源權(quán)限及資源相關配置進行統(tǒng)一管理,由數(shù)據(jù)加工模塊對論文索引元數(shù)據(jù)進行導入、整編、標引、分類、檢查、入庫等一系列處理,其中包括非結(jié)構(gòu)化檢索證明文檔的存儲管理,進而在資源檢索模塊對平臺的多種檢索途徑和檢索導航進行設置,再通過信息發(fā)布模塊將查收查引服務平臺呈現(xiàn)在web上,并配合資源檢索模塊實現(xiàn)論文索引信息的檢索功能,以上所有平臺業(yè)務模塊與底層數(shù)據(jù)庫之間的數(shù)據(jù)傳輸與交互均在數(shù)據(jù)存取模塊的支持下完成。查收查引服務平臺建設分為論文索引數(shù)據(jù)資源化與自建庫平臺建設兩個階段,圖1展示了查收查引服務平臺的建設方案框架。
圖1 查收查引服務平臺建設方案框架(作者自繪)
查收查引服務平臺建設的第一階段是將來源于SCI、SSCI、EI、CPCI等數(shù)據(jù)庫的論文索引原始數(shù)據(jù)資源化,包括論文索引元數(shù)據(jù)設計、數(shù)據(jù)采集、數(shù)據(jù)處理等三個過程,為自建數(shù)據(jù)庫的元數(shù)據(jù)存儲做準備。
元數(shù)據(jù)設計是任何資源數(shù)據(jù)庫建設首要考慮的問題,主要目的在于建立規(guī)范的資源建設標準和數(shù)據(jù)采集方案,確保資源建設的科學性、合理性和穩(wěn)定性。根據(jù)不同數(shù)據(jù)庫中論文索引數(shù)據(jù)的內(nèi)容特征,結(jié)合查收查引服務中檢索結(jié)果的實際需要,確定自建數(shù)據(jù)庫中論文索引元數(shù)據(jù)的所有必要字段及其數(shù)據(jù)類型。建設查收查引服務平臺的主要目的是實現(xiàn)論文自助檢索和檢索證明的自助下載,因此論文索引元數(shù)據(jù)必須包含非結(jié)構(gòu)化文檔數(shù)字對象格式的檢索證明下載字段。與此同時,為了保證檢索證明的唯一性和真實性,便于檢索證明的批量生成和加工上傳,論文索引元數(shù)據(jù)還應該包含檢索證明編號字段,保證其與檢索證明電子文檔中的證明編號一一對應。
論文索引原始數(shù)據(jù)主要來源于SCI、SSCI、EI、CPCI等數(shù)據(jù)庫,現(xiàn)以SCI和EI論文為例介紹原始數(shù)據(jù)的采集過程。從Web of Science和Engineering Village數(shù)據(jù)庫平臺中,通過作者單位、發(fā)表年份等關鍵詞檢索出科研人員可能需要委托檢索的SCI和EI論文,利用數(shù)據(jù)庫平臺的批量導出功能下載論文索引原始數(shù)據(jù)。由于兩大數(shù)據(jù)庫平臺對導出的論文條目有數(shù)量限制,檢索人員可以采取分年度導出再合并到單個Excel工作表的方式對原始數(shù)據(jù)進行整理。在采集論文索引原始數(shù)據(jù)的過程中,必須保證采集數(shù)據(jù)的原始性、真實性、完整性。
在采集的論文索引原始數(shù)據(jù)基礎上,按照論文索引元數(shù)據(jù)設計的字段標準,篩選剔除掉非必要字段,將原始數(shù)據(jù)必要字段處理為符合標準要求的數(shù)據(jù)內(nèi)容,最終生成規(guī)范的論文檢索證明文檔。論文索引元數(shù)據(jù)處理主要分為以下四個步驟。(1)添加檢索證明唯一性編號。按照預先制定的編號規(guī)則對每條論文索引數(shù)據(jù)進行唯一性編號,以形成一條完整的自建庫論文索引元數(shù)據(jù)。(2)批量生成檢索證明。為了提高檢索證明電子文檔的生成效率,利用Word軟件將論文索引元數(shù)據(jù)導入檢索證明統(tǒng)一模板,由此批量合并生成含有所有元數(shù)據(jù)的檢索證明。(3)拆分出獨立的檢索證明。為了保證每篇論文都有獨立的檢索證明可供下載,必須將合并后的文檔拆分成以檢索證明編號為文件名的單獨Word文檔。(4)復核并加密PDF證明文檔。對于已經(jīng)生成的檢索證明內(nèi)容需要再次進行人工復核和格式上的微調(diào),以保證檢索結(jié)果的完整性、準確性和證明文檔整體的美觀性。為了避免檢索證明的內(nèi)容被復制和篡改,同時防止電子印章和檢索人員簽名圖片被惡意盜用,需要將證明電子文檔轉(zhuǎn)換并加密為PDF格式。
論文索引原始數(shù)據(jù)的采集及元數(shù)據(jù)的處理流程如圖2所示,論文索引元數(shù)據(jù)處理完畢即實現(xiàn)了論文索引數(shù)據(jù)資源化,再通過論文索引自建庫平臺中的數(shù)據(jù)加工完成元數(shù)據(jù)入庫及檢索證明上傳,便形成了查收查引服務平臺的數(shù)據(jù)基礎。
圖2 論文索引原始數(shù)據(jù)采集及元數(shù)據(jù)處理流程圖(以SCI、EI論文為例)(作者自繪)
論文索引數(shù)據(jù)資源化為論文索引自建庫平臺建設提供了數(shù)據(jù)支撐?,F(xiàn)對論文索引自建庫平臺具體功能的實現(xiàn)做進一步闡述。
數(shù)據(jù)存取模塊的功能是實現(xiàn)穩(wěn)定、高效的數(shù)據(jù)存取,建立業(yè)務邏輯與底層數(shù)據(jù)庫之間的交互,以提高平臺的運行性能。數(shù)據(jù)存取模塊遵循SOA架構(gòu)標準,采用基于JDBC規(guī)范的標準接口,利用基于組件模型的編程方法,使用SQLServer數(shù)據(jù)庫與JAVA設計模式進行開發(fā),以實現(xiàn)數(shù)據(jù)導入、數(shù)據(jù)更新、數(shù)字對象存儲、數(shù)據(jù)信息提取、數(shù)據(jù)庫備份等功能。論文索引自建庫平臺的數(shù)字資源包括論文索引元數(shù)據(jù)、加工數(shù)據(jù)、檢索證明數(shù)字對象。其中,元數(shù)據(jù)、加工數(shù)據(jù)存儲于結(jié)構(gòu)化數(shù)據(jù)庫中,檢索證明數(shù)字對象存儲于文件存儲系統(tǒng)中。為了滿足文件存儲系統(tǒng)的易用性和兼容性要求,采用NFS/CIFS協(xié)議的存儲方案解決平臺非結(jié)構(gòu)化文檔數(shù)字對象的統(tǒng)一存儲、管理和共享問題,以保證數(shù)據(jù)的一致性和安全性。
內(nèi)容管理模塊可以實現(xiàn)自建數(shù)據(jù)庫的信息管理、用戶角色管理、資源權(quán)限管理、分類導航管理、文檔數(shù)字對象管理等功能。(1)自建數(shù)據(jù)庫的信息管理包含創(chuàng)建、刪除、修改數(shù)據(jù)庫,配置數(shù)據(jù)庫名稱、基本信息、數(shù)據(jù)庫文件保存路徑等功能。(2)將用戶角色和資源權(quán)限管理相結(jié)合,實現(xiàn)對資源的安全管理,如不同用戶對資源有不同的訪問級別。(3)分類導航管理可根據(jù)實際需要設置學科、發(fā)文年份、索引類別等分類導航,對已標引的資源實現(xiàn)自動分類。(4)文檔數(shù)字對象管理是系統(tǒng)管理員根據(jù)實際需求,對數(shù)字對象進行重新命名,如保留原文件名或?qū)⑸蟼鞯奈募臑橐詴r間序列命名,必須保證文件名的唯一性。
數(shù)據(jù)加工模塊主要是通過對導入的論文索引元數(shù)據(jù)與檢索證明數(shù)字對象進行整編、標引、分類、檢查、入庫加工,建立元數(shù)據(jù)與檢索證明文檔一一對應的關系,以提供多種類型分類導航和多種途徑檢索的功能。利用JSP開發(fā)技術實現(xiàn)基于web界面的數(shù)據(jù)解決方案,其中包含批量導入論文索引元數(shù)據(jù),上傳檢索證明數(shù)字對象,按學科類別、發(fā)文年份、索引類別標引和分類,檢查數(shù)據(jù)一致性,審核入庫等步驟。
資源檢索模塊是查收查引服務平臺的重要部分,是用戶能否有效利用平臺的關鍵。資源檢索模塊的工作原理是用戶在前端web界面輸入關鍵詞或設置檢索條件,由后端程序根據(jù)檢索設置自動生成SQL語句檢索式,在數(shù)據(jù)庫中執(zhí)行查詢語句,將檢索結(jié)果傳遞到前端界面。資源檢索模塊可配置不同檢索方式,支持多導航輔助檢索,也可進行各類型數(shù)據(jù)庫的統(tǒng)一跨庫檢索。
信息發(fā)布模塊是查收查引服務平臺對外服務的窗口,實現(xiàn)了自建數(shù)據(jù)庫在網(wǎng)頁上發(fā)布的各種信息配置管理,其建設遵循標準的OpenURL、Z39.50、Portlet、SAML、Web Services等協(xié)議,包含定制多種發(fā)布風格,設置檢索字段、概覽字段、細覽字段的格式,支持多種導航等功能,為用戶提供集檢索、瀏覽、下載等于一體的Web綜合性門戶網(wǎng)站。
華東交通大學圖書館利用現(xiàn)代化信息技術搭建的高校圖書館查收查引服務平臺,具有方便易用、檢索高效、下載快捷、管理規(guī)范、發(fā)布靈活、更新及時等特點,不僅極大地提高了查收查引工作的效率,而且改進了傳統(tǒng)查收查引服務模式的不足,是一次從被動服務到主動服務的轉(zhuǎn)變和創(chuàng)新實踐,能使用戶隨時隨地進行自助檢索和下載檢索證明。
通過大力宣傳和推廣查收查引服務新平臺,用戶逐漸接受和習慣了自助檢索和下載的新模式。查收查引服務平臺在華東交通大學圖書館正常運行一年,研究發(fā)現(xiàn)高校師生委托人工查收查引的數(shù)量大幅減少,相比去年同期減少了50%。用戶對查收查引服務新模式的便利性、時效性、準確性都給予了充分肯定,此舉進一步提升了圖書館查收查引服務的用戶滿意度,也為其他想要優(yōu)化檢索工作流程、提高檢索工作效率的地方高校圖書館的查收查引服務工作提供了參考和借鑒。