謝振寶,劉迎春,司福明(.安徽機(jī)電職業(yè)技術(shù)學(xué)院,安徽 蕪湖 400;.安徽建筑大學(xué),安徽 合肥 300)
?
垂直搜索在圖書館電子資源系統(tǒng)中的應(yīng)用研究
謝振寶1,劉迎春2,司福明1
(1.安徽機(jī)電職業(yè)技術(shù)學(xué)院,安徽蕪湖241002;2.安徽建筑大學(xué),安徽合肥230022)
摘要:電子資源作為現(xiàn)代圖書館的重要館藏資源,不僅是高校以及其它科研機(jī)構(gòu)從事教學(xué)、科研的重要參考資料,其建設(shè)水平也成為了圖書館館藏的主要衡量標(biāo)準(zhǔn)之一.隨著圖書館信息化程度的不斷提高,如何科學(xué)、有效地使用電子資源,已經(jīng)成為現(xiàn)代圖書館關(guān)注的重要課題.而垂直搜索是針對某一特定領(lǐng)域,服務(wù)于某一特定人群的搜索,垂直搜索在技術(shù)上與傳統(tǒng)的搜索并無根本差異,但搜索的策略卻發(fā)生了變化,即由傳統(tǒng)的“大而全”變?yōu)椤皩6?垂直搜索能有效整合圖書館現(xiàn)有電子資源,提高電子資源的利用率,節(jié)省用戶時間.在圖書館電子資源系統(tǒng)中發(fā)展垂直搜索已經(jīng)成為水到渠成的事情.
關(guān)鍵詞:圖書館;電子資源;垂直搜索
目前,各個公共圖書館和高校圖書館都投入了巨大的人力和財(cái)力引進(jìn)了大量的電子資源.2012年11月至2013年1月間的一項(xiàng)針對國內(nèi)本科高等學(xué)校的調(diào)查表明目前我國高校圖書館平均擁有中外文電子數(shù)據(jù)庫以及自建電子數(shù)據(jù)庫的數(shù)量為33.78個,某些高校的電子資源數(shù)量甚至超過200個[1].面對如此眾多的電子資源,如何進(jìn)行科學(xué)、有效地使用,這已成為現(xiàn)代圖書館關(guān)注的重要課題.與發(fā)達(dá)國家相比,國內(nèi)利用資源整合軟件進(jìn)行資源整合的圖書館相對較少,且大多數(shù)都處于試運(yùn)營階段[2].綜合而言,國內(nèi)目前在圖書館電子資源利用方面還存在以下一些主要問題[3]:
(1)電子資源整合度偏低.電子資源大多被簡單地羅列在圖書館的門戶網(wǎng)站上,用戶要定位到某個電子資源上需要花費(fèi)一定的時間.
(2)缺乏統(tǒng)一的搜索方式.用戶需要時間去熟悉不同電子資源的搜索方式.而圖書館相關(guān)部門對電子資源搜索技能的培訓(xùn)往往又受到用戶的輕視.
(3)部分電子資源利用率低下.那些在簡單排列中相對靠后的資源,用戶往往很難發(fā)現(xiàn),其利用率比較低.
(4)內(nèi)容重復(fù)現(xiàn)象嚴(yán)重.不同電子資源之間的內(nèi)容大量冗余,導(dǎo)致用戶搜索效率低下.
為解決以上問題,國內(nèi)外近年來陸續(xù)研發(fā)了諸如統(tǒng)一檢索系統(tǒng)、垂直搜索等解決方案.即通過對資源的分類,以滿足不同用戶對不同分類電子資源的搜索需求.
圖書館電子資源的使用方式目前有以下幾種:直接羅列在圖書館網(wǎng)站中;使用簡單的分類如分為”中文”、“外文”、“試用”等類別;進(jìn)行簡單的資源整合如使用首字母排序、學(xué)科導(dǎo)航等方式.當(dāng)圖書館電子資源越來越多,對資源整合的要求也就越來越高.作為最有效的電子資源整合的一種方式,統(tǒng)一檢索平臺[4]應(yīng)運(yùn)而生.而垂直搜索是將垂直搜索技術(shù)與統(tǒng)一檢索平臺相融合的一種新型的搜索系統(tǒng).
目前,國內(nèi)外具有代表性的電子資源搜索系統(tǒng)有[5]:清華同方基于數(shù)字圖書館管理系統(tǒng)(TPI)基礎(chǔ)上提供的統(tǒng)一檢索平臺USP(UnionSearchPlatform)、CALIS(中國高等教育文獻(xiàn)保障系統(tǒng))統(tǒng)一檢索平臺、CrossSearch檢索系統(tǒng)、MetaLib系統(tǒng)、Web FeatPrism系統(tǒng)等.這些國內(nèi)外系統(tǒng)在一定程度上滿足了圖書館對電子資源整合搜索的要求,但也存在著一些不足,譬如系統(tǒng)價(jià)格昂貴、沒有對電子資源進(jìn)行分類、缺乏靈活性、沒有充分利用圖書館本身的電子資源館藏優(yōu)勢、不能本地化,使用受網(wǎng)絡(luò)條件影響等等.
因此,這些系統(tǒng)并不能滿足圖書館在電子資源整合搜索方面所有的需求.而針對圖書館局域網(wǎng)的基于本館自身電子資源的垂直搜索[6]系統(tǒng)能較好地解決上述問題.所謂垂直搜索既是針對某一特定領(lǐng)域,服務(wù)于某一特定人群的搜索,垂直搜索在技術(shù)上與傳統(tǒng)的搜索并無根本差異,但搜索的策略卻發(fā)生了變化[7],由傳統(tǒng)的“大而全”變?yōu)椤皩6?
發(fā)展垂直搜索并建立一個對圖書館現(xiàn)有電子資源的垂直搜索平臺,能有效整合資源,提高資源利用率,實(shí)現(xiàn)管理員后臺管理用戶需要搜索的電子資源,對資源進(jìn)行分類.用戶依據(jù)這些分類對分類下的所有電子資源進(jìn)行統(tǒng)一搜索,搜索結(jié)果按照與搜索串相關(guān)程度返回給用戶并實(shí)現(xiàn)結(jié)果的“去重”.
3.1功能需求
垂直搜索平臺應(yīng)以圖書館所處的網(wǎng)絡(luò)環(huán)境為基礎(chǔ),使用B/S(瀏覽器/服務(wù)器)架構(gòu)為其基礎(chǔ)框架.將服務(wù)程序放置在服務(wù)器中,客戶端通過瀏覽器對服務(wù)器進(jìn)行訪問,服務(wù)器接收到客戶端請求后進(jìn)行應(yīng)答.平臺主要需求用例如圖1所示:
圖1 平臺功能需求用例圖
上圖中主要的角色和業(yè)務(wù)如表1所示:
表1 平臺的角色
3.2架構(gòu)設(shè)計(jì)
根據(jù)需求分析,同時考慮到平臺的健壯性、擴(kuò)展性和開發(fā)過程的方便性,應(yīng)采用分層架構(gòu).分層架構(gòu)可以使開發(fā)過程分散關(guān)注、松散耦合,還可以使開發(fā)過程中的業(yè)務(wù)邏輯可以復(fù)用,對標(biāo)準(zhǔn)化的建立也是大有好處的.根據(jù)平臺的功能需要,架構(gòu)可分為表示層、應(yīng)用層和數(shù)據(jù)層.
3.2.1表示層
表示層是直接與用戶打交道的層.首先,表示層要負(fù)責(zé)獲取用戶的輸入以及用戶對分類和搜索項(xiàng)的選擇,并將這些信息發(fā)送給應(yīng)用層相應(yīng)功能模塊.其次,顯示層要將應(yīng)用層傳遞過來的搜索結(jié)果以統(tǒng)一的格式顯示給用戶.
3.2.2應(yīng)用層
應(yīng)用層是系統(tǒng)的核心部分.主要負(fù)責(zé)將表示層傳送過來的用戶的輸入、選擇的分類及搜索信息統(tǒng)一生成為CURL搜索命令,將CURL工具獲取的網(wǎng)頁信息經(jīng)過相似性算法比對去除重復(fù)的信息,將獲取的信息標(biāo)題和用戶輸入的字符串語句進(jìn)行匹配確定所有信息的排序,依據(jù)合理的順序?qū)⑺行畔l(fā)送到表示層.
3.2.3數(shù)據(jù)層
數(shù)據(jù)層是系統(tǒng)要檢索的電子資源的集合.主要指圖書館已有的將要加入到電子資源垂直搜索平臺的數(shù)據(jù)庫資源,包括各種中文數(shù)據(jù)庫、外文數(shù)據(jù)庫、試用數(shù)據(jù)庫以及本館的特色數(shù)據(jù)庫等.
3.3平臺的詳細(xì)設(shè)計(jì)
平臺總體上分為前臺的搜索模塊和后臺的管理模塊,其詳細(xì)功能層次分布如圖2所示:
圖2 功能層次圖
以下就部分核心模塊進(jìn)行簡要闡述.
3.3.1搜索請求收集與結(jié)果反饋模塊
搜索請求收集模塊與搜索反饋模塊相互配合,完成用戶的搜索過程.其主要操作和處理流程如下:
(1)用戶首先選擇所要搜索的電子資源類別,點(diǎn)擊相應(yīng)類別后在搜索框下方會出現(xiàn)用戶所選類別的搜索項(xiàng),用戶可以選擇其中某項(xiàng)也可以選擇所有字段進(jìn)行搜索.
(2)選擇完成后用戶在搜索框中輸入搜索內(nèi)容,點(diǎn)擊搜索按鈕進(jìn)行搜索.
(3)系統(tǒng)根據(jù)用戶的操作生成搜索式并提交給CURL,CURL將該搜索式發(fā)送到用戶所選類別下的各個電子資源并抓取返回信息.
(4)反饋信息經(jīng)過信息提取、去重并按照題名信息與用戶搜索語句的相關(guān)程度返回給用戶.返回的信息根據(jù)搜索項(xiàng)的不同返回諸如題名、作者、來源、全文路徑等信息.
搜索過程如圖3所示:
圖3 搜索過程序列圖
3.3.2分類管理模塊
該模塊主要負(fù)責(zé)對電子資源分類進(jìn)行管理.用戶通過點(diǎn)擊后臺的導(dǎo)航對應(yīng)菜單進(jìn)入該模塊,該模塊通過信息表格的方式向用戶展示所要搜索的電子資源分類信息.用戶點(diǎn)擊新增、編輯和刪除按鈕,系統(tǒng)會彈出相對應(yīng)的對話框信息,用戶通過填寫該對話框來完成上述操作. 3.3.3搜索項(xiàng)管理模塊
電子資源搜索項(xiàng)根據(jù)電子資源分類不同而變化.如“電子圖書”類的搜索項(xiàng)包括“書名”、“作者”、“主題詞”,“電子期刊”類的搜索項(xiàng)包括“標(biāo)題”、“作者”、“刊名”、“關(guān)鍵詞”.該模塊主要操作和處理流程如下:
(1)頁面加載.頁面加載時,系統(tǒng)以信息表的形式列出所有的電子資源搜索項(xiàng)詳細(xì)信息,包括“搜索項(xiàng)名稱”、“搜索項(xiàng)簡介”、“所屬分類”信息.
(2)新增搜索項(xiàng)信息.用戶點(diǎn)擊“新增”按鈕時,系統(tǒng)彈出“新增搜索項(xiàng)”對話框,用戶輸入新增的搜索項(xiàng)詳細(xì)信息,并通過下拉列表選擇該搜索項(xiàng)所屬的分類,點(diǎn)擊保存按鈕進(jìn)行保存.保存成功后在當(dāng)前的信息表中會動態(tài)添加新增搜索項(xiàng)信息.
(3)編輯搜索項(xiàng)信息.用戶點(diǎn)擊“編輯”按鈕時,彈出“編輯”對話框,在該對話框中顯示了當(dāng)前待編輯項(xiàng)的所有信息,用戶可以對其進(jìn)行修改并可以重新選擇當(dāng)前搜索項(xiàng)的分類,修改完成后,點(diǎn)擊保存按鈕.修改成功在信息表中會即時更新用戶修改的內(nèi)容,如果修改失敗,系統(tǒng)會彈出修改失敗信息提示框,提醒用戶修改失敗及失敗的原因.
(5)刪除檢索項(xiàng)信息.點(diǎn)擊“刪除”按鈕時,會彈出提醒用戶是否刪除當(dāng)前記錄的對話框,確認(rèn)后即可刪除當(dāng)前選中的搜索項(xiàng)信息.
3.3.4電子資源管理模塊
電子資源管理是管理模塊中最為復(fù)雜的模塊,其展現(xiàn)形式和基本操作和前述各模塊基本相似,不同的地方在于:
(1)彈出對話框搜索項(xiàng)輸入?yún)^(qū)域的動態(tài)變化.點(diǎn)擊“新增”、“編輯”的時候,在彈出對話框中,根據(jù)選擇的不同電子資源分類信息,搜索項(xiàng)參數(shù)信息輸入?yún)^(qū)域會出現(xiàn)當(dāng)前分類所對應(yīng)的搜索項(xiàng)的參數(shù)表達(dá)式、參數(shù)匹配模式和參數(shù)匹配正則式的輸入框.
(2)保存電子資源信息時,要保存與其相關(guān)的其他表的數(shù)據(jù).當(dāng)用戶點(diǎn)擊保存后不僅要保存電子資源的基本信息,還要將參數(shù)表達(dá)式以及參數(shù)匹配模式和參數(shù)匹配正則式保存到搜索項(xiàng)參數(shù)信息表中.
(3)刪除電子資源信息時,也要刪除對應(yīng)參數(shù)表中的信息.
目前國內(nèi)很多圖書館都訂購了大量的電子資源,建有自己的機(jī)房,配備了服務(wù)器和存儲設(shè)備,用于存儲海量數(shù)據(jù),投入了大量的資金.但是,這些電子資源信息往往只是通過鏈接的方式,簡單羅列于圖書館主頁上,用戶如果想查找電子資源的話需要按順序查找,浪費(fèi)了大量時間,而且致使很多不容易被發(fā)現(xiàn)的電子資源利用效率比較低.本文針對這種情況,在充分調(diào)研了圖書館各個電子資源的架構(gòu)和獲取方式的基礎(chǔ)上,研究并設(shè)計(jì)了圖書館電子資源垂直搜索平臺主要框架.該搜索平臺的實(shí)現(xiàn)能有效整合圖書館現(xiàn)有電子資源,提高資源利用率,節(jié)省用戶用于查找電子資源的時間.
參考文獻(xiàn):
〔1〕劉建國,蘇萬鵬.全國本科院校圖書館電子資源調(diào)查研究[J].圖書館學(xué)刊,2013(5).
〔2〕丁申桃,龐躍霞,曹麗娟.我國高校圖書館數(shù)字化資源建設(shè)現(xiàn)狀分析[J].圖書館論壇,2005,25(6).
〔3〕勾丹,鄭洋洋.我國高校圖書館電子資源利用現(xiàn)狀與對策[J].圖書館學(xué)研究,2008(11).
〔4〕林林.數(shù)字資源整合與統(tǒng)一檢索平臺[J].情報(bào)資料工作,2004(5).
〔5〕王效岳,王志玲.國內(nèi)外異構(gòu)數(shù)據(jù)庫統(tǒng)一搜索系統(tǒng)的比較研究[J].情報(bào)雜志,2005(12).
〔6〕王文鈞,李巍.垂直搜索引擎的現(xiàn)狀與發(fā)展探究[J].情報(bào)科學(xué),2010,28(3):477-480.
〔7〕Notess,GregR..Custom Search Engines[J]. ComputersinLibraries,2008,5(28):16-17.
〔8〕劉欣,李慧.PHP開發(fā)寶典[M].北京:機(jī)械工業(yè)出版社,2012.430-470.
〔9〕張衛(wèi),羅長壽,張峻峰,于峰,欒汝朋.基于CURL異構(gòu)數(shù)字資源統(tǒng)一搜索的研究[J].中國農(nóng)學(xué)通報(bào),2010,26(22).
中圖分類號:G250.76;TP302.1
文獻(xiàn)標(biāo)識碼:A
文章編號:1673-260X(2016)06-0167-03
收稿日期:2016-02-28
基金項(xiàng)目:安徽省高校自然科學(xué)研究項(xiàng)目(kj2016A134)階段性成果