汪 圳 李建苗 李 東
(1.長安大學(xué)圖書館 陜西西安 710064)
(2.西安信息職業(yè)大學(xué)數(shù)字經(jīng)濟(jì)管理學(xué)院 陜西西安 710125)
在信息爆炸的時(shí)代,高校用戶并不缺少數(shù)字化的信息資源,而是無法高效率地獲取最需要的知識。越來越多的高校用戶需要個(gè)性化定制信息推送服務(wù)。新時(shí)代的圖書館閱讀推廣服務(wù),應(yīng)同時(shí)考慮優(yōu)質(zhì)的內(nèi)容和用戶的知識需求。傳統(tǒng)的圖書推薦往往是基于對圖書內(nèi)容方面的考慮,但對于圖書館用戶,除了借閱信息,其他維度的信息獲取及分析還遠(yuǎn)遠(yuǎn)不夠。用戶興趣愛好和學(xué)術(shù)背景千差萬別,因此,傳統(tǒng)的推薦策略和簡單的借閱信息早已不能滿足圖書館閱讀推廣服務(wù)的需要?;诖?,在推進(jìn)“資源找人”的個(gè)性化服務(wù)以改變閱讀推廣中的被動困境時(shí),應(yīng)充分考慮用戶所處的情境要素對用戶閱讀偏好產(chǎn)生的實(shí)時(shí)性影響。
情境可以全面準(zhǔn)確地描述實(shí)體的所有信息,包括實(shí)體本身、應(yīng)用程序及復(fù)雜的網(wǎng)絡(luò)關(guān)系等[1]。用戶情境作為情境信息的一個(gè)維度,主要包含了用戶的基本信息、行為信息、時(shí)空信息,是多維度情境信息的集合。根據(jù)情境信息可以進(jìn)一步挖掘用戶內(nèi)心的動機(jī)、需求及偏好等[2]。面對不同的研究對象時(shí)會使用不同的情境要素分類方法,情境要素維度的劃分會影響系統(tǒng)識別用戶情境的效率[3]。本文參考的相關(guān)用戶情境的研究如下:Dey認(rèn)為用戶情境要素包括用戶基本信息、心理特征、社會地位等多方面的要素信息[1];汪圳等人在研究面向科研用戶的數(shù)字圖書館個(gè)性化知識服務(wù)中,從四個(gè)維度全景式地描述了科研情境,即科研人員在科研過程中研究科研對象來完成科研任務(wù)[4];鄧仲華等人認(rèn)為地學(xué)領(lǐng)域的科研用戶情境包括個(gè)人信息、信息行為、處理資源、接受服務(wù)、時(shí)間歷史及社會關(guān)系六個(gè)維度的信息[5];郭順利等人在研究移動圖書館用戶的需求時(shí),將圖書館用戶情境劃分為用戶的位置信息、基本信息和社會網(wǎng)絡(luò)信息三個(gè)方面[6]。
近些年來,隨著推薦策略研究愈加得到圖書館的重視,一些高校的數(shù)字圖書館引入了個(gè)性化信息服務(wù)。楊永權(quán)[7]介紹了美國具有代表性的大學(xué)圖書館的個(gè)性化推薦系統(tǒng):華盛頓大學(xué)圖書館“My Gateway”系統(tǒng)、康奈爾大學(xué)圖書館“MyLibrary@Cornell”系統(tǒng)及北卡羅萊納州立大學(xué)“My Library@LANL”系統(tǒng)等。在國內(nèi),具有代表性的圖書館個(gè)性化服務(wù)系統(tǒng)有中國人民大學(xué)數(shù)字圖書館的個(gè)性化推薦系統(tǒng)、深圳圖書館開發(fā)的“圖書館自動化集成系統(tǒng)”[8]以及浙江大學(xué)圖書館的MyLibrary系統(tǒng)[9]。盡管部分大學(xué)數(shù)字圖書館引進(jìn)的個(gè)性化服務(wù)效果還不太明顯,但都是對信息時(shí)代如何提高知識服務(wù)質(zhì)量的積極探索。
綜上所述, 目前高校圖書館在引入個(gè)性化服務(wù)領(lǐng)域還處于探索階段,諸多數(shù)字圖書館的個(gè)性化服務(wù)采用了熱門檢索詞或基于用戶基本信息等老舊的方式,導(dǎo)致知識推送服務(wù)的質(zhì)量還不太高。本文引入情境感知技術(shù),同時(shí)考慮高校大學(xué)生群體在圖書館平臺產(chǎn)生的行為信息及高校教務(wù)系統(tǒng)的課程信息,提出一種融入用戶情境的數(shù)字圖書館平臺推薦系統(tǒng)框架。
數(shù)字圖書館面向大學(xué)生群體進(jìn)行個(gè)性化知識服務(wù)時(shí),不僅要考慮高質(zhì)量的知識內(nèi)容,還要考慮用戶所處的情境產(chǎn)生的知識需求。只有在恰當(dāng)?shù)臅r(shí)機(jī)推送用戶最需要的知識,才能提高個(gè)性化服務(wù)的質(zhì)量。
本研究提出了一種融入用戶多維度信息的數(shù)字圖書館推薦系統(tǒng)框架,如圖1所示,從左至右分別是用戶情境、云端大數(shù)據(jù)處理中心及用戶定制化服務(wù)。每個(gè)模塊實(shí)現(xiàn)的功能分別為用戶情境模型的構(gòu)建、個(gè)性化推薦技術(shù)的支撐及用戶的定制化服務(wù)。
圖1 融入用戶情境的數(shù)字圖書館平臺推薦系統(tǒng)框架
數(shù)字圖書館向?qū)W生群體進(jìn)行信息資源推薦時(shí),需要充分考慮在校大學(xué)生的實(shí)際需求, 情境可以較全面地描述大學(xué)生的狀態(tài),進(jìn)而推理獲取大學(xué)生群體的知識需求。
構(gòu)建在校大學(xué)生的情境模型首先應(yīng)對用戶的情境要素進(jìn)行抽取與分析。在數(shù)字圖書館應(yīng)用環(huán)境中,考慮用戶情境的3個(gè)維度的信息:用戶基本特征信息(U-basic)、數(shù)字圖書館用戶行為信息(U-lib)、高校教務(wù)系統(tǒng)信息(U-edu)。大學(xué)生群體的用戶情境表示為:Context={ID,U-basic,Ulib,U-edu}。其中,U-basic={ID,Sex,Age, NativeP};U-lib={LB,LS,LD,LR};U-edu={ES,EC,Ecur,EG ,ET}。
用戶情境要素的含義見表1。
組成數(shù)字圖書館用戶情境的三個(gè)維度要素之間的交互關(guān)系如圖2所示。本文構(gòu)建了用戶情境要素的交互模型。該模型能夠準(zhǔn)確識別數(shù)字圖書館用戶所處的動態(tài)情境,從而推理用戶的興趣偏好,這是個(gè)性化服務(wù)的前提。
隨著數(shù)字圖書館資源的急劇增加,大量的數(shù)據(jù)信息會影響目標(biāo)用戶對資源的識別和有效的獲取。如何匹配數(shù)字圖書館優(yōu)質(zhì)的資源與用戶的需求需要不同的推薦策略來實(shí)現(xiàn)。數(shù)字圖書館云端大數(shù)據(jù)處理平臺會存儲大量的指標(biāo)數(shù)據(jù)。這些精細(xì)化、碎片化的數(shù)據(jù)信息能夠反映用戶偏好,將這些數(shù)據(jù)進(jìn)行篩檢處理,可以使用戶需求更容易被系統(tǒng)理解,進(jìn)而提供更符合用戶需求的知識資源。
表1 用戶情境要素的含義和說明
圖2 情境要素交互關(guān)系圖
云端大數(shù)據(jù)處理平臺主要包括四種推薦策略:基于熱門書目的推薦、基于用戶相似度的資源推薦、基于相關(guān)課程信息的資源推薦及基于相似情境的資源推薦。數(shù)字圖書館知識推薦模型如圖3所示。
3.2.1 基于熱門書目的推薦
圖3 數(shù)字圖書館資源推薦模型
知識資源個(gè)體存在差異,僅根據(jù)用戶需求決定的推薦方案會存在推薦資源質(zhì)量不高的情況,所以評判知識庫內(nèi)知識資源的質(zhì)量也是推薦流程中非常重要的過程。本文在參考館藏資源評價(jià)指標(biāo)的相關(guān)研究[10-12]后,構(gòu)建了資源評估體系,從資源特征、資源推薦熱度、資源活躍度、新書上架、評價(jià)反饋5個(gè)方面來構(gòu)建評價(jià)指標(biāo),最后應(yīng)用皮爾森線性相關(guān)分析方法,搭建知識資源受歡迎程度模型。云端大數(shù)據(jù)處理中心根據(jù)知識資源的模型對用戶的推薦方案進(jìn)行篩選,在此基礎(chǔ)上產(chǎn)生資源推薦集合W。
3.2.2 基于用戶相似度的資源推薦
目標(biāo)用戶對數(shù)字圖書館資源的偏好受其所處情境的影響,這些情境要素也會對相似用戶群體產(chǎn)生類似的影響。根據(jù)社會從眾的心理機(jī)制,目標(biāo)用戶的興趣偏好傾向于類似用戶群,因此可以根據(jù)相似用戶的閱讀喜好為目標(biāo)用戶進(jìn)行資源推薦。
相似性計(jì)算方法包括余弦相似性、皮爾森相似性和改進(jìn)的余弦相似性三種。由于改進(jìn)的余弦相似性克服了前兩種算法的缺點(diǎn),因此,本文選擇改進(jìn)的余弦相似性計(jì)算方法計(jì)算目標(biāo)用戶與已知用戶群之間的相似性。
用戶相似性計(jì)算表達(dá)式為:
其中,Ua為目標(biāo)用戶,Ui為系統(tǒng)中已有用戶群中的第i個(gè)用戶。
最后選擇相似性高的N個(gè)用戶組成相似用戶集AUa,將其偏好定義為目標(biāo)用戶的偏好,在此基礎(chǔ)上確定數(shù)字圖書館資源推薦集X。
3.2.3 基于課程相關(guān)的資源推薦
教務(wù)系統(tǒng)主要包括教師信息、學(xué)生信息和課程信息。不同專業(yè)背景的學(xué)生涉及到的課程信息包含不同的教材、資源與任課教師信息,通過對課程與知識資源、教師與知識資源的分析可以確定學(xué)生用戶與知識資源的關(guān)聯(lián)關(guān)系。云端大數(shù)據(jù)處理中心根據(jù)用戶所處的專業(yè)、學(xué)習(xí)階段等信息,為用戶關(guān)聯(lián)數(shù)字圖書館相關(guān)度高的資源集合Y。
3.2.4 基于相似情境的資源推薦
用戶在特定的情境下產(chǎn)生知識需求,當(dāng)數(shù)字圖書館提供的資源滿足用戶時(shí),用戶的查詢信息和數(shù)字圖書館資源應(yīng)用情境被管理系統(tǒng)存儲。本文定義的數(shù)字圖書館知識模型(ILD)包括數(shù)字圖書館資源應(yīng)用情境(Context(H))、數(shù)字圖書館資源載體(Carrier)和數(shù)字圖書館資源內(nèi)容(Content)三部分。
即數(shù)字圖書館知識模型ILD={Context(H),Carrier, Content}。
當(dāng)用戶i情境信息較完整時(shí),系統(tǒng)獲取用戶i的當(dāng)前情境Context(C)i,與數(shù)字圖書館知識j的應(yīng)用情境Context(H)j做相似性計(jì)算,即sin{Context(H)j,Context(C)i},在此基礎(chǔ)上選取相似度最高的前N條知識資源組成用戶潛在感興趣資源集合Z推薦給用戶。
在集成用戶情境的數(shù)字圖書館知識管理平臺中,用戶在不同情境下產(chǎn)生了不同的知識需求,隨著數(shù)字圖書館知識應(yīng)用情境的不斷擴(kuò)充,系統(tǒng)能夠保證更好的自行適應(yīng)性。
定制化應(yīng)用層面以提升優(yōu)質(zhì)館藏資源的推送及用戶線上體驗(yàn)為目標(biāo),期望提升數(shù)字圖書館資源的利用率。本文在上節(jié)分別得到了基于熱門書目、用戶相似度、課程相關(guān)及情境相似的數(shù)字圖書館資源集合。接下來,本文將根據(jù)圖書館用戶的推薦情境分別設(shè)計(jì)不同的定制化應(yīng)用,包括個(gè)人課程、個(gè)性化推薦、定制化信息檢索及主題書架。
3.3.1 個(gè)人課程
(1)課程相關(guān)
根據(jù)用戶課程名等信息,通過拆分分詞,形成課程相關(guān)推薦,為用戶關(guān)聯(lián)館藏資源,并將紙質(zhì)文獻(xiàn)與電子資源匹配,圖書相應(yīng)的新書、熱門等標(biāo)簽就會清晰易見,將圖書館資源推送到相應(yīng)課程中,形成課程與館藏資源的匹配。
(2)專業(yè)精選
精選課程教學(xué)推薦、課程大綱或教師推薦等信息,提供包括推薦圖書、課程網(wǎng)站、相關(guān)課件、其他資料等形式的定制化資源。專業(yè)精選推薦的圖書將與館藏圖書進(jìn)行匹配,并展現(xiàn)館藏狀態(tài)、電子書、新書、熱門、推薦、教參等不同標(biāo)簽,通過圖書館館藏輔助使得用戶能夠?qū)ο鄳?yīng)課程進(jìn)行深入學(xué)習(xí)。
相關(guān)課件和其他資料可由館員自主上傳到相應(yīng)的課程中,用戶可在該課程模塊中下載學(xué)習(xí),集聚課程的館藏資源和電子教參資源,創(chuàng)新支撐線上教學(xué)。
3.3.2 個(gè)性化推薦
(1)熱門推薦。在熱門資源的基礎(chǔ)上,根據(jù)用戶設(shè)定的閱讀偏好類別,進(jìn)一步向用戶展示個(gè)性化的熱門資源,提高資源利用率。
(2)新書推薦。在新書資源的基礎(chǔ)上,根據(jù)用戶設(shè)定的閱讀偏好類別,進(jìn)一步向用戶展示個(gè)性化的熱門資源,提高資源利用率。
(3)智慧推薦。個(gè)性化推薦如果一味以用戶需求為驅(qū)動(小到信息檢索結(jié)果,大到資源宏觀的優(yōu)化配置)就會容易使用戶陷入習(xí)慣性為興趣所導(dǎo)、忽略更廣闊信息資源的信息繭房,從而產(chǎn)生信息盲區(qū)。智慧推薦,即用云計(jì)算分析、學(xué)習(xí)用戶的海量行為數(shù)據(jù),如點(diǎn)擊、搜索、收藏等,獲取用戶個(gè)人和群體的情境狀態(tài),綜合考慮冷門資源、用戶基礎(chǔ)信息、專業(yè)背景等信息,進(jìn)行權(quán)重排序,從而為用戶提供智慧推薦。智慧推薦根據(jù)多維度的用戶個(gè)人情境狀態(tài)和相同資源借閱者、相同資源收藏者、相同搜索詞使用者的群體情境狀態(tài),結(jié)合借還數(shù)據(jù)、點(diǎn)擊數(shù)據(jù)、評分、收藏?cái)?shù)據(jù)等,優(yōu)化算法,增加用戶與資源的偶遇率,從而激活睡眠用戶,降低用戶的信息繭房風(fēng)險(xiǎn),進(jìn)一步提升圖書館的資源使用效率。
3.3.3 定制化信息檢索
(1)保存常用圖書搜索詞,設(shè)置個(gè)性化搜索偏好??杀4娉S盟阉髟~記錄,方便多次檢索,尤其為使用高級檢索的用戶提供便利??稍O(shè)置出版時(shí)間范圍、期望的出版社(數(shù)量可以設(shè)置)、期望的著者(數(shù)量可以設(shè)置),調(diào)整權(quán)重大??;還可設(shè)置搜索結(jié)果數(shù),從而進(jìn)一步精確結(jié)果范圍,提高檢索效率,滿足深度檢索需求。
(2)提供多種結(jié)果排序方式。提供多種結(jié)果排序方式,包括默認(rèn)排序方式(按檢索條件的符合程度依次排列)、按出版時(shí)間排列。
(3)搜索外部資源,并提供外部搜索結(jié)果的訪問入口。針對保存的圖書搜索詞,在搜索館藏之外,同時(shí)搜索圖書館的部分?jǐn)?shù)據(jù)庫資源,并提供訪問入口,滿足用戶的閱讀和科研學(xué)習(xí)需求。
3.3.4 主題書架
(1)新生入館??筛鶕?jù)調(diào)查問卷或教務(wù)信息,按新生的籍貫、學(xué)習(xí)水平、興趣方向自動生成主題書架,展示介紹本地、本校歷史,優(yōu)勢專業(yè),相關(guān)課程教師,課程簡介等相關(guān)資源。
(2)考試專區(qū)??筛鶕?jù)調(diào)查問卷或教務(wù)信息,了解用戶近期的考試需求,如英語四六級考試、研究生考試、公務(wù)員考試以及各種職業(yè)技能考試,自動生成主題書架,展示相關(guān)教輔、考試指南類資源。
(3)就業(yè)專區(qū)??筛鶕?jù)調(diào)查問卷,了解有就業(yè)需求的用戶信息,自動生成主題書架,展示就業(yè)前景、往年畢業(yè)生就業(yè)報(bào)告書、產(chǎn)業(yè)現(xiàn)狀、就職指南等相關(guān)資源。
(4)特色收藏。用戶可對符合自己興趣愛好或?qū)W習(xí)需求的圖書或其他資源進(jìn)行收藏,并自定義收藏夾名稱(即特色收藏)。收藏夾內(nèi)可嵌套新的收藏,層層分級,歸集偏好資源,打造用戶個(gè)人系統(tǒng)性的閱讀和學(xué)習(xí)體系。在對接圖書館相關(guān)電子書鏡像版或圖書鏈接的情況下,支持搜索、在線查看和添加“特色收藏”,以便于學(xué)習(xí)需要和快速訪問。
(5)我的數(shù)據(jù)庫。展示全館數(shù)據(jù)庫,并提供簡要介紹和訪問入口。支持關(guān)鍵詞搜索數(shù)據(jù)庫和分類展示,用戶可添加自己常用的數(shù)據(jù)庫以便于快捷訪問。
情境要素的引入能有效匹配數(shù)字圖書館資源與用戶需求。本文從用戶基本信息、數(shù)字圖書館用戶行為要素和高校教務(wù)系統(tǒng)要素三個(gè)維度構(gòu)建了用戶的情境模型,提出了一種融入用戶情境的數(shù)字圖書館平臺推薦系統(tǒng)框架,并分析了各組成模塊的關(guān)鍵技術(shù)、實(shí)現(xiàn)的功能及模塊間的交互關(guān)系。