• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      圖書館用戶畫像與智慧推介的實(shí)證研究
      ——以浙江音樂學(xué)院圖書館為例*

      2022-06-17 09:03:06吳澹寧
      圖書館論壇 2022年6期
      關(guān)鍵詞:畫像標(biāo)簽智慧

      吳澹寧,陳 敏

      0 引言

      十九大報(bào)告提出加快建設(shè)創(chuàng)新型國(guó)家發(fā)展目標(biāo),“智慧社會(huì)”被寫入報(bào)告[1]?;凇爸腔凵鐣?huì)”新視角,圖書館應(yīng)探索融合新技術(shù)的發(fā)展新路徑,為國(guó)家發(fā)展、社會(huì)進(jìn)步、科技創(chuàng)新、個(gè)人終身學(xué)習(xí)提供智慧化的知識(shí)服務(wù),構(gòu)建支撐綠色、低碳、可持續(xù)發(fā)展的關(guān)鍵驅(qū)動(dòng)力。

      互聯(lián)網(wǎng)極大豐富了知識(shí)的獲取方式,但“知識(shí)迷航”現(xiàn)象日漸顯著。初景利等[2]認(rèn)為圖書館必將從文獻(xiàn)服務(wù)走向智慧服務(wù),要求圖書館服務(wù)內(nèi)容從簡(jiǎn)單的文獻(xiàn)單元向深度挖掘的知識(shí)單元轉(zhuǎn)化,服務(wù)方式從粗放的多渠道投放向精準(zhǔn)的按需推送轉(zhuǎn)變。高校圖書館投入大量經(jīng)費(fèi)購(gòu)買數(shù)字資源和建設(shè)特色資源,并推出各種個(gè)性化服務(wù),滿足在校師生更多深層次的需求。但是,因缺乏對(duì)讀者需求的及時(shí)反饋和準(zhǔn)確把握,圖書館的資源和服務(wù)很難做到精準(zhǔn)推送,資源利用率與服務(wù)效果不甚理想。為解決此類困境,本文引入畫像建模技術(shù),結(jié)合高校圖書館資源與服務(wù)的特殊性和復(fù)雜性,設(shè)計(jì)一套多維度、細(xì)粒度的特征標(biāo)簽體系,探究畫像建模的詳細(xì)流程與實(shí)際問(wèn)題,研究圖書館智慧推介的模式構(gòu)建和實(shí)施策略。憑借現(xiàn)代科技所蘊(yùn)含的“技術(shù)智慧”,提升基于知識(shí)服務(wù)的“圖書館智慧”,激活求知?jiǎng)?chuàng)新過(guò)程中的“用戶智慧”,為建立面向深度學(xué)習(xí)的知識(shí)圖譜和多元立體的知識(shí)資源體系積累經(jīng)驗(yàn)、夯實(shí)基礎(chǔ)[3]。

      1 研究現(xiàn)狀

      交互設(shè)計(jì)之父Alan Cooper最早提出用戶畫像(Persona/User Profile)概念,即對(duì)用戶的自然屬性、行為軌跡、潛在興趣等信息的虛擬刻畫。用戶畫像理念及其技術(shù)得到了廣泛應(yīng)用,如阿里巴巴圍繞“人、貨、場(chǎng)、商”營(yíng)造全新的數(shù)字化生態(tài)系統(tǒng),疏導(dǎo)目標(biāo)流量,提高場(chǎng)貨分發(fā)效能[4]17-21。在文化教育領(lǐng)域,用戶畫像也成為討論熱點(diǎn)。筆者以“用戶畫像”“讀者畫像”“圖書館”“文化教育”等關(guān)鍵詞在CNKI中國(guó)知網(wǎng)進(jìn)行檢索,篩選得到311篇相關(guān)文獻(xiàn)。

      陳慧香等[5]從定義組成、算法模型、實(shí)踐應(yīng)用等方面討論國(guó)外圖書館用戶畫像研究現(xiàn)狀,發(fā)現(xiàn)技術(shù)類的集成創(chuàng)新較少,而國(guó)內(nèi)學(xué)者所構(gòu)建的用戶畫像模型多以局部數(shù)據(jù)為主,缺乏完整性。劉海鷗等[6]引入情境化推薦方法來(lái)重塑圖書館個(gè)性化服務(wù)模式。曾子明等[7]搭建個(gè)性化移動(dòng)視覺搜索及推薦服務(wù)模型,拓展設(shè)計(jì)用戶畫像的思路。劉速[8]以天津圖書館大數(shù)據(jù)分析平臺(tái)的順利實(shí)施,驗(yàn)證多維度交叉分析、用戶關(guān)系圖譜等用戶畫像分析方法,為基于用戶畫像的智能化服務(wù)研究提供了案例參考。單軫等[9]總結(jié)用戶畫像研究中存在的問(wèn)題:理論研究中的概念模糊,如混淆了“群體畫像”與“個(gè)人畫像”的概念;技術(shù)研究中的視野缺失,如忽視了信息安全和評(píng)價(jià)機(jī)制等問(wèn)題。因此,本文以2020年浙江音樂學(xué)院圖書館的350 萬(wàn)條運(yùn)行數(shù)據(jù)和73 萬(wàn)條資源數(shù)據(jù)為基礎(chǔ),論述特征標(biāo)簽、“群體畫像”和“個(gè)人畫像”的設(shè)計(jì)過(guò)程和集成算法,強(qiáng)調(diào)動(dòng)態(tài)數(shù)據(jù)的收集和實(shí)時(shí)畫像的構(gòu)建,研究相似性、差異性、關(guān)聯(lián)性和線下實(shí)時(shí)推介的實(shí)現(xiàn)方式,并嘗試以借閱、瀏覽、點(diǎn)播等行為指標(biāo)評(píng)估資源推介效果,旨在探索一條以完整性、準(zhǔn)確度為導(dǎo)向的圖書館智慧推介的實(shí)踐之路,推動(dòng)用戶畫像與圖書館智慧服務(wù)的深度融合。

      2 數(shù)據(jù)采集全覆蓋

      構(gòu)建用戶畫像所需的數(shù)據(jù),可分為讀者數(shù)據(jù)和資源數(shù)據(jù)。讀者數(shù)據(jù)既包含姓名、年級(jí)、專業(yè)等屬性數(shù)據(jù),也包括在圖書館自動(dòng)化系統(tǒng)上采集到的行為數(shù)據(jù),如文獻(xiàn)系統(tǒng)中的借閱信息、門禁系統(tǒng)中的入館信息、發(fā)現(xiàn)系統(tǒng)中的檢索信息等。資源數(shù)據(jù)是指MARC數(shù)據(jù)和各類元數(shù)據(jù),如題名、責(zé)任者、主題詞、URL等,它反映了讀者行為所涉及的內(nèi)容,是剖析讀者興趣偏好和構(gòu)建“個(gè)人畫像”的重要依據(jù)。資源數(shù)據(jù)的采集有賴于資源聯(lián)合編目和元數(shù)據(jù)開放共享。

      2.1 行為數(shù)據(jù)線上全量采集

      準(zhǔn)確識(shí)別用戶身份是行為數(shù)據(jù)線上采集的前提和基礎(chǔ)?,F(xiàn)在多數(shù)應(yīng)用都設(shè)置了實(shí)名認(rèn)證,系統(tǒng)會(huì)記錄特定讀者的借閱、入館、預(yù)約、薦購(gòu)等操作。然而,圖書館每年花費(fèi)大量資金采購(gòu)和自建的數(shù)字資源是以IP授權(quán)形式開放的,讀者登錄校園網(wǎng)或VPN,便能順利訪問(wèn)各種數(shù)字資源,但系統(tǒng)無(wú)法識(shí)別用戶身份,難以記錄產(chǎn)生的行為數(shù)據(jù)。為了實(shí)現(xiàn)行為數(shù)據(jù)采集范圍的全覆蓋,國(guó)內(nèi)某些高校圖書館[10]采用了最新的WebVPN技術(shù)和Counter R5收割標(biāo)準(zhǔn),開發(fā)數(shù)字資源門戶及統(tǒng)計(jì)分析系統(tǒng),設(shè)置身份認(rèn)證環(huán)節(jié),統(tǒng)一訪問(wèn)入口,分析、評(píng)價(jià)數(shù)字資源的使用情況。

      2.2 行為數(shù)據(jù)線下無(wú)感收集

      智慧書架能實(shí)時(shí)監(jiān)控貼有RFID標(biāo)簽的流通資料,精準(zhǔn)感知每本圖書物理位置的變化。智能視頻監(jiān)控系統(tǒng)是借助光學(xué)裝置和傳感器獲得被檢測(cè)物體的特征圖像,從圖像中提取、分析和處理信息,進(jìn)而實(shí)現(xiàn)對(duì)書架停留時(shí)間、書目翻閱時(shí)間等細(xì)節(jié)的全息探知[11]。iBeacon 是一項(xiàng)室內(nèi)定位技術(shù),具有低成本、易部署等特點(diǎn)。該技術(shù)通過(guò)iBeacon 基站、節(jié)點(diǎn)的布設(shè),建立與移動(dòng)終端的通信,即時(shí)獲取位置信息,信號(hào)最小覆蓋半徑15cm,適用于書架等近距離觸發(fā)場(chǎng)景[12]。未來(lái)圖書館將以室內(nèi)定位技術(shù)描繪用戶的移動(dòng)軌跡,以機(jī)器視覺技術(shù)判定讀者身份,抓取找書、翻書等細(xì)微動(dòng)作,以RFID技術(shù)關(guān)聯(lián)讀者翻閱的書籍信息,構(gòu)筑多場(chǎng)景、伴隨式的數(shù)據(jù)無(wú)感采集模式。

      3 用戶畫像

      用戶畫像通常分為“群體畫像”和“個(gè)人畫像”。前者是對(duì)具有相似行為特性的用戶進(jìn)行語(yǔ)義劃分,即定性分析讀者的行為習(xí)慣,便于制定精準(zhǔn)化服務(wù)的實(shí)施策略;后者是對(duì)讀者興趣的文本挖掘,可用于定量分析其顯性或隱性的情感偏好,確定個(gè)性化服務(wù)的具體內(nèi)容。

      3.1 特征標(biāo)簽體系的設(shè)計(jì)

      特征標(biāo)簽是一種高度精煉的符號(hào)語(yǔ)言,有助于快速了解用戶在特定領(lǐng)域的行為表現(xiàn)。個(gè)別畫像研究對(duì)特征標(biāo)簽的理解存在偏差,混淆了特征標(biāo)簽與具體數(shù)據(jù)之間的從屬關(guān)系,譬如有文章提到姓名等屬性歸為一級(jí)標(biāo)簽,年齡、星座等歸為二級(jí)標(biāo)簽,注冊(cè)時(shí)間等行為信息為三級(jí)標(biāo)簽[13]。其實(shí),標(biāo)簽和數(shù)據(jù)可類比為編程語(yǔ)言中的“類”和“對(duì)象”,數(shù)據(jù)是對(duì)客觀事物或行為的定量表述,標(biāo)簽是對(duì)數(shù)據(jù)的歸納和抽象。所以,基于圖書館資源與服務(wù)的具體內(nèi)容,將讀者需求歸納為實(shí)體資源P、數(shù)字資源E、空間資源U、服務(wù)資源S和活動(dòng)資源A等5個(gè)方面,定義為5個(gè)一級(jí)標(biāo)簽;按本館實(shí)際情況設(shè)計(jì)若干二級(jí)標(biāo)簽,依據(jù)采集的數(shù)據(jù)字段,細(xì)分為三級(jí)及以上標(biāo)簽,形成多維度、細(xì)粒度的特征標(biāo)簽體系。例如,實(shí)體資源標(biāo)簽下設(shè)置紙質(zhì)文獻(xiàn)PP、音像資料PV等2個(gè)二級(jí)標(biāo)簽,紙質(zhì)文獻(xiàn)標(biāo)簽下再設(shè)置借閱PPB、續(xù)借PPR、預(yù)約PPH等3個(gè)三級(jí)標(biāo)簽,以此類推。然后,通過(guò)行為數(shù)據(jù)的歸一化處理,協(xié)調(diào)同級(jí)標(biāo)簽間的比例關(guān)系,完成各級(jí)特征標(biāo)簽的賦值計(jì)算,建立每位讀者的特征標(biāo)簽矩陣,本研究涉及的主要數(shù)據(jù)如表1所示。

      3.2 “群體畫像”的構(gòu)建

      群體畫像描述的是群體的共性特征,是一個(gè)虛擬的用戶代表。在完成各級(jí)標(biāo)簽賦值后,采用Hadoop 分布式計(jì)算平臺(tái)和MapReduce 計(jì)算框架,以K-Means等聚類算法,將所有讀者預(yù)先分為若干類別,不斷迭代分析,使同一群體內(nèi)的特征偏好盡可能相近,不同群體的讀者則具有顯著差異。鑒于經(jīng)典K-Means算法容易出現(xiàn)局部最優(yōu)的缺陷,且迭代次數(shù)和計(jì)算速度受孤立點(diǎn)數(shù)據(jù)的影響較大,本研究選用了基于馬氏距離的二分K-Means 算法[14],聚類中心數(shù)K=sqrt(n/2),其中n代表待聚類目標(biāo)總數(shù)。如前所述,每位讀者具備了5個(gè)一級(jí)標(biāo)簽,每個(gè)標(biāo)簽按需求的強(qiáng)弱定為高、中、低三檔,理論上有243種排列組合。那么,對(duì)浙江音樂學(xué)院5,493名讀者的標(biāo)簽數(shù)據(jù)集(見表2)做K為11的聚類分析,收斂成11個(gè)“群體畫像”,各群體人數(shù)、比例及特征標(biāo)簽值范圍如表3所示。

      表2 讀者特征標(biāo)簽矩陣數(shù)據(jù)集

      表3 各群體人數(shù)、比例及特征標(biāo)簽值范圍

      3.3 “個(gè)人畫像”的構(gòu)建

      個(gè)人畫像注重個(gè)性刻畫,通過(guò)行為與資源數(shù)據(jù)的映射關(guān)聯(lián),提煉文本中的語(yǔ)義信息,繪制讀者興趣圖譜,發(fā)掘興趣的內(nèi)在聯(lián)系,為后續(xù)的智慧服務(wù)奠定基礎(chǔ)。由于資源數(shù)據(jù)普遍存在非結(jié)構(gòu)化特征,需應(yīng)用文本挖掘技術(shù)中的向量空間模型,將文本內(nèi)容處理簡(jiǎn)化為向量空間中的運(yùn)算。因而,讀者興趣矩陣可表示為{(i1,w1),(i2,w2)…(in,wn)},其中i代表興趣內(nèi)容,w代表興趣權(quán)重[15],且賦予各興趣以時(shí)間標(biāo)識(shí),采用經(jīng)過(guò)關(guān)聯(lián)性、時(shí)序性兩方面優(yōu)化的TF-IDF 算法,確定每個(gè)興趣點(diǎn)的相應(yīng)權(quán)重。

      3.3.1 基于關(guān)聯(lián)影響的權(quán)重優(yōu)化

      從神經(jīng)網(wǎng)絡(luò)角度理解,某一時(shí)刻的輸入可能取決于前一時(shí)刻的輸出,亦會(huì)影響下一時(shí)刻的抉擇,其邏輯關(guān)系使各節(jié)點(diǎn)間存在關(guān)聯(lián)性[16]。傳統(tǒng)TF-IDF算法僅是抽取、分析特定行為映射到的資源數(shù)據(jù),并未考慮諸多行為間的相互影響及依賴關(guān)系,這會(huì)導(dǎo)致計(jì)算結(jié)果呈現(xiàn)離散稀疏、噪聲較大的特點(diǎn)。

      利用貝葉斯神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)技術(shù),模擬讀者微觀行為和交互信息,捕捉行為序列對(duì)興趣生成的影響,設(shè)置興趣的關(guān)聯(lián)系數(shù),校正不同興趣點(diǎn)的權(quán)重計(jì)算。例如,根據(jù)某讀者2020年9月22日至29日的行為模擬和興趣分析,勾勒出興趣點(diǎn)的網(wǎng)絡(luò)結(jié)構(gòu),如圖1-2所示。這位讀者的初始興趣為“古典音樂”,后延續(xù)至幾位著名作曲家的經(jīng)典作品,關(guān)注古典音樂方向的評(píng)論分析,最終轉(zhuǎn)向“歷史音樂學(xué)”“音樂史”等領(lǐng)域。“古典音樂”貫穿于整個(gè)興趣網(wǎng)絡(luò),是興趣生成和發(fā)展的主要線索,視為核心興趣點(diǎn),分配最高關(guān)聯(lián)系數(shù);“歷史音樂學(xué)”作為興趣遷移目標(biāo),視為關(guān)鍵興趣點(diǎn),分配較高關(guān)聯(lián)系數(shù);以此類推,“海頓”“音樂評(píng)論”等興趣點(diǎn),只需分配較低關(guān)聯(lián)系數(shù)。

      圖1 讀者行為模擬與興趣分析示例

      圖2 讀者興趣的網(wǎng)絡(luò)結(jié)構(gòu)示例

      3.3.2 基于時(shí)序影響的權(quán)重優(yōu)化

      過(guò)往“個(gè)人畫像”研究只是簡(jiǎn)單地在數(shù)據(jù)集合中分析讀者興趣所在及相應(yīng)權(quán)重,忽略興趣維持的時(shí)變性特點(diǎn)。相同興趣點(diǎn)的權(quán)重會(huì)隨著時(shí)距的增加而減小,如一個(gè)月前挖掘出的興趣點(diǎn)比一年前產(chǎn)生的相同興趣點(diǎn)有更高的影響力。故借鑒艾賓浩斯遺忘曲線,根據(jù)興趣的發(fā)生時(shí)間,設(shè)計(jì)興趣權(quán)重的衰減模型,其公式如下:

      其中,A為tn時(shí)刻某讀者的興趣衰減系數(shù),m為記憶常量,b為衰減常量,tc為當(dāng)前時(shí)刻。記憶常量一般為1,衰減常量針對(duì)不同人群作適當(dāng)調(diào)整。

      不同于檢索、瀏覽、下載等瞬時(shí)行為,借閱等行為挖掘出的興趣將一直延續(xù)至資源的歸還時(shí)刻。為了豐富此類行為的興趣表征,可通過(guò)個(gè)人借閱時(shí)長(zhǎng)的綜合分析,得出每位讀者個(gè)性化的借閱習(xí)慣,以Box-Cox 變換后的累積分布函數(shù),預(yù)測(cè)該讀者(借閱行為挖掘出的)興趣發(fā)展曲線,如公式(2)和表4所示:

      表4 2657號(hào)讀者的借閱時(shí)長(zhǎng)分析

      其中,tb為資源借出時(shí)刻,tr為歸還時(shí)刻,t為借閱間隔;E為tn時(shí)刻某興趣點(diǎn)的分布系數(shù),μ為該讀者所有借閱時(shí)長(zhǎng)的平均值,σ為經(jīng)Box-Cox變換后新的標(biāo)準(zhǔn)差,λ為Box-Cox變換中得出的偏度指數(shù)[17]。

      3.3.3 讀者興趣的綜合建模

      一言蔽之,關(guān)聯(lián)系數(shù)反映了各興趣點(diǎn)在邏輯思維鏈中的重要性,衰減系數(shù)表達(dá)了時(shí)間序列對(duì)同一興趣點(diǎn)的影響程度,分布系數(shù)是研究連續(xù)行為所涉及的興趣分布期望。某一興趣的分析挖掘,應(yīng)綜合不同時(shí)間點(diǎn)的修正系數(shù),加權(quán)得出相應(yīng)的權(quán)重結(jié)果,完成讀者興趣矩陣的最終構(gòu)建,如公式(3)~(5)所示:

      其中,cn′為(瞬時(shí)行為挖掘出的)興趣修正系數(shù),cn′′為(連續(xù)行為挖掘出的)興趣修正系數(shù),R為關(guān)聯(lián)系數(shù),A為衰減系數(shù),E為分布系數(shù),wn為TF-IDF算法確定的原始興趣權(quán)重,wn′為修正后的興趣權(quán)重。

      4 智慧推介

      所謂智慧服務(wù),是依托對(duì)用戶需求的自動(dòng)感知而提供優(yōu)質(zhì)精準(zhǔn)的資源和服務(wù)。構(gòu)筑以畫像建模、資源匹配、推介輸出為主線的智慧推介模式,是推進(jìn)圖書館智慧服務(wù)的有益嘗試,有助于緩解愈加凸顯的“知識(shí)迷航”現(xiàn)象,使資源建設(shè)更符合讀者的身心發(fā)展和內(nèi)心期盼。智慧推介所體現(xiàn)的個(gè)性化、實(shí)時(shí)性、交互性、人性化等特征,亦是智慧圖書館建設(shè)的必然要求和重要目標(biāo)。

      4.1 “群體畫像”賦能科學(xué)決策

      特征標(biāo)簽體系和群體畫像的構(gòu)建初衷是充分分析和掌握每位讀者的顯性需求及所屬群體的特征分布,為不同需求讀者群體提供個(gè)性化服務(wù),致力于改善讀者情感體驗(yàn),彰顯人文關(guān)懷。圖書館用戶畫像與智慧推介項(xiàng)目中,畫像系統(tǒng)以兩個(gè)月為周期,采集所有讀者過(guò)去一年的各項(xiàng)行為數(shù)據(jù),更新群體畫像的特征標(biāo)簽值范圍,明確各群體下一周期的推介策略。例如,0001 號(hào)讀者的特征標(biāo)簽矩陣為{0.305,0.795,0.233,0.474,0.781},判斷其符合01 號(hào)“群體畫像”,該群體對(duì)數(shù)字和活動(dòng)資源的需求旺盛,實(shí)體和服務(wù)資源的需求處于平均水平,空間資源需求偏低。那么,對(duì)于0001號(hào)讀者的推介策略應(yīng)遵循01號(hào)群體的常規(guī)設(shè)置,強(qiáng)化匹配其興趣的數(shù)字和活動(dòng)資源的推介力度。此外,深入分析此讀者的二級(jí)標(biāo)簽,明晰資源需求方向,若偏好期刊論文和講座培訓(xùn),則高頻推送相關(guān)信息??傊?,堅(jiān)持以讀者為中心、需求為導(dǎo)向、開放聯(lián)動(dòng)為原則,按需謀劃圖書館資源建設(shè)和讀者服務(wù)工作,協(xié)助學(xué)校教學(xué)科研的科學(xué)決策和精細(xì)化管理。

      4.2 “個(gè)人畫像”助力精準(zhǔn)推送

      智慧推介大致可分為相似性推介、差異性推介、關(guān)聯(lián)性推介和線下實(shí)時(shí)推介等四個(gè)模塊。前三者以每月更新的“個(gè)人畫像”為基礎(chǔ),依照既定的推介策略,周期性推送各種資源和服務(wù)。線下實(shí)時(shí)推介主要依靠讀者當(dāng)前行為分析,做好互動(dòng)引導(dǎo)與實(shí)時(shí)推薦。

      (1)相似性推介。相似性推介的核心思想是推薦與興趣相契合的資源。根據(jù)“個(gè)人畫像”中的讀者興趣矩陣,推介系統(tǒng)按權(quán)重從高到低羅列出N個(gè)興趣詞條,采用基于鄰域的協(xié)同過(guò)濾算法,進(jìn)行興趣詞條與資源特征向量間的余弦相似度計(jì)算;排除已利用的資源項(xiàng),結(jié)合剩余資源的受歡迎程度(借閱率、下載量、點(diǎn)播量等)做輔助排序,排名靠前的資源列為優(yōu)先推介項(xiàng);綜合待推介資源的館藏現(xiàn)狀和讀者的個(gè)性化推介策略,依次推薦給該讀者,如圖3所示。

      圖3 0001號(hào)讀者的相似性推介示例

      (2)差異性推介。2018年5月,習(xí)近平總書記考察北京大學(xué)時(shí)指出,廣大青年既擁有廣闊發(fā)展空間,也承載著偉大時(shí)代使命。[18]這就要求當(dāng)代大學(xué)生展現(xiàn)出思辨、創(chuàng)新、實(shí)踐和審美能力,努力成長(zhǎng)為“一專多能”的復(fù)合型人才。相似性推介側(cè)重的是個(gè)人興趣或?qū)I(yè)知識(shí)的“高精尖”,而差異性推介主張的是知識(shí)結(jié)構(gòu)拓展和完善,倡導(dǎo)吸納各種類型的知識(shí)經(jīng)驗(yàn),以更宏觀的視角審視和解決問(wèn)題。差異性推介的思路是先從興趣、行為、屬性等方面分別篩選出與目標(biāo)對(duì)象相仿的讀者,后根據(jù)相仿讀者的行為記錄,逐條比對(duì)確定差異項(xiàng),再排除涉及共同興趣點(diǎn)的資源項(xiàng),遵從個(gè)性化策略分批推薦,如圖4所示。

      圖4 0001號(hào)讀者的差異性推介示例

      (3)關(guān)聯(lián)性推介。高校圖書館的大數(shù)據(jù)分析應(yīng)當(dāng)切實(shí)加強(qiáng)與教育教學(xué)數(shù)據(jù)的聯(lián)動(dòng)性,例如通過(guò)學(xué)生成績(jī)與資源利用的關(guān)聯(lián)分析,不難發(fā)現(xiàn):成績(jī)中下學(xué)生的首要需求在于獲取知識(shí)載體,尤其是完整的知識(shí)講解、知識(shí)脈絡(luò)以及適合自身?xiàng)l件的學(xué)習(xí)路徑。針對(duì)此類讀者,不僅要提供精準(zhǔn)化的知識(shí)推送(如教學(xué)參考書、慕課、習(xí)題),還需不定期推介成績(jī)優(yōu)異同學(xué)的閱讀曲線和學(xué)習(xí)方式,引導(dǎo)和激勵(lì)其拓寬閱讀廣度、挖掘知識(shí)深度;同時(shí),積極與一線教師開展合作,利用館藏資源共同制作思維導(dǎo)圖、知識(shí)網(wǎng)絡(luò)、短視頻等個(gè)性化配套資源,營(yíng)造“主動(dòng)參與、共建共享”的知識(shí)新生態(tài)??梢姡P(guān)聯(lián)性推介是結(jié)合學(xué)生學(xué)習(xí)情況的動(dòng)態(tài)分析和準(zhǔn)確把控,以知識(shí)粒度為本體重塑現(xiàn)有的知識(shí)組織體系,生動(dòng)描摹知識(shí)元、知識(shí)體和知識(shí)群中的分類、推理、關(guān)聯(lián)等邏輯關(guān)系[19],使讀者可以借鑒成功的學(xué)習(xí)經(jīng)驗(yàn),厘清各知識(shí)點(diǎn)的內(nèi)在聯(lián)系,促進(jìn)良好學(xué)習(xí)習(xí)慣養(yǎng)成和方法掌握。

      (4)線下實(shí)時(shí)推介。人工智能描畫了美好的發(fā)展愿景,即萬(wàn)端感知、萬(wàn)機(jī)融合、萬(wàn)數(shù)計(jì)算的“全景智能”時(shí)代[20],未來(lái)圖書館會(huì)像具有“智慧”的人類一樣與讀者互動(dòng)并提供服務(wù),是實(shí)體空間、虛擬資源等全方位的存在,做到“我懂你”和“我?guī)湍恪?。線下實(shí)時(shí)推介,是以RFID、機(jī)器視覺、iBeacon等為代表的先進(jìn)技術(shù),完成實(shí)體空間與虛擬資源的互通互聯(lián),著力全景數(shù)據(jù)的即時(shí)計(jì)算,打通推介服務(wù)的線上閉環(huán),從而體現(xiàn)智慧服務(wù)的高效能和洞察力。自讀者進(jìn)入圖書館,增量數(shù)據(jù)采集、畫像更新與推介服務(wù)同步啟動(dòng),首先根據(jù)已有的畫像數(shù)據(jù),發(fā)送實(shí)體資源至交互界面;再根據(jù)讀者選擇或查詢的目標(biāo)資源,提供導(dǎo)覽服務(wù),規(guī)劃最優(yōu)行進(jìn)路線,快速導(dǎo)航至所在架位;否則,系統(tǒng)繼續(xù)記錄行為軌跡,計(jì)算興趣所在。若讀者在某書架的停留時(shí)間超出閾值,系統(tǒng)分辨其駐足尋書,會(huì)再次發(fā)起推介服務(wù)和交互請(qǐng)求,將附近架位中與當(dāng)前興趣匹配的資源推送給讀者,循環(huán)迭代實(shí)現(xiàn)情境式的線下實(shí)時(shí)推介。

      5 效果評(píng)估

      相比傳統(tǒng)圖表,數(shù)據(jù)可視化是更生動(dòng)友好的表現(xiàn)形式,通過(guò)交互式可視化大屏來(lái)發(fā)現(xiàn)并診斷業(yè)務(wù)問(wèn)題已成為越來(lái)越多大數(shù)據(jù)解決方案中的重要環(huán)節(jié)[21]。本文探討的用戶畫像與智慧推介系統(tǒng)會(huì)將讀者興趣矩陣和推介資源以動(dòng)態(tài)圖譜的形式在前端展示,開放可視化溝通窗口,實(shí)時(shí)接收、計(jì)算和評(píng)估反饋信息。

      5.1 智慧推介的使用情況調(diào)研

      為進(jìn)一步掌握推介資源的用戶匹配度和現(xiàn)實(shí)反饋,使用“金數(shù)據(jù)”表單和線下問(wèn)卷相結(jié)合的方式(因單項(xiàng)資源的自主評(píng)價(jià)數(shù)據(jù)較少),于2021年9月集中組織了一次智慧推介服務(wù)的使用情況調(diào)研[22]。問(wèn)卷由“基礎(chǔ)信息”“群體畫像”“個(gè)人畫像”“推介策略”“已推介資源項(xiàng)”和“總體滿意度”等六部分組成?!盎A(chǔ)信息”部分,線下需受訪者填寫學(xué)/工號(hào),線上則授權(quán)微信公眾號(hào)中已綁定的一卡通賬號(hào),便于后續(xù)“已推介資源項(xiàng)”的精準(zhǔn)導(dǎo)出和問(wèn)題設(shè)置?!叭后w畫像”“個(gè)人畫像”和“推介策略”部分,受訪者可量化評(píng)價(jià)各級(jí)特征標(biāo)簽、高權(quán)重興趣點(diǎn)和推介側(cè)重,列舉不認(rèn)同的標(biāo)簽項(xiàng)與興趣點(diǎn),提出個(gè)性化的推介頻率?!耙淹平橘Y源項(xiàng)”部分,根據(jù)身份認(rèn)證信息從資源推介記錄中隨機(jī)挑選5項(xiàng),了解受訪者對(duì)資源推介項(xiàng)的主觀評(píng)價(jià)。

      2021年9月6-30日,累計(jì)回收紙質(zhì)和電子問(wèn)卷 1,933 份,有效問(wèn)卷 1,890 份。結(jié)果顯示,智慧推介總體滿意度(即非常滿意和較為滿意選項(xiàng))78.0%,服務(wù)續(xù)訂意愿(即非常愿意選項(xiàng))69.1%,資源好評(píng)率(即大有裨益和益于了解選項(xiàng))73.9%,59.5%的受訪者偏好每周一次的推介頻率。可見試運(yùn)行1 年的圖書館智慧推介服務(wù)基本得到讀者認(rèn)可,超半數(shù)受訪用戶愿意繼續(xù)接受該項(xiàng)服務(wù)。但是,資源推介頻率過(guò)高、資訊推送不夠及時(shí)、資源導(dǎo)航尚需完善、移動(dòng)端閱讀體驗(yàn)不佳等問(wèn)題依然存在,有待持續(xù)改進(jìn)。

      表6 音視頻(庫(kù)客音樂)推介效果抽樣評(píng)估

      5.2 推介資源利用率抽樣評(píng)估

      除調(diào)研用戶主觀體驗(yàn),還應(yīng)建立健全推介采納度的綜合評(píng)價(jià)機(jī)制,加強(qiáng)對(duì)推介資源的瀏覽、點(diǎn)播、下載、借閱等后續(xù)操作的統(tǒng)計(jì)分析,及時(shí)干預(yù)和調(diào)整負(fù)評(píng)價(jià)較多的個(gè)人或群組。例如,文章隨機(jī)抽取100位讀者為分析對(duì)象,選取2021年6月接收的實(shí)體資源紙質(zhì)文獻(xiàn)推介155項(xiàng)和數(shù)字資源音視頻(庫(kù)客音樂)推介342項(xiàng),以2021年3-5月為推介前統(tǒng)計(jì)區(qū)間,6-9月為推介后統(tǒng)計(jì)區(qū)間,逐個(gè)分析各資源項(xiàng)的利用指標(biāo),如紙質(zhì)書借閱率、借閱時(shí)長(zhǎng)、相應(yīng)電子書的瀏覽/下載量、音視頻點(diǎn)播量、點(diǎn)播時(shí)長(zhǎng)等,如表5-6所示。綜合推介前后的指標(biāo)變化率:從單項(xiàng)看,四項(xiàng)指標(biāo)(除點(diǎn)播時(shí)長(zhǎng))均有接近或超過(guò)半數(shù)的推介項(xiàng)呈現(xiàn)增長(zhǎng)趨勢(shì)(即變化率≧20%);整體而言,47.7%的紙質(zhì)文獻(xiàn)和20.2%的音視頻(庫(kù)客音樂)推介項(xiàng)有兩項(xiàng)以上指標(biāo)呈現(xiàn)增長(zhǎng)趨勢(shì),各項(xiàng)指標(biāo)均未明顯變化的比例分別為15.6% 和44.6%,如表7所示。數(shù)據(jù)表明,實(shí)體資源紙質(zhì)文獻(xiàn)的推介效果可能優(yōu)于數(shù)字資源音視頻,但類似的統(tǒng)計(jì)分析需繼續(xù)深入到不同資源平臺(tái)(如AS世界音樂等多個(gè)音視頻資源庫(kù))和資源類型(如數(shù)字資源中的期刊論文等),以更豐富的統(tǒng)計(jì)指標(biāo)完善推介效果的評(píng)估工作。最終以評(píng)估結(jié)果反哺畫像修正和推介優(yōu)化,體現(xiàn)智慧服務(wù)的工具理性與人文內(nèi)涵。

      表5 紙質(zhì)文獻(xiàn)推介效果抽樣評(píng)估

      表7 推介前后各項(xiàng)指標(biāo)的變化率分析

      6 結(jié)語(yǔ)

      本文聚焦畫像建模與推介服務(wù)的細(xì)節(jié)探究和應(yīng)用實(shí)例,完整闡述了從數(shù)據(jù)采集、特征標(biāo)簽設(shè)計(jì)、用戶畫像構(gòu)建、智慧推介架構(gòu)和推介效果評(píng)估的全過(guò)程,探討了以深度學(xué)習(xí)技術(shù)研究興趣網(wǎng)絡(luò)結(jié)構(gòu)和時(shí)間序列對(duì)興趣衰減、發(fā)展的影響,研究了基于“群體畫像”“個(gè)人畫像”的智慧推介模式及評(píng)估辦法,對(duì)于全面推進(jìn)智慧圖書館建設(shè)具有一定的借鑒意義。當(dāng)然也存在一些不足,例如評(píng)估指標(biāo)體系、信息安全等方面的研究尚有欠缺,后續(xù)將繼續(xù)深入和細(xì)化。

      猜你喜歡
      畫像標(biāo)簽智慧
      威猛的畫像
      “00后”畫像
      畫像
      無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      標(biāo)簽化傷害了誰(shuí)
      基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
      有智慧的羊
      潛行與畫像
      智慧派
      墨竹工卡县| 青神县| 林州市| 健康| 玉树县| 兴山县| 阜平县| 禹城市| 雅安市| 和平区| 商丘市| 贵州省| 博乐市| 佛坪县| 油尖旺区| 阿克苏市| 清徐县| 崇信县| 克拉玛依市| 怀宁县| 华池县| 双峰县| 新密市| 会同县| 休宁县| 墨玉县| 雅江县| 宣恩县| 新沂市| 平南县| 南京市| 康平县| 华宁县| 西畴县| 徐汇区| 富蕴县| 德州市| 南充市| 浙江省| 洛宁县| 扶风县|