周林興 魏亮亮 艾文華
摘? 要:在對檔案館知識服務(wù)研究進(jìn)程的梳理及用戶畫像相關(guān)文獻(xiàn)分析的基礎(chǔ)上,從用戶個性化知識需求增強、檔案館服務(wù)理念亟須轉(zhuǎn)變、知識推廣效益需不斷提升三方面分析了檔案館應(yīng)用用戶畫像的需求,并進(jìn)一步闡述了數(shù)據(jù)獲取、抽取標(biāo)簽、關(guān)聯(lián)特征、知識推薦四步用戶畫像的檔案知識個性化推薦流程。并提出用戶畫像視角下應(yīng)從注重內(nèi)容品質(zhì)、加快推送速度、保護(hù)用戶隱私、完善反饋機制四方面來優(yōu)化檔案館知識服務(wù)個性化推薦策略。
關(guān)鍵詞:檔案館;用戶畫像;知識服務(wù);推薦機理
Abstract: Based on the analysis of the research process of archives knowledge service and the analysis of related literatures of user portraits, this paper analyzes the archives from three aspects: the user's personalized knowledge needs, the need of the archives service concept, and the need to continuously improve the knowledge promotion efficiency. Applying the needs of user portraits, and further expounding the data recommendation, extraction of tags, association features, knowledge recommendation, four-step user portraits, file knowledge personalized recommendation process. Finally, this paper proposes a personalized recommendation optimization strategy for file knowledge focusing on content quality, speeding up push, protecting user privacy, and improving feedback mechanism.
Keywords: Archives; User profile; Knowledge service; Recommend mechanism
大數(shù)據(jù)技術(shù)興起,數(shù)據(jù)需求不斷呈現(xiàn)出大數(shù)據(jù)化、動態(tài)化與跨學(xué)科綜合性等特點[1]。如何從海量數(shù)據(jù)中挖掘出與用戶精準(zhǔn)匹配的個性化知識逐漸成為大數(shù)據(jù)知識服務(wù)領(lǐng)域面臨的新課題[2]。作為日益成熟的數(shù)據(jù)分析工具,用戶畫像能夠全面細(xì)致地刻畫出用戶全貌,并能為檔案館分析用戶需求提供重要渠道。本文通過分析檔案館知識服務(wù)現(xiàn)狀,構(gòu)建用戶畫像視角下的檔案知識個性化推薦流程,提出基于用戶畫像的檔案館知識個性化推薦優(yōu)化策略。
1.1 檔案館知識服務(wù)研究進(jìn)展。1994年特里·庫克[3]在《電子文件與紙質(zhì)文件觀念:后保管及后現(xiàn)代主義社會信息與檔案管理中面臨的一場革命》中提出檔案工作者身份應(yīng)當(dāng)從保管員向知識提供者轉(zhuǎn)變,標(biāo)志著檔案館知識服務(wù)理念的出現(xiàn)。第十三屆國際檔案大會上,特里·庫克發(fā)表《1898年荷蘭手冊出版以來檔案理論與實踐的相互影響》一文,對知識服務(wù)進(jìn)行較為明確的闡述,檔案館知識服務(wù)由此也作為后保管模式理念中的重要內(nèi)涵之一。
國外研究主要呈現(xiàn)應(yīng)用性、技術(shù)性和服務(wù)個性化三個方面。Wallace等[4]建立了一個基于本體的跨媒體檔案語義檢索系統(tǒng),能夠集成檢索歐洲的五個聲像檔案館資源。Hathitrust項目[5]通過運用云計算技術(shù),旨在實現(xiàn)對紙質(zhì)檔案資源的數(shù)字化,實現(xiàn)檔案資源的共享服務(wù)。Kim HN[6]已經(jīng)發(fā)現(xiàn)了用戶畫像在檔案館知識服務(wù)中的作用,如關(guān)注個性化的用戶建模,推薦與用戶興趣相關(guān)的內(nèi)容。
國內(nèi)研究可概括為三個階段。(1)初始階段(2002年—2007年)。諸多學(xué)者研究重心主要集中在知識服務(wù)的背景和內(nèi)涵方面。如周毅[7]首次將知識服務(wù)引入并進(jìn)行了較為全面的論述。(2)發(fā)展階段(2008年—2013年)。研究內(nèi)容主要聚焦在服務(wù)模式和體系構(gòu)建方面。王應(yīng)解[8]以館藏為基礎(chǔ)的檔案知識組織、檔案知識組織實施等維度探討了檔案館知識服務(wù)的實現(xiàn)問題。楊力[9]從知識管理理念出發(fā),探討了數(shù)字檔案館服務(wù)的現(xiàn)狀、發(fā)展方向以及服務(wù)體系的構(gòu)建。(3)深入階段(2014年至今)。研究范圍進(jìn)一步擴大,相關(guān)成果主要集中在大數(shù)據(jù)、智庫、新媒體環(huán)境下檔案館知識服務(wù)研究。魏扣等[10]認(rèn)為檔案館知識服務(wù)能夠發(fā)揮檔案知識價值產(chǎn)生,并以社交媒體環(huán)境為視角提出了相應(yīng)的策略。
1.2 用戶畫像研究進(jìn)展。最早由Alan Copper[11]提出,其認(rèn)為用戶畫像能作為真實用戶的虛擬代表,具備標(biāo)簽化、時效性和動態(tài)性[12]。早期用戶畫像主要應(yīng)用在交互設(shè)計或產(chǎn)品設(shè)計領(lǐng)域中,是一種刻畫目標(biāo)用戶以及聯(lián)系用戶訴求的有效工具[13]。目前,有關(guān)用戶畫像的研究在理論基礎(chǔ)、模型構(gòu)建、方法與技術(shù)、實踐應(yīng)用已較為成熟。就檔案館知識服務(wù)領(lǐng)域而言,相關(guān)研究還較少,但已逐漸受到學(xué)界的廣泛關(guān)注[14]。如李財富等[15]從檔案用戶小數(shù)據(jù)和精準(zhǔn)化檔案信息服務(wù)的概念出發(fā),對精準(zhǔn)化檔案信息服務(wù)模式進(jìn)行了可行性分析等。
在模型方法技術(shù)層面,主要涵蓋向量空間模型、主題模型、語義本體構(gòu)建以及神經(jīng)網(wǎng)絡(luò)模型等算法。Chikhaoui等[16]提出了一種基于因果關(guān)系的用戶畫像模型,利用概率后綴樹、序列聚類算法和標(biāo)準(zhǔn)化互信息度量抽取用戶行為特征。Yu J.等[17]提出了一種基于語義和瀏覽順序構(gòu)建和更新用戶畫像的方法,通過引入了認(rèn)知心理學(xué)的記憶模型,以保證用戶畫像的動態(tài)性。在應(yīng)用領(lǐng)域?qū)用妫瑸榫珳?zhǔn)定位客戶群體,提供個性化服務(wù)推送,用戶畫像在電子商務(wù)[18]、旅游[19]、金融[20]、新聞[21]、健康[22]以及圖書館[23]等領(lǐng)域已實現(xiàn)其價值作用。以圖情領(lǐng)域為例,畢強等[24]從自然、興趣和社交維度構(gòu)建多維度、多層級、立體化的用戶畫像模型,并應(yīng)用于相關(guān)行業(yè)服務(wù)的精準(zhǔn)推薦、個性化檢索、精準(zhǔn)宣傳以及參考決策中。檔案館應(yīng)積極借鑒相關(guān)領(lǐng)域的經(jīng)驗,加快推進(jìn)用戶畫像在檔案館知識服務(wù)過程中的應(yīng)用,以進(jìn)一步提高服務(wù)的質(zhì)量。
綜上,相對于國外研究,國內(nèi)研究側(cè)重于理論分析,實證色彩不足。目前,學(xué)界對實現(xiàn)檔案知識個性化服務(wù)相關(guān)研究仍有不足?;诖?,本文以用戶畫像為視角,探討檔案館知識服務(wù)的推薦機理問題,以期為檔案館知識服務(wù)提供優(yōu)化路徑。
2.1 用戶個性化知識需求增強。隨著物聯(lián)網(wǎng)、人工智能等技術(shù)在檔案服務(wù)中的應(yīng)用逐步深入,利用互聯(lián)網(wǎng)、微博、APP等新興媒介方式的檔案信息服務(wù)愈來愈受到人們的青睞[25]。目前,我國僅有少數(shù)發(fā)展迅速的檔案館實現(xiàn)了全文數(shù)字化。以青島市檔案館為例,其在2003年開展了數(shù)字檔案館建設(shè),實現(xiàn)了擁有目錄數(shù)據(jù)和全文數(shù)據(jù)分別超過2000萬條和2900萬頁的數(shù)字檔案資源;上海市檔案館在局域網(wǎng)和數(shù)據(jù)庫的基礎(chǔ)上,通過設(shè)置瀏覽檢索、高級檢索、主題檢索等多種檢索交互方式以供檔案信息查詢。但在檔案知識深度挖掘方面仍存在短板,無法為用戶定制個性化知識服務(wù)。作為一種數(shù)據(jù)分析手段,用戶畫像的目的在于分析用戶的特定需求,為用戶提供個性化的服務(wù)。
2.2檔案館服務(wù)理念亟須轉(zhuǎn)變。目前,我國大多數(shù)檔案服務(wù)部門對于開展檔案知識服務(wù)問題尚沒有給予足夠的關(guān)注和重視[26]。數(shù)字檔案資源一般是通過新型社交媒體方式提供利用,其在實體檔案館的應(yīng)用較少被關(guān)注[27]。這一情況與檔案知識服務(wù)的需求是相一致的,檔案部門應(yīng)進(jìn)一步樹立社會檔案觀,在館藏資源多元化的基礎(chǔ)上進(jìn)一步推動檔案服務(wù)社會化,通過創(chuàng)新服務(wù)理念與機制,完善服務(wù)制度,通過豐富利用途徑以拉近檔案部門與民眾的距離[28]。大數(shù)據(jù)環(huán)境下,用戶畫像所具備的主動式服務(wù)理念能夠契合檔案館知識服務(wù)需求。將用戶畫像應(yīng)用于檔案館,通過分析用戶的基本信息、閱讀偏好和興趣愛好描繪用戶特征,給用戶建立標(biāo)簽,能夠在一定程度上掌握用戶獲取知識的規(guī)律、偏好,有助于檔案館對接用戶知識需求、提供精準(zhǔn)化的知識服務(wù)。
2.3 知識推廣效益需不斷提升。知識服務(wù)優(yōu)劣程度的衡量指標(biāo)通常為知識推廣的數(shù)量和范圍。以成都市人民政府辦公室官方微博“成都發(fā)布”開展的“絲路之魂——敦煌藝術(shù)大展暨天府之國與絲綢之路文物特展”為例,為獲得較高的關(guān)注度和推廣度,通常會聯(lián)合粉絲流量較多的官微進(jìn)行廣泛宣傳[29]。從本質(zhì)上看,這類知識傳播方式僅是以粉絲流量為基礎(chǔ),而非基于用戶個性化需求的目的進(jìn)行宣傳。因此,未能夠在知識推薦服務(wù)中占據(jù)主導(dǎo)地位,也就無法滿足用戶多樣化、深層次的知識需求。此外,檔案用戶通常以旁觀者角色參與到這類自媒體平臺檔案知識傳播過程中,卻很少參與到檔案知識傳播反饋活動中來,而有關(guān)主動在線評論、交流等活動更是少之又少。通過計算分析用戶興趣偏好,實現(xiàn)檔案知識推廣的針對性服務(wù),便于有效提高檔案知識服務(wù)的實際效益。
用戶畫像在電子商務(wù)領(lǐng)域應(yīng)用較為廣泛,如“知味杭州”的數(shù)字技術(shù)與傳統(tǒng)餐飲結(jié)合,為消費者提供新的便利[30]。借鑒相關(guān)該領(lǐng)域的成功經(jīng)驗,提供檔案知識服務(wù)個性化推薦的流程可以分為數(shù)據(jù)獲取、標(biāo)簽抽取、特征關(guān)聯(lián)、知識推薦四個步驟,如圖1所示。
3.1 數(shù)據(jù)獲?。壕珳?zhǔn)識別目標(biāo)用戶群體。目前,檔案館已經(jīng)形成了包括政府機關(guān)工作人員、企業(yè)員工、高校學(xué)者等在內(nèi)的固定用戶群體,并正在形成普通公眾在內(nèi)的流動用戶群體[31]??梢越柚鷶?shù)字檔案館、數(shù)據(jù)庫系統(tǒng)以及第三方社交工具(如微博、微信公眾號等平臺)收集用戶信息,并對檔案用戶群體進(jìn)行識別、定位和分類。
檔案部門需要采集的用戶信息主要包括基本信息(性別、職業(yè)、年齡等)、知識偏好信息(閱讀興趣、頁面瀏覽等)、互動信息(平臺交流、評論等)、會話信息(平臺登錄信息、下載信息等)以及情景信息(時間、地理位置等)五方面的內(nèi)容。用戶的基本信息可以通過數(shù)字檔案館、檔案數(shù)據(jù)庫平臺登錄時的注冊信息獲取。知識偏好信息可以通過網(wǎng)站頁面瀏覽、在線閱讀和查閱檔案等訪問記錄獲取?;有畔⒖梢酝ㄟ^平臺的社區(qū)交流板塊、第三方社交工具的評論反饋獲取。會話信息可以通過檔案用戶登錄平臺的次數(shù)、資源下載的數(shù)量以及與專業(yè)人員的咨詢對話等途徑獲取。用戶情景信息主要包括可以反映用戶所在位置、事發(fā)時間以及周邊環(huán)境的信息[32]。情景信息可以通過GPS、北斗以及物理傳感器等設(shè)備獲取。檔案部門應(yīng)提前制定用戶數(shù)據(jù)收集規(guī)劃,針對不同的用戶群體,采用不用的數(shù)據(jù)收集方法,盡可能全面采集用戶信息,以便更準(zhǔn)確地建立用戶畫像。
3.2 標(biāo)簽抽?。簷n案用戶數(shù)據(jù)統(tǒng)計分析。標(biāo)簽抽取主要分為靜態(tài)標(biāo)簽和動態(tài)標(biāo)簽。其中,用戶基本屬性屬于靜態(tài)標(biāo)簽,其這些屬性具有一定客觀性,通常由檔案用戶在系統(tǒng)注冊頁面自行填寫,這類標(biāo)簽的抽取相對較為簡便。因檔案用戶數(shù)據(jù)常存在于不同場景和平臺中,在進(jìn)行標(biāo)簽抽取前有必要對數(shù)據(jù)獲取層所采集到的五類信息進(jìn)行數(shù)據(jù)化處理,并根據(jù)資源特征庫進(jìn)行標(biāo)簽分類處理和抽取。
靜態(tài)標(biāo)簽屬于自然維度范疇,主要指用戶基本信息,旨在對用戶最基本的屬性進(jìn)行刻畫。靜態(tài)標(biāo)簽一般涵蓋姓名、性別、職業(yè)、學(xué)歷、城市等基本屬性,且這類標(biāo)簽來源數(shù)據(jù)主要通過系統(tǒng)平臺進(jìn)行采集,從注冊信息中提取用戶的基本屬性,以形成靜態(tài)標(biāo)簽。鑒于興趣維度作為用戶畫像的核心,動態(tài)標(biāo)簽構(gòu)建的來源數(shù)據(jù)主要集中在用戶的知識偏好、互動信息以及情景信息等方面。標(biāo)簽映射法的原理是通過為用戶賦予標(biāo)簽,以將用戶興趣特征化[33]。興趣維度的標(biāo)簽信息主要可以從使用系統(tǒng)平臺的行為數(shù)據(jù)和社交平臺的信息反饋、用戶評論數(shù)據(jù)進(jìn)行獲取。
3.3 特征關(guān)聯(lián):檔案用戶畫像庫的建立。檔案用戶畫像庫的建立是基于對用戶數(shù)據(jù)的充分利用,將用戶需求數(shù)據(jù)化、標(biāo)簽化和關(guān)聯(lián)化,借助行為分析、用戶聚類、主題分析以及關(guān)聯(lián)分析等方法,對用戶標(biāo)簽的多層級別體系與關(guān)系圖譜進(jìn)行可視化呈現(xiàn),并構(gòu)建單用戶畫像庫和群體用戶畫像庫。此外,在建立用戶畫像庫時還應(yīng)構(gòu)建一定溝通渠道,并結(jié)合檔案用戶對用戶畫像的結(jié)果進(jìn)行審定,以便根據(jù)用戶反饋意見作出及時調(diào)整。
因用戶特征差異性,可分為單用戶畫像庫和群體用戶畫像庫。單用戶畫像庫是針對某一檔案用戶個體建立的用戶畫像,單用戶畫像庫的建立可以進(jìn)一步了解用戶的個體特征與知識需求。除單用戶以外,檔案用戶中還存在一些群體用戶,這些群體用戶因瀏覽相似的檔案內(nèi)容、在社交互動過程中具備共同的興趣偏好而表現(xiàn)出較強的群體特征。群體用戶畫像庫的構(gòu)建需要根據(jù)用戶標(biāo)簽對多個用戶進(jìn)行聚類,計算用戶興趣愛好的相似度,提取相似的用戶群體特征。群體用戶畫像庫除涉及因興趣愛好的改變需要更新標(biāo)簽外,還涉及檔案用戶的增加與減少問題。根據(jù)單用戶和群體用戶畫像庫提供的數(shù)據(jù)支撐,檔案部門可以根據(jù)不同用戶畫像庫反映的興趣特征,提供與之相匹配的知識內(nèi)容。以檔案微信公眾號為例,檔案微信公眾號作為知識推薦的一種重要途徑。
3.4 知識推薦:用戶畫像庫與資源匹配。根據(jù)用戶畫像庫分析用戶的知識需求,提供檔案知識服務(wù)精準(zhǔn)推送,是將用戶畫像和檔案館相融合的最終目的。在數(shù)據(jù)收集、標(biāo)簽提取、建立畫像庫之后,通過將用戶畫像庫與館藏資源進(jìn)行匹配,提供滿足用戶需求的知識服務(wù)推送。此外,檔案知識服務(wù)推薦系統(tǒng)能否成功實現(xiàn),取決于用戶畫像庫與館藏資源庫之間的匹配度。
單用戶知識服務(wù)推薦包括兩方面的內(nèi)容:一是通過對檔案庫藏資源進(jìn)行知識化處理,建立相似的資源集并賦予其特定的主題;二是通過用戶畫像庫的標(biāo)簽描述分析出用戶的興趣偏好,將用戶的興趣偏好與主題進(jìn)行映射,進(jìn)而將主題與資源集進(jìn)行匹配。若匹配度較高,則通過推薦系統(tǒng)完成推薦,若匹配失敗,則可以通過反饋機制進(jìn)行反饋。類似地,群體用戶知識服務(wù)推薦通過對群體用戶畫像庫提取出用戶的共同興趣偏好,并將興趣偏好與主題一一映射,最后通過主題與資源集進(jìn)行匹配完成推薦。與單用戶知識推薦不同的是,群體用戶知識推薦需要對用戶的行為數(shù)據(jù)進(jìn)行分析,計算出用戶之間的相關(guān)性,然后通過聚類分析形成相似用戶群,進(jìn)而完成知識推薦。用戶畫像通過情景化推薦,對檔案用戶進(jìn)行識別特征、建立畫像、知識推薦的流程控制,能夠有效識別用戶興趣,提高檔案知識推薦質(zhì)量。此外,基于用戶畫像進(jìn)行檔案知識服務(wù)推送,能夠協(xié)同過濾與用戶需求不匹配的信息,為檔案知識推薦系統(tǒng)降噪,提高檔案館知識推薦的效益。紹興市圖書館開發(fā)了一個垂直檢索引擎,該引擎應(yīng)用了知識組織系統(tǒng)、垂直搜索引擎等技術(shù),根據(jù)用戶的行為數(shù)據(jù)的變化而不斷調(diào)整、豐富用戶畫像庫,尋找與用戶興趣點最貼合的知識內(nèi)容,完成檔案知識的精準(zhǔn)推薦[34]。檔案館數(shù)據(jù)庫系統(tǒng)可以引入該技術(shù),即時捕捉用戶的興趣需求,優(yōu)化檔案知識推薦效果。
4.1 注重知識內(nèi)容品質(zhì),提升服務(wù)質(zhì)量。檔案館不僅需要針對用戶需求進(jìn)行精準(zhǔn)推薦,還應(yīng)該提升知識推薦的內(nèi)容品質(zhì),秉承寧缺毋濫的原則,加工檔案知識精品,向用戶提供個性化知識服務(wù)。在實現(xiàn)個性化知識服務(wù)推薦過程中,基于大量以用戶為中心的數(shù)據(jù)采集,檔案館還需要運用用戶畫像庫對用戶實際需求做出精準(zhǔn)預(yù)測,并根據(jù)初步預(yù)測的用戶畫像進(jìn)行個性化檔案知識內(nèi)容的開發(fā)。檔案知識內(nèi)容的挖掘和提取,需要注意以下三方面問題:一是用戶對檔案知識推薦存在疲度。若推薦的內(nèi)容質(zhì)量不足,極易引起用戶的審美疲勞,產(chǎn)生對推送服務(wù)的厭煩。國際檔案理事會ICA微信公眾號在提供有趣高質(zhì)的檔案知識服務(wù)方面產(chǎn)生了較好的效果。在其界面板塊中,除了推薦具有特色的國際檔案元素,還會推薦檔案趣聞,此類文章提升了檔案知識對用戶的吸引度。二是個性化檔案知識服務(wù)推薦的時機要合適。在知識推薦過程中,檔案館要結(jié)合不同用戶的特征,及時跟進(jìn)用戶需求,以確保所推薦的個性化檔案知識內(nèi)容能夠高度吻合用戶適時需求。同時,根據(jù)用戶瀏覽訪問記錄,選擇準(zhǔn)確契合的時機進(jìn)行推送,并控制知識推送的數(shù)量,以確保所推送的個性化檔案知識內(nèi)容能夠有效提升用戶的黏度。三是個性化檔案知識內(nèi)容的開發(fā)應(yīng)與檔案館藏結(jié)合,利用館藏中極具特色的信息,形成優(yōu)質(zhì)的檔案知識產(chǎn)品。比如江西省的紅色政權(quán)檔案、景德鎮(zhèn)的陶瓷檔案、福建省的僑批檔案、西藏自治區(qū)的滿文檔案都極具特色,對于加工優(yōu)質(zhì)的檔案知識產(chǎn)品十分有利[35]。在實現(xiàn)個性化知識服務(wù)推薦過程中,注重內(nèi)容品質(zhì)的個性化檔案知識服務(wù)推送能夠有效提升檔案館知識服務(wù)的質(zhì)量。
4.2 加快知識推送速度,提高服務(wù)效益。個性化知識服務(wù)推薦具有一定時效性,通過適時加快推送速度,便于提高服務(wù)效益。用戶畫像異于其他技術(shù)的一個重要特點在于用戶畫像能夠精準(zhǔn)捕捉到用戶適時需求和下一步行為意圖,并在個性化知識服務(wù)基礎(chǔ)上,還能夠預(yù)先制定下一步服務(wù)計劃[36]。加快知識服務(wù)推送的速度能夠及時契合用戶適時需求,并能夠降低用戶興趣變化差異而導(dǎo)致推送內(nèi)容失效的風(fēng)險。有關(guān)檔案部門需要及時掌握用戶的動態(tài)信息,逐步完善對用戶的精準(zhǔn)畫像內(nèi)容,以提高檔案知識服務(wù)效益。為有效加快個性化知識服務(wù)推送速度,檔案館需要建立有效的檔案知識服務(wù)機制。一是定期通過微博、微信公眾號、檔案網(wǎng)站等平臺收集用戶信息,經(jīng)過分析及時更新用戶特征,不斷調(diào)整完善用戶畫像,聚焦檔案用戶即時知識需求。二是優(yōu)化檔案人員工作能力,培養(yǎng)具有信息素養(yǎng)的人才隊伍,形成掌握扎實理論基礎(chǔ)與善于運用信息技術(shù)的人才培養(yǎng)機制,能夠及時捕獲檔案用戶的知識需求。三是深化利用館藏資源,縮短館藏資源知識加工周期,加快檔案知識成果出品速度。建立良好的知識服務(wù)機制,加快知識推送速度,通過增強檔案用戶的忠誠度、黏度,以提升知識服務(wù)的效益。
4.3 建立隱私保護(hù)機制,維護(hù)用戶權(quán)益。在構(gòu)建用戶畫像的過程中,用戶信息會存在較大的暴露風(fēng)險,檔案館要建立完善的用戶隱私保護(hù)體制,避免對用戶利益造成損害,否則用戶數(shù)據(jù)信息就有可能成為互聯(lián)網(wǎng)黑色產(chǎn)業(yè)鏈條中明碼標(biāo)價的商品,用戶隱私受到嚴(yán)重的侵犯[37]??梢?,在構(gòu)建用戶畫像時,檔案館必須考慮到這一問題,并保證用戶在讓渡一部分個人信息時,能夠避免用戶信息泄露。一是完善《檔案法》對用戶數(shù)據(jù)的隱私權(quán)保護(hù)。盡快糾正《檔案法》等法律中沒有明確禁止將含有個人信息的檔案劃入至不宜公開類別的規(guī)定,以達(dá)到實現(xiàn)對用戶隱私的有效保護(hù)[38]。因此運用用戶畫像應(yīng)加快用戶隱私保護(hù)條例的制定與執(zhí)行,具體規(guī)定保護(hù)的力度和范圍。二是在用戶信息收集過程中應(yīng)征得用戶同意,秉持用戶至上的原則,不能在用戶不知情的情況下擅自收集其信息并加以利用,這不僅損害了用戶的權(quán)益而且會降低用戶的黏性,不利于檔案館知識服務(wù)的長遠(yuǎn)發(fā)展。三是把握用戶信息收集的范圍。信息采集范圍應(yīng)以用戶知識需求為主,對一些無關(guān)涉私的信息應(yīng)準(zhǔn)確屏蔽。這不僅可以有效保護(hù)用戶隱私,還能降低信息收集工作的投入??傊?,有關(guān)檔案部門在構(gòu)建用戶畫像時,應(yīng)高度重視用戶隱私的保護(hù)問題,有效維護(hù)用戶權(quán)益,保證檔案知識服務(wù)的合理性與合法性。
4.4 完善推薦反饋機制,優(yōu)化用戶體驗。在實現(xiàn)個性化知識推薦服務(wù)過程中,完善反饋機制對于提升知識服務(wù)效果、優(yōu)化用戶體驗十分重要。大數(shù)據(jù)時代下,數(shù)字檔案資源與檔案用戶兩種角色已發(fā)生較大變化,用戶由被動接受轉(zhuǎn)向主動交互。檔案館服務(wù)設(shè)計理念正逐步以用戶為中心發(fā)生轉(zhuǎn)變[39]。在評估檔案知識服務(wù)效果中,檔案資源與用戶的交互程度是一個有效且重要的衡量指標(biāo)。相應(yīng)地,反饋渠道能夠為用戶和檔案資源的交互發(fā)揮較大作用。為優(yōu)化用戶體驗,有關(guān)檔案部門應(yīng)建立完善的知識推薦反饋機制:一是量化用戶評價指標(biāo)。用戶評價是檔案部門獲取用戶需求的重要內(nèi)容,對于用戶評價不應(yīng)停留在寬泛的好與不好層面,而應(yīng)該具體量化評價指標(biāo)。如可將用戶評價指標(biāo)具體量化為有用性、滿意度、便利性、價值型,并規(guī)定具體的數(shù)值,使評價指標(biāo)更加科學(xué)。二是完善用戶反饋渠道。檔案用戶一般是通過微信、微博評論留言進(jìn)行反饋,然而留言并非全部會顯示,一些未被選用的留言可能就會被忽略,這不利于用戶意見收集的完善度、客觀性。檔案部門應(yīng)當(dāng)提供多種反饋渠道,創(chuàng)建一個專項收集庫用以存儲用戶反饋信息。三是優(yōu)化檔案檢索方式。在檔案知識服務(wù)過程中,基于本體的語義檢索能夠?qū)崿F(xiàn)語義的關(guān)聯(lián)、匹配和推理,準(zhǔn)確捕捉到用戶檢索意圖,并幫助用戶查詢到準(zhǔn)確全面的檢索結(jié)果,以優(yōu)化用戶體驗。因此,在實現(xiàn)個性化檔案知識推薦服務(wù)過程中,為提升用戶交互性,優(yōu)化用戶體驗是檔案館服務(wù)取得良好效果的重要因素。
[1]胡媛,艾文華.工程化視角下的科研數(shù)據(jù)需求管理模型構(gòu)建[J].情報雜志, 2019(3):187-193.
[2]劉海鷗,姚蘇梅,黃文娜,張亞明.基于用戶畫像的圖書館大數(shù)據(jù)知識服務(wù)情境化推薦[J].圖書館學(xué)研究,2018(24):57-63+32.
[3]特里·庫克,劉越男.電子文件與紙質(zhì)文件觀念:后保管及后現(xiàn)代主義社會里信息與檔案管理中面臨的一場革命[J].山西檔案, 1997(2):7-13.
[4]Wallace M., Athanasiadis T., AvrithisY, et al.. Integrating multimedia archives: the architecture and the content layer [J].IEEE Transactions on systems,man,and cybernetics,2006, 36(1): 34-52.
[5] Welcome to Hathi Trust! [EB /OL].[2018-03-25].https://www. hathitrust. org/about.
[6]Kim, HN.User preference moeling from positive contents for personalized recommendation [J].Discovery Science, Proceedings, 2007(7):116.
[7]周毅.知識服務(wù):檔案管理部門的新目標(biāo)[J].中國檔案,2002(5):48-50.
[8]王應(yīng)解.檔案知識組織初探[J].檔案學(xué)通訊.2008(2):23-27.
[9]楊力,姚樂野.基于知識管理的數(shù)字檔案館服務(wù)體系構(gòu)建[J].檔案學(xué)通訊, 2010 (1):58-60.
[10]魏扣,李子林,金暢.社交媒體環(huán)境下檔案知識聚合服務(wù)實現(xiàn)架構(gòu)研究[J].檔案學(xué)通訊,2018(6):61-66.
[11]Alan C.交互設(shè)計之路[M].北京:電子工業(yè)出版社,2006:115-135.
[12]宋美琦,陳燁,張瑞.用戶畫像研究述評[J].情報科學(xué),2019 (4):171-177.
[13]亓叢,吳俊.用戶畫像概念溯源與應(yīng)用場景研究[J].重慶交通大學(xué)學(xué)報(社會科學(xué)版),2017 (5):82-87.
[14]陳慧,王曉曉,吳國嬌.基于物聯(lián)網(wǎng)的檔案個性化知識服務(wù)模式:特征與問題探析[J].北京檔案,2019(3):10-14.
[15]李財富,余林夕.基于檔案用戶小數(shù)據(jù)的精準(zhǔn)化檔案信息服務(wù)探析[J].檔案與建設(shè),2018(8):4-7.
[16]Chikhaoui B,Wang S,Xiong T,et al.Pattern-based causal relationships discovery from event sequences for modeling behavioral user profile in ubiquitous environments[J].Information Sciences,2014,285(11):204-222.
[17]Yu J.Liu F,Zhao H. Building User profile based on concept and relation for web personalized services[C]//International conference on innovation and information management. Singapore:ICIIM,2012(36):165-172.
[18]AL-SHAMRI M Y H.User profiling approaches for demographic recommender systems [J]. Knowledge-based systems,2016(100):175-187.
[19]單曉紅,張曉月,劉曉燕.基于在線評論的用戶畫像研究——以攜程酒店為例[J].情報理論與實踐,2018 (4):99-104,149.
[20]中國互聯(lián)網(wǎng)證券用戶畫像[J].現(xiàn)代商業(yè)銀行,2018(17):19-23.
[21]趙曙光.高轉(zhuǎn)化率的社交媒體用戶畫像:基于500用戶的深訪研究[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報),2014 (6):115-120.
[22]馬費成,周利琴.面向智慧健康的知識管理與服務(wù)[J].中國圖書館學(xué)報, 2018(5):1-15.
[23]Suzanne Livesey, Peter Wynne. Extending the hybrid library to students on franchised courses: user profile, service implementation issues and management strategies [J]. Library Management, 2007(1/2):21-25(5).
[24]許鵬程,畢強,張晗,牟冬梅.數(shù)據(jù)驅(qū)動下數(shù)字圖書館用戶畫像模型構(gòu)建[J].圖書情報工作,2019(03):30-37.
[25]陳慧,王曉曉,吳國嬌.基于物聯(lián)網(wǎng)的檔案個性化知識服務(wù)模式:特征與問題探析[J].北京檔案,2019(03):10-14.
[26]呂元智.面向新型智庫建設(shè)的檔案知識服務(wù)工作發(fā)展對策研究[J].檔案學(xué)研究,2018(5):33-38.
[27]陳慧,王曉曉,吳國嬌.基于物聯(lián)網(wǎng)的檔案個性化知識服務(wù)模式:特征與問題探析[J].北京檔案,2019(03):10-14.
[28]魏扣,李子林,郝琦.面向檔案的知識聚合服務(wù)研究現(xiàn)狀及趨勢展望[J].數(shù)字圖書館論壇,2018(03):20-24.
[29]聶云霞,黃文瓊.全媒體多維語境下檔案信息傳播策略研究[J].檔案學(xué)通訊,2018(04):64-69.
[30]燕勐,楊牧.餐飲“黑科技”亮相亞洲美食節(jié).[EB/OL]. [2019-05-17]. http:// world.people.com.cn/n1/2019/0517/c1002-31091237.html.
[31]郝琦.社交媒體環(huán)境下檔案知識聚合服務(wù)研究[J].檔案學(xué)通訊,2018(6):91-94.
[32]劉海鷗,姚蘇梅,黃文娜,張亞明.基于用戶畫像的圖書館大數(shù)據(jù)知識服務(wù)情境化推薦[J].圖書館學(xué)研究,2018(24):57-63+32.
[33]許鵬程,畢強,張晗,牟冬梅.數(shù)據(jù)驅(qū)動下數(shù)字圖書館用戶畫像模型構(gòu)建[J].圖書情報工作,2019 (3):30-37.
[34]吳國芳.紹興圖書館圖書檢索垂直引擎研究及應(yīng)用[J].紹興文理學(xué)院學(xué)報(自然科學(xué)),2014,34(1):18-21.
[35]聶云霞,黃文瓊.全媒體多維語境下檔案信息傳播策略研究[J].檔案學(xué)通訊,2018(04):64-69.
[36]梁榮賢. 基于用戶畫像的圖書館精準(zhǔn)信息服務(wù)研究[J].圖書館工作與研究, 2019(4):65-69.
[37]葉子悅. 想訪A網(wǎng)站卻被強制打開B網(wǎng)站,上網(wǎng)被劫持怎么辦. [EB/OL]. [2019-05-13].
http://legal.people.com.cn/n1/2019/0513/c42510-31081529.html.
[38]譚彩敏.檔案工作中隱私保護(hù)的立法完善[J].檔案管理,2017(6):30-32.
[39]王毅,魏扣.優(yōu)化用戶體驗的數(shù)字檔案資源服務(wù)策略研究[J].檔案學(xué)通訊, 2017(1):64-69.