熊回香 李昕然 代沁泉/華中師范大學(xué)信息管理學(xué)院
隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,Web3.0在Web2.0的基礎(chǔ)上以“個(gè)性、精準(zhǔn)和智能”的核心理念成為新一代互聯(lián)網(wǎng)的顯著特征。在這樣的發(fā)展潮流下,檔案學(xué)界對數(shù)字檔案館的建設(shè)和發(fā)展賦予了新的內(nèi)容和技術(shù)要求。一方面,數(shù)字檔案資源已呈現(xiàn)出檔案數(shù)據(jù)化的趨勢;另一方面,檔案用戶面對海量異構(gòu)的檔案原始數(shù)據(jù)難以在短時(shí)間內(nèi)高效獲取有價(jià)值的信息,其個(gè)性化的需求得不到滿足。集收集、保管、開發(fā)利用等管理過程于一體的數(shù)字檔案館的傳統(tǒng)服務(wù)方式已難以適應(yīng)新環(huán)境和新需求,迫切需要進(jìn)行變革。近年來,用戶畫像作為一種數(shù)據(jù)分析模型,通過對用戶的基本屬性、行為記錄和興趣偏好等進(jìn)行標(biāo)簽化,使用戶信息高度凝練,進(jìn)而挖掘出用戶的需求特征,其已在電子商務(wù)、圖書情報(bào)等不同領(lǐng)域得到具體實(shí)踐,且效果良好,為個(gè)性化服務(wù)奠定了基礎(chǔ)。本文將用戶畫像技術(shù)引入數(shù)字檔案館個(gè)性化服務(wù),通過刻畫用戶全貌、分析用戶特征,幫助數(shù)字檔案館深入落實(shí)以用戶需求為導(dǎo)向的個(gè)性化服務(wù),進(jìn)而提高數(shù)字檔案館服務(wù)效率,使數(shù)字檔案資源價(jià)值得以最大化。
用戶畫像作為大數(shù)據(jù)環(huán)境下分析用戶信息的模型,最早由Alan Cooper提出,它被定義為“表示真實(shí)用戶的虛擬代表”[1],目前國內(nèi)外學(xué)者聚焦于用戶畫像的內(nèi)涵、模型構(gòu)建和具體應(yīng)用等方面。本文認(rèn)為用戶畫像是對用戶的基本信息、個(gè)性需求及興趣偏好等數(shù)據(jù)進(jìn)行標(biāo)簽化,通過抽象出的標(biāo)簽信息構(gòu)建模型來刻畫用戶全貌,強(qiáng)調(diào)用戶的主體地位,有效地將用戶需求與服務(wù)方向相聯(lián)系,為個(gè)性化服務(wù)打下基礎(chǔ);個(gè)性化服務(wù)作為一種新型信息服務(wù)方式,根據(jù)用戶的需求和特征,主動(dòng)提供相應(yīng)服務(wù),更具有針對性。在大數(shù)據(jù)滲透于社會各領(lǐng)域的背景下,個(gè)性化服務(wù)有效地為用戶解決了信息過載和信息迷航的問題[2];數(shù)字檔案館作為提供服務(wù)的主體,是存儲和利用檔案信息資源的知識空間,涉及館藏、網(wǎng)絡(luò)、數(shù)據(jù)庫等檔案資源。檔案信息資源的快速增多、用戶個(gè)性化需求的不斷增長、新興技術(shù)的尚未深入應(yīng)用,使得數(shù)字檔案館難以應(yīng)對大數(shù)據(jù)時(shí)代的強(qiáng)大數(shù)據(jù)壓力[3]。
針對數(shù)字檔案館面臨的挑戰(zhàn),國內(nèi)學(xué)者張開森最先在數(shù)字檔案館中引入個(gè)性化服務(wù),以期提升服務(wù)質(zhì)量,促進(jìn)其在互聯(lián)網(wǎng)中的生存和發(fā)展[4];繼而王斌、王林等探討了數(shù)字檔案館提供信息分類定制、信息推送、信息智能代理、呼叫中心等個(gè)性化的服務(wù)模式[5][6]。由此可見,數(shù)字檔案館個(gè)性化服務(wù)依然以館藏為主,通過發(fā)揮館藏優(yōu)勢來滿足用戶需求。但是,要想為用戶提供高質(zhì)量的個(gè)性化服務(wù),前提是要全面了解用戶,用戶畫像的應(yīng)用是刻畫用戶全貌、聯(lián)系用戶與服務(wù)的有效橋梁。陽曉萍等認(rèn)為用戶建模技術(shù)是個(gè)性化服務(wù)的基礎(chǔ)和核心[7];陳媛等以數(shù)字圖書館為研究對象,提出建立個(gè)性化服務(wù)用戶模型構(gòu)架來獲取用戶隱性興趣[8]。因此,用戶畫像和個(gè)性化服務(wù)相結(jié)合,將進(jìn)一步提高個(gè)性化服務(wù)的針對性、精準(zhǔn)性與高效性??v觀檔案領(lǐng)域,目前關(guān)于用戶畫像的研究相對較少,但已受到相關(guān)學(xué)者的關(guān)注。國外學(xué)者Kim HN闡述了用戶畫像在檔案館知識服務(wù)中的作用,通過個(gè)性化的用戶建模來推薦與用戶興趣相關(guān)的內(nèi)容[9];國內(nèi)周林興等學(xué)者分析了檔案館應(yīng)用用戶畫像的需求,以此構(gòu)建基于用戶畫像的檔案知識個(gè)性化推薦流程[10]??墒蔷唧w到用戶畫像在數(shù)字檔案館個(gè)性化服務(wù)中的應(yīng)用,國內(nèi)外的相關(guān)研究匱乏,檔案界應(yīng)積極借鑒相關(guān)領(lǐng)域的經(jīng)驗(yàn),加快推進(jìn)用戶畫像的應(yīng)用,以提高數(shù)字檔案館個(gè)性化服務(wù)的質(zhì)量。
隨著檔案數(shù)字化工作的轉(zhuǎn)型,我國各級各類數(shù)字檔案館以自身館藏為基礎(chǔ)提供著不同程度的個(gè)性化服務(wù),通過對我國31個(gè)省份的檔案信息網(wǎng)站和檔案館官網(wǎng)進(jìn)行訪問瀏覽發(fā)現(xiàn),我國數(shù)字檔案館基本上能提供面向公眾交流、展覽、學(xué)習(xí)的個(gè)性化服務(wù),但在內(nèi)容質(zhì)量、服務(wù)效果、用戶參與度等方面依然存在著不足。
目前我國絕大多數(shù)檔案館都擁有自己的門戶網(wǎng)站,比如青島、內(nèi)蒙古數(shù)字檔案館建設(shè)有自己的官網(wǎng);北京、長沙、江西數(shù)字檔案館作為檔案信息網(wǎng)站的一個(gè)欄目,不斷推進(jìn)館藏資源數(shù)字化。從館藏內(nèi)容來看,我國數(shù)字檔案館大多以政務(wù)信息、歷史檔案、檔案文化等為主,而互動(dòng)交流、預(yù)約查檔、利用效果等服務(wù)功能較少或者服務(wù)滯后,用戶的檔案問題得不到及時(shí)解決。事實(shí)上,當(dāng)前我國大多數(shù)數(shù)字檔案館所提供的檔案服務(wù)并沒有突破傳統(tǒng)檔案服務(wù)的思維束縛,在具體實(shí)踐中更多的是利用互聯(lián)網(wǎng)技術(shù)和數(shù)字化設(shè)備將一些事先設(shè)計(jì)好的服務(wù)推送給用戶,并不能及時(shí)根據(jù)用戶的利用“場景”來調(diào)整優(yōu)化服務(wù)[11],針對性不強(qiáng),因此不能很好地根據(jù)用戶的特點(diǎn)和需求來“定制”服務(wù)。
數(shù)字檔案館的館藏資源反映了本地區(qū)、本單位的發(fā)展面貌、記憶沉淀與未來展望,突出了很強(qiáng)的地方特色,但是這樣的館藏建設(shè)使檔案資源面臨地域化、零散化、豐裕度不高、關(guān)聯(lián)性不強(qiáng)等問題。即使網(wǎng)站內(nèi)設(shè)置了友情鏈接功能,但是鏈接的結(jié)果依然是各個(gè)檔案館的獨(dú)立資源,質(zhì)量參差不齊,雖然節(jié)省了檢索時(shí)間,卻沒能從本質(zhì)上提高數(shù)字檔案資源的服務(wù)效果。智能化時(shí)代,用戶更關(guān)注自己需求的滿足,渴望得到個(gè)性化、泛在化、快捷智能的知識服務(wù)[12]。因此,社會環(huán)境的變化和用戶動(dòng)態(tài)化需求對數(shù)字檔案館服務(wù)提出了新的技術(shù)要求,檔案資源要實(shí)現(xiàn)分布式存儲與融合,用戶通過統(tǒng)一的檢索入口可以實(shí)現(xiàn)跨館檢索,得到的檢索結(jié)果經(jīng)過去重、排序、整合等操作后以可視化的形式呈現(xiàn)給用戶。
隨著互聯(lián)網(wǎng)的深入發(fā)展,政府信息越來越公開透明,而我國檔案工作依然具有較強(qiáng)的政務(wù)性與機(jī)密性,所以相對于圖書館、電子商務(wù)等其他信息服務(wù)領(lǐng)域,我國數(shù)字檔案館服務(wù)受眾面比較局限,用戶群體規(guī)模相對較小,社會參與度和影響度不高,整個(gè)服務(wù)生態(tài)環(huán)境較為脆弱。通過訪問各個(gè)檔案館網(wǎng)站可以了解到,大多數(shù)數(shù)字檔案館首頁缺少對用戶相關(guān)數(shù)據(jù)的采集,比如用戶首登網(wǎng)站的注冊信息、訪問相關(guān)內(nèi)容記錄、瀏覽網(wǎng)站停留時(shí)間等,對用戶行為的研究存在較大困難,個(gè)性化服務(wù)生態(tài)環(huán)境中“人”的必要因素欠缺。盡管大部分網(wǎng)站設(shè)置有公眾參與、互動(dòng)交流、利用效果等版塊,但是用戶參與量較少、活躍度不高,提供服務(wù)的時(shí)間滯后,用戶的檔案問題不能得到及時(shí)解決,用戶的利用反饋沒有得到充分重視,用戶提出的問題不能得到及時(shí)解決,服務(wù)效率亟待提高。
檔案用戶是數(shù)字檔案館提供個(gè)性化服務(wù)的核心對象,因此對用戶數(shù)據(jù)的采集是整個(gè)服務(wù)模型的基礎(chǔ)。當(dāng)前,我國數(shù)字檔案館在一定程度上形成了固定的檔案用戶社群,其中包括政府機(jī)關(guān)工作人員、企業(yè)員工、專家學(xué)者、高校師生、社會公眾,并且公眾的規(guī)模在逐漸擴(kuò)大。通過網(wǎng)絡(luò)爬蟲等采集工具從數(shù)字檔案館及相應(yīng)的社交媒體采集用戶信息,然后對檔案用戶數(shù)據(jù)進(jìn)行識別分類與分布式交換,最后利用區(qū)塊鏈技術(shù)加密用戶數(shù)據(jù),保障用戶的隱私安全。
數(shù)字檔案館的用戶數(shù)據(jù)可以分為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),其中結(jié)構(gòu)化數(shù)據(jù)是關(guān)于用戶的自然屬性數(shù)據(jù),是指相對穩(wěn)定或靜態(tài)的人口屬性,主要包括用戶的性別、年齡、職業(yè)、學(xué)歷、職稱、工作單位等,可以通過用戶的注冊信息獲得,便于采集,容易形成用戶標(biāo)簽。而半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)屬于用戶行為數(shù)據(jù),是用戶畫像構(gòu)建的核心數(shù)據(jù),量大類多,本文將其劃為社交屬性數(shù)據(jù)、興趣屬性數(shù)據(jù)和能力屬性數(shù)據(jù)。社交屬性數(shù)據(jù)主要包括用戶的活躍度和相關(guān)用戶的聯(lián)系,從而反映出用戶的社交影響力。用戶的活躍度來自用戶頁面點(diǎn)擊、瀏覽、下載、轉(zhuǎn)發(fā)等行為數(shù)據(jù),通過用戶關(guān)注的網(wǎng)站數(shù)、提問及回答的數(shù)量、用戶之間進(jìn)行的交流合作等行為來建立聯(lián)系。興趣屬性數(shù)據(jù)體現(xiàn)了用戶在檔案領(lǐng)域的某種行為偏好與特征,通過數(shù)據(jù)挖掘技術(shù)對用戶標(biāo)識、用戶接觸點(diǎn)、用戶行為數(shù)據(jù)進(jìn)行采集。能力屬性數(shù)據(jù)是用戶對檔案資源完成一次檢索查閱或應(yīng)用的研究領(lǐng)域體現(xiàn)其綜合素質(zhì)的數(shù)據(jù),包括用戶使用的檢索工具類型、采取的檢索方式、檢索結(jié)果的展示?;诖耍瑪?shù)字檔案館系統(tǒng)可通過嵌入用戶頁面行為的監(jiān)控插件,在不影響用戶正常使用的前提下收集用戶不同屬性的數(shù)據(jù)[13],使用戶面貌刻畫得更加完整全面。
3.2.1 用戶數(shù)據(jù)標(biāo)簽化
用戶畫像模型構(gòu)建的本質(zhì)是對采集到的用戶數(shù)據(jù)進(jìn)行標(biāo)簽化。標(biāo)簽化是借助簡短的語言來描述用戶的各項(xiàng)特征,通過標(biāo)注的過程對檔案用戶進(jìn)行聚類,從而使用戶畫像清晰化、規(guī)范化和精準(zhǔn)化。首先,對用戶數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得到用戶畫像的靜態(tài)標(biāo)簽。用戶的自然屬性屬于靜態(tài)標(biāo)簽,具有一定的穩(wěn)定性、客觀性和事實(shí)性,這一類標(biāo)簽可以通過檔案用戶的注冊信息獲得,如性別標(biāo)簽、身份標(biāo)簽、地域標(biāo)簽、學(xué)習(xí)領(lǐng)域標(biāo)簽等。其次,通過機(jī)器學(xué)習(xí)等智能分析技術(shù)挖掘用戶特征、分析用戶行為、構(gòu)建用戶關(guān)聯(lián),得到用戶畫像的動(dòng)態(tài)標(biāo)簽,根據(jù)用戶在互動(dòng)交流區(qū)、查檔咨詢區(qū)、用檔效果區(qū)等公共領(lǐng)域的留言評論提取用戶的興趣特征、社交關(guān)系、情感趨向等信息并賦予標(biāo)簽,將用戶的特征清晰地表達(dá)出來,明確用戶需求。另外,在賦予標(biāo)簽的過程中需要對標(biāo)簽進(jìn)行預(yù)處理,經(jīng)過標(biāo)簽清洗、詞匯標(biāo)準(zhǔn)化、低頻詞過濾等處理步驟,用戶數(shù)據(jù)就轉(zhuǎn)換成了基于詞的特征項(xiàng)的集合,便于計(jì)算機(jī)進(jìn)行識別與操作[14]。
3.2.2 用戶畫像模型的更新
數(shù)字檔案館是一個(gè)開放與共享的系統(tǒng),館藏資源的結(jié)構(gòu)層次越來越多元,內(nèi)容越來越豐富,接受服務(wù)的檔案用戶范圍越來越廣,規(guī)模也越來越大。換言之,用戶標(biāo)簽是不斷變化的,因此用戶畫像的構(gòu)建也應(yīng)該及時(shí)響應(yīng)數(shù)據(jù)的變化并做出相應(yīng)調(diào)整,根據(jù)新增的用戶數(shù)據(jù)對畫像模型進(jìn)行動(dòng)態(tài)更新,以提高準(zhǔn)確性。與此同時(shí),用戶畫像的構(gòu)建與更新離不開算法與模型的技術(shù)支持,首先可以通過數(shù)學(xué)模型度量檔案用戶各方面的屬性特征,如利用知識相似計(jì)算、鄰居相似度計(jì)算、路徑相似度計(jì)算等精確刻畫用戶特征;其次可以借助數(shù)學(xué)模型如一次指數(shù)平滑模型并結(jié)合深度學(xué)習(xí)序列模型,挖掘檔案用戶行為之間的依賴關(guān)系、預(yù)測檔案用戶興趣的變化,實(shí)現(xiàn)用戶畫像模型的實(shí)時(shí)更新。
數(shù)字檔案館要想為用戶提供精準(zhǔn)服務(wù),用戶需求和檔案資源的深度匹配至關(guān)重要。一方面,用戶畫像全面刻畫了用戶面貌,將用戶的屬性、行為和期待等每一個(gè)信息抽象成標(biāo)簽,利用這些標(biāo)簽再把用戶特征具體化,使用戶的檔案需求得以清晰表達(dá),使相似用戶得以關(guān)聯(lián),并為個(gè)體用戶尋找相似用戶,得到用戶—用戶的關(guān)聯(lián)。另一方面,海量的檔案資源包括網(wǎng)頁、圖片、視頻等社交媒體文件,需要進(jìn)行顆粒度細(xì)化處理,所謂數(shù)據(jù)顆粒度是數(shù)據(jù)倉庫中的相關(guān)概念,通過發(fā)現(xiàn)將信息轉(zhuǎn)化為知識,實(shí)質(zhì)上是通過應(yīng)用基于事實(shí)的支持系統(tǒng)來輔助科學(xué)決策的制定,有利于資源的信息化[15]。因此,為了有效揭示和利用細(xì)顆粒度檔案資源,需要對館藏資源進(jìn)行標(biāo)識,完成資源—資源的關(guān)聯(lián),以便快速定位到用戶所需要的檔案。對檔案用戶與檔案資源進(jìn)行相似度計(jì)算,實(shí)現(xiàn)資源—用戶的關(guān)聯(lián)匹配,為個(gè)性化服務(wù)提供有力支撐。
建設(shè)數(shù)字檔案館的最終目的是為用戶提供主動(dòng)性、及時(shí)性、知識性、智能性的個(gè)性化服務(wù),智慧服務(wù)層直接面向檔案用戶,其體驗(yàn)感受和利用反饋的好壞直接影響著整個(gè)數(shù)字檔案館系統(tǒng)的建設(shè)效果。首先,用戶畫像提供了豐富的用戶標(biāo)簽,不僅可以精準(zhǔn)捕獲檔案用戶在特定情境下的特定需求,還可以有效預(yù)測檔案用戶在較長時(shí)間內(nèi)的興趣偏好,所以個(gè)性化推送、知識性定制、智能化問答等服務(wù)可顯著提高數(shù)字檔案館服務(wù)質(zhì)量。其次,用戶的訪問界面更具情境化,且美觀智能。智慧導(dǎo)航是用戶瀏覽閱讀檔案資源的指引,引導(dǎo)檔案用戶快速地查閱到所需信息,節(jié)省用戶檢索時(shí)間,大大提高了檢索效率。另外,數(shù)字檔案館系統(tǒng)提供的檢索方式也影響著檔案用戶的檢索行為,智慧檢索作為數(shù)字檔案館海量資源的檢索入口,根據(jù)用戶輸入的主題詞和用戶畫像標(biāo)簽,結(jié)合基于協(xié)同規(guī)則的過濾,預(yù)測該用戶所需要的檔案資源,將主題最相關(guān)、最符合用戶需要的檔案資源按降序排列呈現(xiàn)。最后,數(shù)字檔案館的個(gè)性化門戶終端將充分利用各種社交媒體平臺和人工智能技術(shù),針對不同層次的用戶群體開展檔案文化展覽、檔案知識宣傳以及檔案情境體驗(yàn)等服務(wù),以更好地滿足用戶全方位、多角度、深層次的個(gè)性化需求。
檔案資源推薦服務(wù)是根據(jù)用戶在解決檔案問題過程中的切實(shí)需求,利用獲取的用戶數(shù)據(jù)和標(biāo)簽體系,并結(jié)合對用戶個(gè)人興趣偏好的分析,主動(dòng)地向用戶推薦其所需的檔案資源的行為,充分體現(xiàn)了數(shù)字檔案館服務(wù)的“智慧化”和“個(gè)性化”。在這一過程中需要個(gè)性化推薦系統(tǒng)的技術(shù)支撐,目前普遍應(yīng)用的推薦技術(shù)有基于內(nèi)容的推薦技術(shù)、基于關(guān)聯(lián)規(guī)則的推薦技術(shù)和協(xié)同過濾推薦技術(shù),其核心部分就是利用推薦算法,快速定位并找到用戶可能感興趣的信息資源并及時(shí)推送[16]。首先,根據(jù)采集到的用戶數(shù)據(jù)提取標(biāo)簽,得到實(shí)時(shí)的個(gè)體用戶畫像,再根據(jù)實(shí)時(shí)的個(gè)體用戶畫像中的用戶標(biāo)簽向用戶推薦相匹配的檔案資源或者將實(shí)時(shí)的個(gè)體用戶畫像與已建立的用戶畫像庫進(jìn)行匹配,找到相似用戶,將相似用戶閱覽的檔案資源推薦給用戶。用戶使用檔案后返回利用反饋界面,如果其檔案需求得到滿足,則此次資源推薦成功,并將目標(biāo)用戶的標(biāo)簽添加到用戶畫像庫之中,否則此次資源推薦失敗,以后不再推薦此類檔案信息。由此可見,用戶的利用反饋信息可以倒逼數(shù)字檔案館進(jìn)行館藏資源建設(shè),使內(nèi)容更加豐富、層次更加多元、結(jié)構(gòu)更加完整。
大數(shù)據(jù)時(shí)代,一方面檔案資源呈現(xiàn)出大數(shù)據(jù)的異構(gòu)、分散、增長速度快、價(jià)值密度低等特點(diǎn),另一方面檔案用戶更加關(guān)注自身檔案問題的解決,檔案信息需要進(jìn)一步加工處理為檔案知識來滿足其需求,因此數(shù)字檔案館實(shí)現(xiàn)個(gè)性化的知識服務(wù)至關(guān)重要,其中知識融合是關(guān)鍵一步。知識融合面向需求和創(chuàng)新,對眾多分散資源、異構(gòu)資源中的知識進(jìn)行獲取、匹配、集成等處理,挖掘有價(jià)值的新知識,同時(shí)優(yōu)化知識的結(jié)構(gòu)和內(nèi)涵,進(jìn)而提供知識服務(wù)[17]?;诖?,根據(jù)用戶畫像靈敏地洞察知識需求的對象、領(lǐng)域和層次,得到用戶精準(zhǔn)的檔案知識需求,數(shù)字檔案館的知識服務(wù)便是從檔案知識中按照用戶需求有針對性地進(jìn)一步提煉、融合所需知識,提供給用戶,幫助用戶解決其實(shí)際問題。將用戶畫像技術(shù)嵌入數(shù)字檔案館服務(wù),也有利于知識向智慧轉(zhuǎn)化,把已有的館藏和能夠調(diào)動(dòng)的資源進(jìn)行融合,來指導(dǎo)用戶進(jìn)行檔案實(shí)踐。面向用戶的多元化、差異性的需求,鼓勵(lì)數(shù)字檔案館和其他信息機(jī)構(gòu)進(jìn)行跨界融合,深度挖掘隱性知識、整合碎片化知識,使不同機(jī)構(gòu)的檔案知識自由流動(dòng)并實(shí)時(shí)共享,實(shí)現(xiàn)檔案知識的創(chuàng)新增值。
數(shù)字檔案館的服務(wù)本質(zhì)是滿足用戶需求。目前,信息技術(shù)的廣泛應(yīng)用為檔案領(lǐng)域帶來了巨大的發(fā)展前景,利用者從原先有特定查檔需求的個(gè)體擴(kuò)大至海量用戶群體[18]。在此背景下,用戶畫像的應(yīng)用有助于數(shù)字檔案館實(shí)時(shí)采集數(shù)據(jù)、分析用戶特征,為用戶提供匹配服務(wù),使其能獲得滿足自身需要的檔案資源。從當(dāng)前檔案用戶來看,可將其劃分為活躍用戶、激活用戶和潛在用戶,活躍用戶是利用檔案比較頻繁并且對檔案資源的開發(fā)利用有促進(jìn)作用的群體,其中大多為學(xué)者專家、高校師生、檔案工作者等專業(yè)人士;激活用戶是對檔案資源有需求,但限于自身檢索能力或所從事的工作,不能很好獲得檔案資源的群體;潛在用戶是當(dāng)前沒有但未來可能會有檔案需求的群體,包含廣大的社會公眾。用戶畫像的數(shù)據(jù)主要來自活躍用戶,他們不僅是個(gè)性化服務(wù)的享有者,更是用戶畫像標(biāo)簽庫的創(chuàng)建者,在這過程中用戶交互不斷加強(qiáng)。隨著個(gè)性化服務(wù)的發(fā)展以及用戶畫像標(biāo)簽體系的豐富,活躍用戶也將以自己的實(shí)際利用體驗(yàn)影響并激活更多的用戶來選擇數(shù)字檔案館作為自己獲取資源的渠道之一。在用戶和資源精準(zhǔn)匹配的良好循環(huán)中,激活用戶和潛在用戶也將不斷發(fā)展為活躍用戶,從而形成龐大的檔案用戶社群。加強(qiáng)用戶之間的交流學(xué)習(xí),最大限度滿足用戶需求,這將進(jìn)一步提高數(shù)字檔案館的社會影響力,發(fā)揮檔案應(yīng)有的社會價(jià)值。