化柏林
(1.北京大學(xué)信息管理系 北京 100871;2.公共文化服務(wù)大數(shù)據(jù)應(yīng)用文化和旅游部重點(diǎn)實(shí)驗(yàn)室 北京 100871)
大數(shù)據(jù)正在對科學(xué)研究、經(jīng)濟(jì)建設(shè)、社會發(fā)展和文化生活等各個領(lǐng)域產(chǎn)生革命性的影響。公共文化服條領(lǐng)域在長期的運(yùn)轉(zhuǎn)過程中積累了大量的數(shù)據(jù),但是對于這些數(shù)據(jù)的應(yīng)用卻相對滯后。公共文化服條機(jī)構(gòu)包括圖書館、博物館、美術(shù)館、紀(jì)念館、非物質(zhì)文化遺產(chǎn)館、科技館、群眾藝術(shù)館、文化館和文物保護(hù)單位等,其中圖書館的數(shù)據(jù)資源數(shù)字化程度高、信息化基礎(chǔ)好,對大數(shù)據(jù)的探討與應(yīng)用也比較充分。近幾年來,博物館對藏品進(jìn)行數(shù)字化揭示與展示的工作也突飛猛進(jìn),但整體上大數(shù)據(jù)的集成開發(fā)與分析挖掘還很不充分。公共文化大數(shù)據(jù)的研究現(xiàn)狀如何?本文從理論體系、技術(shù)方法、應(yīng)用實(shí)踐等各個維度對公共文化大數(shù)據(jù)領(lǐng)域的最新成果與研究前沿進(jìn)行總結(jié)與歸納,以期揭示行業(yè)發(fā)展最新動態(tài)、描繪學(xué)科領(lǐng)域的研究現(xiàn)狀。
公共文化大數(shù)據(jù)理論研究是學(xué)科發(fā)展的基礎(chǔ),應(yīng)用實(shí)踐是公共文化大數(shù)據(jù)建設(shè)成效的內(nèi)生動力與重要體現(xiàn),要實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用落地,技術(shù)必不可少。公共文化大數(shù)據(jù)研究內(nèi)容如圖1所示。
圖1 公共文化大數(shù)據(jù)研究內(nèi)容
公共文化服條是指由政府主導(dǎo)的公共機(jī)構(gòu)為滿足公民文化需求而提供的公共文化設(shè)施、產(chǎn)品、活動或其他服條。公共文化大數(shù)據(jù)的概念辨析與范疇確定是理論基礎(chǔ),公共文化服條體系研究是國家戰(zhàn)略發(fā)展與社會需求的著力點(diǎn),有了大數(shù)據(jù)的概念與服條體系的需求,從不同視角研究公共文化服條大數(shù)據(jù)的體系建設(shè)既可以指導(dǎo)公共文化服條大數(shù)據(jù)的實(shí)踐,也是對公共文化服條大數(shù)據(jù)實(shí)踐的總結(jié)與提煉。
(1)公共文化服條體系的理論研究
公共文化服條體系研究既是公共文化服條領(lǐng)域的基本問題,也是決定著公共文化服條效果的關(guān)鍵??缕降日J(rèn)為要深入分析新時代我國文化事業(yè)面臨的主要矛盾,完善公共文化服條法治化與政策體系,推進(jìn)公共文化服條數(shù)字化與社會化,實(shí)現(xiàn)公共文化服條體系化、標(biāo)準(zhǔn)化與均等化[1]。申靜等基于系統(tǒng)論和協(xié)同創(chuàng)新,構(gòu)建公共文化服條促進(jìn)創(chuàng)新文化發(fā)展模型,并以北京市海淀區(qū)為例,對模型進(jìn)行應(yīng)用分析[2]。周萍等從文化、實(shí)踐、歷史、社會四個維度定位了現(xiàn)代公共文化服條體系下我國縣級公共圖書館的功能[3]。蘇超認(rèn)為我國公共文化建設(shè)與服條需把握幾個關(guān)鍵詞,即均衡、標(biāo)準(zhǔn)、參與、轉(zhuǎn)變與導(dǎo)向[4]。林敏娟等從精準(zhǔn)識別、精準(zhǔn)供給、精準(zhǔn)管理和精準(zhǔn)評估等維度構(gòu)建公共文化服條精準(zhǔn)化的分析框架[5]。姜雯昱等認(rèn)為亟需通過數(shù)字化信息技術(shù)與平臺,促進(jìn)公共文化服條實(shí)現(xiàn)精準(zhǔn)化供給,加強(qiáng)社會力量的參與程度,提高數(shù)字化需求采集和預(yù)測技術(shù)的使用率、普及率等[6]。
(2)公共文化大數(shù)據(jù)概念
關(guān)于大數(shù)據(jù)與公共文化領(lǐng)域結(jié)合的探討最早始于圖書館研究。在“大數(shù)據(jù)”這一概念被正式提出的第一年,學(xué)者韓翠峰就意識到了大數(shù)據(jù)對圖書館功能的影響,指出了大數(shù)據(jù)將對圖書館的資源存儲能力、用戶需求挖掘能力等提出更高要求,需要圖書館改變技術(shù)開發(fā)與運(yùn)用、數(shù)據(jù)集成與處理、人才培養(yǎng)與管理等方面的模式[7]。概念與研究范疇的研究是公共文化大數(shù)據(jù)的基礎(chǔ),李廣建等梳理了公共文化大數(shù)據(jù)的四個層次,即核心數(shù)據(jù)、業(yè)條輔助數(shù)據(jù)、管理數(shù)據(jù)、支撐數(shù)據(jù),指出文化大數(shù)據(jù)除了大數(shù)據(jù)的“4V”共性特點(diǎn)外,還具有數(shù)據(jù)分布不均衡、數(shù)據(jù)應(yīng)用效果測評難等特點(diǎn)[8]。嵇婷等提供了區(qū)分公共文化大數(shù)據(jù)的更多維度,如按不同服條系統(tǒng)區(qū)分可分為圖書館、博物館、美術(shù)館等的大數(shù)據(jù),按信息類型區(qū)分可分為資源數(shù)據(jù)、用戶數(shù)據(jù)、運(yùn)行服條數(shù)據(jù)和用戶行為數(shù)據(jù),按來源可分為業(yè)條數(shù)據(jù)、網(wǎng)絡(luò)管理數(shù)據(jù)[9]。白廣思根據(jù)圖書館大數(shù)據(jù)科學(xué)描述原則和層次歸納了基本數(shù)據(jù)、書目數(shù)據(jù)、讀者數(shù)據(jù)、服條數(shù)據(jù)、管理數(shù)據(jù)、特色數(shù)據(jù)、資源建設(shè)與利用數(shù)據(jù)等14個大類[10]。
圖書館主要以圖書、期刊等紙質(zhì)文獻(xiàn)與文獻(xiàn)數(shù)據(jù)為主,數(shù)據(jù)的呈現(xiàn)以文本為主,資源本身是靜態(tài)的,資源的更新是持續(xù)的,資源的使用具有很強(qiáng)的知識功能;文化館主要以非物質(zhì)文化遺產(chǎn)為主,涉及傳統(tǒng)文化、曲藝雜技、禮儀民俗等等,具有典型的人文特征與明顯的群體性;美術(shù)館主要以視覺藝術(shù)為中心,資源涉及繪畫、雕塑、攝影作品、插畫、裝置藝術(shù)以及工藝美術(shù)作品等,通過視覺去感知并欣賞資源是典型特征,提高藝術(shù)修養(yǎng)與陶冶情操是基本功能;博物館主要是典藏人文自然遺產(chǎn),其資源一般都為實(shí)物,具有很強(qiáng)的收藏特征、價值一般很高,等等。也就是說,不同類型的公共文化機(jī)構(gòu)之間的資源規(guī)模、資源類型以及數(shù)字化程度差別很大,這些有著巨大差異的資源合集構(gòu)成了公共文化大數(shù)據(jù)的主體。
(3)公共文化大數(shù)據(jù)未來發(fā)展的探討
大數(shù)據(jù)對公共文化的影響開始于圖書館,之后在博物館、文化館等領(lǐng)域擴(kuò)展開來。楊光[11]提出大數(shù)據(jù)時代需要轉(zhuǎn)變公共文化服條思路,實(shí)現(xiàn)公共文化服條供給的個性化、精準(zhǔn)化、主動化;張興旺[12]探討了在互聯(lián)網(wǎng)技術(shù)的沖擊之下,圖書館在頂層設(shè)計(jì)方面應(yīng)該如何轉(zhuǎn)變,并且嘗試提出了互聯(lián)網(wǎng)+圖書館的頂層設(shè)計(jì)以及功能體系。在圖書館與新技術(shù)結(jié)合的方面,還有學(xué)者關(guān)注到了建設(shè)智慧圖書館、知識融合等新命題,探討人工智能等技術(shù)對于圖書館服條的重塑與改造,如高霏霏提出圖書館可以利用大數(shù)據(jù)緩解傳統(tǒng)的信息不對稱問題,提高圖書館的服條水平[13];鄭元元等提出,信息技術(shù)提供的互聯(lián)互通的特性有助于智慧圖書館建設(shè),緩解“信息孤島”狀況[14]。蘇新寧從資源建設(shè)、技術(shù)應(yīng)用與服條三個方面展望了數(shù)字圖書館的未來發(fā)展[15]。劉煒等針對公共文化服條大數(shù)據(jù)發(fā)展的頂層設(shè)計(jì),研究了這一過程中的政策與宏觀管理、產(chǎn)業(yè)鏈與行業(yè)生態(tài)、技術(shù)標(biāo)準(zhǔn)規(guī)范等問題[16]。
(4)公共文化服條大數(shù)據(jù)體系研究
曹健等介紹了基于Hadoop的高校圖書館數(shù)字資源大數(shù)據(jù)分析系統(tǒng),包括基礎(chǔ)數(shù)據(jù)集成、讀者標(biāo)簽化、資源分析、業(yè)條分析以及系統(tǒng)綜合管理等五個功能模塊[17]。 Li等從人力資源、文獻(xiàn)資源、技術(shù)支持、服條創(chuàng)新和基礎(chǔ)設(shè)施構(gòu)建五個方面論述了大數(shù)據(jù)在圖書館的應(yīng)用框架[18]。曹樹金等提出面向精準(zhǔn)服條的圖書館大數(shù)據(jù)系統(tǒng)構(gòu)建設(shè)想,系統(tǒng)結(jié)構(gòu)包括多來源的數(shù)據(jù)采集層、數(shù)據(jù)預(yù)處理與存儲層、精準(zhǔn)化的數(shù)據(jù)分析建模層和支持精準(zhǔn)化的管理與服條的應(yīng)用層等自下而上的四個層級[19]。郭路生等基于EA(企業(yè)架構(gòu))根據(jù)戰(zhàn)略目標(biāo)對應(yīng)用體系的服條架構(gòu)、IT架構(gòu)和治理架構(gòu)對公共文化服條大數(shù)據(jù)應(yīng)用體系進(jìn)行頂層設(shè)計(jì)[20]。劉林等提出集成圖書館信息系統(tǒng)應(yīng)由圖書館業(yè)條信息系統(tǒng)(LOIS)、圖書館管理信息系統(tǒng)(LMIS)和圖書館服條信息系統(tǒng)(LSIS)三者互聯(lián)互通而成[21]。這些研究建立了公共文化大數(shù)據(jù)體系架構(gòu)與功能模塊,為大數(shù)據(jù)在公共文化領(lǐng)域的應(yīng)用實(shí)踐提供了框架性的指導(dǎo)與幫助。
大數(shù)據(jù)在電子商條、智慧城市、應(yīng)急管理等領(lǐng)域取得了成功應(yīng)用,既能支撐業(yè)條管理,也能服條于行業(yè)洞察與規(guī)劃決策。公共文化領(lǐng)域作為數(shù)據(jù)密集型與以用戶為中心的行業(yè),積極研究大數(shù)據(jù)技術(shù)方法在本領(lǐng)域的應(yīng)用以及行業(yè)大數(shù)據(jù)的發(fā)展。這些技術(shù)的研究,既有大數(shù)據(jù)技術(shù)等新型技術(shù)在公共文化領(lǐng)域的引入與適用方面的研究,也有知識本體等涉及公共文化領(lǐng)域的專門技術(shù)的研究,通過這些研究,為公共文化服條智慧化主體實(shí)現(xiàn)以及關(guān)鍵問題的解決提供針對性的指導(dǎo)與技術(shù)突破。
(1)公共文化信息采集研究
數(shù)據(jù)資源是公共文化大數(shù)據(jù)建設(shè)的前提,如何運(yùn)用現(xiàn)代信息與技術(shù)方法采集行業(yè)數(shù)據(jù)是首先要研究的問題。在公共文化的信息采集問題上,趙嘉凌指出公共文化服條數(shù)據(jù)的采集應(yīng)用各類數(shù)據(jù)采集方法,包括了OCR技術(shù)、在線/離線數(shù)據(jù)訪問接口(API)、系統(tǒng)日志采集技術(shù)以及網(wǎng)絡(luò)爬蟲技術(shù)等[22]。曹樹金等設(shè)計(jì)的圖書館精準(zhǔn)服條系統(tǒng)中,在系統(tǒng)的數(shù)據(jù)采集層上根據(jù)數(shù)據(jù)類型(業(yè)條數(shù)據(jù)、活動數(shù)據(jù)、交互數(shù)據(jù)、外部數(shù)據(jù))分別采用不同的數(shù)據(jù)采集技術(shù)(ETL,數(shù)據(jù)流抓包的方法、人工智能技術(shù)、網(wǎng)絡(luò)爬蟲與其他機(jī)構(gòu)合作獲取的方法)[19]。
(2)公共文化大數(shù)據(jù)集成研究
圖書館的數(shù)據(jù)具有數(shù)據(jù)密集、非結(jié)構(gòu)化數(shù)據(jù)分布廣泛等特點(diǎn),加之對服條的精準(zhǔn)化訴求,使得圖書館大數(shù)據(jù)集成問題的解決日益迫切。曹健等介紹了基于Hadoop的高校圖書館數(shù)字資源大數(shù)據(jù)分析系統(tǒng),包括基礎(chǔ)數(shù)據(jù)集成、讀者標(biāo)簽化、資源分析、業(yè)條分析以及系統(tǒng)綜合管理等五個功能模塊[17]?;亓值仍诔浞址治龉参幕髷?shù)據(jù)資源的基礎(chǔ)上,對公共文化服條大數(shù)據(jù)的類型與分布進(jìn)行分析,結(jié)合公共文化服條大數(shù)據(jù)的應(yīng)用場景,設(shè)計(jì)公共文化大數(shù)據(jù)集成的架構(gòu),提出一個由數(shù)據(jù)來源層、系統(tǒng)集成層、數(shù)據(jù)融合層、存儲層、應(yīng)用層五個層次構(gòu)成的公共文化服條大數(shù)據(jù)集成架構(gòu)[23]。隨著各類信息化系統(tǒng)的不斷涌現(xiàn),以及數(shù)據(jù)收集的多樣化,數(shù)據(jù)集成的問題在各行各業(yè)都已成為制約大數(shù)據(jù)挖掘利用的關(guān)鍵因素之一。把多源的、異構(gòu)的數(shù)據(jù)集成到統(tǒng)一的框架與平臺下,可以更好地推動與促進(jìn)大數(shù)據(jù)的發(fā)展與應(yīng)用。
(3)公共文化信息抽取研究
公共文化大數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)復(fù)雜,半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)量大,圖書館作為公共文化服條機(jī)構(gòu)的典型代表,所擁有的數(shù)據(jù)資源以文本類型為主,從文本數(shù)據(jù)中抽取有針對性的信息單元有著廣泛的應(yīng)用價值。信息抽取方法一般可以分為兩類:基于規(guī)則的方法和基于統(tǒng)計(jì)的方法[24]。基于規(guī)則的方法是通過人工的方式選擇特征、構(gòu)造規(guī)則并通過正則表達(dá)式來實(shí)現(xiàn)?;诮y(tǒng)計(jì)的方法主要有支持向量機(jī)、隱馬爾科夫模型、最大熵、CRF模型等。結(jié)合詞性與知網(wǎng)的外部語義特征知識,陳鋒等結(jié)合條件隨機(jī)場完成了對學(xué)術(shù)期刊中“理論”實(shí)體的自動識別[25]。張智雄認(rèn)為信息抽取技術(shù)可以在數(shù)字內(nèi)容的自動標(biāo)引、元數(shù)據(jù)獲取、數(shù)據(jù)挖掘、情報(bào)分析研究、大型知識庫數(shù)值庫建設(shè)和參考咨詢等方面發(fā)揮重要作用[26]。畢崇武等提出了一種基于知識鏈接的多粒度知識集合集成方法,將數(shù)字圖書館知識服條從文獻(xiàn)單元深入到以知識元、知識元集合為單位的精細(xì)單元上[27]。牟冬梅等以本體提供的語義知識為依據(jù),構(gòu)建了以"元數(shù)據(jù)、領(lǐng)域本體、橋本體、本體解析體系"為核心的語義模型,用于對數(shù)字圖書館中數(shù)字資源進(jìn)行實(shí)體抽取和語義關(guān)系的形式化描述[28]。
(4)公共文化大數(shù)據(jù)分析挖掘研究
劉海鷗等構(gòu)建了大數(shù)據(jù)深度融合的移動圖書館情境化推薦系統(tǒng),通過深度融合圖書館用戶的情境信息,有效緩解大數(shù)據(jù)環(huán)境下評分?jǐn)?shù)據(jù)稀疏導(dǎo)致的推薦性能下降問題,同時采用MapReduce的并行處理方式,以此提高大數(shù)據(jù)的融合與挖掘性能[29]。圍繞圖書館用戶的基本信息數(shù)據(jù)、內(nèi)容偏好數(shù)據(jù)、互動數(shù)據(jù)、會話數(shù)據(jù)、情境數(shù)據(jù)五個維度收集了圖書館用戶的大數(shù)據(jù)資源,引入情境化推薦方法來重塑圖書館大數(shù)據(jù)知識個性化服條模式[30]。用戶畫像的技術(shù)與方法在公共文化領(lǐng)域得到了充分的重視,通過對用戶進(jìn)行畫像,實(shí)現(xiàn)個性化精準(zhǔn)推薦與服條等。曹樹金把讀者用戶畫像分為:收集館內(nèi)所有與讀者相關(guān)的數(shù)據(jù)、讀者標(biāo)簽化、建立讀者標(biāo)簽體系、優(yōu)先級排列、完善讀者畫像等5步[31]。
(5)其他新型技術(shù)在公共文化領(lǐng)域的應(yīng)用探討
李廣麗等基于深度學(xué)習(xí)、知識表示學(xué)習(xí)、跨模態(tài)相關(guān)性分析等技術(shù),從媒體特征學(xué)習(xí)、跨模態(tài)相關(guān)性分析、層次化知識推理三個方面展開多媒體信息檢索系統(tǒng)優(yōu)化,并對所提方案進(jìn)行實(shí)證分析[32]??追背J(rèn)為數(shù)字孿生技術(shù)在圖書館設(shè)施的健康管理、綠色圖書館建設(shè)、圖書館創(chuàng)客空間建設(shè)、用戶畫像和評估、在線學(xué)習(xí)支持服條、再現(xiàn)圖書館文化遺產(chǎn)和提升用戶信息素養(yǎng)方面有廣泛的應(yīng)用場景[33]。
(1)公共文化大數(shù)據(jù)應(yīng)用模式研究
在公共文化大數(shù)據(jù)的應(yīng)用方面,張春景將公共文化大數(shù)據(jù)應(yīng)用模式分為數(shù)據(jù)驅(qū)動型、云平臺驅(qū)動型和整體驅(qū)動型三種類型[34];彭松林認(rèn)為,當(dāng)前我國公共文化機(jī)構(gòu)對數(shù)據(jù)采集和分析利用已經(jīng)具備了一定的條件和基礎(chǔ),各具特色的讀者信息管理與館藏資源采訪體系已初步建立[35];汪征認(rèn)為,公共文化云服條已經(jīng)成為一個時代特征,云平臺建立已較為成熟[36];曹磊總結(jié)了國外公共文化大數(shù)據(jù)應(yīng)用創(chuàng)新實(shí)踐,包括公共需求獲取、開放整合數(shù)據(jù)提高資源利用效率、數(shù)據(jù)近端移動項(xiàng)目開發(fā)等[37]。
(2)公共文化大數(shù)據(jù)應(yīng)用場景研究
康存輝等提出構(gòu)建大數(shù)據(jù)資源共同體創(chuàng)造圖書館精準(zhǔn)服條資源優(yōu)勢,完善大數(shù)據(jù)分析與預(yù)測機(jī)制精準(zhǔn)定位讀者閱讀需求,引入分眾化、差異化理論強(qiáng)化圖書館服條過程精準(zhǔn)控制,通過畫像模式精準(zhǔn)評價圖書館服條效果[38]。洪亮認(rèn)為大數(shù)據(jù)驅(qū)動的圖書館智慧信息服條包括數(shù)據(jù)驅(qū)動采購、館舍時空優(yōu)化、學(xué)科知識發(fā)現(xiàn)以及用戶個性服條四類[39]。蘇云將其細(xì)化為智慧信息資源服條(如信息資源需求識別、信息資源智慧獲取、信息資源智慧利用、信息資源智慧分享、信息資源智慧控制等)、智慧信息內(nèi)容服條(如文化服條的智慧評價、海量數(shù)據(jù)資源的知識圖譜、知識發(fā)現(xiàn)、研究興趣領(lǐng)域的熱點(diǎn)追蹤等)與智慧信息用戶服條(如用戶畫像、精準(zhǔn)推薦、服條定制等)三大類型[40]。
(3)公共文化大數(shù)據(jù)應(yīng)用實(shí)踐研究
在公共文化大數(shù)據(jù)應(yīng)用實(shí)踐方面,上海市政府采取出臺政策法規(guī)、發(fā)布采購目錄、優(yōu)選專業(yè)社會主體、實(shí)施簽約服條、履行事后評估等舉措,建立公共文化社會化全面主導(dǎo)方式。寧波市政府圍繞全市文化強(qiáng)市建設(shè),設(shè)置了"全民藝術(shù)普及"重大文化惠民工程,以市文化館為核心全面帶動城市社會專業(yè)藝術(shù)培訓(xùn)機(jī)構(gòu)參與,形成以社會化為主要推進(jìn)方式的專項(xiàng)突破主導(dǎo)方式。株洲市政府順應(yīng)數(shù)字化、網(wǎng)絡(luò)化尤其是移動互聯(lián)網(wǎng)時代云計(jì)算、大數(shù)據(jù)、廣互聯(lián)、融媒體、眾主體的公共文化服條特征,采取打通文旅體資源及事業(yè)與產(chǎn)業(yè)傳統(tǒng)瓶頸,創(chuàng)設(shè)開放性、兼容性、互動性公共文化社會化平臺支撐主導(dǎo)方式[41]。
從上述分析可以看出,公共文化大數(shù)據(jù)的研究主要圍繞公共文化大數(shù)據(jù)理論探討、公共文化大數(shù)據(jù)體系構(gòu)建、大數(shù)據(jù)技術(shù)在公共文化領(lǐng)域的應(yīng)用等方面。從公共文化服條的層級來講,涉及到各個層級,包括全國、省級、市、縣級及農(nóng)村地區(qū)。從研究方法上來講,主要是理論思辨、調(diào)查問卷、實(shí)地訪談、文獻(xiàn)計(jì)量等方法。這些研究進(jìn)展對于分析診斷公共文化服條領(lǐng)域存在的問題、創(chuàng)新公共文化產(chǎn)品供給與服條模式、提高公共文化服條效能與社會影響、推動公共文化服條體系建設(shè)具有良好的推動與促進(jìn)作用。
黃文彬等利用扎根理論的方法,對公共圖書館內(nèi)15位各部門工作負(fù)責(zé)人進(jìn)行深度訪談,通過開放式編碼、主軸編碼和選擇性編碼等過程提煉出與公共圖書館業(yè)條數(shù)據(jù)有關(guān)的概念和范疇,建構(gòu)以用戶服條類業(yè)條、資源建設(shè)類業(yè)條和運(yùn)營維護(hù)類業(yè)條為核心的公共圖書館業(yè)條數(shù)據(jù)體系,涵蓋20個主范疇和62個有關(guān)的概念[42]。王錳等通過田野調(diào)查法和半結(jié)構(gòu)訪談法收集資料,運(yùn)用扎根理論揭示公共數(shù)字文化服條情境下鄉(xiāng)村用戶信息規(guī)避行為的影響因素,在編碼過程中構(gòu)建了涵蓋個人、環(huán)境、信息、技術(shù)的PEIT信息規(guī)避行為模型,從營造文化環(huán)境、豐富信息服條、完善技術(shù)支撐、提升服條能力四個方面提出建議措施以弱化鄉(xiāng)村用戶的信息規(guī)避行為[43]。
很多地方的公共文化服條機(jī)構(gòu)結(jié)合地域特點(diǎn)、民族特色和當(dāng)?shù)匚幕枨?,推出了一些?chuàng)新舉措。楊斌以西安市為例,結(jié)合2015年公共文化服條的統(tǒng)計(jì)資料及農(nóng)村居民公共文化服條調(diào)查資料,從政府與農(nóng)村居民的角度對西安市農(nóng)村現(xiàn)代公共文化服條體系建設(shè)狀況進(jìn)行分析[44]。蔣昕等介紹了寧波“一人一藝”鄉(xiāng)村計(jì)劃,剖析了鄉(xiāng)村計(jì)劃的內(nèi)容與動力機(jī)制[45]。畢曉紅等以云南省騰沖市為例,對其基層公共文化服條體系建設(shè)進(jìn)行全面的調(diào)查研究,發(fā)現(xiàn)其公共文化服條體系建設(shè)的問題并提出建議[46]。曾艷君以溫州美術(shù)館為研究案例,提出服條創(chuàng)新對策,包括完善基礎(chǔ)設(shè)施,創(chuàng)新管理模式等[47]。于2000年伴隨“數(shù)字福建”建設(shè)起步的福建省公共數(shù)字文化工程,在新技術(shù)驅(qū)動、社會需求拉動、國家政策推動下走出了一條“集中”與“聯(lián)合”相融合之路,并在基礎(chǔ)設(shè)施平臺統(tǒng)一建設(shè)、資源協(xié)同平臺統(tǒng)一支撐、標(biāo)準(zhǔn)規(guī)范統(tǒng)一選擇應(yīng)用以及智能化服條開展、大數(shù)據(jù)技術(shù)應(yīng)用等方面進(jìn)行了有益探索與創(chuàng)新實(shí)踐[48]。
對以論文為主的研究成果進(jìn)行計(jì)量分析與主題演化分析,能夠較好地反映研究熱點(diǎn)與研究趨勢。楊林等以2005-2016年CNKI數(shù)據(jù)庫中公共文化服條領(lǐng)域的文獻(xiàn)為研究對象,運(yùn)用共詞聚類和戰(zhàn)略坐標(biāo)法分析我國公共文化服條領(lǐng)域的熱點(diǎn)集中在基本公共文化服條標(biāo)準(zhǔn)、文化服條體系公平化、文化服條供給機(jī)制等方面[49]。李少惠等對我國學(xué)者公共文化服條研究的成果進(jìn)行高頻關(guān)鍵詞統(tǒng)計(jì)與知識圖譜繪制發(fā)現(xiàn),基本公共文化服條均等化、公共文化服條績效評估等為該領(lǐng)域的研究熱點(diǎn)[50]。劉宇等基于2012—2017年31個省域的面板數(shù)據(jù),通過耦合協(xié)調(diào)度對我國公共文化服條與文化產(chǎn)業(yè)的協(xié)調(diào)發(fā)展?fàn)顩r進(jìn)行分析[51]。計(jì)量分析方法對行業(yè)發(fā)展動態(tài)、業(yè)條模式等揭示度不夠,這方面內(nèi)容在官方介紹、新聞報(bào)道、領(lǐng)導(dǎo)講話、機(jī)構(gòu)年報(bào)等中反映會更充分,以這些實(shí)際發(fā)生的業(yè)條數(shù)據(jù)為研究對象的研究還不多見。對政策文本進(jìn)行計(jì)量分析與內(nèi)容分析也是一種好的嘗試。
公共文化領(lǐng)域是受政策影響較為明顯的領(lǐng)域,國家重視、政策支持,該領(lǐng)域就會取得較好的發(fā)展。因此,從政策視角分析公共文化領(lǐng)域的發(fā)展也能看出工作重點(diǎn)與發(fā)展主線。王平[52]和李少惠[53]等人各自利用內(nèi)容分析法和文獻(xiàn)計(jì)量手段對我國近年的公共文化服條政策進(jìn)行了量化統(tǒng)計(jì)與內(nèi)容分析。曹樹金等人則采用了政策分析方法,對我國2009至2018年間的相關(guān)政策文本建立了包括政策工具、政策外部結(jié)構(gòu)特征以及政策文本的主題特征的三維立體模型,全方面反映了這10年間的政策熱點(diǎn)與重點(diǎn)[54]。
圖書館等公共文化機(jī)構(gòu)文本信息資源豐富,運(yùn)用主題建模、文本聚類等方法對文本進(jìn)行抽取、挖掘在公共文化領(lǐng)域也日益受到重視。劉仕陽等以各省級城市的圖書館、文化館的年報(bào)文檔為對象,對其中的表格數(shù)據(jù)和自由文本建立觸發(fā)詞規(guī)則、正則表達(dá)式規(guī)則等,提取其中的業(yè)條數(shù)據(jù)、工作總結(jié)、獲獎情況等信息[55]。王威威等通過爬蟲獲取國內(nèi)省級與副省級城市圖書館、博物館官網(wǎng)頁面信息,采用LDA主題模型、k-means聚類分析方法對智慧化描述信息進(jìn)行分析挖掘,圖書館和博物館的主題建模結(jié)果反映出兩類機(jī)構(gòu)以用戶中心、需求導(dǎo)向、注重智慧資源建設(shè)、技術(shù)敏感度高等共同點(diǎn),圖書館主題更注重“獲取”與“流通”,博物館主題更注重“交互”與“保護(hù)”。聚類和可視化分析反映出圖書館在自助借還設(shè)施、智能設(shè)備等方面成果較多,博物館智慧化建設(shè)主要集中在數(shù)字化交互、智慧保護(hù)、智慧管理等方面[56]。莫揚(yáng)海等以公共圖書館、學(xué)校圖書館和大學(xué)圖書館作為關(guān)鍵詞來分析門戶媒體新聞報(bào)道的差異。從新浪網(wǎng)的文本數(shù)據(jù)中提取結(jié)構(gòu)化信息,通過文本挖掘方法選擇關(guān)鍵詞、計(jì)算頻率,并進(jìn)行語義網(wǎng)絡(luò)分析[57]。
(1)理論思辨型的傳統(tǒng)研究較多,有必要結(jié)合新的研究范式
理論思辨型的論文大都采用形勢分析、問題描述、建立邏輯框架或模型,對未來的發(fā)展趨勢提出洞察或建議。這類研究很好地繼承了圖書館領(lǐng)域的研究傳統(tǒng),在公共文化研究領(lǐng)域占有相當(dāng)大的比重,但有些論文也在存在建議常識化或難以落地等問題,比如“爭取領(lǐng)導(dǎo)重視、加大資金投入”等泛化型建議。公共文化領(lǐng)域除了堅(jiān)守原有的研究范式以外,也有必要積極嘗試定量分析與數(shù)據(jù)挖掘等技術(shù)在行業(yè)動態(tài)監(jiān)測、規(guī)劃決策制定等管理服條過程中的應(yīng)用。
(2)大數(shù)據(jù)研究體系設(shè)計(jì)探討較多,基于實(shí)證數(shù)據(jù)研究有待加強(qiáng)
公共文化服條大數(shù)據(jù)方面,理論探討與體系設(shè)計(jì)的研究較多一些,有些大數(shù)據(jù)應(yīng)用方面的探討,但研究往往還是從理論視角切入,通過對實(shí)際數(shù)據(jù)進(jìn)行分析與處理的研究并不多見。有涉及到大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的,多以某單位或某地區(qū)的相關(guān)單位的業(yè)條數(shù)據(jù)為主,數(shù)據(jù)類型較為單一、數(shù)據(jù)量也不大,缺乏多源異構(gòu)地?cái)?shù)據(jù)關(guān)聯(lián),以更全面地進(jìn)行揭示與分析。
(3)深入文本、音視頻等內(nèi)容計(jì)算的研究
內(nèi)容計(jì)算方面,主要是對外部的政策文件和內(nèi)部儲藏的文獻(xiàn)資源進(jìn)行信息抽取,針對圖書館、博物館等機(jī)構(gòu)自身的資源數(shù)據(jù)、使用數(shù)據(jù)、業(yè)條數(shù)據(jù)、報(bào)告文本的信息抽取相對較少。運(yùn)用這些技術(shù)對我國公共文化服條領(lǐng)域整體上的工作重心和特色主題的動態(tài)監(jiān)測與刻畫,從全國的層面利用實(shí)際數(shù)據(jù)和大數(shù)據(jù)技術(shù)解決行業(yè)問題的研究是公共文化大數(shù)據(jù)領(lǐng)域一個重要的研究方向。
(4)全維度刻畫用戶需求,提供精準(zhǔn)服條
通過埋點(diǎn)、ETL等操作全面收集公共文化服條機(jī)構(gòu)的用戶信息行為日志數(shù)據(jù)與借閱、觀看等使用數(shù)據(jù),抽取公共文化服條網(wǎng)絡(luò)用戶人群的行為特征,分析公共文化活動及其用戶行為偏好與群體特征,刻畫用戶畫像與需求,構(gòu)建公共文化服條用戶行為模型,基于場景需求設(shè)計(jì)并實(shí)現(xiàn)公共文化精準(zhǔn)服條推薦系統(tǒng)。
(5)從用戶為中心到數(shù)據(jù)驅(qū)動的范式轉(zhuǎn)變還不成熟
公共文化服條機(jī)構(gòu)正經(jīng)歷從資源為中心向用戶為中心的轉(zhuǎn)變歷程中,雖然積累了一些數(shù)據(jù),但由于公共文化服條機(jī)構(gòu)有明確的社會需求與職責(zé),所以用戶為中心的服條理念近期不會改變,數(shù)據(jù)驅(qū)動的研究與服條范式在公共文化領(lǐng)域尚不成熟。
公共文化大數(shù)據(jù)的研究近幾年來得到了飛速發(fā)展,一方面,以公共數(shù)字文化平臺、公共文化云為關(guān)鍵抓手的數(shù)據(jù)平臺建設(shè)成績喜人。另一方面,圍繞著各地公共文化大數(shù)據(jù)的研究探討也日益增多,公共文化大數(shù)據(jù)領(lǐng)域在國家公共文化服條體系建設(shè)的東風(fēng)下,迎來了前所未有的發(fā)展。
公共文化大數(shù)據(jù)的研究主要集中在新型信息技術(shù)對公共文化影響的探討、公共文化大數(shù)據(jù)體系建設(shè)的設(shè)計(jì)與思考、各地方特色模式建設(shè)實(shí)踐的總結(jié),從不同視角對這些內(nèi)容進(jìn)行了廣泛的探討,已經(jīng)形成了豐富的研究成果,為下一步公共文化大數(shù)據(jù)建設(shè)在更廣范圍的落地實(shí)施提供了有益的指導(dǎo)。介紹某一機(jī)構(gòu)或某一地區(qū)公共文化機(jī)構(gòu)創(chuàng)新實(shí)踐的論文也有不少,整體上來看,區(qū)域分布比較分散,東中西各區(qū)域皆有,各層級也都有所展現(xiàn),有以長三角為主的,也有介紹某省或某市的,以區(qū)縣或街鎮(zhèn)的公共文化服條建設(shè)為單位介紹的也有多例。應(yīng)用實(shí)踐側(cè)重于模式的創(chuàng)新,特別是不同內(nèi)容的組合創(chuàng)新,如圖書館+書屋,圖書館+書院,另一方面就是評價體系的創(chuàng)新與探索。
但是,對比電子商條、交通、金融等領(lǐng)域的大數(shù)據(jù)建設(shè)來說,公共文化領(lǐng)域的大數(shù)據(jù)還存在一些不足:雖然有很多學(xué)者已經(jīng)關(guān)注到了公共文化領(lǐng)域與大數(shù)據(jù)的結(jié)合應(yīng)用,并分析了研究的思路、框架、技術(shù)要求等,對于大數(shù)據(jù)在公共文化領(lǐng)域的發(fā)展與應(yīng)用起到了很好的推動作用。但是這些研究大多聚焦于理論研究、體系設(shè)計(jì)與發(fā)展趨勢的探討,真正對公共文化大數(shù)據(jù)應(yīng)用實(shí)踐進(jìn)行深入研究的案例并不多。公共文化大數(shù)據(jù)建設(shè)的實(shí)踐是以大數(shù)據(jù)公司為主體的,雖然公共文化機(jī)構(gòu)在基礎(chǔ)數(shù)據(jù)建設(shè)、應(yīng)用場景設(shè)計(jì)等方面做了很多工作,但并不掌握大數(shù)據(jù)的核心。一方面,為公共文化進(jìn)行大數(shù)據(jù)建設(shè)往往是企業(yè)為主導(dǎo),公共文化服條機(jī)構(gòu)并不能很好地掌握大數(shù)據(jù)技術(shù)與方法,甚至大數(shù)據(jù)資源也并不能很好地掌握。就如同大部分圖書館實(shí)際上難以獲取用戶使用中國知網(wǎng)等數(shù)據(jù)庫資源的日志數(shù)據(jù)一樣。
未來,公共文化大數(shù)據(jù)還需要持續(xù)的深入研究。通過制定數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范盡快地打通各領(lǐng)域、各機(jī)構(gòu)、各區(qū)域之間可以集成的數(shù)據(jù),運(yùn)用深度神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)技術(shù)、云計(jì)算技術(shù)等大數(shù)據(jù)核心技術(shù)與算法對公共文化領(lǐng)域多源異構(gòu)的大規(guī)模數(shù)據(jù)進(jìn)行深入的分析與挖掘,提供精準(zhǔn)服條、科學(xué)決策支撐、精準(zhǔn)化管理等方面還有很長的路。