許天才 馮婷婷 楊新涯
摘?? 要:大數(shù)據(jù)分析和云計(jì)算技術(shù)的發(fā)展催生出的智能推薦雖然一定程度給讀者的閱讀帶來了便捷,但計(jì)算機(jī)信息處理的局限性會導(dǎo)致讀者獲取信息的范圍習(xí)慣性受自己短時期內(nèi)的興趣引導(dǎo),以至于獲取信息不斷收斂,就像蠶繭一般被困于“繭房”之中成為信息孤島。為破除信息繭房這一困境,文章采用逆向思維提出零數(shù)據(jù),以零數(shù)據(jù)和信息繭房文獻(xiàn)調(diào)研為基礎(chǔ),分析了零數(shù)據(jù)破除信息繭房的本質(zhì),從零數(shù)據(jù)的獲取、定性運(yùn)用、交叉領(lǐng)域共享運(yùn)用、創(chuàng)新推薦運(yùn)用等方面提出了運(yùn)用零數(shù)據(jù)破除信息繭房的策略。
關(guān)鍵詞:零數(shù)據(jù);信息繭房;推薦運(yùn)用;數(shù)據(jù)獲取
中圖分類號:G252?? 文獻(xiàn)標(biāo)識碼:A?? DOI:10.11968/tsyqb.1003-6938.2020057
Research on Breaking Information Cocoon with Zero Data
Abstract The development of big data analysis and cloud computing technology has led to intelligent recommendations that have brought convenience to readers to some extent. However, the limitations of computer information processing will cause readers to obtain information guided by their short-term interests habitually, so that they are trapped in the "cocoon room" and becomes an information isolated island. In order to solve the dilemma of information cocoon, the author uses reverse thinking to put forward zero data, and based on zero data and information cocoon literature research, the nature of information cocoon through zero data is analyzed and strategy is put forward to break the information cocoon by zero data acquisition, definition, cross sharing and innovation recommendation.
Key words Zero data; information cocoon; active recommendation; reading promotion
1?? 引言
1980年著名未來學(xué)家阿爾文·托夫勒首次提出大數(shù)據(jù)這一概念至今,國內(nèi)外學(xué)者從未間斷對其研究,自2008年《Nature》推出“big data”???,大數(shù)據(jù)技術(shù)更是融入各行各業(yè)成為最為熱門的創(chuàng)新研究。新聞傳媒、社交媒體、電子商務(wù)等行業(yè)運(yùn)用大數(shù)據(jù)挖掘技術(shù)根據(jù)用戶的行為數(shù)據(jù)如搜索、點(diǎn)贊、收藏等行為為用戶智能推薦相關(guān)信息,在用戶享受著精準(zhǔn)推薦和個性化需求得到極大滿足的同時,不少學(xué)者也開始質(zhì)疑算法推薦所帶來的弊端,如工具奴隸圈套、信息繭房圈套等。
大數(shù)據(jù)算法推薦使人們面臨算法獨(dú)裁的風(fēng)險(xiǎn)加大,剝奪自由選擇的權(quán)利[1]。大數(shù)據(jù)只注意到人們表現(xiàn)出來的行為,如在新聞客戶端上點(diǎn)擊過某條新聞,平臺會根據(jù)讀者看過的新聞進(jìn)行相關(guān)新聞資訊的推薦,即使讀者已經(jīng)不再關(guān)心該話題,平臺依然會反復(fù)推送相關(guān)類似新聞,從而減少讀者接觸其他新聞資訊的機(jī)會,無形中人們便進(jìn)入信息繭房這一困境。信息繭房現(xiàn)象不僅存在于新聞媒體,還廣泛存在于書籍、文獻(xiàn)閱讀中,如圖書館通過運(yùn)用數(shù)據(jù)挖掘分析并繪制讀者畫像以追求提供精準(zhǔn)服務(wù)。圖書館所采集使用的分析數(shù)據(jù)包括館藏流通數(shù)據(jù)、讀者活動軌跡數(shù)據(jù)、交互數(shù)據(jù)等[2],這些數(shù)據(jù)雖然都是基于讀者行為表現(xiàn)產(chǎn)生的,但是,事實(shí)上并不全面。圖書館獲得的信息片面,讀者接收到的信息重復(fù),從而構(gòu)成了雙向信息繭房的惡性循環(huán)。
信息繭房將人們禁錮在與外界信息隔絕的舒適圈里,將自己的內(nèi)心偏好、價值差異不斷放大,造成群體認(rèn)知差異越來越大,甚至?xí)纬缮鐣后w之間的巨大矛盾[3]。零數(shù)據(jù)作為逆向思維的全新概念,可以很好地彌補(bǔ)大數(shù)據(jù)下算法推薦的弊端,打破信息繭房。零數(shù)據(jù)關(guān)注人們行為表現(xiàn)之外的數(shù)據(jù),對分析用戶行為、圖書館營銷和閱讀推廣有重要價值[4]。零數(shù)據(jù)常被忽略,卻蘊(yùn)含著最能反映事實(shí)的重要價值,是打破信息繭房的重要途徑。
2?? 零數(shù)據(jù)與信息繭房的研究現(xiàn)狀
2.1??? 零數(shù)據(jù)
2008年Hugo Larochelle等[5]提出零數(shù)據(jù)學(xué)習(xí)在解決訓(xùn)練數(shù)據(jù)并未完全覆蓋的類集區(qū)分和宏大任務(wù)時具有很大作用。國內(nèi)學(xué)者王彥力等[4]于2019年提出零數(shù)據(jù)在智慧圖書館中的應(yīng)用,并將零數(shù)據(jù)界定為信息系統(tǒng)中應(yīng)該產(chǎn)生而沒有產(chǎn)生的數(shù)據(jù)、沒有達(dá)到設(shè)計(jì)要求的數(shù)據(jù)以及信息系統(tǒng)中從未被使用的數(shù)據(jù)。雖然在這之前國內(nèi)并沒有零數(shù)據(jù)這一概念,但仍然有不少文獻(xiàn)涉及到相關(guān)理論。如2006年畢艷娜[6]就提出了“零借閱率”這一現(xiàn)象,并探討了這一現(xiàn)象出現(xiàn)的原因及解決方法,此后諸多學(xué)者也先后就“零借閱率”這一現(xiàn)象的成因進(jìn)行了研究,還有學(xué)者針對具體實(shí)例利用對“零借閱率”分析研究館藏流通策略。如馬曉亭和陳臣[7]在大數(shù)據(jù)盛行的狀況下,從讀者角度出發(fā)提出“小數(shù)據(jù)”這一概念,定義為以人為中心,人的思想、行為、喜好等構(gòu)成小數(shù)據(jù)應(yīng)用于深度讀者畫像刻畫中,將雖然存在但長期被忽視的重要數(shù)據(jù)帶入大家的視野。本文作者也曾在研究閱讀推廣數(shù)據(jù)管理應(yīng)用時提出邊緣數(shù)據(jù)這一概念,邊緣數(shù)據(jù)具有間接獲取性、高價值性,但一直未引起重視[8]。不管是零借閱率還是小數(shù)據(jù)、邊緣數(shù)據(jù)都對圖書館館藏調(diào)整、閱讀推廣、科研服務(wù)等具有不可或缺的重要意義。
2.2??? 信息繭房
信息繭房最早是由西方學(xué)者桑坦斯在《信息烏托邦》一書中提出的,他指出“人們由于習(xí)慣性地將自己包裹在由興趣引導(dǎo)的信息領(lǐng)域, 從而像生活在‘繭房中, 這樣一種現(xiàn)象即稱之為‘信息繭房”[8]。這里對信息繭房的定義中傾向于是人們主動形成,但在這個大數(shù)據(jù)時代,智能算法飛速向前發(fā)展的狀態(tài)下,無論是什么行業(yè)都崇尚于為用戶提供智能化推薦,長此以往用戶就被動形成了信息孤島,被困于信息繭房之中。
當(dāng)前信息繭房研究主要圍繞兩個方面,一是聚合類新聞,以今日頭條[9]、騰訊新聞[10]、網(wǎng)易新聞[11]等新聞客戶端為例;二是社交媒體,以新浪微博[12]、抖音[13]等社交平臺為典型案例。不管是在新聞傳播還是在社交媒體,基于用戶行為數(shù)據(jù)的算法推薦,將用戶群體標(biāo)簽化,迎合用戶個人或群體興趣進(jìn)行個性化推送,但個性化推送的背后真相是長期讓用戶處于同質(zhì)化的信息中,將用戶囚禁于信息繭房之中。但信息繭房現(xiàn)象不僅只出現(xiàn)在新聞業(yè)和社交媒體,在移動閱讀方面也存在,微信閱讀以用戶主觀興趣為出發(fā)點(diǎn),基于用戶行為為用戶推送閱讀內(nèi)容[14]。圖書館也在跟隨大數(shù)據(jù)算法、精準(zhǔn)個性化推送浪潮的過程中不知不覺中讓讀者陷于信息繭房之中。
3?? 零數(shù)據(jù)與信息繭房
3.1??? 信息繭房的成因
數(shù)字時代下,每一次信息查找、閱讀和主觀反饋都會留下數(shù)據(jù)痕跡。在大數(shù)據(jù)分析和云計(jì)算技術(shù)的發(fā)展下,計(jì)算機(jī)智能推薦應(yīng)運(yùn)而生,雖然一定程度給人們的閱讀帶來了便捷,但計(jì)算機(jī)信息處理的局限性會導(dǎo)致人們獲取信息的范圍習(xí)慣性受自己短時期內(nèi)的興趣引導(dǎo),以至于獲取信息不斷收斂,就像蠶繭一般被困于“繭房”之中成為信息孤島。
究其原因,主要有以下幾個方面:(1)計(jì)算機(jī)用于分析用戶行為的數(shù)據(jù)不夠全面。主要集中在采集用戶信息獲取過程中行為數(shù)據(jù)的時間跨度不足,涉及信息的領(lǐng)域比較單一,主要以用戶短時間內(nèi)的興趣為主,信息種類不夠豐富,很難做到文字、圖片、音頻、視頻等全媒體的推薦;(2)由于個人隱私保護(hù),計(jì)算機(jī)對于用戶自身特質(zhì)屬性的信息收集不夠全面。如年齡、性別、居住他、職業(yè)、文化背景、社交圈等相關(guān)資料缺失,使得計(jì)算機(jī)無法做到對于具有相同屬性用戶的信息獲取進(jìn)行綜合分析實(shí)現(xiàn)交叉推薦;(3)信息爆炸的當(dāng)下用戶本身獲取信息的目標(biāo)不清晰。面對呈指數(shù)倍激增的海量信息,用戶往往容易迷失自我,對于信息的獲取目的性越來越容易模糊,噪音信息的干擾更是加劇了這一趨勢,導(dǎo)致人們的信息獲取傾向跟隨計(jì)算機(jī)推薦越走越窄;(4)計(jì)算機(jī)無法預(yù)測和滿足人們對未知信息的求知欲望。人們自身的求知欲和獵奇心理會激發(fā)人對新信息的渴望。而計(jì)算機(jī)做出的智能推薦卻始終是基于人們在之前信息獲取所產(chǎn)生數(shù)據(jù)的基礎(chǔ)之上,如果基礎(chǔ)數(shù)據(jù)得不到補(bǔ)充和豐富,獲取全新信息的可能性就會越來越小。
因此,現(xiàn)階段基于計(jì)算機(jī)智能推薦的信息獲取形式,一定程度上提高了人們的信息獲取能力,但卻也悄無聲息的將人們一步步封閉進(jìn)了由相同屬性信息編織成的蠶繭之中。
3.2??? 零數(shù)據(jù)的成因
首先,信息系統(tǒng)的運(yùn)行和原定計(jì)劃通常是有出入的,如圖書館運(yùn)行管理系統(tǒng)中的門禁和座位預(yù)約應(yīng)用,實(shí)際情況卻是門禁系統(tǒng)只記錄了讀者的到館情況,而沒有使用過該系統(tǒng)的讀者數(shù)據(jù),這種未達(dá)到系統(tǒng)設(shè)計(jì)要求從而使得本該產(chǎn)生的數(shù)據(jù)沒有產(chǎn)生;其次,在進(jìn)行數(shù)據(jù)挖掘時,一些被系統(tǒng)或人為清洗、淘汰的異常數(shù)據(jù),這些異常數(shù)據(jù)通常偏差較大、數(shù)據(jù)量小。但存在異常的數(shù)據(jù)總會反映一定的問題,找尋異常數(shù)據(jù)背后的原因,可能會發(fā)現(xiàn)系統(tǒng)運(yùn)行異常、數(shù)據(jù)采集異常或存在特殊用戶群體,因此這部分?jǐn)?shù)據(jù)也不可忽視,一樣是構(gòu)成零數(shù)據(jù)的重要組成;最后,存在卻被忽視、零利用率的數(shù)據(jù)集合。以圖書館領(lǐng)域常見的二八定律為例,80%的文獻(xiàn)流通量來自于20%的館藏資源,剩余80%的館藏未被利用,也就談不上大數(shù)據(jù)利用分析,那么這部分館藏資源所對應(yīng)的館藏總量、增減量、副本數(shù)等數(shù)據(jù)則為零數(shù)據(jù)。再以圖書館到館情況為例,圖書館可以輕松對每日到館人數(shù)、學(xué)院分布、性別比例等數(shù)據(jù)進(jìn)行挖掘分析,而與之對應(yīng)的那些沒有到館的讀者群體也十分龐大,對這部分的讀者情況進(jìn)行收集整合,則構(gòu)成相應(yīng)零數(shù)據(jù)。
3.3??? 零數(shù)據(jù)的特征
零數(shù)據(jù)需要人為進(jìn)行回溯或找回,其形成的規(guī)模并不大,但卻分布分散,不易一次性導(dǎo)出,需要系統(tǒng)或人為找尋。相對大數(shù)據(jù)而言,零數(shù)據(jù)通常表現(xiàn)為數(shù)據(jù)量為零或數(shù)據(jù)量極小,以至類型單一,規(guī)模較小。但零數(shù)據(jù)蘊(yùn)含的價值不亞于大數(shù)據(jù),對檢驗(yàn)信息系統(tǒng)的合理性、反映運(yùn)行管理的效率、人物畫像的全面刻畫等都有重要價值。零數(shù)據(jù)并不會出現(xiàn)頻繁變化,一旦產(chǎn)生并存在,將十分穩(wěn)定。現(xiàn)階段,零數(shù)據(jù)作為一種反向思維的產(chǎn)物,會被人們習(xí)慣性忽視,導(dǎo)致其利用率幾乎為零。因此,零數(shù)據(jù)具備間接獲取性、數(shù)據(jù)量小、類型單一、價值密度高、穩(wěn)定性高和利用率低等特征。零數(shù)據(jù)對分析個人行為、企業(yè)管理、行業(yè)發(fā)展都有不可替代的重要意義。
綜上所述,零數(shù)據(jù)是系統(tǒng)中忽視和沒有達(dá)到設(shè)計(jì)要求,或存在但未被利用的數(shù)據(jù)集合,具有數(shù)據(jù)獲取間接、類型單一、價值密度高、穩(wěn)定性強(qiáng)的特征(具體屬性見圖1)。
3.4??? 零數(shù)據(jù)破除信息繭房的本質(zhì)
大數(shù)據(jù)技術(shù)或許很“聰明”,為人們推薦他們“想要”關(guān)注的信息,但信息雪球越滾越大,將人們囚禁在“猜你喜歡”的信息繭房之中,日漸形成信息孤島,難以接觸吸收孤島外的信息。而零數(shù)據(jù)正是打破信息繭房的關(guān)鍵途徑,大數(shù)據(jù)根據(jù)人們大量歷史行為數(shù)據(jù)智能關(guān)聯(lián)推薦,而那些本應(yīng)該產(chǎn)生卻沒有產(chǎn)生、產(chǎn)生了卻被忽視的數(shù)據(jù)正是將信息孤島與外界相通的橋梁。一方面,零數(shù)據(jù)的成因與特征使它正好與導(dǎo)致信息繭房所基于的數(shù)據(jù)存在本質(zhì)區(qū)別,它可以作為現(xiàn)有計(jì)算機(jī)智能推薦過程中所運(yùn)用基礎(chǔ)數(shù)據(jù)的重要補(bǔ)充,在豐富基礎(chǔ)數(shù)據(jù)樣本的同時,突破不斷收斂的計(jì)算機(jī)信息推薦范圍,將全新的、未知的信息推薦給用戶,拓展用戶日常獲取信息的范圍;另一方面,在人們信息獲取目標(biāo)不清晰的前提下,零數(shù)據(jù)作為一種沒有任何使用記錄的數(shù)據(jù),在滿足人們對未知信息的求知欲望時具有獨(dú)一無二的優(yōu)勢。所以針對用戶沒有任何使用記錄的零數(shù)據(jù)當(dāng)仁不讓的會成為用戶突破固有信息壁壘,獲取全新信息,滿足無限求知欲的最佳幫手。
4?? 運(yùn)用零數(shù)據(jù)破除信息繭房的策略
4.1??? 零數(shù)據(jù)的獲取
(1)系統(tǒng)忽視或未達(dá)到設(shè)計(jì)要求的零數(shù)據(jù)。針對系統(tǒng)忽視或未達(dá)到系統(tǒng)設(shè)計(jì)要求的零數(shù)據(jù),應(yīng)先從系統(tǒng)設(shè)計(jì)環(huán)節(jié)入手,增加零數(shù)據(jù)的采集端口,直接從系統(tǒng)中導(dǎo)出數(shù)據(jù)量為零或極少的數(shù)據(jù),再與信息系統(tǒng)設(shè)計(jì)計(jì)劃相對比,找出原本應(yīng)該產(chǎn)生卻被忽視沒有產(chǎn)生的數(shù)據(jù),以此生成數(shù)據(jù)集合。
(2)異常數(shù)據(jù)構(gòu)成的零數(shù)據(jù)。針對異常數(shù)據(jù)所構(gòu)成的零數(shù)據(jù),則需要圖書館逆向找回在數(shù)據(jù)處理時被清洗或淘汰的數(shù)據(jù)。在對大數(shù)據(jù)挖掘分析的數(shù)據(jù)處理環(huán)節(jié)中每一步所刪除淘汰的數(shù)據(jù)進(jìn)行單獨(dú)保存,從而獲取這部分零數(shù)據(jù)。
(3)存在但未被利用的零數(shù)據(jù)。針對存在但利用率為零的數(shù)據(jù),這部分零數(shù)據(jù)在系統(tǒng)中本身是存在的,但由于長期未被利用,因此分布較為分散也不易引起注意,需要圖書館制定計(jì)劃重新統(tǒng)一調(diào)取管理。
4.2??? 零數(shù)據(jù)的定性運(yùn)用
運(yùn)用零數(shù)據(jù)來破除信息繭房,需要認(rèn)清信息繭房的形成過程,讀者在進(jìn)行閱讀、借閱、訪問、下載等行為時,圖書館系統(tǒng)記錄下讀者的行為大數(shù)據(jù),通過挖掘分析向讀者推薦圖書館資源,讀者在接受推薦后再次進(jìn)行閱讀等行為,圖書館又再次根據(jù)讀者行為進(jìn)行推薦,形成一個構(gòu)成信息繭房的閉環(huán)。但除了讀者表現(xiàn)出來的行為大數(shù)據(jù)之外還存在讀者行為零數(shù)據(jù),圖書館運(yùn)行、管理過程中本該產(chǎn)生卻未能產(chǎn)生、存在卻從未利用過的零數(shù)據(jù),運(yùn)用這些零數(shù)據(jù)可有效打破信息繭房(具體運(yùn)用思路見圖2)。
對讀者來說,零數(shù)據(jù)是相對的,如零閱讀、零訪問、零使用等,假如一篇文獻(xiàn),甲讀者沒有閱讀過,乙讀者閱讀過,那這篇文獻(xiàn)相對甲讀者就是零數(shù)據(jù),若甲、乙讀者的學(xué)科背景相同或?qū)傩杂兴徊嫦嗨浦帲@篇文獻(xiàn)對甲讀者來說是有價值的。圖書館對相對零數(shù)據(jù)進(jìn)行深入挖掘分析,補(bǔ)充以往大數(shù)據(jù)分析的工作內(nèi)容,不再局限于讀者行為表現(xiàn)下的大數(shù)據(jù),從不同角度進(jìn)行更為全面的閱讀推廣,豐富讀者閱讀領(lǐng)域,拓寬閱讀推廣所覆蓋的讀者面積,將讀者從信息繭房中解救出來。
對圖書館來說,零數(shù)據(jù)是絕對的,如零借閱、零注冊和零利用等,如圖書館所購買書籍的借閱次數(shù)為零;購買的數(shù)據(jù)庫訪問次數(shù)為零;開發(fā)的系統(tǒng)注冊人數(shù)為零。圖書館不僅可以通過絕對零數(shù)據(jù)檢驗(yàn)資源建設(shè)、系統(tǒng)設(shè)計(jì)的合理性,還可以根據(jù)絕對零數(shù)據(jù)主動營銷圖書館資源,作為試探性推薦彌補(bǔ)智能推薦的局限性,提供給讀者接觸現(xiàn)有興趣外信息資源的公平機(jī)會,從而打破信息繭房。
4.3??? 交叉領(lǐng)域下零數(shù)據(jù)的共享運(yùn)用
在21世紀(jì)已經(jīng)頒發(fā)過的19次諾貝爾化學(xué)獎中,除了2016年頒發(fā)給了純化學(xué)領(lǐng)域外,基本都與生物學(xué)相關(guān),而從諾貝爾化學(xué)獎的歷史長河來看,諾貝爾化學(xué)獎不僅與生物學(xué)相關(guān),還與物理學(xué)、醫(yī)學(xué)等領(lǐng)域具有千絲萬縷的聯(lián)系。由此不難看出當(dāng)今世界科學(xué)前沿的重大突破和重大原創(chuàng)性成果的產(chǎn)生大多是學(xué)科交叉融合的成果。利用文獻(xiàn)情報(bào)方面的零數(shù)據(jù)可以很好地促進(jìn)學(xué)科交叉融合,也可以更好地提高文獻(xiàn)資源的利用價值。雖然當(dāng)前重慶[15]、沈陽[16]、廣西[17]等部分地方高校實(shí)行了低利用率文獻(xiàn)聯(lián)合存儲機(jī)制,重點(diǎn)卻在“藏”而不是“用”,但這為零數(shù)據(jù)共享創(chuàng)造了可行環(huán)境。2018年正式成立的“一帶一路”圖書館聯(lián)盟共有中國、阿爾巴尼亞、捷克、匈牙利等中東歐16國圖書館參與書目數(shù)據(jù)共享、文獻(xiàn)交流互換等方面的多地資源和數(shù)據(jù)的協(xié)作共享[18],地區(qū)間、國際間圖書館聯(lián)盟的建設(shè)也為零數(shù)據(jù)共享提供了聯(lián)合獲取的技術(shù)基礎(chǔ)。各高校圖書館間零數(shù)據(jù)共享不僅可以豐富高校文獻(xiàn)資源,更能夠促進(jìn)高校學(xué)科交流,從而促進(jìn)學(xué)科的交叉融合。除了高校間的零數(shù)據(jù)共享,高校內(nèi)學(xué)科零數(shù)據(jù)的交流共享同樣重要,各學(xué)院各學(xué)科建設(shè)不應(yīng)只局限于本學(xué)院學(xué)科的資源建設(shè)和推廣,著眼于相對零數(shù)據(jù)將資源推薦給具有交叉學(xué)科背景的讀者,破除讀者專業(yè)壁壘,破除學(xué)科信息繭房,促進(jìn)學(xué)科交叉融合。
4.4??? 零數(shù)據(jù)的創(chuàng)新推薦運(yùn)用
打破信息繭房,需要關(guān)注繭房以外的信息,這些信息正是由大數(shù)據(jù)之外的數(shù)據(jù)也就是“零數(shù)據(jù)”所形成。圖書館無一例外是對讀者大數(shù)據(jù)進(jìn)行挖掘分析從而對讀者進(jìn)行資源推薦,這一做法針對的是有過借閱行為的讀者和被借閱過的館藏,而忽略了其余那些從未或很少借書的讀者以及那些借閱量極低甚至為零的館藏。
圖書館通過零借閱圖書的分析發(fā)現(xiàn)零借閱圖書的形成原因有很多,如圖書專業(yè)性太強(qiáng)、版本過于老舊、宣傳不到位和實(shí)用價值低等。圖書館不但可以根據(jù)這些絕對零數(shù)據(jù)調(diào)整館藏結(jié)構(gòu)和資源建設(shè)計(jì)劃,還可以利用這一絕對零數(shù)據(jù)進(jìn)行反向推薦,拓寬讀者接收信息源,作為破除信息繭房的重要途徑之一。瑞士報(bào)紙 Neue Zürcher Zeitung和谷歌瀏覽器就在大數(shù)據(jù)智能推薦之外,專門推薦讀者興趣之外的內(nèi)容,以反向推薦戳破“過濾氣泡”[19],圖書館可以借鑒以上做法,在每次智能推薦中加入10%的零借閱圖書推薦作為補(bǔ)充,向讀者推薦有價值、易接受的閱讀內(nèi)容,試探性挖掘讀者閱讀潛力,達(dá)到幫助讀者打破信息繭房的目的。重慶大學(xué)微信圖書館中的“學(xué)術(shù)頭條”功能(見圖3)就會在近期熱點(diǎn)信息推薦的同時,還會根據(jù)詞頻、借閱瀏覽等數(shù)據(jù)凝練“信息冷點(diǎn)”,將鮮為人關(guān)注的信息作為推薦,供讀者閱讀,以此豐富讀者的信息獲取量,激發(fā)讀者的求知欲,破除同質(zhì)化推薦造就的信息繭房。
重慶大學(xué)智慧圖書館門戶“猜你喜歡”功能模塊(見圖3),會根據(jù)讀者的借閱和瀏覽記錄進(jìn)行數(shù)據(jù)分析,將關(guān)聯(lián)館藏資源主動推薦給讀者,實(shí)現(xiàn)“猜你喜歡”功能模塊基礎(chǔ)數(shù)據(jù)。此外,為破除信息繭房,在每次推薦的數(shù)據(jù)中系統(tǒng)還會按一定比例加入借閱和瀏覽為零的館藏資源,作為嘗試性推薦供讀者參考使用。圖書館還會定期通過相對借閱與瀏覽量低和高的讀者閱讀情況的對比分析,將針對不同讀者的相對零數(shù)據(jù)館藏資源,結(jié)合讀者性別、年齡、地域、教育背景、專業(yè)方向等身份屬性數(shù)據(jù)向讀者進(jìn)行智能推薦,以拓寬讀者閱讀領(lǐng)域,從而打破信息繭房的高墻。
圖書館除了利用絕對零數(shù)據(jù)和相對零數(shù)據(jù)館藏資源的挖掘分析進(jìn)行多向推薦來幫助讀者破除信息繭房之外,還可以對圖書館零數(shù)據(jù)的館藏資源進(jìn)行可視化分析統(tǒng)計(jì)進(jìn)行展示,并直接推送給讀者,讓讀者了解自己的閱讀范圍和閱讀傾向是否趨于同質(zhì)化,自己是否身處于信息繭房之中,只有引發(fā)讀者的警覺性和培養(yǎng)讀者的自主意識,才能在外界幫助下更好的打破信息繭房。
5?? 結(jié)語
2020年初面對突如其來的一場疫情,“宅”文化應(yīng)勢而行,在家中通過互聯(lián)網(wǎng)閱讀學(xué)習(xí)工作成為人們生活主題,各大新聞、短視頻、文學(xué)閱讀等APP針對用戶短期瀏覽痕跡進(jìn)行的后臺分析和主動推薦一定程度為用戶的使用帶來了便捷,但隨著時間的推移機(jī)械單一化的信息包圍讓讀者被困其中。大數(shù)據(jù)技術(shù)下的算法推薦固然可以短時抓住人們的“胃口”,但與之形成的信息繭房不能視而不見,作為重要信息傳播中心的圖書館更應(yīng)該主動尋求方法破除信息繭房。零數(shù)據(jù)往往反映了大數(shù)據(jù)所看不見的問題,蘊(yùn)藏著巨大的潛在價值,更是破除信息繭房的利器。只有靈活運(yùn)用零數(shù)據(jù),制定合理策略,才能有效破除信息繭房。
參考文獻(xiàn):
[1]? 張森.大數(shù)據(jù)技術(shù)的社會風(fēng)險(xiǎn)及其對策[J].佛山科學(xué)技術(shù)學(xué)院學(xué)報(bào)(社會科學(xué)版),2019,37(5):75-80.
[2]? 曹樹金,劉慧云,王連喜.大數(shù)據(jù)驅(qū)動的圖書館精準(zhǔn)服務(wù)研究[J].大學(xué)圖書館學(xué)報(bào),2019,37(4):54-60.
[3]? 申楠.算法時代的信息繭房與信息公平[J/OL].[2020-02-15].http://kns.cnki.net/kcms/detail/61.1329.c.20200213.0804.002.
html.
[4]? 王彥力,楊新涯,冉蔚然.零數(shù)據(jù)理論及其應(yīng)用模式研究[J].大學(xué)圖書館學(xué)報(bào),2019,37(6):51-56.
[5]? Larochelle H,Erhan D,Bengio Y.Zero-data Learning of New Tasks[C].Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence,AAAI 2008,Chicago,Illinois,USA,July 13-17,2008.DBLP,2008.
[6]? 畢艷娜.小議零借閱率現(xiàn)象[J].圖書館工作與研究,2006(2):37-38.
[7]? 馬曉亭,陳臣.基于可信小數(shù)據(jù)的圖書館個性化服務(wù)研究[J].圖書情報(bào)工作,2015,59(4):70-75.
[8]? 許天才,馮婷婷,潘雨亭,等.高校圖書館閱讀推廣核心數(shù)據(jù)及邊緣數(shù)據(jù)的管理與應(yīng)用[J].大學(xué)圖書館學(xué)報(bào),2020(1):78-85.
[9]? 孫亮.信息時代下的“認(rèn)知繭房”[J].思想政治工作研究,2010(4):52.
[10]? 姚文康.聚合類新聞客戶端的“信息繭房”效應(yīng)及反思——以“今日頭條”為例[J].傳媒論壇,2020,3(3):151,153.
[11]? 陳華珊,王呈偉.繭房效應(yīng)與新聞消費(fèi)行為模式——以騰訊新聞客戶端用戶評論數(shù)據(jù)為例[J].社會科學(xué),2019(11):73-87.
[12]? 孫琳.手機(jī)新聞客戶端信息“私人定制”的利弊分析——以網(wǎng)易新聞客戶端為例[J].現(xiàn)代視聽,2014(2):70-72.
[13]? 薛子凡.社交媒體個性化推薦機(jī)制下“信息繭房”效應(yīng)研究——以新浪微博為例[J].中北大學(xué)學(xué)報(bào)(社會科學(xué)版),2019,35(4):94-96.
[14]? 馮子亞.抖音APP的“信息繭房”效應(yīng)研究[J].視聽,2019(12):173-174.
[15]? 黃鈴,宣建婷.移動閱讀的社交特色及改進(jìn)策略——以“微信讀書”為例[J].中國報(bào)業(yè),2019(16):10-11.
[16]? 彭亞飛.重慶地區(qū)高校圖書館低利用率文獻(xiàn)共享策略研究——以聯(lián)合存儲的實(shí)踐及改進(jìn)為基點(diǎn)[J].圖書情報(bào)導(dǎo)刊,2018,3(12):1-5.
[17]? 王秀紅,王麗雅,王麗娜.沈陽市低利用率文獻(xiàn)合作存儲體系研究[J].圖書館學(xué)刊,2019,41(4):62-66.
[18]? 王鳳翠.廣西高校圖書館低利用率文獻(xiàn)合作儲存運(yùn)行機(jī)制研究[J].圖書館界,2018(3):44-47,54.
[19]? 吳綺云.“一帶一路”圖書館聯(lián)盟信息資源建設(shè)與服務(wù)提升研究[J].圖書館工作與研究,2019(12):17-21.
作者簡介:許天才,男,重慶大學(xué)圖書館副研究館員;馮婷婷,女,重慶大學(xué)經(jīng)濟(jì)與工商學(xué)院碩士研究生;楊新涯,男,重慶大學(xué)人文社會科學(xué)高等研究院、重慶大學(xué)圖書館研究館員。
本文系國家社會科學(xué)基金項(xiàng)目“智慧圖書館的零數(shù)據(jù)模型及應(yīng)用研究”(項(xiàng)目編號: 19BTQ011)與ISTIC-CLARIVATE ANALYTICS科學(xué)計(jì)量學(xué)聯(lián)合實(shí)驗(yàn)室開放基金(項(xiàng)目編號: IC2019004)研究成果之一。
收稿日期:2020-04-21;責(zé)任編輯:柴若熔;通訊作者:許天才(xtc@cqu.edu.cn)