陸 康(南京曉莊學(xué)院圖書館)
2003年,芬蘭學(xué)者Aittola在“智慧圖書館:基于位置感知的移動(dòng)圖書館服務(wù)”一文中首次提出“SmartLibrary”,[1]隨后引起了學(xué)者的廣泛關(guān)注。國(guó)內(nèi)智慧圖書館的相關(guān)研究始于2010年。
近年來(lái),數(shù)據(jù)安全問(wèn)題形勢(shì)不容樂(lè)觀,用戶數(shù)據(jù)泄露事件頻發(fā)。根據(jù)調(diào)查數(shù)據(jù)顯示,全球58%的企業(yè)在2017年至少遭遇過(guò)一場(chǎng)數(shù)據(jù)泄露事件,其中50%至少遭遇了一次內(nèi)部人員泄露事件,而因?yàn)楹献骰锇榛虻谌降脑虮恍孤缎畔⒌某^(guò)1/3。[1]在涉及個(gè)人信息和隱私保護(hù)方面,各國(guó)通常都會(huì)通過(guò)制定法律、法規(guī)及相關(guān)政策約束網(wǎng)絡(luò)服務(wù)提供商收集個(gè)人信息的內(nèi)容和途徑,控制被收集信息的使用方法,掌握被收集信息的使用情況,并據(jù)此對(duì)個(gè)人隱私進(jìn)行保護(hù)。而為了解決在數(shù)據(jù)價(jià)值利用與信息利用過(guò)程中不侵犯用戶隱私這一難題,學(xué)者們一直致力于建立基于社會(huì)隱私政策與技術(shù)方法相結(jié)合的保護(hù)機(jī)制,以求達(dá)到數(shù)據(jù)發(fā)掘與用戶隱私保護(hù)的平衡。智慧服務(wù)需要感知讀者需求,獲取讀者使用圖書館的相關(guān)數(shù)據(jù),挖掘并分析數(shù)據(jù)中有關(guān)的資源、空間、服務(wù)需求,為圖書館智慧服務(wù)提供數(shù)據(jù)決策,以期達(dá)到服務(wù)的精準(zhǔn)性。通過(guò)歸納、分析研究文獻(xiàn),發(fā)現(xiàn)與讀者隱私保護(hù)相關(guān)的社會(huì)方法研究主要為:隱私政策相關(guān)的實(shí)證研究、隱私政策實(shí)踐應(yīng)用研究、隱私政策內(nèi)容表述與協(xié)商研究等三個(gè)方向。[2]技術(shù)方法研究主要為:密文計(jì)算、密文訪問(wèn)控制和密文數(shù)據(jù)聚合。[3]數(shù)字圖書館發(fā)展至今,數(shù)據(jù)使用、數(shù)據(jù)安全與數(shù)據(jù)發(fā)布成為圖書館為讀者權(quán)益保護(hù)和服務(wù)質(zhì)量保證的重要因素。圖書館獲取讀者使用圖書館的行為數(shù)據(jù),依據(jù)該數(shù)據(jù)能夠動(dòng)態(tài)感知讀者的需求。行為數(shù)據(jù)涉及到讀者的數(shù)字圖書館使用習(xí)慣、地點(diǎn)、時(shí)間以及研究領(lǐng)域等信息,圖書館針對(duì)其進(jìn)行多維度的數(shù)據(jù)挖掘及分析可能侵犯到讀者隱私。隱私保護(hù)研究依托信息安全與大數(shù)據(jù),而大數(shù)據(jù)是支撐智慧服務(wù)實(shí)施的前提,因此,讀者隱私保護(hù)是圖書館智慧服務(wù)研究與實(shí)施的重要環(huán)節(jié)之一。本研究對(duì)“互聯(lián)網(wǎng)+”環(huán)境下的高校圖書館智慧服務(wù)的數(shù)據(jù)價(jià)值發(fā)掘以及讀者隱私保護(hù)進(jìn)行了綜合性的梳理、分析與研究,探索兩者之間的平衡點(diǎn),構(gòu)建平衡模型,供圖書館界探討與完善以解決兩者之間存在的現(xiàn)實(shí)問(wèn)題,探索數(shù)據(jù)應(yīng)用與隱私保護(hù)問(wèn)題的解決策略。
大數(shù)據(jù)應(yīng)用實(shí)踐的關(guān)鍵在于其業(yè)務(wù)價(jià)值的體現(xiàn)。數(shù)據(jù)價(jià)值與業(yè)務(wù)需求息息相關(guān),不同的業(yè)務(wù)需要不同維度的數(shù)據(jù)價(jià)值,所需結(jié)果也不盡相同。數(shù)據(jù)價(jià)值的發(fā)掘,不僅可以在海量數(shù)據(jù)中獲取有業(yè)務(wù)價(jià)值的信息,還可以降低數(shù)據(jù)密度,提升數(shù)據(jù)的應(yīng)用性。大數(shù)據(jù)區(qū)別于傳統(tǒng)的統(tǒng)計(jì)學(xué)數(shù)據(jù)處理方法,主要是數(shù)據(jù)挖掘的限定規(guī)則較為寬松。智慧圖書館建設(shè)在以挖掘業(yè)務(wù)數(shù)據(jù)價(jià)值為基礎(chǔ)的前提下,存在著以下問(wèn)題:①隨著數(shù)據(jù)量激增,多維度的進(jìn)行數(shù)據(jù)采集、存儲(chǔ)在一定程度上降低了數(shù)據(jù)價(jià)值的密度;② 雖然多元化的互聯(lián)網(wǎng)業(yè)務(wù)平臺(tái)可以為讀者提供個(gè)性化的服務(wù)與資源獲取的便捷渠道,但是多渠道服務(wù)的模式使得數(shù)據(jù)不斷增長(zhǎng)與沉積,導(dǎo)致了數(shù)據(jù)的復(fù)雜性與多樣性,數(shù)據(jù)的價(jià)值密度底、價(jià)值提取難度增大;③ 數(shù)據(jù)已經(jīng)成為業(yè)務(wù)決策的新的要素,有效的數(shù)據(jù)提取、數(shù)據(jù)應(yīng)用價(jià)值的提煉是直接影響圖書館業(yè)務(wù)決策、智慧服務(wù)效果的因素之一。多維度的數(shù)據(jù)關(guān)聯(lián)與挖掘,涉及到讀者信息安全與隱私的問(wèn)題也越來(lái)越突出。數(shù)據(jù)價(jià)值越高,支持智慧服務(wù)實(shí)施的效果越好,數(shù)據(jù)安全風(fēng)險(xiǎn)越高,隱私泄露幾率越大。
智慧服務(wù)依托業(yè)務(wù)系統(tǒng)的數(shù)據(jù)支持,構(gòu)建一套感知化的服務(wù)體系,能夠挖掘用戶需求,從而進(jìn)行多元化、個(gè)性化服務(wù)。數(shù)據(jù)安全性與穩(wěn)定性往往直接或間接影響著智慧服務(wù)的結(jié)果?;ヂ?lián)網(wǎng)的高速發(fā)展不斷產(chǎn)生各種類型的數(shù)據(jù),如,結(jié)構(gòu)化、非結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù),他們相互作用,融合在各種業(yè)務(wù)系統(tǒng)中,保障業(yè)務(wù)的正常運(yùn)行(見(jiàn)圖1)。據(jù)不完全統(tǒng)計(jì),國(guó)外平均每秒就有大約200萬(wàn)人使用Google搜索,F(xiàn)acebook的用戶每天共享的信息超過(guò)40億條,[4]國(guó)內(nèi)的微信、微博也擁有相似量級(jí)的數(shù)據(jù)信息,這些數(shù)據(jù)被商業(yè)機(jī)構(gòu)運(yùn)用于科學(xué)計(jì)算、醫(yī)療衛(wèi)生、金融與零售等各種行業(yè),并取得了一定的效果。持續(xù)的數(shù)據(jù)利用以及對(duì)數(shù)據(jù)的挖掘,不僅可以發(fā)現(xiàn)其顯性價(jià)值,也可以發(fā)掘其隱性價(jià)值,大數(shù)據(jù)逐漸成為繼云計(jì)算后計(jì)算機(jī)信息科學(xué)領(lǐng)域一個(gè)新的增長(zhǎng)點(diǎn)。人們?cè)谙硎芑ヂ?lián)網(wǎng)各種服務(wù)的過(guò)程中,往往愿意犧牲部分隱私而獲取便捷的服務(wù)。在信息社會(huì)環(huán)境下,用“魚(yú)和熊掌不可兼得”來(lái)形容智慧服務(wù)與隱私保護(hù)兩者之間的關(guān)系也不為過(guò),“隱私”的定義也隨著社會(huì)發(fā)展而發(fā)生改變。
圖1 基于數(shù)據(jù)價(jià)值的智慧服務(wù)體系
大數(shù)據(jù)量已經(jīng)超出人工處理的能力范圍,根據(jù)業(yè)務(wù)需求的數(shù)據(jù)價(jià)值提煉,是實(shí)現(xiàn)精準(zhǔn)服務(wù)的重要環(huán)節(jié),數(shù)據(jù)價(jià)值提取的精度越高,智慧服務(wù)的效果越好,效率越高。科學(xué)數(shù)據(jù)具有周期性,數(shù)據(jù)價(jià)值也有周期性。動(dòng)態(tài)的、實(shí)時(shí)的數(shù)據(jù)價(jià)值的提取,能使智慧服務(wù)在短時(shí)間內(nèi)及時(shí)、精準(zhǔn)地提高讀者的滿意度與忠誠(chéng)度,以智慧服務(wù)為主體的業(yè)務(wù)平臺(tái),讀者粘度是否得到提升,是平臺(tái)建設(shè)成功與否的關(guān)鍵。
李克強(qiáng)總理說(shuō)過(guò),“數(shù)據(jù)是基礎(chǔ)性資源,也是重要的生產(chǎn)力”。[5]而馬云也總結(jié)了數(shù)據(jù)技術(shù)給互聯(lián)網(wǎng)所帶來(lái)的變革,他認(rèn)為,“我們正迎來(lái)一個(gè)從IT到DT變革的新時(shí)代,IT時(shí)代把人變成了機(jī)器,而DT時(shí)代把機(jī)器變成了智能化的人”。[6]大數(shù)據(jù)的價(jià)值體現(xiàn)在宏觀層次的全面性、微觀層次的精確性,大數(shù)據(jù)價(jià)值具備準(zhǔn)確性、及時(shí)性與個(gè)性化的特征。高校圖書館的智慧服務(wù),需要發(fā)掘讀者相關(guān)數(shù)據(jù)的價(jià)值,以此反饋學(xué)科服務(wù),提升其準(zhǔn)確性、及時(shí)性。在方法上,可以借助于信息檢索、資源服務(wù)、決策支持、數(shù)據(jù)挖掘、創(chuàng)新驅(qū)動(dòng)等解決實(shí)際問(wèn)題。數(shù)據(jù)是智慧服務(wù)的基礎(chǔ),數(shù)據(jù)的安全性與穩(wěn)定性,直接影響到智慧服務(wù)的效果。《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》中將數(shù)據(jù)作為國(guó)家基礎(chǔ)性戰(zhàn)略資源,認(rèn)為“數(shù)據(jù)”是21世紀(jì)的“鉆石礦”。[7]因此,真實(shí)、可靠、穩(wěn)定的數(shù)據(jù),可以用以作為宏觀決策的依據(jù),并能夠真實(shí)反映業(yè)務(wù)動(dòng)態(tài)、社會(huì)現(xiàn)象等微觀層面難以描述的現(xiàn)象。由此數(shù)據(jù)安全性與穩(wěn)定性就顯得尤為重要,對(duì)于用戶而言,數(shù)據(jù)安全與隱私問(wèn)題關(guān)注度較高。
數(shù)據(jù)挖掘是為了獲取用戶信息行為中隱藏的需求,圖書館等機(jī)構(gòu)據(jù)此可以開(kāi)展個(gè)性化服務(wù)以及制定對(duì)應(yīng)的管理決策。如,圖書館常用的數(shù)據(jù)統(tǒng)計(jì)方法聯(lián)機(jī)分析處理(On-LineAnalyticalProcess,OLAP),其最大的特征就是設(shè)定需要監(jiān)測(cè)的數(shù)據(jù)維度,以達(dá)到動(dòng)態(tài)獲取分析結(jié)果的目的,其特點(diǎn)是基于數(shù)據(jù)庫(kù)層的在線分析處理程序。OLAP與數(shù)據(jù)挖掘在適用性方面存在著差異,主要區(qū)別在于數(shù)據(jù)挖掘過(guò)程中產(chǎn)生假設(shè),而OLAP用于對(duì)這些假設(shè)進(jìn)行驗(yàn)證(見(jiàn)圖2)。
圖2 OLAP系統(tǒng)分析流程
OLAP是使用者為了滿足某項(xiàng)業(yè)務(wù)的分析需要,假設(shè)一些問(wèn)題或者場(chǎng)景,然后運(yùn)用OLAP驗(yàn)證其假設(shè)是否成立。如,圖書館管理系統(tǒng)中的讀者借閱信息分析,電子資源統(tǒng)計(jì)分析系統(tǒng)以及電子資源遠(yuǎn)程訪問(wèn)系統(tǒng)中訪問(wèn)量、下載量的統(tǒng)計(jì)分析等都是按照時(shí)間軸來(lái)呈現(xiàn)借閱量、訪問(wèn)量和下載量等讀者使用信息的。[8]OLAP由業(yè)務(wù)管理者主導(dǎo)的假設(shè)也存在著一定的缺陷,如業(yè)務(wù)管理者由于主觀限制,未能夠從整體角度發(fā)掘數(shù)據(jù)的規(guī)律?;诙嗑S度的大數(shù)據(jù)挖掘在不設(shè)定規(guī)則的前提下驗(yàn)證假設(shè)、探索規(guī)律、發(fā)掘未知信息、找出事物發(fā)展方向等,這些都是OLAP不能實(shí)現(xiàn)的。人們受到其教育背景、想象力等因素的限制,經(jīng)驗(yàn)主義也不能夠在創(chuàng)新領(lǐng)域得到更大的突破,由此,基于大數(shù)據(jù)挖掘體系的構(gòu)建,能夠改變經(jīng)驗(yàn)性的歸納總結(jié)關(guān)系,并輔以O(shè)LAP確認(rèn)關(guān)聯(lián)性,才能在數(shù)據(jù)關(guān)系模型的創(chuàng)新性方面得以突破。智慧服務(wù)不僅需要OLAP的多維度統(tǒng)計(jì)支持,更需要圖書館業(yè)務(wù)數(shù)據(jù)的挖掘以獲取智慧價(jià)值的協(xié)助。智慧服務(wù)建立在數(shù)據(jù)價(jià)值獲取的基礎(chǔ)上,數(shù)據(jù)價(jià)值與服務(wù)“智慧”性成正向關(guān)系。數(shù)據(jù)價(jià)值的獲取離不開(kāi)數(shù)據(jù)安全的穩(wěn)定性與可靠性,其中數(shù)據(jù)安全涉及用戶個(gè)人信息的隱私問(wèn)題,即數(shù)據(jù)隱私,因此,一個(gè)穩(wěn)定的智慧服務(wù)系統(tǒng)應(yīng)包含完善的用戶隱私保護(hù)框架。
數(shù)據(jù)挖掘是從數(shù)據(jù)中獲取信息和知識(shí)的過(guò)程,最初的數(shù)據(jù)挖掘研究是基于數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn)?;ヂ?lián)網(wǎng)技術(shù)的發(fā)展給用戶的生活帶來(lái)便利的同時(shí),其服務(wù)模式也逐漸被用戶接受。用戶數(shù)據(jù)是挖掘的對(duì)象,高質(zhì)量的數(shù)據(jù)能夠提供準(zhǔn)確的信息,但數(shù)據(jù)統(tǒng)計(jì)及分析會(huì)涉及用戶隱私,而數(shù)據(jù)發(fā)布也可能侵犯用戶的隱私。由此,學(xué)界致力于探索數(shù)據(jù)挖掘過(guò)程中對(duì)用戶隱私保護(hù)的方法,其中,通過(guò)數(shù)據(jù)挖掘的方法制定相應(yīng)的保護(hù)策略是目前采取的主要途徑。如,針對(duì)數(shù)據(jù)挖掘中聚類分析的隱私保護(hù)方法,差分DPkmedoids算法,[9]以及在云計(jì)算中的運(yùn)用基于格的隱私保護(hù)聚類數(shù)據(jù)的挖掘方法。[10]針對(duì)隱私保護(hù)序列模式挖掘問(wèn)題,提出了項(xiàng)集的布爾集合關(guān)系概念,可以在保護(hù)原始數(shù)據(jù)隱私的前提下準(zhǔn)確地挖掘出頻繁序列模式的任務(wù)。[11-12]聚類分析指將物理或抽象對(duì)象的集合分組為由類似的對(duì)象組成的多個(gè)類的分析過(guò)程,它是一種重要的人類行為。[13]圖書館業(yè)務(wù)的數(shù)據(jù)使用可以分為以下三個(gè)角度。① 資源角度,即紙質(zhì)資源、電子資源等結(jié)構(gòu)化數(shù)據(jù)。資源使用數(shù)據(jù)可以借助于圖書館管理系統(tǒng)以及互聯(lián)網(wǎng)監(jiān)測(cè)工具(如OLAP系統(tǒng))完成多維度的統(tǒng)計(jì),如基于網(wǎng)絡(luò)監(jiān)測(cè)的電子資源統(tǒng)計(jì)分析系統(tǒng)[14]和基于地址重定向的域外訪問(wèn)管理系統(tǒng)。[15]② 空間角度主要涉及圖書館空間管理方面的數(shù)據(jù),包括讀者進(jìn)館數(shù)據(jù),使用無(wú)線網(wǎng)絡(luò)數(shù)據(jù)以及座位使用數(shù)據(jù)等??臻g服務(wù)的讀者利用數(shù)據(jù)的獲取可以通過(guò)相應(yīng)的業(yè)務(wù)系統(tǒng)的統(tǒng)計(jì)模塊獲取。③ 服務(wù)角度包括文獻(xiàn)傳遞、查收查引、查新等涉及讀者直接需求的數(shù)據(jù)。對(duì)從服務(wù)角度獲取的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析時(shí)可以利用OLAP來(lái)完成。當(dāng)前,圖書館業(yè)務(wù)數(shù)據(jù)只停留在收集保存的階段,其統(tǒng)計(jì)分析工作仍然需要人工完成。因此,圖書館業(yè)務(wù)的開(kāi)展,需要OLAP系統(tǒng)對(duì)業(yè)務(wù)系統(tǒng)進(jìn)行初始的統(tǒng)計(jì)分析,從而進(jìn)一步驅(qū)動(dòng)管理決策。
信息竊取者想要獲取某一個(gè)數(shù)據(jù)集(除這段記錄之外的其他所有信息),利用差分隱私保護(hù)模型能夠保證竊取者不會(huì)利用其余的記錄,從輸出結(jié)果中獲取額外信息。然而信息安全保護(hù)者所關(guān)注的是在聚類過(guò)程所公布的信息中,用戶隱私不被泄露。在提交聚類查詢信息過(guò)程中,返回的結(jié)果已經(jīng)是被差分隱私處理過(guò)的結(jié)果。在每次發(fā)布真實(shí)中心點(diǎn)之前使用拉普拉斯機(jī)制對(duì)中心點(diǎn)加噪,再發(fā)布加噪之后的中心點(diǎn),在一定程度上保證了個(gè)人隱私的安全性以及聚類的有效性。[9]但是在復(fù)雜多變的互聯(lián)網(wǎng)環(huán)境下,其攻擊方式也在不斷變化,因此防護(hù)策略也需要?jiǎng)討B(tài)、及時(shí)調(diào)整,才能避免由于數(shù)據(jù)隱私泄露造成的損失擴(kuò)大。
在云計(jì)算的環(huán)境下,公有云為機(jī)構(gòu)提供了數(shù)據(jù)存儲(chǔ)的空間,提高了機(jī)構(gòu)的效率,但是數(shù)據(jù)的安全性與穩(wěn)定性問(wèn)題也隨之被業(yè)界質(zhì)疑。公有云的建設(shè)者與擁有者承擔(dān)著數(shù)據(jù)的安全問(wèn)題,其規(guī)模與知名度直接影響到信任度。在視大數(shù)據(jù)為資源的背景下,如果由于用戶隱私問(wèn)題對(duì)數(shù)據(jù)進(jìn)行保護(hù),禁止對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘與分析,那么大數(shù)據(jù)將失去其價(jià)值。因此,在云環(huán)境下,相關(guān)學(xué)者提出了一種基于格的隱私保護(hù)聚類數(shù)據(jù)挖掘方法,用以平衡數(shù)據(jù)挖掘與隱私保護(hù)。[10]高校圖書館的存儲(chǔ)數(shù)據(jù)提供了挖掘的“原材料”,基于格的隱私保護(hù)數(shù)據(jù)挖掘擴(kuò)散了應(yīng)用場(chǎng)景,如PPK-means(PrivacyPreservingK-means)以及隱私保護(hù)層級(jí)聚類等方法,提升了高校圖書館私有云到客戶端的數(shù)據(jù)挖掘精確度。
數(shù)據(jù)安全性與穩(wěn)定性是數(shù)據(jù)挖掘的前提,然而讀者往往擔(dān)心的是數(shù)據(jù)挖掘?qū)﹄[私的侵犯。在用戶隱私數(shù)據(jù)不暴露的前提下實(shí)現(xiàn)精確的數(shù)據(jù)挖掘任務(wù),是當(dāng)前學(xué)者較為熱衷的數(shù)據(jù)挖掘方法。隱私保護(hù)序列挖掘問(wèn)題的相關(guān)概念,如項(xiàng)集的布爾集合關(guān)系概念等,能夠在數(shù)據(jù)的隱私保護(hù)性、挖掘結(jié)果的準(zhǔn)確性與算法執(zhí)行高效性方面得到很好的體現(xiàn)。[11]
智慧服務(wù)需要數(shù)據(jù)支持。對(duì)數(shù)據(jù)進(jìn)行采集、分析,挖掘其中的應(yīng)用價(jià)值,是提高圖書館精準(zhǔn)服務(wù)的基礎(chǔ)。然而數(shù)據(jù)應(yīng)用過(guò)程關(guān)乎讀者隱私問(wèn)題,需要制定相關(guān)的策略和方法以完善數(shù)據(jù)應(yīng)用?;趉-匿名保護(hù)模型是現(xiàn)在應(yīng)用比較廣泛的隱私保護(hù)技術(shù)。隨著網(wǎng)絡(luò)攻擊技術(shù)的不斷發(fā)展,新的攻擊方式下傳統(tǒng)的保護(hù)方法已經(jīng)不再有效。從數(shù)據(jù)層中的數(shù)據(jù)表等相關(guān)內(nèi)容中也能夠挖掘分析出用戶的敏感信息。以數(shù)據(jù)挖掘的聚類分析為例,在互聯(lián)網(wǎng)搜索領(lǐng)域,基于關(guān)鍵詞的搜索將結(jié)果聚類反饋并以簡(jiǎn)潔的方式呈現(xiàn)給用戶。多維數(shù)據(jù)的挖掘可以提高數(shù)據(jù)價(jià)值的精度,然而維度越高,其敏感信息泄露的可能性越高。不同數(shù)據(jù)挖掘的方式原理不同,其保護(hù)策略也存在著差異,不同的數(shù)據(jù)利用方式需要不同的保護(hù)方式。數(shù)據(jù)挖掘方法與工具隨著技術(shù)的進(jìn)步而不斷完善,這也給用戶隱私保護(hù)帶來(lái)了一定的困難。因此,隱私保護(hù)的策略與方法也需要時(shí)刻緊跟挖掘技術(shù)的發(fā)展而不斷變革,以適應(yīng)互聯(lián)網(wǎng)智慧服務(wù)的實(shí)際需要。攻防理論是數(shù)據(jù)安全保護(hù)的基本策略,應(yīng)用場(chǎng)景的不同,其保護(hù)的策略與方法也不盡相同。智慧圖書館處于復(fù)雜多變的互聯(lián)網(wǎng)環(huán)境,其業(yè)務(wù)體系的構(gòu)建、業(yè)務(wù)流程的重組使得數(shù)據(jù)安全保護(hù)策略需要時(shí)刻調(diào)整??傊?,隱私保護(hù)的方法不僅是技術(shù)層面的,更應(yīng)該是社會(huì)層面的,隱私保護(hù)技術(shù)作為工具被用于不同的業(yè)務(wù)系統(tǒng),以保障業(yè)務(wù)的穩(wěn)定實(shí)施。數(shù)據(jù)管理者對(duì)技術(shù)方案的規(guī)劃、設(shè)計(jì)、選取與防護(hù)思路的制定都需要借助社會(huì)方法的參與。
互聯(lián)網(wǎng)技術(shù)提供了許多工具可用于多種業(yè)務(wù)系統(tǒng)提升效率與改進(jìn)流程。隱私保護(hù)技術(shù)工具的選取,需要管理者根據(jù)具體業(yè)務(wù)的運(yùn)行規(guī)律進(jìn)行科學(xué)規(guī)劃,以達(dá)到提升與改進(jìn)的效果。圖書館管理者掌握技術(shù)方法并實(shí)施于業(yè)務(wù)數(shù)據(jù)使用、數(shù)據(jù)安全與數(shù)據(jù)發(fā)布,并在此過(guò)程中貫徹讀者隱私保護(hù)思想,該過(guò)程屬于社會(huì)方法綜合運(yùn)用?;镜臄?shù)據(jù)流循環(huán)將是整個(gè)業(yè)務(wù)系統(tǒng)運(yùn)行的關(guān)鍵,而對(duì)癥下藥、動(dòng)態(tài)監(jiān)測(cè)具體業(yè)務(wù)數(shù)據(jù)也是隱私保護(hù)最精準(zhǔn)有效的方式之一。
智慧服務(wù)的“智慧化”是在大量數(shù)據(jù)采集、分析、挖掘的基礎(chǔ)上,有效感知讀者的所想、所需而開(kāi)展的精細(xì)化服務(wù)。服務(wù)“智慧性”的高低取決于數(shù)據(jù)維度的高低、數(shù)據(jù)的周期性等因素。高校圖書館的數(shù)據(jù)使用過(guò)程涉及讀者的隱私數(shù)據(jù),如讀者姓名、學(xué)號(hào)或者工號(hào)、單位以及何時(shí)、何地訪問(wèn)哪種數(shù)據(jù)庫(kù)、檢索何種關(guān)鍵詞等。數(shù)據(jù)使用的維度越高,涉及讀者相關(guān)的數(shù)據(jù)就越多,分析結(jié)果越精確,隱私泄露的風(fēng)險(xiǎn)越高。數(shù)據(jù)使用隱私保護(hù)的關(guān)鍵點(diǎn)在于對(duì)前期采集數(shù)據(jù)的處理,如匿名化、模糊化的方法對(duì)讀者信息進(jìn)行預(yù)處理,是數(shù)據(jù)使用過(guò)程中保護(hù)讀者隱私的一種較為直接的方法,也是高校圖書館掌握讀者群體的動(dòng)態(tài)信息需求,并以此開(kāi)展智慧服務(wù)的有效途徑之一。①匿名化數(shù)據(jù)能夠分析出用于決策的信息,包括業(yè)務(wù)前期運(yùn)行狀況、規(guī)律,并以此探索后續(xù)發(fā)展?fàn)顩r等;②模糊化方法,提前預(yù)設(shè)采集、提取業(yè)務(wù)分析所需的數(shù)據(jù),摒棄無(wú)關(guān)數(shù)據(jù),此方法既可避免數(shù)據(jù)過(guò)載,也可避免核心隱私數(shù)據(jù)的關(guān)聯(lián)分析造成讀者信息泄露,如通過(guò)預(yù)設(shè)的時(shí)間段的資源訪問(wèn)量、檢索詞等數(shù)據(jù)用于挖掘讀者資源需求。
數(shù)據(jù)安全隱私保護(hù)是根據(jù)不同的數(shù)據(jù)使用環(huán)境,選取合適的數(shù)據(jù)安全保護(hù)策略、機(jī)制進(jìn)行防護(hù)。該方法的實(shí)施依賴于數(shù)據(jù)管理者能夠宏觀掌握最新的數(shù)據(jù)安全技術(shù)方法,并具有敏銳的數(shù)據(jù)安全規(guī)劃與設(shè)計(jì)能力。國(guó)際標(biāo)準(zhǔn)化組織(International Organization for Standardization,ISO)對(duì)計(jì)算機(jī)系統(tǒng)中數(shù)據(jù)安全定義為:構(gòu)建數(shù)據(jù)處理系統(tǒng)、并采用相應(yīng)的技術(shù)和安全保護(hù)以保護(hù)計(jì)算機(jī)硬件、軟件和數(shù)據(jù)不被偶然與惡意的原因遭到破壞、更改與泄露。[16]因此,數(shù)據(jù)安全可以理解為以各種技術(shù)與策略保證數(shù)據(jù)的可用性、完整性與保密性。數(shù)據(jù)安全是保證數(shù)據(jù)在傳輸與交換過(guò)程中不發(fā)生信息的增、減、修改、泄露等。數(shù)據(jù)安全隱私保護(hù)可以分為:① 防護(hù)技術(shù)包括數(shù)據(jù)備份、雙機(jī)容錯(cuò)、數(shù)據(jù)遷移、異地容災(zāi)、數(shù)據(jù)庫(kù)加密、硬盤安全加密;② 安全技術(shù)包括隱藏、訪問(wèn)控制與密碼學(xué);③ 實(shí)施策略包括網(wǎng)絡(luò)分段、交換式集線器替代共享式集線器等。智慧服務(wù)的基礎(chǔ)是依托互聯(lián)網(wǎng)開(kāi)展,數(shù)據(jù)的采集與使用過(guò)程涉及多個(gè)系統(tǒng),系統(tǒng)之間的數(shù)據(jù)交互過(guò)程需要構(gòu)建數(shù)據(jù)安全保護(hù)技術(shù)防止數(shù)據(jù)泄露造成侵犯用戶隱私問(wèn)題發(fā)生。數(shù)據(jù)管理者可根據(jù)不同的數(shù)據(jù)使用環(huán)境,制定相應(yīng)的數(shù)據(jù)安全保護(hù)策略,避免讀者隱私因數(shù)據(jù)外泄造成暴露。
圖書館以系統(tǒng)運(yùn)行數(shù)據(jù)分析信息應(yīng)用于業(yè)務(wù)效率的提升、運(yùn)營(yíng)的決策。由于系統(tǒng)多維度數(shù)據(jù)關(guān)聯(lián)分析的需要,圖書館各項(xiàng)業(yè)務(wù)需要發(fā)布與共享部分?jǐn)?shù)據(jù)。在傳統(tǒng)數(shù)據(jù)庫(kù)支持的業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)發(fā)布以提出請(qǐng)求的方式調(diào)用相應(yīng)的數(shù)據(jù),但是在大數(shù)據(jù)時(shí)代,智慧服務(wù)通常是采用推送的方式授權(quán)給相應(yīng)的主題。數(shù)據(jù)的發(fā)布過(guò)程不僅需要推送策略支持以保證數(shù)據(jù)的可用性,也需要隱私保護(hù)指南規(guī)范發(fā)布行為,如,基于隱私保護(hù)的數(shù)據(jù)挖掘 (Privacy-Preserving Data Mining,PPDM)概念的發(fā)布。傳統(tǒng)數(shù)據(jù)發(fā)布的“匿名”與“模糊”等隱私保護(hù)模型,可以降低在數(shù)據(jù)使用過(guò)程中涉及用戶“隱私”等敏感信息的泄露,但是對(duì)數(shù)據(jù)使用(數(shù)據(jù)挖掘)相關(guān)算法得出的隱私信息無(wú)法進(jìn)行有效保護(hù),這些信息也應(yīng)該動(dòng)態(tài)刪除。PPDM的目標(biāo)是實(shí)現(xiàn)一種改變?cè)紨?shù)據(jù)的算法,讓可能含有隱私信息的數(shù)據(jù)在挖掘過(guò)程中不被泄露。由此,即使發(fā)布、共享數(shù)據(jù),也可以讓數(shù)據(jù)竊取者無(wú)法通過(guò)這些數(shù)據(jù)獲取讀者隱私。高校圖書館擁有多樣化的數(shù)據(jù),為提升服務(wù)質(zhì)量,運(yùn)用數(shù)據(jù)挖掘與分析工具動(dòng)態(tài)獲取讀者的需求,數(shù)據(jù)安全問(wèn)題因此顯得更加突出。隨著智慧服務(wù)理念逐步被圖情領(lǐng)域所接納,智慧的數(shù)據(jù)性,數(shù)據(jù)的安全性,安全的保障性等問(wèn)題需要得到重視以保證智慧服務(wù)健康、穩(wěn)定的發(fā)展。
智慧離不開(kāi)數(shù)據(jù)的支持,如資源數(shù)據(jù)、行為數(shù)據(jù)等,這些數(shù)據(jù)能夠多維度顯示圖書館的運(yùn)行狀態(tài),包括讀者的空間、資源、服務(wù)需求,而數(shù)據(jù)的挖掘分析能夠得到讀者深層次的學(xué)科需求。大量數(shù)據(jù)的采集、整理、統(tǒng)計(jì)、挖掘、分析,其過(guò)程周期較長(zhǎng),數(shù)據(jù)的安全性與穩(wěn)定性在此過(guò)程中尤為重要。數(shù)據(jù)的管理者與利用者的數(shù)據(jù)素養(yǎng),其數(shù)據(jù)意識(shí)、數(shù)據(jù)能力與數(shù)據(jù)倫理直接影響到數(shù)據(jù)應(yīng)用效果與數(shù)據(jù)安全穩(wěn)定。
高校圖書館運(yùn)用互聯(lián)網(wǎng)技術(shù)和理念開(kāi)展學(xué)科服務(wù)、資源服務(wù)與空間服務(wù),具體理念就是關(guān)聯(lián)圖書館多系統(tǒng)的數(shù)據(jù),實(shí)現(xiàn)服務(wù)管理的整合(見(jiàn)圖3)。數(shù)據(jù)由不同系統(tǒng)進(jìn)行多維度匯集,實(shí)現(xiàn)多維度的整合,提升了大數(shù)據(jù)的應(yīng)用價(jià)值,為圖書館開(kāi)展智慧服務(wù)提供了條件,在此過(guò)程中也提高了數(shù)據(jù)管理復(fù)雜度和數(shù)據(jù)隱私泄露的風(fēng)險(xiǎn)度。傳統(tǒng)的隱私保護(hù)技術(shù)已經(jīng)不適應(yīng)智慧服務(wù)中數(shù)據(jù)挖掘、分析等應(yīng)用環(huán)境。同時(shí),讀者還未意識(shí)到在自我隱私保護(hù)方面的重要性,如讀者身份認(rèn)證的讀者卡常被他人借用,身份認(rèn)證賬號(hào)互借的情況也比比皆是。因此,智慧服務(wù)環(huán)境下的讀者隱私保護(hù),不僅是技術(shù)層面、管理層面的保護(hù),也需要加強(qiáng)讀者數(shù)據(jù)素養(yǎng)教育,提高用戶有關(guān)數(shù)據(jù)意識(shí)、數(shù)據(jù)能力和數(shù)據(jù)倫理方面的數(shù)據(jù)素質(zhì),使用戶隱私能夠得到較好的保護(hù)。
圖3 基于數(shù)據(jù)安全與隱私保護(hù)環(huán)境下的智慧服務(wù)體系
讀者對(duì)個(gè)人數(shù)據(jù)的不可控性,不僅需要業(yè)務(wù)機(jī)構(gòu)的行為自律也需要法律法規(guī)對(duì)個(gè)人數(shù)據(jù)加以保護(hù)。然而圖情界至今尚未有完善的數(shù)據(jù)隱私保護(hù)法律法規(guī)來(lái)規(guī)避已經(jīng)存在的安全風(fēng)險(xiǎn)。唯有借鑒國(guó)外先進(jìn)經(jīng)驗(yàn),如歐盟的《一般數(shù)據(jù)保護(hù)條例》等,并結(jié)合圖書館業(yè)務(wù)的數(shù)據(jù)使用現(xiàn)狀,制定數(shù)據(jù)保護(hù)行業(yè)規(guī)則。這些規(guī)則應(yīng)包括數(shù)據(jù)使用目的、明確原則、明示告知原則、數(shù)據(jù)質(zhì)量原則、數(shù)據(jù)安全原則、公開(kāi)責(zé)任原則等。圖書館門戶網(wǎng)站等平臺(tái)在收集、使用讀者數(shù)據(jù)行為時(shí),應(yīng)在其主要頁(yè)面提供法律聲明與隱私權(quán)政策等信息,讓讀者詳細(xì)了解個(gè)人數(shù)據(jù)使用情況以及可能存在的風(fēng)險(xiǎn)等問(wèn)題。
信息社會(huì)環(huán)境下,讀者對(duì)圖書館的數(shù)據(jù)收集、使用等行為不知情、不了解,而且讀者作為數(shù)據(jù)的主體對(duì)數(shù)據(jù)的控制力不強(qiáng),由此會(huì)造成整個(gè)社會(huì)對(duì)機(jī)構(gòu)數(shù)據(jù)使用缺乏信任。因此,增強(qiáng)讀者作為數(shù)據(jù)主體的參與度,提升讀者在涉及個(gè)人數(shù)據(jù)使用的透明度,是實(shí)現(xiàn)讀者權(quán)利正當(dāng)性的基礎(chǔ)。[17]圖書館作為智慧服務(wù)的實(shí)施者,應(yīng)該擁有干預(yù)自動(dòng)化業(yè)務(wù)建設(shè)方處理算法黑箱的權(quán)利,并向讀者公開(kāi)算法決策對(duì)讀者個(gè)人可能存在的影響,以此獲取讀者信任。圖書館作為公共服務(wù)機(jī)構(gòu),應(yīng)該以維護(hù)讀者利益為前提開(kāi)展數(shù)據(jù)收集工作,在此過(guò)程中不可避免地存在讀者個(gè)人與公共利益之間的權(quán)衡問(wèn)題。因此,需要建立讀者與機(jī)構(gòu)之間的數(shù)據(jù)共享知情權(quán),這樣才能夠更好地實(shí)現(xiàn)保護(hù)讀者隱私的目的。
讀者隱私保護(hù)需要區(qū)分一般個(gè)人數(shù)據(jù)與敏感數(shù)據(jù),一般個(gè)人數(shù)據(jù)可以建立在默認(rèn)同意的基礎(chǔ)上,只需要讀者個(gè)人沒(méi)有明確的反對(duì),便可以收集與使用。但是對(duì)于讀者個(gè)人敏感信息而言,則需要圖書館等機(jī)構(gòu)在數(shù)據(jù)收集與使用之前,征得讀者同意。因此,對(duì)于一般數(shù)據(jù)的使用需要機(jī)構(gòu)強(qiáng)化數(shù)據(jù)安全保護(hù)措施,而對(duì)于敏感數(shù)據(jù)的使用則需要調(diào)和讀者數(shù)據(jù)保護(hù)與使用需求之間的矛盾,實(shí)現(xiàn)利益的均衡。
數(shù)字圖書館實(shí)時(shí)、動(dòng)態(tài)收集讀者信息,并且應(yīng)用日志分析等大數(shù)據(jù)技術(shù)分析數(shù)據(jù),進(jìn)行精細(xì)化的智慧服務(wù),在此過(guò)程中,對(duì)于讀者身份判別與讀者個(gè)體進(jìn)行深入的掌握。因此,在圖書館智慧服務(wù)需求的背景下,政府、機(jī)構(gòu)與讀者都對(duì)用戶隱私保護(hù)有了一定的關(guān)注。機(jī)構(gòu)的數(shù)據(jù)收集、使用有了明確的定義,對(duì)業(yè)務(wù)數(shù)據(jù)自動(dòng)化處理也必須有明確規(guī)定。圖書館應(yīng)該有差異的對(duì)待各種讀者數(shù)據(jù),并對(duì)其加以保護(hù),也可以根據(jù)不同環(huán)境、不同業(yè)務(wù)進(jìn)一步細(xì)分讀者數(shù)據(jù)保護(hù)規(guī)則,細(xì)分?jǐn)?shù)據(jù)的收集主體與使用主體。
讀者數(shù)據(jù)被收集后,圖書館等機(jī)構(gòu)要對(duì)所收集的讀者數(shù)據(jù)提供保護(hù)機(jī)制,防止數(shù)據(jù)在存儲(chǔ)過(guò)程中被泄露。數(shù)據(jù)存儲(chǔ)安全根據(jù)不同的環(huán)境,需要建立不同等級(jí)的保護(hù)制度。圖書館出于業(yè)務(wù)發(fā)展需要,收集讀者數(shù)據(jù),也要重視數(shù)據(jù)存儲(chǔ)的安全問(wèn)題,充分考慮業(yè)務(wù)發(fā)展與數(shù)據(jù)安全的關(guān)系。大多數(shù)高校圖書館依托數(shù)字化校園建設(shè)而成就的數(shù)字圖書館,已經(jīng)具備了集中的數(shù)據(jù)資源庫(kù)與數(shù)據(jù)中心體系,數(shù)據(jù)存儲(chǔ)的安全性與穩(wěn)定性也得到進(jìn)一步提升。集中統(tǒng)一的業(yè)務(wù)管理體系避免了存儲(chǔ)數(shù)據(jù)的泄露問(wèn)題,也為智慧校園、智慧圖書館的建設(shè)提供了穩(wěn)定的互聯(lián)網(wǎng)環(huán)境。
由于目前針對(duì)讀者個(gè)人隱私保護(hù)的法律法規(guī)欠缺,法律體系尚未做到有效的銜接,因此在讀者隱私問(wèn)題與現(xiàn)有法律的關(guān)聯(lián)問(wèn)題上,需要考慮到執(zhí)法的適用性與可操作性。讀者個(gè)人隱私問(wèn)題取證、舉證受到一定限制,特別是在大數(shù)據(jù)環(huán)境下,讀者個(gè)人隱私泄露所帶來(lái)的后果難以在短期內(nèi)認(rèn)定,所以執(zhí)法機(jī)構(gòu)只能夠使用傳統(tǒng)的名譽(yù)權(quán)處理方式對(duì)讀者個(gè)人隱私進(jìn)行保護(hù)。讀者隱私不僅需要機(jī)構(gòu)數(shù)據(jù)管理者從數(shù)據(jù)安全技術(shù)與方法手段等方面進(jìn)行保護(hù),也應(yīng)從提升讀者的數(shù)據(jù)素養(yǎng)中加以強(qiáng)化。讀者只有從數(shù)據(jù)意識(shí)、數(shù)據(jù)倫理等角度全方位認(rèn)識(shí)到數(shù)據(jù)使用、數(shù)據(jù)安全與數(shù)據(jù)發(fā)布的需求、流程以及在此過(guò)程中帶來(lái)業(yè)務(wù)的便利性,才能逐漸消除讀者“談隱色變”的心理陰影。
圖書館服務(wù)的智慧性,必須有相應(yīng)的工具配合實(shí)施,才能將數(shù)據(jù)的價(jià)值充分發(fā)掘,從數(shù)據(jù)層面予以業(yè)務(wù)實(shí)施的智慧化。目前,高校圖書館的數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù),大部分還停留在OLAP階段,并沒(méi)有利用數(shù)據(jù)挖掘來(lái)支持學(xué)科服務(wù)。其中數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)發(fā)展的數(shù)據(jù)安全與隱私保護(hù)問(wèn)題,運(yùn)用傳統(tǒng)的“匿名化”與“模糊化”等方法是能夠解決的。[18]由于館員缺乏專業(yè)數(shù)據(jù)素養(yǎng)培養(yǎng),使得支持圖書館數(shù)據(jù)使用、數(shù)據(jù)安全與數(shù)據(jù)發(fā)布等業(yè)務(wù)的制度、流程沒(méi)有得到有效地制定、實(shí)施。以數(shù)據(jù)為基礎(chǔ)的圖書館資源和業(yè)務(wù)系統(tǒng),其安全性與穩(wěn)定性是開(kāi)展智慧服務(wù)的關(guān)鍵性前提,學(xué)科服務(wù)的平臺(tái)化,使得讀者的資源獲取效率得到飛速提升??萍紟?lái)一系列變革,但是以人為本的宗旨不能改變,人的安全保護(hù)應(yīng)該是全方位的,讀者個(gè)人隱私與數(shù)據(jù)安全也應(yīng)該是圖書館在大數(shù)據(jù)時(shí)代所要重點(diǎn)關(guān)注的問(wèn)題。