孫明溪++孫曉宇++劉春琦
摘 要:云計(jì)算環(huán)境中,圖書館面臨著讀者隱私安全威脅。圖書館對讀者數(shù)據(jù)進(jìn)行存儲、利用、傳遞過程中可能會受到多個環(huán)節(jié)的威脅,涉及讀者隱私安全問題。因此,作者提出構(gòu)建圖書館讀者隱私保護(hù)技術(shù)模型,分別設(shè)計(jì)圖書館、用戶、圖書館外方和云端4個模塊,利用現(xiàn)代信息技術(shù)來保護(hù)讀者隱私,有效實(shí)現(xiàn)圖書館在云環(huán)境下對讀者數(shù)據(jù)的隱私保護(hù)。
關(guān)鍵詞:云計(jì)算 圖書館 讀者隱私 隱私保護(hù) 技術(shù)模型
中圖分類號:G252 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2017)09(c)-0008-04
在云計(jì)算環(huán)境下,圖書館實(shí)現(xiàn)了以讀者為中心,為讀者提供高速、安全、便捷的資源獲取和網(wǎng)絡(luò)服務(wù)[1]。隨著信息化程度的提高,圖書館在讀者獲取資源、使用服務(wù)的過程中將收集大量讀者數(shù)據(jù)。圖書館對讀者數(shù)據(jù)進(jìn)行采集、存儲、分析、挖掘、傳遞,能夠有效規(guī)劃圖書館資源配置,使讀者服務(wù)更加人性化、個性化、科學(xué)化,大幅度提高了讀者閱讀愉悅感和圖書館服務(wù)市場占有率[2]。
圖書館讀者數(shù)據(jù)有讀者的姓名、肖像、身份證號、專業(yè)、職業(yè)、工作單位、聯(lián)系方式等個人信息,還有讀者使用圖書館服務(wù)與資源記錄、網(wǎng)絡(luò)訪問行為,以及館內(nèi)監(jiān)控與讀者違章公告等。本文研究的圖書館讀者不只是本館用戶,還包括其他成員館用戶。圖書館利用讀者數(shù)據(jù)提供更精準(zhǔn)服務(wù)的同時,也大大增加了圖書館讀者隱私泄露的風(fēng)險(xiǎn)[3]。國際圖聯(lián)(IFLA)明確規(guī)定:圖書館用戶享有個人的信息隱私權(quán),圖書館員及其所屬機(jī)構(gòu)應(yīng)保護(hù)用戶的信息隱私,不論其使用何種形式的信息、享受何種形式的服務(wù)[4]。圖書館讀者數(shù)據(jù)隱私保護(hù)的方式有很多種,如建立完備的法律法規(guī)、強(qiáng)化圖書館組織建設(shè)、提高讀者隱私保護(hù)意識、采用技術(shù)保障等。本文主要探究利用技術(shù)來保障圖書館讀者數(shù)據(jù)隱私安全。雖然飛速發(fā)展的信息技術(shù)在一定程度上增加了讀者隱私保護(hù)的難度,但在云環(huán)境下利用技術(shù)來保障圖書館讀者數(shù)據(jù)隱私安全是被廣泛認(rèn)可的。在圖書館存儲、分析、利用讀者數(shù)據(jù)時,有效保障讀者數(shù)據(jù)安全是圖書館健康發(fā)展的關(guān)鍵因素。
1 國內(nèi)外研究現(xiàn)狀
1.1 國內(nèi)研究現(xiàn)狀
為了了解國內(nèi)圖書情報(bào)界學(xué)者對圖書館讀者隱私的研究成果,本文選擇“讀者隱私、用戶隱私”作為檢索詞,限定“學(xué)科類別(圖書情報(bào)與數(shù)字圖書館)”,以CNKI(中國知網(wǎng))作為文獻(xiàn)數(shù)據(jù)庫進(jìn)行期刊的“主題”檢索。檢索結(jié)果見表1。
從表1中可以看出,國內(nèi)學(xué)者對讀者隱私保護(hù)的研究始于2000年,在圖書情報(bào)期刊中發(fā)表論文類研究成果共553篇,其中核心期刊中涉及該領(lǐng)域論文160篇。
圖情界學(xué)者們越來越關(guān)注該領(lǐng)域的研究,在核心期刊中發(fā)表的論文也逐年遞增(見圖1)。但從發(fā)表的論文數(shù)量來看,業(yè)界對該領(lǐng)域的關(guān)注度不高,這幾年文獻(xiàn)數(shù)量呈減少趨勢。
1.2 國外研究現(xiàn)狀
以Web of Science作為檢索平臺,選擇“User Privacy”作為檢索詞,研究領(lǐng)域?yàn)椤癐nformation Science Library Science”,進(jìn)行文獻(xiàn)檢索。檢索時間為2009年至2017年。
本文統(tǒng)計(jì)的是國外圖情界在核心期刊中發(fā)表論文的數(shù)量(見表2),總體呈上升趨勢(見圖2),與國內(nèi)同一時期核心期刊中發(fā)表論文相比數(shù)量多,說明國外學(xué)者對該領(lǐng)域的研究更為深入。但從論文成果數(shù)量來說,圖情界學(xué)者對圖書館讀者隱私保護(hù)的研究還很缺乏。
2 圖書館讀者隱私安全威脅
圖書館日常運(yùn)行過程中有很多環(huán)節(jié)威脅了讀者隱私安全。首先,圖書館能夠?qū)崟r監(jiān)測讀者借閱行為、網(wǎng)絡(luò)動態(tài)路徑、地理位置、行為習(xí)慣、社會關(guān)系等,監(jiān)測數(shù)據(jù)都是在讀者毫不知情的情況下獲取的。同時,圖書館在為讀者提供借閱服務(wù)、參考咨詢服務(wù)、個性化服務(wù)、移動服務(wù)過程中,能收集到大量的讀者服務(wù)數(shù)據(jù);其次,圖書館對讀者數(shù)據(jù)監(jiān)管不到位,數(shù)據(jù)監(jiān)管人員權(quán)責(zé)不明確,缺乏有效保護(hù)讀者數(shù)據(jù)的規(guī)章制度;再次,圖書館對讀者數(shù)據(jù)利用不規(guī)范。圖書館為制定科學(xué)、合理的未來發(fā)展策略,加工原始讀者數(shù)據(jù),提高其使用價值與私密程度。加工過程則是利用現(xiàn)代信息技術(shù)來挖掘讀者數(shù)據(jù)、洞察讀者需求、預(yù)測讀者未來行為,這當(dāng)中涉及讀者敏感問題,使得讀者隱私受到侵犯。另外,圖書館會與其他館有業(yè)務(wù)往來,為了保證跨館服務(wù)的開展,館際之間會共享讀者數(shù)據(jù);圖書館合作商在館內(nèi)進(jìn)行調(diào)試和維護(hù)過程中,能夠通過后臺訪問到讀者數(shù)據(jù),不法分子可能會惡意篡改、竊取讀者數(shù)據(jù);最后,在圖書館日常運(yùn)營過程中,也會面臨系統(tǒng)漏洞、技術(shù)缺陷、物理環(huán)境等多方面的威脅。
3 構(gòu)建讀者數(shù)據(jù)隱私保護(hù)技術(shù)模型
在云環(huán)境下,圖書館讀者數(shù)據(jù)在存儲、利用、傳遞過程中受到多種方式的威脅,保護(hù)讀者數(shù)據(jù)的主體不只是圖書館,還包括圖書館用戶、其他圖書館、服務(wù)商和云端。因此,本文構(gòu)建技術(shù)模型分為圖書館模塊、用戶模塊、館外方模塊、云端模塊。每個模塊將針對上文涉及的不同種類讀者數(shù)據(jù)安全威脅提出多個保護(hù)技術(shù),模塊之間相互聯(lián)系構(gòu)成圖書館讀者隱私保護(hù)技術(shù)模型。在隱私保護(hù)技術(shù)模型中,每一個模塊所包含的技術(shù)類型不盡相同(見圖3)。
3.1 圖書館模塊
3.1.1 數(shù)據(jù)加密技術(shù)
數(shù)據(jù)加密是通過加密算法在密鑰的控制下將明文加密為密文的過程。數(shù)據(jù)加密技術(shù)是數(shù)據(jù)隱私保護(hù)最常用技術(shù),圖書館的讀者數(shù)據(jù)應(yīng)當(dāng)以加密的方式存儲。
首先,在圖書館加密讀者存儲數(shù)據(jù)過程中可以采用傳統(tǒng)的加密算法,包括對稱加密和公約加密兩種類型,為了汲取兩種加密算法的優(yōu)點(diǎn),圖書館存儲讀者數(shù)據(jù)可采用對稱加密來加密數(shù)據(jù),用公鑰加密來傳遞對稱加密中的密鑰[5]。加密技術(shù)的安全性取決于密鑰的安全性,密鑰具有無窮盡性、隨機(jī)性、靈活性。
其次,在加密讀者應(yīng)用數(shù)據(jù)過程中,圖書館利用、傳輸讀者數(shù)據(jù)可采用可搜索加密技術(shù)來加密讀者數(shù)據(jù)。圖書館將讀者數(shù)據(jù)加密并生成可搜索索引[6],建立加密讀者數(shù)據(jù)與索引之間的關(guān)聯(lián)。endprint
3.1.2 數(shù)據(jù)擾亂技術(shù)
數(shù)據(jù)擾亂技術(shù)是指通過匿名、擾亂、添加隨機(jī)變量、添加隨機(jī)偏移值、替換等方法對原始的數(shù)據(jù)集中敏感信息進(jìn)行替代,生成加入擾亂信息的模糊數(shù)據(jù)集進(jìn)行公示和計(jì)算等操作[7]。針對實(shí)時獲取的讀者服務(wù)數(shù)據(jù),采用擾亂技術(shù)來模糊讀者隱私數(shù)據(jù),防止館內(nèi)不法分子讀取讀者數(shù)據(jù)。
3.1.3 可回收性與所有權(quán)證明
可回收性證明(POR)與所有權(quán)證明(PDP)[8]都是驗(yàn)證讀者數(shù)據(jù)完整性的云技術(shù)。圖書館應(yīng)安排專門的責(zé)任館員,負(fù)責(zé)讀者數(shù)據(jù)庫監(jiān)管,定期用可回收性和所有權(quán)證明技術(shù)對讀者數(shù)據(jù)完整性進(jìn)行檢驗(yàn)。特別是經(jīng)過修改、利用、傳遞后的讀者數(shù)據(jù),更需要定期檢驗(yàn)其完整性。
3.1.4 秘密共享技術(shù)
秘密共享技術(shù)是將秘密拆分給N個碎片交由N個人各自保管,避免秘密過于集中,只有若干個人同時進(jìn)行解密才能恢復(fù)秘密[9]。圖書館在制定未來發(fā)展決策時,可采用秘密共享技術(shù)將經(jīng)過加工得到的讀者隱私秘密分隔開,分散保管在多個圖書館高層領(lǐng)導(dǎo)的手中。當(dāng)圖書館高層要進(jìn)行決策工作時,共同拿出這些秘密碎片作為發(fā)展決策的參考,從而分散讀者隱私泄露的風(fēng)險(xiǎn)。
3.1.5 安全多方計(jì)算技術(shù)
安全多方計(jì)算是指在一個分布式網(wǎng)絡(luò)環(huán)境下多個參與方各自輸入某個數(shù)據(jù)參數(shù),并得到各自相應(yīng)的輸出結(jié)果,不會透露其他參與各方輸入輸出的數(shù)據(jù),確保參與各方的獨(dú)立性[10]。安全多方技術(shù)可以應(yīng)用在讀者數(shù)據(jù)挖掘、分析讀者閱覽喜好、文獻(xiàn)資源建設(shè)等工作中。在云技術(shù)環(huán)境中,安全多方技術(shù)尚不成熟,但具有發(fā)展前景。
3.1.6 災(zāi)備技術(shù)
災(zāi)備技術(shù)是指圖書館在面對系統(tǒng)故障、水災(zāi)火災(zāi)等突發(fā)事件時,能夠正常運(yùn)行關(guān)鍵業(yè)務(wù),能利用災(zāi)備技術(shù)保障讀者數(shù)據(jù)的完整、安全。常見的災(zāi)備技術(shù)是以備份為核心任務(wù)的讀者數(shù)據(jù)保障技術(shù)。
3.2 用戶模塊
用戶指的是圖書館讀者、館員,還包括成員館訪問者、服務(wù)合作商。用戶模塊主要包括用戶訪問讀者數(shù)據(jù)、圖書館收集讀者數(shù)據(jù)過程中涉及的讀者隱私保護(hù)技術(shù)。
3.2.1 訪問控制技術(shù)
訪問控制技術(shù)是授權(quán)用戶在合法范圍內(nèi)訪問圖書館資源,圖書館根據(jù)用戶身份及其屬性來限制用戶對資源的訪問或?qū)δ艿氖褂谩?/p>
訪問控制(Access Control)一般包括用戶授權(quán)、身份認(rèn)證、訪問認(rèn)可、審計(jì)追蹤四個基本環(huán)節(jié)[11]。具體而言,用戶授權(quán)用于劃定各類用戶的訪問級別;身份認(rèn)證負(fù)責(zé)驗(yàn)證用戶是否具備訪問讀者數(shù)據(jù)的資格,通常采用口令、生物特征、物理密鑰、電子密鑰等認(rèn)證技術(shù);訪問認(rèn)可環(huán)節(jié)基于授權(quán)策略賦予用戶實(shí)際訪問資源的權(quán)限;審計(jì)追蹤記錄訪問軌跡,用于事后問責(zé)[11]。
3.2.2 身份識別技術(shù)
圖書館在采集讀者數(shù)據(jù)時,要先通過身份識別技術(shù)得到讀者授意,再獲取讀者數(shù)據(jù)。讀者將主密鑰交給可信任的第三方密鑰分配中心,圖書館每次身份識別都需要通過密鑰分配中心認(rèn)證,保證在讀者授意的情況下收集和利用圖書館讀者數(shù)據(jù),是讀者意愿的實(shí)質(zhì)證明[12]。
3.2.3 P3P個人隱私保護(hù)技術(shù)
P3P(Platform for Privacy Project)是個人信息安全的隱私參數(shù)選擇平臺[13],能夠識別多種Cookies嵌入方式。讀者在P3P平臺中設(shè)置讀者個人隱私參數(shù),若訪問網(wǎng)站要求讀取讀者數(shù)據(jù)超出參數(shù)范圍,P3P將拒絕有關(guān)Cookies并會向讀者發(fā)布警告,說明網(wǎng)站應(yīng)用讀者數(shù)據(jù)目的與期限。
讀者可以在P3P中設(shè)置IP地址獲取允許、計(jì)算機(jī)機(jī)型獲取允許、電子郵件保密設(shè)置。同時,P3P能主動告知讀者圖書館將要獲取那些讀者數(shù)據(jù),有利于讀者維護(hù)自身權(quán)益。
3.2.4 讀者瀏覽器隱私設(shè)置
讀者在訪問圖書館網(wǎng)站前在瀏覽器上進(jìn)行隱私設(shè)置,編輯允許接收或拒絕接收Cookie。Cookie可稱作瀏覽器緩存,指網(wǎng)站為了識別用戶身份、進(jìn)行session跟蹤而儲存在用戶本地終端上的數(shù)據(jù)[14]。讀者在瀏覽圖書館網(wǎng)站時,會有一些Cookies存儲在讀者的電腦中,圖書館可以利用這些Cookies來為讀者推送個性化的資源和服務(wù)信息。
3.3 圖書館外方模塊
圖書館外各方包括其他圖書館、圖書館服務(wù)商等,館外各方訪問圖書館讀者數(shù)據(jù)、圖書館向外方傳遞讀者數(shù)據(jù)均存在安全隱患,館外方技術(shù)模塊主要保障圖書館在對外交流過程中讀者隱私數(shù)據(jù)安全。
3.3.1 數(shù)字簽名技術(shù)
數(shù)字簽名技術(shù)是云環(huán)境下實(shí)現(xiàn)網(wǎng)絡(luò)信息傳遞的核心技術(shù),指在電子數(shù)據(jù)文檔中添加一組特定的密碼或符號,用于識別數(shù)據(jù)發(fā)布者身份及承諾,數(shù)據(jù)接收方能夠向第三方證明其收到文件真?zhèn)涡远扇〉囊环N措施[15]。圖書館在參與圖書館聯(lián)盟等組織、與服務(wù)商合作的過程中需要傳遞讀者數(shù)據(jù),可以將數(shù)字簽名密碼加在讀者數(shù)據(jù)中保證數(shù)據(jù)傳輸?shù)陌踩?,杜絕篡改讀者隱私數(shù)據(jù)等不法行為。
3.3.2 安全通信
安全通信是保障信號的安全,為讀者數(shù)據(jù)安全傳輸提供了物理基礎(chǔ)。圖書館讀者數(shù)據(jù)的傳輸包括圖書館內(nèi)各部門間傳輸、圖書館與圖書館間傳輸、圖書館與服務(wù)商間傳輸?shù)阮愋?。在云環(huán)境中,根據(jù)不同的傳輸類型采用SSL(安全套接層)、TLS(傳輸層安全)、VPN(虛擬專用網(wǎng)絡(luò))和IPSec(因特網(wǎng)協(xié)議安全性)[16]等安全技術(shù)來保障信號的安全。
3.3.3 SSL VPN技術(shù)
SSL VPN是采用SSL協(xié)議來實(shí)現(xiàn)遠(yuǎn)程接入的一種新型VPN技術(shù),是解決遠(yuǎn)程用戶訪問敏感數(shù)據(jù)最簡單最安全的解決技術(shù)[17],它增強(qiáng)了圖書館安全訪問和安全的級別和能力[18]。
3.3.4 匿名化技術(shù)
K-匿名化技術(shù)是保護(hù)網(wǎng)絡(luò)發(fā)布信息的技術(shù),通過擾亂的方法使得發(fā)布的信息存在至少K個不可區(qū)分的記錄,不能唯一標(biāo)識,數(shù)據(jù)竊取者不能判別出隱私信息數(shù)據(jù)所屬的具體個體,從而保護(hù)了用戶隱私[19]。K-匿名通過參數(shù)K指定用戶可承受的最大信息泄露風(fēng)險(xiǎn)[20]。endprint
3.4 云端模塊
圖書館可以將讀者數(shù)據(jù)存儲在網(wǎng)絡(luò)云中,采用屬性加密算法[21]加密云端數(shù)據(jù)。另外,云災(zāi)備是一種利用云技術(shù)為圖書館提供讀者數(shù)據(jù)保存、管理的災(zāi)備服務(wù),快速實(shí)現(xiàn)圖書館讀者數(shù)據(jù)的災(zāi)備目標(biāo),降低災(zāi)備投入成本和工作強(qiáng)度。
4 結(jié)語
云計(jì)算環(huán)境大大提高了圖書館使用讀者數(shù)據(jù)效率、降低了圖書館存儲讀者數(shù)據(jù)成本,但同時也為圖書館讀者數(shù)據(jù)隱私安全保護(hù)帶來了極大的挑戰(zhàn)。本文在分析了圖書館讀者數(shù)據(jù)隱私安全威脅的基礎(chǔ)上,提出了圖書館讀者隱私保護(hù)技術(shù)模型,以圖書館為核心,圍繞用戶、其他館、服務(wù)商開展讀者數(shù)據(jù)技術(shù)保護(hù),實(shí)現(xiàn)圖書館讀者隱私有效保護(hù)。
但本文的不足之處是,只在理論層面上討論了利用技術(shù)保護(hù)圖書館讀者數(shù)據(jù)隱私安全的問題,接下來應(yīng)當(dāng)開展對技術(shù)保護(hù)模型的實(shí)踐應(yīng)用研究。
參考文獻(xiàn)
[1] 劉立龍.云時代圖書館的讀者服務(wù)拓展[J].中國成人教育,2015(15):62-64.
[2] 馬曉亭.大數(shù)據(jù)時代基于服務(wù)等級協(xié)議的圖書館讀者隱私感知與保護(hù)研究[J].情報(bào)理論與實(shí)踐,2014,4(37):57-60.
[3] 田淑嫻,許春漫.國外圖書館用戶隱私保護(hù)指南文本分析與啟示[J].圖書情報(bào)工作,2015(18):61-65,116.
[4] 汪強(qiáng).用戶個人信息保護(hù)有法可依[J].圖書館工作與研究,2014(4):8-12.
[5] 蔡紅云,田俊峰.云計(jì)算中的數(shù)據(jù)隱私保護(hù)研究[J].山東大學(xué)學(xué)報(bào):理學(xué)版,2014,49(9):83-89,96.
[6] 李經(jīng)緯,賈春福,劉哲理,等.可搜索加密技術(shù)研究綜述 [J].軟件學(xué)報(bào),2015(1):109-128.
[7] 賈哲.分布式環(huán)境中的信息挖掘與隱私保護(hù)相關(guān)技術(shù)研究[D].北京:北京郵電大學(xué),2012.
[8] Rajat Saxena,Somnath Dey.Cloud Audit: A Data Integrity Verification Approach for Cloud Computing[J].Procedia Computer Science,2016(89):142-151.
[9] 肖青華.秘密共享及相關(guān)應(yīng)用研究[D].杭州:浙江大學(xué),2005.
[10]趙川.實(shí)用安全兩方計(jì)算理論研究[D].濟(jì)南:山東大學(xué), 2016.
[11]張玉清,王曉菲,劉雪峰,等.云計(jì)算環(huán)境安全綜述[J]. 軟件學(xué)報(bào),2016,27(6):1328-1348.
[12]徐險(xiǎn)峰.圖書館用戶隱私權(quán)保護(hù)研究綜述[J].圖書館建 設(shè),2010(7):30-34.
[13]易斌,方錦平,陳淑文.圖書館讀者隱私的自我保護(hù)問題 與對策研究[J].圖書館學(xué)研究,2012(9):93-95.
[14]沈海波,洪帆.基于Cookie的Web服務(wù)安全認(rèn)證系統(tǒng)[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2006,27(5):762-764,881.
[15]曹陽.基于秘密共享的數(shù)字簽名方案[J].重慶郵電大學(xué) 學(xué)報(bào):自然科學(xué)版,2015,27(3):418-421.
[16]云計(jì)算——隱私保護(hù)技術(shù)[EB/OL].http://wenku.baidu.com/link?url=8LugCHODyRVs3OVP-_K82a9mpfFYd_f1e5Xy9sqOP-Wo4BwPNHJSaMixe6fEC6kXmGJYcFmRT1CWjB0fm1Km4wY73SoKSprkxYBi7wT89v,2017-04-26.
[17]劉東,王雙,周靜.量子密鑰在電網(wǎng)SSLVPN中的應(yīng)用[J]. 電網(wǎng)技術(shù),2014(2):544-548.
[18]朱意秋.基于SSL協(xié)議的VPN技術(shù)研究和實(shí)現(xiàn)[J].輕工 科技,2015(5):55-56,76.
[19]汪小寒,羅永龍,江葉峰,等.基于KD樹最優(yōu)投影劃分的K匿名算法[J].南京大學(xué)學(xué)報(bào):自然科學(xué),2016,52(6):1052-1064.
[20]宋金玲,劉國華,黃黎明,等.K-匿名隱私保護(hù)模型中K值 的優(yōu)化選擇算法[J].小型微型計(jì)算機(jī)系統(tǒng),2011,32(10):1987-1993.
[21]王彩芬,鄧云霞,牛淑芬.一個新的理想格上基于屬性的 加密方案[J].計(jì)算機(jī)工程與應(yīng)用,2016(17):123-127.endprint