◆李華恩
(五邑大學(xué)計算機學(xué)院 廣東 525300)
探討云計算與大數(shù)據(jù)時代下的隱私與策略
◆李華恩
(五邑大學(xué)計算機學(xué)院 廣東 525300)
互聯(lián)網(wǎng)時代進入了云計算階段加之智能移動設(shè)備的推廣普及,人們無時無刻享受著云帶來生活與工作上的便捷與高效。但在享用科技成果的同時,我們也受到了來自大數(shù)據(jù)對隱私的威脅。本文重點探討云計算時代誕生后對個人用戶信息的變化以及從社會及技術(shù)層面嘗試探討如何解決其帶來的負面影響。
隱私; 云計算; 大數(shù)據(jù); 安全; 網(wǎng)絡(luò)
自從人類進入第三次科技革命時代,電子計算機變得愈發(fā)普及,互聯(lián)網(wǎng)設(shè)備也開始與人們形影不離。人們通過互聯(lián)網(wǎng)記錄、交互、分享信息。這里我們將這種自我有意識地將其公開或在某些協(xié)議背景下分享給某人的數(shù)據(jù)稱之為自我數(shù)據(jù),而另外一種,是互聯(lián)網(wǎng)或商業(yè)公司,會在供應(yīng)于用戶使用的應(yīng)用程序中收集用戶操作時的行為、習(xí)慣、行蹤等數(shù)據(jù),它們以此來提高用戶體驗,盡管用戶在使用程序前同意了某些協(xié)議,但這更多是一種被迫,而大多數(shù)用戶也許根本不清楚自己同意了什么內(nèi)容,這種人們所沒察覺到,卻被使用的數(shù)據(jù)我們可以將其稱為忽略數(shù)據(jù)。放在10年前,自我數(shù)據(jù)量與忽略數(shù)據(jù)量或許只有十年后今天的十萬分之一,原因在于計算機時代的初期,無論是計算機的運算能力或者是硬盤的儲存數(shù)據(jù)量都是極為有限的,但2006年一項技術(shù)的推廣與普及,完全將整個局面顛覆,那便是云計算技術(shù)。
云計算(Cloud Computing)的組成包含了分布式計算(Distributed Computing)、并行計算(Parallel Computing)、效用計算(Utility Computing)、網(wǎng)絡(luò)存儲(Network Storage Technologies)、虛擬化(Virtualization)、負載均衡(Load Balance)、熱備份冗余(High Available)等傳統(tǒng)計算機和網(wǎng)絡(luò)技術(shù),我們不妨將上述五種主要組成云計算的傳統(tǒng)網(wǎng)絡(luò)技術(shù)做個簡化。首先分布計算原理即是將一項工程,分布于整個可利用的大系統(tǒng)中,以最有效率的途徑拆分給各部分系統(tǒng)完成,之后匯總結(jié)果,我們可將其視為協(xié)同工作; 并行計算,即在處理這項工程時,調(diào)用可供其使用的計算機資源來解決復(fù)雜的計算任務(wù),我們將其視為云處理能力。網(wǎng)絡(luò)存儲,即通過匯聚獨立儲存設(shè)備的容量進行統(tǒng)一擴容,資源儲備,我們可將其類比為云記憶能力; 效用計算,即無需用戶或企業(yè)組建自己的數(shù)據(jù)中心,而由網(wǎng)絡(luò)存儲內(nèi)容中資源共享來完成數(shù)據(jù)中心的職責(zé)。
我們再將上述從云計算提取出來這幾項核心部分與人類大腦進行對比??梢园l(fā)現(xiàn),除了缺少“思考”功能,其余每一項對應(yīng)的恰恰是我們?nèi)四X在解決問題時的核心功能。人類只需要將云計算得出的數(shù)據(jù)協(xié)助自己的工作,配合數(shù)據(jù)操控者的思考能力,一個前所未有的高效率時代——云計算時代便如此降臨。
數(shù)據(jù)并不是什么高深的專有詞匯,它可謂是人類社會最重要的組成之一,但大數(shù)據(jù),卻是云計算時代才得到誕生。根據(jù)全球網(wǎng)絡(luò)報告,截至2016年全球網(wǎng)民數(shù)量已經(jīng)接近總?cè)丝诘囊话?,達到34.2億人口。在以往,無論是超級計算機還是極高容量的存儲設(shè)備都是是無法收集、存儲及運算如此龐大的用戶信息,因為無論這些設(shè)備再強大,都是個體,但云概念的誕生,它共享與融合的本質(zhì),使得整個系統(tǒng)的運算能力與存儲能力得到爆炸式的提高,由此誕生大數(shù)據(jù)的概念。
大數(shù)據(jù)涉及的方面十分廣泛,但本文只討論其在互聯(lián)網(wǎng)世界中對用戶隱私部分的影響及探討如何解決。上文詳細分析了云計算及其衍生出的大數(shù)據(jù)時代,我們不妨將這項跨時代的網(wǎng)絡(luò)成果的運用推演在一位普通上班族用戶身上,看看會是什么結(jié)果。A先生是一位普通的上班族,屬于輕度網(wǎng)絡(luò)社交群,網(wǎng)絡(luò)購物平臺的多樣性與便捷性使得他的主要購物渠道是線上,乘坐交通工具上下班的A先生習(xí)慣在路途中拿起手機,瀏覽了一下更新的微博與當天的新聞動態(tài),在遇到感悟時會社交平臺抒發(fā)一下自己的感受?;氐郊液?,洗漱完畢的他開始在瀏覽器上搜索起自己感興趣的詞條,當然其中還包括某些不為人所知的愛好。有時候,在網(wǎng)上找到與自己興趣相投的論壇,A先生會注冊一個該社群的賬號,發(fā)帖留下了自己的聯(lián)系信息以此認識些志同道合的朋友,但謹慎的A先生也不太希望網(wǎng)絡(luò)世界介入自己的生活,所以他也擁有自己的社交小號。
以上便是A先生的一天,可能他的生活代表著以億萬計市民的生活,但在他背后的云計算能將其信息搜集到什么程度?我們不妨一看。
首先,在網(wǎng)購的時候A先生需要填寫自己的收貨信息,其中便包含了他的實名認證手機號碼、常駐住址或公司地址,真名或習(xí)慣用的匿名; 而網(wǎng)購平臺也會記錄下A先生所購買產(chǎn)品品種、類別。而在他使用的智能手機中,手機廠商會在默認的情況下開啟定位記錄A先生的位置,以此進行某些服務(wù),在他使用微博與瀏覽新聞的過程中,程序廠商也在記錄著A先生在關(guān)注何類話題,關(guān)注哪類用戶或在什么內(nèi)容上停留的時間更久; 當A先生回家使用電腦瀏覽論壇時候,他的IP也會記錄在他駐足的每一個頁面處。
以上便是大概估算下一天中A先生在網(wǎng)絡(luò)世界所發(fā)送出去的數(shù)據(jù)量,當然,也可能是你我一天發(fā)送出去的數(shù)據(jù)量,當這些數(shù)據(jù)從一天延伸到一周,一個月,一年,通過云計算的收集、分析、推演,恐怕不難得出一個比我們自己更為了解的“自己”。
由此可見云時代的來臨,我們每一個人都很難獨善其身,即使你不使用互聯(lián)網(wǎng)設(shè)備,你身邊的人記錄的點點滴滴也會在大數(shù)據(jù)的整理下一定程度將你的行蹤暴露。雖然有一些文章與書籍介紹如何盡可能地安全使用互聯(lián)網(wǎng)設(shè)備,但這些充其量只能使我們的重要信息難以落入陌生黑客的手里,但對于我們?nèi)粘I钏柢浖澈蟮幕ヂ?lián)網(wǎng)公司而言,我們這些資料數(shù)據(jù)早已以合同的方式自愿為他們使用。若這些公司將這些用戶大數(shù)據(jù)運用得當,我們會發(fā)現(xiàn)當自己再次打開購物軟件時映入眼簾的全是自己感興趣或即將需要的貨物的優(yōu)惠頁面,當打開導(dǎo)航軟件,它能準確為什么實時規(guī)劃最合理省時的路線; 它們將會化成比自己更了解自己的智能管家,無時無刻推送著我們感興趣的內(nèi)容,做著最合我們心意的事。但若我們的這些大數(shù)據(jù)被泄露或被以壞處利用,我們行蹤將無處可逃,它也將會令一個個詐騙劇本在大數(shù)據(jù)的素材下編織得天衣無縫。
上文在探討云計算與大數(shù)據(jù)帶來的隱私問題,并不是希望社會否定及杯葛這項跨時代的技術(shù)。趨于統(tǒng)一是世界的發(fā)展的趨勢,互聯(lián)網(wǎng)的誕生恰恰就是將世界聯(lián)系在一起,而云計算機則是這項技術(shù)的成熟與后續(xù),我們要做的是面對,接下來本文將嘗試從社會責(zé)任與技術(shù)兩個層面去討論這項技術(shù)帶來的問題的策略。
如今,不少用戶會對自己個人信息較為敏感從而不愿意主動提供給軟件服務(wù)公司,因此很多公司遮遮掩掩試圖讓用戶忽略式地同意軟件隱私合同。這種做法恰恰令隱私安全問題成為隱患。李克強總理曾在首屆世界互聯(lián)網(wǎng)大會上推廣互聯(lián)網(wǎng)+的概念,這也意味著國家鼓勵以及重視新時代中互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)結(jié)合發(fā)展,其中,云計算下的大數(shù)據(jù)更是其中不可或缺的一環(huán)?;ヂ?lián)網(wǎng)公司不必膽怯,而是應(yīng)該讓用戶清楚明白在使用此款軟件時需要收錄他們何種資料及數(shù)據(jù),他們有權(quán)選擇是否使用。在這種人人皆知自己信息要為軟件程序使用的背景下,社會的關(guān)注度也會隨之上升,相關(guān)法律法規(guī)及監(jiān)督機制也會完善與規(guī)范。
Behrouz A.Forouzan曾在其著作《計算機科學(xué)導(dǎo)論》關(guān)于安全的章節(jié)討論過,數(shù)據(jù)安全的三個目標:機密性、完整性、可用性。
由于篇幅有限,本文中我們主要討論涉及用戶數(shù)據(jù)私密數(shù)據(jù)的安全部分即機密性與完整性的改進空間。以現(xiàn)階段技術(shù)層面來講,能對數(shù)據(jù)機密性產(chǎn)生威脅的手段有兩種:嗅探與流量分析。首先討論嗅探,嗅探是指對數(shù)據(jù)的非授權(quán)訪問或偵聽。但不法分子能通過嗅探來獲得用戶資料加以利用的前提是該數(shù)據(jù)是未經(jīng)加密或者只做常見的加密處理,據(jù)世界互聯(lián)網(wǎng)安全大會統(tǒng)計,目前全世界仍然有約百分之二十甚至更多的軟件在傳輸客戶資料數(shù)據(jù)時不對數(shù)據(jù)進行任何的加密,這無疑是對用戶資料的不負責(zé)任。由此看來,在政策層面要求涉及用戶隱私數(shù)據(jù)交換分析的軟件公司實施強制性的用戶資料加密處理是很有必要的。
另一種會對數(shù)據(jù)機密性造成威脅的技術(shù)是流量分析,流量分析是指攻擊者通過在線流量進行監(jiān)控和收集,這種攻擊技術(shù)雖然不受數(shù)據(jù)加密的約束但它只能通過對流量的監(jiān)控來推斷數(shù)據(jù)的類型,而對用戶數(shù)據(jù)內(nèi)容并沒有窺視與竊取的能力。
第二個重點需要解決的便是數(shù)據(jù)的完整性,傳統(tǒng)觀點認為數(shù)據(jù)完整性的攻擊威脅主要在篡改、假冒、重放和抵賴四種方式上。經(jīng)過對四種方式進行分類討論之后我們不難發(fā)現(xiàn),篡改、重放與抵賴都是基于信息被偵聽的情況下才能發(fā)生。結(jié)合上述對機密性的討論,由此可見,安全性問題在技術(shù)上最根本的研究方向應(yīng)該是需要一套完善的對數(shù)據(jù)加密與解密的體系。
目前傳統(tǒng)大企業(yè)對于公司內(nèi)部機密文件采取的是對稱密鑰密碼術(shù)。具體地講,假如A公司有一份機密文件‘Am’需要傳送給B公司,首先A公司會將機密文件‘Am’從明文經(jīng)過加密算法轉(zhuǎn)換成密文‘SAm’,此時他們通過一個普通信道(該信道并不隱蔽)進行傳輸,之后A公司與B公司便需要另一個安全通道來傳遞解開密文的算法(密鑰),密鑰可能是通過雙方見面的方式遞交也可能通過互相連通的安全信道進行傳遞。誠然,這種方法在安全性與保密性方面都能很好地兼顧,他能幫助公司解決內(nèi)部文件的傳達。但若要為如今互聯(lián)網(wǎng)時代龐大的用戶數(shù)據(jù)交換選擇一種類似的保護措施,傳統(tǒng)的對稱密鑰密碼術(shù)便存在很大的漏洞。首先是人為的安全性問題,密鑰的公式是由某一方的公司所設(shè)計,且不說既得利益方會不會出賣密鑰,在傳遞或傳輸?shù)倪^程不被攔截或竊取就已經(jīng)很難保證,另一個缺點就是時間效益,畢竟用戶大數(shù)據(jù)的交換要比公司的機密文件傳達頻繁得多,假如每一次的資料傳輸都要選擇一個安全的信道或者見面?zhèn)鬟f,無疑是經(jīng)濟與時間上的嚴重浪費。
我們可以嘗試在這種方案上進行改良。在對于需要公司內(nèi)部或者合作公司之間甚至是公司與國家之間對用戶的隱私數(shù)據(jù)進行傳輸時,可使用由國家層面的授權(quán)機構(gòu)開發(fā)的將明文按照某一隨機規(guī)律轉(zhuǎn)換密鑰,這種轉(zhuǎn)換密鑰安裝在需要用戶提供資料的軟件接口,所有傳輸?shù)挠脩魯?shù)據(jù)都將以密文的形式進行傳遞,而傳遞到目標機構(gòu)后,再由該機構(gòu)以某種身份確認的方式(如生物指紋識別、工作卡授權(quán))等向密鑰機構(gòu)核實身份,由密鑰機構(gòu)提供對應(yīng)的密鑰,由于整個過程都是在互聯(lián)網(wǎng)層面進行,不僅耗時短,也降低了用戶資料泄露的風(fēng)險。
在早已進入云計算時代的今天,數(shù)據(jù)的收集量與分析能力已遠超以往任何一個時代,近年來手機程序愈發(fā)智能為人們提供了無限便捷的同時,我們也目睹了越來越多的用戶信息遭受泄露,一個個網(wǎng)絡(luò)或電話欺詐案例導(dǎo)致無數(shù)家庭損失慘重,這背后若無大數(shù)據(jù)的分析,單憑騙徒們的花言巧語是不可能達成的。用戶的隱私泄露已經(jīng)到達一個我們無法想象的程度,但卻沒有多少人愿意正視這個問題,本文是對這個云時代用戶隱私的探討,希望引起更多人的注意,有拋磚引石之用,使得我們在享受技術(shù)發(fā)展帶來果實的同時也能共同解決雙刃劍帶給社會的傷害。
[1][美]Behrouz,A,F(xiàn)orouzan.計算機科學(xué)導(dǎo)論[M].北京:機械工業(yè)出版社,2015.
[2]云創(chuàng)大數(shù)據(jù).云計算是什么意思 什么是云計算[EB/OL].云創(chuàng)大數(shù)據(jù).