技術(shù)宅
小一點的隱私泄露,是類似自己的電話號碼被惡意外傳,導(dǎo)致我們不停地接到各種騷擾電話。嚴(yán)重的則可能包含身份證、實際住址、銀行卡號等等,這類信息的泄露會給我們帶來更大的麻煩。
我們的這些隱私信息是怎么被泄露的呢?原因之一是由于內(nèi)部人員或者黑客造成的。比如前段時間網(wǎng)上流出的某某酒店入住數(shù)據(jù),就是黑客入侵酒店服務(wù)器后導(dǎo)致的泄密,這種類型的泄密,作為用戶基本上是無法避免的。而隨著大數(shù)據(jù)技術(shù)的發(fā)展,另一個讓我們防不勝防的隱私泄密原因也逐漸變得常見,這就是一些科技公司通過大數(shù)據(jù)畫像“非法獲取”隱私信息(圖1)。
①大數(shù)據(jù)畫像
日常網(wǎng)絡(luò)生活中,其實我們經(jīng)常要和一些大數(shù)據(jù)分析技術(shù)接觸,比如使用百度搜索的朋友,會在搜索框下方看到推薦的新聞資訊,這個推薦是個性化的,而且每個人的推薦資訊內(nèi)容都不相同,它是根據(jù)每個網(wǎng)友的興趣進行推送的(圖2)。
②百度新聞推薦
③淘寶商品推薦
百度的這一個性推薦功能,背后就是大數(shù)據(jù)分析的結(jié)果。百度根據(jù)用戶的搜索關(guān)鍵字和點擊分析出你的喜好,然后再有針對性地向你推薦符合你愛好的資訊。類似的還有淘寶、京東等網(wǎng)站,也會根據(jù)你的購物習(xí)慣向你精準(zhǔn)地推薦商品,同樣是基于大數(shù)據(jù)技術(shù)(圖3)。這些公司首先海量收集匿名用戶的各種網(wǎng)絡(luò)行為,如搜索偏好、購物習(xí)慣等進行群體畫像,然后再通過這些信息分析對目標(biāo)人物進行畫像。不過這些還只是人物的粗略畫像,從隱私角度來看并不算太過分(圖4)。
目標(biāo)人物畫像
而對于一些非法公司,則是通過真實的簡歷數(shù)據(jù)對自然人數(shù)據(jù)還原。比如淘寶是匿名收集某某喜歡購買數(shù)碼產(chǎn)品,而非法公司則直接根據(jù)簡歷信息搜索張三的真實信息,包括他的生活角色(如婚姻狀態(tài)為未婚)、社會關(guān)系(如父母是張山和李四)、位置信息(如籍貫是西安,在北京某某小區(qū)居?。┑鹊?,以此實現(xiàn)對自然人的精準(zhǔn)畫像(圖5)。
⑤對自然人數(shù)據(jù)還原畫像
另外隨著大家參與的網(wǎng)絡(luò)活動越來越多,我們還會在網(wǎng)上留下自己的郵箱、微信、QQ等社交ID,這些非法公司會將用戶數(shù)據(jù)和這些社交賬號關(guān)聯(lián),從而實現(xiàn)多個識別ID關(guān)聯(lián)、多種設(shè)備關(guān)聯(lián)、跨平臺行為關(guān)聯(lián)、線上線下數(shù)據(jù)互通,將每個人的各種隱私信息一網(wǎng)打盡。
更為恐怖的是,這些公司通過和第三方交換數(shù)據(jù)獲得其他信息,將各種信息綜合后再對其他的關(guān)聯(lián)用戶畫像。比如某公司通過各種手段獲得全國2.2億人的簡歷數(shù)據(jù)以及全國10億個不重復(fù)手機號碼數(shù)據(jù),以其為基礎(chǔ),在獲得張三的通訊錄信息后,又可以獲得張三好友李四的電話號碼,再將李四的號碼在簡歷數(shù)據(jù)庫中檢索后得到李四的所有信息。如此一來,即使李四沒有在該公司投遞過簡歷,李四的所有信息也會被該公司通過聚類分析全部獲?。▓D6)。
非法公司還會將以上信息匹配到平臺的簡歷庫,最終得出這些自然人及其周邊關(guān)系人的收入水平、潛在需求、關(guān)系影響等要素。所以,只要提供某個用戶的手機號碼,此非法公司就可以將其與自有的簡歷庫進行匹配,提取出這些自然人的各種隱私信息,包括年齡、性別、行業(yè)、職業(yè)、戶籍、收入、教育經(jīng)歷、工作經(jīng)歷、關(guān)系鏈等等。而且這些隱私信息會被販賣給各種需要的機構(gòu),導(dǎo)致我們的隱私連環(huán)泄露。這也就是為什么很多人從來沒有在房地產(chǎn)公司買過房,從來沒有參加過教育培訓(xùn),但是卻一直被莫名其妙的房產(chǎn)公司、培訓(xùn)機構(gòu)的電話騷擾的原因。
⑥聚類分析獲取其他用戶的隱私信息
通過上面的介紹我們知道,隱私的泄露很多是由于我們隨便在網(wǎng)上留下各種信息,被其他有心公司收集而導(dǎo)致的。特別是對于類似簡歷、工作經(jīng)歷這些真實信息,大家在參與這些網(wǎng)絡(luò)活動的時候,盡量選擇大型正規(guī)的公司投遞簡歷,避免自己的簡歷被不懷好意的人使用。另外一方面,對于類似網(wǎng)絡(luò)拉票、各種砍價活動盡量不要參與,因為這些活動的最終目的大多是為了獲取我們的微信、QQ等賬號信息的。另外,需要注意保存好自己的通訊錄,盡量不要使用不安全的在線方式保存通訊錄。