趙俊杰
(安徽財經(jīng)大學(xué)工商管理學(xué)院,安徽 蚌埠 233030)
電子商務(wù)中消費(fèi)者隱私保護(hù)問題研究
趙俊杰
(安徽財經(jīng)大學(xué)工商管理學(xué)院,安徽 蚌埠 233030)
隨著精準(zhǔn)化營銷和個性化服務(wù)的廣泛使用,一些市場主體越來越注重對消費(fèi)者的了解,他們在利益驅(qū)使下,在網(wǎng)上消費(fèi)者不知情或不情愿的情況下采取各種技術(shù)手段獲得和利用其信息,侵犯了消費(fèi)者的隱私權(quán)。盡管消費(fèi)者可以因此享受到更加便利和個性化的產(chǎn)品與服務(wù),但是他們對個人隱私的保護(hù)問題也日益關(guān)注。本文對電子商務(wù)中消費(fèi)者的隱私權(quán)進(jìn)行概述,并總結(jié)了電子商務(wù)中消費(fèi)者信息收集的常見途徑,最后對基于隱私保護(hù)的數(shù)據(jù)挖掘技術(shù)與常見算法進(jìn)行綜述。
電子商務(wù);消費(fèi)者;隱私保護(hù);數(shù)據(jù)挖掘;信息收集
隨著一切活動漸趨信息化,人們越來越依賴電腦、手機(jī)和網(wǎng)絡(luò),為了申請郵箱、注冊個人用戶、進(jìn)行網(wǎng)上交易或是網(wǎng)上購物,我們必須提供姓名、聯(lián)系地址等個人資料,有時甚至涉及出生年月、月收入等各種各樣的私人信息。在使用這些網(wǎng)絡(luò)新技術(shù)、享受網(wǎng)絡(luò)帶來的快樂和便利時,我們卻不得不付出信息被記錄下來的代價,平時不愿吐露、不能展現(xiàn)的隱私也可能因此而暴露在公眾面前。據(jù)普華永道公司的調(diào)查,有81%的網(wǎng)絡(luò)用戶和79%的網(wǎng)上消費(fèi)者對他們的個人隱私受到威脅感到擔(dān)憂。更有說服力的是,有6%的網(wǎng)絡(luò)用戶和9%的網(wǎng)上消費(fèi)者聲稱他們曾經(jīng)成為過侵犯隱私的受害者。在網(wǎng)上從事直郵廣告業(yè)務(wù)的智能郵遞公司的一次調(diào)查表明,有75%的本來打算購物的消費(fèi)者在被要求提供個人信息和信用卡信息時改變了主意[1]。
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中已經(jīng)廣泛使用,對個人隱私的保護(hù)帶來了更加嚴(yán)峻的挑戰(zhàn)。主要體現(xiàn)在兩個方面:一方面,供各種挖掘方法使用的數(shù)據(jù)庫中存儲了大量的敏感信息,其中有些信息是在個人無意識甚至是不知情的情況下被收集的,而網(wǎng)絡(luò)及其他媒體對信息的無限制暴露,已經(jīng)開始對個人隱私構(gòu)成嚴(yán)重威脅;另一方面,各種數(shù)據(jù)挖掘方法與工具的不斷完善,也為一些普通用戶通過不正當(dāng)手段獲取他人隱私信息提供了可能。如何對數(shù)據(jù)進(jìn)行有效地挖掘,并同時保證個人的相關(guān)隱私不被泄漏,成為近年來數(shù)據(jù)挖掘領(lǐng)域的一個研究熱點(diǎn)。
個人隱私權(quán)是指個人對個人資料擁有民法所規(guī)定的權(quán)利,這些權(quán)利大致包括:控制權(quán)、收回權(quán)、知悉權(quán)、修改權(quán)和請求司法救濟(jì)權(quán)。電子商務(wù)中個人隱私權(quán)是指網(wǎng)絡(luò)與電子商務(wù)中所涉及到對個人數(shù)據(jù)的收集、傳遞、存儲和加工利用等各個環(huán)節(jié)中網(wǎng)絡(luò)用戶的個人和生活不被干擾的權(quán)利與個人資料的支配控制的權(quán)利。其中個人數(shù)據(jù)主要指自然人的姓名、性別、出生年月、身份證號、特征、指紋、婚姻、家庭、教育、職業(yè)、健康、病歷、財務(wù)情況、社會活動、E-mail信息、IP地址、Username與password等資料。隱私權(quán)保護(hù)主要涉及三方面問題:個人數(shù)據(jù)過度收集;個人數(shù)據(jù)二次開發(fā)利用和個人數(shù)據(jù)交易。
電子商務(wù)中個人隱私權(quán)從不同的角度來劃分,可以有多種分類方法。首先,從權(quán)利形態(tài)來分有隱私不被窺視的權(quán)利、不被侵入的權(quán)利、不被干擾的權(quán)利、不被非法收集利用的權(quán)利。其中,隱私不被窺視、侵入的權(quán)利主要體現(xiàn)在用戶的個人信箱、網(wǎng)上賬戶、信用記錄的安全保密性上;隱私不被干擾的權(quán)利主要體現(xiàn)在用戶使用信箱、交流信息及從事交易活動的安全保密性上;不被非法收集利用的權(quán)利主要體現(xiàn)在用戶的個人特質(zhì)、個人資料等不得在非經(jīng)許可的狀態(tài)下被利用上。其次,從權(quán)利的內(nèi)容分可以有個人特質(zhì)的隱私權(quán)、個人資料的隱私權(quán)、個人行為的隱私權(quán)、通訊內(nèi)容的隱私權(quán)和匿名的隱私權(quán)等。
電子商務(wù)企業(yè)通常會利用各種途徑對消費(fèi)者的資料進(jìn)行收集,包括購物習(xí)慣、消費(fèi)喜好、經(jīng)濟(jì)狀況等,通過加工整理,獲得具有商業(yè)價值的資料,形成比較優(yōu)勢。但這種行為可能會對消費(fèi)者的個人隱私構(gòu)成極大的威脅,因為有些收集行為是通過正當(dāng)途徑且告知消費(fèi)者的,而有些收集行為是利用不正當(dāng)?shù)氖侄?,是在消費(fèi)者不知情的情況下進(jìn)行的。電子商務(wù)企業(yè)對消費(fèi)者信息收集途徑主要有以下幾種:
(1)網(wǎng)上直接調(diào)查法。網(wǎng)上直接調(diào)查法根據(jù)采用調(diào)查方法不同,可分為網(wǎng)上問卷調(diào)查法、網(wǎng)上實驗法和網(wǎng)上觀察法,常用的是網(wǎng)上問卷調(diào)查法。利用網(wǎng)上調(diào)查有很多優(yōu)點(diǎn),例如提高調(diào)研效率、調(diào)查數(shù)據(jù)處理便捷、降低調(diào)查成本、不受地理區(qū)域限制等,其具體形式主要包括:網(wǎng)上搜索法、網(wǎng)站跟蹤法、電子郵件法、在線調(diào)查問卷、郵件列表法、對網(wǎng)站訪問者的抽樣調(diào)查和固定樣本調(diào)查等。
(2)利用在線注冊收集消費(fèi)者信息。網(wǎng)上消費(fèi)者為了進(jìn)行電子商務(wù)交易,一般要求首先進(jìn)行在線注冊,成為電子商務(wù)網(wǎng)站的會員。電子商務(wù)網(wǎng)站為了個性化營銷,有時要求消費(fèi)者填寫較為詳細(xì)的個人信息。例如年齡、性別、出生年月、收入、住址、職業(yè)、個人興趣和愛好,有的甚至包括身高、體重等項目。
(3)利用Cookies文件收集用戶的隱私信息。Cookies最初的應(yīng)用是判定注冊用戶是否已經(jīng)登錄網(wǎng)站,在征得用戶許可下網(wǎng)站保留用戶信息以便簡化登錄手續(xù);另一個重要應(yīng)用場合是“購物車”之類處理。現(xiàn)在的許多網(wǎng)站在每個訪客進(jìn)入網(wǎng)站時將cookie放入訪客電腦,不僅能知道用戶在網(wǎng)站上買了些什么,還能掌握該用戶在網(wǎng)站上看過哪些內(nèi)容,總共逗留了多長時間等,以便了解網(wǎng)站的流量和頁面瀏覽數(shù)量。
(4)利用間諜軟件竊取隱私信息。間諜軟件是在未經(jīng)用戶許可的情況下搜集用戶個人信息的計算機(jī)程序。間諜軟件在用戶不知情或未經(jīng)用戶準(zhǔn)許的情況下收集用戶的個人數(shù)據(jù)。它可以在用戶使用計算機(jī)時通過截屏抓取到敏感文檔,登錄信息數(shù)據(jù)庫,或者在用戶輸入信息的時候捕獲敏感的文檔。它所收集的數(shù)據(jù)范圍可以很廣闊,從該用戶平日瀏覽的網(wǎng)站,到諸如用戶名稱、密碼等個人數(shù)據(jù)。
(5)利用木馬病毒收集消費(fèi)者信息。木馬程序是目前比較流行的病毒文件,它與一般的病毒不同,不會自我繁殖,也并不刻意地去感染其它文件,它通過將自身偽裝吸引用戶下載執(zhí)行,向施種木馬者提供打開被種主機(jī)的門戶,使施種者可以任意毀壞、竊取被種者的文件,甚至遠(yuǎn)程操控被種主機(jī)。一些黑客或商家利用木馬病毒來收集消費(fèi)者信息。
(6)利用網(wǎng)絡(luò)入侵收集消費(fèi)者信息。網(wǎng)絡(luò)入侵是指網(wǎng)絡(luò)攻擊者通過非法的手段(如破譯口令、電子欺騙等)獲得非法的權(quán)限,并通過使用這些非法的權(quán)限使網(wǎng)絡(luò)攻擊者能對被攻擊的主機(jī)進(jìn)行非授權(quán)的操作。網(wǎng)絡(luò)入侵的主要途徑有:破譯口令、IP欺騙和DNS欺騙。由于互聯(lián)網(wǎng)的弱安全性和用戶防護(hù)意識薄弱,很容易導(dǎo)致入侵者利用這些弱點(diǎn)入侵他人的計算機(jī)而竊取隱私信息。
(7)利用釣魚網(wǎng)站收集消費(fèi)者信息。釣魚網(wǎng)站通過提供錯誤的網(wǎng)頁來模仿正規(guī)社交網(wǎng)站、游戲網(wǎng)站、購物網(wǎng)站或網(wǎng)銀頁面等方式,騙取消費(fèi)者在網(wǎng)頁上輸入賬號、密碼、驗證碼等各類個人信息。輸入后,密碼就會被控制釣魚網(wǎng)站的黑客所竊取。另外,也可以獲取用戶訪問了哪個網(wǎng)頁、在網(wǎng)頁表格中輸入了哪些數(shù)據(jù)等隱私信息。
(8)非法轉(zhuǎn)讓隱私信息。在互聯(lián)網(wǎng)免費(fèi)商業(yè)模式下,網(wǎng)站利用免費(fèi)服務(wù)吸引用戶注冊,以組建龐大的用戶群體,形成大數(shù)據(jù)信息。隨著開放平臺這種新型網(wǎng)絡(luò)服務(wù)模式的不斷發(fā)展,擁有龐大用戶基數(shù)的網(wǎng)站通過開放平臺為第三方網(wǎng)站提供我們的個人數(shù)據(jù)以獲取利益。有數(shù)據(jù)顯示,開放平臺以用戶資源進(jìn)行商業(yè)運(yùn)作的模式,已經(jīng)成為主要網(wǎng)絡(luò)經(jīng)營模式。大多數(shù)用戶在不知情的情況下,自己的信息就被第三方合作伙伴拿走了。
現(xiàn)有的一些隱私保護(hù)技術(shù)大體上可基于下面因素對它們分類:數(shù)據(jù)分布、隱私保護(hù)技術(shù)、數(shù)據(jù)或規(guī)則更改方法、數(shù)據(jù)挖掘算法。不同的分類標(biāo)準(zhǔn)所對應(yīng)的隱私保護(hù)的數(shù)據(jù)挖掘技術(shù)也存在較大差異,以基本策略為依據(jù),可將基于隱私的數(shù)據(jù)挖掘技術(shù)分為:(1)數(shù)據(jù)擾亂法。通過在研究過程中對數(shù)據(jù)進(jìn)行隨機(jī)變換,或?qū)?shù)據(jù)進(jìn)行離散與添加噪聲,以達(dá)到對原始數(shù)據(jù)進(jìn)行干擾的目的,其代表算法為MASK法;(2)查詢限制法。通過對數(shù)據(jù)進(jìn)行隱藏、抽樣和劃分,以達(dá)到盡量避免數(shù)據(jù)挖掘者擁有完整原始數(shù)據(jù)的目的,在此基礎(chǔ)上,借助分布式計算或是概率統(tǒng)計,獲得所需的數(shù)據(jù)挖掘結(jié)果。但在利用查詢限制法進(jìn)行隱私保護(hù)時,經(jīng)常存在一個問題,即所提供的數(shù)據(jù)全部為真實的原始數(shù)據(jù),雖然不完整,但也會降低對隱私的保護(hù)效果。以隱私保護(hù)的結(jié)果為依據(jù),又可將相關(guān)的數(shù)據(jù)挖掘技術(shù)分為:(1)啟發(fā)式技術(shù)。又稱為掃描技術(shù),通過將數(shù)據(jù)挖掘的經(jīng)驗和相關(guān)知識移植到檢查病毒的軟件當(dāng)中,進(jìn)而查找出可能存在侵犯用戶隱私的惡意程序或代碼;(2)密碼技術(shù)。密碼技術(shù)是研究如何較為隱蔽地傳遞信息的一門技術(shù),通過應(yīng)用分組密碼和流密碼等相關(guān)技術(shù),從而對陌生的數(shù)據(jù)訪問請求進(jìn)行攔截,以達(dá)到保護(hù)隱私的作用;(3)重構(gòu)技術(shù)。通過利用數(shù)據(jù)重構(gòu)技術(shù),通過結(jié)果轉(zhuǎn)換以及格式變換和類型替換等方式對數(shù)據(jù)空間的結(jié)構(gòu)和格式做出調(diào)整,在實現(xiàn)異構(gòu)數(shù)據(jù)與多源數(shù)據(jù)有效融合的基礎(chǔ)上,降低隱私數(shù)據(jù)被篡改或盜用的可能[2]。
目前,常見的基于隱私保護(hù)的數(shù)據(jù)挖掘算法主要有三類:數(shù)據(jù)預(yù)處理算法、基于關(guān)聯(lián)規(guī)則的算法和基于分類的算法。數(shù)據(jù)預(yù)處理算法是在數(shù)據(jù)預(yù)處理階段刪除數(shù)據(jù)中最敏感的某些字段,如姓名和證件號碼等,或在數(shù)據(jù)集中隨機(jī)添加、修改和轉(zhuǎn)換某些字段的數(shù)據(jù),這些數(shù)據(jù)能起到干擾作用,從而避免隱私泄露。基于關(guān)聯(lián)規(guī)則的算法首先在數(shù)據(jù)集中挖掘關(guān)聯(lián)規(guī)則,然后通過預(yù)先設(shè)定的學(xué)習(xí)方法或人工方法區(qū)分敏感規(guī)則和非敏感規(guī)則,根據(jù)敏感規(guī)則可以刪除其中的部分敏感項或給予較低的權(quán)重?;诜诸惖乃惴ㄊ墙⒁粋€沒有隱私泄露的分類規(guī)則,用于區(qū)分包含隱私的信息和不包含隱私的信息。對于每條數(shù)據(jù),該方法都使用一些字段代替敏感字段,再進(jìn)一步計算這種替換對于數(shù)據(jù)集本身的影響,從而找出一種盡量少泄露隱私又不破壞數(shù)據(jù)集完整性的方案。具體算法如文獻(xiàn)[3]提出一個多參數(shù)隨機(jī)擾動算法,文獻(xiàn)[4]提出了安全多方計算技術(shù)的方法,文獻(xiàn)[5]把密碼學(xué)中的同態(tài)加密和數(shù)字信封技術(shù)應(yīng)用其中,成功挖掘出可用的共享規(guī)則,且很好地保護(hù)了參與方的隱私。此外,匿名隱私保護(hù)也是一種常見的隱私保護(hù)方法,它是通過泛化數(shù)據(jù)標(biāo)識符來防止隱私數(shù)據(jù)泄露[6]。
面臨個人隱私受到嚴(yán)重威脅的現(xiàn)狀,使得電子商務(wù)中個人隱私成為人們越來越關(guān)心的問題之一,同時也使個人隱私安全成為電子商務(wù)面臨的最大挑戰(zhàn)之一。許多消費(fèi)者不愿意參與電子商務(wù)交易的一個重要原因,就是出于對自己個人隱私安全的擔(dān)憂,從而喪失了對電子商務(wù)的信心。因為個人隱私安全的原因使大批消費(fèi)者和網(wǎng)絡(luò)用戶遠(yuǎn)離電子商務(wù),嚴(yán)重影響了電子商務(wù)的順利發(fā)展。所以,保證用戶在電子商務(wù)活動中的個人隱私安全不僅能夠留住一大批的電子商務(wù)潛在消費(fèi)者和客戶,更重要的是,能夠在消費(fèi)者心中建立起對電子商務(wù)的信心,為電子商務(wù)的長遠(yuǎn)發(fā)展奠定堅實基石。除了要進(jìn)行立法保護(hù)、消費(fèi)者自我保護(hù)意識培養(yǎng),以及采用各種技術(shù)手段之外,企業(yè)在收集消費(fèi)者個人信息時,也應(yīng)該做到:一是要告知消費(fèi)者,獲得消費(fèi)者同意;二是根據(jù)信息適量原則進(jìn)行收集;三是保護(hù)收集消費(fèi)者個人信息不被泄露。
[1]周水庚,李豐.面向數(shù)據(jù)庫應(yīng)用的隱私保護(hù)研究綜述[[J].計算機(jī)學(xué)報,2009,32(5):847-861.
[2]宋金玲,劉國華,黃立明,等.k-匿名隱私保護(hù)模型中k值的優(yōu)化選擇算法[J].小型微型計算機(jī)系統(tǒng),2011,32(10):1987-1993.
[3]王銳,劉杰.隱私保護(hù)關(guān)聯(lián)規(guī)則挖掘算法的研究[[J].計算機(jī)工程與應(yīng)用,2009,45(26):126-130.
[4]周志純.隱私保護(hù)數(shù)據(jù)挖掘研究[D].合肥合肥工業(yè)大學(xué),2008.
[5]Cliffton C,Kantarcioglu M,Vaidya J,et a1.Tools for Privacy Preserving Distributed Data Mining.ACM SIGKDD Explorations Newsletter,2004,4(2):28-34.
[6]金華,張志祥,劉善成,等.基于敏感性分級的(α,k)-匿名隱私保護(hù)[J].計算機(jī)工程,2011,37(14):12-17.
Research on the Protection of Consumers'Privacy in Electronic Commerce
Zhao Junjie
(Anhui University of Finance,Bengbu 233030,Anhui)
With the wide use of precision marketing and personalized services,some of the market main body pays more and more attention to understand the consumers,they are motivated by profit to obtain and make use of its information of online consumers without knowledge or willingness.It violates the privacy of consumers.Although consumers can enjoy more convenient and personalized products and services,they also pay attention to the privacy of personal information protection increasingly.This paper summarizes the consumer privacy in e-commerce,and sums up the common way of consumer information collection in electronic commerce.Finally,the data mining technology and common algorithm based on privacy protection are summarized.
electronic commerce;consumer;privacy protection;data mining;information collection
D923
A
1008-6609(2016)05-0033-03
趙俊杰,男,安徽宿州人,碩士,講師,研究方向:電子商務(wù)與數(shù)據(jù)挖掘。
安徽財經(jīng)大學(xué)校級科研項目《電子商務(wù)中消費(fèi)者隱私保護(hù)問題研究》,項目編號:ACKY1430。