2012年,如果評選一個年度最火的IT詞語,那么非大數(shù)據(jù)莫屬,而進入2013年以來,這一局面似乎也得到了延續(xù)。大數(shù)據(jù)具有大價值,這似乎是每個人都認同的觀點,直到“棱鏡門”事件的出現(xiàn)。
2013年6月5日,愛德華·斯諾登把“棱鏡門”的秘密曝光于大庭廣眾之下。此后,一石激起千層浪,美國政治界、外交界和軍界均受到不同程度的沖擊。
在這一事件中,被直接點名的幾大IT公司——蘋果、Facebook、微軟、谷歌、雅虎、YouTube、Skype、AOL和PalTalk——已紛紛展開公關攻勢;美國的智慧產品出口復興計劃,以及歐美自由貿易協(xié)定的談判進程,也必將受到“棱鏡門”的影響。
據(jù)了解,美國代號為“棱鏡”(PRISM)的高度機密行動此前從未對外公開。據(jù)《華盛頓郵報》獲得的文件顯示,美國總統(tǒng)的日常簡報內容也部分來源于此項目,另一份文件指出,“美國國家安全局的報告越來越依賴‘棱鏡’,其已經成為他們的主要信息來源?!倍髷?shù)據(jù)則被認為是獲得這類信息的主要方式。該報道刊出后各界一片嘩然。美國保護公民隱私組織予以強烈譴責,表示不管奧巴馬政府如何以反恐之名進行申辯,其都侵犯了公民基本權利。與此同時,“棱鏡門”也將大數(shù)據(jù)技術是否威脅公民信息安全的問題推上了風口浪尖。
安全威脅
大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業(yè)經營決策更積極目的的資訊。而大數(shù)據(jù)來源就是每個個體,無論個人的生活、消費,抑或是身份特征等信息,最終都會變成以各種形式存儲的數(shù)據(jù)。通過運用大數(shù)據(jù)分析工具對海量數(shù)據(jù)進行分析,企業(yè)可以從中獲取價值,但是對于個人用戶來說,卻是個不得不被動接受的事實,并且在數(shù)據(jù)收集、分析、傳輸?shù)冗^程中,如果遇到保護不利的情況都可能對用戶帶來影響,增加個人信息泄漏的可能。
在中國,大數(shù)據(jù)技術的運用其實已悄悄地來到我們身邊。例如,在某聊天工具上,當你增加一個好友的時候,會隨之而來顯示“你可能認識的人”。在微博上,也會顯示“共同關注的人”,微關系等。以上兩種情況都是通過大數(shù)據(jù)分析工具而實現(xiàn)的服務。但這些看似非常方便的功能,在現(xiàn)實生活中卻有可能遭遇尷尬。比如,之前的戀人總出現(xiàn)在“可能認識的人”中,這種使雙方都感到尷尬的局面對某些人來說就是麻煩。
清華大學國際傳播研究中心副主任、西南政法大學副教授郭曉科告訴《中國經濟信息》,國內外科學家研究大數(shù)據(jù)技術后,發(fā)現(xiàn)大數(shù)據(jù)所產生的問題往往很嚴重,主要是對個人信息安全的威脅,其中既包括隱私、財產安全,也包括個人信息不被暴露。例如,美國已有的一項大數(shù)據(jù)技術顯示,根據(jù)某人在Google上的檢索情況或微博的發(fā)言,就能推測出其真實信息。
針對這種局面,各國學界一直在研究解決對策。根據(jù)郭曉科的介紹,現(xiàn)在主要采取三種策略保護個人信息。第一種是知情同意。但實際上沒人會去通篇閱讀這些條款,或者拒絕,致使其成為企業(yè)的保護傘,而流于形式。第二是模糊策略,即打馬賽克。比如在谷歌街景中,通過網(wǎng)民的舉報,把某些圖片模糊處理,這無異于亡羊補牢。第三是匿名化策略,即網(wǎng)絡服務商有義務提供匿名服務,保護網(wǎng)民信息。但在大數(shù)據(jù)技術的背景下,以上種種手段往往收效甚微。
“尤其是采用匿名化上網(wǎng)策略,我認為并不能保護信息安全。因為這種匿名上網(wǎng)實際上是在實名上網(wǎng)。當網(wǎng)民網(wǎng)絡購物時,必然輸入地址、姓名、手機等重要信息,這些信息一經登記便無法抹去,等于是在實名上網(wǎng),而犯罪分子則是匿名搜集信息。”郭曉科無奈的說。
價值遭疑?
大數(shù)據(jù)技術最大的價值是什么?毋容置疑,是人類的決策的方式和方法的變革,這種決策既包括政府、企業(yè),也包括個人。“在整個人類的決策史上,最初是通過經驗依靠直覺判斷,后來人類學會了統(tǒng)計分析,學會了用數(shù)據(jù)說話,但依然屬于描述的范疇,主觀性比較強。大數(shù)據(jù)時代核心則是讓數(shù)據(jù)說話,這樣的決策才是相對最科學的。”郭曉科認為。
從2009年,美國人首先提出大數(shù)據(jù)概念后,相關的業(yè)界領袖便預言,大數(shù)據(jù)將引發(fā)新的“智慧革命”。自從互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云技術等技術產生以來,整個世界在不停地產生、紛繁復雜的,依靠常人的能力和常規(guī)技術無法處理的巨量信息。大數(shù)據(jù)技術最大的價值就是從海量數(shù)據(jù)中,幫助人類發(fā)現(xiàn)知識、提升智能、創(chuàng)造價值。自此,世界的整體結構將越來越具備“智慧”特征,人類將更“智慧”地利用信息,對世界和他人作出更加“智慧”的判斷與回應,甚至整個城市也將智慧起來,而智慧城市的“智慧”主要出自對大數(shù)據(jù)的處理。
眼下,大數(shù)據(jù)的智慧功能在很多項目中已看到了成果。2013年4月,《科學》雜志上還發(fā)表了運用維基百科等大數(shù)據(jù)庫的關鍵詞來預測股市波動的文章。
但“棱鏡門”事件之后,人們開始關注被忽略已久的大數(shù)據(jù)的另一面——所謂弊端。
國內某機構研究大數(shù)據(jù)問題的專家司啟昌告訴《中國經濟信息》,大數(shù)據(jù)并不完全等于大價值。在企業(yè)中,大數(shù)據(jù)分析設備往往對企業(yè)IT設備有更高的要求。當數(shù)據(jù)達到一定值時,投入的價值甚至超過所得數(shù)據(jù)價值。當企業(yè)注意力被分散到很多碎片化的信息上時,這種技術害處便顯現(xiàn)了。
此外,很多廠商都針對大數(shù)據(jù)推出了自己的解決方案。而這些方案雖然號稱兼容性非常強,但企業(yè)卻往往容易被供應商綁定,這就大大地限制了企業(yè)IT基礎的靈活性。
“負面問題是有的,但總的來說,根據(jù)麥肯錫研究所的研究報告顯示,在美國運用大數(shù)據(jù)的企業(yè)中,其所創(chuàng)造的價值遠遠超出了投入。對于企業(yè)提升生產效率,產品升級換代,以及幫助企業(yè)制定核心策略都具有非常高的價值?!惫鶗钥普f。
達爾文在《進化論》中闡述了這樣的觀點,最終能生存下來的是最靈敏能夠適應變化的生物。“對于企業(yè)也是如此,如果能夠找到與大數(shù)據(jù)的結合點,就能為其生存和發(fā)展帶來先機,所以絕對不能否認大數(shù)據(jù)的積極意義。”郭曉科說。
他認為,只要企業(yè)有分工的概念就可以解決這一問題?!拔磥砘蛟S會出現(xiàn)一批新型的數(shù)據(jù)管理公司,他們可以部分取代企業(yè)的IT部門,企業(yè)只需要以服務外包的形式,把這種工作委托給專門公司,而自己只需要保留最能體現(xiàn)其核心競爭力的人才。云計算則完全可以解決企業(yè)遭到綁定的問題。”郭曉科自信地說。
“未來,企業(yè)運用大數(shù)據(jù)的成本主要是購買數(shù)據(jù)的費用,數(shù)據(jù)挖掘費用則非常低?!惫鶗钥普J為。
“棱鏡”的啟示
“棱鏡門”事件帶來公眾對公權力的擔憂,主要是擔心個人的信息安全,包括企業(yè)信息安全。郭曉科說:“政府處于社會公權力金字塔的頂尖,所以該事件對于政府的啟示應該是以立法的形式保障信息主權?!?/p>
過去,主權更多指政治主權,經濟主權,領土,領海,領空的安全?,F(xiàn)在,由于網(wǎng)絡虛擬空間的崛起,國家的信息主權受到廣泛關注。
郭曉科向記者分析道,如果我們把信息主權作為一種主權的話,從國際法的角度,“棱鏡門”事件就是美國侵犯了其他國家的主權。從政府的角度,應該確立政府對保護公民信息安全的責任和義務,當政府的利益與公民信息安全發(fā)生矛盾沖突時,政府的權利邊界和義務是什么。只有以這種立法的方式才能打消公眾的疑慮。
“棱鏡門”事件給全世界敲響了警鐘,過去全世界都指責中國對互聯(lián)網(wǎng)的管制。棱鏡門曝光后讓我們看到信息主權提出是當務之急。
郭曉科說:“與立法同步的應該是政府信息的公開以及國家戰(zhàn)略的確定,因為各國政府手中往往撰有最豐富、最有價值的信息富礦。例如,美國data.gov網(wǎng)站就是美國政府分批次、有目的、有計劃地公布政府掌握數(shù)據(jù)的網(wǎng)站。讓企業(yè)進行挖掘?!比ツ?月,美國總統(tǒng)奧巴馬簽署了一個大數(shù)據(jù)國家戰(zhàn)略,認為美國未來要保持經濟、科技、軍事霸主地位,就要在大數(shù)據(jù)方面搶占先機。
對于中國而言,首先就是政務信息、氣象資料等公共信息的公開。同時制定專門的支持大數(shù)據(jù)的計劃,包括資金政策等,為企業(yè)運用大數(shù)據(jù)技術提供良好的平臺。
“大數(shù)據(jù)技術的特征是依靠人的智力而非機器設備,只要有立法作為保障,對于像北京這樣的城市乃至整個中國都是千載難逢的機遇?!惫鶗钥瓶隙ǖ恼f。