劉千仞,薛 淼,任夢璇,王光全(中國聯(lián)通網(wǎng)絡技術研究院,北京100048)
隨著移動互聯(lián)網(wǎng)的普及,每個人都有若干個賬號,包括網(wǎng)站和應用,這些賬號都叫做數(shù)字身份。對應實際生活中的身份證,數(shù)字身份則是用戶虛擬生活中的標識,其重要性不言而喻,用戶在互聯(lián)網(wǎng)上活動的基礎是數(shù)字身份,用戶通過數(shù)字身份不斷與其他設備相連,這中間的所有聯(lián)系、交易、數(shù)據(jù)的完整性和隱私性都必須得到最佳的保護和管理,因此只有確保用戶數(shù)字身份的真實可靠,該用戶后續(xù)所產生的一系列交易和活動等才會生效。隨著數(shù)字身份技術和區(qū)塊鏈的發(fā)展,人們逐漸意識到二者之間有著巧妙的聯(lián)系。區(qū)塊鏈的私鑰加密、分布式存儲、全程可追溯可以充分保護用戶的隱私,并且用戶自己掌握自己信息的處理權,可以決定誰來以什么樣的目的查看和使用數(shù)據(jù)。用戶的數(shù)字身份信息不斷完善,可以從源頭上解決區(qū)塊鏈現(xiàn)存的只能保證鏈上存真,而無法去偽的問題,同時有效地促進區(qū)塊鏈信息流通共享,進而提高整體的認證效率。本文主要從數(shù)字身份的發(fā)展現(xiàn)狀及存在問題入手,探討引入?yún)^(qū)塊鏈技術的應用需求、場景及方案。
身份證是一組用于定義某項實體的特征數(shù)據(jù),并具有唯一相對性。身份證的使用包括2個過程,一是認證,即國家給予的身份證明,用來證明公民的合法地位;另一是驗證,利用身份證購車票、辦理酒店入住等。而數(shù)字身份則是特定實體物理身份的數(shù)字版本。世界經濟論壇(WEF)從使用屬性的角度將數(shù)字身份定義為獨特屬性的集合,用于描述一個實體并確定該實體可以參與的相關事務。
數(shù)字身份分為廣義和狹義2種,狹義的數(shù)字身份就是指數(shù)字賬號,廣義的數(shù)字身份涉及面則非常廣,因為在互聯(lián)網(wǎng)上進行活動,不僅人需要身份,公司甚至物品也都需要身份。有了可信的數(shù)字身份,互聯(lián)網(wǎng)上的信息傳遞和分享,商品交易和貿易合作才能更好地開展。
目前國家層面的數(shù)字身份是由公安部開發(fā)的eID工具,eID是一種以密碼技術為基礎、以智能安全芯片為載體、依托“公安部公民網(wǎng)絡身份識別系統(tǒng)”簽發(fā)給公民的網(wǎng)絡電子身份標識,可以在不泄露身份的前提下在線遠程識別身份。但eID只是像公民身份證號一樣,是一個專屬公民的編號,主要是用來認證,并且使用場景有限?,F(xiàn)在公民的數(shù)字身份信息其實是分散的,例如支付軟件存儲著交易信息,聊天軟件存儲著社交信息,游戲軟件存儲著娛樂信息,這些不同屬性的信息對于公民數(shù)字身份來說,就像是身體的各個部位,共同組成了最終的個體,屬性越全面,身份越完整;而一個好的數(shù)字身份可以通過整合新的信息,對用戶有一個全面的刻畫,能夠廣泛應用于社會各個領域。
如今國民經濟和社會發(fā)展各領域正在經歷著數(shù)字化變革,數(shù)字信息正成為經濟社會的發(fā)展動力和方向。然而數(shù)字身份要真正形成完備全面的系統(tǒng)還面臨著許多挑戰(zhàn)。
主要問題如下:
a)“基礎設施”不完善,認證成本高。正如上面提到的,用戶的數(shù)字身份信息往往多種多樣,不同行業(yè)不同部門往往都有各自的數(shù)字身份系統(tǒng),一個公民可能在多個系統(tǒng)內存在多套數(shù)字身份,造成了數(shù)據(jù)存儲資源的浪費,提升使用成本,并且各個系統(tǒng)之間互不相通,系統(tǒng)之間的相互認證需要經歷復雜的流程,認證成本較高。
b)隱私保護困難。談到數(shù)據(jù)隱私,就必須提到通用數(shù)據(jù)保護條例(GDPR)。GDPR是由歐盟推出的一個目的在于遏制個人信息被濫用,保護個人隱私的法案,于2016年4月試推出,正式生效時間為2018年5月25日。根據(jù)GDPR規(guī)定:企業(yè)在收集、存儲、使用個人信息時要取得用戶的同意,用戶對自己的個人數(shù)據(jù)有絕對的掌控權。然而,當下的情況則是用戶的個人隱私數(shù)據(jù)很容易被獲取,便宜出售,從而讓不良利益集團有機可乘,他們利用數(shù)據(jù)分析和精準營銷,定位目標用戶,進而對其進行詐騙,從而使用戶財產及相關的利益受損,并且相關企業(yè)業(yè)務如果涉及歐盟,還要面臨2 000萬歐元或全年營收4%的高額罰款。近年來用戶數(shù)據(jù)泄露數(shù)據(jù)頻發(fā),屢禁不止。表1是過去1年來影響較大的泄露數(shù)據(jù)的事件匯總。
c)認證流程繁瑣低效、容錯性過低。用戶使用不同的服務需要進行多次不同的認證,且主要通過復雜、低效的手動流程,用戶體驗十分不友好。并且傳統(tǒng)的中心化身份認證依賴于單一系統(tǒng)的穩(wěn)定性,一旦宕機或者中心化機構出現(xiàn)數(shù)據(jù)泄露,則影響系統(tǒng)響應服務,并造成信息安全事件,容錯性過低。
2018年達沃斯世界經濟論壇提出:一個好的數(shù)字身份應該滿足5個要素。
a)可靠性:好的數(shù)字身份應具備可靠性,可以建立對其所代表的人的信任,行使其權利和自由,以證明他們有資格獲得服務。
b)包容性:任何需要的人都可以建立和使用數(shù)字身份,不受基于身份相關數(shù)據(jù)的歧視風險影響,也不會面臨排除身份的身份驗證過程。
c)有用性:有用的數(shù)字身份易于建立和使用,并且可提供對多種服務和交互的訪問。
d)靈活性:個人用戶可以選擇如何使用他們的數(shù)據(jù),共享哪些數(shù)據(jù)以進行哪些交易,與誰交易以及持續(xù)多久。
e)安全性:安全性包括保護個人、組織或各種設備免遭身份盜用及濫用,不會出現(xiàn)未經授權的數(shù)據(jù)共享和侵犯人權等行為。
由此可見,像身份證、護照、駕駛證一樣,數(shù)字身份首先需要一個強力背書機構,通常這需要依靠政府的力量來進行,并以此身份認證為基礎進行擴展構建。在前文中也提到,用戶的絕大多數(shù)社會行為信息基本掌握在各類企業(yè)手中,社交、支付、購物、運動、交通信息等都分屬于不同的企業(yè),這些企業(yè)在構建用戶數(shù)字身份中將會起到舉足輕重的作用。而運營商由于手機號的緣故存在天然優(yōu)勢,一方面手機號基本能做到全用戶覆蓋,另一方面每個手機號都是經過實名認證的,一個手機號可以對應到一個實體人,每個人都會攜帶手機,這就是數(shù)字身份的最好載體,這也是運營商可以大力發(fā)展數(shù)字身份的重要原因。
表1 2018年數(shù)據(jù)泄露事件統(tǒng)計
早期的身份認證主要采用口令密碼的形式。用戶需要在網(wǎng)站或者應用上進行注冊并牢記自己的賬號、密碼,作為登錄的憑證。然而每個互聯(lián)網(wǎng)應用都有自己的認證體系和用戶體系,用戶在不同的互聯(lián)網(wǎng)應用之間是無法互聯(lián)互通的。因此,用戶需要記住不同應用對應的賬號和密碼,而若設置簡單或重復的密碼降低記憶成本,又可能會由于密碼泄露導致用戶的信息安全甚至經濟安全受到威脅。過多的應用導致用戶賬號管理困難。其中,任意一個賬號信息被泄露,用戶隱私將被無限擴散,導致用戶一方面面臨各種各樣的騷擾電話和短信,另一方面存在安全隱患,導致財產損失。根據(jù)調查顯示:約80%的用戶不喜歡賬號注冊的繁瑣過程;35%的在線購物者因為沒有賬戶放棄了購物;2018年中國消費者協(xié)會發(fā)布的《APP個人信息泄露情況調查報告》顯示,受訪者中曾因個人信息泄露而被騷擾或侵害的人數(shù)占比高達85.2%;70%的受訪者認為手機APP存在過度索取用戶權限的情況;80%的受訪者認為手機APP采集個人信息目的不純,以便廣告推銷或者二次售賣。從這些數(shù)據(jù)中不難看出用戶對于APP隱私安全問題的焦慮和擔憂。
圖1示出的是數(shù)字賬號過多的危害。
圖1 數(shù)字賬號過多的危害
鑒于口令密碼認證方式使用不便等缺陷,支持不同系統(tǒng)間的統(tǒng)一認證技術方案應運而生。
利用社交媒體賬戶登錄已經成為替代在線注冊的主流選擇。這種方式讓互聯(lián)網(wǎng)用戶使用平臺中現(xiàn)存信息來進行單點登錄,比如Facebook、微信、支付寶等。主要使用的是OAuth 2.0協(xié)議。
OAuth 2.0協(xié)議關注客戶端開發(fā)者的建議性,要么通過資源擁有者和HTTP服務商之間的被批準的交互動作代表用戶,要么允許第三方應用代表用戶獲得訪問的權限。協(xié)議同時為各種應用和設備提供專門的認證流程。2012年10月,OAuth 2.0協(xié)議正式發(fā)布為RFC 6749。以微信為例,第三方APP首先進行軟件審核,審核通過后獲取AppID和AppSecret,然后需要在微信開放平臺注冊開發(fā)者賬號,申請微信登錄且通過審核后,可開始接入流程。新用戶登錄該APP時,會提示微信一鍵登錄按鈕,如果用戶手機沒有安裝微信則會提示安裝微信客戶端。具體步驟見圖2。
圖2 微信授權登錄步驟
這些步驟對于用戶來說,只是簡單地點幾下按鈕就可以完成操作,省去了注冊用戶的一系列流程,所以在現(xiàn)階段應用非常廣泛。
該方案雖然有很多優(yōu)勢,例如簡單、開放及安全。但是該方案也存在不少弊端,例如在安全性上存在一定的漏洞。2016年11月,香港中文大學的研究人員發(fā)表文章稱,“使用OAuth 2.0協(xié)議可以毫不費力地登錄十億移動LApp賬戶”。研究人員發(fā)現(xiàn)通過第三方APP開發(fā)方,錯誤地使用OAuth 2.0協(xié)議,能在用戶不知情的情況下,被黑客遠程利用。
OAuth 2.0只是其中的一個問題,用戶數(shù)據(jù)如何被保護也是重中之重。企業(yè)都盡全力去保護用戶個人信息,但是成本昂貴。數(shù)據(jù)顯示,歐盟地區(qū),僅英國每年的身份確認成本已經超過33億英鎊,約等于290億人民幣。這還不包括后續(xù)由儲存、保護、違約、管理等行為導致的成本追加。
并且基于社交應用的統(tǒng)一認證能力通常只支持用戶登錄,在涉及到用戶信息核實的環(huán)節(jié)(如轉賬匯款等),都需要通過短信或者語音的方式確認用戶的真實身份以及操作的合法性。這種方式不僅會影響用戶的操作體驗,同時可能會面臨手機號碼泄露帶來的安全風險。
運營商掌握大量的用戶信息,基于運營商提供的手機號碼和個人信息進行身份驗證,可以為用戶提供便捷、安全的身份認證服務。但是也存在一些問題:例如如何避免用戶數(shù)據(jù)流失、隱私泄露及身份盜竊;如何對接不同運營商的統(tǒng)一認證平臺,獲取移動認證服務。
針對傳統(tǒng)身份認證的一系列問題,本文從區(qū)塊鏈技術的角度提供一種新的思路,區(qū)塊鏈是一種由多方共同維護,以塊鏈結構存儲數(shù)據(jù),使用密碼學保證傳輸和訪問安全,能夠實現(xiàn)數(shù)據(jù)一致存儲、無法篡改、無法抵賴的技術體系。通過多方參與的分布式賬本技術,可實現(xiàn)運營商之間的合作機制;通過密碼學原理的非對稱加密、智能合約以及零知識證明的方式,保護個人隱私數(shù)據(jù)不被泄露盜?。煌ㄟ^將數(shù)據(jù)使用的決策權歸還給用戶,解決了用戶身份數(shù)據(jù)使用的合法合規(guī)性問題,同時也提供了對接用戶、運營商和需求方的創(chuàng)新性思路。
通過區(qū)塊鏈構建數(shù)字身份系統(tǒng),設計思想是采用弱中心化的“公治”式機制。在該系統(tǒng)中,所有業(yè)務系統(tǒng)像原來一樣,各管各自的用戶賬戶,但會通過聯(lián)盟鏈的形式來彼此鑒權和認可對方的登錄請求,并授權訪問對應的用戶數(shù)據(jù)。
運營商利用算法為實名認證用戶創(chuàng)建數(shù)字身份,與此身份相關聯(lián)的私鑰安全地存儲在用戶的eSIM上,公鑰存儲在所有節(jié)點上。然后用戶使用自己的私鑰添加數(shù)字簽名,登錄時將數(shù)字簽名等摘要信息上鏈進行驗證,如圖3所示。
所有運營商用戶數(shù)據(jù)信息生成摘要(公鑰、數(shù)字簽名等)放在鏈上,其他的軟件需要身份認證的時候訪問鏈進行認證,對其他軟件來說,用戶是匿名登錄,保護了用戶隱私,避免了用戶信息泄露。第三方開啟授權認證時可以通過授權平臺對授權信息進行查詢,通過智能合約技術實現(xiàn)對數(shù)據(jù)信息的查詢,通過鏈完成驗簽過程,直接獲取認證結果。以此構成一個聯(lián)盟鏈,所有加入鏈中的企業(yè)可以互相達成可信機制,具體流程如圖4所示。
圖3 運營商數(shù)字身份原理
圖4 數(shù)字身份流程
a)運營商將自有實名認證的用戶數(shù)據(jù)庫,通過算法進行加密,生成公鑰和私鑰對,利用公鑰生成數(shù)字簽名。其中,公鑰和數(shù)字簽名上鏈進行存儲。私鑰存儲在用戶本地,即eSIM卡上。
b)用戶請求登錄在運營商開放平臺注冊過的第三方APP或者Web應用。
c)第三方APP或者Web應用將用戶請求信息發(fā)送給運營商授權平臺,授權平臺提示用戶,獲取用戶授權登錄信息,在此基礎上提示用戶信息使用范圍,是否允許第三方使用用戶信息(該步驟不影響用戶后續(xù)登錄操作)。
d)第三方APP或者Web應用獲取用戶授權之后,開始上鏈進行驗證申請。
e)利用用戶授權,在鏈上匹配對應公鑰和數(shù)字簽名,同時在運營商數(shù)據(jù)庫內部進行匹配。
f)將匹配的結果反饋給第三方APP或者Web應用。
g)根據(jù)反饋的結果對用戶的登錄請求進行回應,匹配成功則登錄成功,否則就登錄失敗。
h)只要加入聯(lián)盟鏈中的企業(yè)都可以共享認證用戶,假設第三方企業(yè)也有自己的認證用戶數(shù)據(jù)庫,則這些用戶可以直接登錄聯(lián)盟鏈中的其他應用,原理和流程同上述方式。
本方案最終為用戶生成一個唯一的數(shù)字身份,可以用來登錄所有聯(lián)盟鏈內的應用。利用區(qū)塊鏈技術為加入聯(lián)盟鏈中的合作伙伴之間達成實名認證用戶互通。
運營商為用戶創(chuàng)建的數(shù)字身份,在條件允許的情況下,可以用來打造基于區(qū)塊鏈技術的身份認證平臺,結合eID,可以提供諸如統(tǒng)一身份認證、信息校驗、免密登錄等服務。并且該數(shù)字身份不僅可以用來進行第三方合作伙伴驗證。還可以用于政府、金融、民生、醫(yī)療、交通等多個領域,形成電子政務鏈、在線醫(yī)療鏈、健康保險鏈等。在保護用戶隱私的同時,極大地方便了用戶,同時也符合網(wǎng)絡實名制的要求,利于互聯(lián)網(wǎng)安全機制的建立。
將區(qū)塊鏈技術應用于數(shù)字身份,歸結起來有如下優(yōu)勢。
a)數(shù)據(jù)真實有效?;趨^(qū)塊鏈不可篡改、全歷史的特性,區(qū)塊鏈可以充分保障鏈上所有數(shù)據(jù)的真實可信。對于數(shù)字身份來說,為確保上鏈數(shù)據(jù)無虛假,這一部分需要在數(shù)據(jù)上鏈之前出具政府權威認證的信用背書,對于運營商來說,現(xiàn)擁有的所有用戶都是實名用戶,再把這些數(shù)據(jù)上鏈,從而確保鏈上數(shù)據(jù)是真實有效的。上鏈之后,每一個數(shù)據(jù)都是在所有節(jié)點的共同監(jiān)督下被真實完整地記錄下來,證據(jù)充分且可追溯。系統(tǒng)對所有鏈上用戶透明,所有參與者都有可能獲取他人已授權的信息。
b)數(shù)據(jù)安全及隱私保護。區(qū)塊鏈的簽名私鑰、加密技術、安全多方計算等技術,可以有效保障用戶隱私安全。數(shù)據(jù)使用權都在用戶自己手上,而不是像現(xiàn)在這樣,在各種企業(yè)手中,這就保證了用戶隱私不會被其他任何人隨意使用。并且在交易過程中,雙方的隱私都可以通過脫敏技術得到很好的加密處理,外人對其交易行為的了解只限制于過程表面,交易雙方的信息都是加密的。在隱私保護下的前提下,區(qū)塊鏈可為數(shù)據(jù)開放提供解決方案,讓數(shù)據(jù)真正放心地流動起來。
c)數(shù)據(jù)流通及共享。目前不同的互聯(lián)網(wǎng)平臺以及各個業(yè)務系統(tǒng)之間依然是相互獨立的,核心數(shù)據(jù)是各自的立足之本,輕易不會外泄。通過區(qū)塊鏈技術,搭建基于各個平臺和業(yè)務系統(tǒng)之間的聯(lián)盟鏈體系,并采取相應的智能合約、共識機制以及激勵機制,從而有效地驅動企業(yè)去“共享數(shù)據(jù)”,實現(xiàn)優(yōu)勢互補,使數(shù)據(jù)價值利用最大化,進一步促進行業(yè)信息流通和整合。區(qū)塊鏈提供的可追溯路徑,可以有效破解數(shù)據(jù)確權難題,有利于建立可信任的數(shù)據(jù)資產交易環(huán)境。
對于數(shù)字身份而言,要想保證絕對安全僅靠某一種技術是無法實現(xiàn)的,而是需要多種技術進行優(yōu)勢互補,形成軟硬一體的完備解決方案。雖然區(qū)塊鏈的分布式賬本是安全級別較高的技術,理論上賬本不會輕易受到破壞或者篡改,但不法分子會將攻擊重點轉向用戶和設備,因此需要提升上鏈前的安全措施,例如加大對區(qū)塊鏈參與者的身份驗證,提升設備和執(zhí)行環(huán)境的安全性。隨著技術的發(fā)展,這些安全優(yōu)先事項一旦得到有效解決,區(qū)塊鏈技術必將充分發(fā)揮其潛力,成為數(shù)字身份的堅強護盾。