林琳
發(fā)展史
1.很久很久以前,Web基本上就是文檔的瀏覽而已,既然是瀏覽,作為服務(wù)器,不需要記錄誰在某一段時間里都瀏覽了什么文檔。
每次請求都是一個新的HTTP協(xié)議,就是請求加響應(yīng),尤其不用記住是誰剛剛發(fā)了HTTP請求,每個請求相對來說都是全新的。
2.但是隨著交互式Web應(yīng)用的興起,像在線購物網(wǎng)站和需要登錄的網(wǎng)站等就面臨一個問題,那就是要管理會話,必須記住哪些人登錄系統(tǒng),哪些人往自己的購物車中放商品。
也就是說必須把每個人區(qū)分開,這是一個不小的挑戰(zhàn),因?yàn)镠TTP請求是無狀態(tài)的,所以想出的辦法就是給大家發(fā)一個會話標(biāo)識(Session ID)。
說白了就是一個隨機(jī)的字串,每個人收到的都不一樣,每次大家發(fā)起HTTP請求的時候,把這個字符串給一并捎過來,這樣就能區(qū)分開誰是誰了。
3.這樣大家很高興了,可是服務(wù)器就不高興了,每個人只需要保存自己的Session ID,而服務(wù)器要保存所有人的Session ID。如果訪問服務(wù)器多了,就得有成千上萬,甚至幾十萬個。這對服務(wù)器來說是一個巨大的開銷,嚴(yán)重限制了服務(wù)器擴(kuò)展能力。
比如用2個機(jī)器組成了一個集群,小F通過機(jī)器A登錄了系統(tǒng),那Session ID會保存在機(jī)器A上,假設(shè)小F的下一次請求被轉(zhuǎn)發(fā)到機(jī)器B怎么辦?機(jī)器B沒有小F的Session ID。
這時候會采用一點(diǎn)小伎倆:Session sticky,就是讓小F的請求一直粘連在機(jī)器A上,但是這也不管用,要是機(jī)器A掛掉了,還得轉(zhuǎn)到機(jī)器B去。
那只好做Session的復(fù)制了,把Session ID在2個機(jī)器之間搬來搬去,非常累。
后來有個叫Memcached的支了招:把Session ID集中存儲到一個地方,所有的機(jī)器都來訪問這個地方的數(shù)據(jù)。
這樣一來,就不用復(fù)制了,但是增加了單點(diǎn)失敗的可能性,要是那個負(fù)責(zé)Session的機(jī)器掛了,所有人都得重新登錄一遍,估計(jì)得被人罵死。
后來嘗試把這個單點(diǎn)的機(jī)器也集群,增加可靠性,但不管如何,這小小的Session還是一個沉重的負(fù)擔(dān)。
4.于是有人提出,為什么要保存這可惡的Session呢,只讓每個客戶端去保存該多好??墒侨绻槐4孢@些Session ID,怎么驗(yàn)證客戶端發(fā)出的Session ID的確是正確生成的呢?
如果不去驗(yàn)證,都不知道他們是不是合法登錄的用戶,那些不懷好意的家伙們就可以偽造Session ID為所欲為了。
關(guān)鍵點(diǎn)就是驗(yàn)證。比如說,小F已經(jīng)登錄了系統(tǒng),給他發(fā)一個令牌(token),里邊包含了小F的user id,下一次小F再次通過HTTP請求訪問的時候,把這個token通過HTTP Header帶過來不就可以了。不過這和Session ID沒有本質(zhì)區(qū)別,任何人都可以偽造,所以得想辦法,讓別人偽造不了。
那就對數(shù)據(jù)做一個簽名吧,比如說用HMAC-SHA256算法,加上一個只有我才知道的密鑰,對數(shù)據(jù)做一個簽名,把這個簽名和數(shù)據(jù)一起作為token,由于密鑰別人不知道,就無法偽造token了。
這個token不保存,當(dāng)小F把這個token發(fā)過來的時候,再用同樣的HMAC-SHA256算法和同樣的密鑰,對數(shù)據(jù)再計(jì)算一次簽名,和token中的簽名做個比較,如果相同,就知道小F已經(jīng)登錄過了,并且可以直接取到小F的user id,如果不相同,數(shù)據(jù)部分肯定被人篡改過,就告訴發(fā)送者:對不起,沒有認(rèn)證。
Token中的數(shù)據(jù)是明文保存的(雖然會用Base64做下編碼,但那不是加密),還是可以被別人看到的,所以不能在其中保存像密碼這樣的敏感信息。
當(dāng)然,如果一個人的token被別人偷走了,那也沒辦法,也會認(rèn)為小偷就是合法用戶,這其實(shí)和一個人的Session ID被別人偷走是一樣的。這樣一來,就不用保存Session ID了,只是生成token,然后驗(yàn)證token,用CPU計(jì)算時間獲取了我的Session存儲空間。解除了Session ID這個負(fù)擔(dān),可以說是無事一身輕,機(jī)器集群現(xiàn)在可以輕松地做水平擴(kuò)展,用戶訪問量增大,直接加機(jī)器就行。這種無狀態(tài)的感覺實(shí)在是太好了。
Cookie
cookie是一個非常具體的東西,指的就是瀏覽器里面能永久存儲的一種數(shù)據(jù),僅僅是瀏覽器實(shí)現(xiàn)的一種數(shù)據(jù)存儲功能。cookie由服務(wù)器生成,發(fā)送給瀏覽器,瀏覽器把cookie以kv形式保存到某個目錄下的文本文件內(nèi),下一次請求同一網(wǎng)站時會把該cookie發(fā)送給服務(wù)器。
由于cookie是存在客戶端上的,所以瀏覽器加入了一些限制,確保cookie不會被惡意使用,同時不會占據(jù)太多磁盤空間,所以每個域的cookie數(shù)量是有限的。
Session
Session從字面上講,就是會話。這個就類似于正在和一個人交談,怎么知道當(dāng)前和你交談的是張三而不是李四呢?對方肯定有某種特征表明他就是張三。
Session也是類似的道理,服務(wù)器要知道當(dāng)前發(fā)請求給自己的是誰。
為了做這種區(qū)分,服務(wù)器就要給每個客戶端分配不同的身份標(biāo)識,然后客戶端每次向服務(wù)器發(fā)請求的時候,都帶上這個身份標(biāo)識,服務(wù)器就知道這個請求來自于誰了。
至于客戶端怎么保存這個“身份標(biāo)識”,可以有很多種方式,對于瀏覽器客戶端,大家都默認(rèn)采用cookie的方式。
服務(wù)器使用Session把用戶的信息臨時保存在了服務(wù)器上,用戶離開網(wǎng)站后Session會被銷毀。
這種用戶信息存儲方式相對cookie來說更安全,可是Session有一個缺陷:如果Web服務(wù)器做了負(fù)載均衡,那么下一個操作請求到了另一臺服務(wù)器的時候Session就會丟失。
Token
在Web領(lǐng)域基于Token的身份驗(yàn)證隨處可見。在大多數(shù)使用Web API的互聯(lián)網(wǎng)公司中,token是多用戶下處理認(rèn)證的最佳方式。
以下特性會在程序中使用基于Token的身份驗(yàn)證:
1.無狀態(tài)、可擴(kuò)展
2.支持移動設(shè)備
3.跨程序調(diào)用
4.安全
大部分的API和Web應(yīng)用都使用token。例如Facebook,Twitter,Google+,GitHub等。
Token的起源
在介紹基于Token的身份驗(yàn)證的原理與優(yōu)勢之前,不妨先看看之前的認(rèn)證都是怎么做的。
基于服務(wù)器的驗(yàn)證
HTTP協(xié)議是無狀態(tài)的,這種無狀態(tài)意味著程序需要驗(yàn)證每一次請求,從而辨別客戶端的身份。
在這之前,程序都是通過在服務(wù)端存儲的登錄信息來辨別請求的。這種方式一般都是通過存儲Session來完成。隨著Web應(yīng)用程序移動端的興起,這種驗(yàn)證的方式逐漸暴露出了問題,尤其是在可擴(kuò)展性方面。
基于服務(wù)器驗(yàn)證方式暴露的一些問題
1. Seesion:每次認(rèn)證用戶發(fā)起請求時,服務(wù)器需要去創(chuàng)建一個記錄來存儲信息。當(dāng)越來越多的用戶發(fā)請求時,內(nèi)存的開銷也會不斷增加。
2.可擴(kuò)展性:在服務(wù)端的內(nèi)存中使用Seesion存儲登錄信息,伴隨而來的是可擴(kuò)展性問題。
3.跨域資源共享(CORS):當(dāng)需要讓數(shù)據(jù)跨多臺移動設(shè)備使用時,跨域資源的共享會是一個讓人頭疼的問題。在使用Ajax抓取另一個域的資源,就可能會出現(xiàn)禁止請求的情況。
4.跨站請求偽造(CSRF):用戶在訪問銀行網(wǎng)站時,很容易受到跨站請求偽造的攻擊,并且容易被利用訪問其他的網(wǎng)站。
在這些問題中,可擴(kuò)展性是最突出的,因此有必要去尋求一種更有行之有效的方法。
基于Token的驗(yàn)證原理
基于Token的身份驗(yàn)證是無狀態(tài)的,不將用戶信息存在服務(wù)器或Session中,這種概念解決了在服務(wù)端存儲信息時的許多問題。
NoSession意味著程序可以根據(jù)需要去增減機(jī)器,而不用擔(dān)心用戶是否登錄。
基于Token的身份驗(yàn)證的過程如下:
1.用戶通過用戶名和密碼發(fā)送請求
2.程序驗(yàn)證
3.程序返回一個簽名的token給客戶端
4.客戶端儲存token,并且每次用于每次發(fā)送請求
5.服務(wù)端驗(yàn)證token并返回?cái)?shù)據(jù)
每一次請求都需要token。token應(yīng)該在HTTP的頭部發(fā)送從而保證了HTTP請求無狀態(tài)。
通過設(shè)置服務(wù)器屬性Access-Control-Allow-Origin:*,讓服務(wù)器能接受到來自所有域的請求。
需要注意的是,在ACAO頭部標(biāo)明(designating)*時,不得帶有像HTTP認(rèn)證,客戶端SSL證書和cookie的證書。
實(shí)現(xiàn)思路:
1.用戶登錄校驗(yàn),校驗(yàn)成功后就返回token給客戶端
2.客戶端收到數(shù)據(jù)后保存在客戶端
3.客戶端每次訪問API是攜帶token到服務(wù)器端
4.服務(wù)器端采用filter過濾器校驗(yàn)。校驗(yàn)成功則返回請求數(shù)據(jù),校驗(yàn)失敗則返回錯誤碼。當(dāng)在程序中認(rèn)證了信息并取得token之后,便能通過這個token做許多的事情。
甚至能創(chuàng)建一個基于權(quán)限的token傳給第三方應(yīng)用程序,這些第三方程序能夠獲取到我們的數(shù)據(jù)(當(dāng)然只有在我們允許的特定的token)。
Tokens的優(yōu)勢
無狀態(tài)、可擴(kuò)展
在客戶端存儲的Tokens是無狀態(tài)的,并且能夠被擴(kuò)展?;谶@種無狀態(tài)和不存儲Session信息,負(fù)載均衡器能夠?qū)⒂脩粜畔囊粋€服務(wù)器傳到其他服務(wù)器上。
如果將已驗(yàn)證的用戶信息保存在Session中,則每次請求都需要用戶向已驗(yàn)證的服務(wù)器發(fā)送驗(yàn)證信息
但是不要著急。使用token之后這些問題都會迎刃而解,因?yàn)閠okens自己hold住了用戶的驗(yàn)證信息。
安全性
請求中發(fā)送token而不再是發(fā)送cookie能夠防止(跨站請求偽造(CSRF)。
即使在客戶端使用cookie存儲token,cookie也僅是一個存儲機(jī)制而不是用于認(rèn)證。不將信息存儲在Session中,讓我們少了對session操作。
token是有時效的,一段時間之后用戶需要重新驗(yàn)證。我們也不一定需要等到token自動失效,token有撤回的操作,通過to- ken revocataion可以使一個特定的token或是一組有相同認(rèn)證的token無效。
可擴(kuò)展性
Tokens能夠創(chuàng)建與其它程序共享權(quán)限的程序。例如,能將一個隨便的社交帳號和自己的Fackbook或Twitter聯(lián)系起來。
當(dāng)通過服務(wù)登錄Twitter(我們將這個過程稱作Buffer)時,可以將這些Buffer附到Twitter的數(shù)據(jù)流上。
使用token時,可以提供可選的權(quán)限給第三方應(yīng)用程序。當(dāng)用戶想讓另一個應(yīng)用程序訪問它們的數(shù)據(jù),可以通過建立自己的API,產(chǎn)生特殊權(quán)限的tokens。
多平臺跨域
再來談?wù)撘幌驴缬蛸Y源共享(CORS),對應(yīng)用程序和服務(wù)進(jìn)行擴(kuò)展的時候,需要介入各種各種的設(shè)備和應(yīng)用程序。
只要用戶有一個通過了驗(yàn)證的token,數(shù)據(jù)和資源就能夠在任何域上被請求到。