許盛宏 劉智德 林俐
PGW作為L(zhǎng)TE網(wǎng)絡(luò)核心控制設(shè)備,其安全可靠運(yùn)行將影響LTE業(yè)務(wù)的穩(wěn)定提供。針對(duì)目前PGW容災(zāi)問(wèn)題進(jìn)行了分析,通過(guò)對(duì)三種可行方案的研究而提出了可靠容災(zāi)解決方案,并闡述可靠容災(zāi)方案的具體實(shí)現(xiàn),力求為運(yùn)營(yíng)商部署安全可靠的LTE網(wǎng)絡(luò)提供有益的參考。
PGW 實(shí)時(shí)恢復(fù) 容災(zāi)
1 引言
目前運(yùn)營(yíng)商加緊推進(jìn)部署VoLTE業(yè)務(wù),LTE網(wǎng)絡(luò)是VoLTE業(yè)務(wù)核心,因此很有必要提升LTE網(wǎng)絡(luò)組網(wǎng)的安全可靠性。在LTE網(wǎng)絡(luò)中,PGW(PDN Gateway,分組數(shù)據(jù)網(wǎng)網(wǎng)關(guān))設(shè)備是作為用戶數(shù)據(jù)業(yè)務(wù)和VoLTE業(yè)務(wù)的承載通道,負(fù)責(zé)用戶的IP地址分配、數(shù)據(jù)包的路由及前轉(zhuǎn)和用戶相關(guān)業(yè)務(wù)的計(jì)費(fèi);SGW(Serving Gateway,服務(wù)網(wǎng)關(guān))設(shè)備是負(fù)責(zé)基站和PGW之間的數(shù)據(jù)包的路由和前轉(zhuǎn);MME(Mobility Management Entity,移動(dòng)管理實(shí)體)設(shè)備是負(fù)責(zé)移動(dòng)性管理、會(huì)話管理、用戶鑒權(quán)、漫游控制以及PGW、SGW的選擇等方面功能。因此,PGW是LTE網(wǎng)絡(luò)核心控制設(shè)備,其安全可靠運(yùn)行相當(dāng)重要。
當(dāng)主用PGW設(shè)備故障時(shí),接管PGW無(wú)法實(shí)時(shí)恢復(fù)主叫和被叫業(yè)務(wù),特別是當(dāng)前的PGW設(shè)備都采用集中部署方式,將會(huì)導(dǎo)致大面積業(yè)務(wù)長(zhǎng)時(shí)間癱瘓,對(duì)VoLTE業(yè)務(wù)影響尤為嚴(yán)重。為了提升LTE業(yè)務(wù)質(zhì)量服務(wù)水平,很有必要研究一種PGW可靠容災(zāi)解決方案。
2 目前PGW容災(zāi)存在的問(wèn)題
由于主用和備用PGW設(shè)備同步相關(guān)容災(zāi)數(shù)據(jù)將會(huì)導(dǎo)致可用資源的額外消耗、同步數(shù)據(jù)的不完整等問(wèn)題,所以目前主備PGW之間不采用相互同步。目前PGW設(shè)備容災(zāi)方案實(shí)現(xiàn)流程如圖1所示:
對(duì)于主叫容災(zāi)恢復(fù),當(dāng)前服務(wù)的PGW設(shè)備癱瘓時(shí),用戶發(fā)起主叫業(yè)務(wù)請(qǐng)求將會(huì)發(fā)送到當(dāng)前服務(wù)的MME上,由于MME發(fā)現(xiàn)用戶當(dāng)前服務(wù)的PGW已經(jīng)故障,用戶將無(wú)法找到可用承載通道,就會(huì)向用戶發(fā)送業(yè)務(wù)拒絕,指示終端發(fā)起重新附著,將會(huì)中斷本次呼叫,待用戶重新附著成功后,用戶再次發(fā)起主叫才能恢復(fù)主叫業(yè)務(wù)。對(duì)于被叫容災(zāi)恢復(fù),當(dāng)用戶服務(wù)的PGW故障時(shí),AF(Application Function,應(yīng)用服務(wù)器)檢測(cè)到PGW故障后,AF將下行數(shù)據(jù)請(qǐng)求發(fā)送至接管PGW,由于接管PGW沒(méi)有用戶相關(guān)信息而無(wú)法處理下行數(shù)據(jù)請(qǐng)求,被叫業(yè)務(wù)無(wú)法正常建立,用戶將一直無(wú)法得知被叫業(yè)務(wù)無(wú)法接入,待網(wǎng)絡(luò)設(shè)定的TAU(Tracking Area Update,跟蹤區(qū)更新)更新周期到達(dá)后,用戶就會(huì)發(fā)起TAU更新,此時(shí)才會(huì)發(fā)現(xiàn)當(dāng)前服務(wù)PGW故障而無(wú)法處理,然后用戶主動(dòng)發(fā)起重新附著請(qǐng)求,成功附著后業(yè)務(wù)才可恢復(fù)。目前現(xiàn)網(wǎng)配置TAU周期更新為1小時(shí),那么此時(shí)被叫業(yè)務(wù)將會(huì)中斷大約1小時(shí)。因此,目前PGW容災(zāi)方案無(wú)法實(shí)時(shí)恢復(fù)業(yè)務(wù),也就無(wú)法保證LTE業(yè)務(wù)的穩(wěn)定提供。
3 可行解決方案分析
3.1 方案一:基于PCRF存儲(chǔ)
方案一采用基于PCRF(Policy and Charging Rules Function,策略與計(jì)費(fèi)規(guī)則功能)存儲(chǔ)容災(zāi)數(shù)據(jù)的實(shí)現(xiàn)方法。在用戶進(jìn)行初始附著時(shí),PCRF存儲(chǔ)主用PGW傳送的當(dāng)前服務(wù)SGW信息。當(dāng)用戶服務(wù)的PGW故障時(shí),對(duì)于主叫業(yè)務(wù)的恢復(fù),MME在成功建立SGW、PGW承載后而實(shí)時(shí)接管用戶主叫業(yè)務(wù),不會(huì)中斷當(dāng)前主叫業(yè)務(wù)請(qǐng)求;對(duì)于被叫業(yè)務(wù)的恢復(fù),PCRF將之前保存的容災(zāi)數(shù)據(jù)通過(guò)信令傳送到備份PGW,應(yīng)用服務(wù)器(P-CSCF/SBC)通過(guò)承載備份路由選擇接管PGW,實(shí)現(xiàn)實(shí)時(shí)恢復(fù)。
此方案需PGW增加容災(zāi)用戶IP管理功能以及擴(kuò)展相應(yīng)信令流程參數(shù)。此方案可實(shí)現(xiàn)首次呼叫不會(huì)中斷,實(shí)時(shí)恢復(fù)業(yè)務(wù),不需要主備PGW設(shè)備之間相互同步,減少設(shè)備額外開(kāi)銷,但需已有信令的擴(kuò)展參數(shù),PGW改造較大。
3.2 方案二:基于HSS+AS
方案二采用基于MMTelAS查詢?nèi)诤螲SS(Home Subscriber Server,歸屬用戶服務(wù)器)(IMS-HSS和EPC-HSS合設(shè))獲得相關(guān)設(shè)備狀態(tài)實(shí)現(xiàn)容災(zāi)的方法。當(dāng)用戶服務(wù)的PGW故障時(shí),對(duì)于主叫容災(zāi)恢復(fù),通過(guò)SGW主動(dòng)探測(cè)用戶面報(bào)文,在用戶報(bào)文中斷時(shí),觸發(fā)重新附著、業(yè)務(wù)承載重新建立;對(duì)于被叫容災(zāi)恢復(fù),通過(guò)HSS互通獲取PGW為故障狀態(tài),HSS下發(fā)請(qǐng)求給MME,MME發(fā)送基于IMSI的尋呼消息觸發(fā)重新附著、業(yè)務(wù)承載重新建立恢復(fù)。
此方案需要IMS和EPC的HSS之間增加接口或者新建融合HSS,IMS的MMTelAS需要升級(jí)支持被叫域選擇功能,MME需將PGW故障時(shí)的相關(guān)信息送至HSS。此方案不需要SGW之間同步,業(yè)務(wù)恢復(fù)較快,但首次呼叫會(huì)中斷,需要IMS和EPC之間的HSS增加互通接口,同時(shí)用戶作為被叫都需MMTelAs設(shè)備查詢用戶歸屬的HSS,必然導(dǎo)致信令開(kāi)銷和處理時(shí)延較大。
3.3 方案三:基于HSS+I-CSCF
方案三采用基于I-CSCF(Interrogating-CSCF,查詢CSCF)查詢?nèi)诤螲SS獲取相關(guān)設(shè)備狀態(tài)實(shí)現(xiàn)容災(zāi)的方法。利用MME對(duì)PGW的狀態(tài)感知,通過(guò)融合HSS對(duì)用戶呼叫請(qǐng)求的識(shí)別與控制以及MME對(duì)承載建立的控制,實(shí)現(xiàn)容災(zāi)業(yè)務(wù)實(shí)時(shí)接管。當(dāng)用戶服務(wù)的PGW故障時(shí),MME通過(guò)檢測(cè)機(jī)制感知SGW、PGW故障狀態(tài),并將故障狀態(tài)通知融合HSS,當(dāng)用戶有被叫請(qǐng)求時(shí),通過(guò)I-CSCF、融合HSS觸發(fā)用戶重新建立承載以及重注冊(cè)后響應(yīng)呼叫請(qǐng)求,確保被叫業(yè)務(wù)實(shí)時(shí)接管;當(dāng)發(fā)起主叫請(qǐng)求時(shí),通過(guò)成功重新建立PGW承載后終端自動(dòng)重注冊(cè)以及重發(fā)業(yè)務(wù)請(qǐng)求,網(wǎng)絡(luò)設(shè)備將正常處理業(yè)務(wù)請(qǐng)求,不會(huì)中斷當(dāng)前主叫業(yè)務(wù)請(qǐng)求。
此方案需要IMS-HSS和EPC-HSS之間增加接口或者新建融合HSS,同時(shí)MME增加PGW容災(zāi)接管相關(guān)功能。此方案恢復(fù)主叫、被叫業(yè)務(wù)較快,不需要PGW之間同步,無(wú)需額外增加信令流程,但MME需支持容災(zāi)接管功能,I-CSCF處理容災(zāi)用戶業(yè)務(wù)存在較大時(shí)延,實(shí)時(shí)恢復(fù)需要終端支持觸發(fā)重注冊(cè)消息。
3.4 方案對(duì)比分析
如表1所示,通過(guò)對(duì)組網(wǎng)方式、數(shù)據(jù)同步、接管話務(wù)、網(wǎng)絡(luò)改造等方面分析可知,方案一不需要融合HSS支持,并可實(shí)時(shí)恢復(fù)主叫、被叫業(yè)務(wù),接管風(fēng)險(xiǎn)較小。因此,在IMS HSS和EPC HSS分開(kāi)部署時(shí),PGW容災(zāi)方案考慮使用方案一;在IMS HSS和EPC HSS合設(shè)時(shí),可以考慮使用方案三。由于目前現(xiàn)網(wǎng)的IMS HSS和EPC HSS主要是分開(kāi)部署的,所以PGW可靠容災(zāi)方案推薦使用方案一,以提升LTE業(yè)務(wù)運(yùn)行的穩(wěn)定性。
4 方案一的具體實(shí)現(xiàn)
4.1 容災(zāi)數(shù)據(jù)存儲(chǔ)
此方案需增加一個(gè)容災(zāi)數(shù)據(jù)存儲(chǔ)流程以實(shí)時(shí)恢復(fù)容災(zāi)業(yè)務(wù)。在正常發(fā)起附著請(qǐng)求,PGW和PCRF之間建立會(huì)話時(shí),當(dāng)前服務(wù)PGW將用戶當(dāng)前服務(wù)SGW信息傳送給PCRF,包括SGW的IP和用戶的TEID等信息,可以通過(guò)擴(kuò)展CCR消息的參數(shù)實(shí)現(xiàn),PCRF保存此時(shí)的SGW信息,此時(shí)數(shù)據(jù)備份不需要主用PGW和接管PGW之間的直接同步。PGW容災(zāi)數(shù)據(jù)存儲(chǔ)流程如圖2所示。
具體步驟說(shuō)明如下:
(1)在用戶發(fā)送附著請(qǐng)求時(shí),MME將會(huì)根據(jù)數(shù)據(jù)配置選擇一個(gè)可用的SGW、PGW設(shè)備;
(2)MME向已選定可用的SGW、PGW1發(fā)送創(chuàng)建會(huì)話請(qǐng)求消息,請(qǐng)求創(chuàng)建業(yè)務(wù)承載通道;
(3)PGW1將會(huì)根據(jù)數(shù)據(jù)配置選擇PCRF發(fā)送會(huì)話建立請(qǐng)求消息,攜帶SGW信息;
(4)PCRF發(fā)送會(huì)話建立響應(yīng)消息給PGW1;
(5)PGW1發(fā)送創(chuàng)建會(huì)話請(qǐng)求消息給MME;
(6)MME設(shè)備向用戶發(fā)送用戶附著接受消息。
4.2 主叫容災(zāi)恢復(fù)
當(dāng)用戶服務(wù)的PGW故障時(shí),用戶發(fā)起主叫業(yè)務(wù)請(qǐng)求將會(huì)發(fā)送到當(dāng)前服務(wù)的MME上,MME通過(guò)SGW檢測(cè)到當(dāng)前服務(wù)PGW故障后,發(fā)起重新建立承載請(qǐng)求,在成功建立SGW、PGW承載后,繼續(xù)處理本次呼叫,此時(shí)MME就不會(huì)中斷當(dāng)前主叫業(yè)務(wù)。PGW主叫容災(zāi)恢復(fù)實(shí)現(xiàn)流程如圖3所示:
具體步驟說(shuō)明如下:
(1)用戶向當(dāng)前服務(wù)的MME設(shè)備發(fā)起業(yè)務(wù)請(qǐng)求消息;
(2)MME通過(guò)SGW檢測(cè)到當(dāng)前服務(wù)的PGW1故障后,根據(jù)數(shù)據(jù)配置選擇一個(gè)接管的PGW2;
(3)MME通過(guò)在SGW、PGW2之間重新建立承載,恢復(fù)用戶業(yè)務(wù)的承載通道;
(4)MME向用戶發(fā)送業(yè)務(wù)接受消息;
(5)UE(User Equipment,用戶終端)的主叫業(yè)務(wù)恢復(fù)正常處理。
4.3 被叫容災(zāi)恢復(fù)
對(duì)于被叫容災(zāi)恢復(fù),當(dāng)用戶服務(wù)的PGW故障時(shí),AF將業(yè)務(wù)認(rèn)證觸發(fā)到PCRF,PCRF通過(guò)業(yè)務(wù)授權(quán)將之前保存的SGW信息傳送至接管PGW,接管PGW找到當(dāng)前服務(wù)的SGW,AF通過(guò)承載備份路由將下行數(shù)據(jù)請(qǐng)求送至一個(gè)可用的接管PGW,接管PGW具備管理容災(zāi)用戶IP能力,確保了用戶被叫業(yè)務(wù)正常有效處理,實(shí)現(xiàn)實(shí)時(shí)業(yè)務(wù)恢復(fù),不再需要等待1小時(shí)才能恢復(fù)業(yè)務(wù)了。PGW被叫容災(zāi)恢復(fù)實(shí)現(xiàn)流程如圖4所示。
具體步驟說(shuō)明如下:
(1)PCRF檢測(cè)到PGW1故障;
(2)當(dāng)AF收到用戶作為被叫的請(qǐng)求時(shí),向PCRF發(fā)送業(yè)務(wù)認(rèn)證消息;
(3)PCRF向根據(jù)數(shù)據(jù)配置選擇可用的PGW2發(fā)送業(yè)務(wù)授權(quán)消息,攜帶SGW信息,為用戶預(yù)先分配資源;
(4)接管PGW2沒(méi)有用戶相關(guān)數(shù)據(jù),但根據(jù)PCRF送過(guò)來(lái)的SGW信息,向當(dāng)前服務(wù)的SGW發(fā)起下行觸發(fā)承載建立消息,指示建立承載通道,此時(shí)服務(wù)的SGW向當(dāng)前MME轉(zhuǎn)發(fā)此消息;
(5)MME收到此下行觸發(fā)承載建立消息,向SGW和PGW2重新建立默認(rèn)和專用承載;
(6)MME向UE發(fā)起建立業(yè)務(wù)承載的請(qǐng)求,包括默認(rèn)承載和專用承載;
(7)AF通過(guò)承載備份路由(到同一個(gè)目的地采用主備用路由配置,主用路由故障時(shí)選擇備用路由)將下行數(shù)據(jù)請(qǐng)求送至一個(gè)可用的接管PGW2;
(8)PGW2待業(yè)務(wù)承載建立完成后就會(huì)進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā),從而被叫業(yè)務(wù)恢復(fù)正常處理。
5 結(jié)束語(yǔ)
本文針對(duì)目前PGW容災(zāi)存在的問(wèn)題,提出了三種可行的解決方案,并最終建議采用基于PCRF存儲(chǔ)容災(zāi)數(shù)據(jù)的實(shí)現(xiàn)方法(方案一)。此方案改動(dòng)較小且容易實(shí)現(xiàn),并可高效、實(shí)時(shí)接管恢復(fù)容災(zāi)業(yè)務(wù),將有力推動(dòng)LTE業(yè)務(wù)的規(guī)?;煽繎?yīng)用。在現(xiàn)網(wǎng)應(yīng)用時(shí),建議根據(jù)實(shí)際情況進(jìn)一步優(yōu)化解決首次呼叫恢復(fù)時(shí)長(zhǎng)較大的問(wèn)題。
參考文獻(xiàn):
[1] 許盛宏,時(shí)新建,李力卡. LTE網(wǎng)絡(luò)SGW高效可靠容災(zāi)方案研究[J]. 電信技術(shù), 2015(7): 46-48.
[2] 程鴻雁. LTE核心網(wǎng)EPC融合演進(jìn)解決方案[J]. 電信技術(shù), 2013(4): 30-33.
[3] 許盛宏,李力卡,陳慶年. LTE網(wǎng)絡(luò)MME的安全容災(zāi)方案研究[J]. 移動(dòng)通信, 2015(22): 9-13.
[4] 謝紀(jì)鵬,黃艷,廖振松. 基于容災(zāi)架構(gòu)的LTE高可靠網(wǎng)管體系研究[J]. 信息通信, 2014(10): 196-197.
[5] 李旭姣. LTE核心網(wǎng)技術(shù)研究與網(wǎng)絡(luò)建設(shè)[D]. 南京: 南京郵電大學(xué), 2014.
[6] 楊紅梅. LTE核心網(wǎng)演進(jìn)及部署[J]. 現(xiàn)代電信科技, 2013(11): 12-16.
[7] 許盛宏,李力卡,劉智德. IMS核心網(wǎng)元準(zhǔn)POOL容災(zāi)方案研究[J]. 移動(dòng)通信, 2011(13): 19-23.
[8] 段鵬程,喻成霞. LTE核心網(wǎng)EPC語(yǔ)音解決方案研究[J]. 中國(guó)新通信, 2015(9): 56.
[9] 劉婷婷,劉永毓. LTE核心網(wǎng)關(guān)鍵技術(shù)探討[J]. 中國(guó)新通信, 2015(22): 64-65.
[10] 王少波,何麗華,李明晏. LTE核心網(wǎng)質(zhì)量提升方案分析[J]. 數(shù)據(jù)通信, 2015(3): 10-12.
[11] 霍龍社,甘震,馬澤芳,等. 面向LTE的移動(dòng)核心網(wǎng)部署策略探討[J]. 信息通信技術(shù), 2013(2): 43-48.