孫建強 吳麗華
(中國移動通信集團設計院有限公司 北京 100080)
IMS(IP Multimedia Subsystem)即IP多媒體子系統(tǒng),是一種全新的網絡架構和多媒體業(yè)務形式,被業(yè)界普遍認為是下一代網絡的核心控制技術。
經過較長時間的技術論證和網絡測試,IMS核心網架構在全業(yè)務運營環(huán)境下的優(yōu)勢已初現端倪。IMS具有完全的端到端IP特性,保證了其接入的無關性,實現了3G-PS、LAN、WLAN、WiMAX、xDSL等不同制式終端的接入;IMS更加徹底的控制與承載分離、業(yè)務與呼叫控制分離的架構保證了其靈活快速的業(yè)務引入能力;IMS繼承了移動網絡的特性,將用戶數據與其相關聯(lián)的業(yè)務數據集中放置到HSS中,用戶數據的分離集中更加有利于業(yè)務的實現和提供;IMS的核心功能實體之間采用SIP協(xié)議,擴展性好,網絡兼容性強,網絡更加標準和統(tǒng)一。
目前國內三大運營商都在積極籌備建設IMS網絡。其中中國移動已經明確將CM-IMS作為核心網演進方向,并計劃以省或者大區(qū)為單位建設CM-IMS核心網絡,一個省或者一個大區(qū)可能只有一套CM-IMS核心網設備,CM-IMS核心網網元對網絡安全和容災的要求就更加突出。
本文針對CM-IMS網絡的網絡結構、網元功能以及各網元之間連接關系,簡要列出CSCF、HSS、MGCF等重要核心網元的節(jié)點設置方式,重點分析CM-IMS網絡內幾個重要網元的容災方案。
CM-IMS標準是中國移動結合自身網絡特點,將國際標準IMS進行簡化和創(chuàng)新,提出的更加適用于中國移動現網的網絡架構,國際標準與現有網絡的結合誕生的網絡架構更有利于其在現網的部署和在實際應用中發(fā)揮作用。
在CM-IMS網絡架構組成中,主要有以下功能網元。
CSCF(會話控制):是IMS系統(tǒng)的呼叫控制核心,它的主要作用是在IP傳輸平臺上實現用戶接入及鑒權、會話路由、業(yè)務觸發(fā)等功能。根據功能分工不同分為P-CSCF、I-CSCF、S-CSCF和E-CSCF。
P-CSCF(代理會話控制)提供注冊和注銷、鑒權和授權、信令壓縮、媒體授權、信令路由、數據管理、緊急呼叫、QoS、計費等功能。
I-CSCF(查詢會話控制)是IMS歸屬網絡的入口點,在注冊過程中,I-CSCF通過查詢HSS,為用戶選擇S-CSCF;在呼叫過程中,去往IMS網絡的呼叫首先路由到I-CSCF,由I-CSCF從HSS獲取用戶所注冊的S-SCSCF地址,將消息路由到S-CSCF。
S-CSCF(業(yè)務會話控制)在IMS核心網中處于核心的控制地位,負責對終端的注冊鑒權和會話控制,執(zhí)行基本會話路由功能,并進行到AS的業(yè)務觸發(fā)。
E-CSCF負責緊急呼叫的相關處理。
HSS/SLF:HSS作為整個網絡的用戶數據庫,存儲IMS用戶的鑒權信息、簽約信息、業(yè)務透明數據等。SLF在域內存在多個HSS時,由SLF選擇用戶存儲的HSS。
MGCF/IM-MGW:是IMS域與CS域和PSTN互通的功能實體,分別負責控制信令和媒體流的互通。
BGCF:功能主要是將用戶的會話路由到正確的PLMN/PSTN網絡。與本網用戶互通,選擇路由至被叫網絡的MGCF,與其他運營商互通,選擇與其他運營商的BGCF互通。
MRF(MRFC和MRFP):MRF(媒體資源功能)主要提供鈴音與錄音通知的播放、會議的媒體流處理(混音等)、編解碼轉換、DTMF信號處理等功能。
ENUM/DNS:系統(tǒng)在CM-IMS網絡中主要完成用戶E.164號碼與Sip uri之間的轉換,并且提供用戶歸屬域域名對應IP地址的映射,協(xié)助IMS核心網網元完成會話的路由。
SBC(會話邊界控制器):是IMS的接入點,完成用戶代理、接入控制、NAT穿越、媒體門控等功能。
結合目前中國移動及主要設備廠家倡導的CMIMS網元設置方式,分別討論幾類重要網元的容災方案。
CSCF是CM-IMS最核心的控制和處理網元,建議在開通CM-IMS業(yè)務的省中心集中設置。P-CSCF可與I-CSCF/S-CSCF合并設置,也可以單獨設置,并根據業(yè)務需求逐步向用戶側延伸部署。
CSCF的容災方式總結來說可以描述為“資源池負荷分擔模式”,以域內有兩套CSCF設備來舉例說明,CSCF形成1+1互助的容災模式,網絡結構如圖1所示。
圖1 CSCF容災網絡結構示意圖
圖1中CSCF的容災實現機制如下。
(1) S/I-CSCF1和S/I-CSCF2以負荷分擔的方式設置,可以組成S-CSCF Pool。P-CSCF和MGCF以優(yōu)選的方式可均衡的選擇S-CSCF,域內任何一個S-CSCF故障,其負荷將均衡分擔到其它S-CSCF,不影響業(yè)務;
(2) 業(yè)務發(fā)起和網絡路由過程中,由IMS域內的DNS 將來自兩個P-CSCF的注冊、路由請求分別解析到兩個I-CSCF,實現業(yè)務的負荷分擔。同時DNS內保留域內I-CSCF的列表,當按照正常路徑不能解析出目的I-CSCF時,DNS將按照I-CSCF列表解析到第二優(yōu)先級的I-CSCF,實現I-CSCF的容災互助;
(3) 正常狀態(tài)下,通過I-CSCF優(yōu)選綁定S-CSCF,實現S-CSCF的業(yè)務負荷分擔。同時在每個I-CSCF中保留一份域內所有S-CSCF的列表,當按照正常程序指定的S-CSCF不可達時,I-CSCF將按照列表中預先設定的優(yōu)先級將本次業(yè)務指派到其它S-CSCF,實現S-CSCF的容災互助;
(4) P-CSCF的容災,與S-CSCF的容災類似,多個P-CSCF組成P-CSCF Pool。SBC以優(yōu)先級方式可均衡的選擇P-CSCF,域內任何一個P-CSCF故障,其負荷將均衡分擔到其它P-CSCF,不影響業(yè)務。
HSS作為用戶和業(yè)務數據的數據庫,需要頻繁與核心控制網元進行數據交互,宜與核心網元一起集中設置在CM-IMS省中心。HSS與現網HLR的功能和網絡地位類似,需要采用高級別的網元容災備份機制,CMIMS建網初期建議采用基于BOSS系統(tǒng)的“N+1”靜態(tài)數據備份方案。
下面針對HSS設備正常工作、故障倒換、狀態(tài)恢復的3個過程來討論HSS的容災備份機制。以域內有兩套HSS設備來舉例說明,兩套HSS設備之間形成1+1靜態(tài)數據備份的容災模式。
正常狀態(tài)下工作模式如圖2所示。
圖2 HSS正常狀態(tài)工作示意圖
與HSS相連的域內對端網元(主要是CSCF、AS等)分別與主用HSS和備用HSS保持有鏈路連接。在CSCF和AS的Diameter鏈路數據配置中,至主用HSS的鏈路優(yōu)先級高于至備用HSS的鏈路。在正常狀態(tài)下,CSCF和AS等對端網元將信令都發(fā)往主用HSS。同時,主用HSS和備用HSS之間按照一定的機制進行數據同步。
出現故障時工作模式如圖3所示。
當主用HSS出現設備故障,或者對端網元CSCF/AS與主用HSS之間的鏈路中斷時,對端網元可通過SIP Option檢測到主用HSS設備的狀態(tài)異常或鏈路故障,則將信令都發(fā)送到備用HSS。此時網絡仍然運行,業(yè)務不會中斷。
主用HSS的恢復如圖4所示。
圖3 主用HSS故障后示意圖
圖4 主用HSS恢復示意圖
當主用HSS故障恢復時,按照正常業(yè)務流程,對端網元CSCF/AS將會把信令發(fā)給主用HSS,此時需要進行干預才能保證業(yè)務的正常進行。因為在主用HSS故障或鏈路中斷的過程中,系統(tǒng)數據庫中的用戶數據和業(yè)務數據已經在備用HSS中進行修改,主用HSS內存儲的已經不是最新的用戶業(yè)務數據,需要將備份HSS中的數據完全同步到主用HSS。
在主用HSS故障排除后,可通過手工執(zhí)行OMU命令,斷開主用HSS與CSCF/AS的所有鏈路。執(zhí)行從備份HSS到主用HSS的數據同步指令,當數據完全從備份HSS恢復到主用HSS后,再恢復CSCF/AS至主用HSS的鏈路。對端網元檢測到與主用HSS的鏈路恢復,則將信令都發(fā)送到主用HSS。
MGCF是與現網CS域和PSTN進行互通的網元,其功能和網絡地位與現有網絡中的互聯(lián)互通獨立關口局類似,在網元設置方式上建議采用1+1負荷分擔、網元級容災、不同局址設置。
MGCF設備的容災采用1+1負荷分擔方式,S-CSCF(BGCF)到MGCF的鏈路故障是通過啟發(fā)式Option檢測來感知,MGCF到S-CSCF(BGCF)的心跳是通過SIP中繼Option心跳檢測來感知。
負荷分擔情況下S-CSCF(BGCF)上同時配置兩個MGCF的局數據信息,正常工作情況下S-CSCF(BGCF)對MGCF進行輪選,將不同的話務按照負荷分擔原則發(fā)往兩個MGCF,當其中一個MGCF故障時,將所有會話發(fā)往至另一個MGCF。如圖5所示。
假設圖中MGCF1故障,在倒回命令執(zhí)行之前,MGCF1處于雙歸屬非激活態(tài)。對于MGCF1側,CSCF(BGCF)發(fā)送的Option檢測均回應500響應,因此MGCF1側的CSCF(BGCF)選路將一直使用第二路由,路由呼叫和監(jiān)聽消息都發(fā)送到MGCF2。
按照上述容災處理機制,當MGCF1故障時,業(yè)務將自動倒換至MGCF2。在倒回方式上按照通常的處理可有兩種方式:手動倒回和自動倒回。
手動倒回:在MGCF1的業(yè)務倒換至MGCF2之后,對MGCF1進行重新啟動,當MGCF1設備正常運行后,可以在MGCF2上執(zhí)行MML命令,將MGCF1的業(yè)務全部倒回至MGCF1處理,業(yè)務恢復常態(tài)。
自動倒回:在MGCF1的業(yè)務倒換至MGCF2之后,如果MGCF1重新啟動,設備正常運行,則原MGCF1的業(yè)務按照程序自動全部倒回。
在實際網絡運維中,推薦采用故障時自動倒換、恢復時手動倒回的模式,即在一個MGCF故障時自動將業(yè)務倒換至另一個MGCF,但倒回則由手動指令完成,這樣可以在最短時間內避免業(yè)務中斷,也防止在異常時的乒乓倒換,在兩個MGCF之間進行循環(huán)的倒換和倒回。
SBC設置在開放業(yè)務的本地網,采用全代理方式。若同本地網內有多套SBC時, SBC可支持UE對SBC的兩種負荷分擔方式進行容災:
方式1:公網DNS通過輪詢的方式將UE接入本地網內多套SBC中的一套SBC,單套SBC故障時業(yè)務將均衡至其它SBC。
方式2:公網DNS通過設置View,每個View對應一套SBC的管轄區(qū)域,在SBC管轄區(qū)域內的UE向DNS發(fā)起SBC域名解析申請時,DNS會將對應的SBC的IP地址返回給UE。
對于上述兩種方式,本地網內SBC數量較少時適宜采用方式1,本地網內SBC數量較多時適宜采用方式2。
SBC的故障倒換對用戶終端有特殊功能要求,要求DNS向UE返回SBC的列表時,若第一個SBC有故障,UE能自動選第二個SBC發(fā)起請求。
ENUM/DNS服務器應分兩級獨立設置。全網統(tǒng)一設置根ENUM/DNS服務器,負責網內域間信令路由的查詢和解析;省中心設置二級ENUM/DNS服務器,負責域內信令路由的查詢和解析。
圖5 MGCF容災示意圖
ENUM/DNS的容災方式總的來說就是分區(qū)域主用+備用的方式。
一級ENUM/DNS分南北區(qū)設置兩套,互為主備,容災方式與現網的公網DNS相同。
對于二級ENUM/DNS,若核心網設備P-CSCF、I/S/E-CSCF/BGCF多局址設置,建議在不同局址設置2套ENUM/DNS設備,采用互為主備的負荷分擔方式。與ENUM/DNS同局址的核心網元、業(yè)務平臺可設置同局址的ENUM/DNS為主用,則另一個局址的ENUM/DNS為備用;并在省內對ENUM/DNS分管轄區(qū)域,對于與ENUM/DNS不同局址的其它核心網元(如SBC)、業(yè)務平臺等按管轄區(qū)域配置主備ENUM/DNS。
CM-IMS網絡中,網元實體和邏輯功能模塊更加細化。在CM-IMS網絡與現有CS域網絡組成的共存網絡環(huán)境下,并不是所有的業(yè)務流程都需要經過CMIMS網絡中的每一個網元和功能實體。因此,有部分業(yè)務可能實際不需要每一次都通過查詢HSS才能實現,單個業(yè)務可能只需要與本業(yè)務相關的AS參與實現業(yè)務邏輯。當部分網元實體出現故障時,網絡應保證單次業(yè)務最大可能的被實現,此種情況稱之為業(yè)務放通的容災。具體舉例如圖6所示。
圖6 業(yè)務放通容災示意圖
在業(yè)務放通過程中CSCF、MGCF等相關網元需要具有以下功能:
MGCF能夠支持在CSCF網元故障情況下,放通2G-2G的呼叫,確保手機基本業(yè)務的暢通。
CSCF和MGCF支持查詢HSS失敗情況下放通2G-2G的呼叫,確保手機基本業(yè)務。
CSCF支持在單個AS故障情況下,業(yè)務流程可忽略該AS,放通呼叫觸發(fā)后續(xù)AS。