摘要:文章認為LTE-Advanced網(wǎng)絡(luò)自治愈功能能夠通過對現(xiàn)有網(wǎng)絡(luò)運行數(shù)據(jù)的分析,自動、快速、準確地檢測和定位網(wǎng)絡(luò)故障,并進行修復或者補償,可確保用戶連續(xù)、高質(zhì)量的進行通信。針對自治愈技術(shù)中的中斷探測和中斷補償技術(shù),文章分別提出相應(yīng)的解決算法:基于聚類算法的中斷探測方法、基于遺傳算法的中斷補償算法,隨后文章仿真驗證并分析了算法的正確性和有效性。
關(guān)鍵詞:網(wǎng)絡(luò)自組織;自治愈;中斷探測;中斷補償
Abstract: In an LTE-Advanced network, the self-healing function detects and locates faults promptly, accurately, and automatically by processing network statistics. It can also recover or compensate for any breakdowns for consistent, high-quality communication. This article introduces outage detection, based on a clustering algorithm, and compensation based on a genetic algorithm. We simulate these algorithms to validate their purpose and efficiency.
Key words:self-organizing network; self-healing; cell outage detection; cell outage compensation
LTE-Advanced系統(tǒng)是3GPP長期演進(LTE)的進一步演進系統(tǒng),采用更寬頻段的傳輸和頻譜共享,全面引入家庭基站和中繼站,采用增強型的多輸入多輸出(MIMO)、多點協(xié)作(CoMP)、載波聚合等先進技術(shù),從而引入了大量的參數(shù)和數(shù)據(jù)處理,這些將增加網(wǎng)絡(luò)配置及優(yōu)化的復雜度,提升網(wǎng)絡(luò)運維的人工成本和經(jīng)濟開銷。在這樣的背景下,歐美主流高端運營商提出了網(wǎng)絡(luò)自組織(SON)技術(shù),從而實現(xiàn)網(wǎng)絡(luò)自配置、網(wǎng)絡(luò)自優(yōu)化和網(wǎng)絡(luò)自治愈3個目標。
自治愈是本文討論的重點,也是SON三大組成部分(自配置、自優(yōu)化、自治愈)中最復雜的一點。3GPP協(xié)議TS 32.541中描述了自治愈功能,從2009年5月Release 9中3GPP TS 32.541 V0.2.0到2012年9月Release 11中3GPP TS 32.541 V11.0.0,從OAM(運維管理中心)的自治愈概念及需求一直到網(wǎng)絡(luò)自組織中的自治愈概念及需求,對中斷的場景、自治愈流程以及商業(yè)層級和協(xié)議層級的需求做出了循序漸進的完善[1]。
1 自治愈技術(shù)
自治愈功能能夠自動、快速、準確地檢測和定位影響網(wǎng)絡(luò)性能的故障,并進行自動恢復,以確保用戶連續(xù)、高質(zhì)量的進行通信。其目的是當發(fā)生小區(qū)中斷時,通過快速的探測定位中斷小區(qū)并通過小區(qū)中斷補償措施來緩解網(wǎng)絡(luò)性能惡化。具備自治愈功能的小區(qū)能獨立或聯(lián)合地調(diào)整無線參數(shù)及相關(guān)算法,使無線系統(tǒng)性能損失降到最低,同時還大大降低維護成本和人員投入[2]。
可能導致小區(qū)中斷的網(wǎng)絡(luò)故障原因有很多,比如硬件和軟件故障,網(wǎng)絡(luò)連接失敗,甚至是錯誤的配置參數(shù)都可能導致小區(qū)中斷[3]。
為了實現(xiàn)網(wǎng)絡(luò)自治愈,要求移動蜂窩網(wǎng)絡(luò)具有小區(qū)中斷探測和小區(qū)中斷補償兩部分的功能。其中小區(qū)中斷探測是自治愈的基礎(chǔ)和前提,小區(qū)中斷補償是自治愈的核心和關(guān)鍵。一個自治愈中斷管理的場景如圖1所示。
中斷探測模塊收集來自移動臺(UE)、基站(eNodeB)、運維管理中心(OAM)的測量數(shù)據(jù),對它們進行分析處理從而判斷是否有小區(qū)發(fā)生中斷;若有,則觸發(fā)中斷補償功能,調(diào)整相鄰基站的無線參數(shù),以補償中斷用戶惡化的服務(wù)質(zhì)量。圖1中的中間基站發(fā)生了中斷,通過補償算法,其相鄰小區(qū)提高了覆蓋,補償了中斷小區(qū)造成的覆蓋漏洞。補償后還需要對該區(qū)域進行實時監(jiān)控并評估補償后的網(wǎng)絡(luò)整體性能,以保證達到補償?shù)哪繕耍冶M量不對補償小區(qū)中的原有用戶產(chǎn)生過大的影響。
1.1 小區(qū)中斷探測
小區(qū)中斷探測機制在實施中首先需要收集來自UE、eNodeB、OAM等的測量信息,并提取能夠準確判斷小區(qū)性能中斷的數(shù)據(jù)信息。中斷探測收集參數(shù)過程如圖2所示。假設(shè)eNodeB1發(fā)生了中斷,UE1是eNodeB1服務(wù)的一個用戶,UE2是eNodeB2服務(wù)的一個用戶,它們均可以接收到來自服務(wù)小區(qū)和鄰小區(qū)的信號。OAM通過發(fā)現(xiàn)eNodeB1上報的用戶參考信號接收功率(RSRP)突然下降,或者通過發(fā)現(xiàn)eNodeB2中的用戶信道質(zhì)量指示(CQI)突然升高,均可以判斷eNodeB1可能發(fā)生了中斷。圖2中右側(cè)描述了UE、eNodeB、OAM可以收集到的用以實現(xiàn)中斷探測的參數(shù)??商綔y和提取的數(shù)據(jù)信息并不是完備的,而無線網(wǎng)絡(luò)的性能又是時變的,所以需要高效的小區(qū)中斷探測方法在有限的探測信息前提下實現(xiàn)準確地小區(qū)中斷探測。
1.2 小區(qū)中斷補償
小區(qū)中斷補償?shù)哪繕耸蔷徑庵袛嘈^(qū)的服務(wù)質(zhì)量下降,通過自動調(diào)整相鄰小區(qū)的無線參數(shù)來達到運營商制訂的補償要求。通常是調(diào)整相鄰小區(qū)天線的下傾角和方位角,或者發(fā)射功率[4]。但是調(diào)整相鄰小區(qū)的無線參數(shù)意味著對該區(qū)域的原有用戶產(chǎn)生一定程度上的影響。運營商在制訂補償策略時,首先確定中斷小區(qū)的補償小區(qū),以圖3為例,為其內(nèi)圈相鄰小區(qū),外圈小區(qū)雖然不會因為中斷補償機制調(diào)整無線參數(shù),但性能會受到一定程度上的影響。具體的無線參數(shù)調(diào)整方案會因為不同的小區(qū)需求而發(fā)生變化。所以運營商在制訂策略時,需要考慮每一個補償小區(qū)的必要需求,中斷區(qū)域補償后覆蓋和容量間的平衡,以及補償小區(qū)性能下降和中斷小區(qū)性能增強之間的平衡。
1.3 中斷探測和補償?shù)脑u價機制
評價中斷探測機制通常利用如下指標:
·探測延時:Tdetect -Tfail,即中斷發(fā)生了多久以后,中斷才被探測到。
·成功探測的概率:Ndetect / Nfail,即實際發(fā)生的中斷次數(shù)中被正確探測到的概率。
·錯誤探測的概率:N1 /(N1+Ndetect),即探測到中斷的次數(shù)中錯誤探測的概率。
評價中斷補償機制可以通過網(wǎng)絡(luò)中的參數(shù)變化對比,比如系統(tǒng)容量、覆蓋情況以及用戶服務(wù)質(zhì)量等。圖4所示為小區(qū)中斷探測時間軸。中斷前后性能比較如圖5所示,為了評價中斷補償機制,我們通常定義3個階段,以系統(tǒng)平均吞吐量為例,階段A表示了沒有發(fā)生中斷時的系統(tǒng)平均吞吐量,階段B和階段C分別表示發(fā)生了中斷之后不采用中斷補償機制,以及采用中斷補償機制以后的系統(tǒng)平均吞吐量。
2 中斷探測與補償算法
為解決中斷探測和中斷補償兩個問題,我們分別提出了基于聚類算法的中斷探測算法和基于遺傳算法的中斷補償算法,并對這兩種算法進行了仿真評估。
2.1 基于聚類算法的中斷探測方法
我們提出在中斷探測算法中運用數(shù)據(jù)挖掘中的聚類算法,對觸發(fā)A3事件的用戶進行分類,根據(jù)分類結(jié)果以及各類中的用戶分布判斷偵聽區(qū)域內(nèi)有無中斷并在中斷發(fā)生時定位中斷小區(qū)。我們提出了一種動態(tài)傳播仿射(AP)聚類算法,是對傳統(tǒng)AP聚類算法的改進[5]。其基本思想是對AP算法引入決定了分類數(shù)目的偏向參數(shù)p的動態(tài)搜索范圍,并基于聚類質(zhì)量評價指標確定最優(yōu)分類所對應(yīng)的最佳p從而確定最優(yōu)聚類分類數(shù)以及結(jié)果。圖6為整個中斷探測算法流程圖,包括4個步驟:
(1)在網(wǎng)絡(luò)的一個偵聽區(qū)域(包含多個小區(qū))中,OAM收集觸發(fā)A3事件的各用戶關(guān)鍵性能指標(KPI)參數(shù)以及相應(yīng)位置坐標。
(2)將收集的用戶KPI數(shù)據(jù)經(jīng)過預處理后,作為動態(tài)AP聚類算法的輸入?yún)?shù),并采用該算法對觸發(fā)A3事件的用戶進行最優(yōu)分類。
(3)當最優(yōu)分類對應(yīng)的聚類質(zhì)量評價指標小于設(shè)定門限時,說明觸發(fā)A3事件用戶數(shù)據(jù)的聚類可分性較差,即所有觸發(fā)事件的用戶性能沒有明顯差異,判斷該偵聽區(qū)域內(nèi)沒有發(fā)生小區(qū)中斷;若聚類質(zhì)量評價指標大于門限,表示聚類可分性較好,說明偵聽區(qū)域中觸發(fā)事件的用戶數(shù)據(jù)間存在差異,判斷該偵聽區(qū)域存在小區(qū)中斷,進入步驟(4)。
(4)提取所有觸發(fā)A3事件的用戶位置坐標,根據(jù)最優(yōu)分類,將各類中的用戶映射到網(wǎng)絡(luò)偵聽區(qū)域的小區(qū)拓撲中。若某類中有超過一定門限的數(shù)據(jù)點集中在同一小區(qū)中,則判斷該小區(qū)為中斷小區(qū)。
2.2 基于遺傳算法的
中斷補償算法
當一個小區(qū)發(fā)生中斷時,需要通過調(diào)整相鄰小區(qū)的無線參數(shù)來對中斷用戶進行服務(wù),從而達到緩解中斷用戶服務(wù)質(zhì)量下降的目的。假定中斷區(qū)域的用戶可以接入到相鄰基站,所要解決的問題是中斷用戶要接入到哪個基站,并且如何給中斷用戶分配資源塊(RB)。假設(shè)不論是正常用戶還是中斷用戶,每個用戶分配到一個RB,初始每個RB上的發(fā)射功率相同。我們首先根據(jù)遺傳算法將補償小區(qū)的空閑RB分配給中斷用戶[6]。由于中斷用戶離新接入的基站較遠,所以要提高它們RB上的發(fā)射功率,以提高中斷用戶的吞吐量[7]。具體中斷補償算法步驟如圖7所示。流程圖包括3個步驟:
(1)確定中斷小區(qū)的補償小區(qū),所有未分配給用戶的空閑RB作為候選,即將分配給中斷用戶。
(2)利用遺傳算法將補償小區(qū)的空閑RB分配給中斷用戶,目標是最優(yōu)化小區(qū)平均吞吐量。
(3)根據(jù)步驟(2)的分配結(jié)果,在一定程度上為中斷用戶的RB提高發(fā)射功率。以每個補償小區(qū)為單位進行調(diào)整。
3 仿真分析
中斷場景具體仿真參數(shù)設(shè)置如表1所示。中斷探測仿真場景設(shè)置如圖8所示。設(shè)置扇區(qū)0(1)天線增益對比正常天線增益下降50 dBi,扇區(qū)4(1)天線增益對比正常天線增益下降100 dBi,用來表示兩種不同類型的中斷小區(qū)。
利用基于聚類算法的中斷探測方法,將一個偵聽周期內(nèi)的觸發(fā)A3事件用戶的KPI信息組成數(shù)據(jù)向量,基于動態(tài)AP算法對這些用戶進行分類。圖9為不同聚類數(shù)目下對應(yīng)的聚類評價指標,由于我們選取的聚類評價指標值越大說明聚類質(zhì)量越高,也就是意味著類內(nèi)越緊湊,類間可分度越高,觸發(fā)A3事件用戶分為3類為最優(yōu)。圖10為將這些用戶分為3類時的示意圖,根據(jù)不同的分類提取用戶位置坐標映射到網(wǎng)絡(luò)拓撲中。觸發(fā)A3事件用戶分布圖如圖11所示。某兩類的數(shù)據(jù)分別集中于兩個小區(qū)內(nèi),而另一類數(shù)據(jù)則均勻分布在其他小區(qū)的邊緣,進而定位了中斷小區(qū)的位置,且區(qū)分了兩種不同的中斷小區(qū)。結(jié)果與圖8所設(shè)定的仿真場景相符,說明通過該方法可以在無任何人工干預的情況下,準確地探測出偵聽區(qū)域中的故障并定位。
中斷補償?shù)姆抡鎴鼍叭鐖D12所示。為方便分析起見,我們設(shè)置中間小區(qū)為中斷小區(qū),通過該小區(qū)的相鄰一圈小區(qū)對它進行補償。按照基于遺傳算法的中斷補償方法的兩個步驟,先利用遺傳算法將補償小區(qū)的空閑資源塊(RB)分配給中斷用戶,之后調(diào)整這些RB上的發(fā)射功率。圖13為我們所提的中斷補償方法的第一步,也就是利用遺傳算法給中斷用戶分配RB的過程中,小區(qū)平均吞吐量的變化曲線。最開始小區(qū)平均吞吐量為5.03 Mb/s,隨著算法不斷迭代,小區(qū)平均吞吐量逐漸穩(wěn)定并增加到5.36 Mb/s。這樣證明了算法的第一階段,也就是給中斷用戶分配RB的階段,取得了網(wǎng)絡(luò)整體性能的一個初步提升。
圖14分別顯示了4個階段的小區(qū)平均吞吐量情況。階段1:沒有發(fā)生中斷時,所有小區(qū)正常運行,平均小區(qū)吞吐量大約為5.72 Mb/s;階段2:發(fā)生小區(qū)中斷,造成了很大區(qū)域的覆蓋漏洞,在這個區(qū)域的所有用戶均無法通過中斷小區(qū)建立無線連接,所以此時的平均小區(qū)吞吐量下降到大約4.97 Mb/s;階段3:當調(diào)整了周圍小區(qū)天線下傾角以及一些相關(guān)控制參數(shù)后,所有中斷區(qū)域的用戶可以與鄰小區(qū)建立無線連接,但是由于這些用戶導致了更大的小區(qū)間干擾,所以在這個階段,小區(qū)平均吞吐量只有細微的提升;階段4:在利用我們的小區(qū)中斷補償算法進行無線參數(shù)調(diào)整以后的小區(qū)平均吞吐量,對比階段2有了明顯的提升。我們換一個角度來評估該算法,利用由用戶信干噪比定義的用戶滿意度。各階段用戶滿意度比例如圖15所示。當小區(qū)中斷發(fā)生之前,滿意的用戶占整體的96%。算法進行的最初,由于許多中斷用戶與補償小區(qū)建立了無線連接,所以滿意用戶比例對比發(fā)生中斷時有了大幅提高,達到了83%。當補償算法進行完畢時,滿意的用戶到達了93%,幾乎與沒發(fā)生中斷時持平,說明利用該基于遺傳算法的中斷補償算法,可有效緩解中斷用戶的服務(wù)質(zhì)量,并且對補償小區(qū)的用戶造成了較小的影響。
4 結(jié)束語
本文給出了基于聚類算法的中斷探測方法,對觸發(fā)A3事件用戶進行分類,根據(jù)各類用戶的分布判斷有無中斷小區(qū),仿真結(jié)果驗證算法可以準確地探測定位中斷小區(qū)并將不同的故障加以區(qū)分;并且根據(jù)中斷補償?shù)奶攸c,提出了基于遺傳算法的中斷補償算法,利用遺傳算法將補償小區(qū)的空閑RB以最優(yōu)方式分配給中斷用戶,進而調(diào)整每個RB上的發(fā)射功率以達到小區(qū)平均吞吐量最大,經(jīng)過仿真驗證該算法緩解了中斷用戶的服務(wù)質(zhì)量下降并對補償小區(qū)中的用戶幾乎不造成影響。自治愈技術(shù)的研究仍處于較初級階段,大部分工作停留在同構(gòu)網(wǎng)絡(luò),隨著LTE-Advanced系統(tǒng)與異構(gòu)節(jié)點并存的復雜網(wǎng)絡(luò)出現(xiàn),應(yīng)用場景和多媒體業(yè)務(wù)更加豐富,亟需提出更有效且復雜度較低的自治愈方案和策略。
參考文獻
[1] 3GPP TS 32.541 V11.0.0. Telecommunication management; Self-Organizing Networks (SON); Self-healing concepts and requirements [S]. 2012.
[2] AMIRIJOO M, JORGUSESKI L, KüRNER T, et al. Cell outage management in LTE network [C]//Proceedings of the 6th International Symposium on Wireless Communication Systems(ISWCS’09), Sep 7-10,2009, Siena(Tuscany), Italy. Piscatawaw, NJ,USA: IEEE, 2009:600-604.
[3] SZILAGYI P, NOVACZKI S. An automatic detection and diagnosis framework for mobile communication systems [J]. IEEE Transactions on Network and Service Management, 2012,9(2): 184-197.
[4] AMIRIJOO M, JORGUSESKI L, LITJENS R, et al. Cell outage compensation in LTE networks: Algorithms and performance assessment//Proceedings of the 73rd Vehicular Technology Conference (VTC-Spring’11), May 15-18, 2011, Budapest, Hungary. Piscataway, NJ,USA: IEEE, 2011: 5p.
[5] FREY B, DUECK D. Clustering by passing messages between data points [J]. Science, 2007, 315: 972-976.
[6] XIA Lingfeng, LI Wenjing, ZHANG Heng, et al. A cell outage compensation mechanism in self-organizing RAN [C]//Proceedings of the 7th International Conference on Wireless Communications, Networking and Mobile Computing (WiCOM’11), Sep 23-25, 2011, Wuhan, China. Piscataway, NJ,USA:IEEE, 2011:4p.
[7] AMIRIJOO M, JORGUSESKI L, LITJENS R, et al. Effectiveness of cell outage compensation in LTE networks [C]//Proceedings of the 8th IEEE Annual Consumer Communications and Networking Conference (CCNC’11), Jan 9-12, 2011, Las Vegas, NV, USA. Piscataway, NJ, USA: IEEE, 2011: 642-647.
收稿日期:2012-11-02
作者簡介
馬昱,北京郵電大學在讀碩士研究生;主要研究方向是無線網(wǎng)絡(luò)自組織技術(shù)中的自治愈技術(shù)。
薛文倩,北京郵電大學在讀碩士研究生;主要研究方向是無線網(wǎng)絡(luò)自組織技術(shù)中的自治愈技術(shù)。
彭木根,北京郵電大學教授、博士生導師,IEEE高級會員,北京市科技新星,教育部新世紀優(yōu)秀人才,首屆優(yōu)秀青年基金獲得者,首屆青年科學家“973”子課題負責人;長期從事時分雙工(TDD)無線網(wǎng)絡(luò)信息理論、協(xié)同網(wǎng)絡(luò)編碼、無線網(wǎng)絡(luò)自組織技術(shù)、TDD高能效無線傳輸和組網(wǎng)技術(shù)、TD-SCDMA及增強演進系統(tǒng)的傳輸和組網(wǎng)增強技術(shù)的研發(fā)工作;已發(fā)表學術(shù)論文共180余篇,其中SCI學術(shù)期刊論文38篇。