林春暉,農(nóng)蘭鈺
(中國(guó)鐵塔股份有限公司百色市分公司,廣西 百色 533000)
自動(dòng)化運(yùn)維技術(shù)作為一種新的解決方案,廣泛應(yīng)用于5G網(wǎng)絡(luò),旨在提高網(wǎng)絡(luò)的管理效率、降低運(yùn)維成本,并提升網(wǎng)絡(luò)性能和用戶體驗(yàn)。自動(dòng)化運(yùn)維技術(shù)的發(fā)展與5G網(wǎng)絡(luò)的特點(diǎn)緊密相連。5G網(wǎng)絡(luò)具有更高的傳輸速率、更低的時(shí)延和更大的連接密度,其包括大量的設(shè)備、復(fù)雜的拓?fù)浣Y(jié)構(gòu)和海量的數(shù)據(jù)流量。文章研究?jī)?nèi)容將有助于推動(dòng)5G網(wǎng)絡(luò)的自動(dòng)化運(yùn)維技術(shù)的發(fā)展,并為網(wǎng)絡(luò)管理和維護(hù)提供新的解決方案。通過(guò)引入自動(dòng)化運(yùn)維技術(shù),將進(jìn)一步改善5G網(wǎng)絡(luò)的管理效率和性能,為5G網(wǎng)絡(luò)的可持續(xù)發(fā)展提供技術(shù)支持。
自動(dòng)化運(yùn)維技術(shù)是通過(guò)運(yùn)維工具或平臺(tái),處理信息技術(shù)(Information Technology,IT)基礎(chǔ)設(shè)施和業(yè)務(wù)應(yīng)用日常任務(wù)、運(yùn)維流程的自動(dòng)化的一種技術(shù)[1]。自動(dòng)化運(yùn)維技術(shù)利用計(jì)算機(jī)系統(tǒng)和軟件工具,將人為介入的運(yùn)維操作轉(zhuǎn)化為自動(dòng)化的腳本或指令,并通過(guò)預(yù)設(shè)規(guī)則和流程來(lái)執(zhí)行和管理這些操作,從而提高效率和降低運(yùn)行風(fēng)險(xiǎn),促進(jìn)運(yùn)維組織的成熟和各種能力的升級(jí)。
第一,5G網(wǎng)絡(luò)由多種技術(shù)組成,包括傳統(tǒng)的無(wú)線通信、云計(jì)算、邊緣計(jì)算以及物聯(lián)網(wǎng)等。使得網(wǎng)絡(luò)規(guī)模龐大且異構(gòu)性增加,提高了網(wǎng)絡(luò)管理復(fù)雜性。自動(dòng)化運(yùn)維技術(shù)需要能夠適應(yīng)不同類型和品牌的設(shè)備、協(xié)議和接口,統(tǒng)一管理和調(diào)度整個(gè)網(wǎng)絡(luò)。第二,5G網(wǎng)絡(luò)支持更多的服務(wù)和應(yīng)用,故障發(fā)生的風(fēng)險(xiǎn)也相應(yīng)增加。自動(dòng)化運(yùn)維技術(shù)需要具備快速故障定位和修復(fù)能力,以減少故障對(duì)服務(wù)造成的影響。這需要建立全面的故障診斷模型和智能的自動(dòng)化修復(fù)機(jī)制。
自動(dòng)化運(yùn)維系統(tǒng)通過(guò)監(jiān)控設(shè)備、傳感器、網(wǎng)絡(luò)流量等途徑收集大量的運(yùn)維數(shù)據(jù),包括設(shè)備狀態(tài)、性能指標(biāo)、日志信息等。在數(shù)據(jù)采集過(guò)程中,需要考慮數(shù)據(jù)的實(shí)時(shí)性和一致性。數(shù)據(jù)采集完成后,需要進(jìn)行數(shù)據(jù)清洗、去噪和預(yù)處理等工作,以確保數(shù)據(jù)的準(zhǔn)確性和可用性[2]。自動(dòng)化運(yùn)維數(shù)據(jù)包含了大量的特征變量。在建模過(guò)程中,需要通過(guò)特征提取和選擇從原始數(shù)據(jù)中提取有用的特征,并去除冗余或無(wú)關(guān)的特征。該方式可以減少模型的復(fù)雜性,提高建模的效率和準(zhǔn)確性。特征提取是從原始數(shù)據(jù)中提取有用的特征變量,通常通過(guò)數(shù)學(xué)和統(tǒng)計(jì)方法實(shí)現(xiàn)。表示特征提取的過(guò)程的公式為
式中:X為原始數(shù)據(jù);Y為提取得到的特征變量;f(·)為特征提取函數(shù)。
特征選擇是從提取得到的特征變量中選擇最具有代表性和相關(guān)性的特征,去除冗余或無(wú)關(guān)的特征。表示特征選擇的過(guò)程公式為
式中:Z為經(jīng)過(guò)特征選擇后的特征變量;g(·)為特征選擇函數(shù)。
通過(guò)式(2),可以將特征提取和特征選擇過(guò)程表示為一系列函數(shù)的組合,從原始數(shù)據(jù)中提取有用的特征,并去除冗余或無(wú)關(guān)的特征。這樣可以減少建模過(guò)程中考慮的特征數(shù)量,簡(jiǎn)化模型的復(fù)雜度,提高建模的效率和準(zhǔn)確性。
機(jī)器學(xué)習(xí)算法在5G網(wǎng)絡(luò)中的故障診斷和預(yù)測(cè)方面有廣泛的應(yīng)用,通過(guò)機(jī)器學(xué)習(xí)算法,可以根據(jù)歷史數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),構(gòu)建故障診斷模型。這些模型可以自動(dòng)分析和識(shí)別各類故障事件,并識(shí)別故障的類型、位置和嚴(yán)重程度。例如,可以使用分類算法,如決策樹(shù)、支持向量機(jī)等,將故障數(shù)據(jù)與已知故障模式進(jìn)行比對(duì),來(lái)進(jìn)行故障診斷。5G網(wǎng)絡(luò)故障診斷和預(yù)測(cè)中使用的歷史數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)如表1所示。
表1 5G網(wǎng)絡(luò)故障診斷和預(yù)測(cè)中使用的歷史數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)
由表1可知,時(shí)間戳列顯示了數(shù)據(jù)采集的時(shí)間,設(shè)備狀態(tài)列表示設(shè)備的工作狀態(tài),性能指標(biāo)列提供了一些重要的指標(biāo)數(shù)據(jù),日志信息列提供了關(guān)于設(shè)備工作的記錄。使用5G網(wǎng)絡(luò)中的歷史數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),可以使用機(jī)器學(xué)習(xí)算法構(gòu)建故障診斷模型。通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行特征提取、預(yù)處理和訓(xùn)練,還可以使用分類算法,如決策樹(shù)、支持向量機(jī)等來(lái)自動(dòng)分析和識(shí)別故障事件。
機(jī)器學(xué)習(xí)算法可以幫助進(jìn)行故障原因分析,即找出導(dǎo)致系統(tǒng)故障的具體原因。通過(guò)分析各種運(yùn)維數(shù)據(jù)和日志信息,結(jié)合機(jī)器學(xué)習(xí)算法的特征選擇和解釋能力,可以推斷出導(dǎo)致故障的特定條件或事件。實(shí)現(xiàn)故障原因分析的下一步是訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)模型,從特征集合中找到故障根因。可以使用監(jiān)督學(xué)習(xí)算法構(gòu)建模型,其中樣本包括故障發(fā)生期間的數(shù)據(jù)和相應(yīng)的故障根因標(biāo)簽。訓(xùn)練模型的公式可以表示為
式中:M為訓(xùn)練得到的機(jī)器學(xué)習(xí)模型;X為特征向量集合;Y為標(biāo)簽(即故障根因)。
訓(xùn)練好機(jī)器學(xué)習(xí)模型后,可以使用該模型對(duì)新的故障數(shù)據(jù)進(jìn)行預(yù)測(cè)和推斷,找出導(dǎo)致系統(tǒng)故障的具體原因。該過(guò)程的公式為
式中:R為推斷得到的故障根因;I(·)為模型推理或推斷過(guò)程,用于將模型M應(yīng)用于輸入的新數(shù)據(jù)X,并返回推斷結(jié)果R;M為訓(xùn)練得到的機(jī)器學(xué)習(xí)模型;X為新的故障數(shù)據(jù)特征向量。
機(jī)器學(xué)習(xí)算法可以借助運(yùn)維數(shù)據(jù)和日志信息,進(jìn)行故障原因分析,并推斷出導(dǎo)致系統(tǒng)故障的具體原因。這樣可以幫助運(yùn)維人員快速定位問(wèn)題,并采取適當(dāng)?shù)拇胧┬迯?fù)故障,提高系統(tǒng)的可靠性和服務(wù)的質(zhì)量。
智能化運(yùn)維系統(tǒng)設(shè)計(jì)與實(shí)施方案是為了提高5G網(wǎng)絡(luò)的管理和維護(hù)效率,實(shí)現(xiàn)自動(dòng)化、智能化的運(yùn)維管理[3]。在系統(tǒng)架構(gòu)設(shè)計(jì)方面,能夠利用機(jī)器學(xué)習(xí)算法,基于歷史數(shù)據(jù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),構(gòu)建一個(gè)預(yù)測(cè)模型。這個(gè)模型會(huì)根據(jù)用戶的當(dāng)前環(huán)境和應(yīng)用需求,預(yù)測(cè)資源需求量。例如,可以使用深度學(xué)習(xí)的循環(huán)神經(jīng)網(wǎng)絡(luò)循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型,輸入之前的狀態(tài)信息和當(dāng)前的用戶數(shù)據(jù),預(yù)測(cè)下一時(shí)刻用戶需要的資源量。在構(gòu)建資源需求預(yù)測(cè)模型時(shí),可以使用深度學(xué)習(xí)的RNN模型。RNN是一種適用于序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型,非常適合用于預(yù)測(cè)未來(lái)的資源需求量。
假設(shè)有一組歷史數(shù)據(jù),包含用戶的當(dāng)前環(huán)境和應(yīng)用需求及相應(yīng)的資源需求量。將這些數(shù)據(jù)組織成一個(gè)時(shí)間序列,其中每個(gè)時(shí)間步表示一個(gè)特定的時(shí)間點(diǎn)。對(duì)于每個(gè)時(shí)間步,模型的輸入包括之前的狀態(tài)信息和當(dāng)前的用戶數(shù)據(jù)。
針對(duì)RNN模型,表達(dá)式為
式中:ht為當(dāng)時(shí)時(shí)間步的隱藏狀態(tài);xt為當(dāng)前時(shí)間步的輸入數(shù)據(jù);Whh、Whx分別為隱藏狀態(tài)和輸入數(shù)據(jù)的權(quán)重矩陣;bh為偏置項(xiàng);f(·)為激活函數(shù)。
RNN模型能夠根據(jù)之前的狀態(tài)信息和當(dāng)前的用戶數(shù)據(jù),生成一個(gè)隱藏狀態(tài)ht。該隱藏狀態(tài)可以看作模型在當(dāng)前時(shí)間步維護(hù)的記憶信息,反映了過(guò)去時(shí)間步的輸入數(shù)據(jù)和狀態(tài)信息。在RNN模型的輸出層添加一個(gè)全連接層,并使用適當(dāng)?shù)募せ詈瘮?shù),如線性或Sigmoid函數(shù)進(jìn)行轉(zhuǎn)換,從而得到一個(gè)預(yù)測(cè)值,即用戶未來(lái)的資源需求量[4]。通過(guò)建立和訓(xùn)練模型,使其具備預(yù)測(cè)用戶未來(lái)資源需求的能力。模型的預(yù)測(cè)能力可以進(jìn)一步用于故障診斷和預(yù)測(cè)。通過(guò)監(jiān)測(cè)網(wǎng)絡(luò)的實(shí)時(shí)數(shù)據(jù),結(jié)合用戶數(shù)據(jù)和環(huán)境數(shù)據(jù),模型可以及時(shí)識(shí)別可能出現(xiàn)的故障,并提前采取措施避免故障發(fā)生,從而降低網(wǎng)絡(luò)故障率。自動(dòng)化運(yùn)維網(wǎng)絡(luò)故障檢測(cè)數(shù)據(jù)如圖1所示。
圖1 自動(dòng)化運(yùn)維網(wǎng)絡(luò)故障檢測(cè)數(shù)據(jù)
由圖1可知,通過(guò)應(yīng)用自動(dòng)化運(yùn)維技術(shù),故障發(fā)生數(shù)量明顯減少,網(wǎng)絡(luò)故障率得到了顯著降低。這說(shuō)明自動(dòng)化運(yùn)維技術(shù)能夠有效診斷和預(yù)測(cè)故障,并提前采取措施避免潛在問(wèn)題的發(fā)生[5]。需要注意的是,具體的結(jié)果可能會(huì)因?qū)嶒?yàn)設(shè)置和場(chǎng)景不同而有所差異。在實(shí)際的應(yīng)用場(chǎng)景中,應(yīng)考慮更多的潛在因素,并持續(xù)監(jiān)測(cè)和改進(jìn)預(yù)測(cè)模型,以確保其在實(shí)際運(yùn)行中的準(zhǔn)確性和可靠性。
文章主要研究面向5G網(wǎng)絡(luò)的自動(dòng)化運(yùn)維技術(shù)。該技術(shù)能夠有效提高運(yùn)維效率、降低故障率、增強(qiáng)網(wǎng)絡(luò)可靠性以及改善用戶體驗(yàn),對(duì)于5G網(wǎng)絡(luò)的可持續(xù)發(fā)展至關(guān)重要,為構(gòu)建更強(qiáng)大、更穩(wěn)定的5G網(wǎng)絡(luò)奠定了堅(jiān)實(shí)基礎(chǔ)。未來(lái),自動(dòng)化運(yùn)維技術(shù)將引入更多智能網(wǎng)絡(luò)管理機(jī)制,如網(wǎng)絡(luò)切片、自適應(yīng)資源分配和動(dòng)態(tài)路由等,以提供個(gè)性化、靈活且高效的網(wǎng)絡(luò)服務(wù)。