中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2025)08-0010-06
Abstract:The Long TermEvolution of Metro (LTE-M) network fault prediction datasetof rail transit has the problems ofunbalancedsamplesandsmallamountofsampledatawhichimpacttheacuracyoffault prediction.Inordertosolvethe above problems,this paper proposes aresearch methodofLTE-Mfault predictionofrail transitbased onconditionalTime-series Generative Adversarial Networks (TimeGAN).Bydefiningdynamic autoencoderandstatic autoencoderinTimeGANmodel,this method furtherexploresthedynamicandstaticcharacteristicsofLT-Mfaultdataofrailtransit,andintroducesGELUactivation functionnthepotentialspaceofgeneratoranddiscriminatortoaceleratemodelconvergenceandgeneratesyntheticdatacloser toreal data,thusefectivelyalleviating the problemofunbalancedfaultdatasetandsmalldatavoume.Theexperimentalresults showthatwhenthedatasynthesizedbytheTimeGANmodelisusedforfaultpredictiontraining,itcanproducebeterediction results than the original data.
Keywords:rail transitLTE-M;fault prediction;time-series;TimeGAN
0 引言
隨著新一代移動(dòng)通信的飛速發(fā)展,軌道交通通信基礎(chǔ)設(shè)施規(guī)模也迅速擴(kuò)展,LTE-M網(wǎng)絡(luò)作為軌道交通網(wǎng)絡(luò)關(guān)鍵組成部分,其復(fù)雜性也隨之增加。軌道交通LTE-M網(wǎng)絡(luò)系統(tǒng)中任何一個(gè)設(shè)備發(fā)生故障都可能觸發(fā)一系列設(shè)備的連鎖告警反應(yīng),從而產(chǎn)生大量的告警信息。這不僅阻礙網(wǎng)絡(luò)管理人員對故障的及時(shí)和準(zhǔn)確定位,也極大地增加了網(wǎng)絡(luò)維護(hù)的難度。實(shí)時(shí)準(zhǔn)確監(jiān)測網(wǎng)絡(luò)設(shè)備并實(shí)現(xiàn)故障快速定位甚至預(yù)測網(wǎng)絡(luò)故障成為維護(hù)網(wǎng)絡(luò)通信質(zhì)量的核心任務(wù)。
隨著深度學(xué)習(xí)在故障預(yù)測領(lǐng)域的廣泛應(yīng)用,深度學(xué)習(xí)技術(shù)對網(wǎng)絡(luò)故障預(yù)測的研究也層出不窮,但是現(xiàn)有故障預(yù)測研究,對時(shí)間序列特征間關(guān)系的挖掘還不夠充分,導(dǎo)致預(yù)測精度較低。基于深度學(xué)習(xí)的時(shí)間序列預(yù)測主要涉及金融股票[1]、軌跡預(yù)測[2]和工業(yè)指標(biāo)[3]等多個(gè)領(lǐng)域?;谏疃葘W(xué)習(xí)的故障預(yù)測方法通過學(xué)習(xí)歷史數(shù)據(jù)的特征,展現(xiàn)出對網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整的高度適應(yīng)性。施清譯[4等提出一種將時(shí)序生成對抗網(wǎng)絡(luò)和通道空間雙注意力機(jī)制相結(jié)合的數(shù)據(jù)生成方法,合成了與實(shí)際電器功率數(shù)據(jù)相似度較高的合成數(shù)據(jù)。雖然深度學(xué)習(xí)技術(shù)的發(fā)展帶來了預(yù)測性能的提升,但其性能的提升往往依賴于大量的訓(xùn)練樣本數(shù)據(jù)集。然而,在面對實(shí)際數(shù)據(jù)集時(shí),可能面臨數(shù)據(jù)量不足導(dǎo)致樣本不均衡等問題。數(shù)據(jù)集的數(shù)量較少使得預(yù)測模型難以捕獲數(shù)據(jù)中的特征依賴關(guān)系,預(yù)測模型的準(zhǔn)確性往往難以達(dá)到預(yù)期。
數(shù)據(jù)增強(qiáng)是擴(kuò)充數(shù)據(jù)的一種方法,近年來廣泛應(yīng)用于回歸分析和分類領(lǐng)域,并取得了較大進(jìn)展。然而,針對時(shí)間序列數(shù)據(jù)的增強(qiáng)方法研究仍然較少。對抗生成網(wǎng)絡(luò)(GAN)[5]利用合成虛擬樣本的概念,創(chuàng)造了合成數(shù)據(jù)。通過聯(lián)合訓(xùn)練生成器和判別器,GAN逐步擬合原始數(shù)據(jù)分布?;贕AN的數(shù)據(jù)增強(qiáng)策略,Zhang等開發(fā)了一種改進(jìn)的耦合生成器對抗堆疊自編碼器(ICoGASA),以模擬更真實(shí)的天氣預(yù)報(bào)誤差和不同居民的生活方式,并根據(jù)訓(xùn)練樣本生成合成樣本(RSS)。改進(jìn)的條件生成對抗網(wǎng)絡(luò)(RegGAN)[7]通過采樣生成新的特征數(shù)據(jù),并改進(jìn)了CGAN以生成相應(yīng)的估計(jì)值。連續(xù)循環(huán)神經(jīng)網(wǎng)絡(luò)(C-RNN-GAN)結(jié)合了對抗性訓(xùn)練和循環(huán)神經(jīng)網(wǎng)絡(luò),用于時(shí)間序列數(shù)據(jù)增強(qiáng),但未能很好地捕捉時(shí)間步依賴關(guān)系及其動(dòng)態(tài)特征。Yoon等人提出的TimeGAN方法結(jié)合了預(yù)測任務(wù)的監(jiān)督學(xué)習(xí)和編碼任務(wù)的非監(jiān)督學(xué)習(xí),有效生成時(shí)間序列數(shù)據(jù)。Zhang[1o]等,提出數(shù)據(jù)的質(zhì)量和數(shù)量是影響模型預(yù)測精度的關(guān)鍵,并將TimeGAN應(yīng)用于供熱領(lǐng)域,增加了數(shù)據(jù)量,并提高了預(yù)測模型的精度。王渝紅[等,提出一種基于條件生成對抗網(wǎng)絡(luò)(CGAN)與遷移學(xué)習(xí)的暫態(tài)電壓穩(wěn)定超前判別方法,取得了較好的實(shí)驗(yàn)效果。周琳茹[12]等,采用基于注意力機(jī)制的生成對抗網(wǎng)絡(luò)對任務(wù)分析方法進(jìn)行研究,使得模擬生成的數(shù)據(jù)集精度有了較好的提升。
基于上述軌道交通LTE-M網(wǎng)絡(luò)故障預(yù)測研究中存在的問題,首先分析軌道交通LTE-M網(wǎng)絡(luò)故障特征,并引入TimeGAN模型,該模型將自回歸學(xué)習(xí)和對抗學(xué)習(xí)無監(jiān)督訓(xùn)練相結(jié)合,使用兩個(gè)自編碼器分別處理動(dòng)靜態(tài)數(shù)據(jù),進(jìn)一步挖掘軌道交通LTE-M網(wǎng)絡(luò)故障的潛在靜態(tài)分布規(guī)律和動(dòng)態(tài)依賴演變特性,從數(shù)據(jù)層面解決數(shù)據(jù)集中存在的樣本不均衡問題;在生成器與判別器的潛在空間使用GELU激活函數(shù),GELU函數(shù)的平滑性和近似線性特性有助于加速梯度下降算法的收斂,使TimeGAN模型更快地學(xué)習(xí)和適應(yīng)數(shù)據(jù),生成高質(zhì)量的新樣本。為了驗(yàn)證生成數(shù)據(jù)的真實(shí)性和有用性,比較了數(shù)據(jù)增強(qiáng)方法所生成數(shù)據(jù)的分布差距以及合成數(shù)據(jù)用于預(yù)測時(shí)的預(yù)測效果。
1軌道交通LTE-M網(wǎng)絡(luò)故障特點(diǎn)分析
軌道交通LTE-M網(wǎng)絡(luò)故障與告警日志數(shù)據(jù)和網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)的變化密切相關(guān)。在軌道交通LTE-M網(wǎng)絡(luò)管理系統(tǒng)中,網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)可以提供關(guān)于故障發(fā)生時(shí)設(shè)備狀態(tài)的詳細(xì)信息,幫助網(wǎng)絡(luò)管理人員及時(shí)進(jìn)行故障定位。告警日志數(shù)據(jù)記錄系統(tǒng)在設(shè)備運(yùn)行過程中記錄各種告警事件,包括設(shè)備號、告警名稱、告警級別以及發(fā)生時(shí)間等信息,如表1所示是部分網(wǎng)絡(luò)告警日志記錄的示例。
如表2所示是部分網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)的示例。通過分析告警日志數(shù)據(jù)以及網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)總結(jié)出LTE-M網(wǎng)絡(luò)故障數(shù)據(jù)動(dòng)靜態(tài)特征。本文將軌道交通LTE-M故障數(shù)據(jù)集特征劃分為兩個(gè)維度。
1)告警日志數(shù)據(jù):告警日志數(shù)據(jù)是記錄不同告警發(fā)生時(shí)間的數(shù)據(jù),其告警的種類在系統(tǒng)中是有限,數(shù)據(jù)種類是有限的意味著數(shù)據(jù)集中的每個(gè)數(shù)據(jù)點(diǎn)都屬于已知的、固定的類別或取值范圍,在一定范圍內(nèi)是固定不發(fā)生變化的,因此可以將告警數(shù)據(jù)看作靜態(tài)特征數(shù)據(jù)。
2)網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù):網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)記錄網(wǎng)絡(luò)設(shè)備運(yùn)行狀態(tài),其是典型的時(shí)間序列,當(dāng)網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)出現(xiàn)異常波動(dòng)時(shí),可能預(yù)示著網(wǎng)絡(luò)設(shè)備在運(yùn)行過程中,出現(xiàn)了異常。這類數(shù)據(jù)隨著時(shí)間的波動(dòng)變化具有季節(jié)性、周期性等特點(diǎn),故將這類數(shù)據(jù)劃分為時(shí)態(tài)特征數(shù)據(jù)。
2 TimeGAN原理
TimeGAN模型由三個(gè)部分組成,分別是GAN網(wǎng)絡(luò)、動(dòng)態(tài)編碼器和靜態(tài)編碼器,如圖1所示。該模型為了降低對抗性學(xué)習(xí)空間的高維性,引入了兩個(gè)嵌入網(wǎng)絡(luò),分別提供動(dòng)態(tài)和靜態(tài)特征與潛在表示之間的可逆映射關(guān)系。在學(xué)習(xí)嵌入空間對抗性聯(lián)合訓(xùn)練時(shí),引入使用原始數(shù)據(jù)作為監(jiān)督的逐步監(jiān)督損失以及真實(shí)序列和合成序列上的無監(jiān)督對抗損失,從而鼓勵(lì)模型捕捉數(shù)據(jù)中的逐步條件分布。
基于TimeGAN模型將時(shí)間序列數(shù)據(jù)特征劃分為兩種:靜態(tài)特征和時(shí)態(tài)特征。考慮軌道交通LTE-M網(wǎng)絡(luò)故障數(shù)據(jù)包含靜態(tài)特征和動(dòng)態(tài)特征。聯(lián)合訓(xùn)練四個(gè)損失函數(shù)的主要目的是減少合成數(shù)據(jù)與原始數(shù)據(jù)在特征分布上的差異。TimeGAN的目標(biāo)是將GAN目標(biāo)和ML目標(biāo)相結(jié)合。這樣自然會產(chǎn)生一個(gè)訓(xùn)練過程,其中包括簡單地添加監(jiān)督損失來指導(dǎo)對抗性學(xué)習(xí):
2.1 嵌入式和恢復(fù)網(wǎng)絡(luò)
TimeGAN模型中,加入兩個(gè)嵌入式和恢復(fù)網(wǎng)絡(luò)的自的是進(jìn)行動(dòng)態(tài)和靜態(tài)數(shù)據(jù)隱藏空間和特征之間的映射轉(zhuǎn)換,實(shí)現(xiàn)對軌道交通LTE-M網(wǎng)絡(luò)故障數(shù)據(jù)集特征計(jì)算維度的降低,同時(shí)讓生成器G在低維度空間中學(xué)習(xí)數(shù)據(jù)集的潛在時(shí)間逐步依賴分布[13]。本文設(shè)計(jì)了兩個(gè)自編碼器網(wǎng)絡(luò)將動(dòng)態(tài)特征數(shù)據(jù)和靜態(tài)特征數(shù)據(jù)分開進(jìn)行特征提取,減少特征之間的干擾,提高模型的性能和泛化能力,嵌入網(wǎng)絡(luò)與恢復(fù)網(wǎng)絡(luò)維護(hù)一個(gè)重構(gòu)損失函數(shù)LR:
在時(shí)間序列數(shù)據(jù)中,為了生成與真實(shí)數(shù)據(jù)分布接近的合成數(shù)據(jù),對于D和G網(wǎng)絡(luò)的對抗訓(xùn)練損失函數(shù)LU定義為:
為了準(zhǔn)確的捕捉到時(shí)間序列在時(shí)間維度上的動(dòng)態(tài)特征,生成器G在生成數(shù)據(jù)時(shí),基于時(shí)刻t-1的輸入數(shù)據(jù)預(yù)測下一時(shí)間步 t 的數(shù)據(jù)。這意味著生成網(wǎng)絡(luò)能夠在隱藏空間中學(xué)習(xí)并捕捉整個(gè)時(shí)間窗口內(nèi)數(shù)據(jù)在特征維度和時(shí)間維度的分布。其預(yù)測損失函數(shù)LS公式為:
2.2生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)
本文將兩個(gè)自編碼網(wǎng)絡(luò)提取特征之后的動(dòng)態(tài)特征數(shù)據(jù)和靜態(tài)特征數(shù)據(jù)疊加組合,得到一個(gè)綜合特征向量輸入到生成器中,整體訓(xùn)練過程包括數(shù)據(jù)的預(yù)處理、降維和模型訓(xùn)練。針對連續(xù)的網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)預(yù)處理采用標(biāo)準(zhǔn)化和平滑化處理,離散數(shù)據(jù)則采用熱獨(dú)立編碼建立索引,在離散的告警日志數(shù)據(jù)降維中將稀疏的熱獨(dú)立編碼降維成稠密的矩陣。將降維后的綜合特征向量輸入LSTM中得到當(dāng)前時(shí)刻的狀態(tài)輸出,如式: ,
,其中, ν 為迭代更新函數(shù),
為輸入的時(shí)間序列, s 為靜態(tài)特征數(shù)據(jù)。
2.3 GELU激活函數(shù)
激活函數(shù)作為神經(jīng)網(wǎng)絡(luò)是否傳遞信息的“開關(guān)”,對于神經(jīng)網(wǎng)絡(luò)來說至關(guān)重要。高斯誤差線性單元激活函數(shù)(GELU)是在激活中引入了隨機(jī)正則的思想,對神經(jīng)元的輸入進(jìn)行概率描述,本文提出將GELU激活函數(shù)應(yīng)用于TimeGAN生成器網(wǎng)絡(luò)和判別器網(wǎng)絡(luò)的隱藏層。
GELU函數(shù)是一種平滑的非線性函數(shù),其曲線呈現(xiàn)類似S型曲線的形狀。其在整個(gè)實(shí)數(shù)范圍內(nèi)都有連續(xù)的導(dǎo)數(shù),從而更容易優(yōu)化和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。GELU函數(shù)呈現(xiàn)線性的特性能夠避免梯度消失和梯度爆炸,能夠穩(wěn)定生成對抗網(wǎng)絡(luò)的參數(shù)更新。使用GELU函數(shù)作為激活函數(shù)可以加速模型的訓(xùn)練收斂過程,減少訓(xùn)練時(shí)間和資源消耗,使TimeGAN模型更快地學(xué)習(xí)和適應(yīng)數(shù)據(jù)。
3 LTE-M網(wǎng)絡(luò)故障預(yù)測實(shí)現(xiàn)
3.1 基于TimeGAN的軌道交通LTE-M故障預(yù)測實(shí)現(xiàn)流程
基于TimeGAN的軌道交通LTE-M故障預(yù)測實(shí)現(xiàn),具體步驟如下:
1)收集整理地鐵近16個(gè)月以來的網(wǎng)管告警日志和設(shè)備日常運(yùn)行日志數(shù)據(jù),確保樣本覆蓋常見故障模型與變化趨勢,并對日志進(jìn)行清洗,剔除噪聲,采用Min-Max對訓(xùn)練樣本進(jìn)行歸一化,將各個(gè)數(shù)據(jù)特征值統(tǒng)一到相同的量級。2)在TimeGAN網(wǎng)絡(luò)結(jié)構(gòu)中,配置生成器、判別器和自編碼器模塊,確保生成數(shù)據(jù)在時(shí)間序列和特征空間上的一致性。設(shè)置調(diào)整TimeGAN模型網(wǎng)絡(luò)的超參數(shù),將訓(xùn)練樣本輸入模型進(jìn)行訓(xùn)練。3)利用訓(xùn)練完成的TimeGAN模型生成與原始數(shù)據(jù)分布相似的合成故障數(shù)據(jù),以擴(kuò)展訓(xùn)練樣本量并增強(qiáng)模型的魯棒性。4)將TimeGAN生成數(shù)據(jù)和原始數(shù)據(jù)一同輸入LSTM網(wǎng)絡(luò),以進(jìn)行故障預(yù)測模型的訓(xùn)練。5)通過MAPE、 、MAE等指標(biāo),量化模型在預(yù)測故障時(shí)的表現(xiàn)。
3.2 評估指標(biāo)
3.2.1 數(shù)據(jù)生成評估指標(biāo) t-S N E
針對本文所提及的訓(xùn)練TimeGAN模型測試,本文將合成的數(shù)據(jù)與原始數(shù)據(jù)進(jìn)行t分布-隨機(jī)近鄰嵌入(t-SNE)。 是一種降維技術(shù),其將不同數(shù)據(jù)之間的相似程度轉(zhuǎn)化為概率分布。使得具有相似特征的過程數(shù)據(jù)在低維空間中呈現(xiàn)相似的分布,有助于評估合成數(shù)據(jù)的真實(shí)性。
3.2.2 故障預(yù)測評估指標(biāo)
為了驗(yàn)證文中提及的數(shù)據(jù)生成方法的可行性和有效性,需對故障預(yù)測效果進(jìn)行質(zhì)量評估。采用MAPE、 、MAE等指標(biāo),具體內(nèi)容如:
1)MAPE。平均絕對百分比誤差(MAPE)是用來衡量時(shí)序序列擬合精度的統(tǒng)計(jì)指標(biāo)。MAPE的值越小,說明故障預(yù)測模型精度越高。
其中, N 為樣本的數(shù)量,即預(yù)測值和實(shí)際值的總數(shù), 為實(shí)際值,第 i 個(gè)樣本的真實(shí)值。
為預(yù)測值,
第 i 個(gè)樣本的預(yù)測值。
2) 。為了直接的觀察故障預(yù)測結(jié)果的準(zhǔn)確性,通過對模型擬合程度進(jìn)行檢驗(yàn)。越接近1表示擬合程度越好。
其中, 為第 i 個(gè)樣本的真實(shí)值。
為第 i 個(gè)樣本的預(yù)測值。
3)MAE。MAE是真實(shí)值與擬合值之間差值的絕對值之和的平均值,僅衡量誤差的平均模長,而不考慮方向,取值范圍也是[0, + ∞ ] 。當(dāng)真實(shí)值與擬合值完全吻合時(shí),等于0,即完美模型;誤差越大,該值越大。
其中, 為第 i 個(gè)樣本的真實(shí)值。
為第 i 個(gè)樣本的預(yù)測值。
4實(shí)驗(yàn)結(jié)果與分析
4.1 訓(xùn)練數(shù)據(jù)處理
地鐵14號線和18號線2022年12月至2023年12月期間設(shè)備日常運(yùn)行數(shù)據(jù)和告警日志部分?jǐn)?shù)據(jù)如圖2所示。
時(shí)間序列數(shù)據(jù)集有一個(gè)額外的維度一一時(shí)間,可將其視為3D數(shù)據(jù)集。如圖2所示,一個(gè)包含四個(gè)特征和四個(gè)輸入實(shí)例的數(shù)據(jù)集,本文時(shí)間序列數(shù)據(jù)是在該數(shù)據(jù)集上的第三維擴(kuò)展,其中每個(gè)新表格只是新時(shí)間步長的另外一個(gè)數(shù)據(jù)集,本文選取一個(gè)大小為24的窗口,并將這個(gè)窗口沿著數(shù)據(jù)集縱向移位采樣,從而獲得更多數(shù)量的2D矩陣,每個(gè)矩陣的長度為24,并具有該數(shù)據(jù)集所有列的特征。在上述示例數(shù)據(jù)集中,有26行。通過每24行移位采樣,可得到3個(gè)2D矩陣,每個(gè)矩陣有24行和4個(gè)特性,得出一個(gè)維度為(3,(24,4))的數(shù)據(jù)集,其中每個(gè)實(shí)例中有24行和4個(gè)特性。此外,在將數(shù)據(jù)集輸入TimeGAN之前,需要對數(shù)據(jù)集進(jìn)行重構(gòu),以便模型能夠在固定的時(shí)間長度內(nèi)學(xué)習(xí)數(shù)據(jù)的時(shí)間動(dòng)態(tài)。
4.2 超參數(shù)設(shè)置
本文實(shí)驗(yàn)是在Python3環(huán)境中使用TensorFlow和Keras進(jìn)行的。訓(xùn)練過程在一臺使用NVIDIAH100GPU的機(jī)器上進(jìn)行。在TimeGAN模型的訓(xùn)練中,選擇4種不同的故障類型和4種不同網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)類型進(jìn)行合成序列生成,每個(gè)序列長度為10000,使用大小為24的滑動(dòng)時(shí)間窗來捕獲時(shí)間依賴性。該架構(gòu)使用三層門控循環(huán)單元(GRU)網(wǎng)絡(luò)構(gòu)建,用于嵌入、恢復(fù)以及生成和判別組件,隱藏層的維度是設(shè)備類型數(shù)量的四倍。采用數(shù)據(jù)歸一化來促進(jìn)模型收斂,生成的序列進(jìn)行反歸一化以解釋結(jié)果,λ和分別設(shè)置為1和16。以TimeGAN為基準(zhǔn),所有訓(xùn)練都使用Adam優(yōu)化器進(jìn)行細(xì)化,設(shè)置學(xué)習(xí)率為0.0001,beta值為0.9和0.999。
4.2.1 數(shù)據(jù)生成與可視化
為了驗(yàn)證本文所提出的數(shù)據(jù)增強(qiáng)方法能夠改善軌道交通LTE-M網(wǎng)絡(luò)故障預(yù)測精度因數(shù)據(jù)不均衡和數(shù)據(jù)量小而不準(zhǔn)確的問題,將收集整理的地鐵12個(gè)月的LTE-M網(wǎng)絡(luò)故障數(shù)據(jù)集,利用TimeGAN數(shù)據(jù)增強(qiáng)方法進(jìn)行數(shù)據(jù)擴(kuò)充,然后將原數(shù)據(jù)訓(xùn)練的數(shù)據(jù)增強(qiáng)網(wǎng)絡(luò)生成的3000個(gè)合成數(shù)據(jù)與原3000個(gè)數(shù)據(jù)樣本進(jìn)行可視化對比,結(jié)果如圖3所示。灰點(diǎn)和黑點(diǎn)分別代表生成模型訓(xùn)練LTE-M故障數(shù)據(jù)樣本之后生成的二維空間映射數(shù)據(jù)集和真實(shí)數(shù)據(jù)集。在圖3中TimeGAN生成的數(shù)據(jù)與原始數(shù)據(jù)更好地對齊,偏移數(shù)據(jù)點(diǎn)更少。
4.2.2 預(yù)測內(nèi)容
本文將與TimeGAN原理類似的RCGAN和C-RNN-GAN兩種模型作為對比對象。使用TimeGAN、RCGAN和C-RNN-GAN模型訓(xùn)練LTE-M故障數(shù)據(jù)樣本,分別生成四組生成數(shù)據(jù),再將生成數(shù)據(jù)輸入LSTM預(yù)測模型,計(jì)算三組預(yù)測值的MAPE、 、MAE值,如表3所示??梢奟CGAN和C-RNN-GAN預(yù)測效果均不佳,TimeGAN模型預(yù)測效果較好。TimeGAN模型在軌道交通LTE-M網(wǎng)管故障數(shù)據(jù)時(shí)間序列潛在信息的利用上表現(xiàn)出更高的效率。實(shí)驗(yàn)還驗(yàn)證了該模型在故障預(yù)測問題上的精度更高。
5結(jié)論
本文對軌道交通LTE-M網(wǎng)絡(luò)故障預(yù)測問題進(jìn)行建模,針對LTE-M故障預(yù)測數(shù)據(jù)集樣本不均衡和數(shù)據(jù)量較小等問題,提出TimeGAN時(shí)間序列生成模型,用于LTE-M網(wǎng)絡(luò)故障數(shù)據(jù)預(yù)測,主要特點(diǎn)如下:
1)將告警日志數(shù)據(jù)和網(wǎng)絡(luò)日常運(yùn)行數(shù)據(jù)劃分為故障數(shù)據(jù)的動(dòng)靜態(tài)特征,并作為TimeGAN模型的條件監(jiān)督項(xiàng),融合了自回歸模型有監(jiān)督訓(xùn)練與對抗學(xué)習(xí)無監(jiān)督訓(xùn)練。
2)TimeGAN提出設(shè)計(jì)兩個(gè)自編碼器網(wǎng)絡(luò)分別對軌道交通LTE-M動(dòng)靜態(tài)特征數(shù)據(jù)進(jìn)行特征提取,提高特征提取的準(zhǔn)確性,避免動(dòng)靜態(tài)特征干擾,使得合成數(shù)據(jù)與原始數(shù)據(jù)更加接近,真實(shí)性更高,優(yōu)于其他數(shù)據(jù)增強(qiáng)網(wǎng)絡(luò)。
將收集整理的地鐵16個(gè)月的故障數(shù)據(jù)集輸入改進(jìn)模型,得到質(zhì)量更高的合成數(shù)據(jù),再將合成數(shù)據(jù)輸入LSTM網(wǎng)絡(luò)預(yù)測模型,實(shí)驗(yàn)結(jié)果表明,TimeGAN模型生成的數(shù)據(jù)在用于故障預(yù)測訓(xùn)練時(shí),能夠產(chǎn)生更好的擬合效果,有效提升軌道交通LTE-M網(wǎng)絡(luò)故障預(yù)測的精度。
參考文獻(xiàn):
[1]陳東洋,毛力.融合增量學(xué)習(xí)與Transformer模型的股價(jià)預(yù)測研究[J].計(jì)算機(jī)科學(xué)與探索,2024,18(7):1889-1899.
[2]李娜,羊釗,王業(yè)萍,等.融合時(shí)序注意力的CNN-BiGRU四軸無人機(jī)軌跡預(yù)測方法[J/OL].武漢理工大學(xué)學(xué)報(bào):交通科學(xué)與工程版,2025:1-9[2025-03-13].http://kns.cnki.net/kcms/detail/42.1824.U.20240409.1221.046.html.
[3]謝博才,宮殿君.基于機(jī)器學(xué)習(xí)的道岔故障診斷與預(yù)測研究綜述[J].鐵路通信信號工程技術(shù),2021,18(8):93-99.
[4]施清譯,汪偉,安斯光,等.基于時(shí)序生成對抗網(wǎng)絡(luò)和注意力機(jī)制的電器數(shù)據(jù)生成方法[J].現(xiàn)代電子技術(shù),2024,47(11):161-167.
[5]李蘭,張潔,劉杰,等.基于GAN的社會和場景感知行人軌跡預(yù)測[J].計(jì)算機(jī)應(yīng)用與軟件,2024,41(6):72-78.
[6] ZHANGGQ,GUOJF.ANovel Ensemble Method forResidential ElectricityDemand ForecastingBased onANovelSample Simulation Strategy[J].Energy,2020:207:118265.
[7]CHENZS,HOUKR,ZHUMY,etal.AVirtualSampleGeneration ApproachBased onaModified ConditionalGAN and Centroidal Voronoi Tessellation Sampling to Cope WithSmall Sample Size Problems:Applicationto softSensing forChemical Process[J].Applied SoftComputing,2021,101:
[8]丁琳琳,胡永亮,李昱達(dá),等.基于條件對抗增強(qiáng)的Transformer煤礦微震定位方法[J].計(jì)算機(jī)與數(shù)字工程,2024,52(1):1-8+17.
[9]YOONJ,JARRETTD,SCHAARMVD.Time-Series Generative AdversarialNetworks[EB/OL].[2024-09-28].https:// papers.nips.cc/paper/8789-time-series-generative-adversarialnetworks.pdf.
[10]ZHANGYF,ZHOUZH,LIUJW.DataAugmentation for ImprovingHeatingLoad Prediction ofHeatingSubstationBasedon TimeGAN[J].Energy,2022,260:1-12.
[11]王渝紅,何其多,鄭宗生,等.基于條件生成對抗網(wǎng)絡(luò)與遷移學(xué)習(xí)的暫態(tài)電壓穩(wěn)定超前判別[J].電力自動(dòng)化設(shè)備,2025,45(2):159-166.
[12]周琳茹,彭鵬菲.基于注意力-生成對抗網(wǎng)絡(luò)的任務(wù)分析方法研究[J].計(jì)算機(jī)科學(xué),2024,51(3):63-71.
[13]HARFORD S,KARIMF,DARABIH.Generating AdversarialSamplesonMultivariateTimeSeriesusingVariational Autoencoders[J].IEEE/CAA JournalofAutomatica Sinica, 2021,8(9):1523-1538.
[14]譚建所,吳興華,徐文光,等.基于tSNE-LSTM算法的工業(yè)預(yù)測模型[J].現(xiàn)代電子技術(shù),2024,47(12):81-85.
作者簡介:余鳳琴(1999—),女,漢族,安徽安慶人,碩士研究生在讀,研究方向:軌交智能控制與監(jiān)測。