孔 潔
(中國勞動關(guān)系學(xué)院,北京 100048)
當(dāng)前,已全面跨入了大數(shù)據(jù)時代,但在很多具有重要研究價值領(lǐng)域,因其數(shù)據(jù)采集困難而受限制,比如作戰(zhàn)數(shù)據(jù)、作戰(zhàn)文書和裝備數(shù)據(jù)等[1-3]。軍事數(shù)據(jù)是作戰(zhàn)推演、作戰(zhàn)模擬的基礎(chǔ),目前數(shù)據(jù)的生成依然高度依賴人工要素,導(dǎo)致成本高昂且效率低下,實現(xiàn)高效自主的數(shù)據(jù)生產(chǎn)成為提升模擬、推演成效的必要突破點[4]。數(shù)據(jù)生成的本質(zhì)即通過數(shù)據(jù)之間的數(shù)學(xué)運(yùn)算得到預(yù)期的數(shù)據(jù)結(jié)果,神經(jīng)網(wǎng)絡(luò)相關(guān)的人工智能技術(shù)有望成為數(shù)據(jù)生成的有力工具。例如,文獻(xiàn)[5]針對傳統(tǒng)的Fuzz 測試普遍存在挖掘深度不足、樣本沒有指向性問題,提出一種使用長短期記憶網(wǎng)絡(luò)引導(dǎo)生成瀏覽器Fuzz 所需的樣本集的框架,從而克服了傳統(tǒng)瀏覽器Fuzz 中樣本挖掘深度不足、指向性弱的問題。文獻(xiàn)[6]在深度學(xué)習(xí)技術(shù)的基礎(chǔ)上引入遷移學(xué)習(xí)技術(shù),提取出預(yù)訓(xùn)練模型的權(quán)重和樣本特征,實現(xiàn)了目標(biāo)小數(shù)據(jù)集訓(xùn)練與生成。文獻(xiàn)[7]基于卷積神經(jīng)網(wǎng)絡(luò),利用人類視覺和卷積模型在識別物體中表現(xiàn)出的形狀偏好特性,通過顏色模型的擾動變換來生成對抗樣本,提出了一種基于顏色模型的語義對抗樣本生成方法。文獻(xiàn)[8]基于DQN 算法實現(xiàn)智能體的自主尋路,為此提出了基于白盒的樣本生成算法,從而使其通過自主尋路無法達(dá)到應(yīng)有的最優(yōu)最短路徑,并有效降低模型的運(yùn)算量。
由于深度學(xué)習(xí)采用了多層網(wǎng)絡(luò)結(jié)構(gòu),其模型復(fù)雜度比傳統(tǒng)的單隱含層模型要大得多,為了確保模型的泛化能力,就必須相應(yīng)地增大訓(xùn)練數(shù)據(jù)[9]。當(dāng)前在工業(yè)界取得突破的基于機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的人工智能應(yīng)用,對訓(xùn)練樣本都有著數(shù)量上的要求,而訓(xùn)練模型所必須的海量訓(xùn)練數(shù)據(jù)樣本難以獲取,已經(jīng)成為阻礙深度學(xué)習(xí)技術(shù)進(jìn)一步推廣的一個普遍性難題[10]。
本文在生成對抗網(wǎng)絡(luò)(GAN)[11]框架的基礎(chǔ)上,構(gòu)建長短期循環(huán)神經(jīng)網(wǎng)絡(luò)代替生成對抗網(wǎng)絡(luò)中的生成器和鑒別器,以最大平均差異和最大似然估計作為指標(biāo),構(gòu)建數(shù)據(jù)生成評估模型,提出一種可生成實值數(shù)據(jù)序列的循環(huán)條件生成對抗網(wǎng)絡(luò)(RCGAN)。該方法完全依靠數(shù)據(jù)驅(qū)動,無需經(jīng)過精心設(shè)計的建模過程,生成數(shù)據(jù)與真實數(shù)據(jù)一致,魯棒性強(qiáng),受噪聲的干擾較小,具有很好的泛化性。
生成對抗網(wǎng)絡(luò)(GAN)是最先進(jìn)的AI 框架[12],作為一種數(shù)據(jù)生成框架已顯示出卓越的應(yīng)用優(yōu)勢,其核心思想是在生成器和鑒別器之間建立博弈關(guān)系。生成對抗網(wǎng)絡(luò)的一般結(jié)構(gòu)如圖1 所示,由生成器與鑒別器兩部分組成,其中,生成器用于學(xué)習(xí)真實數(shù)據(jù)樣本的潛在分布,并基于學(xué)習(xí)到的分布生成新樣本;鑒別器用于判別其輸入屬于真實樣本還是生成器生成的樣本[13]。
圖1 生成對抗網(wǎng)絡(luò)
在生成對抗網(wǎng)絡(luò)(GAN)中,生成器和鑒別器通過反向傳播,分別提高了它們的生成能力和鑒別能力。對于生成器,其反向傳播過程旨在縮小生成的數(shù)據(jù)與實際數(shù)據(jù)之間的差距。當(dāng)所生成的數(shù)據(jù)和實數(shù)據(jù)被輸入到鑒別器時,鑒別器輸出的是實數(shù)據(jù)的預(yù)測概率。鑒別器的反向傳播用于擴(kuò)展真實數(shù)據(jù)和生成數(shù)據(jù)之間的預(yù)測概率。
從目標(biāo)數(shù)據(jù)分布pd行采樣,使用生成器生成目標(biāo)數(shù)據(jù)的概率為:
式中,θ 是發(fā)生器的網(wǎng)絡(luò)參數(shù),其訓(xùn)練目的就是找到能夠最大化L 的θ*[14]:
長短期循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM-RNN)已經(jīng)被證明能夠通過記憶細(xì)胞在向后傳輸?shù)臅r間步中獲取信息來學(xué)習(xí)復(fù)雜的時間序列。如下頁圖2 所示,長短期循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM-RNN)是在RNN 網(wǎng)絡(luò)的基礎(chǔ)上搭建LSTM 單元,以解決RNN 所存在的長期依賴以及梯度爆炸問題,從而能夠在任意時間間隔內(nèi)記住有價值的信息。
圖2 長短期循環(huán)神經(jīng)網(wǎng)絡(luò)
為了處理時間序列數(shù)據(jù),本文用LSTM-RNN 代替生成對抗網(wǎng)絡(luò)的生成器和鑒別器。按照常規(guī)的生成對抗網(wǎng)絡(luò)的框架架構(gòu),將生成對抗網(wǎng)絡(luò)模型訓(xùn)練成二人極大極小博弈。
其中,生成器是LSTM-RNN 模型,定義其生成樣本的概率分布Grnn(z),z 服從隨機(jī)分布。鑒別器是另一種LSTM-RNN 模型,通過訓(xùn)練能夠使其預(yù)測和序列標(biāo)簽之間的平均交叉熵最小化。鑒頻器的損失函數(shù)為:
同時,生成器被訓(xùn)練來混淆鑒別器,以便鑒別器能夠盡可能多地識別出真實的生成樣本。生成器的損失函數(shù)是:
基于生成對抗網(wǎng)絡(luò)框架,鑒別器和生成器選用LSTM-RNN 結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),在此基礎(chǔ)上提出一種可生成數(shù)據(jù)序列的循環(huán)條件生成對抗網(wǎng)絡(luò)(RCGAN)。如圖3 所示,生成器在每個時間步長采用不同的隨機(jī)種子,如果想用額外的數(shù)據(jù)對生成的序列進(jìn)行條件設(shè)置,則還要加上額外的輸入。由此,在每個時間步長上接受一個額外的輸入,以約束輸出。
圖4 中展示了鑒別器如何獲取生成的序列。鑒別器獲取真實/合成序列,并為每一個時間步長生成一個真實/合成分類。但對于RCGAN,它還在每個時間步長上接受一個額外的輸入,以約束輸出,并對輸入序列的每一個時間步長生成一個合成的或真實的分類。
圖4 鑒別器數(shù)據(jù)輸出
在每一批訓(xùn)練集中,鑒別器將同時處理真實序列和合成序列。于是,對于真實序列,將yn的標(biāo)簽設(shè)為“1”;對于合成序列,則將yn的標(biāo)簽設(shè)為“0”。
生成器的目標(biāo)是“欺騙”鑒別器,將其輸出的分類認(rèn)定為真。這也就是說,生成器希望將鑒別器將預(yù)測序列與“真”標(biāo)簽之間的交叉熵最小化。根據(jù)式(5)得到關(guān)于{zn}的生成器損失:
式中,zn是獨(dú)立于噪聲空間的采樣序列。
為了在RCGAN 中不因為遺忘門而對條件信息打折扣,于是對每個LSTM-RNN 的樣本輸入,在每個時間步長中采用條件信息cn來進(jìn)行擴(kuò)增。
生成對抗網(wǎng)絡(luò)的性能評估中,由于生成器和鑒別器并不容易檢測,一直是極具挑戰(zhàn)性的工作。為此,在對循環(huán)條件生成對抗網(wǎng)絡(luò)(RCGAN)的性能評估中,本文構(gòu)建了一種可量化的評估方法。
對于時間序列中的核函數(shù),將生成的樣本以及真實的樣本通過確定時間軸對齊,然后再將時間序列作為向量進(jìn)行比較。
此外,為更好地反映生成數(shù)據(jù)概率的趨勢,如圖5 所示構(gòu)建了循環(huán)條件生成對抗網(wǎng)絡(luò)的最大似然估計模型[15]:
圖5 循環(huán)條件生成對抗網(wǎng)絡(luò)的最大似然估計模型
本文實驗環(huán)境主要包括計算平臺和環(huán)境配置兩部分。其環(huán)境配置詳細(xì)參數(shù)如表1 所示。
表1 環(huán)境配置參考表
為檢驗本算法的有效性與可比性,實驗數(shù)據(jù)選用了MNIST 數(shù)據(jù)集、正弦波信號數(shù)據(jù)集,以及任意平滑波形數(shù)據(jù)集。其中,MNIST 數(shù)據(jù)集由美國國家標(biāo)準(zhǔn)與技術(shù)研究所提供,是經(jīng)典的人工智能訓(xùn)練測試數(shù)據(jù),被廣泛用于不同算法間的性能比對及驗證,訓(xùn)練結(jié)果具有很強(qiáng)的公平性和說服力。其數(shù)據(jù)來自于250 個不同人手寫數(shù)字,由0~9 十個手寫數(shù)字組成,包含70 000 張28×28 手寫數(shù)字的灰度圖片,分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。由于正弦波數(shù)據(jù)集具有易于檢查、確認(rèn)的優(yōu)勢,而且可通過改變振幅和頻率對任意波形進(jìn)行擬合,因而選用了這類數(shù)據(jù)進(jìn)行實驗。在實際軍事應(yīng)用中,通常希望能夠生成更為復(fù)雜的信號數(shù)據(jù)。因此,實驗中又考慮了軍事通信平滑波形數(shù)據(jù)。
實驗中將每個28×28 手寫數(shù)字轉(zhuǎn)換為784 維的向量,運(yùn)用算法進(jìn)行MNIST 數(shù)字自動生成。通過數(shù)據(jù)的生成,可以容易且直觀地評價數(shù)據(jù)生成效果,也足以檢驗算法的有效性和精確性。如圖6 所示,展示了方法在生成平滑數(shù)據(jù)序列訓(xùn)練過程中鑒別器損失、生成器損失、MMD2以及最大似然估計值的分布情況。說明該方法并不知道底層的數(shù)據(jù)分布,而是完全依靠數(shù)據(jù)驅(qū)動,通過模型自主學(xué)習(xí)獲得真實數(shù)據(jù)的分布規(guī)律。
圖6 算法訓(xùn)練指標(biāo)效果
如圖7 所示,為算法進(jìn)行100 次自主訓(xùn)練,所生成的手寫數(shù)字。其中,剛開始訓(xùn)練時所生成的數(shù)字難以辨認(rèn),隨著訓(xùn)練次數(shù)的增加,各數(shù)字特征越來越明顯。如圖8 所示,當(dāng)算法訓(xùn)練100 次后,所生成的手寫數(shù)字已經(jīng)跟MNIST 真實數(shù)據(jù)集難以區(qū)分。
圖7 手寫數(shù)字自主生成效果
圖8 算法生成數(shù)據(jù)與MNIST 真實數(shù)據(jù)比對
如圖9 所示,給出了不同訓(xùn)練迭代次數(shù)下樣本似然分布的演化過程。在迭代1,代理似然值非常低,因為算法生成的圖像僅僅是隨機(jī)噪聲。隨著訓(xùn)練不斷遞增,概率分布向高值轉(zhuǎn)移,所得數(shù)據(jù)效果也越來越好。
圖9 不同迭代次數(shù)下的最大似然概率分布
在這個MNIST 數(shù)字生成實驗中,為了評估和比較本文算法的性能,將本文算法與經(jīng)典GAN 算法進(jìn)行了比對實驗。如圖10 所示,是分別運(yùn)用本文算法訓(xùn)練100 次后所生成的手寫數(shù)字,以及使用GAN算法訓(xùn)練100 次后所生成的手寫數(shù)字。相比較,同樣訓(xùn)練次數(shù)下本文生成的數(shù)據(jù)明顯優(yōu)于使用GAN生成的圖像,所得數(shù)據(jù)分辨率更高、噪聲更低。此外,如下頁圖11 所示,在對GAN 增加一倍訓(xùn)練次數(shù)后所生成的數(shù)據(jù)也稍遜于本文算法所生成的數(shù)據(jù)。這意味著經(jīng)典GAN 的思想雖可在廣泛領(lǐng)域得到運(yùn)用,但本文算法更適合樣本數(shù)據(jù)生成。
圖10 本文算法與經(jīng)典GAN(Epoch 100)效果比對
圖11 本文算法與經(jīng)典GAN(Epoch 200)效果比對
本文還對其他兩種數(shù)據(jù)集進(jìn)行了實驗,如圖12所示,為生成的正弦波信號數(shù)據(jù)。通過肉眼就可判定該數(shù)據(jù)波形穩(wěn)定,相位、振幅滿足正弦波信號要求。如圖13 所示,為生成的軍事通信平滑波形數(shù)據(jù)。為比較生成數(shù)據(jù)效果,在圖中加入了真實平滑波形,即綠色虛線所示。比較可知,所生成的數(shù)據(jù)與真實數(shù)據(jù)相差無幾,能夠達(dá)到數(shù)據(jù)生成的要求。
圖12 生成的正弦波信號數(shù)據(jù)
圖13 生成的任意平滑波形數(shù)據(jù)
如圖14 所示,計算了3 種生成數(shù)據(jù)的最大似然概率分布。其中,從MNIST 數(shù)據(jù)集獲得的樣本的最高似然估計值;正弦波信號包含了不同的振幅和相位,估計的可能性相對較低;軍事通信平滑波形據(jù)集的概率要小得多,這是因為平滑波形數(shù)據(jù)集的樣本比MNIST 以及正弦波信號的樣本更多樣化所致。
圖14 針對不同數(shù)據(jù)的最大似然概率分布
本文在生成對抗網(wǎng)絡(luò)(GAN)框架的基礎(chǔ)上,構(gòu)建長短期循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM-RNN)代替生成對抗網(wǎng)絡(luò)中的生成器和鑒別器,以最大平均差異和最大似然估計作為指標(biāo)構(gòu)建了數(shù)據(jù)生成評估模型,提出了一種基于循環(huán)條件生成對抗網(wǎng)絡(luò)的數(shù)據(jù)生成方法。該方法完全依靠數(shù)據(jù)驅(qū)動,無需經(jīng)過精心設(shè)計的建模過程,生成的新數(shù)據(jù)也并不是對原始數(shù)據(jù)的簡單復(fù)制與拼接,而是學(xué)習(xí)到了真實數(shù)據(jù)分布規(guī)律,生成了全新的、有效的新數(shù)據(jù)。與傳統(tǒng)數(shù)據(jù)生成方法相比,本文方法具有較強(qiáng)的魯棒性,受噪聲的干擾較小,有很好的泛化性,在對真實數(shù)據(jù)相似度的提升上也得到了很好的效果,有效緩解了數(shù)據(jù)生成人工依賴性強(qiáng)、成本高、效率低的問題,對軍事關(guān)鍵、敏感領(lǐng)域的數(shù)據(jù)獲取提供了一種新的有效途徑。