崔方明,時(shí)宏偉
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都610065)
隨著各行業(yè)生產(chǎn)的數(shù)據(jù)量越來越多,對(duì)數(shù)據(jù)分析處理能力的標(biāo)準(zhǔn)不斷升高,怎樣面對(duì)海量數(shù)據(jù)的挑戰(zhàn),并在其中發(fā)現(xiàn)新的機(jī)遇,已經(jīng)得到了各行業(yè)的廣泛重視。由于大數(shù)據(jù)分析建立新型智能信息交通服務(wù)系統(tǒng)是當(dāng)務(wù)之急,國內(nèi)外有關(guān)交通大數(shù)據(jù)的研究正在進(jìn)行中,與此同時(shí),交通大數(shù)據(jù)一定會(huì)成為該領(lǐng)域數(shù)據(jù)積累的重要方向,應(yīng)引起重視。
SimGAN是一種深度學(xué)習(xí)中的對(duì)抗生成模型[1]。SimGAN模型是生成交通數(shù)據(jù)最有效的方法之一。
目前,國內(nèi)大數(shù)據(jù)研究已經(jīng)比較成熟,有些互聯(lián)網(wǎng)公司例如:滴滴、美團(tuán)、天貓等線上運(yùn)營(yíng)大型公司,都是通過大量用戶興趣愛好的數(shù)據(jù)獲得更為準(zhǔn)確的估算和價(jià)值。例如商湯、依圖、曠世科技等人工智能獨(dú)角獸公司則是依靠于AI產(chǎn)品獲取用戶的線上和線下信息進(jìn)行分析。當(dāng)用戶利用這些軟件和產(chǎn)品進(jìn)行操作的時(shí)候,就會(huì)留下自己的信息,當(dāng)公司獲得足夠的信息的時(shí)候,各種信息匯集起來,就是一個(gè)大數(shù)據(jù)體系。大數(shù)據(jù)具有:大量、高速、多樣、價(jià)值、真實(shí)性,五個(gè)特性。所以,大數(shù)據(jù)的獲取是很關(guān)鍵的,在某些稀缺領(lǐng)域,數(shù)據(jù)很難準(zhǔn)確獲得,例如,自動(dòng)駕駛、手指跟蹤、無人機(jī)、等高新科技領(lǐng)域。
當(dāng)下,對(duì)大數(shù)據(jù)的直接和間接獲取,在國內(nèi)外都比較普遍,但是利用深度學(xué)習(xí)制造仿真數(shù)據(jù),卻還不是家喻戶曉。仿真數(shù)據(jù)有很多優(yōu)勢(shì),例如在一些不可控因素、危險(xiǎn)因素、估計(jì)因素下,仿真數(shù)據(jù)可以暫時(shí)性替代,將實(shí)驗(yàn)不間斷的進(jìn)行。所以,將大數(shù)據(jù)本身和獲取大數(shù)據(jù)的方式方法有機(jī)結(jié)合,更能夠有效地解決一些高新科技缺乏數(shù)據(jù)實(shí)驗(yàn)的難題。
DenseNet有一個(gè)突出優(yōu)點(diǎn)是網(wǎng)絡(luò)比較窄,并且參數(shù)比較少,這是由于dense塊的設(shè)計(jì)導(dǎo)致的,每個(gè)卷積層的輸出feature map的數(shù)量很少,并不是像其他網(wǎng)絡(luò)那樣很厚很寬很復(fù)雜。而且,這種連接方式的特征和梯度的傳遞更加有效,這就導(dǎo)致網(wǎng)絡(luò)訓(xùn)練收斂速度加快[2]。
DenseNet網(wǎng)絡(luò)提高了信息和梯度在的傳輸效率,每層都能直接從損失函數(shù)中得到梯度值,并且直接獲得輸入信息,這樣就能訓(xùn)練更厚更深的網(wǎng)絡(luò)。然而有一些網(wǎng)絡(luò)是從深度和寬度來提升網(wǎng)絡(luò)效率,但是DenseNet是從特征重用的來提升網(wǎng)絡(luò)效率的。DenseNet包含以下幾個(gè)優(yōu)點(diǎn):
①減輕了梯度消失
②加強(qiáng)了網(wǎng)絡(luò)層map的傳遞
③更加有效利用map
④較少參數(shù)數(shù)量
DenseNet和ResNet有一個(gè)明顯區(qū)別是,ResNet是殘差網(wǎng)絡(luò)求和,而DenseNet是做拼接,每一層網(wǎng)絡(luò)的輸入值包括了前面所有層的輸出。Dense結(jié)構(gòu)如圖1[3]。
圖1 DenseNet結(jié)構(gòu)
ShuffleNet和MobileNet以及SqueezeNet等網(wǎng)絡(luò)一樣主要是想應(yīng)用在移動(dòng)端設(shè)備上,得到速度快精度高的結(jié)果。ShuffleNet的核心思想是在有限的計(jì)算資源下獲得最好的模型精度[4]。ShuffleNet的核心是采用了兩種操作:逐點(diǎn)群卷積和通道混洗,這既能保證精度又能減低計(jì)算復(fù)雜度。模型結(jié)構(gòu)設(shè)計(jì)和模型壓縮是在App端很典型的兩個(gè)優(yōu)化點(diǎn)。ShuffleNet是通過設(shè)計(jì)更高效的網(wǎng)絡(luò)結(jié)構(gòu)來實(shí)現(xiàn)模型精度高并且計(jì)算快,不是壓縮。這里的兩個(gè)操作,逐點(diǎn)群卷積和通道混洗,逐點(diǎn)群卷積會(huì)導(dǎo)致通道變得約束,這大大地影響了精度。從而,應(yīng)該通道稀疏連接。組卷積可以大大地降低計(jì)算損失。這會(huì)有副作用,通道的信息流通變?nèi)?,表達(dá)能力變?nèi)?,這時(shí)就需要了通道混洗的操作。shuffle unit單元結(jié)構(gòu)如圖2。
圖2 shuffleunit單元
借助shuffle的功效來輔助DenseNet在加大深度的同時(shí)混洗通道,將圖三分別替代圖一中的H1,H2,H3,H4。并且用固定的方式一部分與ResNet相加模型相同,一部分與shuffle過程一樣。此規(guī)定設(shè)置一個(gè)參數(shù)k,可以調(diào)整順序,需要是等比數(shù)列??梢栽O(shè)ResNet殘差部分是R,shuffle部分為S,中間部分的S的數(shù)量是等比數(shù)列,用系數(shù)k控制,因?yàn)榈胶髞硇枰煜?,但是又不能失去S直接相加的作用。借助此模型改造方法,可以有效的使建模的模型更加輕量級(jí),同時(shí)增加了數(shù)據(jù)識(shí)別處理的精確度,但是也存在一定的弊端,需要手動(dòng)調(diào)整更多的參數(shù),并且控制變量不是非常明確。
(1)開源數(shù)據(jù)介紹PASCAL VOC-2007
PASCAL VOC-2007為數(shù)據(jù)識(shí)別和分類提供了一整套標(biāo)準(zhǔn)化的優(yōu)秀的數(shù)據(jù)集。VOC數(shù)據(jù)集共包含:訓(xùn)練集(5011),測(cè)試集(4952),共計(jì)9963,共包含20個(gè)種類。Annotations為目標(biāo)真值區(qū)域,ImageSets為類別標(biāo)簽,JPEGImages為真實(shí)數(shù)據(jù)。
JPEGImages文件夾中包含了PASCAL VOC所提供的所有的數(shù)據(jù)信息,包括了各種訓(xùn)練數(shù)據(jù)和各種測(cè)試數(shù)據(jù)。Annotations文件夾中存放的是xml格式的標(biāo)簽文件,每一個(gè)xml文件都對(duì)應(yīng)于JPEGImages文件夾中的一份數(shù)據(jù),ImageSets存放的是每一種類型的chal?lenge對(duì)應(yīng)的數(shù)據(jù)。在ImageSets下有幾個(gè)文件夾,Seg?mentationClass和SegmentationObject這兩個(gè)文件夾下保存了物體分割后的數(shù)據(jù)。
(2)SimGAN造帶標(biāo)注的仿真數(shù)據(jù)
SimGAN是一種深度學(xué)習(xí)網(wǎng)絡(luò),但是它繼承于GAN網(wǎng)絡(luò),也是一種對(duì)抗性生成網(wǎng)絡(luò)。SimGAN比GAN更加穩(wěn)定,更加便于增加自己想要的內(nèi)容。在調(diào)用SimGAN的時(shí)候,可以寫豐富的Python腳本搭配。
本文利用了深度學(xué)習(xí)“對(duì)抗訓(xùn)練”方法,可以使用合成的和未標(biāo)記的數(shù)據(jù)訓(xùn)練先進(jìn)的神經(jīng)網(wǎng)絡(luò)。通過自正則化損失項(xiàng)使精確和合成數(shù)據(jù)之間的差異最小化來保留標(biāo)注。使合成數(shù)據(jù)看起來是真實(shí)的(GAN的標(biāo)準(zhǔn)概念)。精煉網(wǎng)絡(luò)(refiner)將合成數(shù)據(jù)樣本作為輸入,輸出相同維度的改進(jìn)數(shù)據(jù)樣本。判別網(wǎng)絡(luò)(discrimina?tor)將數(shù)據(jù)樣本作為輸入,并將其分類為改進(jìn)的或真實(shí)的。
改善器RR:輸入合成數(shù)據(jù),輸出改善結(jié)果。鑒別器DD:判斷輸入是真實(shí)數(shù)據(jù)還是經(jīng)過改善的合成數(shù)據(jù)。相關(guān)的代價(jià)有三種:代價(jià)1:鑒別器識(shí)別改善圖像的錯(cuò)誤率。代價(jià)2:鑒別器識(shí)別真實(shí)圖像的錯(cuò)誤率。代價(jià)3:改善圖像和原始圖像的逐像素差。其中,代價(jià)3保證改善圖像和原始圖像的類標(biāo)相同。例如,保證手勢(shì)姿態(tài)不變保證視線方向不變。除了直接比較像素,還可以提取圖像特征之后在做差。在每一輪迭代中:最大化代價(jià)1,最小化代價(jià)3,優(yōu)化改善器RR的參數(shù)。共執(zhí)行KrKr次SGD。最小化代價(jià)1,最小化代價(jià)2,優(yōu)化鑒別器DD的參數(shù)。共執(zhí)KdKd次SGD。經(jīng)過若干次迭代得到的改善器RR,可以將合成樣本加工成具有以下兩個(gè)性質(zhì)的樣本:品質(zhì)和真實(shí)圖像難以分辨,保持合成樣本原有類標(biāo)不變。
隨著迭代不斷進(jìn)行中,鑒別器DD會(huì)過分利用一些錯(cuò)誤的全局特征信號(hào)進(jìn)行分類從而使得改善圖像出現(xiàn)不自然。舉例:真實(shí)圖像中可能只包含一些固定視線方向的樣本,但合成圖像的視線方向則均勻而連續(xù)。于是鑒別器“以偏概全”地以視線方向作為真假樣本的判別標(biāo)準(zhǔn)。解決辦法是:在訓(xùn)練鑒別器DD時(shí),將圖像分割成小塊分別輸入;在利用DD進(jìn)行分類時(shí),以各個(gè)小塊的分類結(jié)果只和作為該圖像的結(jié)果。除了避免全局信息引artift之外,這種方法還能夠增加訓(xùn)練樣本的數(shù)量。SimGAN結(jié)構(gòu)如圖3。
圖3 SIMGAN精煉結(jié)構(gòu)
實(shí)驗(yàn)是利用DenseNet和ShuffleNet的結(jié)合模型,來將文章核心模型SimGAN生成的仿真數(shù)據(jù)以及VOC2007開源數(shù)據(jù)進(jìn)行多階段的混合實(shí)驗(yàn)。通過此實(shí)驗(yàn),可以提高交通路徑規(guī)劃準(zhǔn)確率和降低建模的重量級(jí),利用識(shí)別出來路徑MAP,來進(jìn)行對(duì)比實(shí)驗(yàn),并且規(guī)劃出更佳的路線。實(shí)驗(yàn)采用的是Python編程語言、深度學(xué)習(xí)框架TensorFlow和基于并行編程模型和指令集架構(gòu)的通用計(jì)算架構(gòu)CUDA8.0,通過torch.cuda調(diào)用GPU來提升計(jì)算速度[8]。本文使用在線質(zhì)量度量工具moba通過路徑規(guī)劃輕量級(jí)別和路徑規(guī)劃MAP得分來評(píng)價(jià)實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)中測(cè)試了幾種模型DenseNet和ShuffleNet以及MobileNet對(duì)路徑規(guī)劃的預(yù)測(cè),迭代次數(shù)為50000次[9]。
表1 DenseNet的完整實(shí)驗(yàn)
表2 ShuffleNet的完整實(shí)驗(yàn)
表3 兩種模型對(duì)比實(shí)驗(yàn)與MobileNet和其他模型相比
表4 DenseNet不同比例下實(shí)驗(yàn)結(jié)果展示
本文提出了一種生成仿真數(shù)據(jù)的方法,此方法利用SimGAN深度學(xué)習(xí)模型生成大量帶有標(biāo)注交通方面的數(shù)據(jù),交通數(shù)據(jù)具有多樣性和仿真性,所以在真實(shí)數(shù)據(jù)不足的情況下,可以利用SimGAN模型達(dá)到目的,以此來豐富訓(xùn)練內(nèi)容,多個(gè)角度訓(xùn)練模型,使路徑規(guī)劃效果精確和普適性。同時(shí),本文利用了DenseNet和Shuf?fleNet來建模分析數(shù)據(jù),由于這兩類模型本身具有的特點(diǎn),所以將其結(jié)合達(dá)到了輕量化和精確率高的目的。實(shí)驗(yàn)證明SimGAN很適合應(yīng)用于道路交通路徑規(guī)劃的數(shù)據(jù)獲取方面研究,與傳統(tǒng)數(shù)據(jù)建模相比,SimGAN應(yīng)用數(shù)據(jù)種類更多,能夠提升針對(duì)大量交通大數(shù)據(jù)信息挖掘和分析的效率。
在將來的工作中,可以將此模型應(yīng)用于離線端口,這就需要將模型結(jié)構(gòu)壓縮和量化,量化后的模型可以更加方便地嵌入到終端App中,使交通數(shù)據(jù)分析更加實(shí)時(shí)性,路徑規(guī)劃更加便捷。