• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于GPU 的并行粒子群神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)與實(shí)現(xiàn)

    2014-12-20 06:53:02田雨波
    關(guān)鍵詞:測試函數(shù)線程全局

    陳 風(fēng),田雨波,楊 敏

    (江蘇科技大學(xué) 電子信息學(xué)院,江蘇 鎮(zhèn)江212003)

    0 引 言

    人工神經(jīng)網(wǎng)絡(luò) (artificial neural networks,ANN),簡稱神經(jīng)網(wǎng)絡(luò) (neural networks,NN),正在各個(gè)領(lǐng)域得到越來越廣泛的應(yīng)用。粒子群優(yōu)化 (particle swarm optimization,PSO)作為一種容易實(shí)現(xiàn)、收斂速度快的全局優(yōu)化算法[1],正在逐漸代替常用的誤差反向傳播 (back propagation,BP)算法應(yīng)用到NN 的訓(xùn)練中[2]。面對(duì)計(jì)算復(fù)雜度較高的問題時(shí),運(yùn)算時(shí)間長是粒子群神經(jīng)網(wǎng)絡(luò) (PSO-NN)的一大問題,并行化加速是解決該問題的有效思路。

    除了NN 存儲(chǔ)結(jié)構(gòu)和樣本訓(xùn)練的并行性[3-5],PSO-NN還存在PSO 算法天然具備的群體中個(gè)體行為的并行性。相比用計(jì) 算 機(jī) 群[6,7]、多 核CPU[8]或FPGA 等 專 業(yè) 并 行 設(shè)備[9]加速PSO 算 法,利 用 圖 形 處 理 器 (graphic processing unit,GPU)并行加速PSO 算法[10-13]具備硬件成本低的最顯著優(yōu)勢。特別是2007年NVIDA 公司推出了統(tǒng)一計(jì)算設(shè)備架構(gòu) (compute unified device architecture,CUDA),不需要借助復(fù)雜的圖形學(xué)知識(shí),良好的可編程性使其迅速成為當(dāng)前最為流行的GPU 編程語言。

    本文在GPU-PSO 的研究基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了一種基于CUDA 的并行PSO-NN 求解方法,并對(duì)一簡單測試函數(shù)逼近進(jìn)行了實(shí)驗(yàn)測試。本文創(chuàng)新之處在于,從GPU-PSO解決的問題看,將GPU-PSO 用來加速訓(xùn)練NN;從PSONN 的實(shí)現(xiàn)方式上,用GPU 并行加速訓(xùn)練PSO-NN。實(shí)驗(yàn)結(jié)果表明,該方法能加速NN 的訓(xùn)練,減少NN 的訓(xùn)練時(shí)間,相對(duì)于基于CPU 的串行PSO-NN,基于GPU 的并行PSO-NN 在保證訓(xùn)練誤差的前提下取得了超過500 倍的計(jì)算加速比。

    1 基于CUDA 的并行PSO-NN 算法

    1.1 標(biāo)準(zhǔn)PSO-NN算法

    PSO 算法是Kennedy和Eberhart于1995 年提出的一種基于群體智能的優(yōu)化算法,其簡單易實(shí)現(xiàn),具備較強(qiáng)的全局搜索和收斂能力,用于優(yōu)化NN 權(quán)閾值能比BP-NN 獲得更好的收斂精度和更強(qiáng)的預(yù)測能力[2]。PSO-NN 的核心思想在于粒子與NN 之間的4 個(gè)對(duì)應(yīng):粒子維數(shù)對(duì)應(yīng)NN權(quán)閾值的數(shù)目,粒子位置對(duì)應(yīng)NN 的權(quán)閾值,粒子速度對(duì)應(yīng)NN 權(quán)閾值的變化,粒子適應(yīng)度值對(duì)應(yīng)NN 的輸出誤差。

    本文使用的PSO 算法版本為帶慣性權(quán)重、全局拓?fù)浣Y(jié)構(gòu)的PSO 算法。粒子群由N 個(gè)粒子組成,每個(gè)粒子的位置代表優(yōu)化問題在D 維搜索空間 (D 為NN 權(quán)閾值的數(shù)目)中的一個(gè)潛在的解。PSO-NN 中,采用粒子各維與NN 各權(quán)閾值一一對(duì)應(yīng)的原則,將每個(gè)粒子被編碼成一個(gè)向量,比如將圖1 (圖中已將權(quán)值和閾值合并表示為權(quán)閾值)所示的一個(gè)輸入層2 節(jié)點(diǎn)、隱層3 節(jié)點(diǎn)、輸出層1 節(jié)點(diǎn)的NN編碼成一個(gè)13維的粒子

    式中:i——粒子數(shù),i=1,2,...,N。特別要指出的是,這里未采用矩陣編碼策略,而采用向量編碼策略,主要是考慮到1.3節(jié)中方便將粒子位置、速度等信息存儲(chǔ)在線性的GPU 全局內(nèi)存中。

    算法的速度更新和位置更新公式如下

    其中,i=1,2,...,N,d=1,2,...,D;c1和c2是學(xué)習(xí)因子,非負(fù)的常數(shù);r1和r2是介于 [0,1]的均勻分布的隨機(jī)數(shù);Vid(t)∈ [-Vmax,Vmax],Vmax限制了粒子飛行的最大速度,Xid(t)∈ [-Xmax,Xmax],Xmax限定了粒子搜索空間的范圍,可設(shè)定Vmax=kXmax,0≤k≤1;w 是慣性權(quán)重,介于 [0,1],用來平衡粒子的全局探索能力和局部開發(fā)能力。

    標(biāo)準(zhǔn)PSO-NN 算法的流程如下:

    (1)讀入訓(xùn)練樣本和測試樣本,數(shù)據(jù)預(yù)處理,設(shè)定最大迭代次數(shù)Tmax。

    圖1 2-3-1結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型

    (2)隨機(jī)初始化每個(gè)粒子的位置Vid(t)和速度Xid(t)。

    (3)初始化個(gè)體最優(yōu)位置Pbestid(t)和全局最優(yōu)位置Gbestd(t)。

    (4)更新每個(gè)粒子的速度Vid(t)和位置Xid(t)。

    (5)計(jì)算每個(gè)粒子對(duì)應(yīng)的適應(yīng)度值 (即NN 的輸出誤差)F(Xi)。

    (6)更新個(gè)體最優(yōu)位置Pbestid(t)和全局最優(yōu)位置Gbestd(t)。

    (7)若達(dá)到最大迭代次數(shù)Tmax,則執(zhí)行步驟 (8),否則返回步驟 (4)。

    (8)將訓(xùn)練樣本和測試樣本帶入訓(xùn)練好的NN,得到網(wǎng)絡(luò)輸出。

    1.2 CUDA編程架構(gòu)

    CUDA 采用CPU 和GPU 異構(gòu)協(xié)作的編程模式,CPU負(fù)責(zé)串行計(jì)算任務(wù)和控制GPU 計(jì)算,GPU 以單指令多線程 (single instruction multiple threads,SIMT)執(zhí)行方式負(fù)責(zé)并行計(jì)算任務(wù)。內(nèi)核函數(shù) (kernel)執(zhí)行GPU 上的并行計(jì)算任務(wù),是整個(gè)程序中的一個(gè)可以被并行執(zhí)行的步驟。CUDA 將線程組織成塊網(wǎng)格 (grid)、線程塊 (block)、線程 (thread)這3個(gè)不同的層次,并采用多層次的存儲(chǔ)器結(jié)構(gòu):只對(duì)單個(gè)線程可見的本地存儲(chǔ)器,對(duì)塊內(nèi)線程可見的共享存儲(chǔ)器,對(duì)所有線程可見的全局存儲(chǔ)器等。kernel函數(shù)中,Grid內(nèi)的Block之間不可通信,能以任意順序串行或并行地獨(dú)立執(zhí)行;Block內(nèi)的Thread之間可以通信,能通過存儲(chǔ)共享和柵欄同步有效協(xié)作執(zhí)行。CUDA 程序流程通常包括以下6個(gè)步驟:①分配CPU 內(nèi)存并初始化;②分配GPU 內(nèi)存;③CPU 到GPU 數(shù)據(jù)傳遞;④GPU 并行計(jì)算;⑤計(jì)算結(jié)果從GPU 傳回CPU;⑥處理傳回到CPU的數(shù)據(jù)。

    1.3 基于CUDA的并行PSO-NN算法設(shè)計(jì)

    常見的NN 神經(jīng)元節(jié)點(diǎn)和訓(xùn)練樣本數(shù)目往往只有十幾或幾十個(gè),利用NN 存儲(chǔ)結(jié)構(gòu)或樣本訓(xùn)練的并行性比較適合計(jì)算機(jī)集群等并行計(jì)算方式[3-5],對(duì)于GPU 來說其算法并行程度還是不夠,因?yàn)镚PU 線程數(shù)為十幾或幾十時(shí)難以充分發(fā)揮其強(qiáng)大的并行計(jì)算能力。對(duì)于較復(fù)雜的問題,PSO-NN 中的粒子數(shù)往往可以達(dá)到上百個(gè)乃至更多,利用群體中粒子行為的并行性可以比較充分發(fā)揮GPU 的并行計(jì)算能力。

    2009年,Veronese和Krohling 首次應(yīng)用CUDA 實(shí)現(xiàn)了 對(duì)PSO 算 法 的 加 速[10],掀 起 了GPU 加 速PSO 算 法 的 研究熱潮,近幾年GPU-PSO 的研究趨勢集中在以下2 個(gè)方面:①有GPU 架構(gòu)特色的各種PSO 算法變種;②GPUPSO 解決實(shí)際問題。國內(nèi)文獻(xiàn)對(duì)GPU 加速PSO 算法的研究相對(duì)較少。張慶科等在文獻(xiàn) [12]中概述了CUDA 架構(gòu)下包括PSO 算法在內(nèi)的5種典型現(xiàn)代優(yōu)化算法的并行實(shí)現(xiàn)過程,在并行PSO 算法部分給出了文獻(xiàn) [14]中的實(shí)驗(yàn)結(jié)果。蔡勇等近期在文獻(xiàn) [13]中給出了并行PSO 算法較詳細(xì)的設(shè)計(jì)過程和優(yōu)化思路,取得了90倍的加速比。

    本文所述的基于CUDA 的并行PSO-NN 算法屬于上文所述GPU-PSO 研究趨勢的第2個(gè)方面,解決的實(shí)際問題是NN 的加速訓(xùn)練。PSO-NN 算法非常適合CUDA 架構(gòu)的原因有2點(diǎn):一是可并行部分 (NN 的訓(xùn)練)的執(zhí)行時(shí)間占整個(gè)程序執(zhí)行時(shí)間的絕大部分;二是CPU 和GPU 之間無需頻繁通信,數(shù)據(jù)傳輸?shù)臅r(shí)間開銷只占整個(gè)程序執(zhí)行時(shí)間的極小部分。

    為簡單起見,本文使用前述標(biāo)準(zhǔn)PSO-NN 算法,采用粒子與線程一一對(duì)應(yīng)的并行策略,利用PSO算法固有的三大并行性:速度更新和位置更新的并行性,計(jì)算粒子適應(yīng)度的并行性,更新Pbest適應(yīng)度值和位置的并行性,以及CUDA 架構(gòu)特有的并行性:更新Gbest時(shí)的并行規(guī)約 (reduction)算法,將GPU-PSO-NN的算法流程設(shè)計(jì)如圖2所示。

    圖2 基于CUDA 架構(gòu)的并行PSO-NN 算法流程

    GPU-PSO-NN 算法的步驟如下:

    (1)CPU 端讀入訓(xùn)練樣本和測試樣本,數(shù)據(jù)預(yù)處理。

    (2)CPU 端調(diào)用malloc ()函數(shù)和cudaMalloc ()函數(shù),分別在CPU 端和GPU 端分配變量空間。

    (3)CPU 端初始化粒子的位置、速度等信息。

    (4)CPU 端調(diào)用cudaMemcpy ()函數(shù),將CPU 端粒子信息傳至GPU 全局內(nèi)存;CPU 端調(diào)用cudaMemcpyTo-Symbol()函數(shù),將CPU 端訓(xùn)練樣本傳至GPU 常量內(nèi)存。

    (5)CPU 端調(diào)用kernel函數(shù),執(zhí)行GPU 上的并行計(jì)算任務(wù),完成NN 的訓(xùn)練。

    (6)CPU 端調(diào)用cudaMemcpy ()函數(shù),將GPU 端有用信息傳回至CPU 端。

    (7)CPU 端將訓(xùn)練樣本和測試樣本帶入訓(xùn)練好的NN,查看結(jié)果。

    (8)CPU 端 調(diào) 用free ()函 數(shù) 和cudaFree ()函 數(shù),釋放CPU 端和GPU 端已分配的變量空間。

    以上步驟中,完成加速訓(xùn)練NN 的步驟 (5)是GPUPSO-NN 算法的核心,其偽代碼如下:

    以上偽代碼中的kernel 4 需要找出適應(yīng)度值最小的粒子編號(hào),這對(duì)單線程算法來說非常簡單的任務(wù),在大規(guī)模并行架構(gòu)上實(shí)現(xiàn)時(shí)卻會(huì)變成一個(gè)復(fù)雜的問題。當(dāng)粒子數(shù)大于塊內(nèi)最大線程數(shù)1024 (計(jì)算能力2.0 及以上)或512(計(jì)算能力2.0 以下)時(shí),在CUDA 架構(gòu)上需用2 次并行Reduction實(shí)現(xiàn),程序具體實(shí)現(xiàn)時(shí)分為2個(gè)kernel。第1個(gè)kernel啟動(dòng)等于粒子數(shù)的線程數(shù),找到各個(gè)線程塊中的最小值;第2個(gè)kernel啟動(dòng)等于第1個(gè)kernel中線程塊數(shù)的線程數(shù),找到這些最小值的最小值,即當(dāng)前全局最優(yōu)值。當(dāng)前全局最優(yōu)值再與舊的全局最優(yōu)值對(duì)比,決定是否需要更新。不能只使用1個(gè)kernel的原因在于:CUDA 架構(gòu)能通過調(diào)用__syncthreads()使線程塊內(nèi)的線程同步,但不能使所有線程同步,所有線程的同步只能通過kernel的結(jié)束來保證。當(dāng)粒子數(shù)小于等于塊內(nèi)最大線程數(shù)1024 或512時(shí),在kernel函數(shù)中啟動(dòng)等于粒子數(shù)的線程數(shù)做1次并行Reduction即可。

    2 GPU-PSO-NN算法性能優(yōu)化

    2.1 粒子 (線程)數(shù)目和線程塊大小的設(shè)計(jì)

    一個(gè)線程束 (Warp)包含索引相鄰的32個(gè)線程,流多處理器 (stream multiprocessor,SM)以Warp為單位調(diào)度和執(zhí)行線程,因此將粒子數(shù)目和線程塊大小都設(shè)計(jì)成32的倍數(shù)值。具體實(shí)現(xiàn)時(shí),每個(gè)線程塊中的線程數(shù)目在kernel 1、kernel 2、kernel 3中盡量取128、192、256這樣的典型值,在kernel 4中為了充分利用共享內(nèi)存第1個(gè)Reduction時(shí)盡量取大 (計(jì)算能力2.0 及以上的塊內(nèi)最大線程數(shù)為1024,計(jì)算能力2.0以下的塊內(nèi)最大線程數(shù)為512),第2個(gè)Reduction時(shí)取第一個(gè)Reduction的線程塊數(shù)。

    2.2 最小化線程分支

    SIMT 執(zhí) 行 模 式 會(huì) 導(dǎo) 致 線 程 分 支 (thread divergence)特別耗時(shí),應(yīng)盡量減少Warp內(nèi)的分支數(shù)目。以kernel 4中的并行規(guī)約為例 (實(shí)驗(yàn)中至少有32個(gè)線程,這里簡單起見只列出8個(gè)線程),圖3的方案具有明顯的線程分支,在第一次求min中,只有那些索引為偶數(shù)的線程才執(zhí)行求min,相鄰線程行為不同。圖4的方案分支就較少,表現(xiàn)在相鄰線程行為相同,都求min或者都不求min。

    圖3 大量線程分支的并行規(guī)約求極值方案

    圖4 最小化線程分支的并行規(guī)約求極值方案

    2.3 合并訪問全局存儲(chǔ)器

    粒子位置、速度等信息在CPU 內(nèi)存中以二維形式存儲(chǔ),如圖5所示 (圖中d=D-1,n=N-1),而GPU 全局內(nèi)存是一維形式,將粒子位置、速度等信息在GPU 全局內(nèi)存中布局涉及到合并訪問 (coalesced access)的問題。簡單地說,相鄰的線程訪問相鄰的數(shù)據(jù),即可滿足合并訪問的要求。合并訪問能使傳輸數(shù)據(jù)時(shí)的速度接近全局存儲(chǔ)器帶寬的峰值。粒子位置信息在GPU 全局內(nèi)存中按粒子順序存儲(chǔ) (文獻(xiàn) [13,15]等就是采用的這種方式),如圖6所示,雖然簡單直觀但不符合合并訪問的要求,會(huì)造成訪存效率大幅下降。這里采用文獻(xiàn) [16]所述的存儲(chǔ)布局方法,如圖7所示,訪存時(shí)同時(shí)訪問各個(gè)粒子的同一維,滿足合并訪問的條件,提高了訪存效率。粒子速度信息的存儲(chǔ)布局與粒子位置信息類似。

    圖5 粒子位置信息在CPU 內(nèi)存中的存儲(chǔ)

    圖6 粒子位置信息在GPU 全局內(nèi)存中的存儲(chǔ)(沒有合并訪問)

    圖7 粒子位置信息在GPU 全局內(nèi)存中的存儲(chǔ) (合并訪問)

    2.4 最大化使用共享存儲(chǔ)器

    每個(gè)SM 提供最多48KB 的共享存儲(chǔ)器,比全局存儲(chǔ)器的訪問速度快得多,但只對(duì)塊內(nèi)線程可見。應(yīng)盡量使用共享存儲(chǔ)器來保存全局存儲(chǔ)器中在kernel函數(shù)的執(zhí)行階段需要頻繁使用的那部分?jǐn)?shù)據(jù)。以kernel 4中的并行Reduction為例,每次規(guī)約時(shí)將先將全局內(nèi)存中的數(shù)據(jù)保存至共享內(nèi)存,規(guī)約時(shí)反復(fù)使用共享內(nèi)存上的數(shù)據(jù),規(guī)約完成后再將共享內(nèi)存上的結(jié)果保存至全局內(nèi)存。

    2.5 最大化使用常量存儲(chǔ)器

    GPU 上共有64KB對(duì)所有線程可見的常量存儲(chǔ)器,以數(shù)據(jù) “不可變”作為代價(jià)換取比全局存儲(chǔ)器更快的訪問速度。PSO-NN 用于訓(xùn)練的樣本數(shù)據(jù)量較多 (十幾、幾十乃至上百個(gè)數(shù)據(jù)),都是常量且重復(fù)利用。因此和粒子速度、位置等信息存儲(chǔ)在全局內(nèi)存中不同,將訓(xùn)練樣本數(shù)據(jù)存放在常量內(nèi)存中,加快訪存速度。

    2.6 最小化CPU 和GPU 之間的數(shù)據(jù)傳輸

    GPU 上執(zhí)行PSO 的粒子速度更新需要大量的隨機(jī)數(shù)。早期的GPU 上沒有自帶的隨機(jī)數(shù)生成庫,需要將CPU 產(chǎn)生的隨機(jī)數(shù)傳至GPU (傳輸時(shí)間降低計(jì)算性能)[14],或編寫GPU 隨機(jī)數(shù)生成函數(shù) (使用不方便)[17]。目前,可以使用CURAND 庫中的curand_uniform ()函數(shù)在GPU 上產(chǎn)生隨機(jī)數(shù),這樣使整個(gè)迭代過程都在GPU 上完成,避免在CPU 和GPU 之間頻繁傳輸數(shù)據(jù)帶來的時(shí)間損耗。

    3 實(shí)驗(yàn)結(jié)果與分析

    本文采用一個(gè)簡單測試函數(shù)逼近對(duì)GPU-PSO-NN 算法和CPU-PSO-NN 算法進(jìn)行加速性能測試。

    該函數(shù)表達(dá)式如式 (4)所示,在定義域 [-4,4]內(nèi)有兩個(gè)峰值點(diǎn),如圖8所示。訓(xùn)練函數(shù)集和測試函數(shù)集分別有101和100組輸入,如式(5)和式(6)所示,帶入式(4)可得其理論輸出。NN訓(xùn)練樣本的輸出均方誤差(MSE),即粒子的適應(yīng)度值,反映NN對(duì)測試函數(shù)的逼近程度。

    圖8 測試函數(shù)

    仿真計(jì)算過程中,NN 結(jié)構(gòu)設(shè)定為1-10-1,即輸入層1節(jié)點(diǎn)、隱層10節(jié)點(diǎn)、輸出層1節(jié)點(diǎn),權(quán)閾值數(shù)目為31(粒子維數(shù)),如圖9所示。隱層激活函數(shù)為雙極性S型函數(shù),其表達(dá)式如式 (7)所示。輸出層激活函數(shù)為線性函數(shù),其表達(dá)式如式 (8)所示

    慣性權(quán)重w 取值0.9 至0.4線性遞減。學(xué)習(xí)因子c1和c2均取2.05。k取值0.5。訓(xùn)練次數(shù)Tmax取值1000。實(shí)驗(yàn)所采用的計(jì)算平臺(tái)見表1。為保證結(jié)果的可靠性,實(shí)驗(yàn)數(shù)據(jù)為20次實(shí)驗(yàn)去掉最大值和最小值之后18次的平均值。

    “加速比”Siteration是最常用的加速性能指標(biāo),定義為PSO-NN 算法在相同的粒子數(shù)和相同的迭代次數(shù) (1000)下CPU 程 序 運(yùn) 行 時(shí) 間Tcpu-iteration和GPU 程 序 運(yùn) 行 時(shí) 間Tgpu-iteration的比值

    圖9 實(shí)驗(yàn)所用的1-10-1結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型

    表1 計(jì)算平臺(tái)

    實(shí)驗(yàn)結(jié)果見表2。

    表2 PSO-NN 作簡單測試函數(shù)逼近取得的加速比

    對(duì)表2中的數(shù)據(jù)做如下分析:

    (1)PSO-NN 完成1000 次迭代的運(yùn)行時(shí)間,在CPU程序中隨著粒子數(shù)的翻倍大致呈翻倍趨勢;在GPU 程序中當(dāng)粒子數(shù)小于等于16384 時(shí)呈小幅增長趨勢,大于等于32768時(shí)呈大幅增長趨勢 (其原因見 (2))。

    (2)該GPU 共13個(gè)SM,每個(gè)SM 的最大駐留線程數(shù)為2048,總最大駐留線程數(shù)為26624。當(dāng)粒子數(shù) (線程數(shù))小于等于16384時(shí),各個(gè)粒子執(zhí)行時(shí)間相似,但同步 (包括kernel函數(shù)結(jié)束對(duì)應(yīng)的所有線程的同步,以及__syncthreads()調(diào)用對(duì)應(yīng)的線程塊內(nèi)線程的同步)所消耗的時(shí)間隨著粒子數(shù)的增多而小幅增長,造成PSO-NN 的運(yùn)行時(shí)間呈小幅增長趨勢;當(dāng)粒子數(shù)大于等于32768 時(shí),線程總數(shù)已超過26624,PSO-NN 的運(yùn)行時(shí)間呈大幅增長趨勢(當(dāng)粒子數(shù)翻倍,運(yùn)行時(shí)間增加不到1倍是基于以下3個(gè)原因的共同作用:①粒子數(shù)翻倍對(duì)應(yīng)運(yùn)行時(shí)間翻倍;②粒子數(shù)增多對(duì)應(yīng)同步時(shí)間增加;③線程切換能掩蓋存儲(chǔ)器訪問延遲,顯著減少執(zhí)行時(shí)間)。

    分析表2中的數(shù)據(jù)可得如下結(jié)論:

    (3)粒子數(shù)越多,獲得的加速比越高,PSO-NN 最高獲得了566倍的加速比。隨著粒子數(shù)的翻倍,當(dāng)粒子數(shù)小于等于16384,加速比大致翻倍;當(dāng)粒子數(shù)大于等于32768,加速比仍能增加但增速放緩。

    (4)GPU-PSO-NN 具 有 與CPU-PSO-NN 同 樣 的 尋 優(yōu)穩(wěn)定性。隨著粒子數(shù)的不斷增多,CPU 程序和GPU 程序的訓(xùn)練誤差 (即NN 的MSE)不斷減小;粒子數(shù)相同時(shí),CPU 程序和GPU 程序的訓(xùn)練誤差大致相同或相近。

    (5)大幅增加粒子數(shù)是適應(yīng)GPU 計(jì)算架構(gòu)的特殊方法。若GPU 端使用比CPU 端多的多的粒子,則可以在運(yùn)行時(shí)間增加極為有限的情況下大幅降低訓(xùn)練誤差。

    另外作如下推斷:

    (6)使用相同實(shí)驗(yàn)設(shè)備,筆者曾在CUDA 架構(gòu)下對(duì)Sphere、Rosenbrock、Rastrigrin、Griewangk 這4個(gè)基準(zhǔn)測試函數(shù)進(jìn)行了數(shù)值測試,以比較GPU-PSO 算法相對(duì)CPUPSO 算法的加速性能,結(jié)果表明,當(dāng)粒子數(shù)目小于100時(shí),往往不能得到加速。文獻(xiàn) [13]也進(jìn)行了類似測試,使用的粒子數(shù)目最小也為400 (具體為400、1200、2000、2800、5000)。而本文的實(shí)驗(yàn)當(dāng)粒子數(shù)目為32和64時(shí),也得到了加速。PSO-NN 算法本質(zhì)上就是適應(yīng)度函數(shù)為NN輸出誤差的PSO 算法,問題維數(shù)很多 (1-10-1簡單結(jié)構(gòu)的NN 就已有31維)且計(jì)算時(shí)反復(fù)使用,比起一般的基準(zhǔn)測試函數(shù)計(jì)算復(fù)雜度高的多。

    可以推斷,用GPU 作并行加速時(shí),PSO-NN 由于適應(yīng)度函數(shù)計(jì)算量大,比起一般的PSO 能獲得更好的加速比,更適應(yīng)CUDA 并行計(jì)算架構(gòu)。

    (7)對(duì)于該測試函數(shù)的NN 逼近問題,當(dāng)NN 訓(xùn)練樣本的MSE小于0.001起,測試樣本輸出曲線與實(shí)際曲線基本擬合,肉眼尚能明顯分清差別;當(dāng)MSE 小于0.0002起,測試樣本輸出曲線與實(shí)際曲線基本重合,肉眼不易分清差別;當(dāng)MSE小于0.0001起,測試樣本輸出曲線與實(shí)際曲線幾乎完全重合,肉眼幾乎不能分清差別。

    根據(jù)經(jīng)驗(yàn),一般而言CPU 端粒子數(shù)應(yīng)多于問題維數(shù),以保證種群的多樣性,但粒子數(shù)過多又會(huì)增加計(jì)算時(shí)間,降低尋優(yōu)效率,顯著惡化CPU 端PSO-NN 算法性能而造成加速比虛假現(xiàn)象。當(dāng)粒子數(shù)為128、256、512、1024 時(shí),其CPU 程序?qū)?yīng)的MSE大致在0.001至0.0001之間,不妨認(rèn)為這些CPU 程序是 “高效的CPU 程序” (粒子數(shù)過少則逼近精度較差,“不合格”;粒子數(shù)過多則浪費(fèi)計(jì)算時(shí)間,“不值得”),其對(duì)應(yīng)的GPU 程序取得了5.6至44.0的加速比。

    注意到本實(shí)驗(yàn)的測試函數(shù)逼近問題所用NN只有1個(gè)輸入層節(jié)點(diǎn)、1個(gè)輸出層節(jié)點(diǎn),網(wǎng)絡(luò)結(jié)構(gòu)非常簡單,問題維數(shù)較少(31維),實(shí)際問題往往是多輸入、多輸出、更多的隱層節(jié)點(diǎn)數(shù)、更多的權(quán)閾值數(shù)目,帶來的直接好處是,“高效的CPU 程序”對(duì)應(yīng)的粒子數(shù)以及獲得的加速比也會(huì)相應(yīng)增加。

    可以推斷,NN 解決的問題越復(fù)雜,獲得的加速比越高。

    4 結(jié)束語

    本文采用CUDA 架構(gòu)設(shè)計(jì)并實(shí)現(xiàn)了PSO-NN 的并行加速求解。通過粒子與線程一一對(duì)應(yīng)的并行策略,采用適應(yīng)GPU 計(jì)算的優(yōu)化設(shè)計(jì)方法,實(shí)現(xiàn)了對(duì)NN 訓(xùn)練這一占整個(gè)程序絕大部分執(zhí)行時(shí)間的可并行部分的加速計(jì)算,并對(duì)一簡單測試函數(shù)逼近進(jìn)行了數(shù)值仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,相對(duì)于傳統(tǒng)的基于CPU 的串行PSO-NN,基于GPU 的并行PSO-NN 在尋優(yōu)穩(wěn)定性一致的前提下取得了超過500倍的計(jì)算加速比。本文提出的基于GPU 的并行PSO-NN 設(shè)計(jì)方案和優(yōu)化思路可以推廣應(yīng)用到其它類似實(shí)際問題的分析和設(shè)計(jì)中。

    [1]Poli R,Kennedy J,Blackwell T.Particle swarm optimization:An overview [J].Swarm Intelligence,2007,1 (1):33-57.

    [2]TIAN Yubo,LI Zhengqiang,WANG Jianhua.Model resonant frequency of rectangular microstrip antenna based on particle swarm neural network [J].Journal of Microwaves,2009,25 (5):45-50 (in Chinese).[田雨波,李正強(qiáng),王建華.矩形微帶天線諧振頻率的粒子群神經(jīng)網(wǎng)絡(luò)建模 [J].微波學(xué)報(bào),2009,25 (5):45-50.]

    [3]Ganeshamoorthy K,Ranasinghe D N.On the performance of parallel neural network implementations on distributed memory architectures [C]//8th IEEE International Symposium on Cluster Computing and the Grid,2008:90-97.

    [4]GUO Wensheng,LI Guohe.On designing artificial neural networks on parallel computer cluster[J].Computer Applications and Software,2010,27 (5):12-14 (in Chinese).[郭文生,李國和.人工神經(jīng)網(wǎng)絡(luò)在并行計(jì)算機(jī)集群上的設(shè)計(jì)研究 [J].計(jì)算機(jī)應(yīng)用與軟件,2010,27 (5):12-14.]

    [5]ZHANG Daiyuan.Training algorithm for neural networks based on distributed parallel calculation [J].Systems Engineering and Electronics,2010,32 (2):386-391 (in Chinese).[張代遠(yuǎn).基于分布式并行計(jì)算的神經(jīng)網(wǎng)絡(luò)算法 [J].系統(tǒng)工程與電子技術(shù),2010,32 (2):386-391.]

    [6]Singhal G,Jain A,Patnaik A.Parallelization of particle swarm optimization using message passing interfaces(MPIs)[C]//IEEE World Congress on Nature &Biologically Inspired Computing,2009:67-71.

    [7]Deep K,Sharma S,Pant M.Modified parallel particle swarm optimization for global optimization using message passing interface [C]//IEEE Fifth International Conference on Bio-Inspired Computing:Theories and Applications,2010:1451-1458.

    [8]Wang D Z,Wu C H.Parallel multi-population particle swarm optimization algorithm for the uncapacitated facility location problem using OpenMP [C]//IEEE Congress on Evolutionary Computation,2008:1214-1218.

    [9]Maeda Y,Matsushita N.Simultaneous perturbation particle swarm optimization using FPGA [C]//IEEE International Joint Conference on Neural Networks,2007:2695-2700.

    [10]Veronese L,Krohling R.Swarm’s flight:Accelerating the particles using C-CUDA [C]//Proceedings of the IEEE Congress on Evolutionary Computation,2009:3264-3270.

    [11]Calazan R M,Nedjah N,de Macedo Mourelle L.Parallel GPU-based implementation of high dimension particle swarm optimizations[C]//IEEE Fourth Latin American Symposium on Circuits and Systems,2013:1-4.

    [12]ZHANG Qingke,YANG Bo,WANG Lin,et al.Research on parallel modern optimization algorithms using GPU [J].Computer Science,2012,39 (4):304-311 (in Chinese).[張慶科,楊波,王琳,等.基于GPU 的現(xiàn)代并行優(yōu)化算法[J].計(jì)算機(jī)科學(xué),2012,39 (4):304-311.]

    [13]CAI Yong,LI Guangyao,WANG Hu.Research and implementation of parallel particle swarm optimization based on CUDA [J].Application Research of Computers,2013,30 (8):2415-2418 (in Chinese). [蔡勇,李光耀,王琥.基于CUDA 的并行粒子群優(yōu)化算法的設(shè)計(jì)與實(shí)現(xiàn) [J].計(jì)算機(jī)應(yīng)用研究,2013,30 (8):2415-2418.]

    [14]Zhou Y,Tan Y.GPU-based parallel particle swarm optimization [C]//Proceedings of the IEEE Congress on Evolutionary Computation,2009:1493-1500.

    [15]Mussi L,Daolio F,Cagnoni S.Evaluation of parallel particle swarm optimization algorithms within the CUDA architecture[J].Information Sciences,2010,181 (20):4642-4657.

    [16]Roberge V,Tarbouchi M.Efficient parallel Particle Swarm Optimizers on GPU for real-time harmonic minimization in multilevel inverters [C]//38th Annual Conference on IEEE Industrial Electronics Society,2012:2275-2282.

    [17]Bastos-Filho CJA,Oliveira MAC,Nascimento DNO,et al.Impact of the random number generator quality on particle swarm optimization algorithm running on graphic processor units[C]//IEEE 10th International Conference on Hybrid Intelligent Systems,2010:85-90.

    猜你喜歡
    測試函數(shù)線程全局
    Cahn-Hilliard-Brinkman系統(tǒng)的全局吸引子
    量子Navier-Stokes方程弱解的全局存在性
    落子山東,意在全局
    金橋(2018年4期)2018-09-26 02:24:54
    具有收縮因子的自適應(yīng)鴿群算法用于函數(shù)優(yōu)化問題
    淺談linux多線程協(xié)作
    帶勢函數(shù)的雙調(diào)和不等式組的整體解的不存在性
    約束二進(jìn)制二次規(guī)劃測試函數(shù)的一個(gè)構(gòu)造方法
    新思路:牽一發(fā)動(dòng)全局
    面向真實(shí)世界的測試函數(shù)Ⅱ
    Linux線程實(shí)現(xiàn)技術(shù)研究
    久久精品国产99精品国产亚洲性色| 亚洲av中文字字幕乱码综合| 99热这里只有是精品50| 国产伦一二天堂av在线观看| .国产精品久久| 九九在线视频观看精品| 久久欧美精品欧美久久欧美| 日韩制服骚丝袜av| 国产一区二区在线av高清观看| 亚洲最大成人av| 午夜亚洲福利在线播放| 一夜夜www| 一区二区三区四区激情视频 | 内地一区二区视频在线| 欧美变态另类bdsm刘玥| 成人亚洲欧美一区二区av| 成年女人看的毛片在线观看| 精品少妇黑人巨大在线播放 | 免费在线观看成人毛片| 国产av一区在线观看免费| 老女人水多毛片| 欧美变态另类bdsm刘玥| 日本黄色视频三级网站网址| 国产真实伦视频高清在线观看| 国产高清激情床上av| 精品一区二区免费观看| 狠狠狠狠99中文字幕| 男插女下体视频免费在线播放| 热99re8久久精品国产| 久久精品久久久久久久性| 亚洲精品乱码久久久v下载方式| 真实男女啪啪啪动态图| 国产成人freesex在线| 亚洲经典国产精华液单| 久久99精品国语久久久| 日韩欧美三级三区| 淫秽高清视频在线观看| 国产亚洲av嫩草精品影院| 麻豆久久精品国产亚洲av| 亚洲精品亚洲一区二区| 欧美日韩精品成人综合77777| 国产精品无大码| 日本五十路高清| 亚洲激情五月婷婷啪啪| 18+在线观看网站| 日本一本二区三区精品| 91精品国产九色| 成人av在线播放网站| 99久久精品国产国产毛片| а√天堂www在线а√下载| 亚洲国产欧美人成| 亚洲熟妇中文字幕五十中出| 久久99热这里只有精品18| 国产午夜福利久久久久久| 婷婷亚洲欧美| 国内少妇人妻偷人精品xxx网站| 3wmmmm亚洲av在线观看| 国产精品精品国产色婷婷| 国产成人a∨麻豆精品| 一本一本综合久久| 国内久久婷婷六月综合欲色啪| 国产激情偷乱视频一区二区| 精品熟女少妇av免费看| 欧美+亚洲+日韩+国产| 国内揄拍国产精品人妻在线| 国产一区二区三区在线臀色熟女| 午夜免费激情av| 美女 人体艺术 gogo| 别揉我奶头 嗯啊视频| 在线国产一区二区在线| 不卡一级毛片| 我的女老师完整版在线观看| 欧美性猛交╳xxx乱大交人| 99riav亚洲国产免费| 夜夜夜夜夜久久久久| 国产成人a区在线观看| 联通29元200g的流量卡| 美女被艹到高潮喷水动态| 又爽又黄a免费视频| 国内久久婷婷六月综合欲色啪| 直男gayav资源| 青春草视频在线免费观看| 在线国产一区二区在线| 少妇熟女aⅴ在线视频| 网址你懂的国产日韩在线| 中文亚洲av片在线观看爽| av在线蜜桃| 欧美+亚洲+日韩+国产| 黄片无遮挡物在线观看| avwww免费| 亚洲熟妇中文字幕五十中出| 嫩草影院精品99| 夜夜爽天天搞| 天堂影院成人在线观看| 亚洲一区二区三区色噜噜| 亚洲一级一片aⅴ在线观看| 一边摸一边抽搐一进一小说| 最近最新中文字幕大全电影3| 亚洲av二区三区四区| 婷婷色综合大香蕉| 毛片一级片免费看久久久久| 乱码一卡2卡4卡精品| h日本视频在线播放| www日本黄色视频网| 日本免费a在线| 人妻系列 视频| 中文字幕av在线有码专区| 国内少妇人妻偷人精品xxx网站| 亚洲av成人av| 能在线免费观看的黄片| 国产亚洲精品av在线| 日韩人妻高清精品专区| 久久久精品欧美日韩精品| 非洲黑人性xxxx精品又粗又长| 一级毛片aaaaaa免费看小| 亚洲欧美精品自产自拍| 97在线视频观看| 最近2019中文字幕mv第一页| 尾随美女入室| 亚洲成人精品中文字幕电影| 一区二区三区四区激情视频 | 看非洲黑人一级黄片| 亚洲七黄色美女视频| 亚洲精品456在线播放app| 久久久久久久久久成人| 色噜噜av男人的天堂激情| 女人十人毛片免费观看3o分钟| 精品日产1卡2卡| 免费看光身美女| 黄片无遮挡物在线观看| 卡戴珊不雅视频在线播放| 欧美成人精品欧美一级黄| 亚洲国产精品合色在线| 国产精品久久久久久精品电影| 97热精品久久久久久| 99久久成人亚洲精品观看| 国产精品一区二区三区四区免费观看| 久久99热这里只有精品18| 中国美女看黄片| 精品人妻一区二区三区麻豆| 你懂的网址亚洲精品在线观看 | 成人无遮挡网站| 高清在线视频一区二区三区 | 欧美一区二区精品小视频在线| 国产一区二区亚洲精品在线观看| 国产精品美女特级片免费视频播放器| 国产伦理片在线播放av一区 | 好男人在线观看高清免费视频| 成人综合一区亚洲| 亚洲自拍偷在线| 两个人视频免费观看高清| 人妻久久中文字幕网| 久久久久久久久久久免费av| 久久久成人免费电影| 免费大片18禁| 亚洲不卡免费看| 亚洲经典国产精华液单| 麻豆国产97在线/欧美| 乱系列少妇在线播放| 18+在线观看网站| 亚洲精品久久久久久婷婷小说 | 美女内射精品一级片tv| 成人欧美大片| 2022亚洲国产成人精品| 99久久无色码亚洲精品果冻| 真实男女啪啪啪动态图| 国产精品福利在线免费观看| 国产成人a∨麻豆精品| 久久久a久久爽久久v久久| 成年女人看的毛片在线观看| 九九热线精品视视频播放| 亚洲精品456在线播放app| 免费无遮挡裸体视频| 久久久成人免费电影| 春色校园在线视频观看| 亚洲,欧美,日韩| www日本黄色视频网| 毛片一级片免费看久久久久| 亚洲欧美日韩高清在线视频| 亚洲人成网站在线播放欧美日韩| 99久久精品热视频| 亚洲四区av| 亚洲欧美精品综合久久99| 亚洲色图av天堂| 精品午夜福利在线看| 日韩 亚洲 欧美在线| 内射极品少妇av片p| 婷婷六月久久综合丁香| 51国产日韩欧美| 内射极品少妇av片p| 免费av毛片视频| 精品一区二区三区视频在线| 免费无遮挡裸体视频| 精品午夜福利在线看| 日韩一区二区三区影片| 在线观看免费视频日本深夜| 中国国产av一级| 男人狂女人下面高潮的视频| 寂寞人妻少妇视频99o| 欧美性猛交╳xxx乱大交人| 久久精品国产亚洲av天美| 寂寞人妻少妇视频99o| 国产精品精品国产色婷婷| 99热这里只有精品一区| 国产三级中文精品| 亚洲婷婷狠狠爱综合网| 男女那种视频在线观看| 国产三级中文精品| 免费大片18禁| 亚洲欧美日韩高清在线视频| 热99在线观看视频| av在线播放精品| 老女人水多毛片| 边亲边吃奶的免费视频| 成人国产麻豆网| 最近视频中文字幕2019在线8| 日本欧美国产在线视频| 亚洲精品456在线播放app| 午夜精品一区二区三区免费看| av专区在线播放| 亚洲经典国产精华液单| 神马国产精品三级电影在线观看| www日本黄色视频网| 长腿黑丝高跟| 国国产精品蜜臀av免费| 嫩草影院新地址| 久久国内精品自在自线图片| 亚洲最大成人手机在线| 中国美女看黄片| 亚洲国产精品成人久久小说 | 啦啦啦韩国在线观看视频| 欧美激情国产日韩精品一区| 国产午夜福利久久久久久| 2022亚洲国产成人精品| 黑人高潮一二区| 日本免费a在线| 波野结衣二区三区在线| 亚洲国产精品合色在线| 97人妻精品一区二区三区麻豆| 午夜老司机福利剧场| 99热这里只有是精品50| 搡女人真爽免费视频火全软件| 精品久久久久久久久av| 国产乱人偷精品视频| 亚洲欧美精品自产自拍| 搡老妇女老女人老熟妇| 日本一本二区三区精品| 最好的美女福利视频网| 熟女人妻精品中文字幕| 天天一区二区日本电影三级| 高清日韩中文字幕在线| 久久人人爽人人片av| 伊人久久精品亚洲午夜| 狂野欧美激情性xxxx在线观看| 麻豆乱淫一区二区| 亚洲经典国产精华液单| 69人妻影院| 色尼玛亚洲综合影院| 91午夜精品亚洲一区二区三区| 最近视频中文字幕2019在线8| 久久久国产成人精品二区| 欧美日韩一区二区视频在线观看视频在线 | 一个人看视频在线观看www免费| eeuss影院久久| 亚洲国产色片| 岛国毛片在线播放| 变态另类丝袜制服| 尤物成人国产欧美一区二区三区| 国内精品美女久久久久久| 亚洲欧美日韩卡通动漫| 精品国内亚洲2022精品成人| 精华霜和精华液先用哪个| 国产精品一区www在线观看| 亚洲精华国产精华液的使用体验 | 国产精品久久久久久精品电影小说 | 久久综合国产亚洲精品| 99热这里只有精品一区| 久久国产乱子免费精品| 禁无遮挡网站| 国产精品1区2区在线观看.| 99热只有精品国产| 精品久久久久久久久久久久久| 成人毛片a级毛片在线播放| 久久国产乱子免费精品| 国产精华一区二区三区| 伊人久久精品亚洲午夜| 99在线人妻在线中文字幕| 九九爱精品视频在线观看| 亚洲中文字幕一区二区三区有码在线看| 日本免费a在线| 尤物成人国产欧美一区二区三区| 亚洲精品亚洲一区二区| 国内精品宾馆在线| 国产成人午夜福利电影在线观看| av国产免费在线观看| 午夜精品在线福利| 久久精品国产亚洲av涩爱 | 国产精品久久久久久久久免| 亚洲国产高清在线一区二区三| 天美传媒精品一区二区| 联通29元200g的流量卡| 91麻豆精品激情在线观看国产| 国产美女午夜福利| 国内精品美女久久久久久| 一个人免费在线观看电影| 一本精品99久久精品77| 国产不卡一卡二| 好男人在线观看高清免费视频| 免费av不卡在线播放| 免费av毛片视频| 国产精品美女特级片免费视频播放器| 日本-黄色视频高清免费观看| 狂野欧美激情性xxxx在线观看| 99热这里只有是精品50| 日韩欧美三级三区| 午夜精品国产一区二区电影 | 成人无遮挡网站| 国产精品乱码一区二三区的特点| 久久久精品94久久精品| 国产精品久久电影中文字幕| 国产一区二区在线观看日韩| 久久久久网色| 日本-黄色视频高清免费观看| 日本爱情动作片www.在线观看| 午夜免费男女啪啪视频观看| 亚洲精品日韩av片在线观看| 成人性生交大片免费视频hd| 三级国产精品欧美在线观看| 亚洲精品影视一区二区三区av| 麻豆成人av视频| 亚洲自偷自拍三级| 免费观看的影片在线观看| 成人欧美大片| 欧美区成人在线视频| 久久亚洲精品不卡| 欧美成人a在线观看| 国产日韩欧美在线精品| 日韩人妻高清精品专区| 91麻豆精品激情在线观看国产| 卡戴珊不雅视频在线播放| 在线国产一区二区在线| 深夜精品福利| 国产v大片淫在线免费观看| 亚洲中文字幕一区二区三区有码在线看| 日韩成人av中文字幕在线观看| 亚洲国产精品国产精品| 99国产极品粉嫩在线观看| 好男人在线观看高清免费视频| 少妇的逼水好多| 99在线人妻在线中文字幕| 欧美极品一区二区三区四区| 婷婷色综合大香蕉| 一级黄片播放器| 人妻夜夜爽99麻豆av| 色播亚洲综合网| 欧美成人免费av一区二区三区| 国产极品天堂在线| 男人和女人高潮做爰伦理| 高清午夜精品一区二区三区 | 亚洲最大成人中文| 久久精品综合一区二区三区| 蜜桃亚洲精品一区二区三区| 久久精品人妻少妇| 一区二区三区免费毛片| 久久精品国产亚洲av涩爱 | 免费观看精品视频网站| 91aial.com中文字幕在线观看| 亚洲成a人片在线一区二区| 国产精品一区二区性色av| 少妇猛男粗大的猛烈进出视频 | 亚洲av免费在线观看| 亚洲精品乱码久久久v下载方式| 国产一区二区在线观看日韩| 欧美另类亚洲清纯唯美| 日韩中字成人| 成年av动漫网址| 精华霜和精华液先用哪个| 三级毛片av免费| 亚洲中文字幕日韩| 最后的刺客免费高清国语| 免费无遮挡裸体视频| 18禁在线播放成人免费| 日韩国内少妇激情av| 日韩成人av中文字幕在线观看| 成人永久免费在线观看视频| 91在线精品国自产拍蜜月| 亚洲在久久综合| 变态另类丝袜制服| 日本一本二区三区精品| 色综合亚洲欧美另类图片| 人妻系列 视频| 国产高潮美女av| 午夜爱爱视频在线播放| 看十八女毛片水多多多| 久久午夜福利片| 成年版毛片免费区| 最后的刺客免费高清国语| 人体艺术视频欧美日本| 欧美zozozo另类| 亚洲一区高清亚洲精品| 哪个播放器可以免费观看大片| 青春草国产在线视频 | 校园人妻丝袜中文字幕| a级一级毛片免费在线观看| 亚洲内射少妇av| 日韩欧美国产在线观看| 亚州av有码| 国产精品永久免费网站| 国产精品,欧美在线| 成熟少妇高潮喷水视频| 婷婷色综合大香蕉| 免费黄网站久久成人精品| 亚洲自拍偷在线| 成人鲁丝片一二三区免费| 日韩人妻高清精品专区| 人妻系列 视频| 欧美日韩一区二区视频在线观看视频在线 | 亚洲国产精品成人综合色| 日本熟妇午夜| 色综合站精品国产| 欧美人与善性xxx| av在线播放精品| 亚洲国产日韩欧美精品在线观看| 免费观看人在逋| 午夜免费男女啪啪视频观看| 校园人妻丝袜中文字幕| 亚洲丝袜综合中文字幕| 亚洲国产欧洲综合997久久,| 亚洲人成网站在线观看播放| 久久精品影院6| 麻豆一二三区av精品| 国产私拍福利视频在线观看| 啦啦啦观看免费观看视频高清| 天堂√8在线中文| 国产综合懂色| 亚洲国产欧美人成| 成人欧美大片| 在线观看美女被高潮喷水网站| 久久久久国产网址| 观看美女的网站| 成人高潮视频无遮挡免费网站| 噜噜噜噜噜久久久久久91| 久久亚洲国产成人精品v| 麻豆国产97在线/欧美| 国产日本99.免费观看| 欧美区成人在线视频| 亚洲av一区综合| 午夜免费男女啪啪视频观看| 国产精品日韩av在线免费观看| 晚上一个人看的免费电影| 日韩一本色道免费dvd| 日韩 亚洲 欧美在线| 人人妻人人澡欧美一区二区| 麻豆乱淫一区二区| 国产不卡一卡二| 热99re8久久精品国产| 日本黄色视频三级网站网址| 成人午夜高清在线视频| 九草在线视频观看| 亚洲欧美清纯卡通| 欧美日韩一区二区视频在线观看视频在线 | 91久久精品电影网| 国产真实乱freesex| 国产精品久久久久久亚洲av鲁大| 美女 人体艺术 gogo| 村上凉子中文字幕在线| a级毛色黄片| 26uuu在线亚洲综合色| 国产乱人偷精品视频| 国产亚洲91精品色在线| 色5月婷婷丁香| 日韩av在线大香蕉| 免费观看在线日韩| 精品一区二区三区视频在线| 人妻夜夜爽99麻豆av| 99热全是精品| 男女啪啪激烈高潮av片| 老司机福利观看| 婷婷色综合大香蕉| 又黄又爽又刺激的免费视频.| 精品一区二区免费观看| 麻豆av噜噜一区二区三区| 国产精品福利在线免费观看| 一卡2卡三卡四卡精品乱码亚洲| 精华霜和精华液先用哪个| 精品久久久久久久久久久久久| 97人妻精品一区二区三区麻豆| 人妻系列 视频| 美女脱内裤让男人舔精品视频 | a级毛色黄片| 亚洲精品亚洲一区二区| 中文字幕精品亚洲无线码一区| 18禁黄网站禁片免费观看直播| 国产黄色视频一区二区在线观看 | 国产国拍精品亚洲av在线观看| 国产成人a区在线观看| 国产黄a三级三级三级人| 99热这里只有是精品50| 国产av不卡久久| 欧美+日韩+精品| 一级二级三级毛片免费看| 人人妻人人澡人人爽人人夜夜 | 国产久久久一区二区三区| 亚州av有码| 九九爱精品视频在线观看| 国内揄拍国产精品人妻在线| 国产探花在线观看一区二区| 精品久久国产蜜桃| 国产探花极品一区二区| 黄色视频,在线免费观看| 黄色日韩在线| 久99久视频精品免费| 国产乱人视频| 欧美成人免费av一区二区三区| 亚洲成人精品中文字幕电影| 成熟少妇高潮喷水视频| 国产午夜精品久久久久久一区二区三区| 亚洲美女搞黄在线观看| 久久久久久久久久黄片| 免费观看精品视频网站| 亚洲精品国产成人久久av| 国产日韩欧美在线精品| 免费电影在线观看免费观看| 中文字幕免费在线视频6| 国产三级在线视频| 成人无遮挡网站| 尾随美女入室| 国产成年人精品一区二区| 亚洲精品456在线播放app| 天堂中文最新版在线下载 | 国产片特级美女逼逼视频| 国产午夜精品论理片| 欧美精品国产亚洲| 欧美色欧美亚洲另类二区| 精品熟女少妇av免费看| 精品久久久久久久末码| 国产精品人妻久久久久久| 一级毛片电影观看 | 国产三级中文精品| 麻豆成人午夜福利视频| 日韩,欧美,国产一区二区三区 | 黄色视频,在线免费观看| 晚上一个人看的免费电影| 日本免费一区二区三区高清不卡| 久久精品国产亚洲网站| 精品一区二区免费观看| 精品久久久久久久久久免费视频| 乱人视频在线观看| 麻豆成人av视频| 日本一二三区视频观看| 不卡视频在线观看欧美| 在现免费观看毛片| 高清午夜精品一区二区三区 | 悠悠久久av| 美女高潮的动态| 99热只有精品国产| 免费人成在线观看视频色| av视频在线观看入口| 久久久久久久久久久免费av| 简卡轻食公司| 国产高清激情床上av| 亚洲天堂国产精品一区在线| 国产精品精品国产色婷婷| 日韩,欧美,国产一区二区三区 | 日本在线视频免费播放| 国产蜜桃级精品一区二区三区| 中文字幕av在线有码专区| 一区二区三区免费毛片| 三级国产精品欧美在线观看| 成熟少妇高潮喷水视频| 日韩欧美一区二区三区在线观看| 在线播放无遮挡| 亚洲欧美清纯卡通| 久久久久久九九精品二区国产| 亚洲久久久久久中文字幕| 国产精品免费一区二区三区在线| 欧美+日韩+精品| 亚洲av免费高清在线观看| 又粗又爽又猛毛片免费看| 欧美高清性xxxxhd video| 国产精品免费一区二区三区在线| 欧美+日韩+精品| 两个人视频免费观看高清| 身体一侧抽搐| 精品99又大又爽又粗少妇毛片| 国产蜜桃级精品一区二区三区| 国产亚洲精品av在线| 日本爱情动作片www.在线观看| 一区二区三区高清视频在线| 欧洲精品卡2卡3卡4卡5卡区| 99热网站在线观看| 久久久久久久久久成人| 搡老妇女老女人老熟妇| 成人特级黄色片久久久久久久| 夜夜夜夜夜久久久久| 精品熟女少妇av免费看| 热99re8久久精品国产| 我的女老师完整版在线观看| 久久精品国产亚洲av涩爱 | 亚洲av中文av极速乱| 国产亚洲av片在线观看秒播厂 | 91狼人影院| 狠狠狠狠99中文字幕| 日韩av不卡免费在线播放| 乱码一卡2卡4卡精品| 色哟哟·www| 国产高清不卡午夜福利| 国产日本99.免费观看| 26uuu在线亚洲综合色| 18+在线观看网站| 免费观看的影片在线观看| 日韩av不卡免费在线播放| 最近最新中文字幕大全电影3| 91在线精品国自产拍蜜月| 欧美日韩综合久久久久久|