• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    片上互連網(wǎng)絡(luò)的功耗特征分析與優(yōu)化*

    2020-07-27 10:41:42孫曉樂錢亞龍齊新新張云放
    計算機(jī)工程與科學(xué) 2020年7期
    關(guān)鍵詞:功耗應(yīng)用程序處理器

    孫曉樂,錢亞龍,齊新新,張云放,陳 娟,袁 遠(yuǎn),董 勇

    (國防科技大學(xué)計算機(jī)學(xué)院,湖南 長沙 410073)

    1 引言

    隨著半導(dǎo)體工藝技術(shù)的發(fā)展與進(jìn)步,單芯片晶體管的數(shù)量也在不斷地增長,帶來了互連延遲增大、存儲帶寬受限、功耗密度極限等問題。計算機(jī)體系結(jié)構(gòu)研究者不斷地采取包括提高頻率、指令并行等技術(shù)來提高處理器性能,但這些不可避免地帶來了功耗的急劇上升。與此同時,處理器性能提升的減緩,導(dǎo)致了處理器體系結(jié)構(gòu)的改變,研究人員轉(zhuǎn)向設(shè)計多核處理器。盡管多核乃至眾核處理器的出現(xiàn)極大提高了處理器的性能,但還是面臨著延遲較大、可擴(kuò)展性差、帶寬較低和功耗較高等方面的挑戰(zhàn)[1]。片上互連網(wǎng)絡(luò)NoC(Network-on-Chip)的出現(xiàn)很好地避免了這些缺陷。片上互連網(wǎng)絡(luò)將傳統(tǒng)網(wǎng)絡(luò)中報文交換的思想引入芯片內(nèi)部的通信機(jī)制里,迅速成為眾核處理器片上通信設(shè)計的標(biāo)準(zhǔn)[2]。

    NoC設(shè)計中最關(guān)鍵的問題之一是應(yīng)用處理的能耗效率。正如文獻(xiàn)[3]中所指出的,NoC能耗占芯片總能耗的絕大部分。很多學(xué)者從硬件設(shè)計的角度減少應(yīng)用的通信能耗。Mineo等[4]提出運(yùn)行時調(diào)整路由器鏈路電壓,從而降低信號在交叉桿和鏈路中的電壓波動。Charles等[5]研究了應(yīng)用在不同內(nèi)存模式、處理器核親和性模式配置下,目錄與內(nèi)存控制器數(shù)據(jù)傳輸?shù)臒狳c(diǎn)問題,為不同應(yīng)用的運(yùn)行提供了相應(yīng)的配置。Yang等[6]基于 STT-RAM(Spin-Torque Transfer Magnetic RAM)的路由器,通過計算爭用的flit來減少通信能耗。

    這些方法都依賴于特定的硬件條件,眾多研究人員則從軟件優(yōu)化的角度,在應(yīng)用映射時提高其局部性,減少通信能耗。Zhu等[7]通過多應(yīng)用的啟發(fā)式映射,在性能感知的情況下平衡最小的片上數(shù)據(jù)包延遲,減少能耗。Pang等[8]提出了一種分支界定算法,將IP核映射到基于區(qū)塊架構(gòu)的NoC,同時滿足帶寬約束并最小化總通信能耗。Reza等[9]針對多核處理器上的深度神經(jīng)網(wǎng)絡(luò)應(yīng)用,提出了一種高效的集中式的NoC架構(gòu)和一種負(fù)載均衡的映射解決方案來加速深度神經(jīng)網(wǎng)絡(luò),減少通信開銷。

    盡管眾多映射方法的出發(fā)點(diǎn)有所差別,但是保證了應(yīng)用在片上的通信距離盡可能小,以此來保證較低的通信開銷。為此本文針對一種典型的凸區(qū)域增量映射方法INC(INCremental mapping)[10],分析改進(jìn)其區(qū)域選擇的相關(guān)參數(shù)并提出了新的映射算法。通過實(shí)驗(yàn)表明,新的算法相較于INC減少了12.10%的通信功耗并且?guī)砹?1.23%的通信延遲優(yōu)化。

    本文第2節(jié)介紹了典型NoC案例包括FT-2000和KNL,以及任務(wù)映射問題描述;第3節(jié)詳細(xì)闡述了改進(jìn)的參數(shù)以及新的映射算法;第4節(jié)給出了改進(jìn)算法(our)在NIRGAM(NoC Interconnect Routing and Application Modeling)[11]模擬器中的實(shí)驗(yàn)結(jié)果,并且與常見的2種算法以及INC進(jìn)行了比較;第5節(jié)為本文總結(jié),并指出了進(jìn)一步的工作方向。

    2 NoC典型案例及任務(wù)映射問題描述

    2.1 NoC典型案例

    目前,處理器已經(jīng)進(jìn)入多核時代。一般核數(shù)小于或等于8個的處理器被稱為多核處理器,具有更多核數(shù)的處理器被稱為眾核處理器。目前關(guān)于片上互連網(wǎng)絡(luò)的理論研究部分已經(jīng)投入工業(yè)生產(chǎn)中。

    2.1.1 飛騰(PHYTIUM)FT-2000

    FT-2000處理器芯片集成64個自主開發(fā)的基于ARMv8處理器核心,兼容處理器內(nèi)核FTC662,采用片上并行系統(tǒng)(PSoC)體系結(jié)構(gòu)。通過集成高效處理器核心、基于數(shù)據(jù)親和的大規(guī)模性存儲架構(gòu)、層次式二維Mesh互連網(wǎng)絡(luò),優(yōu)化存儲訪問延時,提供業(yè)界領(lǐng)先的計算性能、訪存帶寬和IO擴(kuò)展能力。

    2.1.2 Intel Knight Landing

    KNL(KNight Landing) 是Intel首款專門針對高度并行工作負(fù)載而設(shè)計的可獨(dú)立自啟動的主處理器,并首次實(shí)現(xiàn)了內(nèi)存與高速互連技術(shù)的集成。KNL單顆芯片最大支持72個CPU物理核心,16 GB片上高速內(nèi)存,384 GB DDR4系統(tǒng)內(nèi)存,單CPU的雙精度浮點(diǎn)峰值超過3 TFlops,可以為高并行負(fù)載應(yīng)用提供強(qiáng)大的性能支持。Intel在Knight Landing中引入了新的片內(nèi)總線:Mesh取代了雙環(huán)(Dual Ring),它是一種2D的Mesh網(wǎng)絡(luò)。

    2.2 任務(wù)映射問題描述

    映射到片上互連網(wǎng)絡(luò)的所有應(yīng)用程序都由程序任務(wù)圖描述。如圖1所示是一個程序的應(yīng)用通信圖ACG(Application Communication Graph)。一個ACG圖包括通信節(jié)點(diǎn)及其電壓水平、通信邊及權(quán)重,ACG圖中的一個通信節(jié)點(diǎn)代表實(shí)際應(yīng)用程序的一個進(jìn)程或一個子任務(wù)。該ACG圖映射到如圖2所示的4×4共16個tile的片上互連網(wǎng)絡(luò)結(jié)構(gòu)上。圖2中,有黑色圓圈的矩形代表該tile已經(jīng)被映射了應(yīng)用程序,不可再被其他應(yīng)用程序映射。故tile 0已經(jīng)有了對應(yīng)的應(yīng)用程序,不能重復(fù)被映射?;疑匦螀^(qū)域代表這個tile是高電平,其余區(qū)域?qū)?yīng)低電平。應(yīng)用程序中的節(jié)點(diǎn)v4和v6必須映射到高電平tile上,而tile 5~tile 7是高電平,其余都是低電平。節(jié)點(diǎn)之間按照任務(wù)圖進(jìn)行通信。

    Figure 1 ACG of a program[10]圖1 一個程序的應(yīng)用通信圖[10]

    Figure 2 Structure of NoC圖2 片上互連網(wǎng)絡(luò)結(jié)構(gòu)圖

    一個新的應(yīng)用(如圖1所示)到達(dá)系統(tǒng),并映射到片上互連網(wǎng)絡(luò)(如圖2所示),使得功耗最優(yōu)化的過程可以抽象為:

    給定條件:當(dāng)前系統(tǒng)的狀態(tài)(包括處理單元PE(Processing Elements)的使用狀態(tài)以及電壓水平),新應(yīng)用的ACG圖。

    目標(biāo):找到一個區(qū)域R以及一個映射map(),使得對于任意節(jié)點(diǎn)vi∈V,map(vi)→PEi,使得:

    最小化。

    其中,V是ACG圖中的節(jié)點(diǎn)集合,ei,j是節(jié)點(diǎn)vi到vj的邊,w(ei,j)是邊ei,j的權(quán)重,MD是映射到片上互連網(wǎng)絡(luò)節(jié)點(diǎn)的曼哈頓距離。W是加權(quán)后的通信距離,根據(jù)Chou等[10]的論文,片上互連網(wǎng)絡(luò)的通信能耗和通信距離成正比。因此,能耗問題可轉(zhuǎn)化為曼哈頓距離問題。

    定義1L(R):由N個PE組成的一個區(qū)域R中任意2個PE之間曼哈頓距離之和。

    解決的問題:對于一個已經(jīng)映射過應(yīng)用的系統(tǒng),共有M個PE可用,假設(shè)新來一個包含N個節(jié)點(diǎn)的應(yīng)用(N

    Figure 3 Minimization problem:Select a region,such that the sum of the totalMDbetween any pair of tiles inside regionsR1andR-R1is minimized圖3 L(R1)+L(R-R1)最小化問題

    L(R1)最小化使得需要映射的應(yīng)用節(jié)點(diǎn)間的通信代價最小化,L(R1)+L(R-R1)最小化是從整個系統(tǒng)出發(fā),使得新應(yīng)用映射結(jié)束后,剩余PE離散化的程度小,使得整體通信代價小。因此,本文采用這2個指標(biāo)來比較改進(jìn)映射算法和未改進(jìn)算法的優(yōu)劣。

    3 改進(jìn)區(qū)域選擇算法并提出新的映射算法

    由于目標(biāo)應(yīng)用程序的到達(dá)順序不是可預(yù)測或已知的,在多處理器片上系統(tǒng)(MPSoC)中實(shí)現(xiàn)有效的運(yùn)行時映射是一項具有挑戰(zhàn)性的任務(wù)。Chou等[10]提出了一種有效的啟發(fā)式映射算法(包括區(qū)域選擇和節(jié)點(diǎn)分配),用來解決具有多個電壓電平的NoC的能量和性能感知的增量映射問題。該算法是一個2步算法,分為近凸區(qū)域選擇算法和節(jié)點(diǎn)分配算法。所提出的算法允許以最小的處理器間開銷將新的應(yīng)用添加到系統(tǒng)。與使用任意映射方案相比,該算法極大地降低了能耗。

    通常,如果區(qū)域包含連接其中任何一對點(diǎn)的所有線段,則該區(qū)域是凸的。近凸區(qū)域選擇算法通過計算待選擇PE的分散因子與離散因子的和,來逐步確定對應(yīng)片上互連網(wǎng)絡(luò)的映射區(qū)域。實(shí)際上,發(fā)現(xiàn)選擇的區(qū)域近似凸形。

    在選擇近凸區(qū)域之后,將輸入應(yīng)用的節(jié)點(diǎn)分配給具有所選區(qū)域中的特定電壓電平的PE,同時最小化處理器間通信。使用其總通信量的非遞增順序?qū)⒐?jié)點(diǎn)分類為有序集,即節(jié)點(diǎn)具有的通信量越大,發(fā)現(xiàn)或完成得越早。按照該有序集對應(yīng)用的節(jié)點(diǎn)一一分配,每分配一個,計算可用區(qū)域內(nèi)該節(jié)點(diǎn)對應(yīng)每一個位置的通信距離,選擇距離最小的位置。

    3.1 區(qū)域選擇算法

    Chou的區(qū)域選擇算法通過計算待選擇PE的分散因子與離散因子的和,來逐步確定對應(yīng)片上互連網(wǎng)絡(luò)的映射區(qū)域。這2個因子是整個區(qū)域選擇算法中最核心的部分。

    3.1.1 分散因子的改進(jìn)

    Chou對片上互連網(wǎng)絡(luò)的PE的分散因子定義為D(PE)=C-該P(yáng)E使用鄰居的數(shù)量,其中C是常數(shù),其選擇是根據(jù)經(jīng)驗(yàn),對于角落PE,C= 3;對于其他PE(包括邊界),C= 4。對于區(qū)域選擇而言,具有較小D(PE)值的PE表示該P(yáng)E被包括在當(dāng)前區(qū)域中的可能性較高。實(shí)際上,其大多數(shù)鄰居被使用的PE(即具有小D(PE)值的PE)很可能后來被隔離,所以將該P(yáng)E添加到區(qū)域中有助于降低其分散概率。

    但是,經(jīng)過分析,我們認(rèn)為分散因子的定義有如下問題,首先常數(shù)C的選取沒有充分的理由,是靠經(jīng)驗(yàn)得出的,事實(shí)上邊界PE和中間PE的鄰居數(shù)分別是3和4,情況有所區(qū)別,不能統(tǒng)一定義為C=4;其次最優(yōu)化的區(qū)域選擇考慮的是全局的最優(yōu)化,不但要使得當(dāng)前應(yīng)用映射區(qū)域的通信距離最優(yōu)化,還要使得余下的區(qū)域通信距離盡可能小。Chou提出的分散因子對于PE只考慮了與其鄰居的使用情況,未能衡量全局通信距離。

    分散因子D實(shí)際上是衡量一個PE可使用的鄰居數(shù)量的指標(biāo),當(dāng)前可使用鄰居數(shù)量越少,其被選入到區(qū)域中的可能性越大。

    為此,我們改進(jìn)Chou關(guān)于分散因子的定義。PE的分散因子D定義為:D(PE)=該P(yáng)E能夠使用的鄰居數(shù)量和鄰居的曼哈頓路徑覆蓋的PE。如圖4所示,PE5的鄰居節(jié)點(diǎn)包括PE1、PE4、PE6、PE9,按照XY路由規(guī)則,從PE4到PE1需要經(jīng)過PE5,圖中白色箭頭指示方向;而從PE1到PE4需要經(jīng)過PE0,圖中黑色箭頭指示方向,PE0和PE5就是鄰居PE1和PE4的曼哈頓路徑覆蓋。因此對于未分配的Mesh結(jié)構(gòu)而言,角落PE分散因子為3個PE(2個鄰居+1個覆蓋)、邊界PE分散因子為5個PE(3個鄰居+2個覆蓋)、中間PE分散因子為8個PE(4個鄰居+4個覆蓋)。

    Figure 4 Neighbor nodes and Manhattan overlay nodes圖4 鄰居節(jié)點(diǎn)及曼哈頓覆蓋節(jié)點(diǎn)示意圖

    圖5所示是對一個已經(jīng)映射應(yīng)用的系統(tǒng)通過啟發(fā)因子選擇4個PE的結(jié)果。黑色圓表示該P(yáng)E已經(jīng)被使用,白色三角形是新來應(yīng)用分配的區(qū)域。圖5a只考慮鄰居,圖5b考慮鄰居以及鄰居的曼哈頓覆蓋,可以明顯看出,2種離散因子選擇出的L(R1)是相同的,但是圖5b的L(R1)+L(R-R1)小于圖5a的,剩余區(qū)域更加緊湊,有利于后續(xù)應(yīng)用的映射,并降低整個系統(tǒng)通信能耗。

    倒是在一邊旁觀者清的葉總有些好奇,便出聲詢問王祥整個事件的來龍去脈。王祥開始還遮遮掩掩,不過當(dāng)著兩位老板的面也編不出什么高明的謊話,便把事情經(jīng)過避輕就重地給兩位老總說了一遍。從他們從老家偶得玉石到城里擺攤巧遇老道,最后一起說服胖子成交,再到如何和老道分道揚(yáng)鑣,王祥都如實(shí)講了出來。最后,王祥還向葉、錢兩位老總展示了自己留作紀(jì)念的玉墜,證明確有其事。

    Figure 5 Mapping comparasion圖5 映射對比圖

    3.1.2 離心因子的改進(jìn)

    Chou對片上互連網(wǎng)絡(luò)的PE的離心因子定義為:C(PE)為任何PE與當(dāng)前區(qū)域的邊界之間的曼哈頓距離。

    對于區(qū)域選擇而言,離心因子較小的PE被包括在當(dāng)前區(qū)域中的可能性較高。實(shí)際上,由于區(qū)域中的每個PE應(yīng)該都接近該區(qū)域的邊界,因此具有較小離心因子的PE更適合于添加到區(qū)域中。

    但是,對于離心因子若只考慮PE到當(dāng)前區(qū)域的邊界,選擇的PE雖然離當(dāng)前區(qū)域的距離較近,但是對于選擇后的區(qū)域而言,并不能保證新加入的PE使得整體的通信距離最優(yōu)。

    為此我們改進(jìn)Chou關(guān)于離心因子的定義。PE離心因子C(PE)被定義為任何PE與當(dāng)前區(qū)域邊界PE的最大曼哈頓距離。離心因子反映的是PE到當(dāng)前區(qū)域的位置關(guān)系,以最遠(yuǎn)距離來衡量,在保證相鄰的基礎(chǔ)上,使得區(qū)域平衡地進(jìn)行擴(kuò)張,同時也保證新加入的PE到最遠(yuǎn)邊界的距離不會太大。

    圖6用一個簡單的示例說明了改進(jìn)的離心因子和分散因子的效果。如圖6所示,黑色圓代表已經(jīng)使用的PE,白色三角形為新應(yīng)用分配的區(qū)域,假設(shè)N=10,在當(dāng)前區(qū)域基礎(chǔ)上增加1個PE。在Chou的算法中,由于PE1~PE5都有1個鄰居被使用且與當(dāng)前區(qū)域相鄰,D(PE)=4-1=3,C(PE)=1,都是相同的,算法比較的啟發(fā)因子相同,因此會隨機(jī)選擇,甚至?xí)葱蛱栠x擇。若使用改進(jìn)后的算法,待選PE的啟發(fā)因子,以及加入到當(dāng)前區(qū)域后的L(R1)和L(R-R1)計算結(jié)果如表1所示。

    Figure 6 Mapping example(choosing one PE to current region by differentDandC)圖6 映射示例(考慮下一步選入?yún)^(qū)域的PE)

    表1 改進(jìn)算法待選節(jié)點(diǎn)的啟發(fā)因子及新區(qū)域的L(R1)和L(R1)+L(R-R1)比較

    如果只考慮離心因子C,C(PE3)和C(PE4)最小,其L(R1)是最小的,加上分散因子D,D(PE5)+C(PE5)是最小的,加入PE5后區(qū)域L(R1)+L(R-R1)最小。通過這個例子可以看出,改進(jìn)算法中的離心因子C側(cè)重于新加PE使得新區(qū)域內(nèi)部通信距離最小化,分散因子D側(cè)重于全局,保證剩余區(qū)域是集中的,方便后續(xù)應(yīng)用映射,提升全局性能。

    3.1.3 改進(jìn)算法效果

    我們對已經(jīng)映射過應(yīng)用的區(qū)域進(jìn)行討論,考慮其在整個系統(tǒng)中的位置分別為:聚集在某一角落(gather in the corner)、聚集在中心位置(gather in the center)以及在系統(tǒng)中碎片化分布(fragmentation distribution)。分別采用Chou和改進(jìn)后的區(qū)域選擇算法,比較L(R1)和L(R1)+L(R-R1) 2項指標(biāo)。

    考慮到在實(shí)際應(yīng)用中會分配一個PE作為GM(Global Manager),其作用是運(yùn)行區(qū)域選擇算法,為新到的應(yīng)用選擇資源,并在選定區(qū)域運(yùn)行映射算法。如圖7所示,在7×7的2D Mesh網(wǎng)絡(luò)中,第1個PE作為GM,白色圓表示已經(jīng)使用的PE。我們在7×7的2D Mesh網(wǎng)絡(luò)中考慮了多種情況,圖7a假定4個被占用的PE聚集在左上角;圖7b假定5個被占用的PE聚集在中心位置;圖7c和圖7d假定8個被占用的PE碎片化分布,利用隨機(jī)數(shù)生成工具生成區(qū)間在1~48共8個不重復(fù)的隨機(jī)數(shù),作為被占用的PE號碼(片上互連網(wǎng)絡(luò)的PE編號按照從左到右、自上而下的順序?qū)?yīng)0號到48號),得到圖7c和圖7d 2種情況。

    Figure 7 Four different system mappings圖7 4種不同的系統(tǒng)映射情況

    考慮到實(shí)際應(yīng)用通信節(jié)點(diǎn)規(guī)模的不同,對于上述4種PE使用情況的系統(tǒng),對于新到應(yīng)用考慮其節(jié)點(diǎn)數(shù)目分別從N=3開始到N達(dá)到最大可用PE數(shù)目,對于corner和centerN取3~42各40種情況,對于random1和random2N各取3~39各37種情況,所以實(shí)驗(yàn)共考慮154種情況,分別采用Chou和改進(jìn)后的區(qū)域選擇算法,比較L(R1)和L(R1)+L(R-R1) 2項指標(biāo)。

    圖8和圖9分別是L(R1)和L(R1)+L(R-R1)的比較結(jié)果,我們使用改進(jìn)算法比Chou區(qū)域選擇算法減少通信距離的百分比為衡量指標(biāo),也就是對L(R1)和L(R1)+L(R-R1)降低的百分比。對提升結(jié)果進(jìn)行排序,位于0以上部分表示改進(jìn)算法提升性能,位于0以下部分表示改進(jìn)算法不能提升性能。

    從L(R1)的結(jié)果中可以看出,改進(jìn)算法對于corner和center 2種情況性能改善比較好,分別獲得4.89%和2.83%的性能提升,對于random1和random2 2種情況效果并不顯著,4種系統(tǒng)情況,154個實(shí)驗(yàn)平均可以獲得1.45%的性能提升。從的結(jié)果上看出,幾乎柱狀圖的大部分位于0以上,corner、center、random1、random2分別獲得6.29%,2.03%,0.20%,1.47%的性能提升,平均亦獲得了2.5%的性能提升。尤其對于random2而言,雖然對于L(R1)的性能提升并不明顯,但是考慮到系統(tǒng)整體,其L(R1)+L(R-R1)提升顯著。從4種系統(tǒng)實(shí)驗(yàn)結(jié)果的比較可以看出,改進(jìn)算法更適合corner和center 2種情況,同時在碎片化分布上并不比Chou算法的差,甚至在L(R1)+L(R-R1)上要優(yōu)于Chou算法的。

    Figure 8 L(R1) performance improvement of improved algorithm in different initial systems圖8 不同初始系統(tǒng)下改進(jìn)算法L(R1)性能提升圖

    Figure 9 L(R1)+L(R-R1) performance improvement ofimproved algorithm in different initial systems圖9 不同初始系統(tǒng)下改進(jìn)算法L(R1)+L(R-R1)性能提升圖

    實(shí)驗(yàn)說明改進(jìn)的算法與Chou算法相比,在保證當(dāng)前應(yīng)用映射區(qū)域通信能耗較小的基礎(chǔ)上,更加注重在系統(tǒng)級減少通信能耗,為后續(xù)程序提供規(guī)整化的可使用PE,適合于運(yùn)行時動態(tài)地映射應(yīng)用。

    3.2 映射算法

    應(yīng)用程序的區(qū)域選擇完成后,我們繼續(xù)將傳入應(yīng)用程序的節(jié)點(diǎn)分配到所選區(qū)域具有特定電壓水平的PE上,同時最小化處理器間通信。

    為了跟蹤節(jié)點(diǎn)分配過程,Chou算法將每個節(jié)點(diǎn)涂成白色、灰色或黑色?;疑?jié)點(diǎn)表示它對應(yīng)一些暫定的PE位置,其精確位置將在以后確定。相反,一個黑色節(jié)點(diǎn)表示它已經(jīng)映射到某個PE上,并且這個映射將不再改變。所有的節(jié)點(diǎn)一開始都是白色的,然后可能變成灰色,然后變成黑色,或者直接變成黑色。將黑節(jié)點(diǎn)映射到某一PE之后,該P(yáng)E被設(shè)置為已占用。

    Chou算法的節(jié)點(diǎn)分配核心思想是:首先使用其總通信量的非遞增順序?qū)⒐?jié)點(diǎn)分類為有序集,即節(jié)點(diǎn)具有的通信量越大,發(fā)現(xiàn)或完成得越早,按照該有序集對應(yīng)用的節(jié)點(diǎn)一一分配,每分配一個,計算可用區(qū)域內(nèi)該節(jié)點(diǎn)對應(yīng)每一個位置的通信距離,選擇最小的位置。相對于順序映射或者隨機(jī)映射而言,效果明顯,可以有效縮短通信距離,降低通信能耗,從而可以實(shí)現(xiàn)節(jié)省能耗的目的。

    但是,經(jīng)過分析我們認(rèn)為算法在以下方面欠缺考慮:(1)在節(jié)點(diǎn)映射時,只考慮了總通信量以及其鄰居節(jié)點(diǎn)是否映射。很可能節(jié)點(diǎn)的鄰居有很多,但是它們之間的通信量是不同的,這一點(diǎn)Chou有所忽略。對于某個節(jié)點(diǎn)而言,在映射該節(jié)點(diǎn)時,與其通信量最大的鄰居節(jié)點(diǎn)未完成映射,根據(jù)算法啟發(fā),反而會映射到通信量較少的鄰居旁邊,可能會導(dǎo)致通信量最大的鄰居節(jié)點(diǎn)通信距離反而相對變大。(2)該算法只有按照通信量從大到小的方向逐一進(jìn)行映射,然而對于一些區(qū)域和程序而言,通信量較小的節(jié)點(diǎn)更容易精確映射。(3)算法中為每個節(jié)點(diǎn)定義了2個狀態(tài)DISCOVER和FINISH,在最壞條件下每個節(jié)點(diǎn)需要遍歷2遍,首先DISCOVER,選出可用的PE,并將節(jié)點(diǎn)標(biāo)灰暫定在這些可用PE位置上,再等鄰居節(jié)點(diǎn)映射DISCOVER,進(jìn)入FINISH,確定精確映射PE位置,并將節(jié)點(diǎn)標(biāo)成黑色。

    為此我們提出如下映射算法:

    根據(jù)ACG圖計算每個節(jié)點(diǎn)t的相鄰邊數(shù)作為衡量該節(jié)點(diǎn)通信量的指標(biāo),記做comm(t)。通過對每個節(jié)點(diǎn)的comm(t)排序得到不同電壓組合的節(jié)點(diǎn)序列,共k組,分別記做Vi,i=1,…,k。

    (1)計算選中區(qū)域中每個PE的D(PE)。

    (2)從V1開始,每次選擇該組中comm(t)最小和最大的節(jié)點(diǎn),分別記做S和B。

    (3)雖然每次選2個節(jié)點(diǎn),但是2個節(jié)點(diǎn)不是同時進(jìn)行映射,此時對這2個節(jié)點(diǎn)需要考慮如下情形:

    ①如果B節(jié)點(diǎn)權(quán)重較大的鄰居已經(jīng)映射,則對其優(yōu)先映射;如果該鄰居沒有映射,優(yōu)先S節(jié)點(diǎn)。

    ②對于S節(jié)點(diǎn)只需要尋找D最小的PE進(jìn)行映射。

    ③對于B節(jié)點(diǎn),如果鄰居節(jié)點(diǎn)已經(jīng)映射,那么該節(jié)點(diǎn)映射到靠近鄰居節(jié)點(diǎn)且D(PE)最大的PE上;如果有多個鄰居節(jié)點(diǎn)映射完畢,且其D(PE)相等,此時應(yīng)該考慮該節(jié)點(diǎn)與鄰居節(jié)點(diǎn)的通信量comm,選擇接近c(diǎn)omm最大的鄰居PE進(jìn)行映射;如果鄰居節(jié)點(diǎn)都沒有被映射,那么該節(jié)點(diǎn)選擇D(PE)最大的PE。

    ④S節(jié)點(diǎn)或B節(jié)點(diǎn)映射完成都需要更新未選擇的D(PE)。

    (4)V1遍歷結(jié)束,對Vi遍歷,直到k組序列均映射完成,算法結(jié)束。

    該算法對通信量不同的節(jié)點(diǎn)的映射方法是不同的,對于通信量較小的節(jié)點(diǎn)只需要找具有最小的D的PE進(jìn)行映射,對于通信量較大的節(jié)點(diǎn)優(yōu)先映射到權(quán)重較大的鄰居旁邊。這樣可以把較小通信量節(jié)點(diǎn)定位到相對孤立的PE位置,使得通信量大的節(jié)點(diǎn)之間局部通信距離最優(yōu)。

    Chou算法的節(jié)點(diǎn)分配核心思想是:首先使用其總通信量的非遞增順序?qū)⒐?jié)點(diǎn)分類為有序集,即節(jié)點(diǎn)具有的通信量越大,發(fā)現(xiàn)或完成得越早。在此基礎(chǔ)上,改進(jìn)算法把邏輯上通信量大的節(jié)點(diǎn)與其權(quán)重較大的鄰居在物理上映射到相鄰的PE上,并通過定位通信量較小的節(jié)點(diǎn)到孤立的PE上從而增加權(quán)重較大的鄰居出現(xiàn)的概率。

    下面用一個簡單的例子逐步描述該算法,需要注意的是在映射過程中使用的改進(jìn)算法分散因子D,并且對D的計算限定在選定的區(qū)域內(nèi)。

    片上互連網(wǎng)絡(luò)如圖10所示,其中括號中的數(shù)字代表PE編號,灰色網(wǎng)格表示高電位的PE,網(wǎng)格中的黑色圓圈表示應(yīng)用選擇的區(qū)域,映射過程為(0)→(1)→(2)→(3)→(4)。

    Figure 10 Mapping process圖10 映射過程示意圖

    根據(jù)ACG圖對節(jié)點(diǎn)的通信量由大到小進(jìn)行排序,獲得節(jié)點(diǎn)有序集為:{v5,v1,v6,v8,v9,v4,v2,v3},根據(jù)電壓水平可以將有序集分成2組,VH={v6,v4},VL={v5,v1,v7,v8,v9,v2,v3}。

    (1)首先從VH開始映射,選擇通信量最小節(jié)點(diǎn)S=v4,最大節(jié)點(diǎn)B=v6,由于v6權(quán)重較大的鄰居節(jié)點(diǎn)未映射,故先對v6進(jìn)行映射,片上的2個高電位D(PE6)=4,D(PE7)=5,因此v4映射到PE6上,接著對v6進(jìn)行映射,高電位只有PE7,故v6映射到PE7,結(jié)果如圖10b所示。

    (2)VH映射結(jié)束,對VL進(jìn)行映射,選擇通信量最小節(jié)點(diǎn)S=v3,最大節(jié)點(diǎn)B=v5,對于v5,權(quán)重最大鄰居v6映射完成,故優(yōu)先,在片上與PE7相鄰的有PE2和PE8,D(PE2)=3,D(PE8)=4,因此v5映射到PE8上,v3直接找D最小的PE,故映射到PE5,結(jié)果如圖10c所示。

    (3)繼續(xù)對VL進(jìn)行映射,選擇通信量最小節(jié)點(diǎn)S=v2,最大節(jié)點(diǎn)B=v1,由于v1權(quán)重最大的鄰居節(jié)點(diǎn)未映射,故先對v2進(jìn)行映射,直接選取D最小的PE1進(jìn)行映射,接著對v1進(jìn)行映射,其權(quán)重最大的鄰居節(jié)點(diǎn)v2剛好映射完,故v2映射到片上與PE1相鄰的有PE2上,結(jié)果如圖10d所示。

    (4)以同樣的方法映射v7、v9后,分別對應(yīng)片上的PE3和PE4,剩下節(jié)點(diǎn)v8自動映射到剩下的PE9上,結(jié)果如圖10e所示。VL映射結(jié)束后所有電壓水平的序列均已映射完成,過程結(jié)束。

    3.3 算法復(fù)雜性分析

    本文對區(qū)域選擇算法的改進(jìn)只針對于分散因子和離心因子,并沒有改變算法的步驟,這就意味著改進(jìn)區(qū)域選擇算法的時間復(fù)雜度為O(|V| log |V| )[10],其中|V|為應(yīng)用ACG圖的節(jié)點(diǎn)數(shù)。對于選定區(qū)域的映射算法而言,|V|個節(jié)點(diǎn)都需要遍歷一次,在每次遍歷節(jié)點(diǎn)時需要檢查該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的映射情況,最多遍歷E條邊,時間復(fù)雜度為O(|V|E )。因此,整個映射算法的時間復(fù)雜度為O(|V| log |V|+ |V|E )。

    4 基于NIRGAM的NoC功耗優(yōu)化方法對比實(shí)驗(yàn)

    本節(jié)將利用TGFF[13]工具隨機(jī)產(chǎn)生的應(yīng)用映射到8×8共64個tile的片上互連網(wǎng)絡(luò)結(jié)構(gòu)上。其中tile 0代表GM。本節(jié)比較的映射算法包括隨機(jī)映射(FT2000+在不綁定核的情況下根據(jù)任務(wù)數(shù)隨機(jī)映射到核上)、順序映射(按照tile編號的順序進(jìn)行任務(wù)映射)、INC以及本文新的映射算法(our)。通過NIRGAM來模擬片上處理器核通信的能耗。

    4.1 實(shí)驗(yàn)環(huán)境

    本文基于NIRGAM模擬器研究應(yīng)用在片上映射的功耗。

    NIRGAM是由英國南安普頓大學(xué)電子與計算機(jī)科學(xué)院電子系統(tǒng)設(shè)計團(tuán)隊和印度一家研究所共同聯(lián)合開發(fā)的,是專門面向片上互連網(wǎng)絡(luò)研究而開發(fā)的一種離散事件和周期精確的模擬器[11]。該模擬器采用SystemC編寫。NIRGAM模擬器可以模擬現(xiàn)有常見片上互連網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和路由規(guī)則,并且可進(jìn)行擴(kuò)展。此外,該模擬器可以進(jìn)行周期精確的功耗模擬,適合進(jìn)行片上互連網(wǎng)絡(luò)功耗研究。

    NIRGAM允許對片上互連網(wǎng)絡(luò)設(shè)計的每個階段的各種屬性進(jìn)行實(shí)驗(yàn),如拓?fù)?、交換機(jī)制、虛通道、緩沖區(qū)、時鐘頻率、路由算法和應(yīng)用等。該模擬器支持蟲洞式交換機(jī)制。NIRGAM模擬器自身存在代碼級別的缺陷,為了避免對功耗測量產(chǎn)生影響,根據(jù)已有解決方法對NIRGAM模擬器進(jìn)行修復(fù)。王榮陽等[12]在實(shí)際測試中發(fā)現(xiàn)NIRGAM在緩沖區(qū)與虛擬通道的關(guān)系、微片數(shù)目與pkt和flit大小關(guān)系、負(fù)載與包注入率之間關(guān)系這三方面存在問題。本文根據(jù)其提出的修改建議對NIRGAM進(jìn)行修復(fù)。表2是NIRGAM的配置表。

    Table 2 NIRGAM configuration

    本節(jié)利用TGFF工具生成2組隨機(jī)應(yīng)用程序序列:A組與B組。以應(yīng)用程序?qū)Φ男问竭M(jìn)行映射,一個應(yīng)用程序?qū)Χx為(a,b),其中a來自A組,b來自B組。每次映射時,a先于b映射。用于模擬先后到達(dá)的應(yīng)用程序,以此來驗(yàn)證映射算法對系統(tǒng)整體的優(yōu)化效果。在實(shí)驗(yàn)中A、B2組各包括60個應(yīng)用程序,每個應(yīng)用任務(wù)數(shù)從 4~32,任務(wù)之間的通信量權(quán)重從 2~15。規(guī)定單個應(yīng)用任務(wù)數(shù)不超過32,是為了保證a、b都可以分配到資源,避免后到的應(yīng)用b由于計算資源缺少而造成等待。

    4.2 實(shí)驗(yàn)結(jié)果

    本節(jié)用加權(quán)曼哈頓距離WMD(Weighted Manhattan Distance,應(yīng)用程序任務(wù)在片上的曼哈頓距離與相應(yīng)通信的權(quán)重的乘積之和) 作為一個應(yīng)用程序映射好壞的度量,WMD越小代表應(yīng)用程序任務(wù)之間通信距離越小,映射結(jié)果越好。如圖11所示是A、B2組應(yīng)用程序采取4種映射方法的WMD對比圖。相對于其他算法而言,our不但可以有效降低當(dāng)前應(yīng)用程序的通信距離(如A組WMD),并且可以減小對后續(xù)應(yīng)用程序的映射距離(如B組WMD)。就2組應(yīng)用程序的平均通信距離而言,相比于隨機(jī)映射、順序映射、INC,our映射結(jié)果的通信距離分別減少了56.05%,29.81% 以及 17.45%。

    Figure 11 WMDcomparison among different mapping algorithms圖11 映射算法加權(quán)曼哈頓距離比較

    通過在NIRGAM對A、B2組應(yīng)用程序的映射結(jié)果進(jìn)行模擬,得到4種算法映射下的功耗對比。其中圖12是每組應(yīng)用程序在4種算法映射下的功耗對比,該圖按照our的功耗大小對橫坐標(biāo)進(jìn)行排序??梢钥闯?5%的應(yīng)用通過our映射后功耗相比于之前得到了優(yōu)化。圖13是2組應(yīng)用程序在4種算法下應(yīng)用程序平均的通信延遲和功耗對比,our相對于隨機(jī)映射、順序映射、INC算法分別降低了45.38%,20.30%,11.23%的應(yīng)用程序通信功耗。在降低功耗的同時,our算法也可以減少通信的延遲。our與隨機(jī)映射、順序映射、INC相比帶來了36.60%,20.46%,12.10%的通信優(yōu)化。

    Figure 12 Power comparison among different mapping algorithms for job set圖12 每組應(yīng)用程序在4種算法映射下的功耗對比

    Figure 13 Latency and power comparison among different mapping algorithms for jobs inA,B圖13 A、B2組應(yīng)用程序在4種算法下的延遲&功耗對比圖

    通過對A組應(yīng)用程序的映射結(jié)果可以看出,本文改進(jìn)的算法對減少單個應(yīng)用程序通信功耗提升通信性能是有益的。同時,通過B組應(yīng)用程序的映射結(jié)果可以看出,算法對后續(xù)應(yīng)用程序的通信開銷有優(yōu)化作用。

    5 結(jié)束語

    縮短應(yīng)用在片上互連網(wǎng)絡(luò)的通信距離對減少其通信功耗是有益的。本文分析Chou等提出的任務(wù)映射算法(INC)中的啟發(fā)因子,包括分散因子和離心因子,對其區(qū)域選擇算法進(jìn)行改進(jìn),并驗(yàn)證了其有效性;提出了新的節(jié)點(diǎn)映射算法,本文提出的映射算法在通信量越大的節(jié)點(diǎn)映射越早的基礎(chǔ)上,進(jìn)一步把邏輯上通信量大的節(jié)點(diǎn)與其權(quán)重較大的鄰居在物理上映射到相鄰的tile上,并通過定位通信量較小的節(jié)點(diǎn)到孤立的tile上從而增加權(quán)重較大的鄰居出現(xiàn)的概率,減少了通信開銷,降低了功耗。它為進(jìn)一步尋找更優(yōu)的映射以及對算法進(jìn)行改進(jìn)提供了新的思路。實(shí)驗(yàn)表明,相比于INC,新算法減少了12.10%的通信功耗,且?guī)砹?1.23%的通信延遲優(yōu)化。如何發(fā)現(xiàn)和改進(jìn)片上互連網(wǎng)絡(luò)映射算法一直以來是一個重要的研究課題,該問題是一個NP完全問題,業(yè)界關(guān)于映射算法的研究正在繼續(xù)。下一步計劃將本文的算法擴(kuò)展到實(shí)際的平臺上,例如FT-2000,并參考天河的互連網(wǎng)絡(luò)相關(guān)技術(shù)和方法[14,15]提出更有效的映射策略。

    猜你喜歡
    功耗應(yīng)用程序處理器
    刪除Win10中自帶的應(yīng)用程序
    電腦報(2019年12期)2019-09-10 05:08:20
    揭開GPU功耗的面紗
    個人電腦(2016年12期)2017-02-13 15:24:40
    數(shù)字電路功耗的分析及優(yōu)化
    電子制作(2016年19期)2016-08-24 07:49:54
    “功耗”說了算 MCU Cortex-M系列占優(yōu)
    電子世界(2015年22期)2015-12-29 02:49:44
    IGBT模型優(yōu)化及其在Buck變換器中的功耗分析
    Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
    ADI推出新一代SigmaDSP處理器
    汽車零部件(2014年1期)2014-09-21 11:41:11
    呼嚕處理器
    小青蛙報(2014年1期)2014-03-21 21:29:39
    關(guān)閉應(yīng)用程序更新提醒
    電腦迷(2012年15期)2012-04-29 17:09:47
    三星電子將開設(shè)應(yīng)用程序下載商店
    久久亚洲精品不卡| 又大又爽又粗| 亚洲视频免费观看视频| 国产精品免费视频内射| 国产精品亚洲av一区麻豆| 中文字幕高清在线视频| 69精品国产乱码久久久| 后天国语完整版免费观看| 亚洲五月天丁香| 最近最新中文字幕大全免费视频| 91精品三级在线观看| 免费黄频网站在线观看国产| 女同久久另类99精品国产91| 高潮久久久久久久久久久不卡| 国产97色在线日韩免费| 精品久久蜜臀av无| svipshipincom国产片| 高清在线国产一区| 亚洲avbb在线观看| 波多野结衣一区麻豆| 天堂俺去俺来也www色官网| 黄网站色视频无遮挡免费观看| 欧美日韩黄片免| 亚洲 国产 在线| 巨乳人妻的诱惑在线观看| 动漫黄色视频在线观看| 久久精品国产综合久久久| 成人精品一区二区免费| 高清欧美精品videossex| 91字幕亚洲| av不卡在线播放| 一区二区三区国产精品乱码| 97人妻天天添夜夜摸| 亚洲国产欧美日韩在线播放| 欧美日韩av久久| 亚洲五月色婷婷综合| 纯流量卡能插随身wifi吗| 日本五十路高清| 久久天堂一区二区三区四区| 中文字幕人妻丝袜一区二区| 精品人妻熟女毛片av久久网站| 亚洲av日韩在线播放| 亚洲av欧美aⅴ国产| 午夜福利在线观看吧| 中国美女看黄片| 久久这里只有精品19| 国产亚洲欧美精品永久| 夫妻午夜视频| 看片在线看免费视频| 亚洲av成人一区二区三| 丝袜在线中文字幕| 婷婷精品国产亚洲av在线 | 亚洲av电影在线进入| 亚洲av电影在线进入| 久久99一区二区三区| 后天国语完整版免费观看| 成年女人毛片免费观看观看9 | 在线观看舔阴道视频| 欧美日韩国产mv在线观看视频| 久久青草综合色| 久久国产亚洲av麻豆专区| 午夜福利影视在线免费观看| 国产视频一区二区在线看| 亚洲精品中文字幕在线视频| 久久久久久人人人人人| 久久精品熟女亚洲av麻豆精品| 一二三四社区在线视频社区8| 日韩熟女老妇一区二区性免费视频| 男女下面插进去视频免费观看| a级毛片在线看网站| x7x7x7水蜜桃| 国产成人啪精品午夜网站| 怎么达到女性高潮| 天天躁日日躁夜夜躁夜夜| 久久久久国产精品人妻aⅴ院 | 高清毛片免费观看视频网站 | 欧美老熟妇乱子伦牲交| 天天添夜夜摸| 这个男人来自地球电影免费观看| www.精华液| 欧美不卡视频在线免费观看 | 18在线观看网站| www.熟女人妻精品国产| 国产成人av激情在线播放| 久久国产精品男人的天堂亚洲| 亚洲av成人不卡在线观看播放网| 极品少妇高潮喷水抽搐| 久久99一区二区三区| 久久亚洲精品不卡| 国产蜜桃级精品一区二区三区 | 国产成人精品在线电影| 亚洲aⅴ乱码一区二区在线播放 | 亚洲三区欧美一区| 亚洲人成77777在线视频| 欧美丝袜亚洲另类 | 欧美久久黑人一区二区| 老司机靠b影院| 久久香蕉国产精品| 老司机福利观看| 水蜜桃什么品种好| 啦啦啦 在线观看视频| 黄色片一级片一级黄色片| 黑人操中国人逼视频| 亚洲国产毛片av蜜桃av| 麻豆av在线久日| 国产aⅴ精品一区二区三区波| 在线观看www视频免费| 久久久水蜜桃国产精品网| 欧美日韩一级在线毛片| 51午夜福利影视在线观看| 男人操女人黄网站| 亚洲午夜理论影院| 在线视频色国产色| 亚洲精华国产精华精| 久久热在线av| www.自偷自拍.com| 最近最新免费中文字幕在线| 99国产精品99久久久久| 国产不卡一卡二| 1024视频免费在线观看| 淫妇啪啪啪对白视频| 日韩免费av在线播放| 极品教师在线免费播放| 成人影院久久| 老熟女久久久| 久久久久国内视频| 午夜日韩欧美国产| 一区二区日韩欧美中文字幕| av福利片在线| 一边摸一边抽搐一进一出视频| 18禁国产床啪视频网站| 美女 人体艺术 gogo| 热99国产精品久久久久久7| 午夜福利一区二区在线看| 欧美乱妇无乱码| 真人做人爱边吃奶动态| 人妻 亚洲 视频| 欧美精品一区二区免费开放| 王馨瑶露胸无遮挡在线观看| 在线永久观看黄色视频| 国产精品秋霞免费鲁丝片| 欧美 亚洲 国产 日韩一| 久热这里只有精品99| 欧美成狂野欧美在线观看| 99国产精品99久久久久| 热99久久久久精品小说推荐| 欧美精品一区二区免费开放| 两性午夜刺激爽爽歪歪视频在线观看 | 黑人巨大精品欧美一区二区蜜桃| 在线看a的网站| 久久ye,这里只有精品| 悠悠久久av| 女人久久www免费人成看片| 首页视频小说图片口味搜索| 不卡一级毛片| 欧美在线一区亚洲| 免费一级毛片在线播放高清视频 | 18禁观看日本| 久久精品91无色码中文字幕| 色播在线永久视频| 欧美黄色片欧美黄色片| 久久草成人影院| 麻豆成人av在线观看| 国产一区二区激情短视频| 久久精品国产99精品国产亚洲性色 | 这个男人来自地球电影免费观看| 美女福利国产在线| 久久精品国产清高在天天线| 可以免费在线观看a视频的电影网站| 侵犯人妻中文字幕一二三四区| 亚洲熟妇熟女久久| 成人18禁在线播放| 91字幕亚洲| 亚洲av欧美aⅴ国产| 免费观看精品视频网站| 两个人免费观看高清视频| 精品熟女少妇八av免费久了| 久久国产精品影院| 成在线人永久免费视频| 黄片播放在线免费| 一区福利在线观看| 男人操女人黄网站| 国产精品免费视频内射| videosex国产| 91大片在线观看| 黑人巨大精品欧美一区二区蜜桃| 在线观看免费日韩欧美大片| a级毛片黄视频| 男女床上黄色一级片免费看| 亚洲精品国产一区二区精华液| 国产精品久久久久久精品古装| 香蕉丝袜av| 国产日韩一区二区三区精品不卡| tube8黄色片| 男人的好看免费观看在线视频 | 国产野战对白在线观看| 制服诱惑二区| 一二三四在线观看免费中文在| 19禁男女啪啪无遮挡网站| 精品午夜福利视频在线观看一区| 999久久久国产精品视频| 国产伦人伦偷精品视频| 久久 成人 亚洲| 美女午夜性视频免费| 中文欧美无线码| 高清欧美精品videossex| 人人妻人人爽人人添夜夜欢视频| 成人国语在线视频| 天堂俺去俺来也www色官网| 国产av精品麻豆| 久久午夜综合久久蜜桃| 巨乳人妻的诱惑在线观看| 麻豆国产av国片精品| 99国产精品一区二区三区| 亚洲熟妇中文字幕五十中出 | 久久久久国产精品人妻aⅴ院 | 老司机亚洲免费影院| 99精品欧美一区二区三区四区| 亚洲免费av在线视频| 日韩中文字幕欧美一区二区| 久久精品国产亚洲av高清一级| 50天的宝宝边吃奶边哭怎么回事| 久久亚洲精品不卡| 中文字幕色久视频| 日韩欧美国产一区二区入口| 久9热在线精品视频| 亚洲国产精品合色在线| 19禁男女啪啪无遮挡网站| www.精华液| 乱人伦中国视频| 欧美亚洲 丝袜 人妻 在线| 国产在视频线精品| 久久久国产精品麻豆| 正在播放国产对白刺激| 精品国产一区二区三区四区第35| 亚洲人成伊人成综合网2020| 飞空精品影院首页| 亚洲精品自拍成人| 曰老女人黄片| 51午夜福利影视在线观看| 国产激情欧美一区二区| 亚洲第一青青草原| 美女扒开内裤让男人捅视频| 无遮挡黄片免费观看| 国产av又大| 国产精品国产高清国产av | 欧美日韩瑟瑟在线播放| 久久中文字幕人妻熟女| 亚洲成人手机| 国产精品九九99| 免费av中文字幕在线| 精品人妻1区二区| 国产精华一区二区三区| 色婷婷久久久亚洲欧美| 欧美日韩亚洲综合一区二区三区_| 国产在线精品亚洲第一网站| 另类亚洲欧美激情| 一级片'在线观看视频| 欧美+亚洲+日韩+国产| 国内久久婷婷六月综合欲色啪| 三上悠亚av全集在线观看| 久久精品91无色码中文字幕| 一边摸一边抽搐一进一出视频| 一个人免费在线观看的高清视频| xxxhd国产人妻xxx| 美女高潮喷水抽搐中文字幕| 精品午夜福利视频在线观看一区| 色在线成人网| 日本一区二区免费在线视频| 少妇粗大呻吟视频| 制服诱惑二区| 成人特级黄色片久久久久久久| 男女之事视频高清在线观看| 精品高清国产在线一区| 亚洲精品粉嫩美女一区| 黄色怎么调成土黄色| 80岁老熟妇乱子伦牲交| 国产亚洲欧美精品永久| 国产xxxxx性猛交| 亚洲人成伊人成综合网2020| 好男人电影高清在线观看| a在线观看视频网站| 女性被躁到高潮视频| 国产精品自产拍在线观看55亚洲 | 精品国产乱码久久久久久男人| 日日夜夜操网爽| 欧美午夜高清在线| 丰满人妻熟妇乱又伦精品不卡| 午夜影院日韩av| 操出白浆在线播放| 不卡一级毛片| 欧美成狂野欧美在线观看| 亚洲精品一卡2卡三卡4卡5卡| 叶爱在线成人免费视频播放| 精品国产国语对白av| 老汉色av国产亚洲站长工具| 91老司机精品| 人妻一区二区av| 国产精品欧美亚洲77777| 亚洲国产精品sss在线观看 | 午夜成年电影在线免费观看| avwww免费| 欧美黄色淫秽网站| 欧美+亚洲+日韩+国产| tocl精华| 亚洲精品国产区一区二| 国产av又大| 国产亚洲av高清不卡| 大型av网站在线播放| 精品国产国语对白av| 国产午夜精品久久久久久| 成人18禁高潮啪啪吃奶动态图| 国产主播在线观看一区二区| 校园春色视频在线观看| 国产不卡一卡二| 国产成人欧美在线观看 | 色尼玛亚洲综合影院| 波多野结衣av一区二区av| 亚洲人成伊人成综合网2020| 99国产极品粉嫩在线观看| 麻豆国产av国片精品| 激情视频va一区二区三区| 视频在线观看一区二区三区| 国产亚洲av高清不卡| 啪啪无遮挡十八禁网站| 欧美日韩精品网址| 人成视频在线观看免费观看| 手机成人av网站| 精品免费久久久久久久清纯 | 中亚洲国语对白在线视频| www日本在线高清视频| 国产有黄有色有爽视频| 亚洲专区字幕在线| 亚洲av第一区精品v没综合| 亚洲一区二区三区不卡视频| 日韩欧美免费精品| 国产成+人综合+亚洲专区| 一个人免费在线观看的高清视频| 在线观看舔阴道视频| 久久精品人人爽人人爽视色| 99久久99久久久精品蜜桃| 亚洲av日韩精品久久久久久密| av国产精品久久久久影院| 一本一本久久a久久精品综合妖精| 国产高清videossex| 国产av一区二区精品久久| 校园春色视频在线观看| 国产一区在线观看成人免费| av网站在线播放免费| 国产精品久久久av美女十八| 欧美成人免费av一区二区三区 | 精品国产一区二区久久| 国产在线一区二区三区精| 国产成人av教育| 国产精品综合久久久久久久免费 | 国产午夜精品久久久久久| 免费在线观看日本一区| 19禁男女啪啪无遮挡网站| 国产99久久九九免费精品| 亚洲男人天堂网一区| 9色porny在线观看| 99在线人妻在线中文字幕 | 18禁美女被吸乳视频| 好看av亚洲va欧美ⅴa在| 精品久久久久久久毛片微露脸| 中文字幕高清在线视频| 久久中文字幕人妻熟女| 欧美精品啪啪一区二区三区| 久久久久久久久久久久大奶| 国产精品亚洲一级av第二区| 久久精品亚洲av国产电影网| 亚洲中文字幕日韩| 欧美色视频一区免费| 欧美亚洲日本最大视频资源| 18禁黄网站禁片午夜丰满| 老熟妇仑乱视频hdxx| 国产精品美女特级片免费视频播放器 | 久久久久久久久免费视频了| 亚洲精品美女久久av网站| 脱女人内裤的视频| 国产成人精品在线电影| 欧美人与性动交α欧美软件| 亚洲黑人精品在线| 一边摸一边做爽爽视频免费| 久久午夜亚洲精品久久| 91字幕亚洲| 精品一区二区三区四区五区乱码| 涩涩av久久男人的天堂| 久久久久国产一级毛片高清牌| 国产精品久久久av美女十八| √禁漫天堂资源中文www| 两个人免费观看高清视频| 欧美精品av麻豆av| 在线免费观看的www视频| 久久国产精品人妻蜜桃| 19禁男女啪啪无遮挡网站| 一级毛片高清免费大全| 丝袜美腿诱惑在线| 成年人午夜在线观看视频| 男女下面插进去视频免费观看| 欧美日韩av久久| 一级,二级,三级黄色视频| 久热爱精品视频在线9| 中国美女看黄片| 亚洲中文字幕日韩| 操出白浆在线播放| 久久久国产欧美日韩av| 国产成人啪精品午夜网站| 他把我摸到了高潮在线观看| 夜夜躁狠狠躁天天躁| 国产欧美亚洲国产| av电影中文网址| 亚洲av日韩在线播放| 欧美精品亚洲一区二区| 久久精品亚洲av国产电影网| 精品电影一区二区在线| 首页视频小说图片口味搜索| 久久亚洲精品不卡| 亚洲在线自拍视频| 色94色欧美一区二区| 女人爽到高潮嗷嗷叫在线视频| 亚洲欧美一区二区三区黑人| 亚洲精品一卡2卡三卡4卡5卡| 高清毛片免费观看视频网站 | 在线视频色国产色| 国产精品永久免费网站| 久久久久精品人妻al黑| 王馨瑶露胸无遮挡在线观看| 在线看a的网站| 一级a爱视频在线免费观看| 99riav亚洲国产免费| 国产成人欧美| 极品人妻少妇av视频| 亚洲国产毛片av蜜桃av| 国产人伦9x9x在线观看| 久久香蕉国产精品| 两性午夜刺激爽爽歪歪视频在线观看 | 在线观看免费日韩欧美大片| 精品电影一区二区在线| 可以免费在线观看a视频的电影网站| 一区福利在线观看| 夜夜躁狠狠躁天天躁| 国产免费现黄频在线看| 不卡av一区二区三区| 午夜福利,免费看| 免费观看精品视频网站| 欧美日韩亚洲综合一区二区三区_| a级毛片黄视频| 欧美亚洲 丝袜 人妻 在线| 欧美日韩亚洲高清精品| 18禁裸乳无遮挡动漫免费视频| 精品视频人人做人人爽| 国产成人av激情在线播放| 成人亚洲精品一区在线观看| 欧美激情久久久久久爽电影 | 亚洲七黄色美女视频| 午夜激情av网站| 亚洲欧美一区二区三区黑人| 国产免费男女视频| 久久精品91无色码中文字幕| 国产欧美日韩一区二区三区在线| 亚洲成国产人片在线观看| 人妻 亚洲 视频| 午夜免费鲁丝| 日韩欧美免费精品| 欧美成人午夜精品| 久久这里只有精品19| 日本欧美视频一区| 91大片在线观看| 视频区欧美日本亚洲| 不卡av一区二区三区| 丝袜人妻中文字幕| 国产深夜福利视频在线观看| 国产精品免费大片| 天堂√8在线中文| 在线观看舔阴道视频| 欧美精品人与动牲交sv欧美| 欧美 日韩 精品 国产| 成人国语在线视频| 欧美老熟妇乱子伦牲交| 亚洲午夜理论影院| 一级,二级,三级黄色视频| 免费在线观看影片大全网站| 久久久久视频综合| 欧美黄色片欧美黄色片| 天天躁日日躁夜夜躁夜夜| 久久久久久久久久久久大奶| 国产精品综合久久久久久久免费 | 亚洲国产精品一区二区三区在线| 建设人人有责人人尽责人人享有的| 99久久国产精品久久久| 亚洲精品久久成人aⅴ小说| 精品久久久久久久久久免费视频 | av超薄肉色丝袜交足视频| 老汉色∧v一级毛片| 在线av久久热| 久久精品国产清高在天天线| 99久久99久久久精品蜜桃| 一级片免费观看大全| 国产高清视频在线播放一区| 精品久久蜜臀av无| www.999成人在线观看| 好看av亚洲va欧美ⅴa在| 亚洲一区二区三区欧美精品| 国产深夜福利视频在线观看| 成人18禁在线播放| 人人妻人人澡人人爽人人夜夜| 成年人午夜在线观看视频| tocl精华| 巨乳人妻的诱惑在线观看| 精品一区二区三区av网在线观看| 中文字幕另类日韩欧美亚洲嫩草| 成人特级黄色片久久久久久久| 老司机午夜十八禁免费视频| 他把我摸到了高潮在线观看| 亚洲av片天天在线观看| 免费看十八禁软件| 女人高潮潮喷娇喘18禁视频| av一本久久久久| 久久精品人人爽人人爽视色| 国产精品免费视频内射| 久久这里只有精品19| 国产av一区二区精品久久| 在线观看免费高清a一片| 啪啪无遮挡十八禁网站| 男人舔女人的私密视频| 国产精品 欧美亚洲| 女性生殖器流出的白浆| 国产精品99久久99久久久不卡| 国产欧美日韩综合在线一区二区| 精品一品国产午夜福利视频| 国产99久久九九免费精品| 国产成人精品久久二区二区91| 免费在线观看影片大全网站| 国产亚洲欧美精品永久| 大香蕉久久网| 欧美不卡视频在线免费观看 | 一区二区三区国产精品乱码| 久久亚洲真实| 国产深夜福利视频在线观看| 正在播放国产对白刺激| 丝袜美腿诱惑在线| 国产99白浆流出| 亚洲第一欧美日韩一区二区三区| 日本黄色日本黄色录像| 下体分泌物呈黄色| 日本一区二区免费在线视频| av视频免费观看在线观看| 亚洲av片天天在线观看| 欧美日韩成人在线一区二区| 波多野结衣av一区二区av| 淫妇啪啪啪对白视频| 亚洲欧美一区二区三区黑人| 欧美 日韩 精品 国产| 亚洲avbb在线观看| 午夜福利免费观看在线| 女同久久另类99精品国产91| 十分钟在线观看高清视频www| 深夜精品福利| 又黄又爽又免费观看的视频| 国产精品美女特级片免费视频播放器 | 国产精品国产高清国产av | 国产不卡一卡二| 中文字幕av电影在线播放| 日韩人妻精品一区2区三区| 丝瓜视频免费看黄片| 搡老乐熟女国产| 久久中文字幕人妻熟女| 亚洲精品中文字幕在线视频| 校园春色视频在线观看| 露出奶头的视频| 在线观看免费视频日本深夜| 精品久久久久久电影网| 免费在线观看完整版高清| 欧美性长视频在线观看| 99热国产这里只有精品6| 在线永久观看黄色视频| 久久精品亚洲精品国产色婷小说| 国产熟女午夜一区二区三区| 国产精品香港三级国产av潘金莲| 亚洲成人手机| 在线观看免费日韩欧美大片| 国产一区在线观看成人免费| 一区二区三区国产精品乱码| 男人的好看免费观看在线视频 | 亚洲aⅴ乱码一区二区在线播放 | 免费观看人在逋| 每晚都被弄得嗷嗷叫到高潮| 免费久久久久久久精品成人欧美视频| 亚洲av电影在线进入| 在线观看www视频免费| 亚洲综合色网址| 国产成人精品在线电影| 精品一区二区三区视频在线观看免费 | 女警被强在线播放| 亚洲成人国产一区在线观看| www日本在线高清视频| 国产成人av教育| 欧美黄色片欧美黄色片| 亚洲午夜精品一区,二区,三区| 极品人妻少妇av视频| 99re6热这里在线精品视频| 成年人午夜在线观看视频| 精品久久久久久电影网| 91精品三级在线观看| a级毛片黄视频| 日本撒尿小便嘘嘘汇集6| 日本精品一区二区三区蜜桃| 国产乱人伦免费视频| 欧美黄色淫秽网站| 大香蕉久久网| 亚洲中文字幕日韩| 免费久久久久久久精品成人欧美视频| 亚洲性夜色夜夜综合| 黄色 视频免费看|