• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    NDP-Ledger:面向區(qū)塊鏈應(yīng)用的通用高通量加速架構(gòu)①

    2020-12-19 06:20:22安述倩李文明范志華吳海彬唐志敏
    高技術(shù)通訊 2020年11期
    關(guān)鍵詞:數(shù)據(jù)流應(yīng)用程序內(nèi)存

    安述倩 李文明 范志華 吳海彬 吳 萌 王 達(dá) 張 浩 唐志敏

    (*計算機體系結(jié)構(gòu)國家重點實驗室(中國科學(xué)院計算技術(shù)研究所) 北京 100190)

    (**中國科學(xué)院大學(xué) 北京 100049)

    0 引 言

    作為去中心化交易協(xié)議,區(qū)塊鏈已廣泛應(yīng)用于眾多領(lǐng)域,如數(shù)字貨幣、金融服務(wù)和物聯(lián)網(wǎng)(Internet of things,IoT)[1-4]等,成為研究熱點之一。最初基于區(qū)塊鏈技術(shù)的數(shù)字貨幣應(yīng)用,如比特幣采用的典型的安全哈希算法(secure Hash algorithm,SHA-256)對計算資源需求較大,對存儲容量和帶寬的需求較小,這使SHA-256算法在圖形處理器(graphics processing unit, GPU)上取得了優(yōu)異的效率。但是由于GPU的通用性設(shè)計,SHA-256并不能充分利用GPU上的各類計算資源,導(dǎo)致計算能效比并不理想[5]。另一方面,由于SHA-256算法固定,計算模式簡單,定制化的ASIC芯片較GPU可以實現(xiàn)更高的性能和能效比[6],成為了當(dāng)前數(shù)字貨幣領(lǐng)域的主要算力之一。但是ASIC芯片卻違背了比特幣設(shè)計的去中心化思想[7],為緩解這種沖突,研究人員提出了眾多新的數(shù)字貨幣應(yīng)用,如萊特幣(litecoin, LTC)[8]、以太坊(Ethereum)[9]、Dash幣[10]、Zcash[11]、Equihash算法[12]、Bytom[13]等,算法變得更加復(fù)雜,并且需要更大的存儲容量和更高的訪存帶寬。這些數(shù)字貨幣的發(fā)展方向是尋找反中心化算法以實現(xiàn)區(qū)塊鏈處理器的公平性,導(dǎo)致越來越多的區(qū)塊鏈算法增加了對存儲、內(nèi)存帶寬的需求,并降低了對計算資源的需求,這使中央處理器(central processing unit, CPU)、GPU甚至ASIC的效率越來越低。同時,區(qū)塊鏈算法迅速演變,而ASIC只能針對一類區(qū)塊鏈算法進(jìn)行加速,無法實現(xiàn)通用性的加速?;谝陨戏治觯枰业较鄬νㄓ玫奶幚砑軜?gòu),滿足高能效的區(qū)塊鏈算法處理。

    近年來,近數(shù)據(jù)處理(near-data-processing,NDP)為需要大存儲容量和高存儲訪問帶寬的應(yīng)用提供了一種有效的解決方案。3D堆疊存儲技術(shù)提供了一種通過降低數(shù)據(jù)搬運成本來提高計算系統(tǒng)的性能和降低功耗的方法。此外,為了進(jìn)一步提高大規(guī)模并行執(zhí)行應(yīng)用程序的效率,數(shù)據(jù)流執(zhí)行模式已在許多處理器中得到廣泛應(yīng)用。數(shù)據(jù)流執(zhí)行模式具有天然的并行特征,并通過降低訪存來緩解“存儲墻”問題。

    通過分析不同類型的區(qū)塊鏈應(yīng)用程序的特點以及3D堆疊存儲技術(shù)特征,本文提出了一種基于3D堆疊存儲器和數(shù)據(jù)流執(zhí)行模式的面向區(qū)塊鏈應(yīng)用處理的通用數(shù)據(jù)處理架構(gòu),NDP-Ledger。本文的主要貢獻(xiàn)包括:

    (1)分析并對比了不同區(qū)塊鏈應(yīng)用程序的算法特征,并基于算法特征,提出了通用NDP加速器架構(gòu)設(shè)計NDP-Ledger。

    (2)提出了基于3D堆疊存儲器的面向區(qū)塊鏈應(yīng)用的通用NDP加速架構(gòu)。

    (3)設(shè)計并實現(xiàn)了粗粒度的數(shù)據(jù)流執(zhí)行模型,提高數(shù)據(jù)處理的并行度,高效地控制內(nèi)存以及陣列之間的數(shù)據(jù)流動。

    (4)實驗結(jié)果表明,本文提出的通用加速處理架構(gòu)與通用多核CPU相比,性能提升了39.98倍;與通用GPU相比,性能提升了1.8倍。

    1 相關(guān)工作

    近幾年,區(qū)塊鏈技術(shù)在學(xué)術(shù)界和工業(yè)界都獲得了極大的關(guān)注,基于區(qū)塊鏈協(xié)議的應(yīng)用越來越多地服務(wù)于國民經(jīng)濟(jì)的發(fā)展,包括金融服務(wù)、公證、智能合約、IoT以及數(shù)字貨幣。此類應(yīng)用對處理器的性能和功耗提出了更高的要求,低效的CPU無法滿足此類應(yīng)用的需求。因為具有更多的計算資源和更高的并行度,GPU一度成為繼CPU之后的首選區(qū)塊鏈處理架構(gòu)。為了追求更高的收益,針對一種或幾種區(qū)塊鏈應(yīng)用的專用ASIC加速器逐漸替代了GPU,例如針對比特幣設(shè)計的AvalonMiner[14]等。然而,由于新算法和新應(yīng)用的不斷涌現(xiàn),這些ASIC無法滿足不斷演化的算法需求,僅能支持一種或幾種算法的高效執(zhí)行。另外,越來越多的算法不適合在ASIC上進(jìn)行計算,這給ASIC設(shè)計帶來了更大的挑戰(zhàn)。

    隨著3D封裝技術(shù)的發(fā)展,NDP為具有簡單計算模式和大存儲容量需求的應(yīng)用程序提供了新的高效解決方案。Kang等人[15]將計算單元、有限狀態(tài)機和其他控制邏輯集成到普通動態(tài)隨機存儲器(dynamic random access memory, DRAM)中構(gòu)成了3D堆疊內(nèi)存,用來加速用于DNA比對的Blast算法。Pugsley等人[16]使用了低能耗的指令內(nèi)核,例如Cortex A5,與混合內(nèi)存立方體(hybrid memory cube,HMC)一起實現(xiàn)了高能效的新一代數(shù)據(jù)中心(new data center, NDC)架構(gòu)。Nair等人[17]在HMC的邏輯層上實現(xiàn)了復(fù)雜的運算部件,用于加速科學(xué)計算應(yīng)用處理。Ahn等人[18]提出了一種稱為PEI(PIM-enabled instructions)的通用NDP體系結(jié)構(gòu),該體系結(jié)構(gòu)實現(xiàn)了一種可基于數(shù)據(jù)的位置實現(xiàn)內(nèi)存處理的機制。與之前的工作類似,Santos等人[19]在HMC的邏輯層中放置了可重構(gòu)處理單元,可以靈活處理不同類型的數(shù)據(jù)。文獻(xiàn)[20]利用現(xiàn)場可編程門陣列(field programmable gate array, FPGA)和粗粒度可重構(gòu)陣列(coarse-grained reconfigurable array,CGRA)的優(yōu)勢來實現(xiàn)高能效和高靈活性的NDP系統(tǒng)。同時,由于圖計算的大量離散存儲訪問的特征,研究人員提出了基于HMC的高效架構(gòu)用于圖計算處理[21-23]。在其他相關(guān)工作中,HMC用于字符串處理[24]和矩陣中的乘加運算[25],這些算法具有簡單的計算模式和海量的數(shù)據(jù)集。綜上所述,隨著3D堆疊技術(shù)的發(fā)展,NDP已成為解決內(nèi)存密集型應(yīng)用程序的最有前景的方法之一。

    另一方面,隨著應(yīng)用程序(如人工智能(artificial intelligence, AI)、IoT和網(wǎng)絡(luò)服務(wù))所需要處理的數(shù)據(jù)量的不斷增長,數(shù)據(jù)流體系結(jié)構(gòu)展現(xiàn)出比傳統(tǒng)馮諾依曼體系結(jié)構(gòu)具有更好的執(zhí)行并行度和執(zhí)行性能。數(shù)據(jù)流體系結(jié)構(gòu)的優(yōu)點主要來自2個方面:首先是數(shù)據(jù)流執(zhí)行模式的天然并行性,一旦數(shù)據(jù)準(zhǔn)備好就觸發(fā)指令,無需考慮指令和數(shù)據(jù)的依賴性;第二是內(nèi)存訪問量的減少,相當(dāng)一部分?jǐn)?shù)據(jù)在片上流動,緩解了傳統(tǒng)馮諾依曼結(jié)構(gòu)中的“存儲墻”的問題。已有的諸多研究工作已經(jīng)證明了數(shù)據(jù)流體系結(jié)構(gòu)在許多應(yīng)用程序中的優(yōu)勢。例如,Wave Computing提出的數(shù)據(jù)流處理器(DPU)[26]實現(xiàn)了高性能處理AI應(yīng)用程序,NeuFlow處理器[27]是為視覺處理設(shè)計的數(shù)據(jù)流架構(gòu)。其他典型的數(shù)據(jù)流體系結(jié)構(gòu)包括TeraFlux[28]、Runnemede[29]、TRIPS[30]和WaveScalar[31],在特定應(yīng)用中,均體現(xiàn)出數(shù)據(jù)流結(jié)構(gòu)對于馮諾依曼體系結(jié)構(gòu)的巨大優(yōu)勢。

    基于以上分析,本文探索了基于3D堆疊內(nèi)存和數(shù)據(jù)流控制機制的區(qū)塊鏈應(yīng)用通用加速結(jié)構(gòu)設(shè)計思路,以實現(xiàn)更為高效的區(qū)塊鏈通用處理架構(gòu)。

    2 區(qū)塊鏈應(yīng)用分析

    去中心化及不可篡改是區(qū)塊鏈的核心思想,分布式賬本是由不斷產(chǎn)生的區(qū)塊組成,這些區(qū)塊在整個區(qū)塊鏈網(wǎng)絡(luò)上共享給不同的組織,以確保分類賬的公平性、開放性和安全性。區(qū)塊鏈網(wǎng)絡(luò)中的每個節(jié)點都接收區(qū)塊頭,并在處理后返回計算結(jié)果。該過程由多種算法組成,用以證明工作已經(jīng)完成。隨著越來越多不同需求的逐漸演變,基于區(qū)塊鏈應(yīng)用的算法變得越來越復(fù)雜,算法的核心對于計算資源要求不高,但是越來越依賴于存儲器來減少ASIC對于去中心化思想的影響。在本節(jié)中,首先根據(jù)算法采用的核心思想總結(jié)不同算法的特征和具體的資源需求,然后根據(jù)不同的算法特征以及各種計算、存儲需求,分析適用于不同區(qū)塊鏈應(yīng)用程序的硬件架構(gòu)設(shè)計,并結(jié)合新興的存儲技術(shù),分析未來的結(jié)構(gòu)設(shè)計的可能性。

    2.1 哈希相關(guān)的算法

    比特幣作為區(qū)塊鏈技術(shù)的第1個著名應(yīng)用,利用了加密算法SHA-256,該算法執(zhí)行定點模式的哈希運算,包括6個邏輯運算功能,如表1所示。在大多數(shù)的哈希算法中,移位、與、或、異或、非運算是最常見而且是主要的運算。這些操作很簡單,對計算資源的復(fù)雜性要求不高,但是需要重復(fù)執(zhí)行多次,這對于結(jié)構(gòu)復(fù)雜而功能強大的CPU及GPU來說是一種資源浪費。

    表1 SHA-256算法的邏輯運算符和功能描述

    在比特幣之后,研究人員提出了使用更復(fù)雜的哈希運算或不同哈希運算組合的數(shù)字貨幣。因此,更加復(fù)雜和需要更多軟硬件資源的工作量證明(proof of work, PoW)算法被提出,如Quark應(yīng)用了9種哈希函數(shù),包括BLAKE,BMW,GROESTL,JH,KECCAK和SKEIN等等。DASH結(jié)合了11種哈希加密算法,命名為X11。相應(yīng)地,X13和X15算法也隨之被提出。幾乎所有方法都基于現(xiàn)有的加密算法進(jìn)行了升級,這些算法強調(diào)簡單的邏輯運算而不是復(fù)雜的科學(xué)計算,這使得針對此類算法的ASIC的研發(fā)相對容易。

    2.2 內(nèi)存依賴型算法

    因為純哈希算法易于ASIC加速,這違背了區(qū)塊鏈去中心化的原則,因此,一些更平等的共識算法被逐漸提出。例如,Ethash是對Dagger-Hashimoto進(jìn)行優(yōu)化,該算法的執(zhí)行很大程度依賴存儲容量和訪存帶寬,其數(shù)據(jù)量的大小超過1 GB,并且每年增加7 GB,與內(nèi)存需求相比,對CPU的計算能力的需求并不是那么強烈。另一個典型的應(yīng)用是Zcash,它使用被稱為生日悖論的Equihash作為其共識算法。 Equihash是一種依賴于內(nèi)存的算法,每個線程至少需要1 GB的內(nèi)存容量。還有許多其他共識算法,所有這些算法都強調(diào)帶寬和內(nèi)存容量,而不是計算性能。 因此,針對這類應(yīng)用,NDP架構(gòu)具有很大的優(yōu)勢。

    2.3 其他典型算法

    有些研究人員認(rèn)為ASIC僅支持哈希類運算,造成了資源浪費,因此并不認(rèn)可這種做法。使用現(xiàn)有的計算資源來處理區(qū)塊鏈應(yīng)用程序,同時進(jìn)行一些其他有效計算,這方面是有意義的。例如,tensority是基于張量計算模型的ASIC友好共識算法,其中矩陣和張量運算被引入到哈希過程中。因此,這些處理機還可以用于AI硬件加速服務(wù)、并行計算,并產(chǎn)生額外的社會效益。 另一個例子是Primecoin,它是世界上第1個以科學(xué)計算為設(shè)計目標(biāo)的共識算法。在Primecoin中,PoW不僅為網(wǎng)絡(luò)提供了安全性和生成區(qū)塊的功能,而且還生成了數(shù)學(xué)研究人員感興趣的特殊形式的質(zhì)數(shù)鏈。

    以上為代表性的區(qū)塊鏈應(yīng)用程序。當(dāng)然,還有許多其他的區(qū)塊鏈應(yīng)用程序使用了復(fù)雜且有意義的共識算法,這些算法面向不同的應(yīng)用領(lǐng)域,都可以歸為上述類別。

    2.4 設(shè)計面向區(qū)塊鏈應(yīng)用的高效結(jié)構(gòu)

    大多數(shù)區(qū)塊鏈應(yīng)用程序的特點是邏輯操作簡單,內(nèi)存容量需求大和帶寬需求高。因此,要為區(qū)塊鏈應(yīng)用開發(fā)更加通用和高效的處理架構(gòu),應(yīng)該充分考慮并利用這些特征。隨著3D封裝技術(shù)的發(fā)展,3D堆疊存儲器技術(shù)已經(jīng)成熟。已有研究證明了3D堆疊存儲器[25-30]的優(yōu)勢,它通過減少數(shù)據(jù)搬運距離并提供高帶寬來提高計算機的性能。3D堆疊存儲器,如HMC已經(jīng)成為比傳統(tǒng)存儲器體系結(jié)構(gòu)更具吸引力的設(shè)計方案。本文以HMC為例,研究3D堆疊存儲器在區(qū)塊鏈應(yīng)用場景中的效果。

    如圖1所示,在HMC中,邏輯層(logic die)和多層DRAM堆疊在芯片上,使用硅通孔(through silicon via,TSV)技術(shù)以進(jìn)行層間通信。典型的HMC由32個庫(vault)組成,每個庫在垂直方向上由幾個可以獨立訪問的堆疊隨機存取存儲(random access memory,RAM)塊組成,以此實現(xiàn)更短的存儲訪問距離和更高的內(nèi)存帶寬。與傳統(tǒng)的內(nèi)存系統(tǒng)相比,HMC具有更高的訪存性能和更低的能耗損失。邏輯層可以通過集成運算部件來就近處理存儲器中的數(shù)據(jù),添加了運算部件的HMC可以像ASIC一樣作為高能效的加速架構(gòu)。

    圖1 HMC存儲結(jié)構(gòu)示意圖

    3 NDP-Ledger架構(gòu)設(shè)計

    本文提出了一種基于3D堆疊存儲器和數(shù)據(jù)流執(zhí)行模式的近數(shù)據(jù)處理架構(gòu)NDP- Ledger,以加速各種區(qū)塊鏈應(yīng)用程序的執(zhí)行。 本節(jié)將討論NDP- Ledger的結(jié)構(gòu)設(shè)計、編程模型和數(shù)據(jù)流控制機制。

    3.1 NDP-Ledger 體系結(jié)構(gòu)概述

    NDP-Ledger的總體架構(gòu)如圖2所示。在主機端,設(shè)置了1個加速使能單元(acceleration enable unit,AEU)。AEU用于監(jiān)視主機處理器的行為并決定是否激活NDP-Ledger。用戶使用專門的編程接口來控制AEU。在收到啟動NDP-Ledger加速區(qū)塊鏈算法的CALL之后,CALL將繞過緩存直接發(fā)送到HMC控制器的NDP處理內(nèi)核,NDP處理器核解析指令并運行,指令執(zhí)行結(jié)束后,收集結(jié)果并處理,并將最終結(jié)果發(fā)送回主機端。在AEU未使能狀態(tài)下,傳統(tǒng)的內(nèi)存訪問系統(tǒng)仍可按其普通方式工作。當(dāng)選擇NDP-Ledger模式時,數(shù)據(jù)將直接在HMC中被處理。在數(shù)據(jù)一致性方面,為了保持高速緩存和HMC之間的數(shù)據(jù)一致性,2種方式可以選擇。第1個方法是當(dāng)命令從AEU發(fā)送到HMC控制器時,控制器需要廣播到所有緩存,無效掉HMC端需要由內(nèi)核處理的所有數(shù)據(jù)。第2個方法是高速緩存繞過策略,即需要由處理器核處理的數(shù)據(jù)應(yīng)標(biāo)記為非高速緩存存儲數(shù)據(jù)。在NDP-Ledger中,選擇第2種方法,即繞過緩存策略,以避免維護(hù)緩存一致性帶來開銷。圖2(b)顯示了NDP-Ledger的執(zhí)行模型。

    圖2 NDP-Ledger 體系結(jié)構(gòu)圖

    圖3顯示了NDP-Ledger的詳細(xì)加速架構(gòu)設(shè)計。如圖3(a)所示,在HMC的邏輯層中的每個vault控制器上實現(xiàn)加速處理單元陣列,由16個處理單元(process element,PE)組成。所有運算單元都由高速總線連接。如圖3(b)所示,PE之間由1個mesh結(jié)構(gòu)的片上網(wǎng)絡(luò)連接。4個PE由同一個路由器連接,并且可以在數(shù)據(jù)流執(zhí)行模型中作為1個工作組。共享路由器可提高PE組內(nèi)部的通信效率。圖3(c)展示了PE的結(jié)構(gòu),它由指令緩沖區(qū)、上下文操作數(shù)、流水線和路由器組成。本文采用粗粒度的數(shù)據(jù)流執(zhí)行模型,指令塊(而不是指令)作為最小的調(diào)度單元。粗粒度的數(shù)據(jù)流執(zhí)行模型可以簡化控制邏輯,并且流水線設(shè)計仍使用控制流執(zhí)行模型。圖3(d)展示了流水線的結(jié)構(gòu)。區(qū)塊鏈應(yīng)用程序中大部分的運算為簡單的邏輯運算,因此,PE中配置了2個邏輯單元(logic unit,LU)來增強邏輯運算能力,此外還包含1個算術(shù)單元,1個浮點單元和1個LD/ST單元。與傳統(tǒng)處理器流水線不同,在數(shù)據(jù)流執(zhí)行模式中,增加了FLOW單元來支持PE之間的數(shù)據(jù)流動。FLOW單元由特殊指令控制,用來將數(shù)據(jù)從操作數(shù)緩沖區(qū)復(fù)制到其他PE中。該指令在源代碼的編譯階段生成。數(shù)據(jù)流映射決定了指令塊和PE之間的映射關(guān)系。為了提高執(zhí)行的并行性,PE采用SIMD執(zhí)行模式。

    圖3 NDP-Ledger加速架構(gòu)示意圖

    3.2 編程和指令映射

    在編程模型的設(shè)計上,實現(xiàn)了類似于CUDA的編程模型作為用戶調(diào)用運行內(nèi)核算法的NDP-Ledger加速器的接口。加速單元僅用于處理算法的內(nèi)核部分,而其他功能,如通過Internet與其他節(jié)點進(jìn)行通信等功能,在主處理器上執(zhí)行。

    本文實現(xiàn)了粗粒度的數(shù)據(jù)流執(zhí)行模型,其中指令塊是最小的調(diào)度單元。指令塊通常包含多條指令,用于實現(xiàn)特定功能。比如for()、while() 或者公式等(例如比特幣應(yīng)用中的Maj()、Ch()、Σ0()、σ1()),其中一個或者多個的功能實現(xiàn)可以編寫在1個指令塊中,稱之為執(zhí)行塊(execution block,Exeblock)。

    下面以比特幣為例來詳細(xì)說明Exeblock和映射機制的實現(xiàn)。如圖4所示,根據(jù)上面介紹的規(guī)則,將該算法編程為幾個Exeblock(白色上層框), 灰色底框顯示運行Exeblock的PE。右側(cè)部分顯示數(shù)據(jù)的流向。在當(dāng)前映射方式中,選擇邊緣PE加載數(shù)據(jù)并將數(shù)據(jù)搬運到它們的右側(cè)的PE中以進(jìn)行下一步計算。空閑PE可以處理另一個比特幣任務(wù),為了充分利用計算資源,多個任務(wù)可以同時映射到PE陣列上運行。

    圖4 比特幣算法到PE陣列的映射方式以及數(shù)據(jù)流圖

    在進(jìn)行Exeblock劃分時,按照圖5所示的方法,針對算法進(jìn)行解析。根據(jù)SHA-256的算法特點,首先將算法的執(zhí)行過程劃分為“報文預(yù)處理”、“加載Hash初值”、“Hash運算”等3大部分,針對每一部分,根據(jù)其所需要執(zhí)行的具體功能,按照指令數(shù)均衡的原則,劃分指令塊,并利用PE的任務(wù)級并行以及SIMD特性,挖掘算法的并行性;根據(jù)指令塊之間的數(shù)據(jù)依賴關(guān)系,實現(xiàn)算法的依賴關(guān)系圖,最終形成數(shù)據(jù)流圖。圖4是針對SHA-256算法的宏觀解析,具體到實際的指令塊,編譯器通過檢索實際的數(shù)據(jù)流依賴關(guān)系,會形成更加復(fù)雜的數(shù)據(jù)流圖。

    圖5 SHA-256算法數(shù)據(jù)流圖解析過程

    除了Exeblock的劃分,數(shù)據(jù)流執(zhí)行模式中最重要的映射機制,是將Exeblock放到指定PE上的策略,以往研究人員針對映射機制研究已經(jīng)有很多工作,如面向科學(xué)計算的映射算法[32]、考慮負(fù)載均衡的映射算法TBIM[33](topology-based instruction mapping) 等。TBIM算法如圖6所示,將Exeblock根據(jù)數(shù)據(jù)依賴關(guān)系形成數(shù)據(jù)流圖(dataflow graph),作為映射算法輸入之一,并且將PE陣列以及拓?fù)潢P(guān)系作為映射算法第2個輸入,通過衡量各個PE上定點浮點負(fù)載以及網(wǎng)絡(luò)傳輸代價的大小,逐個檢索各個指令塊的最佳映射位置,獲得最優(yōu)的映射結(jié)果。

    圖6 TBIM算法[33]

    3.3 粗粒度的數(shù)據(jù)流控制機制

    在本文實現(xiàn)的粗粒度數(shù)據(jù)流模型中,最小調(diào)度單位是Exeblock,其中包含一行或幾行程序代碼,這些代碼可以實現(xiàn)用戶確定的一個或多個功能。一旦所有數(shù)據(jù)到達(dá),就可以觸發(fā)Exeblock執(zhí)行。如圖7所示,一個應(yīng)用程序可以分為幾個任務(wù),每個任務(wù)由幾個Exeblock組成??梢愿鶕?jù)數(shù)據(jù)量的大小和同時運行的任務(wù)數(shù)將Exeblock執(zhí)行流圖映射到內(nèi)部PE級別、PE陣列級別或跨PE陣列級別。在圖中,有2個要處理的應(yīng)用程序,每個應(yīng)用程序包含幾個任務(wù)。圖中顯示了只有1個PE陣列的可能映射結(jié)果。數(shù)據(jù)流圖映射可能跨PE陣列,多個PE陣列共同在一個應(yīng)用程序或任務(wù)上工作。數(shù)據(jù)流映射是在編程時確定的,并將配置信息發(fā)送到每個PE陣列的控制邏輯,如圖4所示。為了使數(shù)據(jù)流圖的Exeblock更有效地工作,本文開發(fā)了一種雙向ack機制來控制Exeblock之間的交互。每個Exeblock都有1個三位的狀態(tài)字,該狀態(tài)字指示與執(zhí)行塊相關(guān)的運行狀態(tài)。三位的狀態(tài)字用來控制上游和下游Exeblock的執(zhí)行,如圖8所示。Ack、active 和 done是3個控制信號,用于維持?jǐn)?shù)據(jù)流圖的執(zhí)行。Ack用于將自身節(jié)點的完成消息通知上游節(jié)點。Active負(fù)責(zé)啟動下游節(jié)點。Done信號標(biāo)記節(jié)點所有循環(huán)的結(jié)束。所有Exeblock均受HMC內(nèi)存中NDP內(nèi)核的控制。這樣的設(shè)計方案使得PE支持任務(wù)級并行,同時可以并行執(zhí)行一個任務(wù)的不同迭代。圖8展示了5個Exeblock的執(zhí)行示例。圖中標(biāo)記了控制步驟的詳細(xì)說明。每個Exeblock都有upstream、downstream、 enable三位狀態(tài)字,分別用于表示當(dāng)前節(jié)點需要回應(yīng)的上游個數(shù)、需要激活的下游個數(shù)以及是否已經(jīng)被控制部件激活。Exeblock可以執(zhí)行的條件是當(dāng)前被激活的節(jié)點需要發(fā)送ack和active的上下游節(jié)點數(shù)都為0,即在上次迭代執(zhí)行已經(jīng)結(jié)束的情況下,才可以進(jìn)入下一次執(zhí)行。圖中B0、B1為根節(jié)點,無父節(jié)點,B2、B3分別為其子節(jié)點,B3和B4為葉子節(jié)點。Enable主要用來控制根節(jié)點是否可以正常執(zhí)行,根節(jié)點收到控制核的激活信號后,處于可執(zhí)行狀態(tài),執(zhí)行結(jié)束后需要將enable歸0,避免在子節(jié)點當(dāng)前迭代未結(jié)束之前再次執(zhí)行;中間各子節(jié)點包括葉子節(jié)點,主要通過判斷upstream來確定是否可以正常執(zhí)行。運行過程中,中間節(jié)點的enable信號一直處于激活狀態(tài),后續(xù)的各次迭代收到上游節(jié)點的激活信息后進(jìn)行開始執(zhí)行??刂坪诵枰盏剿泄?jié)點發(fā)出的done信號之后,才會激活任務(wù)的下一次迭代,如圖8第9步所示,B0和B4同時在執(zhí)行任務(wù)的不同迭代,實現(xiàn)任務(wù)級并行。

    圖7 PE陣列和PE單元上的映射示例圖

    圖8 粗粒度數(shù)據(jù)流的控制機制示意圖

    4 實驗與評估

    為了驗證NDP-Ledger的性能,對本文所提出的架構(gòu)進(jìn)行了模擬仿真,并將其與Intel CPU和NVIDIA GPU進(jìn)行了比較。

    4.1 實驗設(shè)置

    本實驗將CasHMC[34]集成到Gem5[35]中來模擬NDP-Ledger的架構(gòu)設(shè)計。Gem5是一個完整的系統(tǒng)模擬器。CasHMC是一個實現(xiàn)了HMC存儲的周期精確的模擬器。實驗中,采用了1個Cube,存儲空間大小為8 GB。每個Cube包含32個vaults,每個vault分為16個banks,其中32個vaults分別對應(yīng)32個PE 陣列結(jié)構(gòu)。本文在HMC內(nèi)存中添加了4個ARM1176作為多NDP處理器核來控制PE陣列,ARM1176用作加速器的MCU,它負(fù)責(zé)調(diào)度任務(wù)到加速器并與主機處理器進(jìn)行通信。為了提高并行計算能力,在實驗中,每個PE單元包含4組算術(shù)部件,并以SIMD方式執(zhí)行。本文使用CACTI對寄存器的功耗和面積、配置緩沖區(qū)以及其他部件進(jìn)行建模。使用通用服務(wù)器級Intel E5-2697 v3和高性能服務(wù)器加速卡NVIDIA TITAN XP作為對比平臺,詳細(xì)配置如表2所示。NDP-Ledger的功耗和面積參數(shù)為32 nm工藝下參數(shù)。

    表2 CPU、GPU 和 NDP-Ledger 參數(shù)對比

    HMC邏輯芯片的功耗和面積數(shù)據(jù)來源于Micron公司公布的數(shù)據(jù)[36]。四個NDP核心的總功率為0.5 W,HMC為90 W[16],每個PE陣列的總功率為0.8 W,32個PE陣列的總功率為25.6 W。NDP-Ledger的整體功率為116 W。NDP-Ledger的面積等于HMC控制邏輯部分的面積。從表中可以看出,NDP-Ledger的面積和功率都小于CPU和GPU。

    本文選擇了具有代表性的區(qū)塊鏈應(yīng)用的算法作為基準(zhǔn)測試程序,如表3所示。算法中的主要操作步驟已在表中列出。這些運算主要與移位運算、邏輯運算和矩陣運算有關(guān)。費馬小定理是搜索素數(shù)Cunningham鏈的關(guān)鍵操作。

    表3 基準(zhǔn)測試程序說明

    4.2 性能評估與分析

    在實驗中,通過編程來充分利用CPU和GPU的硬件資源。為了排除主機系統(tǒng)對CPU、GPU和NDP-Ledger的影響,僅使用這3個平臺執(zhí)行區(qū)塊鏈應(yīng)用程序的核心算法部分。

    圖9顯示了CPU、GPU和NDP-Ledger的性能比較。結(jié)果表明,NDP-Ledger的平均運算速度是E5-2697 v3的39.98倍,是NVIDIA TITAN XP平均速度的1.8倍。最好的加速結(jié)果為Scrypt算法,因為該算法具有簡單的邏輯運算和訪存密集型的特點。

    圖9 CPU、GPU和 NDP-Ledger性能對比圖

    圖10顯示了3種結(jié)構(gòu)的能效對比。由于NDP-Ledger所擁有的熱設(shè)計功耗(thermal design power,TDP)比GPU少,因此在能效上取得了更好的結(jié)果。結(jié)果表明,NDP-Ledger和GPU相比,能效比是其3.9倍;和CPU相比,能效比是其49.97倍。

    圖10 CPU、GPU和 NDP-Ledger 功效對比圖

    在性能密度方面,NDP-Ledger由于其3D堆疊存儲技術(shù)減小了總面積,從而提高了單位面積的性能,如圖 11所示。集成PE陣列的邏輯層,其面積等于HMC本身面積。實驗結(jié)果表明,NDP-Ledger的單位面積計算密度是E5-2697 v3的60.11倍,是NVIDIA TITAN XP的2.81倍。

    圖11 CPU、GPU和NDP-Ledger 性能密度對比圖

    5 結(jié) 論

    隨著區(qū)塊鏈技術(shù)的飛速發(fā)展,區(qū)塊鏈應(yīng)用越來越豐富,其核心算法對處理器的計算性能和存儲訪問性能要求不斷變化,目前缺乏可以高效處理區(qū)塊鏈應(yīng)用的通用結(jié)構(gòu)。針對這一現(xiàn)狀,本文提出了基于3D堆疊存儲的具有數(shù)據(jù)流執(zhí)行模式的通用NDP區(qū)塊鏈加速結(jié)構(gòu)設(shè)計,將PE陣列單元與3D堆疊存儲集成在一起,以提高性能密度并減少數(shù)據(jù)傳輸距離。實驗表明,本文提出的NDP-Ledger提高了區(qū)塊鏈應(yīng)用的處理性能和能效比。同時,提出了一種面向粗粒度數(shù)據(jù)流執(zhí)行模型的高效編程和控制行機制,提高了程序執(zhí)行的并發(fā)度,減少了存儲器訪問的需求。評估結(jié)果表明,NDP-Ledger處理性能是主流CPU的39.98倍,是主流GPU的1.8倍,驗證了本文提出的結(jié)構(gòu)的有效性。

    本文提出的通用性加速結(jié)構(gòu)NDP-Ledger結(jié)合了3D堆棧存儲以及數(shù)據(jù)流執(zhí)行模型,下一步的研究工作需要針對這兩方面結(jié)合來進(jìn)行。針對數(shù)據(jù)流執(zhí)行模型的編譯技術(shù)研究,進(jìn)一步減少對存儲訪問的依賴;針對存儲層次結(jié)構(gòu)的優(yōu)化研究,進(jìn)一步提升存儲的效率。這兩方面對NDP-Ledger的結(jié)構(gòu)及性能提升有著重要影響,也是基于本文提出的結(jié)構(gòu)未來要開展的工作。

    猜你喜歡
    數(shù)據(jù)流應(yīng)用程序內(nèi)存
    汽車維修數(shù)據(jù)流基礎(chǔ)(下)
    刪除Win10中自帶的應(yīng)用程序
    電腦報(2019年12期)2019-09-10 05:08:20
    “春夏秋冬”的內(nèi)存
    一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機制
    基于數(shù)據(jù)流聚類的多目標(biāo)跟蹤算法
    北醫(yī)三院 數(shù)據(jù)流疏通就診量
    基于內(nèi)存的地理信息訪問技術(shù)
    關(guān)閉應(yīng)用程序更新提醒
    電腦迷(2012年15期)2012-04-29 17:09:47
    三星電子將開設(shè)應(yīng)用程序下載商店
    微軟軟件商店開始接受應(yīng)用程序
    国产精品人妻久久久久久| 少妇人妻久久综合中文| 岛国毛片在线播放| 人妻一区二区av| 涩涩av久久男人的天堂| 热re99久久精品国产66热6| 亚洲四区av| 国模一区二区三区四区视频| av在线播放精品| 天美传媒精品一区二区| 亚洲欧洲日产国产| 伦理电影免费视频| 成人18禁高潮啪啪吃奶动态图 | 国产精品三级大全| 精品午夜福利在线看| 大码成人一级视频| 少妇的逼好多水| 亚洲欧洲日产国产| 亚洲av电影在线观看一区二区三区| 97在线视频观看| 久久影院123| 国产日韩一区二区三区精品不卡 | a级毛色黄片| 99热6这里只有精品| 亚洲精品成人av观看孕妇| 99热全是精品| 亚洲精品成人av观看孕妇| 妹子高潮喷水视频| 久热久热在线精品观看| 亚洲av综合色区一区| 婷婷色av中文字幕| 18禁动态无遮挡网站| 91精品国产九色| 欧美 日韩 精品 国产| 亚洲五月色婷婷综合| 女性被躁到高潮视频| 国产片特级美女逼逼视频| 人妻少妇偷人精品九色| 我要看黄色一级片免费的| 国产精品熟女久久久久浪| 大香蕉97超碰在线| 少妇猛男粗大的猛烈进出视频| 久久综合国产亚洲精品| 中文字幕最新亚洲高清| 国精品久久久久久国模美| 黄色毛片三级朝国网站| 国产成人a∨麻豆精品| 久久久久人妻精品一区果冻| 美女xxoo啪啪120秒动态图| 黄片播放在线免费| 日日爽夜夜爽网站| 日日摸夜夜添夜夜爱| 久久韩国三级中文字幕| 国产精品久久久久成人av| 国产片特级美女逼逼视频| 亚洲国产色片| 国产免费一级a男人的天堂| 一级毛片 在线播放| 午夜福利网站1000一区二区三区| 免费少妇av软件| 久久免费观看电影| 成人免费观看视频高清| 在线观看美女被高潮喷水网站| 精品久久国产蜜桃| 亚洲精品乱码久久久久久按摩| 两个人的视频大全免费| 在线观看美女被高潮喷水网站| 亚洲欧美精品自产自拍| 在线天堂最新版资源| 午夜福利在线观看免费完整高清在| 久久人妻熟女aⅴ| 三级国产精品欧美在线观看| 国产免费福利视频在线观看| 纵有疾风起免费观看全集完整版| 三级国产精品欧美在线观看| 国产极品天堂在线| 又大又黄又爽视频免费| 亚洲国产精品专区欧美| 日韩三级伦理在线观看| 少妇的逼好多水| √禁漫天堂资源中文www| 丰满乱子伦码专区| 久久青草综合色| a 毛片基地| 999精品在线视频| 日本欧美视频一区| 亚洲欧美成人精品一区二区| 一本久久精品| 丝袜脚勾引网站| 在线亚洲精品国产二区图片欧美 | 女人久久www免费人成看片| 亚洲精品aⅴ在线观看| 亚洲精品日韩av片在线观看| 亚洲国产av影院在线观看| 精品久久久久久久久av| 国产成人av激情在线播放 | tube8黄色片| 一区二区日韩欧美中文字幕 | 免费观看的影片在线观看| 91精品国产国语对白视频| 国产精品嫩草影院av在线观看| 久久久久国产精品人妻一区二区| 欧美亚洲日本最大视频资源| 久久久国产欧美日韩av| 人人妻人人爽人人添夜夜欢视频| 免费观看在线日韩| 久久久亚洲精品成人影院| 国产午夜精品久久久久久一区二区三区| 婷婷色综合大香蕉| 日韩三级伦理在线观看| 综合色丁香网| 免费观看的影片在线观看| 少妇熟女欧美另类| 中文字幕制服av| 欧美一级a爱片免费观看看| 一区二区日韩欧美中文字幕 | 日韩精品免费视频一区二区三区 | 十八禁高潮呻吟视频| 秋霞伦理黄片| 性高湖久久久久久久久免费观看| 免费观看av网站的网址| 亚洲av国产av综合av卡| 视频区图区小说| 少妇的逼好多水| 天美传媒精品一区二区| 亚洲精品日本国产第一区| 国产精品久久久久久精品古装| 黑人巨大精品欧美一区二区蜜桃 | 欧美变态另类bdsm刘玥| 九草在线视频观看| 在线天堂最新版资源| 国产精品一国产av| 日本vs欧美在线观看视频| 免费av中文字幕在线| 中文字幕av电影在线播放| av女优亚洲男人天堂| 欧美成人午夜免费资源| 国产淫语在线视频| 十八禁网站网址无遮挡| 夜夜看夜夜爽夜夜摸| 久久99蜜桃精品久久| 精品久久蜜臀av无| 国产av国产精品国产| 最近2019中文字幕mv第一页| 亚洲不卡免费看| 亚洲人成网站在线观看播放| 91午夜精品亚洲一区二区三区| 99视频精品全部免费 在线| 欧美日韩一区二区视频在线观看视频在线| 国产成人精品无人区| 啦啦啦啦在线视频资源| 最近的中文字幕免费完整| 亚洲精品一区蜜桃| 99re6热这里在线精品视频| 欧美xxⅹ黑人| 免费播放大片免费观看视频在线观看| 伦理电影免费视频| 一区二区三区乱码不卡18| 久久久精品区二区三区| 免费少妇av软件| 性高湖久久久久久久久免费观看| 日韩av不卡免费在线播放| 26uuu在线亚洲综合色| 久久ye,这里只有精品| 高清欧美精品videossex| 亚洲av综合色区一区| 久久这里有精品视频免费| 亚洲人成77777在线视频| av国产久精品久网站免费入址| 99热6这里只有精品| 精品亚洲成a人片在线观看| 国产在线免费精品| 高清黄色对白视频在线免费看| 最新中文字幕久久久久| 精品久久国产蜜桃| 美女cb高潮喷水在线观看| 精品亚洲成a人片在线观看| 人人妻人人爽人人添夜夜欢视频| 欧美精品一区二区大全| 日韩制服骚丝袜av| 亚洲av电影在线观看一区二区三区| 大香蕉97超碰在线| 久久精品国产亚洲av天美| 人人妻人人爽人人添夜夜欢视频| av网站免费在线观看视频| 久久久久久伊人网av| av卡一久久| 国产无遮挡羞羞视频在线观看| 精品人妻偷拍中文字幕| 制服诱惑二区| 久久久久人妻精品一区果冻| 九色亚洲精品在线播放| 久久国产精品男人的天堂亚洲 | 精品久久久噜噜| 成年人免费黄色播放视频| 汤姆久久久久久久影院中文字幕| 七月丁香在线播放| 黄色毛片三级朝国网站| 妹子高潮喷水视频| 日韩在线高清观看一区二区三区| av.在线天堂| 亚洲综合色惰| av卡一久久| 亚洲国产成人一精品久久久| www.av在线官网国产| 国产精品无大码| 亚洲国产精品一区三区| 热re99久久精品国产66热6| 欧美激情 高清一区二区三区| 久久热精品热| 2018国产大陆天天弄谢| 成年人午夜在线观看视频| av专区在线播放| 日本黄大片高清| 亚洲av男天堂| 嫩草影院入口| 久久久久久人妻| 五月开心婷婷网| 亚洲美女视频黄频| 国产成人a∨麻豆精品| 成人二区视频| 色5月婷婷丁香| 黄片无遮挡物在线观看| 亚洲欧洲日产国产| 日韩免费高清中文字幕av| 高清毛片免费看| .国产精品久久| 极品人妻少妇av视频| videossex国产| 老熟女久久久| 人体艺术视频欧美日本| 91国产中文字幕| 欧美性感艳星| 黄色视频在线播放观看不卡| 99久久精品一区二区三区| 一级,二级,三级黄色视频| 2018国产大陆天天弄谢| 热99国产精品久久久久久7| 亚洲少妇的诱惑av| 国产免费现黄频在线看| 日韩精品有码人妻一区| 亚洲欧美日韩卡通动漫| 亚洲国产欧美日韩在线播放| 久久亚洲国产成人精品v| 欧美亚洲 丝袜 人妻 在线| 九色成人免费人妻av| 亚洲四区av| 中文字幕人妻熟人妻熟丝袜美| 国产高清不卡午夜福利| 又大又黄又爽视频免费| 91精品伊人久久大香线蕉| 狠狠精品人妻久久久久久综合| 尾随美女入室| 日本av免费视频播放| 天堂8中文在线网| a级毛色黄片| 久久av网站| 日韩不卡一区二区三区视频在线| 免费观看的影片在线观看| 欧美97在线视频| 永久网站在线| 亚洲内射少妇av| 亚洲精品第二区| 高清视频免费观看一区二区| av在线观看视频网站免费| 狂野欧美激情性xxxx在线观看| a级毛色黄片| 日本欧美视频一区| 亚洲成色77777| 极品人妻少妇av视频| 一区二区三区乱码不卡18| 亚洲精品乱码久久久v下载方式| 看十八女毛片水多多多| 又大又黄又爽视频免费| 日日爽夜夜爽网站| 亚洲av在线观看美女高潮| 精品国产露脸久久av麻豆| 各种免费的搞黄视频| 老司机影院成人| 少妇的逼水好多| 成人毛片60女人毛片免费| 少妇的逼好多水| 国产老妇伦熟女老妇高清| 精品一品国产午夜福利视频| 国产永久视频网站| 亚洲国产欧美在线一区| 色婷婷久久久亚洲欧美| 午夜免费观看性视频| 天天躁夜夜躁狠狠久久av| 国产精品女同一区二区软件| 999精品在线视频| 日本黄色日本黄色录像| 26uuu在线亚洲综合色| 成人无遮挡网站| 又黄又爽又刺激的免费视频.| 国产免费一级a男人的天堂| 午夜激情久久久久久久| 亚洲五月色婷婷综合| 亚洲,欧美,日韩| 精品国产一区二区久久| 男男h啪啪无遮挡| 久久久国产欧美日韩av| 91久久精品电影网| 国产精品一区二区在线不卡| 韩国高清视频一区二区三区| 99国产精品免费福利视频| 国产欧美日韩综合在线一区二区| 亚洲婷婷狠狠爱综合网| 国产成人精品一,二区| 高清午夜精品一区二区三区| 亚洲av福利一区| 亚洲精品第二区| 精品人妻熟女毛片av久久网站| 少妇被粗大猛烈的视频| 成人无遮挡网站| 又黄又爽又刺激的免费视频.| 交换朋友夫妻互换小说| 黑人猛操日本美女一级片| 亚洲精品456在线播放app| 精品少妇久久久久久888优播| 纯流量卡能插随身wifi吗| 熟女电影av网| 九色成人免费人妻av| 国产亚洲一区二区精品| 看十八女毛片水多多多| 五月玫瑰六月丁香| 欧美xxxx性猛交bbbb| 久久av网站| 草草在线视频免费看| 性色avwww在线观看| 在线观看免费视频网站a站| 午夜日本视频在线| 久久久久人妻精品一区果冻| 99热这里只有精品一区| 免费观看av网站的网址| 国产男人的电影天堂91| 亚洲精品第二区| 国产精品.久久久| 少妇的逼好多水| 嘟嘟电影网在线观看| 夫妻性生交免费视频一级片| 大片电影免费在线观看免费| 人妻系列 视频| 少妇高潮的动态图| av免费在线看不卡| 人妻少妇偷人精品九色| 免费看光身美女| 成人国语在线视频| 久久久久国产精品人妻一区二区| 亚洲国产日韩一区二区| 国产精品人妻久久久影院| 97精品久久久久久久久久精品| 国产探花极品一区二区| 亚洲精品色激情综合| 韩国av在线不卡| 欧美激情国产日韩精品一区| 桃花免费在线播放| 免费黄色在线免费观看| 国产伦理片在线播放av一区| 少妇人妻 视频| 51国产日韩欧美| 国产成人精品福利久久| 97超视频在线观看视频| 少妇熟女欧美另类| 女性生殖器流出的白浆| 有码 亚洲区| 欧美3d第一页| 欧美日韩综合久久久久久| 成人18禁高潮啪啪吃奶动态图 | 国产伦理片在线播放av一区| 少妇丰满av| 免费日韩欧美在线观看| 亚洲无线观看免费| 国产成人免费观看mmmm| 99热6这里只有精品| 久久久久久久久久久免费av| 少妇的逼好多水| 亚洲人成网站在线播| 两个人的视频大全免费| 人人澡人人妻人| 高清在线视频一区二区三区| 亚洲av国产av综合av卡| av电影中文网址| 久久精品国产亚洲av涩爱| 国产精品人妻久久久影院| 免费看av在线观看网站| 国产有黄有色有爽视频| 欧美性感艳星| 蜜桃久久精品国产亚洲av| 欧美精品一区二区大全| 男男h啪啪无遮挡| 国产不卡av网站在线观看| 一区二区三区精品91| 亚洲高清免费不卡视频| 少妇的逼水好多| 久久久久久伊人网av| 麻豆乱淫一区二区| 亚洲成人av在线免费| 欧美国产精品一级二级三级| 熟妇人妻不卡中文字幕| 成人毛片60女人毛片免费| 久久99热这里只频精品6学生| av在线老鸭窝| 成人手机av| 高清欧美精品videossex| 国产欧美亚洲国产| 一边亲一边摸免费视频| 乱人伦中国视频| 亚洲av国产av综合av卡| 国模一区二区三区四区视频| av专区在线播放| 菩萨蛮人人尽说江南好唐韦庄| 三级国产精品片| 久久99一区二区三区| 国精品久久久久久国模美| 另类精品久久| 肉色欧美久久久久久久蜜桃| 国产成人免费无遮挡视频| h视频一区二区三区| 免费播放大片免费观看视频在线观看| 少妇被粗大猛烈的视频| 亚洲高清免费不卡视频| 一区二区日韩欧美中文字幕 | 老司机影院毛片| 国产日韩一区二区三区精品不卡 | 亚洲成人av在线免费| 青春草亚洲视频在线观看| videos熟女内射| 美女主播在线视频| 九色亚洲精品在线播放| 全区人妻精品视频| 免费观看性生交大片5| 国产亚洲av片在线观看秒播厂| 欧美日韩在线观看h| 国产精品久久久久久精品电影小说| 性高湖久久久久久久久免费观看| 国产高清国产精品国产三级| 久久久国产欧美日韩av| 如日韩欧美国产精品一区二区三区 | 日韩人妻高清精品专区| 大片免费播放器 马上看| 99国产精品免费福利视频| 2018国产大陆天天弄谢| videos熟女内射| 最黄视频免费看| 一级黄片播放器| 永久免费av网站大全| 亚洲成人手机| 99久久中文字幕三级久久日本| 午夜福利影视在线免费观看| 日韩在线高清观看一区二区三区| 日韩精品有码人妻一区| 简卡轻食公司| 国产熟女欧美一区二区| 日本爱情动作片www.在线观看| 80岁老熟妇乱子伦牲交| 久久久久视频综合| 久久久久久久大尺度免费视频| a级毛片在线看网站| 性色avwww在线观看| 大香蕉久久网| 亚洲情色 制服丝袜| 另类亚洲欧美激情| 国产国拍精品亚洲av在线观看| av黄色大香蕉| 亚洲天堂av无毛| 国产黄色视频一区二区在线观看| 狠狠婷婷综合久久久久久88av| 黄色毛片三级朝国网站| 午夜福利,免费看| 国产国拍精品亚洲av在线观看| 一级爰片在线观看| 视频区图区小说| 性色av一级| 亚洲精品亚洲一区二区| 久久狼人影院| 高清视频免费观看一区二区| 免费久久久久久久精品成人欧美视频 | 国产白丝娇喘喷水9色精品| 激情五月婷婷亚洲| 免费黄频网站在线观看国产| 欧美精品人与动牲交sv欧美| 丰满少妇做爰视频| 国产成人精品福利久久| 午夜免费鲁丝| 国产精品人妻久久久久久| 亚洲国产欧美在线一区| av黄色大香蕉| 国产国语露脸激情在线看| 久久精品久久久久久久性| 亚洲av欧美aⅴ国产| 免费观看无遮挡的男女| 另类亚洲欧美激情| 九色成人免费人妻av| 精品亚洲成国产av| 男人操女人黄网站| 九色亚洲精品在线播放| 国产有黄有色有爽视频| 18禁在线无遮挡免费观看视频| 十八禁网站网址无遮挡| 18禁在线播放成人免费| av视频免费观看在线观看| 少妇的逼好多水| 亚洲av成人精品一区久久| 日日撸夜夜添| 国产乱人偷精品视频| 亚洲色图 男人天堂 中文字幕 | 在线观看美女被高潮喷水网站| 日韩在线高清观看一区二区三区| 激情五月婷婷亚洲| 男人添女人高潮全过程视频| 精品一区二区免费观看| 特大巨黑吊av在线直播| 日韩中字成人| 蜜桃国产av成人99| 制服诱惑二区| 亚洲精品中文字幕在线视频| 亚洲激情五月婷婷啪啪| 久久久久网色| 夜夜看夜夜爽夜夜摸| 高清欧美精品videossex| 国产精品.久久久| 免费观看性生交大片5| 十八禁网站网址无遮挡| 日韩三级伦理在线观看| 亚洲国产毛片av蜜桃av| 最近最新中文字幕免费大全7| 精品亚洲乱码少妇综合久久| 成人黄色视频免费在线看| 免费看av在线观看网站| 亚洲精品,欧美精品| 少妇 在线观看| 亚洲av日韩在线播放| 春色校园在线视频观看| 插逼视频在线观看| 亚洲成人手机| 精品酒店卫生间| 啦啦啦中文免费视频观看日本| 少妇高潮的动态图| 亚洲精品av麻豆狂野| 免费大片黄手机在线观看| 人人妻人人添人人爽欧美一区卜| 在线播放无遮挡| 青春草亚洲视频在线观看| 亚洲精华国产精华液的使用体验| 精品一区在线观看国产| 黄色欧美视频在线观看| 大码成人一级视频| 涩涩av久久男人的天堂| 日日撸夜夜添| 日本91视频免费播放| 日韩大片免费观看网站| 乱码一卡2卡4卡精品| 一区二区av电影网| 亚洲成人一二三区av| 国产精品国产三级专区第一集| 麻豆精品久久久久久蜜桃| 亚洲av国产av综合av卡| 日韩一区二区三区影片| 亚洲av中文av极速乱| 人妻系列 视频| 一区在线观看完整版| 女的被弄到高潮叫床怎么办| 久久精品久久久久久噜噜老黄| 亚洲国产成人一精品久久久| 欧美日韩在线观看h| 国产精品久久久久久精品古装| 街头女战士在线观看网站| 中文乱码字字幕精品一区二区三区| 久久人妻熟女aⅴ| 老司机影院成人| 男的添女的下面高潮视频| 中文乱码字字幕精品一区二区三区| 寂寞人妻少妇视频99o| 熟女人妻精品中文字幕| 最新的欧美精品一区二区| 丰满饥渴人妻一区二区三| 欧美精品一区二区免费开放| 能在线免费看毛片的网站| 欧美变态另类bdsm刘玥| 观看av在线不卡| 大香蕉97超碰在线| 熟女av电影| www.色视频.com| 丝袜脚勾引网站| 日韩,欧美,国产一区二区三区| 日本vs欧美在线观看视频| 国产免费一区二区三区四区乱码| 伊人久久国产一区二区| 色94色欧美一区二区| 国产伦精品一区二区三区视频9| 国内精品宾馆在线| 成人亚洲欧美一区二区av| 欧美日韩国产mv在线观看视频| 老司机影院毛片| 免费观看的影片在线观看| 人成视频在线观看免费观看| 一级黄片播放器| 欧美日韩视频精品一区| 成年av动漫网址| 成人国产av品久久久| 搡老乐熟女国产| 免费看光身美女| 国产精品久久久久久av不卡| 成年美女黄网站色视频大全免费 | 亚洲国产精品一区二区三区在线| 99久国产av精品国产电影| 交换朋友夫妻互换小说| 欧美xxxx性猛交bbbb| 成人黄色视频免费在线看| 亚洲精品乱码久久久v下载方式| 日韩三级伦理在线观看| 80岁老熟妇乱子伦牲交| 国产综合精华液| 看免费成人av毛片|