• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    MPD:結(jié)點(diǎn)具有多個(gè)并行緩存一致性域的CC-NUMA系統(tǒng)

    2017-11-07 08:38:52陳繼承趙雅倩李一韓王恩東史宏志唐士斌
    關(guān)鍵詞:結(jié)點(diǎn)遠(yuǎn)端處理器

    陳繼承 趙雅倩 李一韓 王恩東 史宏志 唐士斌

    (高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室(浪潮集團(tuán)有限公司) 北京 100085)

    (chenjch@inspur.com)

    緩存一致性維護(hù)是影響高速緩存一致性非均勻存儲(chǔ)訪問(wèn)(cache coherence non-uniform memory access, CC-NUMA)系統(tǒng)性能的關(guān)鍵因素.早期的CC-NUMA系統(tǒng)中,處理器數(shù)量較少,各處理器間直接互連,系統(tǒng)采用單級(jí)一致性域設(shè)計(jì)即可滿足系統(tǒng)性能需求.但隨著系統(tǒng)規(guī)模的擴(kuò)展,單級(jí)一致性域系統(tǒng)的處理器互連結(jié)構(gòu)越來(lái)越復(fù)雜,消息全局性傳播引發(fā)的網(wǎng)絡(luò)阻塞延遲越來(lái)越大,緩存一致性維護(hù)開銷急劇增長(zhǎng),嚴(yán)重影響系統(tǒng)性能與擴(kuò)展性.因此,8路以上的CC-NUMA系統(tǒng)通常采用兩級(jí)一致性域設(shè)計(jì)抑制緩存一致性維護(hù)開銷,即:多個(gè)處理器互連組成結(jié)點(diǎn)后形成結(jié)點(diǎn)內(nèi)一致性域,多個(gè)結(jié)點(diǎn)互連組成系統(tǒng)后形成結(jié)點(diǎn)間一致性域,兩級(jí)一致性域間的協(xié)議轉(zhuǎn)換通過(guò)一致性協(xié)同芯片(coherence chip, CC)實(shí)現(xiàn)[1-3].該方法可將一致性維護(hù)操作盡量限制在局部區(qū)域以避免一致性消息的全局傳播,避免了單級(jí)一致性域造成的系統(tǒng)互連結(jié)構(gòu)復(fù)雜、跨處理器訪問(wèn)跳步數(shù)多、高負(fù)載下阻塞延遲急劇增長(zhǎng)等難題[4],從而使系統(tǒng)性能得到有效擴(kuò)展.

    受限于處理器的直連能力和處理器可識(shí)別的ID數(shù),CC-NUMA系統(tǒng)所能構(gòu)建的單結(jié)點(diǎn)規(guī)模有限,系統(tǒng)擴(kuò)展只能通過(guò)增加結(jié)點(diǎn)數(shù)目來(lái)實(shí)現(xiàn).但是,結(jié)點(diǎn)數(shù)目的增加會(huì)導(dǎo)致一致性目錄存儲(chǔ)開銷上升、跨結(jié)點(diǎn)訪問(wèn)跳步數(shù)和延遲增大、系統(tǒng)規(guī)模無(wú)法進(jìn)一步有效擴(kuò)展.針對(duì)上述問(wèn)題,當(dāng)前CC-NUMA系統(tǒng)采用目錄優(yōu)化[5]、片外緩存擴(kuò)展[6-8]、緩存數(shù)據(jù)預(yù)取[9-11]、一致性協(xié)議優(yōu)化[12-14]等方法來(lái)降低跨結(jié)點(diǎn)訪問(wèn)頻度,減少一致性開銷.

    然而,上述優(yōu)化方法都是通過(guò)減少跨結(jié)點(diǎn)訪問(wèn)頻度間接減少平均訪問(wèn)延遲,對(duì)系統(tǒng)拓?fù)浣Y(jié)構(gòu)沒(méi)有改變,沒(méi)有縮短跨結(jié)點(diǎn)訪問(wèn)路徑和跳步數(shù).針對(duì)該問(wèn)題,本文提出了一種可任意配置結(jié)點(diǎn)內(nèi)處理器規(guī)模的CC-NUMA系統(tǒng)——多并行緩存一致性域(multiple parallel cache coherency domain, MPD).該系統(tǒng)通過(guò)在結(jié)點(diǎn)內(nèi)構(gòu)建多個(gè)并行緩存一致性域來(lái)擴(kuò)大單結(jié)點(diǎn)規(guī)模,使其不再受限于處理器直連能力和處理器可識(shí)別ID數(shù),從而減少系統(tǒng)結(jié)點(diǎn)數(shù)量,簡(jiǎn)化系統(tǒng)拓?fù)浣Y(jié)構(gòu),縮短訪問(wèn)路徑和跳步數(shù),直接減少系統(tǒng)平均訪問(wèn)延遲.同時(shí),由于結(jié)點(diǎn)內(nèi)的多個(gè)緩存一致性域之間是并行關(guān)系,連接至1個(gè)一致性協(xié)同芯片,共同構(gòu)成結(jié)點(diǎn)內(nèi)一致性域,所以,與傳統(tǒng)CC-NUMA系統(tǒng)相比,MPD系統(tǒng)并未增加緩存一致性域的層級(jí).

    1 兩級(jí)一致性域CC-NUMA系統(tǒng)

    為減少緩存遠(yuǎn)端訪問(wèn)頻率,降低緩存一致性維護(hù)開銷,CC-NUMA系統(tǒng)通常將緩存資源劃分為2個(gè)一致性同步域,使用兩級(jí)緩存一致性協(xié)議對(duì)各一致性域進(jìn)行一致性管理.圖1是一個(gè)典型的多結(jié)點(diǎn)CC-NUMA系統(tǒng),包含結(jié)點(diǎn)內(nèi)一致性域和結(jié)點(diǎn)間一致性域的兩級(jí)緩存一致性域.

    1) 結(jié)點(diǎn)內(nèi)一致性域.n個(gè)處理器與1個(gè)一致性協(xié)同芯片互連,構(gòu)成結(jié)點(diǎn)內(nèi)一致性域,維護(hù)的是本結(jié)點(diǎn)內(nèi)n個(gè)處理器間的緩存一致性.

    2) 結(jié)點(diǎn)間一致性域.M個(gè)結(jié)點(diǎn)通過(guò)一致性協(xié)同芯片互連,構(gòu)成結(jié)點(diǎn)間一致性域,維護(hù)的是系統(tǒng)內(nèi)各結(jié)點(diǎn)間的緩存一致性.

    兩級(jí)一致性域系統(tǒng)中,一致性協(xié)同芯片用于維護(hù)兩級(jí)一致性協(xié)議的轉(zhuǎn)換和維護(hù),該芯片通常包含遠(yuǎn)端代理(remote proxy, RP)和本地代理(local proxy, LP)兩個(gè)處理單元.

    1) RP.結(jié)點(diǎn)一致性協(xié)同芯片的遠(yuǎn)端內(nèi)存代理,存儲(chǔ)遠(yuǎn)端地址數(shù)據(jù)在本地結(jié)點(diǎn)內(nèi)處理器的一致性狀態(tài),監(jiān)控本地處理器對(duì)遠(yuǎn)端地址的請(qǐng)求,可與本地處理器及遠(yuǎn)端結(jié)點(diǎn)一致性協(xié)同芯片的LP單元進(jìn)行通信.

    2) LP.結(jié)點(diǎn)一致性協(xié)同芯片的本地內(nèi)存代理,存儲(chǔ)本結(jié)點(diǎn)地址的數(shù)據(jù)在其他遠(yuǎn)端結(jié)點(diǎn)的一致性狀態(tài),監(jiān)控遠(yuǎn)端結(jié)點(diǎn)對(duì)本地地址的請(qǐng)求,可與本地根目錄及遠(yuǎn)端結(jié)點(diǎn)一致性協(xié)同芯片的RP單元進(jìn)行通信.

    偵聽與目錄是對(duì)緩存一致性信息的2種處理方式[15].由于偵聽協(xié)議可擴(kuò)展性差,所以,CC-NUMA系統(tǒng)多采用基于目錄的緩存一致性協(xié)議.結(jié)點(diǎn)一致性協(xié)同芯片的緩存一致性目錄記錄了各緩存行的一致性狀態(tài)(State)、共享列表(Share List)和寫權(quán)限擁有者(Owner),按緩存數(shù)據(jù)地址的不同,分別由RP與LP單元維護(hù)與更新.

    RP目錄存儲(chǔ)了遠(yuǎn)端數(shù)據(jù)在本結(jié)點(diǎn)的一致性狀態(tài)信息,目錄項(xiàng)如圖2所示:

    1) State——狀態(tài)位,記錄遠(yuǎn)端數(shù)據(jù)在本結(jié)點(diǎn)的一致性狀態(tài),其長(zhǎng)度與協(xié)議有關(guān),如MI協(xié)議占用1 b,MESI協(xié)議占用2 b;

    2) Share List——共享列表,記錄遠(yuǎn)端數(shù)據(jù)在本地結(jié)點(diǎn)內(nèi)處理器的一致性狀態(tài),其長(zhǎng)度與目錄實(shí)現(xiàn)技術(shù)有關(guān),如全映射目錄[3]的共享列表長(zhǎng)度為n;

    3) Owner——寫權(quán)限擁有者,記錄遠(yuǎn)端數(shù)據(jù)在本結(jié)點(diǎn)內(nèi)處于ME態(tài)的處理器ID,其長(zhǎng)度為n.

    LP目錄存儲(chǔ)了本地?cái)?shù)據(jù)在遠(yuǎn)端結(jié)點(diǎn)的一致性狀態(tài)信息,目錄項(xiàng)如圖3所示:

    Fig. 3 LP directory entry in CC-NUMA system圖3 CC-NUMA系統(tǒng)結(jié)點(diǎn)一致性協(xié)同芯片LP目錄項(xiàng)

    1) State——狀態(tài)位,記錄本地?cái)?shù)據(jù)在本結(jié)點(diǎn)的一致性狀態(tài);

    2) Share List——共享列表,記錄本地?cái)?shù)據(jù)在本結(jié)點(diǎn)i之外的所有遠(yuǎn)端結(jié)點(diǎn)的一致性狀態(tài),全映射目錄的共享列表長(zhǎng)度為M-1;

    3) Owner——寫權(quán)限擁有者,記錄本地?cái)?shù)據(jù)在遠(yuǎn)端結(jié)點(diǎn)處于ME態(tài)的遠(yuǎn)端結(jié)點(diǎn)ID,其長(zhǎng)度為M-1.

    2 MPD系統(tǒng)

    2.1 MPD系統(tǒng)結(jié)構(gòu)

    MPD系統(tǒng)是一個(gè)結(jié)點(diǎn)內(nèi)包含多個(gè)并行緩存一致性域的CC-NUMA系統(tǒng).如圖4所示,n個(gè)處理器與結(jié)點(diǎn)一致性協(xié)同芯片緊耦合互連,構(gòu)成1個(gè)緩存一致性域(cache coherence domain, CCD);k個(gè)緩存一致性域并行連接至1個(gè)結(jié)點(diǎn)一致性協(xié)同芯片,共同構(gòu)成結(jié)點(diǎn)內(nèi)一致性域;m個(gè)結(jié)點(diǎn)通過(guò)結(jié)點(diǎn)一致性協(xié)同芯片互連,構(gòu)成結(jié)點(diǎn)間一致性域,m=Mk.與圖1的CC-NUMA系統(tǒng)相比,圖4的MPD系統(tǒng)結(jié)點(diǎn)數(shù)量縮減為原系統(tǒng)的1k.

    MPD系統(tǒng)中,結(jié)點(diǎn)內(nèi)的多個(gè)緩存一致性域并行連接至1個(gè)一致性協(xié)同芯片,并由該協(xié)同芯片統(tǒng)一維護(hù)其結(jié)點(diǎn)內(nèi)的緩存一致性,也就是說(shuō),這些并行的緩存一致性域并不單獨(dú)維護(hù)一致性域.所以,MPD系統(tǒng)的一致性域設(shè)計(jì)與CC-NUMA系統(tǒng)相同,都是結(jié)點(diǎn)內(nèi)結(jié)點(diǎn)間兩級(jí)一致性域架構(gòu),使用兩級(jí)緩存一致性協(xié)議,兩級(jí)一致性域間的協(xié)議轉(zhuǎn)換通過(guò)一致性協(xié)同芯片實(shí)現(xiàn).

    1) 結(jié)點(diǎn)內(nèi)一致性域.k個(gè)緩存一致性域與1個(gè)一致性協(xié)同芯片互連,構(gòu)成結(jié)點(diǎn)內(nèi)一致性域,由本結(jié)點(diǎn)的一致性協(xié)同芯片統(tǒng)一維護(hù)結(jié)點(diǎn)內(nèi)nk個(gè)處理器間的緩存一致性.

    Fig. 4 MPD system with multiple clumps圖4 多結(jié)點(diǎn)MPD系統(tǒng)

    2) 結(jié)點(diǎn)間一致性域.m個(gè)結(jié)點(diǎn)通過(guò)一致性協(xié)同芯片互連,構(gòu)成結(jié)點(diǎn)間一致性域,由各結(jié)點(diǎn)的一致性協(xié)同芯片共同維護(hù)系統(tǒng)各結(jié)點(diǎn)間的緩存一致性.

    與CC-NUMA系統(tǒng)類似,MPD系統(tǒng)的結(jié)點(diǎn)一致性協(xié)同芯片也包括遠(yuǎn)端代理RP和本地代理LP這2個(gè)處理單元,但邏輯功能和通信單元略有差異,主要是對(duì)LP進(jìn)行了功能擴(kuò)展,以同時(shí)維護(hù)結(jié)點(diǎn)內(nèi)所有處理器的緩存一致性.

    1) RP.結(jié)點(diǎn)一致性協(xié)同芯片的遠(yuǎn)端內(nèi)存代理,存儲(chǔ)遠(yuǎn)端地址數(shù)據(jù)在本地結(jié)點(diǎn)內(nèi)(含本結(jié)點(diǎn)內(nèi)所有緩存一致性域)處理器的一致性狀態(tài),監(jiān)控本結(jié)點(diǎn)內(nèi)所有處理器對(duì)遠(yuǎn)端地址的請(qǐng)求,可與本結(jié)點(diǎn)內(nèi)處理器或遠(yuǎn)端結(jié)點(diǎn)一致性協(xié)同芯片的LP單元進(jìn)行通信.

    2) LP.結(jié)點(diǎn)一致性協(xié)同芯片的本地內(nèi)存代理,存儲(chǔ)結(jié)點(diǎn)內(nèi)各緩存一致性域的本地?cái)?shù)據(jù)在本結(jié)點(diǎn)內(nèi)其他緩存一致性域各處理器以及系統(tǒng)內(nèi)所有遠(yuǎn)端結(jié)點(diǎn)的一致性狀態(tài),監(jiān)控各緩存一致性域?qū)Y(jié)點(diǎn)內(nèi)其他緩存一致性域的請(qǐng)求以及遠(yuǎn)端結(jié)點(diǎn)對(duì)本地地址的請(qǐng)求,可與本結(jié)點(diǎn)內(nèi)處理器、根目錄以及遠(yuǎn)端結(jié)點(diǎn)一致性協(xié)同芯片的RP單元進(jìn)行通信.

    從CC-NUMA與MPD系統(tǒng)中RP與LP的邏輯功能對(duì)比來(lái)看,MPD系統(tǒng)中的RP與LP單元需要存儲(chǔ)更多處理器的一致性狀態(tài)信息,所以需要對(duì)CC-NUMA系統(tǒng)的一致性協(xié)同芯片目錄的共享列表進(jìn)行擴(kuò)展.

    RP目錄存儲(chǔ)了遠(yuǎn)端數(shù)據(jù)在本結(jié)點(diǎn)內(nèi)所有并行緩存一致性域的一致性狀態(tài)信息,目錄項(xiàng)如圖5所示.

    1) State——狀態(tài)位,記錄遠(yuǎn)端數(shù)據(jù)在本結(jié)點(diǎn)的一致性狀態(tài);

    2) Share List——共享列表,記錄遠(yuǎn)端數(shù)據(jù)在本地結(jié)點(diǎn)所有緩存一致性域內(nèi)處理器的一致性狀態(tài),全映射目錄的共享列表長(zhǎng)度為nk;

    3) Owner——寫權(quán)限擁有者,記錄遠(yuǎn)端數(shù)據(jù)在本結(jié)點(diǎn)內(nèi)處于ME態(tài)的處理器ID,其長(zhǎng)度為lb(nk).

    Fig. 5 RP directory entry in MPD system圖5 MPD系統(tǒng)RP目錄項(xiàng)

    LP目錄存儲(chǔ)了本結(jié)點(diǎn)各緩存一致性域的本地?cái)?shù)據(jù)在結(jié)點(diǎn)內(nèi)其他并行緩存一致性域以及系統(tǒng)遠(yuǎn)端結(jié)點(diǎn)的一致性狀態(tài)信息,目錄項(xiàng)如圖6所示.

    1) State——狀態(tài)位,記錄本地?cái)?shù)據(jù)在本結(jié)點(diǎn)的一致性狀態(tài);

    3) Owner——寫權(quán)限擁有者,記錄本地?cái)?shù)據(jù)在遠(yuǎn)端結(jié)點(diǎn)處于ME態(tài)的遠(yuǎn)端結(jié)點(diǎn)ID,或緩存一致性域本地?cái)?shù)據(jù)在結(jié)點(diǎn)內(nèi)其他緩存一致性域處于ME態(tài)的處理器ID,長(zhǎng)度為

    Fig. 6 LP directory entry in MPD system圖6 MPD系統(tǒng)LP目錄項(xiàng)

    2.2 MPD系統(tǒng)的緩存一致性訪問(wèn)

    雖然MPD系統(tǒng)與CC-NUMA系統(tǒng)的緩存一致性域?qū)哟蜗嗤?,但兩者的系統(tǒng)架構(gòu)不同,因此,2種系統(tǒng)的緩存一致性交互流程略有不同.

    1) 緩存一致性域內(nèi)訪問(wèn)

    MPD系統(tǒng)與CC-NUMA系統(tǒng)的緩存一致性域結(jié)構(gòu)相同,都是由多個(gè)處理器與一致性協(xié)同芯片互連而成,因此,兩者的緩存一致性域內(nèi)訪問(wèn)流程相同,均為CPU與根目錄直接交互,如圖7所示:

    Fig. 7 Access within the same CCD in CC-NUMA or MPD system圖7 CC-NUMA系統(tǒng)與MPD系統(tǒng)的緩存一致性域內(nèi)訪問(wèn)

    2) 緩存一致性域間訪問(wèn)

    CC-NUMA系統(tǒng)內(nèi),結(jié)點(diǎn)內(nèi)一致性域由單個(gè)緩存一致性域構(gòu)成,所以,緩存一致性域間訪問(wèn)即為結(jié)點(diǎn)間一致性訪問(wèn),如圖8所示:

    Fig. 8 Access between different CCDs in CC-NUMA system圖8 CC-NUMA系統(tǒng)的緩存一致性域間(結(jié)點(diǎn)間)訪問(wèn)

    MPD系統(tǒng)內(nèi),單個(gè)結(jié)點(diǎn)一致性域內(nèi)包含多個(gè)緩存一致性域,因此,MPD系統(tǒng)的緩存一致性域間訪問(wèn)包含了結(jié)點(diǎn)內(nèi)的緩存一致性域間訪問(wèn)和結(jié)點(diǎn)間的緩存一致性域間訪問(wèn)2種類型,如圖9所示:

    Fig. 9 Access between CCDs in MPD system圖9 MPD系統(tǒng)的緩存一致性域間訪問(wèn)

    圖9(a)描述了MPD系統(tǒng)獨(dú)有的結(jié)點(diǎn)內(nèi)跨緩存一致性域訪問(wèn),它將CC-NUMA系統(tǒng)中的遠(yuǎn)端跨結(jié)點(diǎn)訪問(wèn)轉(zhuǎn)換為近端結(jié)點(diǎn)內(nèi)跨域訪問(wèn),僅與本地一致性協(xié)同芯片進(jìn)行交互;圖9(b)描述了與CC-NUMA系統(tǒng)相同的結(jié)點(diǎn)間的緩存一致性域間訪問(wèn),需與本地一致性協(xié)同芯片及遠(yuǎn)端一致性協(xié)同芯片進(jìn)行交互.

    從2種系統(tǒng)的緩存一致性交互流程描述來(lái)看,MPD系統(tǒng)中的緩存一致性訪問(wèn)分為3類:

    1) 結(jié)點(diǎn)內(nèi)的緩存一致性域內(nèi)訪問(wèn).該類訪問(wèn)對(duì)應(yīng)CC-NUMA系統(tǒng)的結(jié)點(diǎn)一致性內(nèi)訪問(wèn)(即緩存一致性域內(nèi)訪問(wèn)),兩者開銷相同.

    2) 結(jié)點(diǎn)內(nèi)的緩存一致性域間訪問(wèn).該類訪問(wèn)對(duì)應(yīng)CC-NUMA系統(tǒng)中的結(jié)點(diǎn)間訪問(wèn),前者僅通過(guò)本地CC即可進(jìn)行交互,而后者需要通過(guò)本地CC與遠(yuǎn)端CC才可進(jìn)行交互,前者開銷小于后者.

    3) 結(jié)點(diǎn)間的緩存一致性域間訪問(wèn).該類訪問(wèn)對(duì)應(yīng)CC-NUMA系統(tǒng)中的結(jié)點(diǎn)間訪問(wèn),兩者開銷相同.

    因此,與CC-NUMA系統(tǒng)相比,MPD系統(tǒng)并未產(chǎn)生額外的一致性開銷,并將部分結(jié)點(diǎn)間訪問(wèn)轉(zhuǎn)換為結(jié)點(diǎn)內(nèi)訪問(wèn),直接縮短了訪問(wèn)路徑與跳步數(shù),從而降低系統(tǒng)平均訪問(wèn)延遲,減少一致性維護(hù)開銷,提升系統(tǒng)性能.

    3 MPD系統(tǒng)性能分析

    3.1 結(jié)點(diǎn)規(guī)模分析

    MPD系統(tǒng)通過(guò)在結(jié)點(diǎn)內(nèi)構(gòu)建多個(gè)并行緩存一致性域突破了單結(jié)點(diǎn)規(guī)模限制,減少了結(jié)點(diǎn)數(shù)量,從而降低了結(jié)點(diǎn)規(guī)模和結(jié)點(diǎn)間網(wǎng)絡(luò)復(fù)雜度.

    假設(shè)某系統(tǒng)規(guī)模(即處理器總數(shù))為N,單個(gè)緩存一致性域內(nèi)最多容納處理器數(shù)量為n,那么,傳統(tǒng)CC-NUMA系統(tǒng)和MPD系統(tǒng)的結(jié)點(diǎn)數(shù)Num_C以及結(jié)點(diǎn)間全互連的連接數(shù)T分別為

    Num_CCC-NUMA=Nn,

    (1)

    TCC-NUMA=N(N-n)2n2,

    (2)

    Num_CMPD=Nnk,

    (3)

    TMPD=N(N-nk)2(nk)2,

    (4)

    其中,k為MPD系統(tǒng)中單個(gè)結(jié)點(diǎn)內(nèi)包含的并行緩存一致性域個(gè)數(shù).

    由式(1)~(4)可以得出,同等系統(tǒng)規(guī)模下,傳統(tǒng)CC-NUMA系統(tǒng)和MPD系統(tǒng)的結(jié)點(diǎn)數(shù)量的比值ηNum_C為

    (5)

    結(jié)點(diǎn)間全互連的連接數(shù)比值ηT為

    (6)

    因此,與傳統(tǒng)CC-NUMA系統(tǒng)相比,MPD系統(tǒng)的結(jié)點(diǎn)規(guī)??煽s減至1k,結(jié)點(diǎn)間全互連的連接數(shù)可降低到1k2以下.例如,當(dāng)N=64,n=4,k=2時(shí),MPD系統(tǒng)的結(jié)點(diǎn)規(guī)模降低50%,結(jié)點(diǎn)間全互連的連接數(shù)降低77%;而當(dāng)N=64,n=4,k=4時(shí),MPD系統(tǒng)的結(jié)點(diǎn)規(guī)模降低75%,結(jié)點(diǎn)間全互連的連接數(shù)降低95%.

    3.2 平均訪問(wèn)延遲分析

    由于同一結(jié)點(diǎn)內(nèi)不同緩存一致性域間的近端跨域訪問(wèn)延遲遠(yuǎn)小于不同結(jié)點(diǎn)間的遠(yuǎn)端跨結(jié)點(diǎn)訪問(wèn)延遲,所以MPD系統(tǒng)的平均訪問(wèn)延遲低于CC-NUMA系統(tǒng),如圖10所示:

    Fig. 10 Clump architecture in different systems built with different CPU圖10 不同規(guī)格處理器搭建的系統(tǒng)單結(jié)點(diǎn)架構(gòu)

    假設(shè)MPD系統(tǒng)中同一緩存一致性域內(nèi)的平均訪問(wèn)延遲為l,同一結(jié)點(diǎn)內(nèi)不同緩存一致性域間的平均訪問(wèn)延遲為3l,不同結(jié)點(diǎn)間的平均訪問(wèn)延遲為7l,緩存一致性域內(nèi)的緩存次數(shù)占比為α,近端結(jié)點(diǎn)內(nèi)跨域的訪問(wèn)次數(shù)占比為β,那么,MPD系統(tǒng)的遠(yuǎn)端跨結(jié)點(diǎn)的訪問(wèn)次數(shù)占比為1-α-β,而相同規(guī)模的CC-NUMA系統(tǒng)的遠(yuǎn)端跨結(jié)點(diǎn)的訪問(wèn)次數(shù)占比為1-α.因此,同規(guī)模的MPD系統(tǒng)與CC-NUMA系統(tǒng)的平均訪問(wèn)延遲L分別為

    LMPD=l×α+3l×β+7l×(1-α-β)=
    l×(7-6α-4β),

    (7)

    LCC-NUMA=l×α+7l×(1-α)=l×(7-6α).

    (8)

    ① 該結(jié)論僅針對(duì)大規(guī)模CC-NUMA系統(tǒng),單結(jié)點(diǎn)等小規(guī)模系統(tǒng)不保證不等式結(jié)論成立.

    由式(7)(8)可得2種系統(tǒng)平均訪問(wèn)延遲的比值為

    (9)

    假設(shè)α=10%,β=30%,則2種系統(tǒng)的平均訪問(wèn)延遲之比為1316=0.812 5,即MPD系統(tǒng)的平均訪問(wèn)延遲降低了近2成,有效提高了系統(tǒng)性能.

    3.3 結(jié)點(diǎn)一致性目錄存儲(chǔ)開銷分析

    CC-NUMA系統(tǒng)中,每個(gè)緩存一致性域單獨(dú)維護(hù)1個(gè)結(jié)點(diǎn)一致性目錄,結(jié)點(diǎn)數(shù)量較多,系統(tǒng)的結(jié)點(diǎn)一致性目錄開銷較大;而MPD系統(tǒng)中,多個(gè)并行緩存一致性域共同維護(hù)1個(gè)結(jié)點(diǎn)一致性目錄,結(jié)點(diǎn)數(shù)量較少,系統(tǒng)的結(jié)點(diǎn)一致性目錄開銷較小.

    以MESI(modified,exclusive, shared or invalid)協(xié)議的全映射目錄結(jié)構(gòu)為例,假設(shè)MPD系統(tǒng)規(guī)模為N,單個(gè)緩存一致性域內(nèi)最多容納處理器數(shù)量為n,每個(gè)結(jié)點(diǎn)內(nèi)共有k個(gè)緩存一致性域,內(nèi)存容量為B,緩存項(xiàng)大小為b,則該系統(tǒng)內(nèi)單個(gè)結(jié)點(diǎn)一致性目錄開銷為

    (10)

    該MPD系統(tǒng)內(nèi)所有結(jié)點(diǎn)的一致性目錄總開銷為

    (11)

    同等規(guī)模的傳統(tǒng)CC-NUMA系統(tǒng)內(nèi)單個(gè)結(jié)點(diǎn)目錄開銷為

    (12)

    該CC-NUMA系統(tǒng)內(nèi)所有結(jié)點(diǎn)的一致性目錄總開銷為

    (13)

    由式(11)(13)可得,傳統(tǒng)CC-NUMA系統(tǒng)與MPD系統(tǒng)的結(jié)點(diǎn)一致性目錄總開銷的差值ΔD為

    因?yàn)樵诖笠?guī)模CC-NUMA系統(tǒng)中,

    因此,對(duì)于大規(guī)模CC-NUMA系統(tǒng),同等規(guī)模的MPD系統(tǒng)的結(jié)點(diǎn)目錄開銷更小,而且,內(nèi)存容量越大,目錄開銷降低的幅度越大.

    以64顆處理器組成的CC-NUMA系統(tǒng)為例,假設(shè)每個(gè)緩存一致性域內(nèi)最多可容納2顆處理器,系統(tǒng)內(nèi)存容量為16 GB,單個(gè)緩存項(xiàng)大小為128 KB.那么傳統(tǒng)CC-NUMA系統(tǒng)共需32個(gè)結(jié)點(diǎn)一致性協(xié)同芯片,目錄開銷為[8×(1 027+31×lb 31)]Mb,約為9.223 Gb;而單結(jié)點(diǎn)內(nèi)含2個(gè)并行緩存一致性域的MPD系統(tǒng)僅需16個(gè)結(jié)點(diǎn)一致性協(xié)同芯片,目錄開銷為[8×(293+15×lb 17)]Mb,約為2.768 Gb,不到CC-NUMA系統(tǒng)目錄開銷的13;單結(jié)點(diǎn)內(nèi)含4個(gè)并行緩存一致性域的MPD系統(tǒng)僅需8個(gè)結(jié)點(diǎn)一致性協(xié)同芯片,目錄開銷為[8×(118+7×lb 13)]Mb,約為1.124 Gb,不到CC-NUMA系統(tǒng)結(jié)點(diǎn)目錄開銷的18.

    3.4 系統(tǒng)構(gòu)建成本與功耗分析

    MPD系統(tǒng)中,單結(jié)點(diǎn)規(guī)模不再受處理器直連能力的限制,因此,可以選用直連能力較弱的處理器代替直連能力較強(qiáng)的處理器搭建同等結(jié)點(diǎn)規(guī)模的系統(tǒng),以降低系統(tǒng)成本與功耗.不同直連能力的處理器價(jià)格和功耗差異較大.支持8路直連的處理器有3個(gè)一致性互連端口,功耗約為130 W,單價(jià)約為2 500美元;支持4路直連的處理器有2個(gè)一致性互連端口,功耗為115 W,單價(jià)為2 000美元;而支持2路直連的處理器僅有1個(gè)一致性互連端口,功耗為100 W,單價(jià)為1 500美元.

    假設(shè)要搭建8結(jié)點(diǎn)的32路系統(tǒng),傳統(tǒng)CC-NUMA系統(tǒng)需要32顆具有8路直連能力的處理器,結(jié)點(diǎn)內(nèi)結(jié)構(gòu)如圖10(a)所示;而結(jié)點(diǎn)內(nèi)含2個(gè)并行緩存一致性域的MPD1系統(tǒng)則只需要32顆具有4路直連能力的處理器,結(jié)點(diǎn)內(nèi)結(jié)構(gòu)如圖10(b)所示;結(jié)點(diǎn)內(nèi)含4個(gè)并行緩存一致性域的MPD2系統(tǒng)僅需要32顆具有2路直連能力的處理器,結(jié)點(diǎn)內(nèi)結(jié)構(gòu)如圖10(c)所示.

    假定一致性協(xié)同芯片的單價(jià)為1 000美元,那么,CC-NUMA,MPD1,MPD2這3種8結(jié)點(diǎn)32路系統(tǒng)的硬件成本和處理器功耗如表1所示.相比于傳統(tǒng)CC-NUMA系統(tǒng),單結(jié)點(diǎn)內(nèi)含2個(gè)并行緩存一致性域的MPD1系統(tǒng)可降低功耗11.5%,降低成本20%;單結(jié)點(diǎn)內(nèi)含4個(gè)并行緩存一致性域的MPD2系統(tǒng)可降低功耗23.1%,降低成本40%.

    Table 1 Comparison of Power and Cost AmongDifferent Systems

    ① 本文實(shí)驗(yàn)設(shè)置較小的內(nèi)存容量是為了避免部分緩存密集訪問(wèn),以便更好地模擬大規(guī)模系統(tǒng)的多結(jié)點(diǎn)間的緩存一致性維護(hù).

    4 系統(tǒng)性能模擬

    4.1 實(shí)驗(yàn)平臺(tái)

    本文選用gem5[16]對(duì)兩級(jí)緩存一致性域的MPD系統(tǒng)和CC-NUMA系統(tǒng)進(jìn)行模擬,模擬系統(tǒng)中,系統(tǒng)結(jié)點(diǎn)無(wú)結(jié)點(diǎn)緩存功能,對(duì)接收的消息均做轉(zhuǎn)發(fā)處理.各級(jí)訪問(wèn)延遲比為∶緩存域內(nèi)訪問(wèn)延遲∶結(jié)點(diǎn)內(nèi)訪問(wèn)延遲∶結(jié)點(diǎn)間訪問(wèn)延遲=1∶3∶7.實(shí)驗(yàn)的主要系統(tǒng)參數(shù)如表2所示.實(shí)驗(yàn)測(cè)試程序選用了SPLASH2[17]的1個(gè)內(nèi)核程序和3個(gè)應(yīng)用程序,以及PARSEC[18]中的3個(gè)應(yīng)用程序,各配置如表3所示.

    Table 2 Parameters of System Configuration表2 系統(tǒng)參數(shù)配置

    Table 3 Benchmark SPLASH2 and PARSEC表3 測(cè)試集SPLASH2與PARSEC

    為驗(yàn)證MPD系統(tǒng)對(duì)系統(tǒng)性能有效擴(kuò)展能力的提升,以及低功耗低成本MPD系統(tǒng)構(gòu)建的可行性,本節(jié)分別對(duì)16路、32路和64路的傳統(tǒng)CC-NUMA系統(tǒng)與不同配置的MPD系統(tǒng)進(jìn)行了對(duì)比測(cè)試.測(cè)試實(shí)驗(yàn)數(shù)據(jù)顯示,不同處理器規(guī)模的系統(tǒng)對(duì)比結(jié)果類似.因此,為了避免重復(fù),本節(jié)僅選用32路系統(tǒng)的對(duì)比測(cè)試數(shù)據(jù)進(jìn)行說(shuō)明.另外,為便于數(shù)據(jù)比較的直觀性,各組數(shù)據(jù)均以傳統(tǒng)CC-NUMA的系統(tǒng)性能為標(biāo)準(zhǔn)進(jìn)行了歸一化處理.

    4.2 同規(guī)格處理器下的系統(tǒng)性能對(duì)比

    4.2.1 平均訪問(wèn)延遲對(duì)比

    圖11顯示了CC-NUMA系統(tǒng)與各MPD系統(tǒng)中不同類型訪問(wèn)的數(shù)量占比.圖11中的橫坐標(biāo)m×k代表了系統(tǒng)的緩存一致性域規(guī)模:m代表結(jié)點(diǎn)數(shù),k代表單結(jié)點(diǎn)內(nèi)緩存一致性域數(shù)量.因此,m×1就代表了結(jié)點(diǎn)數(shù)為m的CC-NUMA系統(tǒng).從圖11中各類訪問(wèn)占比來(lái)看,由于MPD系統(tǒng)擴(kuò)大了單結(jié)點(diǎn)處理器規(guī)模,有效減少了結(jié)點(diǎn)數(shù)量,部分結(jié)點(diǎn)間遠(yuǎn)端訪問(wèn)轉(zhuǎn)換為結(jié)點(diǎn)內(nèi)跨域近端訪問(wèn),而且,單結(jié)點(diǎn)處理器規(guī)模越大,轉(zhuǎn)換為結(jié)點(diǎn)內(nèi)跨域訪問(wèn)的結(jié)點(diǎn)間訪問(wèn)量越多.圖11中結(jié)點(diǎn)間訪問(wèn)量減少最多的是OCEAN_NS.當(dāng)單結(jié)點(diǎn)內(nèi)有8個(gè)并行緩存一致性域時(shí),OCEAN_NS有58%的結(jié)點(diǎn)間訪問(wèn)轉(zhuǎn)換為結(jié)點(diǎn)內(nèi)跨域訪問(wèn).

    Fig. 11 Comparison of the access ratio among different 32-way systems圖11 32路CC-NUMA系統(tǒng)與MPD系統(tǒng)的各類型訪問(wèn)量對(duì)比

    因?yàn)榻Y(jié)點(diǎn)內(nèi)跨域訪問(wèn)延遲遠(yuǎn)小于結(jié)點(diǎn)間訪問(wèn)延遲,所以結(jié)點(diǎn)間訪問(wèn)數(shù)量的減少直接降低了系統(tǒng)平均訪問(wèn)延遲.例如,單結(jié)點(diǎn)內(nèi)有8個(gè)并行緩存一致性域時(shí),OCEAN_NS的系統(tǒng)平均訪存延遲降低32%.從圖12的對(duì)比結(jié)果來(lái)看,系統(tǒng)平均訪問(wèn)延遲的變化趨勢(shì)與結(jié)點(diǎn)間訪問(wèn)占比類似,均隨結(jié)點(diǎn)內(nèi)緩存一致性域數(shù)量k的增加而減少.當(dāng)k=2時(shí),與CC-NUMA系統(tǒng)相比,MPD系統(tǒng)的平均訪問(wèn)延遲降低3.9%;當(dāng)k=4時(shí),與CC-NUMA系統(tǒng)相比,MPD系統(tǒng)的平均訪問(wèn)延遲降低11.7%;當(dāng)k=8時(shí),與CC-NUMA系統(tǒng)相比,MPD系統(tǒng)的平均訪問(wèn)延遲降低27.9%.

    Fig. 12 Comparison of the average access latency among different 32-way systems圖12 32路CC-NUMA系統(tǒng)與MPD系統(tǒng)的平均訪問(wèn)延遲對(duì)比

    4.2.2 指令平均執(zhí)行周期對(duì)比

    相較于系統(tǒng)平均訪問(wèn)延遲,CC-NUMA系統(tǒng)和MPD系統(tǒng)的指令平均執(zhí)行周期(cycles per instruction,CPI)差異較小,但仍是MPD系統(tǒng)性能較優(yōu),且系統(tǒng)CPI隨結(jié)點(diǎn)內(nèi)緩存一致性域數(shù)量k的增加而減少.這主要是因?yàn)?,系統(tǒng)平均訪問(wèn)延遲僅與訪問(wèn)類型占比有關(guān),而CPI還與程序指令數(shù)、指令類型等有關(guān).圖13中各程序的CPI變化幅度不同也是因?yàn)檫@個(gè)原因.盡管各測(cè)試程序的CPI降幅不同,但MPD系統(tǒng)整體平均性能仍呈現(xiàn)較明顯的線性下降趨勢(shì):當(dāng)k取值為2,4,8時(shí),MPD系統(tǒng)比傳統(tǒng)CC-NUMA系統(tǒng)的CPI分別降低3.6%,7.6%,12.6%,即MPD系統(tǒng)性能提升3.5%,8.2%,14.4%.

    4.3 不同規(guī)格處理器的系統(tǒng)性能對(duì)比

    本文3.4節(jié)所述,MPD系統(tǒng)中可采用直連能力較弱的處理器代替直連能力較強(qiáng)的處理器搭建同等規(guī)模的系統(tǒng),以降低功耗、節(jié)約成本.但是,MPD系統(tǒng)采用的是單結(jié)點(diǎn)內(nèi)多緩存一致性域架構(gòu);原CC-NUMA系統(tǒng)中的部分緩存一致性域內(nèi)訪問(wèn)將轉(zhuǎn)換為結(jié)點(diǎn)內(nèi)跨一致性域訪問(wèn),從而導(dǎo)致系統(tǒng)平均訪問(wèn)延遲增加,性能下降.

    Fig. 13 Comparison of CPI among different 32-way systems圖13 32路CC-NUMA系統(tǒng)與MPD系統(tǒng)的CPI對(duì)比

    為測(cè)試這種低功耗低成本的MPD系統(tǒng)與傳統(tǒng)CC-NUMA系統(tǒng)的性能差異度,本節(jié)對(duì)不同規(guī)格處理器搭建的4結(jié)點(diǎn)16路系統(tǒng)、8結(jié)點(diǎn)32路系統(tǒng)和16結(jié)點(diǎn)64路系統(tǒng)進(jìn)行了性能測(cè)試.各組測(cè)試數(shù)據(jù)均表明,與傳統(tǒng)CC-NUMA系統(tǒng)相比,采用較低規(guī)格處理器搭建的MPD系統(tǒng)性能下降有限.以圖14中的32路系統(tǒng)為例,當(dāng)處理器為4路直連時(shí),每個(gè)結(jié)點(diǎn)內(nèi)有2個(gè)緩存一致性域,系統(tǒng)CPI上升1.7%;當(dāng)處理器為2路直連時(shí),每個(gè)結(jié)點(diǎn)內(nèi)有4個(gè)緩存一致性域,系統(tǒng)CPI上升2.6%,上升幅度變小.

    與表1中處理器硬件成本的下降程度相比,這種MPD系統(tǒng)的性能下降幅度較小,因此,使用低規(guī)格處理器搭建的MPD系統(tǒng)具有更高的性價(jià)比.如圖15所示,與8路直連處理器搭建的CC-NUMA系統(tǒng)相比,4路直連處理器搭建的32路MPD系統(tǒng)性價(jià)比提升1.20倍,2路直連處理器搭建的32路MPD系統(tǒng)性價(jià)比提升1.53倍.

    Fig. 14 Comparison of CPI among 8 clumps 32-way systems built by different processors圖14 不同處理器搭建的8結(jié)點(diǎn)32路系統(tǒng)的CPI對(duì)比

    Fig. 15 Cost-effective of different systems圖15 不同處理器系統(tǒng)的性價(jià)比

    5 結(jié) 論

    處理器直連能力和處理器可識(shí)別ID數(shù)的有限性限制了CC-NUMA系統(tǒng)的單個(gè)結(jié)點(diǎn)規(guī)模,導(dǎo)致系統(tǒng)規(guī)模的擴(kuò)張只能通過(guò)結(jié)點(diǎn)數(shù)量的增加來(lái)實(shí)現(xiàn).而結(jié)點(diǎn)數(shù)量的增加致使緩存一致性維護(hù)開銷增大,結(jié)點(diǎn)間互連結(jié)構(gòu)復(fù)雜,降低了系統(tǒng)性能的有效擴(kuò)展.本文提出的MPD系統(tǒng)突破了單結(jié)點(diǎn)的處理器規(guī)模限制,能夠任意設(shè)置單結(jié)點(diǎn)規(guī)模,大幅減少結(jié)點(diǎn)數(shù)量.與其他系統(tǒng)性能優(yōu)化方法相比,這種擴(kuò)大單結(jié)點(diǎn)規(guī)模的方法直接縮短了系統(tǒng)平均訪問(wèn)路徑和跳步數(shù),從而降低了平均訪問(wèn)延遲,實(shí)現(xiàn)了系統(tǒng)性能的有效擴(kuò)展.另一方面,由于MPD系統(tǒng)的單結(jié)點(diǎn)規(guī)模與處理器直連能力無(wú)關(guān),MPD系統(tǒng)還可用于構(gòu)建低功耗低成本系統(tǒng),提升系統(tǒng)性價(jià)比.實(shí)驗(yàn)數(shù)據(jù)表明,32路系統(tǒng)中,采用同規(guī)格處理器時(shí),結(jié)點(diǎn)內(nèi)4個(gè)并行緩存一致性域的MPD系統(tǒng)平均訪問(wèn)延遲降低27.9%,系統(tǒng)性能提升14.4%;采用不同規(guī)格處理器時(shí),與8路直連處理器搭建的CC-NUMA系統(tǒng)相比,2路直連處理器搭建的MPD系統(tǒng)性價(jià)比提升1.53倍.

    未來(lái)的工作中,我們將增加結(jié)點(diǎn)緩存功能,進(jìn)一步優(yōu)化MPD系統(tǒng)的一致性協(xié)議實(shí)現(xiàn),提升大規(guī)模系統(tǒng)性能.

    猜你喜歡
    結(jié)點(diǎn)遠(yuǎn)端處理器
    內(nèi)側(cè)楔骨遠(yuǎn)端傾斜與拇外翻關(guān)系的相關(guān)性
    Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點(diǎn)個(gè)數(shù)估計(jì)
    遠(yuǎn)端蒂足內(nèi)側(cè)皮瓣修復(fù)(足母)趾皮膚軟組織缺損
    胃小彎全切術(shù)治療遠(yuǎn)端胃癌的隨機(jī)對(duì)照研究
    Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
    ADI推出新一代SigmaDSP處理器
    汽車零部件(2014年1期)2014-09-21 11:41:11
    呼嚕處理器
    中西醫(yī)結(jié)合治療橈骨遠(yuǎn)端骨折40例
    基于Raspberry PI為結(jié)點(diǎn)的天氣云測(cè)量網(wǎng)絡(luò)實(shí)現(xiàn)
    基于DHT全分布式P2P-SIP網(wǎng)絡(luò)電話穩(wěn)定性研究與設(shè)計(jì)
    av卡一久久| 男女啪啪激烈高潮av片| 欧美高清成人免费视频www| 国产精品野战在线观看| 乱码一卡2卡4卡精品| 国产 一区 欧美 日韩| 极品教师在线视频| 蜜桃久久精品国产亚洲av| 亚洲精品一区蜜桃| av黄色大香蕉| 亚洲精品一区蜜桃| 精品久久久噜噜| 久久这里有精品视频免费| 亚洲丝袜综合中文字幕| 亚洲av中文字字幕乱码综合| 在线播放无遮挡| 久久久久免费精品人妻一区二区| 免费一级毛片在线播放高清视频| 高清午夜精品一区二区三区| 日本一二三区视频观看| 一级毛片我不卡| 亚洲欧美日韩高清专用| 亚洲欧美一区二区三区国产| 春色校园在线视频观看| 最近中文字幕高清免费大全6| 天堂√8在线中文| 汤姆久久久久久久影院中文字幕 | 又爽又黄无遮挡网站| 美女高潮的动态| 一级av片app| 久久精品国产99精品国产亚洲性色| 男人狂女人下面高潮的视频| 欧美高清性xxxxhd video| 99热这里只有精品一区| 精品人妻一区二区三区麻豆| 国产成人a区在线观看| 成人午夜精彩视频在线观看| 久久久久久久久中文| kizo精华| 亚洲欧美日韩东京热| 大香蕉久久网| 一级黄色大片毛片| 国内精品美女久久久久久| 亚洲精品乱码久久久久久按摩| 中文天堂在线官网| 亚洲av成人精品一二三区| 久久人人爽人人爽人人片va| 变态另类丝袜制服| 我要搜黄色片| 女人十人毛片免费观看3o分钟| 插阴视频在线观看视频| 春色校园在线视频观看| 欧美成人a在线观看| 日韩高清综合在线| 春色校园在线视频观看| 一本一本综合久久| 啦啦啦啦在线视频资源| 国产v大片淫在线免费观看| 亚洲久久久久久中文字幕| 精品久久久噜噜| 日韩成人伦理影院| 国产精品一区二区三区四区免费观看| 一级黄色大片毛片| 永久免费av网站大全| 亚洲成人精品中文字幕电影| 国产精品久久久久久精品电影| 欧美一区二区国产精品久久精品| 久久99热这里只频精品6学生 | 中文字幕制服av| 欧美一级a爱片免费观看看| 日日摸夜夜添夜夜添av毛片| h日本视频在线播放| 身体一侧抽搐| 自拍偷自拍亚洲精品老妇| 搡女人真爽免费视频火全软件| 97超视频在线观看视频| 国产高清国产精品国产三级 | 免费看av在线观看网站| 欧美高清性xxxxhd video| 国产探花在线观看一区二区| 亚洲无线观看免费| 看免费成人av毛片| 夜夜看夜夜爽夜夜摸| 男人舔奶头视频| 最新中文字幕久久久久| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 国产麻豆成人av免费视频| 亚洲欧美精品综合久久99| 国产又黄又爽又无遮挡在线| 国产欧美日韩精品一区二区| 成人午夜高清在线视频| 精品午夜福利在线看| 一级毛片久久久久久久久女| 一区二区三区乱码不卡18| 精品无人区乱码1区二区| 国产乱人偷精品视频| 免费av观看视频| 老司机影院毛片| 国产乱人视频| 亚洲欧洲国产日韩| 国产av不卡久久| 乱人视频在线观看| 亚洲国产最新在线播放| 午夜激情欧美在线| 成年av动漫网址| 免费一级毛片在线播放高清视频| 黄色配什么色好看| 身体一侧抽搐| 久久国产乱子免费精品| 亚洲精品乱久久久久久| 18禁在线播放成人免费| 男人的好看免费观看在线视频| 青春草国产在线视频| 亚洲国产精品久久男人天堂| 国产午夜精品一二区理论片| 在线a可以看的网站| av在线观看视频网站免费| 日韩大片免费观看网站 | 成人鲁丝片一二三区免费| 亚洲天堂国产精品一区在线| a级一级毛片免费在线观看| 国语自产精品视频在线第100页| 日韩人妻高清精品专区| 亚洲怡红院男人天堂| 亚洲欧洲日产国产| 久久6这里有精品| 乱系列少妇在线播放| 内地一区二区视频在线| 免费一级毛片在线播放高清视频| 成人亚洲欧美一区二区av| 人人妻人人澡欧美一区二区| 国产欧美另类精品又又久久亚洲欧美| 观看美女的网站| 午夜免费激情av| 超碰97精品在线观看| 十八禁国产超污无遮挡网站| 欧美日韩国产亚洲二区| 中文亚洲av片在线观看爽| 久久久午夜欧美精品| 亚洲国产精品专区欧美| 噜噜噜噜噜久久久久久91| 一二三四中文在线观看免费高清| 1024手机看黄色片| 51国产日韩欧美| 日本三级黄在线观看| 国产精品人妻久久久久久| 色网站视频免费| av在线观看视频网站免费| 日本wwww免费看| 国产视频首页在线观看| 国产精品久久久久久av不卡| 狂野欧美白嫩少妇大欣赏| 久久久久久久国产电影| a级一级毛片免费在线观看| 99久久九九国产精品国产免费| 亚洲电影在线观看av| 五月伊人婷婷丁香| 在线免费观看的www视频| 麻豆国产97在线/欧美| 99久久无色码亚洲精品果冻| 成人av在线播放网站| 九九爱精品视频在线观看| 免费黄网站久久成人精品| 国产精华一区二区三区| 麻豆av噜噜一区二区三区| 亚洲人成网站高清观看| 亚洲经典国产精华液单| 成人三级黄色视频| 97在线视频观看| 亚洲av免费高清在线观看| 国产久久久一区二区三区| 内射极品少妇av片p| 男人舔奶头视频| 亚洲欧洲日产国产| 老司机影院成人| 级片在线观看| 国产黄片美女视频| 精品人妻视频免费看| or卡值多少钱| 99在线视频只有这里精品首页| 级片在线观看| .国产精品久久| 在线观看一区二区三区| 超碰av人人做人人爽久久| 51国产日韩欧美| 国产欧美日韩精品一区二区| 天堂中文最新版在线下载 | 99热这里只有是精品在线观看| 久久久a久久爽久久v久久| h日本视频在线播放| 久久精品国产自在天天线| 中国国产av一级| 亚洲成人久久爱视频| 啦啦啦观看免费观看视频高清| 成年女人看的毛片在线观看| www.色视频.com| 欧美激情在线99| 麻豆精品久久久久久蜜桃| 99久久精品一区二区三区| 日韩国内少妇激情av| 日韩强制内射视频| 久久亚洲国产成人精品v| 99热这里只有是精品50| 日韩视频在线欧美| 乱系列少妇在线播放| 在线免费十八禁| 91久久精品国产一区二区三区| 乱人视频在线观看| 成人午夜高清在线视频| 亚洲精品国产av成人精品| 亚洲四区av| 乱系列少妇在线播放| 国产单亲对白刺激| 久久精品国产鲁丝片午夜精品| 最近最新中文字幕大全电影3| 十八禁国产超污无遮挡网站| 中文字幕av在线有码专区| 国产伦精品一区二区三区四那| 中国美白少妇内射xxxbb| 成人高潮视频无遮挡免费网站| 免费av不卡在线播放| 久久亚洲国产成人精品v| 少妇的逼水好多| 成人午夜精彩视频在线观看| 免费无遮挡裸体视频| 国产av码专区亚洲av| 亚洲精品乱码久久久久久按摩| 免费看a级黄色片| 亚洲国产精品专区欧美| 国产精品久久久久久精品电影| 免费搜索国产男女视频| 日韩高清综合在线| 国产单亲对白刺激| 成人亚洲精品av一区二区| 91狼人影院| 国产精品1区2区在线观看.| 免费观看在线日韩| 亚洲自拍偷在线| 日韩精品有码人妻一区| 丝袜美腿在线中文| 人妻少妇偷人精品九色| 特大巨黑吊av在线直播| 成人美女网站在线观看视频| 人妻制服诱惑在线中文字幕| 日本免费在线观看一区| 91av网一区二区| 综合色丁香网| 欧美成人一区二区免费高清观看| 欧美成人精品欧美一级黄| 国产淫语在线视频| 两性午夜刺激爽爽歪歪视频在线观看| 国产精品一区二区在线观看99 | 免费大片18禁| 久久精品久久精品一区二区三区| 午夜福利在线观看吧| 国产精品久久久久久精品电影小说 | 成人二区视频| 男人的好看免费观看在线视频| 在线免费观看不下载黄p国产| 特大巨黑吊av在线直播| 中文在线观看免费www的网站| 久久亚洲国产成人精品v| 国产成人a区在线观看| 中文资源天堂在线| 日本与韩国留学比较| www.色视频.com| 免费观看人在逋| 国语对白做爰xxxⅹ性视频网站| 毛片女人毛片| 亚洲欧美日韩高清专用| 青春草视频在线免费观看| 伦理电影大哥的女人| 夫妻性生交免费视频一级片| 日产精品乱码卡一卡2卡三| 日韩制服骚丝袜av| 国产成人免费观看mmmm| 午夜福利视频1000在线观看| 如何舔出高潮| 免费一级毛片在线播放高清视频| .国产精品久久| 日韩av不卡免费在线播放| 丰满乱子伦码专区| 性色avwww在线观看| 国产精品伦人一区二区| 国产乱人偷精品视频| 特级一级黄色大片| 国产一级毛片七仙女欲春2| 中文精品一卡2卡3卡4更新| 日日干狠狠操夜夜爽| 亚洲欧美一区二区三区国产| 亚洲久久久久久中文字幕| 91狼人影院| 在线观看一区二区三区| 又粗又硬又长又爽又黄的视频| 国产精品爽爽va在线观看网站| 欧美一区二区亚洲| 精品一区二区三区视频在线| 99久国产av精品| 亚洲人成网站在线观看播放| 国产乱人视频| 91久久精品电影网| 欧美bdsm另类| 久久综合国产亚洲精品| 日韩高清综合在线| 啦啦啦啦在线视频资源| 精品少妇黑人巨大在线播放 | 91久久精品国产一区二区三区| 简卡轻食公司| 国产在线男女| 亚洲在久久综合| 久久这里只有精品中国| 久久国内精品自在自线图片| 精品久久久久久成人av| 久久久久久久久中文| 欧美又色又爽又黄视频| 中文精品一卡2卡3卡4更新| 成人特级av手机在线观看| 色视频www国产| 中文字幕久久专区| h日本视频在线播放| 日本色播在线视频| 免费不卡的大黄色大毛片视频在线观看 | 国产成年人精品一区二区| 亚洲精品乱久久久久久| 色播亚洲综合网| 麻豆av噜噜一区二区三区| 乱码一卡2卡4卡精品| 一区二区三区高清视频在线| 日韩制服骚丝袜av| 校园人妻丝袜中文字幕| 建设人人有责人人尽责人人享有的 | 日韩一区二区三区影片| 最近最新中文字幕大全电影3| 大香蕉久久网| 国产亚洲5aaaaa淫片| 日韩大片免费观看网站 | 最新中文字幕久久久久| 色哟哟·www| videossex国产| av在线老鸭窝| 色综合色国产| 亚洲精品自拍成人| 日韩三级伦理在线观看| 中文字幕精品亚洲无线码一区| 国产日韩欧美在线精品| 不卡视频在线观看欧美| 国产精品国产三级专区第一集| 国产黄a三级三级三级人| 午夜精品在线福利| 午夜精品国产一区二区电影 | 91精品一卡2卡3卡4卡| 插逼视频在线观看| 免费播放大片免费观看视频在线观看 | av在线蜜桃| 一级毛片久久久久久久久女| 51国产日韩欧美| 黄色一级大片看看| 欧美日韩在线观看h| 国产精品精品国产色婷婷| 日本欧美国产在线视频| 亚洲综合精品二区| 精品久久久噜噜| 黄色日韩在线| 亚洲国产精品久久男人天堂| 啦啦啦啦在线视频资源| 欧美97在线视频| 高清午夜精品一区二区三区| 国内揄拍国产精品人妻在线| 国产高清有码在线观看视频| 国产人妻一区二区三区在| 高清视频免费观看一区二区 | 99热6这里只有精品| 亚洲在久久综合| 免费看a级黄色片| 免费观看人在逋| 女人被狂操c到高潮| 青春草视频在线免费观看| 亚洲精品乱码久久久久久按摩| 久久久精品94久久精品| 午夜爱爱视频在线播放| 国产日韩欧美在线精品| 身体一侧抽搐| 国产精品国产三级国产av玫瑰| 欧美成人a在线观看| 干丝袜人妻中文字幕| 欧美日韩国产亚洲二区| 黄片无遮挡物在线观看| 国产黄a三级三级三级人| 亚洲欧美精品综合久久99| 高清视频免费观看一区二区 | 伊人久久精品亚洲午夜| 三级国产精品欧美在线观看| 精品午夜福利在线看| 99在线视频只有这里精品首页| 成人性生交大片免费视频hd| 亚洲人成网站在线观看播放| .国产精品久久| av在线观看视频网站免费| 噜噜噜噜噜久久久久久91| 99久久精品国产国产毛片| 日韩欧美国产在线观看| 三级经典国产精品| 久久久久精品久久久久真实原创| 免费观看人在逋| 99在线视频只有这里精品首页| 欧美一级a爱片免费观看看| 国产毛片a区久久久久| 黑人高潮一二区| 国产麻豆成人av免费视频| 麻豆成人av视频| 亚洲精品色激情综合| 美女cb高潮喷水在线观看| 国产在线一区二区三区精 | 99久久九九国产精品国产免费| 免费观看a级毛片全部| 成人性生交大片免费视频hd| 国产在线男女| 日韩av不卡免费在线播放| 男女国产视频网站| 天堂影院成人在线观看| 老司机影院毛片| 搡女人真爽免费视频火全软件| 欧美xxxx黑人xx丫x性爽| 直男gayav资源| 国产精品.久久久| 成人国产麻豆网| 好男人视频免费观看在线| 午夜久久久久精精品| 亚洲av日韩在线播放| 有码 亚洲区| 三级国产精品片| 日韩国内少妇激情av| 国产极品天堂在线| or卡值多少钱| 如何舔出高潮| 久久久亚洲精品成人影院| 亚洲最大成人av| 女人被狂操c到高潮| 国产女主播在线喷水免费视频网站 | 亚洲国产欧美人成| 亚洲欧美中文字幕日韩二区| 成人美女网站在线观看视频| 欧美日韩精品成人综合77777| 天天躁日日操中文字幕| 91精品国产九色| av专区在线播放| 九九久久精品国产亚洲av麻豆| 少妇猛男粗大的猛烈进出视频 | h日本视频在线播放| 九九热线精品视视频播放| 99热全是精品| 国产成人午夜福利电影在线观看| 亚洲一级一片aⅴ在线观看| 熟女人妻精品中文字幕| 国内精品一区二区在线观看| 亚洲伊人久久精品综合 | 久久99热这里只有精品18| 我要看日韩黄色一级片| 亚洲国产精品成人久久小说| 欧美丝袜亚洲另类| 边亲边吃奶的免费视频| 狠狠狠狠99中文字幕| 日韩欧美在线乱码| 亚洲精品久久久久久婷婷小说 | 亚洲精品乱码久久久久久按摩| 国产av不卡久久| 在现免费观看毛片| h日本视频在线播放| 日韩欧美三级三区| 老司机影院成人| 成人高潮视频无遮挡免费网站| 国产成人免费观看mmmm| 亚洲国产精品成人久久小说| 99久久人妻综合| 网址你懂的国产日韩在线| 久久久久久久久久黄片| 一区二区三区乱码不卡18| 99热精品在线国产| www.色视频.com| 久久久国产成人免费| 99热这里只有是精品50| 自拍偷自拍亚洲精品老妇| 卡戴珊不雅视频在线播放| 久久久精品大字幕| 91av网一区二区| 一区二区三区四区激情视频| 99久久成人亚洲精品观看| 人妻夜夜爽99麻豆av| 一区二区三区四区激情视频| 国产亚洲av片在线观看秒播厂 | 精品熟女少妇av免费看| 久久精品国产自在天天线| 国产精品国产三级国产专区5o | 搡女人真爽免费视频火全软件| 色播亚洲综合网| 久久久久久久久久成人| 欧美日韩精品成人综合77777| 日本爱情动作片www.在线观看| 久久久久性生活片| 在线a可以看的网站| 国产精品无大码| АⅤ资源中文在线天堂| 好男人视频免费观看在线| 国产精品国产三级国产专区5o | 日韩国内少妇激情av| 欧美三级亚洲精品| 久久婷婷人人爽人人干人人爱| 能在线免费看毛片的网站| 欧美一级a爱片免费观看看| 免费观看在线日韩| 日韩高清综合在线| 乱码一卡2卡4卡精品| 亚洲欧美成人综合另类久久久 | 欧美成人午夜免费资源| 97人妻精品一区二区三区麻豆| 欧美zozozo另类| 久久久a久久爽久久v久久| 永久免费av网站大全| 亚洲精品国产成人久久av| 成人一区二区视频在线观看| 黄色欧美视频在线观看| 日韩三级伦理在线观看| 精品人妻一区二区三区麻豆| 国产高潮美女av| 精品午夜福利在线看| 老师上课跳d突然被开到最大视频| 亚洲欧美精品自产自拍| 中文字幕熟女人妻在线| 午夜激情欧美在线| 亚洲最大成人中文| 美女黄网站色视频| 建设人人有责人人尽责人人享有的 | 国产高清有码在线观看视频| 日韩在线高清观看一区二区三区| 成人国产麻豆网| 免费黄网站久久成人精品| 国产乱人视频| 天天躁日日操中文字幕| 国产白丝娇喘喷水9色精品| 久久韩国三级中文字幕| 青春草视频在线免费观看| 亚洲欧美日韩无卡精品| 麻豆av噜噜一区二区三区| 人体艺术视频欧美日本| 日韩三级伦理在线观看| 日本一本二区三区精品| 2021天堂中文幕一二区在线观| 成人无遮挡网站| 国产探花在线观看一区二区| 久久人人爽人人爽人人片va| 晚上一个人看的免费电影| 永久免费av网站大全| 天美传媒精品一区二区| 久久精品熟女亚洲av麻豆精品 | 变态另类丝袜制服| 热99re8久久精品国产| 久久久久国产网址| 日韩大片免费观看网站 | 一区二区三区四区激情视频| 亚洲国产精品国产精品| 亚洲精品乱码久久久久久按摩| 日韩av在线大香蕉| 亚洲丝袜综合中文字幕| eeuss影院久久| 久久国内精品自在自线图片| 日日摸夜夜添夜夜添av毛片| 精品久久久久久电影网 | 毛片女人毛片| 亚洲无线观看免费| 国产精品,欧美在线| 热99re8久久精品国产| 久久久久久久久久久免费av| 亚洲国产欧美人成| 蜜桃久久精品国产亚洲av| 国内少妇人妻偷人精品xxx网站| 一夜夜www| 成人欧美大片| 91午夜精品亚洲一区二区三区| 中文精品一卡2卡3卡4更新| 韩国av在线不卡| 成人高潮视频无遮挡免费网站| 亚洲精品色激情综合| 免费在线观看成人毛片| 女人久久www免费人成看片 | 99久久精品热视频| 久久久久九九精品影院| 国产伦理片在线播放av一区| 国产成人91sexporn| 蜜桃亚洲精品一区二区三区| av在线蜜桃| 观看美女的网站| 国产激情偷乱视频一区二区| 亚洲欧洲国产日韩| 又爽又黄无遮挡网站| 久久久久久九九精品二区国产| 嫩草影院入口| 久久久久久久久久成人| 国产精品久久久久久精品电影| 久99久视频精品免费| 九九在线视频观看精品| 又粗又硬又长又爽又黄的视频| 尤物成人国产欧美一区二区三区| 日韩欧美精品v在线| 亚洲精品国产av成人精品| 亚洲人成网站在线观看播放| 国内揄拍国产精品人妻在线| 51国产日韩欧美| 女人久久www免费人成看片 | 亚洲欧洲日产国产| 久久精品国产亚洲av天美| 国内少妇人妻偷人精品xxx网站| 有码 亚洲区| 99热全是精品| eeuss影院久久| 午夜老司机福利剧场|