• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    HL-TLS:支持熱點的線程級猜測編譯實現(xiàn)

    2015-12-06 06:11:12李春強尚云海盧永江
    計算機工程 2015年11期
    關(guān)鍵詞:線程熱點沖突

    金 躍,李春強,尚云海,盧永江

    (浙江大學(xué)超大規(guī)模集成電路設(shè)計研究所,杭州310027)

    HL-TLS:支持熱點的線程級猜測編譯實現(xiàn)

    金 躍,李春強,尚云海,盧永江

    (浙江大學(xué)超大規(guī)模集成電路設(shè)計研究所,杭州310027)

    猜測并行化編譯,即線程級猜測(TLS)編譯,可將原來順序運行的程序并行化。但由于猜測數(shù)據(jù)的不確定性引起的數(shù)據(jù)管理開銷過大,以及猜測線程失敗引起的線程回滾開銷,使得并行后的執(zhí)行性能較低。針對上述問題,提出一種HL-TLS并行化編譯優(yōu)化框架。HL-TLS能有效地標記并行化的循環(huán)體為熱點循環(huán)體,采用對最高層次熱點循環(huán)體進行更激進的并行化的方式提高性能,而對非熱點循環(huán)體采用保守的順序執(zhí)行以減少開銷。實驗結(jié)果表明,使用HL-TLS編譯優(yōu)化框架,實驗程序的執(zhí)行效率可以提高20%。

    并行計算;多線程;猜測執(zhí)行;線程級猜測并行;熱點循環(huán);動態(tài)轉(zhuǎn)換執(zhí)行機制

    1 概述

    循環(huán)體的并行化是當(dāng)今多核系統(tǒng)中提升計算機性能的一個編譯研究熱點。線程級猜測(Thread Level Speculation,TLS)技術(shù)能有效提高并行化效率。TLS技術(shù)在假設(shè)不存在數(shù)據(jù)依賴的條件下,延后檢查數(shù)據(jù)沖突,積極地對程序進行并行化,從而提高程序執(zhí)行的性能。使用硬件TLS技術(shù)[1-3],雖然取得較好的效果,但是往往代價昂貴,并且設(shè)計復(fù)雜。軟件TLS編譯技術(shù)[4-6]相比硬件來說,有更好的可擴展性,但存在資源開銷大的問題,如猜測線程間通信的開銷、猜測數(shù)據(jù)管理一致性的開銷等,特別是當(dāng)猜測線程執(zhí)行時如果檢測到數(shù)據(jù)沖突發(fā)生,往往需要將整個線程回滾(Rollback)[6]到安全點,整個程序才能繼續(xù)保持數(shù)據(jù)一致性。當(dāng)猜測錯誤達到一定比例時,線程回滾形成的CPU資源浪費會導(dǎo)致TLS猜測并行化執(zhí)行時間比順序執(zhí)行時間更長。

    HL-TLS(Hot Loops-TLS)并行編譯優(yōu)化框架編譯出的程序在執(zhí)行時,編譯時插入的樁代碼能有效地標記可以并行化執(zhí)行的熱點循環(huán)體,并對循環(huán)體的并行化執(zhí)行方式進行動態(tài)轉(zhuǎn)換,轉(zhuǎn)換后的熱點循環(huán)體執(zhí)行方式根據(jù)熱點程度不同分為多個層次。在HL-TLS并行編譯優(yōu)化框架中,第一層次熱點循環(huán)體先采用順序提交的TLS并行化執(zhí)行方式;TLS并行化執(zhí)行過程中,如果回滾次數(shù)低于一定程度,則此循環(huán)體被標記為第二層次熱點循環(huán)體,被動態(tài)轉(zhuǎn)換為激進的直接提交(In-Place)[7-9]的TLS執(zhí)行方式,從而進一步提升性能;對于TLS執(zhí)行中回滾次數(shù)高于一定程度的循環(huán)體,將被標記為非熱點循環(huán)體,被動態(tài)轉(zhuǎn)換為順序執(zhí)行,從而避免開銷過大而產(chǎn)生TLS執(zhí)行效率低于順序執(zhí)行的情況。

    針對TLS編譯技術(shù)的上述問題,本文提出HL-TLS編譯優(yōu)化框架,在TLS編譯技術(shù)的基礎(chǔ)上,引入熱點循環(huán)體(Hot Loops,HL)的概念來解決現(xiàn)有TLS編譯技術(shù)因線程回滾過多導(dǎo)致資源開銷過大的問題,并對熱點循環(huán)體采用更為激進的并行化執(zhí)行策略,從而提高程序性能。

    2 相關(guān)研究

    LRPD test[10]系統(tǒng)地實現(xiàn)了軟件TLS并行化技術(shù)。在LRPD test中,數(shù)據(jù)依賴在線程執(zhí)行的最后檢測,相比同步并行化技術(shù)(synchronization parallel)減少了等待和執(zhí)行時檢查的時間,從而提高了性能。此后RLRPD test[11]基于LRPD test做了改進,并使用了sliding w indow策略,從而控制了線程間通信的開銷。

    文獻[12-13]針對循環(huán)體進行TLS研究。其中文獻[12]實現(xiàn)了代價驅(qū)動的編譯器框架,其使用代價描述決定了哪些可以被TLS并行,而哪些不適合。

    本文的HL-TLS框架不同于上文提到的框架。首先,HL-TLS是一個全新的概念,以上文章都沒有針對HL-TLS進行研究。其次,雖然HL-TLS和文獻[12]中的cost-driven compiler一樣是代價驅(qū)動的,但是后者是靜態(tài)計算代價,而在HL-TLS是動態(tài)計算并決定的。但是以上文獻都沒有提到動態(tài)轉(zhuǎn)換執(zhí)行機制的技術(shù)。

    文獻[14-15]實現(xiàn)了編譯器輔助TLS并行化,提高了編程效率,但是對性能并沒有改進。

    文獻[16]總結(jié)了TLS并行技術(shù),并從生命周期的角度提出新的分類方法,但是并未提出新的框架,也并未提高性能。

    與本文框架最為接近的是文獻[6-7]。文獻[7]提出了一個輕量級的TLS軟件并行框架,并驗證了性能提升和可行性。文獻[6]對文獻[7]進行改進,在數(shù)據(jù)管理上采用新的數(shù)據(jù)結(jié)構(gòu)以節(jié)省緩存開銷。本文HL-TLS框架的不同之處在于:(1)采用了新框架,并提出了TLS熱點循環(huán)體的概念,針對TLS最高層次的熱點循環(huán)體,可以采用激進的直接提交的TLS策略,進一步提升程序性能;(2)本文采用了執(zhí)行機制動態(tài)轉(zhuǎn)換,程序?qū)⑹褂米钸m合的執(zhí)行方式,從而最大程度上保證程序的性能提升。

    3 TLS編譯技術(shù)

    TLS編譯技術(shù),是一種并行化計算編譯技術(shù)。當(dāng)程序在編譯時不確定是否存在數(shù)據(jù)依賴關(guān)系時,編譯器往往保守地認為存在數(shù)據(jù)依賴關(guān)系,從而阻礙了程序的并行化編譯。但是運用TLS編譯技術(shù),可以先假設(shè)程序中不存在數(shù)據(jù)沖突,將程序并行化編譯以提高性能,而將數(shù)據(jù)沖突檢測延后。

    為了解決數(shù)據(jù)沖突的問題,TLS編譯技術(shù)對猜測線程產(chǎn)生的數(shù)據(jù)進行了一定管理,管理方法采用2種方式[6]:

    (1)每個猜測線程產(chǎn)生的數(shù)據(jù)采用專門的緩存(Buffer)管理,不直接寫到內(nèi)存(M emory);在猜測線程的提交(Comm it)階段,再將最終數(shù)據(jù)從緩存中提交到內(nèi)存中。這種方式稱為順序提交(Serial-Comm it)。

    (2)每個猜測線程產(chǎn)生的數(shù)據(jù)直接寫到內(nèi)存(M emory),寫入前的內(nèi)存數(shù)據(jù)備份到專門的緩存(Buffer)中;在猜測線程的提交(Comm it)階段,如果檢測到數(shù)據(jù)沖突,則內(nèi)存中的數(shù)據(jù)被取消,采用備份在緩存中的原數(shù)據(jù)進行恢復(fù)。這種方式稱為直接提交(In-Place Comm it)。

    直接提交相對順序提交而言,是一種激進的數(shù)據(jù)管理方法。直接提交假設(shè)猜測線程產(chǎn)生的猜測數(shù)據(jù)是正確的,且不存在將數(shù)據(jù)從緩存中提交到內(nèi)存的階段,因此如果程序中存在的數(shù)據(jù)沖突較少時,即回滾次數(shù)相對較小時,則采用直接提交將比順序提交可以獲得更好的性能。但是一旦數(shù)據(jù)沖突超過一定比例,直接提交方式的內(nèi)存恢復(fù)的開銷將引起性能急劇下降,并抵消并行化帶來的性能提升,因而此時性能比順序提交要差。另外,在TLS編譯技術(shù)中,當(dāng)程序執(zhí)行時沖突比例超過一定閾值時,TLS并行不管采用直接提交或是順序提交,其執(zhí)行時間將會超過順序執(zhí)行時間。傳統(tǒng)的TLS編譯技術(shù)一般假設(shè)程序中存在一定比例的數(shù)據(jù)沖突,因此使用的數(shù)據(jù)管理方式往往是比較保守的順序提交方式。

    圖1(a)展示了一個循環(huán)體。假設(shè)只有在執(zhí)行時才知道數(shù)組成員間的依賴關(guān)系,則為了保證程序的正確性,這段程序只能順序執(zhí)行,如圖1(b)所示。但是如果運用TLS編譯技術(shù),則可以將這段程序并行化執(zhí)行。剛開始猜測線程執(zhí)行時形成的數(shù)據(jù),稱為猜測數(shù)據(jù),因為并沒有檢驗其數(shù)據(jù)一致性,所以猜測數(shù)據(jù)是不安全的;當(dāng)猜測線程執(zhí)行完畢,如果沒有檢測到數(shù)據(jù)沖突,則該猜測線程產(chǎn)生的數(shù)據(jù)是安全的,此猜測線程產(chǎn)生的猜測數(shù)據(jù)被確認寫入內(nèi)存,這個過程稱為提交;如果檢測到數(shù)據(jù)沖突,線程需要撤銷(Squash)到安全狀態(tài),并進行回滾操作,以保障數(shù)據(jù)一致性,這個過程稱為撤銷并回滾。

    如圖1(c)中所示,線程1對arrary[3]進行寫操作,線程3對array[3]進行讀操作,而且讀操作發(fā)生在寫操作前,即RAW(Read-A fter-W rite)沖突,則線程3必須回滾到安全點重新執(zhí)行。

    圖1 線程猜測循環(huán)過程

    綜上所述,猜測線程的生命周期包括了空閑、猜測化執(zhí)行、提交或檢測到?jīng)_突進行撤銷并回滾等階段,如圖2所示。

    圖2 線程猜測的生命周期

    4 HL-TLS框架

    本文在TLS編譯技術(shù)的基礎(chǔ)上提出了HL-TLS并行化編譯框架:標記能有效并行化的循環(huán)體為熱點循環(huán)體(HL),采用對最高層次的熱點循環(huán)體進行更激進的并行化的方式提高性能,而對非熱點循環(huán)體采用保守的執(zhí)行方式以減少開銷。

    HL-TLS編譯出的程序,除循環(huán)體的線程化部分外,還包含2個重要部件:熱點循環(huán)體判斷部件和執(zhí)行機制動態(tài)轉(zhuǎn)換部件。

    熱點循環(huán)體判斷部件的任務(wù)是尋找符合熱點條件的循環(huán)體。熱點循環(huán)體判斷部件將會使用如下3個條件:

    (1)循環(huán)體所在的函數(shù)被調(diào)用多次,超過HL-TLS定義的臨界調(diào)用次數(shù)——N-HOT-CALL;循環(huán)體順序執(zhí)行時,所用的時間超過HL-TLS定義的臨界執(zhí)行時間——T-HOT-EXE。

    (2)循環(huán)體TLS執(zhí)行后,沖突比例不超過HL-TLS定義的臨界沖突比例1——P-ROLLBACK1。

    (3)循環(huán)體TLS執(zhí)行后,沖突比例超過HL-TLS定義的臨界沖突比例1——P-ROLLBACK1,但不超過HL-TLS定義的臨界沖突比例2——P-ROLLBACK2。

    執(zhí)行機制動態(tài)轉(zhuǎn)換部件的任務(wù)是根據(jù)以上條件決定的循環(huán)體熱點程度選擇該循環(huán)體的執(zhí)行方式:順序執(zhí)行、順序提交的TLS并行化執(zhí)行和直接提交的TLS并行化執(zhí)行。

    循環(huán)體在程序執(zhí)行初期均為非熱點循環(huán)體,采用保守的順序執(zhí)行;當(dāng)符合熱點條件1時,HL-TLS將其標記為第一層次熱點循環(huán)體,循環(huán)體將采用順序提交的TLS并行化執(zhí)行;到達下次執(zhí)行前,將根據(jù)是否符合熱點條件2來決定是否轉(zhuǎn)換為激進的直接提交的TLS并行化執(zhí)行,如果沖突比例小于P-ROLLBACK1,則HL-TLS將其標記為第二層次熱點循環(huán)體,采用激進的直接提交的TLS并行化執(zhí)行此循環(huán)體,以提高執(zhí)行效率;如果沖突比例大于P-ROLLBACK 1但是小于P-ROLLBACK2,即滿足熱點條件3,此循環(huán)體仍然作為第一層次熱點采用順序提交的TLS并行化執(zhí)行;如果沖突比例超過P-ROLLBACK 2,過多的數(shù)據(jù)沖突造成的回滾操作將浪費大量CPU資源,判定此循環(huán)體不適合TLS并行化,HL-TLS將其標記為非熱點循環(huán)體,此后執(zhí)行將轉(zhuǎn)為保守的順序執(zhí)行方式。

    4.1 熱點判斷

    如前文所述,熱點判斷的條件有3點。循環(huán)體滿足條件1或者條件3時,為第一層次熱點循環(huán)體,將采用順序提交的TLS方式執(zhí)行;循環(huán)體滿足條件2時,為第二層次,即最高層次熱點循環(huán)體,將采用激進的直接提交的TLS方式執(zhí)行,以提高程序性能。如果3個條件皆不滿足或者TLS執(zhí)行后發(fā)現(xiàn)沖突比例超過了P-ROLLBACK 2時,此循環(huán)體將被標記為非熱點循環(huán)體,其后續(xù)的執(zhí)行方式將使用順序執(zhí)行。使用各個條件來判斷熱點循環(huán)體的原因如下:

    (1)不滿足條件1:如果循環(huán)體所在的函數(shù)沒有被多次調(diào)用(調(diào)用次數(shù)小于N-HOT-CALL),循環(huán)體并行化的意義不大,繼續(xù)延續(xù)順序執(zhí)行。如果循環(huán)體的單次執(zhí)行時間很短(小于T-HOT-EXE),則可以判定將來并行化帶來的性能提升將被創(chuàng)建線程的開銷所抵消,循環(huán)體不能被判定為熱點循環(huán)體,將繼續(xù)延續(xù)順序執(zhí)行;

    (2)不滿足條件2或者條件3:如果沖突比例過高(HL-TLS中定義為大于P-ROLLBACK 2),則數(shù)據(jù)沖突而回滾整個線程造成的開銷將抵消并行帶來的優(yōu)勢,甚至超過了帶來的優(yōu)勢,即TLS并行化執(zhí)行時間超過順序執(zhí)行時間的情況。

    (3)區(qū)分第一層次和第二層次熱點循環(huán)體:如前文所述,如果回滾比例在一定范圍內(nèi)(HL-TLS中定義為小于P-ROLLBACK1),則直接提交的TLS并行執(zhí)行方式可以獲得比順序提交的TLS并行執(zhí)行方式更快的執(zhí)行速度。第二層次熱點循環(huán)體采用的是直接提交的TLS并行執(zhí)行,其回滾比例小于P-ROLLBACK1;第一層次熱點循環(huán)體采用的是順序提交的TLS并行執(zhí)行,其回滾比例大于P-ROLLBACK 1但小于P-ROLLBACK 2。當(dāng)回滾比例大于P-ROLLBACK2,此循環(huán)體為非熱點循環(huán)體。

    熱點機制的算法實現(xiàn)如下:

    判定為熱點循環(huán)體的優(yōu)勢在于,下一次執(zhí)行此循環(huán)體時,將根據(jù)循環(huán)體為第一層次或第二層次熱點循環(huán)體的信息,來選擇下一次執(zhí)行方式。如果此循環(huán)體被判定為第一層次熱點循環(huán)體,則說明此循環(huán)體滿足了順序提交的TLS并行化執(zhí)行的前提條件,下次執(zhí)行則會采用順序提交的TLS并行化執(zhí)行。如果此循環(huán)體被判定為第二層次熱點,則說明此循環(huán)體用TLS來并行化將有極大可能給程序帶來性能的提升,此時,可以采用更加激進的策略去TLS并行這段程序塊,即采用直接提交的數(shù)據(jù)管理機制。

    相反,如果這段循環(huán)體沒有被判定為第一層或第二層次熱點循環(huán)體,則此循環(huán)體為非熱點循環(huán)體,只能夠保守地對它進行順序執(zhí)行。在這種情況下,通常是因為程序執(zhí)行時遇到了過多的沖突,此時如果仍然采用TLS并行化策略,將會導(dǎo)致開銷(沖突檢測開銷、回滾開銷)帶來的性能下降大過并行化帶來的性能提升。此時,相比較現(xiàn)行其他的TLS策略,HL-TLS編譯優(yōu)化框架有利于避免這種情況的發(fā)生從而大大減少了不必要的開銷。

    使用到的宏、數(shù)據(jù)結(jié)構(gòu)和函數(shù)接口如表1所示。

    表1 熱點判斷部件用到的結(jié)構(gòu)體以及函數(shù)接口

    4.2 執(zhí)行機制動態(tài)轉(zhuǎn)換

    從上節(jié)可知,執(zhí)行機制的動態(tài)轉(zhuǎn)換依賴于熱點判斷部件。對于循環(huán)體運用什么方式的執(zhí)行機制,是由熱點判斷部件決定的。這種動態(tài)的執(zhí)行方式的轉(zhuǎn)化,解決了因TLS并行帶來的并行性能低于順序執(zhí)行性能的問題;并且因更加激進的TLS策略的應(yīng)用,一定程度上提高了程序的性能。如圖3所示,在HL-TLS框架中的動態(tài)轉(zhuǎn)換執(zhí)行機制分為下面2個方面:

    (1)發(fā)生在循環(huán)體多次調(diào)用之間。根據(jù)熱點判斷部件,可以知道循環(huán)體是否被判定為第一層或第二層次熱點循環(huán)體。如果循環(huán)體是第一層次熱點循環(huán)體,則下次執(zhí)行循環(huán)體時,將用TLS并行化機制;如果循環(huán)體是第二層次循環(huán)體,則使用更加激進的直接提交的TLS并行化執(zhí)行策略;否則,此循環(huán)體將使用保守的順序化執(zhí)行機制。

    (2)發(fā)生在循環(huán)體執(zhí)行時。如前文所述,多次執(zhí)行循環(huán)體時,會根據(jù)前幾次的執(zhí)行情況,來指導(dǎo)下一次執(zhí)行。不僅如此,在循環(huán)體執(zhí)行的時候,也會根據(jù)循環(huán)體內(nèi)部前幾次循環(huán)執(zhí)行后的數(shù)據(jù)沖突情況,來指導(dǎo)循環(huán)體剩下部分的執(zhí)行。如果前幾次循環(huán)出現(xiàn)沖突,那么在剩下的循環(huán)體中,出現(xiàn)沖突的可能性就會大大增加。所以,在前幾次循環(huán)中,數(shù)據(jù)沖突出現(xiàn)一定的比例之后,就會轉(zhuǎn)而用順序或同步并行的方法去執(zhí)行剩下的部分。

    圖3 動態(tài)轉(zhuǎn)換執(zhí)行機制

    4.3 程序執(zhí)行流程

    運用HL-TLS框架時,編譯器對源代碼中每個可以TLS并行化執(zhí)行的循環(huán)體前插入一段熱點判斷和執(zhí)行機制動態(tài)轉(zhuǎn)換的代碼,并對其進行并行化編譯,程序執(zhí)行時,通過HL-TLS的熱點判斷和執(zhí)行機制動態(tài)轉(zhuǎn)換部件,進行第一層次、第二層次熱點的判斷,并轉(zhuǎn)換到最適合此循環(huán)體的執(zhí)行方式執(zhí)行。

    (1)順序執(zhí)行程序,跟蹤循環(huán)體是否滿足熱點條件1;

    (2)如果不滿足條件1,則此循環(huán)體被判定為非熱點循環(huán)體,循環(huán)體繼續(xù)采用順序執(zhí)行;

    (3)如果滿足條件1,則此循環(huán)體被判定為第一層次熱點循環(huán)體,循環(huán)體的下次執(zhí)行方式為順序提交的TLS并行,TLS執(zhí)行后判斷是否滿足熱點條件2或者3;

    (4)如果滿足熱點條件2,則此循環(huán)體被判定為第二層次熱點循環(huán)體,此后循環(huán)體的猜測并行化執(zhí)行將采用更為激進的直接提交的TLS執(zhí)行方式;

    (5)如果不滿足條件2,但滿足條件3,則此循環(huán)體延續(xù)為第一層次熱點循環(huán)體,此后的執(zhí)行方式為順序提交的TLS執(zhí)行;

    (6)如果既不滿足條件2,也不滿足條件3,則此循環(huán)體將被判定為非熱點循環(huán)體,此后的執(zhí)行方式為保守地順序執(zhí)行。

    循環(huán)體執(zhí)行的流程如圖4所示。

    圖4 HL-TLS執(zhí)行流程

    在HL-TLS框架中,熱點判斷部件以及執(zhí)行機制動態(tài)轉(zhuǎn)換的采用,有效減少了因回滾引起的開銷,解決了因開銷過大而引起的性能降低的問題;而被標記為第二層次熱點之后,采用更為激進的直接提交的TLS方式執(zhí)行循環(huán)體,在一定程度上提高了其執(zhí)行的性能。

    5 性能比較與分析

    將HL-TLS和SpLSC[7]做性能比較。SpLSC是一個輕量級的TLS編譯框架,是目前相對實用且性能表現(xiàn)比較好的實現(xiàn)框架。SpLSC假設(shè)程序中會存在一定的沖突比例,采用順序提交的TLS執(zhí)行方式,且其執(zhí)行方式在程序執(zhí)行時不可改變。相比較SpLSC來說,HL-TLS引進了熱點循環(huán)體的概念和分析,并運用了執(zhí)行機制的動態(tài)轉(zhuǎn)換,且主要在以下2個方面對SpLSC體現(xiàn)了優(yōu)勢:

    (1)引進熱點循環(huán)體判斷,能有效減少不必要的開銷,特別是避免因回滾過多引起的TLS并行性能比順序性能還低的問題;

    (2)對于最終判定為第二層次熱點的循環(huán)體,HL-TLS將采用更加激進的方案進行TLS并行,所以在一定程度上能提高加速比。

    實驗所用的處理器為Intel Xeon 8核處理器,頻率3.47 GHz,cache大小為12 288 KB。所用的編譯器為gcc-4.6.3,使用-O2選項。實驗采用的測試用例來自以下3個benchmark:SciM ark2,BYTEmark和JOlden。實驗結(jié)果如表2所示,SpLSC和HL-TLS加速比皆為和順序執(zhí)行相比較的結(jié)果。

    表2 測試用例實驗結(jié)果

    如表2所示,4核上的HL-TLS執(zhí)行速度平均要比順序執(zhí)行提高了79.7%,比SpLSC提高了19.8%。其中NNFW性能提升較為明顯,比SpLSC提升了將近40%。

    8核上的HL-TLS執(zhí)行速度平均要比順序執(zhí)行提高了152.3%,比SpLSC提高了20.0%。其中SparseM ult性能提升較為明顯,比SpLSC提升了將近40%。而在IDEA Dekey中性能略微下降了0.8%。

    從實驗結(jié)果中可以看到,除了IDEA Dekey在8核HL-TLS比SpLSC要慢,HL-TLS的性能均有所提升,不管是在4核還是8核上,執(zhí)行速度平均要比SpLSC提高了20%。HL-TLS性能有所提升的主要原因是HL-TLS在執(zhí)行時識別了循環(huán)體熱點層次,其后最高層次熱點循環(huán)體將采用更加激進的直接提交的數(shù)據(jù)管理方案進行TLS并行,因此得到了更多的性能提升。

    IDEA Dekey在8核中,HL-TLS執(zhí)行速度比SpLSC低0.9%。分析運行結(jié)果發(fā)現(xiàn),IDEA Dekey運行時猜測線程產(chǎn)生的數(shù)據(jù)有較高的比例是猜測錯誤的,因此IDEA Dekey適合使用順序提交的TLS并行方式。在IDEA Dekey中,HL-TLS沒有體現(xiàn)出對SpLSC的優(yōu)勢,HL-TLS熱點判斷模塊產(chǎn)生的額外開銷導(dǎo)致了性能略微有所下降。

    除了動態(tài)地采用直接提交的TLS并行策略提升性能,HL-TLS還將動態(tài)地識別那些不適合TLS并行化的循環(huán)體轉(zhuǎn)換為保守地順序執(zhí)行。如表3所示,在EM 3D中,HL-TLS是SpLSC性能的2倍左右。其中,SpLSC性能明顯低于順序執(zhí)行,且不到順序執(zhí)行的50%。而HL-TLS性能接近于順序執(zhí)行。SpLCS引起的回滾數(shù)量為:20(4核)、60(8核)。例如,循環(huán)體進行TLS并行執(zhí)行時如果數(shù)據(jù)沖突過多此時線程撤銷并回滾的開銷已經(jīng)抵消了并行化帶來的優(yōu)勢,HL-TLS將采用順序執(zhí)行,從而避免了如SpLSC的性能明顯下降的問題。

    表3 SpLSC中開銷過大的情況

    因此,從總體上看,無論循環(huán)體猜測并行執(zhí)行時回滾次數(shù)多少,HL-TLS都體現(xiàn)出了對SpLSC的優(yōu)勢。

    6 結(jié)束語

    本文提出一種新的TLS編譯框架HL-TLS。該框架有效解決了現(xiàn)有TLS編譯技術(shù)中猜測并行執(zhí)行回滾開銷過大、性能提高有限的問題。HL-TLS對第二層次的熱點循環(huán)體采用更加激進的TLS并行化策略,從而進一步提高了并行執(zhí)行的性能。而針對回滾過多影響性能、甚至導(dǎo)致并行性能低于順序執(zhí)行的情況,HL-TLS能夠加以識別并動態(tài)轉(zhuǎn)換執(zhí)行機制,從而避免此種問題的發(fā)生。實驗結(jié)果表明,HL-TLS在一定程度上提高了程序的性能,并且解決了開銷過大的問題。下一步的研究方向是在HOT機制中加入同步并行的HOT判斷,并在動態(tài)轉(zhuǎn)換執(zhí)行機制中進行同步并行方案,實現(xiàn)順序、同步并行、順序提交TLS并行和直接提交TLS并行執(zhí)行方式的動態(tài)轉(zhuǎn)換,從而進一步挖掘程序的并行化能力。

    [1] Steffan JG,Colohan C G,Zhai A,et al.A Scalable Approach for Thread Level Speculation[C]//Proceedings of the 27th Annual International Sym posium on Computing Architecture.New York,USA:ACM Press,2000:1-12.

    [2] 賴 鑫,劉 聰,王志英.支持線程級猜測的存儲體系結(jié)構(gòu)設(shè)計[J].計算機工程,2012,38(24):228-234.

    [3] Krishnan V,Torrellas J.A Chip-multiprocessor Architecture with Speculative Multithreading[J].IEEE Transactions on Computings,1999,48(9):866-880.

    [4] Cintra M,Llanos D R.Toward Efficient and Robust Software Speculative Parallelization on Multiprocessors[C]//Proceedings of the 9th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming.New York,USA:ACM Press,2003:13-24.

    [5] Liu W,Tuck J,Ceze L,et al.POSH:A TLS Compiler that Exploits Program Structure[C]//Proceedings of the 11th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming.New York,USA:ACM Press,2006:158-167.

    [6] Yiapanis P,Rosas-Ham D,Brow n G,et al.Optimizing Software Runtime Systems for Speculative Parallelization[J].ACM Transactions on Architecture and Code Optimization,2013,9(4):39-51.

    [7] Oancea C E,Mycroft A.Software Thread-level Speculation:An Optimistic Library Implementation[C]//Proceedings of the 1st International Workshop on Multicore Software Engineering.New York,USA:ACM Press,2008:23-32.

    [8] Oancea C E,Mycroft A.A Lightweight In-place Implementation for Software Thread-level Speculation[C]// Proceedings of the 21st Annual Symposium on Parallelism in Algorithm s and Architectures.New York,USA:ACM Press,2009:223-232.

    [9] Oancea C E,Mycroft A.Set-congruence Dynamic Analysis for Thread-level Speculation[M].Berlin,Germany:Springer-Verlag,2008:156-171.

    [10] Rauchwerger L,Padua D.The LRPD Test:Speculative Run-time Parallelization of Loops with Privatization and Reduction Parallelization[C]//Proceedings of ACM SIGPLAN'95.New York,USA:ACM Press,1995:218-232.

    [11] Dang F,Yu H,Rauchwerger L.The R-LRPD Test:Speculative Parallelization of Partially Parallel Loops,TX77843-3112[R].College Station,USA:Texas A&M University,2001.

    [12] Du Zhaohui,Lim Chu Cheow,Li Xiaofeng,et al.A Cost-driven Compilation Framework for Speculative Parallelization of Sequential Program s[C]//Proceedings of ACM SIGPLAN'04.New York,USA:ACM Press,2004:71-81.

    [13] Dubey P K,O'Brien K,O'Brien K M,et al.Singleprogram Speculative Multithreading(SPSM)Architecture[C]//Proceedings of PACT'95.Manchester,UK:[s.n.],1995:109-121.

    [14] Xiang Lingxiang,Scott M L.Compiler Aided Manual Speculation for High Performance Concurrent Data Structures[C]//Proceedings of the 18th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming.New York,USA:ACM Press,2013:47-56.

    [15] A ldea S,Estebanez A,Llanos D R,et al.A New GCC Plugin-based Compiler Pass to Add Support for Thread level Speculation into OpenMP[C]//Proceedings of EPP'14.Porto,Portugal:Springer International Publishing,2014:234-245.

    [16] 郭 輝,王 瓊,沈 立,等.多核平臺上的線程級猜測執(zhí)行綜述[J].計算機科學(xué),2014,41(1):16-21.

    編輯索書志

    HL-TLS:Com piling Implementation of Thread Level Speculation Supporting Hot Spot

    JIN Yue,LI Chunqiang,SHANG Yunhai,LU Yongjiang
    (Institute of VLSIDesign,Zhejiang University,Hangzhou 310027,China)

    Thread Level Speculation(TLS)compiling can effectively improve the parallel efficiency.But the overheads,caused by the management of the speculative data and the failure of speculative thread's rollback,decreases the improvement of the parallel performance.Aiming at the too big overhead of data management and thread rollback,the Hot Loops-TLS(HL-TLS)framework is proposed.HL-TLS marks the loops which can be efficiently paralleled as HL,using a more eager parallel way on HL to improve performance,while using conservative sequence way on non-HL to reduce the overheads.Experimental result shows that HL-TLS im proves 20%performance.

    parallel computing;multi-thread;speculative execution;Thread Level Speculation(TLS)parallel;Hot Loops(HL);dynamic transformation execution mechanism

    金 躍,李春強,尚云海,等.HL-TLS:支持熱點的線程級猜測編譯實現(xiàn)[J].計算機工程,2015,41(11):77-83.

    英文引用格式:Jin Yue,Li Chunqiang,Shang Yunhai,et al.HL-TLS:Com piling Implementation of Thread Level Speculation Supporting Hot Spot[J].Computer Engineering,2015,41(11):77-83.

    1000-3428(2015)11-0077-07

    A

    TP311

    10.3969/j.issn.1000-3428.2015.11.014

    國家自然科學(xué)基金資助項目(61204111);“核高基”重大專項(2010ZX01030-001-001-006)。

    金 躍(1990-),男,碩士研究生,主研方向:編譯器優(yōu)化,并行計算;李春強、尚云海,碩士;盧永江,副教授、博士。

    2014-11-06

    2014-12-07 E-m ail:xuyv@zju.edu.cn

    猜你喜歡
    線程熱點沖突
    熱點
    耶路撒冷爆發(fā)大規(guī)模沖突
    “三宜”“三不宜”化解師生沖突
    井岡教育(2020年6期)2020-12-14 03:04:32
    熱點
    車迷(2019年10期)2019-06-24 05:43:28
    結(jié)合熱點做演講
    快樂語文(2018年7期)2018-05-25 02:32:00
    淺談linux多線程協(xié)作
    “鄰避沖突”的破解路徑
    浙江人大(2014年6期)2014-03-20 16:20:40
    熱點
    中國記者(2014年6期)2014-03-01 01:39:53
    Linux線程實現(xiàn)技術(shù)研究
    一次沖突引發(fā)的思考和實踐
    中國火炬(2012年3期)2012-07-25 10:34:06
    内射极品少妇av片p| 婷婷色av中文字幕| 亚洲av成人精品一二三区| 街头女战士在线观看网站| 伦精品一区二区三区| 嫩草影院新地址| 高清不卡的av网站| 免费黄网站久久成人精品| 亚洲无线观看免费| 中文欧美无线码| 狂野欧美激情性xxxx在线观看| 国产老妇伦熟女老妇高清| 亚洲精品乱码久久久v下载方式| 国产精品不卡视频一区二区| 国产精品成人在线| 成人影院久久| 国产亚洲一区二区精品| 亚洲在久久综合| 免费人妻精品一区二区三区视频| 欧美另类一区| 日日爽夜夜爽网站| 纯流量卡能插随身wifi吗| 国产欧美日韩精品一区二区| 全区人妻精品视频| 久久国产精品大桥未久av | 一级毛片电影观看| 人妻人人澡人人爽人人| 少妇精品久久久久久久| 国产熟女欧美一区二区| 精品午夜福利在线看| 少妇猛男粗大的猛烈进出视频| 国产精品一二三区在线看| 日韩欧美一区视频在线观看 | 99热这里只有是精品在线观看| 免费少妇av软件| 最近中文字幕2019免费版| 国产极品粉嫩免费观看在线 | 五月玫瑰六月丁香| 我要看日韩黄色一级片| 久久精品久久久久久久性| 男人添女人高潮全过程视频| 国产永久视频网站| 99九九线精品视频在线观看视频| 日本黄色片子视频| www.av在线官网国产| 亚洲欧美精品专区久久| 中文字幕av电影在线播放| 丝袜在线中文字幕| 国产成人精品福利久久| 99久久中文字幕三级久久日本| 黄色毛片三级朝国网站 | 亚洲av.av天堂| 男男h啪啪无遮挡| 韩国高清视频一区二区三区| 十八禁网站网址无遮挡 | 中文在线观看免费www的网站| 精品酒店卫生间| 国产 一区精品| 视频中文字幕在线观看| 精品亚洲乱码少妇综合久久| 国产精品.久久久| 3wmmmm亚洲av在线观看| 亚洲成人手机| 老熟女久久久| 制服丝袜香蕉在线| 激情五月婷婷亚洲| 另类精品久久| 亚洲国产日韩一区二区| 桃花免费在线播放| 乱系列少妇在线播放| 男女无遮挡免费网站观看| 高清黄色对白视频在线免费看 | 久热这里只有精品99| 成人毛片60女人毛片免费| 亚洲国产欧美在线一区| 在线免费观看不下载黄p国产| 午夜免费观看性视频| 国内少妇人妻偷人精品xxx网站| 777米奇影视久久| 国产精品熟女久久久久浪| 国产日韩欧美在线精品| 汤姆久久久久久久影院中文字幕| 亚洲av电影在线观看一区二区三区| 亚洲精品第二区| 成年女人在线观看亚洲视频| 亚洲精品亚洲一区二区| 国产亚洲午夜精品一区二区久久| 亚洲欧美日韩另类电影网站| 少妇被粗大的猛进出69影院 | 18+在线观看网站| 只有这里有精品99| 热re99久久国产66热| 国产乱人偷精品视频| 全区人妻精品视频| 久久午夜综合久久蜜桃| 国产深夜福利视频在线观看| 老司机影院毛片| 国产成人免费观看mmmm| 国产老妇伦熟女老妇高清| 成人午夜精彩视频在线观看| 免费高清在线观看视频在线观看| 国产免费视频播放在线视频| 免费少妇av软件| 精品人妻偷拍中文字幕| 亚洲,一卡二卡三卡| 久久久久久久国产电影| 两个人的视频大全免费| 黄色怎么调成土黄色| 女的被弄到高潮叫床怎么办| 国产免费福利视频在线观看| 中国国产av一级| 美女视频免费永久观看网站| 欧美三级亚洲精品| 免费av中文字幕在线| 秋霞在线观看毛片| 欧美日本中文国产一区发布| 大码成人一级视频| 国产美女午夜福利| 大香蕉久久网| 日韩大片免费观看网站| 韩国av在线不卡| 99re6热这里在线精品视频| 成人黄色视频免费在线看| 卡戴珊不雅视频在线播放| 老女人水多毛片| 伊人亚洲综合成人网| 一级二级三级毛片免费看| 国产精品久久久久久久久免| 国产成人精品久久久久久| 多毛熟女@视频| 建设人人有责人人尽责人人享有的| 国产成人freesex在线| 91午夜精品亚洲一区二区三区| 女人精品久久久久毛片| 婷婷色综合www| 午夜激情福利司机影院| 99久久精品一区二区三区| 中文天堂在线官网| 毛片一级片免费看久久久久| h视频一区二区三区| 在线观看免费日韩欧美大片 | 亚洲精品国产av蜜桃| 伦理电影大哥的女人| 桃花免费在线播放| 欧美3d第一页| 天堂中文最新版在线下载| 国国产精品蜜臀av免费| 成年av动漫网址| 肉色欧美久久久久久久蜜桃| 国产精品女同一区二区软件| 欧美精品高潮呻吟av久久| 久久国产精品大桥未久av | 亚洲人与动物交配视频| 中文字幕制服av| 国产午夜精品一二区理论片| 国产精品久久久久久久电影| 少妇裸体淫交视频免费看高清| 久久精品国产亚洲av天美| 精品熟女少妇av免费看| 色视频在线一区二区三区| 国产深夜福利视频在线观看| 天堂中文最新版在线下载| 国产午夜精品久久久久久一区二区三区| a级毛片免费高清观看在线播放| 婷婷色av中文字幕| 国产精品久久久久久久电影| 美女xxoo啪啪120秒动态图| 久久久久久人妻| 亚洲av日韩在线播放| 99九九线精品视频在线观看视频| 国产一区有黄有色的免费视频| 日韩av不卡免费在线播放| 91在线精品国自产拍蜜月| 精品亚洲成国产av| 亚洲天堂av无毛| 亚洲精品国产av成人精品| 久热这里只有精品99| 3wmmmm亚洲av在线观看| 下体分泌物呈黄色| 免费av不卡在线播放| 精品久久久久久久久av| 纯流量卡能插随身wifi吗| 日本黄大片高清| 丰满迷人的少妇在线观看| 亚洲美女搞黄在线观看| 91午夜精品亚洲一区二区三区| 中文字幕av电影在线播放| 国产色婷婷99| 日韩伦理黄色片| 女性被躁到高潮视频| 国产毛片在线视频| 2018国产大陆天天弄谢| 中文字幕亚洲精品专区| 亚洲精品亚洲一区二区| 国内精品宾馆在线| 女性生殖器流出的白浆| 美女xxoo啪啪120秒动态图| av在线app专区| 日产精品乱码卡一卡2卡三| 热re99久久国产66热| h视频一区二区三区| 精品国产乱码久久久久久小说| av不卡在线播放| 亚洲,欧美,日韩| 色吧在线观看| 99热这里只有是精品在线观看| 99精国产麻豆久久婷婷| 91久久精品国产一区二区三区| 自线自在国产av| 交换朋友夫妻互换小说| 久久国产亚洲av麻豆专区| 秋霞伦理黄片| 少妇丰满av| 曰老女人黄片| 黑丝袜美女国产一区| av天堂久久9| 精品亚洲成国产av| 免费播放大片免费观看视频在线观看| 免费在线观看成人毛片| 夫妻性生交免费视频一级片| 免费大片18禁| 国产在线男女| 97超视频在线观看视频| 丝瓜视频免费看黄片| 久久免费观看电影| av不卡在线播放| 亚洲国产日韩一区二区| 国产日韩一区二区三区精品不卡 | 80岁老熟妇乱子伦牲交| xxx大片免费视频| 一级av片app| 午夜福利网站1000一区二区三区| 久久午夜福利片| 在线播放无遮挡| 日本与韩国留学比较| 精品久久国产蜜桃| 王馨瑶露胸无遮挡在线观看| 国产日韩欧美视频二区| 色5月婷婷丁香| 日韩中字成人| 国产成人a∨麻豆精品| 久久精品夜色国产| 久久毛片免费看一区二区三区| 亚洲精品,欧美精品| 天美传媒精品一区二区| 久久久久久人妻| 国产精品一区二区性色av| 国产国拍精品亚洲av在线观看| 欧美日韩av久久| 日韩视频在线欧美| 日韩人妻高清精品专区| 国产精品国产三级国产av玫瑰| 能在线免费看毛片的网站| 国产又色又爽无遮挡免| 国产精品免费大片| 国产成人精品一,二区| av免费观看日本| 国产精品99久久99久久久不卡 | 极品人妻少妇av视频| 啦啦啦啦在线视频资源| 成人毛片a级毛片在线播放| av卡一久久| 国产毛片在线视频| 亚洲欧洲精品一区二区精品久久久 | 久久6这里有精品| 99久久精品一区二区三区| 色婷婷av一区二区三区视频| 午夜精品国产一区二区电影| 亚洲天堂av无毛| 午夜激情福利司机影院| 久久久久久久久久久久大奶| 国内精品宾馆在线| 在线天堂最新版资源| 亚洲,一卡二卡三卡| 免费看不卡的av| 亚洲自偷自拍三级| 一个人免费看片子| 亚洲国产av新网站| 蜜桃久久精品国产亚洲av| 在线观看av片永久免费下载| 国产片特级美女逼逼视频| 国产男女超爽视频在线观看| 亚洲精品久久午夜乱码| 午夜福利,免费看| 欧美最新免费一区二区三区| 国产高清国产精品国产三级| 两个人免费观看高清视频 | 久久久精品免费免费高清| 日日撸夜夜添| 日日啪夜夜爽| 国产伦精品一区二区三区视频9| 啦啦啦啦在线视频资源| 国产精品福利在线免费观看| 午夜福利视频精品| 黄色欧美视频在线观看| 国产探花极品一区二区| 麻豆精品久久久久久蜜桃| 亚洲欧美日韩东京热| 国产 一区精品| 99九九线精品视频在线观看视频| 熟妇人妻不卡中文字幕| 我的老师免费观看完整版| xxx大片免费视频| 三级国产精品片| 你懂的网址亚洲精品在线观看| 国产精品欧美亚洲77777| 国产无遮挡羞羞视频在线观看| 亚洲欧美日韩东京热| 亚洲精品色激情综合| 欧美精品亚洲一区二区| 国产成人午夜福利电影在线观看| 多毛熟女@视频| 国产免费又黄又爽又色| 免费不卡的大黄色大毛片视频在线观看| 亚洲精品乱码久久久v下载方式| 亚洲熟女精品中文字幕| 亚洲国产欧美日韩在线播放 | 国产免费一区二区三区四区乱码| 三级经典国产精品| 高清不卡的av网站| 黄色配什么色好看| 久久97久久精品| 国产成人一区二区在线| 丰满迷人的少妇在线观看| 人妻 亚洲 视频| 国产成人精品婷婷| 男女无遮挡免费网站观看| 丰满人妻一区二区三区视频av| 狠狠精品人妻久久久久久综合| 国产精品成人在线| 妹子高潮喷水视频| 日本av免费视频播放| 少妇 在线观看| 日韩人妻高清精品专区| 99热6这里只有精品| 国内少妇人妻偷人精品xxx网站| 日韩亚洲欧美综合| 亚洲精品aⅴ在线观看| 一本大道久久a久久精品| 黄色日韩在线| 亚洲婷婷狠狠爱综合网| 国产av码专区亚洲av| 亚洲高清免费不卡视频| 欧美日韩综合久久久久久| 精品少妇内射三级| 九九在线视频观看精品| 国内精品宾馆在线| 天堂中文最新版在线下载| 春色校园在线视频观看| 大话2 男鬼变身卡| 亚洲国产精品成人久久小说| 我的老师免费观看完整版| 亚洲国产最新在线播放| 成人午夜精彩视频在线观看| 精华霜和精华液先用哪个| 99久久精品国产国产毛片| 欧美激情国产日韩精品一区| 校园人妻丝袜中文字幕| 国产在线免费精品| 99久久综合免费| 国产白丝娇喘喷水9色精品| 亚洲欧美日韩卡通动漫| 日韩熟女老妇一区二区性免费视频| 最近中文字幕高清免费大全6| 国产毛片在线视频| av国产精品久久久久影院| 伊人久久精品亚洲午夜| 久久韩国三级中文字幕| h日本视频在线播放| 毛片一级片免费看久久久久| 美女脱内裤让男人舔精品视频| 人妻人人澡人人爽人人| 久久99一区二区三区| 国内精品宾馆在线| 精品人妻偷拍中文字幕| 青春草国产在线视频| 久久99蜜桃精品久久| 妹子高潮喷水视频| 日韩伦理黄色片| 亚洲美女搞黄在线观看| 成人国产av品久久久| 人妻一区二区av| 美女xxoo啪啪120秒动态图| 高清视频免费观看一区二区| 久久精品久久精品一区二区三区| 国产精品.久久久| 亚洲成人手机| 精品熟女少妇av免费看| 国产精品99久久99久久久不卡 | 久久综合国产亚洲精品| 欧美激情极品国产一区二区三区 | 亚洲情色 制服丝袜| 麻豆成人av视频| 国产综合精华液| 久久鲁丝午夜福利片| 高清不卡的av网站| 人体艺术视频欧美日本| 国语对白做爰xxxⅹ性视频网站| 欧美日韩一区二区视频在线观看视频在线| 精品一区二区三区视频在线| 久久久午夜欧美精品| 99热全是精品| 日韩中字成人| 中文字幕人妻熟人妻熟丝袜美| av免费在线看不卡| 国产色婷婷99| 久久ye,这里只有精品| 欧美老熟妇乱子伦牲交| 嫩草影院新地址| 成人免费观看视频高清| 国语对白做爰xxxⅹ性视频网站| 午夜福利在线观看免费完整高清在| av不卡在线播放| 伊人亚洲综合成人网| 免费在线观看成人毛片| av福利片在线| 精品人妻一区二区三区麻豆| 国产亚洲欧美精品永久| 国产av一区二区精品久久| a级毛片免费高清观看在线播放| 日韩成人伦理影院| 啦啦啦中文免费视频观看日本| 女人久久www免费人成看片| 亚洲成人手机| 天堂中文最新版在线下载| 黄色视频在线播放观看不卡| 欧美日韩在线观看h| 香蕉精品网在线| 亚洲怡红院男人天堂| 国产高清三级在线| 欧美另类一区| 人妻制服诱惑在线中文字幕| 国语对白做爰xxxⅹ性视频网站| 亚洲第一区二区三区不卡| 国产精品一区www在线观看| 国产极品天堂在线| 国产爽快片一区二区三区| 女人精品久久久久毛片| 日韩欧美一区视频在线观看 | 99精国产麻豆久久婷婷| 丝袜脚勾引网站| 亚洲精品久久久久久婷婷小说| 免费看av在线观看网站| 国产成人91sexporn| 精品一区二区三卡| 欧美性感艳星| 国产精品国产av在线观看| 有码 亚洲区| 国产淫片久久久久久久久| 国产中年淑女户外野战色| 国产精品.久久久| 成人影院久久| 日韩电影二区| 国产一区亚洲一区在线观看| videos熟女内射| 精品人妻偷拍中文字幕| 久久6这里有精品| 十八禁网站网址无遮挡 | 新久久久久国产一级毛片| 又大又黄又爽视频免费| 成人二区视频| 国产精品国产三级专区第一集| 下体分泌物呈黄色| 国产免费一级a男人的天堂| 亚洲四区av| 国产av码专区亚洲av| 精品卡一卡二卡四卡免费| 女人久久www免费人成看片| 观看美女的网站| 亚洲精华国产精华液的使用体验| 国产精品欧美亚洲77777| 另类亚洲欧美激情| 国产精品一区二区在线不卡| 成年女人在线观看亚洲视频| 一本—道久久a久久精品蜜桃钙片| 亚洲精品乱码久久久v下载方式| 免费观看a级毛片全部| 日本黄色片子视频| 国产一区二区三区av在线| 日韩一区二区三区影片| 亚洲精品乱码久久久久久按摩| 在线 av 中文字幕| 国产免费福利视频在线观看| 中文字幕精品免费在线观看视频 | 人妻系列 视频| 国产亚洲5aaaaa淫片| 国产乱来视频区| 国产精品无大码| 国产亚洲一区二区精品| 日本色播在线视频| 高清毛片免费看| 亚洲av男天堂| 亚洲av成人精品一区久久| 欧美精品国产亚洲| 久久精品熟女亚洲av麻豆精品| 免费久久久久久久精品成人欧美视频 | 亚洲欧美精品专区久久| 特大巨黑吊av在线直播| 亚洲怡红院男人天堂| 少妇精品久久久久久久| 一级a做视频免费观看| 亚洲精品一二三| 色视频在线一区二区三区| 伦理电影大哥的女人| 亚洲精品国产av成人精品| 中文天堂在线官网| 天堂俺去俺来也www色官网| 久久精品国产自在天天线| 成年av动漫网址| 亚洲av成人精品一二三区| 国产乱人偷精品视频| av免费在线看不卡| 在线观看人妻少妇| 中国三级夫妇交换| 免费少妇av软件| 男女国产视频网站| 内射极品少妇av片p| 91精品国产国语对白视频| 欧美区成人在线视频| 色婷婷久久久亚洲欧美| 欧美精品一区二区大全| 少妇人妻精品综合一区二区| 男人舔奶头视频| 国产乱来视频区| av免费观看日本| 蜜桃久久精品国产亚洲av| 亚洲国产精品专区欧美| 亚洲第一av免费看| 久久久精品94久久精品| 亚洲无线观看免费| 美女福利国产在线| 高清午夜精品一区二区三区| 熟女人妻精品中文字幕| 亚洲美女黄色视频免费看| 亚洲美女搞黄在线观看| 日韩中文字幕视频在线看片| 国产精品国产av在线观看| 国精品久久久久久国模美| 欧美区成人在线视频| 亚洲欧美一区二区三区国产| 成人黄色视频免费在线看| 中文字幕人妻熟人妻熟丝袜美| 日本猛色少妇xxxxx猛交久久| 少妇的逼水好多| 日本爱情动作片www.在线观看| 精品酒店卫生间| 亚洲国产最新在线播放| 久久人妻熟女aⅴ| 国产成人免费观看mmmm| 亚洲欧美一区二区三区国产| 亚洲精品自拍成人| 最近的中文字幕免费完整| 国产午夜精品久久久久久一区二区三区| 香蕉精品网在线| 亚洲国产av新网站| 99热这里只有是精品50| 精品一区在线观看国产| 欧美日本中文国产一区发布| 一区二区三区乱码不卡18| 日本黄大片高清| 日韩 亚洲 欧美在线| 亚洲精品日韩在线中文字幕| 三级国产精品片| 国产精品偷伦视频观看了| 国产精品久久久久久久久免| 亚洲欧美成人综合另类久久久| 乱码一卡2卡4卡精品| 大片电影免费在线观看免费| 欧美变态另类bdsm刘玥| 久久午夜综合久久蜜桃| 国产一区二区三区综合在线观看 | 高清午夜精品一区二区三区| 精品一区二区三区视频在线| 亚洲精品久久久久久婷婷小说| 国产精品久久久久久久久免| 极品人妻少妇av视频| 国产色婷婷99| 久久久久人妻精品一区果冻| 人妻制服诱惑在线中文字幕| 欧美日韩国产mv在线观看视频| 在线看a的网站| 久久精品夜色国产| 亚洲国产精品专区欧美| 在线精品无人区一区二区三| 女性被躁到高潮视频| 亚洲欧洲国产日韩| 免费看不卡的av| av不卡在线播放| 国内揄拍国产精品人妻在线| 亚洲欧美成人精品一区二区| 老司机亚洲免费影院| 草草在线视频免费看| 日韩成人伦理影院| 久久久久网色| www.色视频.com| 不卡视频在线观看欧美| 日韩 亚洲 欧美在线| 最近最新中文字幕免费大全7| 日韩,欧美,国产一区二区三区| 欧美精品亚洲一区二区| 成人国产av品久久久| 国产黄频视频在线观看| 久久狼人影院| 丰满少妇做爰视频| 国产熟女午夜一区二区三区 | 久久久午夜欧美精品| 在线观看一区二区三区激情| 91久久精品国产一区二区成人| 日日啪夜夜撸| 在线观看一区二区三区激情| 男男h啪啪无遮挡| 欧美精品一区二区免费开放| 国产伦精品一区二区三区四那| 成人无遮挡网站| 欧美日韩视频精品一区|