• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種支持Superscalar-VLIW混合架構(gòu)處理器的混合分支預(yù)測(cè)設(shè)計(jì)

    2017-02-27 10:58:48付家為
    關(guān)鍵詞:預(yù)測(cè)器雙峰計(jì)數(shù)器

    付家為 王 旭 何 虎

    (清華大學(xué)微電子學(xué)研究所 北京 100084)

    一種支持Superscalar-VLIW混合架構(gòu)處理器的混合分支預(yù)測(cè)設(shè)計(jì)

    付家為 王 旭 何 虎

    (清華大學(xué)微電子學(xué)研究所 北京 100084)

    描述在一款支持超標(biāo)量與超長(zhǎng)指令字結(jié)構(gòu)的混合架構(gòu)數(shù)字信號(hào)處理器上設(shè)計(jì)的分支預(yù)測(cè)結(jié)構(gòu)。為控制硬件復(fù)雜度并充分提高預(yù)測(cè)準(zhǔn)確度,設(shè)計(jì)雙峰預(yù)測(cè)器與PAp預(yù)測(cè)器混合型預(yù)測(cè)結(jié)構(gòu),充分發(fā)揮兩種預(yù)測(cè)器的優(yōu)點(diǎn)。在設(shè)計(jì)完成的處理器上,運(yùn)行標(biāo)準(zhǔn)DSPstone程序。實(shí)驗(yàn)結(jié)果表明,添加分支預(yù)測(cè)結(jié)構(gòu)使得處理器性能平均提升23%,并且混合型預(yù)測(cè)結(jié)構(gòu)相比單一預(yù)測(cè)結(jié)構(gòu)在準(zhǔn)確度方面優(yōu)勢(shì)明顯。

    數(shù)字信號(hào)處理器 超標(biāo)量 超長(zhǎng)指令字 分支預(yù)測(cè) 雙峰預(yù)測(cè) PAp

    0 引 言

    數(shù)字信號(hào)處理器(DSP)已經(jīng)越來(lái)越多地應(yīng)用于通信及多媒體信號(hào)處理領(lǐng)域,隨著如視頻、音頻、圖像等多媒體應(yīng)用越來(lái)越復(fù)雜多樣,對(duì)處理器性能的要求也越來(lái)越高[1]。提高指令并行度(ILP)是提高處理器性能的重要手段。超標(biāo)量(Superscalar)與超長(zhǎng)指令字(VLIW)技術(shù)作為挖掘指令并行度的重要手段,分別在硬件層面與軟件層面對(duì)指令并行進(jìn)行調(diào)度。Superscalar技術(shù)由硬件決定指令并行性[2],硬件復(fù)雜度較高,對(duì)于編譯器要求較低,軟件可移植性較強(qiáng)[3];VLIW技術(shù)由軟件調(diào)度指令并行性,大大降低了硬件復(fù)雜度,但隨之而來(lái)的代價(jià)是軟件復(fù)雜度的增大以及寄存器和功能單元數(shù)目的增加[4],而且VLIW處理器程序兼容性也較低。為充分利用兩種技術(shù)的優(yōu)勢(shì),本設(shè)計(jì)處理器采用Superscalar與VLIW混合架構(gòu),對(duì)于運(yùn)算密集重復(fù)性較高的程序,采用VLIW模式執(zhí)行,提高指令并行度以提高執(zhí)行效率,其他部分程序采用Superscalar模式執(zhí)行,確保程序可移植性。

    現(xiàn)代高性能處理器中多數(shù)采用流水線技術(shù),采用流水線技術(shù)隨之而來(lái)的問(wèn)題就是跳轉(zhuǎn)指令所帶來(lái)的周期損失,尤其對(duì)于深度流水線結(jié)構(gòu)處理器更是明顯。所以成熟精準(zhǔn)的分支預(yù)測(cè)設(shè)計(jì)對(duì)于處理器性能的提升不言而喻?,F(xiàn)階段常用的分支預(yù)測(cè)技術(shù)主要分為靜態(tài)分支預(yù)測(cè)與動(dòng)態(tài)分支預(yù)測(cè)。對(duì)于靜態(tài)分支預(yù)測(cè),程序中每次遇到跳轉(zhuǎn)指令,都對(duì)其進(jìn)行固定的預(yù)測(cè),靜態(tài)分支預(yù)測(cè)準(zhǔn)確率較低。動(dòng)態(tài)分支預(yù)測(cè)在每次遇到跳轉(zhuǎn)指令時(shí),通過(guò)關(guān)聯(lián)之前的跳轉(zhuǎn)信息,對(duì)不同的跳轉(zhuǎn)指令進(jìn)行不同的預(yù)測(cè),并實(shí)時(shí)更新跳轉(zhuǎn)信息[5]。

    動(dòng)態(tài)分支預(yù)測(cè)中,廣泛使用的方法主要有雙峰預(yù)測(cè)與兩級(jí)自適應(yīng)預(yù)測(cè),近年來(lái)各種改進(jìn)型預(yù)測(cè)器如神經(jīng)網(wǎng)絡(luò)型預(yù)測(cè)器也是相繼被提出。較成熟的雙峰預(yù)測(cè)與兩級(jí)自適應(yīng)預(yù)測(cè)各有利弊[6],其中兩級(jí)自適應(yīng)預(yù)測(cè)中常被使用到的方法包括PAp、GAg、GAs、Gshare等。雙峰預(yù)測(cè)器的優(yōu)勢(shì)在于硬件結(jié)構(gòu)簡(jiǎn)單,預(yù)測(cè)穩(wěn)定性高,訓(xùn)練時(shí)間短,但準(zhǔn)確率較低;兩級(jí)自適應(yīng)預(yù)測(cè)器的準(zhǔn)確率較高,但是硬件邏輯較為復(fù)雜,增加了面積功耗的額外開(kāi)銷(xiāo)。

    現(xiàn)有技術(shù)中,動(dòng)態(tài)分支預(yù)測(cè)已在Superscalar結(jié)構(gòu)上充分利用,而VLIW結(jié)構(gòu)的分支預(yù)測(cè)功能多采用靜態(tài)預(yù)測(cè),由軟件調(diào)度。事實(shí)上,大多數(shù)VLIW結(jié)構(gòu)使用延遲跳轉(zhuǎn)技術(shù)[7],這大大增加了編譯器的負(fù)擔(dān),尤其對(duì)于VLIW結(jié)構(gòu)單周期多發(fā)射指令編譯,編譯器為填滿(mǎn)延遲槽大大增加了軟件負(fù)擔(dān)[8]。所以,為VLIW結(jié)構(gòu)設(shè)計(jì)動(dòng)態(tài)分支預(yù)測(cè)方法具有重要的意義。

    本文提出支持Superscalar與VLIW雙模式架構(gòu)處理器的動(dòng)態(tài)分支預(yù)測(cè)方法,預(yù)測(cè)設(shè)計(jì)采用雙峰預(yù)測(cè)與PAp預(yù)測(cè)混合結(jié)構(gòu),對(duì)于不同跳轉(zhuǎn)指令使用不同的預(yù)測(cè)方法,充分發(fā)揮兩種預(yù)測(cè)器的優(yōu)勢(shì)。實(shí)驗(yàn)結(jié)果表明,使用混合結(jié)構(gòu)預(yù)測(cè)器比單獨(dú)結(jié)構(gòu)預(yù)測(cè)器性能優(yōu)勢(shì)明顯,并使處理器整體性能得到很大提升。

    1 Orchid結(jié)構(gòu)

    1.1 Orchid硬件結(jié)構(gòu)

    本設(shè)計(jì)在清華大學(xué)DSP實(shí)驗(yàn)室自主開(kāi)發(fā)的Orchid處理器上完成,Orchid是一款兼容ARM指令集的通用處理器,采用Superscalar-VLIW混合結(jié)構(gòu),整體分為程序存儲(chǔ)器、數(shù)據(jù)存儲(chǔ)器、指令獲取模塊、指令分發(fā)模塊、執(zhí)行模塊以及寄存器堆模塊,如圖1所示,是Orchid處理器的整體硬件結(jié)構(gòu)。

    圖1 Orchid整體結(jié)構(gòu)圖

    指令獲取模塊每次從程序存儲(chǔ)器中獲取256位的指令包,包含16位與32位混編指令。分發(fā)單元可以工作在兩種分發(fā)模式下,Superscalar模式和VLIW模式,由軟件實(shí)現(xiàn)模式切換,Superscalar模式支持最多2發(fā)射,VLIW模式支持最多6發(fā)射。經(jīng)過(guò)將指令包中的指令擴(kuò)展、分發(fā)后,分配到相應(yīng)的執(zhí)行單元進(jìn)行指令執(zhí)行。為更好地兼容ARM指令集,Orchid的寄存器堆采用與ARM架構(gòu)相應(yīng)的15個(gè)通用寄存器。

    Orchid功能單元分為兩個(gè)A單元,兩個(gè)M單元,兩個(gè)D單元,最多支持六條指令并行執(zhí)行。其中A單元用于算術(shù)邏輯運(yùn)算以及移位運(yùn)算,M單元用于乘法運(yùn)算,D單元用于存儲(chǔ)器的存取以及實(shí)現(xiàn)程序的跳轉(zhuǎn)。

    1.2 Orchid流水線結(jié)構(gòu)

    Orchid流水線設(shè)計(jì)為十級(jí)流水線結(jié)構(gòu),主要分為Fetch_PG、Fetch_PS、Fetch_WT、Fetch_IR、Fetch_EXP、Dispatch、Decode、Exe1、Exe2、Exe3,如圖2所示。流水線各級(jí)功能如下:

    Fetch_PG:分支預(yù)測(cè)以及產(chǎn)生PC地址。

    Fetch_PS:將產(chǎn)生的PC地址傳遞給指令cache控制單元。

    Fetch_WT:等待指令cache控制單元讀取指令。

    Fetch_IR:從指令cache控制單元讀取指令。

    Fetch_EXP:將16位于32位指令統(tǒng)一擴(kuò)展成32位指令,每6條指令形成一個(gè)擴(kuò)展包。

    Dispatch:執(zhí)行指令并行分發(fā)策略,將具有并行性的指令同時(shí)分發(fā)到各個(gè)功能單元。對(duì)于Superscalar模式,最多并行發(fā)射2條指令,并行分發(fā)原則是判斷兩條指令是否有依賴(lài)關(guān)系以及執(zhí)行單元是否沖突;對(duì)于VLIW模式,最多并行發(fā)射6條執(zhí)行,并行分發(fā)原則是按照指令執(zhí)行單元順序。

    Decode:指令解碼。

    Exe1~Exe3:執(zhí)行級(jí),完成指令執(zhí)行其中Exe1完成單周期執(zhí)行指令,Exe2與Exe3完成多周期執(zhí)行指令。

    圖2 Orchid流水線結(jié)構(gòu)圖

    2 Orchid雙模式分支預(yù)測(cè)設(shè)計(jì)

    2.1 Orchid 雙峰-PAp混合預(yù)測(cè)器結(jié)構(gòu)

    本設(shè)計(jì)采用了雙峰預(yù)測(cè)器與PAp預(yù)測(cè)器結(jié)合的混合預(yù)測(cè)結(jié)構(gòu),對(duì)于不同的跳轉(zhuǎn)指令采用不同的預(yù)測(cè)機(jī)制,充分發(fā)揮兩種預(yù)測(cè)器的優(yōu)勢(shì)。

    分支預(yù)測(cè)的原理是在Fetch_PG級(jí),通過(guò)PC地址索引BTB表查找跳轉(zhuǎn)信息,如果查到了跳轉(zhuǎn)指令的信息,則按照跳轉(zhuǎn)信息進(jìn)行跳轉(zhuǎn)操作。在執(zhí)行級(jí)判斷預(yù)測(cè)是否正確,如果預(yù)測(cè)正確,則按照預(yù)測(cè)結(jié)果繼續(xù)執(zhí)行,如果預(yù)測(cè)錯(cuò)誤,則清空流水線,從正確位置重新執(zhí)行并對(duì)BTB表中存儲(chǔ)的跳轉(zhuǎn)信息進(jìn)行修改。分支預(yù)測(cè)原理如圖3所示。

    圖3 分支預(yù)測(cè)原理圖

    雙峰預(yù)測(cè)器的核心技術(shù)是分支目標(biāo)緩存表(BTB),BTB表是一塊SRAM,里面存儲(chǔ)著各條跳轉(zhuǎn)指令的跳轉(zhuǎn)信息,由PC進(jìn)行索引。雙峰預(yù)測(cè)BTB表的每個(gè)表項(xiàng)存儲(chǔ)四部分信息:跳轉(zhuǎn)指令地址BIA(Branch Instruction Address)、跳轉(zhuǎn)目標(biāo)地址BTA(Branch Target Address)、跳轉(zhuǎn)指令下一個(gè)執(zhí)行包地址NDA(Next Dispatch_packet Addrees)以及分支歷史信息BHI(Branch History Information),如圖4所示。其中BIA用于索引BTB表項(xiàng),BTA是跳轉(zhuǎn)目標(biāo)地址,BHI存儲(chǔ)是否跳轉(zhuǎn),NDA是預(yù)測(cè)錯(cuò)誤后重新執(zhí)行的地址。跳轉(zhuǎn)指令第一次執(zhí)行時(shí),將其相應(yīng)信息存入BTB表中,當(dāng)此跳轉(zhuǎn)指令再次執(zhí)行時(shí),通過(guò)PC索引BTB表讀取跳轉(zhuǎn)信息進(jìn)行預(yù)測(cè),按照預(yù)測(cè)信息執(zhí)行,在執(zhí)行級(jí)判斷預(yù)測(cè)是否準(zhǔn)確,如果預(yù)測(cè)錯(cuò)誤,則用正確的跳轉(zhuǎn)信息改寫(xiě)B(tài)TB表。

    圖4 雙峰預(yù)測(cè)器BTB表示意圖

    PAp預(yù)測(cè)器的BTB表在雙峰預(yù)測(cè)器的基礎(chǔ)上增加了跳轉(zhuǎn)歷史寄存器BHR(Branch History Register),通過(guò)PC索引BTB表項(xiàng),由BHR索引模式表(Pattern Table),對(duì)應(yīng)模式表中設(shè)計(jì)一個(gè)計(jì)數(shù)器,每個(gè)計(jì)數(shù)值記錄一次跳轉(zhuǎn)指令的跳轉(zhuǎn)方向。這樣對(duì)于條件執(zhí)行的跳轉(zhuǎn)指令,可以準(zhǔn)確預(yù)測(cè)出每次的跳轉(zhuǎn)方向,即準(zhǔn)確預(yù)測(cè)出哪一次跳轉(zhuǎn),哪一次不跳轉(zhuǎn)。PAp預(yù)測(cè)器BTB表如圖5所示。

    圖5 PAp預(yù)測(cè)器BTB表示意圖

    雙峰預(yù)測(cè)器的優(yōu)勢(shì)在于邏輯結(jié)構(gòu)簡(jiǎn)單,面積、功耗較小,并且正確預(yù)測(cè)之前所需的訓(xùn)練次數(shù)少,訓(xùn)練完成后預(yù)測(cè)穩(wěn)定性高,但是對(duì)于條件執(zhí)行的跳轉(zhuǎn)指令,只能預(yù)測(cè)出一種跳轉(zhuǎn)方向,預(yù)測(cè)命中率較低;PAp預(yù)測(cè)器的優(yōu)勢(shì)在于可以準(zhǔn)確預(yù)測(cè)出跳轉(zhuǎn)指令的不同跳轉(zhuǎn)方向,預(yù)測(cè)命中率較高,但是邏輯結(jié)構(gòu)較復(fù)雜,隨之帶來(lái)了面積、功耗的增加,同時(shí),需要為每次不同跳轉(zhuǎn)方向建立對(duì)應(yīng)的模式表表項(xiàng),即建立完整跳轉(zhuǎn)指令信息的BTB表項(xiàng)時(shí)間較長(zhǎng),且BTB表較大增加額外存儲(chǔ)資源負(fù)擔(dān)。將建立完整跳轉(zhuǎn)指令信息BTB表項(xiàng)的時(shí)間稱(chēng)為預(yù)測(cè)訓(xùn)練時(shí)間,PAp預(yù)測(cè)器的訓(xùn)練時(shí)間是雙峰預(yù)測(cè)器的數(shù)倍甚至數(shù)十倍,后文將介紹縮短訓(xùn)練時(shí)間的方法。為更好地利用兩種預(yù)測(cè)器的優(yōu)勢(shì),本設(shè)計(jì)采用一種混合的分支預(yù)測(cè)機(jī)制:對(duì)于非條件執(zhí)行的跳轉(zhuǎn)指令,其只有一種跳轉(zhuǎn)方向,所以采用雙峰預(yù)測(cè)器,降低面積、功耗與訓(xùn)練時(shí)間,減少存儲(chǔ)資源負(fù)擔(dān);對(duì)于條件執(zhí)行的跳轉(zhuǎn)指令,其存在兩種跳轉(zhuǎn)方向,采用PAp預(yù)測(cè)器進(jìn)行預(yù)測(cè),提高預(yù)測(cè)命中率。

    2.2 Superscalar-VLIW雙模式下分支預(yù)測(cè)技術(shù)

    本設(shè)計(jì)中,包的概念十分重要,在整個(gè)流水線設(shè)計(jì)過(guò)程中,指令是以包的形式存在的,即取指包、擴(kuò)展包、分發(fā)包。取指包是指令獲取單元從程序存儲(chǔ)器中讀取的256位數(shù)據(jù)包,包含16位與32位指令;擴(kuò)展包在Fetch_EXP級(jí)生成,將16位指令與32位指令統(tǒng)一擴(kuò)展成32位,每6條指令形成一個(gè)擴(kuò)展包,即192位;分發(fā)包在Dispatch級(jí)生成,根據(jù)分發(fā)策略,將并行執(zhí)行的指令裝載在一個(gè)分發(fā)包中。

    分支預(yù)測(cè)是在Fetch_PG級(jí)進(jìn)行的,從BTB表中讀出BIA、BTA、NDA、BHI、PT等預(yù)測(cè)信息,在Exe1級(jí)要對(duì)預(yù)測(cè)信息進(jìn)行判斷是否正確,所以預(yù)測(cè)信息需要隨著跳轉(zhuǎn)指令一起沿流水線逐級(jí)傳遞下去,因?yàn)樘D(zhuǎn)指令是以包的形式逐級(jí)傳遞的,所以預(yù)測(cè)信息也要與相應(yīng)的包一起逐級(jí)傳遞。確定預(yù)測(cè)信息與某個(gè)包中的跳轉(zhuǎn)指令對(duì)應(yīng)的原則是判斷預(yù)測(cè)信息中的BIA是否與包中的跳轉(zhuǎn)指令PC對(duì)應(yīng)。對(duì)于Superscalar模式,最多2發(fā)射,即BIA與2條指令作比較;但對(duì)于VLIW模式,最多6發(fā)射,BIA需要與6條指令分別對(duì)照,所需邏輯復(fù)雜,所以存入VLIW模式存入BTB表項(xiàng)中的BIA并不是跳轉(zhuǎn)指令的PC,而是跳轉(zhuǎn)指令所在分發(fā)包的首地址,這樣只需要將BIA與分發(fā)包首地址做比較即可,邏輯較為簡(jiǎn)單。

    Superscalar與VLIW模式下分支預(yù)測(cè)另一個(gè)不同點(diǎn)是,Superscalar模式下,跳轉(zhuǎn)指令后面一條指令不能與跳轉(zhuǎn)指令并行發(fā)射,而VLIW模式下,跳轉(zhuǎn)指令后面指令如果沒(méi)有執(zhí)行單元沖突,則可與跳轉(zhuǎn)指令并行發(fā)射。NDA表示預(yù)測(cè)錯(cuò)誤后正確的執(zhí)行地址,對(duì)于Superscalar模式,NDA為跳轉(zhuǎn)指令后面一條指令的地址,而對(duì)于VLIW模式,NDA為跳轉(zhuǎn)指令所在分發(fā)包的下一個(gè)分發(fā)包的首地址。如圖6所示,是取指包中Superscalar與VLIW模式下BIA與NDA位置示意圖,其中Dp_package1與Dp_package2是兩個(gè)分發(fā)包,即Dp_package1中指令并行發(fā)射,Dp_package2中指令并行發(fā)射。

    圖6 取指包中Superscalar與VLIW模式下BIA與NDA位置示意圖

    2.3 分支預(yù)測(cè)的技術(shù)改進(jìn)

    對(duì)于PAp預(yù)測(cè)器,雖然其預(yù)測(cè)命中率較高,但是存在訓(xùn)練時(shí)間較長(zhǎng)的缺點(diǎn),所以降低訓(xùn)練時(shí)間對(duì)于提高分支預(yù)測(cè)器性能至關(guān)重要。動(dòng)態(tài)的基于歷史信息的跳轉(zhuǎn)方向預(yù)測(cè)方法可使用有限狀態(tài)機(jī)來(lái)描述,圖7(a)表示預(yù)測(cè)方向狀態(tài)機(jī)示意圖。狀態(tài)機(jī)由四個(gè)狀態(tài)組成,每個(gè)狀態(tài)有2 bit信息組成,代表最近兩次跳轉(zhuǎn)方向。狀態(tài)機(jī)中狀態(tài)存在BTB表的BHI中,代表跳轉(zhuǎn)方向,00、01表示不跳,10、11表示跳。BHI的初始狀態(tài)為00。對(duì)于訓(xùn)練一條方向?yàn)樘D(zhuǎn)的跳轉(zhuǎn)指令,需要兩次訓(xùn)練,第三次才能正確預(yù)測(cè),對(duì)于PAp預(yù)測(cè)器,每個(gè)PT模式狀態(tài)都需要兩次訓(xùn)練,如果循環(huán)為for(i=0,i<10,i++)這種10次的循環(huán),訓(xùn)練次數(shù)至少為20次,這將付出相當(dāng)大的代價(jià)。本設(shè)計(jì)對(duì)有限狀態(tài)機(jī)做改進(jìn),改進(jìn)的狀態(tài)機(jī)如圖7(b)所示,00表示不跳,10、11表示跳,從不跳到跳只需1次訓(xùn)練,將原有訓(xùn)練時(shí)間減半。

    圖7 有限狀態(tài)機(jī)

    改進(jìn)后的PAp訓(xùn)練時(shí)間減半,但是對(duì)于循環(huán)次數(shù)較多的跳轉(zhuǎn)指令,需要對(duì)每個(gè)PT模式狀態(tài)都進(jìn)行訓(xùn)練,如果循環(huán)為for(i=0,i<10,i++)這種10次的循環(huán),訓(xùn)練次數(shù)至少為10次,訓(xùn)練代價(jià)依然很大,所以對(duì)PT模式表中對(duì)應(yīng)的BHI值訓(xùn)練方法進(jìn)行改進(jìn)。第一次訓(xùn)練時(shí),不僅僅對(duì)PT模式計(jì)數(shù)器中計(jì)數(shù)為000項(xiàng)的BHI值進(jìn)行更改,對(duì)所有計(jì)數(shù)項(xiàng)的BHI都做000項(xiàng)的更改,也就是將所有項(xiàng)都置成跳轉(zhuǎn)方向,這樣只需要對(duì)不跳轉(zhuǎn)的一項(xiàng)即最后一項(xiàng)進(jìn)行訓(xùn)練即可,通過(guò)此改進(jìn)方法,訓(xùn)練項(xiàng)僅為第一項(xiàng)與最后一項(xiàng),大大縮短了訓(xùn)練次數(shù)。

    Fetch_PG級(jí)還未對(duì)指令進(jìn)行解碼,通過(guò)PC索引BTB表的方法是對(duì)取指包中的每條指令進(jìn)行遍歷,看BTB表中是否有與之對(duì)應(yīng)的表項(xiàng),如果查到對(duì)應(yīng)的表項(xiàng),說(shuō)明該指令是跳轉(zhuǎn)指令,并取出跳轉(zhuǎn)信息進(jìn)行預(yù)測(cè),每個(gè)包遍歷一次得到一組跳轉(zhuǎn)信息。存在一種情況是一個(gè)取指包中包含兩條跳轉(zhuǎn)指令,第一條跳轉(zhuǎn)指令方向?yàn)椴惶?,第二條跳轉(zhuǎn)指令要執(zhí)行。 但是這個(gè)取指包中只能取出第一條跳轉(zhuǎn)指令的跳轉(zhuǎn)信息,而得不到第二條跳轉(zhuǎn)指令的跳轉(zhuǎn)信息,因此需要多加入一套跳轉(zhuǎn)信息。即在遍歷到一條方向?yàn)椴惶奶D(zhuǎn)指令后在取值包中繼續(xù)遍歷,如果又遍歷到跳轉(zhuǎn)指令則取出第二套跳轉(zhuǎn)信息,與第一套跳轉(zhuǎn)信息共同完成預(yù)測(cè)并一起沿流水線逐級(jí)傳遞并在Exe1級(jí)進(jìn)行分支預(yù)測(cè)正確性的判斷。

    PT模式表計(jì)數(shù)器的計(jì)數(shù)規(guī)則為每次遇到跳轉(zhuǎn)指令,對(duì)BTB表中對(duì)應(yīng)表項(xiàng)的PT模式表計(jì)數(shù)器加1,遇到跳轉(zhuǎn)指令方向?yàn)椴惶蝾A(yù)測(cè)錯(cuò)誤需要清空流水線時(shí),BTB表對(duì)應(yīng)項(xiàng)PT模式表計(jì)數(shù)器歸零。由于預(yù)測(cè)是在Fetch_PG級(jí)進(jìn)行的,PT模式表計(jì)數(shù)也要發(fā)生在Fetch_PG級(jí),計(jì)數(shù)原則是在取指包中遍歷指令,如果發(fā)現(xiàn)跳轉(zhuǎn)指令,則對(duì)其相應(yīng)的PT模式表計(jì)數(shù)器加1。在預(yù)測(cè)錯(cuò)誤需要清空流水線的情況下,對(duì)預(yù)測(cè)錯(cuò)誤的跳轉(zhuǎn)指令PT表計(jì)數(shù)器歸零,但是存在一種情況,即在Fetch_PG級(jí),按照預(yù)測(cè)信息執(zhí)行的指令中有其他跳轉(zhuǎn)指令,它們的PT表計(jì)數(shù)器也發(fā)生了改變,而預(yù)測(cè)錯(cuò)誤的跳轉(zhuǎn)指令后面執(zhí)行的跳轉(zhuǎn)指令本不該執(zhí)行,它們的PT表計(jì)數(shù)器也不應(yīng)該發(fā)生變化。如圖8所示的一段程序,指令B1預(yù)測(cè)方向?yàn)椴惶D(zhuǎn),但實(shí)際方向?yàn)樘D(zhuǎn),固B2、B3兩條跳轉(zhuǎn)指令本不該執(zhí)行,但根據(jù)預(yù)測(cè)信息,這兩條指令在B1到達(dá)Exe1級(jí)之前執(zhí)行,B2、B3的PT表計(jì)數(shù)器發(fā)生了不該有的變化。本設(shè)計(jì)考慮到了預(yù)測(cè)錯(cuò)誤的跳轉(zhuǎn)指令,讓它們的PT表計(jì)數(shù)器恢復(fù)到正確的計(jì)數(shù)值,即對(duì)于圖8所示的程序,當(dāng)B1后流水線清空后,B2與B3的PT表計(jì)數(shù)器恢復(fù)到了正確的計(jì)數(shù)值。

    圖8 跳轉(zhuǎn)示例程序

    PT模式表的計(jì)數(shù)器位數(shù)同樣決定了PAp預(yù)測(cè)器預(yù)測(cè)的準(zhǔn)確率。當(dāng)計(jì)數(shù)器為3位時(shí),計(jì)數(shù)范圍是0~7,對(duì)于循環(huán)次數(shù)大于8的跳轉(zhuǎn)指令,則無(wú)法記錄每次跳轉(zhuǎn)方向,所以增加計(jì)數(shù)器位數(shù)可有效提高預(yù)測(cè)的命中率。但是增加計(jì)數(shù)器位數(shù)又會(huì)增大面積與功耗,所以計(jì)數(shù)器位數(shù)的選擇應(yīng)為命中率與面積功耗折中的結(jié)果。

    3 性能評(píng)測(cè)

    3.1 對(duì)2.3節(jié)分支預(yù)測(cè)技術(shù)改進(jìn)性能指標(biāo)評(píng)測(cè)

    本實(shí)驗(yàn)采用DSPstone基準(zhǔn)程序?qū)μ幚砥骷胺种ьA(yù)測(cè)部分性能進(jìn)行評(píng)估。表1對(duì)2.3節(jié)分支預(yù)測(cè)技術(shù)改進(jìn)前后預(yù)測(cè)準(zhǔn)確率進(jìn)行對(duì)比,由表中可以看出,改進(jìn)后分支預(yù)測(cè)命中率較改進(jìn)前均有明顯提升,即對(duì)于混合預(yù)測(cè)器,預(yù)測(cè)訓(xùn)練時(shí)間較改進(jìn)前大大減少,命中率最高可以提升32%,命中率平均提升23%。

    表1 改進(jìn)分支預(yù)測(cè)器預(yù)測(cè)命中率比較

    3.2 混合預(yù)測(cè)器與單一預(yù)測(cè)器以及不采用分支預(yù)測(cè)器性能比較

    表2是在Superscalar模式與Superscalar-VLIW混合模式下混合預(yù)測(cè)器與單一預(yù)測(cè)器及無(wú)分支預(yù)測(cè)器性能預(yù)測(cè)命中率的比較。由表中可以看出,對(duì)于單獨(dú)Superscalar模式與Superscalar-VLIW混合模式,分支預(yù)測(cè)均適用,并且兩種模式下分支預(yù)測(cè)準(zhǔn)確率相近。混合模式分支預(yù)測(cè)器命中率相比無(wú)分支預(yù)測(cè)器和單一雙峰預(yù)測(cè)器都有非常明顯提升,命中率最高可達(dá)到近99%,并且對(duì)于類(lèi)似fir2dim、matrix2、matrix1這樣較大的程序,混合預(yù)測(cè)器命中率提升更為明顯并且準(zhǔn)確率更高,原因在于,對(duì)于小程序,跳轉(zhuǎn)指令數(shù)目較少并且訓(xùn)練時(shí)間所占比例較大,所以準(zhǔn)確率和優(yōu)化空間有限。

    表2 混合預(yù)測(cè)器與單一預(yù)測(cè)器及 無(wú)分支預(yù)測(cè)器性能預(yù)測(cè)命中率比較 %

    表3是混合預(yù)測(cè)器與雙峰預(yù)測(cè)器相比無(wú)分支預(yù)測(cè)器運(yùn)行時(shí)間提升的比較,可以看出,混合預(yù)測(cè)器與雙峰預(yù)測(cè)器對(duì)于程序運(yùn)行時(shí)間提升明顯,并且混合預(yù)測(cè)器相比單一雙峰預(yù)測(cè)器運(yùn)行時(shí)間也都有明顯提升,最高提升達(dá)38%。

    表3 混合預(yù)測(cè)器與雙峰預(yù)測(cè)器相比 無(wú)分支預(yù)測(cè)器運(yùn)行時(shí)間提升比較 %

    3.3 綜合報(bào)告

    表4是使用xilinx vivado綜合工具,選擇XC7K-325T FPGA綜合得到的結(jié)果,處理器內(nèi)核的存儲(chǔ)資源沒(méi)有進(jìn)行綜合,目的在于更直觀地對(duì)比分支預(yù)測(cè)部分的存儲(chǔ)資源占用量。由表中可以看出,雙峰與PAp混合預(yù)測(cè)器邏輯資源與寄存器數(shù)量占整個(gè)處理器的比例較小?;旌项A(yù)測(cè)器比單一的雙峰預(yù)測(cè)器邏輯資源增加了48%左右,寄存器數(shù)量增加近40%,存儲(chǔ)資源幾乎沒(méi)有增加;相比選用單一的PAp預(yù)測(cè)器,邏輯資源減小了一半,寄存器數(shù)目大大減少。由此可以看出,相比單一雙峰預(yù)測(cè)器,混合預(yù)測(cè)器只增加了少量硬件開(kāi)銷(xiāo),但占處理器內(nèi)核比例依舊很?。幌啾葐我坏腜Ap預(yù)測(cè)器,混合預(yù)測(cè)器大大降低了硬件復(fù)雜度。由此可見(jiàn),混合預(yù)測(cè)器以較小的硬件代價(jià)換取了處理器性能的很大提升,混合型預(yù)測(cè)器是處理器性能和硬件開(kāi)銷(xiāo)折中考慮的最優(yōu)選擇。

    表4 綜合報(bào)告

    4 結(jié) 語(yǔ)

    本文提出一種支持Superscalar-VLIW混合架構(gòu)處理器的分支預(yù)測(cè)方法,在兩種模式下均可以進(jìn)行分支預(yù)測(cè),預(yù)測(cè)機(jī)制采用雙峰預(yù)測(cè)與PAp預(yù)測(cè)相結(jié)合,充分利用二者在預(yù)測(cè)穩(wěn)定性、硬件結(jié)構(gòu)以及預(yù)測(cè)準(zhǔn)確率方面的優(yōu)勢(shì)。實(shí)驗(yàn)結(jié)果表明,該分支預(yù)測(cè)方法在Superscalar與VLIW兩種模式下進(jìn)行分支預(yù)測(cè)的效果相同,并且得到了較高的預(yù)測(cè)準(zhǔn)確率,占用硬件資源較少,處理器性能得到了較大的提升。

    [1] Lee J,Youn J M,Cho D,et al.Reducing instruction bit-width for low-power VLIW architectures[J].Acm Transactions on Design Automation of Electronic Systems,2013,18(2):99-109.

    [2] Moon S M,Ebcioglu K.An Efficient Resource-constrained Global Scheduling Technique For Superscalar And Vliw Processors[J].Acm Sigmicro Newsletter,1993,23(23):55-71.

    [3] Steven G,Christianson B,Collins R,et al.A superscalar architecture to exploit instruction level parallelism[J].Microprocessors & Microsystems,1997,20(96):391-400.

    [4] 沈鉦,何虎,楊旭,等.Architecture Design of a Variable Length Instruction Set VLIW DSP[J].Tsinghua Science & Technology,2009,14(5):561-569.

    [5] Palermo G,Sam M,Silvan C,et al.Branch prediction techniques for low-power VLIW processors[C]//Proceedings of the 13th ACM Great Lakes symposium on VLSI.ACM,2003:225-228.

    [6] Yeh T Y,Patt Y N.Two-Level Adaptive Training Branch Prediction[C]//24th ACM/IEEE International Symposium on Micro architecture.1991:1028-1073.

    [7] Patterson D A,Hennessy J L.Computer Architecture:A Quantitative Approach[M].2nd ed.Morgan Kaufmann,San Mateo,CA,1996.

    [8] Hoogerbrugge J.Dynamic branch prediction for a VLIW processor[C]//International Conference on Parallel Architectures & Compilation Techniques,2000:207-214.

    [9] Faravelon A,Fournel N,Pétrot F.Fast and accurate branch predictor simulation[C]//Design,Automation & Test in Europe Conference & Exhibition (DATE),2015.IEEE,2015:317-320.

    [10] Zhou P,Nder S,Carr S.Fast branch misprediction recovery in out-of-order superscalar processors[C]//Proceedings of the 19th annual international conference on Supercomputing.ACM,2005:41-50.

    [11] Eden A N,Mudge T.The YAGS branch prediction scheme[C]//Microarchitecture,1998.MICRO-31.Proceedings.31st Annual ACM/IEEE International Symposium on.IEEE,1998:69-77.

    [12] 謝子超,佟冬,黃明凱.A General Low-Cost Indirect Branch Prediction Using Target Address Pointers[J].Journal of Computer Science & Technology,2014,29(6):929-946.

    [13] 肖澤強(qiáng).動(dòng)態(tài)分支預(yù)測(cè)技術(shù)分析與量化研究[J].信息技術(shù),2011(3):80-82.

    [14] 張?bào)?史戰(zhàn)果,吳迪.基于SimpleScalar的動(dòng)態(tài)分支預(yù)測(cè)器研究[J].微型電腦應(yīng)用,2011,27(11):19-21.

    [15] 顧慧,龔育昌,趙振西.超長(zhǎng)指令字技術(shù)[J].小型微型計(jì)算機(jī)系統(tǒng),2000,21(2):174-177.

    A DESIGN OF HYBRID BRANCH PREDICTOR SUPPORTING SUPERSCALAR-VLIW HYBRID MICROPROCESSOR

    Fu Jiawei Wang Xu He Hu

    (InstituteofMicroelectronics,TsinghuaUniversity,Beijing100084,China)

    A design of hybrid branch predictor on a digital signal processor which supports Superscalar-VLIW hybrid architecture is described. To control hardware complexity and improve the accuracy of prediction, a hybrid branch predictor of bimodal and PAp is selected for the branch prediction scheme. The standard DSPstone programs have been run on the processor. The experimental results show that the processor with hybrid branch predictor has an improvement of 23% on average compared with processor without branch predictor, and processor with hybrid branch predictor predicts more accurately than processor with only bimodal predictor.

    Digital signal processor Superscalar VLIW Branch prediction Bimodal prediction PAp

    2016-01-12。核高基重大專(zhuān)項(xiàng)基金項(xiàng)目(2012ZX01034001-002)。付家為,碩士生,主研領(lǐng)域:微處理器架構(gòu)設(shè)計(jì)。王旭,碩士生。何虎,副教授。

    TP303

    A

    10.3969/j.issn.1000-386x.2017.02.018

    猜你喜歡
    預(yù)測(cè)器雙峰計(jì)數(shù)器
    輸入延遲系統(tǒng)的切換偽預(yù)測(cè)鎮(zhèn)定控制器
    煤氣與熱力(2022年2期)2022-03-09 06:29:30
    雙峰映輝
    寶藏(2021年5期)2021-06-14 13:50:36
    一種改進(jìn)型TAGE分支預(yù)測(cè)器的實(shí)現(xiàn)
    荷蘭金融監(jiān)管“雙峰”模式研究及對(duì)我國(guó)的啟示
    自信滿(mǎn)滿(mǎn)的煉鋼工
    計(jì)數(shù)器競(jìng)爭(zhēng)冒險(xiǎn)及其處理的仿真分析
    任意N進(jìn)制計(jì)數(shù)器的設(shè)計(jì)方法
    河南科技(2014年10期)2014-02-27 14:09:30
    基于單片機(jī)的仰臥起坐計(jì)數(shù)器
    雙峰臉譜
    廉政瞭望(2013年5期)2013-04-29 01:48:26
    国产一级毛片在线| 亚洲精品日本国产第一区| 久久久国产一区二区| 日韩人妻高清精品专区| 中文字幕人妻丝袜制服| 日韩,欧美,国产一区二区三区| 久久久久国产网址| 99国产精品免费福利视频| 久久免费观看电影| 少妇高潮的动态图| 国产不卡av网站在线观看| 成年女人在线观看亚洲视频| 飞空精品影院首页| 亚洲欧美清纯卡通| 毛片一级片免费看久久久久| 久久影院123| 日韩av免费高清视频| av又黄又爽大尺度在线免费看| 亚洲国产欧美在线一区| 女人精品久久久久毛片| 亚洲国产av影院在线观看| 少妇人妻久久综合中文| 久久久久久伊人网av| 亚洲av成人精品一二三区| 亚洲欧美成人综合另类久久久| 亚洲色图 男人天堂 中文字幕 | 亚洲国产色片| 欧美精品亚洲一区二区| 秋霞在线观看毛片| 欧美成人精品欧美一级黄| 欧美成人精品欧美一级黄| 熟妇人妻不卡中文字幕| 欧美成人精品欧美一级黄| 自线自在国产av| 国产乱人偷精品视频| 在线观看人妻少妇| 乱码一卡2卡4卡精品| 国产一区有黄有色的免费视频| 黄色欧美视频在线观看| 国产淫语在线视频| av视频免费观看在线观看| 国产精品国产av在线观看| 少妇的逼水好多| 国产成人午夜福利电影在线观看| 亚洲欧美成人精品一区二区| www.av在线官网国产| 九九在线视频观看精品| 丝袜在线中文字幕| 51国产日韩欧美| 国产精品一二三区在线看| 99热这里只有是精品在线观看| 麻豆精品久久久久久蜜桃| 99热6这里只有精品| 中文字幕亚洲精品专区| 伊人久久国产一区二区| 少妇精品久久久久久久| tube8黄色片| 国产午夜精品一二区理论片| 久久av网站| 伊人久久精品亚洲午夜| 夫妻性生交免费视频一级片| av.在线天堂| 国产精品 国内视频| 国产一区二区在线观看日韩| 亚洲精品日韩av片在线观看| 欧美bdsm另类| 观看av在线不卡| 亚洲av成人精品一二三区| 最近最新中文字幕免费大全7| 99热网站在线观看| 国产成人精品婷婷| 精品少妇久久久久久888优播| av电影中文网址| 黄色视频在线播放观看不卡| 少妇熟女欧美另类| 亚洲精品中文字幕在线视频| 欧美成人午夜免费资源| 欧美日韩亚洲高清精品| 成年av动漫网址| 国产亚洲av片在线观看秒播厂| 欧美精品高潮呻吟av久久| 日韩一区二区视频免费看| 午夜免费男女啪啪视频观看| 91精品一卡2卡3卡4卡| 久久亚洲国产成人精品v| 人妻一区二区av| 亚洲中文av在线| 肉色欧美久久久久久久蜜桃| 两个人的视频大全免费| 精品人妻偷拍中文字幕| 母亲3免费完整高清在线观看 | av免费在线看不卡| 久久久久久伊人网av| 精品久久久久久久久av| 青春草亚洲视频在线观看| 中文字幕最新亚洲高清| 人人澡人人妻人| 亚洲精品av麻豆狂野| 久久韩国三级中文字幕| av卡一久久| 99久久中文字幕三级久久日本| 如日韩欧美国产精品一区二区三区 | 午夜老司机福利剧场| 99九九在线精品视频| 热99国产精品久久久久久7| 久久精品夜色国产| 51国产日韩欧美| 欧美丝袜亚洲另类| 亚洲精品第二区| 嘟嘟电影网在线观看| 久久久久久人妻| 亚洲av不卡在线观看| 内地一区二区视频在线| 亚洲美女搞黄在线观看| 三上悠亚av全集在线观看| 亚洲av在线观看美女高潮| 国产亚洲av片在线观看秒播厂| 亚洲丝袜综合中文字幕| 热99久久久久精品小说推荐| 国产精品三级大全| 日本vs欧美在线观看视频| 国产成人精品婷婷| 免费av中文字幕在线| 欧美性感艳星| 国产黄片视频在线免费观看| 卡戴珊不雅视频在线播放| 一本久久精品| 亚洲欧美一区二区三区国产| 国产乱来视频区| 久久久久久久国产电影| 乱人伦中国视频| 精品一区二区三卡| 麻豆成人av视频| 国产精品一区二区三区四区免费观看| 国产成人精品在线电影| 一区在线观看完整版| 伊人亚洲综合成人网| 在线观看免费日韩欧美大片 | 青春草国产在线视频| 丝袜在线中文字幕| 亚洲少妇的诱惑av| 另类亚洲欧美激情| 一个人看视频在线观看www免费| 亚洲经典国产精华液单| 国产有黄有色有爽视频| 我的老师免费观看完整版| 91国产中文字幕| 国产伦精品一区二区三区视频9| 爱豆传媒免费全集在线观看| 一级毛片电影观看| 中文字幕av电影在线播放| 91精品伊人久久大香线蕉| 丰满迷人的少妇在线观看| 18禁在线无遮挡免费观看视频| 国产精品久久久久成人av| 99热6这里只有精品| 婷婷色av中文字幕| 亚洲av在线观看美女高潮| 在线观看免费视频网站a站| 人人妻人人爽人人添夜夜欢视频| 亚洲无线观看免费| 亚洲国产日韩一区二区| 大陆偷拍与自拍| 最新的欧美精品一区二区| 人人妻人人澡人人看| 国产精品人妻久久久影院| 久久影院123| 国产免费视频播放在线视频| 色视频在线一区二区三区| 男女高潮啪啪啪动态图| 大片电影免费在线观看免费| 欧美国产精品一级二级三级| 亚洲,一卡二卡三卡| 人妻人人澡人人爽人人| av女优亚洲男人天堂| 少妇 在线观看| 欧美成人精品欧美一级黄| 午夜福利视频在线观看免费| 国产精品不卡视频一区二区| av有码第一页| 亚洲第一区二区三区不卡| 这个男人来自地球电影免费观看 | 精品一区二区免费观看| 国产精品一区二区在线不卡| 国产精品久久久久成人av| 欧美 日韩 精品 国产| 日本欧美视频一区| 大香蕉久久网| 国产免费福利视频在线观看| 如日韩欧美国产精品一区二区三区 | 草草在线视频免费看| 激情五月婷婷亚洲| 一级毛片我不卡| 女的被弄到高潮叫床怎么办| 在线播放无遮挡| 成人毛片60女人毛片免费| 国产精品久久久久久精品电影小说| 国模一区二区三区四区视频| 啦啦啦啦在线视频资源| 久久狼人影院| 欧美日韩综合久久久久久| 一区二区三区精品91| 免费不卡的大黄色大毛片视频在线观看| 久久影院123| 五月天丁香电影| 成年av动漫网址| 国产成人一区二区在线| 寂寞人妻少妇视频99o| 搡女人真爽免费视频火全软件| 中国国产av一级| 中文乱码字字幕精品一区二区三区| 热re99久久精品国产66热6| 日本欧美视频一区| 国产精品.久久久| 成人毛片60女人毛片免费| 欧美日韩成人在线一区二区| 色婷婷av一区二区三区视频| 成人18禁高潮啪啪吃奶动态图 | 国产无遮挡羞羞视频在线观看| 日本91视频免费播放| 99re6热这里在线精品视频| 大话2 男鬼变身卡| 日韩精品有码人妻一区| 国产亚洲午夜精品一区二区久久| av在线播放精品| 97精品久久久久久久久久精品| 午夜福利视频在线观看免费| 欧美老熟妇乱子伦牲交| 成人亚洲欧美一区二区av| 成人手机av| 精品久久蜜臀av无| 搡老乐熟女国产| 最近手机中文字幕大全| 亚洲国产欧美日韩在线播放| 国产亚洲av片在线观看秒播厂| 18+在线观看网站| 少妇高潮的动态图| 欧美精品一区二区免费开放| 美女国产视频在线观看| 在线观看国产h片| 亚洲欧美清纯卡通| 三上悠亚av全集在线观看| 免费人成在线观看视频色| 九草在线视频观看| 国产黄色免费在线视频| 美女国产视频在线观看| 成人18禁高潮啪啪吃奶动态图 | 自线自在国产av| 国产成人一区二区在线| 狠狠婷婷综合久久久久久88av| 3wmmmm亚洲av在线观看| 一级a做视频免费观看| 一本久久精品| 蜜桃国产av成人99| 日本欧美视频一区| 免费大片黄手机在线观看| 18在线观看网站| 黑人猛操日本美女一级片| av不卡在线播放| 亚洲av在线观看美女高潮| 高清视频免费观看一区二区| 久久热精品热| 久久久国产一区二区| 丰满少妇做爰视频| 高清毛片免费看| 欧美人与善性xxx| 日产精品乱码卡一卡2卡三| 亚洲情色 制服丝袜| 九色亚洲精品在线播放| 丁香六月天网| 国产成人精品福利久久| 亚洲精品乱码久久久久久按摩| 我的女老师完整版在线观看| 国产成人a∨麻豆精品| 欧美丝袜亚洲另类| 一区二区日韩欧美中文字幕 | 精品99又大又爽又粗少妇毛片| 国产不卡av网站在线观看| 永久免费av网站大全| 亚洲欧洲国产日韩| 亚洲,一卡二卡三卡| 久久精品久久久久久久性| 亚洲丝袜综合中文字幕| 国产白丝娇喘喷水9色精品| 91久久精品电影网| 一本—道久久a久久精品蜜桃钙片| 一二三四中文在线观看免费高清| 亚洲精品成人av观看孕妇| 精品一品国产午夜福利视频| 日本-黄色视频高清免费观看| 少妇人妻 视频| 在线观看国产h片| 免费黄色在线免费观看| 久久久国产欧美日韩av| 欧美激情极品国产一区二区三区 | 精品人妻偷拍中文字幕| 亚洲精品色激情综合| 一二三四中文在线观看免费高清| 建设人人有责人人尽责人人享有的| 国产av一区二区精品久久| 男女边摸边吃奶| 精品久久久久久久久av| 国产亚洲精品久久久com| 久久精品国产鲁丝片午夜精品| 久久久久国产网址| 亚洲精品自拍成人| 国国产精品蜜臀av免费| 亚洲国产精品成人久久小说| 男女无遮挡免费网站观看| 三级国产精品欧美在线观看| 国产精品国产三级国产av玫瑰| 久久国内精品自在自线图片| 熟女电影av网| 桃花免费在线播放| 最后的刺客免费高清国语| 蜜桃久久精品国产亚洲av| 日日摸夜夜添夜夜添av毛片| 国产黄色免费在线视频| 黑人猛操日本美女一级片| 一边摸一边做爽爽视频免费| 一个人免费看片子| 国产精品99久久久久久久久| 免费看av在线观看网站| 亚洲美女黄色视频免费看| 国产乱来视频区| 大码成人一级视频| 国产欧美日韩综合在线一区二区| 中国国产av一级| a级毛色黄片| 国产一区二区三区综合在线观看 | 91aial.com中文字幕在线观看| 日本爱情动作片www.在线观看| 丝袜在线中文字幕| 久久久久久久久久久免费av| 看非洲黑人一级黄片| 99久久综合免费| videos熟女内射| av.在线天堂| 久久久久视频综合| 国产精品熟女久久久久浪| 成年女人在线观看亚洲视频| 22中文网久久字幕| 成人影院久久| 丝袜在线中文字幕| 色94色欧美一区二区| 成人国产av品久久久| 国产精品国产三级专区第一集| 国产视频首页在线观看| 亚洲精品成人av观看孕妇| 日韩成人伦理影院| 一区在线观看完整版| 黑人欧美特级aaaaaa片| 成人二区视频| 国产在线免费精品| 亚洲怡红院男人天堂| 美女内射精品一级片tv| 久久精品国产亚洲av天美| 国产熟女欧美一区二区| 18禁裸乳无遮挡动漫免费视频| 国内精品宾馆在线| 黄色欧美视频在线观看| 欧美xxⅹ黑人| 久久久国产一区二区| 熟女人妻精品中文字幕| 免费人成在线观看视频色| 成人手机av| 国产成人免费无遮挡视频| 丁香六月天网| 九九在线视频观看精品| 亚洲综合色网址| 免费黄色在线免费观看| 久久亚洲国产成人精品v| 91aial.com中文字幕在线观看| 色视频在线一区二区三区| 国产精品国产三级国产专区5o| 黄色一级大片看看| 久久久久精品久久久久真实原创| 国产高清有码在线观看视频| 日日啪夜夜爽| 高清午夜精品一区二区三区| 人成视频在线观看免费观看| 欧美少妇被猛烈插入视频| 99热6这里只有精品| 日韩精品免费视频一区二区三区 | 嘟嘟电影网在线观看| 99国产精品免费福利视频| 国产一区二区在线观看日韩| 亚洲欧美日韩卡通动漫| 国产乱人偷精品视频| 高清午夜精品一区二区三区| 自拍欧美九色日韩亚洲蝌蚪91| 夜夜骑夜夜射夜夜干| 久久久精品免费免费高清| 91aial.com中文字幕在线观看| 国产高清有码在线观看视频| 如何舔出高潮| 国产精品一区二区三区四区免费观看| 亚洲精品乱久久久久久| 国产精品久久久久久精品电影小说| 天天影视国产精品| 男的添女的下面高潮视频| 亚洲av电影在线观看一区二区三区| 亚洲美女搞黄在线观看| 欧美xxⅹ黑人| 久久午夜综合久久蜜桃| 午夜精品国产一区二区电影| 插逼视频在线观看| √禁漫天堂资源中文www| 韩国av在线不卡| 亚洲中文av在线| 亚洲精品色激情综合| 下体分泌物呈黄色| 人人妻人人爽人人添夜夜欢视频| 亚洲欧美成人综合另类久久久| 人妻人人澡人人爽人人| 亚洲精品久久成人aⅴ小说 | 我的女老师完整版在线观看| 日韩亚洲欧美综合| 久久亚洲国产成人精品v| 亚洲怡红院男人天堂| 中文乱码字字幕精品一区二区三区| 国产伦理片在线播放av一区| 日韩不卡一区二区三区视频在线| av电影中文网址| 日日摸夜夜添夜夜添av毛片| 日本午夜av视频| 午夜福利影视在线免费观看| 美女中出高潮动态图| 91国产中文字幕| 99久久综合免费| 大话2 男鬼变身卡| 男女边吃奶边做爰视频| 国产无遮挡羞羞视频在线观看| 亚洲人成77777在线视频| 男女边吃奶边做爰视频| 亚洲av不卡在线观看| 日本与韩国留学比较| 久久影院123| 99久久人妻综合| 欧美精品一区二区大全| 亚洲情色 制服丝袜| 极品少妇高潮喷水抽搐| 亚洲激情五月婷婷啪啪| 久久青草综合色| 老女人水多毛片| 最新的欧美精品一区二区| 91精品国产国语对白视频| tube8黄色片| 汤姆久久久久久久影院中文字幕| 国产av国产精品国产| 国产成人精品一,二区| av在线观看视频网站免费| 在线观看美女被高潮喷水网站| 乱码一卡2卡4卡精品| 亚洲精品视频女| 91在线精品国自产拍蜜月| 午夜福利视频在线观看免费| 亚洲av中文av极速乱| 亚洲av成人精品一区久久| 午夜视频国产福利| 成人国产av品久久久| av网站免费在线观看视频| 日韩强制内射视频| 高清在线视频一区二区三区| 视频在线观看一区二区三区| 91精品国产国语对白视频| 午夜免费观看性视频| 亚洲国产精品专区欧美| 麻豆乱淫一区二区| 高清午夜精品一区二区三区| 黄片播放在线免费| 十八禁高潮呻吟视频| 亚洲av国产av综合av卡| 午夜91福利影院| 人妻一区二区av| 高清av免费在线| 久久精品国产a三级三级三级| 国产极品天堂在线| 最后的刺客免费高清国语| av视频免费观看在线观看| 男人操女人黄网站| 国产精品久久久久久av不卡| 夫妻午夜视频| 亚洲av不卡在线观看| 中文天堂在线官网| 女人精品久久久久毛片| 韩国av在线不卡| 亚洲精品一二三| 亚洲欧美一区二区三区黑人 | 国产免费视频播放在线视频| 亚洲欧美清纯卡通| 免费黄频网站在线观看国产| 国产免费福利视频在线观看| 搡女人真爽免费视频火全软件| 91久久精品国产一区二区成人| 精品99又大又爽又粗少妇毛片| 人妻一区二区av| 亚洲怡红院男人天堂| 91在线精品国自产拍蜜月| 高清欧美精品videossex| 一个人看视频在线观看www免费| av福利片在线| 91精品国产国语对白视频| tube8黄色片| 一个人看视频在线观看www免费| 伊人亚洲综合成人网| 亚洲av电影在线观看一区二区三区| 亚洲精品国产av蜜桃| 亚洲av日韩在线播放| 日本爱情动作片www.在线观看| 人妻系列 视频| 日韩在线高清观看一区二区三区| 三级国产精品欧美在线观看| 亚洲av福利一区| 精品久久久精品久久久| 国产又色又爽无遮挡免| 亚洲一区二区三区欧美精品| 少妇人妻久久综合中文| 一本大道久久a久久精品| 大又大粗又爽又黄少妇毛片口| 人妻夜夜爽99麻豆av| 热re99久久国产66热| 涩涩av久久男人的天堂| 亚洲第一区二区三区不卡| 一边亲一边摸免费视频| 黑人巨大精品欧美一区二区蜜桃 | 制服人妻中文乱码| 久久久久网色| 亚洲国产精品999| 国产黄频视频在线观看| 久久国产亚洲av麻豆专区| 涩涩av久久男人的天堂| 制服丝袜香蕉在线| 亚洲国产欧美在线一区| 久久久久久久久久久丰满| 欧美日韩综合久久久久久| 亚洲一级一片aⅴ在线观看| 性色avwww在线观看| 熟妇人妻不卡中文字幕| 99久国产av精品国产电影| videos熟女内射| 熟女电影av网| 少妇的逼好多水| 国产色爽女视频免费观看| 亚洲av日韩在线播放| 亚洲综合色网址| 一级黄片播放器| 久久久精品免费免费高清| 国产精品成人在线| 国产高清有码在线观看视频| 国产乱人偷精品视频| 欧美精品一区二区免费开放| 美女内射精品一级片tv| 日本黄色日本黄色录像| av又黄又爽大尺度在线免费看| 久久久久久久大尺度免费视频| 亚洲av二区三区四区| 黑人欧美特级aaaaaa片| 91精品国产九色| 街头女战士在线观看网站| 精品久久久精品久久久| 夫妻性生交免费视频一级片| 国产亚洲欧美精品永久| 免费少妇av软件| 亚洲精品,欧美精品| 国产乱来视频区| 全区人妻精品视频| 午夜老司机福利剧场| 久久婷婷青草| 在线观看免费日韩欧美大片 | 久久韩国三级中文字幕| 精品99又大又爽又粗少妇毛片| 国产精品偷伦视频观看了| 最近中文字幕高清免费大全6| 久热这里只有精品99| 亚洲欧洲国产日韩| 飞空精品影院首页| 精品人妻偷拍中文字幕| 久久精品夜色国产| 国产免费现黄频在线看| 毛片一级片免费看久久久久| 午夜免费男女啪啪视频观看| 国产男女内射视频| 青春草国产在线视频| 91国产中文字幕| 我要看黄色一级片免费的| 亚洲第一区二区三区不卡| 久久影院123| 熟女av电影| av免费在线看不卡| 丝袜喷水一区| 欧美日韩精品成人综合77777| 亚洲精品中文字幕在线视频| 中文字幕人妻丝袜制服| 一本一本综合久久| 成人亚洲精品一区在线观看| videossex国产| 久久精品国产亚洲av涩爱| 校园人妻丝袜中文字幕| 久久精品熟女亚洲av麻豆精品| 亚洲av福利一区| 少妇 在线观看| 久久99蜜桃精品久久| 亚洲欧美中文字幕日韩二区| 男的添女的下面高潮视频| 一级毛片我不卡| 在线看a的网站| 国产综合精华液| 亚洲国产日韩一区二区| 成人影院久久| 久久久久久久久久成人| 2018国产大陆天天弄谢| 午夜免费男女啪啪视频观看| 亚洲伊人久久精品综合| 熟女人妻精品中文字幕|