• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于申威SIMD指令的H.264編碼優(yōu)化

    2024-09-14 00:00:00黃樸劉世巍張昊王聰
    現(xiàn)代電子技術(shù) 2024年6期
    關(guān)鍵詞:指令處理器編碼

    摘 "要: 國(guó)產(chǎn)化申威處理器出現(xiàn)較晚,其在多媒體領(lǐng)域中的性能還不突出,同時(shí)通用處理器中的單指令流多數(shù)據(jù)流(SIMD)因能有效提升并行處理能力而受到處理器廠商的青睞。為提高國(guó)產(chǎn)化自主平臺(tái)申威架構(gòu)的多媒體處理能力,結(jié)合申威架構(gòu)Core3B體系的SIMD指令系統(tǒng),提出一種基于申威架構(gòu)的SIMD指令集H.264編碼優(yōu)化方法。結(jié)合申威處理器的并行結(jié)構(gòu)特點(diǎn),利用申威適配的Perf、Top指令等系統(tǒng)性能分析工具,采集兩種主流視頻分辨率下與編碼性能強(qiáng)相關(guān)的高頻熱點(diǎn)函數(shù),詳細(xì)分析其程序并行化可行性,采用手工嵌入申威SIMD和訪存擴(kuò)展等匯編指令進(jìn)行細(xì)粒度優(yōu)化。實(shí)驗(yàn)結(jié)果表明,該方法在申威架構(gòu)下的H.264平均編碼性能提升了約30%。相應(yīng)工作成果已推送到申威社區(qū),增強(qiáng)了基于申威處理器的國(guó)產(chǎn)計(jì)算機(jī)在桌面多媒體應(yīng)用領(lǐng)域的工作體驗(yàn)。

    關(guān)鍵詞: 單指令流多數(shù)據(jù)流; H.264標(biāo)準(zhǔn); 申威處理器; 熱點(diǎn)函數(shù); 程序并行化; 細(xì)粒度

    中圖分類(lèi)號(hào): TN911?34; TP3 " " " " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A " " " " " " " " " " 文章編號(hào): 1004?373X(2024)06?0049?06

    H.264 encoding optimization based on SW SIMD instruction

    HUANG Pu, LIU Shiwei, ZHANG Hao, WANG Cong

    (CETC Suntai Information Technology Co., Ltd., Wuxi 214000, China)

    Abstract: Domestic Shenwei processors emerged relatively late, and their performance in the multimedia field is not yet outstanding. At the same time, single instruction multiple data (SIMD) in general?purpose processors are favored by processor manufacturers for effectively improving parallel processing capabilities. In order to improve the multimedia processing capability of the domestic independent platform Shenwei architecture, a SIMD instruction set H.264 encoding optimization method based on the Shenwei architecture is proposed by combining with the SIMD instruction system of the Core3B system of the Shenwei architecture. Based on the parallel structure characteristics of the Shenwei processor, high?frequency hotspot functions strongly related to encoding performance under two mainstream video resolutions are collected by means of system performance analysis tools such as Perf and Top instructions adapted by Shenwei. The experimental results show that this method can improve the average encoding performance of H.264 under the Shenwei architecture by about 30%, and the corresponding work results have been pushed to the Shenwei community, enhancing the work experience of domestic computers based on Shenwei processors in the field of desktop multimedia applications.

    Keywords: SIMD; H.264 standard; Shenwei processor; hotspot function; program parallelization; fine grained

    0 "引 "言

    單指令流多數(shù)據(jù)流(Single Instruction Multiple Data, SIMD)是計(jì)算機(jī)處理器中的一種指令集架構(gòu),主要用于執(zhí)行并行計(jì)算[1]。為提升CPU的圖形圖像數(shù)據(jù)處理能力,SIMD架構(gòu)被廣泛應(yīng)用于各種類(lèi)型的計(jì)算機(jī)處理器中,包括常見(jiàn)的桌面和移動(dòng)設(shè)備處理器[2?3]。

    申威是我國(guó)自主設(shè)計(jì)、具有完全自主知識(shí)產(chǎn)權(quán)的64位字長(zhǎng)Load/Store型RISC架構(gòu)多核處理器[4]。經(jīng)過(guò)多年發(fā)展,申威形成了Core3B核心處理器指令系統(tǒng),包括基本指令系統(tǒng)和SIMD擴(kuò)展指令系統(tǒng)。所有指令均采用定長(zhǎng)的32位格式,支持32位單精度和64位雙精度浮點(diǎn)運(yùn)算,支持256位單指令流多數(shù)據(jù)流(SIMD)的短向量運(yùn)算,通過(guò)指令集適配優(yōu)化,可以大幅度提升系統(tǒng)性能。

    盡管H.265已發(fā)布多年,但H.264仍是目前市場(chǎng)應(yīng)用最廣泛的視頻編解碼標(biāo)準(zhǔn)[5]。對(duì)該編解碼算法的結(jié)構(gòu)并行性研究,主要集中在X86和ARM平臺(tái)上[6?7],而在國(guó)產(chǎn)化CPU平臺(tái)上的相關(guān)研究還不多見(jiàn)[2],大部分為針對(duì)解碼器或?yàn)V波模塊的優(yōu)化工作。文獻(xiàn)[8]介紹了基于開(kāi)源編碼器匯編優(yōu)化幀內(nèi)預(yù)測(cè)的率失真代價(jià)計(jì)算過(guò)程。文獻(xiàn)[9]設(shè)計(jì)了一種基于4×4基本塊復(fù)用的18路預(yù)測(cè)模式并行的高吞吐量全流水線硬件架構(gòu)。文獻(xiàn)[10]完成了視差估計(jì)算法的并行映射。文獻(xiàn)[11]設(shè)計(jì)了一種新的幀內(nèi)率失真優(yōu)化預(yù)測(cè)模式的并行流水線硬件架構(gòu)。

    本文針對(duì)申威威焱831平臺(tái)特點(diǎn),基于Core3B SIMD指令優(yōu)化了H.264視頻編碼器的處理效率,工作成果已推送到申威開(kāi)源社區(qū),為加快國(guó)產(chǎn)申威計(jì)算機(jī)的圖形化應(yīng)用發(fā)揮了積極作用。

    1 "申威SIMD技術(shù)

    目前,程序向量化通常由兩種途徑來(lái)實(shí)現(xiàn):其一是利用編譯器自身的功能實(shí)現(xiàn)程序的自動(dòng)向量化,即編譯器經(jīng)過(guò)對(duì)程序的依賴分析、對(duì)齊分析等自動(dòng)把標(biāo)量代碼轉(zhuǎn)變成相應(yīng)的向量化指令,從而實(shí)現(xiàn)程序的并行計(jì)算;其二是手工向量化,開(kāi)發(fā)人員利用SIMD程序接口或使用內(nèi)嵌匯編的方法,通過(guò)SIMD擴(kuò)展的體系結(jié)構(gòu)和指令集,對(duì)串行程序重新進(jìn)行向量化程序的編寫(xiě),在一定程度上省去編譯器進(jìn)行向量化分析查找后端指令等工作,并且對(duì)性能提升有明顯效果。本次研究主要基于威焱831處理器,使用手工嵌入式匯編的方式將普通程序替換為申威SIMD指令來(lái)提升多媒體程序性能。

    1.1 "申威SIMD概述

    申威處理器提供了200多條指令來(lái)實(shí)現(xiàn) SIMD的功能,支持浮點(diǎn)雙256位SIMD流水線和整數(shù)單256位SIMD流水線。

    1.2 "數(shù)據(jù)類(lèi)型、寄存器與指令擴(kuò)展

    C3B核心擴(kuò)展指令系統(tǒng)設(shè)置有32個(gè)256位向量寄存器,與浮點(diǎn)寄存器文件共用地址,其低64位即是浮點(diǎn)寄存器;向量寄存器與浮點(diǎn)寄存器在硬件實(shí)現(xiàn)上不同,但是在匯編代碼中的表示格式是相同的。此外所有寄存器均以字符$開(kāi)頭,所以在匯編代碼中向量寄存器和浮點(diǎn)寄存器均以$f0~$f31表示。

    C3B核心支持短向量數(shù)據(jù)類(lèi)型,包括長(zhǎng)度為8的字整數(shù)向量(8×32位)、長(zhǎng)度為4的單精度浮點(diǎn)向量(4×32位)與雙精度浮點(diǎn)向量(4×64位),還有限支持長(zhǎng)度為32的字節(jié)整數(shù)向量(32×8位)、長(zhǎng)度為16的半字整數(shù)向量(16×16位)、長(zhǎng)度為4的長(zhǎng)字整數(shù)向量(4×64位)以及256位的8倍字整數(shù)數(shù)據(jù)。

    C3B的擴(kuò)展指令系統(tǒng)較為全面,在多媒體優(yōu)化中經(jīng)常用到的指令包括加法減法指令、可重構(gòu)邏輯運(yùn)算指令、位移指令、條件判斷選擇指令以及裝入和存儲(chǔ)指令等。

    1.3 "向量化限制

    理論上來(lái)說(shuō),對(duì)于完全SIMD向量化的程序,32×8 的向量運(yùn)算性能可以達(dá)到標(biāo)量的8倍,64×4的向量運(yùn)算性能可以達(dá)到標(biāo)量的4倍。但是,程序向量化通常存在以下限制,因此很難做到完全SIMD向量化。

    首先是硬件限制:向量化受限于硬件的限制。在 SIMD擴(kuò)展中,向量化訪存操作必須是地址連續(xù)的,且要求32字節(jié)對(duì)界。因此,雖然有些循環(huán)是可向量化的,但具體針對(duì)威焱831體系結(jié)構(gòu),需要進(jìn)行程序變換后才能向量化。

    1) 循環(huán)結(jié)構(gòu)的限制:循環(huán)必須是只有一個(gè)入口和一個(gè)出口時(shí)才能被向量化。

    2) 更有效的使用Cache:高效地使用各級(jí)Cache對(duì)于性能的提高是極為重要的,一級(jí)Cache中訪問(wèn)數(shù)據(jù)的速度比主存儲(chǔ)器中訪問(wèn)數(shù)據(jù)快數(shù)十倍。為了更好地使用Cache,程序需要盡量使用同一個(gè)Cache行的所有數(shù)據(jù)而不是各不同Cache行的部分?jǐn)?shù)據(jù),而且程序最好能在數(shù)據(jù)被替換出Cache以前盡量多地重用這些數(shù)據(jù)。當(dāng)然,為了從SIMD部件中獲得性能的提升,也要求程序最好訪問(wèn)連續(xù)的內(nèi)存區(qū)域,這一點(diǎn)來(lái)講,Cache與SIMD 部件對(duì)程序的要求是一樣的。

    3) 對(duì)界問(wèn)題:大部分情況下,申威架構(gòu)下使用擴(kuò)展存儲(chǔ)與裝入指令進(jìn)行變量映射的時(shí)候,需要保證標(biāo)準(zhǔn)類(lèi)型變量為32字節(jié)對(duì)界。若進(jìn)行了不對(duì)界訪存,程序運(yùn)行時(shí),系統(tǒng)需要不斷處理該訪存引起的異常,這將極大拖慢程序與系統(tǒng)的運(yùn)行速度。數(shù)據(jù)Cache中跨32字節(jié)的不對(duì)界訪存如圖1所示。

    上述三個(gè)問(wèn)題的處理,1)關(guān)系到能否實(shí)施向量化,2)、3)則是向量化后能否發(fā)揮預(yù)期性能的關(guān)鍵。

    2 "FFmpeg的H.264編碼優(yōu)化

    2.1 "H.264視頻編碼標(biāo)準(zhǔn)

    H.264(AVC)視頻編碼標(biāo)準(zhǔn)作為目前應(yīng)用最廣的標(biāo)準(zhǔn)意義非凡,其既能帶來(lái)較高的壓縮率,又能保證編碼質(zhì)量,在安防、直播等視頻領(lǐng)域都有很廣泛的應(yīng)用。

    從編碼途徑上分類(lèi),視頻編碼可分為硬件編碼和軟件編碼。硬件編碼依靠專(zhuān)門(mén)的解碼芯片,編碼效率高;軟件編碼則可以支持不同的視頻編解碼標(biāo)準(zhǔn),系統(tǒng)兼容性好,當(dāng)然軟件編碼對(duì)CPU的性能要求也較高。目前基于H.264標(biāo)準(zhǔn)的媒體應(yīng)用最廣泛,因此從實(shí)用性角度看,優(yōu)化H.264的軟件編碼效率,性價(jià)比最高。

    2.2 "H.264編碼器優(yōu)化實(shí)現(xiàn)

    FFmpeg是一套完善的開(kāi)源的音視頻處理軟件框架[12],編譯時(shí)可集成x264庫(kù)。在申威處理器上,其H.264編碼流程由通用分支基于高級(jí)語(yǔ)言實(shí)現(xiàn),雖然具有格式兼容性好和算法升級(jí)靈活的優(yōu)勢(shì),但單純依靠CPU性能,編碼效率較低。

    FFmpeg調(diào)用x264的流程如圖2所示。圖中,用戶傳入命令參數(shù)后,解析指令、進(jìn)行查找編碼器等操作,由avcodec_open2打開(kāi)編碼器接口進(jìn)入編解碼器部分,隨后初始化x264編碼器并進(jìn)行相關(guān)配置;其次是編碼階段,由avcodec_alloc_frame()函數(shù)為編碼幀分配內(nèi)存,av_read_frame()函數(shù)從碼流中讀取幀數(shù)據(jù),判斷幀類(lèi)型后調(diào)用avcodec_encode_video()函數(shù)編碼;最后是收尾階段,釋放數(shù)據(jù)內(nèi)存、編碼器和關(guān)閉輸入文件。

    2.2.1 "性能瓶頸分析

    x264的編碼運(yùn)算主要集中在x264_encoder_encode()函數(shù),可細(xì)分成: 幀間和幀內(nèi)預(yù)測(cè)、變換與量化、濾波、熵編碼四部分。H.264碼流的基本單位是NALU(碼流單元),分為多種類(lèi)型,比如:圖像數(shù)據(jù)分片(Slice)、增強(qiáng)信息(SEI)、序列參數(shù)集(SPS)、圖像參數(shù)集(PPS)。一個(gè)Slice分片通常由多個(gè)宏塊(MB)組成,宏塊是編碼運(yùn)算處理的基本單位。

    1) 幀間和幀內(nèi)預(yù)測(cè):幀間預(yù)測(cè)指利用視頻時(shí)間域相關(guān)性,使用鄰近已編碼圖像像素預(yù)測(cè)當(dāng)前圖像的像素,以達(dá)到有效去除視頻時(shí)間域冗余的目的。由于視頻序列通常包括較強(qiáng)的時(shí)間域相關(guān)性,因此預(yù)測(cè)殘差值接近于0。將殘差信號(hào)作為后續(xù)模塊的輸入進(jìn)行變換、量化、掃描及熵編碼,可實(shí)現(xiàn)對(duì)視頻信號(hào)的高效壓縮,核心函數(shù)是x264_mb_analyse_inter_*()。

    幀內(nèi)預(yù)測(cè)則是利用圖像內(nèi)空間域相關(guān)性,使用已編碼像素預(yù)測(cè)圖像鄰近像素,以達(dá)到有效去除圖像空間域冗余的目的,其核心函數(shù)是x264_mb_analyse_intra()。

    2) 變換與量化:變換編碼將圖像時(shí)域信號(hào)變換成頻域信號(hào),在頻域中圖像信號(hào)能量大部分集中在低頻區(qū)域,相對(duì)時(shí)域信號(hào),碼率有較大的下降。H.264對(duì)圖像或預(yù)測(cè)殘差采用4×4整數(shù)離散余弦(DCT)變換技術(shù)。

    量化過(guò)程就是根據(jù)圖像的動(dòng)態(tài)范圍大小確定量化參數(shù),既保留圖像必要的細(xì)節(jié),又可以減少碼流。在圖像編碼中,變換編碼和量化從原理上講是兩個(gè)獨(dú)立的過(guò)程;但在H.264中,將兩個(gè)過(guò)程中的乘法合二為一,并進(jìn)一步采用整數(shù)運(yùn)算,減少編解碼的運(yùn)算量,提高圖像壓縮的實(shí)時(shí)性,這些措施對(duì)峰值信噪比(PSNR)的影響很小,一般低于0.02 dB,可不計(jì)。

    宏塊編碼函數(shù)x264_macroblock_encode是完成變換與量化的主要函數(shù)。

    3) 濾波:H.264視頻編碼標(biāo)準(zhǔn)中,在編解碼器反變換量化后,圖像會(huì)出現(xiàn)方塊效應(yīng),盡管H.264采用較小的4×4變換尺寸,可以降低這種不連續(xù)現(xiàn)象,但仍需要一個(gè)去方塊濾波器,以最大程度提高編碼性能。在x264中,x264_slice_write()函數(shù)中調(diào)用x264_fdec_filter_row()的源代碼,x264_fdec_filter_row()對(duì)應(yīng)著x264中的濾波模塊。

    4) 熵編碼:熵編碼函數(shù)x264_macroblock_write_cabac()或x264_macroblock_write_cavlc()讀取碼流數(shù)據(jù),進(jìn)行CABAC或CAVLC熵編碼。

    在申威平臺(tái)上,通過(guò)性能分析發(fā)現(xiàn),編碼過(guò)程絕大多數(shù)CPU性能消耗在幀內(nèi)預(yù)測(cè)、運(yùn)動(dòng)補(bǔ)償、DCT變換、濾波等過(guò)程運(yùn)算上。另外,在視頻輸出方面,大量的數(shù)據(jù)拷貝操作同樣消耗了不少的CPU時(shí)間。

    表1統(tǒng)計(jì)了CPU占比的熱點(diǎn)函數(shù),并刪掉了其中不滿足向量化限制性條件的內(nèi)容。

    針對(duì)上述分析,在申威平臺(tái)上進(jìn)行編碼器優(yōu)化的流程如圖3所示。首先,使用性能分析工具perf記錄編碼全程的高頻熱點(diǎn)函數(shù);其次,逐項(xiàng)分析熱點(diǎn)函數(shù),在滿足向量化限制條件的基礎(chǔ)上研究并行化方法;然后采用SIMD指令以嵌入式匯編手段重構(gòu)熱點(diǎn)函數(shù),包括循環(huán)展開(kāi)、數(shù)據(jù)分組打包、并行運(yùn)算等步驟;最后結(jié)合申威流水線特點(diǎn),考慮指令延遲及循環(huán)間隔等因素,進(jìn)一步調(diào)整指令流,減少因數(shù)據(jù)相關(guān)而引入的不必要延遲,使用更高效的指令進(jìn)行替換。如果性能結(jié)果不滿意,則繼續(xù)查找新的優(yōu)化點(diǎn),重復(fù)上述過(guò)程。

    2.2.2 "優(yōu)化實(shí)現(xiàn)

    1) SIMD優(yōu)化。利用微處理器的并行部件,SIMD技術(shù)通過(guò)一條指令對(duì)一組數(shù)據(jù)進(jìn)行相同的操作,從而完成之前需要多條指令才能完成的處理任務(wù)。以方塊濾波函數(shù)x264_pixel_sad_16×16為例,其通用分支代碼實(shí)現(xiàn)和采用SIMD擴(kuò)展指令將內(nèi)層循環(huán)進(jìn)行并行優(yōu)化后的代碼如下:

    //C代碼節(jié)選

    for( int y = 0; y lt; ly; y++ )

    {

    for( int x = 0; x lt; lx; x++ )

    {

    i_sum+=abs(pix1[x]?pix2[x]);

    }}

    //并行化改造

    for(int y = 0; y lt; ly; y++) {

    for(int i = 0,x = 0;i lt; idx ; i++,x+=8){

    _asm_ _volatile_(

    \"VLDD $f2,0(%0)\n\t\"

    \"VLDD $f3,0(%1)\n\t\"

    \"VSUBW $f3,$f2,$f4\n\t\"

    \"VSUBW $f2,$f3,$f5\n\t\"

    \"VSELLTW $f4,$f5,$f4,$f6\n\t\"

    \"VSTD $f6,0(%2)\n\t\"

    :\"r\"(amp;v_pix1[x]),\"r\"(amp;v_pix2[x]),\"r\"(amp;v_result)

    :);}}

    其中v_pix1、v_pix2為源代碼中像素?cái)?shù)據(jù)pix1及pix2轉(zhuǎn)換并進(jìn)行對(duì)齊操作的向量數(shù)組。使用VLDD指令加載到向量寄存器$f2、$f3后,使用VSUBW指令進(jìn)行v_pix1-v_pix2、vpix2-v_pix1減法操作。將二者的差值分別存儲(chǔ)到$f4、$f5,通過(guò)指令VSELLTW判斷$f4向量中每個(gè)元素的值,如果小于0則選取$f5中相應(yīng)元素的值;否則,將$f4相應(yīng)元素的值存儲(chǔ)至$f6。最終使用VSTD指令將結(jié)果$f6儲(chǔ)存至對(duì)齊數(shù)組v_result中,該數(shù)組的各元素之和即為源代碼中的i_sum。內(nèi)層循環(huán)一次可操作8個(gè)數(shù)據(jù),整體來(lái)看循環(huán)次數(shù)減少為原來(lái)的[18],有效提升了性能。

    又如子函數(shù)x264_clip_pixel()被2的整數(shù)倍次調(diào)用,改造時(shí)需先展開(kāi)再進(jìn)行并行化改造,同時(shí)其運(yùn)算完全由位運(yùn)算、加減法及條件判斷組成,是比較理想的可改寫(xiě)函數(shù)。其代碼如下:

    //簡(jiǎn)化C代碼

    for( int y = 0; y lt; i_h; y++, dst += i_dst, src += i_src)

    for( int x = 0; x lt; i_w; x++ )

    dst[x] = x264_clip_pixel(x);

    // x264_clip_pixel()

    x264_clip_pixel(x){

    return ((xamp;~A)?(?x)gt;gt;31amp;A;x;

    }

    其中x = src[x]*A + B;

    for( y = 0; y lt; i_height; y++, dst += i_dst_stride, src += i_src_stride ){

    for( x = 0; x lt; j; x++ ){

    for( i = 0; i lt; 8; i++){

    tmp_res[i] = src[i+off] * scale;}

    _asm_ _volatile_(

    \"VLDD $f10,0(%0)\n\t\"

    \"VLDD $f11,0(%1)\n\t\"

    \"VADDW $f10,$f11,$f12\n\t\"

    \"VSTD $f12,0(%2)\n\t\"

    :\"r\"(amp;tmp_res),\"r\"(amp;tmp_offset),\"r\"(amp;tmp_dst)

    :);

    _asm_ _volatile_(

    \"VLDD $f10,0(%0)\n\t\" " " " " " " " " " " " " " " " " " "http://tmp_dst

    \"VLDD $f11,0(%1)\n\t\" " " " " " " " " " " " " " " "http://PIXEL_MAX

    \"VLDD $f12,0(%2)\n\t\" " " " " " " " " " " " " " " " "http://tmp_const0

    \"VADDW $f11,1,$f13\n\t\" " " " " " " " " " " " " " "http://tmp_max+1

    \"VSUBW $f12,$f13,$f13\n\t\" " //?(tmp_max+1)=~PIXEL_MAX

    \"VLOG08 $f12,$f10,$f13,$f14\n\t\" " //tmp_dstamp;~PIXEL_MAX

    \"VSUBW $f12,$f10,$f15\n\t\" " " " " " " " " " " " " " "http://?tmp_dst

    \"VSRAW $f15,31,$f15\n\t\" " " " " " " " " " " " " " " //gt;gt;31算術(shù)

    \"VLOG08 $f12,$f15,$f11,$f15\n\t\" " " " " " " " " " " " " " " "http://amp;

    \"VSELEQW $f14,$f10,$f15,$f16\n\t\" " " " " " " " " " " " " " "http://?

    \"VSTD $f16,0(%3)\n\t\" " " " " " " " " " " " " " " " " " " " " " " //

    :\"r\"(amp;tmp_dst),\"r\"(amp;tmp_max),\"r\"(amp;tmp_const0),\"r\" (amp;tmp_

    return)

    :);

    首先改造最內(nèi)層數(shù)據(jù)變量x,由于缺少乘法指令,因此src[x]*A保留,將其8次循環(huán)的值賦給對(duì)齊向量數(shù)組tmp_res;然后B值賦給向量tmp_offset,通過(guò)指令VADDW相加存儲(chǔ)到tmp_dst,即完成變量x的向量化;其次改造x264_clip_pixel(x):x向量值tmp_dst加載到$f10,常量A對(duì)齊轉(zhuǎn)換為tmp_max后加載$f11,0對(duì)齊轉(zhuǎn)換為tmp_const0加載到$f12;由于缺少向量取反指令, tmp_max首先加1存儲(chǔ)至$f13,隨后通過(guò)VSUBW進(jìn)行tmp_const0?tmp_max間接實(shí)現(xiàn)取反操作;最后通過(guò)可重構(gòu)指令VLOG08實(shí)現(xiàn)tmp_dstamp;~PIXEL_MAX的邏輯與操作,其中數(shù)據(jù)8通過(guò)與操作的真值表求出,剩余部分可查看注釋釋義。

    2) 對(duì)界問(wèn)題的處理。申威架構(gòu)中,一般情況下可采用兩種方式來(lái)處理對(duì)界問(wèn)題:一是采用SIMD整理指令對(duì)數(shù)組b進(jìn)行拼接;二是使用不對(duì)界訪存接口直接處理。理論上,方法2比方法1性能要好。但實(shí)際使用中,不對(duì)界仿存指令依舊會(huì)帶來(lái)不可接受的巨大開(kāi)銷(xiāo)。因此申請(qǐng)?jiān)S多新內(nèi)存空間,并利用_attribute_((aligned(n)))強(qiáng)制對(duì)界,配合內(nèi)存拷貝優(yōu)化方式來(lái)初始化能有效提升性能。

    3) 內(nèi)存拷貝優(yōu)化。幀拷貝大量使用memcpy()函數(shù)。該部分通過(guò)SW平臺(tái)下優(yōu)化的mem庫(kù)直接鏈接使用。

    上述三種優(yōu)化手段里面,SIMD向量?jī)?yōu)化主要集中在運(yùn)動(dòng)補(bǔ)償和去塊濾波方面,效果明顯;而幀拷貝優(yōu)化屬于通用優(yōu)化方法,在編碼的各個(gè)階段都可以獲益,尤其是在編碼后的視頻輸出階段。

    3 "實(shí) "驗(yàn)

    3.1 "實(shí)驗(yàn)平臺(tái)

    實(shí)驗(yàn)的硬件平臺(tái)采用威焱831臺(tái)式計(jì)算機(jī)。威焱831為64位字長(zhǎng)的國(guó)產(chǎn)高性能8核通用處理器,該處理器集成了8個(gè)64位RISC結(jié)構(gòu)的申威處理器核心,采用Core3B核心指令系統(tǒng),主頻2.5 GHz,配置16 GB DDR3內(nèi)存,搭載UOS 20操作系統(tǒng),采用Linux 4.19?sw內(nèi)核。視頻編碼器x264版本為0.164.x,測(cè)試視頻片段為h264格式視頻文件通過(guò)FFmpeg軟件解碼出來(lái)的YUV文件,包括1 080P、4K兩種主流分辨率。

    3.2 "實(shí)驗(yàn)數(shù)據(jù)

    表2統(tǒng)計(jì)了上述主要耗時(shí)函數(shù)在兩種分辨率的YUV文件編碼H.264格式視頻過(guò)程中的CPU耗時(shí)占比,以10億個(gè)CPU周期(G Cycles)為單位。從表2可以看出,經(jīng)過(guò)SIMD向量化優(yōu)化后,去塊效應(yīng)濾波模塊和運(yùn)動(dòng)補(bǔ)償模塊計(jì)算效率明顯改善,結(jié)合表1可發(fā)現(xiàn)性能改善主要集中在去塊效應(yīng)濾波模塊。SIMD向量化充分利用了各種系統(tǒng)資源和程序的計(jì)算并行性特征,編碼過(guò)程中的計(jì)算效率明顯提升。在保證了幀率和圖像質(zhì)量的前提下,各主要熱點(diǎn)函數(shù)經(jīng)過(guò)SIMD優(yōu)化后,在整個(gè)編碼過(guò)程中的耗時(shí)占比大幅下降。其中,在1 080P分辨率下耗時(shí)均下降到2%以下,相對(duì)于4K分辨率的編碼情景,改善效果感性上更為顯著。

    表3統(tǒng)計(jì)了優(yōu)化前后兩種分辨率視頻的整體編碼性能,主要以編碼時(shí)的FPS作為性能比較基準(zhǔn)單位。

    從表3可以看出:與表2占比耗時(shí)提升推測(cè)相對(duì)應(yīng),1 080P分辨率的編碼性能效果提升更為顯著,整體編碼性能由4.9提升到7.4,平均提升幅度達(dá)到50%以上;4K分辨率提升效果則達(dá)到近20%,不過(guò)CPU占用率基本達(dá)到飽和。

    4 "結(jié) "語(yǔ)

    本文對(duì)申威處理器上使用FFmpeg編碼H.264標(biāo)準(zhǔn)視頻的性能瓶頸進(jìn)行了較詳細(xì)的分析,針對(duì)其中比較耗時(shí)的操作,提出了在申威架構(gòu)下適用SIMD進(jìn)行優(yōu)化的具體方法。各項(xiàng)數(shù)據(jù)表明,在保證圖像視頻質(zhì)量下,編碼器在主流分辨率下的性能提升了15%以上,平均性能提升了30%以上。這種基于申威SIMD技術(shù)的優(yōu)化方法充分利用了總線、數(shù)據(jù)通道資源,并且沒(méi)有改變處理算法的基本結(jié)構(gòu),在基于軟件編碼的國(guó)產(chǎn)處理器多媒體領(lǐng)域中有著廣泛應(yīng)用。

    參考文獻(xiàn)

    [1] 劉浩浩.面向SIMD超長(zhǎng)向量加速部件的向量化方法研究[D].鄭州:中原工學(xué)院,2022.

    [2] 陽(yáng)飛.基于龍芯2K1000B的H.264視頻解碼系統(tǒng)軟件適配與優(yōu)化[D].南京:東南大學(xué),2020.

    [3] 裴航.基于申威421處理器的視頻解碼SIMD優(yōu)化技術(shù)研究[D].鄭州:中原工學(xué)院,2021.

    [4] 張振東,王彤,劉鵬.面向申威眾核處理器的規(guī)則處理優(yōu)化技術(shù)[J/OL].計(jì)算機(jī)研究與發(fā)展:1?19[2023?09?13]. http://kns.cnki.net/kcms/detail/11.1777.TP.20230720.0940.004.html.

    [5] 馮德邦.支持超高清的H.264熵解碼器的設(shè)計(jì)與驗(yàn)證[D].哈爾濱:哈爾濱工業(yè)大學(xué),2022.

    [6] 谷一鑫.面向ARM架構(gòu)的圖像高性能計(jì)算庫(kù)研究與移植優(yōu)化[D].西安:西安電子科技大學(xué),2022.

    [7] 馬浩.基于Tilera多核處理器的HEVC解碼主要模塊并行處理方案設(shè)計(jì)與實(shí)現(xiàn)[D].南京:南京郵電大學(xué),2021.

    [8] 佘成龍.“魂芯”DSP H.265幀內(nèi)預(yù)測(cè)實(shí)現(xiàn)及預(yù)測(cè)模式并行化設(shè)計(jì)[D].合肥:合肥工業(yè)大學(xué),2019.

    [9] 熊啟金,丁永強(qiáng),林志堅(jiān).高效視頻編碼幀內(nèi)預(yù)測(cè)算法優(yōu)化與硬件架構(gòu)設(shè)計(jì)[J].無(wú)線電通信技術(shù),2023,49(5):953?959.

    [10] 蔣林,馮茹.基于視頻陣列處理器的3D?HEVC視差估計(jì)算法并行設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟件,2023,40(7):260?265.

    [11] 林志堅(jiān),丁永強(qiáng),楊秀芝,等.HEVC幀內(nèi)率失真優(yōu)化預(yù)測(cè)模式的并行流水線硬件設(shè)計(jì)[J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,51(5):95?103.

    [12] FFmpeg documentation. FFmpeg source code [EB/OL]. [2022?04?30]. http://www.ffmpeg.org/download.html#get?sources/.

    [13] 屠要峰,陳河堆.面向GoldenX軟硬協(xié)同優(yōu)化的異構(gòu)加速列式存儲(chǔ)引擎研究[J].計(jì)算機(jī)學(xué)報(bào),2022(1):207?223.

    猜你喜歡
    指令處理器編碼
    聽(tīng)我指令:大催眠術(shù)
    基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
    《全元詩(shī)》未編碼疑難字考辨十五則
    子帶編碼在圖像壓縮編碼中的應(yīng)用
    電子制作(2019年22期)2020-01-14 03:16:24
    ARINC661顯控指令快速驗(yàn)證方法
    Genome and healthcare
    LED照明產(chǎn)品歐盟ErP指令要求解讀
    Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
    ADI推出新一代SigmaDSP處理器
    呼嚕處理器
    久久精品久久久久久噜噜老黄 | 淫秽高清视频在线观看| 深爱激情五月婷婷| 国产精品爽爽va在线观看网站| 成人特级av手机在线观看| 舔av片在线| 国产精品精品国产色婷婷| 黄色视频,在线免费观看| 超碰av人人做人人爽久久| 日韩成人av中文字幕在线观看| 色播亚洲综合网| 久久国内精品自在自线图片| 国产麻豆成人av免费视频| 麻豆av噜噜一区二区三区| 校园春色视频在线观看| 久久人妻av系列| 联通29元200g的流量卡| 久久亚洲国产成人精品v| 国产精品不卡视频一区二区| 日韩,欧美,国产一区二区三区 | 亚洲欧美精品自产自拍| 亚洲激情五月婷婷啪啪| 国产精品福利在线免费观看| 26uuu在线亚洲综合色| 美女黄网站色视频| 狂野欧美激情性xxxx在线观看| 女人十人毛片免费观看3o分钟| 夜夜爽天天搞| 久久午夜亚洲精品久久| 午夜激情欧美在线| 99久国产av精品| 乱码一卡2卡4卡精品| 天堂av国产一区二区熟女人妻| 国产精品99久久久久久久久| 亚洲经典国产精华液单| 身体一侧抽搐| 精品人妻视频免费看| www.色视频.com| 床上黄色一级片| 天美传媒精品一区二区| 最近手机中文字幕大全| 欧美色欧美亚洲另类二区| 午夜激情福利司机影院| 成人二区视频| 久久久久久久久久久丰满| 国内精品久久久久精免费| 国产精品不卡视频一区二区| 一个人看的www免费观看视频| 亚洲中文字幕一区二区三区有码在线看| 亚洲精品自拍成人| 久久精品国产自在天天线| 91麻豆精品激情在线观看国产| 国产精品三级大全| 一区二区三区四区激情视频 | 你懂的网址亚洲精品在线观看 | 神马国产精品三级电影在线观看| 成人三级黄色视频| 99热网站在线观看| 欧美一区二区国产精品久久精品| 成人午夜高清在线视频| 给我免费播放毛片高清在线观看| 美女 人体艺术 gogo| 中文字幕免费在线视频6| 亚洲图色成人| 美女被艹到高潮喷水动态| 亚洲国产精品合色在线| 天堂中文最新版在线下载 | 精华霜和精华液先用哪个| 亚洲av免费在线观看| 嫩草影院精品99| 99国产极品粉嫩在线观看| 男女下面进入的视频免费午夜| 日日撸夜夜添| 日韩强制内射视频| 一区二区三区免费毛片| 一进一出抽搐动态| 又爽又黄无遮挡网站| 成年av动漫网址| 日韩大尺度精品在线看网址| 伊人久久精品亚洲午夜| 国产午夜福利久久久久久| 村上凉子中文字幕在线| 国产精品,欧美在线| 中国国产av一级| 欧美成人一区二区免费高清观看| 人妻少妇偷人精品九色| 亚洲av电影不卡..在线观看| 啦啦啦观看免费观看视频高清| 天天一区二区日本电影三级| 寂寞人妻少妇视频99o| 91av网一区二区| 亚洲国产欧洲综合997久久,| 最近中文字幕高清免费大全6| 一级毛片我不卡| 久久人人爽人人片av| 尤物成人国产欧美一区二区三区| 欧美高清成人免费视频www| 99视频精品全部免费 在线| 久久热精品热| 男女做爰动态图高潮gif福利片| 激情 狠狠 欧美| 99riav亚洲国产免费| 麻豆av噜噜一区二区三区| 亚洲在线观看片| 人妻制服诱惑在线中文字幕| 身体一侧抽搐| 精品国产三级普通话版| 成人特级av手机在线观看| 18禁在线无遮挡免费观看视频| 99热这里只有是精品在线观看| 男女那种视频在线观看| www.av在线官网国产| 欧美+亚洲+日韩+国产| 久久这里只有精品中国| 偷拍熟女少妇极品色| 国产亚洲av嫩草精品影院| 中出人妻视频一区二区| 波多野结衣巨乳人妻| 欧美区成人在线视频| 亚洲欧美日韩无卡精品| 国产亚洲91精品色在线| 两个人视频免费观看高清| 可以在线观看的亚洲视频| 国产乱人偷精品视频| 搞女人的毛片| 在线观看av片永久免费下载| 久久久成人免费电影| 免费看美女性在线毛片视频| 久久午夜亚洲精品久久| 日本三级黄在线观看| 中文字幕av在线有码专区| 91狼人影院| 久久精品91蜜桃| 男人舔女人下体高潮全视频| 我要看日韩黄色一级片| 给我免费播放毛片高清在线观看| 精品久久久久久成人av| 久久久久免费精品人妻一区二区| 两个人的视频大全免费| 国产精品久久久久久精品电影| 超碰av人人做人人爽久久| 乱系列少妇在线播放| 乱码一卡2卡4卡精品| 婷婷亚洲欧美| 黄片无遮挡物在线观看| 麻豆国产97在线/欧美| 在线观看午夜福利视频| 人妻久久中文字幕网| 免费av观看视频| 欧美一区二区精品小视频在线| 国产成年人精品一区二区| 免费观看的影片在线观看| 嘟嘟电影网在线观看| 国产精品人妻久久久久久| 永久网站在线| 国产精品,欧美在线| 色播亚洲综合网| 免费看日本二区| av在线亚洲专区| 神马国产精品三级电影在线观看| 亚洲精品粉嫩美女一区| 国内精品宾馆在线| 国产大屁股一区二区在线视频| 国产毛片a区久久久久| 亚洲真实伦在线观看| 九色成人免费人妻av| 亚洲精品国产av成人精品| 欧美成人免费av一区二区三区| 欧美高清成人免费视频www| 久久久久久九九精品二区国产| 99热只有精品国产| 一个人观看的视频www高清免费观看| 国产69精品久久久久777片| 天堂av国产一区二区熟女人妻| 麻豆久久精品国产亚洲av| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 国产精品人妻久久久影院| 亚洲精品久久国产高清桃花| 午夜福利成人在线免费观看| 色5月婷婷丁香| 男人舔奶头视频| 国产一区二区在线av高清观看| 日韩亚洲欧美综合| 十八禁国产超污无遮挡网站| 欧美最新免费一区二区三区| eeuss影院久久| 久久久精品欧美日韩精品| 可以在线观看的亚洲视频| 欧美最黄视频在线播放免费| 男的添女的下面高潮视频| 国产成人91sexporn| 亚洲aⅴ乱码一区二区在线播放| 毛片女人毛片| 少妇丰满av| 免费电影在线观看免费观看| 噜噜噜噜噜久久久久久91| 午夜福利视频1000在线观看| 精品日产1卡2卡| 十八禁国产超污无遮挡网站| 国产三级中文精品| 免费观看人在逋| 一级av片app| 免费人成在线观看视频色| 91久久精品电影网| 久久久久久伊人网av| 一区二区三区四区激情视频 | 免费看日本二区| 美女内射精品一级片tv| 如何舔出高潮| 欧美人与善性xxx| 国产av在哪里看| 亚洲内射少妇av| 精品欧美国产一区二区三| 精品人妻一区二区三区麻豆| 在线观看66精品国产| 色综合亚洲欧美另类图片| 99久久无色码亚洲精品果冻| 欧美极品一区二区三区四区| 黄色一级大片看看| av天堂在线播放| 中文字幕熟女人妻在线| 一级黄片播放器| 97超碰精品成人国产| 国产极品天堂在线| 国产一区二区三区在线臀色熟女| 在线免费观看不下载黄p国产| 91精品一卡2卡3卡4卡| 午夜福利在线在线| 听说在线观看完整版免费高清| 三级毛片av免费| 国产成人午夜福利电影在线观看| 国内少妇人妻偷人精品xxx网站| 国产av不卡久久| 麻豆国产av国片精品| 欧美最黄视频在线播放免费| 成人毛片a级毛片在线播放| 波多野结衣高清作品| 99在线视频只有这里精品首页| 免费人成在线观看视频色| 日韩欧美 国产精品| 国产av不卡久久| 国产精品美女特级片免费视频播放器| 国产午夜精品一二区理论片| 男女啪啪激烈高潮av片| 亚洲最大成人av| 亚洲一区高清亚洲精品| 国产午夜精品论理片| 深夜a级毛片| 欧美在线一区亚洲| 国产av一区在线观看免费| 在线天堂最新版资源| 亚洲国产欧洲综合997久久,| 亚洲国产精品成人久久小说 | 亚洲成人中文字幕在线播放| 欧美zozozo另类| 欧洲精品卡2卡3卡4卡5卡区| av天堂中文字幕网| 日韩欧美三级三区| 久久久国产成人免费| 亚洲av中文字字幕乱码综合| 日产精品乱码卡一卡2卡三| 日本免费a在线| 免费黄网站久久成人精品| 成人亚洲欧美一区二区av| 亚州av有码| 亚洲欧美中文字幕日韩二区| 小蜜桃在线观看免费完整版高清| 只有这里有精品99| 校园人妻丝袜中文字幕| 亚洲av电影不卡..在线观看| 日本成人三级电影网站| 久久久久久久久久黄片| 精品人妻熟女av久视频| 久久久久久久久中文| 欧美日韩在线观看h| 我要搜黄色片| 99热这里只有精品一区| 国产高清不卡午夜福利| 国产成人福利小说| 日本撒尿小便嘘嘘汇集6| 日韩,欧美,国产一区二区三区 | 久久久久久久久久黄片| 国产真实乱freesex| a级一级毛片免费在线观看| 日本五十路高清| 亚洲av熟女| 中文在线观看免费www的网站| 国产免费一级a男人的天堂| 成人特级av手机在线观看| 蜜桃亚洲精品一区二区三区| 人人妻人人澡人人爽人人夜夜 | 国产综合懂色| 国产爱豆传媒在线观看| 欧美性猛交╳xxx乱大交人| 人妻久久中文字幕网| 高清午夜精品一区二区三区 | 大又大粗又爽又黄少妇毛片口| 亚洲精品亚洲一区二区| 观看美女的网站| 亚洲精品乱码久久久v下载方式| 国产精品久久久久久久电影| 一级毛片电影观看 | 亚洲av免费高清在线观看| 日韩欧美在线乱码| av免费观看日本| 国模一区二区三区四区视频| 大又大粗又爽又黄少妇毛片口| 国产亚洲5aaaaa淫片| 成人午夜高清在线视频| 男女那种视频在线观看| 亚洲精品日韩在线中文字幕 | 国产精品一区二区三区四区免费观看| 免费av毛片视频| 久久久国产成人免费| 国产伦在线观看视频一区| 精品99又大又爽又粗少妇毛片| 中国美白少妇内射xxxbb| 成人国产麻豆网| 给我免费播放毛片高清在线观看| 97超碰精品成人国产| 日韩精品有码人妻一区| 午夜精品在线福利| 尾随美女入室| www.色视频.com| 男人的好看免费观看在线视频| 亚洲av成人精品一区久久| 人人妻人人澡欧美一区二区| 午夜福利在线观看吧| 亚洲av中文字字幕乱码综合| 婷婷色综合大香蕉| 99久久精品国产国产毛片| 亚洲av中文字字幕乱码综合| 亚洲精品日韩av片在线观看| 日韩高清综合在线| 国产午夜精品一二区理论片| 男女下面进入的视频免费午夜| 亚洲av免费高清在线观看| 国产伦在线观看视频一区| 国产精品人妻久久久影院| 成年免费大片在线观看| 在线观看免费视频日本深夜| 亚洲精品粉嫩美女一区| 人妻久久中文字幕网| 国产免费一级a男人的天堂| 搡老妇女老女人老熟妇| 国产大屁股一区二区在线视频| 亚洲精品乱码久久久久久按摩| 亚洲国产精品成人综合色| 联通29元200g的流量卡| 91av网一区二区| 日本一二三区视频观看| 在线播放无遮挡| 日韩欧美一区二区三区在线观看| 国产黄色视频一区二区在线观看 | 人体艺术视频欧美日本| a级毛片a级免费在线| 欧美高清性xxxxhd video| 欧美一区二区精品小视频在线| av视频在线观看入口| 久久久精品大字幕| 91aial.com中文字幕在线观看| 日韩高清综合在线| 中文资源天堂在线| 久久久久久伊人网av| 免费在线观看成人毛片| 亚洲成人av在线免费| 中国国产av一级| 丝袜喷水一区| 最好的美女福利视频网| 性插视频无遮挡在线免费观看| a级一级毛片免费在线观看| 热99在线观看视频| 精品无人区乱码1区二区| 国产精品一区二区在线观看99 | 99精品在免费线老司机午夜| 午夜a级毛片| 99热全是精品| 国产精品久久久久久久电影| 我要搜黄色片| 亚洲三级黄色毛片| 国产一区二区在线观看日韩| 国产真实乱freesex| 亚洲av二区三区四区| a级毛片a级免费在线| 天天一区二区日本电影三级| eeuss影院久久| 日韩 亚洲 欧美在线| 在线观看免费视频日本深夜| 噜噜噜噜噜久久久久久91| 国产亚洲av片在线观看秒播厂 | 国产精品久久久久久精品电影小说 | 国产精品一区二区三区四区久久| 久久草成人影院| 久久热精品热| 国模一区二区三区四区视频| 欧美+日韩+精品| 床上黄色一级片| 高清在线视频一区二区三区 | 欧美三级亚洲精品| 噜噜噜噜噜久久久久久91| 乱码一卡2卡4卡精品| 亚洲欧美日韩无卡精品| 国产淫片久久久久久久久| 三级经典国产精品| av在线天堂中文字幕| 亚洲av成人精品一区久久| 亚洲精品成人久久久久久| 在现免费观看毛片| 看十八女毛片水多多多| 一级二级三级毛片免费看| 亚洲欧美日韩高清在线视频| 久久精品夜夜夜夜夜久久蜜豆| 免费在线观看成人毛片| 亚洲一区二区三区色噜噜| 夜夜爽天天搞| 亚洲欧美成人精品一区二区| 黑人高潮一二区| 精品久久久久久成人av| 2022亚洲国产成人精品| 性色avwww在线观看| 亚洲在久久综合| 亚洲av免费在线观看| 女的被弄到高潮叫床怎么办| 99久久久亚洲精品蜜臀av| av卡一久久| 少妇熟女aⅴ在线视频| 成年女人永久免费观看视频| 国产 一区 欧美 日韩| 3wmmmm亚洲av在线观看| 在线免费观看不下载黄p国产| 女同久久另类99精品国产91| 舔av片在线| 国产探花在线观看一区二区| 菩萨蛮人人尽说江南好唐韦庄 | 99久久精品国产国产毛片| 热99在线观看视频| 国产一区二区亚洲精品在线观看| 日本三级黄在线观看| 少妇人妻一区二区三区视频| 午夜爱爱视频在线播放| 美女脱内裤让男人舔精品视频 | 国产成人aa在线观看| 亚洲第一区二区三区不卡| 性插视频无遮挡在线免费观看| 久久久久久久久久成人| 国产一区二区亚洲精品在线观看| 观看免费一级毛片| 国产高清激情床上av| 成人鲁丝片一二三区免费| 22中文网久久字幕| 久久久久九九精品影院| 国产白丝娇喘喷水9色精品| 在线观看美女被高潮喷水网站| 欧美变态另类bdsm刘玥| 亚洲熟妇中文字幕五十中出| 99久久成人亚洲精品观看| 26uuu在线亚洲综合色| 又爽又黄无遮挡网站| 亚洲精品日韩在线中文字幕 | 国产高潮美女av| 日韩高清综合在线| 亚洲色图av天堂| 亚洲七黄色美女视频| 成人永久免费在线观看视频| 久久久久久大精品| 日韩视频在线欧美| 日韩制服骚丝袜av| 成年av动漫网址| av免费观看日本| 国产单亲对白刺激| 最好的美女福利视频网| 少妇熟女欧美另类| 日韩av不卡免费在线播放| 欧美色视频一区免费| 成人特级黄色片久久久久久久| 亚洲精品影视一区二区三区av| 国产成人freesex在线| 黄色视频,在线免费观看| 美女被艹到高潮喷水动态| 亚洲自偷自拍三级| 级片在线观看| 最新中文字幕久久久久| 国产精品久久久久久久久免| 亚洲真实伦在线观看| 午夜激情福利司机影院| 日本免费一区二区三区高清不卡| 国产老妇伦熟女老妇高清| 成年女人看的毛片在线观看| 亚洲va在线va天堂va国产| 精品不卡国产一区二区三区| 18禁在线无遮挡免费观看视频| 欧美区成人在线视频| 亚洲成人久久爱视频| 五月伊人婷婷丁香| 成人美女网站在线观看视频| 亚洲av一区综合| 99久久九九国产精品国产免费| 一区二区三区四区激情视频 | 久久久精品欧美日韩精品| 国产精品电影一区二区三区| 精品午夜福利在线看| 国产大屁股一区二区在线视频| 菩萨蛮人人尽说江南好唐韦庄 | 国产人妻一区二区三区在| 人妻夜夜爽99麻豆av| 欧美3d第一页| 国产精品,欧美在线| 免费av观看视频| 一个人观看的视频www高清免费观看| 身体一侧抽搐| 久久草成人影院| 丰满人妻一区二区三区视频av| 18+在线观看网站| 天天躁日日操中文字幕| 午夜福利高清视频| 欧美另类亚洲清纯唯美| 亚洲精品粉嫩美女一区| 99久久九九国产精品国产免费| 亚洲欧美日韩高清专用| 国产真实伦视频高清在线观看| 级片在线观看| 听说在线观看完整版免费高清| 在线观看66精品国产| 三级毛片av免费| 国产高清激情床上av| 国产精品野战在线观看| 99久久无色码亚洲精品果冻| 久久热精品热| 九九爱精品视频在线观看| 变态另类丝袜制服| 不卡视频在线观看欧美| 欧美色视频一区免费| 精华霜和精华液先用哪个| 欧美一级a爱片免费观看看| 日韩成人av中文字幕在线观看| 欧美三级亚洲精品| 国产精品伦人一区二区| 精品午夜福利在线看| 精品少妇黑人巨大在线播放 | 久久精品国产99精品国产亚洲性色| 亚洲成人精品中文字幕电影| 日本撒尿小便嘘嘘汇集6| 久久99精品国语久久久| 一级av片app| 国产午夜精品久久久久久一区二区三区| 国产精品伦人一区二区| 国产一区二区三区av在线 | av在线观看视频网站免费| 成人鲁丝片一二三区免费| 国产不卡一卡二| 在线播放国产精品三级| 亚州av有码| 国产欧美日韩精品一区二区| 亚洲无线在线观看| 97超碰精品成人国产| 国产一区二区亚洲精品在线观看| 可以在线观看毛片的网站| 99在线人妻在线中文字幕| 午夜视频国产福利| 亚洲最大成人av| 精品少妇黑人巨大在线播放 | 插阴视频在线观看视频| 身体一侧抽搐| 国产成人aa在线观看| 此物有八面人人有两片| 国产亚洲欧美98| av国产免费在线观看| 高清毛片免费看| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 久久久久久久久久久丰满| 国产精品免费一区二区三区在线| 日韩视频在线欧美| 欧美一区二区国产精品久久精品| 日日摸夜夜添夜夜添av毛片| 偷拍熟女少妇极品色| 婷婷亚洲欧美| 男人的好看免费观看在线视频| 国产免费一级a男人的天堂| 在线免费观看不下载黄p国产| 亚洲精品久久久久久婷婷小说 | 卡戴珊不雅视频在线播放| 一级黄色大片毛片| 国产精品嫩草影院av在线观看| 午夜福利高清视频| 久久99热6这里只有精品| 欧美日韩精品成人综合77777| 国产乱人偷精品视频| 亚洲av成人av| 少妇的逼水好多| 在线观看美女被高潮喷水网站| 久久久久久久久久久免费av| 亚洲四区av| 亚洲精品自拍成人| 亚洲欧美精品综合久久99| 高清日韩中文字幕在线| a级一级毛片免费在线观看| 欧美日韩乱码在线| 免费av不卡在线播放| 久久久久网色| 国产av在哪里看| 九九爱精品视频在线观看| 深夜精品福利| 在线国产一区二区在线| 69人妻影院| 成人亚洲欧美一区二区av| 亚洲欧美中文字幕日韩二区| 2021天堂中文幕一二区在线观| 午夜精品国产一区二区电影 | 久久精品影院6| av在线亚洲专区| 六月丁香七月| 久久精品91蜜桃| 一级黄片播放器| 国内揄拍国产精品人妻在线| 国产成人a区在线观看|