• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于HLS的高精度位移測量算法的硬件加速設(shè)計

    2025-03-20 00:00:00陳昊然王天昊路美娜宋茂新羅環(huán)吳曉宇駱冬根裘楨煒
    關(guān)鍵詞:現(xiàn)場可編程門陣列

    摘 要:針對高精度位移傳感器對高速位移測量算法的運行速度、可移植性及降低研發(fā)成本的需求,提出一種基于高層次綜合(high level synthesis, HLS)技術(shù)的高精度測量算法的硬件加速設(shè)計方法。使用HLS技術(shù)實現(xiàn)C++語言到Verilog語言的綜合,針對高精度位移測量算法設(shè)計策略,利用HLS技術(shù)中的流水化和數(shù)組重構(gòu)等優(yōu)化技術(shù)進行硬件加速,并將其封裝為知識產(chǎn)權(quán)(intellectual property, IP)核,提高算法的可移植性。以Xilinx公司的Kintex 7系列現(xiàn)場可編程門陣列(field programmable gate array, FPGA)芯片XC7K325TFFG676為載體的測量系統(tǒng)實驗結(jié)果表明,整個算法耗時91.8 μs,相比數(shù)字信號處理(digital signal processor, DSP)單元將運行時間縮短了308.2 μs,測量精度達到44.44 nm,穩(wěn)定性為49.20 nm,線性度為0.503‰。

    關(guān)鍵詞: 高層次綜合技術(shù); 位移檢測; 現(xiàn)場可編程門陣列; 硬件加速

    中圖分類號: TP 33

    文獻標志碼: ADOI:10.12305/j.issn.1001 506X.2025.02.01

    High precision displacement measurement algorithm based on

    HLS for hardware acceleration design

    CHEN Haoran1,2, WANG Tianhao1,2, LU Meina2,*, SONG Maoxin2, LUO Huan2,

    WU Xiaoyu2, LUO Donggen2, QIU Zhenwei2

    (1. Science Island Branch, Graduate School of University of Science and Technology of China, Hefei 230026, China;

    2. Hefei Institutes of Physical Science, Chinese Academy of Sciences, Hefei 230031, China)

    Abstract:To address the requirements of high precision displacement sensors for high speed displacement measurement algorithms for operating speed, protability and lower researching and developing cost, a hardware acceleration design method for high precision measurement algorithms based on high level synthesis (HLS) technology is proposed. By using HLS, the C++code is synthesized into Verilog. The design strategy for high precision displacement measurement algorithms employs optimization techniques such as pipelining and array partitioning in HLS to achieve hardware acceleration and the design is packaged as an intellectual property (IP) core to enhance portability of the proposed algorithm. The measurement system is implemented on a Xilinx Kintex 7 field programmable gate array (FPGA) XC7K325TFFG676 chip as a carrier, and experimental results demonstrate that the entire operating time of the proposed algorithm is 91.8 μs, which is 308.2 μs shorter than the implementation time of a digital signal processor (DSP), with the measurement accuracy of 44.44 nm, stability of 49.20 nm, and linearity of 0.503‰.

    Keywords:high level synthesis (HLS) technology; displacement measurement; field programmable gate array (FPGA); hardware acceleration

    0 引 言

    近年來,高精度位移傳感器已成為推動工業(yè)智能化和自動化發(fā)展的關(guān)鍵工具,其應(yīng)用范圍涵蓋了工程建筑、精密數(shù)控、航天航空、集成電路制造等諸多領(lǐng)域1-4。在工程建筑領(lǐng)域1,通過對建筑結(jié)構(gòu)進行高精度位移測量,可以及時檢測出超限形變,從而進行快速的安全評估并給出準確的解決方案,以保證工程設(shè)施的安全性和穩(wěn)定性,減少生命財產(chǎn)的損失。在精密數(shù)控領(lǐng)域1-3,液壓機械臂由于非線性動力以及液壓驅(qū)動特有的時變不確定性,需要更高精度的軌跡跟蹤控制,以確保產(chǎn)品能夠被準確裝配到目標孔上,避免撞擊事故的發(fā)生。同時,高精度位移測量技術(shù)可用于檢測機床的誤差和偏差,并對導(dǎo)軌的磨損和松動進行補償校正,從而提高機床加工的精度和穩(wěn)定性。

    目前,高精度位移測量技術(shù)廣泛使用激光三角測量法,該方法通過分析傳感器捕獲的光斑位置來計算物體的精確位置。盡管激光三角測量法在高精度位移測量中應(yīng)用效果顯著,但在處理高速動態(tài)對象時,其實時性與精度受到圖像處理技術(shù)限制。傳統(tǒng)的圖像處理技術(shù)利用中央處理器(central processing unit, CPU)和圖形處理器(graphics processing unit, GPU)[5-7進行訓(xùn)練和推理,達到硬件加速的效果。文獻[8]使用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,提高目標監(jiān)測的準確性。使用無人機通過串口通信的方式采集圖像,利用局域網(wǎng)的相關(guān)特性,實現(xiàn)高性能的異步通訊。使用CPU或GPU對算法進行軟件實現(xiàn)具有較高的可編程性和靈活性,但是對于規(guī)模較大的實驗,例如高能物理(high energy physics, HEP)實驗9,傳統(tǒng)CPU方法的計算成本非常高,采用多核CPU和服務(wù)集群來提升網(wǎng)絡(luò)處理性能,不僅受限于“功耗墻”,還會增加主機間通訊難度,運營成本非常高10-11。因此,盡管CPU在數(shù)據(jù)處理上表現(xiàn)出相當好的性能,但是其實時性在與外部硬件集成時很難實現(xiàn),需要消耗大量的電力并且需要服務(wù)器等基礎(chǔ)設(shè)施,不適用于流水化工業(yè)生產(chǎn)。

    隨著芯片運算能力的不斷提高,通過現(xiàn)場可編程門陣列(field programmable gate array, FPGA)實現(xiàn)算法的硬件加速成為解決上述問題的理想選擇。一方面,F(xiàn)PGA擁有天然的并行性,內(nèi)置的數(shù)千個“內(nèi)核”12可以直接并行執(zhí)行相同的操作,從而有效減少資源的重復(fù)使用,降低不必要的延遲。另一方面,F(xiàn)PGA在功能配置時就能提供確定的時延,與依賴復(fù)雜指令集的CPU相比,F(xiàn)PGA通過定制數(shù)據(jù)路徑實現(xiàn)了無需處理指令開銷的高級并行流水線。如果將數(shù)據(jù)傳輸時間考慮在內(nèi),F(xiàn)PGA的性能比單個CPU增加了1.4倍;考慮到能源消耗,單個FPGA比雙CPU增加3.4倍以上13。因此,并行化與低開銷的數(shù)據(jù)傳輸顯著提升整個系統(tǒng)的硬件加速能力。為達到高速、高精度位移測量的目的,使用基于FPGA的實時圖像處理系統(tǒng)是非常理想的解決方案。文獻[14]提出基于FPGA和數(shù)字信號處理器(digital signal processor, DSP)搭建異構(gòu)平臺圖像處理系統(tǒng),能同時發(fā)揮FPGA強大的并行處理能力和DSP卓越的運算能力,但是異構(gòu)平臺結(jié)構(gòu)復(fù)雜,數(shù)據(jù)傳輸消耗額外資源15-17。文獻[18]提出以FPGA為載體,結(jié)合可編程片上系統(tǒng)(system on a programmable chip, SOPC)和軟硬件協(xié)同設(shè)計方案,將算法移植到FPGA中以實現(xiàn)加速處理。這種方案具有實時性好、靈活性高的特點19。但是隨著對高效率和實時性的更高追求,在處理大規(guī)模、高速的多路圖像數(shù)據(jù)時,探索新的技術(shù)解決方案已成為必要。

    在這一背景下,高層次綜合(high level synthesis, HLS)技術(shù)20的引入為解決上述問題提供了新的視角。在深度神經(jīng)網(wǎng)絡(luò)(deep neural networks, DNN)中,需要頻繁對經(jīng)過訓(xùn)練的網(wǎng)絡(luò)模型參數(shù)進行存儲與訪問,由此產(chǎn)生大量的計算和內(nèi)存需求。文獻[21]提出靈活卷積神經(jīng)網(wǎng)絡(luò)(flexible convolutional neural network, Flex CNN)架構(gòu),使用HLS技術(shù)進行動態(tài)平鋪和數(shù)據(jù)布局優(yōu)化等操作,在Openpose V2網(wǎng)絡(luò)上實現(xiàn)了2.3倍的加速,滿足每秒幀數(shù)(frames per second, FPS)為23.8的實時處理要求。在視頻轉(zhuǎn)碼中,需要設(shè)計復(fù)雜的算法來確定視頻吞吐率和資源使用率,文獻[22]為研究復(fù)雜應(yīng)用的設(shè)計與優(yōu)化,提出使用HLS技術(shù)進行完整H.264解碼器的案例研究。通過優(yōu)化,在640×480分辨率下實現(xiàn)了34 FPS的吞吐量。在圖形處理中,由于計算較低的內(nèi)存比例和不規(guī)則的數(shù)據(jù)訪問模式,圖形處理通常受內(nèi)存限制。文獻[23]提出一種在HLS技術(shù)中設(shè)計的圖線性代數(shù)疊加層,可以在配備高帶寬內(nèi)存(high bandwidth memory, HBM)的FPGA上實現(xiàn)圖處理工作負載的高效加速。

    通過HLS技術(shù),可以將復(fù)雜的圖像處理算法快速轉(zhuǎn)化為高效的硬件邏輯,并部署在FPGA上,從而顯著提升數(shù)據(jù)處理的速度和效率。然而,HLS技術(shù)在硬件綜合過程中仍面臨影響系統(tǒng)性能的問題,分別為編譯問題、并行問題、訪存問題、易用性問題和可移植性問題。針對這些問題,本文自頂向下分析算法,通過循環(huán)優(yōu)化、數(shù)組重構(gòu)、代碼優(yōu)化等技術(shù),提高硬件綜合效果,減少數(shù)據(jù)傳輸延遲。將加速后的算法封裝為知識產(chǎn)權(quán)(intellectual property, IP)核,提高算法的復(fù)用性和可移植性。

    基于以上分析,本文采用FPGA作為主控制器,搭建高精度位移測量系統(tǒng)。在完成圖像采集后,在FPGA內(nèi)部通過模板匹配、基于灰度質(zhì)心算法等步驟,實現(xiàn)對多光斑峰值的亞像素定位。通過HLS技術(shù),針對上述流程進行硬件加速設(shè)計,大幅度降低算法時延和資源消耗,以滿足更為嚴苛的工業(yè)應(yīng)用需求。

    1 系統(tǒng)原理及總體設(shè)計

    1.1 系統(tǒng)原理

    高精度位移測量系統(tǒng)原理基于三角測量法24-25,其結(jié)構(gòu)如圖1所示。首先,光源發(fā)出的入射光經(jīng)聚光鏡后,出射成為平行光束。平行光束經(jīng)成像系統(tǒng)1和轉(zhuǎn)折反射鏡斜入射在硅片上,形成如圖2所示的光斑標記。標記通過硅片以一定角度反射,被成像系統(tǒng)2放大成像在電荷耦合器件(charge coupled device, CCD)上。圖3為位移測量光路原理圖。硅片高度的偏移與CCD標記的偏移有如下的幾何關(guān)系:

    y=Δhcos θsin2θ=2Δhsin θ(1)

    式中:y為CCD上偏移量;Δh為硅片高度偏移量;θ為入射光與硅片的夾角。根據(jù)式(1)可知,硅片高度的偏移Δh和CCD上標記的偏移y有幾何關(guān)系,當硅片的高度發(fā)生偏移時,標記在CCD上的偏移均會產(chǎn)生相應(yīng)的位移。通過高精度位移算法處理像元中心的偏移可以得到硅片的位移量。

    1.2 算法實現(xiàn)

    高精度位移測量算法的核心是計算CCD探測器上成像光斑的亞像元位置。常見的光斑定位算法有加權(quán)插值法、擬合法、質(zhì)心法、峰值法等26-28。為提升算法的運行效率,本文首先使用模板匹配法對光斑的5個狹縫進行粗定位,再根據(jù)粗定位結(jié)果和光斑信號的相對位置關(guān)系,選取對應(yīng)波形寬度范圍的計算窗口,使用基于灰度的加權(quán)質(zhì)心定位算法進行細定位。結(jié)合粗定位和細定位結(jié)果,可以得到硅片的位移量。

    1.2.1 模板匹配粗定位算法

    光斑標記在CCD上形成的包絡(luò)曲線如圖4所示,根據(jù)兩側(cè)波峰與中間峰的相對位置設(shè)定閾值權(quán)重,從左向右逐像元移動匹配模板的起始位置:

    M=∑ni=1wiri(2)

    式中:M是匹配度;wi是第i個位置的權(quán)重;ri是第i個位置的響應(yīng)值;n是位置的總數(shù)。

    經(jīng)式(2)匹配度公式可以得到包絡(luò)曲線不同位置像元的匹配度,選取匹配度最大的像元坐標作為粗定位的結(jié)果。

    基于灰度質(zhì)心法的原理是通過計算灰度圖片中元素的坐標和對應(yīng)灰度值的乘積之和,以及灰度值的總和,從而確定物體的質(zhì)心坐標。然而,在實際測量中,光斑存在散斑并包含CCD噪聲29-31,直接使用質(zhì)心法會存在一定的計算誤差:

    Xc=∑Si=1xif4(xi)∑Si=1f4(xi)(3)

    式中:Xc是細定位結(jié)果;xi表示圖像中每個像素點的橫縱坐標;S是窗口內(nèi)的像元個數(shù);f(xi)是對應(yīng)于像素點的灰度響應(yīng)值。

    本文使用的加權(quán)質(zhì)心法是質(zhì)心法的進階算法,這種方式更多地受圖像中心信息的影響,從而提高算法的抗干擾能力。如圖4所示,根據(jù)粗定位的結(jié)果和光斑信號的相對位置關(guān)系,選取對應(yīng)波形寬度范圍的計算窗口,通過如式(3)所示的加權(quán)質(zhì)心定位公式得到細定位結(jié)果。

    1.3 算法優(yōu)化

    本算法基于CCD三角測量法,并在質(zhì)心細定位方面進行了優(yōu)化。

    0.2(fmax-fmin)≤f≤0.8(fmax-fmin)(4)

    式中:fmax是窗口內(nèi)最大響應(yīng)值;fmin表示窗口內(nèi)最小響應(yīng)值;f是計算的窗口內(nèi)響應(yīng)值。

    在原始算法的實驗過程中,首先根據(jù)精測窗口范圍內(nèi)響應(yīng)值的最大值fmax和最小值fmin確定數(shù)據(jù)響應(yīng)值范圍。具體而言,僅考慮這一范圍內(nèi)的響應(yīng)而進行質(zhì)心定位計算,如式(4)所示。然后,根據(jù)篩選后的數(shù)據(jù)響應(yīng)值選擇對應(yīng)的像元序號并進行質(zhì)心法的計算。通過這種方法計算得到的重復(fù)精度為10 μm,遠超實際工業(yè)測量需求,導(dǎo)致測量系統(tǒng)設(shè)計復(fù)雜,成本增加。

    鑒于此,本文進一步優(yōu)化算法,對窗口范圍內(nèi)的響應(yīng)值采用改進的基于灰度加權(quán)質(zhì)心法與線性插值32相結(jié)合的定位方法,對窗口范圍內(nèi)的S+1個像元進行m倍的線性插值,最終窗口內(nèi)實際用于計算的像元數(shù)據(jù)個數(shù)為S×m+1,對插值后的窗口內(nèi)數(shù)據(jù)進行基于灰度的加權(quán)質(zhì)心定位:

    Xc=∑Sm+1i=1xif4(xi)∑Sm+1i=1f4(xi)(5)

    式中:Xc是細定位結(jié)果;xi表示圖像中每個像素點的橫、縱坐標;S是窗口內(nèi)的像元個數(shù);f(xi)是對應(yīng)于像素點的灰度響應(yīng)值;m表示線性插值倍數(shù)。

    質(zhì)心定位結(jié)果如式(5)所示,其中權(quán)重定義為fn(xi),通過調(diào)整權(quán)重的指數(shù)n,對算法性能進行了多次優(yōu)化。經(jīng)過一系列仿真軟件實驗測試,綜合考慮算法運行時間、重復(fù)精度以及FPGA資源的使用率,最終確定將n設(shè)為4。這一調(diào)整使得算法能夠在硬件上更高效地實現(xiàn),優(yōu)化了其重復(fù)精度和穩(wěn)定性。

    1.4 硬件電路設(shè)計

    高精度位移測量系統(tǒng)開發(fā)平臺采用核心版加擴展版的模式,設(shè)計的硬件平臺如圖5所示。為提升系統(tǒng)的可擴展性,其內(nèi)部包含6套獨立的線陣CCD探頭。為提高數(shù)據(jù)傳輸效率,主控芯片選用Kintex 7系列作為主控制器。線陣CCD通過高速串行總線33向FPGA發(fā)送圖像數(shù)據(jù),并將數(shù)據(jù)存儲到雙口隨機存儲器中。FPGA內(nèi)部對雙口存儲器中的圖像數(shù)據(jù)峰值進行基于灰度的加權(quán)質(zhì)心定位計算,計算結(jié)果通過數(shù)模轉(zhuǎn)換芯片34-35轉(zhuǎn)換為模擬量并輸入上位機,6套線陣CCD、光源設(shè)置、相機設(shè)置、算法參數(shù)統(tǒng)一接受串口36通信處理解析上位機的控制指令。

    2 硬件加速設(shè)計

    傳統(tǒng)的硬件加速優(yōu)化方式,例如FPGA+DSP和軟硬件協(xié)同等方式設(shè)計復(fù)雜、耗時長、調(diào)試難度大,不利于進行快速開發(fā)。通過HLS技術(shù)創(chuàng)建新方案,使用優(yōu)化指令(如流水化和數(shù)組重構(gòu)等)對算法進行硬件加速,從而減少設(shè)計復(fù)雜度并實現(xiàn)快速迭代開發(fā),滿足期望的面積和性能目標。

    在使用HLS技術(shù)對算法進行優(yōu)化的過程中,需要綜合考慮面積和時延兩個方面的指標。面積是算法硬件資源37的使用量,包括塊狀隨機訪問存儲器(block" random access memory, BRAM)、DSP、觸發(fā)器(flip flop, FF)和查找表(look up table, LUT)。時延包括最小和最大時延值,表示執(zhí)行循環(huán)所需的時鐘周期數(shù)。在綜合報告中,Vivado HLS工具會提供資源的消耗和時延的理論值。通常情況下,面積與時延成反比關(guān)系,所以需要在兩者之間進行權(quán)衡,找到最佳方案。本文提供循環(huán)優(yōu)化、數(shù)組優(yōu)化和代碼優(yōu)化等策略,在提升算法性能的同時實現(xiàn)了硬件資源的高效利用。

    2.1 循環(huán)優(yōu)化

    調(diào)焦算法結(jié)構(gòu)由模板粗匹配和細匹配組成,自頂向下進行分析。未經(jīng)優(yōu)化前,調(diào)焦算法的計算最大時延為21 308個時鐘周期,其中模板粗匹配的最大時延和最小時延均為2 084個時鐘周期,占據(jù)調(diào)焦算法總時延的9.8%,并且粗匹配模塊內(nèi)部結(jié)構(gòu)簡潔且易于分析,現(xiàn)首先分析粗匹配模塊。

    時延主要來源于兩個方面,一是分配數(shù)組空間,二是循環(huán)結(jié)構(gòu)的執(zhí)行。在粗匹配函數(shù)的計算中,初始化一個長度為2 048的無符號整型數(shù)組,需要執(zhí)行2 048次運算,其直接關(guān)聯(lián)到數(shù)據(jù)存儲和訪問模式。在FPGA等硬件上進行實現(xiàn)時,數(shù)組常被映射到硬件資源上,如寄存器或隨機訪問存儲器(random access memory, RAM)。對寄存器和RAM進行合理的數(shù)組空間的分配,對于削減時延和提高資源的使用效率有顯著的影響。針對這一問題,首先對數(shù)組初始化做靜態(tài)關(guān)鍵字約束,將其初始化為具體的值。靜態(tài)數(shù)組的值在編譯時就已確定,所以在FPGA進行綜合時,Vivado HLS工具可以直接將靜態(tài)數(shù)據(jù)燒錄進FPGA的比特流中,硬件可以直接訪問這些數(shù)據(jù),無需通過外部接口進行數(shù)據(jù)傳輸,從而提高算法的處理速度。

    表1和表2分別給出了使用靜態(tài)關(guān)鍵字優(yōu)化前后算法的性能和資源利用率比較。根據(jù)表1和表2數(shù)據(jù)可知,優(yōu)化前后最小時延和間隔從8 485個時鐘周期降低到4 118個時鐘周期,降幅達到51.4%。最大時延和間隔也從32 294個時鐘周期降低到27 927個時鐘周期,降幅為13.5%。從資源利用情況來看,BRAM的使用從12個單位降低到10個單位,減少了16.7%。FF的使用量從9 756減少到8 927,降低了8.5%。LUT的使用量從16 711降到16 233,減少了2.9%。DSP的使用量則保持不變。通過對算法進行靜態(tài)關(guān)鍵字優(yōu)化,不僅顯著提升算法的處理速度,降低時間延遲,還可有效地提高硬件資源的使用效率,達到性能與資源雙重優(yōu)化的目標。

    其次,對循環(huán)內(nèi)部的并行性進行探索并分析。粗匹配的核心是進行模板匹配,通過與模板數(shù)據(jù)進行乘法和加法運算,得到每個位置上的匹配度,選取匹配度最高的位置為中心位置。如圖6所示,算法輸入被實現(xiàn)為雙端口RAM,通過HLS技術(shù)優(yōu)化硬件電路,將一次循環(huán)分成多個周期執(zhí)行,將每次的乘加操作結(jié)果放入寄存器中,減少多個運算器的串聯(lián)操作。雙端口RAM在一個周期內(nèi)只能讀取2個數(shù)據(jù),所以單次循環(huán)至少需要5個時鐘周期。相比軟件的加法器串聯(lián)執(zhí)行,此方法減少了算法的運行時延,實現(xiàn)了硬件電路的加速優(yōu)化。

    在硬件實現(xiàn)中,循環(huán)結(jié)構(gòu)可能導(dǎo)致流水線阻塞和數(shù)據(jù)依賴,從而增加總體時延。如圖7所示,每次循環(huán)迭代需要進行數(shù)據(jù)讀取、數(shù)據(jù)計算、數(shù)據(jù)寫入的操作,迭代間隔(initia tion interval, II)為3個時鐘周期。由于沒有進行流水化操作,每次循環(huán)迭代都需要等待前一次寫入操作的完成。這樣3次循環(huán)需要9個時鐘周期。使用流水化指令進行優(yōu)化,在上一個循環(huán)進行計算操作時既可以進行第2個循環(huán)的數(shù)據(jù)讀入,II為1個時鐘周期。以此類推,3次循環(huán)僅需要5個時鐘周期,大大降低了算法時延,提高了吞吐量。

    同理,對于細定位函數(shù)的優(yōu)化也同樣做流水化處理。細定位算法的核心為加權(quán)質(zhì)心法,通過計算采樣點的信號強度與其位置的加權(quán)平均,計算得出亞像元坐標。該方法的基本原理是將每個采樣點的信號強度作為權(quán)重,將位置作為加權(quán)因子,進而通過計算得到質(zhì)心。其代碼實現(xiàn)需要進行累加操作,即需要對某一寄存器進行讀取和寫入,此操作會導(dǎo)致數(shù)據(jù)依賴的問題。數(shù)據(jù)依賴38分為3種類型:讀后寫(read after write, RAW)、寫后讀(write after read, WAR)和寫后寫(write after write, WAW),對這些依賴關(guān)系的識別和處理是實現(xiàn)有效流水線的關(guān)鍵。本算法中的累加操作即RAW問題,在第1次寫入完成之前無法進行第2次讀取,每次循環(huán)迭代中的運算都指向不同的地址,但是每次迭代對寄存器的累加操作都只能同時針對1個地址,所以無法使用流水化展開循環(huán)。

    表3和表4分別給出了循環(huán)流水優(yōu)化前后算法性能和資源利用率比較。根據(jù)表3和表4數(shù)據(jù)可知,優(yōu)化后,最小時延和間隔從4 118個時鐘周期降低到872個時鐘周期,減少了82.8%;最大時延和間隔從27 927個時鐘周期降低到5 540個時鐘周期,減少了80.2%。資源的使用率也相應(yīng)增加,DSP數(shù)量從27增加到49,增加了81.5%;FF的使用量從8 927增加到13 761,增加了54.3%;LUT從16 233增加到21 273,增加了31.1%。這表明循環(huán)流水優(yōu)化在顯著提升算法執(zhí)行速度的同時,也出現(xiàn)了對硬件資源的更高需求。這種優(yōu)化策略在設(shè)計時需要權(quán)衡性能提升與資源消耗雙重目標,尤其是在資源受限的環(huán)境中,需要進行更細致的資源管理和優(yōu)化策略調(diào)整。

    2.2 數(shù)組優(yōu)化

    在使用Vivado HLS工具進行硬件綜合時,數(shù)組被實現(xiàn)為雙端口RAM,由于RAM端口大小的約束,讀寫操作在1個時鐘周期內(nèi)至多完成2次。由于優(yōu)化操作需要展開循環(huán),在一個時鐘周期內(nèi)需要對內(nèi)存進行多次讀/寫,所以數(shù)組資源受到限制。讀寫端口數(shù)量不夠,無法使II等于1個時鐘周期,不能達到理想要求。本文使用數(shù)組降維的方式解決內(nèi)存瓶頸,即采用塊分割、循環(huán)分割以及完全分割等方式分割數(shù)組。分割方式如圖8所示,分別有0~N-1個數(shù)組塊。塊分割是將數(shù)組按照分割的塊數(shù)順序放入不同的塊RAM中,一個塊RAM放滿,才會放入下一個塊。循環(huán)分割是將原數(shù)組數(shù)據(jù)以交叉分割的方式存儲在若干個塊RAM中。完全分割是將原數(shù)組數(shù)據(jù)存放在寄存器中,能同時獲取多個數(shù)據(jù),比較適合較小的數(shù)組。

    表5和表6分別給出了數(shù)組優(yōu)化前后算法的性能和資源利用率比較。根據(jù)數(shù)組優(yōu)化前后的數(shù)據(jù)可知,算法性能在延遲和間隔方面實現(xiàn)了微小的改進,最小和最大時延分別降低了1.6%和0.4%,而在邏輯資源方面有大幅增加。這表明數(shù)組優(yōu)化策略在提升算法時延能力的同時,極大地依賴于更復(fù)雜的邏輯資源。

    在上文中提到的粗匹配中,模板匹配算法需要5個時鐘周期才能完成一次循環(huán)的操作,從中可以看出,一個時鐘周期只能從RAM中讀取兩個數(shù)據(jù),若需要將其進行流水化操作,需要對輸入的數(shù)組進行數(shù)組重構(gòu)指令操作,以提高數(shù)據(jù)訪問并行度和效率。使用HLS技術(shù)中的重構(gòu)指令將圖像數(shù)據(jù)分別存儲到2 048個寄存器中,每個時鐘周期能同時獲取2 048個數(shù)據(jù)進行運算,達到II為1個時鐘周期的目的,從而綜合算法時延相較上一方案最多降低20個時鐘周期,但同時會導(dǎo)致LUT和FF的數(shù)量增加193%。由于時延的減少是通過增加資源面積來換取的,兩者為負相關(guān)的關(guān)系,所以在時延和面積之間存在一個平衡點,這個平衡點即為最佳優(yōu)化點。

    2.3 代碼優(yōu)化

    2.3.1 雙緩沖策略

    為了解決上文中提到的累加器無法進行流水化操作、循環(huán)迭代次數(shù)無法在編譯時確定的問題,本文采用乒乓緩沖區(qū)策略來提高數(shù)據(jù)處理的并行度。該策略設(shè)計兩個獨立的緩沖區(qū),交替用于數(shù)據(jù)的讀取和處理。當一個緩沖區(qū)執(zhí)行數(shù)據(jù)運算時,另一個緩沖區(qū)則同時加載數(shù)據(jù)。這種交替使用緩沖區(qū)的方法不僅有效地解決了因數(shù)據(jù)依賴性而導(dǎo)致的處理延遲,還極大地提高了算法的資源使用率。在數(shù)據(jù)處理過程中,一旦一個緩沖區(qū)完成了數(shù)據(jù)的處理,就可以立即接收新的數(shù)據(jù),而不需要等待整個數(shù)據(jù)處理周期的完成。通過并行化數(shù)據(jù)的讀取和處理操作,使得數(shù)據(jù)流在硬件資源中的持續(xù)流動成為可能,從而實現(xiàn)更高效的數(shù)據(jù)重用和加速整體的處理速度。

    2.3.2 移位操作的應(yīng)用

    移位操作是一種在二進制數(shù)中左移位或右移位的操作,可以用來進行乘法和除法的近似計算。在硬件實現(xiàn)中,移位操作比乘法操作速度更快,因為其可以通過簡單的位移和加法運算來完成,而不需要復(fù)雜的邏輯門陣列。同時,移位操作只需單周期即可完成,可以顯著降低對LUT和其他邏輯資源的消耗。本文將模板匹配算法中的乘法換為移位操作,通過將輸入信號數(shù)組中的值左移特定的位數(shù),并將其加入到臨時變量中,可以模擬乘法操作。這種方法不僅提高了執(zhí)行效率,還節(jié)省了硬件資源,從而實現(xiàn)硬件加速。

    表7和表8分別給出了代碼優(yōu)化前后算法的性能和資源利用率比較。通過對表7和表8的分析可知,雖然代碼優(yōu)化為算法的時延和間隔僅帶來了微小的提升,但是在資源利用率方面卻帶來了顯著的優(yōu)化,其中FF從46 909降至27 552,減少了41.3%,LUT從180 172降至117 682,減少了34.7%??紤]到高精度位移測量系統(tǒng)對數(shù)據(jù)量和實時性的高要求,在優(yōu)化過程中以滿足性能要求為重中之重,在可接受的范圍內(nèi)允許適當增加資源利用率。因此,采用HLS技術(shù)設(shè)計的模塊符合要求。

    2.4 小結(jié)

    本文通過Vivado HLS工具,將高級語言編譯為硬件代碼,有效解決了編譯問題、并行問題、訪存問題以及易用性和可移植性問題。

    2.4.1 編譯問題

    本文通過設(shè)計空間探索算法和剪枝技術(shù)解決編譯問題,利用Vivado HLS工具將C++語言編譯轉(zhuǎn)化為硬件語言,實現(xiàn)代碼的自動重構(gòu)39,并在不同的編譯指導(dǎo)組合下探索資源和性能的平衡。設(shè)計空間探索算法,自頂向下出發(fā),分析嵌套循環(huán)結(jié)構(gòu),設(shè)定不同的優(yōu)化組合,在進行硬件綜合后通過編譯生成的報告不斷評估資源消耗與時延,找到最佳的時延和資源的平衡方案。

    2.4.2 并行問題

    由于FPGA具有天然的并行性,因此在整體資源有限的情況下,可通過增加多個并行模塊來提高對計算資源的利用率。本文使用HLS技術(shù)中的流水化指令對循環(huán)進行流水化,將每個循環(huán)迭代分解為多級流水線,以提高并行度。循環(huán)次數(shù)指令對未知循環(huán)次數(shù)確定循環(huán)上限。此外,通過數(shù)據(jù)流指令允許函數(shù)級別的流水化操作,使得多任務(wù)能夠并行執(zhí)行。通過分析頂層函數(shù)及其子函數(shù),確保整個系統(tǒng)具備高度的并行處理能力,實現(xiàn)任務(wù)級并行。

    2.4.3 訪存問題

    為提升FPGA訪存資源使用率,本文采用一維和多維數(shù)據(jù)分割策略,使得數(shù)據(jù)能夠分布在盡可能多的內(nèi)存塊中,以空間為代價降低時間消耗。常見的數(shù)據(jù)分割方法包括塊分割、循環(huán)分割和安全分割。本文還引入了雙緩沖策略和移位操作,通過優(yōu)化片上內(nèi)存,提高數(shù)據(jù)處理的并行度,實現(xiàn)內(nèi)存的合理分配。此外,流水化指令對片上內(nèi)存進行的流水化操作有效提高了訪存效率,并在不同的優(yōu)化組合下保持訪存性能的穩(wěn)定性。

    2.4.4 易用性和可移植性

    易用性和可移植性問題通過模塊化和可復(fù)用設(shè)計得到解決。Vivado HLS工具的IP核可被集成到不同項目的硬件代碼中,并借助邏輯分析器或虛擬輸入輸出組件進行硬件內(nèi)部測試。同時,通過HLS技術(shù)將高級語言(C/C++)編譯為FPGA硬件描述語言,降低了硬件設(shè)計的復(fù)雜度,使得不熟悉Verilog等硬件語言的工程師也能進行FPGA設(shè)計,同時使硬件IP核具備了快速適應(yīng)不同項目需求的可移植性和靈活性。

    3 測試及驗證

    3.1 時延測試

    3.1.1 時延測試方法

    本研究利用Xilinx Kintex 7 FPGA作為主控模塊,驗證算法在實際硬件上的性能。整個開發(fā)和測試均在Vivado 2018.3和Vivado HLS 2018.3平臺上進行,系統(tǒng)的工作頻率設(shè)定為100 Hz。如圖9所示,測試平臺包括光源、光纖、光學(xué)探測模塊和主控模塊等組件。在實驗中,光源發(fā)射的光束經(jīng)光纖傳輸至光學(xué)探測模塊。在光學(xué)探測模塊內(nèi),硅片位置的變化導(dǎo)致其反射的調(diào)焦標記在探測器上產(chǎn)生位移,該位移通過主控模塊進行分析,從而計算出硅片的實際位移量,計算公式如下:

    Time=apdone-apstart(6)

    式中:Time是算法運行時間;apdone是算法結(jié)束時間;apstart是算法開始時間。

    為了確保數(shù)據(jù)的準確性,使用示波器監(jiān)測和記錄算法處理的開始與結(jié)束信號,進一步通過式(6)計算處理時間,確保實驗數(shù)據(jù)的可靠性和實驗的可重復(fù)性。

    FPGA通過線陣CCD捕獲大小為2 048×16比特的圖片數(shù)據(jù),并使用HLS技術(shù)進行圖像數(shù)據(jù)處理和硬件加速設(shè)計。經(jīng)過處理,系統(tǒng)計算得到的硅片位移量為24.25 nm,與仿真軟件前期驗證的計算結(jié)果一致,證明算法輸出結(jié)果正確。將Vivado HLS工具中驗證的算法封裝為IP核,并在Vivado中進行實例化。通過包括仿真、綜合、布局布線在內(nèi)的一系列步驟,最終生成比特流并燒錄到板卡中,完成了板級驗證。在實驗中,使用捕獲算法的開始和結(jié)束信號,通過式(6)計算得到算法的運行時間Time。

    3.1.2 時延測試結(jié)果

    示波器測量結(jié)果顯示,基于HLS技術(shù)的高精度位移測量系統(tǒng)處理一幅圖像所需的時間約為91.8 μs。在未進行優(yōu)化之前,該高精度位移算法的處理時延為424.67 μs。優(yōu)化后,處理時延顯著減少至91.8 μs,降低了332.87 μs。使用Vivado HLS工具進行硬件綜合后,軟件提供了算法各函數(shù)模塊的運行時間在優(yōu)化前后的詳細對比,其中粗定位函數(shù)的時延從2 048個時鐘周期大幅降低至僅19個時鐘周期,降幅達到了99.07%,而細定位函數(shù)的時延也從20 086個時鐘周期減少至3 717個時鐘周期,降幅為81.5%。這種優(yōu)化顯著提高了各函數(shù)的執(zhí)行速度,并極大地增強了系統(tǒng)的響應(yīng)能力和處理效率。對實時圖像處理系統(tǒng)而言,這樣的優(yōu)化能夠在更短的時間內(nèi)完成相同的任務(wù),從而降低了系統(tǒng)的整體能耗,有效改善了系統(tǒng)的性能。

    3.2 重復(fù)精度和穩(wěn)定性測試

    3.2.1 重復(fù)精度和穩(wěn)定性測試方法

    良好的重復(fù)精度和穩(wěn)定性是進行高精度位移測量的基本要求。為此,本研究采用高精度位移測量算法對靜止硅片進行連續(xù)的測量實驗,實驗分別持續(xù)30 s和30 min,以評估系統(tǒng)在短期和長期運行條件下的性能。在相同的環(huán)境條件和設(shè)備設(shè)施下,短時測量(30 s)主要用于評估重復(fù)精度,通過計算測量數(shù)據(jù)的3倍標準差來定量表達。長時測量(30 min)用于評估系統(tǒng)的穩(wěn)定性,同樣采取3倍標準差作為穩(wěn)定性的指標。所有測量數(shù)據(jù)均由高精度位移測量系統(tǒng)自動記錄并直接輸出位置坐標。在數(shù)據(jù)收集完成后,利用仿真軟件對結(jié)果進行分析,以確保分析的準確性和可靠性。

    3.2.2 重復(fù)精度和穩(wěn)定性測試結(jié)果

    基于上述測量數(shù)據(jù),繪制兩組不同時間段下硅片位移波動的曲線圖,如圖10所示。從圖10可以看出,硅片位移的動態(tài)變化,為評估系統(tǒng)的測量性能提供了直接的視覺效應(yīng)。

    根據(jù)表9的統(tǒng)計結(jié)果,可以看出系統(tǒng)在不同時間尺度上的重復(fù)精度和穩(wěn)定性。在短時測量中,系統(tǒng)的3倍標準差為44.44 nm,遠低于100 nm,表明系統(tǒng)具有極高的測量精度。對于長時測量,3倍標準差為49.20 nm,同樣遠低于500 nm的穩(wěn)定性閾值。統(tǒng)計結(jié)果不僅驗證了位移測量系統(tǒng)的高精度和穩(wěn)定性,而且通過連續(xù)和長期測量展示了系統(tǒng)對環(huán)境或操作變化的健壯性。

    3.3 線性度測試

    本實驗采用線性度測試評估高精度位移測量系統(tǒng)的性能。線性度指測量系統(tǒng)在測量范圍內(nèi),輸出量與輸入量之間呈線性關(guān)系的程度,通常用來衡量系統(tǒng)的輸出與理想線性關(guān)系之間的偏離程度,計算公式如下:

    y^=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2x+y--∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2x-(7)

    式中:y^是預(yù)測值;xi是第i個觀測值的自變量;yi是第i個觀測值的因變量;x-和y-分別為所有xi和yi的平均值。

    在測試中,為確保測量系統(tǒng)的準確性,上位機控制位移臺以±140 nm的量程進行等間距移動,總共移動10步,每步停留1 s,以確保測量的準確性。在此過程中,共采集11 000張圖片,通過高精度位移測量系統(tǒng)實時計算并記錄硅片的位置數(shù)據(jù)。經(jīng)FPGA處理后,將位移結(jié)果通過串口傳至上位機,進行進一步的數(shù)據(jù)分析。硅片位移波動的結(jié)果如圖11所示。對于數(shù)據(jù)分析,本實驗采用式(7)擬合出預(yù)測的位移曲線y^,并將擬合曲線與實測曲線進行比較,如圖12所示。

    高精度位移算法的計算公式如下:

    r=MAX{|y^-y|}L×100%(8)

    式中:y是第i個觀測值的實際值;L是量程大小;r是線性度。

    利用式(8)計算出高精度位移算法的線性度為0.503‰,遠低于0.1%的允許偏差,證明了系統(tǒng)在測試范圍內(nèi)具有良好的線性度。這一結(jié)果不僅證實了系統(tǒng)的高精確度,也顯示了其在實際應(yīng)用中的可靠性。

    3.4 不同架構(gòu)時間性能對比

    在高精度位移測量算法的實際應(yīng)用中,F(xiàn)PGA利用HLS技術(shù)定制數(shù)據(jù)通路,從而在硬件層面上實現(xiàn)了復(fù)雜的控制和數(shù)據(jù)處理,這種定制化的數(shù)據(jù)通路能夠顯著減少FPGA的算法響應(yīng)時間,在處理效率上具有顯著優(yōu)勢。相比之下,盡管DSP在執(zhí)行標準的線性代數(shù)運算和信號過濾任務(wù)時擁有強大的計算能力,但其高性能主要依賴多核的并行化處理。然而,多核處理的需求增加了核間通訊的處理時延,特別是在處理多幅圖像的位移檢測任務(wù)時,這在極大程度上限制了DSP的性能。

    此外,DSP雖然具有成熟的開發(fā)環(huán)境和測試工具,便于快速部署算法,但是在硬件層面定制化能力有限。同時,DSP的研發(fā)周期較長,研發(fā)成本高,需要有經(jīng)驗的工程師進行測試以維護異構(gòu)平臺的穩(wěn)定性。相比之下,基于HLS技術(shù)的開發(fā)不僅能夠充分利用FPGA的并行性,提高圖像處理的性能,而且可通過不同約束方案的協(xié)同仿真來優(yōu)化時延,提供了高效的開發(fā)流程。在工程中可進行IP核的多次例化,大大提高了開發(fā)效率,保證了算法的可移植性和靈活性。

    為了進行不同系統(tǒng)間性能的比較,本實驗在具有1 GHz主頻的DSP中實現(xiàn)了與FPGA相同參數(shù)位寬的高精度位移測量算法。該DSP在Code Composer Studio開發(fā)環(huán)境下運行。FPGA和DSP在時間性能上的對比如表10所示,盡管FPGA的工作頻率較低,但其處理時間顯著優(yōu)于DSP,僅需91.8 μs,而DSP的處理時間為400 μs,相比之下,F(xiàn)PGA的處理時延縮短了308.2 μs。

    盡管DSP擁有顯著的計算能力和工作頻率,但面對需要迅速開發(fā)和高效算法實現(xiàn)的應(yīng)用時,基于HLS的FPGA在硬件加速、開發(fā)效率提升、資源成本控制等方面提供了更優(yōu)的解決方案。FPGA不僅能夠縮短項目研發(fā)周期,還能有效降低開發(fā)成本,優(yōu)化整體性能。這一優(yōu)勢使FPGA成為對性能和響應(yīng)時間有嚴格要求的高精度位移測量應(yīng)用的更佳選擇。

    4 結(jié) 論

    本文根據(jù)實際應(yīng)用需求,使用FPGA作為主控制器,通過HLS技術(shù)的循環(huán)流水優(yōu)化、數(shù)組重構(gòu)、代碼優(yōu)化等步驟,完成了高精度位移測量算法的硬件加速設(shè)計。通過實驗,對高精度位移測量算法運算時間進行驗證,實驗結(jié)果表明算法時延達到91.8 μs,與未進行優(yōu)化相比,其處理時延降低了332.87 μs,與DSP技術(shù)相比,其實現(xiàn)效率提高了78.6%。硬件加速后,算法的重復(fù)精度為44.44 nm,穩(wěn)定性為49.20 nm,線性度為0.503‰,線性度在偏差范圍內(nèi),驗證了系統(tǒng)良好的重復(fù)精度和穩(wěn)定性。所提方法有效提升了數(shù)據(jù)處理效率,具有實時性高、設(shè)計難度低、靈活性強的特點,可以滿足實際應(yīng)用需求。

    參考文獻

    [1]李清泉, 陳睿哲, 涂偉, 等. 基于慣性相機的大跨度橋梁線形形變實時測量方法[J]. 武漢大學(xué)學(xué)報, 2023, 48(11): 1834-1843.

    LI Q Q, CHEN R Z, TU W, et al. Real time vision based deformation measurement of long span bridge with inertial sensors[J]. Geomatics and Information Science of Wuhan University, 2023, 48(11): 1834-1843.

    [2]丁孺琦, 王振, 程敏, 等. 基于模型控制的液壓機械臂高精度軌跡跟蹤[J]. 機械工程學(xué)報, 2023, 59(14): 298-309.

    DING R Q, WANG Z, CHENG M, et al. Model based control of the hydraulic manipulator for the high precision trajectory tracking[J]. Journal of Mechanical Engineering, 2023, 59(14): 298-309.

    [3]GAO W, KIM S W, BOSSE H, et al. Measurement technologies for precision positioning[J]. CIRP Annals, 2015, 64(2): 773-796.

    [4]楊宏興, 付海金, 胡鵬程, 等. 超精密高速激光干涉位移測量技術(shù)與儀器[J]. 激光與光電子學(xué)進展, 2022, 59(9): 305-319.

    YANG H X, FU H J, HU P C, et al. Ultra precision and high speed laser interferometric displacement measurement technology and instrument[J]. Laser Optoelectron Progress, 2022, 59(9): 305-319.

    [5]GEORGIS G, LENTARIS G, REISIS D. Acceleration techniques and evaluation on multi core CPU, GPU and FPGA for image processing and super resolution[J]. Journal of Real Time Image Processing, 2019, 16(4): 1207-1234.

    [6]NAZ N, MALIK H A, KHURSHID A B, et al. Efficient processing of image processing applications on CPU/GPU[J]. Mathe matical Problems in Engineering, 2020, 2020(1): 4839876.

    [7]譚鵬源, 薛長斌, 周莉. 基于嵌入式 CPU+GPU異構(gòu)平臺的遙感圖像濾波加速[J]. 空間科學(xué)學(xué)報, 2024, 44(1): 95-102.

    TAN P Y, XUE C B, ZHOU L. Acceleration of remote sensing image filtering based on embedded CPU+GPU heterogeneous platform[J]. Chinese Journal of Space Science, 2024, 44(1): 95-102.

    [8]HUANG F, CHEN S Y, WANG Q, et al. Using deep learning in an embedded system for real time target detection based on images from an unmanned aerial vehicle: vehicle detection as a case study[J]. International Journal of Digital Earth, 2023, 16(1): 910-936.

    [9]WOJENSKI A, ZBROSZCZYK H, KRUSZEWSKI M, et al. Hardware acceleration of complex HEP algorithms with HLS and FPGAs: methodology and preliminary implementation[J]. Computer Physics Communications, 2024, 295: 108997.

    [10]趙鵬, 程光, 趙德宇. 基于 FPGA 的高性能可編程數(shù)據(jù)平面研究綜述[J]. 軟件學(xué)報, 2023, 34(11): 5330-5354.

    ZHAO P, CHENG G, ZHAO D Y. Survey on FPGA based high performance programmable data plane[J]. Journal of Software, 2023, 34(11): 5330-5354.

    [11]ASANO S, MARUYAMA T, YAMAGUCHI Y. Performance comparison of FPGA, GPU and CPU in image processing[C]∥Proc.of the IEEE International Conference on Field Progra mmable Logic and Applications, 2009: 126-131.

    [12]李博杰. 基于可編程網(wǎng)卡的高性能數(shù)據(jù)中心系統(tǒng)[D]. 合肥: 中國科學(xué)技術(shù)大學(xué), 2019.

    LI B J. High performance data center systems with programmable network interface cards[D]. Hefei: University of Science and Technology of China, 2019.

    [13]SRIDHARAN S, DURANTE P, FAERBER C, et al. Accele rating particle identification for high speed data filtering using OpenCL on FPGAs and other architectures[C]∥Proc.of the IEEE 26th International Conference on Field Programmable Logic and Applications, 2016.

    [14]周全. 基于FPGA和DSP架構(gòu)的實時高速圖像處理系統(tǒng)的硬件平臺設(shè)計[D]. 重慶: 重慶理工大學(xué), 2016.

    ZHOU Q. The hardware platform design of high speed real time image processing system based on DSP and FPGA[D]. Chongqing: Chongqing University of Technology, 2016.

    [15]LI Y, ZHAO X D, CHENG T R. Heterogeneous computing platform based on CPU+FPGA and working modes[C]∥Proc.of the IEEE 12th International Conference on Computational Intelligence and Security, 2016: 669-672.

    [16]YANG Z P, JI S X, CHEN X Z, et al. Challenges and opportunities to enable large scale compuating via heterogeneous chiplets[C]∥Proc.of the 29th Asia and South Pacific Design Automation Conference, 2024: 765-770.

    [17]HAJIRASSOULIHA A, TABERNER A J, NASH M P, et al. Suitability of recent hardware accelerators (DSPs, FPGAs, and GPUs) for computer vision and image processing algorithms[J]. Signal Processing: Image Communication, 2018, 68: 101-119.

    [18]趙子豪, 駱冬根, 路美娜, 等. 基于SOPC的檢焦圖像實時處理系統(tǒng)設(shè)計[J]. 電子測量技術(shù), 2022, 45(9): 31-37.

    ZHAO Z H, LUO D G, LU M N, et al. Design of real time processing system of focus detection image based on SOPC[J]. Electric Measurement Technology, 2024, 45(9): 31-37.

    [19]SU S F, CHANG M W. Adaptive neural acceleration unit based on heterogeneous multicore hardware architecture FPGA and software defined hardware[J]. Journal of the Chinese Institute of Engineers, 2024, 47(3): 337-350.

    [20]徐誠, 郭進陽, 李超, 等. 使用HLS開發(fā)FPGA異構(gòu)加速系統(tǒng): 問題、優(yōu)化方法和機遇[J]. 計算機科學(xué)與探索, 2023, 17(8): 1729-1748.

    XU C, GUO J Y, LI C, et al. Using HLS to develop FPGA hetero geneous acceleration system: problems, optimization methods and opportunities[J]. Journal of Frontiers of Computer Science amp; Technology, 2023, 17(8): 1729-1748.

    [21]SOHRABIZADEH A, WANG J, CONG J. End to end optimization of deep learning applications[C]∥Proc.of the ACM/SIGDA International Symposium on Field Programmable Gate Arrays, 2020: 133-139.

    [22]LIU X H, CHEN Y, NGUYEN T, et al. High level synthesis of complex applications: an H. 264 video decoder[C]∥Proc.of the ACM/SIGDA International Symposium on Field Programmable Gate Arrays, 2016: 224-233.

    [23]HU Y W, DU Y X, USTUN E, et al. GraphLily: accelerating graph linear algebra on HBM equipped FPGAs[C]∥Proc.of the IEEE/ACM International Conference on Computer Aided Design, 2021.

    [24]LIANG X R, ZENG J S, GUO X, et al. Optimization of laser spot center detection based on laser triangulation[C]∥Proc.of the 3rd International Conference on Optics and Image Processing, 2023.

    [25]倪沛東. 基于激光三角法的目標位移測量方法及系統(tǒng)設(shè)計[D]. 太原: 中北大學(xué), 2023.

    NI P D. Target displacement measurement method and system design based onlaser triangulation[D]. Taiyuan: North University of China, 2023.

    [26]ZHANG Q J, ZHAO Y H. Measurement method of laser spot center based on weight interpolation algorithm[J]. Laser amp; Infrared, 2016, 46(1): 81-84.

    [27]XIAO M F, ZHANG Y M, LI H. High precision spot position ing algorithm based on four quadrant detector[C]∥Proc.of the Journal of Physics: Conference Series, 2020, 1633(1): 012122.

    [28]ZHOU P, WANG X Q, HUANG Q Y, et al. Laser spot center detection based on improved circled fitting algorithm[C]∥Proc.of the 2nd IEEE Advanced Information Management, Communicates, Electronic and Automation Control Confe rence, 2018: 316-319.

    [29]ZENG K, LI Y L, XIONG Y Z. A signal denoising system for CCD spectrometer based on FPGA[C]∥Proc.of the 4th International Conference on Signal Processing and Computer Science, 2023, 12970: 455-462.

    [30]GAO R H, LIU H S, ZHAO Y, et al. High precision laser spot center positioning method for weak light conditions[J]. Applied Optics, 2020, 59(6): 1763-1768.

    [31]ZHAO H L, WANG S Z, SHEN W, et al. Laser spot centering algorithm of double area shrinking iteration based on baseline method[J]. Applied Sciences, 2022, 12(21): 11302.

    [32]XU P F, JIA Y J. SNR improvement based on piecewise linear interpolation[J]. Journal of Electrical Engineering, 2021, 72(5): 348-351.

    [33]BAILEY D G. Design for embedded image processing on FPGAs[M]. New Jersey: Wiley, 2023.

    [34]PENG X X, TANG Y, LI J F, et al. FPGA based CCD signal acquisition and transmission system design[J]. Scientific Reports, 2024, 14(1): 1855.

    [35]BOYLE S, GUNDERSON A, ORLANDIC M. High level FPGA design of deep learning hyperspectral anomaly detection[C]∥Proc.of the IEEE Nordic Circuits and Systems Conference, 2023.

    [36]SHAO Z Y. An FPGA based adaptive solution for synchronous configuration in UART communication[J]. Highlights in Science, Engineering and Technology, 2024, 81: 615-622.

    [37]NOROUZI M, ILIAS Q, JANNESARI A, et al. Accelerating data dependence profiling with static hints[C]∥Proc.of the 25th International Conference on Parallel and Distributed Computing, 2019: 17-28.

    [38]李朝帥. 面向多分支語句的自動重構(gòu)方法研究[D]. 石家莊: 河北科技大學(xué), 2024.

    LI Z S. An automated refactoring approach for multi branch statement[D]. Shijiazhuang: Hebei University of Science and Technology, 2024.

    作者簡介

    陳昊然(2000—),女,碩士研究生,主要研究方向為圖像采集及數(shù)據(jù)處理。

    王天昊(1999—),男,碩士研究生,主要研究方向為視、聽覺信息處理、模式識別。

    路美娜(1986—),女,副研究員,碩士,主要研究方向為光電遙感。

    宋茂新(1983—),男,研究員,博士,主要研究方向為光機設(shè)計。

    羅 環(huán)(1994—),女,工程師,碩士,主要研究方向為嵌入式軟件開發(fā)。

    吳曉宇(1998—),女,碩士研究生,主要研究方向為光機設(shè)計。

    駱冬根(1979—),男,副研究員,博士,主要研究方向為光電檢測、偏振光學(xué)遙感。

    裘楨煒(1982—),男,研究員,博士,主要研究方向為空間光學(xué)偏振遙感、大氣氣溶膠探測。

    猜你喜歡
    現(xiàn)場可編程門陣列
    基于機器人的溫室大棚環(huán)境智能監(jiān)控系統(tǒng)
    一種PCI接口AFDX端系統(tǒng)模塊的設(shè)計與實現(xiàn)
    D—BLAST基帶系統(tǒng)的FPGA實現(xiàn)研究
    移動通信(2016年20期)2016-12-10 09:33:12
    雙目立體匹配算法的FPGA實現(xiàn)
    任務(wù)間通訊郵箱的硬件實現(xiàn)
    一種千兆以太網(wǎng)SerDes 接口與電接口的轉(zhuǎn)換方法
    卷積神經(jīng)網(wǎng)絡(luò)的FPGA并行結(jié)構(gòu)研究
    基于FPGA的遺傳算法在交通控制中的應(yīng)用
    基于FPGA的顏色識別觸摸屏系統(tǒng)設(shè)計與實現(xiàn)
    基于FPGA的9/7小波變換算法實現(xiàn)
    2021少妇久久久久久久久久久| 黄片wwwwww| 色5月婷婷丁香| 熟女av电影| 免费av观看视频| 久久人人爽人人片av| 国产成年人精品一区二区| 亚洲精品自拍成人| 看免费成人av毛片| 国产爽快片一区二区三区| 国产伦理片在线播放av一区| 亚洲真实伦在线观看| 亚洲一级一片aⅴ在线观看| 少妇被粗大猛烈的视频| 国产毛片a区久久久久| 在线观看av片永久免费下载| 亚洲精品影视一区二区三区av| 国产成人免费观看mmmm| 91午夜精品亚洲一区二区三区| 精品少妇黑人巨大在线播放| 男女那种视频在线观看| 久久人人爽人人片av| 日本av手机在线免费观看| 99久久中文字幕三级久久日本| 国产一区二区三区av在线| 国产毛片在线视频| 亚洲精品国产av蜜桃| 欧美成人a在线观看| 男女边吃奶边做爰视频| 日韩三级伦理在线观看| 日韩一区二区视频免费看| 久久久久精品性色| 国产成人精品婷婷| 中文天堂在线官网| 日日啪夜夜爽| 美女视频免费永久观看网站| 我要看日韩黄色一级片| 日本色播在线视频| 制服丝袜香蕉在线| 内地一区二区视频在线| 如何舔出高潮| 日本黄色片子视频| 亚洲av.av天堂| 看非洲黑人一级黄片| 一个人看视频在线观看www免费| 久热久热在线精品观看| 免费观看性生交大片5| 欧美一区二区亚洲| videossex国产| 日韩伦理黄色片| 亚洲第一区二区三区不卡| 国产精品.久久久| 国产日韩欧美亚洲二区| 99热这里只有精品一区| 插阴视频在线观看视频| 大香蕉97超碰在线| 性色avwww在线观看| 久久久国产一区二区| 日本wwww免费看| 国产精品偷伦视频观看了| 日韩欧美 国产精品| 特级一级黄色大片| 看黄色毛片网站| 国产成人一区二区在线| 韩国高清视频一区二区三区| 男人爽女人下面视频在线观看| 国精品久久久久久国模美| 久久久久久国产a免费观看| 日韩三级伦理在线观看| 中文精品一卡2卡3卡4更新| 男女下面进入的视频免费午夜| 黄片wwwwww| 日韩不卡一区二区三区视频在线| 国产熟女欧美一区二区| 日本-黄色视频高清免费观看| 成年女人在线观看亚洲视频 | 蜜桃亚洲精品一区二区三区| 中文字幕亚洲精品专区| 国产精品伦人一区二区| 亚洲va在线va天堂va国产| 国产精品久久久久久av不卡| 观看美女的网站| 日日摸夜夜添夜夜爱| 亚洲av不卡在线观看| 国产欧美亚洲国产| 一本色道久久久久久精品综合| 久久国内精品自在自线图片| 久久精品国产亚洲av天美| 人妻 亚洲 视频| 欧美高清性xxxxhd video| 精品久久久精品久久久| 熟女人妻精品中文字幕| 国产精品嫩草影院av在线观看| 亚洲精品国产成人久久av| 99九九线精品视频在线观看视频| 精华霜和精华液先用哪个| 久久国产乱子免费精品| 午夜日本视频在线| 22中文网久久字幕| av国产免费在线观看| 亚洲综合色惰| 黑人高潮一二区| 久久久久久伊人网av| 菩萨蛮人人尽说江南好唐韦庄| 国产乱人视频| 精品国产乱码久久久久久小说| 国产精品国产三级专区第一集| 国产精品一区二区性色av| 日韩欧美 国产精品| 国产午夜精品久久久久久一区二区三区| 99热这里只有精品一区| 国产精品久久久久久久久免| 国产亚洲一区二区精品| 一级黄片播放器| 99热这里只有是精品50| 男女无遮挡免费网站观看| 天堂网av新在线| 亚洲丝袜综合中文字幕| 男插女下体视频免费在线播放| 蜜臀久久99精品久久宅男| 国产爱豆传媒在线观看| 久久99热6这里只有精品| 国产成人福利小说| 国产一区二区三区综合在线观看 | 亚洲精品视频女| 免费黄频网站在线观看国产| 日韩三级伦理在线观看| 亚洲av日韩在线播放| 久久久久久久久久久丰满| 国模一区二区三区四区视频| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 蜜桃久久精品国产亚洲av| 日韩 亚洲 欧美在线| 国产高清国产精品国产三级 | 亚洲国产精品999| 黄色视频在线播放观看不卡| av在线天堂中文字幕| 大香蕉久久网| 亚洲精品中文字幕在线视频 | 国产高清三级在线| 两个人的视频大全免费| 亚洲国产精品专区欧美| 麻豆成人av视频| 18禁动态无遮挡网站| 亚洲av免费高清在线观看| 欧美性感艳星| 国产成人免费观看mmmm| 国产精品福利在线免费观看| 成年女人看的毛片在线观看| 尾随美女入室| 免费少妇av软件| 中文字幕亚洲精品专区| 色视频www国产| 国产人妻一区二区三区在| 欧美少妇被猛烈插入视频| 国产精品人妻久久久影院| 精品国产乱码久久久久久小说| 中文字幕av成人在线电影| 久久久久久久久久人人人人人人| 国产成人a区在线观看| 干丝袜人妻中文字幕| 国产成人a∨麻豆精品| 精品一区在线观看国产| 精品久久国产蜜桃| 久久人人爽人人爽人人片va| 哪个播放器可以免费观看大片| 纵有疾风起免费观看全集完整版| 人妻一区二区av| 久久这里有精品视频免费| 国产欧美日韩一区二区三区在线 | 国产亚洲最大av| 最新中文字幕久久久久| 18禁在线播放成人免费| 天天躁日日操中文字幕| 亚洲国产精品成人久久小说| 成年人午夜在线观看视频| 成人无遮挡网站| 亚洲高清免费不卡视频| 欧美zozozo另类| 午夜福利视频精品| 国产成人免费无遮挡视频| 色视频在线一区二区三区| 大码成人一级视频| 男男h啪啪无遮挡| 成人二区视频| 国产毛片在线视频| 亚洲精品成人久久久久久| 综合色丁香网| 亚洲精品国产av蜜桃| 色综合色国产| 亚洲av成人精品一二三区| 天美传媒精品一区二区| 性色av一级| 成人欧美大片| 成人免费观看视频高清| 国产午夜福利久久久久久| 免费高清在线观看视频在线观看| 亚洲欧洲国产日韩| 欧美另类一区| 精品久久久精品久久久| 成年av动漫网址| 精品国产一区二区三区久久久樱花 | 日韩免费高清中文字幕av| 国产精品麻豆人妻色哟哟久久| 永久免费av网站大全| 男女国产视频网站| 美女高潮的动态| 国产成人精品福利久久| 亚洲精品,欧美精品| 69人妻影院| 婷婷色综合www| 国产亚洲av嫩草精品影院| 国语对白做爰xxxⅹ性视频网站| 国产黄色视频一区二区在线观看| 亚洲人成网站在线播| 联通29元200g的流量卡| 人妻制服诱惑在线中文字幕| 亚洲精品aⅴ在线观看| 国内揄拍国产精品人妻在线| 成人漫画全彩无遮挡| 在线免费观看不下载黄p国产| 高清在线视频一区二区三区| 国产欧美亚洲国产| 亚洲成色77777| .国产精品久久| 美女国产视频在线观看| 久久6这里有精品| 2021少妇久久久久久久久久久| 国产欧美日韩一区二区三区在线 | 青春草视频在线免费观看| 在线天堂最新版资源| 欧美日韩在线观看h| 国产综合精华液| 国产成人a∨麻豆精品| 麻豆精品久久久久久蜜桃| 亚洲丝袜综合中文字幕| 九九在线视频观看精品| 亚洲av成人精品一二三区| 成人漫画全彩无遮挡| 五月天丁香电影| 在线观看一区二区三区激情| 伊人久久精品亚洲午夜| 中文字幕av成人在线电影| 丰满人妻一区二区三区视频av| 国产免费视频播放在线视频| 狂野欧美激情性bbbbbb| a级一级毛片免费在线观看| 国产白丝娇喘喷水9色精品| 亚洲自拍偷在线| 丰满人妻一区二区三区视频av| videossex国产| 久久精品国产a三级三级三级| 伦理电影大哥的女人| 男的添女的下面高潮视频| 神马国产精品三级电影在线观看| 日韩精品有码人妻一区| 欧美性感艳星| 啦啦啦啦在线视频资源| 看黄色毛片网站| 亚洲精品乱码久久久久久按摩| 夫妻午夜视频| 在线免费十八禁| 干丝袜人妻中文字幕| 久久这里有精品视频免费| 久久99精品国语久久久| 深爱激情五月婷婷| 最近2019中文字幕mv第一页| 80岁老熟妇乱子伦牲交| 国产精品一区二区性色av| 国产成人免费观看mmmm| 99久国产av精品国产电影| 午夜精品一区二区三区免费看| 国内少妇人妻偷人精品xxx网站| 国产成年人精品一区二区| 51国产日韩欧美| 欧美人与善性xxx| 街头女战士在线观看网站| 综合色av麻豆| 亚洲欧美一区二区三区国产| 成年女人在线观看亚洲视频 | 春色校园在线视频观看| av专区在线播放| 高清日韩中文字幕在线| 亚洲不卡免费看| 国产精品偷伦视频观看了| 日韩亚洲欧美综合| 国产有黄有色有爽视频| av国产久精品久网站免费入址| 国产成人freesex在线| 久久久久久久午夜电影| 大又大粗又爽又黄少妇毛片口| 日本wwww免费看| 性色av一级| 天天躁夜夜躁狠狠久久av| 午夜福利视频1000在线观看| 国产高清不卡午夜福利| 一个人观看的视频www高清免费观看| 人妻一区二区av| 一级毛片电影观看| 小蜜桃在线观看免费完整版高清| 一级片'在线观看视频| 日日啪夜夜爽| 亚洲av成人精品一二三区| 国产精品伦人一区二区| 91aial.com中文字幕在线观看| 最近的中文字幕免费完整| 亚洲av日韩在线播放| 最后的刺客免费高清国语| 国产精品一区二区三区四区免费观看| 校园人妻丝袜中文字幕| 十八禁网站网址无遮挡 | 精品午夜福利在线看| 欧美高清性xxxxhd video| 亚洲精品日韩av片在线观看| 蜜桃亚洲精品一区二区三区| 国产黄频视频在线观看| 99热全是精品| 久久久久久九九精品二区国产| 美女cb高潮喷水在线观看| 在线a可以看的网站| 精品少妇久久久久久888优播| 97超碰精品成人国产| 麻豆国产97在线/欧美| 欧美成人精品欧美一级黄| 亚洲第一区二区三区不卡| 观看美女的网站| 伊人久久国产一区二区| 欧美精品人与动牲交sv欧美| 免费观看性生交大片5| 又爽又黄a免费视频| 日日啪夜夜撸| 王馨瑶露胸无遮挡在线观看| 午夜视频国产福利| 日日啪夜夜撸| 亚洲国产精品成人综合色| 最近最新中文字幕大全电影3| 婷婷色麻豆天堂久久| 黄色怎么调成土黄色| 欧美 日韩 精品 国产| 黄色一级大片看看| 日韩制服骚丝袜av| 久久国内精品自在自线图片| 观看免费一级毛片| 高清午夜精品一区二区三区| 99热这里只有精品一区| 国产探花在线观看一区二区| 亚洲电影在线观看av| 国产精品国产三级国产av玫瑰| 51国产日韩欧美| 五月开心婷婷网| 视频区图区小说| 国产老妇伦熟女老妇高清| 欧美变态另类bdsm刘玥| 两个人的视频大全免费| 狂野欧美激情性xxxx在线观看| 欧美3d第一页| 亚洲在久久综合| 男女下面进入的视频免费午夜| 欧美日韩国产mv在线观看视频 | 一级av片app| 人体艺术视频欧美日本| 在线观看三级黄色| 久热久热在线精品观看| 天天一区二区日本电影三级| 久久精品国产自在天天线| 2021少妇久久久久久久久久久| av在线亚洲专区| 欧美另类一区| 国产毛片在线视频| 啦啦啦中文免费视频观看日本| 特级一级黄色大片| 久久精品久久精品一区二区三区| 18+在线观看网站| 综合色av麻豆| 在线精品无人区一区二区三 | 自拍欧美九色日韩亚洲蝌蚪91 | 国产69精品久久久久777片| 亚洲激情五月婷婷啪啪| 国产精品国产三级国产专区5o| 国产精品国产三级专区第一集| 国产美女午夜福利| 亚洲精品,欧美精品| 成年免费大片在线观看| 少妇被粗大猛烈的视频| 精品亚洲乱码少妇综合久久| 久久热精品热| 国产成人a∨麻豆精品| 亚洲精品一二三| 99热网站在线观看| 国产黄片视频在线免费观看| 又爽又黄a免费视频| 亚洲成人精品中文字幕电影| 91久久精品国产一区二区成人| 看黄色毛片网站| 久久久久久久久大av| 麻豆精品久久久久久蜜桃| 91午夜精品亚洲一区二区三区| 久久精品夜色国产| 国产黄频视频在线观看| 狠狠精品人妻久久久久久综合| 少妇被粗大猛烈的视频| 又爽又黄a免费视频| 各种免费的搞黄视频| 国产日韩欧美在线精品| 夫妻午夜视频| 欧美+日韩+精品| 久久97久久精品| 人人妻人人澡人人爽人人夜夜| 亚洲国产最新在线播放| 两个人的视频大全免费| 国产精品国产三级国产专区5o| 国产精品无大码| 晚上一个人看的免费电影| 久久精品国产自在天天线| 国产69精品久久久久777片| 五月伊人婷婷丁香| 涩涩av久久男人的天堂| 麻豆国产97在线/欧美| 亚洲精华国产精华液的使用体验| av在线天堂中文字幕| 日韩,欧美,国产一区二区三区| 亚洲,一卡二卡三卡| 白带黄色成豆腐渣| 国模一区二区三区四区视频| 亚洲欧美精品自产自拍| 国产老妇伦熟女老妇高清| 男女边摸边吃奶| 精品一区二区三区视频在线| 国产有黄有色有爽视频| 午夜老司机福利剧场| 色网站视频免费| 男插女下体视频免费在线播放| 亚洲精品aⅴ在线观看| 一级黄片播放器| 91aial.com中文字幕在线观看| 在线亚洲精品国产二区图片欧美 | 波多野结衣巨乳人妻| 欧美性感艳星| 久久女婷五月综合色啪小说 | 国产白丝娇喘喷水9色精品| 国产精品久久久久久av不卡| 亚洲第一区二区三区不卡| 水蜜桃什么品种好| 国产真实伦视频高清在线观看| 中文字幕制服av| 国产精品一及| 久热这里只有精品99| a级毛片免费高清观看在线播放| 看黄色毛片网站| 久久久久久久精品精品| 欧美日韩综合久久久久久| 免费观看的影片在线观看| 中文字幕av成人在线电影| 热re99久久精品国产66热6| 又大又黄又爽视频免费| 国产色婷婷99| 青青草视频在线视频观看| 99久久九九国产精品国产免费| 国模一区二区三区四区视频| 国产一区二区三区av在线| 又爽又黄无遮挡网站| 日韩制服骚丝袜av| 男女无遮挡免费网站观看| 激情 狠狠 欧美| 国产毛片a区久久久久| 六月丁香七月| 三级国产精品欧美在线观看| a级毛色黄片| 免费播放大片免费观看视频在线观看| tube8黄色片| 国产成人福利小说| 一个人看视频在线观看www免费| 在线观看免费高清a一片| 欧美日韩一区二区视频在线观看视频在线 | 日韩亚洲欧美综合| 国产精品偷伦视频观看了| 18禁动态无遮挡网站| 18禁裸乳无遮挡动漫免费视频 | 亚洲aⅴ乱码一区二区在线播放| 你懂的网址亚洲精品在线观看| 国产成人aa在线观看| 哪个播放器可以免费观看大片| 涩涩av久久男人的天堂| a级毛片免费高清观看在线播放| 日本熟妇午夜| 亚洲四区av| 一区二区三区精品91| 国产在线一区二区三区精| 一级片'在线观看视频| 人人妻人人爽人人添夜夜欢视频 | 日韩三级伦理在线观看| 熟女av电影| 少妇猛男粗大的猛烈进出视频 | 成人二区视频| 成人国产av品久久久| 久久久久久伊人网av| 日韩欧美一区视频在线观看 | 日韩强制内射视频| 久久这里有精品视频免费| 久久99热这里只频精品6学生| 精品国产露脸久久av麻豆| 久久久久国产精品人妻一区二区| av国产免费在线观看| 中文在线观看免费www的网站| av一本久久久久| 成年版毛片免费区| 人妻少妇偷人精品九色| 精品久久久久久久久亚洲| 天堂网av新在线| 偷拍熟女少妇极品色| 久久久久久久久久久免费av| 精品人妻熟女av久视频| eeuss影院久久| 涩涩av久久男人的天堂| 久久影院123| 欧美日韩综合久久久久久| 午夜激情福利司机影院| 久久99热这里只有精品18| 成人午夜精彩视频在线观看| 亚洲,一卡二卡三卡| 人妻夜夜爽99麻豆av| 国产一级毛片在线| 国产男人的电影天堂91| 伦精品一区二区三区| 婷婷色综合www| 国产精品偷伦视频观看了| 亚洲天堂国产精品一区在线| 国产精品精品国产色婷婷| 精品国产一区二区三区久久久樱花 | 大片免费播放器 马上看| 国产永久视频网站| 久久久久久久国产电影| 男女边吃奶边做爰视频| 大香蕉久久网| 国产人妻一区二区三区在| 男女下面进入的视频免费午夜| 可以在线观看毛片的网站| 亚洲国产精品成人综合色| 国产爱豆传媒在线观看| 国产久久久一区二区三区| a级毛片免费高清观看在线播放| 亚洲av二区三区四区| 久久久久国产精品人妻一区二区| 亚洲国产av新网站| 日韩在线高清观看一区二区三区| 国语对白做爰xxxⅹ性视频网站| 免费看a级黄色片| 国产色爽女视频免费观看| 国产亚洲最大av| 美女脱内裤让男人舔精品视频| 99热这里只有是精品在线观看| 18禁裸乳无遮挡动漫免费视频 | 春色校园在线视频观看| 欧美日韩视频精品一区| 国产日韩欧美在线精品| 啦啦啦中文免费视频观看日本| 边亲边吃奶的免费视频| 丝瓜视频免费看黄片| 欧美另类一区| 最近中文字幕2019免费版| 色视频www国产| 亚洲自偷自拍三级| www.av在线官网国产| 国产亚洲av嫩草精品影院| 欧美日韩在线观看h| 亚洲三级黄色毛片| 女人十人毛片免费观看3o分钟| 1000部很黄的大片| 欧美成人午夜免费资源| 亚洲最大成人av| 肉色欧美久久久久久久蜜桃 | 免费不卡的大黄色大毛片视频在线观看| 在线精品无人区一区二区三 | 波多野结衣巨乳人妻| 成人无遮挡网站| 国产精品无大码| 免费人成在线观看视频色| 欧美成人a在线观看| av在线观看视频网站免费| 观看免费一级毛片| av在线播放精品| 日韩av不卡免费在线播放| 亚洲国产精品国产精品| 美女xxoo啪啪120秒动态图| 大话2 男鬼变身卡| 欧美成人午夜免费资源| 国产精品精品国产色婷婷| 大话2 男鬼变身卡| 九九爱精品视频在线观看| 久久ye,这里只有精品| 精品熟女少妇av免费看| 中文字幕免费在线视频6| 噜噜噜噜噜久久久久久91| 国产精品一区二区在线观看99| 色视频www国产| 2018国产大陆天天弄谢| 老司机影院毛片| 国产精品伦人一区二区| 亚洲国产欧美人成| 国产av码专区亚洲av| 欧美日韩亚洲高清精品| 男女边吃奶边做爰视频| 国产有黄有色有爽视频| 女的被弄到高潮叫床怎么办| 色哟哟·www| 全区人妻精品视频| 国产欧美日韩一区二区三区在线 | 日韩一区二区三区影片| eeuss影院久久| av在线老鸭窝| 啦啦啦中文免费视频观看日本| 亚洲精品亚洲一区二区| 在线观看一区二区三区激情| 91精品伊人久久大香线蕉| 国产午夜精品久久久久久一区二区三区|