• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強(qiáng)化學(xué)習(xí)的農(nóng)田節(jié)點(diǎn)數(shù)據(jù)無人機(jī)采集方法

    2022-03-09 01:55:00張亞莉望夢成蘭玉彬張植勛
    關(guān)鍵詞:能耗深度傳感器

    胡 潔,張亞莉,王 團(tuán),望夢成,蘭玉彬,張植勛

    ·農(nóng)業(yè)航空工程·

    基于深度強(qiáng)化學(xué)習(xí)的農(nóng)田節(jié)點(diǎn)數(shù)據(jù)無人機(jī)采集方法

    胡 潔1,3,張亞莉2,3※,王 團(tuán)1,望夢成1,蘭玉彬1,3,張植勛2

    (1. 華南農(nóng)業(yè)大學(xué)電子工程學(xué)院,廣州 510642;2. 華南農(nóng)業(yè)大學(xué)工程學(xué)院,廣州 510642;3. 國家精準(zhǔn)農(nóng)業(yè)航空施藥技術(shù)國際聯(lián)合研究中心,廣州 510642)

    利用無人機(jī)采集農(nóng)田傳感器節(jié)點(diǎn)數(shù)據(jù),可避免網(wǎng)絡(luò)節(jié)點(diǎn)間多次轉(zhuǎn)發(fā)數(shù)據(jù)造成節(jié)點(diǎn)電量耗盡,近網(wǎng)關(guān)節(jié)點(diǎn)過早死亡及網(wǎng)絡(luò)生命周期縮短等問題。由于相鄰傳感器數(shù)據(jù)可能存在冗余、無人機(jī)可同時(shí)覆蓋多個(gè)節(jié)點(diǎn)進(jìn)行采集等特點(diǎn),該研究針對冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集和全節(jié)點(diǎn)數(shù)據(jù)采集,對無人機(jī)數(shù)據(jù)采集的路線及方案進(jìn)行優(yōu)化,以減輕無人機(jī)能耗,縮短任務(wù)完成時(shí)間。在冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景中,通過競爭雙重深度Q網(wǎng)絡(luò)算法(Dueling Double Deep Q Network,DDDQN)優(yōu)化無人機(jī)節(jié)點(diǎn)選擇及采集順序,使采集的數(shù)據(jù)滿足覆蓋率要求的同時(shí)無人機(jī)能效最優(yōu)。仿真結(jié)果表明,該算法在滿足相同感知覆蓋率要求下,較深度Q網(wǎng)絡(luò)(Deep Q Network,DQN)算法的飛行距離縮短了1.21 km,能耗減少27.9%。在全節(jié)點(diǎn)數(shù)據(jù)采集場景中,采用兩級深度強(qiáng)化學(xué)習(xí)聯(lián)合(Double Deep Reinforcement Learning,DDRL)方法對無人機(jī)的懸停位置和順序進(jìn)行優(yōu)化,使無人機(jī)完成數(shù)據(jù)采集任務(wù)時(shí)的總能耗最小。仿真結(jié)果表明,單節(jié)點(diǎn)數(shù)據(jù)量在160 kB以下時(shí),在不同節(jié)點(diǎn)個(gè)數(shù)及無人機(jī)飛行速度下,該方法比經(jīng)典基于粒子群優(yōu)化的旅行商問題(Particle Swarm Optimization-Traveling Salesman Problem,PSO-TSP)算法和最小化能量飛行控制(Minimized Energy Flight Control,MEFC)算法的總能耗最少節(jié)約6.3%。田間試驗(yàn)結(jié)果表明,相比PSO-TSP算法,基于DDRL的數(shù)據(jù)采集方法的無人機(jī)總能耗降低11.5%。研究結(jié)構(gòu)可為無人機(jī)大田無線傳感器節(jié)點(diǎn)數(shù)據(jù)采集提供參考。

    無人機(jī);數(shù)據(jù)采集;深度強(qiáng)化學(xué)習(xí);節(jié)點(diǎn)感知冗余;DQN;DRL

    0 引 言

    各種農(nóng)業(yè)傳感器在農(nóng)業(yè)生產(chǎn)中起著監(jiān)測作物生長環(huán)境、協(xié)助精準(zhǔn)灌溉和施肥及病蟲害防治等作用[1-2]。在網(wǎng)絡(luò)基礎(chǔ)設(shè)施缺乏的部分邊遠(yuǎn)地區(qū),農(nóng)田無線傳感器節(jié)點(diǎn)的數(shù)據(jù)采集存在困難[3-4]。因此,利用各種移動(dòng)設(shè)備采集田間無線傳感器節(jié)點(diǎn)數(shù)據(jù)成為一種解決措施[5-6]。相比地面移動(dòng)設(shè)備,無人機(jī)具有不受限于地面環(huán)境、不破壞地面作物、信號傳輸所受阻擋小等優(yōu)勢,是采集傳感器節(jié)點(diǎn)數(shù)據(jù)的有利途徑[7]。目前農(nóng)業(yè)無人機(jī)普遍采用牛耕法的方式進(jìn)行噴藥、撒播等作業(yè),然而當(dāng)采集隨機(jī)布置的傳感器節(jié)點(diǎn)數(shù)據(jù)時(shí),相鄰節(jié)點(diǎn)間的數(shù)據(jù)可能存在冗余[8-9],且無人機(jī)在一個(gè)懸停點(diǎn)可能覆蓋多個(gè)節(jié)點(diǎn)[10],因此需要對無人機(jī)數(shù)據(jù)采集的路線及方案進(jìn)行優(yōu)化,以減小無人機(jī)能耗、縮短任務(wù)完成時(shí)間。

    針對無人機(jī)采集傳感器節(jié)點(diǎn)數(shù)據(jù)的方法,國內(nèi)外學(xué)者開展了相關(guān)研究,大部分優(yōu)化方案主要集中在降低能耗[11-12]、任務(wù)完成時(shí)間最短[13]、軌跡距離最小[14-17]等。Luo等[11]提出了一種智慧農(nóng)場的數(shù)據(jù)采集方案,根據(jù)傳感器節(jié)點(diǎn)的接收信號強(qiáng)度(Received Signal Strength Indication,RSSI)確定簇和簇頭,采用改進(jìn)的Dijkstra和遺傳算法(Genetic algorithm,GA)尋求最佳軌跡。Ben等[12]提出了一種使用無人機(jī)從無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)采集數(shù)據(jù)的解決方案,可以同時(shí)減小通信與無人機(jī)飛行能耗。Just等[14]針對無人機(jī)采集大面積節(jié)點(diǎn)數(shù)據(jù),使用時(shí)隙概念結(jié)合飛行禁止列表,將無人機(jī)路徑與每個(gè)節(jié)點(diǎn)的激活周期進(jìn)行同步,大大縮短了飛行距離和飛行時(shí)間。Zhang等[15]提出了一種基于分層深度強(qiáng)化學(xué)習(xí)(Hierarchical Deep Reinforcement Learning,HDRL)算法解決可充電多無人機(jī)數(shù)據(jù)采集場景的路徑規(guī)劃問題,最大限度地縮短無人機(jī)的總飛行時(shí)間。蔣寶慶等[16]提出了一種基于Q學(xué)習(xí)的無人機(jī)輔助采集小規(guī)模無線傳感器節(jié)點(diǎn)數(shù)據(jù),減少了無人機(jī)的任務(wù)完成時(shí)間和有效數(shù)據(jù)量,提高了無人機(jī)能效。Yi等[17]研究了一種基于深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)的無人機(jī)輔助物聯(lián)網(wǎng)采集最優(yōu)信息年齡(Age of Information,AoI)數(shù)據(jù),得到最優(yōu)的無人機(jī)飛行軌跡和傳感器節(jié)點(diǎn)的傳輸調(diào)度方案。文獻(xiàn)[15-18]采用強(qiáng)化學(xué)習(xí)算法研究無人機(jī)數(shù)據(jù)采集問題,無人機(jī)通過與環(huán)境進(jìn)行交互得到反饋,通過自主學(xué)習(xí)獲得最優(yōu)數(shù)據(jù)采集策略。上述研究大多針對無人機(jī)的飛行距離進(jìn)行優(yōu)化,忽略了節(jié)點(diǎn)數(shù)據(jù)量大小和通信范圍等因素。

    作者在無人機(jī)果樹噴藥的研究中發(fā)現(xiàn),懸停能耗對無人機(jī)整體能耗的影響更大,需綜合考慮懸停時(shí)間和飛行時(shí)間。因此,針對能量受限的農(nóng)業(yè)無人機(jī)不同數(shù)據(jù)采集場景,本文基于深度強(qiáng)化學(xué)習(xí)算法,在考慮傳感器節(jié)點(diǎn)冗余覆蓋的情況下,研究如何對無人機(jī)進(jìn)行調(diào)度,有選擇地采集部分節(jié)點(diǎn)數(shù)據(jù)及規(guī)劃采集順序,使數(shù)據(jù)采集在滿足覆蓋率要求的同時(shí)達(dá)到無人機(jī)能效最優(yōu),在需要采集全部傳感器節(jié)點(diǎn)數(shù)據(jù)的情況下優(yōu)化無人機(jī)的懸停位置和采集順序,使無人機(jī)能耗最小。

    1 作業(yè)場景及相關(guān)模型

    1.1 冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景

    在布設(shè)傳感器時(shí),為了對整個(gè)作業(yè)區(qū)域進(jìn)行全面覆蓋,傳感器之間往往存在感知范圍交叉重疊的情況,這種情況在隨機(jī)布設(shè)傳感器的環(huán)境中尤其明顯。無人機(jī)受限于自身能量和續(xù)航時(shí)間,在采集傳感器數(shù)據(jù)時(shí)需要對傳感器進(jìn)行甄選,對飛行路徑進(jìn)行優(yōu)化,以求在感知覆蓋率要求和無人機(jī)能耗之間獲得最佳平衡。

    假定農(nóng)田隨機(jī)分布的傳感器節(jié)點(diǎn)總數(shù)為,每個(gè)節(jié)點(diǎn)的感知范圍是以節(jié)點(diǎn)為中心的圓(本文假設(shè)所有節(jié)點(diǎn)的感知半徑相同),如圖1所示。在采集數(shù)據(jù)過程中無人機(jī)懸停在節(jié)點(diǎn)的正上方,在一個(gè)懸停位置只采集一個(gè)節(jié)點(diǎn)的數(shù)據(jù),傳感器節(jié)點(diǎn)在收到無人機(jī)的信標(biāo)信息后被喚醒并向無人機(jī)發(fā)送數(shù)據(jù),無人機(jī)采集完該節(jié)點(diǎn)數(shù)據(jù)后飛向下一個(gè)被選擇的節(jié)點(diǎn)。數(shù)據(jù)采集過程中,假設(shè)無人機(jī)可以獲知各節(jié)點(diǎn)的位置及當(dāng)前自身能量。無人機(jī)以固定高度飛行,為簡便表示,后續(xù)統(tǒng)一采用平面二維坐標(biāo)表示無人機(jī)的懸停位置。

    圖1 冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景

    1.2 全節(jié)點(diǎn)數(shù)據(jù)采集場景

    農(nóng)業(yè)生產(chǎn)中,有些情況下需要采集田間所有傳感器節(jié)點(diǎn)的數(shù)據(jù),若每采集一個(gè)節(jié)點(diǎn)數(shù)據(jù)都要懸停,懸停點(diǎn)過多,無人機(jī)會(huì)有巨大的能量消耗。由于無人機(jī)的通信區(qū)域是以懸停點(diǎn)在地面投影為中心的圓,在這個(gè)范圍內(nèi)的節(jié)點(diǎn)都可以與無人機(jī)進(jìn)行數(shù)據(jù)傳輸,通過合理選擇無人機(jī)的懸停點(diǎn)位置和采集順序,讓無人機(jī)在每個(gè)懸停點(diǎn)時(shí)采集其通信范圍內(nèi)的傳感器節(jié)點(diǎn)數(shù)據(jù),達(dá)到減少無人機(jī)懸停次數(shù)及能耗的目標(biāo),最終完成所有傳感器節(jié)點(diǎn)的數(shù)據(jù)采集。

    如圖2所示,假設(shè)田間有個(gè)無線傳感器節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)都有準(zhǔn)確定位(配備GPS或北斗天線),每個(gè)傳感器都具有相同的通信范圍和數(shù)據(jù)緩沖區(qū)大小。無人機(jī)在飛行高度固定為的情況下,在某個(gè)懸停點(diǎn)可正常通信的是圖2中圓形區(qū)域內(nèi)的傳感器節(jié)點(diǎn),設(shè)該區(qū)域的半徑為(通過信道傳輸模型計(jì)算得出),區(qū)域中的傳感器節(jié)點(diǎn)以單跳方式與無人機(jī)進(jìn)行通信。假設(shè)無人機(jī)勻速飛行,飛行高度固定,通過對懸停位置選擇及飛行路徑規(guī)劃,使無人機(jī)在采集完所有傳感器節(jié)點(diǎn)數(shù)據(jù)時(shí)總能耗最小。為簡便表示,后續(xù)統(tǒng)一用平面二維坐標(biāo)表示無人機(jī)的懸停位置。

    注:H為無人機(jī)飛行高度,m;R為無人機(jī)在某個(gè)懸停點(diǎn)可與傳感器正常通信的區(qū)域半徑,m。

    1.3 信道傳輸模型

    無人機(jī)懸停采集田間節(jié)點(diǎn)數(shù)據(jù),其懸停時(shí)間與數(shù)據(jù)傳輸速率相關(guān),而數(shù)據(jù)傳輸速率受信道損耗和衰落的影響。

    假設(shè)在通信過程中傳感器節(jié)點(diǎn)的發(fā)射功率為,根據(jù)香農(nóng)定理可得位置的無人機(jī)與節(jié)點(diǎn)間的數(shù)據(jù)傳輸速率R,i(bit/s)為

    從式(2)可以看出,在其他參數(shù)不變的情況下,無人機(jī)與節(jié)點(diǎn)的距離越遠(yuǎn),數(shù)據(jù)傳輸速率越慢,則無人機(jī)懸停時(shí)間越長。

    1.4 無人機(jī)能耗模型

    本文采用Zeng等[19]的旋翼無人機(jī)功率模型:

    由式(3)~(4)、式(6)~(7)可知,在冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景中,無人機(jī)從SN-1起飛到結(jié)束SN的數(shù)據(jù)采集所消耗的能量(kJ)為

    同理,在全節(jié)點(diǎn)數(shù)據(jù)采集場景中,從SN-1起飛到結(jié)束SN的數(shù)據(jù)采集所消耗的能量(kJ)為

    最終,無人機(jī)完成個(gè)懸停位置的數(shù)據(jù)采集任務(wù)所需要的總能耗E(kJ)為

    2 基于DRL的節(jié)點(diǎn)數(shù)據(jù)采集方法

    2.1 深度強(qiáng)化學(xué)習(xí)DRL

    強(qiáng)化學(xué)習(xí)是一類特定的機(jī)器學(xué)習(xí)方法,可解決關(guān)于序列決策的相關(guān)問題[20]。深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)將深度學(xué)習(xí)的感知能力和強(qiáng)化學(xué)習(xí)的決策能力相結(jié)合[21-22],通過深度學(xué)習(xí)對環(huán)境狀態(tài)信息進(jìn)行特征提取,傳遞給智能體進(jìn)行決策并執(zhí)行動(dòng)作,執(zhí)行動(dòng)作后得到由環(huán)境反饋的獎(jiǎng)懲信號以及環(huán)境狀態(tài)的改變,促進(jìn)智能體進(jìn)行下一步的動(dòng)作。智能體通過與環(huán)境迭代交互選取一系列動(dòng)作以最大化累積獎(jiǎng)勵(lì),即在有限反饋中實(shí)現(xiàn)序列決策的優(yōu)化[23]。田間節(jié)點(diǎn)數(shù)據(jù)采集本質(zhì)上是在多種影響因素變化情況下對無人機(jī)懸停位置的選擇和采集時(shí)序的安排;每采集一個(gè)節(jié)點(diǎn)數(shù)據(jù),或會(huì)帶來相鄰節(jié)點(diǎn)數(shù)據(jù)的效用變化,或會(huì)帶來去往其余節(jié)點(diǎn)的距離成本變化,這可以轉(zhuǎn)化為序列決策問題。本文基于DRL方法,針對前述2個(gè)場景設(shè)計(jì)了競爭雙重深度Q網(wǎng)絡(luò)(Dueling Double Deep Q Network,DDDQN)及兩級深度強(qiáng)化學(xué)習(xí)(Double Deep Reinforcement Learning,DDRL)算法。

    2.2 冗余覆蓋下基于DDDQN的部分節(jié)點(diǎn)數(shù)據(jù)采集方法

    2.2.1 任務(wù)環(huán)境

    設(shè)農(nóng)田為一個(gè)矩形區(qū)域,如圖3所示,無人機(jī)按照虛線所示的路線采集節(jié)點(diǎn)數(shù)據(jù)。采集節(jié)點(diǎn)a數(shù)據(jù)時(shí),無人機(jī)獲取的數(shù)據(jù)覆蓋范圍增量是以a為中心的整個(gè)圓范圍;采集節(jié)點(diǎn)b數(shù)據(jù)時(shí),數(shù)據(jù)覆蓋范圍增量是以b為中心、去掉陰影區(qū)域1的剩余圓;采集節(jié)點(diǎn)c數(shù)據(jù)時(shí),數(shù)據(jù)覆蓋范圍增量是以c為中心、去掉陰影區(qū)域2的剩余圓;而采集節(jié)點(diǎn)d的數(shù)據(jù)覆蓋率增量只有陰影區(qū)域3的范圍,節(jié)點(diǎn)d與已采集的節(jié)點(diǎn)間數(shù)據(jù)冗余比例高,無人機(jī)根據(jù)獎(jiǎng)勵(lì)函數(shù)(公式(12))確定當(dāng)前動(dòng)作,可能會(huì)將節(jié)點(diǎn)d舍棄。

    注:a~e為傳感器節(jié)點(diǎn);1為節(jié)點(diǎn)a與節(jié)點(diǎn)b的冗余覆蓋部分;2為節(jié)點(diǎn)b與節(jié)點(diǎn)c的冗余覆蓋部分;3為節(jié)點(diǎn)d帶來的數(shù)據(jù)覆蓋率增量。

    2.2.2 DDDQN算法

    DDDQN算法將雙重深度Q網(wǎng)絡(luò)(Double DQN)[24]與競爭深度Q網(wǎng)絡(luò)(Dueling DQN)[25]相融合。圖4為DDDQN算法框架[26]。該算法結(jié)合了2種算法的優(yōu)勢,將DQN算法存在的網(wǎng)絡(luò)值估計(jì)過高的問題與網(wǎng)絡(luò)的結(jié)構(gòu)同時(shí)進(jìn)行優(yōu)化。

    注:s為無人機(jī)當(dāng)前狀態(tài);V(s)為在狀態(tài)s下通過神經(jīng)網(wǎng)絡(luò)得到的狀態(tài)值;A(s,a)為在狀態(tài)為s下執(zhí)行動(dòng)作a時(shí)通過神經(jīng)網(wǎng)絡(luò)得到的優(yōu)勢值;Q(s,a)為在狀態(tài)值V(s)和優(yōu)勢值A(chǔ)(s,a)的總和。

    在冗余覆蓋場景中,無人機(jī)強(qiáng)化學(xué)習(xí)模型中的狀態(tài)-動(dòng)作-獎(jiǎng)勵(lì)框架如下:

    3)獎(jiǎng)勵(lì)函數(shù):考慮到無人機(jī)續(xù)航能力有限,需要盡可能快地從分散的傳感器節(jié)點(diǎn)采集數(shù)據(jù),避免花費(fèi)大量時(shí)間和能耗采集冗余覆蓋部分?jǐn)?shù)據(jù)。因此,在建立獎(jiǎng)勵(lì)函數(shù)時(shí)需要兼顧正向和負(fù)向獎(jiǎng)勵(lì),定義如下:

    2.3 基于DDRL的全節(jié)點(diǎn)數(shù)據(jù)采集方法

    2.3.1 任務(wù)環(huán)境

    全節(jié)點(diǎn)數(shù)據(jù)采集與部分節(jié)點(diǎn)數(shù)據(jù)采集的區(qū)別是:(1)要求采集所有節(jié)點(diǎn)的數(shù)據(jù);(2)懸停位置不局限在節(jié)點(diǎn)的正上方;(3)在一個(gè)懸停位置可以采集多個(gè)在通信范圍內(nèi)的節(jié)點(diǎn)數(shù)據(jù)。

    全節(jié)點(diǎn)數(shù)據(jù)采集示意圖如圖5所示,設(shè)農(nóng)田為矩形區(qū)域,為定位無人機(jī)的懸停位置,將農(nóng)田區(qū)域離散為×個(gè)小柵格,每個(gè)小柵格中心是無人機(jī)可選的懸停點(diǎn)。柵格越小,對懸停位置的優(yōu)化程度越高,但算法復(fù)雜度越高。圖中三角形代表某個(gè)飛行策略確定的懸停采集點(diǎn),虛線代表飛行路徑。無人機(jī)在懸停點(diǎn)2采集傳感器b和c的數(shù)據(jù),在懸停點(diǎn)3采集傳感器d和e的數(shù)據(jù)。

    針對全節(jié)點(diǎn)數(shù)據(jù)采集場景,若直接采用DQN算法對系統(tǒng)進(jìn)行建模,會(huì)導(dǎo)致系統(tǒng)狀態(tài)空間維數(shù)爆炸、模型訓(xùn)練困難,無人機(jī)甚至難以完成數(shù)據(jù)采集任務(wù)。本文提出一種基于兩級深度強(qiáng)化學(xué)習(xí)(DDRL)的數(shù)據(jù)采集策略,將該問題分解為2個(gè)子問題進(jìn)行研究,以簡化模型,避免出現(xiàn)直接采用DQN算法產(chǎn)生的問題。分解后的2個(gè)子問題為:1)選擇無人機(jī)最優(yōu)采集區(qū)域,采用深度Q網(wǎng)絡(luò)(Deep Q Network,DQN)算法;2)在得到的最優(yōu)采集區(qū)域內(nèi),采用n步深度Q網(wǎng)絡(luò)(Option n-step Deep Q Network,OnDQN)算法選擇懸停位置以及確定遍歷順序。

    注:n0為矩形區(qū)域長度;k為小柵格長度;f為傳感器節(jié)點(diǎn);1~4為無人機(jī)懸停采集點(diǎn)。

    2.3.2 基于DQN的最優(yōu)采集區(qū)域選取

    3)獎(jiǎng)勵(lì)函數(shù):獎(jiǎng)勵(lì)函數(shù)由3個(gè)部分組成,其中能量效率表示當(dāng)前動(dòng)作執(zhí)行后采集的傳感器節(jié)點(diǎn)數(shù)增量與當(dāng)前動(dòng)作執(zhí)行所消耗的能量之比,如式(13)所示。

    注:1~7是根據(jù)傳感器節(jié)點(diǎn)通信范圍交疊情況劃分的子區(qū)域。

    Note:1-7is a sub-region divided by overlapping communication ranges of the sensor nodes.

    圖6 數(shù)據(jù)采集子區(qū)域的劃分示意圖

    Fig.6 Schematic diagram of data collection subarea division

    式中為負(fù)常數(shù)。

    另外,為避免無人機(jī)耗盡電量,在數(shù)據(jù)采集過程中,若無人機(jī)出現(xiàn)電量不足的情況也給出懲罰:

    式中為負(fù)常數(shù)。

    2.3.3 基于OnDQN的最優(yōu)航跡規(guī)劃

    無人機(jī)懸停點(diǎn)距離傳感器位置越遠(yuǎn),數(shù)據(jù)傳輸速率越低,懸停時(shí)間就越長。選定無人機(jī)的最優(yōu)采集子區(qū)域后,需對子區(qū)域的采集順序和懸停位置進(jìn)行決策,以平衡無人機(jī)的飛行距離與懸停時(shí)間,從而最大限度地減少無人機(jī)能耗。在該問題中,無人機(jī)動(dòng)作空間包括飛向某一子區(qū)域、懸停在子區(qū)域某個(gè)位置、數(shù)據(jù)采集3個(gè)動(dòng)作,本文采用基于選項(xiàng)(option)的分層強(qiáng)化學(xué)習(xí)思想來解決該問題[15,27],將狀態(tài)空間、動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)以及option建模如下:

    當(dāng)獎(jiǎng)勵(lì)函數(shù)為稀疏獎(jiǎng)勵(lì)時(shí),可能會(huì)導(dǎo)致算法學(xué)習(xí)效率低,甚至難以收斂[28]。本文采用n-step回報(bào)代替1-step回報(bào)來加快算法迭代速度[29]。定義n-step回報(bào)函數(shù)為

    需要說明的是,本文的研究基于一些假設(shè)前提:假定無人機(jī)勻速飛行,沒有考慮從懸停到起飛以及飛行到懸停的速度變化過程的能量消耗變化;假定無人機(jī)從一個(gè)位置到另一個(gè)位置是直線飛行,實(shí)際應(yīng)用中還需考慮無人機(jī)的轉(zhuǎn)向問題。

    3 仿真分析

    為驗(yàn)證節(jié)點(diǎn)數(shù)據(jù)采集算法的有效性,分別在冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景和全節(jié)點(diǎn)數(shù)據(jù)采集場景進(jìn)行仿真試驗(yàn),試驗(yàn)在windows10系統(tǒng)下進(jìn)行,處理器為AMD Ryzen 5 2500U,頻率為2.0 GHz。網(wǎng)絡(luò)架構(gòu)使用谷歌的開源Tensorflow模塊構(gòu)建,利用Python搭建深度強(qiáng)化學(xué)習(xí)仿真環(huán)境。表1為旋翼無人機(jī)的功率模型參數(shù)。

    表1 旋翼無人機(jī)參數(shù)

    3.1 冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景的仿真分析

    仿真假設(shè)在640 m×640 m的農(nóng)田隨機(jī)均勻部署20個(gè)無線傳感器節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)的感知覆蓋半徑均為80 m,無人機(jī)飛行速度為5 m/s,飛行高度為10 m,每個(gè)傳感器存儲(chǔ)的數(shù)據(jù)為160 kB。經(jīng)平衡運(yùn)算復(fù)雜度和優(yōu)化結(jié)果,將農(nóng)田離散為40 m×40 m的網(wǎng)格,共計(jì)256個(gè)網(wǎng)格單元。以覆蓋率和有效覆蓋平均能耗評估算法性能,定義如下:

    根據(jù)式(12)設(shè)置獎(jiǎng)勵(lì)函數(shù),在實(shí)際訓(xùn)練過程中發(fā)現(xiàn),負(fù)向獎(jiǎng)勵(lì)的取值范圍遠(yuǎn)大于正向獎(jiǎng)勵(lì),導(dǎo)致正向激勵(lì)幾乎不起作用。為此使用對數(shù)函數(shù)變換對原始獎(jiǎng)勵(lì)計(jì)算結(jié)果進(jìn)行歸一化處理:

    圖8為以最佳配置4作為獎(jiǎng)勵(lì)函數(shù)調(diào)節(jié)因子時(shí),DDDQN算法與DQN算法的學(xué)習(xí)差異。DDDQN的學(xué)習(xí)過程比DQN更穩(wěn)定,在學(xué)習(xí)結(jié)束時(shí)獲得更高的周期獎(jiǎng)勵(lì)。在調(diào)節(jié)因子配置4下DDDQN算法每個(gè)episode可獲得12的累積獎(jiǎng)勵(lì),而DQN最多只能獲得9的累積獎(jiǎng)勵(lì)。

    表2 調(diào)節(jié)因子配置

    注:,為獎(jiǎng)勵(lì)函數(shù)的調(diào)節(jié)因子,2為調(diào)節(jié)因子配置組編號。

    圖7 不同調(diào)節(jié)因子配置下的覆蓋率與有效覆蓋平均能耗

    圖8 DDQN和DQN算法的訓(xùn)練獎(jiǎng)勵(lì)值對比

    圖9為采集節(jié)點(diǎn)覆蓋率超過80%時(shí)DDDQN和DQN算法的無人機(jī)數(shù)據(jù)采集方案。經(jīng)計(jì)算,DDDQN算法的飛行距離為3.13 km,相比DQN算法的4.34 km,無人機(jī)能耗減少了27.9%,飛行距離縮短1.21 km。根據(jù)式(19)~(20)計(jì)算可得,DDDQN相比DQN的有效覆蓋平均能耗降低了26.3%。

    圖9 DDDQN和DQN算法的數(shù)據(jù)采集方案

    3.2 全節(jié)點(diǎn)數(shù)據(jù)采集場景的仿真與結(jié)果分析

    在仿真中,假設(shè)無線傳感器節(jié)點(diǎn)隨機(jī)分布在600 m×600 m的矩形區(qū)域內(nèi),將該矩形區(qū)域劃分為15 m×15 m的網(wǎng)格。設(shè)置矩形區(qū)域左下角為無人機(jī)的飛行起點(diǎn),飛行高度為10 m;無人機(jī)與傳感器節(jié)點(diǎn)間單位距離(1 m)的信噪比=34 dB;通信帶寬=10 kHz。

    圖10是不同條件下本文DDRL算法與經(jīng)典PSO-TSP算法的結(jié)果對比。PSO-TSP算法是在Chen[30]等提出的IGA方法的基礎(chǔ)上提出來的。PSO-TSP算法要求無人機(jī)遍歷每個(gè)節(jié)點(diǎn),在每個(gè)節(jié)點(diǎn)正上方懸停采集數(shù)據(jù)。

    圖10a是無人機(jī)的飛行速度對總能耗和總工作時(shí)間的影響。在仿真中設(shè)置20個(gè)傳感器,每個(gè)傳感器儲(chǔ)存的數(shù)據(jù)為160 kB,通信半徑為80 m。對于2種算法來說,飛行速度的增加都會(huì)減小無人機(jī)的總能耗和工作時(shí)間。在相同速度下,DDRL算法比PSO-TSP算法的能耗更低,當(dāng)速度較低時(shí)DDRL算法優(yōu)勢更明顯,無人機(jī)飛行速度為5 m/s時(shí),相比PSO-TSP,采用DDRL算法的無人機(jī)總能耗減少7.8%,工作時(shí)間減少9.2%。

    圖10b為節(jié)點(diǎn)數(shù)據(jù)負(fù)載量對無人機(jī)能耗的影響。仿真中傳感器節(jié)點(diǎn)數(shù)設(shè)置為20個(gè),傳感器的通信半徑分別設(shè)為60 和80 m。從圖10b中可以看出,本文DDRL算法在節(jié)點(diǎn)數(shù)據(jù)量較少(少于160 kB)的情況下比PSO-TSP算法的能耗低;通信半徑60 m時(shí)DDRL算法的優(yōu)勢較80 m更明顯。節(jié)點(diǎn)數(shù)據(jù)量變大后,相比PSO-TSP算法在節(jié)點(diǎn)正上方采集數(shù)據(jù)(距離近采集時(shí)間短),DDRL算法在每個(gè)懸停點(diǎn)采集多個(gè)節(jié)點(diǎn)數(shù)據(jù),由于有些節(jié)點(diǎn)的距離遠(yuǎn)導(dǎo)致采集時(shí)間延長,導(dǎo)致懸停時(shí)間和能耗加大,總能耗超過PSO-TSP算法,通信范圍大時(shí)更加明顯。隨著節(jié)點(diǎn)數(shù)據(jù)量增加,無人機(jī)飛行能耗占比減少,這是因?yàn)闊o人機(jī)懸停能耗增加。同等數(shù)據(jù)量前提下,DDRL算法的飛行能耗占比比PSO-TSP算法低,節(jié)點(diǎn)通信距離80 m時(shí)的飛行能耗占比比60 m時(shí)低,即懸停能耗占比高。

    圖10c是飛行速度對無人機(jī)懸停采集時(shí)間的影響。設(shè)置節(jié)點(diǎn)的水平通信距離為80 m,節(jié)點(diǎn)數(shù)據(jù)量為160 kB。由于PSO-TSP算法中無人機(jī)懸停在每個(gè)傳感器正上方采集數(shù)據(jù),數(shù)據(jù)傳輸距離近,故其懸停采集時(shí)間最低且不受飛行速度影響。而在DDRL算法中,懸停采集時(shí)間隨著飛行速度的增加而減少,這是因?yàn)镈DRL算法通過懸停點(diǎn)選擇和采集順序決策來優(yōu)化總能耗,飛行速度增加,飛行能耗變小,此時(shí)懸停能耗成為影響總能耗的主要因素。

    圖10d為水平通信距離60 m、節(jié)點(diǎn)數(shù)據(jù)量160 kB時(shí)傳感器節(jié)點(diǎn)個(gè)數(shù)對總能耗的影響。將本文DDRL算法與PSO-TSP及MEFC(Minimized Energy Flight Control)算法[31對比可知,MEFC算法考慮了無人機(jī)的飛行速度與轉(zhuǎn)彎角度對能耗的影響,找到最優(yōu)飛行速度并優(yōu)化了飛行軌跡,將懸停點(diǎn)規(guī)劃在傳感器傳輸范圍邊緣,使無人機(jī)以低能耗完成數(shù)據(jù)采集。從圖10d中可以看出,PSO-TSP的無人機(jī)總能耗最大,這是因?yàn)闊o人機(jī)需要飛到每個(gè)傳感器節(jié)點(diǎn)正上方采集數(shù)據(jù),由于飛行路徑增加使其飛行能耗大大增加。MEFC算法規(guī)劃的懸停點(diǎn)均在傳感器傳輸范圍邊緣,且未考慮傳輸范圍重疊的情況,雖然減少了飛行距離和飛行能耗,但增加了懸停點(diǎn)的數(shù)據(jù)傳輸時(shí)間,即增加了懸停時(shí)間和懸停能耗。隨著節(jié)點(diǎn)數(shù)量的增加,3種算法的總能耗都增加。因此在數(shù)據(jù)量不大的情況下,本文DDRL算法的總能耗較另兩種算法更具優(yōu)勢。

    DDRL: Double Deep Reinforcement Learning; PSO-TSP: Particle Swarm Optimization-Traveling Salesman Problem; MEFC: Minimized Energy Flight Control; 60,80: Horizontal communication distance, m.

    4 全節(jié)點(diǎn)數(shù)據(jù)采集算法的田間試驗(yàn)與結(jié)果分析

    針對全節(jié)點(diǎn)數(shù)據(jù)采集場景,本研究通過田間試驗(yàn)對所提方法進(jìn)行評估并驗(yàn)證其可行性。試驗(yàn)在廣州華南農(nóng)業(yè)大學(xué)增城教研基地開展,采用自制的四旋翼無人機(jī)在210 m×400 m的平坦農(nóng)田中進(jìn)行測試,無人機(jī)飛行高度為5 m。為了驗(yàn)證無人機(jī)接收數(shù)據(jù)的丟包率,同時(shí)對田間的通信路徑損耗進(jìn)行估測,以更精確地計(jì)算無人機(jī)懸停時(shí)間,利用2個(gè)DRF1609H型Zigbee模塊測試無人機(jī)接收模塊與地面數(shù)據(jù)發(fā)送模塊之間的丟包情況和接收信號強(qiáng)度值,其中地面數(shù)據(jù)發(fā)送模塊由Zigbee通信模塊與單片機(jī)STM32組成,DRF1609H型Zigbee模塊的發(fā)送功率為22 dbm。

    如圖11所示,無人機(jī)從地面節(jié)點(diǎn)正上方開始,每隔10 m水平距離,到與節(jié)點(diǎn)水平距離120m為止,當(dāng)?shù)孛婀?jié)點(diǎn)接收到無人機(jī)的數(shù)據(jù)請求后,發(fā)送200個(gè)數(shù)據(jù)包,每個(gè)數(shù)據(jù)包的長度為0.5 kB,丟包率測試結(jié)果如表3所示。接收信號強(qiáng)度值取每個(gè)位置采集10次數(shù)據(jù)的接收信號強(qiáng)度平均值。

    圖11 田間試驗(yàn)

    從表3中可以看出,在水平通信距離80 m以外,隨著測試距離的增加,丟包率增加,80 m以內(nèi)范圍滿足數(shù)據(jù)傳輸穩(wěn)定性要求。

    表3 水平通信距離對丟包率的影響

    采用MATLAB中的曲線擬合方法對路徑損耗模型進(jìn)行評估,確定水平通信距離與接收信號強(qiáng)度值之間的關(guān)系。如圖12所示,經(jīng)過多次試驗(yàn)發(fā)現(xiàn),指數(shù)函數(shù)的擬合效果最佳,田間ZigBee傳輸?shù)慕邮招盘枏?qiáng)度值RSSI與水平通信距離的關(guān)系為

    為了進(jìn)一步評估所提算法對無人機(jī)能耗優(yōu)化的效果,在無人機(jī)上配備電流計(jì)模塊獲取瞬時(shí)電流并計(jì)算無人機(jī)能耗。首先測試無人機(jī)的飛行功率和懸停功率,測試方案如下:無人機(jī)以5 m/s速度和5 m高度進(jìn)行勻速直線飛行100 m,利用每隔0.1 s獲取的瞬時(shí)電流和電壓計(jì)算無人機(jī)的飛行功率。同理,計(jì)算單位時(shí)間內(nèi)無人機(jī)的懸停能耗。經(jīng)過實(shí)際測試,本試驗(yàn)所采用的四旋翼無人機(jī)的平均飛行功率為746.38 W,平均懸停功率為771.86 W,無人機(jī)電池的最大容量為22 000 mAh。

    最后,在田間隨機(jī)布置11個(gè)Zigbee模塊模擬節(jié)點(diǎn),結(jié)合田間路徑損耗模型,運(yùn)行算法得到DDRL算法及PSO-TSP算法規(guī)劃的懸停點(diǎn)、懸停時(shí)間及采集順序,然后令無人機(jī)按照規(guī)劃方案進(jìn)行數(shù)據(jù)采集試驗(yàn)。設(shè)置節(jié)點(diǎn)數(shù)據(jù)量為160 kB,數(shù)據(jù)包長度為0.5 kB,無人機(jī)飛行高度5 m,飛行速度5 m/s。圖13a為PSO-TSP算法的飛行路徑;圖 13b為本文算法DDRL優(yōu)化的懸停點(diǎn)和飛行路徑。最終的試驗(yàn)結(jié)果表明,DDRL算法的無人機(jī)總能耗為354.56 kJ,飛行距離為1 189.23 m,丟包率為0.28%;PSO-TSP算法的總能耗為400.83 kJ,飛行距離為1 556.21 m,丟包率為0.15%。相比PSO-TSP,DDRL算法的總能耗減少了11.5%,飛行路徑減少了366.98 m;DDRL算法的丟包率略高于PSO-TSP算法,這是因?yàn)镈DRL算法的規(guī)劃方案中無人機(jī)懸停采集點(diǎn)不在節(jié)點(diǎn)正上方,且在一個(gè)懸停點(diǎn)采集多個(gè)節(jié)點(diǎn)數(shù)據(jù),而PSO-TSP算法的規(guī)劃方案中無人機(jī)懸停在節(jié)點(diǎn)正上方采集數(shù)據(jù),丟包概率降低。

    圖13 PSO-TSP和DDRL算法無人機(jī)懸停點(diǎn)及數(shù)據(jù)采集順序示意圖

    5 結(jié) 論

    利用無人機(jī)采集田間無線傳感器節(jié)點(diǎn)數(shù)據(jù),能克服農(nóng)田無網(wǎng)絡(luò)基礎(chǔ)設(shè)施及節(jié)點(diǎn)多跳轉(zhuǎn)發(fā)數(shù)據(jù)耗電快、網(wǎng)絡(luò)生命周期短的問題。本研究將節(jié)點(diǎn)采集的情況分為感知冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集及全節(jié)點(diǎn)數(shù)據(jù)采集兩個(gè)場景,基于深度強(qiáng)化學(xué)習(xí)規(guī)劃無人機(jī)的節(jié)點(diǎn)選擇、懸停位置及采集順序,以節(jié)省無人機(jī)能耗縮短任務(wù)完成時(shí)間。感知冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集方案適用于節(jié)點(diǎn)間冗余覆蓋面積比例比較高,無人機(jī)能量無法完成所有節(jié)點(diǎn)的數(shù)據(jù)采集任務(wù),以及對數(shù)據(jù)的完整性要求不高的應(yīng)用場景;全節(jié)點(diǎn)數(shù)據(jù)采集方案適用于對數(shù)據(jù)有完整性要求的應(yīng)用場景。通過對研究結(jié)果的分析,得到以下結(jié)論:

    1)在考慮感知冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景中,采用競爭雙重深度Q網(wǎng)絡(luò)(DDDQN)算法選擇采集節(jié)點(diǎn)及規(guī)劃采集順序,提高了無人機(jī)的能效和減少了冗余數(shù)據(jù)的采集。仿真驗(yàn)證了在相同配置下,DDDQN算法比DQN算法的覆蓋率和平均能耗更優(yōu),算法性能更加穩(wěn)定;在相同的覆蓋率要求下,DDDQN算法比DQN算法的飛行距離縮短了1.21 km,能耗減少了27.9%。

    2)在全節(jié)點(diǎn)數(shù)據(jù)采集場景中,提出了兩級深度強(qiáng)化學(xué)習(xí)(DDRL)算法對無人機(jī)的懸停位置及采集順序進(jìn)行優(yōu)化,減少了無人機(jī)完成任務(wù)時(shí)的總能耗。本文從傳感器不同數(shù)據(jù)負(fù)載量、無人機(jī)飛行速度、傳感器節(jié)點(diǎn)數(shù)量對DDRL與PSO-TSP及MEFC算法的總能耗、總時(shí)間、飛行能耗占比、懸停采集時(shí)間進(jìn)行仿真對比,結(jié)果證明無人機(jī)采用DDRL算法采集數(shù)據(jù)的總能耗最低。最后,通過田間試驗(yàn)測試了四旋翼無人機(jī)的飛行功率與懸停功率,并對DDRL算法及經(jīng)典PSO-TSP算法的采集方案進(jìn)行了實(shí)際田間飛行試驗(yàn)。結(jié)果表明,DDRL算法能同時(shí)考慮飛行距離與數(shù)據(jù)傳輸時(shí)間兩個(gè)因素,在采集相同的數(shù)據(jù)情況下較PSO-TSP算法能耗降低了11.5%。

    [1] García L, Parra L, Jimenez J M, et al. DronAway: A proposal on the use of remote sensing drones as mobile gateway for WSN in precision agriculture[J]. Applied Sciences, 2020, 10(19): 6668.

    [2] 宋成寶,柳平增,劉興華,等. 基于HSIC的日光溫室溫度傳感器優(yōu)化配置策略[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022, 38(8):200-207.

    Song Chengbao, Liu Pingzeng, Liu Xinghua, et al. Optimal configuration strategy for temperature sensors in solar greenhouse based on HSIC[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(8): 200-207. (in Chinese with English abstract)

    [3] Bandur D, Jaksic B, Bandur M, et al. An analysis of energy efficiency in Wireless Sensor Networks (WSNs) applied in smart agriculture[J]. Computers and Electronics in Agriculture, 2019, 156: 500-507.

    [4] Polo J, Hornero G, Duijneveld C, et al. Design of a low-cost wireless sensor network with UAV mobile node for agricultural applications[J]. Computers and Electronics in Agriculture, 2015, 119: 19-32.

    [5] Zhang B T, Meng L Y. Energy efficiency analysis of wireless sensor networks in precision agriculture economy[J]. Scientific Programming, 2021, 2021: 8346708.

    [6] Huang S C, Chang H Y. A farmland multimedia data collection method using mobile sink for wireless sensor networks[J]. Multimedia Tools and Applications, 2017, 76(19): 19463-19478.

    [7] Singh P K, Sharma A. An intelligent WSN-UAV-based IoT framework for precision agriculture application[J]. Computers and Electrical Engineering, 2022, 100: 107912.

    [8] Yemeni Z, Wang H, Ismael W M, et al. Reliable spatial and temporal data redundancy reduction approach for WSN[J]. Computer Networks, 2021, 185: 107701.

    [9] Kumar S, Chaurasiya V K. A strategy for elimination of data redundancy in internet of things (IoT) based wireless sensor network(WSN)[J]. IEEE Systems Journal, 2018, 13(2): 1650-1657.

    [10] Rezende J D V, da Silva R I, Souza M J F. Gathering big data in wireless sensor networks by drone(dagger)[J]. Sensors, 2020, 20(23): 6954.

    [11] Luo C W, Chen W P, Li D Y, et al. Optimizing flight trajectory of UAV for efficient data collection in wireless sensor networks[J]. Theoretical Computer Science, 2021, 853: 25-42.

    [12] Ben Ghorbel M, Rodríguez-Duarte D, Ghazzai H, et al. Joint position and travel path optimization for energy efficient wireless data gathering using unmanned aerial vehicles[J]. IEEE Transactions on Vehicular Technology, 2019, 68(3): 2165-2175.

    [13] Gong J, Chang T H, Shen C, et al. Flight time minimization of UAV for data collection over wireless sensor networks[J]. IEEE Journal on Selected Areas in Communications, 2018, 36(9): 1942-1954.

    [14] Just G E, Pellenz M E, Lima L A D, et al. UAV path optimization for precision agriculture wireless sensor networks[J]. Sensors, 2020, 20(21): 6098.

    [15] Zhang Y, Mou Z Y, Gao F F, et al. Hierarchical deep reinforcement learning for backscattering data collection with multiple UAVs[J]. IEEE Internet of Things Journal, 2021, 8(5): 3786-3800.

    [16] 蔣寶慶,陳宏濱. 基于Q學(xué)習(xí)的無人機(jī)輔助WSN數(shù)據(jù)采集軌跡規(guī)劃[J]. 計(jì)算機(jī)工程,2021,47(4):127-134.

    Jiang Baoqin, Chen Hongbin. Trajectory planning for unmanned aerial vehicle assisted WSN data collection based on Q-Learning[J]. Computer Engineering, 2021, 47(4): 127-134. (in Chinese with English abstract)

    [17] Yi M J, Wang X J, Liu J, et al. Deep reinforcement learning for fresh data collection in UAV-assisted IoT networks[C]//IEEE INFOCOM 2020-IEEE Conference on Computer Communications Workshops (INFOCOM WKSHPS). Toronto, ON, Canada: IEEE, 2020: 716-721.

    [18] 付澍,楊祥月,張海君,等. 物聯(lián)網(wǎng)數(shù)據(jù)收集中無人機(jī)路徑智能規(guī)劃[J]. 通信學(xué)報(bào),2021,42(2):124-133.

    Fu Shu, Yang Xiangyue, Zhang Haijun, et al. UAV path intelligent planning in IoT data collection[J]. Journal on Communications, 2021, 42(2): 124-133. (in Chinese with English abstract)

    [19] Zeng Y, Xu J, Zhang R. Energy minimization for wireless communication with Rotary-Wing UAV[J]. IEEE Transactions on Wireless Communications, 2019, 18(4): 2329-2345.

    [20] Padakandla S. A survey of reinforcement learning algorithms for dynamically varying environments[J]. ACM Computing Surveys, 2021, 54(6): 127.

    [21] 陳佳盼,鄭敏華. 基于深度強(qiáng)化學(xué)習(xí)的機(jī)器人操作行為研究綜述[J]. 機(jī)器人,2022,44(2):236-256.

    Chen Jiapan, Zheng Minhua. A survey of robot manipulation behavior research based on deep reinforcement learning[J]. Robet, 2022, 44(2): 236-256. (in Chinese with English abstract)

    [22] Fenjiro Y, Benbrahim H. Deep reinforcement learning overview of the state of the art[J]. Journal of Automation, Mobile Robotics and Intelligent Systems, 2018, 12: 20-39.

    [23] 張自東,邱才明,張東霞,等. 基于深度強(qiáng)化學(xué)習(xí)的微電網(wǎng)復(fù)合儲(chǔ)能協(xié)調(diào)控制方法[J]. 電網(wǎng)技術(shù),2019,43(6):1914-1921.

    Zhang Zidong, Qiu Caiming, Zhang Dongxia, et al. A coordinated control method for hybrid energy storage system in microgrid based on deep reinforcement learning[J]. Power System Technology, 2019, 43(6): 1914-1921. (in Chinese with English abstract)

    [24] Zhang W Y, Gai J Y, Zhang Z G, et al. Double-DQN based path smoothing and tracking control method for robotic vehicle navigation[J]. Computers and Electronics in Agriculture, 2019, 166: 104985.

    [25] Wang Z Y, Schaul T, Hessel M, et al. Dueling network architectures for deep reinforcement learning[C]. //In Proceedings of the 33rd International Conference on International Conference on Machine Learning. New York, NY, USA: ICML, 2016: 1995-2003.

    [26] Kumar H, Mammen P M, Ramamritham K. Explainable AI: deep reinforcement learning agents for residential demand side cost savings in smart grids[J]. arXiv e-prints, 2019: 1910. 08719.

    [27] 趙銘慧,張雪波,郭憲,等. 基于分層強(qiáng)化學(xué)習(xí)的通用裝配序列規(guī)劃算法[J]. 控制與決策,2022,37(4):861-870.

    Zhao Minghui, Zhang Xuebo, Guo Xian, et al. A general assembly sequence planning algorithm based on hierarchical reinforcement learning[J], Control and Decision, 2022, 37(4): 861-870. (in Chinese with English abstract)

    [28] 楊惟軼,白辰甲,蔡超,等. 深度強(qiáng)化學(xué)習(xí)中稀疏獎(jiǎng)勵(lì)問題研究綜述[J]. 計(jì)算機(jī)科學(xué),2020,47(3):182-191.

    Yang Weiyi, Bai Chenjia, Cai Chao, et al. Survey on sparse reward in deep reinforcement learning[J]. Computer Science. 2020, 47(3): 182-191. (in Chinese with English abstract)

    [29] Hernandez-Garcia J F, Sutton R S. Understanding multi-step deep reinforcement learning: A systematic study of the DQN target[J]. arXiv e-prints, 2019:1901. 07510.

    [30] Chen J, Ye F, Li Y B. Travelling salesman problem for UAV path planning with two parallel optimization algorithms[C]//2017 Progress in Electromagnetics Research Symposium-Fall(PIERS-FALL). Singapore, 2017: 832-837.

    [31] 吳媚. 工業(yè)物聯(lián)網(wǎng)環(huán)境下面向能耗優(yōu)化的無人機(jī)飛行規(guī)劃系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 南京:東南大學(xué),2019.

    Wu Mei. Energy Efficient UAV Flight Planning System for the Industrial IoT Environment[D]. Nanjing:Southeast University, 2019. (in Chinese with English abstract)

    UAV collection methods for the farmland nodes data based on deep reinforcement learning

    Hu Jie1,3, Zhang Yali2,3※, Wang Tuan1, Wang Mengcheng1, Lan Yubin1,3, Zhang Zhixun2

    (1.,,510642,; 2.,,510642,; 3.,510642,)

    Unmanned Aerial Vehicle (UAV) has been widely used to collect data from the wireless sensor node in fields. Some problems can be solved in this case, such as no network infrastructure in farmland, fast power consumption of multi-hop data forwarding, premature death of nodes near the gateway, and shortened network life cycle. However, the multiple nodes overlapping can often occur during UAVs collection at the same time, due to the possible redundancy of adjacent sensor data. In this study, a UAV data collection method was proposed to plan the node selection, hovering position, and collecting order using improved deep reinforcement learning. The UAV data collection from the sensor nodes was then divided into two scenarios: data collection from the partial nodes under perceptual redundancy coverage, and data collection from all nodes. The optimization was made to save the UAV energy consumption in less mission completion time. The data collection of partial nodes under perceived redundancy coverage was suitable for the relatively high proportion of redundant coverage area among nodes. The UAV energy also failed to complete the data collection tasks of all nodes, indicating the low requirements of data integrity. By contrast, the all-node data collection fully met the high requirement of data integrity. In the scenario of partial node data collection with perceived redundant coverage, the Dueling Double Deep Q Network (DDDQN) was used to select the collection nodes and then plan the collecting order, indicating the high energy efficiency of the UAV with the less redundant data. Simulation results show that the DDDQN presented greater data coverage and lower effective coverage average energy consumption than the Deep Q Network (DQN) under the same configuration. The training process of DDDQN was more stable than that of DQN, particularly for the higher returns at the end of learning. More importantly, the flight distance and energy consumption of the DDDQN were reduced by 1.21 km, and 27.9%, respectively, compared with the DQN. In the scenario of all-node data collection, a Double Deep Reinforcement Learning (DDRL) was proposed to optimize the hovering position and UAV collection sequence, in order to minimize the total energy consumption of the UAV during data collection. A comparison was made on the DDRL with the classical PSO-TSP and MEFC. A systematic evaluation was made to clarify the impact of the UAV flight speed on the total energy consumption and total working time, the impact of different node data loads on the UAV energy consumption, the impact of different flight speeds on the UAV hover collection time, and the impact of the number of sensor nodes on the total energy consumption. The simulation results show that the total energy consumption of the improved model was at least 6.3% less than that of the classical PSO-based Travel Salesman Problem (PSO-TSP), and the Minimized Energy Flight Control (MEFC) under different node numbers and UAV flight speeds, especially at the data load of a single node less than 160 kB. Finally, the flight and hover powers of the quadrotor UAV were tested to determine the packet loss rate and received signal strength of the UAV in the field experiments. The actual field flight experiments were carried out on the DDRL and the data collection of the classical PSO-TSP. Field experiment results show that the DDRL-based data collection was reduced by 11.5% for the total energy consumption of UAV, compared with the PSO-TSP. The DDDQN and DDRL approaches can be expected to provide the optimal energy consumption for the UAVs' data collection of wireless sensor nodes in the field.

    UAV; deep reinforcement learning; node data collection; perceptual redundancy; DQN; DRL

    10.11975/j.issn.1002-6819.2022.22.005

    S126;S-3

    A

    1002-6819(2022)-22-0041-11

    胡潔,張亞莉,王團(tuán),等. 基于深度強(qiáng)化學(xué)習(xí)的農(nóng)田節(jié)點(diǎn)數(shù)據(jù)無人機(jī)采集方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(22):41-51.doi:10.11975/j.issn.1002-6819.2022.22.005 http://www.tcsae.org

    Hu Jie, Zhang Yali, Wang Tuan, et al. UAV collection methods for the farmland nodes data based on deep reinforcement learning[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(22): 41-51. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2022.22.005 http://www.tcsae.org

    2022-07-21

    2022-10-27

    高等學(xué)校學(xué)科創(chuàng)新引智計(jì)劃項(xiàng)目(D18019);國家自然科學(xué)基金項(xiàng)目(32271997);廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目(2019B020221001);廣東省科技計(jì)劃項(xiàng)目(2018A050506073)

    胡潔,博士,副教授,研究方向?yàn)檗r(nóng)業(yè)人工智能,農(nóng)業(yè)物聯(lián)網(wǎng)。Email:hjgz79@scau.edu.cn

    張亞莉,博士,副教授,研究方向?yàn)檗r(nóng)業(yè)航空傳感器技術(shù)與農(nóng)產(chǎn)品產(chǎn)地環(huán)境監(jiān)測。Email:ylzhang@scau.edu.cn

    猜你喜歡
    能耗深度傳感器
    120t轉(zhuǎn)爐降低工序能耗生產(chǎn)實(shí)踐
    昆鋼科技(2022年2期)2022-07-08 06:36:14
    能耗雙控下,漲價(jià)潮再度來襲!
    康奈爾大學(xué)制造出可拉伸傳感器
    探討如何設(shè)計(jì)零能耗住宅
    深度理解一元一次方程
    簡述傳感器在物聯(lián)網(wǎng)中的應(yīng)用
    電子制作(2019年22期)2020-01-14 03:16:52
    “傳感器新聞”會(huì)帶來什么
    傳媒評論(2019年5期)2019-08-30 03:50:18
    跟蹤導(dǎo)練(三)2
    深度觀察
    深度觀察
    欧美乱码精品一区二区三区| ponron亚洲| 国产av在哪里看| 免费电影在线观看免费观看| 一夜夜www| 亚洲欧美激情综合另类| 亚洲在线观看片| 岛国在线观看网站| 午夜福利18| 在线免费观看的www视频| 日本免费a在线| 成人性生交大片免费视频hd| 免费一级毛片在线播放高清视频| 亚洲国产高清在线一区二区三| 婷婷六月久久综合丁香| 色精品久久人妻99蜜桃| 午夜久久久久精精品| 在线十欧美十亚洲十日本专区| 午夜福利在线在线| 九九热线精品视视频播放| 十八禁人妻一区二区| 成人三级做爰电影| 熟妇人妻久久中文字幕3abv| 亚洲乱码一区二区免费版| 成年女人永久免费观看视频| 毛片女人毛片| 久久人妻av系列| 亚洲av成人一区二区三| 亚洲av成人不卡在线观看播放网| 久久久国产精品麻豆| 久久久国产成人免费| 99热这里只有是精品50| 1000部很黄的大片| 国产91精品成人一区二区三区| av在线天堂中文字幕| 99久久国产精品久久久| 欧美高清成人免费视频www| 精品电影一区二区在线| 欧美性猛交黑人性爽| 一级作爱视频免费观看| 黑人欧美特级aaaaaa片| 美女扒开内裤让男人捅视频| 神马国产精品三级电影在线观看| 又粗又爽又猛毛片免费看| 国产一区二区三区视频了| 婷婷亚洲欧美| 亚洲中文字幕一区二区三区有码在线看 | 久久精品影院6| 琪琪午夜伦伦电影理论片6080| 叶爱在线成人免费视频播放| 黄片大片在线免费观看| 亚洲欧美日韩高清在线视频| 精品电影一区二区在线| 久久久精品欧美日韩精品| bbb黄色大片| 免费在线观看日本一区| 国产99白浆流出| 久久久久久久久久黄片| 久久久国产成人免费| 怎么达到女性高潮| 久久欧美精品欧美久久欧美| 午夜亚洲福利在线播放| 欧美极品一区二区三区四区| 免费av不卡在线播放| 国内揄拍国产精品人妻在线| 性色avwww在线观看| 精品久久久久久久久久久久久| 亚洲色图av天堂| 亚洲国产看品久久| 午夜福利在线观看吧| 欧洲精品卡2卡3卡4卡5卡区| 一区二区三区激情视频| 国产亚洲欧美在线一区二区| 亚洲一区高清亚洲精品| 国产乱人伦免费视频| 日本 av在线| 亚洲黑人精品在线| 精品久久久久久久久久久久久| 精品不卡国产一区二区三区| 久久精品影院6| 别揉我奶头~嗯~啊~动态视频| 一级毛片女人18水好多| 亚洲精品在线观看二区| 91久久精品国产一区二区成人 | 高清在线国产一区| 黄色 视频免费看| 亚洲av成人av| 免费在线观看亚洲国产| 婷婷亚洲欧美| 五月玫瑰六月丁香| 午夜激情欧美在线| 怎么达到女性高潮| 久久国产精品影院| 亚洲18禁久久av| 一本一本综合久久| 国产成人精品久久二区二区免费| 91av网一区二区| 狠狠狠狠99中文字幕| 色综合欧美亚洲国产小说| 国产精品乱码一区二三区的特点| 久久亚洲精品不卡| 欧美乱妇无乱码| 国产探花在线观看一区二区| 欧美日本亚洲视频在线播放| 精品久久久久久久末码| 亚洲av中文字字幕乱码综合| 少妇人妻一区二区三区视频| 中亚洲国语对白在线视频| 国产av一区在线观看免费| 变态另类成人亚洲欧美熟女| 久久久水蜜桃国产精品网| 成人性生交大片免费视频hd| 日韩国内少妇激情av| 午夜a级毛片| 国模一区二区三区四区视频 | 亚洲国产欧洲综合997久久,| 色播亚洲综合网| 国内揄拍国产精品人妻在线| 最好的美女福利视频网| 国产野战对白在线观看| 美女免费视频网站| 免费电影在线观看免费观看| 午夜福利免费观看在线| 两个人视频免费观看高清| 桃红色精品国产亚洲av| 狂野欧美白嫩少妇大欣赏| 欧美极品一区二区三区四区| 亚洲在线自拍视频| 日韩国内少妇激情av| 成年女人看的毛片在线观看| 丁香欧美五月| 丰满人妻一区二区三区视频av | 国产主播在线观看一区二区| 亚洲欧美日韩高清专用| 国产精品99久久久久久久久| 香蕉av资源在线| 男人和女人高潮做爰伦理| 精品国内亚洲2022精品成人| 搡老岳熟女国产| 久久亚洲真实| 夜夜躁狠狠躁天天躁| 91字幕亚洲| 国内毛片毛片毛片毛片毛片| 日本三级黄在线观看| 日本黄色视频三级网站网址| 精品久久久久久久毛片微露脸| 久久久久国产一级毛片高清牌| 国产黄片美女视频| 美女高潮喷水抽搐中文字幕| 亚洲精品456在线播放app | 日韩 欧美 亚洲 中文字幕| 88av欧美| 亚洲无线在线观看| 高清毛片免费观看视频网站| 免费看日本二区| 一级毛片高清免费大全| 亚洲精品在线美女| 久久婷婷人人爽人人干人人爱| 日韩欧美免费精品| 18禁黄网站禁片午夜丰满| 一本精品99久久精品77| 亚洲色图av天堂| 最好的美女福利视频网| 久久精品综合一区二区三区| 久久性视频一级片| 国产精品 欧美亚洲| 国产精品一区二区三区四区免费观看 | 桃色一区二区三区在线观看| 日韩欧美免费精品| 国产久久久一区二区三区| 亚洲国产欧美网| 午夜福利18| 男女之事视频高清在线观看| 欧美极品一区二区三区四区| 亚洲专区字幕在线| 亚洲欧美日韩无卡精品| or卡值多少钱| 日韩有码中文字幕| 日日夜夜操网爽| 国产乱人视频| 极品教师在线免费播放| 99热6这里只有精品| 国产亚洲精品av在线| 国产99白浆流出| 国产91精品成人一区二区三区| 美女cb高潮喷水在线观看 | 巨乳人妻的诱惑在线观看| 制服丝袜大香蕉在线| 成人三级做爰电影| 亚洲va日本ⅴa欧美va伊人久久| 久久欧美精品欧美久久欧美| 深夜精品福利| 男女视频在线观看网站免费| 国产单亲对白刺激| 搞女人的毛片| 最好的美女福利视频网| 久久久国产精品麻豆| 国产精品美女特级片免费视频播放器 | 在线观看免费视频日本深夜| 男人舔女人下体高潮全视频| 两个人视频免费观看高清| 欧美一级毛片孕妇| 成人永久免费在线观看视频| 欧美又色又爽又黄视频| 淫秽高清视频在线观看| 99久久精品国产亚洲精品| 成人精品一区二区免费| 国产精品久久久久久亚洲av鲁大| 桃红色精品国产亚洲av| 韩国av一区二区三区四区| 国产伦精品一区二区三区视频9 | 999久久久精品免费观看国产| 国产精品精品国产色婷婷| 日本在线视频免费播放| 日韩成人在线观看一区二区三区| 亚洲人成电影免费在线| 麻豆成人av在线观看| 色综合站精品国产| 男女那种视频在线观看| 一a级毛片在线观看| 亚洲国产色片| 国产精品久久久久久久电影 | 成年免费大片在线观看| 亚洲国产高清在线一区二区三| 黄色视频,在线免费观看| 色尼玛亚洲综合影院| 欧美+亚洲+日韩+国产| 亚洲精华国产精华精| 午夜日韩欧美国产| 一二三四社区在线视频社区8| 亚洲第一欧美日韩一区二区三区| 国内精品一区二区在线观看| 国产精品久久久人人做人人爽| 精品一区二区三区视频在线 | av国产免费在线观看| 叶爱在线成人免费视频播放| 国产精品永久免费网站| 国内少妇人妻偷人精品xxx网站 | 久久久久免费精品人妻一区二区| 老汉色av国产亚洲站长工具| 99久久成人亚洲精品观看| 999久久久国产精品视频| 欧美zozozo另类| 窝窝影院91人妻| 色噜噜av男人的天堂激情| 欧美日韩福利视频一区二区| 中文亚洲av片在线观看爽| 免费看美女性在线毛片视频| 国产精品野战在线观看| 国产精品,欧美在线| 成年免费大片在线观看| 悠悠久久av| 最近最新中文字幕大全免费视频| 国产伦精品一区二区三区四那| 久久精品aⅴ一区二区三区四区| 国产成人一区二区三区免费视频网站| 欧美日韩黄片免| 欧美激情在线99| 国产精品电影一区二区三区| 97超视频在线观看视频| 亚洲第一电影网av| 国产真人三级小视频在线观看| 国产真实乱freesex| h日本视频在线播放| 亚洲av电影在线进入| 国产高清videossex| 精品人妻1区二区| 亚洲成av人片免费观看| 久久国产精品影院| 色播亚洲综合网| 黑人操中国人逼视频| 宅男免费午夜| 欧洲精品卡2卡3卡4卡5卡区| 搡老岳熟女国产| 国产麻豆成人av免费视频| 黄色成人免费大全| 亚洲国产精品成人综合色| 一级毛片高清免费大全| 亚洲熟妇熟女久久| 最近最新中文字幕大全电影3| 亚洲自拍偷在线| 久99久视频精品免费| 在线观看免费视频日本深夜| 男女视频在线观看网站免费| 亚洲欧美日韩东京热| 露出奶头的视频| 久久人妻av系列| 99re在线观看精品视频| 欧美丝袜亚洲另类 | 国产精品久久久久久人妻精品电影| 在线国产一区二区在线| 变态另类丝袜制服| 久久人妻av系列| 一区福利在线观看| 精品日产1卡2卡| 波多野结衣高清无吗| 久久久色成人| 国产亚洲精品久久久久久毛片| 俄罗斯特黄特色一大片| 中文字幕av在线有码专区| 日韩欧美三级三区| 亚洲男人的天堂狠狠| 国产三级在线视频| 18禁黄网站禁片午夜丰满| 国产99白浆流出| 日本 欧美在线| 久久精品亚洲精品国产色婷小说| 嫩草影院精品99| 日韩大尺度精品在线看网址| 99精品欧美一区二区三区四区| 欧美日韩亚洲国产一区二区在线观看| 91av网一区二区| 久久久久性生活片| 神马国产精品三级电影在线观看| 成人性生交大片免费视频hd| 12—13女人毛片做爰片一| 成人无遮挡网站| www日本在线高清视频| 90打野战视频偷拍视频| 天堂av国产一区二区熟女人妻| 亚洲精品色激情综合| 成人18禁在线播放| 九九久久精品国产亚洲av麻豆 | 好男人电影高清在线观看| 禁无遮挡网站| 国产精品亚洲一级av第二区| 亚洲av熟女| 久久久久免费精品人妻一区二区| 嫩草影院精品99| 国产av麻豆久久久久久久| www.999成人在线观看| 国内久久婷婷六月综合欲色啪| 国产成人系列免费观看| 成年女人毛片免费观看观看9| 日韩精品青青久久久久久| 麻豆成人午夜福利视频| 麻豆久久精品国产亚洲av| 18美女黄网站色大片免费观看| 欧美日韩瑟瑟在线播放| 岛国在线免费视频观看| 日韩精品中文字幕看吧| 一个人观看的视频www高清免费观看 | 在线视频色国产色| 少妇的丰满在线观看| 女人高潮潮喷娇喘18禁视频| 很黄的视频免费| 12—13女人毛片做爰片一| 给我免费播放毛片高清在线观看| 中文亚洲av片在线观看爽| 麻豆av在线久日| 亚洲av五月六月丁香网| 欧美黑人巨大hd| 日韩国内少妇激情av| 偷拍熟女少妇极品色| 在线观看舔阴道视频| 90打野战视频偷拍视频| 少妇的逼水好多| 99热只有精品国产| 国产在线精品亚洲第一网站| 亚洲国产欧洲综合997久久,| 国产精品 欧美亚洲| 热99在线观看视频| www.熟女人妻精品国产| 草草在线视频免费看| 婷婷丁香在线五月| 国产又色又爽无遮挡免费看| 亚洲avbb在线观看| avwww免费| 国产成人欧美在线观看| 午夜福利18| 桃色一区二区三区在线观看| 欧美日本亚洲视频在线播放| 久久草成人影院| 少妇人妻一区二区三区视频| 欧美3d第一页| 在线视频色国产色| 精品日产1卡2卡| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲一区高清亚洲精品| 国产乱人伦免费视频| 男女视频在线观看网站免费| 国产精品99久久99久久久不卡| 亚洲国产欧美一区二区综合| 黑人巨大精品欧美一区二区mp4| 国产精品 国内视频| 黄色日韩在线| 最近最新免费中文字幕在线| 女同久久另类99精品国产91| 久久午夜亚洲精品久久| 日本免费一区二区三区高清不卡| 非洲黑人性xxxx精品又粗又长| 精品电影一区二区在线| 欧美色欧美亚洲另类二区| 午夜福利在线在线| 精品久久蜜臀av无| 午夜免费成人在线视频| 欧美中文日本在线观看视频| av欧美777| 国产久久久一区二区三区| 国产精品av视频在线免费观看| 精品99又大又爽又粗少妇毛片 | 淫妇啪啪啪对白视频| 亚洲av美国av| 成人欧美大片| 天天添夜夜摸| 又黄又粗又硬又大视频| 男女之事视频高清在线观看| 国产乱人伦免费视频| 99久久无色码亚洲精品果冻| 日韩中文字幕欧美一区二区| 麻豆国产av国片精品| 99久久久亚洲精品蜜臀av| 国产真实乱freesex| 日韩人妻高清精品专区| 色视频www国产| 搡老岳熟女国产| 欧美日韩亚洲国产一区二区在线观看| 在线永久观看黄色视频| 怎么达到女性高潮| 国产精品爽爽va在线观看网站| 少妇的逼水好多| 国内毛片毛片毛片毛片毛片| 久久久久国产精品人妻aⅴ院| 欧美zozozo另类| av福利片在线观看| 桃红色精品国产亚洲av| 国产爱豆传媒在线观看| 欧美黄色淫秽网站| 亚洲国产看品久久| 欧美大码av| www.999成人在线观看| 国产av麻豆久久久久久久| a级毛片a级免费在线| 又黄又粗又硬又大视频| 嫩草影院入口| 国产一区二区三区视频了| 国产美女午夜福利| 亚洲成人精品中文字幕电影| 法律面前人人平等表现在哪些方面| 欧美午夜高清在线| 免费在线观看日本一区| 国产精品av久久久久免费| 亚洲人成网站在线播放欧美日韩| 18禁裸乳无遮挡免费网站照片| 国产精品亚洲一级av第二区| 精品熟女少妇八av免费久了| 男女那种视频在线观看| 国产一区二区三区视频了| 嫩草影院入口| 少妇熟女aⅴ在线视频| 色综合站精品国产| 久久午夜亚洲精品久久| av福利片在线观看| 51午夜福利影视在线观看| 国产aⅴ精品一区二区三区波| 国产三级在线视频| 一级作爱视频免费观看| 亚洲精品一卡2卡三卡4卡5卡| 日本免费a在线| 99国产精品99久久久久| 岛国视频午夜一区免费看| 亚洲国产精品久久男人天堂| 日韩成人在线观看一区二区三区| 狂野欧美白嫩少妇大欣赏| 精品一区二区三区视频在线观看免费| 啪啪无遮挡十八禁网站| 欧美乱色亚洲激情| 欧美性猛交黑人性爽| 国产探花在线观看一区二区| 午夜免费观看网址| 日韩欧美在线二视频| 精华霜和精华液先用哪个| aaaaa片日本免费| 欧美一区二区精品小视频在线| 午夜福利视频1000在线观看| 老司机在亚洲福利影院| 国产伦人伦偷精品视频| 国产熟女xx| 90打野战视频偷拍视频| 一级毛片精品| 哪里可以看免费的av片| xxx96com| 免费av毛片视频| 麻豆成人午夜福利视频| 欧美日韩福利视频一区二区| 久久精品亚洲精品国产色婷小说| 舔av片在线| 美女被艹到高潮喷水动态| 久久欧美精品欧美久久欧美| 亚洲七黄色美女视频| 日韩大尺度精品在线看网址| 美女黄网站色视频| 国产精品 欧美亚洲| 亚洲国产看品久久| 成人鲁丝片一二三区免费| 国产精品影院久久| bbb黄色大片| 一进一出抽搐gif免费好疼| 久久九九热精品免费| 在线观看66精品国产| 久久久久久久精品吃奶| 99国产精品一区二区三区| 极品教师在线免费播放| 人人妻人人看人人澡| 国产亚洲欧美在线一区二区| 99精品在免费线老司机午夜| 波多野结衣高清作品| 99热这里只有是精品50| 99精品欧美一区二区三区四区| 男女那种视频在线观看| 欧美黄色片欧美黄色片| 国产精品一区二区免费欧美| 欧美午夜高清在线| 精品久久久久久久久久久久久| 国产精品,欧美在线| 中文字幕高清在线视频| 亚洲黑人精品在线| 悠悠久久av| 成年女人毛片免费观看观看9| 精品乱码久久久久久99久播| 91在线观看av| 这个男人来自地球电影免费观看| 日韩精品青青久久久久久| www.精华液| 亚洲精品粉嫩美女一区| 亚洲色图av天堂| 久99久视频精品免费| 一a级毛片在线观看| 国产精品电影一区二区三区| 日日干狠狠操夜夜爽| 精品一区二区三区视频在线观看免费| 97超级碰碰碰精品色视频在线观看| 久久亚洲精品不卡| 国产伦精品一区二区三区四那| 69av精品久久久久久| 人妻夜夜爽99麻豆av| 成人三级做爰电影| 久久香蕉国产精品| 国产毛片a区久久久久| 成人av在线播放网站| 最新中文字幕久久久久 | 久久久久国产精品人妻aⅴ院| 欧美色视频一区免费| 在线视频色国产色| 在线播放国产精品三级| 噜噜噜噜噜久久久久久91| 亚洲专区国产一区二区| 国产麻豆成人av免费视频| 国产精品香港三级国产av潘金莲| 一卡2卡三卡四卡精品乱码亚洲| 国产真人三级小视频在线观看| 午夜免费激情av| www国产在线视频色| 色哟哟哟哟哟哟| 精品一区二区三区视频在线 | 亚洲va日本ⅴa欧美va伊人久久| 欧美日韩中文字幕国产精品一区二区三区| 久久人妻av系列| 88av欧美| 别揉我奶头~嗯~啊~动态视频| 亚洲在线自拍视频| 日韩欧美三级三区| 中文字幕久久专区| 国产精品香港三级国产av潘金莲| 精品国产三级普通话版| 九九久久精品国产亚洲av麻豆 | 小蜜桃在线观看免费完整版高清| 久久精品影院6| 性色av乱码一区二区三区2| 亚洲欧美精品综合久久99| 色综合亚洲欧美另类图片| 观看免费一级毛片| 日本精品一区二区三区蜜桃| 一级毛片高清免费大全| a级毛片a级免费在线| 国内精品久久久久精免费| 美女免费视频网站| 国产精品美女特级片免费视频播放器 | 亚洲九九香蕉| 精品久久久久久成人av| av中文乱码字幕在线| 18禁黄网站禁片午夜丰满| 在线观看免费视频日本深夜| av视频在线观看入口| 欧美日韩精品网址| a在线观看视频网站| 国产一区二区三区视频了| 国产美女午夜福利| 日本五十路高清| 老司机午夜福利在线观看视频| 少妇丰满av| 伦理电影免费视频| 一二三四社区在线视频社区8| 免费一级毛片在线播放高清视频| 欧美性猛交黑人性爽| 国产精品99久久久久久久久| 欧美在线一区亚洲| 国产精品亚洲一级av第二区| 真人一进一出gif抽搐免费| 大型黄色视频在线免费观看| 欧美3d第一页| 男女做爰动态图高潮gif福利片| 久久国产精品人妻蜜桃| 亚洲精品国产精品久久久不卡| 久久久久免费精品人妻一区二区| 国产成人精品无人区| 一区二区三区激情视频| 日韩有码中文字幕| 97人妻精品一区二区三区麻豆| 精品久久久久久成人av| 久久久久久国产a免费观看| 国产精品亚洲一级av第二区| 久久草成人影院| 午夜福利免费观看在线| 精品国产亚洲在线|