• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于長短期記憶近端策略優(yōu)化強(qiáng)化學(xué)習(xí)的等效并行機(jī)在線調(diào)度方法

    2022-02-28 02:16:00賀俊杰汪俊亮
    中國機(jī)械工程 2022年3期
    關(guān)鍵詞:緩沖區(qū)工件調(diào)度

    賀俊杰 張 潔 張 朋 汪俊亮 鄭 鵬 王 明

    1.東華大學(xué)機(jī)械工程學(xué)院,上海,2016202.上海交通大學(xué)機(jī)械與動力工程學(xué)院,上海,200240

    0 引言

    在晶圓制造、航天制造等生產(chǎn)系統(tǒng)中,各工序生產(chǎn)單元通常需要連續(xù)不斷地將動態(tài)到達(dá)的工件指派到多臺并行設(shè)備上,該類生產(chǎn)單元的調(diào)度問題是典型的等效并行機(jī)在線調(diào)度問題。以航天制造業(yè)為例,航天企業(yè)迫切需要實(shí)現(xiàn)短周期、高品質(zhì)、快速響應(yīng)的生產(chǎn)模式[1],但航天產(chǎn)品制造過程中有的零件包含復(fù)雜曲面,其特征復(fù)雜且加工質(zhì)量要求高,需采用昂貴的多軸精密數(shù)控機(jī)床進(jìn)行加工。此類零件的加工時間長且在加工過程中易報(bào)廢,使得復(fù)雜曲面的數(shù)控加工工序成為航天零件實(shí)際生產(chǎn)過程中的瓶頸工序。航天零件生產(chǎn)具有設(shè)計(jì)迭代快、生產(chǎn)批量小的特點(diǎn),需要車間調(diào)度人員快速作出調(diào)度響應(yīng)。為降低生產(chǎn)成本,該類零件往往安排在同一車間生產(chǎn),通過其中的任意一臺同型號的數(shù)控機(jī)床進(jìn)行加工。此外,晶圓生產(chǎn)的光刻區(qū)調(diào)度、爐管區(qū)調(diào)度,以及紡織品生產(chǎn)的織機(jī)調(diào)度、染缸調(diào)度,鋼鐵生產(chǎn)的轉(zhuǎn)爐煉鋼等都可抽象為此類調(diào)度問題。面對這類生產(chǎn)調(diào)度問題,在實(shí)現(xiàn)快速響應(yīng)的同時最大程度上實(shí)現(xiàn)調(diào)度優(yōu)化,是滿足客戶要求的必要條件,具有重要的理論意義和工程實(shí)際應(yīng)用價(jià)值。

    目前針對等效并行機(jī)在線調(diào)度問題的研究方法分為兩種,一是啟發(fā)式規(guī)則,BANSAL[2]和LEONARDI等[3]提出了最小化流動時間的啟發(fā)式算法;SITTERS[4]和HALL等[5]提出了最小化完工時間的啟發(fā)式算法,這種方法執(zhí)行時間短,能夠?qū)崿F(xiàn)快速響應(yīng),但往往針對一種特定場景設(shè)計(jì),缺乏自適應(yīng)性[6]。二是智能算法,柳丹丹等[7]設(shè)計(jì)了改進(jìn)遺傳算法應(yīng)用于等效并行機(jī)在線調(diào)度問題;許顯楊等[8]提出了面向設(shè)備動態(tài)性的蟻群算法,該方法雖能精確求解,但求解時間長,無法實(shí)時響應(yīng),且頻繁的滾動調(diào)度會導(dǎo)致準(zhǔn)備工作效率低下[9]。在半導(dǎo)體制造、紡織品生產(chǎn)[10]等行業(yè),因在制品眾多且無法搶占加工,調(diào)度時需考慮等待未來到達(dá)的工件,進(jìn)一步優(yōu)化調(diào)度方案,因此,是否等待是最關(guān)鍵的問題。有學(xué)者在加權(quán)最短加工時間優(yōu)先(weighted shortest processing time first, WSPT)規(guī)則[11-12]的基礎(chǔ)上設(shè)計(jì)等待機(jī)制,如ANDERSON等[13]提出D-WSPT規(guī)則以優(yōu)化單機(jī)的加權(quán)完工時間和;TAO[14]進(jìn)一步提出針對等效并行機(jī)的AD-WSPT算法,但以上兩種方法對在線調(diào)度的自適應(yīng)性不足。

    近年來,機(jī)器學(xué)習(xí)中的強(qiáng)化學(xué)習(xí)方法因具有自適應(yīng)能力,被應(yīng)用于解決許多具有挑戰(zhàn)性的決策問題[15-18],利用強(qiáng)化學(xué)習(xí)算法求解調(diào)度問題也成為了研究熱點(diǎn)[19]。首先將調(diào)度問題轉(zhuǎn)化為馬爾可夫決策過程(Markov decision process, MDP),在MDP中狀態(tài)s描述了車間狀態(tài),強(qiáng)化學(xué)習(xí)智能體(agent)觀察狀態(tài)s,然后采取調(diào)度決策a,并從車間環(huán)境獲得獎勵值R,通過與車間環(huán)境交互獲取調(diào)度經(jīng)驗(yàn),并以數(shù)據(jù)驅(qū)動的方法學(xué)習(xí)經(jīng)驗(yàn),最大化獎勵的同時最優(yōu)化調(diào)度策略[20-21]。GABEL等[22]提出了基于策略梯度(policy gradient, PG)的作業(yè)車間調(diào)度方法,在狀態(tài)矩陣中設(shè)計(jì)了下一道工序預(yù)覽。王世進(jìn)等[23]提出基于Q-Learning的單機(jī)調(diào)度方法,適用于多目標(biāo)動態(tài)切換的調(diào)度環(huán)境。WANG等[24]將Actor-Critic算法用于晶圓制造系統(tǒng)調(diào)度,對多目標(biāo)采用加權(quán)的獎勵函數(shù)。ZHANG等[25]以工件到達(dá)和機(jī)器釋放事件觸發(fā)調(diào)度,在動作空間中考慮了等待并對獎勵函數(shù)進(jìn)行證明?;趶?qiáng)化學(xué)習(xí)的方法適合解決調(diào)度問題,但現(xiàn)有基于強(qiáng)化學(xué)習(xí)的方法僅根據(jù)實(shí)時狀態(tài)進(jìn)行調(diào)度,應(yīng)用于在線調(diào)度問題還需考慮車間的動態(tài)變化情況。近年來提出的近端策略優(yōu)化(proximal policy optimization, PPO)算法是一種基于策略的深度強(qiáng)化學(xué)習(xí)算法,該算法交互的經(jīng)驗(yàn)數(shù)據(jù)可進(jìn)行重復(fù)利用使得采樣效率更高,該算法獨(dú)有的損失函數(shù)裁剪使得該算法學(xué)習(xí)穩(wěn)定性更強(qiáng),在交通[26-27]、機(jī)器人[28-29]、車間調(diào)度[30-31]等智能控制領(lǐng)域得到了實(shí)際應(yīng)用,且明顯優(yōu)于策略梯度(policygradient, PG)[32]、信任區(qū)域策略優(yōu)化(trust region policy optimization, TRPO)[33]、優(yōu)勢動作評論(advantage actor critic, A2C)[34]等深度強(qiáng)化學(xué)習(xí)算法。因此本文基于PPO算法展開研究,考慮到長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)具有記憶與預(yù)測功能,將其引入強(qiáng)化學(xué)習(xí)智能體以適應(yīng)在線調(diào)度環(huán)境。

    考慮到加權(quán)完工時間和是提升客戶滿意度和降低庫存成本的重要指標(biāo),本文針對等效并行機(jī)在線調(diào)度問題,以最小化加權(quán)完工時間和為優(yōu)化目標(biāo),提出基于長短期記憶近端策略優(yōu)化(proximal policy optimization with long short-term memory,LSTM-PPO)的等效并行機(jī)在線調(diào)度方法。針對任務(wù)在線到達(dá)的不確定性,設(shè)計(jì)了考慮等待策略的在線調(diào)度決策流程;針對進(jìn)行等待所需考慮的全局信息,在強(qiáng)化學(xué)習(xí)智能體結(jié)構(gòu)中引入LSTM實(shí)現(xiàn)時間維的車間狀態(tài)信息融合,構(gòu)建高效的LSTM-PPO在線調(diào)度算法。

    1 問題描述與分析

    1.1 問題描述

    有n個工件需在m臺相同的設(shè)備上進(jìn)行加工,每個工件j有到達(dá)時間rj、權(quán)重wj和加工時長pj,直到工件到達(dá)才已知該工件的所有信息。工件一旦開始加工則無法中斷。當(dāng)一個工件到達(dá)后就可進(jìn)行加工,且一個工件僅能在一臺機(jī)器上加工一次[14]。因此,本調(diào)度問題用三元描述法描述如下:

    Pm|rj,online|∑wjCj

    (1)

    式中,Pm表示等效并行機(jī);online表示在線環(huán)境;Cj為工件j的完工時間。

    1.2 問題分析

    在線環(huán)境下有效的等待策略是優(yōu)化∑wjCj的關(guān)鍵。圖1的案例展示了在t1時刻是否等待的兩種情形,案例中任務(wù)j1和j2的參數(shù)如表1所示。t1時刻無等待的調(diào)度方案先加工j1再加工j2;t1時刻等待的調(diào)度方案則先加工j2再加工j1,因j2的權(quán)重較大且加工時間短,j1的加工時間長且權(quán)重較小,故有等待的調(diào)度方案加權(quán)完工時間和比無等待的多45。但由于t1時刻未知j2的到達(dá)時間等參數(shù),因而在t1時刻合理的調(diào)度決策較困難。在線環(huán)境下,有效融合時間維度的任務(wù)和機(jī)器狀態(tài)對當(dāng)前時刻的調(diào)度決策有重要意義。

    圖1 有無等待的調(diào)度方法對比

    表1 案例中的任務(wù)參數(shù)

    2 基于LSTM-PPO強(qiáng)化學(xué)習(xí)的等效并行機(jī)在線調(diào)度系統(tǒng)

    在基于強(qiáng)化學(xué)習(xí)的調(diào)度系統(tǒng)中,強(qiáng)化學(xué)習(xí)智能體通過與車間環(huán)境進(jìn)行交互,感知車間的狀態(tài)變化并嘗試各種調(diào)度行為,獲取獎勵值作為調(diào)度決策的評價(jià),通過反復(fù)試錯以獲取更高的獎勵值,實(shí)現(xiàn)最優(yōu)的調(diào)度策略?;趶?qiáng)化學(xué)習(xí)的等效并行機(jī)調(diào)度系統(tǒng)交互流程如圖2所示。

    圖2 基于強(qiáng)化學(xué)習(xí)的等效并行機(jī)調(diào)度交互流程

    2.1 調(diào)度智能體

    LSTM-PPO強(qiáng)化學(xué)習(xí)調(diào)度智能體是一種Actor-Critic結(jié)構(gòu)類型的智能體,如圖3所示,由3個模塊組成,包括記憶與預(yù)測模塊LSTM,策略模塊Actor,評價(jià)模塊Critic。Actor根據(jù)當(dāng)前的并行機(jī)環(huán)境進(jìn)行調(diào)度決策,Critic對調(diào)度決策的優(yōu)劣進(jìn)行評價(jià)。策略模塊采用前饋神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)逼近最優(yōu)的調(diào)度策略π*,表示為π(a|sk,mk,θ,ψ),其中θ為網(wǎng)絡(luò)參數(shù),sk為第k次調(diào)度時的車間狀態(tài),mk為記憶與預(yù)測模塊提供的時序信息,ψ為LSTM網(wǎng)絡(luò)參數(shù)。評價(jià)模塊同樣采用一個BPNN作為值網(wǎng)絡(luò),對真實(shí)值函數(shù)Vπ(sk)進(jìn)行逼近,可表示為V(sk,mk,ω,ψ),其中ω為值網(wǎng)絡(luò)參數(shù)。

    LSTM記憶與預(yù)測模塊的輸入為每次調(diào)度時的環(huán)境狀態(tài)和對應(yīng)的調(diào)度決策,通過編碼后輸出記憶與預(yù)測信息,如圖3中LSTM模塊所示。記憶與預(yù)測模塊的運(yùn)行可表示為

    圖3 LSTM-PPO智能體結(jié)構(gòu)

    mk=LSTM(sak-1,hk-1,ck-1,ψ)

    (2)

    sak-1=(sk-1,ak-1)

    (3)

    式中,hk-1和ck-1為k次決策后LSTM網(wǎng)絡(luò)輸出的隱狀態(tài);sak-1為k次決策的車間狀態(tài)sk-1與調(diào)度決策ak-1組成的向量。

    在功能方面,將輸出的記憶與預(yù)測信息mk與車間實(shí)時狀態(tài)sk拼接,輸入給策略模塊和評價(jià)模塊,使智能體調(diào)度時的輸入信息更完備,包括實(shí)時信息與車間時序動態(tài)信息。在網(wǎng)絡(luò)結(jié)構(gòu)方面,mk作為中間變量將LSTM網(wǎng)絡(luò)輸出層與值網(wǎng)絡(luò)的輸入層、策略網(wǎng)絡(luò)的輸入層相連,使得LSTM網(wǎng)絡(luò)成為值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)共享前綴網(wǎng)絡(luò)。

    將記憶與預(yù)測單元對歷史調(diào)度決策的記憶編碼輸出作為下次調(diào)度的輸入,使智能體調(diào)度時可對歷史調(diào)度進(jìn)行考慮,對前后調(diào)度決策之間的相互關(guān)聯(lián)與影響進(jìn)行表征,實(shí)現(xiàn)全局優(yōu)化。

    2.2 調(diào)度狀態(tài)空間

    狀態(tài)空間S的定義與優(yōu)化目標(biāo)密切相關(guān),需反映車間調(diào)度相關(guān)特征和車間狀態(tài)變化。設(shè)定任務(wù)緩沖區(qū)和等待隊(duì)列,對不確定數(shù)量的任務(wù)實(shí)現(xiàn)固定數(shù)量的參數(shù)表征。新任務(wù)到達(dá)后隨機(jī)進(jìn)入空閑緩沖區(qū),避免智能體學(xué)習(xí)過程中的樣本不平衡。若任務(wù)緩沖區(qū)已滿則進(jìn)入等待隊(duì)列,按照先入先出原則進(jìn)入任務(wù)緩沖區(qū)中待調(diào)度。狀態(tài)矩陣s=[f1f2f3]從緩沖區(qū)、任務(wù)等待隊(duì)列、設(shè)備3個維度對并行機(jī)在線調(diào)度環(huán)境進(jìn)行描述,使強(qiáng)化學(xué)習(xí)智能體對生產(chǎn)狀態(tài)進(jìn)行完備的觀察。其中緩沖區(qū)狀態(tài)f1=(f1,1,f1,2,…,f1,k,…,f1,q),緩沖區(qū)k的狀態(tài)向量f1,k=(f1,k,1,f1,k,2,f1,k,3,f1,k,4),其中任務(wù)等待隊(duì)列狀態(tài)f2僅包含等待隊(duì)列占用率一個參數(shù);機(jī)器狀態(tài)f3=(f3,1,f3,2,…,f3,i,…,f3,m),其中設(shè)備i的狀態(tài)向量f3,i定義為(f3,i,1,f3,i,2,f3,i,3),參數(shù)表達(dá)式如表2所示。

    表2 并行機(jī)環(huán)境狀態(tài)參數(shù)

    綜上,設(shè)緩沖區(qū)數(shù)量為nslot,機(jī)器數(shù)量為m,得到一維等效并行機(jī)環(huán)境狀態(tài)矩陣尺寸ns如下:

    ns=nslot×4+1+m×3

    (4)

    2.3 調(diào)度動作空間

    調(diào)度動作空間A即調(diào)度決策集合,主要包括以下調(diào)度決策:

    (1)選擇第k個緩沖區(qū)。若該緩沖區(qū)中存在一個工件j,則將該工件加載到任意一臺空閑機(jī)器上;若該緩沖區(qū)為空,則作用同調(diào)度決策(2)。通過選緩沖區(qū)間接選擇工件,改善了規(guī)則選擇可能導(dǎo)致的解空間縮小和冗余的問題:

    a=k0≤k

    (5)

    式中,q為緩沖區(qū)的最大數(shù)量。

    (2)等待。不選擇任何工件進(jìn)行加工。通過將等待引入到調(diào)度的動作空間,使智能體可在調(diào)度時選擇等待:

    a=q

    (6)

    2.4 調(diào)度獎勵函數(shù)

    強(qiáng)化學(xué)習(xí)在最大化獎勵值R的同時實(shí)現(xiàn)目標(biāo)最優(yōu)化。獎勵函數(shù)R對智能體的調(diào)度決策對目標(biāo)函數(shù)做出的貢獻(xiàn)進(jìn)行量化評估,為智能體學(xué)習(xí)調(diào)度策略提供有效指導(dǎo)。將目標(biāo)函數(shù)∑wjCj分解,轉(zhuǎn)化為每次調(diào)度決策的獎勵值,避免獎勵稀疏:

    (7)

    因式(7)中到達(dá)時間rj與加工時間pj為常量,所有優(yōu)化目標(biāo)等效于最小化加權(quán)的等待時間和,進(jìn)一步通過下式分解到每個單位時間:

    (8)

    (9)

    式中,sj為任務(wù)的加工狀態(tài)參數(shù),判定任務(wù)是否處于等待狀態(tài)。

    因此,最小化加權(quán)完工時間和實(shí)際上等效于最小化每一時間節(jié)點(diǎn)的待加工任務(wù)數(shù)權(quán)重之和,據(jù)此推論設(shè)計(jì)獎勵函數(shù)R如下:

    (10)

    式中,St為t時刻的狀態(tài)。

    對式(10)中的加權(quán)等待時間取相反數(shù),因此目標(biāo)函數(shù)∑wjCj越小,獎勵值R越大。

    2.5 模型更新

    強(qiáng)化學(xué)習(xí)智能體通過與等效并行機(jī)在線環(huán)境交互獲取大量的經(jīng)驗(yàn)數(shù)據(jù)(mk,sk,ak,rk),并通過經(jīng)驗(yàn)數(shù)據(jù)對智能體的3個模塊進(jìn)行參數(shù)更新。采用現(xiàn)有的PPO算法對模型進(jìn)行更新,此外,因LSTM網(wǎng)絡(luò)是策略網(wǎng)絡(luò)和值網(wǎng)絡(luò)的共同前綴層,因此在模型更新階段值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)的損失均回傳至LSTM網(wǎng)絡(luò)以實(shí)現(xiàn)整體網(wǎng)絡(luò)優(yōu)化,并通過下式對值網(wǎng)絡(luò)參數(shù)θ、ψ進(jìn)行更新:

    θ←θ+αθJ(θ,ψ)

    (11)

    ψ←ψ+αθJ(θ,ψ)

    (12)

    通過下式對值網(wǎng)絡(luò)參數(shù)ω、ψ進(jìn)行更新:

    ω←ω-αωL(ω,ψ)

    (13)

    ψ←ψ-αωL(ω,ψ)

    (14)

    因此,值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)更新時,梯度均回傳至LSTM網(wǎng)絡(luò)并更新其參數(shù)ψ,如圖3中損失傳播路線所示。綜上得到基于LSTM-PPO的等效并行機(jī)在線調(diào)度算法:

    1: 隨機(jī)初始化智能體參數(shù)θ,ω,ψ

    2: for each episode do:

    3:k=0

    4: 初始化任務(wù)序列、記憶與預(yù)測信息mk、經(jīng)驗(yàn)緩存池和狀態(tài)sk

    5: while not done ork≤Kdo:

    6: 根據(jù)策略π采取調(diào)度決策ak~π(a|sk,mk,θ,ψ)

    7:sk+1,rk,done←Env(sk,ak)

    8: 刷新LSTM信息mk+1=LSTM(sak,hk,ck,ψ)

    9: 將經(jīng)驗(yàn)[sk,mk,ak,rk]保存至經(jīng)驗(yàn)緩存池

    10:k←k+1

    11: 更新并行機(jī)環(huán)境狀態(tài)s←s′

    12: end while

    13: 計(jì)算折扣獎勵

    14: if緩沖區(qū)經(jīng)驗(yàn)數(shù)目>小批量數(shù)目Mdo:

    15: forepoch=1,2,…,Ndo:

    17: 更新策略網(wǎng)絡(luò)和LSTM(θ,ψ)←(θ,ψ)+αθJ(θ,ψ)

    18: 更新值網(wǎng)絡(luò)和LSTM(ω,ψ)←(ω,ψ)-αωL(ω,ψ)

    19: end for

    20:θold,wold,ψo(hù)ld←θ,w,ψ

    21: end if

    22: end for

    3 實(shí)驗(yàn)驗(yàn)證

    使用Pycharm軟件進(jìn)行編程,在Windows10操作系統(tǒng)、2.9 GHz CPU、16G內(nèi)存的計(jì)算機(jī)和Python3.5環(huán)境下運(yùn)行。以面向?qū)ο蟮男问酱罱瞬⑿袡C(jī)環(huán)境類,包括機(jī)器類、工件類等,并用Pytorch實(shí)現(xiàn)了智能體的模型搭建。

    在仿真算例實(shí)驗(yàn)中,采用與文獻(xiàn)[14]相同的算例生成方法:設(shè)工件的到達(dá)規(guī)律服從泊松分布,且每個工件有不同的權(quán)重wj和不同的加工時間pj,wj~U(1,pmax),pj~U(1,pmax),pmax為工件的最長加工時間。為驗(yàn)證本方法的泛化能力,隨機(jī)生成了100個算例作為訓(xùn)練集,30個算例作為測試集,測試集僅用于對比各方法的性能,不作為訓(xùn)練過程的問題輸入。在實(shí)驗(yàn)中,取機(jī)器的數(shù)量m=4,最長加工時間pmax=10,泊松分布參數(shù)λ=0.4,每個算例的模擬調(diào)度時間為200 h。

    3.1 模型訓(xùn)練

    在模型訓(xùn)練開始之前,本文算法的參數(shù)主要根據(jù)經(jīng)驗(yàn)值以及智能體交互過程的實(shí)際數(shù)據(jù)情況進(jìn)行設(shè)置。首先,LSTM-PPO強(qiáng)化學(xué)習(xí)智能體的Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò)均為BP神經(jīng)網(wǎng)絡(luò),隱含層的神經(jīng)元個數(shù)設(shè)置為100,LSTM單元的隱層神經(jīng)元個數(shù)設(shè)置為32,LSTM輸出的消息長度為8,取Actor網(wǎng)絡(luò)的學(xué)習(xí)率α1=0.001,Critic網(wǎng)絡(luò)的學(xué)習(xí)率α2=0.002,累積折扣因子γ=0.9,損失裁剪參數(shù)ε=0.2,為加快收斂速度,采用Adam算法[35]對網(wǎng)絡(luò)參數(shù)進(jìn)行更新。緩沖區(qū)的數(shù)量是本算法最關(guān)鍵的參數(shù),數(shù)量過多會導(dǎo)致網(wǎng)絡(luò)復(fù)雜,同樣任務(wù)到達(dá)情況下空閑的緩沖區(qū)多,智能體選中任務(wù)的難度更高,學(xué)習(xí)更慢;緩沖區(qū)過少則導(dǎo)致緩沖區(qū)長時間飽和,可能造成優(yōu)先級高的工件無法及時進(jìn)入緩沖區(qū)。通過監(jiān)控交互過程中的緩沖區(qū)和等待隊(duì)列的情況,設(shè)置緩沖區(qū)數(shù)量nslot=20,等待隊(duì)列最大容量為10,時間窗口設(shè)置為1 h。在每次迭代中,強(qiáng)化學(xué)習(xí)智能體在每個訓(xùn)練集算例上重復(fù)8次獨(dú)立實(shí)驗(yàn)。

    圖4a展示了LSTM-PPO方法的訓(xùn)練迭代過程。在迭代次數(shù)為0時,由于強(qiáng)化學(xué)習(xí)智能體中網(wǎng)絡(luò)參數(shù)均初始化為隨機(jī)數(shù),故LSTM-PPO方法與隨機(jī)調(diào)度非常接近,而隨著迭代次數(shù)的增加,本文方法獲得的獎勵函數(shù)值逐漸超越現(xiàn)有的幾種啟發(fā)式算法。啟發(fā)式算法和隨機(jī)調(diào)度因不具學(xué)習(xí)能力,故獎勵值和目標(biāo)函數(shù)值均不隨迭代次數(shù)發(fā)生變化。通過與環(huán)境的交互獲取經(jīng)驗(yàn)并學(xué)習(xí),可見LSTM-PPO智能體可快速學(xué)習(xí)如何調(diào)度以獲取更高的獎勵值。同時,圖4b表明在訓(xùn)練集上的加權(quán)完工時間和也在相應(yīng)地減小,驗(yàn)證了所設(shè)計(jì)的獎勵函數(shù)指導(dǎo)優(yōu)化智能體優(yōu)化目標(biāo)函數(shù)的有效性,直至迭代7000次已基本收斂,且在這些訓(xùn)練集上訓(xùn)練迭代7000次時,強(qiáng)化學(xué)習(xí)智能體的平均水平已優(yōu)于現(xiàn)有的幾種啟發(fā)式算法。

    (a)訓(xùn)練過程累積折扣獎勵

    3.2 仿真算例驗(yàn)證

    將訓(xùn)練后的LSTM-PPO模型進(jìn)行保存,在測試集上與改進(jìn)前的PPO算法、現(xiàn)有啟發(fā)式算法進(jìn)行對比,仿真的測試集包括30個算例,智能體在學(xué)習(xí)過程中未學(xué)習(xí)過這些測試算例。首先將本文提出的LSTM-PPO算法與現(xiàn)有的PPO算法進(jìn)行對比以驗(yàn)證融入LSTM的有效性,如表3中的前兩列所示,在相同訓(xùn)練次數(shù)與迭代條件下,LSTM-PPO算法優(yōu)于未改進(jìn)的PPO算法,融入的LSTM網(wǎng)絡(luò)能結(jié)合過去的歷史狀態(tài)和歷史調(diào)度進(jìn)行預(yù)測,并將預(yù)測的消息片段輔助智能體進(jìn)行調(diào)度。

    將經(jīng)過訓(xùn)練后的強(qiáng)化學(xué)習(xí)智能體與現(xiàn)有的3種啟發(fā)式算法進(jìn)行對比。D-WSPT和AD-WSPT為兩種改進(jìn)的WSPT規(guī)則,可根據(jù)當(dāng)前時間和任務(wù)權(quán)重以及加工時間判定是否等待。訓(xùn)練結(jié)束后最終測試結(jié)果的均值和方差見表3,LSTM-PPO方法的均值和方差最優(yōu);除本文方法外,性能最好的是WSPT規(guī)則,D-WSPT規(guī)則和AD-WSPT規(guī)則的等待策略對具有不確定性的在線調(diào)度環(huán)境缺乏自適應(yīng)性。

    表3 不同方法的時間對比

    3.3 調(diào)度策略分析

    對本文方法在調(diào)度過程中的等待決策進(jìn)行分析。若存在機(jī)器空閑且有待加工工件,調(diào)度決策為等待,則這些待加工工件定義為被延遲。記錄所有的等待決策,分析工件被延遲的頻率。如圖5所示,每個方塊中的數(shù)值表示該權(quán)重和加工時間的工件被延遲的頻率。由圖可知,加工時間越長且權(quán)重越小的工件被延遲的頻率越高,這是智能體從數(shù)據(jù)中學(xué)習(xí)的等待策略。工件延遲加工,若短時間內(nèi)到達(dá)加工時間更短或權(quán)重更大的工件即可減小加權(quán)完工時間和∑wjCj。圖5表明權(quán)重大且加工時間短的任務(wù)會有更高的加工優(yōu)先級,極少被延遲加工,若可加工任務(wù)均權(quán)重較小且加工時間較長,則被延遲加工的概率較高。智能體學(xué)習(xí)到的策略是一種提升的WSPT規(guī)則,調(diào)度輸入的是更全面的車間狀態(tài)矩陣和時序動態(tài)信息,通過神經(jīng)網(wǎng)絡(luò)梯度下降進(jìn)行策略學(xué)習(xí),得到了通過合理等待實(shí)現(xiàn)目標(biāo)優(yōu)化的調(diào)度策略。

    圖5 不同權(quán)重和加工時長的工件被延遲的頻率

    3.4 企業(yè)算例驗(yàn)證

    將本文提出的算法應(yīng)用于某航天機(jī)加車間的真實(shí)調(diào)度算例。該車間有4臺設(shè)備,43個歷史加工任務(wù),各工件的加工時間等相關(guān)參數(shù)見表4。利用不同算法對算例進(jìn)行在線調(diào)度,調(diào)度結(jié)果繪制成甘特圖,如圖6所示,每個方塊表示一個工件,方塊內(nèi)的數(shù)字表示工件的到達(dá)時間,被延遲的工件用藍(lán)色標(biāo)出。由圖6可知,LSTM-PPO方法的等待決策發(fā)生在機(jī)器2空閑時,智能體選擇等待即將到達(dá)的較短加工時間的工件k,而工件j被延遲加工。由于工件j的加工時間較長,故延遲該工件j的加工而等待工件k有效降低了目標(biāo)函數(shù)值。由甘特圖可知,WSPT規(guī)則無法等待,D-WSPT規(guī)則與AD-WSPT規(guī)則的等待觸發(fā)條件均與當(dāng)前時刻相關(guān),使得等待決策發(fā)生在調(diào)度起始的一段時間內(nèi),本文方法的在線環(huán)境自適應(yīng)性更強(qiáng)。

    (a)LSTM-PPO,∑wjCj=8911

    表4 實(shí)際歷史任務(wù)的工件參數(shù)

    4 結(jié)論

    (1)本文針對等效并行機(jī)在線調(diào)度問題,以最小化加權(quán)完工時間和為目標(biāo),對任務(wù)在線到達(dá)的特性和決策等待的難點(diǎn)進(jìn)行了分析,提出考慮等待的在線調(diào)度策略。

    (2)針對任務(wù)到達(dá)的動態(tài)性設(shè)計(jì)了帶時序信息融合的LSTM-PPO強(qiáng)化學(xué)習(xí)智能體,并定義了調(diào)度的狀態(tài)空間、動作空間和獎勵函數(shù),成功將LSTM-PPO調(diào)度決策智能體應(yīng)用于等效并行機(jī)在線調(diào)度問題。

    (3)智能體觀察車間的實(shí)時狀態(tài)和動態(tài)信息進(jìn)行調(diào)度,通過調(diào)度交互獲取經(jīng)驗(yàn)并通過梯度下降法更新策略實(shí)現(xiàn)最小化加權(quán)完工時間和,訓(xùn)練得到的最優(yōu)調(diào)度策略存儲在神經(jīng)網(wǎng)絡(luò),調(diào)度決策速度快。

    (4)實(shí)驗(yàn)結(jié)果表明,所得模型的調(diào)度結(jié)果優(yōu)于3種啟發(fā)式算法。對調(diào)度策略中的工件延遲加工頻率分布和甘特圖進(jìn)行分析,證明本文提出的方法通過自學(xué)習(xí)得到在線環(huán)境下自適應(yīng)等待的調(diào)度策略,對動態(tài)環(huán)境下的生產(chǎn)調(diào)度策略探索具有一定參考價(jià)值。

    在大規(guī)模問題中,設(shè)計(jì)的緩沖區(qū)數(shù)量決定了輸出神經(jīng)元的個數(shù),隨著問題規(guī)模的增大,需要的輸出神經(jīng)元數(shù)量增大,可能導(dǎo)致網(wǎng)絡(luò)難以訓(xùn)練。下一步將尋求一種更為彈性的方法以代替緩沖區(qū),且能解決規(guī)則選擇方法過于壓縮解空間的問題。進(jìn)一步對問題進(jìn)行深入研究,考慮在線的并行批處理機(jī)調(diào)度問題,研究如何實(shí)現(xiàn)多智能體協(xié)作機(jī)制,并實(shí)現(xiàn)在晶圓制造、航天制造等領(lǐng)域的實(shí)際應(yīng)用。

    猜你喜歡
    緩沖區(qū)工件調(diào)度
    嵌入式系統(tǒng)環(huán)形緩沖區(qū)快速讀寫方法的設(shè)計(jì)與實(shí)現(xiàn)
    《調(diào)度集中系統(tǒng)(CTC)/列車調(diào)度指揮系統(tǒng)(TDCS)維護(hù)手冊》正式出版
    一種基于負(fù)載均衡的Kubernetes調(diào)度改進(jìn)算法
    考慮非線性誤差的五軸工件安裝位置優(yōu)化
    虛擬機(jī)實(shí)時遷移調(diào)度算法
    三坐標(biāo)在工件測繪中的應(yīng)用技巧
    焊接殘余形變在工件精密裝配中的仿真應(yīng)用研究
    焊接(2015年9期)2015-07-18 11:03:52
    關(guān)鍵鏈技術(shù)緩沖區(qū)的確定方法研究
    一種非圓旋轉(zhuǎn)工件支撐裝置控制算法
    SVC的RTP封裝及其在NS2包調(diào)度中的應(yīng)用研究
    国产综合懂色| 亚洲天堂国产精品一区在线| 我的老师免费观看完整版| 人妻夜夜爽99麻豆av| 人妻夜夜爽99麻豆av| 男女边摸边吃奶| 身体一侧抽搐| 成人亚洲精品一区在线观看 | 日本午夜av视频| 欧美高清性xxxxhd video| 国产欧美日韩一区二区三区在线 | 亚洲色图综合在线观看| 综合色av麻豆| 久久影院123| 啦啦啦中文免费视频观看日本| 丝袜美腿在线中文| 天天躁日日操中文字幕| 男男h啪啪无遮挡| 日韩欧美精品免费久久| 美女cb高潮喷水在线观看| 亚洲欧美中文字幕日韩二区| 精品一区二区三区视频在线| 色婷婷久久久亚洲欧美| 亚洲人与动物交配视频| 亚洲av免费高清在线观看| 色婷婷久久久亚洲欧美| 最近的中文字幕免费完整| 久久久久久久大尺度免费视频| 高清毛片免费看| 欧美xxxx性猛交bbbb| 狂野欧美激情性bbbbbb| 国产精品久久久久久精品电影小说 | 国产乱来视频区| 国产老妇伦熟女老妇高清| 亚洲国产色片| 韩国高清视频一区二区三区| 欧美成人精品欧美一级黄| 国产成人a区在线观看| 成人美女网站在线观看视频| 18+在线观看网站| 熟女电影av网| 男女啪啪激烈高潮av片| 汤姆久久久久久久影院中文字幕| 国内精品美女久久久久久| 亚洲av日韩在线播放| 日韩一本色道免费dvd| 午夜日本视频在线| 黄片无遮挡物在线观看| 成人国产麻豆网| 黑人高潮一二区| 久久人人爽人人爽人人片va| 国产国拍精品亚洲av在线观看| 日韩av免费高清视频| 国产一区二区亚洲精品在线观看| 久久ye,这里只有精品| 国产av国产精品国产| 精品久久久久久久末码| 2021少妇久久久久久久久久久| 久久久久国产精品人妻一区二区| 日本黄色片子视频| 中文字幕免费在线视频6| 精品99又大又爽又粗少妇毛片| 国产综合懂色| 亚洲三级黄色毛片| 尾随美女入室| 女人久久www免费人成看片| 亚洲欧美精品自产自拍| 纵有疾风起免费观看全集完整版| av在线观看视频网站免费| 成人黄色视频免费在线看| 日本色播在线视频| 亚洲国产av新网站| 高清av免费在线| 成人漫画全彩无遮挡| 在线观看美女被高潮喷水网站| 久久人人爽av亚洲精品天堂 | 18禁在线播放成人免费| 黄色怎么调成土黄色| 亚洲四区av| 日韩 亚洲 欧美在线| 欧美 日韩 精品 国产| 亚洲精品456在线播放app| 亚洲不卡免费看| 天堂网av新在线| 看黄色毛片网站| 特级一级黄色大片| 网址你懂的国产日韩在线| 国产精品一区二区在线观看99| 永久网站在线| 深夜a级毛片| 七月丁香在线播放| 亚洲精品国产成人久久av| 嫩草影院新地址| 午夜福利视频1000在线观看| 97精品久久久久久久久久精品| 久久久久久久大尺度免费视频| 国产免费又黄又爽又色| 国产伦理片在线播放av一区| 网址你懂的国产日韩在线| 久久久久久九九精品二区国产| 深夜a级毛片| 99久久中文字幕三级久久日本| 青春草亚洲视频在线观看| 六月丁香七月| 一边亲一边摸免费视频| 成人国产麻豆网| 啦啦啦在线观看免费高清www| 天堂中文最新版在线下载 | 黑人高潮一二区| 91aial.com中文字幕在线观看| 亚洲精品乱久久久久久| 精品少妇久久久久久888优播| 男人和女人高潮做爰伦理| 女人被狂操c到高潮| 国产日韩欧美亚洲二区| 18禁动态无遮挡网站| 久久精品熟女亚洲av麻豆精品| av在线老鸭窝| 久久这里有精品视频免费| 九草在线视频观看| 寂寞人妻少妇视频99o| 日韩av在线免费看完整版不卡| 亚洲熟女精品中文字幕| www.色视频.com| 国产精品女同一区二区软件| 能在线免费看毛片的网站| 男人爽女人下面视频在线观看| 国产亚洲一区二区精品| 尤物成人国产欧美一区二区三区| 久久久精品免费免费高清| 夫妻性生交免费视频一级片| 欧美三级亚洲精品| 少妇被粗大猛烈的视频| 国产精品久久久久久精品电影| 欧美性猛交╳xxx乱大交人| 热99国产精品久久久久久7| 晚上一个人看的免费电影| 成人一区二区视频在线观看| 欧美最新免费一区二区三区| 亚洲一区二区三区欧美精品 | 成年人午夜在线观看视频| 一级av片app| 成人综合一区亚洲| 黄色一级大片看看| 亚洲精品日韩在线中文字幕| 亚洲一级一片aⅴ在线观看| 综合色丁香网| 久久久色成人| 亚洲天堂国产精品一区在线| 伦精品一区二区三区| 亚洲av日韩在线播放| 久久久成人免费电影| 免费大片18禁| 国产淫片久久久久久久久| 高清毛片免费看| 欧美变态另类bdsm刘玥| 久久久久国产网址| 纵有疾风起免费观看全集完整版| 亚洲综合色惰| 亚洲最大成人av| 99久久精品国产国产毛片| 久久99热6这里只有精品| 国产久久久一区二区三区| 成人高潮视频无遮挡免费网站| 三级经典国产精品| 国产极品天堂在线| 日本wwww免费看| 欧美另类一区| 在线观看免费高清a一片| 天堂俺去俺来也www色官网| 国产色爽女视频免费观看| 成年版毛片免费区| 国产精品偷伦视频观看了| 亚洲av福利一区| 欧美成人a在线观看| 亚洲精品中文字幕在线视频 | 肉色欧美久久久久久久蜜桃 | 久久精品国产亚洲网站| 久久精品国产鲁丝片午夜精品| 18+在线观看网站| 午夜福利在线观看免费完整高清在| 少妇人妻一区二区三区视频| 国产av不卡久久| 男男h啪啪无遮挡| 99热这里只有是精品在线观看| 日本一本二区三区精品| 最近中文字幕2019免费版| 日本与韩国留学比较| 又粗又硬又长又爽又黄的视频| 视频中文字幕在线观看| 午夜激情福利司机影院| av在线app专区| 一个人看的www免费观看视频| 亚洲精品亚洲一区二区| 国产亚洲91精品色在线| 亚洲国产精品成人综合色| 国产黄色视频一区二区在线观看| 老女人水多毛片| 99久久九九国产精品国产免费| 少妇人妻一区二区三区视频| 狂野欧美激情性xxxx在线观看| av女优亚洲男人天堂| 国产久久久一区二区三区| 日韩,欧美,国产一区二区三区| 亚洲av欧美aⅴ国产| 大码成人一级视频| 18禁在线无遮挡免费观看视频| 嘟嘟电影网在线观看| 人妻 亚洲 视频| 免费观看av网站的网址| 五月玫瑰六月丁香| 最近中文字幕高清免费大全6| 久久久久精品性色| 亚洲精品成人av观看孕妇| 黄色欧美视频在线观看| 国产又色又爽无遮挡免| 波野结衣二区三区在线| 少妇丰满av| 国产欧美另类精品又又久久亚洲欧美| 国产精品三级大全| 日韩成人av中文字幕在线观看| 亚洲精品国产av成人精品| 亚洲国产成人一精品久久久| 久久亚洲国产成人精品v| 亚洲av欧美aⅴ国产| 麻豆国产97在线/欧美| 免费观看的影片在线观看| 精品99又大又爽又粗少妇毛片| 十八禁网站网址无遮挡 | 少妇熟女欧美另类| 久久精品国产a三级三级三级| 免费大片黄手机在线观看| 国产极品天堂在线| 舔av片在线| 日韩亚洲欧美综合| 女的被弄到高潮叫床怎么办| 国产成人精品福利久久| 亚洲一区二区三区欧美精品 | 免费黄色在线免费观看| 国产精品麻豆人妻色哟哟久久| 女人久久www免费人成看片| 美女主播在线视频| 久久6这里有精品| 成人亚洲精品av一区二区| 大陆偷拍与自拍| 亚洲综合色惰| 国产免费一区二区三区四区乱码| 欧美3d第一页| 亚洲国产精品999| 午夜日本视频在线| 亚洲内射少妇av| 日本一二三区视频观看| 久久精品国产a三级三级三级| 美女脱内裤让男人舔精品视频| 免费电影在线观看免费观看| 精品久久久久久久末码| 欧美日韩亚洲高清精品| 久久久久久久久久久免费av| av国产免费在线观看| 嫩草影院精品99| 99热这里只有是精品在线观看| 小蜜桃在线观看免费完整版高清| 免费观看a级毛片全部| 又大又黄又爽视频免费| 男女那种视频在线观看| 国产淫语在线视频| 国产乱人视频| 又粗又硬又长又爽又黄的视频| 精品久久久久久久人妻蜜臀av| 男女边摸边吃奶| xxx大片免费视频| 国产老妇伦熟女老妇高清| 一级爰片在线观看| 制服丝袜香蕉在线| 欧美精品国产亚洲| 久久国内精品自在自线图片| 丝袜喷水一区| 成人亚洲欧美一区二区av| 日韩制服骚丝袜av| 能在线免费看毛片的网站| 女的被弄到高潮叫床怎么办| 国产精品99久久久久久久久| 久久精品国产自在天天线| 一个人观看的视频www高清免费观看| 色婷婷久久久亚洲欧美| 成年女人在线观看亚洲视频 | 国产av国产精品国产| 成年av动漫网址| 黄色日韩在线| 少妇人妻 视频| 性插视频无遮挡在线免费观看| 亚洲精品国产av蜜桃| 免费大片黄手机在线观看| 精品人妻视频免费看| 国产成人a∨麻豆精品| 久久精品国产a三级三级三级| 国产免费福利视频在线观看| 97在线视频观看| 亚洲人与动物交配视频| 亚洲av中文字字幕乱码综合| 亚洲精品自拍成人| 我要看日韩黄色一级片| 国产精品蜜桃在线观看| 在线a可以看的网站| 高清av免费在线| 日韩亚洲欧美综合| 赤兔流量卡办理| 国产亚洲5aaaaa淫片| 久久6这里有精品| 在线观看人妻少妇| 中文天堂在线官网| 日韩av免费高清视频| 人妻少妇偷人精品九色| av在线老鸭窝| 国产成人精品福利久久| av免费观看日本| 18禁在线无遮挡免费观看视频| 欧美高清性xxxxhd video| 国产欧美亚洲国产| 国产伦精品一区二区三区视频9| 国产免费视频播放在线视频| 免费黄频网站在线观看国产| 亚洲欧美精品自产自拍| 夫妻午夜视频| 青春草国产在线视频| 在线精品无人区一区二区三 | 日本午夜av视频| 少妇猛男粗大的猛烈进出视频 | 久久精品久久久久久噜噜老黄| 18禁在线播放成人免费| 中文字幕免费在线视频6| 国产精品久久久久久久电影| 自拍欧美九色日韩亚洲蝌蚪91 | 亚洲欧美一区二区三区黑人 | 网址你懂的国产日韩在线| 亚洲精品自拍成人| 亚洲av电影在线观看一区二区三区 | 插阴视频在线观看视频| 国产久久久一区二区三区| 看十八女毛片水多多多| 97超视频在线观看视频| 国内精品宾馆在线| 人妻 亚洲 视频| 亚洲av成人精品一二三区| 国产亚洲av嫩草精品影院| 另类亚洲欧美激情| 中文字幕av成人在线电影| 色视频在线一区二区三区| 久久精品国产鲁丝片午夜精品| 国产免费一级a男人的天堂| 日韩成人av中文字幕在线观看| av黄色大香蕉| 日日啪夜夜撸| 在线观看美女被高潮喷水网站| 国产91av在线免费观看| 全区人妻精品视频| 国产高清国产精品国产三级 | 伊人久久国产一区二区| 欧美精品一区二区大全| 国产精品女同一区二区软件| 亚洲天堂国产精品一区在线| 国产极品天堂在线| 卡戴珊不雅视频在线播放| 亚洲在线观看片| 欧美日韩在线观看h| 亚洲精品国产av成人精品| 国产亚洲av片在线观看秒播厂| 汤姆久久久久久久影院中文字幕| 国产免费视频播放在线视频| 久久精品熟女亚洲av麻豆精品| 国产真实伦视频高清在线观看| 六月丁香七月| 久热这里只有精品99| 97人妻精品一区二区三区麻豆| 国产精品精品国产色婷婷| 亚洲精品一区蜜桃| 亚洲激情五月婷婷啪啪| 啦啦啦中文免费视频观看日本| 久久精品熟女亚洲av麻豆精品| 国产黄色免费在线视频| 国产免费一区二区三区四区乱码| 成人美女网站在线观看视频| 久久精品国产自在天天线| 免费观看无遮挡的男女| 国产一区有黄有色的免费视频| 国产一区二区在线观看日韩| 精品一区二区三区视频在线| 日韩,欧美,国产一区二区三区| 国产一区二区亚洲精品在线观看| 国产v大片淫在线免费观看| 交换朋友夫妻互换小说| 一区二区三区四区激情视频| 极品少妇高潮喷水抽搐| 国产精品一区二区性色av| 日日摸夜夜添夜夜爱| 人人妻人人看人人澡| 国产成年人精品一区二区| 亚洲精品第二区| av福利片在线观看| 18禁裸乳无遮挡动漫免费视频 | 22中文网久久字幕| 亚洲高清免费不卡视频| 亚洲精华国产精华液的使用体验| 欧美日韩精品成人综合77777| 精品一区二区三区视频在线| 少妇高潮的动态图| 自拍欧美九色日韩亚洲蝌蚪91 | 一级片'在线观看视频| 少妇 在线观看| 三级男女做爰猛烈吃奶摸视频| 久久久久久国产a免费观看| 九九爱精品视频在线观看| 久久99精品国语久久久| 国产在视频线精品| 国产欧美亚洲国产| 欧美少妇被猛烈插入视频| 久久精品国产亚洲av天美| 国产极品天堂在线| 国产精品嫩草影院av在线观看| 国产黄片美女视频| 久久影院123| 真实男女啪啪啪动态图| 免费观看a级毛片全部| 狂野欧美激情性bbbbbb| 老司机影院毛片| 少妇裸体淫交视频免费看高清| 成人欧美大片| 一级毛片 在线播放| 国产精品久久久久久久久免| 久久久久久九九精品二区国产| 好男人视频免费观看在线| 亚洲欧美日韩东京热| 欧美国产精品一级二级三级 | 国产免费福利视频在线观看| 别揉我奶头 嗯啊视频| 日韩av不卡免费在线播放| 一区二区三区乱码不卡18| 欧美+日韩+精品| 色吧在线观看| 中文字幕免费在线视频6| 日日啪夜夜撸| 五月天丁香电影| 国产高清不卡午夜福利| 啦啦啦中文免费视频观看日本| 午夜免费观看性视频| 丰满人妻一区二区三区视频av| 欧美成人精品欧美一级黄| 亚洲av中文av极速乱| 大香蕉97超碰在线| 亚洲经典国产精华液单| 亚洲精品久久午夜乱码| 亚洲av中文字字幕乱码综合| 各种免费的搞黄视频| 日本三级黄在线观看| 精品国产露脸久久av麻豆| 国产黄色免费在线视频| 久久久久九九精品影院| 国产精品.久久久| 国产精品女同一区二区软件| av在线天堂中文字幕| 成人欧美大片| 大码成人一级视频| 直男gayav资源| 成人黄色视频免费在线看| 少妇人妻精品综合一区二区| 亚洲欧美精品自产自拍| videossex国产| 一个人看的www免费观看视频| 深爱激情五月婷婷| 久久久欧美国产精品| 大片电影免费在线观看免费| 国产精品伦人一区二区| 日韩av不卡免费在线播放| 2021少妇久久久久久久久久久| 在线a可以看的网站| 91精品伊人久久大香线蕉| 国产又色又爽无遮挡免| 午夜激情久久久久久久| 高清在线视频一区二区三区| av免费观看日本| 美女高潮的动态| 男人舔奶头视频| 亚洲国产色片| 高清午夜精品一区二区三区| 亚洲婷婷狠狠爱综合网| 精品酒店卫生间| 亚洲欧美日韩卡通动漫| 欧美激情国产日韩精品一区| 国产精品爽爽va在线观看网站| 大又大粗又爽又黄少妇毛片口| 一本色道久久久久久精品综合| 又爽又黄无遮挡网站| 国产精品偷伦视频观看了| 少妇熟女欧美另类| 在线看a的网站| 18禁裸乳无遮挡免费网站照片| 伦理电影大哥的女人| 超碰av人人做人人爽久久| 熟女av电影| 亚洲精品国产成人久久av| av专区在线播放| 一边亲一边摸免费视频| 亚洲av成人精品一区久久| 免费电影在线观看免费观看| 老师上课跳d突然被开到最大视频| 九九久久精品国产亚洲av麻豆| 在线亚洲精品国产二区图片欧美 | 午夜福利网站1000一区二区三区| 国产亚洲av嫩草精品影院| 国产精品久久久久久久电影| 亚洲精品国产av成人精品| 天堂中文最新版在线下载 | 国产色婷婷99| 日韩三级伦理在线观看| videos熟女内射| 日韩大片免费观看网站| 精品人妻一区二区三区麻豆| 欧美bdsm另类| 美女视频免费永久观看网站| 亚洲欧美日韩无卡精品| 国产亚洲一区二区精品| 婷婷色麻豆天堂久久| 黄色视频在线播放观看不卡| 麻豆久久精品国产亚洲av| 一区二区三区乱码不卡18| 在线天堂最新版资源| 精品久久久精品久久久| 99精国产麻豆久久婷婷| 18禁裸乳无遮挡免费网站照片| 99视频精品全部免费 在线| 国产免费一区二区三区四区乱码| 欧美日韩综合久久久久久| 亚洲国产精品成人综合色| 成年版毛片免费区| 六月丁香七月| 美女脱内裤让男人舔精品视频| 国产亚洲91精品色在线| 国产日韩欧美在线精品| 国产成年人精品一区二区| 精品一区二区三卡| 国产精品三级大全| 精品久久久久久久人妻蜜臀av| 久久影院123| 国产精品99久久久久久久久| 69人妻影院| 国产精品.久久久| 国产免费一区二区三区四区乱码| 人妻制服诱惑在线中文字幕| 国产免费视频播放在线视频| 大陆偷拍与自拍| 一本久久精品| 永久免费av网站大全| 午夜激情福利司机影院| 亚洲欧美精品专区久久| 韩国高清视频一区二区三区| 欧美日韩在线观看h| 免费黄网站久久成人精品| 少妇人妻 视频| 久久久a久久爽久久v久久| 各种免费的搞黄视频| 国产淫语在线视频| 丰满乱子伦码专区| 久久亚洲国产成人精品v| 黄色怎么调成土黄色| 成年版毛片免费区| 性色avwww在线观看| 寂寞人妻少妇视频99o| 毛片女人毛片| 22中文网久久字幕| 国产亚洲一区二区精品| 精品久久久久久久久亚洲| 国产在线一区二区三区精| 一级毛片 在线播放| 可以在线观看毛片的网站| 国产精品人妻久久久影院| 免费黄网站久久成人精品| 男女下面进入的视频免费午夜| 日本三级黄在线观看| 亚洲成人中文字幕在线播放| 秋霞在线观看毛片| 亚洲精品,欧美精品| 成人二区视频| 国产精品av视频在线免费观看| av在线老鸭窝| 国产一区亚洲一区在线观看| 亚洲丝袜综合中文字幕| 中国国产av一级| 色综合色国产| 精品久久久精品久久久| 交换朋友夫妻互换小说| 韩国av在线不卡| 哪个播放器可以免费观看大片| 午夜精品国产一区二区电影 | 18禁裸乳无遮挡免费网站照片| 麻豆久久精品国产亚洲av| 久久精品夜色国产| 免费观看在线日韩| 久久精品夜色国产| 婷婷色综合大香蕉| 新久久久久国产一级毛片| 午夜激情久久久久久久| 亚洲国产精品999| 一个人观看的视频www高清免费观看| 成人亚洲欧美一区二区av| 成年人午夜在线观看视频| 国产精品国产三级专区第一集| 亚洲国产成人一精品久久久| 成人国产av品久久久| 国产男人的电影天堂91| 国产成人午夜福利电影在线观看| 校园人妻丝袜中文字幕| 熟女电影av网| 99热6这里只有精品| 少妇丰满av| 欧美97在线视频|