• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Q學(xué)習(xí)的智能車間自適應(yīng)調(diào)度方法

    2023-12-04 11:19:16蔡靜雯馬玉敏黎聲益
    關(guān)鍵詞:智能環(huán)境生產(chǎn)

    蔡靜雯,馬玉敏,黎聲益,劉 鵑

    (同濟(jì)大學(xué) 電子與信息工程學(xué)院,上海 201804)

    0 引言

    近年來,在智能制造背景下,隨著定制化程度的提升,產(chǎn)品的生命周期縮短,制造過程中的動(dòng)態(tài)不確定性因素對(duì)制造系統(tǒng)性能的影響越來越不容忽視[1],具有適應(yīng)能力的動(dòng)態(tài)調(diào)度方法得到越來越多的關(guān)注。其中,智能車間動(dòng)態(tài)不確定環(huán)境下的自適應(yīng)調(diào)度方法就是關(guān)注點(diǎn)之一[2]。智能車間實(shí)現(xiàn)自適應(yīng)調(diào)度的關(guān)鍵在于,系統(tǒng)在環(huán)境發(fā)生動(dòng)態(tài)變化時(shí),依據(jù)科學(xué)合理的調(diào)度知識(shí)在減少人工干預(yù)的情況下自主完成調(diào)度策略的確定和實(shí)施。

    以傳感技術(shù)和物聯(lián)網(wǎng)技術(shù)為基礎(chǔ)的智能車間使生產(chǎn)狀態(tài)數(shù)據(jù)采集實(shí)時(shí)可靠[3],數(shù)據(jù)驅(qū)動(dòng)的調(diào)度優(yōu)化方法成為主流。例如,JUN等[4]為了解決柔性作業(yè)車間調(diào)度問題,從歷史最佳調(diào)度方案中學(xué)習(xí)到在性能和魯棒性方面表現(xiàn)優(yōu)異的調(diào)度規(guī)則;ROSSIT等[5]針對(duì)智能制造和工業(yè)4.0帶來的制造過程分散化和自主性特點(diǎn),提出基于信息物理融合系統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)調(diào)度體系架構(gòu),提高調(diào)度決策效率,實(shí)現(xiàn)智能制造系統(tǒng)的有序運(yùn)行。由此可見,數(shù)據(jù)驅(qū)動(dòng)的調(diào)度方法能夠充分利用車間生產(chǎn)過程中產(chǎn)生的大量歷史數(shù)據(jù)或仿真數(shù)據(jù),從中挖掘出實(shí)時(shí)可靠的調(diào)度知識(shí)來指導(dǎo)車間生產(chǎn)運(yùn)行,從而增加調(diào)度策略的實(shí)時(shí)性、科學(xué)性與可行性[6]。

    在數(shù)據(jù)驅(qū)動(dòng)的調(diào)度方法中,機(jī)器學(xué)習(xí)算法在應(yīng)對(duì)動(dòng)態(tài)場(chǎng)景下的大規(guī)模、高復(fù)雜性數(shù)據(jù)問題上具備優(yōu)勢(shì)[7],為解決智能車間生產(chǎn)調(diào)度問題提供了有效途徑。機(jī)器學(xué)習(xí)算法不需要建立精確的數(shù)學(xué)模型,通過學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律,獲取數(shù)據(jù)的分布式特征,確立從輸入到輸出的映射關(guān)系[8]。從樣本數(shù)據(jù)的組成結(jié)構(gòu)層面分析,機(jī)器學(xué)習(xí)可以分為監(jiān)督學(xué)習(xí)算法和強(qiáng)化學(xué)習(xí)算法[9]。監(jiān)督學(xué)習(xí)算法使用具有多維特征的帶標(biāo)簽樣本進(jìn)行訓(xùn)練,能夠?qū)π聵颖镜臉?biāo)簽進(jìn)行分析與預(yù)測(cè)[10]。例如,SHAO等[11]為解決車間調(diào)度中NP-hard問題,設(shè)計(jì)了多尺度特征融合卷積神經(jīng)網(wǎng)絡(luò),從動(dòng)態(tài)環(huán)境中提取特征,根據(jù)特征預(yù)測(cè)最優(yōu)策略,該方法可以有效處理復(fù)雜調(diào)度問題;ZANG等[12]利用卷積變換將生產(chǎn)過程中的不規(guī)則數(shù)據(jù)轉(zhuǎn)換為以調(diào)度策略為標(biāo)簽的規(guī)則樣本數(shù)據(jù),用于訓(xùn)練混合深度神經(jīng)網(wǎng)絡(luò)調(diào)度器,該調(diào)度器具有較強(qiáng)的泛化能力,能夠解決大規(guī)模調(diào)度問題。在調(diào)度問題中,帶標(biāo)簽樣本是通過優(yōu)化處理生成的使調(diào)度目標(biāo)達(dá)到最優(yōu)的樣本,即最優(yōu)樣本。樣本優(yōu)化處理過程需要大量人工參與,會(huì)產(chǎn)生較高的人力與時(shí)間成本,且可能存在最優(yōu)樣本準(zhǔn)確度難以保證的問題[13],從而影響調(diào)度策略的有效性。強(qiáng)化學(xué)習(xí)方法不依賴于帶標(biāo)簽樣本,通過與環(huán)境的不斷交互試錯(cuò)獲取反饋數(shù)據(jù),基于最大化獎(jiǎng)勵(lì)反饋不斷優(yōu)化行為策略,能有效解決此問題[14]。例如,WANG等[15]考慮到車間生產(chǎn)環(huán)境的動(dòng)態(tài)性和不確定性,提出一種基于聚類和動(dòng)態(tài)搜索的加權(quán)Q學(xué)習(xí)自適應(yīng)調(diào)度算法,通過與環(huán)境的直接交互學(xué)習(xí)最優(yōu)操作,該方法在不同調(diào)度環(huán)境下具有良好的適應(yīng)性。ZHOU等[16]在分布式制造系統(tǒng)中,利用多智能體強(qiáng)化學(xué)習(xí)方法對(duì)多個(gè)調(diào)度器進(jìn)行動(dòng)態(tài)協(xié)同,該方法有效地提升了調(diào)度器的學(xué)習(xí)和調(diào)度效率,同時(shí)對(duì)突發(fā)擾動(dòng)具有一定的應(yīng)對(duì)能力。ZHAO等[17]針對(duì)動(dòng)態(tài)作業(yè)車間調(diào)度問題建立深度Q網(wǎng)絡(luò),將多種啟發(fā)式調(diào)度規(guī)則作為動(dòng)作集合,根據(jù)調(diào)度期結(jié)束時(shí)的生產(chǎn)狀態(tài)確定下一調(diào)度期的規(guī)則,該方法的泛化性以及對(duì)生產(chǎn)性能的優(yōu)化作用均優(yōu)于單一啟發(fā)式調(diào)度規(guī)則和基于有監(jiān)督學(xué)習(xí)的方法。由此可知,強(qiáng)化學(xué)習(xí)算法通過與環(huán)境的自主交互,學(xué)習(xí)使目標(biāo)最優(yōu)化的調(diào)度知識(shí),具有強(qiáng)大的自學(xué)習(xí)能力[18],能夠在生產(chǎn)調(diào)度過程中最大程度地減少人工干預(yù)。

    同時(shí),在監(jiān)督學(xué)習(xí)中,訓(xùn)練所用的優(yōu)化樣本由歷史數(shù)據(jù)得到,導(dǎo)致學(xué)習(xí)到的調(diào)度知識(shí)具有時(shí)效性,在應(yīng)用于環(huán)境動(dòng)態(tài)變化的智能車間生產(chǎn)調(diào)度問題時(shí),存在失效的可能性,以至于生成的調(diào)度決策產(chǎn)生偏差甚至失真,難以實(shí)現(xiàn)全生產(chǎn)過程的自適應(yīng)調(diào)度。強(qiáng)化學(xué)習(xí)基于其交互學(xué)習(xí)和在線訓(xùn)練特性[19],在獲取動(dòng)態(tài)調(diào)度知識(shí)方面具備優(yōu)越性。此外,現(xiàn)有的生產(chǎn)調(diào)度決策多考慮單一調(diào)度規(guī)則,其解空間有限,無法涵蓋所有決策可能性,存在調(diào)度決策對(duì)生產(chǎn)目標(biāo)優(yōu)化效果不明顯的問題,而組合式調(diào)度規(guī)則綜合考慮多個(gè)面向不同調(diào)度目標(biāo)的調(diào)度規(guī)則,能夠兼顧多種單一規(guī)則的優(yōu)點(diǎn),同時(shí)提高解空間維度[20]。因此,本文研究了一種基于Q學(xué)習(xí)的自適應(yīng)調(diào)度方法,該方法通過與智能車間的交互,自主學(xué)習(xí)與更新能夠適應(yīng)車間動(dòng)態(tài)生產(chǎn)環(huán)境的調(diào)度知識(shí),同時(shí)基于組合式調(diào)度規(guī)則,在變化的車間生產(chǎn)環(huán)境下實(shí)時(shí)地調(diào)整最優(yōu)調(diào)度決策,從而保持對(duì)智能車間生產(chǎn)全過程性能指標(biāo)的持續(xù)優(yōu)化。所提出的自適應(yīng)調(diào)度方法將在MiniFab半導(dǎo)體生產(chǎn)線模型上進(jìn)行測(cè)試,并通過衡量其對(duì)綜合性能指標(biāo)以及人力與時(shí)間成本的優(yōu)化效果,來驗(yàn)證該方法的有效性與優(yōu)越性。

    1 智能車間自適應(yīng)調(diào)度解決方案

    以物聯(lián)網(wǎng)為基礎(chǔ)的智能車間能實(shí)時(shí)感知車間生產(chǎn)狀態(tài),在此基礎(chǔ)上,本文借鑒車間的動(dòng)態(tài)調(diào)度框架[21],提出了如圖1所示的基于強(qiáng)化學(xué)習(xí)交互訓(xùn)練機(jī)制的智能車間自適應(yīng)調(diào)度解決方案。其中,調(diào)度模型是對(duì)調(diào)度知識(shí)進(jìn)行抽象后的形式化表達(dá),該方案通過學(xué)習(xí)生產(chǎn)數(shù)據(jù)內(nèi)部邏輯與規(guī)律,構(gòu)建適應(yīng)智能車間調(diào)度目標(biāo)與動(dòng)態(tài)生產(chǎn)環(huán)境的調(diào)度模型,確立從生產(chǎn)狀態(tài)到調(diào)度決策的映射關(guān)系,進(jìn)而根據(jù)調(diào)度模型實(shí)時(shí)指導(dǎo)智能車間最優(yōu)調(diào)度決策的生成與實(shí)施。

    該方案的整體運(yùn)行框架由多個(gè)功能模塊組成,包括存儲(chǔ)車間歷史與實(shí)時(shí)運(yùn)行數(shù)據(jù)的數(shù)據(jù)池、強(qiáng)化學(xué)習(xí)交互訓(xùn)練機(jī)制所需的仿真車間平臺(tái)、利用強(qiáng)化學(xué)習(xí)算法進(jìn)行模型生成與更新的調(diào)度模型訓(xùn)練模塊,以及指導(dǎo)車間生產(chǎn)調(diào)度的自適應(yīng)調(diào)度模塊,各功能模塊之間協(xié)調(diào)配合,共同完成智能車間自適應(yīng)調(diào)度過程。該方案的運(yùn)行過程分為調(diào)度模型訓(xùn)練過程和調(diào)度模型應(yīng)用過程,具體實(shí)現(xiàn)如下:

    (1)仿真車間構(gòu)建與更新 根據(jù)智能車間配置數(shù)據(jù)與實(shí)時(shí)生產(chǎn)數(shù)據(jù)進(jìn)行仿真車間模型的構(gòu)建與更新,用于支撐調(diào)度模型訓(xùn)練模塊的高效、高重復(fù)性迭代訓(xùn)練。仿真車間與真實(shí)物理車間運(yùn)行狀態(tài)保持一致性、同步性,使得訓(xùn)練生成的調(diào)度模型能夠有效應(yīng)用于實(shí)際生產(chǎn)車間。

    (2)車間數(shù)據(jù)采集 利用車間傳感器實(shí)時(shí)采集車間運(yùn)行過程信息,對(duì)其進(jìn)行清洗、合并等預(yù)處理操作后形成標(biāo)準(zhǔn)類型的車間運(yùn)行數(shù)據(jù)進(jìn)行存儲(chǔ),同時(shí)提供給自適應(yīng)調(diào)度模塊和仿真車間。

    (3)調(diào)度模型訓(xùn)練 調(diào)度模型訓(xùn)練模塊基于強(qiáng)化學(xué)習(xí)交互訓(xùn)練機(jī)制,結(jié)合調(diào)度目標(biāo)和訓(xùn)練算法,通過與仿真車間的在線交互訓(xùn)練,使調(diào)度模型始終適應(yīng)生產(chǎn)環(huán)境的變化,保持模型有效性,從而能夠根據(jù)需求及時(shí)更新自適應(yīng)調(diào)度模塊,降低更新的遲滯性。

    (4)自適應(yīng)調(diào)度 自適應(yīng)調(diào)度模塊通過接收當(dāng)前時(shí)刻車間生產(chǎn)狀態(tài)作為自適應(yīng)調(diào)度模型的輸入,輸出相應(yīng)的最優(yōu)調(diào)度決策施加給智能車間,指導(dǎo)下一階段的車間生產(chǎn)運(yùn)行,從而實(shí)現(xiàn)動(dòng)態(tài)生產(chǎn)環(huán)境下的自適應(yīng)調(diào)度決策。同時(shí),將生產(chǎn)性能與調(diào)度目標(biāo)進(jìn)行周期性對(duì)比分析,評(píng)估調(diào)度模型是否能支持當(dāng)前車間動(dòng)態(tài)環(huán)境下的生產(chǎn)調(diào)度,若調(diào)度模型失效,則激活調(diào)度模型動(dòng)態(tài)更新操作。

    上述智能車間自適應(yīng)調(diào)度框架中,自適應(yīng)調(diào)度模塊是依據(jù)自適應(yīng)調(diào)度模型的指導(dǎo),根據(jù)實(shí)時(shí)感知到的生產(chǎn)狀態(tài)變化動(dòng)態(tài)更新調(diào)度決策,使調(diào)度決策始終保持最優(yōu),從而實(shí)現(xiàn)動(dòng)態(tài)環(huán)境下車間的平穩(wěn)高效運(yùn)行。因此,基于強(qiáng)化學(xué)習(xí)生成與應(yīng)用合理有效的自適應(yīng)調(diào)度模型是實(shí)現(xiàn)智能車間自適應(yīng)調(diào)度過程的關(guān)鍵。

    2 基于Q學(xué)習(xí)算法的自適應(yīng)調(diào)度模型

    2.1 基于Q學(xué)習(xí)算法的調(diào)度智能體設(shè)計(jì)

    本文的自適應(yīng)調(diào)度模型由調(diào)度模型訓(xùn)練模塊生成,應(yīng)用于自適應(yīng)調(diào)度模塊。為了降低訓(xùn)練過程中人工參與優(yōu)化樣本處理過程帶來的時(shí)間與人力成本,減小模型生成或更新過程的遲滯,保證自適應(yīng)調(diào)度的實(shí)時(shí)性與準(zhǔn)確性,本文采用強(qiáng)化學(xué)習(xí)算法進(jìn)行訓(xùn)練。強(qiáng)化學(xué)習(xí)是一種交互試錯(cuò)式的學(xué)習(xí)方法,不需要帶標(biāo)簽的樣本數(shù)據(jù),通過與環(huán)境的不斷交互獲得用于訓(xùn)練的數(shù)據(jù)。實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)需要搭建相應(yīng)的智能體與環(huán)境,智能體用于向環(huán)境施加動(dòng)作,環(huán)境則對(duì)智能體施加的動(dòng)作作出反應(yīng),如圖2所示。

    在生產(chǎn)調(diào)度問題中,智能體與環(huán)境可分別對(duì)應(yīng)于做出調(diào)度決策的調(diào)度智能體和智能車間生產(chǎn)環(huán)境,如圖3所示。調(diào)度智能體一方面不斷向生產(chǎn)環(huán)境施加決策動(dòng)作,另一方面不斷接收來自環(huán)境的反饋,反饋基于調(diào)度目標(biāo),可能是懲罰也可能是獎(jiǎng)勵(lì),調(diào)度智能體則根據(jù)反饋選擇下一步的決策,不斷循環(huán)上述過程,通過多次迭代探索后獲得最大化反饋獎(jiǎng)賞的調(diào)度模型。

    Q學(xué)習(xí)算法是經(jīng)典的基于值函數(shù)的強(qiáng)化學(xué)習(xí)方法,是強(qiáng)化學(xué)習(xí)的基礎(chǔ)算法[22]。在生產(chǎn)調(diào)度問題應(yīng)用方面,其主要優(yōu)點(diǎn)體現(xiàn)為[23]:① 車間調(diào)度問題一般為組合優(yōu)化問題,基于值函數(shù)的方法在離散空間模型中具有更好的優(yōu)化效果;②單步更新的學(xué)習(xí)過程能夠提升調(diào)度模型的訓(xùn)練效率,同時(shí)模型對(duì)于環(huán)境的變化更為敏感,有利于最優(yōu)調(diào)度策略的及時(shí)調(diào)整;③根據(jù)不同的策略,支持在線學(xué)習(xí)與離線學(xué)習(xí)兩種模式,可以學(xué)習(xí)到歷史生產(chǎn)數(shù)據(jù)中的知識(shí),也可以通過與環(huán)境的交互進(jìn)行在線學(xué)習(xí),進(jìn)而滿足調(diào)度模型同步訓(xùn)練與實(shí)時(shí)更新的需求。

    Q學(xué)習(xí)算法將狀態(tài)S與動(dòng)作A構(gòu)建成一張Q-table來存儲(chǔ)Q值,采用類似梯度下降的漸進(jìn)方式逐步靠近目標(biāo)Q值,減少估計(jì)誤差造成的影響,Q值計(jì)算如下:

    Q(s,a)′=Q(s,a)+α(r+γmaxQ(s′,a′)-Q(s,a))。

    (1)

    式中:α表示學(xué)習(xí)率,其值大小決定模型訓(xùn)練獲得最優(yōu)解的速度,學(xué)習(xí)率過大可能會(huì)導(dǎo)致錯(cuò)過最優(yōu)解而使模型無法收斂,反之則會(huì)影響訓(xùn)練效率;γ表示折扣率,表示長(zhǎng)期決策對(duì)當(dāng)前行為的影響;Q(s,a)表示在某一環(huán)境狀態(tài)s(s∈S)下智能體采取動(dòng)作a(a∈A)能夠獲得的收益的期望;r表示環(huán)境對(duì)智能體動(dòng)作的反饋;Q(s′,a′)表示環(huán)境在當(dāng)前動(dòng)作作用下進(jìn)入的新狀態(tài)s′(s′∈S)在Q-table中對(duì)應(yīng)的最大期望值,當(dāng)每個(gè)迭代回合結(jié)束時(shí)不需考慮新的生產(chǎn)狀態(tài),此時(shí)取Q(s′,a′)=0。

    將Q學(xué)習(xí)算法用于自適應(yīng)調(diào)度問題求解時(shí),s表示智能車間生產(chǎn)狀態(tài),a表示調(diào)度智能體施加的調(diào)度決策d,s′表示車間按照調(diào)度決策運(yùn)行得到的新生產(chǎn)狀態(tài),r表示基于調(diào)度目標(biāo)的反饋回報(bào),Q-table即為表征生產(chǎn)狀態(tài)與調(diào)度決策間映射關(guān)系的自適應(yīng)調(diào)度模型。

    Q學(xué)習(xí)算法的主要思想是在智能體與環(huán)境的交互迭代中不斷更新Q-table,最后根據(jù)當(dāng)前狀態(tài)的Q值選擇能夠獲得收益最大的動(dòng)作,從而生成最優(yōu)行動(dòng)軌跡,據(jù)此,基于Q學(xué)習(xí)算法的自適應(yīng)調(diào)度模型生成與應(yīng)用過程如圖3所示。其中,調(diào)度模型的生成過程為,根據(jù)智能車間配置數(shù)據(jù)與實(shí)時(shí)生產(chǎn)數(shù)據(jù)搭建或更新仿真車間,以支持調(diào)度智能體與環(huán)境的不斷交互,調(diào)度智能體則根據(jù)式(1)更新Q-table,通過與仿真車間生產(chǎn)環(huán)境的交互試錯(cuò),學(xué)習(xí)使獎(jiǎng)勵(lì)最大化的調(diào)度決策,該過程對(duì)應(yīng)自適應(yīng)調(diào)度框架中的調(diào)度模型訓(xùn)練階段。調(diào)度模型的應(yīng)用過程為,訓(xùn)練完成的調(diào)度智能體基于當(dāng)前Q-table,在車間生產(chǎn)運(yùn)行過程中的每個(gè)調(diào)度點(diǎn)觀測(cè)生產(chǎn)狀態(tài)數(shù)據(jù),據(jù)此選擇使調(diào)度目標(biāo)最優(yōu)化的相應(yīng)調(diào)度決策,該過程對(duì)應(yīng)自適應(yīng)調(diào)度框架中的調(diào)度模型應(yīng)用階段。

    2.2 調(diào)度智能體訓(xùn)練過程

    自適應(yīng)調(diào)度模型由調(diào)度智能體利用Q學(xué)習(xí)算法訓(xùn)練得到,訓(xùn)練過程如圖4所示。

    基于Q學(xué)習(xí)算法的調(diào)度智能體具體訓(xùn)練步驟如下:

    步驟1調(diào)度智能體依據(jù)環(huán)境特征與調(diào)度目標(biāo),選定車間生產(chǎn)狀態(tài)維度和決策維度,建立n×m的矩陣Q-table,初始化為零矩陣。

    步驟2從智能車間生產(chǎn)環(huán)境中觀測(cè)初始生產(chǎn)狀態(tài)s0;

    步驟3根據(jù)貪心算法ε-greedy在Q-table中選擇對(duì)應(yīng)的動(dòng)作a(即調(diào)度決策d)施加于環(huán)境,觀測(cè)運(yùn)行后的新狀態(tài)s′,并計(jì)算實(shí)際生產(chǎn)性能與目標(biāo)性能之間的偏差,得到獎(jiǎng)勵(lì)反饋或懲罰反饋。其中,ε-greedy貪心算法基于概率對(duì)探索和利用進(jìn)行折衷,即以探索率的概率ε進(jìn)行探索,以1-ε的概率進(jìn)行利用,防止陷入局部最優(yōu)解,基于此,設(shè)計(jì)式(2)所示的動(dòng)作a作出決策:

    (2)

    其中rand=random[0,1]。

    步驟4根據(jù)式(1)更新Q-table。

    步驟5判斷該回合訓(xùn)練是否結(jié)束,若結(jié)束,則進(jìn)入下一訓(xùn)練回合,重復(fù)執(zhí)行步驟2~步驟4;若沒有結(jié)束,則重復(fù)步驟3~步驟4繼續(xù)訓(xùn)練。

    步驟6達(dá)到預(yù)設(shè)最大訓(xùn)練回合數(shù),總獎(jiǎng)勵(lì)值收斂則智能體訓(xùn)練完成,生成自適應(yīng)調(diào)度模型Q-table。

    基于Q學(xué)習(xí)的調(diào)度智能體訓(xùn)練過程算法如下:

    算法1基于Q學(xué)習(xí)的調(diào)度智能體訓(xùn)練算法。

    參數(shù):學(xué)習(xí)率α、折扣率γ、探索率ε

    初始化Q-table(Q(s,a))=0,?s∈S,a∈A)

    Repeat (for each episode):

    觀測(cè)初始狀態(tài)

    Repeat (for each step of episode):

    使用貪心算法ε-greedy從Q-table中選擇動(dòng)作a(決策d)

    對(duì)環(huán)境施加動(dòng)作a,并觀測(cè)反饋r和新狀態(tài)s′

    根據(jù)式(1)更新Q(s,a)

    Until 所有步驟結(jié)束

    Until 所有回合結(jié)束

    輸出Q-table

    將利用Q學(xué)習(xí)算法訓(xùn)練得到的調(diào)度模型應(yīng)用于車間自適應(yīng)調(diào)度框架(如圖1)中的自適應(yīng)調(diào)度模塊,調(diào)度模型在每個(gè)調(diào)度決策點(diǎn)根據(jù)獲取到的實(shí)時(shí)車間生產(chǎn)狀態(tài)數(shù)據(jù),選擇使目標(biāo)最優(yōu)的調(diào)度決策指導(dǎo)整個(gè)調(diào)度周期車間的生產(chǎn)運(yùn)行。此外,在生產(chǎn)環(huán)境發(fā)生較大變動(dòng)或調(diào)度目標(biāo)改變導(dǎo)致調(diào)度模型失效時(shí),調(diào)度智能體根據(jù)當(dāng)前生產(chǎn)需求更新自適應(yīng)調(diào)度模塊的調(diào)度模型,以適應(yīng)新的生產(chǎn)狀況。

    3 實(shí)驗(yàn)

    為驗(yàn)證本文中所提出的基于Q學(xué)習(xí)的智能車間自適應(yīng)調(diào)度方法的有效性,該方法在基于經(jīng)典半導(dǎo)體生產(chǎn)車間MiniFab[24]模型搭建的半導(dǎo)體智慧制造單元上進(jìn)行驗(yàn)證,如圖5所示。該制造單元包含5臺(tái)設(shè)備(3個(gè)設(shè)備群)、3個(gè)緩沖區(qū)和3種加工產(chǎn)品,用于構(gòu)造仿真車間的軟件平臺(tái)選用西門子的Tecnomatix Plant Simulation。

    3.1 實(shí)驗(yàn)設(shè)計(jì)

    3.1.1 數(shù)據(jù)結(jié)構(gòu)設(shè)置

    本文所設(shè)計(jì)的調(diào)度智能體通過不斷向生產(chǎn)環(huán)境施加調(diào)度決策,并觀測(cè)環(huán)境的生產(chǎn)狀態(tài)變化和相應(yīng)的反饋回報(bào)來訓(xùn)練自適應(yīng)調(diào)度模型。因此,本實(shí)驗(yàn)需要設(shè)計(jì)合適的數(shù)據(jù)結(jié)構(gòu)以提升交互學(xué)習(xí)的效率,包括智能車間生產(chǎn)狀態(tài)S、調(diào)度決策D和回報(bào)函數(shù)R。

    (1)生產(chǎn)狀態(tài)S生產(chǎn)狀態(tài)選取擴(kuò)散區(qū)、離子注入?yún)^(qū)、光刻區(qū)中3種產(chǎn)品P_a、P_b、P_c的在制品數(shù)。車間的日投料數(shù)量設(shè)置為在[5,7]區(qū)間內(nèi)均勻分布。為了得到涵蓋多種生產(chǎn)狀態(tài)的數(shù)據(jù),本實(shí)驗(yàn)在隨機(jī)調(diào)度規(guī)則下運(yùn)行仿真車間模型,獲得600組生產(chǎn)狀態(tài)數(shù)據(jù),并對(duì)原始狀態(tài)數(shù)據(jù)進(jìn)行編碼,即對(duì)每一類在制品按照數(shù)據(jù)量均等的原則劃分區(qū)間,將其轉(zhuǎn)換為適合模型訓(xùn)練的狀態(tài)數(shù)據(jù)。

    根據(jù)表1的劃分依據(jù),本實(shí)驗(yàn)可將原始生產(chǎn)狀態(tài)編碼為8 748種類型,即調(diào)度模型Q-table的生產(chǎn)狀態(tài)維度n=8 748。

    表1 車間生產(chǎn)狀態(tài)數(shù)據(jù)劃分依據(jù)

    (2)調(diào)度決策D調(diào)度決策設(shè)置最早交貨期優(yōu)先規(guī)則EarliestDueDate,EDD)、最短剩余加工時(shí)間優(yōu)先規(guī)則(ShortestRemainingProcessingTime,SRPT)、關(guān)鍵比例規(guī)則(CriticalRatio,CR)3種啟發(fā)式調(diào)度規(guī)則進(jìn)行組合,形成組合式調(diào)度規(guī)則D={d1,d2,...,dm}[20],其中di=(ωEDDi,ωSRPTi,ωCRi),1≤i≤m,m表示調(diào)度決策的類型數(shù)量。調(diào)度決策根據(jù)式(3)和式(4)計(jì)算得到:

    P=ωEDDPE+ωSRPTPS+ωCRPC,ω∈[0,1],

    (3)

    ωEDD+ωSRPT+ωCR=1。

    (4)

    其中:P表示待加工產(chǎn)品的加工優(yōu)先級(jí),ωEDD、ωSRPT、ωCR分別表示3種啟發(fā)式調(diào)度規(guī)則的權(quán)重,PE、PS、PC則分別表示在3種啟發(fā)式調(diào)度規(guī)則下的產(chǎn)品加工優(yōu)先級(jí),設(shè)置權(quán)重ω間隔為0.05,因此本實(shí)驗(yàn)中共有255種調(diào)度決策類型,即調(diào)度模型Q-table的決策維度m=255。

    (3)回報(bào)函數(shù)R針對(duì)多目標(biāo)優(yōu)化問題,回報(bào)函數(shù)選擇日產(chǎn)量Tp和日移動(dòng)步數(shù)Mov作為關(guān)鍵評(píng)價(jià)指標(biāo),回報(bào)值與指標(biāo)間呈正相關(guān),指標(biāo)數(shù)值越高表示調(diào)度決策效果越好,此時(shí)環(huán)境對(duì)訓(xùn)練智能體的獎(jiǎng)勵(lì)越高。實(shí)驗(yàn)設(shè)置車間日產(chǎn)量閾值Tp_th,日移動(dòng)步數(shù)閾值Mov_th,高于閾值則回報(bào)函數(shù)為正值(獎(jiǎng)勵(lì)),低于閾值則回報(bào)為負(fù)值(懲罰),回報(bào)函數(shù)數(shù)值r(r∈R)根據(jù)式(5)進(jìn)行計(jì)算:

    r=(Tp-Tp_th)+(Mov-Mov_th)。

    (5)

    3.1.2 超參數(shù)設(shè)置

    調(diào)度智能體訓(xùn)練時(shí)根據(jù)式(1)更新Q-table,需要確定超參數(shù)折扣率γ和學(xué)習(xí)速率α。由于本文研究的調(diào)度問題是采用最優(yōu)調(diào)度決策優(yōu)化整個(gè)調(diào)度周期內(nèi)車間生產(chǎn)性能,折扣率γ取較大值0.9,表示未來調(diào)度決策對(duì)當(dāng)前決策行為的影響較大。在學(xué)習(xí)速率α的選擇上,為了獲得最大收益并使實(shí)驗(yàn)迭代次數(shù)在可接受范圍內(nèi),開始學(xué)習(xí)時(shí)設(shè)置較大的學(xué)習(xí)速率來修正智能體的行為,隨著實(shí)驗(yàn)次數(shù)的增加,逐漸減小學(xué)習(xí)速率防止錯(cuò)過最優(yōu)解[25]。實(shí)驗(yàn)中采用式(6)動(dòng)態(tài)減小學(xué)習(xí)速率。

    (6)

    初始學(xué)習(xí)率α0設(shè)置為0.5;學(xué)習(xí)率動(dòng)態(tài)變化的最大回合數(shù)max_episode設(shè)置為1 500。

    訓(xùn)練過程中智能體的行為策略依據(jù)貪心算法ε-greedy(式(2)),以ε的概率在動(dòng)作空間隨機(jī)選擇一個(gè)決策,通過不斷探索可以獲得更佳的決策,以1-ε的概率在已知決策中選擇一個(gè)回報(bào)最大的決策。實(shí)驗(yàn)采用式(7)動(dòng)態(tài)減小探索速率,隨著探索率減小,總回報(bào)逐漸收斂于最高值,達(dá)到探索—利用平衡。

    (7)

    初始探索率ε0設(shè)置為0.5;探索率動(dòng)態(tài)變化的最大回合數(shù)max_episode設(shè)置為1 500。

    在1 500回合之前,學(xué)習(xí)率和探索率動(dòng)態(tài)減小,1 500回合之后,學(xué)習(xí)率和探索率保持在0.01,即仍然存在探索和學(xué)習(xí)的可能。

    3.2 實(shí)驗(yàn)結(jié)果

    在3.1節(jié)中所設(shè)置的實(shí)驗(yàn)數(shù)據(jù)結(jié)構(gòu)和超參數(shù)基礎(chǔ)上,訓(xùn)練基于Q學(xué)習(xí)算法的調(diào)度模型,用于動(dòng)態(tài)環(huán)境下的智能車間自適應(yīng)調(diào)度決策(Q學(xué)習(xí)調(diào)度方法)。實(shí)驗(yàn)以日產(chǎn)量Tp和日移動(dòng)步數(shù)Mov為性能評(píng)價(jià)指標(biāo),調(diào)度模型根據(jù)生產(chǎn)狀態(tài)變化對(duì)最優(yōu)調(diào)度決策進(jìn)行每日更新,將該決策與單一調(diào)度規(guī)則EDD、SRPT、CR和基于支持向量回歸(Support Vector Regression,SVR)算法的有監(jiān)督調(diào)度模型輸出的長(zhǎng)期調(diào)度決策對(duì)車間生產(chǎn)性能指標(biāo)產(chǎn)生的影響作對(duì)比,同時(shí)對(duì)比SVR調(diào)度方法與Q-learning調(diào)度方法所需的時(shí)間與人力成本,驗(yàn)證基于Q學(xué)習(xí)的智能車間自適應(yīng)調(diào)度方法的可行性與有效性。實(shí)驗(yàn)中,車間生產(chǎn)環(huán)境的動(dòng)態(tài)不確定性體現(xiàn)在日投料數(shù)量的隨機(jī)性上。對(duì)比實(shí)驗(yàn)采取控制變量法,除調(diào)度決策外,其余實(shí)驗(yàn)條件一致。

    調(diào)度智能體在2 500回合學(xué)習(xí)過程中的獎(jiǎng)勵(lì)值數(shù)據(jù)記錄如圖6所示。在學(xué)習(xí)初期,獎(jiǎng)勵(lì)值存在劇烈波動(dòng),但曲線總體呈不斷上升的趨勢(shì),此時(shí)智能體的探索能力和學(xué)習(xí)能力較強(qiáng)。隨著回合數(shù)的增加,智能體學(xué)習(xí)速率和探索率減小,獎(jiǎng)勵(lì)值逐漸收斂于一個(gè)較高的數(shù)值,則表明訓(xùn)練完成,生成的調(diào)度模型能夠用于指導(dǎo)該場(chǎng)景下的車間生產(chǎn)調(diào)度。

    在相同實(shí)驗(yàn)場(chǎng)景下,對(duì)生成的調(diào)度模型進(jìn)行有效性驗(yàn)證。為了消除實(shí)驗(yàn)結(jié)果偶然性的影響,隨機(jī)選取20種不同投料模式,對(duì)5種調(diào)度方法得到的每日生產(chǎn)性能進(jìn)行記錄,如圖7~圖9a所示,同時(shí),對(duì)不同調(diào)度方法下的生產(chǎn)性能數(shù)據(jù)分布進(jìn)行對(duì)比,如圖7~9b的箱型圖所示。其中,生產(chǎn)前10d預(yù)熱時(shí)間,調(diào)度周期為11~25d。

    統(tǒng)計(jì)性能指標(biāo)平均值(如表2),對(duì)比分析發(fā)現(xiàn),Q學(xué)習(xí)算法在日產(chǎn)量、日移動(dòng)步數(shù)、綜合性能上均表現(xiàn)出了最優(yōu)的效果。數(shù)值上,Q學(xué)習(xí)算法調(diào)度方法的日產(chǎn)量較EDD、SRPT、CR和SVR分別提升了9.978%、1.617%、0.771%和0.332%,日移動(dòng)步數(shù)分別提升了1.903%、0.636%、0.131%和0.112%,綜合性能則分別優(yōu)化了2.933%、0.769%、0.217%和0.147%。

    表2 車間性能指標(biāo)統(tǒng)計(jì)數(shù)據(jù)記錄

    為了更好地分析不同調(diào)度方法對(duì)于整個(gè)調(diào)度周期內(nèi)生產(chǎn)性能的影響,橫向?qū)Ρ?0組不同投料機(jī)制下的實(shí)驗(yàn)結(jié)果,繪制箱型圖,分別表示統(tǒng)計(jì)數(shù)據(jù)的上邊緣、上四分位數(shù)、中位數(shù)、下四分位數(shù)、下邊緣、平均數(shù)和異常點(diǎn)(數(shù)據(jù)如表2)。在調(diào)度周期內(nèi)的平均日產(chǎn)量方面,Q學(xué)習(xí)算法對(duì)應(yīng)的生產(chǎn)性能明顯優(yōu)于EDD和SRPT,與CR、SVR具有相近的影響效果,其箱型圖的上邊緣相同,但整體分布區(qū)間包括中位數(shù)、平均數(shù)、下邊緣等均高于CR與SVR。在調(diào)度周期平均日移動(dòng)步數(shù)方面,同樣地,Q學(xué)習(xí)算法所得到的性能遠(yuǎn)優(yōu)于EDD和SRPT,同時(shí)所有評(píng)價(jià)指標(biāo)均略微優(yōu)于CR和SVR。在調(diào)度周期綜合性能指標(biāo)方面,Q學(xué)習(xí)算法相較于SVR和GCR,整體分布的優(yōu)化效果則更為明顯,據(jù)此能夠驗(yàn)證本文基于Q學(xué)習(xí)算法自適應(yīng)調(diào)度方法的有效性與優(yōu)越性。

    此外,強(qiáng)化學(xué)習(xí)算法在人力與時(shí)間成本方面均有優(yōu)化作用,基于SVR的有監(jiān)督方法與基于Q學(xué)習(xí)算法的強(qiáng)化學(xué)習(xí)方法實(shí)現(xiàn)時(shí)間記錄如表3所示,表中帶*號(hào)步驟表示需人工參與完成。其中,SVR方法利用有標(biāo)簽樣本進(jìn)行訓(xùn)練,樣本采集和樣本標(biāo)注時(shí)間占總時(shí)間的99.19%,對(duì)應(yīng)地,Q學(xué)習(xí)算法方法采集的樣本僅用于狀態(tài)數(shù)據(jù)劃分,相較于SVR而言,時(shí)間減少了97.92%(271515.83s)。Q學(xué)習(xí)算法方法通過與智能體與環(huán)境的交互獲取樣本與訓(xùn)練調(diào)度模型,模型訓(xùn)練時(shí)間占總時(shí)間的85.63%,是SVR訓(xùn)練時(shí)間的15.14倍(32146.80s)。但是,在調(diào)度模型生成與應(yīng)用總時(shí)間方面,Q學(xué)習(xí)算法較SVR減少了85.62%(239364.89s),需要人工參與的步驟時(shí)間較SVR減少了98.00%(264600s),極大降低了人力與時(shí)間成本,提升了模型動(dòng)態(tài)訓(xùn)練與更新的實(shí)時(shí)性。

    表3 SVR與Q學(xué)習(xí)算法調(diào)度方法實(shí)現(xiàn)時(shí)間 s

    由此可知,基于Q學(xué)習(xí)的智能車間自適應(yīng)調(diào)度方法能夠在盡可能減少人工參與的同時(shí),始終保持調(diào)度模型的有效性,并根據(jù)車間實(shí)時(shí)狀態(tài)變化輸出最優(yōu)組合式調(diào)度規(guī)則,使得車間生產(chǎn)性能保持穩(wěn)定高效。

    4 結(jié)束語

    為了降低生產(chǎn)過程中動(dòng)態(tài)不確定性因素對(duì)智能車間生產(chǎn)性能的影響,本文提出一種基于Q學(xué)習(xí)的智能車間自適應(yīng)調(diào)度方法。首先,提出基于強(qiáng)化學(xué)習(xí)交互訓(xùn)練機(jī)制的智能車間自適應(yīng)調(diào)度框架,在此框架下,利用Q學(xué)習(xí)算法,通過智能體與車間仿真環(huán)境的實(shí)時(shí)交互反饋訓(xùn)練調(diào)度模型,得到生產(chǎn)狀態(tài)與調(diào)度決策的映射關(guān)系,用于指導(dǎo)車間在線調(diào)度,并根據(jù)生產(chǎn)環(huán)境變動(dòng)及時(shí)更新調(diào)度模型,使其適應(yīng)變化的生產(chǎn)環(huán)境。最后,將此方法在MiniFab生產(chǎn)線模型上進(jìn)行驗(yàn)證,相較于單一調(diào)度規(guī)則和調(diào)度模型不更新的有監(jiān)督調(diào)度方法,基于Q學(xué)習(xí)的自適應(yīng)調(diào)度方法能夠?qū)崿F(xiàn)對(duì)車間綜合性能指標(biāo)的持續(xù)優(yōu)化,同時(shí)大幅度降低調(diào)度過程的時(shí)間與人力成本。據(jù)此,本文所提出的方法能夠?qū)崿F(xiàn)在生產(chǎn)全過程中,根據(jù)車間生產(chǎn)狀況動(dòng)態(tài)變化及時(shí)生成相應(yīng)的最優(yōu)調(diào)度決策,形成最優(yōu)決策軌跡,對(duì)動(dòng)態(tài)生產(chǎn)過程具有良好的適應(yīng)性。

    但是,Q學(xué)習(xí)算法在空間維度上存在局限性,高維模型會(huì)出現(xiàn)訓(xùn)練過程緩慢、難以收斂到最優(yōu)的問題,因此選擇科學(xué)合理的狀態(tài)與動(dòng)作空間尤為重要。在今后的研究中可以通過相關(guān)性分析選擇更為有效的狀態(tài)、動(dòng)作數(shù)據(jù)用于模型訓(xùn)練,或?qū)λ惴ㄟM(jìn)行改進(jìn),使調(diào)度模型適用范圍更廣、泛化能力更強(qiáng)。

    猜你喜歡
    智能環(huán)境生產(chǎn)
    長(zhǎng)期鍛煉創(chuàng)造體內(nèi)抑癌環(huán)境
    一種用于自主學(xué)習(xí)的虛擬仿真環(huán)境
    用舊的生產(chǎn)新的!
    “三夏”生產(chǎn) 如火如荼
    孕期遠(yuǎn)離容易致畸的環(huán)境
    環(huán)境
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    免费播放大片免费观看视频在线观看| 3wmmmm亚洲av在线观看| 一级黄片播放器| 日本av免费视频播放| 男人添女人高潮全过程视频| 久久国内精品自在自线图片| 欧美精品人与动牲交sv欧美| 亚洲欧美成人精品一区二区| 成人影院久久| 男女免费视频国产| 嘟嘟电影网在线观看| 有码 亚洲区| 在线观看一区二区三区激情| 日日撸夜夜添| 久久精品国产亚洲av涩爱| 国产午夜精品久久久久久一区二区三区| 国产高清三级在线| 亚洲精品亚洲一区二区| 嫩草影院入口| 欧美最新免费一区二区三区| 能在线免费看毛片的网站| 美女国产视频在线观看| 日韩在线高清观看一区二区三区| 欧美成人午夜免费资源| 国产精品一二三区在线看| 久久人人爽人人片av| 欧美 亚洲 国产 日韩一| 日韩av在线免费看完整版不卡| 久久久久久久久久成人| 中文字幕久久专区| 自线自在国产av| 成年人午夜在线观看视频| 啦啦啦中文免费视频观看日本| 免费观看av网站的网址| 青春草视频在线免费观看| 欧美 日韩 精品 国产| 99久久综合免费| 高清不卡的av网站| 七月丁香在线播放| 亚洲,欧美,日韩| 亚洲久久久国产精品| 国产爽快片一区二区三区| 美女xxoo啪啪120秒动态图| 国产在线免费精品| 国产一区二区三区综合在线观看 | 一二三四中文在线观看免费高清| 国产精品人妻久久久影院| 免费人妻精品一区二区三区视频| 久久99一区二区三区| 国产一区二区三区综合在线观看 | 国产男女超爽视频在线观看| 在线观看人妻少妇| 一级av片app| 亚洲欧美精品自产自拍| 新久久久久国产一级毛片| 特大巨黑吊av在线直播| 美女视频免费永久观看网站| 亚洲高清免费不卡视频| av免费观看日本| 婷婷色麻豆天堂久久| 亚洲av国产av综合av卡| 黄色日韩在线| 美女视频免费永久观看网站| 久久人人爽av亚洲精品天堂| av在线观看视频网站免费| 午夜福利网站1000一区二区三区| 国产91av在线免费观看| 久久国产乱子免费精品| 美女大奶头黄色视频| 中国美白少妇内射xxxbb| 夫妻午夜视频| 国产欧美亚洲国产| 亚洲国产精品成人久久小说| 最黄视频免费看| 亚洲精品中文字幕在线视频 | 熟女人妻精品中文字幕| 黑人巨大精品欧美一区二区蜜桃 | 久久99热这里只频精品6学生| av国产精品久久久久影院| 亚洲成人手机| 能在线免费看毛片的网站| 少妇人妻精品综合一区二区| 在线免费观看不下载黄p国产| 中国三级夫妇交换| 亚洲一区二区三区欧美精品| 人人妻人人看人人澡| 久久毛片免费看一区二区三区| 老女人水多毛片| 国产色爽女视频免费观看| 免费人成在线观看视频色| 国产中年淑女户外野战色| 国产在视频线精品| 一边亲一边摸免费视频| www.色视频.com| 国产一区二区在线观看av| 久久久久久久久久久久大奶| 寂寞人妻少妇视频99o| av.在线天堂| 黄色日韩在线| 精品国产露脸久久av麻豆| 18+在线观看网站| av视频免费观看在线观看| 久久精品熟女亚洲av麻豆精品| 嘟嘟电影网在线观看| 国产欧美日韩一区二区三区在线 | av福利片在线观看| 伦理电影大哥的女人| 性高湖久久久久久久久免费观看| a级一级毛片免费在线观看| 久久精品熟女亚洲av麻豆精品| 亚洲精品国产av蜜桃| 国产日韩欧美视频二区| 韩国高清视频一区二区三区| 亚洲综合精品二区| videossex国产| 午夜91福利影院| 18禁在线播放成人免费| 成人黄色视频免费在线看| 午夜日本视频在线| 高清视频免费观看一区二区| 欧美 日韩 精品 国产| 国产老妇伦熟女老妇高清| 国产精品久久久久久av不卡| 午夜老司机福利剧场| 七月丁香在线播放| 日韩中文字幕视频在线看片| 少妇人妻久久综合中文| 久久久亚洲精品成人影院| 欧美人与善性xxx| 日日啪夜夜爽| 国产精品一二三区在线看| 亚洲精品日本国产第一区| 最近中文字幕高清免费大全6| 国产日韩一区二区三区精品不卡 | 午夜精品国产一区二区电影| 国产精品久久久久久精品古装| 国产亚洲一区二区精品| 青春草国产在线视频| 亚洲欧美一区二区三区国产| 亚洲精品一区蜜桃| av女优亚洲男人天堂| 在线观看www视频免费| 国产精品嫩草影院av在线观看| 观看美女的网站| 99热国产这里只有精品6| 亚洲精品日韩在线中文字幕| 只有这里有精品99| 高清黄色对白视频在线免费看 | 成人毛片60女人毛片免费| 午夜福利网站1000一区二区三区| 一级毛片黄色毛片免费观看视频| 麻豆成人av视频| 国产探花极品一区二区| 成人毛片a级毛片在线播放| 国产男女超爽视频在线观看| 亚洲成色77777| 三级国产精品欧美在线观看| 国产永久视频网站| 亚洲国产av新网站| 街头女战士在线观看网站| 欧美日韩在线观看h| 在线看a的网站| 国产熟女欧美一区二区| 久久ye,这里只有精品| 一边亲一边摸免费视频| 能在线免费看毛片的网站| 亚洲国产精品一区三区| 欧美少妇被猛烈插入视频| 久久人人爽人人爽人人片va| xxx大片免费视频| √禁漫天堂资源中文www| 高清av免费在线| 国产免费视频播放在线视频| 王馨瑶露胸无遮挡在线观看| 毛片一级片免费看久久久久| 日韩中字成人| 岛国毛片在线播放| 国产在线免费精品| 欧美日韩一区二区视频在线观看视频在线| 99视频精品全部免费 在线| 伊人久久精品亚洲午夜| 日本黄色日本黄色录像| 免费大片黄手机在线观看| 少妇高潮的动态图| 99精国产麻豆久久婷婷| 最黄视频免费看| 一级片'在线观看视频| 国产视频首页在线观看| 91久久精品国产一区二区成人| 久久99热这里只频精品6学生| 人妻人人澡人人爽人人| 在现免费观看毛片| 亚洲精品成人av观看孕妇| 赤兔流量卡办理| 日韩一本色道免费dvd| 一边亲一边摸免费视频| 插阴视频在线观看视频| 18禁动态无遮挡网站| 成人午夜精彩视频在线观看| 国产有黄有色有爽视频| 99久久精品热视频| 一区二区三区免费毛片| 亚洲国产成人一精品久久久| 久久av网站| 亚洲av欧美aⅴ国产| 亚洲美女视频黄频| 天堂8中文在线网| 丰满饥渴人妻一区二区三| 丝袜在线中文字幕| 亚洲无线观看免费| 久久久久久久久久人人人人人人| 欧美日韩在线观看h| 久久ye,这里只有精品| 麻豆乱淫一区二区| 日韩电影二区| 久久女婷五月综合色啪小说| 国产永久视频网站| 最近最新中文字幕免费大全7| 97在线视频观看| 大香蕉97超碰在线| 午夜91福利影院| 亚洲精品456在线播放app| 新久久久久国产一级毛片| 精品酒店卫生间| 一级毛片黄色毛片免费观看视频| 在线观看av片永久免费下载| 99久久中文字幕三级久久日本| 七月丁香在线播放| 日韩强制内射视频| 青春草亚洲视频在线观看| av在线播放精品| 五月天丁香电影| 99久久人妻综合| 亚洲无线观看免费| 少妇精品久久久久久久| 午夜免费观看性视频| 伊人久久精品亚洲午夜| 大话2 男鬼变身卡| 欧美精品一区二区免费开放| 成人午夜精彩视频在线观看| 国产免费又黄又爽又色| 精品视频人人做人人爽| 老熟女久久久| 国产一区二区三区综合在线观看 | 欧美成人午夜免费资源| 成年av动漫网址| 涩涩av久久男人的天堂| 欧美高清成人免费视频www| 国产中年淑女户外野战色| 午夜精品国产一区二区电影| 亚洲av在线观看美女高潮| 亚洲人成网站在线观看播放| www.av在线官网国产| 中文资源天堂在线| 波野结衣二区三区在线| 黄色配什么色好看| 久久久久久久久久成人| 免费看光身美女| 大陆偷拍与自拍| 亚洲精品日韩在线中文字幕| 精品久久久久久电影网| 国产男人的电影天堂91| 一级毛片电影观看| 日韩三级伦理在线观看| 综合色丁香网| 久久久久网色| 性色avwww在线观看| 婷婷色综合www| 久久女婷五月综合色啪小说| 80岁老熟妇乱子伦牲交| 熟妇人妻不卡中文字幕| 久久久久久久亚洲中文字幕| 国产一区有黄有色的免费视频| 亚洲av不卡在线观看| 国产精品麻豆人妻色哟哟久久| 国产精品99久久久久久久久| 免费观看在线日韩| 少妇被粗大的猛进出69影院 | 久久人人爽人人片av| 一级黄片播放器| 18禁动态无遮挡网站| 夜夜爽夜夜爽视频| 亚洲久久久国产精品| 欧美xxⅹ黑人| 一区二区av电影网| 日韩三级伦理在线观看| 777米奇影视久久| 综合色丁香网| 男人爽女人下面视频在线观看| 国产精品蜜桃在线观看| 日本欧美视频一区| 内地一区二区视频在线| 午夜免费男女啪啪视频观看| 午夜免费男女啪啪视频观看| 两个人的视频大全免费| 亚洲av成人精品一二三区| 日日爽夜夜爽网站| 亚洲国产成人一精品久久久| 一个人免费看片子| 国产成人精品福利久久| 久久99一区二区三区| 少妇人妻 视频| 亚洲av男天堂| 国产亚洲5aaaaa淫片| a级毛片免费高清观看在线播放| 不卡视频在线观看欧美| 女人久久www免费人成看片| 久久毛片免费看一区二区三区| 精品亚洲乱码少妇综合久久| 人妻 亚洲 视频| 免费av不卡在线播放| 亚洲av成人精品一二三区| 99热网站在线观看| 成人无遮挡网站| 国产成人aa在线观看| 亚洲av在线观看美女高潮| 黄色一级大片看看| 久久人妻熟女aⅴ| av福利片在线| 久久免费观看电影| 国产成人91sexporn| 中文字幕av电影在线播放| 日韩欧美精品免费久久| 免费黄网站久久成人精品| av福利片在线观看| 最黄视频免费看| 国产淫片久久久久久久久| 久久久久久人妻| 国产亚洲av片在线观看秒播厂| 永久网站在线| 亚洲精品乱久久久久久| 美女福利国产在线| 熟妇人妻不卡中文字幕| 日韩,欧美,国产一区二区三区| 国产中年淑女户外野战色| 婷婷色av中文字幕| 国产探花极品一区二区| 成人黄色视频免费在线看| av国产久精品久网站免费入址| 91精品国产九色| 国产在线免费精品| 观看av在线不卡| 一级a做视频免费观看| 男女啪啪激烈高潮av片| 在线天堂最新版资源| 一区二区av电影网| 国产精品三级大全| 麻豆成人午夜福利视频| 午夜视频国产福利| 欧美日韩综合久久久久久| 美女主播在线视频| 欧美少妇被猛烈插入视频| 亚洲婷婷狠狠爱综合网| 三上悠亚av全集在线观看 | 国产精品不卡视频一区二区| 十八禁网站网址无遮挡 | 在线观看三级黄色| 黄色怎么调成土黄色| 国产精品熟女久久久久浪| 久久精品国产亚洲av天美| 欧美一级a爱片免费观看看| 久久久久久久久久人人人人人人| 3wmmmm亚洲av在线观看| 黄色毛片三级朝国网站 | 免费久久久久久久精品成人欧美视频 | 国产亚洲5aaaaa淫片| 日日撸夜夜添| 一区二区三区免费毛片| 免费黄频网站在线观看国产| 99视频精品全部免费 在线| 色婷婷av一区二区三区视频| 成人漫画全彩无遮挡| 99热全是精品| 欧美激情国产日韩精品一区| 欧美人与善性xxx| 日本-黄色视频高清免费观看| av免费观看日本| 久久久久久伊人网av| 久久午夜综合久久蜜桃| 亚洲人与动物交配视频| 在线播放无遮挡| 亚洲精品日韩av片在线观看| 在线观看美女被高潮喷水网站| 国产乱来视频区| 国产一区二区三区综合在线观看 | 亚州av有码| 最近手机中文字幕大全| 免费人成在线观看视频色| 天天操日日干夜夜撸| 丰满人妻一区二区三区视频av| 日本av手机在线免费观看| 欧美xxxx性猛交bbbb| 大又大粗又爽又黄少妇毛片口| 成人毛片a级毛片在线播放| 十分钟在线观看高清视频www | 在线观看av片永久免费下载| 国产真实伦视频高清在线观看| 国产免费一区二区三区四区乱码| 极品教师在线视频| 蜜桃在线观看..| 国产女主播在线喷水免费视频网站| 女人精品久久久久毛片| 男的添女的下面高潮视频| 男人爽女人下面视频在线观看| 亚洲中文av在线| 午夜免费观看性视频| 欧美老熟妇乱子伦牲交| 欧美日韩一区二区视频在线观看视频在线| 日本与韩国留学比较| 亚州av有码| 国产高清国产精品国产三级| 在线观看三级黄色| 99热网站在线观看| 亚洲一级一片aⅴ在线观看| 亚洲欧洲国产日韩| 国产成人精品婷婷| 啦啦啦中文免费视频观看日本| 精品一区二区三卡| 国产亚洲91精品色在线| 热re99久久国产66热| av在线播放精品| 久久99热这里只频精品6学生| 18禁动态无遮挡网站| 国产成人精品福利久久| 亚洲精品视频女| 国产综合精华液| 又爽又黄a免费视频| 成年美女黄网站色视频大全免费 | www.色视频.com| 免费观看无遮挡的男女| 久久久久久久大尺度免费视频| 免费看光身美女| 日本wwww免费看| 国模一区二区三区四区视频| 国产午夜精品一二区理论片| 国产黄频视频在线观看| 黄色毛片三级朝国网站 | 国产乱人偷精品视频| 欧美97在线视频| 赤兔流量卡办理| 日韩电影二区| 亚洲成色77777| 日本av免费视频播放| 久久久久久伊人网av| 久久久精品94久久精品| 国模一区二区三区四区视频| 亚洲欧美一区二区三区国产| 日韩 亚洲 欧美在线| 亚洲国产欧美日韩在线播放 | 一区二区三区四区激情视频| 五月天丁香电影| 三上悠亚av全集在线观看 | 免费看日本二区| av线在线观看网站| 赤兔流量卡办理| 永久网站在线| 亚洲欧洲国产日韩| 欧美另类一区| 热re99久久国产66热| 国产精品伦人一区二区| 黄色配什么色好看| 久久国产乱子免费精品| 99九九在线精品视频 | 黑人猛操日本美女一级片| 精品卡一卡二卡四卡免费| 中文字幕人妻熟人妻熟丝袜美| 黄色日韩在线| 五月玫瑰六月丁香| 狂野欧美激情性bbbbbb| 美女中出高潮动态图| 高清黄色对白视频在线免费看 | 2018国产大陆天天弄谢| 国产视频内射| 成人毛片a级毛片在线播放| 久久影院123| 国产精品一二三区在线看| 久久久久国产网址| 国产精品国产三级国产av玫瑰| 亚洲av免费高清在线观看| 久热这里只有精品99| 黑人巨大精品欧美一区二区蜜桃 | 极品少妇高潮喷水抽搐| 老司机影院毛片| 亚洲情色 制服丝袜| 亚洲国产欧美日韩在线播放 | 日韩一区二区视频免费看| av播播在线观看一区| 久久久午夜欧美精品| 我要看日韩黄色一级片| 一级av片app| 久久久久久久久久人人人人人人| 中国三级夫妇交换| 午夜激情福利司机影院| 欧美高清成人免费视频www| h日本视频在线播放| 日韩人妻高清精品专区| 一级毛片黄色毛片免费观看视频| 日本-黄色视频高清免费观看| 亚洲成色77777| 蜜臀久久99精品久久宅男| 久久久久久久久大av| 国产精品三级大全| videossex国产| 国产精品一二三区在线看| 欧美3d第一页| 成人综合一区亚洲| 亚洲国产精品999| 国产有黄有色有爽视频| 成年女人在线观看亚洲视频| 在线免费观看不下载黄p国产| 中文精品一卡2卡3卡4更新| 日韩免费高清中文字幕av| 国产色爽女视频免费观看| 亚洲精品自拍成人| 欧美日韩视频高清一区二区三区二| 国产无遮挡羞羞视频在线观看| 精品一区二区三卡| 国产精品国产三级专区第一集| av国产精品久久久久影院| 99久久人妻综合| 自拍偷自拍亚洲精品老妇| 久久精品久久精品一区二区三区| 丝袜在线中文字幕| h日本视频在线播放| 亚洲精品色激情综合| 国产老妇伦熟女老妇高清| 人人妻人人看人人澡| 一区在线观看完整版| 国语对白做爰xxxⅹ性视频网站| 国产精品麻豆人妻色哟哟久久| 三级国产精品欧美在线观看| 新久久久久国产一级毛片| 国产有黄有色有爽视频| 狂野欧美激情性xxxx在线观看| 亚洲国产色片| 日韩欧美一区视频在线观看 | 91成人精品电影| 国产精品国产av在线观看| 日日啪夜夜撸| 日日爽夜夜爽网站| 国产伦精品一区二区三区四那| 日韩中文字幕视频在线看片| 国产欧美日韩精品一区二区| 国产亚洲91精品色在线| 80岁老熟妇乱子伦牲交| 亚洲欧美成人综合另类久久久| 国产乱人偷精品视频| 国产男人的电影天堂91| 高清毛片免费看| 少妇的逼好多水| 日韩一区二区视频免费看| 久久韩国三级中文字幕| 国产一区二区三区综合在线观看 | 国产日韩欧美视频二区| 久久久久久久久久久久大奶| 国产黄色视频一区二区在线观看| 男女免费视频国产| 亚洲精品中文字幕在线视频 | 国内精品宾馆在线| 黄色毛片三级朝国网站 | 成人特级av手机在线观看| 在线观看免费视频网站a站| 国产亚洲欧美精品永久| 久久精品熟女亚洲av麻豆精品| 国产国拍精品亚洲av在线观看| 免费黄网站久久成人精品| 十分钟在线观看高清视频www | 久久久久久久久大av| 亚洲国产精品999| 国产精品久久久久成人av| 高清黄色对白视频在线免费看 | 夫妻性生交免费视频一级片| 18禁在线播放成人免费| 岛国毛片在线播放| 能在线免费看毛片的网站| 插逼视频在线观看| av一本久久久久| 99久久精品一区二区三区| 日本wwww免费看| 久久亚洲国产成人精品v| 美女福利国产在线| 欧美丝袜亚洲另类| 亚洲av.av天堂| 国产淫语在线视频| 桃花免费在线播放| 赤兔流量卡办理| 日日爽夜夜爽网站| 欧美日韩一区二区视频在线观看视频在线| 久久影院123| 精品酒店卫生间| 人人妻人人添人人爽欧美一区卜| 伊人久久精品亚洲午夜| 日韩精品有码人妻一区| 免费看日本二区| 久久精品国产自在天天线| 亚洲婷婷狠狠爱综合网| 啦啦啦在线观看免费高清www| 亚洲国产最新在线播放| 日韩精品免费视频一区二区三区 | 麻豆成人av视频| 中文精品一卡2卡3卡4更新| 超碰97精品在线观看| 在线亚洲精品国产二区图片欧美 | 欧美日韩视频高清一区二区三区二| 国产淫语在线视频| 亚洲av.av天堂| 国产深夜福利视频在线观看| 日韩制服骚丝袜av| 夜夜爽夜夜爽视频| 国产精品免费大片| 国产精品.久久久| 亚洲成人手机| 九草在线视频观看| 曰老女人黄片| 日本av免费视频播放|