• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于局部策略交互探索的深度確定性策略梯度的工業(yè)過程控制方法

    2022-06-21 07:20:24鄧紹斌朱軍周曉鋒李帥劉舒銳
    計(jì)算機(jī)應(yīng)用 2022年5期
    關(guān)鍵詞:青霉素控制策略工業(yè)

    鄧紹斌,朱軍,周曉鋒*,李帥,劉舒銳

    (1.中國科學(xué)院 網(wǎng)絡(luò)化控制系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,沈陽 110016; 2.中國科學(xué)院 沈陽自動化研究所,沈陽 110169;3.中國科學(xué)院 機(jī)器人與智能制造創(chuàng)新研究院,沈陽 110169; 4.中國科學(xué)院大學(xué),北京 100049)(?通信作者電子郵箱zhouxf@sia.cn)

    基于局部策略交互探索的深度確定性策略梯度的工業(yè)過程控制方法

    鄧紹斌1,2,3,4,朱軍1,2,3,周曉鋒1,2,3*,李帥1,2,3,4,劉舒銳1,2,3

    (1.中國科學(xué)院 網(wǎng)絡(luò)化控制系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,沈陽 110016; 2.中國科學(xué)院 沈陽自動化研究所,沈陽 110169;3.中國科學(xué)院 機(jī)器人與智能制造創(chuàng)新研究院,沈陽 110169; 4.中國科學(xué)院大學(xué),北京 100049)(?通信作者電子郵箱zhouxf@sia.cn)

    為了實(shí)現(xiàn)對非線性、滯后性和強(qiáng)耦合的工業(yè)過程穩(wěn)定精確的控制,提出了一種基于局部策略交互探索的深度確定性策略梯度(LPIE-DDPG)的控制方法用于深度強(qiáng)化學(xué)習(xí)的連續(xù)控制。首先,使用深度確定性策略梯度(DDPG)算法作為控制策略,從而極大地減小控制過程中的超調(diào)和振蕩現(xiàn)象;同時(shí),使用原控制器的控制策略作為局部策略進(jìn)行搜索,并以交互探索規(guī)則進(jìn)行學(xué)習(xí),提高了學(xué)習(xí)效率和學(xué)習(xí)穩(wěn)定性;最后,在Gym框架下搭建青霉素發(fā)酵過程仿真平臺并進(jìn)行實(shí)驗(yàn)。仿真結(jié)果表明,相較于DDPG,LPIE-DDPG在收斂效率上提升了27.3%;相較于比例-積分-微分(PID),LPIE-DDPG在溫度控制效果上有更少的超調(diào)和振蕩現(xiàn)象,在產(chǎn)量上青霉素濃度提高了3.8%??梢娝岱椒苡行嵘?xùn)練效率,同時(shí)提高工業(yè)過程控制的穩(wěn)定性。

    工業(yè)過程控制;深度強(qiáng)化學(xué)習(xí);深度確定性策略梯度;局部策略交互探索;青霉素發(fā)酵過程

    0 引言

    隨著現(xiàn)代化工業(yè)過程集成化加深,動態(tài)控制性能要求越來越高。精準(zhǔn)有效的控制可以促進(jìn)工業(yè)過程的穩(wěn)定、產(chǎn)品質(zhì)量的提高和經(jīng)濟(jì)效益的增長,因此控制策略扮演著越來越重要的角色。

    大多數(shù)工業(yè)過程是非線性、滯后性和強(qiáng)耦合的多輸入單輸出過程,青霉素發(fā)酵過程是典型之一,面對不同的工業(yè)要求,往往需要制定不同的控制策略。針對受時(shí)變干擾和時(shí)不變不確定的蒸餾塔過程,Bansal等[1]使用單變量比例-積分-微分(Proportion-Integration-Differentiation, PID)控制器對蒸餾塔過程進(jìn)行控制,取得了較好的經(jīng)濟(jì)效益,但面對多目標(biāo)的情況存在控制不足的問題;Asteasuain等[2]提出了使用多變量PID控制器對連續(xù)攪拌釜反應(yīng)器進(jìn)行控制,實(shí)現(xiàn)了單變量到多變量的控制,但未考慮到控制系統(tǒng)的自適應(yīng)性;趙海丞等[3]提出變調(diào)節(jié)周期PID方法來控制溫度系統(tǒng),解決了溫控系統(tǒng)精度受限的問題,一定程度上提高了系統(tǒng)自適應(yīng)性;包元興等[4]提出模糊PID與跟隨控制相結(jié)合的控制策略,實(shí)現(xiàn)了對具有純滯后、大慣性及通道間強(qiáng)耦合特性爐溫的準(zhǔn)確控制,進(jìn)一步提高了系統(tǒng)自適應(yīng)性。PID參數(shù)少、便于掌握,但隨著控制過程復(fù)雜化,參數(shù)調(diào)整往往需要專家長時(shí)間的調(diào)整。

    為了提高復(fù)雜工業(yè)系統(tǒng)的控制性能,研究者們引入了不同的控制方法。吳鵬松等[5]采用多變量解耦和內(nèi)??刂?,實(shí)現(xiàn)了對具有大滯后、強(qiáng)耦合特性系統(tǒng)的穩(wěn)定控制;張惠琳等[6]針對復(fù)雜的浮標(biāo)控制系統(tǒng),提出了基于雙閉環(huán)反饋回路的模糊PID定深控制,實(shí)現(xiàn)了對浮標(biāo)良好的控制和穩(wěn)定;莊緒君等[7]通過遺傳算法和迭代動態(tài)規(guī)劃結(jié)合的混合優(yōu)化控制策略,解決了青霉素發(fā)酵模型的不確定性敏感的問題。但上述方法都無法實(shí)現(xiàn)在線學(xué)習(xí),造成控制系統(tǒng)設(shè)計(jì)過程復(fù)雜,同時(shí)無法滿足最優(yōu)控制。

    深度強(qiáng)化學(xué)習(xí)是一種利用數(shù)據(jù)驅(qū)動,通過與系統(tǒng)交互實(shí)現(xiàn)端到端控制的方法,將深度強(qiáng)化學(xué)習(xí)應(yīng)用到這類工業(yè)控制過程中,可以有效實(shí)現(xiàn)最優(yōu)控制,再進(jìn)一步通過對不同場景進(jìn)行設(shè)定,能夠有效地提高算法的自適應(yīng)性。郝鵑等[8]針對車間不確定環(huán)境調(diào)度問題,提出了使用平均強(qiáng)化學(xué)習(xí)進(jìn)行控制,實(shí)現(xiàn)了車間的自適應(yīng)控制,但該方法的應(yīng)用局限于離散動作的工業(yè)環(huán)境;王建平等[9]針對工業(yè)制造中傳統(tǒng)二連桿控制效率低和適用性低等缺點(diǎn),提出了使用基于深度強(qiáng)化學(xué)習(xí)的方法,實(shí)現(xiàn)了連續(xù)控制穩(wěn)定性和適用性的提高,但忽略了復(fù)雜工業(yè)數(shù)據(jù)導(dǎo)致訓(xùn)練困難的問題。

    針對非線性、滯后性和強(qiáng)耦合的工業(yè)過程難以滿足控制器的在線穩(wěn)定訓(xùn)練需求和精準(zhǔn)穩(wěn)定的連續(xù)控制需求,本文提出了基于局部策略交互探索的深度確定性策略梯度(Local Policy Interaction Exploration-based Deep Deterministic Policy Gradient, LPIE-DDPG)的控制方法。一方面,深度確定性策略梯度(Deep Deterministic Policy Gradient, DDPG)有很強(qiáng)的自我學(xué)習(xí)能力,可以根據(jù)不同環(huán)境學(xué)習(xí)最優(yōu)控制策略,在最優(yōu)控制中展現(xiàn)出直接自適應(yīng)性。另一方面,針對DDPG學(xué)習(xí)效率不足,引入PID在工業(yè)控制中的控制邏輯,將PID的控制策略以專家經(jīng)驗(yàn)的形式作為局部策略,并通過交互規(guī)則學(xué)習(xí)PID的控制策略,最后進(jìn)行再探索和再利用,完成最優(yōu)策略的學(xué)習(xí)。其中,交互規(guī)則保證了代理在強(qiáng)相似的工業(yè)數(shù)據(jù)中正常學(xué)習(xí),在線局部策略提高了代理的收斂速度,再探索和再利用保留了代理的尋優(yōu)能力,使得DDPG能收斂于最優(yōu)策略。最后,本文通過具有代表性的多輸出單輸出過程——青霉素發(fā)酵過程進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證了本文方法的有效性。

    1 基于LPIE?DDPG的控制方法

    1.1 深度強(qiáng)化學(xué)習(xí)理論

    強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)中一種以系統(tǒng)狀態(tài)為輸入、以策略函數(shù)為輸出的方法,作為自監(jiān)督的學(xué)習(xí)方式,一方面基于行動和獎勵(lì)數(shù)據(jù)進(jìn)行反復(fù)訓(xùn)練,優(yōu)化行動策略,另一方面自主地與環(huán)境互動,觀測并獲取環(huán)境反饋[10]。

    深度強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合,深度神經(jīng)網(wǎng)絡(luò)克服了強(qiáng)化學(xué)習(xí)方法只能應(yīng)用于非凸策略函數(shù)的局限,解決了強(qiáng)化學(xué)習(xí)算法不能應(yīng)用到非常復(fù)雜的決策情景的問題,實(shí)現(xiàn)了端到端的學(xué)習(xí)。

    1.2 DDPG

    DDPG是深度強(qiáng)化學(xué)習(xí)中一種基于策略的強(qiáng)化學(xué)習(xí)方法,可以在連續(xù)行為空間中尋找最優(yōu)策略[11]。

    對行動價(jià)值網(wǎng)絡(luò)的訓(xùn)練是基于最小化損失函數(shù):

    而現(xiàn)實(shí)網(wǎng)絡(luò)中演說家網(wǎng)絡(luò)使用策略梯度算法更新的參數(shù)為:

    網(wǎng)絡(luò)參數(shù)復(fù)制采用軟更新方式:

    1.3 LPIE-DDPG

    DDPG仍然存在如何權(quán)衡探索和利用的矛盾,學(xué)習(xí)過程中樣本效率低,學(xué)習(xí)成本高。針對學(xué)習(xí)效率不足的問題,Hou等[12]使用優(yōu)先經(jīng)驗(yàn)重放池代替經(jīng)驗(yàn)重放緩沖池,可以極大縮短網(wǎng)絡(luò)總訓(xùn)練時(shí)間。但采用比例優(yōu)先性定義時(shí),經(jīng)驗(yàn)被抽取的概率正比于經(jīng)驗(yàn)時(shí)序誤差值,時(shí)序誤差值越大,經(jīng)驗(yàn)被回放的概率更大。因此在工業(yè)過程中,非良性控制經(jīng)驗(yàn)將在回放經(jīng)驗(yàn)池被一直回放,良性控制的經(jīng)驗(yàn)得不到回放,代理的學(xué)習(xí)效果受時(shí)序誤差離群值的不利影響,優(yōu)先經(jīng)驗(yàn)重放池失效。

    在模仿學(xué)習(xí)中,代理像人類專家那樣執(zhí)行一種行為,最大化預(yù)期總回報(bào),可以有效地解決探索的問題,但是由于代理通常只模仿專家的標(biāo)注行為,代理的表現(xiàn)不能超過主題專家或主管[13]。

    本文將專家知識應(yīng)用到探索和策略估計(jì)中,提出了基于局部策略交互探索的深度確定性策略梯度算法,通過在線收集原控制器的控制經(jīng)驗(yàn),以模仿學(xué)習(xí)的方式,加快訓(xùn)練智能體,LPIE-DDPG的結(jié)構(gòu)如圖1所示。

    圖1 LPIE-DDPG的結(jié)構(gòu)Fig. 1 Structure of LPIE-DDPG

    Agent內(nèi)部結(jié)構(gòu)(DDPG):現(xiàn)實(shí)網(wǎng)絡(luò)中演說家Actor從經(jīng)驗(yàn)池中取出作為輸入,并輸出一個(gè)表示從連續(xù)動作空間中選擇的動作的單一實(shí)值,經(jīng)過環(huán)境得到當(dāng)前獎勵(lì),隨后目標(biāo)網(wǎng)絡(luò)中演說家Actor根據(jù)下一個(gè)狀態(tài)輸出動作并傳給目標(biāo)網(wǎng)絡(luò)中評論家Critic。

    基于局部策略交互探索(Local Policy Interaction Exploration, LPIE)的流程結(jié)構(gòu)包括以下兩部分。

    策略更新 隨機(jī)地從經(jīng)驗(yàn)池取出經(jīng)驗(yàn)進(jìn)行網(wǎng)絡(luò)更新。

    探索階段 使用Agent網(wǎng)絡(luò)進(jìn)行自主探索,通過試錯(cuò)的形式完成搜索和經(jīng)驗(yàn)獲取。

    策略更新 從經(jīng)驗(yàn)池取出經(jīng)驗(yàn)進(jìn)行網(wǎng)絡(luò)更新。

    自由探索保證了Agent網(wǎng)絡(luò)更新不會陷入局部策略,朝著最優(yōu)策略探索和學(xué)習(xí)。

    LPIE-DDPG算法的具體步驟如算法1所示。

    算法1 基于局部策略交互探索的深度確定性策略梯度。

    3) 獲取初始狀態(tài)

    7) else

    9) end if

    13) if 達(dá)到網(wǎng)絡(luò)的策略優(yōu)化更新條件then:

    15) 評論家根據(jù)式(1)更新網(wǎng)絡(luò)參數(shù)

    16) 演說家根據(jù)式(2)更新網(wǎng)絡(luò)參數(shù)

    18) end if

    19) end for

    20) end for

    2 基于LPIE?DDPG的青霉素仿真控制

    將深度強(qiáng)化學(xué)習(xí)控制應(yīng)用到多輸入單輸出的工業(yè)過程的控制流程如下:

    1)建立實(shí)際系統(tǒng)交互模型。

    2)根據(jù)實(shí)際系統(tǒng)模型建立馬爾可夫模型。

    3)驗(yàn)證實(shí)際系統(tǒng)交互模型的準(zhǔn)確性和馬爾可夫模型的可行性。

    4)根據(jù)馬爾可夫模型設(shè)置模型參數(shù),如狀態(tài)空間、動作空間、獎勵(lì)函數(shù)等。

    5)借鑒原控制器的控制策略,對代理進(jìn)行多次訓(xùn)練。

    6)將代理應(yīng)用到控制過程,實(shí)現(xiàn)對系統(tǒng)的有效控制。

    2.1 青霉素發(fā)酵過程

    青霉素仿真過程是青霉素發(fā)酵的一系列過程:青霉素菌種在合適的培養(yǎng)基、PH、溫度和通氣攪拌等發(fā)酵條件下進(jìn)行生長和合成青霉素的代謝活動[14]。青霉素發(fā)酵過程用到發(fā)酵罐、冷水調(diào)節(jié)器、熱水調(diào)節(jié)器、攪拌器和酸堿液調(diào)節(jié)器,青霉素生產(chǎn)發(fā)酵過程的流程如圖2所示。

    圖2 青霉素發(fā)酵過程Fig. 2 Penicillin fermentation process

    青霉素發(fā)酵過程是一個(gè)典型的非線性、強(qiáng)耦合和滯后性的間歇過程。青霉素發(fā)酵過程被劃分為兩個(gè)階段:菌體生長期和青霉素合成期[15]。青霉素發(fā)酵過程是一個(gè)長時(shí)間持續(xù)的生產(chǎn)過程,其總過程大約在400 h。前一個(gè)階段是菌種生長階段,持續(xù)50 h~60 h,后兩個(gè)階段是青霉素合成和菌體衰老階段,持續(xù)340 h~350 h。在不同時(shí)期,菌體的生長環(huán)境又受諸多因素影響,在前兩個(gè)階段,青霉素生長的最佳溫度是303 K,最佳PH是6.2~6.5,在后兩個(gè)階段,青霉素合成的最佳溫度是298 K,最佳PH是6.5~6.9。這使得青霉素發(fā)酵過程是一個(gè)非線性和多動態(tài)的過程,并且發(fā)酵過程有9個(gè)初始變量、7個(gè)過程變量,這使得青霉素發(fā)酵過程是一個(gè)多輸入和強(qiáng)耦合過程。

    2.2 青霉素發(fā)酵馬爾可夫模型

    本文選取的研究對象是青霉素發(fā)酵過程,青霉素發(fā)酵過程的控制與強(qiáng)化學(xué)習(xí)結(jié)合的前提就是建立青霉素發(fā)酵的馬爾可夫模型。定義青霉素發(fā)酵的馬爾可夫模型如圖3所示:是由青霉素發(fā)酵過程的初始狀態(tài)和可變的操縱變量組成的狀態(tài)空間,是由青霉素發(fā)酵過程的可控變量組成的動作空間,是青霉素發(fā)酵過程不同狀態(tài)之間的轉(zhuǎn)移概率,是在當(dāng)前狀態(tài)執(zhí)行策略獲得的即時(shí)獎勵(lì)。

    圖3 青霉素發(fā)酵馬爾可夫模型Fig. 3 Markov model of penicillin fermentation

    2.3 深度強(qiáng)化學(xué)習(xí)狀態(tài)參數(shù)

    青霉素合成期和菌體自溶期是青霉素合成的關(guān)鍵時(shí)期,溫度和PH是青霉素合成的關(guān)鍵影響因素,因此本文選取青霉素合成期和菌體自溶期作為實(shí)驗(yàn)的背景,青霉素合成過程中以溫度控制作為實(shí)驗(yàn)內(nèi)容。針對選取實(shí)驗(yàn)內(nèi)容的實(shí)際控制情況,青霉素發(fā)酵過程馬爾可夫模型的具體參數(shù)規(guī)定如下:

    在保證PH穩(wěn)定控制的情況下,基于生化反應(yīng)各個(gè)狀態(tài)值的強(qiáng)耦合性和強(qiáng)相關(guān)性,選擇當(dāng)前時(shí)刻的氧氣濃度、菌體濃度、青霉素濃度(g/L)、培養(yǎng)基體積(L)、二氧化碳濃度、發(fā)酵器反應(yīng)溫度和溫度差作為狀態(tài)空間參數(shù)。

    根據(jù)實(shí)際控制原則,選擇實(shí)際控制過程中的被控變量-冷水值作為控制動作。

    轉(zhuǎn)移概率取決于當(dāng)前狀態(tài)執(zhí)行動作策略后的新狀態(tài)。

    由于青霉素合成的需要,溫度應(yīng)保持在298 K,因此,獎勵(lì)函數(shù)定義如下:

    3 仿真實(shí)驗(yàn)及結(jié)果分析

    3.1 仿真環(huán)境

    本文的仿真環(huán)境是基于Matlab/Simulink環(huán)境的青霉素發(fā)酵過程仿真平臺[16],使用Python語言,在Gym框架下完成了青霉素仿真模型的遷移。

    部分主要狀態(tài)方程如生物質(zhì)濃度的計(jì)算式為:

    溫度對微生物比生長速率的影響為:

    青霉素濃度的生產(chǎn)用非生長伴隨產(chǎn)物形成動力學(xué)模型表示:

    考慮到溫度對發(fā)酵過程的影響,本文對完成控制過程的目標(biāo)設(shè)定為:在PH穩(wěn)定控制的情況下,實(shí)現(xiàn)溫度值調(diào)控的低超調(diào)和低振蕩。

    3.2 實(shí)驗(yàn)設(shè)置

    1)神經(jīng)網(wǎng)絡(luò)參數(shù)。

    LPIE-DDPG網(wǎng)絡(luò)分為演說家網(wǎng)絡(luò)(Actor)和評論家網(wǎng)絡(luò)(Critic),輸入神經(jīng)元數(shù)和輸出神經(jīng)元數(shù)分別對應(yīng)狀態(tài)個(gè)數(shù)和動作個(gè)數(shù),隱含神經(jīng)元數(shù)由實(shí)驗(yàn)測試所得,根據(jù)損失函數(shù)的下降趨勢,分別確定學(xué)習(xí)率的大小,激活函數(shù)選擇能使模型收斂速度穩(wěn)定的ReLU(Rectified Linear Unit)函數(shù),具體神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置如表1所示。

    表1 神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置Tab. 1 Neural network parameter setting

    2)仿真平臺初始參數(shù)。

    在仿真模型中,故障變量包含通風(fēng)率、攪拌機(jī)功率和底物的喂養(yǎng)速率。通風(fēng)率噪聲設(shè)置為1 L/h,攪拌功率噪聲設(shè)置為0.06 W,底物的喂養(yǎng)速率不變。仿真平臺其他初始參數(shù)如表2所示,其中青霉素濃度指青霉素產(chǎn)量在培養(yǎng)基中的占比,發(fā)酵器反應(yīng)溫度是在發(fā)酵過程中受外界環(huán)境和產(chǎn)生熱影響的溫度值。

    3)算法超參數(shù)。

    訓(xùn)練總集數(shù)為2 000,總步數(shù)為200步,折扣因子和經(jīng)驗(yàn)池容量等超參數(shù)的設(shè)置如表3所示。

    本文規(guī)定3個(gè)指標(biāo)來對控制策略進(jìn)行評價(jià),分別為溫度變化、青霉素產(chǎn)量和抗干擾能力。其中,溫度變化指控制溫度和目標(biāo)溫度298 K的差值大小,青霉素產(chǎn)量為在培養(yǎng)基中的青霉素濃度,抗干擾能力為在干擾信號下對溫度的穩(wěn)定控制能力(相同條件下,溫度變化差值越小,青霉素產(chǎn)量越高,抗干擾能力越強(qiáng),控制策略越優(yōu))。

    3.3 結(jié)果分析

    訓(xùn)練過程如圖4所示,其中15 000為PID控制情況下每集的獎勵(lì)累加,并將其作為局部策略引入到DDPG。此外,還將LPIE引入到DQN(Deep Q-learning Network)中,形成局部策略交互探索DQN(Local Policy Interaction Exploration-based Deep Q-learning Network, LPIE-DQN)。軸是訓(xùn)練集數(shù),軸是平均獎勵(lì),考慮到獎勵(lì)受訓(xùn)練過程中探索的影響,本文采用9∶1的獎勵(lì)累加形式,具體如式(12)所示:

    表2 青霉素發(fā)酵過程變量的初始值Tab. 2 Initial values of penicillin fermentation process variables

    表3 算法超參數(shù)設(shè)置Tab. 3 Algorithm hyperparameter setting

    圖4 不同算法隨迭代次數(shù)變化的獎勵(lì)值Fig. 4 Reward values of different algorithms changing with number of iterations

    相較于DDPG,LPIE-DDPG迅速地在100集左右達(dá)到局部收斂,并在800集處達(dá)到最優(yōu),收斂總平均獎勵(lì)達(dá)到18 000,收斂效率提升了27.3%。此外,還對比了DQN和LPIE-DQN的學(xué)習(xí)效率,LPIE-DQN相較DQN更早達(dá)到收斂,在100集就完成了局部收斂,具體結(jié)果如表4所示。

    通過對代理進(jìn)行仿真訓(xùn)練,生成最優(yōu)代理。最優(yōu)代理對青霉素發(fā)酵過程的控制結(jié)果如下3個(gè)指標(biāo)所示。

    1)溫度變化指標(biāo)。在初始溫度為299 K和無干擾的條件下,不同方法的溫度變化如圖5所示。從圖5可以看出,相較于PID和LPIE-DQN,LPIE-DDPG的溫度控制表現(xiàn)出無超調(diào)和無振蕩。

    表4 不同方法的學(xué)習(xí)效率對比Tab. 4 Comparison of learning efficiency of different methods

    2)青霉素產(chǎn)量指標(biāo)。在同等初始條件下,青霉素發(fā)酵過程的產(chǎn)量結(jié)果如圖6所示。由圖6可以看出,相較于PID控制,使用LPIE-DDPG控制的青霉素產(chǎn)量濃度值提高了3.8%;相較于LPIE-DQN,LPIE-DDPG具有穩(wěn)定持續(xù)的高青霉素濃度值產(chǎn)量。

    圖5 LPIE-DDPG、LPIE-DQN和PID的溫度控制效果對比Fig. 5 Comparison of temperature control effect of LPIE-DDPG, LPIE-DQN and PID

    圖6 LPIE-DDPG、LPIE-DQN和PID控制下的青霉素產(chǎn)量對比Fig. 6 Comparison of penicillin yield under LPIE-DDPG,LPIE-DQN and PID control

    3)抗干擾能力指標(biāo)。為了檢驗(yàn)系統(tǒng)的抗干擾能力,分別在20 h時(shí)刻和120 h時(shí)刻引入正向脈沖干擾和負(fù)向脈沖干擾,結(jié)果如圖7所示。由圖7可以看出,相較于PID和LPIE-DQN,LPIE-DDPG對含有干擾信號的環(huán)境具有更加平緩穩(wěn)定的控制性能。

    圖7 LPIE-DDPG、LPIE-DQN和PID的抗干擾性對比Fig. 7 Comparison of interference resistance of LPIE-DDPG, LPIE-DQN and PID

    4 結(jié)語

    針對工業(yè)控制過程的非線性、強(qiáng)耦合、滯后性等特點(diǎn), 本文提出了基于局部策略交互探索深度確定性策略梯度的控制方法。該方法以DDPG為框架,使用原控制器的控制策略進(jìn)行學(xué)習(xí),以交互探索的方式保證經(jīng)驗(yàn)回放的可行性,通過自由探索的形式從環(huán)境中直接學(xué)習(xí),最后通過與工業(yè)系統(tǒng)直接交互,完成精準(zhǔn)、穩(wěn)定的控制。基于青霉素仿真模型進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文方法有更高的學(xué)習(xí)效率和更快速的收斂性能,同時(shí)提高了工業(yè)過程控制的穩(wěn)定性。

    未來的工作將研究在實(shí)際生產(chǎn)中應(yīng)用LPIE-DDPG,通過在探索過程中添加相關(guān)安全措施和優(yōu)化獎勵(lì)函數(shù)來滿足實(shí)際生產(chǎn)需求、降低生產(chǎn)成本。

    [1] BANSAL V, PERKINS J D, PISTIKOPOULOS E N. A case study in simultaneous design and control using rigorous, mixed-integer dynamic optimization models [J]. Industrial and Engineering Chemistry Research, 2002, 41(4): 760-778.

    [2] ASTEASUAIN M, BANDONI A, SARMORIA C, et al. Simultaneous process and control system design for grade transition in styrene polymerization [J]. Chemical Engineering Science, 2006, 61(10): 3362-3378.

    [3] 趙海丞,鄒應(yīng)全,劉睿佳,等.溫控系統(tǒng)中變調(diào)節(jié)周期PID算法[J].計(jì)算機(jī)應(yīng)用,2016,36(S2):116-119.(ZHAO H C,ZOU Y Q, LIU R J, et al. PID algorithm of variable adjustment period based on temperature control system [J]. Journal of Computer Applications, 2016, 36(S2): 116-119.)

    [4] 包元興,丁炯,楊遂軍,等.強(qiáng)耦合雙通道熱分析爐溫度跟隨控制策略研究[J].測控技術(shù),2016,35(5):70-74.(BAO Y X, DING J,YANG S J, et al. Study on temperature following control strategy for strong-coupled dual-channel thermal analysis furnace [J]. Measurement and Control Technology, 2016, 35(5): 70-74.)

    [5] 吳鵬松,吳朝野,周東華.大純滯后信號解耦內(nèi)模控制系統(tǒng)研究[J].化工自動化及儀表,2012,39(9):1115-1117,1176.(WU P S, WU C Y, ZHOU D H. Research on signal-decoupling internal mode control system with big time lag [J]. Control and Instruments in Chemical Industry, 2012, 39(9): 1115-1117, 1176.)

    [6] 張惠琳,李醒飛,楊少波,等.深海自持式智能浮標(biāo)雙閉環(huán)模糊PID定深控制[J].信息與控制,2019,48(2):202-208,216.(ZHANG H L, LI X F, YANG S B, et al. Dual closed-loop fuzzy PID depth control for deep-sea self-holding intelligent buoy [J]. Information and Control, 2019, 48(2): 202-208, 216.)

    [7] 莊緒君,李宏光.基于遺傳算法與迭代動態(tài)規(guī)劃混合策略的青霉素發(fā)酵過程優(yōu)化控制[J].計(jì)算機(jī)與應(yīng)用化學(xué),2013,30(9):1051-1054.(ZHUANG X J, LI H G. Optimization control strategies combined genetic algorithms and iterative dynamic programming for penicillin fermentation processes [J]. Computers and Applied Chemistry, 2013, 30(9): 1051-1054.)

    [8] 郝鵑,余建軍,周文慧.基于平均強(qiáng)化學(xué)習(xí)的訂單生產(chǎn)方式企業(yè)訂單接受策略[J].計(jì)算機(jī)應(yīng)用,2013,33(4):976-979.(HAO J, YU J J, ZHOU W H. Order acceptance policy in make-to-order manufacturing based on average-reward reinforcement learning [J]. Journal of Computer Applications, 2013, 33(4): 976-979.)

    [9] 王建平,王剛,毛曉彬,等.基于深度強(qiáng)化學(xué)習(xí)的二連桿機(jī)械臂運(yùn)動控制方法[J].計(jì)算機(jī)應(yīng)用,2021,41(6):1799-1804.(WANG J P, WANG G,MAO X B, et al. Motion control method of two-link manipulator based on deep reinforcement learning [J]. Journal of Computer Applications, 2021, 41(6): 1799-1804.)

    [10] 多南訊,呂強(qiáng),林輝燦,等.邁進(jìn)高維連續(xù)空間:深度強(qiáng)化學(xué)習(xí)在機(jī)器人領(lǐng)域中的應(yīng)用[J].機(jī)器人,2019,41(2):276-288.(DUO N X, LYU Q, LIN H C, et al. Step into high-dimensional and continuous action space: a survey on applications of deep reinforcement learning to robotics [J]. Robot, 2019, 41(2): 276-288.)

    [11] 劉洋,李建軍.深度確定性策略梯度算法優(yōu)化[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,39(6):545-549.(LIU Y, LI J J. Optimization of deep deterministic policy gradient algorithm [J]. Journal of Liaoning Technical University (Natural Science), 2020, 39(6):545-549.)

    [12] HOU Y N, LIU L F, WEI Q, et al. A novel DDPG method with prioritized experience replay [C]// Proceedings of the 2017 IEEE International Conference on Systems, Man, and Cybernetics. Piscataway: IEEE, 2017:316-321.

    [13] NIAN R, LIU J F, HUANG B. A review on reinforcement learning: Introduction and applications in industrial process control [J]. Computers and Chemical Engineering, 2020, 139: Article No.106886.

    [14] 李云龍,唐文俊,白成海,等.青霉素生產(chǎn)工藝優(yōu)化及代謝分析提高產(chǎn)量[J].中國抗生素雜志,2019,44(6):679-686.(LI Y L, TANG W J,BAI C H, et al. Optimization of the feeding process and metabolism analysis to improve the yield of penicillin [J]. Chinese Journal of Antibiotics, 2019, 44(6): 679-686.)

    [15] 王蕾,陳進(jìn)東,潘豐.引力搜索算法在青霉素發(fā)酵模型參數(shù)估計(jì)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2013,33(11):3296-3299,3304.(WANG L, CHEN J D, PAN F. Applications of gravitational search algorithm in parameters estimation of penicillin fermentation process model [J]. Journal of Computer Applications, 2013, 33(11): 3296-3299, 3304.)

    [16] 葉凌箭,程江華.基于Matlab/Simulink的青霉素發(fā)酵過程仿真平臺[J].系統(tǒng)仿真學(xué)報(bào),2015,27(3):515-520.(YE L J, CHENG J H. Simulation platform of penicillin fermentation process based on Matlab/Simulink [J]. Journal of System Simulation, 2015, 27(3): 515-520.)

    Industrial process control method based on local policy interaction exploration-based deep deterministic policy gradient

    DENG Shaobin1,2,3,4,ZHU Jun1,2,3, ZHOU Xiaofeng1,2,3*, LI Shuai1,2,3,4, LIU Shurui1,2,3

    (1.Key Laboratory of Networked Control System,Chinese Academy of Sciences,Shenyang Liaoning110016,China;2.Shenyang Institute of Automation,Chinese Academy of Sciences,Shenyang Liaoning110169,China;3.Institutes for Robotics and Intelligent Manufacturing Innovation,Chinese Academy of Sciences,Shenyang Liaoning110169,China;4.University of Chinese Academy of Sciences,Beijing100049,China)

    In order to achieve the stable and precise control of industrial processes with non-linearity, hysteresis, and strong coupling, a new control method based on Local Policy Interaction Exploration-based Deep Deterministic Policy Gradient (LPIE-DDPG) was proposed for the continuous control of deep reinforcement learning. Firstly, the Deep Deterministic Policy Gradient (DDPG) algorithm was used as the control strategy to greatly reduce the phenomena of overshoot and oscillation in the control process. At the same time,the control strategy of original controller was used as the local strategy for searching, and interactive exploration was used as the rule for learning, thereby improving the learning efficiency and stability. Finally, a penicillin fermentation process simulation platform was built under the framework of Gym and the experiments were carried out. Simulation results show that, compared with DDPG, the proposed LPIE-DDPG improves the convergence efficiency by 27.3%; compared with Proportion-Integration-Differentiation (PID), the proposed LPIE-DDPG has fewer overshoot and oscillation phenomena on temperature control effect, and has the penicillin concentration increased by 3.8% in yield. In conclusion, the proposed method can effectively improve the training efficiency and improve the stability of industrial process control.

    industrial process control; deep reinforcement learning; Deep Deterministic Policy Gradient (DDPG); Local Policy Interaction Exploration (LPIE); penicillin fermentation process

    TP273.2

    A

    1001-9081(2022)05-1642-07

    10.11772/j.issn.1001-9081.2021050716

    2021?05?07;

    2021?09?27;

    2021?11?26。

    遼寧省“興遼英才計(jì)劃”項(xiàng)目(XLYC1808009)。

    鄧紹斌(1997—),男,江西贛州人,碩士研究生,主要研究方向:強(qiáng)化學(xué)習(xí)、工業(yè)過程控制; 朱軍(1964—),男,遼寧沈陽人,研究員,碩士,主要研究方向:自動控制、工業(yè)自動化; 周曉鋒(1978—),女,遼寧本溪人,副研究員,博士,主要研究方向:機(jī)器學(xué)習(xí)、工業(yè)過程優(yōu)化; 李帥(1988—)男,遼寧錦州人,副研究員,博士研究生,主要研究方向:機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘; 劉舒銳(1993—)男,湖北襄陽人,助理研究員,碩士,主要研究方向:工業(yè)過程建模與控制、機(jī)器學(xué)習(xí)。

    This work is partially supported by Program of Liaoning Province “Xingliao Talents Plan” (XLYC1808009).

    DENG Shaobin, born in 1997, M. S. candidate. His research interests include reinforcement learning,industrial process control.

    ZHU Jun, born in 1964, M. S., research follow. His research interests include automatic control, industrial automation.

    ZHOU Xiaofeng, born in 1978, Ph. D., associate research fellow. Her research interests include machine learning, industrial process optimization.

    LI Shuai, born in 1988, Ph. D. candidate, associate research fellow. His research interests include machine learning, data mining.

    LIU Shurui, born in 1993, M. S., assistant research fellow. His research interests include industrial process modeling and control, machine learning.

    猜你喜歡
    青霉素控制策略工業(yè)
    亞歷山大·弗萊明:青霉素,那是我偶然發(fā)現(xiàn)的
    考慮虛擬慣性的VSC-MTDC改進(jìn)下垂控制策略
    能源工程(2020年6期)2021-01-26 00:55:22
    細(xì)菌為何能“吃”青霉素
    工程造價(jià)控制策略
    山東冶金(2019年3期)2019-07-10 00:54:04
    現(xiàn)代企業(yè)會計(jì)的內(nèi)部控制策略探討
    工業(yè)人
    黃河之聲(2018年5期)2018-05-17 11:30:01
    青霉素的發(fā)明者—萊明
    容錯(cuò)逆變器直接轉(zhuǎn)矩控制策略
    掌握4大工業(yè)元素,一秒變工業(yè)風(fēng)!
    Coco薇(2015年10期)2015-10-19 12:51:50
    “工業(yè)4.0”之思考
    xxxhd国产人妻xxx| 欧美精品一区二区免费开放| 成在线人永久免费视频| 免费人妻精品一区二区三区视频| 免费观看人在逋| a级毛片在线看网站| 亚洲国产av影院在线观看| 日本av手机在线免费观看| 亚洲专区国产一区二区| 欧美在线黄色| 色综合婷婷激情| 妹子高潮喷水视频| 国产不卡av网站在线观看| 久久99一区二区三区| 操美女的视频在线观看| 色播在线永久视频| videos熟女内射| 国产精品.久久久| 欧美成狂野欧美在线观看| 久久久精品94久久精品| 一级a爱视频在线免费观看| 免费少妇av软件| 极品教师在线免费播放| 国产精品亚洲av一区麻豆| 中文字幕高清在线视频| 999久久久国产精品视频| 久久精品国产亚洲av香蕉五月 | 亚洲成av片中文字幕在线观看| 欧美黄色片欧美黄色片| 亚洲国产毛片av蜜桃av| 免费少妇av软件| 国产精品国产av在线观看| 国产又色又爽无遮挡免费看| 国产野战对白在线观看| 国产精品影院久久| 女人被躁到高潮嗷嗷叫费观| 亚洲 国产 在线| 波多野结衣av一区二区av| 考比视频在线观看| 精品人妻熟女毛片av久久网站| 国产精品香港三级国产av潘金莲| videos熟女内射| 少妇被粗大的猛进出69影院| 日本黄色日本黄色录像| 久久中文字幕人妻熟女| 久久免费观看电影| 中文字幕人妻熟女乱码| 欧美日韩亚洲国产一区二区在线观看 | 丝瓜视频免费看黄片| kizo精华| 国产色视频综合| 成人18禁高潮啪啪吃奶动态图| av不卡在线播放| 涩涩av久久男人的天堂| 18禁美女被吸乳视频| 久久久久视频综合| 国产成+人综合+亚洲专区| 国产欧美日韩一区二区三区在线| 人妻 亚洲 视频| 69av精品久久久久久 | 国产在线一区二区三区精| 亚洲男人天堂网一区| 久久精品国产亚洲av高清一级| 国产极品粉嫩免费观看在线| 国产成人精品久久二区二区免费| 另类精品久久| 一二三四社区在线视频社区8| 人成视频在线观看免费观看| 久久久久精品国产欧美久久久| 国产精品久久久久成人av| 国产精品影院久久| 大型av网站在线播放| 国产激情久久老熟女| 777久久人妻少妇嫩草av网站| 精品亚洲成国产av| 大陆偷拍与自拍| 日韩大片免费观看网站| 超碰成人久久| 99re在线观看精品视频| 高清毛片免费观看视频网站 | 久久久久久久精品吃奶| 欧美国产精品一级二级三级| 国产日韩欧美视频二区| 国产欧美亚洲国产| bbb黄色大片| 丁香六月欧美| 十八禁高潮呻吟视频| 日韩熟女老妇一区二区性免费视频| 亚洲黑人精品在线| 午夜免费鲁丝| 亚洲少妇的诱惑av| 狠狠狠狠99中文字幕| 色综合欧美亚洲国产小说| 女性被躁到高潮视频| av在线播放免费不卡| 黑丝袜美女国产一区| 国产97色在线日韩免费| 一边摸一边抽搐一进一出视频| 亚洲全国av大片| 欧美日韩中文字幕国产精品一区二区三区 | 久热爱精品视频在线9| 91九色精品人成在线观看| 久久久国产一区二区| 大片电影免费在线观看免费| 成人国产av品久久久| 欧美精品啪啪一区二区三区| 成人特级黄色片久久久久久久 | 国产在线视频一区二区| 最近最新中文字幕大全免费视频| 久久亚洲真实| 国产成人一区二区三区免费视频网站| 视频区图区小说| 国产精品免费大片| 啦啦啦视频在线资源免费观看| 王馨瑶露胸无遮挡在线观看| 老司机亚洲免费影院| 悠悠久久av| 男女无遮挡免费网站观看| 亚洲天堂av无毛| 菩萨蛮人人尽说江南好唐韦庄| 正在播放国产对白刺激| 亚洲国产成人一精品久久久| 国产男女超爽视频在线观看| 欧美日韩亚洲国产一区二区在线观看 | 久久久精品94久久精品| 亚洲色图av天堂| 精品一品国产午夜福利视频| 国产精品偷伦视频观看了| 亚洲欧洲精品一区二区精品久久久| 国产精品国产高清国产av | 亚洲精品美女久久av网站| 国产极品粉嫩免费观看在线| 国产老妇伦熟女老妇高清| 日韩视频在线欧美| 久久午夜亚洲精品久久| 91九色精品人成在线观看| 亚洲国产看品久久| 男人操女人黄网站| 国产精品久久久久成人av| 久热这里只有精品99| 制服诱惑二区| 久久精品亚洲精品国产色婷小说| 久久久国产欧美日韩av| 亚洲一区二区三区欧美精品| 国产1区2区3区精品| 精品人妻1区二区| 亚洲av第一区精品v没综合| www.熟女人妻精品国产| 韩国精品一区二区三区| 欧美精品一区二区大全| 脱女人内裤的视频| 国产又爽黄色视频| 麻豆国产av国片精品| 精品高清国产在线一区| 久久国产精品男人的天堂亚洲| 69av精品久久久久久 | 十八禁网站网址无遮挡| 18禁黄网站禁片午夜丰满| 99九九在线精品视频| 亚洲国产看品久久| 国产成人av教育| 国产精品久久久久成人av| 久久久欧美国产精品| 国产色视频综合| 黑人操中国人逼视频| 日韩 欧美 亚洲 中文字幕| 麻豆av在线久日| 久久青草综合色| 国产日韩欧美亚洲二区| 国产黄频视频在线观看| 一本大道久久a久久精品| 久久亚洲精品不卡| 91国产中文字幕| 免费一级毛片在线播放高清视频 | 欧美中文综合在线视频| 国产欧美日韩一区二区三区在线| 国产在线视频一区二区| 午夜老司机福利片| 欧美日韩精品网址| 美女高潮到喷水免费观看| 首页视频小说图片口味搜索| 每晚都被弄得嗷嗷叫到高潮| 欧美精品人与动牲交sv欧美| 天天躁日日躁夜夜躁夜夜| 久久亚洲精品不卡| 欧美日韩福利视频一区二区| 侵犯人妻中文字幕一二三四区| 1024香蕉在线观看| 国产极品粉嫩免费观看在线| 久热爱精品视频在线9| 久久久水蜜桃国产精品网| 日韩一卡2卡3卡4卡2021年| 老熟妇乱子伦视频在线观看| 亚洲中文av在线| 成年女人毛片免费观看观看9 | 另类精品久久| av有码第一页| 搡老乐熟女国产| 91字幕亚洲| 亚洲av欧美aⅴ国产| 啦啦啦在线免费观看视频4| 丁香欧美五月| 一进一出抽搐动态| 国产精品亚洲一级av第二区| 男女免费视频国产| 在线观看免费高清a一片| 午夜福利欧美成人| 亚洲成a人片在线一区二区| 久热爱精品视频在线9| 国产成人精品在线电影| 久久久久久久久免费视频了| 欧美av亚洲av综合av国产av| 免费在线观看黄色视频的| 国产精品国产高清国产av | 久久九九热精品免费| xxxhd国产人妻xxx| 国产一区有黄有色的免费视频| 高清黄色对白视频在线免费看| 免费久久久久久久精品成人欧美视频| 女同久久另类99精品国产91| 国产有黄有色有爽视频| 精品少妇久久久久久888优播| 亚洲av成人不卡在线观看播放网| 欧美精品一区二区大全| 亚洲av片天天在线观看| 日本精品一区二区三区蜜桃| 欧美中文综合在线视频| 国产深夜福利视频在线观看| 青草久久国产| 少妇 在线观看| 人人妻人人澡人人爽人人夜夜| 首页视频小说图片口味搜索| www日本在线高清视频| 建设人人有责人人尽责人人享有的| 美国免费a级毛片| 欧美日韩精品网址| 中文字幕制服av| 亚洲精品美女久久久久99蜜臀| 中文字幕另类日韩欧美亚洲嫩草| 国产色视频综合| 自拍欧美九色日韩亚洲蝌蚪91| 免费在线观看日本一区| 老汉色∧v一级毛片| 老汉色av国产亚洲站长工具| 两性夫妻黄色片| 亚洲 欧美一区二区三区| 久久人人97超碰香蕉20202| 成人免费观看视频高清| av福利片在线| 亚洲国产欧美网| 日韩视频在线欧美| 嫁个100分男人电影在线观看| 久久久久久亚洲精品国产蜜桃av| 日日摸夜夜添夜夜添小说| 免费看a级黄色片| 欧美大码av| 老司机靠b影院| 国产一区二区三区在线臀色熟女 | 欧美精品高潮呻吟av久久| 国产精品一区二区在线观看99| 精品熟女少妇八av免费久了| 日日爽夜夜爽网站| 男女午夜视频在线观看| av网站免费在线观看视频| 亚洲欧洲日产国产| 在线观看免费视频日本深夜| 亚洲,欧美精品.| 免费观看a级毛片全部| 亚洲精品av麻豆狂野| 国产男靠女视频免费网站| 国产成人精品久久二区二区91| 女警被强在线播放| 中文字幕高清在线视频| 波多野结衣av一区二区av| 中亚洲国语对白在线视频| 最新美女视频免费是黄的| 国产精品影院久久| 在线观看免费午夜福利视频| 欧美三级亚洲精品| 又大又爽又粗| 欧美日韩精品网址| 亚洲aⅴ乱码一区二区在线播放| 精品久久久久久久久久免费视频| 精华霜和精华液先用哪个| 非洲黑人性xxxx精品又粗又长| 曰老女人黄片| 欧美zozozo另类| 香蕉久久夜色| 国产精品av久久久久免费| 高潮久久久久久久久久久不卡| 午夜福利欧美成人| 精品午夜福利视频在线观看一区| 成人av一区二区三区在线看| 国产亚洲av嫩草精品影院| 国语自产精品视频在线第100页| 久久久久久国产a免费观看| www.熟女人妻精品国产| 婷婷六月久久综合丁香| 法律面前人人平等表现在哪些方面| 999久久久国产精品视频| 久久久久久久精品吃奶| 又黄又爽又免费观看的视频| 欧美日韩中文字幕国产精品一区二区三区| 国产真实乱freesex| 久久香蕉国产精品| 黄频高清免费视频| www国产在线视频色| 欧美精品啪啪一区二区三区| 日本 av在线| 亚洲欧美日韩高清专用| 亚洲无线观看免费| www日本黄色视频网| 18禁裸乳无遮挡免费网站照片| av片东京热男人的天堂| 不卡av一区二区三区| 国产蜜桃级精品一区二区三区| 十八禁人妻一区二区| 久久久久精品国产欧美久久久| 午夜福利在线观看免费完整高清在 | 中文字幕人成人乱码亚洲影| 毛片女人毛片| 一本综合久久免费| 十八禁网站免费在线| 久久久久精品国产欧美久久久| 亚洲欧美日韩无卡精品| 欧美丝袜亚洲另类 | 免费在线观看亚洲国产| 欧美+亚洲+日韩+国产| 久9热在线精品视频| 精品不卡国产一区二区三区| 国产精品久久视频播放| 女同久久另类99精品国产91| 久久久久九九精品影院| 亚洲成人免费电影在线观看| 俺也久久电影网| 亚洲专区国产一区二区| 性色avwww在线观看| 国产精品1区2区在线观看.| 亚洲七黄色美女视频| 91九色精品人成在线观看| a级毛片a级免费在线| 看片在线看免费视频| 美女高潮喷水抽搐中文字幕| 两个人看的免费小视频| 亚洲精品美女久久久久99蜜臀| 高清在线国产一区| 精品国产美女av久久久久小说| 国产v大片淫在线免费观看| 日韩欧美精品v在线| 夜夜夜夜夜久久久久| 嫩草影视91久久| 亚洲人成电影免费在线| 亚洲av成人不卡在线观看播放网| 在线观看日韩欧美| 999久久久国产精品视频| 午夜精品久久久久久毛片777| 在线a可以看的网站| 久久天躁狠狠躁夜夜2o2o| 国产精品国产高清国产av| 岛国在线免费视频观看| 国语自产精品视频在线第100页| 欧美日韩乱码在线| 不卡av一区二区三区| 观看美女的网站| 欧美绝顶高潮抽搐喷水| cao死你这个sao货| 岛国在线观看网站| 欧美xxxx黑人xx丫x性爽| 亚洲午夜精品一区,二区,三区| 90打野战视频偷拍视频| 国产熟女xx| 国内毛片毛片毛片毛片毛片| 少妇熟女aⅴ在线视频| 国产高清有码在线观看视频| 国产精品98久久久久久宅男小说| 色播亚洲综合网| 亚洲国产精品合色在线| 免费搜索国产男女视频| 99视频精品全部免费 在线 | 男人舔女人的私密视频| 国产成人av教育| 三级男女做爰猛烈吃奶摸视频| 久久久久久久午夜电影| 亚洲av成人一区二区三| 亚洲精品美女久久久久99蜜臀| 精品无人区乱码1区二区| 久久精品人妻少妇| 最新在线观看一区二区三区| 亚洲国产看品久久| 99久久成人亚洲精品观看| 黄色女人牲交| 精品一区二区三区av网在线观看| 国产精品一区二区三区四区久久| 久久热在线av| 九色成人免费人妻av| 麻豆一二三区av精品| 女生性感内裤真人,穿戴方法视频| 啦啦啦观看免费观看视频高清| 97超视频在线观看视频| 免费在线观看日本一区| 亚洲av电影在线进入| 国产午夜精品论理片| 51午夜福利影视在线观看| 不卡av一区二区三区| 欧美在线一区亚洲| 午夜两性在线视频| 欧美日韩福利视频一区二区| 亚洲乱码一区二区免费版| 国产69精品久久久久777片 | 久久午夜综合久久蜜桃| 日本精品一区二区三区蜜桃| 少妇的逼水好多| 噜噜噜噜噜久久久久久91| 国产成+人综合+亚洲专区| 狠狠狠狠99中文字幕| 国产精品99久久99久久久不卡| 亚洲av电影在线进入| 亚洲一区二区三区不卡视频| 国产综合懂色| 岛国视频午夜一区免费看| 精品一区二区三区av网在线观看| 国产精品 欧美亚洲| 三级国产精品欧美在线观看 | 久久久久免费精品人妻一区二区| 久久婷婷人人爽人人干人人爱| 操出白浆在线播放| 激情在线观看视频在线高清| 亚洲av电影在线进入| 国产精品电影一区二区三区| 久久亚洲精品不卡| 女人被狂操c到高潮| 悠悠久久av| 麻豆av在线久日| 欧美精品啪啪一区二区三区| 久久久国产精品麻豆| 亚洲欧美日韩高清在线视频| 午夜福利18| 在线观看日韩欧美| 亚洲电影在线观看av| 亚洲国产精品成人综合色| 又黄又粗又硬又大视频| 国产精品日韩av在线免费观看| 国产精品永久免费网站| 97人妻精品一区二区三区麻豆| 亚洲五月天丁香| 欧美精品啪啪一区二区三区| 国产精品女同一区二区软件 | 欧美三级亚洲精品| 中国美女看黄片| 婷婷亚洲欧美| а√天堂www在线а√下载| 亚洲国产欧美网| 久久久久久久午夜电影| 国产激情欧美一区二区| 哪里可以看免费的av片| 国产伦一二天堂av在线观看| 中亚洲国语对白在线视频| 国产一区二区三区视频了| 午夜激情欧美在线| 在线观看一区二区三区| 夜夜躁狠狠躁天天躁| 女生性感内裤真人,穿戴方法视频| 少妇的逼水好多| 成人特级av手机在线观看| 99国产精品一区二区三区| 91久久精品国产一区二区成人 | 91字幕亚洲| 首页视频小说图片口味搜索| 色综合亚洲欧美另类图片| xxx96com| 亚洲性夜色夜夜综合| 岛国在线观看网站| 一本一本综合久久| 午夜影院日韩av| 高清在线国产一区| 国产亚洲欧美在线一区二区| 在线观看舔阴道视频| 亚洲av熟女| 动漫黄色视频在线观看| av片东京热男人的天堂| 国产精品久久久久久精品电影| 久久久久久久久免费视频了| 九色成人免费人妻av| 免费在线观看日本一区| 国产成人福利小说| 亚洲国产欧美一区二区综合| 国产精品永久免费网站| 在线观看一区二区三区| 一卡2卡三卡四卡精品乱码亚洲| 不卡一级毛片| 欧美黑人巨大hd| 99久久99久久久精品蜜桃| 五月伊人婷婷丁香| 女人被狂操c到高潮| 亚洲av成人不卡在线观看播放网| 午夜福利在线观看吧| 免费av不卡在线播放| 亚洲五月婷婷丁香| 精品不卡国产一区二区三区| www.www免费av| 国产精品1区2区在线观看.| 啪啪无遮挡十八禁网站| 亚洲国产精品合色在线| 99国产精品一区二区蜜桃av| 搞女人的毛片| 欧美日韩乱码在线| 亚洲自偷自拍图片 自拍| 噜噜噜噜噜久久久久久91| 亚洲av成人一区二区三| 听说在线观看完整版免费高清| 真人做人爱边吃奶动态| 久久香蕉国产精品| 中文字幕av在线有码专区| 国产成年人精品一区二区| 精品一区二区三区av网在线观看| 香蕉av资源在线| 精品久久久久久久久久免费视频| 免费电影在线观看免费观看| 日本一本二区三区精品| 精品乱码久久久久久99久播| 国产精品一区二区免费欧美| 亚洲av美国av| 九色国产91popny在线| 丰满人妻一区二区三区视频av | 国模一区二区三区四区视频 | 成人无遮挡网站| 国产黄片美女视频| 日本 欧美在线| 精品一区二区三区视频在线观看免费| 熟女人妻精品中文字幕| 久久这里只有精品中国| 国产av麻豆久久久久久久| 免费人成视频x8x8入口观看| 999久久久国产精品视频| 中出人妻视频一区二区| 天堂√8在线中文| 岛国在线观看网站| 日韩有码中文字幕| avwww免费| 真人做人爱边吃奶动态| 欧美xxxx黑人xx丫x性爽| 国产精品影院久久| 国产aⅴ精品一区二区三区波| 女生性感内裤真人,穿戴方法视频| 国产精品99久久久久久久久| 亚洲欧美日韩高清专用| 少妇丰满av| 波多野结衣巨乳人妻| 精品久久久久久久末码| 女人高潮潮喷娇喘18禁视频| 久久国产精品人妻蜜桃| 亚洲九九香蕉| 久久精品91蜜桃| 美女高潮的动态| 亚洲国产欧洲综合997久久,| 又黄又爽又免费观看的视频| 国产麻豆成人av免费视频| 国产精品久久久久久精品电影| 一级毛片高清免费大全| 成人无遮挡网站| 久久久国产欧美日韩av| 国产高清三级在线| 国内毛片毛片毛片毛片毛片| 三级国产精品欧美在线观看 | 在线免费观看的www视频| 韩国av一区二区三区四区| 一本久久中文字幕| 搡老岳熟女国产| 日日夜夜操网爽| 最近最新免费中文字幕在线| 男女午夜视频在线观看| 亚洲欧美日韩高清在线视频| 免费人成视频x8x8入口观看| 国产精品影院久久| 黑人欧美特级aaaaaa片| 欧美zozozo另类| 此物有八面人人有两片| 最新美女视频免费是黄的| 18禁美女被吸乳视频| 国产爱豆传媒在线观看| av黄色大香蕉| 性色av乱码一区二区三区2| 国产精品综合久久久久久久免费| 欧美日韩亚洲国产一区二区在线观看| 长腿黑丝高跟| 激情在线观看视频在线高清| 精品一区二区三区四区五区乱码| 男女下面进入的视频免费午夜| 日日夜夜操网爽| 久久天躁狠狠躁夜夜2o2o| 亚洲乱码一区二区免费版| 免费观看精品视频网站| 日本 欧美在线| 午夜福利18| 成人一区二区视频在线观看| 久久亚洲真实| 亚洲自拍偷在线| 日韩大尺度精品在线看网址| 亚洲国产欧美一区二区综合| 色在线成人网| 丁香六月欧美| 中国美女看黄片| 亚洲自拍偷在线| 看免费av毛片| 亚洲自偷自拍图片 自拍| 精品一区二区三区视频在线 | 国产精品久久久久久人妻精品电影| 三级国产精品欧美在线观看 | 亚洲av成人av| 亚洲欧美精品综合一区二区三区| 国产精品美女特级片免费视频播放器 | 久久九九热精品免费| 一区福利在线观看| 美女被艹到高潮喷水动态| 高清毛片免费观看视频网站|