• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    以用戶QoE 預(yù)測值為獎勵的視頻自適應(yīng)比特率算法

    2021-04-09 03:10:26肖慶宇陳梓晗陳貴豪李陶深
    電子科技大學(xué)學(xué)報 2021年2期
    關(guān)鍵詞:用戶方法模型

    葉 進(jìn),肖慶宇,陳梓晗,陳貴豪,李陶深

    (廣西大學(xué)計算機(jī)與電子信息學(xué)院 南寧 530004)

    近年來,基于HTTP 的視頻流觀看需求迅速增長。為了在各種網(wǎng)絡(luò)條件下實現(xiàn)流暢的視頻播放,客戶端視頻播放器采用自適應(yīng)比特率(adaptive bitrate, ABR)算法來動態(tài)確定每個視頻塊的比特率以優(yōu)化視頻質(zhì)量。這樣做的目標(biāo)是使視頻比特率適應(yīng)潛在的網(wǎng)絡(luò)條件來最大化用戶的體驗質(zhì)量(quality of experience, QoE)。但是由于網(wǎng)絡(luò)流量的高突發(fā)性,為每一個視頻塊選擇一個合適的比特率是具有挑戰(zhàn)性的。

    國際電信聯(lián)盟(international telecommunication union, ITU)對QoE 進(jìn)行了明確的定義[1],即一個應(yīng)用或一項服務(wù)的整體可接受性,它由終端用戶的主觀感知決定。當(dāng)QoE 較差時,用戶可能會更早關(guān)閉視頻頁面,這導(dǎo)致視頻內(nèi)容提供方的大量經(jīng)濟(jì)損失。而在視頻傳輸場景下,QoE 是指用戶在某一次觀看視頻后對這次觀看體驗的接受性。一些現(xiàn)有研究以評分的形式直接從用戶處獲取QoE,文獻(xiàn)[2]則采用一些應(yīng)用層或網(wǎng)絡(luò)層的指標(biāo)來定義QoE。

    現(xiàn)有的ABR 算法采用固定的控制規(guī)則來選擇未來的視頻比特率。但這類方法具有很強(qiáng)的假設(shè)性,難以適應(yīng)不同的網(wǎng)絡(luò)環(huán)境。因此利用強(qiáng)化學(xué)習(xí)(reinforcement learning, RL)生成ABR 的方法被提出,能從零開始學(xué)習(xí)并生成算法而無需任何網(wǎng)絡(luò)假設(shè),這類方法通過提高訓(xùn)練時的獎勵值來優(yōu)化神經(jīng)網(wǎng)絡(luò),而獎勵定義為QoE 函數(shù)。但獎勵函數(shù)往往被預(yù)先設(shè)置且設(shè)置時缺乏現(xiàn)實依據(jù),因此該類基于RL 的方法具有獲得相對良好的獎勵值的能力,但它們也可能為用戶提供與用戶期望不匹配的觀看體驗。

    播放視頻時用戶QoE 受到多種因素影響,以準(zhǔn)確的QoE 值作為RL 訓(xùn)練時的獎勵,能讓ABR朝著最大化QoE 的方向做出比特率決策。QoE 與視頻播放時的指標(biāo)密切相關(guān),其中包括視頻播放時的卡頓持續(xù)時間、平均播放比特率和比特率的變化值等。恰當(dāng)?shù)莫剟詈瘮?shù)設(shè)計能使獎勵值的變化更貼近真實用戶的QoE。但如何確定用于ABR 的獎勵,目前缺乏統(tǒng)一的標(biāo)準(zhǔn),而現(xiàn)有方法中的獎勵函數(shù)在訓(xùn)練之前就被預(yù)先設(shè)置,且設(shè)置過程缺乏描述和依據(jù),無法得知是否與用戶真實意圖相匹配。

    本文提出用戶QoE 預(yù)測網(wǎng)絡(luò)(user QoE prediction network, UQPN),以真實用戶數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)并預(yù)測用戶QoE 的方法。UQPN 將視頻流狀態(tài)作為輸入,輸出為現(xiàn)在用戶的QoE 預(yù)測分?jǐn)?shù),并以UQPN作為“獎勵函數(shù)”。本文提出了一種基于RL 的ABR算法,引入UQPN 加入ABR 訓(xùn)練過程,避免了獎勵函數(shù)建模的盲目性,從而使ABR 算法可以在滿足用戶要求的方向上進(jìn)行訓(xùn)練。

    1 相關(guān)工作

    基于客戶端的ABR 算法主要分為兩種類型:基于模型的方法和基于學(xué)習(xí)的方法[3]。

    第一類方法考慮了吞吐量的預(yù)測值和視頻緩沖區(qū)大小等因素來選擇比特率。文獻(xiàn)[4]通過過去視頻塊大小和下載時間預(yù)測網(wǎng)絡(luò)吞吐量,并以此作為未來吞吐量的估計值,估計值大時選擇高視頻比特率。另一些方法通過觀察緩沖區(qū)大小來避免卡頓事件,并以此作為標(biāo)準(zhǔn)為下一個視頻塊選擇盡可能高的比特率。文獻(xiàn)[5]提出了一個線性標(biāo)準(zhǔn)閾值來控制可用的播放緩沖區(qū)大小。以model predictive control (MPC)[6]為代表的混合策略綜合考慮了吞吐量預(yù)測值和緩沖區(qū)大小,進(jìn)行下一個視頻塊的比特率決策。此外,文獻(xiàn)[7]研究了電池電量與移動流媒體QoE 的關(guān)系。文獻(xiàn)[8]提出的Oboe 對現(xiàn)有ABR 策略參數(shù)進(jìn)行自動調(diào)整,使現(xiàn)有算法能夠找到更佳的參數(shù)配置。此類方法往往針對某些網(wǎng)絡(luò)條件,并在具有較強(qiáng)假設(shè)的前提下進(jìn)行設(shè)計,嚴(yán)重依賴于微調(diào)的參數(shù),難以適用于不同的網(wǎng)絡(luò)環(huán)境。

    基于學(xué)習(xí)的方法針對上述不足進(jìn)行了改進(jìn),在獲取到不同網(wǎng)絡(luò)條件下的經(jīng)驗后,該類算法能夠顯著提高ABR 的性能。D-DASH (a deep Q-learning frame work for dynamic adaptive streaming over HTTP)[9]結(jié)合了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)技術(shù),利用深度Q-learning 這種基于價值的強(qiáng)化學(xué)習(xí)方法優(yōu)化視頻的QoE。在相同的網(wǎng)絡(luò)條件下,Tiyuntsong[10]用生成對抗網(wǎng)絡(luò),通過兩個智能體的競爭來朝著規(guī)則或特定的獎勵進(jìn)行自我優(yōu)化。Pensieve[11]采用最新的A3C[12]算法生成ABR算法模型,其中包含兩個神經(jīng)網(wǎng)絡(luò)模型,一個用于比特率決策,另一個用于評估當(dāng)前狀態(tài)并給出狀態(tài)價值,實驗結(jié)果顯示其性能優(yōu)于基于模型的方法。HOT Dash[13]將視頻中的幀區(qū)分為熱點(diǎn)和非熱點(diǎn),并將熱點(diǎn)部分在帶寬允許時優(yōu)先傳輸,這樣的做法使用戶能夠高質(zhì)量的觀看特定視頻塊。Comyco[14]針對該類方法采樣效率低的缺陷,通過模仿即時求解器給出的專家軌跡來訓(xùn)練策略,這不僅可以避免多余的探索,還可以更好地利用收集的樣本。

    上述方法在訓(xùn)練時擁有相同的目標(biāo):最大化累計獎勵值?;趯W(xué)習(xí)的方法多采用線性QoE 公式作為獎勵函數(shù),應(yīng)用層的網(wǎng)絡(luò)或播放器參數(shù)作為其輸入,每一項參數(shù)給與固定的權(quán)重以表示對其的重視程度,但是權(quán)重的設(shè)置過程缺乏描述和依據(jù)。因此出現(xiàn)了一些采用機(jī)器學(xué)習(xí)的方法對用戶的QoE進(jìn)行預(yù)測。Video ATLAS[15]是一種機(jī)器學(xué)習(xí)框架,其中結(jié)合了許多與QoE 相關(guān)的特征,包括客觀視頻質(zhì)量、卡頓以及記憶特征進(jìn)行QoE 預(yù)測。在此基礎(chǔ)上,文獻(xiàn)[16]采用非線性自回歸外生模型來在連續(xù)時間上對QoE 進(jìn)行預(yù)測,在幀級別的粒度上測量QoE,并利用了多模型聯(lián)合預(yù)測來提升準(zhǔn)確率。文獻(xiàn)[17]選擇長短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)來捕捉QoE 在時序上的依賴關(guān)系,并在真實的用戶數(shù)據(jù)上展現(xiàn)了良好的性能。

    綜上,現(xiàn)有強(qiáng)化學(xué)習(xí)的訓(xùn)練目標(biāo)都可以被描述成使預(yù)期的累計獎勵值達(dá)到最大化,而基于RL 的ABR 算法輸出比特率決策,視頻播放器以該比特率請求下載下一個視頻塊。下載完成后狀態(tài)發(fā)生轉(zhuǎn)移,獎勵函數(shù)以這些狀態(tài)指標(biāo)作為輸入,計算得到下一步的獎勵值,從而使算法模型沿著獎勵值的梯度方向進(jìn)行更新,因此獎勵函數(shù)的設(shè)置對于算法性能具有重要影響。如果獎勵函數(shù)設(shè)計未經(jīng)充分考慮,一般會導(dǎo)致網(wǎng)絡(luò)不收斂,結(jié)果不優(yōu)或者使模型無法按照希望的方法做出決策。

    已有基于RL 的ABR 算法均以量化的QoE 作為獎勵值。QoE 由播放中的指標(biāo)如視頻平均比特率、卡頓時間、比特率切換值等構(gòu)成,每項指標(biāo)賦予固定的權(quán)重表達(dá)對其重視程度。但由于用戶的主觀因素(如期望、體驗經(jīng)歷)和環(huán)境因素,QoE 的量化十分復(fù)雜。獎勵函數(shù)中權(quán)重的設(shè)置體現(xiàn)了用戶對不同指標(biāo)的傾向,而定量描述用戶對這樣的事件的傾向,用以確定獎勵函數(shù)的設(shè)置是一項難以實施的工作。本文認(rèn)為,ABR 算法獎勵值應(yīng)該體現(xiàn)對播放質(zhì)量變化事件的相應(yīng)懲罰或獎勵,應(yīng)該針對用戶QoE 進(jìn)行大量采樣和訓(xùn)練建模,用以研究用戶QoE 預(yù)測的方法。因此本文提出了UQPN,從用戶數(shù)據(jù)出發(fā)訓(xùn)練得到QoE 預(yù)測模型代替以往的函數(shù),以此網(wǎng)絡(luò)用于訓(xùn)練,能夠獲得更加符合用戶需求的ABR 算法模型。

    2 詳細(xì)設(shè)計

    本文提出UQPN 并讓其加入RL 訓(xùn)練過程,因為RL 訓(xùn)練的目標(biāo)為最大化累計獎勵值,所以有了UQPN 輸出更準(zhǔn)確的QoE 預(yù)測值作為獎勵,可以使ABR 學(xué)會做出令用戶QoE 更佳的比特率決策。據(jù)此設(shè)計的ABR 算法其整體系統(tǒng)結(jié)構(gòu)如圖1 所示。

    圖1 ABR 算法整體結(jié)構(gòu)

    該方法采用離線訓(xùn)練模式,在離線仿真器上讀取收集好的數(shù)據(jù)進(jìn)行訓(xùn)練。仿真訓(xùn)練時,設(shè)某一視頻塊下載完成的時間為t,離線仿真器將不同的狀態(tài)向量st和s′t輸出至UQPN 和ABR 智能體。UQPN接受當(dāng)前狀態(tài)后將用戶QoE 預(yù)測值rt輸出給ABR智能體作為獎勵用于訓(xùn)練。智能體接收該值并基于該值采用策略梯度法更新神經(jīng)網(wǎng)絡(luò),隨后發(fā)送下一視頻塊的碼率決策at至仿真器,開始下一塊的模擬下載。待訓(xùn)練過程結(jié)束后,將最新的ABR 模型發(fā)送至在線使用的ABR 服務(wù)器進(jìn)行替換,為在線視頻播放器提供自適應(yīng)比特率服務(wù)。與離線訓(xùn)練階段相比,在線應(yīng)用階段則無需獎勵機(jī)制,由ABR 獲取播放器狀態(tài)并做出碼率決策即可。

    2.1 UQPN 設(shè)計

    使用RL 生成ABR 模型時,受到獎勵函數(shù)建模困難和權(quán)重難以確定的困擾。因此,本節(jié)給出UQPN 的設(shè)計細(xì)節(jié),該網(wǎng)絡(luò)能夠接收當(dāng)前視頻流狀態(tài)并輸出當(dāng)前QoE 預(yù)測值。訓(xùn)練UQPN 讓其“學(xué)會”捕捉用戶數(shù)據(jù)中潛藏的信息,以UQPN 作為獎勵能夠使ABR 模型做出更迎合用戶需求的碼率決策。

    UQPN 的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采用具有雙隱藏層的多層感知器(multi-layer perceptron, MLP)結(jié)構(gòu)。MLP是一種前饋人工神經(jīng)網(wǎng)絡(luò),層與層之間的節(jié)點(diǎn)進(jìn)行全連接。每當(dāng)下載完成一個視頻塊,設(shè)此時時刻為t,UQPN 收到狀態(tài)輸入st={x,n,m},x 為已下載完成的上個視頻塊的比特率;n 為上個視頻塊的比特率切換值;如果某個塊的比特率和上一個塊的比特率不相等,則有第i 個塊的比特率切換值ni=|xi-xi-1|。比特率切換值越大,代表用戶觀看視頻時的質(zhì)量波動越大;m 則表示上個視頻塊播放過程中的卡頓持續(xù)時間。在特征選擇時,使用Multi-RELIEF[18]方法來篩選特征,它計算每個特征對于QoE 貢獻(xiàn)的權(quán)重。其中以現(xiàn)有數(shù)據(jù)集LIVE-NFLXII[19]中記錄的用戶評分作為其觀看的QoE,各個視頻流中記錄的參數(shù)作為特征來計算權(quán)重。取權(quán)重值最大的前3 位特征作為狀態(tài)輸入st。接收輸入st后,UQPN 給出當(dāng)前狀態(tài)的QoE 預(yù)測值,即獎勵值rt。

    UQPN 以梯度下降法訓(xùn)練,采用反向傳播的方式更新網(wǎng)絡(luò)節(jié)點(diǎn),使訓(xùn)練集上的累計誤差不斷減小。訓(xùn)練開始之前,以輸入層的下一層為第一層,為所有節(jié)點(diǎn)隨機(jī)初始化權(quán)重和偏置值。其中設(shè)第i 層的權(quán)重矩陣為Wi、偏置為bi。節(jié)點(diǎn)的激活函數(shù)采用sigmoid,令其為f。于是,第i 隱藏層的節(jié)點(diǎn)激活值為:

    式中,xi-1為第i-1 層所有節(jié)點(diǎn)的輸出組成的矩陣。

    最終輸出層的激活值為:

    式中,L 為神經(jīng)網(wǎng)絡(luò)層數(shù)。

    訓(xùn)練時的損失函數(shù)定義為訓(xùn)練數(shù)據(jù)集之中用戶觀看視頻給出的QoE 得分y 與UQPN 輸出值r 之間差值的平方,并加入正則化項以防止過擬合。訓(xùn)練過程中通過反向傳播算法逐一計算誤差的偏導(dǎo)數(shù),并以此更新神經(jīng)網(wǎng)絡(luò)參數(shù)來達(dá)到最小化累計誤差的目標(biāo)。

    2.2 基于UQPN 的ABR 算法

    在此基礎(chǔ)上,本文提出一種強(qiáng)化學(xué)習(xí)的ABR算法。UQPN 訓(xùn)練完成后,令其加入RL 訓(xùn)練,替代以往的獎勵函數(shù)給出獎勵值。該方法的基本訓(xùn)練算法使用A3C,這是一種高效的actor-critic 算法,其中包括用于做出決策的actor 網(wǎng)絡(luò)和預(yù)測狀態(tài)價值的critic 網(wǎng)絡(luò)。訓(xùn)練時采用策略梯度算法更新網(wǎng)絡(luò)參數(shù),梯度方向則是能使UQPN 輸出值增加的方向。

    在每一個視頻塊完成下載的時刻t,actor 網(wǎng)絡(luò)接收狀態(tài)觀察向量s′t并輸出比特率決策at。同樣的,使用Multi-RELIEF 方法篩選特征后,考慮到該方法網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性和客戶端獲取特征的可行性,定義狀態(tài)觀察向量s′t={ot,nt,at,et,τt,B},其中ot為t 之前的k 個視頻塊的下載時的吞吐量測量值; nt為t 之前的k 個視頻塊的大小; at表示t 之前的k 個視頻塊的比特率; et儲存了t 之前的k 個視頻塊各自下載時播放視頻的卡頓時間; τt為t 之前的k 個視頻塊的下載時間;B 為當(dāng)前播放器緩沖區(qū)的大小。

    需要注意的是,actor 網(wǎng)絡(luò)的實際輸出并非某一確定值,而是一個概率分布。即在某一狀態(tài)下特定比特率被選擇的概率,將其標(biāo)識為π(s′,a),輸入狀態(tài)和動作后輸出概率。而具有可管理的、可調(diào)整的神經(jīng)網(wǎng)絡(luò)權(quán)重集θ 的網(wǎng)絡(luò),標(biāo)識為πθ(s′,a)。因此,訓(xùn)練目標(biāo),即累積獎勵相對于θ 的梯度可表示為:

    因此,actor 網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)權(quán)重集θ 更新公式為:

    環(huán)境部署應(yīng)用at后狀態(tài)由s′t轉(zhuǎn)移至s′t+1,s′t+1的預(yù)期獎勵估計為V(s′t+1),γ 為未來折扣系數(shù),γ∈[0,1]。γ=1 時表示未來狀態(tài)和當(dāng)前狀態(tài)同等權(quán)重。而critic 網(wǎng)絡(luò)接收s′t后輸出狀態(tài)價值V(s′t),以評價當(dāng)前狀態(tài)好壞。對于critic 網(wǎng)絡(luò)的更新,使用時序差分法更新所有critic 網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)權(quán)重集θv,對于每次t,critic 估計值和真實值之間的誤差可以表示為:

    θv的更新公式為:

    式中,μ為critic 網(wǎng)絡(luò)的學(xué)習(xí)速率。為提升訓(xùn)練速度,算法使用多個ABR 智能體并行訓(xùn)練,每個智能體的輸入不同。默認(rèn)情況下,本文工作按照Pensieve 建議,使用16 個并行智能體。這樣互不干預(yù)的獨(dú)立訓(xùn)練可獲得不同的經(jīng)驗。每個智能體將其獲得的數(shù)據(jù)發(fā)送給中央智能體,該智能體會對其進(jìn)行匯總以生成一個ABR 算法模型。對于中央智能體接收到的每組數(shù)據(jù),它都使用actor-critic 算法來計算梯度并進(jìn)行更新。最后,中央智能體更新actor 網(wǎng)絡(luò),并將新模型返回給其余智能體使用。

    2.3 模型更新

    當(dāng)前的客戶端視頻播放器網(wǎng)絡(luò)條件多變,且流量行為變化復(fù)雜,為了保證ABR 模型決策的有效性和對環(huán)境變化的適應(yīng)性,算法中設(shè)置了觸發(fā)更換新模型的觸發(fā)機(jī)制。當(dāng)客戶端播放器播放視頻時記錄其吞吐量,即每次視頻播放完成時都可以獲得該次播放的網(wǎng)絡(luò)吞吐量追蹤。其次,播放完成或頁面關(guān)閉時,向用戶詢問該次播放的QoE 評分并記錄。考慮到用戶評分收集難度較大,當(dāng)吞吐量追蹤獲取到一定數(shù)量時,離線ABR 智能體在現(xiàn)有模型基礎(chǔ)上進(jìn)一步訓(xùn)練,結(jié)束后則進(jìn)行模型更新,即將剛經(jīng)過訓(xùn)練的ABR 模型部署至在線的ABR 服務(wù)器。具體算法如下。

    算法1:ABR 模型更新算法

    輸入:吞吐量追蹤向量o,用戶QoE 評分向量N,現(xiàn)有ABR 模型π,UQPN 模型r

    輸出:模型更新結(jié)果

    初始化更新所需閾值S;

    其中S 為模型更新的吞吐量追蹤數(shù)量閾值,該值應(yīng)隨客戶端具體需求變化。當(dāng)客戶端網(wǎng)絡(luò)條件變化較為頻繁時,可以適當(dāng)減小S 以更多地更新模型。網(wǎng)絡(luò)條件較為穩(wěn)定時,可以適當(dāng)增大S 以減少更新次數(shù)。

    3 仿真實驗及結(jié)果

    本節(jié)首先進(jìn)行了相關(guān)性對比來驗證UPQN 的效果,然后對基于UPQN 的RL 獎勵及其ABR 算法進(jìn)行了對比。其中相關(guān)性對比實驗采用LIVENFLX-II 數(shù)據(jù)集,包括訓(xùn)練所需的視頻流信息和用戶QoE 信息。實驗收集了由15 個不同類型的視頻、4 種不同的ABR 算法、7 種不同的網(wǎng)絡(luò)狀態(tài)生成的視頻流,以及由65 個受試者給出的視頻評分。對于每個視頻流,在連續(xù)時間上生成了連續(xù)評分。數(shù)據(jù)集記錄了視頻卡頓狀況和多種視頻質(zhì)量評價指標(biāo)的變化。

    對于RL 獎勵及其ABR 算法,結(jié)合兩個真實網(wǎng)絡(luò)帶寬數(shù)據(jù)集進(jìn)行仿真:由FCC 提供的寬帶數(shù)據(jù)集[20]和挪威收集的移動設(shè)備網(wǎng)絡(luò)數(shù)據(jù)集[21]。仿真實驗采用文獻(xiàn)[16]提出的QoE 預(yù)測方法作為評價標(biāo)準(zhǔn),實驗中包含多個測試視頻流,每個視頻流均需下載若干個視頻塊,因此實驗采用每一視頻塊的平均QoE 作為評價指標(biāo)。

    3.1 相關(guān)性對比

    UPQN 為雙隱藏層MLP 結(jié)構(gòu),其中將第二隱藏層固定為4 節(jié)點(diǎn),進(jìn)行第一層的節(jié)點(diǎn)實驗性探索,發(fā)現(xiàn)第一隱藏層具有12 節(jié)點(diǎn)時最優(yōu)。因此論文使用上述UQPN 網(wǎng)絡(luò)結(jié)構(gòu)在數(shù)據(jù)集上進(jìn)行評估。表1 使用了兩個度量來對比UQPN 模型與其他獎勵函數(shù)的QoE 預(yù)測的性能:線性相關(guān)系數(shù)(linear correlation coefficient, LCC)以及斯皮爾曼等級相關(guān)系數(shù)(spearman rank order correlation coefficient,SROCC)。LCC 和SROCC 度量的是兩組數(shù)據(jù)之間的相關(guān)程度。對本實驗來說,這兩個指標(biāo)值越大,預(yù)測的分值和QoE 越接近。

    表1 可見經(jīng)過真實用戶數(shù)據(jù)訓(xùn)練得到的UQPN相比于現(xiàn)有方法的獎勵函數(shù)平均提升了12%~22.4%的LCC 和11.6%~14.3%的SRCC。

    表1 UQPN 與其他獎勵函數(shù)相關(guān)性對比

    3.2 不同RL 獎勵方法對比

    本節(jié)主要考慮以下3 種常用的RL 算法:

    Policy-Gradient:使用函數(shù)逼近器明確表示策略,并根據(jù)預(yù)期獎勵相對于策略參數(shù)的梯度進(jìn)行更新,并證明了具有任意可微函數(shù)逼近器的策略迭代之后可以收斂到局部最優(yōu)策略。

    A2C:A2C 是一種改進(jìn)的actor-critic 算法,使用優(yōu)勢函數(shù)代替critic 網(wǎng)絡(luò)中的原始獎勵,可以作為衡量被選取動作值和所有動作平均值好壞的指標(biāo)。

    A3C:神經(jīng)網(wǎng)絡(luò)訓(xùn)練時,需要的數(shù)據(jù)是獨(dú)立同分布的,因此A3C 采用異步訓(xùn)練的方法,打破數(shù)據(jù)的相關(guān)性并加速了訓(xùn)練過程。

    之后將每種RL 算法中的獎勵設(shè)定為由3 種方法給出:Pensieve、Comyco 和UQPN。其中前兩者均為線性函數(shù),由播放中比特率、卡頓時間等指標(biāo)與固定權(quán)重的乘積組成。實驗中RL 智能體采用的輸入與Pensieve 中一致,并設(shè)置所有ABR 模型訓(xùn)練次數(shù)為10 000 次。實驗中訓(xùn)練、測試數(shù)據(jù)均為離線仿真器讀取網(wǎng)絡(luò)帶寬數(shù)據(jù)并模擬下載特定視頻得出。

    如圖2 所示,在兩種用于測試的網(wǎng)絡(luò)帶寬數(shù)據(jù)下,與Pensieve、Comyco 提出的獎勵函數(shù)相比,UQPN 在3 種不同的RL 算法上的性能均更優(yōu),展現(xiàn)了良好的泛化能力。在A3C 方法上UQPN 的優(yōu)勢最為明顯,相比另外兩種方法的平均歸一化QoE在挪威數(shù)據(jù)集上帶來約27.9%提升并在FCC 數(shù)據(jù)集上帶來約27.7%的QoE 提升。而在A2C 方法上,UQPN 能夠帶來平均約27.2%和18.3%的QoE提升,在Policy-Gradient 上則有約15.4%和8.6%的QoE 性能上升。這是由算法的學(xué)習(xí)能力導(dǎo)致,A3C 算法的學(xué)習(xí)能力最強(qiáng),同樣的訓(xùn)練次數(shù)下更能夠發(fā)揮UQPN 的優(yōu)勢。而Policy-Gradient 則相反,不同的獎勵方法帶來的差異并不明顯。

    圖2 3 種獎勵方法得到的ABR 模型QoE 對比

    3.3 基于RL 的ABR 算法性能對比

    結(jié)果顯示,該方法分別能夠帶來平均約29.6%和26.1%的歸一化QoE 提升。這意味著,將UQPN和本文提出的訓(xùn)練方法結(jié)合,以UQPN 輸出值作為獎勵,使ABR 策略模型在強(qiáng)化學(xué)習(xí)時有了更準(zhǔn)確、合理的訓(xùn)練目標(biāo),因此該方法在寬帶和移動兩種真實網(wǎng)絡(luò)條件下都能夠比現(xiàn)有的基于RL 的ABR方法給用戶帶來更好的QoE。

    4 結(jié) 束 語

    本文提出了一種使用用戶QoE 預(yù)測值作為強(qiáng)化學(xué)習(xí)獎勵的自適應(yīng)比特率算法。有了更加準(zhǔn)確的QoE 預(yù)測值加入訓(xùn)練,該方法能夠給用戶帶來更好的觀看體驗。該方法采用離線訓(xùn)練,僅基于收集的數(shù)據(jù)即可生成算法模型,其輸入?yún)?shù)也易于獲取,無需修改現(xiàn)有的流媒體視頻傳輸框架,具備較好的可行性。未來的工作中,將考慮采用更細(xì)粒度、更準(zhǔn)確的方法來探索用戶在觀看視頻時的QoE變化,能夠更準(zhǔn)確把握用戶在觀看視頻時的感受,為用戶提供更好的觀看體驗。

    猜你喜歡
    用戶方法模型
    一半模型
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    關(guān)注用戶
    商用汽車(2016年11期)2016-12-19 01:20:16
    可能是方法不對
    3D打印中的模型分割與打包
    關(guān)注用戶
    商用汽車(2016年6期)2016-06-29 09:18:54
    關(guān)注用戶
    商用汽車(2016年4期)2016-05-09 01:23:12
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    欧美日韩亚洲综合一区二区三区_| 怎么达到女性高潮| 欧美性长视频在线观看| 老汉色∧v一级毛片| 欧美黑人精品巨大| 欧美激情高清一区二区三区| 欧美精品一区二区免费开放| 亚洲精品国产色婷婷电影| 免费日韩欧美在线观看| 国产在线一区二区三区精| 久久人人97超碰香蕉20202| 亚洲熟女毛片儿| 日韩一区二区三区影片| 美女国产高潮福利片在线看| 9热在线视频观看99| 国产视频一区二区在线看| 少妇粗大呻吟视频| 99国产极品粉嫩在线观看| 亚洲第一av免费看| 亚洲成人国产一区在线观看| 岛国毛片在线播放| 91av网站免费观看| 中国美女看黄片| 亚洲人成电影免费在线| 精品欧美一区二区三区在线| 中文字幕av电影在线播放| 日本黄色视频三级网站网址 | 久久久欧美国产精品| 国产成人精品无人区| 午夜老司机福利片| 亚洲精品av麻豆狂野| 另类精品久久| 1024香蕉在线观看| 色精品久久人妻99蜜桃| 熟女少妇亚洲综合色aaa.| 国产精品久久久久成人av| 精品人妻1区二区| av有码第一页| 在线观看免费午夜福利视频| 午夜免费鲁丝| 国产无遮挡羞羞视频在线观看| 1024香蕉在线观看| 99riav亚洲国产免费| √禁漫天堂资源中文www| a级毛片黄视频| 国产一区有黄有色的免费视频| 日韩视频一区二区在线观看| 午夜老司机福利片| 丝袜美足系列| 嫩草影视91久久| 国产一区二区激情短视频| 最黄视频免费看| 高潮久久久久久久久久久不卡| 激情视频va一区二区三区| a级片在线免费高清观看视频| 久久精品成人免费网站| 伦理电影免费视频| 黄色成人免费大全| 欧美变态另类bdsm刘玥| 麻豆av在线久日| 国产片内射在线| 国产亚洲av高清不卡| 国产欧美日韩一区二区三| 中国美女看黄片| av天堂久久9| 麻豆乱淫一区二区| 蜜桃在线观看..| 18在线观看网站| 久久国产精品人妻蜜桃| 黄网站色视频无遮挡免费观看| 欧美激情 高清一区二区三区| 亚洲精品自拍成人| 国产高清videossex| 麻豆成人av在线观看| 欧美变态另类bdsm刘玥| 汤姆久久久久久久影院中文字幕| 伦理电影免费视频| 亚洲中文字幕日韩| 中文字幕人妻丝袜一区二区| e午夜精品久久久久久久| 在线观看免费高清a一片| 欧美+亚洲+日韩+国产| 成人亚洲精品一区在线观看| 操出白浆在线播放| 91精品国产国语对白视频| 狠狠精品人妻久久久久久综合| 19禁男女啪啪无遮挡网站| 国产极品粉嫩免费观看在线| 男男h啪啪无遮挡| 韩国精品一区二区三区| 叶爱在线成人免费视频播放| 亚洲免费av在线视频| 高清欧美精品videossex| 少妇精品久久久久久久| 久久精品国产亚洲av高清一级| 人妻久久中文字幕网| 9热在线视频观看99| 一进一出好大好爽视频| 国产精品偷伦视频观看了| 国产成人av激情在线播放| 美女视频免费永久观看网站| 欧美日本中文国产一区发布| 日韩有码中文字幕| 热re99久久国产66热| 精品亚洲乱码少妇综合久久| 日韩欧美免费精品| 久久久国产一区二区| av免费在线观看网站| 国产伦理片在线播放av一区| 欧美日韩视频精品一区| 免费在线观看日本一区| 亚洲全国av大片| 黑丝袜美女国产一区| 国产单亲对白刺激| 亚洲一区中文字幕在线| 考比视频在线观看| 中文欧美无线码| 亚洲色图综合在线观看| 亚洲av成人不卡在线观看播放网| 国内毛片毛片毛片毛片毛片| 老司机福利观看| 97人妻天天添夜夜摸| 久久中文看片网| 后天国语完整版免费观看| 国产av国产精品国产| 韩国精品一区二区三区| 性色av乱码一区二区三区2| 国产男女内射视频| 成人特级黄色片久久久久久久 | 高清av免费在线| 国产精品免费视频内射| 精品乱码久久久久久99久播| 一进一出抽搐动态| 两性午夜刺激爽爽歪歪视频在线观看 | 久久久国产一区二区| 国产亚洲av高清不卡| 国产一区二区三区综合在线观看| 69精品国产乱码久久久| 国产男女内射视频| 黄色怎么调成土黄色| 天天躁日日躁夜夜躁夜夜| 国产精品久久久久久精品古装| 男女无遮挡免费网站观看| 日韩视频一区二区在线观看| 99香蕉大伊视频| 国产高清国产精品国产三级| 在线 av 中文字幕| 午夜免费成人在线视频| 久久久久精品人妻al黑| 久久久久国内视频| 国产亚洲欧美精品永久| 美国免费a级毛片| 亚洲av成人不卡在线观看播放网| 色94色欧美一区二区| 狂野欧美激情性xxxx| 老司机在亚洲福利影院| www.999成人在线观看| 日本vs欧美在线观看视频| www日本在线高清视频| 久久天堂一区二区三区四区| 久久性视频一级片| 精品高清国产在线一区| 啦啦啦免费观看视频1| 汤姆久久久久久久影院中文字幕| 91精品国产国语对白视频| 国产精品久久久av美女十八| 国产黄色免费在线视频| av国产精品久久久久影院| 亚洲美女黄片视频| 久久精品91无色码中文字幕| 亚洲 欧美一区二区三区| 新久久久久国产一级毛片| 欧美在线一区亚洲| 青青草视频在线视频观看| 亚洲少妇的诱惑av| 一级片免费观看大全| 精品国内亚洲2022精品成人 | 在线观看免费视频网站a站| 青草久久国产| 9191精品国产免费久久| 成年动漫av网址| 亚洲熟女精品中文字幕| 美国免费a级毛片| 欧美午夜高清在线| 99久久国产精品久久久| 欧美激情久久久久久爽电影 | 一本久久精品| 另类亚洲欧美激情| 日本一区二区免费在线视频| www日本在线高清视频| www.999成人在线观看| 欧美黄色淫秽网站| 亚洲精品成人av观看孕妇| 亚洲av日韩精品久久久久久密| 老司机午夜福利在线观看视频 | 天天操日日干夜夜撸| 我的亚洲天堂| 丁香六月天网| 黄片大片在线免费观看| 99九九在线精品视频| 国产av一区二区精品久久| 99热国产这里只有精品6| 亚洲一区中文字幕在线| 19禁男女啪啪无遮挡网站| 成人三级做爰电影| 老汉色∧v一级毛片| 亚洲七黄色美女视频| 色视频在线一区二区三区| 国产精品麻豆人妻色哟哟久久| 青草久久国产| 两性午夜刺激爽爽歪歪视频在线观看 | 下体分泌物呈黄色| 国产日韩欧美亚洲二区| 色精品久久人妻99蜜桃| 精品国产国语对白av| 国产精品国产av在线观看| 国产国语露脸激情在线看| 曰老女人黄片| 女性生殖器流出的白浆| 丰满人妻熟妇乱又伦精品不卡| 天天躁夜夜躁狠狠躁躁| 久久天躁狠狠躁夜夜2o2o| 午夜免费鲁丝| 午夜福利欧美成人| bbb黄色大片| 精品福利观看| 老司机影院毛片| 国产单亲对白刺激| 久久婷婷成人综合色麻豆| 免费观看av网站的网址| 亚洲欧美日韩高清在线视频 | 久久热在线av| 天天躁狠狠躁夜夜躁狠狠躁| 中文欧美无线码| 在线十欧美十亚洲十日本专区| 日本精品一区二区三区蜜桃| 亚洲第一欧美日韩一区二区三区 | 日韩人妻精品一区2区三区| 国产成人精品久久二区二区免费| 久久毛片免费看一区二区三区| 免费在线观看黄色视频的| 欧美激情久久久久久爽电影 | 国产精品国产高清国产av | 一进一出抽搐动态| 国产亚洲av高清不卡| 免费观看人在逋| 50天的宝宝边吃奶边哭怎么回事| 国产日韩欧美在线精品| 久久久国产成人免费| 欧美精品亚洲一区二区| 黄色视频,在线免费观看| 久久热在线av| 国产淫语在线视频| 久久这里只有精品19| 日韩中文字幕欧美一区二区| 亚洲国产精品一区二区三区在线| 精品高清国产在线一区| 国产伦理片在线播放av一区| 成人三级做爰电影| 日韩欧美国产一区二区入口| 免费人妻精品一区二区三区视频| av不卡在线播放| 亚洲精品美女久久av网站| 2018国产大陆天天弄谢| 国产深夜福利视频在线观看| 久久九九热精品免费| 曰老女人黄片| 亚洲九九香蕉| 一级毛片精品| 久久天堂一区二区三区四区| 亚洲第一欧美日韩一区二区三区 | 在线观看免费日韩欧美大片| 国产精品国产高清国产av | 两人在一起打扑克的视频| 蜜桃国产av成人99| 麻豆av在线久日| 欧美人与性动交α欧美软件| 国产欧美亚洲国产| 国产精品一区二区在线不卡| 动漫黄色视频在线观看| 国产午夜精品久久久久久| 汤姆久久久久久久影院中文字幕| 搡老乐熟女国产| 一区二区三区激情视频| 成年人免费黄色播放视频| av福利片在线| 一区二区三区乱码不卡18| 国产又色又爽无遮挡免费看| 超色免费av| 窝窝影院91人妻| 日韩欧美国产一区二区入口| 亚洲欧美一区二区三区黑人| www.熟女人妻精品国产| 精品国产超薄肉色丝袜足j| 国产免费现黄频在线看| 国产成人欧美在线观看 | 999久久久精品免费观看国产| 国产亚洲欧美在线一区二区| 欧美一级毛片孕妇| 日韩免费av在线播放| 国产成人精品久久二区二区91| 亚洲国产av影院在线观看| 国产成人精品无人区| 成人18禁在线播放| 亚洲五月色婷婷综合| 国产精品二区激情视频| 中文欧美无线码| xxxhd国产人妻xxx| 丝袜在线中文字幕| 老汉色av国产亚洲站长工具| 99久久国产精品久久久| 我要看黄色一级片免费的| 人妻 亚洲 视频| 欧美成狂野欧美在线观看| 亚洲成人手机| 久久国产精品男人的天堂亚洲| 这个男人来自地球电影免费观看| 91老司机精品| 日本五十路高清| 国产精品久久久久久人妻精品电影 | 美女福利国产在线| 欧美在线黄色| 亚洲五月婷婷丁香| 丰满少妇做爰视频| 国产一卡二卡三卡精品| 菩萨蛮人人尽说江南好唐韦庄| 黄色视频在线播放观看不卡| 国产欧美亚洲国产| 大片电影免费在线观看免费| 丝袜在线中文字幕| 欧美日韩视频精品一区| 久久久精品区二区三区| 18在线观看网站| 国产精品1区2区在线观看. | 这个男人来自地球电影免费观看| 黄色视频在线播放观看不卡| 交换朋友夫妻互换小说| 亚洲午夜精品一区,二区,三区| 日韩欧美免费精品| av电影中文网址| 亚洲性夜色夜夜综合| 中文字幕av电影在线播放| 精品人妻熟女毛片av久久网站| 丰满迷人的少妇在线观看| 久久天堂一区二区三区四区| 国产高清videossex| 国产av一区二区精品久久| 亚洲国产中文字幕在线视频| 成年动漫av网址| 大片电影免费在线观看免费| 美女午夜性视频免费| 大码成人一级视频| 国产成人系列免费观看| 亚洲色图 男人天堂 中文字幕| 我要看黄色一级片免费的| 啦啦啦在线免费观看视频4| 国产视频一区二区在线看| 午夜福利免费观看在线| √禁漫天堂资源中文www| 欧美日韩黄片免| 亚洲九九香蕉| 国产人伦9x9x在线观看| 一本大道久久a久久精品| 亚洲视频免费观看视频| 精品一区二区三区四区五区乱码| 在线观看66精品国产| 国产免费现黄频在线看| 成人18禁在线播放| 亚洲精品在线观看二区| 亚洲一区二区三区欧美精品| 午夜日韩欧美国产| 亚洲视频免费观看视频| 欧美黄色淫秽网站| 精品一区二区三区视频在线观看免费 | 亚洲九九香蕉| 法律面前人人平等表现在哪些方面| 久久久久久久国产电影| 黄片大片在线免费观看| 精品一区二区三区视频在线观看免费 | 免费在线观看影片大全网站| av福利片在线| 韩国精品一区二区三区| 操美女的视频在线观看| 国产野战对白在线观看| 在线av久久热| 日韩 欧美 亚洲 中文字幕| 2018国产大陆天天弄谢| 午夜福利一区二区在线看| 高清在线国产一区| 久久av网站| 高潮久久久久久久久久久不卡| 精品少妇黑人巨大在线播放| 久久青草综合色| 国产精品九九99| 一区二区三区国产精品乱码| 久久国产精品大桥未久av| 香蕉久久夜色| 在线看a的网站| 下体分泌物呈黄色| 久久久久国内视频| 热re99久久精品国产66热6| 国产精品成人在线| 中文字幕制服av| bbb黄色大片| 亚洲精品在线观看二区| 狂野欧美激情性xxxx| 日韩 欧美 亚洲 中文字幕| 午夜久久久在线观看| 在线永久观看黄色视频| 制服人妻中文乱码| 一二三四社区在线视频社区8| 国产99久久九九免费精品| 日韩熟女老妇一区二区性免费视频| 亚洲av片天天在线观看| 男女之事视频高清在线观看| 欧美激情久久久久久爽电影 | 亚洲国产成人一精品久久久| 国产麻豆69| 精品亚洲成国产av| 777米奇影视久久| 精品视频人人做人人爽| 久久午夜综合久久蜜桃| 日韩三级视频一区二区三区| 久久精品国产综合久久久| 性色av乱码一区二区三区2| a级毛片黄视频| 久久精品成人免费网站| 黄色 视频免费看| 国产国语露脸激情在线看| 免费看a级黄色片| 欧美一级毛片孕妇| 国产精品国产av在线观看| 91老司机精品| 色94色欧美一区二区| 一本大道久久a久久精品| cao死你这个sao货| 国产视频一区二区在线看| 成人黄色视频免费在线看| 欧美+亚洲+日韩+国产| 成人国产av品久久久| 亚洲一区二区三区欧美精品| 美女国产高潮福利片在线看| 国产老妇伦熟女老妇高清| 考比视频在线观看| 国产成人免费观看mmmm| 免费在线观看影片大全网站| 亚洲一码二码三码区别大吗| 亚洲精品成人av观看孕妇| 欧美日韩视频精品一区| 精品人妻1区二区| 一级片'在线观看视频| 国产精品国产av在线观看| 91精品三级在线观看| 国产一区二区 视频在线| 亚洲中文av在线| 国产成+人综合+亚洲专区| 大型av网站在线播放| 亚洲熟女毛片儿| 国产极品粉嫩免费观看在线| 免费少妇av软件| 搡老乐熟女国产| 大香蕉久久网| www日本在线高清视频| 日韩大码丰满熟妇| 午夜精品国产一区二区电影| 亚洲第一欧美日韩一区二区三区 | 汤姆久久久久久久影院中文字幕| 亚洲专区中文字幕在线| 大码成人一级视频| 亚洲,欧美精品.| 日日摸夜夜添夜夜添小说| 免费女性裸体啪啪无遮挡网站| 亚洲专区国产一区二区| 99香蕉大伊视频| 免费黄频网站在线观看国产| 伦理电影免费视频| videosex国产| 欧美激情久久久久久爽电影 | 嫩草影视91久久| 自拍欧美九色日韩亚洲蝌蚪91| 他把我摸到了高潮在线观看 | 一夜夜www| 777久久人妻少妇嫩草av网站| 成人黄色视频免费在线看| 国产日韩欧美亚洲二区| 正在播放国产对白刺激| 精品少妇黑人巨大在线播放| 亚洲专区字幕在线| 黄片大片在线免费观看| 亚洲少妇的诱惑av| 亚洲欧洲精品一区二区精品久久久| 国产一区二区三区综合在线观看| 欧美人与性动交α欧美软件| 久久精品亚洲av国产电影网| 男女午夜视频在线观看| 国产精品 欧美亚洲| 国产欧美日韩精品亚洲av| 亚洲中文日韩欧美视频| av超薄肉色丝袜交足视频| 欧美日韩亚洲高清精品| 日韩大片免费观看网站| 国产不卡av网站在线观看| 成人精品一区二区免费| 电影成人av| 在线亚洲精品国产二区图片欧美| 欧美成人免费av一区二区三区 | 精品国产一区二区三区久久久樱花| 成年版毛片免费区| 久久精品亚洲av国产电影网| 成人国产一区最新在线观看| 高清av免费在线| 老汉色av国产亚洲站长工具| 老司机亚洲免费影院| 免费人妻精品一区二区三区视频| 男女午夜视频在线观看| 成人18禁高潮啪啪吃奶动态图| 国产一区二区三区在线臀色熟女 | 两性午夜刺激爽爽歪歪视频在线观看 | 在线观看免费视频网站a站| 一级毛片女人18水好多| 满18在线观看网站| 国产高清视频在线播放一区| 成人三级做爰电影| 黄色视频不卡| 激情在线观看视频在线高清 | 少妇猛男粗大的猛烈进出视频| 满18在线观看网站| 老熟妇仑乱视频hdxx| 亚洲综合色网址| 欧美日本中文国产一区发布| 亚洲一区中文字幕在线| av福利片在线| 国产主播在线观看一区二区| 丁香六月欧美| 最近最新免费中文字幕在线| 国产午夜精品久久久久久| 亚洲va日本ⅴa欧美va伊人久久| 欧美精品一区二区免费开放| 亚洲欧美色中文字幕在线| 色视频在线一区二区三区| 18禁美女被吸乳视频| 欧美亚洲日本最大视频资源| av又黄又爽大尺度在线免费看| 十八禁网站免费在线| 757午夜福利合集在线观看| 久久香蕉激情| avwww免费| 99精品在免费线老司机午夜| 国产成人精品无人区| 中文字幕制服av| 多毛熟女@视频| 午夜福利在线免费观看网站| 麻豆乱淫一区二区| 18禁裸乳无遮挡动漫免费视频| 亚洲久久久国产精品| 欧美国产精品va在线观看不卡| 久9热在线精品视频| 搡老岳熟女国产| 窝窝影院91人妻| 亚洲国产欧美一区二区综合| 自线自在国产av| 成人18禁在线播放| 99国产综合亚洲精品| 天堂俺去俺来也www色官网| 最新在线观看一区二区三区| 男女床上黄色一级片免费看| 欧美激情久久久久久爽电影 | 国产不卡一卡二| 一区二区三区国产精品乱码| 国产成人影院久久av| 波多野结衣av一区二区av| 我的亚洲天堂| cao死你这个sao货| 老熟女久久久| 国产精品一区二区在线不卡| 男女之事视频高清在线观看| 在线亚洲精品国产二区图片欧美| 成人18禁在线播放| 久久人妻福利社区极品人妻图片| 蜜桃国产av成人99| 国产成人啪精品午夜网站| 国产精品自产拍在线观看55亚洲 | 99精品欧美一区二区三区四区| 女性被躁到高潮视频| 18禁黄网站禁片午夜丰满| 国产不卡av网站在线观看| 无限看片的www在线观看| 别揉我奶头~嗯~啊~动态视频| 国产av一区二区精品久久| 国产亚洲精品一区二区www | 国产99久久九九免费精品| a级毛片在线看网站| videos熟女内射| 精品国内亚洲2022精品成人 | 免费在线观看黄色视频的| 国产主播在线观看一区二区| 亚洲国产欧美网| 制服诱惑二区| 久久精品国产亚洲av香蕉五月 | 久久久国产欧美日韩av| 日日夜夜操网爽| 最新的欧美精品一区二区| 亚洲第一av免费看| 久久 成人 亚洲| 久久久久国内视频| 日本欧美视频一区| 亚洲av片天天在线观看| 久久午夜亚洲精品久久| 精品人妻在线不人妻| 国产免费视频播放在线视频| 啪啪无遮挡十八禁网站| av天堂在线播放| 精品国内亚洲2022精品成人 | 波多野结衣一区麻豆| 国产精品久久久人人做人人爽|