• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    多維度交叉注意力融合的視聽分割網(wǎng)絡(luò)

    2025-08-03 00:00:00李凡凡張垣垣章永龍朱俊武
    計算機應(yīng)用研究 2025年6期
    關(guān)鍵詞:音頻模態(tài)特征

    doi:10.19734/j.issn.1001-3695.2024.08.0369

    Audio-visual segmentation network with multi-dimensional cross-attention fusion

    LiFanfan,Zhang Yuanyuan,Zhang Yonglong,Zhu Junwu? (School of Information Engineering,Yangzhou University,Yangzhou Jiangsu 2251Oo,China)

    Abstract:Audio-visual segmentation (AVS)aimsto locateandaccuratelysegmentthesoundingobjects inimagesbasedon both visualandauditoryinformation.Whilemostexistingresearch focusesprimarilyonexploring methods foraudio-visualinformationfusio,thereisinsuicientin-depthexplorationoffine-grinedaudio-visualanalysis,particularlyinaligingcontinuousaudiofeatures withspatialpixel-level information.Therefore,thispaperproposedanaudio-visualsegmentationatention fusion(AVSAF)method basedoncontrastive learning.Firstly,themethodusedmulti-ead crossattentionmechanismand memorytokentoconstructaaudio-visualtokenfusionmodule toreducethelossofmulti-modalinformation.Secondlyitintro ducedcontrastivelearning tominimizethediscrepancybetweenaudioandvisualfeatures,enhancing theiralignment.Aduallayerdecoderwasthenemployedtoaccuratelypredictandsegment thetarget’sposition.Finalyitcarredoutalargeumber of experiments on the S4 and MS3 sub-datasets of the AVSBenge-Object dataset.The J -valueisincreasedby3.O4and4.71 percentage pointsrespectively,and the F valueis increased by 2.4 and3.5percentage points respectively,which fully proves the effectiveness of the proposed method in audio-visual segmentation tasks.

    Key words:audio-visual segmentation;multi-modal;contrastive learning;attention mechanism

    0引言

    人類的感知是多維的,包括視覺、聽覺、觸覺、味覺和嗅覺。其中,視覺和聽覺是日常生活中非常重要的感知方式,兩者的結(jié)合幫人類更全面地了解周圍環(huán)境。在數(shù)據(jù)量爆炸性增長以及智能設(shè)備廣泛應(yīng)用的時代下,視聽融合技術(shù)得到了廣泛的發(fā)展。隨著視聽像素級標(biāo)簽的引入,Zhou等人[]提出了新的視聽融合任務(wù),稱為視聽分割(audio-visualsegmentation,AVS)。AVS旨在根據(jù)視頻和音頻實現(xiàn)對環(huán)境中對象和語義信息的準(zhǔn)確分割,使得模型預(yù)測的像素圖與給定的音頻相匹配。例如,在圖1中,AVS可以識別正在啼哭的嬰兒并分割出對應(yīng)的像素區(qū)域。AVS在多個應(yīng)用領(lǐng)域具有重要意義,如視頻音頻編輯和安全監(jiān)控等。

    AVS通過結(jié)合視頻和音頻數(shù)據(jù),從圖像分割的角度挖掘視聽之間的潛在關(guān)系,實現(xiàn)對環(huán)境中對象和語義信息的精確分割。其中,Zhou等人[1提出一種基于時間像素級視聽交互的編碼器解碼器網(wǎng)絡(luò),實現(xiàn)視聽分割的目標(biāo),構(gòu)建了AVSBench-Object數(shù)據(jù)集,不僅提高對環(huán)境信息處理的理解,還為開發(fā)更具智能化的視聽感知系統(tǒng)提供了新的思路和方法。Mao等人[2]提出一種基于對比學(xué)習(xí)的潛在擴散模型用于音視頻分割,進一步提升了音視頻分割任務(wù)的精度,但該模型在融合視覺和聽覺特征時,缺乏對不同模態(tài)間細(xì)微差別的捕捉。Li等人[3]提出了一種視聽組合的時空依賴關(guān)系的融合方法,在捕捉音頻和視覺信號的時間動態(tài)變化和空間布局方面表現(xiàn)出了優(yōu)越性,但在連續(xù)音頻特征與空間像素級信息的對齊上存在挑戰(zhàn)。總之,這些研究在視聽分割領(lǐng)域取得了顯著進展,為更智能的多模態(tài)感知系統(tǒng)發(fā)展奠定了基礎(chǔ)。但是,現(xiàn)有方法仍然面臨著一些挑戰(zhàn),例如在不同維度下不能充分挖掘音頻和視頻線索之間的細(xì)粒度相關(guān)性,并且無法有效對齊連續(xù)音頻特征與空間像素級信息。

    為了解決上述問題,本文提出了一種視聽分割注意力融合方法(audio-visual segmentation attention fusion,AVSAF)。首先,AVSAF模型采用了視/聽覺token融合模塊,與僅依賴簡單特征拼接或加權(quán)融合的方法不同,AVSAF通過引入多頭交叉注意機制和記憶token,能夠動態(tài)捕捉并交互不同模態(tài)之間的關(guān)鍵信息。其次,模型通過對比學(xué)習(xí)策略,利用正負(fù)樣本進行對比訓(xùn)練,實現(xiàn)了連續(xù)音頻特征與空間像素級特征的精細(xì)對齊。與傳統(tǒng)方法相比,這種對比學(xué)習(xí)有效解決了多模態(tài)信息對齊不精確的問題,提升對細(xì)粒度特征的匹配能力。最后,AVSAF引入雙層解碼器結(jié)構(gòu),相比于傳統(tǒng)的單層解碼器,雙層解碼器通過逐層的特征提取與信息融合,增強了模型的泛化能力和對多模態(tài)特征的層次化理解。這種結(jié)構(gòu)設(shè)計使得AVSAF在處理復(fù)雜的音視頻分割任務(wù)時表現(xiàn)出更高的精度與魯棒性。

    1相關(guān)工作

    1.1傳統(tǒng)的視聽融合技術(shù)

    傳統(tǒng)的視聽融合技術(shù)包括視聽對應(yīng)(audio-visualcorre-spondence,AVC)[4\~6]、視聽事件定位(audio-visual event locali-zation,AVEL)[7-9]、視聽視頻解析(audio-visual video parsing,AVVP)[10,11]、聲源定位(sound source localization,SSL)[12\~15]等。例如,SSL任務(wù)是估計聲源在視頻序列中的位置,Chen等人[12]利用挖掘策略和對比學(xué)習(xí)機制來區(qū)分具有挑戰(zhàn)性的圖像片段,提高了在復(fù)雜圖像中區(qū)分聲源的能力。 Hu 等人[14]從混合聲音中執(zhí)行類感知的聲音對象定位,最初集中在從單聲道定位中學(xué)習(xí)健壯的對象表示,解決了從混合聲音中定位不同類別聲音對象的問題。Qian等人[13]在無約束的視頻中定位多個聲源,而不需要兩兩配對的聲音對象注釋。這種方法通過兩階段學(xué)習(xí)框架和跨模態(tài)特征對齊,實現(xiàn)了在無標(biāo)簽的情況下定位多個聲源,提高了在視頻中的聲源定位能力。但是,大多數(shù)研究主要集中在區(qū)域級別的利用或圖像分類上,缺乏對像素級信息的捕捉。

    1.2 對比學(xué)習(xí)

    對比學(xué)習(xí)是一種無監(jiān)督學(xué)習(xí)方法,通過將相似的數(shù)據(jù)樣本在特征空間中拉近、不相似的數(shù)據(jù)樣本推開的方式來學(xué)習(xí)有效的特征表示。這種方法已經(jīng)在計算機視覺、自然語言處理和多模態(tài)數(shù)據(jù)處理等多個領(lǐng)域中取得了顯著的進展。近年來,許多研究者提出了各種基于對比學(xué)習(xí)的方法來解決不同任務(wù)中的多模態(tài)對齊問題。例如,Oord等人[16]首次提出了對比預(yù)測編碼方法(CPC),通過預(yù)測未來時刻的特征表示來學(xué)習(xí)有效的語義表示。這種方法為后續(xù)的對比學(xué)習(xí)研究奠定了基礎(chǔ)。隨后,Chen等人[17]提出了SimCLR方法,這是一種簡單而有效的對比學(xué)習(xí)框架,通過數(shù)據(jù)增強和隨機投影等技術(shù)進一步提升了模型的性能。在視聽分割任務(wù)中,對比學(xué)習(xí)的引人可以有效減少視覺與聽覺特征之間的差異,從而增強模型對多模態(tài)信息的捕捉能力。例如,Mao等人[2將對比學(xué)習(xí)引人到視聽分割中,提出了一種潛在擴散模型,顯著提升了音視頻分割的精度。這些研究為本文提供了寶貴的啟示,并促使本文在模型方面進行創(chuàng)新。

    2方法

    本文提出的AVSAF主要包含音視頻編碼器、視/聽覺token融合模塊(audio-visualtokenfusion,VATF)和雙層解碼器三個關(guān)鍵模塊,總體框架如圖2所示。其中,音視頻編碼器提取視覺和聽覺特征,視/聽覺token融合模塊利用多頭交叉注意力機制,針對性地學(xué)習(xí)跨模態(tài)信息,生成不同階段的融合特征。然后,通過對比學(xué)習(xí)對齊融合特征與音頻特征,有效地減小它們在特征空間中的距離。最后,通過雙層解碼器增強融合特征的表達能力,輸出分割結(jié)果。

    2.1 音視頻編碼器

    音視頻編碼器使用VGGish[18]提取音頻特征,通過PVTv2或 ResNet-50 提取視覺特征。具體而言,首先,將音頻重新采樣為 16kHz 的單聲道音頻 ,其中 Ns 與音頻時長相關(guān)。然后,利用短時傅里葉變換獲得 Mel 頻譜。隨后將其作為VGGish模型的輸人以提取音頻特征 A∈RT×128 ,其中 T 表示幀數(shù)。

    對于視覺特征,首先,視頻通過預(yù)處理提取幀圖像,將幀圖像表示為 xvisual∈RT×3×H×W ,其中 T 表示幀數(shù)。然后,利用視覺骨干網(wǎng)絡(luò)(PVTv2或ResNet-50)提取不同階段的視覺特征 V 其可以表示為

    V={V1,V2,V3,V4}

    其中: i∈{1,2,3,4} H 和 W 分別是幀的

    高度和寬度; Ci 表示第 i 階段的通道數(shù)。特征提取過程如圖2所示。

    2.2視/聽覺token融合模塊

    VATF作為AVSAF的關(guān)鍵組件,模塊結(jié)構(gòu)如圖3所示,利用三個多頭交叉注意力模塊,在不同的注意力頭中學(xué)習(xí)來自視覺和聽覺模態(tài)的多種信息表示,并使用記憶token動態(tài)地選擇最相關(guān)的音頻信息。傳統(tǒng)方法[1-3,19]往往無法有效區(qū)分不同模態(tài)信息的重要性,容易導(dǎo)致特征冗余或信息丟失。而VATF引人記憶token動態(tài)存儲關(guān)鍵的多模態(tài)信息,在訓(xùn)練過程中,逐漸學(xué)習(xí)并記憶音視頻特征中的重要信息,從而避免不必要的計算,并有效降低冗余特征的影響。另外,在處理不同任務(wù)時能夠有針對性地選擇最相關(guān)的模態(tài)信息,從而顯著提升信息處理效率和模型表達能力。

    圖3視/聽覺token融合模塊Fig.3Audio-visual token fusion module

    給定音頻特征 A 和第 i 階段的視覺特征 Vi 。首先,使用兩個獨立的 1×1 卷積層將它們映射到相同的維度空間 Ci 得到聽覺特征 和視覺特征 νi 。然后,將視覺特征 νi 作為鍵 K 和值 V ,音頻特征 作為查詢 ,利用多頭交叉注意力(MHCA)生成具有視覺感知的音頻特征,即

    Fiνa=MHCA(νi,a)=concat([Γattn(xv,xa)Γk]k=1h

    其中: ΔWQ,WK,WV 是可訓(xùn)練的參數(shù)矩陣; d=Ci;h 為多頭注意力機制中頭的數(shù)量; concat(?) 表示將來自 h 個頭的輸出進行拼接。

    其次,為了增強模型的表達能力,引入一組隨機初始化的向量,稱為記憶token。將記憶 和視覺特征 νi 作為MHCA的輸入,生成具有多模態(tài)信息的條件token Fitva ,即

    Fitva=MHCA(MT,F(xiàn)iva

    其中: MT 是記憶token, T 為記憶token的數(shù)量

    接著,視覺特征 νi 充當(dāng)查詢,利用MHCA模塊將 νi 和條件token ?Fitva 作進一步處理,得到具有視覺和聽覺信息的融合特征。最后,通過 1×1 卷積得到第 i 階段融合特征 Fi ,公式如下:

    Fi=conv(MHCA(νi,F(xiàn)itva))

    其中: i={3,4} conv(?) 函數(shù)是卷積函數(shù)。

    2.3 音頻特征對齊

    AVSAF通過引入對比學(xué)習(xí),在特征空間上捕獲連續(xù)音頻與視覺像素級信息之間的細(xì)粒度差異與相似性,使模型在訓(xùn)練過程中能夠區(qū)分相似數(shù)據(jù)的微小差異,并強化跨模態(tài)特征的對齊,從而顯著提升視聽分割的準(zhǔn)確性,確保分割任務(wù)的精度和魯棒性。

    對比學(xué)習(xí)(contrastive learming,CL)[16]面臨的一個主要挑戰(zhàn)是如何構(gòu)建正樣本和負(fù)樣本對,這個過程旨在以無監(jiān)督的方式學(xué)習(xí)一個適合特定任務(wù)的距離函數(shù)。對于AVS任務(wù),

    AVSAF目標(biāo)是學(xué)習(xí)一個合適的距離函數(shù),使得配對的視頻和聲音數(shù)據(jù)應(yīng)該比未配對的數(shù)據(jù)更接近。具體來說,給定融合特征 Fi,F(xiàn)i 與對應(yīng)的音頻特征 xa 的預(yù)測分?jǐn)?shù)應(yīng)該比另一個聲音產(chǎn)生者 的分?jǐn)?shù)高。換句話說,將融合特征 Fi 與對應(yīng)的音頻特征 xa 作為正樣本,小批量中除 xa 以外的音頻特征 定義為負(fù)樣本。在這種情況下,融合特征應(yīng)該具有足夠的判別力來區(qū)分音頻特征?;谏鲜稣?負(fù)樣本,得到的對比損失為

    最后,將多階段損失函數(shù)進行平均,得到最終的對比學(xué)習(xí)損失函數(shù):

    其中: K=2 表示融合特征與音頻特征利用對比學(xué)習(xí)的次數(shù)。

    2.4 雙層FPN解碼器

    在解碼階段,AVSAF模型使用雙層特征金字塔網(wǎng)絡(luò)(fea-turepyramidnetworks,F(xiàn)PN)作為解碼器來生成最終的掩碼。第一層負(fù)責(zé)融合特征的初步提取,并進行上采樣,生成多尺度的特征表示。其中,將 V1,V2 和 {Fi|i∈{3,4}} 融合后的特征作為輸入, {Si|i∈{1,2,3,4}} 作為輸出,并分別傳遞到 1×1 卷積層,以獲得從粗到細(xì)的分割掩碼。第二層采用Panoptic-FPN,具體而言,在第 j 個階段,即 j={2,3,4},S5-j 和最后 S6-j 作為輸入用于解碼過程。解碼的特征被上采樣到下一個階段,最終通過 sigmoid 激活輸出為 M∈RT×H×W 。公式如下:

    M=Δ(P1(S1,P2(S2,P3(S3,P4(S4))))).

    其中: ?Pi(?) 表示第 i 個階段的Panoptic-FPN解碼器; Si 為第 i 層解碼器的輸出特征; Δ(?) 為sigmoid激活函數(shù)。

    AVSAF通過雙層特征金字塔結(jié)構(gòu),分別在不同階段上提取和融合多尺度特征,顯著增強了模型的特征表達能力和多尺度處理能力,提高了目標(biāo)檢測和分割任務(wù)的精度和魯棒性。

    2.5 目標(biāo)函數(shù)

    損失函數(shù)包括分割損失 Lseg 和對比損失 Lcon 兩部分。分割損失是利用交叉熵?fù)p失函數(shù)將預(yù)測的分割圖與真實的標(biāo)簽進行比較。總目標(biāo)函數(shù) L 的計算公式如下:

    L=Lseg+λLcon

    其中: λ 為平衡因子; BCE(?) 為二進制交叉熵?fù)p失函數(shù); M 是預(yù)測的分割圖; Y 是真實的分割圖。

    3實驗

    3.1 評估指標(biāo)

    本文使用 F 分?jǐn)?shù)和Jaccard指數(shù) J 作為評估指標(biāo)。其中, F 分?jǐn)?shù)綜合考慮了查準(zhǔn)率和查全率,用于評估分割結(jié)果的輪廓準(zhǔn)確性;Jaccard指數(shù) J 用于測量區(qū)域相似性,計算預(yù)測分割圖和真實分割圖的交集與并集之比。 F 分?jǐn)?shù)和Jaccard指數(shù) J 的公式如下:

    其中:precision是準(zhǔn)確度;recall是召回率; M 是預(yù)測的分割圖; Y

    是真實的分割圖。

    3.2 數(shù)據(jù)集和實驗設(shè)置

    相關(guān)實驗在AVSBench-object數(shù)據(jù)集[1]進行視聽分割,該數(shù)據(jù)集包含半監(jiān)督單聲源分割(semi-supervised single soundsourcesegmentation,S4)和全監(jiān)督多聲源分割(fully-supervisedmultiple sound source segmentation,MS3)兩個子集。S4子集是具有單個目標(biāo)對象的音頻樣本,包含4932個視頻,其中3452個視頻用于訓(xùn)練,740個視頻用于驗證,740個視頻用于測試。目標(biāo)對象涵蓋23個類別,包括人、動物、車輛和樂器等。MS3子集包括424個視頻,其中286個訓(xùn)練視頻,64個驗證用于視頻,64個視頻用于測試,具有與S4相同的類別。

    使用NVIDIAL2OGPU訓(xùn)練AVSAF模型,批次大小設(shè)置為16,S4訓(xùn)練周期數(shù)(epoch)為25,MS3訓(xùn)練周期為50,記憶token值為150。ResNet-50 和 pyramidvision Transformer(PVT-Δv2 )作為視覺骨干網(wǎng)絡(luò)。視覺骨干網(wǎng)絡(luò)為PVT-v2時,通道大小C= [64,128,320,512];骨干網(wǎng)絡(luò)為ResNet-50時,通道大小

    C=[256,512,1 024,2 048] 。對比損失的溫度系數(shù) τ=0.1 ,總損失函數(shù)的超參數(shù) λ=1 ,評估指標(biāo)的 β2 設(shè)置為0.3。使用Ad-am優(yōu)化器,所有視頻幀的大小都統(tǒng)一為 224×224 。

    3.3 實驗結(jié)果

    AVSAF與AVSBench的分割結(jié)果如圖4所示,AVSAF能夠準(zhǔn)確地分割出鍵盤上的按鍵以及鋼琴鍵(圖4(a)(b)),且成功地分割出正在唱歌的女生(圖4(c))。這表明AVSAF在聲音定位性能方面具有更精準(zhǔn)的分割結(jié)果。本節(jié)從以下兩個方面去評估模型的性能,首先,將AVSAF與聲音定位(SSL)[12,13]、視頻對象分割(VOS)[20,21]和顯著目標(biāo)檢測(SOD)[22,23]等任務(wù)方法作比較,實驗結(jié)果如表1所示?;赟SL的方法與AVSAF之間存在顯著的性能差距,這主要是由于SSL中缺乏像素級標(biāo)簽。此外,由于VOS和SOD是單模態(tài)任務(wù),它們僅考慮視覺信息而忽略了音頻信息,這導(dǎo)致AVSAF在AVSBench-object數(shù)據(jù)集上明顯優(yōu)于VOS和SOD。總之,與相關(guān)任務(wù)方法的比較證實了模型在AVS中的卓越性能。

    表1實驗結(jié)果Tab.1Experimental results /%

    噪聲,增加了多模態(tài)信息對齊的難度,且多聲源情況下的音頻特征更為分散,使得模型難以精準(zhǔn)定位各個聲源的發(fā)聲對象。

    其次,為了充分體現(xiàn)本文方法的可信性,將AVSAF與其他AVS進行了全面比較,其中AVSBench是AVSBench-Object數(shù)據(jù)集的基線方法。為了確保公平性,采用 ResNet-50 或PVT- ?v2 作為提取視覺特征的骨干網(wǎng)絡(luò)。從表1可以看出,在S4數(shù)據(jù)集上,當(dāng)使用PVT σ?v2 作為骨干網(wǎng)絡(luò)時,AVSAF比AVSBench、AVSC、CCLD和CATR的 J 值分別提高了 3.04.0.49.0.40 和0.38百分點, F 值分別提高 2.4,1.8,0.1 和0.7百分點,這表明AVSAF在單聲源場景中表現(xiàn)出更強的目標(biāo)分割能力。在MS3數(shù)據(jù)集上,AVSAF比AVSBench方法的 J 值提高了4.71百分點, F 值提高3.5百分點。但是相比于CATR,AVSAF的性能略低,主要原因是MS3數(shù)據(jù)集包含更復(fù)雜的音頻和背景

    最后,基于PVT- σ?v2 骨干網(wǎng)絡(luò)的模型在不同迭代次數(shù)下的訓(xùn)練結(jié)果曲線如圖5所示,AVSAF相比于AVSBench基線方法 ,Lseg 損失值與 J 值曲線更為平滑。盡管 Lseg 損失值下降程度很接近(圖5(a)),但是整體來看AVSAF方法優(yōu)于基線方法。隨著epoch增大,J值在AVSAF上具有更高的性能。這些結(jié)果表明,AVSAF在視聽分割任務(wù)中具備較強的泛化能力和魯棒性。

    3.4 消融實驗

    本節(jié)通過消融實驗驗證AVSAF主要模塊的有效性,所有消融實驗的視覺骨干網(wǎng)絡(luò)均采用PVT- σ?v2 。

    3.4.1 對比學(xué)習(xí)消融

    表2在沒有對比學(xué)習(xí)的情況下直接訓(xùn)練AVSAF。實驗結(jié)果表明,在S4子集上,無對比學(xué)習(xí)的 J 值為 81.11% , F 值為89.8% 。然而,加入對比學(xué)習(xí)的AVSAF的 J 值提升0.67百分點, F 值提升0.5百分點。在MS3集上,加入對比學(xué)習(xí)使得 J 值提高2.28百分點, F 值提高1.9百分點,這表明了對比學(xué)習(xí)在AVSAF框架中的有效性。對比學(xué)習(xí)的加入使模型更能學(xué)習(xí)到音頻和視頻特征之間的細(xì)微差異和聯(lián)系,并準(zhǔn)確地區(qū)分不同類別的特征。此外,對比學(xué)習(xí)在編碼器-解碼器框架下效果一般,尤其是在有限的計算配置下,這是由于無法構(gòu)建足夠大的正樣本和負(fù)樣本,并且訓(xùn)練的數(shù)據(jù)集有限且分布不全面,無法足夠地學(xué)習(xí)到獨特的特征。

    表2有無對比學(xué)習(xí)的消融實驗

    3.4.2 VATF模塊消融

    為了評估VATF模塊的數(shù)量對模型性能的影響,改變VATF模塊的個數(shù)進行訓(xùn)練,并將結(jié)果顯示在表3中。實驗表明,當(dāng)VATF的數(shù)量為2時,模型性能最佳,一個VATF模塊可能不足以充分融合音頻和視頻特征,而三個VATF模塊可能會導(dǎo)致過度融合,增加模型的復(fù)雜性,進而引入噪聲和冗余信息。這表明了所提多維度融合網(wǎng)絡(luò)在AVSAF任務(wù)中的必要性和有效性。具體來說,在S4數(shù)據(jù)集上,僅使用一個VATF模塊時, J 的性能從 81.78% 下降到 80.90% , F 值從 90.3% 下降到89.7% ;而使用三個VATF模塊時, J 的性能從81. 78% 下降到81.33% F 值從 90.3% 下降到 90.0% 。同時,在MS3數(shù)據(jù)集上,使用兩個VATF模塊的AVSAF性能最好。因此,對于視聽分割任務(wù),使用兩個VATF模塊能夠在特征融合方面取得最佳效果。

    表3VATF模塊的數(shù)量的消融實驗Tab.3The numberofVATFmodulesforablation experiments/%表4不同的token值實驗

    3.4.3token參數(shù)分析

    記憶token的數(shù)量對模型性能的影響如表4所示,本文對不同記憶token值進行了實驗,其中記憶token數(shù)量為{0,100,150,200}。在VLTF中,隨著記憶token數(shù)量的增加,初始時 J 指標(biāo)會上升,當(dāng)token數(shù)量達到150之后 J 指標(biāo)減少。token數(shù)量設(shè)置為150時,可獲得最佳性能。這是因為相關(guān)的音頻特征在AVSBench-object數(shù)據(jù)集中受到了一定的限制,記憶token數(shù)量的增加在一定范圍內(nèi)有助于捕捉更多的特征信息,提高模型的表達能力。然而,當(dāng)token數(shù)量過多時,模型可能會引入過多的冗余信息和噪聲,導(dǎo)致特征融合過程中的干擾增加,反而降低了分割效果。因此,設(shè)置token數(shù)量為150能夠在信息量和特征精度之間達到最佳平衡,獲得最優(yōu)的分割效果。此外,當(dāng)token數(shù)量為0時,模型性能顯著下降,表明記憶token的引入對于有效捕捉和融合多模態(tài)特征至關(guān)重要,缺少記憶token會導(dǎo)致信息表達不足,從而影響分割效果。

    Tab.4Experiment with different token values

    3.5模型參數(shù)和訓(xùn)練時間分析

    模型參數(shù)和訓(xùn)練時間如表5所示,其中包括AVSBench、CATR和AVSAF在使用不同骨干網(wǎng)絡(luò)(ResNet-50和PVT- ?v2 )的參數(shù)大小和訓(xùn)練時間。首先,從參數(shù)大小角度來看,AVSAF模型參數(shù)大小介于AVSBench和CATR之間,既不會因參數(shù)過少而犧牲過多性能,也不會因參數(shù)過多而給計算資源帶來沉重負(fù)擔(dān)。其次,在訓(xùn)練時間方面,AVSAF的訓(xùn)練時間同樣處于AVSBench和CATR之間。雖然AVSAF的訓(xùn)練時間比AVS-Bench長,但能獲得更高的準(zhǔn)確度。盡管CATR的 J 值和 F 值比AVSAF略高,然而其需要更多的訓(xùn)練時間??傊?,AVSAF模型在追求精度的同時,訓(xùn)練效率表現(xiàn)良好。盡管相比AVS-Bench,其參數(shù)量和訓(xùn)練時間有所增加,但相比于CATR的大規(guī)模參數(shù)和超長訓(xùn)練時間,AVSAF的參數(shù)量和訓(xùn)練時間都更加具有優(yōu)勢。

    表5參數(shù)和訓(xùn)練時間Tab.5Parametersand training time

    4結(jié)束語

    為了解決視聽分割中視覺和聽覺特征融合效果不佳的問題,本文提出了基于對比學(xué)習(xí)的視聽分割注意力融合框架。該方法首先使用音視頻編碼器提取視/聽覺特征;其次,利用多個視/聽覺token融合模塊來有效整合像素級的視覺和聽覺特征,不僅提升了特征的表達能力,還加強了跨模態(tài)信息的融合;然后,引入對比學(xué)習(xí)機制進一步增強了視覺和聽覺特征之間的關(guān)聯(lián)性,使得模型能夠更準(zhǔn)確地理解視覺和聽覺信息;隨后,利用雙層FPN解碼器生成特征圖,增強視聽分割任務(wù)的魯棒性,提高模型在不同場景中的性能表現(xiàn);最后,在AVSBench-object數(shù)據(jù)集上進行了模型對比實驗、消融實驗和參數(shù)靈敏性實驗,驗證了AVSAF在視聽分割任務(wù)中的有效性和優(yōu)越性。這些實驗證明了本文框架在處理多模態(tài)數(shù)據(jù)時的準(zhǔn)確性,為視聽融合技術(shù)的進一步發(fā)展提供了有力支持。

    在當(dāng)前的視聽融合模型中,當(dāng)具有相似聽覺特征的對象同時存在于一個幀圖像中時,可能會導(dǎo)致視頻分割結(jié)果的混淆和準(zhǔn)確度下降。尤其是在復(fù)雜環(huán)境中,這種混淆不僅影響模型的分割性能,還可能導(dǎo)致對場景和對象的誤解。為了應(yīng)對這一挑戰(zhàn),筆者計劃在未來的研究中可以精細(xì)化音頻特征預(yù)處理。

    參考文獻:

    [1]Zhou Jinxing,Wang Jianyuan,Zhang Jiayi,et al. Audio-visual segmentation[C]//Proc of European Conference on Computer Vision. Cham:Springer,2022:386-403.

    [2]Mao Yuxin,Zhang Jing,Xiang Mochu,et al.Contrastive conditional latent diffusion for audio-visual segmentation [EB/OL]. (2023-07- 31).https://arxiv.org/abs/2307.16579.

    [3]LiKexin,Yang Zongxin,Chen Lei,etal.CATR:combinatorialdependence audio-queried Transformer for audio-visual video segmntation[C]//Proc of the31st ACM International Conference on Multimedia.NewYork:ACMPress,2023:1485-1494.

    [4]ArandjelovicR,ZissermanA.Look,listen and learn[C]//Proc of IEEEInternational Conferenceon ComputerVision.Piscataway,NJ: IEEEPress,2017:609-617.

    [5]ArandjelovicR,Zisserman A.Objects that sound[C]//Proc of European Conference on Computer Vision.Cham:Springer,2018:435-451.

    [6]AytarY,Vondrick C,Torralba A. SoundNet:learningsound representations from unlabeled video[EB/OL]. (2016-10-27). https:// arxiv.org/abs/1610.09001.

    [7]LinYanbo,LiYJ,WangYF.Dual-modality seq2seq network for audio-visual event localization[C]//Proc of IEEE International Conference on Acoustics,Speech and Signal Processing. Piscataway,NJ: IEEE Press,2019:2002-2006.

    [8]Lin Yanbo,Wang YF.Audiovisual transformer with instance attentionfor audio-visual event localization[C]//Proc of Asian Conference on Computer Vision.Cham:Springer,2021:274-290.

    [9]Duan Bin,Tang Hao,WangWei,et al.Audio-visual event localizationvia recursive fusion by joint co-attention[C]//Proc of IEEE Winter Conference on Applications of Computer Vision. Piscataway, NJ:IEEE Press,2021:4012-4021.

    [10]Lin Yanbo,Tseng HY,LeeHY,et al.Exploring cross-video and cross-modality signals for weakly-supervised audio-visual video parsing [C]//Proc of the 35th International Conference on Neural InformationProcessing Systems. New York:ACM Press,2021:11449-11461.

    [11]Wu Yu,Yang Yi.Exploring heterogeneous clues for weaklysupervised audio-visual video parsing[C]//Proc of IEEE/CVF Conference on Computer Vision and Pattern Recognition.Piscataway, NJ:IEEE Press,2021:1326-1335.

    [12]ChenHonglie,XieWeidi,AfourasT,etal.Localizingvisual sounds thehard way[C]//Proc of IEEE/CVF Conferenceon ComputerVision and Pattern Recognition.Piscataway,NJ:IEEE Press,2021: 16862-16871.

    [13]Qian Rui,Hu Di,Dinkel H,et al. Multiple sound sources localizationfromcoarse tofine[C]//Proc of the16thEuropean Conference on Computer Vision.Cham:Springer,2020:292-308.

    [14]Hu Di,QianRui,Jiang Minyue,etal.Discriminativesounding objectslocalizationvia self-supervised audiovisual matching[C]//Proc of the 34th International Conference on Neural Information Processing Systems.New York:ACM Press,2020:10077-10087.

    [15]陳國良,徐揚,黃曉琴.基于正四棱錐結(jié)構(gòu)的機器人聲源定位系 統(tǒng)研究[J].計算機應(yīng)用研究,2019,36(4):1088-1092.(Chen Guoliang,Xu Yang,Huang Xiaoqin. Sound source localization systemfor robot based on rectangular pyramid structure[J].Application Research of Computers,2019,36(4):1088-1092.)

    [16]Oord A VD,Li Yazhe,Vinyals O.Representation learning with contrastive predictive coding[EB/OL]. (2019-01-22). https://arxiv. org/abs/1807.03748.

    [17]Chen Ting,KornblithS,Norouzi M,et al.A simpleframework for contrastive learning of visual representations[C]//Proc of the 37th International Conference on Machine Learning. New York:ACM Press,2020:1597-1607.

    [18]Hershey S,Chaudhuri S,Elis DPW,etal.CNNarchitectures for large-scale audio classification[C]//Proc of IEEEInternational Conference on Acoustics, Speech and Signal Processing. Piscataway, NJ:IEEEPress,2017:131-135.

    [19]Liu Chen,LiPP,Qi Xingqun,et al.Audio-visual segmentation by exploring cross-modal mutual semantics[C]//Proc of the 31st ACM International Conference on Multimedia. New York:ACM Press, 2023:7590-7598.

    [20]Mahadevan S,Athar A,Osep A,et al.Making a case for 3D convolutions for object segmentation in videos[EB/OL].(2020-08-26). https://arxiv.org/abs/2008.11516.

    [21]Duke B,Ahmed A,Wolf C,et al. SSTVOS:sparse spatiotemporal transformers for video object segmentation[C]//Proc of IEEE/CVF Conference on Computer Vision and Pattern Recognition.Piscataway, NJ:IEEE Press,2021:5908-5917.

    [22]Mao Yuxin,Zhang Jing,Wan Zhexiong,et al.Generative Transformer for accurate and reliable salient object detection[EB/OL].(2021- 04-20).https://arxiv.org/abs/2104.10127.

    [23]Zhang Jing,Xie Jianwen,Barnes N,et al.Learning generative vision Transformerwith energy-based latent space for saliency prediction [C]//Proc of the 35th International Conference on Neural Information Processing Systems.New York:ACM Press,2021:15448-15463.

    猜你喜歡
    音頻模態(tài)特征
    基于VITS的高性能歌聲轉(zhuǎn)換模型
    數(shù)字信號處理課程中濾波器線性相位特性教學(xué)實驗研究
    基于STFT算法的聲光自適應(yīng)映射技術(shù)研究
    在線音頻平臺的盈利模式研究
    如何表達“特征”
    不忠誠的四個特征
    抓住特征巧觀察
    國內(nèi)多模態(tài)教學(xué)研究回顧與展望
    基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識別
    由單個模態(tài)構(gòu)造對稱簡支梁的抗彎剛度
    計算物理(2014年2期)2014-03-11 17:01:39
    成人av一区二区三区在线看 | 国产免费现黄频在线看| 90打野战视频偷拍视频| 久久人妻福利社区极品人妻图片| 亚洲一码二码三码区别大吗| 成年人黄色毛片网站| 五月开心婷婷网| 深夜精品福利| 大陆偷拍与自拍| 国产av精品麻豆| 永久免费av网站大全| 欧美精品一区二区大全| 久久久国产成人免费| 日韩大码丰满熟妇| 女人精品久久久久毛片| 一本综合久久免费| 丁香六月天网| 中文字幕另类日韩欧美亚洲嫩草| 在线av久久热| 大片免费播放器 马上看| 亚洲精品中文字幕在线视频| 久久亚洲国产成人精品v| 精品福利永久在线观看| 欧美日韩福利视频一区二区| 日本猛色少妇xxxxx猛交久久| 男女国产视频网站| 在线观看免费高清a一片| 国产成+人综合+亚洲专区| 久久精品亚洲熟妇少妇任你| 999精品在线视频| 日本五十路高清| 国产淫语在线视频| 日韩,欧美,国产一区二区三区| 日本黄色日本黄色录像| 永久免费av网站大全| 国产av又大| 操美女的视频在线观看| 淫妇啪啪啪对白视频 | 亚洲av片天天在线观看| 五月天丁香电影| 蜜桃国产av成人99| 亚洲伊人色综图| 国产淫语在线视频| 亚洲av日韩精品久久久久久密| 免费高清在线观看日韩| 又大又爽又粗| 女人精品久久久久毛片| 青春草亚洲视频在线观看| 99久久99久久久精品蜜桃| 国产在视频线精品| 另类精品久久| 欧美精品高潮呻吟av久久| 国产精品久久久人人做人人爽| 欧美日本中文国产一区发布| 1024视频免费在线观看| 十八禁人妻一区二区| 90打野战视频偷拍视频| 亚洲成人国产一区在线观看| 老司机靠b影院| 下体分泌物呈黄色| 亚洲国产成人一精品久久久| 考比视频在线观看| 免费观看人在逋| 人成视频在线观看免费观看| 日韩一卡2卡3卡4卡2021年| 日韩一卡2卡3卡4卡2021年| 日韩有码中文字幕| 亚洲精品国产色婷婷电影| 久久国产亚洲av麻豆专区| 岛国在线观看网站| 国产日韩欧美亚洲二区| 日本精品一区二区三区蜜桃| 国产精品久久久久久人妻精品电影 | netflix在线观看网站| 一二三四在线观看免费中文在| 12—13女人毛片做爰片一| 在线观看一区二区三区激情| 国产精品九九99| 大型av网站在线播放| 男女床上黄色一级片免费看| 国产伦人伦偷精品视频| 午夜精品久久久久久毛片777| www.999成人在线观看| 精品人妻1区二区| 国产欧美日韩一区二区三区在线| 国产精品久久久av美女十八| 十八禁网站免费在线| 日韩视频一区二区在线观看| bbb黄色大片| 久久这里只有精品19| 欧美国产精品一级二级三级| 亚洲欧美日韩高清在线视频 | 欧美少妇被猛烈插入视频| 国产男女内射视频| 久久精品亚洲熟妇少妇任你| 亚洲少妇的诱惑av| 欧美激情极品国产一区二区三区| 中文欧美无线码| 在线观看免费午夜福利视频| 老司机午夜福利在线观看视频 | 国产高清videossex| 女人爽到高潮嗷嗷叫在线视频| 又黄又粗又硬又大视频| 在线 av 中文字幕| 丝瓜视频免费看黄片| 精品一区二区三卡| 欧美日韩亚洲综合一区二区三区_| 日本av免费视频播放| 亚洲国产欧美在线一区| 9191精品国产免费久久| 每晚都被弄得嗷嗷叫到高潮| 久久亚洲国产成人精品v| 亚洲av日韩在线播放| 男人操女人黄网站| 搡老乐熟女国产| 一区二区三区乱码不卡18| 丰满饥渴人妻一区二区三| 亚洲欧美色中文字幕在线| 美女高潮到喷水免费观看| 在线观看免费日韩欧美大片| 夫妻午夜视频| 欧美人与性动交α欧美软件| 91成人精品电影| 国产日韩一区二区三区精品不卡| 咕卡用的链子| 国产免费av片在线观看野外av| 欧美精品一区二区大全| 日本av手机在线免费观看| 三上悠亚av全集在线观看| 一个人免费在线观看的高清视频 | 男人爽女人下面视频在线观看| 久久毛片免费看一区二区三区| 国产精品成人在线| 欧美人与性动交α欧美软件| 一本一本久久a久久精品综合妖精| 麻豆国产av国片精品| 丝袜美足系列| 欧美变态另类bdsm刘玥| 欧美日韩福利视频一区二区| 一本久久精品| 欧美黑人精品巨大| 免费在线观看黄色视频的| 欧美日韩国产mv在线观看视频| 国产精品麻豆人妻色哟哟久久| 欧美精品人与动牲交sv欧美| 日日爽夜夜爽网站| 一区二区日韩欧美中文字幕| 三级毛片av免费| 免费日韩欧美在线观看| 在线天堂中文资源库| 国产麻豆69| 老司机亚洲免费影院| 国产精品国产av在线观看| 国产欧美日韩一区二区精品| 久久精品国产综合久久久| 成年动漫av网址| 十八禁人妻一区二区| 国产免费视频播放在线视频| 久久亚洲精品不卡| 国产国语露脸激情在线看| 亚洲专区字幕在线| 99精品欧美一区二区三区四区| 免费在线观看黄色视频的| 国产精品熟女久久久久浪| 国产不卡av网站在线观看| 免费观看a级毛片全部| 久久精品国产综合久久久| 亚洲精品久久成人aⅴ小说| 波多野结衣一区麻豆| 国产亚洲精品一区二区www | 久久精品aⅴ一区二区三区四区| 十八禁人妻一区二区| 中文字幕高清在线视频| 国产免费av片在线观看野外av| 99精品久久久久人妻精品| 欧美乱码精品一区二区三区| 日本精品一区二区三区蜜桃| 国产男女内射视频| 99国产极品粉嫩在线观看| 国产成人精品无人区| 黄色怎么调成土黄色| 亚洲精品一区蜜桃| a级毛片在线看网站| 丁香六月欧美| 国产免费av片在线观看野外av| 精品国产乱码久久久久久小说| 午夜福利影视在线免费观看| 日本精品一区二区三区蜜桃| 亚洲国产中文字幕在线视频| 老熟女久久久| 欧美成狂野欧美在线观看| 亚洲av片天天在线观看| 深夜精品福利| 最新在线观看一区二区三区| 亚洲精品国产区一区二| 99国产精品一区二区蜜桃av | 国产亚洲午夜精品一区二区久久| 黄网站色视频无遮挡免费观看| 国产一区二区三区在线臀色熟女 | 青春草视频在线免费观看| 伊人亚洲综合成人网| 看免费av毛片| 亚洲视频免费观看视频| 久久久久久亚洲精品国产蜜桃av| 999久久久精品免费观看国产| 日韩精品免费视频一区二区三区| 两性夫妻黄色片| av电影中文网址| 亚洲第一青青草原| 欧美一级毛片孕妇| 亚洲专区中文字幕在线| 老鸭窝网址在线观看| 国产av国产精品国产| 久久国产精品男人的天堂亚洲| 波多野结衣一区麻豆| 欧美精品啪啪一区二区三区 | 午夜成年电影在线免费观看| 三上悠亚av全集在线观看| av网站免费在线观看视频| 啦啦啦中文免费视频观看日本| 日韩视频在线欧美| 99热网站在线观看| 欧美成人午夜精品| 亚洲欧美精品自产自拍| 9191精品国产免费久久| 精品视频人人做人人爽| 国产一区二区在线观看av| 日韩 亚洲 欧美在线| 女人久久www免费人成看片| 人妻久久中文字幕网| 啦啦啦啦在线视频资源| av网站免费在线观看视频| 日日摸夜夜添夜夜添小说| 日韩欧美一区视频在线观看| 黄色片一级片一级黄色片| 色婷婷久久久亚洲欧美| 国产精品一区二区在线观看99| 美女扒开内裤让男人捅视频| 一二三四在线观看免费中文在| 在线天堂中文资源库| 在线av久久热| 国产在线一区二区三区精| 免费看十八禁软件| 老司机亚洲免费影院| 国产三级黄色录像| 精品第一国产精品| 男人添女人高潮全过程视频| 色婷婷av一区二区三区视频| 婷婷色av中文字幕| 麻豆av在线久日| 精品国产国语对白av| 免费在线观看完整版高清| 亚洲国产欧美在线一区| 乱人伦中国视频| 成人手机av| 99国产精品一区二区三区| 19禁男女啪啪无遮挡网站| 欧美少妇被猛烈插入视频| 丁香六月天网| 亚洲伊人久久精品综合| 久久久久久久大尺度免费视频| 亚洲av欧美aⅴ国产| 亚洲欧美一区二区三区久久| 精品少妇黑人巨大在线播放| 久久ye,这里只有精品| 精品亚洲成a人片在线观看| 91国产中文字幕| 一边摸一边抽搐一进一出视频| 91成年电影在线观看| 成人影院久久| 少妇被粗大的猛进出69影院| 自拍欧美九色日韩亚洲蝌蚪91| 伊人久久大香线蕉亚洲五| 国产黄色免费在线视频| 手机成人av网站| 91成年电影在线观看| 久久综合国产亚洲精品| 国产精品国产av在线观看| 久久久久视频综合| 黑人巨大精品欧美一区二区蜜桃| 日韩有码中文字幕| 成人av一区二区三区在线看 | 狠狠精品人妻久久久久久综合| 亚洲精华国产精华精| 欧美日韩国产mv在线观看视频| 精品少妇黑人巨大在线播放| 9色porny在线观看| 另类亚洲欧美激情| 国产激情久久老熟女| 人人妻,人人澡人人爽秒播| 亚洲五月婷婷丁香| 日韩一区二区三区影片| 久久精品国产亚洲av高清一级| 99久久综合免费| 美女高潮喷水抽搐中文字幕| 丰满人妻熟妇乱又伦精品不卡| videos熟女内射| 国产欧美日韩一区二区精品| 国产精品久久久久久精品古装| 欧美精品人与动牲交sv欧美| 9热在线视频观看99| 大陆偷拍与自拍| 啦啦啦在线免费观看视频4| 热99久久久久精品小说推荐| av一本久久久久| 亚洲欧美色中文字幕在线| 日韩制服骚丝袜av| 天天躁夜夜躁狠狠躁躁| 国产欧美日韩综合在线一区二区| 老熟妇仑乱视频hdxx| 久久久久国内视频| 国产精品1区2区在线观看. | 美女中出高潮动态图| 亚洲伊人久久精品综合| av天堂在线播放| 久久久久国内视频| 精品少妇一区二区三区视频日本电影| 午夜福利在线观看吧| 精品卡一卡二卡四卡免费| 19禁男女啪啪无遮挡网站| 黄片播放在线免费| 亚洲,欧美精品.| 午夜久久久在线观看| 巨乳人妻的诱惑在线观看| 极品人妻少妇av视频| 狠狠精品人妻久久久久久综合| 制服诱惑二区| 亚洲国产欧美日韩在线播放| 制服诱惑二区| 12—13女人毛片做爰片一| 汤姆久久久久久久影院中文字幕| 人妻人人澡人人爽人人| 亚洲成人国产一区在线观看| 国产麻豆69| 午夜日韩欧美国产| 亚洲精品一区蜜桃| 欧美午夜高清在线| 国产av又大| 精品久久久精品久久久| 欧美变态另类bdsm刘玥| 欧美少妇被猛烈插入视频| 国产精品香港三级国产av潘金莲| 777米奇影视久久| 丝袜喷水一区| 一本色道久久久久久精品综合| 日韩制服丝袜自拍偷拍| 人人妻人人澡人人看| 午夜精品国产一区二区电影| 99香蕉大伊视频| 啦啦啦啦在线视频资源| 亚洲天堂av无毛| 不卡一级毛片| 制服诱惑二区| 中文字幕制服av| 国产一区二区三区av在线| 久久人人爽人人片av| 老鸭窝网址在线观看| 下体分泌物呈黄色| 亚洲一区二区三区欧美精品| 免费在线观看视频国产中文字幕亚洲 | 大码成人一级视频| 高潮久久久久久久久久久不卡| 日本五十路高清| 国产av又大| 不卡av一区二区三区| 精品人妻在线不人妻| 久久这里只有精品19| 999精品在线视频| 亚洲av欧美aⅴ国产| 99九九在线精品视频| 在线天堂中文资源库| 亚洲情色 制服丝袜| 国产在线观看jvid| 99久久国产精品久久久| 日韩中文字幕视频在线看片| 夜夜夜夜夜久久久久| 麻豆乱淫一区二区| 亚洲国产日韩一区二区| 午夜激情久久久久久久| 曰老女人黄片| 日韩三级视频一区二区三区| 久久久久国产一级毛片高清牌| 亚洲专区中文字幕在线| 日韩人妻精品一区2区三区| 亚洲 欧美一区二区三区| 天天影视国产精品| 久久九九热精品免费| 精品国内亚洲2022精品成人 | 亚洲久久久国产精品| 一本—道久久a久久精品蜜桃钙片| 曰老女人黄片| 五月开心婷婷网| 美女扒开内裤让男人捅视频| 999久久久精品免费观看国产| 满18在线观看网站| 久久久久久久精品精品| 午夜免费成人在线视频| 汤姆久久久久久久影院中文字幕| 一本综合久久免费| 99国产精品免费福利视频| 中文精品一卡2卡3卡4更新| 国产高清视频在线播放一区 | 日韩中文字幕欧美一区二区| 狠狠婷婷综合久久久久久88av| 制服人妻中文乱码| 久久精品国产a三级三级三级| 永久免费av网站大全| 亚洲欧美日韩高清在线视频 | 成年动漫av网址| 亚洲免费av在线视频| 国产高清视频在线播放一区 | 超碰成人久久| 人妻一区二区av| 国产成人免费观看mmmm| av免费在线观看网站| a级毛片在线看网站| 亚洲熟女毛片儿| 亚洲精品久久久久久婷婷小说| 国产无遮挡羞羞视频在线观看| 如日韩欧美国产精品一区二区三区| 美女国产高潮福利片在线看| 99国产精品免费福利视频| 十分钟在线观看高清视频www| 老司机在亚洲福利影院| 亚洲人成77777在线视频| 啦啦啦中文免费视频观看日本| 亚洲成人国产一区在线观看| 免费av中文字幕在线| 国产xxxxx性猛交| 成人国语在线视频| 日韩制服丝袜自拍偷拍| 午夜老司机福利片| 丝袜在线中文字幕| 青草久久国产| 久热爱精品视频在线9| 美女高潮到喷水免费观看| 制服人妻中文乱码| av视频免费观看在线观看| av网站在线播放免费| 国产又爽黄色视频| 操美女的视频在线观看| 亚洲专区中文字幕在线| 久9热在线精品视频| 午夜福利视频精品| 国产一区有黄有色的免费视频| 久久天躁狠狠躁夜夜2o2o| 日韩欧美一区二区三区在线观看 | 51午夜福利影视在线观看| 久久99热这里只频精品6学生| 午夜福利一区二区在线看| 国产成人免费观看mmmm| 国产视频一区二区在线看| 亚洲人成77777在线视频| xxxhd国产人妻xxx| 一区二区日韩欧美中文字幕| 爱豆传媒免费全集在线观看| 欧美日韩黄片免| 麻豆av在线久日| 色老头精品视频在线观看| 男女之事视频高清在线观看| 丰满少妇做爰视频| 久久久国产精品麻豆| 我的亚洲天堂| 久久天堂一区二区三区四区| 日韩大片免费观看网站| av天堂在线播放| 亚洲国产av新网站| 欧美 日韩 精品 国产| 亚洲美女黄色视频免费看| 国产精品国产三级国产专区5o| 亚洲精品日韩在线中文字幕| 亚洲精品一卡2卡三卡4卡5卡 | svipshipincom国产片| 青春草视频在线免费观看| 两人在一起打扑克的视频| 十八禁高潮呻吟视频| 99精品久久久久人妻精品| 黄网站色视频无遮挡免费观看| 最新的欧美精品一区二区| av免费在线观看网站| 欧美在线一区亚洲| 一本久久精品| 国产精品.久久久| 国产成人av激情在线播放| 午夜福利乱码中文字幕| 国产欧美日韩一区二区精品| 亚洲五月色婷婷综合| 亚洲七黄色美女视频| 中文字幕高清在线视频| 久久久水蜜桃国产精品网| 国产日韩一区二区三区精品不卡| 精品一品国产午夜福利视频| 久久久久视频综合| 丝袜喷水一区| 一本—道久久a久久精品蜜桃钙片| av在线app专区| 色精品久久人妻99蜜桃| 曰老女人黄片| 天天操日日干夜夜撸| 亚洲午夜精品一区,二区,三区| 最近最新中文字幕大全免费视频| 一本综合久久免费| 久久中文字幕一级| 国产在视频线精品| 国产亚洲精品久久久久5区| 两性午夜刺激爽爽歪歪视频在线观看 | 成年人午夜在线观看视频| 男女免费视频国产| 岛国在线观看网站| 久久精品国产亚洲av高清一级| 久久精品亚洲熟妇少妇任你| 中文字幕人妻丝袜制服| 国产成+人综合+亚洲专区| 久久中文字幕一级| 亚洲va日本ⅴa欧美va伊人久久 | 久久久国产一区二区| 精品一品国产午夜福利视频| 高潮久久久久久久久久久不卡| 久久人妻福利社区极品人妻图片| a 毛片基地| 精品国产乱码久久久久久小说| 欧美av亚洲av综合av国产av| 精品一区二区三区av网在线观看 | 免费高清在线观看视频在线观看| 欧美+亚洲+日韩+国产| 成人三级做爰电影| 国产欧美亚洲国产| 岛国在线观看网站| 精品熟女少妇八av免费久了| 日韩视频在线欧美| 黄色怎么调成土黄色| 亚洲欧美精品自产自拍| 老司机靠b影院| 亚洲综合色网址| 在线精品无人区一区二区三| 两性午夜刺激爽爽歪歪视频在线观看 | 日本vs欧美在线观看视频| 国产精品久久久人人做人人爽| 啦啦啦视频在线资源免费观看| 少妇裸体淫交视频免费看高清 | 亚洲av国产av综合av卡| 亚洲av成人不卡在线观看播放网 | 国产精品九九99| 五月天丁香电影| 日本av免费视频播放| 亚洲第一av免费看| 高潮久久久久久久久久久不卡| 欧美xxⅹ黑人| 久久久久久久大尺度免费视频| 日韩大片免费观看网站| 91精品三级在线观看| 欧美精品啪啪一区二区三区 | 黄网站色视频无遮挡免费观看| 十分钟在线观看高清视频www| 久久av网站| 不卡av一区二区三区| 久久久国产成人免费| 精品视频人人做人人爽| 国产成人a∨麻豆精品| 亚洲av国产av综合av卡| 精品亚洲成国产av| 9色porny在线观看| 亚洲av日韩在线播放| 久久久久久久国产电影| 精品一区在线观看国产| 国内毛片毛片毛片毛片毛片| 蜜桃国产av成人99| 精品欧美一区二区三区在线| 国产欧美日韩精品亚洲av| 五月天丁香电影| 国产国语露脸激情在线看| 午夜福利乱码中文字幕| 黑人操中国人逼视频| 中文欧美无线码| 国产一区有黄有色的免费视频| 啦啦啦中文免费视频观看日本| 美女大奶头黄色视频| 日本五十路高清| 精品一区二区三区av网在线观看 | 麻豆国产av国片精品| 久久亚洲精品不卡| 咕卡用的链子| 男人操女人黄网站| 日韩电影二区| 在线观看免费高清a一片| 国产黄色免费在线视频| 日本五十路高清| 色视频在线一区二区三区| 交换朋友夫妻互换小说| av天堂在线播放| 午夜免费鲁丝| 日韩人妻精品一区2区三区| 精品亚洲成a人片在线观看| 久久国产精品人妻蜜桃| 免费观看av网站的网址| 每晚都被弄得嗷嗷叫到高潮| 亚洲avbb在线观看| 高清视频免费观看一区二区| 色播在线永久视频| 欧美在线一区亚洲| 一级毛片精品| 无遮挡黄片免费观看| bbb黄色大片| 亚洲第一av免费看| 久久久久精品国产欧美久久久 | 亚洲激情五月婷婷啪啪| 成人av一区二区三区在线看 | 热re99久久精品国产66热6| 最近最新免费中文字幕在线| 久久国产精品影院| 69精品国产乱码久久久| 巨乳人妻的诱惑在线观看| 两个人看的免费小视频| 成人亚洲精品一区在线观看| 大片免费播放器 马上看|