• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于外部知識(shí)的視覺(jué)問(wèn)答研究

    2023-06-25 18:49:32賈少杰王雷
    電腦知識(shí)與技術(shù) 2023年13期

    賈少杰 王雷

    摘要:視覺(jué)問(wèn)答(Visual Question Answering, VQA) 是當(dāng)前融合計(jì)算機(jī)視覺(jué)領(lǐng)域和自然語(yǔ)言處理領(lǐng)域的典型多模態(tài)問(wèn)題之一,而基于知識(shí)的視覺(jué)問(wèn)題回答任務(wù)要求模型具有關(guān)聯(lián)外部知識(shí)的能力,文章采用多模態(tài)數(shù)據(jù)集當(dāng)作外部知識(shí)源,相比從文本知識(shí)庫(kù)中提取單模態(tài)的文本語(yǔ)義,多模態(tài)數(shù)據(jù)集能夠提供視覺(jué)問(wèn)答所需要的多模態(tài)知識(shí),能夠更好地利用圖像中所蘊(yùn)含的知識(shí),并將其應(yīng)用到針對(duì)圖像中問(wèn)題的回答中。同時(shí),為了能夠更輕量級(jí)地進(jìn)行學(xué)習(xí),在問(wèn)題文本中添加并訓(xùn)練了一個(gè)前綴prompt,并且凍結(jié)了部分的預(yù)訓(xùn)練模型參數(shù),通過(guò)采用預(yù)訓(xùn)練和微調(diào)指定未凍結(jié)參數(shù)的學(xué)習(xí)策略,逐步積累了基礎(chǔ)的多模態(tài)知識(shí),用于進(jìn)行答案的推理。最后,經(jīng)實(shí)驗(yàn)結(jié)果證明,文章模型在凍結(jié)預(yù)訓(xùn)練模型中的大部分參數(shù)后,在VQA-V2實(shí)驗(yàn)數(shù)據(jù)集中也具有較好的表現(xiàn),同時(shí)在獲取到VQA-V2中的多模態(tài)外部知識(shí)后,在需要進(jìn)行推理的數(shù)據(jù)集OK-VQA數(shù)據(jù)集上也取得了令人滿意的結(jié)果,擁有較高的準(zhǔn)確率。

    關(guān)鍵詞:視覺(jué)問(wèn)答;prompt tuning;多模態(tài)預(yù)訓(xùn)練模型

    中圖分類號(hào):TP18? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

    文章編號(hào):1009-3044(2023)13-0015-04

    開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)

    1 視覺(jué)問(wèn)答研究的相關(guān)基礎(chǔ)

    1.1 視覺(jué)問(wèn)答的概述

    多模態(tài)視覺(jué)問(wèn)答作為計(jì)算機(jī)視覺(jué)與自然語(yǔ)言處理的一個(gè)交叉領(lǐng)域,近年來(lái)受到學(xué)術(shù)界多方關(guān)注,主要任務(wù)是通過(guò)給定一幅圖像以及關(guān)于該圖像的一個(gè)開(kāi)放的用自然語(yǔ)言描述的問(wèn)題,借助問(wèn)題和圖像中的內(nèi)容推斷出正確的答案,傳統(tǒng)的方法是首先將兩種模態(tài)的數(shù)據(jù)分別進(jìn)行嵌入表示,之后通過(guò)特征融合的方法對(duì)不同模態(tài)的數(shù)據(jù)進(jìn)行建模,在獲取到每個(gè)模態(tài)單獨(dú)的特征表示之后進(jìn)行視覺(jué)問(wèn)答最重要的特征融合工作,目的是將特征空間不同的各模態(tài)特征拉入同一個(gè)特征空間中,經(jīng)過(guò)融合后的特征向量使用不同的目標(biāo)函數(shù)約束可以得到不同的結(jié)果輸出,目前的視覺(jué)問(wèn)答為了方便進(jìn)行精準(zhǔn)度的計(jì)算,普遍采用分類形式的答案,生成式的答案不利于指標(biāo)評(píng)估。

    視覺(jué)問(wèn)答的關(guān)鍵在于不同模態(tài)之間的特征融合,特征融合根據(jù)階段的不同可以分為早期融合與晚期融合、混合融合等,早期融合指在各模態(tài)提取特征后立刻進(jìn)行融合,晚期融合指分別訓(xùn)練各模態(tài)的模型之后將模型輸出進(jìn)行融合。早期的特征融合常采用基礎(chǔ)的向量運(yùn)算,這種處理方法邏輯簡(jiǎn)單、計(jì)算量較小,但最終并不能在復(fù)雜的多模態(tài)數(shù)據(jù)環(huán)境下取得很好的融合結(jié)果。

    目前,常用于特征融合的多模態(tài)預(yù)訓(xùn)練模型多采用Transformer 機(jī)制,通過(guò)對(duì)大量的無(wú)標(biāo)簽多模態(tài)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,然后在具體任務(wù)中使用少量的標(biāo)注數(shù)據(jù)來(lái)進(jìn)行微調(diào),然而使用Transformer 機(jī)制計(jì)算量與代價(jià)都很大,如何能夠減少訓(xùn)練參數(shù),實(shí)現(xiàn)更輕量級(jí)的訓(xùn)練方法也是目前的一大研究熱點(diǎn)。

    針對(duì)需要外部知識(shí)的視覺(jué)問(wèn)答,此類問(wèn)答不只單純提問(wèn)圖像中的內(nèi)容,如圖1所示,圖中左側(cè)的問(wèn)題提問(wèn)金發(fā)的發(fā)型叫什么,只根據(jù)圖中的信息而不知道發(fā)型種類的話是無(wú)法推斷出是馬尾發(fā)型的。最近的大多數(shù)相關(guān)工作都基于知識(shí)庫(kù)檢索的方法,此類方法首先從龐大的外部文本知識(shí)庫(kù)中檢索相關(guān)事實(shí),然后對(duì)知識(shí)圖進(jìn)行顯式推理[1-2]。

    受Ding[3]等人提出的Mukea模型的啟發(fā),針對(duì)需要外部知識(shí)進(jìn)行視覺(jué)問(wèn)答的數(shù)據(jù)集OK-VQA,通過(guò)在知識(shí)庫(kù)中查詢的方法沒(méi)有能夠很好地利用多模態(tài)的外部數(shù)據(jù),而只是利用了知識(shí)庫(kù)中的文本知識(shí),這在多模態(tài)問(wèn)答中略顯不足,通過(guò)在大規(guī)模的視覺(jué)問(wèn)答數(shù)據(jù)集VQA-V2中對(duì)預(yù)訓(xùn)練模型以及模型參數(shù)進(jìn)行粗調(diào),能夠很好地提取到外部的多模態(tài)知識(shí)。

    1.2 Prompt在視覺(jué)問(wèn)答領(lǐng)域的應(yīng)用

    Prompt中文譯作提示,是一種幫助計(jì)算機(jī)解決視覺(jué)問(wèn)答中關(guān)鍵問(wèn)題的提示內(nèi)容,此前在NLP領(lǐng)域中微調(diào)prompt取得了不錯(cuò)的成績(jī),prompt一般分為兩種:人工設(shè)計(jì)的prompt以及連續(xù)的prompt, 人工設(shè)計(jì)prompt的方法通過(guò)人工設(shè)計(jì)的prompt需要額外的知識(shí)以及專家的經(jīng)驗(yàn)來(lái)設(shè)計(jì),整個(gè)設(shè)計(jì)過(guò)程耗時(shí)耗力,可能會(huì)取得很好的結(jié)果但是不具有可遷移性。而連續(xù)類的可學(xué)習(xí)的prompt,需要考慮初始化、向量的長(zhǎng)度等設(shè)置,這些設(shè)置可以在不斷的實(shí)驗(yàn)過(guò)程中根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行調(diào)整,在NLP領(lǐng)域中的prompt-tuning和prefix-tuning[4]就是典型的連續(xù)類prompt的例子。

    Prompt在多模態(tài)領(lǐng)域的使用主要目的有兩個(gè),一是將預(yù)訓(xùn)練模型更接近下游任務(wù),二是進(jìn)行更加輕量級(jí)的訓(xùn)練,通過(guò)凍結(jié)預(yù)訓(xùn)練模型的參數(shù)來(lái)降低訓(xùn)練量,如Frozen模型[5],本文的方法主要側(cè)重prompt在輕量級(jí)訓(xùn)練中的應(yīng)用,在后續(xù)的內(nèi)容中會(huì)介紹凍結(jié)預(yù)訓(xùn)練參數(shù)進(jìn)行訓(xùn)練的訓(xùn)練方法。

    2 視覺(jué)問(wèn)答模型研究

    問(wèn)答系統(tǒng)流程的研究,本文將其分為以下幾個(gè)部分進(jìn)行介紹(整體流程如圖2所示),首先介紹模型的兩種模態(tài)數(shù)據(jù)輸入處理,然后介紹預(yù)訓(xùn)練模型的處理,第三部分介紹答案預(yù)測(cè)部分,最后介紹粗調(diào)和精調(diào)的訓(xùn)練思路。

    2.1 模型輸入

    模型的輸入是一張圖片以及一條涉及圖片內(nèi)容的問(wèn)句,第一步就是對(duì)兩種模態(tài)數(shù)據(jù)的特征提取,針對(duì)圖像可以提取出多個(gè)目標(biāo)區(qū)域的位置向量以及語(yǔ)義向量,通過(guò)Faster-rcnn[6]獲取圖片中不同主體的特征表示,每張圖片選擇36個(gè)特征,通過(guò)Faster-rcnn后的圖片特征表示為一個(gè)2 048維的向量fi ∈ Rdf (df = 2 048),位置信息則表示為一個(gè)四維向量bi∈Rdb(db = 4)。

    針對(duì)問(wèn)題文本的嵌入表示,使用了預(yù)訓(xùn)練模型lxmert中的LxmertTokenizer,該tokenizer與bert中的tokenizer用法相同,都是基于WordPiece[7]的嵌入方法,問(wèn)句經(jīng)過(guò)該嵌入方法后被表示為多個(gè)token組成的序列qi。

    考慮到多模態(tài)預(yù)訓(xùn)練模型在多模態(tài)信息的融合方面能力強(qiáng)大,采用lxmert預(yù)訓(xùn)練模型進(jìn)行多模態(tài)內(nèi)部以及模態(tài)之間的信息建模。將fi、di以及問(wèn)題文本的嵌入表示qi一同輸入經(jīng)過(guò)參數(shù)凍結(jié)的預(yù)訓(xùn)練模型lxmert中,就能得到問(wèn)題向量Q和視覺(jué)向量V以及一個(gè)多模態(tài)融合向量cls,其中Q和V∈Rdv(dv=768)。

    2.2 預(yù)訓(xùn)練模型處理

    Lxmert模型[8]作為典型的雙流預(yù)訓(xùn)練模型,首先在單模態(tài)內(nèi)進(jìn)行自注意力編碼,然后設(shè)計(jì)了跨模態(tài)的注意力來(lái)學(xué)習(xí)跨模態(tài)信息,以及進(jìn)行跨模態(tài)特征融合,筆者設(shè)計(jì)的Frozen模型,凍結(jié)了預(yù)訓(xùn)練模型lxmert中的大部分參數(shù),根據(jù)不同的方法凍結(jié)不同的參數(shù)進(jìn)行試驗(yàn),在進(jìn)行prompt訓(xùn)練的過(guò)程中,凍結(jié)了預(yù)訓(xùn)練模型中除視覺(jué)encoder之外的全部參數(shù),整個(gè)粗調(diào)過(guò)程只更新預(yù)訓(xùn)練中的視覺(jué)encoder以及后續(xù)的相似度矩陣和全連接等參數(shù),參數(shù)凍結(jié)部分如圖3所示,圖中的雪花標(biāo)識(shí)代表該部分參數(shù)已被凍結(jié)。

    通過(guò)只更新視覺(jué)encoder來(lái)進(jìn)行訓(xùn)練,這種訓(xùn)練的目的是使用更少的訓(xùn)練參數(shù),避免對(duì)數(shù)據(jù)量較大的預(yù)訓(xùn)練模型進(jìn)行大規(guī)模的參數(shù)更新。同時(shí),將vision encoder的參數(shù)激活的目的是將圖片特征的嵌入表示拉到文本的特征空間中,減少不同模態(tài)數(shù)據(jù)表示空間之間的差異。

    除此之外,筆者嘗試進(jìn)行了prefix前綴訓(xùn)練方法,在問(wèn)題文本的嵌入表示向量之前,添加了一段與文本向量維度相同的prefix,在粗調(diào)和精調(diào)的階段凍結(jié)全部的預(yù)訓(xùn)練模型的參數(shù),只訓(xùn)練prefix中的參數(shù)以及預(yù)訓(xùn)練后的線性層中的參數(shù)。

    2.3 答案預(yù)測(cè)

    在獲取到預(yù)訓(xùn)練模型的輸出之后,為了能夠更好地縮小圖片特征與文本特征之間的差距,將圖片特征與多模態(tài)關(guān)系特征進(jìn)行融合,多模態(tài)輸出cls起到將視覺(jué)特征拉入文本特征空間的作用。同時(shí),為了衡量圖片中的對(duì)象與問(wèn)題中的每個(gè)詞項(xiàng)的相關(guān)關(guān)系,使用了一個(gè)相似度關(guān)聯(lián)矩陣M,圖中對(duì)象與問(wèn)題詞項(xiàng)相似度越高,則被后續(xù)過(guò)程選擇中的概率越大,然后再與問(wèn)題詞項(xiàng)進(jìn)行相似度計(jì)算,選取相似度最高的融合特征。

    [M = (W1Q)T(W2(V+cls))]

    選取到與問(wèn)題最相關(guān)的融合特征后,經(jīng)過(guò)一個(gè)激活函數(shù)softmax以及top k來(lái)選取到與問(wèn)題文本相似度最高的融合特征,選取到的特征經(jīng)過(guò)一個(gè)全連接層,輸出維度為數(shù)據(jù)集答案詞典維度,通過(guò)在查找表中查找出最終答案,在損失函數(shù)的選擇方面,參考Mukea模型的損失函數(shù)選擇,受傳統(tǒng)知識(shí)圖領(lǐng)域中的知識(shí)嵌入方法TransE的啟發(fā),在多模態(tài)場(chǎng)景中應(yīng)用了類似TransE的目標(biāo)損失函數(shù)來(lái)作為參數(shù)反向傳播的依據(jù)。

    [LTransE =? ∑t+∈A+ ∑t?∈A? [γ+d(v+cls, t+)?d(v+cls, t?)]]

    其中v+cls代表與多模態(tài)關(guān)系融合后的圖中目標(biāo)向量,A+代表預(yù)測(cè)正確的答案,A-代表錯(cuò)誤的答案,這個(gè)損失函數(shù)的目的是使融合后的圖中目標(biāo)向量能夠更加接近正確的答案,與正確答案之間的transe距離變小。

    2.4 粗調(diào)和精調(diào)

    粗調(diào)和精調(diào)的整個(gè)流程即為上述的步驟,但是不同之處在于粗調(diào)是在大規(guī)模的多模態(tài)視覺(jué)問(wèn)答數(shù)據(jù)集VQA-V2上進(jìn)行操作的,好處在于VQA-V2的數(shù)據(jù)規(guī)模相較目標(biāo)數(shù)據(jù)集更大,雖然不及外部知識(shí)庫(kù)中的開(kāi)放領(lǐng)域的文本知識(shí)量,但是具備豐富的多模態(tài)外部知識(shí),能夠解決文本知識(shí)模態(tài)單一,與圖片模態(tài)特征空間差距較大的問(wèn)題。在進(jìn)行粗調(diào)之前,去除VQA-V2中的yes/no類問(wèn)題以及計(jì)數(shù)類問(wèn)題,只保留包含外部知識(shí)的開(kāi)放類問(wèn)答對(duì),這樣操作的目的在于去除掉不包含外部知識(shí)的訓(xùn)練數(shù)據(jù),減少對(duì)預(yù)訓(xùn)練模型的干擾。

    精調(diào)則是在目標(biāo)數(shù)據(jù)集上再一次進(jìn)行微調(diào),經(jīng)過(guò)粗調(diào)后的模型已經(jīng)獲得了豐富的外部知識(shí),可以針對(duì)某些特定的數(shù)據(jù)集進(jìn)行微調(diào),OK-VQA數(shù)據(jù)集中包含的問(wèn)答是經(jīng)過(guò)人工篩選的,能夠騙過(guò)基礎(chǔ)模型的復(fù)雜問(wèn)題,只通過(guò)圖片中的信息無(wú)法推斷出答案,需要借助一些外部的知識(shí)。在針對(duì)該數(shù)據(jù)集進(jìn)行精調(diào)時(shí),該數(shù)據(jù)集的數(shù)據(jù)量比起VQA-V2數(shù)據(jù)集要小很多,所需的計(jì)算資源也相對(duì)較少,考慮在精調(diào)時(shí),放開(kāi)在粗調(diào)時(shí)固定的參數(shù),以此取得更好的準(zhǔn)確度。其中粗調(diào)與精調(diào)的兩個(gè)步驟均包含在下述的實(shí)驗(yàn)中,包括完整的實(shí)驗(yàn)?zāi)P鸵约搬槍?duì)輕量級(jí)學(xué)習(xí)的prompt和prefix微調(diào)的實(shí)驗(yàn)。

    3 實(shí)驗(yàn)結(jié)果及分析

    為了驗(yàn)證視覺(jué)問(wèn)答模型的可行性,本文利用VAQ-V2以及OK-VQA數(shù)據(jù)集進(jìn)行相應(yīng)的實(shí)驗(yàn),同時(shí)針對(duì)不同的微調(diào)方法進(jìn)行了相應(yīng)的對(duì)比和測(cè)試,證明了該模型的有效性。

    3.1 數(shù)據(jù)集介紹

    VQA-V2[9]數(shù)據(jù)集 全稱 Visual Question Answering (v2.0),是一個(gè)人工標(biāo)注的、關(guān)于圖像的開(kāi)放式問(wèn)答數(shù)據(jù)集?;卮疬@些問(wèn)題,需要對(duì)圖像、語(yǔ)言以及常識(shí)都具備一定的理解力,在VQA-V2數(shù)據(jù)集中,針對(duì)每一幅圖像通常準(zhǔn)備了三個(gè)問(wèn)題,針對(duì)每個(gè)問(wèn)題有10個(gè)正確的答案。

    OK-VQA[10]數(shù)據(jù)集中的圖像數(shù)據(jù)來(lái)自COCO數(shù)據(jù)集,共計(jì)約8萬(wàn)張訓(xùn)練圖像以及4萬(wàn)張測(cè)試圖像。經(jīng)過(guò)兩輪的人工篩選,剔除掉了直觀上可以回答的簡(jiǎn)單問(wèn)題,原本86 700個(gè)問(wèn)題最終篩選到34 921個(gè)問(wèn)題。針對(duì)s數(shù)據(jù)集中的偏見(jiàn)問(wèn)題,作者刪除掉了相同答案頻率超過(guò)五次的問(wèn)答對(duì),剩余問(wèn)答對(duì)共計(jì)14 055道,包括9 009道訓(xùn)練題和5 046道測(cè)試題。此外,在OK-VQA數(shù)據(jù)集上的模型準(zhǔn)確率要遠(yuǎn)低于VQA-V2等直觀問(wèn)答數(shù)據(jù)集,因?yàn)樵摂?shù)據(jù)集需要外部知識(shí)進(jìn)行聯(lián)合推理。

    3.2 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置

    本文的實(shí)驗(yàn)環(huán)境選擇采用Windows操作系統(tǒng)和英偉達(dá)Tesla P100顯卡,深度學(xué)習(xí)框架采用PyTorch,以此對(duì)基于深度學(xué)習(xí)框架進(jìn)行實(shí)驗(yàn),并利用Python語(yǔ)言對(duì)其進(jìn)行編程。

    參數(shù)設(shè)置方面:batch size設(shè)置為256,優(yōu)化器選擇了adam優(yōu)化器,學(xué)習(xí)率為1e-4,訓(xùn)練過(guò)程進(jìn)行200個(gè)epoch,得到最終的實(shí)驗(yàn)數(shù)據(jù)。

    3.3 結(jié)果分析

    表1為OK-VQA數(shù)據(jù)集上不同方法的最終結(jié)果,表2為一部分的消融實(shí)驗(yàn)以及兩種凍結(jié)參數(shù)的微調(diào)方法的最終結(jié)果。

    如表1所示,完整模型在上述的實(shí)驗(yàn)環(huán)境與參數(shù)設(shè)置下的準(zhǔn)確度達(dá)到了41.01,好于OK-VQA論文中提及的基準(zhǔn)方法MUTAN+AN等,雖然VQA-V2的外部知識(shí)遠(yuǎn)沒(méi)有維基百科和conceptnet中的文本知識(shí)豐富,但是模型依然取得了不錯(cuò)的準(zhǔn)確度,證明了模型引入多模態(tài)外部知識(shí)的有效性。

    以下是關(guān)于表2的分析:

    方法2的結(jié)果為在VQA-V2進(jìn)行粗調(diào)之后直接在目標(biāo)數(shù)據(jù)集上進(jìn)行準(zhǔn)確度驗(yàn)證,并不在目標(biāo)數(shù)據(jù)集上進(jìn)行微調(diào),不包含OK-VQA中知識(shí)的模型推導(dǎo)能力較差,也反映了OK-VQA數(shù)據(jù)集中的問(wèn)答對(duì)難度較高,需要豐富的外部知識(shí)。

    方法3的結(jié)果是在凍結(jié)lxmert的全部參數(shù)且不添加任何其他結(jié)構(gòu)的情況下,只訓(xùn)練預(yù)訓(xùn)練后的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)。

    方法4的結(jié)果是直接在目標(biāo)數(shù)據(jù)集上進(jìn)行精調(diào)的結(jié)果,根據(jù)準(zhǔn)確度可以得出,通過(guò)在外部數(shù)據(jù)集上進(jìn)行粗調(diào)的方式來(lái)引入外部知識(shí)是一個(gè)有效的途徑,直接精調(diào)的結(jié)果比起完整模型還有一定的差距。

    方法6的prompt微調(diào)方法和方法5的prefix微調(diào)方法在準(zhǔn)確度上的差異不大,實(shí)驗(yàn)準(zhǔn)確度在凍結(jié)大部分參數(shù)的情況下依然好于未經(jīng)VQA-V2預(yù)訓(xùn)練而直接在OK-VQA上微調(diào)的方法4,同時(shí)也好于完全凍結(jié)預(yù)訓(xùn)練模型的方法3。

    4 結(jié)束語(yǔ)

    綜上所述,文章對(duì)目前主流的視覺(jué)問(wèn)答方法進(jìn)行了梳理,并提出了一種基于外部知識(shí)和多模態(tài)預(yù)訓(xùn)練模型的視覺(jué)問(wèn)答方法,本方法通過(guò)使用預(yù)訓(xùn)練模型來(lái)進(jìn)行多模態(tài)數(shù)據(jù)的融合,使用大規(guī)模視覺(jué)問(wèn)答數(shù)據(jù)集VQA-V2來(lái)對(duì)模型進(jìn)行一次粗調(diào),之后再利用粗調(diào)后的模型數(shù)據(jù)在目標(biāo)數(shù)據(jù)集上進(jìn)行微調(diào),這樣做能夠更好地引入多模態(tài)的外部知識(shí)。

    方法的局限性在于多模態(tài)問(wèn)答的訓(xùn)練數(shù)據(jù)集不夠全面,VQA-V2中所包含的外部知識(shí)并沒(méi)有通用知識(shí)庫(kù)中的內(nèi)容豐富,有很多視覺(jué)上相近的材料或物品無(wú)法進(jìn)行有效分辨,prompt和prefix參數(shù)的初始化方面還需要繼續(xù)進(jìn)行嘗試。

    參考文獻(xiàn):

    [1] Narasimhan M,Lazebnik S,Schwing A G .Out of the box:reasoning with graph convolution nets for factual visual question answering[EB/OL].2018:arXiv:1811.00538.https://arxiv.org/abs/1811.00538.

    [2] Wang P,Wu Q,Shen C,et al.FVQA:fact-based visual question answering[EB/OL].2016:arXiv:1606.05433.https://arxiv.org/abs/1606.05433.

    [3] Ding Y,Yu J,Liu B,et al.MuKEA:multimodal knowledge extraction and accumulation for knowledge-based visual question answering[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).,New Orleans,LA,USA.IEEE,2022:5079-5088.

    [4] Li X L,Liang P.Prefix-tuning:optimizing continuous prompts for generation[EB/OL].2021:arXiv:2101.00190.https://arxiv.org/abs/2101.00190.

    [5] Tsimpoukelli M,Menick J,Cabi S,et al.Multimodal few-shot learning with frozen language models[EB/OL].2021:arXiv:2106.13884.https://arxiv.org/abs/2106.13884.

    [6] Ren S Q,He K M,Girshick R,et al.Faster R-CNN:towards real-time object detection with region proposal networks[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6):1137-1149.

    [7] Wu Y,Schuster M,Chen Z,et al.Googles neural machine translation system:bridging the gap between human and machine translation[EB/OL].2016:arXiv:1609.08144.https://arxiv.org/abs/1609.08144.

    [8] Tan H, Bansal M. LXMERT: Learning Cross-Modality Encoder Representations from Transformers[C]//Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), 2019: 5103-5114.

    [9] Goyal Y, Khot T, Summers-Stay D, et al. Making the V in VQA Matter: elevating the role of image understanding in visual question answering[C]//Proceedings of the IEEE International Conference on Computer Vision, 2017: 6325-6334.

    [10] Marino K,Rastegari M,F(xiàn)arhadi A,et al.OK-VQA:a visual question answering benchmark requiring external knowledge[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).,Long Beach,CA,USA.IEEE,2020:3190-3199.

    [11] Ben-younes H,Cadene R,Cord M,et al.MUTAN:multimodal tucker fusion for visual question answering[C]//2017 IEEE International Conference on Computer Vision (ICCV).IEEE,2017:2631-2639.

    [12] Zhu Z,Yu J,Wang Y,et al.Mucko:multi-layer cross-modal knowledge reasoning for fact-based visual question answering[EB/OL]2020:arXiv:2006.09073.https://arxiv.org/abs/2006. 09073.

    [13] Gardères F,Ziaeefard M,Abeloos B,et al.ConceptBert:concept-aware representation for visual question answering[C]//Findings of the Association for Computational Linguistics:EMNLP 2020.Online.Stroudsburg,PA,USA:Association for Computational Linguistics,2020.

    【通聯(lián)編輯:唐一東】

    怎么达到女性高潮| 国产主播在线观看一区二区| or卡值多少钱| 1024视频免费在线观看| √禁漫天堂资源中文www| 搞女人的毛片| 久久精品人妻少妇| 亚洲精品国产精品久久久不卡| 午夜免费激情av| √禁漫天堂资源中文www| 亚洲欧美日韩东京热| 麻豆久久精品国产亚洲av| 久久天堂一区二区三区四区| 亚洲精华国产精华精| 亚洲欧美精品综合久久99| 在线国产一区二区在线| 亚洲av成人不卡在线观看播放网| 久久精品综合一区二区三区| 免费在线观看成人毛片| 香蕉久久夜色| 午夜福利18| 九色成人免费人妻av| 禁无遮挡网站| 脱女人内裤的视频| 久久精品人妻少妇| 精品国产乱码久久久久久男人| 三级毛片av免费| 日韩大尺度精品在线看网址| 日韩免费av在线播放| 一二三四社区在线视频社区8| 午夜免费激情av| 日韩欧美国产在线观看| 不卡一级毛片| 视频区欧美日本亚洲| 久久久国产成人免费| 日韩欧美国产在线观看| 国产午夜福利久久久久久| 免费电影在线观看免费观看| 最近在线观看免费完整版| 九色国产91popny在线| 国产精品免费视频内射| 欧美黑人欧美精品刺激| 久久香蕉激情| 亚洲av成人一区二区三| 91字幕亚洲| 19禁男女啪啪无遮挡网站| 亚洲成av人片免费观看| 啦啦啦观看免费观看视频高清| 国产99白浆流出| 岛国视频午夜一区免费看| 国模一区二区三区四区视频 | 一本精品99久久精品77| 亚洲 欧美 日韩 在线 免费| 欧美黑人欧美精品刺激| 精品无人区乱码1区二区| 麻豆一二三区av精品| 精品电影一区二区在线| 90打野战视频偷拍视频| 成年女人毛片免费观看观看9| 国产伦在线观看视频一区| 免费看a级黄色片| 嫩草影院精品99| x7x7x7水蜜桃| 757午夜福利合集在线观看| 啦啦啦免费观看视频1| 一夜夜www| 99久久综合精品五月天人人| 在线观看66精品国产| 国产av一区二区精品久久| 麻豆av在线久日| 日韩欧美在线二视频| 国产精品98久久久久久宅男小说| 欧美黑人欧美精品刺激| 非洲黑人性xxxx精品又粗又长| 精品久久久久久久人妻蜜臀av| 亚洲专区中文字幕在线| 51午夜福利影视在线观看| 91麻豆av在线| 变态另类成人亚洲欧美熟女| 亚洲熟妇熟女久久| 久久久国产成人精品二区| 搞女人的毛片| 一区福利在线观看| 99久久无色码亚洲精品果冻| 欧美久久黑人一区二区| 好男人电影高清在线观看| av有码第一页| 久久久久国产一级毛片高清牌| 少妇熟女aⅴ在线视频| 五月伊人婷婷丁香| 久久精品91无色码中文字幕| 精品国产乱子伦一区二区三区| 每晚都被弄得嗷嗷叫到高潮| 丝袜美腿诱惑在线| 国产久久久一区二区三区| 亚洲人成网站在线播放欧美日韩| 亚洲精品国产精品久久久不卡| 国产成人一区二区三区免费视频网站| 欧美性长视频在线观看| 国产精品一及| 热99re8久久精品国产| 欧美高清成人免费视频www| 午夜免费成人在线视频| 一个人免费在线观看电影 | 欧美激情久久久久久爽电影| av在线播放免费不卡| 一个人观看的视频www高清免费观看 | 国产精品久久久久久人妻精品电影| 精品久久久久久成人av| 在线观看免费视频日本深夜| 久久久国产精品麻豆| 欧美色欧美亚洲另类二区| 熟妇人妻久久中文字幕3abv| 黄片小视频在线播放| 一本一本综合久久| 免费在线观看视频国产中文字幕亚洲| 日韩 欧美 亚洲 中文字幕| 色精品久久人妻99蜜桃| 男男h啪啪无遮挡| 免费看a级黄色片| 俄罗斯特黄特色一大片| 国产高清videossex| 亚洲 欧美 日韩 在线 免费| 亚洲熟妇中文字幕五十中出| 国产精品 国内视频| 免费人成视频x8x8入口观看| 国产一区二区在线观看日韩 | 免费搜索国产男女视频| 老司机午夜福利在线观看视频| 色综合婷婷激情| 精品国产亚洲在线| av天堂在线播放| 波多野结衣高清作品| 香蕉国产在线看| 高潮久久久久久久久久久不卡| 亚洲色图av天堂| 男人舔奶头视频| 麻豆国产97在线/欧美 | 国内精品一区二区在线观看| 美女大奶头视频| 久久久久久久精品吃奶| 午夜福利成人在线免费观看| 色综合婷婷激情| 欧美日本亚洲视频在线播放| 国产高清视频在线观看网站| 色播亚洲综合网| 欧美日韩福利视频一区二区| 亚洲人成网站高清观看| 欧美乱码精品一区二区三区| 一边摸一边做爽爽视频免费| 国产精品久久久av美女十八| 亚洲精品国产精品久久久不卡| 亚洲黑人精品在线| 无人区码免费观看不卡| www.熟女人妻精品国产| 手机成人av网站| 国产精品久久久久久亚洲av鲁大| 免费电影在线观看免费观看| 淫秽高清视频在线观看| 国产欧美日韩一区二区精品| xxx96com| 妹子高潮喷水视频| 黄片小视频在线播放| 免费人成视频x8x8入口观看| 国产69精品久久久久777片 | 国产高清视频在线播放一区| 免费在线观看完整版高清| cao死你这个sao货| 亚洲免费av在线视频| 亚洲av成人一区二区三| 久久久国产欧美日韩av| 国产成人精品无人区| 国产av一区在线观看免费| 国产99白浆流出| 亚洲中文av在线| 国内精品久久久久久久电影| 欧美乱色亚洲激情| 欧美在线黄色| 国产成人影院久久av| 高清在线国产一区| 亚洲va日本ⅴa欧美va伊人久久| 久久欧美精品欧美久久欧美| 淫秽高清视频在线观看| 精品久久蜜臀av无| 老司机在亚洲福利影院| 免费在线观看完整版高清| 国产欧美日韩一区二区精品| 免费一级毛片在线播放高清视频| 欧美av亚洲av综合av国产av| 久9热在线精品视频| 国产亚洲精品一区二区www| 少妇被粗大的猛进出69影院| 国产单亲对白刺激| 不卡一级毛片| 精品国产乱码久久久久久男人| 天堂影院成人在线观看| 久久久久久九九精品二区国产 | 757午夜福利合集在线观看| 亚洲18禁久久av| 成年免费大片在线观看| 精品少妇一区二区三区视频日本电影| 亚洲狠狠婷婷综合久久图片| 50天的宝宝边吃奶边哭怎么回事| av在线播放免费不卡| 别揉我奶头~嗯~啊~动态视频| 99国产精品一区二区三区| 国产成年人精品一区二区| 欧美3d第一页| 999久久久国产精品视频| 日日干狠狠操夜夜爽| 高潮久久久久久久久久久不卡| 国产在线观看jvid| 18禁黄网站禁片午夜丰满| 国产精品一区二区三区四区免费观看 | 妹子高潮喷水视频| 亚洲国产欧美一区二区综合| 又黄又粗又硬又大视频| 国产一区二区激情短视频| 国产精品久久电影中文字幕| 成人国产一区最新在线观看| 久久性视频一级片| 老熟妇乱子伦视频在线观看| 嫩草影院精品99| 一本精品99久久精品77| 午夜a级毛片| bbb黄色大片| 777久久人妻少妇嫩草av网站| 琪琪午夜伦伦电影理论片6080| 国产精品久久电影中文字幕| 亚洲国产精品sss在线观看| 毛片女人毛片| 婷婷精品国产亚洲av| 一个人免费在线观看的高清视频| 亚洲人成网站高清观看| 99久久精品热视频| 成人亚洲精品av一区二区| 天天躁夜夜躁狠狠躁躁| 成人手机av| 日韩国内少妇激情av| www.999成人在线观看| 99久久综合精品五月天人人| 精品人妻1区二区| 午夜福利视频1000在线观看| 一二三四在线观看免费中文在| 一个人免费在线观看的高清视频| 日日夜夜操网爽| 少妇被粗大的猛进出69影院| 熟女少妇亚洲综合色aaa.| www.自偷自拍.com| 国产欧美日韩一区二区精品| 亚洲 欧美 日韩 在线 免费| 久久精品成人免费网站| 国产精品乱码一区二三区的特点| 亚洲性夜色夜夜综合| 最新美女视频免费是黄的| 一级a爱片免费观看的视频| 欧美人与性动交α欧美精品济南到| 日本熟妇午夜| 国产精品一及| 蜜桃久久精品国产亚洲av| 欧美又色又爽又黄视频| 操出白浆在线播放| 免费在线观看影片大全网站| 国产成人影院久久av| 亚洲va日本ⅴa欧美va伊人久久| АⅤ资源中文在线天堂| 亚洲欧洲精品一区二区精品久久久| 伊人久久大香线蕉亚洲五| 俺也久久电影网| 在线十欧美十亚洲十日本专区| 亚洲精品粉嫩美女一区| 九色国产91popny在线| 午夜福利欧美成人| 老司机午夜十八禁免费视频| 国产爱豆传媒在线观看 | 免费在线观看影片大全网站| 91国产中文字幕| 激情在线观看视频在线高清| 久久精品国产亚洲av高清一级| 中文字幕高清在线视频| 国产精品,欧美在线| 国产单亲对白刺激| 男女午夜视频在线观看| 日韩有码中文字幕| 精品国产超薄肉色丝袜足j| 久久亚洲真实| 特级一级黄色大片| 丝袜美腿诱惑在线| 韩国av一区二区三区四区| 床上黄色一级片| 国产又黄又爽又无遮挡在线| 国产免费av片在线观看野外av| 首页视频小说图片口味搜索| 久久人人精品亚洲av| 别揉我奶头~嗯~啊~动态视频| 女同久久另类99精品国产91| 久久天躁狠狠躁夜夜2o2o| 亚洲va日本ⅴa欧美va伊人久久| 一个人免费在线观看的高清视频| 男男h啪啪无遮挡| 国产精品一区二区三区四区久久| 成人18禁高潮啪啪吃奶动态图| 国内揄拍国产精品人妻在线| 老司机福利观看| 午夜影院日韩av| 国产麻豆成人av免费视频| 亚洲国产高清在线一区二区三| 国产成人精品无人区| 国产成+人综合+亚洲专区| 亚洲中文av在线| 淫妇啪啪啪对白视频| 久久这里只有精品中国| 午夜福利成人在线免费观看| 色噜噜av男人的天堂激情| 国产精品亚洲av一区麻豆| 91字幕亚洲| 99在线视频只有这里精品首页| 亚洲熟女毛片儿| 欧美黑人巨大hd| 欧美性长视频在线观看| 狠狠狠狠99中文字幕| 91九色精品人成在线观看| 欧美日韩中文字幕国产精品一区二区三区| 脱女人内裤的视频| 国产一区二区在线av高清观看| 久久人妻av系列| 草草在线视频免费看| 中出人妻视频一区二区| 美女午夜性视频免费| 俺也久久电影网| 亚洲成av人片在线播放无| 国产午夜精品久久久久久| 久久人妻av系列| 国产精品久久久久久精品电影| 国产精品亚洲av一区麻豆| 在线a可以看的网站| 91成年电影在线观看| 91老司机精品| 精华霜和精华液先用哪个| 制服诱惑二区| 亚洲一区二区三区色噜噜| 久久性视频一级片| 老汉色∧v一级毛片| 黄片大片在线免费观看| 亚洲成人免费电影在线观看| 男插女下体视频免费在线播放| 麻豆成人av在线观看| 69av精品久久久久久| 一本大道久久a久久精品| av在线天堂中文字幕| 亚洲av成人一区二区三| 丝袜美腿诱惑在线| 两性午夜刺激爽爽歪歪视频在线观看 | 黑人欧美特级aaaaaa片| 久久久久久久久久黄片| 怎么达到女性高潮| av有码第一页| 91在线观看av| 欧美日韩乱码在线| 日本熟妇午夜| 一级片免费观看大全| 久久精品亚洲精品国产色婷小说| 18禁美女被吸乳视频| 日韩国内少妇激情av| 日本a在线网址| 日本熟妇午夜| 母亲3免费完整高清在线观看| 国内精品一区二区在线观看| 亚洲国产欧美一区二区综合| 国产亚洲av高清不卡| 1024视频免费在线观看| 麻豆成人av在线观看| 亚洲精品久久国产高清桃花| 精品国产超薄肉色丝袜足j| 91国产中文字幕| 999久久久精品免费观看国产| 亚洲五月婷婷丁香| 亚洲一区二区三区色噜噜| 1024手机看黄色片| 亚洲专区中文字幕在线| av片东京热男人的天堂| 国产成人系列免费观看| 欧美另类亚洲清纯唯美| 午夜免费观看网址| 看免费av毛片| 精品久久久久久久毛片微露脸| 9191精品国产免费久久| 搡老妇女老女人老熟妇| 婷婷精品国产亚洲av| 国产精品久久视频播放| 女同久久另类99精品国产91| 欧美成狂野欧美在线观看| 色哟哟哟哟哟哟| 国产熟女午夜一区二区三区| 91字幕亚洲| 精品无人区乱码1区二区| 午夜福利在线在线| 国产单亲对白刺激| 欧美黑人精品巨大| 日本一本二区三区精品| 久久久水蜜桃国产精品网| 亚洲av中文字字幕乱码综合| 国产精品av久久久久免费| 成人永久免费在线观看视频| 亚洲aⅴ乱码一区二区在线播放 | av福利片在线| 18禁观看日本| 女人被狂操c到高潮| 啦啦啦免费观看视频1| 国产激情久久老熟女| 色噜噜av男人的天堂激情| 日本在线视频免费播放| 日本精品一区二区三区蜜桃| 精品高清国产在线一区| 国产黄色小视频在线观看| 国产精品一区二区三区四区免费观看 | 亚洲国产看品久久| 亚洲国产精品久久男人天堂| 深夜精品福利| 中文字幕av在线有码专区| 久久久精品欧美日韩精品| 国产免费男女视频| 久久精品91无色码中文字幕| 身体一侧抽搐| 精品一区二区三区四区五区乱码| 亚洲欧美日韩无卡精品| www.精华液| 宅男免费午夜| 中文字幕久久专区| 九九热线精品视视频播放| 亚洲一区二区三区不卡视频| 国产精品久久久久久人妻精品电影| 国产精品一区二区三区四区免费观看 | 成人三级黄色视频| 法律面前人人平等表现在哪些方面| 国产av一区二区精品久久| 两个人看的免费小视频| 欧美性猛交黑人性爽| 亚洲专区字幕在线| av视频在线观看入口| 亚洲精品一卡2卡三卡4卡5卡| 嫁个100分男人电影在线观看| 精品国产亚洲在线| 99久久国产精品久久久| 男男h啪啪无遮挡| www.www免费av| 757午夜福利合集在线观看| 日日干狠狠操夜夜爽| 三级男女做爰猛烈吃奶摸视频| 男插女下体视频免费在线播放| 国产精品综合久久久久久久免费| 两人在一起打扑克的视频| 美女免费视频网站| www.熟女人妻精品国产| 麻豆国产97在线/欧美 | 久久香蕉国产精品| 日韩国内少妇激情av| 18美女黄网站色大片免费观看| 亚洲电影在线观看av| 亚洲人与动物交配视频| 国产精品久久久av美女十八| 91大片在线观看| 床上黄色一级片| 欧美日韩国产亚洲二区| 最近最新免费中文字幕在线| 人妻夜夜爽99麻豆av| 精品一区二区三区四区五区乱码| 欧美在线黄色| 日本一本二区三区精品| 天天添夜夜摸| 免费无遮挡裸体视频| 午夜福利视频1000在线观看| 99国产极品粉嫩在线观看| 久久久久国产一级毛片高清牌| 一进一出好大好爽视频| 天堂av国产一区二区熟女人妻 | 久久 成人 亚洲| 日韩欧美免费精品| 在线a可以看的网站| 麻豆成人午夜福利视频| 亚洲欧美日韩无卡精品| 午夜久久久久精精品| 九色成人免费人妻av| 国产午夜精品论理片| 欧美黑人巨大hd| 国产午夜福利久久久久久| 99热6这里只有精品| 国产在线观看jvid| 久久久久久久久免费视频了| 精品久久久久久久毛片微露脸| 亚洲一区中文字幕在线| 高清毛片免费观看视频网站| www.自偷自拍.com| 精品久久久久久成人av| 变态另类丝袜制服| 天堂av国产一区二区熟女人妻 | 欧美日韩亚洲国产一区二区在线观看| 美女高潮喷水抽搐中文字幕| 中文字幕高清在线视频| 一级片免费观看大全| 免费在线观看影片大全网站| 免费看日本二区| 久久久久久久久久黄片| 国产伦在线观看视频一区| 中国美女看黄片| 18禁观看日本| 精品久久久久久成人av| 19禁男女啪啪无遮挡网站| 久久久久免费精品人妻一区二区| 免费看十八禁软件| 精品电影一区二区在线| 国产成人啪精品午夜网站| 国产高清视频在线观看网站| 老司机深夜福利视频在线观看| 午夜福利在线观看吧| ponron亚洲| 免费看日本二区| 88av欧美| 国产精品亚洲美女久久久| 俺也久久电影网| 好男人电影高清在线观看| 亚洲国产中文字幕在线视频| 99精品欧美一区二区三区四区| 女人爽到高潮嗷嗷叫在线视频| av超薄肉色丝袜交足视频| 久久久久久九九精品二区国产 | 亚洲av成人av| 一本综合久久免费| 青草久久国产| 亚洲国产精品sss在线观看| 精品久久久久久久久久免费视频| 我要搜黄色片| 中文亚洲av片在线观看爽| 精品无人区乱码1区二区| 久久99热这里只有精品18| 麻豆一二三区av精品| 国产精品久久久久久人妻精品电影| 每晚都被弄得嗷嗷叫到高潮| 欧美另类亚洲清纯唯美| 床上黄色一级片| 曰老女人黄片| 亚洲人与动物交配视频| 久久亚洲精品不卡| 国产激情欧美一区二区| 一个人观看的视频www高清免费观看 | 欧美成人午夜精品| 国内精品久久久久久久电影| 久久精品国产清高在天天线| 国产成人精品久久二区二区免费| 日韩av在线大香蕉| 日韩免费av在线播放| 欧美一级毛片孕妇| 麻豆国产97在线/欧美 | 亚洲精品中文字幕一二三四区| 精品一区二区三区视频在线观看免费| 成人国语在线视频| 亚洲熟妇中文字幕五十中出| 欧美激情久久久久久爽电影| 黄色片一级片一级黄色片| 日韩精品免费视频一区二区三区| 男男h啪啪无遮挡| 免费看十八禁软件| 欧美又色又爽又黄视频| 精品第一国产精品| 免费观看人在逋| 两个人的视频大全免费| 精品午夜福利视频在线观看一区| АⅤ资源中文在线天堂| 白带黄色成豆腐渣| 很黄的视频免费| 18禁国产床啪视频网站| 黑人操中国人逼视频| 久久久久九九精品影院| 村上凉子中文字幕在线| 国产探花在线观看一区二区| 久久久久久久精品吃奶| 此物有八面人人有两片| 日韩欧美国产在线观看| 黄频高清免费视频| 少妇粗大呻吟视频| 丰满人妻熟妇乱又伦精品不卡| 叶爱在线成人免费视频播放| 成人特级黄色片久久久久久久| 久久久久国产一级毛片高清牌| 国产黄a三级三级三级人| 欧美精品亚洲一区二区| x7x7x7水蜜桃| 丰满人妻一区二区三区视频av | √禁漫天堂资源中文www| 91成年电影在线观看| 全区人妻精品视频| 老司机午夜福利在线观看视频| 床上黄色一级片| 国产精品亚洲一级av第二区| 可以免费在线观看a视频的电影网站| 亚洲精品美女久久av网站| 亚洲专区国产一区二区| 在线看三级毛片| 国产精品一及| 两性午夜刺激爽爽歪歪视频在线观看 | 亚洲一区中文字幕在线| 国内精品久久久久久久电影| 中文字幕人妻丝袜一区二区| 亚洲最大成人中文| x7x7x7水蜜桃| 亚洲精品美女久久久久99蜜臀| 色老头精品视频在线观看| 亚洲欧美激情综合另类| 亚洲av成人av| 国产精品免费视频内射| 少妇的丰满在线观看| 色综合站精品国产| 亚洲 欧美 日韩 在线 免费| 精品日产1卡2卡| 亚洲性夜色夜夜综合|