• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于伴隨文本信息的Web圖像批量標(biāo)注方法

    2018-10-13 02:31:34郭蕾蕾段國(guó)侖陶性留
    關(guān)鍵詞:分詞文檔聚類(lèi)

    郭蕾蕾,俞 璐,段國(guó)侖,陶性留

    (1.陸軍工程大學(xué) 通信工程學(xué)院,江蘇 南京 210007;2.陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京 210007)

    0 引言

    隨著互聯(lián)網(wǎng)的迅速普及以及多媒體技術(shù)的快速發(fā)展,圖像資源的數(shù)量急劇增長(zhǎng)。如何快速、有效檢索圖像正逐漸成為學(xué)術(shù)界研究的一個(gè)熱點(diǎn),圖像標(biāo)注作為圖像檢索的核心,也越來(lái)越受到研究者的關(guān)注。同時(shí)圖像標(biāo)注具有廣泛的應(yīng)用領(lǐng)域和前景,在圖像分析、圖像理解、大規(guī)模圖像管理等不同領(lǐng)域均有一定的應(yīng)用和研究[1]。

    傳統(tǒng)的圖像標(biāo)注大都是人工標(biāo)注,即專(zhuān)家手工地對(duì)圖像進(jìn)行文本注釋。然而面對(duì)海量圖像,人工標(biāo)注費(fèi)時(shí)費(fèi)力,同時(shí)會(huì)帶入某些主觀因素,直接影響到圖像標(biāo)注的準(zhǔn)確性。顯然這種依賴(lài)人工方式實(shí)現(xiàn)的圖像標(biāo)注,已經(jīng)無(wú)法滿(mǎn)足需求[2],圖像自動(dòng)標(biāo)注技術(shù)得以迅速發(fā)展。

    所謂圖像自動(dòng)標(biāo)注,就是讓計(jì)算機(jī)自動(dòng)地為圖像添加上能夠反映圖像內(nèi)容或用戶(hù)意圖的文本標(biāo)簽[3]。圖像自動(dòng)標(biāo)注分為有監(jiān)督學(xué)習(xí)的圖像自動(dòng)標(biāo)注和無(wú)監(jiān)督學(xué)習(xí)的圖像自動(dòng)標(biāo)注。由于大多數(shù)網(wǎng)絡(luò)圖像集都未帶語(yǔ)義標(biāo)簽,因此無(wú)監(jiān)督的學(xué)習(xí)方法備受學(xué)者關(guān)注,這也是本文研究的一個(gè)重點(diǎn)內(nèi)容。

    互聯(lián)網(wǎng)時(shí)代,大多數(shù)圖像是Web圖像。Web圖像通常關(guān)聯(lián)著豐富的文本信息,如圖像文件名、周邊文本等,圖像的語(yǔ)義或多或少地都與這些關(guān)聯(lián)文本相關(guān),分析挖掘這些關(guān)聯(lián)文本信息,可以更準(zhǔn)確地對(duì)圖像進(jìn)行標(biāo)注[4]。因此,在Web圖像語(yǔ)義自動(dòng)標(biāo)注過(guò)程中,如何利用Web圖像的伴隨文本來(lái)提高標(biāo)注性能是當(dāng)前研究的熱點(diǎn)之一。

    為說(shuō)明伴隨文本信息對(duì)于圖像標(biāo)注的重要性,本文提出了一種僅利用圖像伴隨文本信息,而沒(méi)有利用圖像特征的批量標(biāo)注方法。

    1 相關(guān)工作

    1.1 TF-IDF算法

    TF-IDF(Term Frequency-Inverse Document Frequency)算法是一種廣泛應(yīng)用于信息檢索和文本挖掘領(lǐng)域的常用技術(shù)。其主要思想是:如果某個(gè)詞在某篇文檔中出現(xiàn)的頻率高,即TF高;在語(yǔ)料庫(kù)其他文檔中出現(xiàn)的頻率低,即DF很低,也即IDF高,則認(rèn)為這個(gè)詞具有很好的區(qū)分能力[5]。

    詞頻(Term Frequency)、逆文檔頻率(Inverse Document Frequency)的計(jì)算公式如下:

    (1)

    (2)

    tfidfi,j=tfi,j×idfi

    (3)

    1.2 向量空間模型(VSM)

    向量空間模型(VSM)是文本建模中常用的模型之一,它的主要思想是將文本用多維空間的向量來(lái)表示,每一個(gè)不同的特征項(xiàng)(詞語(yǔ)或句子)對(duì)應(yīng)向量空間的一維,而每一維的值就是對(duì)應(yīng)的特征項(xiàng)在文本中的特征值。

    通常,向量空間模型(VSM)將文本集中的每個(gè)文檔di用特征權(quán)重向量(wi1,wi2,..,win)表示,其中wij表示特征詞tj(j=1,2,…,n)的權(quán)重。向量空間模型的構(gòu)造過(guò)程如圖1所示[6]。

    圖1 向量空間模型構(gòu)造過(guò)程圖

    1.3 Word2vec與Doc2vec

    向量空間模型中的特征權(quán)重向量常用Word2vec模型獲得。Word2vec是Google在2013年開(kāi)源的一款將詞表征為空間向量的模型工具,主要采用連續(xù)詞袋模型(Continuous Bag-Of-Words,CBOW)以及Skip-gram模型[7]。它基于人工神經(jīng)網(wǎng)絡(luò),通過(guò)多層感知機(jī)將初始的底層特征組合為更抽象的高層特征,并將高層特征用于普通的機(jī)器學(xué)習(xí)方法以得到更好的效果。Word2vec通過(guò)訓(xùn)練,可以把文本內(nèi)容的處理簡(jiǎn)化為n維向量空間中的向量運(yùn)算,向量空間上的相似度可以用來(lái)表示文本語(yǔ)義上的相似度。

    雖然可以直接將句子/文檔中所有詞的向量取均值作為它們的向量表示,但是這樣會(huì)忽略單詞之間的排列順序?qū)渥踊蛭谋拘畔⒌挠绊??;诖?,MIKOLOV T提出了Doc2vec模型。Doc2vec模型其實(shí)是在Word2vec模型的基礎(chǔ)上做出的改進(jìn),基本思路很接近。

    2 基于伴隨文本信息的圖像標(biāo)注

    針對(duì)傳統(tǒng)人工標(biāo)注所展現(xiàn)出來(lái)的缺點(diǎn),本文提出了如圖2所示的方法來(lái)批量自動(dòng)標(biāo)注圖像。

    圖2 圖像標(biāo)注流程圖

    2.1 文本預(yù)處理

    一般而言,相比處理整個(gè)句子的文本,處理一個(gè)詞匯組成的列表更為簡(jiǎn)單,因此,需要采用分詞技術(shù)將字詞與字詞分割開(kāi)來(lái),即進(jìn)行分詞處理。對(duì)于中文分詞,目前技術(shù)比較成熟,常用的分詞工具有jieba、NLPIR、THULAC等。

    分詞后的文本中通常會(huì)存在大量的虛詞、代詞、生僻詞或者沒(méi)有特定含義的詞,這些詞語(yǔ)對(duì)文本分析起不到任何幫助。在具體的文本處理中,通常情況下需要構(gòu)建一個(gè)停用詞表,通過(guò)字符串匹配或借助其他策略將文本中的停用詞剔除[8],這個(gè)過(guò)程就是去除停用詞。

    接下來(lái)利用Doc2vec將文檔向量化,把每一個(gè)文檔表示成向量形式,以便后續(xù)進(jìn)行計(jì)算與處理。

    2.2 文本聚類(lèi)

    2.2.1聚類(lèi)意義

    本文研究的是無(wú)監(jiān)督圖像標(biāo)注,沒(méi)有樣本類(lèi)別信息可供學(xué)習(xí),采用聚類(lèi)方式至少有兩個(gè)優(yōu)點(diǎn):

    (1)通過(guò)聚類(lèi)可以抽取樣本的本質(zhì)特征,過(guò)濾掉一些無(wú)關(guān)的或者特有的信息。比如對(duì)于多個(gè)描述“犬類(lèi)”的文檔,若不采用聚類(lèi),得到的圖像標(biāo)注可能是具體的描述,如“貴賓犬”、“牧羊犬”、“秋田犬”等,但事實(shí)上看到這些圖像,只希望標(biāo)注出“狗”、“犬”等即可,聚類(lèi)可以達(dá)到此目的。

    (2)通過(guò)聚類(lèi)得到的簇中包含了多個(gè)具有共性的文檔,可將整個(gè)簇中的文本所對(duì)應(yīng)的圖像用相同的詞語(yǔ)進(jìn)行標(biāo)注,借此解決批量標(biāo)注圖像的難題,有利于提高海量圖像管理與檢索的效率。

    2.2.2AP聚類(lèi)

    Affinity Propagation聚類(lèi)算法又叫近鄰傳播算法,簡(jiǎn)稱(chēng)AP[9],其基本思想是將全部樣本看作網(wǎng)絡(luò)的節(jié)點(diǎn),通過(guò)數(shù)據(jù)元素之間的消息傳遞,實(shí)現(xiàn)數(shù)據(jù)集合中元素的自適應(yīng)聚類(lèi)[10]。AP聚類(lèi)的輸入為節(jié)點(diǎn)間的相似度矩陣S,其中s(i,j)表示節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的相似度值,表明了j作為i的聚類(lèi)中心的能力。聚類(lèi)過(guò)程中,共有兩種消息在各節(jié)點(diǎn)間傳遞,分別是吸引度(responsibility)和歸屬度(availability)。AP算法通過(guò)迭代過(guò)程不斷更新每一個(gè)節(jié)點(diǎn)的吸引度和歸屬度值,直到產(chǎn)生m個(gè)高質(zhì)量的Exemplar(類(lèi)似于質(zhì)心),同時(shí)將其余的數(shù)據(jù)點(diǎn)分配到相應(yīng)的聚類(lèi)中。吸引度信息用r(i,k)表示,即數(shù)據(jù)點(diǎn)k適合作為數(shù)據(jù)點(diǎn)i的聚類(lèi)中心的程度,r(i,k)值越大,則表示數(shù)據(jù)點(diǎn)k成為聚類(lèi)中心的能力越強(qiáng);歸屬度信息用a(i,k)表示,即數(shù)據(jù)點(diǎn)i選擇數(shù)據(jù)點(diǎn)k作為聚類(lèi)中心的合適程度。兩種信息的迭代公式如下:

    r(i,k)←s(i,k)-maxk′≠k{a(i,k′)+s(i,k′)}

    (4)

    (5)

    (6)

    其中,a(i,k′)表示除k外其他點(diǎn)對(duì)i點(diǎn)的歸屬度值,初始為0;r(i′,k)表示節(jié)點(diǎn)k作為除i外其他節(jié)點(diǎn)的聚類(lèi)中心的吸引度值。在相似度矩陣中,索引相同的點(diǎn)(如s(i,i))的值稱(chēng)為參考度或偏好參數(shù)(preference),此參數(shù)會(huì)影響到最后聚類(lèi)的數(shù)量,參考度越大說(shuō)明某個(gè)數(shù)據(jù)點(diǎn)成為聚類(lèi)中心的能力越強(qiáng),則最終聚類(lèi)中心的個(gè)數(shù)越多。迭代開(kāi)始前假設(shè)所有點(diǎn)成為聚類(lèi)中心的能力相同,因此參考度一般設(shè)為相似度矩陣中所有值的最小值或者中位數(shù)。

    2.3 關(guān)鍵詞抽取

    關(guān)鍵詞抽取就是從文本中把與這篇文檔意義最相關(guān)的一些詞抽取出來(lái)。從算法的角度來(lái)看,關(guān)鍵詞抽取算法主要有兩類(lèi):(1)有監(jiān)督學(xué)習(xí)算法,將關(guān)鍵詞抽取過(guò)程視為二分類(lèi)問(wèn)題,先抽取出候選詞,對(duì)每個(gè)候選詞劃定標(biāo)簽,訓(xùn)練關(guān)鍵詞抽取分類(lèi)器;(2)無(wú)監(jiān)督學(xué)習(xí)算法,先抽取出候選詞,然后對(duì)各個(gè)候選詞進(jìn)行打分,輸出topK個(gè)分值最高的候選詞作為關(guān)鍵詞。根據(jù)打分的策略不同,有不同的算法,例如TF-IDF、TextRank等算法。

    基于TF-IDF的抽取算法對(duì)文檔集中的每個(gè)文檔提取分值最高的5個(gè)關(guān)鍵詞,其抽取步驟如下:

    (1)預(yù)處理,對(duì)文本進(jìn)行分詞和詞性標(biāo)注,將滿(mǎn)足指定詞性的詞作為候選詞;

    (2)分別計(jì)算每個(gè)詞的TF-IDF值;

    (3)根據(jù)每個(gè)詞的TF-IDF值降序排列,并輸出5個(gè)詞匯作為可能的關(guān)鍵詞。

    2.4 相似度度量

    文本聚類(lèi)后得到不同的簇,每個(gè)簇中包含不同數(shù)量的具有相似性的文檔,而且經(jīng)過(guò)Word2vec詞向量化及關(guān)鍵詞抽取后,每個(gè)文檔已經(jīng)提取出了5個(gè)最具代表性的關(guān)鍵詞,且這些關(guān)鍵詞都在語(yǔ)料庫(kù)中并被表示為向量形式。為了批量標(biāo)注圖像,需要把位于同一個(gè)簇中的樣本的共性提取出來(lái),因此需要對(duì)詞語(yǔ)進(jìn)行相似度度量,選取相似度較大的幾個(gè)詞語(yǔ)作為該簇中的所有圖像的標(biāo)注。為此,選取網(wǎng)頁(yè)中經(jīng)常檢索的詞語(yǔ)構(gòu)建一個(gè)候選詞詞典,并將該詞典加入到語(yǔ)料庫(kù),訓(xùn)練模型,得到詞語(yǔ)的向量表示,每個(gè)簇中的圖像的最終標(biāo)注就是從該候選詞詞典中選出的與抽取的關(guān)鍵詞相似度較大的幾個(gè)詞語(yǔ)。

    2.4.1候選詞與文檔關(guān)鍵詞的相似度度量

    相似度度量通常采用的方法是計(jì)算樣本間的距離,余弦相似度是用向量空間中兩個(gè)向量夾角的余弦值來(lái)衡量?jī)蓚€(gè)樣本個(gè)體間差異的大小。假設(shè)有兩個(gè)n維向量a和b,其余弦相似度為:

    (7)

    式中,a·b表示兩個(gè)向量的點(diǎn)積,夾角余弦取值范圍為[-1,1],取值越大表示兩向量的夾角越小,兩向量越相似。

    假設(shè)第i個(gè)簇中第j個(gè)文檔經(jīng)過(guò)關(guān)鍵詞抽取后得到5個(gè)關(guān)鍵詞kij1,kij2,…,kij5,候選詞詞典中有M個(gè)候選詞h1,h2,…,hM。候選詞語(yǔ)與抽取的關(guān)鍵詞之間的相似度為:

    (8)

    其中,hm表示第m個(gè)候選詞語(yǔ)的特征向量,kijp表示第i個(gè)簇中第j個(gè)文檔抽取的第p個(gè)關(guān)鍵詞的特征向量。

    2.4.2候選詞與文檔的相似度度量

    在得到候選詞語(yǔ)與各文檔抽取的關(guān)鍵詞之間的余弦相似度后,由于每篇文檔抽取的關(guān)鍵詞有差異,不能作為整個(gè)聚類(lèi)圖像的標(biāo)注結(jié)果,因此要提取聚類(lèi)簇中文檔關(guān)鍵詞的共性,得到候選詞語(yǔ)與每個(gè)文檔之間的余弦相似度。通常一個(gè)候選詞與文檔中的某個(gè)關(guān)鍵詞的相似度較大,就認(rèn)為該候選詞與該文檔的相似度就大。因此選擇候選詞語(yǔ)與每個(gè)文檔抽取的5個(gè)關(guān)鍵詞中相似度最大的一個(gè)作為候選詞語(yǔ)與該文檔之間的相似度。

    假設(shè)文本聚類(lèi)后有K個(gè)簇c1,c2,…,cK,每個(gè)簇中有N個(gè)文檔di1,di2,…,diN,則候選詞與文檔之間的余弦相似度為:

    s(hm,dij)?maxp=1,2,…,5{g(hm,kijp)}

    i=1,2,…,K;m=1,2,…,M

    (9)

    其中,dij表示第i個(gè)簇中第j個(gè)文檔,s(hm,dij)表示第m個(gè)候選詞語(yǔ)與第i個(gè)簇中第j個(gè)文檔的相似度。

    2.4.3候選詞與聚類(lèi)簇的相似度度量

    通過(guò)式(9)計(jì)算得到候選詞與每個(gè)文檔的相似度s(hm,dij)后,要想對(duì)每個(gè)簇進(jìn)行批量標(biāo)注,還需知道候選詞與每個(gè)簇之間的相似度大小。由于關(guān)鍵詞抽取、聚類(lèi)等屬于無(wú)監(jiān)督學(xué)習(xí),聚類(lèi)后每個(gè)簇中的樣本準(zhǔn)確性不能保證,因此不能簡(jiǎn)單采取像2.4.2節(jié)中的方法直接將候選詞與某簇中文檔相似度最大的一個(gè)作為候選詞與聚類(lèi)簇的相似度。為了消除各種噪聲影響,本文用候選詞-文檔相似度的均值來(lái)定義候選詞與聚類(lèi)簇的相似度。為避免聚類(lèi)中得到的差異較大的文本帶來(lái)的不良影響,需對(duì)N個(gè)候選詞-文檔相似度s(hm,dij)由大到小進(jìn)行排序,排序結(jié)果用(si1,si2,…,siN)表示,選取topQ(Q≤N)個(gè)相似度求均值來(lái)計(jì)算候選詞與第i個(gè)簇的相似度:

    (10)

    式中,sil表示第i個(gè)簇排序結(jié)果中第l個(gè)相似度值。

    2.5 最終標(biāo)注詞輸出

    通過(guò)式(10)計(jì)算出每個(gè)候選詞到每個(gè)簇的相似度值f(hm,ci),m=1,2,…,M;i=1,2,…,K,將每個(gè)簇中的相似度值由大到小順序排列,選取值最大的3個(gè)對(duì)應(yīng)的候選詞作為該簇的標(biāo)注結(jié)果。

    3 實(shí)驗(yàn)結(jié)果

    3.1 實(shí)驗(yàn)條件

    為了驗(yàn)證本文方法的有效性,首先需要訓(xùn)練模型得到文檔及詞語(yǔ)的向量,為此下載了中文維基百科語(yǔ)料庫(kù)。本文在PyCharm EDU環(huán)境下調(diào)用gensim庫(kù)中的wikicorpus函數(shù)去除語(yǔ)料庫(kù)中無(wú)用的標(biāo)記符號(hào),將壓縮文件轉(zhuǎn)換為txt文本,并安裝開(kāi)源項(xiàng)目OpenCC,去除繁體數(shù)據(jù),完成繁簡(jiǎn)轉(zhuǎn)化。

    同時(shí),在PyCharm EDU環(huán)境下編寫(xiě)Python程序爬取百度百科網(wǎng)頁(yè),獲得了480幅圖像及對(duì)應(yīng)的伴隨文本(一幅圖像對(duì)應(yīng)一個(gè)伴隨文本文檔),這些圖像大致分為7類(lèi):狗(70)、植物(70)、飛機(jī)(70)、橋(70)、鳥(niǎo)類(lèi)(70)、建筑(70)、山水(60)。隨后將480個(gè)伴隨文本文檔添加入維基百科語(yǔ)料庫(kù),對(duì)添加后的文本使用jieba分詞工具進(jìn)行分詞,分詞過(guò)程中將自己構(gòu)建的停用詞表導(dǎo)入該程序以去除停用詞,并調(diào)用gensim庫(kù)中的Word2vec模型進(jìn)行模型訓(xùn)練,得到包含大量詞語(yǔ)的詞匯庫(kù)及所對(duì)應(yīng)的向量。

    本文還選取了115個(gè)網(wǎng)頁(yè)檢索中常用的詞語(yǔ)構(gòu)建了一個(gè)候選詞詞典,圖像的最終標(biāo)注結(jié)果將從這個(gè)候選詞詞典中得到。

    3.2 評(píng)價(jià)標(biāo)準(zhǔn)

    在本文中,所使用的數(shù)據(jù)集都是從網(wǎng)絡(luò)上得到的真實(shí)數(shù)據(jù),沒(méi)有標(biāo)準(zhǔn)的標(biāo)注結(jié)果,在驗(yàn)證實(shí)驗(yàn)結(jié)果前,首先對(duì)提取的480幅真實(shí)圖像從候選詞詞典中選取某些詞語(yǔ)進(jìn)行了人工標(biāo)注,每幅圖像標(biāo)注了1~6個(gè)語(yǔ)義標(biāo)簽。

    對(duì)于聚類(lèi)結(jié)果,采用純度[11]進(jìn)行了簡(jiǎn)單的評(píng)價(jià),定義第i簇的純度為:

    (11)

    其中,mi是第i簇中樣本的個(gè)數(shù),mij是第i簇中第j類(lèi)的樣本個(gè)數(shù)。

    聚類(lèi)的總純度為:

    (12)

    其中,K表示聚類(lèi)簇的個(gè)數(shù),m是樣本的總數(shù)。

    本文使用準(zhǔn)確率P(Precision)、召回率R(Recall)和F1值對(duì)每幅圖像的標(biāo)注結(jié)果進(jìn)行評(píng)測(cè)[12],準(zhǔn)確率、召回率、F1值定義如下:

    (13)

    (14)

    (15)

    圖3 標(biāo)注結(jié)果示例

    其中,precision(Ii)表示第i幅圖像標(biāo)注的準(zhǔn)確率,度量了圖像標(biāo)注的精度;recall(Ii)表示第i幅圖像標(biāo)注的召回率,度量了圖像標(biāo)注的完整性;F1(Ii)是準(zhǔn)確率與召回率的加權(quán)平均值,度量了圖像標(biāo)注的綜合性能,其值越接近1,表示性能越好。Numc(Ii)表示第i幅待標(biāo)注圖像返回的正確標(biāo)注詞語(yǔ)的個(gè)數(shù),Numr(Ii)表示第i幅待標(biāo)注圖像返回的標(biāo)注詞語(yǔ)的個(gè)數(shù),Numm(Ii)表示第i幅待標(biāo)注圖像人工標(biāo)注詞語(yǔ)的個(gè)數(shù)。

    本文對(duì)圖像集里的每幅圖像進(jìn)行標(biāo)注,最后將所有圖像的準(zhǔn)確率、召回率、F1值分別取平均作為最終評(píng)價(jià)指標(biāo)[13],即定義宏準(zhǔn)確率(macro-precision)、宏召回率(macro-recall)、宏F1值(macro-F1),如下:

    macro-precision=

    (16)

    macro-recall=

    (17)

    (18)

    式中Image表示待標(biāo)注圖像集合,|Image|表示待標(biāo)注圖像集合中圖像的數(shù)量。

    為了更加直觀地評(píng)價(jià)和展現(xiàn)標(biāo)注結(jié)果,本文定義了一種簡(jiǎn)化的評(píng)價(jià)準(zhǔn)則,即自動(dòng)標(biāo)注的詞語(yǔ)中只要有一個(gè)與人工標(biāo)注結(jié)果相同或相近,則認(rèn)為圖像被正確標(biāo)注,得到圖像標(biāo)注的精度為:

    (19)

    其中,|correct|表示正確標(biāo)注的圖像的數(shù)目。

    3.3 實(shí)驗(yàn)結(jié)果

    本文對(duì)480幅圖像利用其伴隨文本信息進(jìn)行了標(biāo)注,在文本聚類(lèi)中產(chǎn)生了7個(gè)簇,每個(gè)簇中包含數(shù)量不等的文檔數(shù),且在候選詞與聚類(lèi)簇相似度度量中設(shè)置Q=0.8×N,表1給出了此次標(biāo)注的結(jié)果。

    圖3給出了利用本文所提方法得到的某個(gè)簇中部分圖像標(biāo)注結(jié)果的實(shí)例。

    表1 圖像標(biāo)注的性能

    從上述結(jié)果可以看出,大部分圖像可以借助其文本信息實(shí)現(xiàn)標(biāo)注,采用本文定義的簡(jiǎn)化準(zhǔn)則,標(biāo)注精度可達(dá)到88%,而且批量標(biāo)注提高了標(biāo)注的效率。

    僅采用伴隨文本信息進(jìn)行圖像標(biāo)注難以達(dá)到更精確的結(jié)果,究其原因有如下幾點(diǎn):(1)圖像伴隨文本信息并不能完全表達(dá)圖像的含義,如有些圖像中“燈光”等信息沒(méi)有在文本中體現(xiàn),這說(shuō)明圖像視覺(jué)特征的重要性;(2)因?yàn)槭菬o(wú)監(jiān)督學(xué)習(xí),文檔關(guān)鍵詞提取和聚類(lèi)都難以保證準(zhǔn)確性,如圖3中的第6幅圖像,因?yàn)闆](méi)有正確聚類(lèi),導(dǎo)致標(biāo)注不夠準(zhǔn)確。但總體來(lái)說(shuō),此次實(shí)驗(yàn)達(dá)到了預(yù)想的目標(biāo)。

    4 結(jié)論

    本文僅利用圖像的伴隨文本信息作為特征,結(jié)合文本聚類(lèi)及關(guān)鍵詞抽取等技術(shù),提出了基于伴隨文本信息的Web圖像批量標(biāo)注框架,并且利用Python爬取百度百科網(wǎng)頁(yè)自建圖像數(shù)據(jù)庫(kù),實(shí)現(xiàn)了對(duì)圖像的批量標(biāo)注。

    本文工作充分證明了伴隨文本信息對(duì)于圖像標(biāo)注的重要性。下一步將研究圖像的視覺(jué)特征,將圖像特征與伴隨文本信息進(jìn)行結(jié)合,以實(shí)現(xiàn)對(duì)圖像的精確標(biāo)注。

    猜你喜歡
    分詞文檔聚類(lèi)
    有人一聲不吭向你扔了個(gè)文檔
    結(jié)巴分詞在詞云中的應(yīng)用
    基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    值得重視的分詞的特殊用法
    基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
    自適應(yīng)確定K-means算法的聚類(lèi)數(shù):以遙感圖像聚類(lèi)為例
    高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
    长腿黑丝高跟| 国产一区二区亚洲精品在线观看| 亚洲美女黄片视频| 国产成人精品久久久久久| 九九在线视频观看精品| 国产精品久久久久久久电影| 成人特级黄色片久久久久久久| 国内精品美女久久久久久| 国内精品美女久久久久久| 男女啪啪激烈高潮av片| 欧美日本亚洲视频在线播放| 午夜福利在线在线| 午夜福利18| 亚洲成人中文字幕在线播放| 久久久成人免费电影| 激情 狠狠 欧美| 给我免费播放毛片高清在线观看| 国产v大片淫在线免费观看| 亚洲第一电影网av| 久久久国产成人精品二区| 国产美女午夜福利| 男人和女人高潮做爰伦理| 日韩亚洲欧美综合| 一本久久中文字幕| 国产亚洲av嫩草精品影院| 亚洲四区av| 国产麻豆成人av免费视频| 中文字幕精品亚洲无线码一区| a级毛色黄片| 午夜福利成人在线免费观看| 色尼玛亚洲综合影院| 午夜久久久久精精品| 亚洲人成网站高清观看| 成人欧美大片| 在线播放无遮挡| 久久久久国产精品人妻aⅴ院| 日韩精品青青久久久久久| 免费不卡的大黄色大毛片视频在线观看 | 国产精品人妻久久久影院| 久久久久久国产a免费观看| 女生性感内裤真人,穿戴方法视频| 日韩精品有码人妻一区| 1000部很黄的大片| 三级国产精品欧美在线观看| 天天躁夜夜躁狠狠久久av| 婷婷精品国产亚洲av在线| 国产午夜精品久久久久久一区二区三区 | 亚洲第一区二区三区不卡| 亚洲成人久久性| 国产高清视频在线播放一区| 插逼视频在线观看| 99精品在免费线老司机午夜| 一级毛片aaaaaa免费看小| 在线播放国产精品三级| 亚洲美女搞黄在线观看 | 欧美日韩一区二区视频在线观看视频在线 | 熟妇人妻久久中文字幕3abv| 免费观看精品视频网站| 国产激情偷乱视频一区二区| 欧美日韩国产亚洲二区| 婷婷精品国产亚洲av| 三级国产精品欧美在线观看| 2021天堂中文幕一二区在线观| 少妇丰满av| 精品午夜福利在线看| 欧美一区二区国产精品久久精品| 亚洲av熟女| 男人和女人高潮做爰伦理| 午夜日韩欧美国产| 插逼视频在线观看| 国产亚洲91精品色在线| 午夜激情欧美在线| 午夜视频国产福利| 久久欧美精品欧美久久欧美| 中文字幕熟女人妻在线| 美女高潮的动态| 在线播放无遮挡| 波多野结衣高清无吗| 久久久久久国产a免费观看| 久久午夜亚洲精品久久| 欧美潮喷喷水| 22中文网久久字幕| a级毛片a级免费在线| 99在线视频只有这里精品首页| 老女人水多毛片| 黄色日韩在线| 久久精品国产清高在天天线| 亚洲欧美日韩高清专用| 在线播放国产精品三级| 国产毛片a区久久久久| 亚洲人成网站在线播放欧美日韩| 日韩欧美 国产精品| 一级a爱片免费观看的视频| 丰满的人妻完整版| 天堂√8在线中文| 一级毛片久久久久久久久女| 中国美女看黄片| 国产亚洲精品久久久com| 成人二区视频| 亚洲人成网站高清观看| av天堂中文字幕网| 久久精品国产亚洲av香蕉五月| 久久精品影院6| 欧美激情在线99| 亚洲va在线va天堂va国产| 最近的中文字幕免费完整| 看黄色毛片网站| 亚洲精品日韩在线中文字幕 | av女优亚洲男人天堂| 欧美最黄视频在线播放免费| 男女啪啪激烈高潮av片| 69人妻影院| 蜜桃久久精品国产亚洲av| 免费无遮挡裸体视频| 亚洲美女视频黄频| 麻豆成人午夜福利视频| 国产伦一二天堂av在线观看| 精品人妻视频免费看| 日韩成人av中文字幕在线观看 | 亚洲av美国av| 日本撒尿小便嘘嘘汇集6| 特级一级黄色大片| 亚洲综合色惰| 午夜精品在线福利| 亚洲欧美成人精品一区二区| 久久精品国产自在天天线| 欧美在线一区亚洲| 久久久久久久亚洲中文字幕| 色哟哟哟哟哟哟| 国产黄a三级三级三级人| 国产真实乱freesex| 国产激情偷乱视频一区二区| 男女下面进入的视频免费午夜| 中国美女看黄片| 国产在线精品亚洲第一网站| 中文字幕av成人在线电影| 美女xxoo啪啪120秒动态图| 成人二区视频| 精品熟女少妇av免费看| 亚洲18禁久久av| 狂野欧美白嫩少妇大欣赏| 久久久欧美国产精品| 亚洲成人精品中文字幕电影| 久久久久九九精品影院| 成人综合一区亚洲| 天天躁夜夜躁狠狠久久av| 美女xxoo啪啪120秒动态图| 老司机福利观看| 国产精品国产高清国产av| 久久婷婷人人爽人人干人人爱| av视频在线观看入口| 精品久久久久久久久久久久久| 欧美区成人在线视频| 深夜精品福利| 精品人妻熟女av久视频| 日韩在线高清观看一区二区三区| 欧美日韩精品成人综合77777| 女人十人毛片免费观看3o分钟| 亚洲图色成人| 欧美又色又爽又黄视频| 一区二区三区免费毛片| 国产精品电影一区二区三区| 欧美日韩在线观看h| 久久韩国三级中文字幕| 国产高清三级在线| 成年女人看的毛片在线观看| 国产成人91sexporn| 噜噜噜噜噜久久久久久91| 久久久精品大字幕| 男女那种视频在线观看| 黄色配什么色好看| 少妇人妻一区二区三区视频| 女生性感内裤真人,穿戴方法视频| 日本欧美国产在线视频| 级片在线观看| 日本成人三级电影网站| 看非洲黑人一级黄片| 99九九线精品视频在线观看视频| 国产美女午夜福利| 青春草视频在线免费观看| 成人特级黄色片久久久久久久| 精品乱码久久久久久99久播| 九色成人免费人妻av| 99久国产av精品国产电影| 精品午夜福利视频在线观看一区| 亚洲欧美成人精品一区二区| 免费av不卡在线播放| 此物有八面人人有两片| 亚洲熟妇中文字幕五十中出| 99久国产av精品国产电影| 久久久久久久久久久丰满| 少妇熟女aⅴ在线视频| 精品人妻视频免费看| 最近中文字幕高清免费大全6| 色视频www国产| 美女被艹到高潮喷水动态| 欧美日韩一区二区视频在线观看视频在线 | 国产亚洲精品久久久久久毛片| 欧美三级亚洲精品| 亚洲欧美日韩无卡精品| 成年女人永久免费观看视频| 最近的中文字幕免费完整| 久久久久久久亚洲中文字幕| 在线a可以看的网站| 少妇丰满av| 日本爱情动作片www.在线观看 | 欧美+亚洲+日韩+国产| 亚州av有码| 卡戴珊不雅视频在线播放| 午夜激情欧美在线| 内地一区二区视频在线| 三级男女做爰猛烈吃奶摸视频| 一a级毛片在线观看| 偷拍熟女少妇极品色| 可以在线观看的亚洲视频| 丝袜喷水一区| 国产伦在线观看视频一区| 日韩人妻高清精品专区| 亚洲国产欧洲综合997久久,| 六月丁香七月| 亚洲不卡免费看| 色5月婷婷丁香| ponron亚洲| 国产成人91sexporn| 女人十人毛片免费观看3o分钟| 美女 人体艺术 gogo| 亚洲丝袜综合中文字幕| 色5月婷婷丁香| 亚洲成人中文字幕在线播放| 国产精品精品国产色婷婷| 99热6这里只有精品| 麻豆av噜噜一区二区三区| 国产综合懂色| 成人高潮视频无遮挡免费网站| 国产探花极品一区二区| 午夜福利18| 深爱激情五月婷婷| 亚洲婷婷狠狠爱综合网| 在线播放国产精品三级| 亚洲中文日韩欧美视频| 久久久久久九九精品二区国产| 久久人人爽人人爽人人片va| 男女视频在线观看网站免费| 国产精品一二三区在线看| 久久久久久久久中文| 在线观看av片永久免费下载| 男女下面进入的视频免费午夜| 99九九线精品视频在线观看视频| 国产69精品久久久久777片| 97超碰精品成人国产| av福利片在线观看| 日韩欧美一区二区三区在线观看| 国产精品久久久久久av不卡| 老司机午夜福利在线观看视频| 久久精品国产鲁丝片午夜精品| 少妇熟女aⅴ在线视频| 亚洲乱码一区二区免费版| 国产精品av视频在线免费观看| 少妇猛男粗大的猛烈进出视频 | 日本 av在线| 成人午夜高清在线视频| 校园春色视频在线观看| 亚洲在线观看片| 日本黄大片高清| 亚洲av.av天堂| 国内精品宾馆在线| 小蜜桃在线观看免费完整版高清| av天堂在线播放| 噜噜噜噜噜久久久久久91| 欧美成人免费av一区二区三区| 三级经典国产精品| 一级a爱片免费观看的视频| 国产精品精品国产色婷婷| 麻豆av噜噜一区二区三区| 黄色配什么色好看| www日本黄色视频网| 卡戴珊不雅视频在线播放| 亚洲国产精品久久男人天堂| 欧美日韩综合久久久久久| 九九久久精品国产亚洲av麻豆| 亚洲精品国产av成人精品 | 亚洲激情五月婷婷啪啪| 精品久久久久久久久av| 国产片特级美女逼逼视频| 男女那种视频在线观看| 国产成人精品久久久久久| 亚洲av成人av| 国产淫片久久久久久久久| 国产色爽女视频免费观看| 欧美一区二区精品小视频在线| 美女黄网站色视频| 日本欧美国产在线视频| 波多野结衣巨乳人妻| av天堂在线播放| 亚洲五月天丁香| 老司机福利观看| 三级经典国产精品| 精品午夜福利在线看| 非洲黑人性xxxx精品又粗又长| 亚洲中文日韩欧美视频| av在线观看视频网站免费| 国产黄色小视频在线观看| 欧美国产日韩亚洲一区| 国产精品久久久久久久电影| 国产精品久久久久久精品电影| 禁无遮挡网站| 黄色欧美视频在线观看| 亚洲第一区二区三区不卡| a级毛片免费高清观看在线播放| 欧美3d第一页| 99久久九九国产精品国产免费| 亚洲一级一片aⅴ在线观看| 精品人妻熟女av久视频| 不卡视频在线观看欧美| 久久99热这里只有精品18| 99久国产av精品国产电影| 色5月婷婷丁香| 91麻豆精品激情在线观看国产| 日日干狠狠操夜夜爽| 国产麻豆成人av免费视频| 黄色配什么色好看| 久久精品夜夜夜夜夜久久蜜豆| 国产成人a∨麻豆精品| 成年女人毛片免费观看观看9| 成年版毛片免费区| 99久久精品热视频| 国内精品宾馆在线| 天堂网av新在线| 亚洲av中文av极速乱| 两个人视频免费观看高清| 日本在线视频免费播放| 国产乱人视频| 日本爱情动作片www.在线观看 | 久久这里只有精品中国| 免费搜索国产男女视频| 精品一区二区三区av网在线观看| 又粗又爽又猛毛片免费看| 97在线视频观看| 少妇人妻精品综合一区二区 | 精品99又大又爽又粗少妇毛片| 在线观看av片永久免费下载| 搡老妇女老女人老熟妇| 国产91av在线免费观看| 寂寞人妻少妇视频99o| 亚洲精品色激情综合| 久99久视频精品免费| 国产伦一二天堂av在线观看| 亚洲精品日韩av片在线观看| 91在线精品国自产拍蜜月| 99热这里只有精品一区| 亚洲人成网站在线播放欧美日韩| 久久久久久国产a免费观看| 欧美成人免费av一区二区三区| 伦精品一区二区三区| 婷婷色综合大香蕉| 久久天躁狠狠躁夜夜2o2o| 亚洲人成网站高清观看| 亚洲电影在线观看av| 亚洲熟妇中文字幕五十中出| 免费在线观看成人毛片| 搡老熟女国产l中国老女人| 久久精品夜夜夜夜夜久久蜜豆| 最近手机中文字幕大全| 亚洲国产日韩欧美精品在线观看| 少妇丰满av| 亚洲精品久久国产高清桃花| 国产在线精品亚洲第一网站| 亚洲激情五月婷婷啪啪| 99国产精品一区二区蜜桃av| 十八禁国产超污无遮挡网站| 欧美日本亚洲视频在线播放| 国产精品久久久久久av不卡| 又爽又黄a免费视频| 亚洲一区二区三区色噜噜| 亚洲最大成人av| 色av中文字幕| 久久久久久九九精品二区国产| 卡戴珊不雅视频在线播放| 麻豆一二三区av精品| 精华霜和精华液先用哪个| 美女cb高潮喷水在线观看| 色5月婷婷丁香| 国内揄拍国产精品人妻在线| 午夜免费激情av| 亚洲中文日韩欧美视频| 国产高清激情床上av| 中国美女看黄片| 欧美激情国产日韩精品一区| 少妇人妻一区二区三区视频| 性插视频无遮挡在线免费观看| 啦啦啦韩国在线观看视频| 91av网一区二区| 国产精品嫩草影院av在线观看| 国产精品不卡视频一区二区| 黑人高潮一二区| 啦啦啦啦在线视频资源| 在线天堂最新版资源| 久久精品综合一区二区三区| 非洲黑人性xxxx精品又粗又长| 看十八女毛片水多多多| 色噜噜av男人的天堂激情| 欧美色视频一区免费| 日韩在线高清观看一区二区三区| 国产av在哪里看| 中国美女看黄片| 看黄色毛片网站| 久久精品久久久久久噜噜老黄 | 亚洲,欧美,日韩| 国产精品爽爽va在线观看网站| 国产精品永久免费网站| 99国产极品粉嫩在线观看| 国内精品宾馆在线| 少妇高潮的动态图| 中文字幕熟女人妻在线| 亚洲精品乱码久久久v下载方式| 嫩草影视91久久| 嫩草影院入口| 久久久欧美国产精品| 精品午夜福利在线看| 国产av一区在线观看免费| 嫩草影视91久久| 久久国内精品自在自线图片| 看十八女毛片水多多多| 色综合站精品国产| 欧美国产日韩亚洲一区| 少妇丰满av| 女的被弄到高潮叫床怎么办| 99久久久亚洲精品蜜臀av| 高清毛片免费观看视频网站| 日本熟妇午夜| 岛国在线免费视频观看| 啦啦啦韩国在线观看视频| 日韩欧美一区二区三区在线观看| 国产v大片淫在线免费观看| av在线观看视频网站免费| 亚洲欧美日韩高清专用| 中文亚洲av片在线观看爽| av在线播放精品| 国产精品人妻久久久久久| 国产亚洲91精品色在线| 亚洲精品456在线播放app| 男女啪啪激烈高潮av片| 1024手机看黄色片| 亚洲成人av在线免费| 成年av动漫网址| 岛国在线免费视频观看| 日韩亚洲欧美综合| 极品教师在线视频| 欧美潮喷喷水| 国产69精品久久久久777片| 人人妻人人澡人人爽人人夜夜 | av在线播放精品| 成年免费大片在线观看| 亚洲丝袜综合中文字幕| 国产极品精品免费视频能看的| 亚洲av免费在线观看| 亚洲婷婷狠狠爱综合网| 小蜜桃在线观看免费完整版高清| 亚洲精品一区av在线观看| 六月丁香七月| 久久精品国产鲁丝片午夜精品| 无遮挡黄片免费观看| av视频在线观看入口| 最近最新中文字幕大全电影3| 在线观看免费视频日本深夜| 免费看美女性在线毛片视频| 久久精品国产鲁丝片午夜精品| 欧美区成人在线视频| 精品午夜福利在线看| 日韩强制内射视频| 欧美另类亚洲清纯唯美| 变态另类成人亚洲欧美熟女| 亚洲精品日韩av片在线观看| 亚洲四区av| 亚洲第一区二区三区不卡| 免费电影在线观看免费观看| 在线观看午夜福利视频| 又爽又黄a免费视频| 中文字幕av成人在线电影| 好男人在线观看高清免费视频| 真人做人爱边吃奶动态| 少妇被粗大猛烈的视频| 欧美成人一区二区免费高清观看| 亚洲在线观看片| 亚洲国产高清在线一区二区三| 欧美精品国产亚洲| 亚洲精品456在线播放app| 熟妇人妻久久中文字幕3abv| 天堂√8在线中文| 少妇熟女欧美另类| 人人妻人人澡人人爽人人夜夜 | 亚洲人成网站在线播放欧美日韩| 日本精品一区二区三区蜜桃| 久久久色成人| 亚洲色图av天堂| 国产精品一区二区三区四区久久| 国产真实乱freesex| 中文资源天堂在线| 久久人人爽人人爽人人片va| 久久久国产成人精品二区| 一个人看的www免费观看视频| 亚洲熟妇熟女久久| 中文字幕人妻熟人妻熟丝袜美| 1000部很黄的大片| 国产高清有码在线观看视频| 国产亚洲精品av在线| a级毛片a级免费在线| 成年免费大片在线观看| 此物有八面人人有两片| 国产黄a三级三级三级人| 精品欧美国产一区二区三| 亚洲无线观看免费| 麻豆久久精品国产亚洲av| 午夜老司机福利剧场| 国产亚洲精品av在线| 美女xxoo啪啪120秒动态图| 可以在线观看的亚洲视频| 成人亚洲精品av一区二区| 免费在线观看影片大全网站| 男插女下体视频免费在线播放| 91狼人影院| 国产精品女同一区二区软件| 天堂影院成人在线观看| 亚洲综合色惰| 麻豆成人午夜福利视频| 亚洲中文字幕日韩| 深爱激情五月婷婷| 国产精品不卡视频一区二区| 在线观看一区二区三区| 一本一本综合久久| 国产极品精品免费视频能看的| 乱人视频在线观看| 搡老熟女国产l中国老女人| 深夜精品福利| 亚洲人成网站高清观看| 亚洲精品一区av在线观看| 一级黄片播放器| 国内精品美女久久久久久| 国产片特级美女逼逼视频| 尤物成人国产欧美一区二区三区| 午夜影院日韩av| 男人的好看免费观看在线视频| 小蜜桃在线观看免费完整版高清| 国产精品,欧美在线| 男人狂女人下面高潮的视频| 波多野结衣高清无吗| 日韩高清综合在线| av.在线天堂| 搡老妇女老女人老熟妇| 欧美+日韩+精品| 国产精品人妻久久久影院| 久久久久久久亚洲中文字幕| 久久精品国产亚洲av香蕉五月| 看片在线看免费视频| 国产黄色小视频在线观看| 白带黄色成豆腐渣| 可以在线观看的亚洲视频| 久久热精品热| 尤物成人国产欧美一区二区三区| 美女xxoo啪啪120秒动态图| 日本熟妇午夜| 精品人妻熟女av久视频| 一a级毛片在线观看| 一本精品99久久精品77| 欧美日韩乱码在线| 国产精品乱码一区二三区的特点| 亚洲欧美日韩高清专用| 最新中文字幕久久久久| 久99久视频精品免费| 成人亚洲欧美一区二区av| 一本一本综合久久| 久久精品夜夜夜夜夜久久蜜豆| 在线国产一区二区在线| 99九九线精品视频在线观看视频| 午夜福利在线观看免费完整高清在 | 国产亚洲91精品色在线| 黄色一级大片看看| 六月丁香七月| 亚洲乱码一区二区免费版| av在线老鸭窝| 国产精品三级大全| 国产老妇女一区| 午夜免费激情av| 婷婷色综合大香蕉| 小蜜桃在线观看免费完整版高清| 久久综合国产亚洲精品| 国产免费一级a男人的天堂| 国产日本99.免费观看| 欧美日韩精品成人综合77777| 波多野结衣巨乳人妻| 黄色视频,在线免费观看| 亚洲一区二区三区色噜噜| 欧美色视频一区免费| 大型黄色视频在线免费观看| 亚洲精品456在线播放app| www日本黄色视频网| 国产精品久久电影中文字幕| 乱人视频在线观看| 三级国产精品欧美在线观看| 国产中年淑女户外野战色| 亚洲自偷自拍三级| 国产精品国产高清国产av| 一区二区三区免费毛片| 少妇人妻一区二区三区视频| 日韩欧美精品免费久久| 村上凉子中文字幕在线| 久久精品国产99精品国产亚洲性色| 一进一出好大好爽视频| 亚洲最大成人中文| av视频在线观看入口| 亚洲精品在线观看二区| 亚洲av成人精品一区久久| 色哟哟·www| 校园春色视频在线观看| 亚洲性夜色夜夜综合|