鄧學(xué)雄, 楊志成, 朱正海
(華南理工大學(xué)設(shè)計(jì)學(xué)院,廣東 廣州 510006)
圖像檢索中的主要問題是“語義鴻溝”。“語義鴻溝”的實(shí)質(zhì)是,人無法向計(jì)算機(jī)清楚地描述自己對(duì)圖像的認(rèn)知,計(jì)算機(jī)不明白人是怎樣理解和描述圖像的,人機(jī)之間缺少一套“共同語言”,從而導(dǎo)致人和計(jì)算機(jī)無法溝通。因而解決“語義鴻溝”的關(guān)鍵是選擇有效的特征描述語言,能準(zhǔn)確描述圖像特征。商標(biāo)檢索是圖像檢索的一個(gè)子問題。其檢索方式主要有類目檢索、文本檢索和內(nèi)容檢索。由于商標(biāo)對(duì)象的構(gòu)成復(fù)雜多樣,很多商標(biāo)圖像既不易歸類,也不易通過文本方式來描述。
本研究提出了一種新穎的形狀描述子——字母描述子,以其來描述圖像。所謂“字母描述子”就是利用拉丁字母的物象、抽象、意象等性質(zhì),將字母作為描述語言對(duì)圖像進(jìn)行描述編碼和檢索。該方法符合人對(duì)圖像(圖案)的理解方式,并且突破了不同語言的限制,在不同使用人群中具有的魯棒性,適用于多語種環(huán)境下的檢索。比如o代表“圓”,l代表“直線”,是人類共同的認(rèn)知。在人和計(jì)算機(jī)之間搭建了一座橋梁,人可以將圖像的有效特征用“字母描述子”向計(jì)算機(jī)方便地傳達(dá)自己的描述,計(jì)算機(jī)也可以很好地提取和理解這些特征?;凇白帜该枋鲎印钡男螤钐卣髅枋觯梢越o圖像增加一類語義標(biāo)簽,從而改變商標(biāo)檢索的“無從下手”的困境,也為“語義鴻溝”問題提供了一個(gè)新的解決思路。
商標(biāo)和文字同源,是由原始的圖畫、符契發(fā)展而來。兩者在描述思維和描述方法上有共同之處。有研究[1]總結(jié)了漢字和字母文字的結(jié)構(gòu):字素(筆劃或字母)→文(偏旁部首或詞綴詞根)→字(單字或單詞)(該公式中“文”、“字”定義取自許慎《說文解字》)。商標(biāo)也有類似結(jié)構(gòu)和基本元素,如點(diǎn)、線、面是商標(biāo)視覺符號(hào)最基本的構(gòu)成元素。通過分析這些基本元素的特征以及元素之間構(gòu)成的規(guī)律,為商標(biāo)檢索中的有效特征分析提供科學(xué)可行的依據(jù)。商標(biāo)的構(gòu)成和表現(xiàn)手法,直接關(guān)系到商標(biāo)的視覺形態(tài)以及對(duì)商標(biāo)的認(rèn)知。
在人類的圖像理解系統(tǒng)中,底層的圖像描述通過感知分組[2]分層次地不斷組合,最終獲得一個(gè)能夠被推理過程使用的有意義的圖像表達(dá),即構(gòu)成圖像的主要特征。圖像識(shí)別是以圖像的主要特征為判斷依據(jù)的。對(duì)于熟悉的圖形,如果掌握了它的主要特征,就會(huì)把它當(dāng)作一個(gè)單元來識(shí)別,而忽略它的細(xì)節(jié)部分。這種由孤立的單元材料組成的整體單位叫做“組塊”。
經(jīng)過對(duì)大量商標(biāo)圖像進(jìn)行分析,我們認(rèn)為商標(biāo)圖像具有組塊特點(diǎn)。在此,我們將商標(biāo)的結(jié)構(gòu)分為 3個(gè)特征群:① 幾何特征,包括直線、弧線、圓等;② 交點(diǎn)特征,包括A型交點(diǎn)、Y型交點(diǎn)、X型交點(diǎn);③ 邏輯特征,包括對(duì)稱、平行、全包圍等,如圖1所示為商標(biāo)結(jié)構(gòu)的部分特征形式。
圖1 商標(biāo)結(jié)構(gòu)的特征
本研究隨機(jī)選取了一批著名企業(yè)的商標(biāo)進(jìn)行統(tǒng)計(jì),得到如下特征統(tǒng)計(jì)數(shù)據(jù),見表1。我們將超過25%的特征作為顯著特征,包括:直線、弧線、折線、圓、A型交點(diǎn)、Y型交點(diǎn)、X型交點(diǎn)、對(duì)稱、平行、全包圍等,也就是說大部分的商標(biāo)都可用這些結(jié)構(gòu)特征進(jìn)行描述。
表1 商標(biāo)構(gòu)成的特征統(tǒng)計(jì)
將商標(biāo)解構(gòu)成多個(gè)組塊,提煉出基本特征,并用字母作為有效的特征描述語言,向計(jì)算機(jī)傳遞商標(biāo)的形狀特征,這就是本研究——字母描述子的基本理論。
原始字母本是埃及象形字[3],經(jīng)過希臘文字、拉丁文字,演化到現(xiàn)代歐洲文字?,F(xiàn)代字母具有豐富的物象、抽象和意象含義,以及靈活的描述能力。雖然與起源字母的形體、名稱、含義不一定存在嚴(yán)謹(jǐn)?shù)膶?duì)應(yīng)關(guān)系,但是,其象形、象形背后的抽象及意象,以及文字構(gòu)造的思維方法保留了下來。
字母能不能作為一種有效的語言來描述商標(biāo),是由字母本身的含義決定的。已有研究[1,4]通過大量事實(shí)論證了字母具有象形的屬性,比如:Oo象“日”,Cc象“月”,Mm 象“山”,Yy象“河”,Rr象“火”,Aa象“人”;并且,由象形的字母組成的字綴、字根以及整字仍然帶有象形的痕跡,比如:av象“鳥”,cl象“抓”,eye象“眼睛”,bed象“床”,bud象“花”。還有研究[5]分析了英語原始字母宏觀的傾向性語義,比如,H與“隱蔽”、“隱藏”有關(guān),N與“否定”、“連接”有關(guān)。
經(jīng)過深入系統(tǒng)地分析,我們對(duì) 26個(gè)字母含義作了歸納總結(jié),表2列出了其中部分字母的含義。表中:
物象:也稱具象,是對(duì)客觀事物的如實(shí)刻畫。
抽象[6]:是指對(duì)事物非本質(zhì)因素的舍棄和對(duì)本質(zhì)因素的抽取。抽象具有概括性。
意象:物象和抽象事物的屬性,如形狀、顏色、聲音、動(dòng)作、位置、方向、出現(xiàn)時(shí)間、影響等。
表2 部分字母的物象、抽象、意象含義
單個(gè)字母含有較大的信息量,且字母之間具有明顯的差別性,其外形和構(gòu)造保留了最簡潔、最具代表性的特征,可以用來描述圖像特征,尤其是簡練的商標(biāo)圖像,形成字母描述子。如果用字母對(duì)商標(biāo)圖像特征編碼,就可以用字母描述子對(duì)商標(biāo)進(jìn)行檢索。根據(jù)以上的研究和分析,本研究總結(jié)出的字母描述子如表3所示。
表3 字母描述子
即商標(biāo)圖像經(jīng)簡化處理后,其結(jié)構(gòu)特征均可以簡單地用 l、c、o、A、Y、X、M、E、P、O等拉丁字母來描述,即形成特征碼。
本研究開發(fā)了一個(gè)用于商標(biāo)圖像檢索的系統(tǒng),主要有商標(biāo)的導(dǎo)入、預(yù)處理、特征檢測(cè)、特征編碼和檢索等功能。其應(yīng)用過程是:
(1)將導(dǎo)入的商標(biāo)圖像進(jìn)行預(yù)處理,即使用細(xì)化、濾波、腐蝕、膨脹、開閉等算法,去除冗余或干擾信息。
(2)將預(yù)處理后的商標(biāo)特征檢測(cè)出來,并自動(dòng)編寫特征碼(用字母描述子表示)。
(3)將所生成的特征碼作為文件名,保存該商標(biāo)圖像。
(4)重復(fù)以上步驟,建立商標(biāo)圖像庫。
(5)輸入檢索碼(字母描述子表示的特征碼),在圖像庫中檢索出相應(yīng)的商標(biāo)圖像。
以下為應(yīng)用實(shí)例,導(dǎo)入一商標(biāo)圖像,經(jīng)預(yù)處理和特征檢測(cè)后,即自動(dòng)編碼:IoAYXMEPO,并將編碼“IoAYXMEPO”作為文件名保存該商標(biāo)圖像,如圖2所示。
圖2 商標(biāo)的編碼
在檢索時(shí)如輸入檢索碼:IoME,在商標(biāo)圖像庫中,即可檢索出相匹配的商標(biāo)圖像。其結(jié)果按匹配度從大到小排列,如圖3所示。
圖3 商標(biāo)的檢索
以上的檢索方法進(jìn)行了查準(zhǔn)率、查全率及誤檢率作了統(tǒng)計(jì),結(jié)果如表4所示。表中的數(shù)據(jù)表明,本研究提出用字母描述子對(duì)商標(biāo)特征進(jìn)行描述、編碼和檢索的方法具有一定的實(shí)用意義。
表4 查準(zhǔn)率、查全率及誤檢率的統(tǒng)計(jì)
針對(duì)“語義鴻溝”問題,本研究提出了“字母描述子”概念,以此作為商標(biāo)的有效特征描述語言,利用拉丁字母來對(duì)商標(biāo)圖像進(jìn)行描述和檢索。這種檢索方式較為方便,更接近自然語言,符合人的經(jīng)驗(yàn),在圖像檢索方面作了新的嘗試。但“字母描述子”作為特征對(duì)商標(biāo)圖像進(jìn)行編碼和檢索的方法,目前只適用于小數(shù)據(jù)量的范圍。除了以上所提出的10個(gè)描述子外,其他16個(gè)字母有是否待于加以利用;還有字母與數(shù)字是否能相結(jié)合以增加組合,完善圖像的描述體系等,都有待于進(jìn)一步的研究。
[1]袁 立. 字母文字與漢字同構(gòu)象形論[J]. 北京社會(huì)科學(xué), 1999, (2): 151-158.
[2]Qasim Iqbal, Aggarwal J K. Appling perceptual grouping to content-based image retrieval: building images [J].International Conference on Computer Vision and Pattern Recognition, 1999, (1): 42-48.
[3]伊斯特林. 文字的產(chǎn)生和發(fā)展[M]. 北京: 北京大學(xué)出版社, 2002: 284.
[4]袁 立. 字母文字象形論史證鉤沉[J]. 北京社會(huì)科學(xué), 2000, (2): 151-157.
[5]戚建平. 論英語原始字母宏觀傾向性語義[J]. 信息工程學(xué)院學(xué)報(bào), 1996, 15(1): 55-61.
[6]李敏艷. 淺談抽象藝術(shù)[J]. 中國商界, 2008, (7):277.