周 淼,蔣 瀾,楊越茗
(1.東北大學(xué)機(jī)械工程與自動(dòng)化學(xué)院,遼寧沈陽(yáng) 110819;2.東北大學(xué)醫(yī)學(xué)與生物信息工程學(xué)院,遼寧沈陽(yáng) 110819;3.沈陽(yáng)市城市建設(shè)學(xué)院,遼寧沈陽(yáng) 110004)
在機(jī)械設(shè)計(jì)制造中,產(chǎn)品的美觀度直接影響產(chǎn)品的形象,從藝術(shù)設(shè)計(jì)美學(xué)視角出發(fā),使功能與審美相符合,以達(dá)到最優(yōu)的綜合設(shè)計(jì)效果。
設(shè)計(jì)藝術(shù)風(fēng)格的智能識(shí)別可實(shí)現(xiàn)機(jī)械設(shè)計(jì)產(chǎn)品智能數(shù)據(jù)庫(kù)風(fēng)格自動(dòng)檢索及后續(xù)特定風(fēng)格的參數(shù)化設(shè)計(jì),但現(xiàn)有的設(shè)計(jì)藝術(shù)風(fēng)格智能識(shí)別多僅將藝術(shù)風(fēng)格進(jìn)行量化,以情感識(shí)別和圖像淺層特征提取相關(guān)的研究為主。
如日本多所大學(xué)提出感性媒體研究,并實(shí)現(xiàn)了文獻(xiàn)[1?2]情感圖像檢索原型系統(tǒng);文獻(xiàn)[3]給出一個(gè)圖像情感語(yǔ)義提取的結(jié)構(gòu)框架,指出圖像中的各因素和情感之間有很大的關(guān)系,實(shí)現(xiàn)了圖像的情感語(yǔ)義分類和檢索;文獻(xiàn)[4]提出一種基于信息熵的藝術(shù)風(fēng)格分類算法,計(jì)算圖像的顏色熵、分塊熵和輪廓熵,并用支持向量機(jī)(SVM)實(shí)現(xiàn)分類。
它們大多忽略了人類審美的主要特點(diǎn)是主觀性,文獻(xiàn)[5]提出:藝術(shù)活動(dòng)首先是一個(gè)情感性的精神過(guò)程,任何一項(xiàng)科學(xué)性的藝術(shù)研究必然屬于心理學(xué)范疇。
按照設(shè)計(jì)藝術(shù)學(xué)的學(xué)科解釋,對(duì)設(shè)計(jì)師及其作品的風(fēng)格研究,同樣屬于心理學(xué)范疇。
上述研究由于隔斷了人類認(rèn)知機(jī)理和風(fēng)格分類識(shí)別的關(guān)系,相對(duì)而言存在特征篩選困難、算法內(nèi)在機(jī)制可解釋性差等問(wèn)題。
可見(jiàn),要讓計(jì)算機(jī)對(duì)設(shè)計(jì)作品的風(fēng)格做出快速、令人信服的判別,必須建立在人的生理反饋、心理情感、風(fēng)格文脈意義之上,即找到人的認(rèn)知層與機(jī)器學(xué)習(xí)卷積層映射關(guān)系。由此,以人的認(rèn)知機(jī)理為基礎(chǔ)來(lái)研究設(shè)計(jì)風(fēng)格智能分析技術(shù)是必要的。
研究以人類認(rèn)知機(jī)理為出發(fā)點(diǎn),結(jié)合人類認(rèn)知神經(jīng)網(wǎng)絡(luò)(Ar‐tificial Cognitive Neural Network,ACNN),創(chuàng)新性地將人類認(rèn)知機(jī)理用于網(wǎng)絡(luò)決策,對(duì)各層特征可視化后結(jié)合人類對(duì)各層特征圖的認(rèn)知調(diào)整網(wǎng)絡(luò)參數(shù),同時(shí)融入人類認(rèn)知輔助結(jié)構(gòu)使對(duì)分類起重要作用的特征得到更好的篩選,對(duì)以人類認(rèn)知機(jī)理為出發(fā)點(diǎn)的設(shè)計(jì)藝術(shù)風(fēng)格智能識(shí)別方法進(jìn)了有益的探索并將其用于機(jī)械美學(xué)設(shè)計(jì),有效地解決了人類認(rèn)知和設(shè)計(jì)藝術(shù)風(fēng)格識(shí)別間的隔斷問(wèn)題和機(jī)械產(chǎn)品外觀設(shè)計(jì)問(wèn)題,具有一定的創(chuàng)新性和優(yōu)越性。
人對(duì)藝術(shù)風(fēng)格的認(rèn)知構(gòu)成分為三個(gè)層面,即行為層、本能層和反思層,如圖1所示。
圖1 藝術(shù)風(fēng)格識(shí)別的認(rèn)知基礎(chǔ)Fig.1 The Cognitive Basis of Artistic Style Recognition
人之所以能快速準(zhǔn)確地對(duì)設(shè)計(jì)作品的藝術(shù)風(fēng)格進(jìn)行主觀判定,是基于原始設(shè)計(jì)圖像的分析(行為、反思層),結(jié)合生理、心理感受(本能層)等情感問(wèn)題的主觀推理和判斷,需要建立在知識(shí)、規(guī)則學(xué)習(xí)和文化、情感傳承的基礎(chǔ)之上。在邏輯層面,本質(zhì)上是一個(gè)將多維圖像特征映射到認(rèn)知層次的過(guò)程。
人類認(rèn)知的行為層,是對(duì)視覺(jué)元素獲取階段,在算法中表現(xiàn)圖像卷積淺層特征提取,如色彩、形狀、紋理及空間方面構(gòu)成等設(shè)計(jì)師構(gòu)成風(fēng)格手法的行為元素;人類認(rèn)知的本能層,在算法中表現(xiàn)為語(yǔ)義特征提取,包含了人在審美過(guò)程中生理感受(色調(diào)、光色、明度)和心理語(yǔ)義(情感因子)等本能層次;人類認(rèn)知的反思層,在算法中表現(xiàn)為圖像卷積深層特征提取,模擬人類通過(guò)邏輯推理和識(shí)別典型文化符號(hào)(如柱頭、穹頂、花紋等)引發(fā)的文化聯(lián)想和審美同情,通過(guò)語(yǔ)義(文化符號(hào)形成的特定文脈、故事、隱喻)匹配判斷圖像屬于某些風(fēng)格。
網(wǎng)絡(luò)總體架構(gòu)設(shè)計(jì),如圖2所示,主體由1個(gè)輸入層、9層卷積層、3層池化層、1個(gè)全連接層和1個(gè)輸出層組成。
圖2 網(wǎng)絡(luò)總體架構(gòu)Fig.2 Overall Network Architecture
基于人類認(rèn)知機(jī)理的設(shè)計(jì)風(fēng)格識(shí)別網(wǎng)絡(luò)總體架構(gòu)根據(jù)VG‐GNet使用數(shù)個(gè)VGGBlock堆疊的原理,設(shè)計(jì)了由卷積層、sigmoid激活和池化層構(gòu)成的Block。此外,VGGNet模型驗(yàn)證了增加網(wǎng)絡(luò)深度可以有效提升模型性能這一結(jié)論,它具有不同的配置體系結(jié)構(gòu),其中含有8 個(gè)卷積層的VGGNet?11 和含有10 個(gè)卷積層的VGGNet?13有相對(duì)簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu)和較好的分類效果,由此,在主體網(wǎng)絡(luò)中探索性地設(shè)計(jì)了9層卷積層以實(shí)現(xiàn)計(jì)算量和輸出特性的最優(yōu)化,即主體網(wǎng)絡(luò)分為3個(gè)Block,各Block對(duì)應(yīng)的卷積層數(shù)量為(2,3,4)。
在主體網(wǎng)絡(luò)架構(gòu)完成后,受GoogleNet中inception結(jié)構(gòu)的啟發(fā),在網(wǎng)絡(luò)深度和寬度較大時(shí),為處理龐大數(shù)量的參數(shù),可采用聚類的方法提高計(jì)算性能。由此,設(shè)計(jì)了人類認(rèn)知輔助結(jié)構(gòu),讓對(duì)分類識(shí)別起決定性作用的層次的卷積輸出聚集,為其附加權(quán)重,使網(wǎng)絡(luò)重點(diǎn)提取符合人類認(rèn)知機(jī)理的特征,進(jìn)一步提高分類的準(zhǔn)確率。
先使用建立室內(nèi)風(fēng)格圖片數(shù)據(jù)集對(duì)主體網(wǎng)絡(luò)預(yù)訓(xùn)練,初步確定各層所對(duì)應(yīng)的參數(shù);在可視化ACNN的各通道特征后,通過(guò)設(shè)計(jì)師對(duì)特征人工篩選對(duì)室內(nèi)藝術(shù)風(fēng)格判定發(fā)揮重要作用的卷積層,在這些卷積層后添加人類認(rèn)知輔助結(jié)構(gòu),為其附加權(quán)重,使網(wǎng)絡(luò)著重訓(xùn)練對(duì)藝術(shù)風(fēng)格分類更有效的特征,最終四種分類結(jié)果由所有分類器的加權(quán)輸出決定。
首先用卷積對(duì)設(shè)計(jì)圖像進(jìn)行特征的提取。每一次卷積相當(dāng)于一次映射,則輸出可表示為[6]:
式中:x—輸入的一張三維圖像;w—使用的一個(gè)三維卷積核,將對(duì)應(yīng)元素相乘求和;其中l(wèi)、i?l—所在位置的行;m、j?m—所在列;n、k?n—所在頁(yè)。
若訓(xùn)練集中樣本圖片達(dá)到足夠多數(shù)量,最終卷積核會(huì)訓(xùn)練成線條、紋理等待提取的特征。
卷積獲得特征之后,需要利用這些特征去做藝術(shù)風(fēng)格分類。如果把所有計(jì)算得到的特征關(guān)聯(lián)到一個(gè)分類器上,會(huì)導(dǎo)致計(jì)算量非常大,且極容易出現(xiàn)過(guò)擬合。由此,引入隨機(jī)文獻(xiàn)[7]進(jìn)行特征壓縮和簡(jiǎn)化計(jì)算,,以池化域中每個(gè)元素的權(quán)重為概率進(jìn)行依概率抽樣,首先通過(guò)歸一化區(qū)域內(nèi)的激活來(lái)計(jì)算每個(gè)區(qū)域的概率。
式中:pi—某一特定元素對(duì)應(yīng)的概率;分子ai—這一元素的值,分母為全部元素值的和。
隨機(jī)池化的結(jié)果為sj:
式中:從基于p的多項(xiàng)分布中抽樣,l—在區(qū)域內(nèi)選擇的一個(gè)位置。
特征圖中的元素按照其概率值大小被隨機(jī)選擇,元素?cái)?shù)值大則選中幾率大,優(yōu)點(diǎn)在于風(fēng)格判定中既能較好地保留整體數(shù)據(jù)的特征,突出室內(nèi)設(shè)計(jì)圖像的背景信息;又能保留較多的圖像細(xì)節(jié)紋理特征。
由于softmax分類器能學(xué)習(xí)、理解非常復(fù)雜和非線性的映射關(guān)系,ACNN的主體網(wǎng)絡(luò)和人類認(rèn)知輔助結(jié)構(gòu)中的分類器都采用軟最大輸出函數(shù)softmax[8]。
式中:xi—i通道輸入信號(hào);exp(xi)—以自然常數(shù)e為底的指數(shù)函數(shù)。
藝術(shù)風(fēng)格是一種高度抽象的信息,它很大程度上是人類認(rèn)知對(duì)外界美的反映。在完成特征提取后,通常直接將提取出來(lái)的特征經(jīng)全連接層輸入分類器中進(jìn)行分類,但深度學(xué)習(xí)對(duì)圖像的分類過(guò)程往往具有不可見(jiàn)性,多數(shù)情況下不能很好地反映人類認(rèn)知,這樣得出的分類結(jié)果往往具有盲目性。而利用特征可視化可以窺探ACNN網(wǎng)絡(luò)內(nèi)部機(jī)理,理解網(wǎng)絡(luò)節(jié)點(diǎn)如何學(xué)習(xí)特征,幫助優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),并進(jìn)一步提高模型對(duì)人類認(rèn)知機(jī)理的模擬能力。
由此,ACNN網(wǎng)絡(luò)特征可視化從橫向、縱向、相關(guān)組三個(gè)角度進(jìn)行,它的優(yōu)點(diǎn)主要在于:①了解網(wǎng)絡(luò)的工作原理,找出網(wǎng)絡(luò)進(jìn)行決策判定的依據(jù),提升網(wǎng)絡(luò)的可理解水平。②利用可視化實(shí)現(xiàn)人類認(rèn)知與網(wǎng)絡(luò)內(nèi)部信息的交互,利用現(xiàn)實(shí)世界中人類的真實(shí)認(rèn)知構(gòu)建更好反映人類認(rèn)知機(jī)理的分類網(wǎng)絡(luò)。
4.2.1 橫向可視化分析
橫向可視化,即對(duì)不同卷積核卷積操作后的輸出進(jìn)行分析,如圖4中1(a)所示。利用激活最大化方法,尋找一個(gè)輸入圖像使某個(gè)通道激活響應(yīng)最大來(lái)生成可視化特征圖,此可視化圖能最大地反映出對(duì)應(yīng)卷積核從全體輸入樣本中學(xué)習(xí)到的某種特征,同時(shí)將其他特征的干擾降到最小。
訓(xùn)練網(wǎng)絡(luò)后,設(shè)cij(θ,X)為ACNN網(wǎng)絡(luò)中第j層中單元i的激活,cij是參數(shù)θ和輸入樣本X的函數(shù),即通道特征可視化轉(zhuǎn)化為尋找輸入Xmax,Xmax表示當(dāng)cij(θ,X)最大時(shí)X的取值。
為了尋找Xmax,使用梯度上升法對(duì)輸入圖像X進(jìn)行隨機(jī)值初始化,然后設(shè)置學(xué)習(xí)速率β,計(jì)算cij(θ,X)的梯度,在梯度方向上調(diào)整輸入圖像X,進(jìn)行迭代:
橫向可視化輸出圖像,如圖3中2(a)所示。
圖3 ACNN網(wǎng)絡(luò)卷積層特征可視化Fig.3 ACNN Network Convolutional Layer Feature Visualization
4.2.2 縱向可視化分析
縱向可視化,即對(duì)不同通道相同空間位置的輸出結(jié)果的分析,如圖4中1(b)所示。由于單個(gè)神經(jīng)元可視化僅能反映極少數(shù)輸入圖像的特征,而從縱向空間位置角度組合神經(jīng)元特征能將ACNN網(wǎng)絡(luò)提取到的輸入樣本圖像特征可視化為符合人類認(rèn)知,可以理解共情的圖形。一個(gè)卷積層特定對(duì)應(yīng)位置所有神經(jīng)元的特征加權(quán)和形成空間位置特征,可視化縱向位置格激活向量提取的特征,能夠幫助分析和理解輸入室內(nèi)設(shè)計(jì)圖像不同位置紋理、對(duì)象的特征信息。
利用式(7)將各計(jì)算完的單元位置格可視化圖像拼接組合??v向可視化輸出圖像,如圖3中2(b)所示。
4.2.3 相關(guān)組可視化分析
以上兩類可視化分析僅限于表達(dá)圖像空間位置或者單獨(dú)一種特征模式。相關(guān)組可視化通過(guò)非負(fù)矩陣分解找到卷積層中高度相關(guān)的神經(jīng)元組以辨別更有意義的神經(jīng)元組合方式,使可視化分析更容易被人類理解。這樣的非負(fù)矩陣分組方法反映了人類認(rèn)知機(jī)理過(guò)程,即“局部組合推出整體認(rèn)知”,具有認(rèn)知語(yǔ)義意義。
可將L近似分解為基矩陣G和系數(shù)矩陣F:
式中:L—卷積層激活,設(shè)該卷積層有k個(gè)大小為(a×b)的通道,即構(gòu)成(a×b×k)維矩陣。s—分組的神經(jīng)元組的數(shù)量,s?a,b,k,相關(guān)組可視化結(jié)果Q為:
即得到結(jié)果為系數(shù)矩陣F作為權(quán)重系數(shù)的各通道Hx特征加權(quán)和。利用非負(fù)矩陣分解特定卷積層中高度相關(guān)的神經(jīng)元組,用式(8)得到系數(shù)矩陣F作為權(quán)重,用式(9)計(jì)算通道加權(quán)和[10],得到的可視化結(jié)果與人類認(rèn)知分類存在更好的擬合效果,獲得的語(yǔ)義信息也更強(qiáng)。相關(guān)組可視化輸出圖像,如圖3中2(c)所示。
在特征提取和三種網(wǎng)絡(luò)可視化完成后,通過(guò)利用網(wǎng)絡(luò)索引得到的數(shù)據(jù)集預(yù)訓(xùn)練ACNN網(wǎng)絡(luò),結(jié)合人類對(duì)各可視化特征圖的認(rèn)知將各層參數(shù)進(jìn)行調(diào)整,即根據(jù)看到的可視化圖片信息多少、獲得全局特征的優(yōu)劣和與人類認(rèn)知三個(gè)層次的符合程度進(jìn)行卷積核大小、步長(zhǎng)、個(gè)數(shù)的調(diào)整,參數(shù)調(diào)整能及時(shí)修復(fù)網(wǎng)絡(luò)缺陷,預(yù)訓(xùn)練能顯著地減少正式實(shí)驗(yàn)時(shí)訓(xùn)練的時(shí)間,調(diào)整后網(wǎng)絡(luò)各層的參數(shù),如表1所示。
表1 ACNN網(wǎng)絡(luò)各層參數(shù)詳細(xì)信息Tab.1 Parameter Details of Each Layer of Network
可視化各卷積層通道特征后,人工觀察其中更符合人審美習(xí)慣,對(duì)藝術(shù)風(fēng)格判定有重要作用的三層通道,可視化示例,如圖4所示。卷積層2傾向于提取人類認(rèn)知行為層面特征,從特征圖中可以看出具有明顯排列規(guī)律的紋理,交錯(cuò)的顏色塊和平面凹凸空間分布。卷積層5傾向于提取人類認(rèn)知本能層面特征,卷積層5可視化后的特征圖中多種不同元素組合構(gòu)成有濃烈情感色彩的意境,其明艷度高,色相較全,元素花紋復(fù)雜,突出高貴優(yōu)雅、奢華大氣的場(chǎng)景,給人一種古典繁復(fù)鮮艷奢華的情感感受。
圖4 微調(diào)模型重要通道可視化示例Fig.4 Examples of Fine Tuning Model Important Channel Visualization
卷積層8傾向于提取人類認(rèn)知反思層面特征,其可視化后的特征圖中可看出迭級(jí)多層次吊頂、直線石膏板線條、輪廓和轉(zhuǎn)折部分有對(duì)稱而富有節(jié)奏感的曲線等典型元素,表現(xiàn)出濃郁的古典主義風(fēng)格。
選取卷積層2、卷積層5和卷積層8,在其后添加人類認(rèn)知輔助結(jié)構(gòu),并附加權(quán)重,讓人類認(rèn)知機(jī)理的層面融合到網(wǎng)絡(luò)分類識(shí)別中,促使網(wǎng)絡(luò)重點(diǎn)訓(xùn)練符合人類認(rèn)知機(jī)理過(guò)程的特征,加大能對(duì)應(yīng)人類認(rèn)知的卷積層的特征相應(yīng)權(quán)重。人類認(rèn)知輔助結(jié)構(gòu)由隨機(jī)池化(Stochastic Pooling)層、全連接層和Softmax 分類器構(gòu)成,并用Dropout緩解過(guò)擬合,詳細(xì)信息,如表2所示。
表2 人類認(rèn)知輔助結(jié)構(gòu)詳細(xì)信息Tab.2 Details of Human Cognitive Aids
人類認(rèn)知輔助結(jié)構(gòu)中隨機(jī)池化層輸出大小和Dropout 輸出大小取決于對(duì)應(yīng)卷積層通道數(shù)量,全連接層和Softmax輸出大小由分類類別所決定。
針對(duì)有關(guān)設(shè)計(jì)藝術(shù)風(fēng)格圖像分類識(shí)別相關(guān)研究較少,開(kāi)源數(shù)據(jù)集難以獲得的情況,使用Image?Downloader爬蟲(chóng)工具,分別使用歐式復(fù)古(古典主義)、歐式現(xiàn)代(現(xiàn)代主義)、中式復(fù)古(明清風(fēng)格)和中式現(xiàn)代(新中式)等關(guān)鍵詞各自爬取了5000張圖建立訓(xùn)練庫(kù)。
據(jù)上述對(duì)各卷積層所提取特征的可視化情況,提取符合人類認(rèn)知機(jī)理行為、本能、反思三個(gè)層面的特征的卷積層2、卷積層5、卷積層8中人類認(rèn)知輔助結(jié)構(gòu)分別加以0.15的權(quán)重參與模型訓(xùn)練和室內(nèi)設(shè)計(jì)風(fēng)格分類,主體網(wǎng)絡(luò)中的總分類器占0.55權(quán)重。這樣做能重點(diǎn)訓(xùn)練符合人類認(rèn)知機(jī)理的特征,并使這些特征的作用放大,使其對(duì)最終分類結(jié)果產(chǎn)生直接影響,減少不必要信息的干擾和重要信息的損失。引入準(zhǔn)確率(Accuracy)來(lái)評(píng)估網(wǎng)絡(luò)對(duì)藝術(shù)風(fēng)格的分類結(jié)果,表示為:
式中:TP—將正類預(yù)測(cè)為正類的個(gè)數(shù)(正—正);TN—負(fù)?負(fù);FP—負(fù)?正;FN—正?負(fù)。
對(duì)室內(nèi)設(shè)計(jì)圖像藝術(shù)風(fēng)格的分類識(shí)別準(zhǔn)確率實(shí)驗(yàn)結(jié)果,如圖6所示。橫軸為所用于訓(xùn)練的室內(nèi)設(shè)計(jì)藝術(shù)風(fēng)格圖像數(shù)據(jù)庫(kù)容量,四條曲線分別代表歐式復(fù)古(古典主義)、歐式現(xiàn)代(現(xiàn)代主義)、中式復(fù)古(明清風(fēng)格)和中式現(xiàn)代(新中式)各自的分類識(shí)別準(zhǔn)確率,由圖可知,四類藝術(shù)風(fēng)格的分類準(zhǔn)確率隨著訓(xùn)練樣本的增加大致呈增加趨勢(shì),說(shuō)明在一定范圍內(nèi),增加輸入樣本可以提高網(wǎng)絡(luò)的分類準(zhǔn)確率,且當(dāng)數(shù)據(jù)庫(kù)容量達(dá)到5000時(shí),上述四類藝術(shù)風(fēng)格的分類識(shí)別準(zhǔn)確率分別為:93.7%,92.0%,93.1%,91.6%。
圖5 室內(nèi)設(shè)計(jì)四種藝術(shù)風(fēng)格分類判斷準(zhǔn)確率Fig.5 Accuracy of Classification Judgment of Four Art Styles in Interior Design
為了驗(yàn)證添加人類認(rèn)知輔助結(jié)構(gòu)對(duì)于室內(nèi)設(shè)計(jì)藝術(shù)風(fēng)格分類的有效性、重要性,分別在ACNN 網(wǎng)絡(luò)共9個(gè)卷積層分別添加人類認(rèn)知輔助結(jié)構(gòu),加以0.15的權(quán)重參與模型訓(xùn)練和分類,主體網(wǎng)絡(luò)中的總分類器占0.85權(quán)重。實(shí)驗(yàn)結(jié)果,如表3所示。實(shí)驗(yàn)1為對(duì)照組,不改動(dòng)原始網(wǎng)絡(luò)結(jié)構(gòu)。表中實(shí)驗(yàn)3、6、9顯示,根據(jù)網(wǎng)絡(luò)可視化分析并結(jié)合人類認(rèn)知機(jī)理選取的卷積層2、卷積層5、卷積層8是適合添加人類認(rèn)知輔助結(jié)構(gòu)的卷積層,它們能較明顯地提高分類準(zhǔn)確率,而其他卷積層對(duì)分類準(zhǔn)確率影響較小甚至起到負(fù)面影響,這說(shuō)明ACNN網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化有一定的必要性和先進(jìn)性。
表3 各層添加人類認(rèn)知輔助結(jié)構(gòu)后準(zhǔn)確率對(duì)比Tab.3 Accuracy Comparison in Interior Design
同時(shí)需要說(shuō)明的是:(1)囿于存在不同藝術(shù)風(fēng)格評(píng)判標(biāo)準(zhǔn),研究基于人類認(rèn)知的藝術(shù)風(fēng)格分類算法可能與基于其他評(píng)判標(biāo)準(zhǔn)的算法,在輸出藝術(shù)風(fēng)格類別上存在少量差異;(2)囿于現(xiàn)有藝術(shù)風(fēng)格存在融合交叉趨勢(shì),某些室內(nèi)設(shè)計(jì)不能單獨(dú)用一種藝術(shù)風(fēng)格進(jìn)行定義,導(dǎo)致符合要求、有確切一種藝術(shù)風(fēng)格定義的數(shù)據(jù)集難以獲得且分類識(shí)別過(guò)程中輸出結(jié)果的準(zhǔn)確率提升較為困難。進(jìn)一步增加訓(xùn)練數(shù),擴(kuò)展訓(xùn)練庫(kù)的圖片類型,將輸入輸出作為映射對(duì)存入,建立機(jī)械設(shè)計(jì)藝術(shù)風(fēng)格數(shù)據(jù)庫(kù)。當(dāng)用戶輸入主空間設(shè)計(jì)圖時(shí),通過(guò)ACNN網(wǎng)絡(luò)識(shí)別出對(duì)應(yīng)風(fēng)格和輸出各參數(shù),在數(shù)據(jù)庫(kù)中查找符合的子空間配置,測(cè)試結(jié)果,如圖6所示。
圖6 機(jī)械美學(xué)設(shè)計(jì)應(yīng)用輸入輸出Fig.6 Mechanical Aesthetic Design Applies Input and Output
基于人類認(rèn)知機(jī)理提出的ACNN網(wǎng)絡(luò)模型,能通過(guò)橫向、縱向、相關(guān)組可視化找出最能反映人類認(rèn)知機(jī)理三層次的卷積層,并在其后加入人類認(rèn)知輔助結(jié)構(gòu)優(yōu)化網(wǎng)絡(luò)模型,使其對(duì)于人類認(rèn)知機(jī)理有較好的擬合效果,更適用于設(shè)計(jì)藝術(shù)風(fēng)格的智能識(shí)別分類任務(wù)。
實(shí)驗(yàn)結(jié)果表明ACNN網(wǎng)絡(luò)模型在分類識(shí)別上準(zhǔn)確率平均達(dá)92.6%,并驗(yàn)證了在適當(dāng)卷積層添加人類認(rèn)知輔助結(jié)構(gòu)后準(zhǔn)確率平均提升2.23%。其成果可用于提供個(gè)性化機(jī)械產(chǎn)品設(shè)計(jì)、提高空間場(chǎng)所內(nèi)設(shè)計(jì)風(fēng)格的一致性、實(shí)現(xiàn)藝術(shù)風(fēng)格的數(shù)字化管理等,有助于在人類美學(xué)認(rèn)知與智能設(shè)計(jì)之間搭建橋梁,為機(jī)械美學(xué)設(shè)計(jì)提供指導(dǎo),讓智能算法更好地為人類服務(wù)。