編譯/張含陽(yáng)
對(duì)抗網(wǎng)絡(luò)生成的藝術(shù)作品為何比人類藝術(shù)家更受歡迎?
編譯/張含陽(yáng)
深度學(xué)習(xí)如何像人類一樣產(chǎn)生“創(chuàng)造力”,一直是AI科學(xué)家們研究的熱點(diǎn)。羅格斯大學(xué)和查爾斯頓學(xué)院近日聯(lián)合發(fā)布了一篇論文,發(fā)布了一種全新的深度學(xué)習(xí)模型——?jiǎng)?chuàng)意對(duì)抗網(wǎng)絡(luò)(Creative Adversarial Networks,CANs)。CAN通過(guò)學(xué)習(xí)風(fēng)格和偏離風(fēng)格規(guī)范來(lái)生成“藝術(shù)作品”。該論文是在2017年6月20日至6月22日在亞特蘭大舉行的第八屆國(guó)際計(jì)算創(chuàng)意大會(huì)(ICCC)發(fā)布的論文的擴(kuò)展版本。
我們提出了一個(gè)新的藝術(shù)創(chuàng)作系統(tǒng)。該系統(tǒng)通過(guò)觀察藝術(shù)和學(xué)習(xí)風(fēng)格來(lái)生成藝術(shù)作品,并通過(guò)偏離學(xué)習(xí)的風(fēng)格增加生成的藝術(shù)的喚醒潛力而變得具有創(chuàng)造性。我們建立了生成對(duì)抗網(wǎng)絡(luò)(GAN),它已經(jīng)顯示出學(xué)習(xí)生成模擬給定分布的新穎圖像的能力。我們認(rèn)為,這樣的網(wǎng)絡(luò)在其原始設(shè)計(jì)中產(chǎn)生創(chuàng)意產(chǎn)品的能力有限。我們提出對(duì)其目標(biāo)的修改,使其能夠通過(guò)最大限度地偏離已建立的風(fēng)格和最小化偏離藝術(shù)品分布來(lái)創(chuàng)造創(chuàng)意藝術(shù)。我們進(jìn)行實(shí)驗(yàn),比較人類測(cè)試者對(duì)所產(chǎn)生的藝術(shù)的反應(yīng),以及他們對(duì)藝術(shù)家創(chuàng)造的藝術(shù)的反應(yīng)。結(jié)果表明,人類測(cè)試者無(wú)法將系統(tǒng)生成的藝術(shù)作品與當(dāng)代藝術(shù)家所產(chǎn)生的藝術(shù)區(qū)分開(kāi)。人類測(cè)試者甚至在某些程度上,對(duì)機(jī)器生成的圖像產(chǎn)生了更高的評(píng)價(jià)。
自從人工智能崛起以來(lái),科學(xué)家一直在探索機(jī)器產(chǎn)生詩(shī)歌、故事、笑話、音樂(lè)、繪畫等人類創(chuàng)意產(chǎn)品的能力,以及對(duì)于創(chuàng)造能力的解決方案。這種能力才是真正顯示人工智能算法是否智能的基礎(chǔ)。在視覺(jué)藝術(shù)方面,已經(jīng)提出了幾種系統(tǒng),不僅在AI和計(jì)算創(chuàng)意領(lǐng)域,而且在計(jì)算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)中,自動(dòng)創(chuàng)建藝術(shù)的算法亦有研究。
在有關(guān)計(jì)算創(chuàng)意的相關(guān)文獻(xiàn)中,提出了不同的算法,專注于發(fā)現(xiàn)各種有效的探索創(chuàng)意空間的方法。幾種方法已經(jīng)使用進(jìn)化過(guò)程,其中算法通過(guò)生成候選者進(jìn)行迭代,使用適應(yīng)度函數(shù)來(lái)評(píng)估它們,然后修改它們以改善下一次迭代的適應(yīng)度分?jǐn)?shù)。通常,該過(guò)程在遺傳算法框架內(nèi)完成。正如DiPaola和Gabora在 2009年所指出的,任何算法的挑戰(zhàn)都集中于“如何編寫具有審美意義的邏輯適應(yīng)度函數(shù)”。一些早期的系統(tǒng)在回路中使用了一個(gè)能夠引導(dǎo)進(jìn)程的人類。在這些互動(dòng)系統(tǒng)中,計(jì)算機(jī)探索創(chuàng)意空間,人類扮演觀察器的角色,其反饋對(duì)于推動(dòng)過(guò)程至關(guān)重要。而最近的系統(tǒng)則強(qiáng)調(diào)了創(chuàng)意過(guò)程中感知和認(rèn)知的作用。
本論文的目的是發(fā)現(xiàn)藝術(shù)生成的計(jì)算創(chuàng)意系統(tǒng),而不需要在創(chuàng)作過(guò)程中涉及到人類藝術(shù)家,但仍然將人類創(chuàng)意產(chǎn)品融入到學(xué)習(xí)過(guò)程中。藝術(shù)生成算法的一個(gè)重要組成部分是將他們的創(chuàng)作過(guò)程與人類藝術(shù)家在時(shí)間上產(chǎn)生的藝術(shù)相關(guān)聯(lián)。我們相信這是重要的,因?yàn)槿祟惖膭?chuàng)作過(guò)程利用了藝術(shù)的先前的經(jīng)驗(yàn)。一位人類藝術(shù)家不斷接受其他藝術(shù)家的作品,并且一直以來(lái)都面對(duì)著各種各樣的藝術(shù)。人類藝術(shù)家如何將過(guò)去藝術(shù)的知識(shí)與他們產(chǎn)生新形式的能力結(jié)合在一起仍然在很大程度上是未知的,這需要一套理論來(lái)建模,如何將藝術(shù)風(fēng)格與藝術(shù)創(chuàng)作相結(jié)合。
科林·馬丁代爾(Colin M artindale,1943-2008)提出了一種解釋新藝術(shù)創(chuàng)作的心理學(xué)理論。他假設(shè),在任何時(shí)候,創(chuàng)意藝術(shù)家都試圖增加藝術(shù)的喚醒潛力來(lái)推動(dòng)改變慣性。然而,這種增長(zhǎng)必須是最小的,以避免觀察器的負(fù)面反應(yīng)(最不努力的原則)。馬丁代爾還假設(shè),當(dāng)藝術(shù)家在風(fēng)格的角色中發(fā)揮其他手段時(shí),風(fēng)格的突破就是增加藝術(shù)的喚醒潛力的一種方式。本文提出的方法靈感來(lái)自于馬丁代爾的最小努力原則和他對(duì)風(fēng)格的分析。在試圖解釋藝術(shù)進(jìn)步的理論中,我們發(fā)現(xiàn)馬丁代爾的理論是在計(jì)算上可行的。
深層神經(jīng)網(wǎng)絡(luò)最近在推動(dòng)各種應(yīng)用領(lǐng)域的人工智能方面發(fā)揮了轉(zhuǎn)型作用。特別需要指出的是,人類已經(jīng)提出了幾個(gè)具有生成新穎圖像以模擬給定訓(xùn)練分布的生成深層網(wǎng)絡(luò)。生成對(duì)抗網(wǎng)絡(luò)(GAN)已經(jīng)非常成功地實(shí)現(xiàn)了這一目標(biāo)。我們認(rèn)為,這樣的網(wǎng)絡(luò)在其原始設(shè)計(jì)中產(chǎn)生創(chuàng)意作品的能力有限。靈感來(lái)自于馬丁代爾的理論,在本文中,我們提出修改GAN的目標(biāo),使其能夠通過(guò)最大化偏離已建立的風(fēng)格同時(shí)最大限度地減少偏離藝術(shù)品分布來(lái)創(chuàng)造創(chuàng)意藝術(shù)。
圖1 顯示了生成的圖像的樣本
圖2 CAN系統(tǒng)框架圖
在提出的創(chuàng)意對(duì)抗網(wǎng)絡(luò)(CAN)中,發(fā)生器被設(shè)計(jì)為接收來(lái)自鑒別器的兩個(gè)信號(hào),作為兩個(gè)相互矛盾的力量,以實(shí)現(xiàn)三點(diǎn):
1)生成新作品;
2)新作品不應(yīng)該太新,它不應(yīng)該遠(yuǎn)離分布,否則會(huì)產(chǎn)生太多的喚醒,從而根據(jù)W undt曲線激活厭惡系統(tǒng)并落入負(fù)面特征范圍;
3)生成的作品應(yīng)該增加風(fēng)格的模糊性。
類似于生成對(duì)抗網(wǎng)絡(luò)(GAN),CAN具有兩個(gè)對(duì)手網(wǎng)絡(luò),一個(gè)鑒別器和一個(gè)發(fā)生器。鑒別器可以使用與風(fēng)格標(biāo)簽(文藝復(fù)興、巴洛克風(fēng)格、印象派、表現(xiàn)主義等)相關(guān)的大量藝術(shù)品,并使用它來(lái)學(xué)習(xí)區(qū)分風(fēng)格。生成器無(wú)法訪問(wèn)任何藝術(shù)品,它從隨機(jī)輸入中生成藝術(shù),但與GAN不同,它從鑒別器接收兩個(gè)信號(hào),以生成其任何作品。
第一個(gè)信號(hào)是鑒別器對(duì)“藝術(shù)與非藝術(shù)”的分類。在傳統(tǒng)的GAN中,該信號(hào)使得發(fā)生器能夠改變其權(quán)重,以產(chǎn)生更頻繁地欺騙鑒別器關(guān)于它是否來(lái)自相同分布的圖像。由于我們案例中的鑒別器是對(duì)藝術(shù)進(jìn)行了訓(xùn)練的,所以這將表明鑒別器是否認(rèn)為所產(chǎn)生的藝術(shù)來(lái)自與知道的實(shí)際藝術(shù)相同的分布。在這個(gè)意義上,這個(gè)信號(hào)標(biāo)示出鑒別器是否認(rèn)為呈現(xiàn)給它的圖像是“藝術(shù)還是非藝術(shù)”。由于發(fā)生器僅接收到該信號(hào),所以它將最終收斂以產(chǎn)生將模擬藝術(shù)的圖像。
發(fā)生器接收的第二個(gè)信號(hào)是關(guān)于鑒別器可以將生成的藝術(shù)分類成已建立樣式的信號(hào)。如果發(fā)生器生成了鑒別器認(rèn)為是藝術(shù)的圖像,并且也可以容易地分類成已建立的樣式之一,則發(fā)生器將愚弄鑒別器以相信它產(chǎn)生符合已建立樣式的實(shí)際藝術(shù)。相比之下,創(chuàng)意發(fā)生器將嘗試產(chǎn)生混淆鑒別器的藝術(shù)。一方面,它試圖欺騙鑒別器認(rèn)為它是“藝術(shù)”,另一方面它試圖混淆鑒別器所產(chǎn)生的作品風(fēng)格。
這兩個(gè)信號(hào)是矛盾的力量,因?yàn)榈谝粋€(gè)信號(hào)推動(dòng)發(fā)生器產(chǎn)生鑒別器接受為“藝術(shù)”的作品,但是如果它在已建立的樣式的規(guī)則中成功,則鑒別器也將能夠?qū)ζ滹L(fēng)格進(jìn)行分類。 那么第二個(gè)信號(hào)將會(huì)對(duì)發(fā)生器造成嚴(yán)重的懲罰。 這是因?yàn)榈诙€(gè)信號(hào)推動(dòng)發(fā)生器產(chǎn)生風(fēng)格模糊的作品。 因此,這兩個(gè)信號(hào)在一起應(yīng)該推動(dòng)發(fā)生器探索靠近藝術(shù)分布的創(chuàng)意空間。
張含陽(yáng) 本刊編輯