阿離
每每談到AI替代人類工作這個話題,更多時候還是以重復(fù)、機械式工作為主,可當(dāng)某一天AI能夠在創(chuàng)造力上同人類一較高低,會是怎樣一番情景呢?
前不久,一款登頂50個國家免費榜的APP就讓人們重新認識了AI在創(chuàng)造力方面的應(yīng)用,在畫畫這個需要靈感和天賦的領(lǐng)域,一款名為Dream By Wombo的智能夢境生成器軟件成功刷爆了全球網(wǎng)友社交圈??吹竭@些精美的圖畫,你能相信它們是由原本“沒有情感”的AI創(chuàng)作的嗎(如圖1)?
圖1 網(wǎng)絡(luò)上的Dream By Wombo作品
Dream By Wombo本身是一款使用人工智能(AI)來生成復(fù)雜藝術(shù)作品的應(yīng)用。用戶只需輸入提示(或從Dream的建議中進行選擇,如“未來城市”、“鉆石樹”等),然后選擇一種藝術(shù)風(fēng)格,如Dali、Fantasy或Steampunk等。然后,用戶可以實時觀看Dream By Wombo根據(jù)這些輸入創(chuàng)建藝術(shù)品的全過程。
Dream By Wombo使用的是CLIP引導(dǎo)的方法,CLIP是人工智能實驗室 OpenAI 的一個開源的神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)使用了互聯(lián)網(wǎng)上的“圖像-文字描述”配對訓(xùn)練,并且可以評估用戶提供的文字描述與圖像的關(guān)聯(lián)程度。
為了生成藝術(shù)作品,Dream 模型從一個隨機生成的向量開始,即圖像的數(shù)學(xué)表示。向量中的每個條目對應(yīng)于圖像的一個微小細節(jié)。有些可能對應(yīng)于顏色,有些對應(yīng)于形狀,有些對應(yīng)于更抽象的含義。通常隨機向量首先對應(yīng)于一個灰色的像素塊。然后,該算法使用 CLIP 來確定當(dāng)前矢量圖像與用戶提示的對應(yīng)程度,并在多次迭代中改進對應(yīng)關(guān)系。用戶實時觀看算法執(zhí)行此過程;該應(yīng)用程序會在最終產(chǎn)品出現(xiàn)之前創(chuàng)建多個圖像。過程的隨機性意味著 Dream 永遠不會兩次制作相同的藝術(shù)品,就如同人們很難做兩個同樣的夢一樣。
用戶在Dream By Wombo中輸入一個單詞或短語作為提示,并使用算法(通過暴露于大量不同的圖像來訓(xùn)練)來生成完全獨特的原創(chuàng)藝術(shù)品。Dream By Wombo使用較為簡單,不過目前尚未有中文版本,因此國內(nèi)英文不太好的用戶使用起來可能會稍微慢一些。
下載并啟動Dream By Wombo軟件后,可以看到其主界面較為簡潔,啟動軟件后用戶可以根據(jù)自己的夢境在“Enter prompt”框中輸入一些英文單詞作為關(guān)鍵詞使用,再根據(jù)個人愛好選擇使用一個藝術(shù)風(fēng)格。Dream By Wombo當(dāng)前默認提供了巴洛克、蒸汽朋克、漫畫等二十多種畫風(fēng)可選,選定完成后點擊“Create”按鈕就能自動生成一張對應(yīng)的AI畫作(如圖2)。
圖2 關(guān)鍵詞最好為英文單詞
非常有意思的是Dream By Wombo每次作畫的結(jié)果都是不同的,即便是用戶使用了相同的關(guān)鍵字和藝術(shù)風(fēng)格,其生成的畫作可能在大體感覺上比較類似,但細微的差別總是存在,這或許也是AI作畫的魅力所在吧!
值得一提的是在Dream By Wombo之前,其實已經(jīng)有不少AI軟件在嘗試創(chuàng)作了,NightCafe Creation、Disco Diffusion等軟件都可以進行類似的操作,但要么需要付費,要么對登錄賬號有一定要求,因此,對于大多數(shù)普通用戶而言,Dream By Wombo顯然是更好的選擇。
讓AI創(chuàng)作藝術(shù)品并非突發(fā)奇想,早在Dream By Wombo之前,這幾年已經(jīng)浮現(xiàn)出不少讓AI作畫的技術(shù)工具。最早是谷歌在2015年推出的DeepDream,還有英偉達的GauGAN、OpenAI的DALL·E、開源的Disco Diffusion等。
以DeepDream為例,其利用深度學(xué)習(xí)技術(shù)識別圖片,再把自己解讀的畫面呈現(xiàn)出來。后來谷歌將這一項目開源,讓所有人都可以上傳圖片,再生產(chǎn)出被DeepDream解讀的結(jié)果。實際上,DeepDream真正想要了解的是神經(jīng)網(wǎng)絡(luò)黑盒子的工作邏輯。神經(jīng)網(wǎng)絡(luò)在識別圖像時通常是層數(shù)越多越細致,第一層神經(jīng)網(wǎng)絡(luò)可能在識別輪廓,中間層的神經(jīng)網(wǎng)絡(luò)可能就在識別紋理、筆觸等等細節(jié)了。我們看到的那些正確識別出圖像的算法,都是經(jīng)由人工調(diào)試后的,而DeepDream則跳過了人工指導(dǎo)、矯正這一步,直接憑著自己的意愿識別圖片,并且會經(jīng)過數(shù)次重復(fù),最終就成了我們現(xiàn)在看到的樣子(如圖3)。
圖3 DeepDream的識別與創(chuàng)作
除了藝術(shù)創(chuàng)作之外,這些年區(qū)塊鏈技術(shù)的進步,疊加AI獨一無二和視覺驚艷的特點,AI作畫影響到的圈層也越來越廣泛,比較典型的有美術(shù)圈、藝術(shù)收藏圈以及NFT領(lǐng)域,畢竟唯一性已經(jīng)是一個相當(dāng)不錯的賣點了,只不過市場是否接受就真不一定了。