文| 馬迪
AI 是怎么學會畫畫的?它的作品算是藝術品嗎?以后人類畫家會失業(yè)嗎?
AI的聰明程度,早就超出了大眾的想象。
當年AlphaGo擊敗中國棋手柯潔,人們并不十分沮喪,因為他們認為圍棋處于計算機擅長的計算領域,只要算力足夠大,再復雜的游戲能都被窮舉,人類的敗北在意料之中;而藝術創(chuàng)作就不同了,人類迸發(fā)的靈感、復雜的情緒、無盡的想象力,這些東西是AI永遠不可能具備的,也是人類創(chuàng)造力的最高體現(xiàn)。
然而,最近一款免費的AI作畫工具Disco Diffusion,打破了人們固有的觀念。你可以在社交網(wǎng)站上搜索“AI繪畫”,看看那些不遜于專業(yè)畫家的精彩作品!這讓人不得不深思,創(chuàng)造力真的是人類獨有的嗎?AI是怎么學會畫畫的?它的作品算是藝術品嗎?以后人類畫家會失業(yè)嗎?
人類學畫,通常是從兒童時期開始,經(jīng)歷反復練習才能逐漸掌握各種技巧,最終一筆一筆地傳達出自己的想象。但如果我們換一個思路,從AI的視角來看繪畫,又是什么樣子呢?
點、線、形、彩、構圖、光影、虛實、透視……這些都不是重點,在AI看來,無論什么樣的圖像都只是一個由像素點構成的矩陣,每個像素點都由紅、綠、藍三個顏色通道組成。AI繪畫相當于一個可以逐漸產(chǎn)生像素、進行圖像生成的計算機模型。一方面,模型中要包含海量的參數(shù),比如繪畫中每一筆的位置、形狀、顏色,甚至是覆蓋關系、筆觸組合等等;另一方面,還需要基于海量的已有圖像進行訓練,讓AI可以找到效果最好、最合適的參數(shù),輸出讓人類能夠接受的結果。
在AI領域中,有一項非常熱門的分支,叫做機器學習,用程序模擬人類學習的過程,可以自我更新、自我進化、累積經(jīng)驗,最終形成自己的某種程序。而在機器學習中,又有一種非常熱門的方式叫生成對抗網(wǎng)絡。2014年,Ian Goodfellow提出了該模型,即設計兩個獨立的機器學習網(wǎng)絡,分別為生成器和判別器。以模擬一張圖片為例,生成器不斷訓練,目的是“模仿”出以假亂真的圖;判別器則不斷檢測,判斷出此圖是真是假。在對抗過程中,兩者都會不斷優(yōu)化,提高自己的生成能力和判別能力。這樣“左右互搏”的結果就是,最終產(chǎn)出的圖片越來越自然,也越來越真實。
對抗生成網(wǎng)絡提出后,AI的圖像生成能力有了大跨步的發(fā)展,一些有趣的APP應運而生。像可以給線稿上色的PAIntschAIner,能夠識別線稿的內容,比如可識別人像的皮膚、頭發(fā)、衣服等,分別涂上適當?shù)念伾?,上色范圍還很精準。還有能補完草稿的GauGAN,只需你用不同顏色的色塊和線條勾勒幾筆,它就可以生成完成度極高的圖像。
之所以有人將2022稱為AI繪畫元年,是因為今年的AI畫手開始井噴式地出現(xiàn)。它們有驚人的迭代速度,還有震驚世人的色彩、構圖能力以及想象力、創(chuàng)作力。這一切似乎都在表示,AI畫手正在逐漸掌握“畫語權”。
Disco Diffusion一經(jīng)面世就刷爆了全球各大社交媒體,顛覆了很多人對AI的認知。這是一款基于谷歌的技術框架開發(fā)的AI作畫工具,能夠根據(jù)用戶的描述文字生成高質量的畫作。它的核心技術是圖像擴散模型,也就是對自己生成的圖像進行一次又一次的“去噪”,減少無關的干擾部分,使其變得越來越清晰。這個過程就被稱為“迭代”。每次迭代時,AI會利用其圖像識別技術,依據(jù)文本提示對現(xiàn)有的圖像擴散模型進行評估,并為其提供下次迭代的“方向”。就這樣AI生產(chǎn)的圖像會和文本提示的匹配度越來越高,圖像的精細度也會逐漸增加。
在包括很多專業(yè)畫手在內的人們眼里,AI生成的畫作是非常驚人的,甚至可以說擁有一定的藝術感,尤其是其所展現(xiàn)的“想象力”,幾乎是將手伸到了人類認為只有自己才能做到的領域。這不免引起了很多人的擔憂:人類畫家會不會被AI所取代?
就像攝影技術誕生200年,仍然不能取代繪畫一樣,AI繪畫雖然會對現(xiàn)在的繪畫產(chǎn)生沖擊,但兩者之間并非你死我活的競爭關系。說到底,目前的AI繪畫只是對人類輸入語言的簡單理解和詮釋,整個繪制過程還是“黑箱操作”,不到成品出來,誰都不知道畫會是什么樣子,更不要提精準表達畫家的思想了。很多藝術家傾向于用AI繪畫作為“輔助工具”,在動筆之前,先將理念輸入AI生成多張不同風格的畫作,借它們來尋找靈感。
可以確定的是,AI繪畫背后的技術仍在快速發(fā)展,產(chǎn)出的畫作必將越來越多,人類和算法,在一次次從輸入到輸出的互動中,正一起推開新世界的大門。