摘 要:AI繪畫是基于人工智能技術(shù)進(jìn)行藝術(shù)創(chuàng)作的一種方法,在AI繪畫中,Stable Diffusion可提供穩(wěn)定、連續(xù)和高質(zhì)量的圖像生成。Stable Diffusion是一種基于生成對抗網(wǎng)絡(luò)的圖像生成方法,它通過不斷更新圖像的噪聲分布,逐漸生成越來越逼真的圖像。在繪畫藝術(shù)創(chuàng)作中,Stable Diffusion能夠激發(fā)創(chuàng)作者的靈感,幫助他們探索不同的創(chuàng)作風(fēng)格和創(chuàng)作方式。與此同時,創(chuàng)作者仍需運(yùn)用自己的審美判斷力對所繪制的作品進(jìn)行篩選和調(diào)整。
關(guān)鍵詞:AI繪畫;Stable Diffusion;藝術(shù)創(chuàng)作
中圖分類號:TP399;TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2024)08-0133-05
DOI:10.19850/j.cnki.2096-4706.2024.08.029
0 引 言
AI繪畫是指利用人工智能技術(shù)進(jìn)行繪畫和藝術(shù)創(chuàng)作的方法。AI繪畫的技術(shù)原理主要涉及文本理解、圖像生成和圖像優(yōu)化等方面,其中圖像生成是核心環(huán)節(jié),也是近年來研究最為活躍的領(lǐng)域[1]。隨著深度學(xué)習(xí)和計算機(jī)視覺等技術(shù)的發(fā)展,AI繪畫逐漸成為藝術(shù)創(chuàng)作領(lǐng)域的熱點(diǎn)。藝術(shù)創(chuàng)作是人類創(chuàng)造力和想象力的產(chǎn)物,而AI繪畫則是通過機(jī)器學(xué)習(xí)算法和大量的數(shù)據(jù)訓(xùn)練,使機(jī)器能夠模擬藝術(shù)家的風(fēng)格和創(chuàng)作技巧進(jìn)行繪畫創(chuàng)作。AI繪畫作為一種新的藝術(shù)表現(xiàn)形式,正在沖擊著傳統(tǒng)的藝術(shù)領(lǐng)域及相關(guān)行業(yè)。AI繪畫降低了藝術(shù)創(chuàng)作的門檻,提高了藝術(shù)相關(guān)產(chǎn)業(yè)的生產(chǎn)效率[2]。
1 Stable Diffusion的介紹
Stable Diffusion一推向市場,便成為AI圖像生成領(lǐng)域的佼佼者。2022年5月至8月期間,其開發(fā)企業(yè)Stability AI進(jìn)行了內(nèi)部測試,并在項目開源化后同時公開了代碼和文檔[3]。在圖形設(shè)計領(lǐng)域,Stable Diffusion可以通過文生圖、圖生圖的方式結(jié)合關(guān)鍵詞(Prompt)生成各種抽象和夢幻效果的圖形,從而創(chuàng)造出更加豐富和多樣化的動態(tài)圖形效果[4,5]。
Stable Diffusion(穩(wěn)定擴(kuò)散)是一種基于生成對抗網(wǎng)絡(luò)(GANs)的圖像生成方法,用于在AI繪畫中實現(xiàn)高質(zhì)量、連續(xù)和穩(wěn)定的圖像生成。穩(wěn)定擴(kuò)散是通過將生成過程分解為多個擴(kuò)散步驟實現(xiàn)的。在各個步驟中,生成器模型逐漸將噪聲圖像轉(zhuǎn)變?yōu)楸普娴膱D像,同時判別器模型評估生成圖像的真實度。通過迭代調(diào)整生成器和判別器之間的對抗學(xué)習(xí)過程,產(chǎn)生更加真實和細(xì)膩的圖像。
相比其他傳統(tǒng)的圖像生成方法,穩(wěn)定擴(kuò)散具有以下優(yōu)勢:
1)穩(wěn)定擴(kuò)散能夠生成連續(xù)的圖像序列,從低質(zhì)量到高質(zhì)量的漸進(jìn)過程使得生成過程更加可控。
2)穩(wěn)定擴(kuò)散能夠生成高質(zhì)量的圖像,圖像不會模糊或失真,并且具有較好的穩(wěn)定性。
3)穩(wěn)定擴(kuò)散還能夠在保持圖像細(xì)節(jié)和紋理的同時實現(xiàn)較快的生成速度,適用于大規(guī)模圖像生成任務(wù)。
Stable Diffusion的基本原理是,在一系列的迭代步驟中通過不斷地更新圖像的噪聲分布使其逐漸接近目標(biāo)圖像。這個過程類似于熱擴(kuò)散,通過平滑和調(diào)整圖像的細(xì)節(jié),使得生成的圖像具有更好的連續(xù)性和真實感。
Stable Diffusion方法在AI繪畫中的應(yīng)用能夠提供更穩(wěn)定、連續(xù)和高質(zhì)量的圖像生成效果,為創(chuàng)作者帶來更多的創(chuàng)作工具,使創(chuàng)作者涌現(xiàn)出更多的創(chuàng)作靈感。通過這種方法,創(chuàng)作者可以探索更多風(fēng)格和創(chuàng)作方式,拓寬藝術(shù)創(chuàng)作的邊界,給藝術(shù)帶來更多的創(chuàng)新和可能。
2 Stable Diffusion繪畫方法詳解
為方便用戶使用Stable Diffusion,開發(fā)人員會提供一鍵部署安裝包,以簡化安裝和配置的過程。這樣的安裝包通常包含所需的軟件、依賴庫和配置文件,使用戶可以快速地將Stable Diffusion部署到自己的計算環(huán)境中。AI繪畫Stable Diffusion一鍵部署安裝包如圖1所示。
2.1 推薦電腦配置
為了達(dá)到較好的流暢度,操作系統(tǒng)選擇Windows 10,配備64位多核處理器CPU,32 GB內(nèi)存,顯卡為8 GB顯存的GTX 3070,硬盤可用空間達(dá)到100 GB。為了獲得更好的性能和運(yùn)行速度,建議選擇固態(tài)硬盤作為系統(tǒng)盤。在這樣的配置下,可以繪制最大尺寸為1 024×1 024的圖像,每幅圖像的繪制時間約為20秒。
2.2 Stable Diffusion常用方法及相關(guān)指令
Stable Diffusion常用方法及相關(guān)指令有很多,在生成圖案中起到了尤為重要的作用,創(chuàng)作者可根據(jù)需要選擇不同的方法,而相關(guān)指令的參數(shù)調(diào)節(jié)能夠精準(zhǔn)完成圖像的風(fēng)格定位、細(xì)節(jié)勾勒、動作描畫等任務(wù)。隨著人工智能的不斷發(fā)展,Stable Diffusion常用方法及相關(guān)指令也會不斷地更新和迭代。Stable Diffusion常用方法及相關(guān)指令的詳細(xì)說明如下:
1)文生圖。最常用生圖的操作方式是利用正向提示詞和反向提示詞來控制想要達(dá)到的效果,提示詞需要以英文輸入。
2)圖生圖。根據(jù)以有的圖像結(jié)合正向提示詞和反向提示詞形成新的圖像。
3)后期處理。放大圖片使用,因平時使用較少,放大效果并不是很好。
4)CheckPoint模型(大模型)。經(jīng)過訓(xùn)練的圖片合集被稱作大模型,CKPT的全稱為CheckPoint(檢查點(diǎn)),常見格式的模型體積較大,一般真人版單個模型的大小在7 GB左右,動漫版單個模型的大小在2~5 GB之間。訓(xùn)練一個大模型比較困難,需要極高的顯卡算力,所以絕大多數(shù)人不會訓(xùn)練大模型。
5)LoRA模型。通俗來講可以理解為Stable Diffusion中的一個插件,僅需少量數(shù)據(jù)就可以進(jìn)行訓(xùn)練的一種模型。在生成圖片時,需要將LoRA模型與大模型結(jié)合起來使用,從而實現(xiàn)對輸出圖片結(jié)果的調(diào)整。
6)提示詞。分為正向提示詞(Positive Prompt)和反向提示詞(Negative Prompt),寫出一份比較好的提示詞是文生圖技術(shù)的關(guān)鍵。Stable Diffusion目前只支持英文,你可以輸入單詞、詞組和短句來描述特征,正向提示詞就是想要達(dá)到的效果,反向提示詞是不想出現(xiàn)的效果,不同的提示詞之間以英文逗號分隔??梢杂茫ǎ┗蛘弑稊?shù)增加權(quán)重。
7)迭代步數(shù)(Steps)。是指Stable Diffusion生成圖像所需的迭代步數(shù)。每增加一步迭代,都會給AI更多的機(jī)會去比對當(dāng)前結(jié)果并進(jìn)行相應(yīng)的調(diào)整。更高的迭代步數(shù)需要更多的計算時間,高步數(shù)并不一定意味著更好的結(jié)果。相反,如果迭代步數(shù)太少,則會降低生成圖像的質(zhì)量。
8)采樣方法(Sampler)。是每次出圖都必須選擇的一個功能,在采樣方法(Sampler Method)中有很多種采樣器可供選擇,不同的采樣方法會產(chǎn)生不同的出圖效果。
9)隨機(jī)數(shù)種子(Seed)??梢岳斫鉃槊總€圖畫的唯一編碼,當(dāng)設(shè)置為-1時,圖畫隨機(jī)生成,想要達(dá)到某種效果時,復(fù)制該圖的種子數(shù)值并將其填入隨機(jī)種子框內(nèi),后續(xù)生成的圖畫基本保持同種類型。
10)ControlNet。是Stable Diffusion中的一種擴(kuò)展模型,通過這種擴(kuò)展模型我們能夠?qū)⒖紙D像的構(gòu)圖(Compositions)或者人體姿勢遷移到目標(biāo)圖像。在生成圖像的過程中,可以通過ControlNet引入更多條件來干預(yù)圖像的生成過程,它可以與現(xiàn)有任何Stable Diffusion模型搭配使用。
3 Stable Diffusion在繪畫藝術(shù)創(chuàng)作中的應(yīng)用
在繪畫藝術(shù)創(chuàng)作中,Stable Diffusion可以激發(fā)創(chuàng)作者的靈感,可供創(chuàng)作者設(shè)計草圖和構(gòu)圖,完成色彩和風(fēng)格的探索、故事情節(jié)構(gòu)建等工作。需要注意的是,Stable Diffusion作為一個生成模型,其生成結(jié)果具有一定的隨機(jī)性和創(chuàng)造性[6,7]。在將其應(yīng)用于繪畫藝術(shù)創(chuàng)作時,創(chuàng)作者仍需運(yùn)用自己的審美和判斷力對生成的結(jié)果進(jìn)行篩選和調(diào)整,以確保最終作品符合其創(chuàng)作意圖和要求。應(yīng)用Stable Diffusion繪制一個中國傳統(tǒng)水墨畫人物,步驟如下:
1)選擇Stable Diffusion大模型。選擇二次元風(fēng)格的CheckPoint模型2.0D-meinamix_meinaV10.safetensors,它具有獨(dú)特的繪畫風(fēng)格和高質(zhì)量的細(xì)節(jié)表現(xiàn),適用于創(chuàng)作出二次元角色形象,如圖2所示。
2)輸入正向提示詞和反向提示詞。根據(jù)創(chuàng)作者的個人創(chuàng)作需求和想象力,正向提示詞將盡可能詳細(xì)地描述人物的細(xì)節(jié)、特征以及環(huán)境等方面的信息。創(chuàng)作者可以根據(jù)自己的審美判斷和創(chuàng)造力對這些描述進(jìn)行組合、調(diào)整,進(jìn)一步拓展和演繹,從而創(chuàng)作出充滿個性的角色形象,如圖3所示。
正向提示詞:
(white printed chineseupshirt),(green long skirt),upper body,shukezouma, negative space, shuimobysim , portrait of a woman standing , willow branches, (masterpiece, best quality:1.2), traditional chinese ink painting, modelshoot style, peaceful, (smile), looking at viewer, song, willow tree in background, wuchangshuo, lt;lora:旗袍裙ChinaDressV2.0:
0.7gt;lt;lora:畫風(fēng)LoRA:墨心MoXin_墨心MoXin1.0:0.5gt;
反向提示詞:
mutated hands, (poorly drawn hands:2),(fused fingers:2), (too many fingers:2), bad hands, missing fingers, extra digit, (worst quality:2), (low quality:2), (normal quality:2),bad face,badhands,bad anatomy
3)選擇合適的Lora模型。根據(jù)創(chuàng)作者需要的風(fēng)格和最終想要達(dá)到的要求,選擇合適的Lora模型,在這里選擇的是lt;lora:旗袍裙ChinaDressV2.0:0.7gt;和lt;lora:畫風(fēng)Lora:墨心MoXin_墨心MoXin1.0:0.5gt;,分別調(diào)整它們的權(quán)重為0.7和0.5,如圖4所示。
4)調(diào)整其他指令。迭代步數(shù)(Steps)選擇20步,采樣方法(Sampler)選擇DPM++SDE Karras,隨機(jī)數(shù)種子(Seed)選擇-1,并設(shè)置高度600和寬度400,如圖5所示。
5)最終生成圖片,如圖6所示。
6)細(xì)節(jié)調(diào)整。采用Stable Diffusion進(jìn)行高分辨率修復(fù),并通過ControlNet對人物姿態(tài)進(jìn)行調(diào)整,以進(jìn)一步完善細(xì)節(jié),實現(xiàn)創(chuàng)作目的,如圖7所示。
4 Stable Diffusion在繪畫藝術(shù)中的優(yōu)劣勢
Stable Diffusion是一種用于AI繪畫的工具,它以高質(zhì)量的繪畫作品呈現(xiàn)為特點(diǎn),同時也具備出色的交互性和靈活性。其強(qiáng)大的功能可使用戶根據(jù)需求和想象力繪制出不同風(fēng)格、主題和表現(xiàn)力的繪畫作品。此外,它注重細(xì)節(jié)和真實感,能夠捕捉到物體、人物和背景的細(xì)微特征,使繪畫作品更加逼真自然。與傳統(tǒng)手繪或計算機(jī)繪圖方法相比,Stable Diffusion具有更高的時間效率和資源效率[8]。
但需要注意的是,盡管Stable Diffusion在AI繪畫中具有許多優(yōu)勢,但它仍然是基于模型的生成,可能存在一定的局限性和不足之處?,F(xiàn)階段AI繪畫還無法完全替代人類繪畫,其繪制的成品常常存在細(xì)節(jié)模糊和結(jié)構(gòu)錯誤的地方,同時AI的識別能力相對于人的認(rèn)知是有限的,學(xué)習(xí)過程中針對訓(xùn)練模型的平均值提取和疊加會出現(xiàn)一些莫名其妙的失誤,需要創(chuàng)作者在AI繪畫的基礎(chǔ)上進(jìn)行相應(yīng)的修改[9,10]。創(chuàng)作者仍然需要根據(jù)自己的審美和藝術(shù)追求對生成的繪畫結(jié)果進(jìn)行進(jìn)一步的調(diào)整和潤飾,以創(chuàng)作出獨(dú)特且理想的作品。
5 AI繪畫在藝術(shù)創(chuàng)作中的發(fā)展及影響
AI繪畫是指利用人工智能技術(shù)進(jìn)行藝術(shù)創(chuàng)作和圖像生成的過程。隨著深度學(xué)習(xí)和計算機(jī)視覺技術(shù)的不斷發(fā)展,AI繪畫在藝術(shù)創(chuàng)作中嶄露頭角,并對藝術(shù)創(chuàng)作產(chǎn)生了深遠(yuǎn)影響:
1)AI繪畫為藝術(shù)家提供了全新的創(chuàng)作方式和創(chuàng)作工具。傳統(tǒng)的藝術(shù)創(chuàng)作依賴于藝術(shù)家的創(chuàng)造力和技巧,而AI繪畫則是在學(xué)習(xí)和分析大量藝術(shù)品和圖像數(shù)據(jù)的基礎(chǔ)上生成新穎獨(dú)特的藝術(shù)作品,為藝術(shù)家提供更多的創(chuàng)作靈感,為藝術(shù)創(chuàng)新帶來更多的可能。藝術(shù)家可以將AI生成的圖像作為創(chuàng)作的起點(diǎn),進(jìn)行進(jìn)一步的創(chuàng)新改進(jìn)、創(chuàng)意完善,從而創(chuàng)作出新穎別致、獨(dú)具個性的作品。
2)AI繪畫加速了藝術(shù)創(chuàng)作的過程。傳統(tǒng)繪畫需要藝術(shù)家耗費(fèi)大量的時間和精力去打磨,而AI繪畫可以通過自動化和智能化的方式快速生成圖像。藝術(shù)家可以使用AI繪畫工具快速完成構(gòu)圖、色彩選擇和紋理添加等操作,大大縮短了創(chuàng)作的時間周期,提高了創(chuàng)作效率。這使得藝術(shù)家能夠更加專注于創(chuàng)作的構(gòu)思和表達(dá),而不必在煩瑣的技術(shù)細(xì)節(jié)上花費(fèi)過多的時間。
3)AI繪畫為藝術(shù)創(chuàng)作帶來了新的可能性和挑戰(zhàn)。AI繪畫可以生成具有高度細(xì)膩和逼真感的圖像,甚至可以模仿名家的特色與風(fēng)格。這使得藝術(shù)家可以通過結(jié)合AI或參考AI創(chuàng)作出更加精美和令人驚嘆的作品。然而,也有一些人擔(dān)心AI繪畫可能導(dǎo)致藝術(shù)的同質(zhì)化和缺乏原創(chuàng)性。因此,藝術(shù)家需要積極探索和利用AI技術(shù),將其與個人的創(chuàng)作理念和風(fēng)格相結(jié)合,以保持藝術(shù)作品的獨(dú)特性和個性化。
4)AI繪畫對藝術(shù)市場和商業(yè)應(yīng)用產(chǎn)生了深遠(yuǎn)影響。隨著AI藝術(shù)作品越來越多地被認(rèn)可和接受,藝術(shù)品的銷售和交易方式也發(fā)生了變革。藝術(shù)家可以通過AI繪畫技術(shù)創(chuàng)造出更多樣化和定制化的藝術(shù)作品,滿足不同人群的個性化需求。此外,AI繪畫還可以用于廣告、設(shè)計和產(chǎn)品開發(fā)等商業(yè)領(lǐng)域,為企業(yè)呈現(xiàn)更具創(chuàng)意和富有吸引力的視覺效果,可有力地推動藝術(shù)與商業(yè)的融合。
6 結(jié) 論
AI繪畫為藝術(shù)家?guī)砹诵碌膭?chuàng)作方式和創(chuàng)作工具,加速了創(chuàng)作過程,提高了創(chuàng)作效率,同時也帶來了新的可能性與挑戰(zhàn)。它對藝術(shù)市場和商業(yè)應(yīng)用產(chǎn)生了深遠(yuǎn)的影響,推動了藝術(shù)與科技的融合。然而,我們也要認(rèn)識到AI繪畫并非是取代傳統(tǒng)藝術(shù),而是與傳統(tǒng)藝術(shù)共生共存的一股新興力量。
參考文獻(xiàn):
[1] 孫鳳華.打開“圖片盲盒”:AI繪畫助力新媒體演化 [J].全媒體探索,2023(7):107-108.
[2] 丁磊.生成式人工智能:AIGC的邏輯與應(yīng)用 [M].北京:中信出版集團(tuán),2023.
[3] 孫文倩.人工智能技術(shù)輔助下的圖像生成藝術(shù)創(chuàng)作研究 [D].上海:華東師范大學(xué),2023.
[4] 張福也.AIGC技術(shù)在動態(tài)圖形設(shè)計中的影響 [J].絲網(wǎng)印刷,2023(12):97-99.
[5] 朱光輝,王喜文.ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來圖景 [J].新疆師范大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2023,44(4):113-122.
[6] 劉明亮.人工智能生成內(nèi)容(AIGC)技術(shù)特征及應(yīng)用場景分析 [J].信息記錄材料,2023,24(10):234-236.
[7] 張兆羽.AI繪畫在數(shù)字媒體設(shè)計中的應(yīng)用 [J].藝術(shù)品鑒,2023(9):114-117.
[8] 中國信息通信研究院 京東探索研究院.人工智能生成內(nèi)容(AIGC)白皮書 [R/OL].(2022-09-02).http://www.caict.
ac.cn/english/research/whitepapers/202211/P020221111501862950
279.pdf.
[9] 繆虹,王敬雷.AI繪畫創(chuàng)作的運(yùn)行規(guī)律及應(yīng)用 [J].絲網(wǎng)印刷,2023(7):96-98.
[10] 汪佳雨.藝術(shù)類受眾對人工智能生成繪畫作品接受意愿的影響因素研究 [D].合肥:中國科學(xué)技術(shù)大學(xué),2023.
作者簡介:李深森(1988—),男,漢族,山東德州人,副教授,本科,研究方向:數(shù)字媒體技術(shù)、三維動畫設(shè)計。
收稿日期:2023-08-17
基金項目:山東省一流本科專業(yè)建設(shè)項目(數(shù)字媒體技術(shù))階段性研究成果
Application of AI Painting in Art Creation
——Taking Stable Diffusion as an Example
LI Shensen
(School of Design and Art, Shandong Huayu University of Technology, Dezhou 253034, China)
Abstract: AI painting is a method of artistic creation based on artificial intelligence technology. In AI painting, Stable Diffusion can provide stable, continuous, and high-quality image generation. Stable Diffusion is an image generation method based on generative adversarial networks, which gradually generates increasingly realistic images by continuously updating the noise distribution of the image. In the creation of painting art, Stable Diffusion can inspire creators and help them explore different creative styles and methods. At the same time, creators still need to use their own aesthetic judgment to screen and adjust the drawn works.
Keywords: AI painting; Stable Diffusion; art creation