周子洪,周志斌,張于揚,孫凌云+
(1.浙江大學(xué) 浙江省設(shè)計智能與數(shù)字創(chuàng)意研究重點實驗室,浙江 杭州 310027;2.浙江大學(xué) 阿里巴巴—浙江大學(xué)前沿技術(shù)聯(lián)合研究中心,浙江 杭州 310027)
1956年,美國達特茅斯會議(Dartmouth Workshop)首次確立了人工智能(Artificial Intelligence, AI)的概念[1]:讓機器像人那樣理解、思考和學(xué)習(xí),即用計算機模擬人的智能。半個多世紀過去了,人工智能成為了全球新一輪工業(yè)轉(zhuǎn)型的主要驅(qū)動力[2],引領(lǐng)著世界各國技術(shù)的發(fā)展。如今,人工智能已經(jīng)在各專業(yè)領(lǐng)域開始趕超人類,在聚焦創(chuàng)意的設(shè)計領(lǐng)域也有了一定的突破。2018年,由人工智能創(chuàng)作的畫作《Edmond de Belamy》以43.25萬美元價格被成功拍賣;阿里巴巴研制的鹿班系統(tǒng)在促銷活動期間累計生成近5億張平面設(shè)計,均接近高級設(shè)計師的水平。可見,人工智能在模擬和增強人類智能上已經(jīng)取得了一系列成就。但是,人工智能的發(fā)展仍充滿挑戰(zhàn),當(dāng)前依舊處于弱人工智能階段。
人工智能很早就被用于設(shè)計領(lǐng)域,輔助著設(shè)計過程的各個環(huán)節(jié)。早期人工智能主要通過建模設(shè)計領(lǐng)域知識[3]來解決設(shè)計問題,如基于案例的推理、約束滿足算法和進化算法等[4]。這些人工智能方法擅長推理和分析,但囿于軟硬件條件的限制,在創(chuàng)造力這一核心問題上并未取得太大進展,對于創(chuàng)造性的支持也十分有限。
數(shù)字創(chuàng)意設(shè)計是一類典型的視覺知識表達問題,是將人類創(chuàng)造力轉(zhuǎn)化為數(shù)字視覺內(nèi)容和知識的過程。2016年,人工智能進入2.0時代(AI 2.0)[5],以深度學(xué)習(xí)、對抗生成網(wǎng)絡(luò)等技術(shù)為代表的人工智能迅速發(fā)展,人工智能開始具備一定的創(chuàng)造能力。許多由人工智能獨立或輔助設(shè)計師完成的文本、圖像、視頻以及VR(virtual reality)、AR(augmented reality)應(yīng)用等作品,已經(jīng)具有了較高的創(chuàng)新性。與此同時,跨媒體智能、大數(shù)據(jù)智能、人機混合增強智能等理論、方法和技術(shù)迅速發(fā)展,人工智能成為了推動數(shù)字視覺領(lǐng)域發(fā)展的關(guān)鍵技術(shù)[6]。
本文主要介紹在人工智能賦能的背景下數(shù)字創(chuàng)意設(shè)計領(lǐng)域的發(fā)展現(xiàn)狀和應(yīng)用前景。首先總結(jié)了當(dāng)前設(shè)計與人工智能的關(guān)系和挑戰(zhàn),然后從支持設(shè)計過程和生產(chǎn)創(chuàng)意內(nèi)容兩個角度出發(fā),綜述了人工智能賦能設(shè)計領(lǐng)域的最新研究進展。最后,本文從人機關(guān)系多元化和設(shè)計新范式這兩個方面,探討了數(shù)字創(chuàng)意設(shè)計領(lǐng)域的未來發(fā)展趨勢。
創(chuàng)造力作為人類智能的基本特征[7],是當(dāng)前人工智能面臨的核心挑戰(zhàn)。在早期研究中,計算創(chuàng)造力和設(shè)計計算是從計算和認知的角度對創(chuàng)造力、設(shè)計和創(chuàng)意問題進行研究的兩個重要方向[8]。Gero等[9]提出設(shè)計計算主要是通過新的計算方法和技術(shù)來進行設(shè)計研究和設(shè)計實踐,強調(diào)應(yīng)用模型和算法輔助設(shè)計師產(chǎn)出更好的創(chuàng)意;Boden[10]的研究總結(jié)指出計算創(chuàng)造力是聚焦創(chuàng)新創(chuàng)意過程的計算模型,主要研究創(chuàng)造力的工作機制,從而模擬人類智能以增強機器創(chuàng)造力。2016年,隨著AI2.0時代的到來,設(shè)計智能成為了結(jié)合計算創(chuàng)造力和設(shè)計計算演化而來的新的研究方向,專注于解決新一代人工智能在創(chuàng)意和設(shè)計中遇到的挑戰(zhàn)和問題。Tang等[11]給出了AI 2.0時代下設(shè)計智能的最新定義:解決設(shè)計和創(chuàng)意過程中的問題并生成創(chuàng)意解決方案(設(shè)計、內(nèi)容和服務(wù))的人工智能技術(shù)。
數(shù)據(jù)、算法、算力是人工智能的3大要素。人工智能通常是從數(shù)據(jù)中歸納和推理出知識,并通過算法表現(xiàn)出智能的行為,算力則為人工智能提供必要的硬件支持。傳統(tǒng)的人工智能擅長解決推理、證明、分類、聚類等目標明確、規(guī)則清晰的技術(shù)問題,這些問題通常具有唯一最優(yōu)解。然而,設(shè)計作為創(chuàng)造性的活動,帶有強烈的主觀性和不確定性[12-13],這給人工智能在該領(lǐng)域的應(yīng)用研究帶來了巨大的挑戰(zhàn)。Simon[14]指出設(shè)計所要解決的問題通常是不良定義的,具有問題定義不清晰、求解路徑不確定、評價標準不明確等特點。因此,設(shè)計通常呈現(xiàn)出預(yù)測未來、開放多解、結(jié)構(gòu)不良等一系列特征,這也恰好是計算機所不擅長解決的。例如,一個算法通常有明確定義的輸入和輸出,強調(diào)問題求解的過程;而一次設(shè)計活動往往沒有明確的規(guī)則,其設(shè)計問題的定義是非常模糊的,需要設(shè)計師在設(shè)計過程中不斷發(fā)散和收斂,逐漸固化設(shè)計問題,并提出最終解決方案。
設(shè)計思維是指設(shè)計產(chǎn)生的過程,即設(shè)計產(chǎn)物產(chǎn)生的思維過程[15],描述了設(shè)計師實現(xiàn)設(shè)計創(chuàng)新的思考、推理過程。因此,理解設(shè)計思維將有助于人工智能解決設(shè)計問題。設(shè)計思維有3個重要特征。首先,設(shè)計思維是跨媒體知識加工的過程。在設(shè)計過程中,設(shè)計師搜集到的有關(guān)用戶、技術(shù)、市場等各種信息,將會以文本、圖片、視頻、聲音甚至氣味等多種形式呈現(xiàn),設(shè)計師通過對信息進行匯總、歸納和推理,激發(fā)設(shè)計靈感,產(chǎn)出創(chuàng)意方案。對于計算機而言,這種多通道的信息處理和分析,正是典型的跨媒體知識加工的過程[16-17];其次,設(shè)計思維中的問題與方案共同進化。在設(shè)計過程中,設(shè)計師經(jīng)常根據(jù)其對設(shè)計問題的理解提出新的設(shè)計問題或新的設(shè)計方案,設(shè)計師對設(shè)計方案的評估也將促進設(shè)計問題的重新定義,或激發(fā)新的設(shè)計方案,如此循環(huán)往復(fù)。這樣的循環(huán)過程促使問題和方案空間相互激發(fā)、共同進化[18];最后,整個設(shè)計過程是發(fā)散與收斂并重的。設(shè)計師定義、細化問題,并根據(jù)問題生成方案,該過程發(fā)散了問題空間與方案空間;然后對問題和方案進行評價,并選取優(yōu)質(zhì)問題與方案進一步發(fā)散,再根據(jù)評價結(jié)果收斂發(fā)散的方向。整個設(shè)計過程呈現(xiàn)發(fā)散與收斂交替進行、整體先發(fā)散后收斂的特征[19]。
由此可見,人工智能擅長解決的問題與設(shè)計的特征存在著沖突,利用人工智能解決設(shè)計問題還面臨著很多挑戰(zhàn)(如圖1)。
目前,人工智能主要依賴數(shù)據(jù)和規(guī)則來創(chuàng)作或解決問題[20],并沒有完全具備獨立解決設(shè)計問題的能力。但相較于設(shè)計師,人工智能仍然具有3個方面的優(yōu)勢:①強大的計算能力,可以在極短的時間內(nèi)完成復(fù)雜計算;②批量化處理能力,可以批量解決重復(fù)性設(shè)計問題;③持續(xù)的學(xué)習(xí)能力,能夠利用海量設(shè)計數(shù)據(jù),不斷迭代學(xué)習(xí)能力。這些優(yōu)勢讓人工智能在面臨復(fù)雜問題時能夠不斷遍歷可行方案,快速找出最佳解決辦法。與早期的計算機輔助設(shè)計不同,如今的人工智能具有更加強大的輔助設(shè)計和創(chuàng)意內(nèi)容生產(chǎn)能力。在設(shè)計過程中,人工智能可以替代設(shè)計師完成高重復(fù)性、低創(chuàng)造性的設(shè)計工作[21],輔助設(shè)計師從海量數(shù)據(jù)中整合設(shè)計知識[22],還可以根據(jù)設(shè)計師的指導(dǎo)從不同角度快速探索和生成新的設(shè)計方案[23]等。由此可見,設(shè)計師與人工智能之間的協(xié)作關(guān)系愈發(fā)深入和智能化,呈現(xiàn)一種相輔相成的關(guān)系。人工智能利用其強大的學(xué)習(xí)和計算能力為設(shè)計師提供輔助和啟發(fā),設(shè)計師則更多地投入到創(chuàng)造性的設(shè)計活動中,二者結(jié)合,可以更快、更好地產(chǎn)出設(shè)計方案,創(chuàng)造設(shè)計價值。
近幾年來,人工智能開始廣泛應(yīng)用于數(shù)字創(chuàng)意領(lǐng)域。根據(jù)人工智能在創(chuàng)意設(shè)計過程中所發(fā)揮的主要作用進行區(qū)分,可將其應(yīng)用分為支持設(shè)計過程和生產(chǎn)創(chuàng)意內(nèi)容兩類。在前者中,設(shè)計師是設(shè)計創(chuàng)意的主要提供者,人工智能作為輔助設(shè)計工具,輔助設(shè)計師完成設(shè)計過程的各個環(huán)節(jié);在后者中,人工智能將成為設(shè)計創(chuàng)意的主要來源,協(xié)同甚至替代設(shè)計師完成主要設(shè)計過程。
傳統(tǒng)設(shè)計流程一般可分為需求分析、創(chuàng)意激發(fā)、原型設(shè)計和設(shè)計評價4個階段。人工智能的迅速發(fā)展極大地便利了傳統(tǒng)設(shè)計流程的各個環(huán)節(jié),推動了傳統(tǒng)設(shè)計方法的變革。
2.1.1 需求分析
用戶需求分析是指通過相應(yīng)的技術(shù)和方法來觀察和分析用戶的行為、偏好和意圖,從而洞察用戶的真實需求。Maguire等[24]指出成功的設(shè)計和創(chuàng)意作品往往來源于設(shè)計師對用戶需求的充分理解和把握。傳統(tǒng)的需求分析主要通過用戶訪談、問卷調(diào)查等方法對少量的典型目標用戶進行研究,以推測整體用戶的偏好和需求。然而,這種模式無法做到大量用戶數(shù)據(jù)樣本下的定量研究[25],難以滿足用戶的個性化需求。人工智能的發(fā)展支持了設(shè)計師對大量用戶數(shù)據(jù)進行更加細粒度、全方位的分析和總結(jié),從而保證產(chǎn)品最大限度地滿足用戶的需求。
用戶畫像是應(yīng)用于用戶需求分析的主要工具[26]。近年來,隨著數(shù)據(jù)收集方法的進步,使用人工智能處理海量用戶數(shù)據(jù),實現(xiàn)自動化的用戶畫像生成(Automatic Persona Generation, APG)[27]成為熱門趨勢。人工智能主要通過在線的社交媒體或內(nèi)容平臺[28-29]收集用戶數(shù)據(jù),并自動生成相應(yīng)的用戶畫像,用于支持企業(yè)推廣、產(chǎn)品市場營銷和個性化產(chǎn)品推薦等活動[30]。例如,卡塔爾計算研究所的Salminen等[22,31]和An等[30,32]對此做了大量研究,他們整合了來自Facebook、Twitter和YouTube等平臺用戶的社交網(wǎng)絡(luò)數(shù)據(jù),包括用戶的交互行為、目標屬性以及話題偏好等信息,基于聚類、LSTM(long short-term memory)等方法構(gòu)建了APG系統(tǒng)。典型的APG系統(tǒng)框架如圖2所示。
生成模型[33]是一類基于對抗生成網(wǎng)絡(luò),通過生成全新的樣本來幫助設(shè)計師獲取用戶潛在需求的智能方法。這類方法通過學(xué)習(xí)社交網(wǎng)絡(luò)上目標用戶屬性及其行為偏好的數(shù)據(jù)分布,能夠直接生成全新的用戶數(shù)據(jù),用以構(gòu)建潛在用戶畫像。典型研究包括Wang等[34]提出的IRGAN和Bharadhwaj等[35]提出的RecGAN,這兩類生成模型能夠基于用戶行為的數(shù)據(jù)樣本直接生成相關(guān)的潛在用戶偏好;Perera等[36]還提出了用于自動生成跨網(wǎng)絡(luò)、跨平臺用戶偏好的CnGAN,通過學(xué)習(xí)Twitter上的社交數(shù)據(jù),CnGAN能夠生成一些適用于YouTube平臺的用戶偏好數(shù)據(jù)。
事實上,上述方法在設(shè)計過程中還沒有被廣泛普及,智能化的用戶畫像生成仍面臨著兩大主要挑戰(zhàn):(1)如何利用跨媒體智能方法[37]從海量的各類用戶數(shù)據(jù)(包括文本、圖片、視頻、VR、AR等數(shù)據(jù))中提取、融合有效信息以獲得精準的用戶畫像[38];(2)評估用戶畫像有效性的常用方法仍局限于案例研究[39]??偟膩碚f,分析在線數(shù)據(jù)從而自動生成用戶畫像的系統(tǒng)和方法具有廣泛的研究和應(yīng)用價值,對于使用在線內(nèi)容和用戶數(shù)據(jù)進行設(shè)計和內(nèi)容創(chuàng)新的人員來說尤其如此。
2.1.2 創(chuàng)意激發(fā)
創(chuàng)意激發(fā)是發(fā)掘潛在創(chuàng)意的設(shè)計過程[40],可以為產(chǎn)品的造型和功能設(shè)計提供早期創(chuàng)意、基本構(gòu)件和材料。創(chuàng)意激發(fā)面臨的挑戰(zhàn)主要包括設(shè)計固化(design fixation)、功能性固化(functional fixedness)、類比關(guān)系的忽略(analogy blindness)、狹隘的動詞關(guān)聯(lián)(narrow verb associations)等[41],解決這些問題的關(guān)鍵在于為設(shè)計師提供足夠豐富的設(shè)計刺激。
設(shè)計刺激是設(shè)計想法或概念的觸發(fā)器或跳板,通過減少獲取設(shè)計起點的認知難度、引入有用信息、快速擴大搜索空間等方法,有效促進設(shè)計創(chuàng)新的產(chǎn)生[15]。人工智能在創(chuàng)意激發(fā)中的應(yīng)用研究可分為設(shè)計刺激的檢索[42-46]和生成[47]兩個方面。前者主要基于數(shù)據(jù)驅(qū)動的方法,使用不同的檢索算法來分析現(xiàn)有知識庫,再通過分類、篩選、組合、類比等方法獲得具有啟發(fā)性的刺激材料;后者則利用生成技術(shù),通過生成全新的刺激材料為設(shè)計師提供啟發(fā)。典型的創(chuàng)意激發(fā)系統(tǒng)框架如圖3所示。
在刺激檢索方面,Hao等[42]采用進化計算的方法對上萬個授權(quán)專利和工業(yè)產(chǎn)品進行啟發(fā)性詞語的檢索,將啟發(fā)性最高的詞語篩選出來呈現(xiàn)給設(shè)計師;Vandevenne等[43]使用行為語言模型表示文本中的自然和人造實體,基于K近鄰算法對其中的生物學(xué)案例進行分類,從而形成易于查詢的案例分類目錄。此外,基于類比關(guān)系的檢索工具也被廣泛應(yīng)用于創(chuàng)意激發(fā)的過程中[48]。例如,Han等[49]基于ConceptNet[50]知識庫中指定的16種本體關(guān)系,使用類比關(guān)系A(chǔ):B::C:X的形式來對不同屬性間的實體進行關(guān)聯(lián)搜索,以得到與搜索關(guān)鍵詞可能形成類比關(guān)系的視覺和文本信息X,并呈現(xiàn)給用戶。相關(guān)應(yīng)用研究還有基于功能向量空間模型的類比搜索系統(tǒng)[51]、基于ConceptNet知識庫的創(chuàng)意組合工具Combinator[52]等。
在刺激生成方面,主要以視覺刺激為主。2019年,Chen等[47]首次將生成技術(shù)應(yīng)用于創(chuàng)意激發(fā),提出了一個語義構(gòu)思網(wǎng)絡(luò)模型用來挖掘不同知識領(lǐng)域間的潛在知識聯(lián)系,再基于生成對抗網(wǎng)絡(luò)建立視覺概念組合模型,根據(jù)多個具有潛在關(guān)聯(lián)的概念語義來生成相應(yīng)的視覺刺激。目前,這方面的研究還較少,但隨著生成技術(shù)的發(fā)展,例如文本到圖像的生成[53]、圖像自動上色[54]、圖像風(fēng)格遷移[55]等,未來這些技術(shù)都能夠運用到創(chuàng)意激發(fā)中,為設(shè)計師提供更多的視覺刺激,提高創(chuàng)意激發(fā)的效率。
2.1.3 原型設(shè)計
原型是指能夠部分或全部反映最終產(chǎn)品特性的產(chǎn)品近似品,它能夠直觀地展示產(chǎn)品的形態(tài)與功能。原型設(shè)計是一個需要歷經(jīng)多次迭代,從低保真到高保真的制作過程,一般可包括草繪、線框圖、界面原型、功能原型、實物原型等階段。
視覺UI(user interface)的原型生成是人工智能賦能數(shù)字創(chuàng)意設(shè)計的典型應(yīng)用[56]。目前,這方面工作主要研究如何自動生成具有不同保真度的原型,以替代設(shè)計師完成一些低創(chuàng)造性、高重復(fù)性的設(shè)計任務(wù)[57]。相關(guān)研究可分為基于文本的原型生成[58-60]、基于案例的原型生成[61-62]和基于概念的原型生成[63-64]等方向,其對應(yīng)的典型系統(tǒng)框架如圖4所示。
基于設(shè)計師的文本描述自動生成相應(yīng)的草圖原型,能夠有效降低設(shè)計師在原型階段的工作量。典型研究包括:Huang等[58-59]提出了基于Sketch-RNN模型[65]的草圖自動生成系統(tǒng)Sketchforme,該系統(tǒng)可以根據(jù)設(shè)計師的文字描述自動生成具有復(fù)雜語義的草圖;在此基礎(chǔ)上,他們又進一步提出了基于上下文語境的可迭代草圖生成系統(tǒng)Scones,Scones支持設(shè)計師以對話的方式來不斷地修改和細化當(dāng)前的生成結(jié)果,從而實現(xiàn)草圖的迭代和完善,這類研究主要針對從文本到草圖的生成研究。除此之外,從文本到界面原型的生成研究也是當(dāng)下的熱門主題,例如在2020年6月,設(shè)計軟件Figma基于人工智能公司OpenAI近期推出的通用NLP(natural language processing)模型GPT-3[66]實現(xiàn)了快速生成界面原型的功能[67],用戶只需輸入一段有關(guān)某個UI界面的描述性文字,F(xiàn)igma便可快速生成對應(yīng)的可編輯界面原型。目前,基于文本的原型生成應(yīng)用研究仍處于起步階段,當(dāng)前應(yīng)用在很多任務(wù)場景下還不足以滿足設(shè)計師的原型制作需求,與其相關(guān)的研究領(lǐng)域還集中在文本語義分析[68]、文本到圖片的生成[53]等方面。
設(shè)計案例能夠有效支持設(shè)計師的創(chuàng)意過程[69]?;赨I設(shè)計案例從而自動生成對應(yīng)的UI元素及其布局信息,能夠支持設(shè)計師快速嘗試不同的布局方式,而無需重復(fù)構(gòu)建界面。典型研究如Pandian等人[61]提出的工具Blu,一個基于深度神經(jīng)網(wǎng)絡(luò)的UI布局檢測與生成系統(tǒng),該系統(tǒng)基于RICO數(shù)據(jù)集[70]訓(xùn)練了特定的目標檢測模型,用以識別UI截圖中UI元素的種類、位置和尺寸大小等信息,并使用OCR(optical character recognition)技術(shù)識別UI元素中的文字信息,最后系統(tǒng)采用了基于格式塔原則的算法來還原UI設(shè)計案例中的布局信息。這類研究和UI逆向工程具有密切的聯(lián)系,相關(guān)的最新應(yīng)用研究還包括Rewire[62]、pix2code[71]等。
從低保真到高保真的原型制作過程通常會耗費設(shè)計師大量的時間和精力[63],而人工智能使得這個過程逐漸變得簡單而高效。通過提取低保真原型中的語義概念,實現(xiàn)自動生成具有更高保真度的原型,將能夠有效支持設(shè)計師快速探索各類設(shè)計方案。典型研究如2019年微軟AI Lab推出的Sketch2Code[64]系統(tǒng),Sketch2Code可以將用戶的手繪草圖實時地轉(zhuǎn)換為UI原型對應(yīng)的HTML代碼,其核心轉(zhuǎn)換過程可分為面向草圖的UI元素識別與匹配、手寫文本識別、UI布局生成以及HTML代碼生成4步。但Sketch2Code目前還只能針對布局較為簡單的低保真原型生成其相應(yīng)的HTML代碼,難以處理更加復(fù)雜的案例。為此,Pan等[72]提出結(jié)合深度學(xué)習(xí)和專家啟發(fā)式評估對低保真的UI原型進行更細粒度的處理和識別,并基于此開發(fā)了能夠處理復(fù)雜布局原型并生成良好結(jié)構(gòu)代碼的UI原型轉(zhuǎn)HTML工具Visual Compiler,同時友好地支持原型的二次開發(fā)。相關(guān)應(yīng)用研究還包括Eve[63]、CSSSketch2Code[73]等。目前,數(shù)據(jù)集仍是該研究方向的限制因素之一[74],探索建立具有更大規(guī)模、更細粒度的草圖數(shù)據(jù)集將有利于提高系統(tǒng)生成內(nèi)容的豐富性,為設(shè)計師提供更多可參考的原型方案。由于手繪草圖本身容易受到來自設(shè)計師主觀因素(如繪畫風(fēng)格等)的影響,相同語義的UI元素或圖形將可能呈現(xiàn)多樣化的形態(tài),因此建立面向草圖的視覺識別和生成模型也將是未來的重要探索方向[75]。
隨著VR、AR等技術(shù)的發(fā)展,虛擬原型設(shè)計成為數(shù)字創(chuàng)意領(lǐng)域中新興的探索方向。設(shè)計師可借助VR或AR頭顯等設(shè)備(如微軟HoloLens)在3D虛擬環(huán)境中進行協(xié)同設(shè)計,實現(xiàn)產(chǎn)品原型的快速迭代[76]。例如,Hammady等[77]基于微軟HoloLens開發(fā)了具有3D視圖的UI原型,并將其應(yīng)用于博物館的游客參觀引導(dǎo)中;Erra等[78]基于微軟Kinect 2開發(fā)了一項虛擬試衣技術(shù),這項技術(shù)能夠支持服裝設(shè)計師對服裝原型進行快速評估和迭代。目前,虛擬原型設(shè)計的應(yīng)用還較少,受VR、AR等技術(shù)自身應(yīng)用場景的限制,相關(guān)研究仍處于起步階段。
2.1.4 設(shè)計評價
設(shè)計評價的目的是衡量設(shè)計結(jié)果的質(zhì)量好壞,人工智能主導(dǎo)的設(shè)計評價可能為設(shè)計師提供更加客觀而有效的參考建議。美學(xué)和功能是兩個非常重要的設(shè)計評價準則[79],目前人工智能在數(shù)字創(chuàng)意設(shè)計評價任務(wù)中的應(yīng)用研究主要面向前者,相關(guān)研究領(lǐng)域主要是計算美學(xué)。
針對視覺藝術(shù)的計算美學(xué)主要研究如何讓計算機模擬人類思維對視覺表達進行美學(xué)評估[80],即自動計算不同類型視覺內(nèi)容的美感程度,例如圖像、圖形用戶界面(Graphical User Interface,GUI)、LOGO、服裝等。傳統(tǒng)美學(xué)計算主要采用基于人工設(shè)計特征的方法[81],例如Li等[82]將顏色和構(gòu)圖作為機器學(xué)習(xí)的主要特征用以評估繪畫的美學(xué)質(zhì)量,Ciesielski等[83]將紋理和色矩作為關(guān)鍵特征用以評估攝影圖像的美學(xué)價值。這是一種模仿人類專家實現(xiàn)美學(xué)評價的形式,通過設(shè)計合適的美學(xué)特征對圖像的不同方面進行建模,再基于分類、回歸等方法預(yù)測得到圖像的美學(xué)值。這類方法具有良好的可解釋性,但通常由于無法描述全部美學(xué)特征而導(dǎo)致準確度受限。相比之下,基于深度神經(jīng)網(wǎng)絡(luò)的美學(xué)計算方法具有更好的預(yù)測效果。2015年,Lu等[84]首次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在美學(xué)計算領(lǐng)域中,在圖像美學(xué)評價的準確率上獲得了大幅提升。由于這類方法采取從圖像中自動提取美學(xué)特征的形式,因此無需專業(yè)人員針對不同類型的視覺內(nèi)容設(shè)計相應(yīng)的美學(xué)特征,只需提供對應(yīng)類型的數(shù)據(jù)集即可,但這類方法的主要問題在于其預(yù)測結(jié)果的可解釋性較差。典型的計算美學(xué)系統(tǒng)框架如圖5所示。
目前,計算美學(xué)的進一步應(yīng)用大多集中在圖像自動裁剪、圖像自動篩選、圖像摘要生成等圖像編輯領(lǐng)域[85]。有關(guān)計算美學(xué)支持設(shè)計過程方面的應(yīng)用研究還較少,主要集中于對GUI[86-87]和LOGO[88-89]設(shè)計的美學(xué)評價。典型應(yīng)用如2019年Dou等[86]提出的用于自動計算和量化網(wǎng)頁美感的評價工具Webthetics,Webthetics采用遷移學(xué)習(xí)的方法,基于圖像風(fēng)格識別任務(wù)實現(xiàn)評價模型的預(yù)訓(xùn)練,接著將預(yù)訓(xùn)練好的評價模型遷移到網(wǎng)頁美學(xué)的評價任務(wù)上,既實現(xiàn)了網(wǎng)頁美感的自動評價,又克服了缺少網(wǎng)頁美學(xué)評價數(shù)據(jù)的挑戰(zhàn)。
人工智能在生產(chǎn)創(chuàng)意內(nèi)容方面的應(yīng)用,主要是以解決自動化、批量化設(shè)計任務(wù)的智能生產(chǎn)平臺為代表。在這類智能生產(chǎn)平臺上,設(shè)計師只需輸入特定的設(shè)計目標和約束條件,就可以得到豐富的設(shè)計結(jié)果。例如2019年You等[21]采用數(shù)據(jù)驅(qū)動的方法解決產(chǎn)品廣告圖像的自動配色設(shè)計問題,他們提出了一個視覺色彩分析系統(tǒng),該系統(tǒng)能夠基于用戶輸入的產(chǎn)品顏色以及若干關(guān)鍵字,對整幅廣告圖像進行自動配色,從而快速支持產(chǎn)品推廣及品牌營銷等活動。
和設(shè)計師相比,盡管人工智能生成的設(shè)計結(jié)果還無法直接推向市場,但機器驅(qū)動的設(shè)計生產(chǎn)降低了勞動力成本,提高了生產(chǎn)效率。在原型結(jié)果的基礎(chǔ)上,設(shè)計師還可以進一步優(yōu)化細節(jié),以滿足用戶和市場的需求。典型應(yīng)用如海報自動生成平臺“鹿班”、參數(shù)化字體設(shè)計平臺“Spectral”和LOGO自動設(shè)計平臺“Looka”等,相關(guān)研究涉及自動布局生成[90]、字體生成[91]、圖像生成[92]等眾多領(lǐng)域。
隨著設(shè)計和人工智能這兩個領(lǐng)域不斷碰撞和融合,人工智能在設(shè)計領(lǐng)域中的介入程度越來越深[93],設(shè)計師與計算機的關(guān)系逐漸呈現(xiàn)多元化的形態(tài)。
(1)設(shè)計師與計算機呈現(xiàn)一種主仆關(guān)系。設(shè)計師通常會讓計算機完成一些規(guī)則單一的、機械性的工作內(nèi)容,這類工作往往非常耗時且沒有任何創(chuàng)意可言。
(2)當(dāng)計算機對復(fù)雜問題具備一定的分析和推理能力,便可成為設(shè)計師的助理。作為助理,計算機要能夠基于設(shè)計師確定的風(fēng)格和規(guī)則,完成不同場景下的適配性設(shè)計,此時計算機的主要職責(zé)在于幫助設(shè)計師完成高重復(fù)性、低創(chuàng)造性的設(shè)計工作。
(3)當(dāng)計算機具備自主學(xué)習(xí)的能力,能夠從大量的案例和經(jīng)驗中總結(jié)知識、預(yù)測未來,形成初步的創(chuàng)新能力,此時設(shè)計師與計算機呈現(xiàn)一種師生關(guān)系。作為學(xué)生,計算機要按照設(shè)計師的要求去學(xué)習(xí)某一領(lǐng)域的知識,并能夠在設(shè)計師的指導(dǎo)下完成一定的創(chuàng)造性工作。
(4)當(dāng)計算機具備一定的自主創(chuàng)新能力,能夠從現(xiàn)象和過程中發(fā)現(xiàn)新的問題和創(chuàng)意,并給出相應(yīng)的解決方案,此時設(shè)計師與計算機呈現(xiàn)一種合伙人的關(guān)系。作為合伙人,計算機能夠為設(shè)計師提供具有建設(shè)性的意見和啟發(fā),設(shè)計師則能夠讓計算機學(xué)習(xí)到新的知識和技能。
如圖6所示,這4種關(guān)系表現(xiàn)了計算機對設(shè)計領(lǐng)域的不同介入程度和影響方式,也是人工智能介入設(shè)計領(lǐng)域之后的不同發(fā)展方向。這4種關(guān)系并無高下之分,在設(shè)計過程中,設(shè)計師既需要忠實的仆人和可靠的助理,也需要聰明的學(xué)生和有能力的合伙人。
人工智能已成為設(shè)計的新維度、新要素,是新的設(shè)計范式下的主要驅(qū)動力。人工智能賦能的設(shè)計新范式尚無成型的設(shè)計方法,包含多種理論和立場,是非排他性的。因此,本文嘗試從設(shè)計過程、設(shè)計對象、設(shè)計師職能3方面來描述新范式的特征,希望為設(shè)計與人工智能的進一步發(fā)展提供參考。
在傳統(tǒng)的設(shè)計范式里,設(shè)計過程可以抽象成一條從用戶研究到功能和形式設(shè)計,最終構(gòu)建產(chǎn)品的設(shè)計鏈路。然而,隨著人工智能的發(fā)展和介入,傳統(tǒng)設(shè)計過程逐漸發(fā)生了變化。設(shè)計師不再是通過用戶抽樣去尋找需求、給出一個解決方案,而是介入產(chǎn)品的整個生命周期中,在用戶的實際體驗過程中不斷地再設(shè)計、再優(yōu)化[94],從而給用戶帶來更加個性化的服務(wù)體驗。因此,設(shè)計不再是產(chǎn)品生產(chǎn)鏈路中的一個節(jié)點,而是成為以用戶為中心、人工智能賦能的設(shè)計循環(huán),貫穿整個產(chǎn)品生命周期。
新范式下的設(shè)計對象亦發(fā)生了改變。以往,設(shè)計師的目標通常是單個的設(shè)計產(chǎn)出?,F(xiàn)如今在人工智能賦能的背景下,設(shè)計師的使命將不再局限于一個個“物”的設(shè)計,而是有可能直接參與“造物主”的設(shè)計[95],其設(shè)計目標將是一條條自動化生產(chǎn)線,通過參與構(gòu)建具備自動設(shè)計能力的復(fù)雜系統(tǒng),支撐起各類產(chǎn)品與服務(wù)的智能化、批量化生成。不同于工業(yè)時代中批量生產(chǎn)的規(guī)格化產(chǎn)品,人工智能背景下大批量生成的設(shè)計結(jié)果彼此之間并非完全一致,將呈現(xiàn)出“千人千面”的差異性[96]。
設(shè)計對象的改變亦對設(shè)計師的職能提出了全新的要求,設(shè)計工具的革新也需要設(shè)計師與時俱進。在未來,數(shù)據(jù)和算法將成為設(shè)計師需要熟悉和掌握的首要工具。設(shè)計師應(yīng)具備與人工智能技術(shù)團隊協(xié)作的能力,能從數(shù)據(jù)的角度理解設(shè)計的構(gòu)成,從算法的角度了解智能系統(tǒng)的運行。這也給設(shè)計教育、設(shè)計研究提出了新的挑戰(zhàn)。設(shè)計師作為設(shè)計與大眾密切相關(guān)產(chǎn)品的職業(yè),需要與各行業(yè)人才共同行動,一起構(gòu)建起人工智能與人和諧共處、互促共進的新環(huán)境。
本文回顧了在人工智能賦能的背景下數(shù)字創(chuàng)意設(shè)計領(lǐng)域的發(fā)展現(xiàn)狀和應(yīng)用前景,希望能夠為后續(xù)的相關(guān)研究和設(shè)計實踐提供有益的參考。本文首先總結(jié)了設(shè)計與人工智能之間的關(guān)系和挑戰(zhàn);然后從支持設(shè)計過程和創(chuàng)意內(nèi)容生產(chǎn)兩個角度對人工智能在設(shè)計領(lǐng)域下的最新應(yīng)用研究做了綜述,特別是針對需求分析、創(chuàng)意激發(fā)、原型設(shè)計和設(shè)計評價4個階段重點論述了人工智能對傳統(tǒng)設(shè)計流程的支持和促進;最后提出人工智能與設(shè)計之間的關(guān)系將呈現(xiàn)出多元化的形態(tài),新的設(shè)計范式正在產(chǎn)生,在人工智能賦能的背景下,設(shè)計正逐漸邁向一個全新的時代。