張穎
(南京藝術(shù)學(xué)院信息化建設(shè)管理中心,江蘇 南京 210013)
人工智能和大數(shù)據(jù)技術(shù)作為推動(dòng)中國(guó)經(jīng)濟(jì)發(fā)展的新引擎,已在新一輪科技與產(chǎn)業(yè)革命的關(guān)鍵領(lǐng)域形成主導(dǎo),并被普遍應(yīng)用于各行各業(yè),如家居、醫(yī)院、安防、金融等,極大便利了人們的工作和生活。藝術(shù)領(lǐng)域也不例外,“AI+藝術(shù)”也日趨流行。本文正是基于此背景綜合調(diào)研了AI 在藝術(shù)各細(xì)分領(lǐng)域中的發(fā)展情況,并對(duì)AI 在藝術(shù)領(lǐng)域發(fā)展中面臨的問題進(jìn)行了探討。
人工智能發(fā)展前景廣闊,在歐美等國(guó)甚至已上升至國(guó)家戰(zhàn)略高度。中國(guó)相關(guān)政策密集出臺(tái),如2015—2018 年,國(guó)務(wù)院先后發(fā)布了《新一代人工智能發(fā)展規(guī)劃》《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018—2020 年)》[1]等文件,地方政策如《南京市關(guān)于加快人工智能產(chǎn)業(yè)發(fā)展的實(shí)施意見》等。據(jù)IDC發(fā)布的《全球人工智能支出指南》預(yù)測(cè),全球AI 市場(chǎng)規(guī)模將于2025 年增至2 218.7 億美元,其中,中國(guó)將占全球總規(guī)模8.3%,位列單體國(guó)家第二。中國(guó)“十四五”規(guī)劃綱要更是將人工智能定位為新興數(shù)字產(chǎn)業(yè)。
在學(xué)術(shù)界,自然科學(xué)更側(cè)重人工智能技術(shù)的創(chuàng)新和研發(fā),而社會(huì)人文科學(xué)則較為關(guān)注人工智能與各行各業(yè)深度結(jié)合的應(yīng)用。在藝術(shù)學(xué)科領(lǐng)域人工智能以更接近人類感知的方式,延伸和增強(qiáng)了藝術(shù)創(chuàng)作的能力。
本文通過對(duì)“人工智能+藝術(shù)”“人工智能+設(shè)計(jì)”“人工智能+音樂”“人工智能+繪畫”“人工智能+書法”“人工智能+圖像處理”“人工智能+傳媒”“人工智能+影視”等關(guān)鍵字的檢索,在分析和調(diào)研了63 篇期刊、碩博士論文的基礎(chǔ)上,梳理出人工智能在以下藝術(shù)領(lǐng)域應(yīng)用中的最新進(jìn)展。
人工智能與音樂結(jié)合主要有兩大研究方向:音樂信息檢索和音樂生成[2]。
在音樂信息檢索方面,奧地利人工智能研究所借鑒計(jì)算機(jī)視覺領(lǐng)域的研究,把頻譜圖看作圖像,利用無監(jiān)督特征學(xué)習(xí)和受限玻爾茲曼機(jī)進(jìn)行音樂分類。法國(guó)國(guó)家視聽研究所使用半監(jiān)督策略訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行音樂分類和分割。西班牙馬德里自治大學(xué)探索了混合卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò)方法進(jìn)行語音和音樂檢測(cè)。瑞典皇家理工學(xué)院則提出使用時(shí)域卷積網(wǎng)絡(luò)來實(shí)現(xiàn)音樂檢測(cè)。浙江大學(xué)的馮雅中、莊越挺、潘云鶴等人已將神經(jīng)網(wǎng)絡(luò)理論引入到音樂哼唱檢索中并取得良好的效果。
在音樂作曲方面,20 1 5 年谷歌公司推出的DeepDream,在完成對(duì)百萬級(jí)藝術(shù)家創(chuàng)作風(fēng)格學(xué)習(xí)的基礎(chǔ)上可根據(jù)用戶需求自動(dòng)合成藝術(shù)家風(fēng)格的唱片。IBM 公司的Watson 借助認(rèn)知計(jì)算技術(shù)已在2017 年與格萊美獲獎(jiǎng)制作人Alex Dakid 成功創(chuàng)作了歌曲。美國(guó)OpenAI公司提出了MuseNet模型可實(shí)現(xiàn)不同風(fēng)格樂器音樂作品的生成,其另一模型Jukebox 可生成各種流派藝術(shù)家風(fēng)格音樂或演唱音頻。加拿大多倫多大學(xué)使用循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)流行音樂的生成,提出了著名的Song From PI 工作。百度公司發(fā)布的“看圖作曲”可將某張照片或圖片進(jìn)行元素分解并進(jìn)行情感分析,然后智能訪問樂譜數(shù)據(jù)庫自動(dòng)組合作曲。南京藝術(shù)學(xué)院博士論文《基于樂譜識(shí)別的深度學(xué)習(xí)算法作曲系統(tǒng)》重點(diǎn)研究了基于深度學(xué)習(xí)算法作曲領(lǐng)域中的非人工干預(yù)創(chuàng)作。中國(guó)科技大學(xué)碩士論文《基于深度學(xué)習(xí)的自動(dòng)作曲編曲研究》則結(jié)合深度學(xué)習(xí)重點(diǎn)研究了音樂生成中的關(guān)鍵問題。
2018 年10 月,由人工智能自主合成的首幅繪畫作品油畫《埃德蒙·貝拉米畫像》(Portrait of Edmond Belamy)問世,其背后支撐的技術(shù)便是深度學(xué)習(xí)模型;2016 年由俄羅斯開發(fā)者阿列克謝·莫伊辛恩科夫(Alexey Moiseenkoy)將神經(jīng)網(wǎng)絡(luò)技術(shù)和工智能照片編輯器結(jié)合創(chuàng)造了prisma,通過系統(tǒng)學(xué)習(xí)和訓(xùn)練著名繪畫藝術(shù)家的藝術(shù)風(fēng)格,可將普通照片轉(zhuǎn)換為不同藝術(shù)家或流派的風(fēng)格。2021 年1 月Open AI 公布人工智能神經(jīng)網(wǎng)絡(luò)“DALL·E”,其因聲稱可以通過自然語言文本直接生成對(duì)應(yīng)圖像而獲得廣泛關(guān)注[3]。
國(guó)內(nèi)方面,中影培訓(xùn)基地與中國(guó)科技大學(xué)技術(shù)團(tuán)隊(duì)合作創(chuàng)造了“中影·神思”,通過對(duì)人類藝術(shù)家的美學(xué)思想、藝術(shù)理念、工藝流程等的學(xué)習(xí),并將其轉(zhuǎn)化為審美數(shù)學(xué)模型實(shí)現(xiàn)自動(dòng)圖像處理。人工智能繪畫機(jī)器人Andy(美圖公司研發(fā))通過對(duì)海量圖畫作品的深度學(xué)習(xí),可基于用戶照片輸入模仿諸多種不同風(fēng)格的肖像畫。阿里巴巴智能設(shè)計(jì)實(shí)驗(yàn)室自主研發(fā)的鹿班平臺(tái)利用圖像智能生成技術(shù)1 s 即可設(shè)計(jì)出8 000 張海報(bào)。國(guó)內(nèi)學(xué)術(shù)界還出現(xiàn)了基于人工智能的古陶瓷器型和紋飾圖像特征識(shí)別研究、基于影像特征的藝術(shù)品識(shí)別檢索等藝術(shù)細(xì)分領(lǐng)域的深度研究和應(yīng)用。
人工智能在影視項(xiàng)目全生命周期的各個(gè)環(huán)節(jié)都能發(fā)揮它的作用。結(jié)合大數(shù)據(jù)利用人工智能分析技術(shù),在影視劇本策劃階段我們即可過濾掉不符合市場(chǎng)需要的策劃題材。影視制作時(shí),可利用增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)、步態(tài)識(shí)別、人臉識(shí)別等人工智能技術(shù)完成鏡頭動(dòng)態(tài)捕捉、視頻剪輯、虛擬角色和場(chǎng)景創(chuàng)作等,如2016年11 月,Adobe 公司發(fā)布了一款可用于Photoshop、Premiere、Illustrato 等軟件中的基于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的底層人工智能工具——Adobe Sensei,同年第一部由紐約大學(xué)AI 研究員奧斯卡·夏普(Oscar Sharp)和羅斯·古德溫(Ross Goodwin)開發(fā)的遞歸神經(jīng)網(wǎng)絡(luò)系統(tǒng)“Benjamin”創(chuàng)作了基于人工智能的影視劇本Sunspring。2017 年7 月,Adobe 與斯坦福大學(xué)研究人員共同研發(fā)了一款可以用于自動(dòng)視頻剪輯工作的人工智能程序,同年Botnik 研究室利用人工智能技術(shù)開發(fā)了“預(yù)言鍵盤”算法,創(chuàng)作了《哈利·波特與看起來像一大坨灰燼的肖像》[4]。阿里魚平臺(tái)可基于影視內(nèi)容實(shí)現(xiàn)流量預(yù)測(cè),助力其生態(tài)賣家引入優(yōu)質(zhì)IP 版權(quán)。其他方面的應(yīng)用如安捷秀(Agile Shot),可以在保證自然語言分析準(zhǔn)確率的基礎(chǔ)上,對(duì)導(dǎo)入或輸入的劇本內(nèi)容進(jìn)行自動(dòng)分解等,從而提升工作效率。
在設(shè)計(jì)領(lǐng)域,人工智能與設(shè)計(jì)結(jié)合已發(fā)展出一門新學(xué)科分支,即設(shè)計(jì)人工智能DAI 或D+AI。國(guó)內(nèi)外各大高校也紛紛建立起人工智能交互設(shè)計(jì)實(shí)驗(yàn)室,如麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)、斯坦福大學(xué)的人工智能實(shí)驗(yàn)室(SAIL)、湖南大學(xué)藝術(shù)學(xué)院的人工智能實(shí)驗(yàn)室(Design A.I.Lab)等,智能交互設(shè)計(jì)專業(yè)也在2021 年被批準(zhǔn)為中國(guó)普通高等學(xué)校本科專業(yè)。但在學(xué)術(shù)界目前相關(guān)研究成果并不突出,2005 年美國(guó)Donald Norma 曾在其著作The Design of Future Things一書中探索了人的心理和機(jī)器的能力;2018 年中國(guó)譚力勤線上出版的《奇點(diǎn)藝術(shù)》從科技和藝術(shù)融合的角度曾探索了未來藝術(shù)的發(fā)展和思考[5]。業(yè)界百度公司曾以地圖為例探索了基于人工智能的情感化語音交互設(shè)計(jì),科大訊飛開發(fā)的集導(dǎo)航、電話、娛樂、聊天等功能于一體的小飛魚駕駛助手實(shí)現(xiàn)了無屏化交互,體現(xiàn)了一部分人工智能和主動(dòng)設(shè)計(jì)的思想,另在其他一些智能家居產(chǎn)品中都有一些體現(xiàn),但目前都未形成完整的理論體系。
在藝術(shù)傳播方面,人工智能能夠改善因針對(duì)性不強(qiáng)而導(dǎo)致的傳播效率偏低且無法發(fā)揮長(zhǎng)尾優(yōu)勢(shì)等傳播缺陷[6]。通過數(shù)據(jù)采集、量化建立模型并進(jìn)行人工智能數(shù)據(jù)挖掘,可以在藝術(shù)信息與受眾需求之間達(dá)到良好的匹配進(jìn)行精準(zhǔn)傳播。在新聞寫作和制作中,機(jī)器人新聞利用專門的算法和自然語言生成器捕捉重要信息進(jìn)行結(jié)構(gòu)化處理可實(shí)現(xiàn)自動(dòng)撰稿;在新聞播報(bào)方面,人工智能主播能自動(dòng)生成播報(bào)內(nèi)容,2017 年微軟和湛盧文化合作推出的微軟“小冰”通過學(xué)習(xí)近百年來眾多詩人的現(xiàn)代詩歌作品,運(yùn)用深度神經(jīng)網(wǎng)絡(luò)技術(shù)不僅創(chuàng)作了詩集《陽光失了玻璃窗》,還作為主持人參與主持了多檔電視節(jié)目和廣播節(jié)目。
人工智能技術(shù)的發(fā)展給藝術(shù)領(lǐng)域帶來了新的思路和眼界,但作為新的學(xué)科交叉,仍存在較多問題和爭(zhēng)議,主要體現(xiàn)在以下幾個(gè)方面。
人工智能藝術(shù)創(chuàng)作離不開大數(shù)據(jù)、機(jī)器學(xué)習(xí)、數(shù)據(jù)處理分析和建模等技術(shù)的支持。對(duì)藝術(shù)從業(yè)者來說,其大部分相關(guān)軟件的使用仍過于專業(yè),且學(xué)習(xí)成本較高,影響了AI 和藝術(shù)的深度結(jié)合,因此需要降低其使用門檻。
人工智能在藝術(shù)創(chuàng)作上存在一定限制。人工智能技術(shù)以邏輯和理性思維為主,其在語義、情緒與情感的分析和處理能力仍然較弱,并不能很好地復(fù)制和表達(dá)人類的情感,而藝術(shù)的表現(xiàn)力依賴于創(chuàng)造性、批判性、象征性等,其創(chuàng)作離不開藝術(shù)家對(duì)于人類靈魂獨(dú)特性的體驗(yàn)以及對(duì)生命的感悟,人工智能仍處于錦上添花的階段。
人工智能生成內(nèi)容版權(quán)保護(hù)問題爭(zhēng)議較大,人工智能創(chuàng)作物具有涉獵范圍廣、低成本高產(chǎn)出、擬人化等特點(diǎn)[6],其在創(chuàng)作過程中利用已有的資源作為創(chuàng)作學(xué)習(xí)的基礎(chǔ),可能存在侵權(quán)之嫌,同時(shí)其創(chuàng)作物在商業(yè)化使用過程中存在一定的利益之爭(zhēng),而國(guó)內(nèi)外還沒有針對(duì)人工智能創(chuàng)造物的知識(shí)產(chǎn)權(quán)歸屬作出明確規(guī)定。因此如何進(jìn)行著作權(quán)保護(hù)這一問題值得深入研究,這中間所涉及的創(chuàng)作物性質(zhì)、權(quán)利歸屬認(rèn)定以及保護(hù)方式等仍需要社會(huì)和相關(guān)部門進(jìn)行前瞻性思考。
人工智能潛在的安全問題可分為客觀和主觀2 個(gè)方面:客觀因素包括AI 技術(shù)的應(yīng)用不夠成熟、相關(guān)算法缺少透明性和可解釋性等[7];主觀上存在AI 技術(shù)被不法分子利用實(shí)施不法行為謀取暴利的可能,甚至利用“有目的性”的數(shù)據(jù)來干擾AI 決策等。在人工智能數(shù)據(jù)安全方面,不同國(guó)家和機(jī)構(gòu)都在其制定的政策中有所體現(xiàn),如《歐盟人工智能》在其戰(zhàn)略規(guī)劃部分指出需制定與人工智能發(fā)展和應(yīng)用相適應(yīng)的倫理和法律框架;2019 年美國(guó)政府發(fā)布的《美國(guó)人工智能倡議》強(qiáng)調(diào)了人工智能對(duì)傳統(tǒng)安全領(lǐng)域的重要意義;2020 年6 月中國(guó)發(fā)布的《全國(guó)人大常委會(huì)2020 年度立法工作計(jì)劃》明確提出“重視對(duì)人工智能、區(qū)塊鏈、基因編輯等新技術(shù)新領(lǐng)域相關(guān)法律問題的研究”,但相關(guān)立法工作仍然是任重而道遠(yuǎn)。
本文基于人工智能發(fā)展的大背景,討論了人工智能在藝術(shù)各領(lǐng)域中的應(yīng)用和發(fā)展前景,并對(duì)人工智能在藝術(shù)領(lǐng)域發(fā)展中存在的一些問題進(jìn)行了深入探討和闡述,為后續(xù)研究提供參考。