摘要:GAI以強大的多模態(tài)內(nèi)容生成與互轉(zhuǎn)能力,為影視內(nèi)容創(chuàng)作提供了前所未有的支持。以文生視頻軟件Sora為例,可以看出GAI在提升影視創(chuàng)作效率與質(zhì)量、創(chuàng)新人物設計、自動生成劇本及優(yōu)化視覺效果等方面的潛力。GAI的引入不僅推動了影視創(chuàng)作的創(chuàng)新,也為人機協(xié)作提供了可能。機器通過模仿學習,逐漸展現(xiàn)出更人性化的創(chuàng)作思維,而人類則在創(chuàng)作過程中融入了更多機器化的精準與高效。因此,未來的影視創(chuàng)作流程將持續(xù)革新,與GAI技術相輔相成,既保持藝術作品的人性特質(zhì),又借助其強大的功能推動多模態(tài)生成式藝術的發(fā)展,塑造全新藝術范式與語言。
關鍵詞:生成式人工智能 視頻編輯 內(nèi)容創(chuàng)作
近年來,生成式人工智能(Generative Artificial Intelligence,簡稱GAI)迎來迅速發(fā)展期,在助力各行各業(yè)的基礎上,也為影視行業(yè)帶來了革命性的技術革新。在影視制作中,從劇本創(chuàng)作到角色設計,從視覺特效制作到背景音樂創(chuàng)作,GAI都能夠提供高效、創(chuàng)新的解決方案。在人機協(xié)作的新模式下,創(chuàng)作者可以更多地專注于創(chuàng)意思考和藝術指導,而將繁瑣的技術執(zhí)行交給GAI。這不僅能夠釋放人類創(chuàng)造力,也為影視藝術的發(fā)展提供了新的可能性。
一、GAI的發(fā)展現(xiàn)狀
近年來,生成式人工智能(GAI)依托深度學習、自然語言處理(NLP)與計算機視覺(Computer Vision)等技術的突破,在AI大模型領域取得顯著進展。以ChatGPT、Sora為代表的國際大模型引領了文本與多模態(tài)生成技術的革新,而國產(chǎn)大模型如DeepSeek的崛起則標志著全球GAI競爭格局的深刻變化。摩根大通報告指出,中國GAI發(fā)展正處于應用落地的第二階段,DeepSeek等本土模型的突破為行業(yè)提供了技術自主化的關鍵支撐。
GAI技術的核心在于利用機器學習模型,特別是那些能夠處理和生成大規(guī)模數(shù)據(jù)集的模型,如變分自編碼器(VAEs)、生成對抗網(wǎng)絡(GANs)和Transformer模型。這些技術的進步為GAI提供了強大的算法支持,使其能夠生成質(zhì)量越來越高的文本、圖像、音樂和視頻等內(nèi)容。
ChatGPT基于Transformer架構,在自然語言生成領域?qū)崿F(xiàn)了類人水平的文本創(chuàng)作能力;Sora則通過GANs技術將文本描述轉(zhuǎn)化為高精度視覺內(nèi)容。兩者分別代表了文本與圖像生成的技術標桿。然而,DeepSeek的低成本高性能路線打破了國際技術壟斷,其R1模型在數(shù)學推理、代碼生成等任務中超越GPT-4o,且支持本地化部署與行業(yè)定制。
DeepSeek作為中國AI自主創(chuàng)新的代表,展現(xiàn)出三大核心優(yōu)勢實現(xiàn)國產(chǎn)化突破。一是技術性能領先,其DeepSeek-V3在國際基準測試中超越Llama3.1與GPT-4o,在復雜邏輯推理、多模態(tài)生成等場景表現(xiàn)突出。二是應用場景深化,在政務領域助力深圳福田區(qū)開發(fā)AI數(shù)智員工,實現(xiàn)政務大模型2.0升級;在影視創(chuàng)作中,憑借多模態(tài)生成能力可快速生成分鏡腳本與特效方案,提升制作效率。三是生態(tài)協(xié)同創(chuàng)新,通過開源社區(qū)與產(chǎn)業(yè)鏈合作推動技術普惠化,如長安汽車將其接入車機系統(tǒng)供用戶語音交互調(diào)用,開發(fā)者利用其API構建企業(yè)級RAG應用實現(xiàn)低成本知識庫智能化。
當前GAI發(fā)展呈現(xiàn)兩大方向:一是以OpenAI為代表的高成本尖端路線,專注于未知領域探索;二是以DeepSeek為代表的低成本大眾化路線,通過效率優(yōu)化與開源生態(tài)推動技術普惠。國產(chǎn)模型的突破不僅重塑了全球AI競爭格局,更驗證了“技術—產(chǎn)業(yè)—應用”閉環(huán)的可能性。未來,GAI將加速與影視、金融、政務等領域的融合,形成“人機協(xié)同創(chuàng)作”的新范式,在保持藝術人性化的同時,實現(xiàn)工業(yè)化精準生產(chǎn)。
二、GAI技術在影視內(nèi)容生產(chǎn)中的多維挑戰(zhàn)
從劇本創(chuàng)作、角色設計,到特效生成、后期剪輯,GAI技術展現(xiàn)出巨大的應用潛力,為影視從業(yè)者打開了全新的創(chuàng)作視野與想象空間。但在這令人振奮的技術變革背后,是版權歸屬模糊、倫理失范風險及技術誤用等系統(tǒng)性挑戰(zhàn)的顯性化。
1.版權與知識產(chǎn)權。在新技術浪潮的推動下,GAI技術以Sora等為代表,于2024年初引發(fā)了廣泛的社會關注。該技術與影視工業(yè)化流程相融合,為整個行業(yè)帶來了前所未有的發(fā)展機遇。GAI技術的局限性以及使用者之間的差異,也使得作品在藝術意蘊、原創(chuàng)性以及倫理道德等方面面臨著日益嚴峻的挑戰(zhàn)。例如,在藝術家克里斯蒂娜·卡什塔諾娃為其漫畫書《黎明的曙光》申請版權保護時,其使用Midjourney生成的AI插圖卻未能得到美國版權局的認可。這一案例凸顯了GAI作品在著作權法保護方面的復雜性和不確定性。面對這些生成式AI所存在的潛在問題,未來的研究在推動技術創(chuàng)新的同時,更需要關注社會制度的完善,以確保在技術的健康發(fā)展與承擔社會責任之間保持平衡。美國版權局對于GAI作品持有明確立場,即版權只保護人類創(chuàng)造力的產(chǎn)物,而AI的貢獻被視為“機械復制”的結果,這一態(tài)度為GAI技術的未來發(fā)展提供了重要的參考方向。
GAI生成的內(nèi)容,無論是劇本、角色形象還是視覺特效,都建立在大量的現(xiàn)有數(shù)據(jù)之上,這些數(shù)據(jù)往往來源于各種版權作品。這導致了一個復雜而微妙的局面:GAI生成的內(nèi)容是否侵犯了原始作品的版權?其版權又應歸屬于何方?
對于這一問題,現(xiàn)有的法律體系尚未提供明確的答案。傳統(tǒng)的版權觀念通?;谧髌返脑瓌?chuàng)性和作者的創(chuàng)造性勞動,而GAI生成的內(nèi)容卻是由算法自動生成的,這使得版權歸屬變得模糊不清。此外,當GAI被用于模仿或復制現(xiàn)有的影視作品時,也可能涉及侵權問題。
因此,需要重新審視并更新現(xiàn)有的版權和知識產(chǎn)權法規(guī),以適應GAI的健康發(fā)展。這包括明確GAI生成內(nèi)容的版權歸屬原則、制定合理的使用許可機制,以及加強版權侵權行為的打擊力度。同時,業(yè)界還需要推動建立跨行業(yè)的合作機制,共同制定行業(yè)標準和規(guī)范,以促進影視產(chǎn)業(yè)的健康發(fā)展。
2.道德與倫理問題。GAI在影視制作中的應用也引發(fā)了深刻的道德和倫理問題。一方面,GAI可能被用于創(chuàng)建涉及真實人物的內(nèi)容,如深度偽造視頻等。這些視頻可能會侵犯個人隱私、損害名譽,甚至對受害者造成精神傷害。因此,需要在技術發(fā)展的同時,加強對個人隱私和肖像權的保護,制定嚴格的監(jiān)管措施和技術標準,防止GAI被濫用。
另一方面,GAI也可能無意中傳播偏見和歧視觀念。由于AI大模型通?;诖罅繑?shù)據(jù)進行訓練,這些數(shù)據(jù)中存在的偏見和歧視觀念可能會被算法繼承并放大,導致生成的影視內(nèi)容存在對不公正理念的過度渲染,進而加劇社會矛盾。因此,我們需要在GAI技術的設計和應用中充分考慮道德和倫理因素,加強數(shù)據(jù)審核和算法優(yōu)化,確保生成的內(nèi)容符合社會主義核心價值觀和道德標準。
3.技術誤用。技術誤用是GAI在影視領域面臨的另一個重要風險。GAI技術的高度自動化和智能化使得其生成的內(nèi)容具有極高的逼真度和可信度,這也為虛假信息的傳播提供了便利。不法分子可能會利用GAI技術制作虛假新聞、誤導性廣告或惡意攻擊他人的視頻,從而破壞社會秩序、損害公共利益,產(chǎn)生社會信任危機等問題。
為了應對這一風險,人們需要采取多種措施。一方面,加強技術監(jiān)管和審核機制,建立嚴格的審核標準和流程,確保GAI生成的內(nèi)容真實可靠、符合法律法規(guī)。另一方面,推動技術研發(fā)和創(chuàng)新,開發(fā)能夠識別和過濾虛假信息的算法和技術工具,提高信息的真實性和可信度。
三、GAI在影視領域的創(chuàng)新應用
當下,大數(shù)據(jù)與人工智能技術正以前所未有的速度蓬勃發(fā)展,成為推動影視領域變革的關鍵力量。而 GAI作為其中的新興主力軍,更是嶄露頭角,憑借自身獨特的優(yōu)勢,逐步打破傳統(tǒng)影視創(chuàng)作的固有邊界。
1.GAI在影視創(chuàng)作流程中的革新。隨著大數(shù)據(jù)和人工智能技術的迅猛進步,GAI已深入影視內(nèi)容創(chuàng)作的各個環(huán)節(jié),為觀眾呈現(xiàn)更加個性化與創(chuàng)新性的體驗。在制作流程中,GAI以其強大的數(shù)據(jù)分析和處理能力,實現(xiàn)了劇本創(chuàng)作的智能化輔助、角色場景設計的精準化定制,以及后期制作的高效優(yōu)化,以下是GAI在制作流程創(chuàng)新與個性化方面的具體應用分析。
第一,劇本創(chuàng)作的智能重構。GAI通過自然語言處理技術(NLP)與機器學習算法,實現(xiàn)劇本創(chuàng)作的范式突破。以DeepMind的Dramatron系統(tǒng)為例,其可分析百萬級文學數(shù)據(jù)庫,提取敘事規(guī)律與市場偏好,自動生成角色設定、情節(jié)框架及對話內(nèi)容。更關鍵的是,系統(tǒng)能通過情感分析預測劇情轉(zhuǎn)折點的觀眾反應,并利用強化學習持續(xù)優(yōu)化劇本結構,使作品兼具藝術創(chuàng)新性與市場適配度。數(shù)據(jù)顯示,人機協(xié)同模式使編劇效率提升40%以上。
第二,角色設計的數(shù)字化躍遷。GAI構建的三維評估體系(生理特征、表演檔案、觀眾反饋)顛覆傳統(tǒng)選角模式。系統(tǒng)運用深度神經(jīng)網(wǎng)絡進行多維匹配分析,通過面部動作編碼系統(tǒng)(FACS)量化演員微表情控制力,聲紋分析匹配角色聲音特質(zhì),預測市場接受度。華納兄弟的選角AI系統(tǒng)使角色匹配準確率提升35%,群演篩選效率提高200%。值得關注的是,部分系統(tǒng)已具備“虛擬演員”生成能力,可創(chuàng)建數(shù)字替身應對特殊拍攝需求。
第三,演員甄選的科學化轉(zhuǎn)型。在演員選擇方面,AI大模型通過海量數(shù)據(jù)庫分析演員的相貌、聲音、觀眾反饋以及社交媒體互動等信息,AI能夠為選角導演提供全面且客觀的演員評估。這種智能化的評估不僅協(xié)助導演快速篩選出最適合角色的演員,還能為演員提供精準的表演建議,進一步提升表演質(zhì)量和觀眾滿意度。GAI的介入增加了演員選擇的科學性,為影視作品的成功奠定了堅實基礎。
第四,影視配樂的智能適配。Suno AI、Mubert等平臺通過跨模態(tài)轉(zhuǎn)換器,將畫面色彩、運鏡速度轉(zhuǎn)化為音樂參數(shù),實時生成適配劇情的原創(chuàng)配樂。Filmstro平臺支持導演通過可視化控制面板(節(jié)奏、力度、復雜度調(diào)節(jié)桿)在10分鐘內(nèi)完成傳統(tǒng)需數(shù)日的配樂適配工作,且支持22種語言版本的自動適配。這種技術使音樂與影片內(nèi)容的契合度提升60%。
第五,宣傳營銷的精準化創(chuàng)新。GAI通過分析觀眾畫像數(shù)據(jù)構建動態(tài)預測模型,智能生成千人千面的宣傳方案??煽诳蓸?023年AI廣告的突破性實踐顯示,系統(tǒng)通過Stable Diffusion實現(xiàn)藝術風格的跨時空融合,結合3D重建與實拍影像,創(chuàng)造虛實交融的視覺奇觀。數(shù)據(jù)顯示,這種智能廣告的觀眾記憶留存率比傳統(tǒng)形式提升58%,轉(zhuǎn)化率提高42%。
2.GAI在影視領域的創(chuàng)新應用。GAI作為一種高效的生產(chǎn)工具,在影視內(nèi)容生產(chǎn)領域展現(xiàn)出了巨大的應用潛力。如在2023年漫威發(fā)布的美劇《秘密入侵》片頭便是采用的GAI技術生成,這段GAI生成的視頻完美符合了作品中變化莫測的斯克魯人的神秘感,就好比GAI適合去畫不可名狀的克蘇魯一樣,這種帶有一些不確定性,變幻莫測的感覺很適合這部劇的調(diào)性。
技術的不斷創(chuàng)新,不僅推動了GAI的快速發(fā)展,還極大地豐富了其生產(chǎn)可供性,使其能夠滿足更多樣化的市場需求。同時,GAI以其高效、靈活且成本相對較低的特點,成功地吸引了大量影視內(nèi)容生產(chǎn)市場的關注。它不僅能夠快速生成高質(zhì)量的內(nèi)容,還能夠適應不同風格、類型和題材的需求,從而滿足了海量影視內(nèi)容生產(chǎn)市場的多元化需求。
3.GAI對角色、場景、物體的輔助設計。GAI生成技術在角色、場景和物體設計方面的應用越來越廣泛,利用先進的AI繪圖工具,如Midjourney、Stable Diffusion(SD),以及基于GPT的DALL·E,創(chuàng)作者能將抽象概念迅速轉(zhuǎn)化為具體的視覺作品,極大地提高了制作效率和創(chuàng)意自由度。
Midjourney和SD等AI制圖軟件利用復雜的深度學習模型,根據(jù)文字提示生成高質(zhì)量圖像,為角色和場景設計提供了快速而豐富的視覺參考。例如,在電影角色設計初期,僅需向這些工具輸入角色特征描述,它們即可生成多種視覺概念供團隊選擇和迭代。同理,通過描述期望的環(huán)境風格和元素,這些工具能夠創(chuàng)造出獨特而詳盡的場景圖像,幫助設計師快速鎖定和細化創(chuàng)意。DALL· E進一步擴展了GAI的應用,能夠根據(jù)更加復雜的文本描述進行圖像的生成和修改。它不僅可以創(chuàng)造出與描述相符的圖像,還能對圖片進行細節(jié)上的調(diào)整,如改變顏色、添加特定物體等,進一步個性化設計輸出。這些AI繪圖工具的應用,不僅加快了從概念到可視化的過程,也為影視制作中的角色塑造、場景構建和道具設計提供了無限的可能性。它們的出現(xiàn)降低了創(chuàng)作門檻,使得設計師能夠更專注于創(chuàng)意探索和故事敘述,而非制作過程中的技術細節(jié)。
4.GAI對影視視覺效果的革新。視覺效果(VFX)是現(xiàn)代影視制作不可或缺的一部分。例如,Sora是一種專為影視制作設計的AI工具,它可以自動生成或修改視覺效果,從而提高效率和創(chuàng)造力。通過利用深度學習模型,Sora能夠理解復雜的場景和視覺元素,如自然環(huán)境、天氣變化或特定時代的建筑風格,從而創(chuàng)造出逼真的背景和場景。
這種技術的應用不僅創(chuàng)建了全新的視覺元素,還包括對現(xiàn)有影像的增強和修復。Sora可以用于提升老舊電影的畫質(zhì),通過增加分辨率、調(diào)整光照和顏色,使其適應現(xiàn)代觀眾的觀看習慣。此外,通過自動化重復性和技術性的任務,Sora釋放了視覺效果藝術家的時間,使他們能夠?qū)W⒂诟粍?chuàng)造性的工作,并大大提升創(chuàng)作效率。
(作者單位 重慶郵電大學傳媒藝術學院 )
本文系重慶市教育委員會人文社會科學研究項目“講好中國故事—中國歷代繪畫大系的數(shù)字再創(chuàng)造研究”(項目編號: 22SKJD075)的階段性研究成果。
參考文獻
[1]張新寶,卞龍.人工智能生成內(nèi)容的著作權保護研究[J].比較法研究, 2024(04).
[2]張藍姍.機器的人性化與人類的機器化——AI大模型時代影視藝術發(fā)展新范式[J].中國電視,2024(03).
[3]朱凌宇,何靜,田野.AIGC在傳媒領域的應用探索與潛在風險[J].傳媒,2024(02).
[4]胡冬梅,雷桐.AIGC:影視內(nèi)容生產(chǎn)的變革動能[J].科技傳播,2023(21).
[5]馬文杰.人工智能(AI)與擴展現(xiàn)實(XR)視域下電影敘事的虛實之境[J].電影文學,2023(20).
【編輯:李棟】