當(dāng)前,生成式AI正在以超出我們預(yù)想的發(fā)展速度進(jìn)入視頻內(nèi)容生產(chǎn)領(lǐng)域,其越來(lái)越強(qiáng)大的功能給視頻內(nèi)容生產(chǎn)帶來(lái)了全面而深刻的影響。2022年11月,美國(guó)OpenAI公司開發(fā)了AI工具ChatGPT,開啟了人工智能生成內(nèi)容(AIGC)的“潘多拉魔盒”,國(guó)內(nèi)緊跟其后發(fā)布了一些AI工具,包括文心一言、訊飛星火、通義千問等。這些AI工具利用大數(shù)據(jù)、大模型、大算力等技術(shù),獲得了強(qiáng)大的語(yǔ)言理解與生成、復(fù)雜邏輯推理、上下文學(xué)習(xí)等能力,并將人機(jī)交互的難度幾乎降到了零,推動(dòng)了AI的普及,在高質(zhì)量的互動(dòng)中帶來(lái)了極佳的用戶體驗(yàn)。隨著技術(shù)的變革,生成式AI在視頻生產(chǎn)領(lǐng)域初見雛形。2024年年初,OpenAI正式發(fā)布Sora模型,意味著生成式AI由單模態(tài)轉(zhuǎn)向多模態(tài)。這項(xiàng)基于ChatGPT的創(chuàng)新突破具有里程碑意義,實(shí)現(xiàn)了從純文本理解到全方位視頻創(chuàng)作的跨越,為創(chuàng)作者帶來(lái)了前所未有的可能。傳統(tǒng)視頻制作需要經(jīng)歷撰寫腳本、收集素材、剪輯素材、添加錄音或音樂特效等步驟,往往耗時(shí)較長(zhǎng),且面臨高成本、高門檻等諸多限制,生成式AI則從根本上簡(jiǎn)化了這一過(guò)程,創(chuàng)作者只需輸入文本指令,即可實(shí)時(shí)獲得不同風(fēng)格、畫幅和時(shí)長(zhǎng)的高清視頻作品,無(wú)需復(fù)雜的后期制作,就能將創(chuàng)意轉(zhuǎn)化為直觀的視覺內(nèi)容。令人矚目的是,AI還能根據(jù)創(chuàng)作者本人的特征生成容貌一致的3D數(shù)字人,根據(jù)本人的聲音生成音調(diào)、語(yǔ)氣一致的TTS音色,為創(chuàng)作注入新的可能。
在這場(chǎng)變革中,作為國(guó)內(nèi)最具影響力的中長(zhǎng)視頻平臺(tái),B站的知識(shí)區(qū)內(nèi)容尤其值得關(guān)注。由于站內(nèi)知識(shí)區(qū)視頻普遍具有制作精良、時(shí)間較長(zhǎng)的特點(diǎn),視頻創(chuàng)作者在視頻制作過(guò)程中存在耗時(shí)長(zhǎng)、費(fèi)力的痛點(diǎn),而AI技術(shù)的引入為解決這一痛點(diǎn)帶來(lái)了新突破。本文結(jié)合對(duì)10位B站知識(shí)區(qū)視頻創(chuàng)作者(平均粉絲數(shù)量約為25萬(wàn))的訪談,深入分析現(xiàn)在的視頻創(chuàng)作流程,并探索基于文生視頻技術(shù)的知識(shí)類中長(zhǎng)視頻內(nèi)容生產(chǎn)的新范式。
選題和腳本創(chuàng)作是B站知識(shí)區(qū)創(chuàng)作者面臨的主要挑戰(zhàn)。以古生物區(qū)UP主為例,由于內(nèi)容專業(yè)性強(qiáng)、需要大量文獻(xiàn)支撐,往往需要耗時(shí)一個(gè)月才能完成一篇視頻腳本初稿。傳統(tǒng)的知識(shí)區(qū)視頻腳本通常采用GSC結(jié)構(gòu):首先以Gap(設(shè)問)引發(fā)觀眾興趣,其次通過(guò)Scene(場(chǎng)景)具象化描述論證觀點(diǎn),最后用Comment(評(píng)價(jià))強(qiáng)化核心論點(diǎn)。生成式AI的出現(xiàn)革新了創(chuàng)作流程,創(chuàng)作者無(wú)需提供完整的策劃文案,只要按照GSC結(jié)構(gòu)提供簡(jiǎn)單的提示詞或描述性文本,AI就能生成高質(zhì)量的視頻腳本。若首次生成效果未達(dá)到預(yù)期,創(chuàng)作者可通過(guò)迭代提示詞來(lái)不斷優(yōu)化內(nèi)容,直至滿意。這種人機(jī)協(xié)作模式優(yōu)化了傳統(tǒng)創(chuàng)作流程,為知識(shí)類內(nèi)容生產(chǎn)開辟了新途徑。
B站知識(shí)類視頻主要分為出鏡口播和非出鏡兩種形式。對(duì)于前者,傳統(tǒng)創(chuàng)作要求UP主在專業(yè)環(huán)境下錄制,對(duì)個(gè)人狀態(tài)和拍攝條件都有較高要求。然而,由于大多數(shù)創(chuàng)作者是非全職UP主,往往難以在工作、生活的雙重壓力下保持最佳創(chuàng)作狀態(tài)。數(shù)字人技術(shù)的出現(xiàn)很好地解決了這一問題。創(chuàng)作者只需上傳一段個(gè)人視頻和音頻樣本,就能生成與本人高度相似的數(shù)字形象。通過(guò)簡(jiǎn)單的文本指令,這個(gè)數(shù)字分身就能完美呈現(xiàn)真人的表情、動(dòng)作和語(yǔ)言表達(dá),幫助視頻創(chuàng)作者以最佳狀態(tài)在觀眾面前進(jìn)行口播。對(duì)于非出鏡視頻,素材的獲取一直是困擾創(chuàng)作者的主要問題。據(jù)眾多站內(nèi)財(cái)經(jīng)區(qū)UP主反饋,全網(wǎng)素材搜集不僅費(fèi)時(shí),還常常面臨侵權(quán)風(fēng)險(xiǎn)。快影可靈AI則為此提供了理想的解決方案,該產(chǎn)品的文生視頻功能允許用戶輸入文本描述,AI隨后將這些文本轉(zhuǎn)換成視頻。這一過(guò)程包括選擇背景、人物和動(dòng)作等,以確保視頻內(nèi)容與文本主題相匹配。例如,用戶輸入“海邊日出”,AI會(huì)生成一個(gè)海浪輕拍沙灘、太陽(yáng)漸漸升起的場(chǎng)景。對(duì)于創(chuàng)作者來(lái)說(shuō),這項(xiàng)技術(shù)不僅能提升創(chuàng)作效率,還有效規(guī)避了版權(quán)隱患。從技術(shù)演進(jìn)來(lái)看,B站知識(shí)區(qū)的未來(lái)將是數(shù)字人與AI文生視頻的深度結(jié)合,這種結(jié)合將大幅降低創(chuàng)作門檻,讓更多懷揣創(chuàng)意的普通人能夠?qū)W⒂趦?nèi)容本身,而不必過(guò)分擔(dān)憂多媒體技術(shù)和設(shè)備的限制。當(dāng)然,技術(shù)的進(jìn)步也帶來(lái)了新的思考,如何在提升創(chuàng)作效率的同時(shí)確保內(nèi)容的專業(yè)性和價(jià)值深度,避免淪為快餐式流量?jī)?nèi)容,是每位創(chuàng)作者面臨的重要課題。
以擁有400萬(wàn)粉絲的“大象放映室”為代表的頭部創(chuàng)作者,對(duì)智能化剪輯提出了更高的要求,她提到一個(gè)知識(shí)類視頻的創(chuàng)作不僅需要基礎(chǔ)的剪輯功能,更需要快速生成高質(zhì)量的可視化內(nèi)容。特別是在B站知識(shí)類視頻中,圖表和PPT形態(tài)內(nèi)容占比較大,這類內(nèi)容能提升知識(shí)傳遞的效率,已成為優(yōu)質(zhì)知識(shí)類內(nèi)容的標(biāo)配。
面對(duì)日益提升的制作標(biāo)準(zhǔn),小型MCN機(jī)構(gòu)和剪輯團(tuán)隊(duì)往往受限于設(shè)計(jì)人力和制作成本。他們對(duì)標(biāo)準(zhǔn)化、高質(zhì)量的素材模板有著強(qiáng)烈需求,而生成式AI技術(shù)的發(fā)展為此提供了解決方案,從PPT制作、貼紙?jiān)O(shè)計(jì)到圖表生成,目前AI能通過(guò)提示詞的建設(shè)提供專業(yè)水準(zhǔn)的輸出。這些智能生成的素材正逐步融入視頻制作流程,為后期剪輯帶來(lái)了全新的創(chuàng)作可能。
總的來(lái)說(shuō),生成式AI技術(shù)實(shí)質(zhì)上重塑了視頻創(chuàng)作的模式,將傳統(tǒng)的線性制作流程轉(zhuǎn)變?yōu)椤疤崾窘换ナ健钡男路妒?,?duì)未來(lái)的視頻創(chuàng)作生產(chǎn)產(chǎn)生了重要影響。
然而,需要注意的是,隨著生成式AI的日益成熟和廣泛應(yīng)用,部分不法分子利用數(shù)字人及AI文生視頻技術(shù)從事非法活動(dòng),如傳銷和電信詐騙等。為了維護(hù)一個(gè)健康有序的視頻創(chuàng)作生態(tài),業(yè)界亟待建立完善的監(jiān)管機(jī)制和防范措施,以保護(hù)創(chuàng)作者權(quán)益,確保內(nèi)容生態(tài)的良性發(fā)展。
(作者單位:上海交通大學(xué))