【內(nèi)容提要】隨著人工智能技術(shù)的飛速發(fā)展,尤其是文本生成視頻(text-to-video)技術(shù)如Sora模型的出現(xiàn),新聞視頻制作領(lǐng)域迎來了革命性的變化。這些技術(shù)在提高新聞報(bào)道效率、促進(jìn)傳媒業(yè)智能化轉(zhuǎn)型的同時(shí),也會(huì)進(jìn)一步加劇內(nèi)容造假、侵犯版權(quán)等風(fēng)險(xiǎn)。本文旨在探討Sora等AI技術(shù)在新聞視頻制作中的應(yīng)用,分析其帶來的挑戰(zhàn),并提出相應(yīng)的對策建議。
【關(guān)鍵詞】人工智能" 內(nèi)容生成" 新聞視頻" 法律監(jiān)管
Sora,一款由OpenAI在2024年2月推出的創(chuàng)新性文本生成視頻(text-to-video)模型,標(biāo)志著人工智能在視頻生成領(lǐng)域的一次重大飛躍。AI在模擬現(xiàn)實(shí)世界和進(jìn)行創(chuàng)意創(chuàng)作方面的巨大潛力,已經(jīng)開始對新聞產(chǎn)業(yè)產(chǎn)生影響。這不僅預(yù)示著新聞生產(chǎn)方式和流程可能經(jīng)歷全面的變革和智能化升級(jí),同時(shí)也可能對新聞機(jī)構(gòu)的職能和社會(huì)身份帶來重新審視和調(diào)整。
一、Sora模型的技術(shù)革新
(一)原理解析:視覺數(shù)據(jù)的壓縮與重映射
從原理上看,Sora模型結(jié)合了擴(kuò)散模型和Transformer架構(gòu),以實(shí)現(xiàn)對視覺數(shù)據(jù)的高效處理和高質(zhì)量視頻內(nèi)容的生成。這一過程的核心在于將視覺數(shù)據(jù)壓縮到一個(gè)低維潛在空間,并在此空間中將數(shù)據(jù)表征分解為一系列時(shí)空圖像塊(patches)。這些時(shí)空圖像塊類似于GPT模型中的token,它們是視頻內(nèi)容的基本構(gòu)建單元,能夠捕捉到視頻的關(guān)鍵特征和動(dòng)態(tài)變化。
在低維潛在空間中,Sora模型通過學(xué)習(xí)這些patches的分布,生成新的潛在對象。這些對象包含了生成視頻所需的所有信息,但尚未轉(zhuǎn)換為可視化的像素。隨后,Sora利用解碼器模型將這些潛在對象映射回原始的像素空間,這一逆變換過程使得抽象的潛在表示轉(zhuǎn)化為具體的、可視化的視頻幀。
Transformer架構(gòu)在Sora模型中扮演了至關(guān)重要的角色。它通過自注意力機(jī)制,使模型能夠捕捉到視頻序列中的上下文信息,從而在生成過程中保持時(shí)間上的連貫性和空間上的細(xì)節(jié)。
(二)技術(shù)亮點(diǎn):GPT理念的繼承與創(chuàng)新
Sora模型通過對GPT訓(xùn)練理念的繼承與創(chuàng)新,在視頻生成過程中展現(xiàn)出了一種高適配性,即能夠根據(jù)用戶輸入的復(fù)雜文本提示,生成與之相匹配的視頻內(nèi)容。這種能力得益于其深度學(xué)習(xí)算法,特別是自注意力機(jī)制的應(yīng)用,使得模型能夠捕捉文本中的細(xì)微差別,并將其轉(zhuǎn)化為相應(yīng)的視覺元素。無論是靜態(tài)場景還是動(dòng)態(tài)事件,Sora都能夠理解并生成符合用戶預(yù)期的視頻片段。
其次,Sora具有一定的靈活性,可以生成不同分辨率、時(shí)長和尺寸要求的視頻。這使得Sora能夠在多種設(shè)備和平臺(tái)上生成和播放視頻,滿足不同用戶的觀看需求。此外,Sora的采樣機(jī)制允許在潛在空間中靈活選擇和組合patches,以適應(yīng)不同的視頻規(guī)格和創(chuàng)作意圖。
最后,Sora模型可以處理各種長度和復(fù)雜度的視頻內(nèi)容,這體現(xiàn)為一種擴(kuò)展性。Sora能夠生成具有連貫性和一致性的長視頻,并在多角度、多鏡頭切換下保持視頻內(nèi)容的一致性,這對于制作高質(zhì)量的視頻內(nèi)容尤為重要。
(三)突破成就:時(shí)長、質(zhì)量與現(xiàn)實(shí)模擬
Sora模型在AI視頻生成技術(shù)方面取得了革命性的進(jìn)展,其突破主要體現(xiàn)在三個(gè)方面:視頻生成時(shí)長、視頻質(zhì)量和現(xiàn)實(shí)世界模擬能力。在視頻生成時(shí)長方面,Sora能夠制作超過60秒的視頻,這一時(shí)長遠(yuǎn)超業(yè)界其他模型如Pika和Runway的20秒限制。這使得Sora能夠創(chuàng)作出更加完整和詳細(xì)的視頻故事,為用戶提供更加豐富的視覺體驗(yàn)。
Sora在視頻質(zhì)量上的表現(xiàn)同樣卓越。它解決了視頻生成領(lǐng)域的兩大核心問題:準(zhǔn)確性和一致性。Sora能夠準(zhǔn)確識(shí)別并響應(yīng)用戶輸入的復(fù)雜文字需求,即使是長達(dá)135個(gè)單詞的長提示,也能通過詳細(xì)的轉(zhuǎn)譯,生成相應(yīng)的視頻內(nèi)容。在一致性方面,Sora能夠在長達(dá)17秒的多角度、多鏡頭切換下保持視頻內(nèi)容的連貫性。據(jù)硅谷專家Gabor Cselle的對比,這一表現(xiàn)遠(yuǎn)超其他主流視頻生成模型,后者通常只能在5秒左右的時(shí)間內(nèi)保持一致性。
Sora在現(xiàn)實(shí)世界的模擬方面也有顯著突破。通過模型的尺度擴(kuò)展,Sora不僅能夠生成逼真的視頻內(nèi)容,還能夠模擬真實(shí)物理世界中的物體移動(dòng)、習(xí)性以及相互作用。例如,Sora可以生成一個(gè)角色吃漢堡并留下咬痕的視頻,這種細(xì)節(jié)的再現(xiàn)極大地增強(qiáng)了視頻的真實(shí)感和可信度。
二、Sora對新聞生產(chǎn)方式和流程的影響
(一)視頻生產(chǎn)的效率革命
隨著Sora技術(shù)的不斷成熟和應(yīng)用,新聞機(jī)構(gòu)將面臨前所未有的變革。首先,Sora模型能夠賦能視頻生產(chǎn)流程,極大地提高了新聞制作的效率和質(zhì)量。當(dāng)新聞事件突發(fā)時(shí),Sora能夠立即協(xié)助記者和編輯進(jìn)行內(nèi)容的編排和節(jié)目的策劃。例如,Sora技術(shù)可以通過深入分析大量的新聞作品、電視節(jié)目以及用戶反饋,為新聞工作者提供視頻或圖像的創(chuàng)意構(gòu)思方面的解決方案。此外,對于視頻后期的編輯、制作和合成,生成式AI技術(shù)可以進(jìn)一步協(xié)助其流程的優(yōu)化,從而使得新聞內(nèi)容的制作周期大幅縮短。
此外,該技術(shù)還能夠替代真人主播,創(chuàng)造出虛擬主播以及相應(yīng)的演播場景。在2023年春節(jié)期間,《杭州新聞聯(lián)播》創(chuàng)新性地全面啟用AI數(shù)字主播小雨和小宇來進(jìn)行新聞播報(bào),成為全國首個(gè)完全由數(shù)字人主持的“聯(lián)播”類新聞節(jié)目。Sora的視頻生成功能可以輔助新聞機(jī)構(gòu)塑造出更多形象生動(dòng)的AI主播,實(shí)現(xiàn)全天候?qū)崟r(shí)播報(bào),推動(dòng)傳統(tǒng)廣播電視新聞服務(wù)的質(zhì)量提升和效率優(yōu)化。
在動(dòng)畫演示方面,Sora模型強(qiáng)大的3D動(dòng)畫制作能力,提升了新聞視頻質(zhì)量和社會(huì)效益。例如,在報(bào)道自然災(zāi)害或國際突發(fā)事件時(shí),Sora能夠迅速制作出高質(zhì)量的3D動(dòng)畫視頻,增強(qiáng)視覺沖擊力和真實(shí)感,幫助觀眾更好地理解復(fù)雜的新聞背景和細(xì)節(jié)。在報(bào)道重大科技進(jìn)展時(shí),Sora模型可以快速生成解釋性動(dòng)畫,將復(fù)雜的科學(xué)原理和技術(shù)創(chuàng)新以直觀的方式呈現(xiàn)給觀眾。這不僅提高了信息的可理解性,也使得非專業(yè)觀眾能夠更容易地吸收和理解新聞內(nèi)容。
(二)傳媒產(chǎn)業(yè)的智能轉(zhuǎn)型
生成式AI技術(shù)能夠根據(jù)給定的文本、圖像、視頻等數(shù)據(jù)自動(dòng)生成視頻內(nèi)容,意味著新聞機(jī)構(gòu)可以強(qiáng)化新聞生產(chǎn)的自動(dòng)化能力,進(jìn)行產(chǎn)業(yè)的智能化轉(zhuǎn)型。此前,好看視頻通過接入百度大腦智能創(chuàng)作平臺(tái),實(shí)現(xiàn)了根據(jù)文章自動(dòng)化生產(chǎn)視頻的功能,有效減少了人工生產(chǎn)視頻的成本。隨著視頻生成技術(shù)的進(jìn)一步成熟,在體育直播、金融等特定領(lǐng)域,人工智能可以實(shí)現(xiàn)從數(shù)據(jù)收集到視頻發(fā)布全過程的數(shù)據(jù)可視化、數(shù)據(jù)視頻化以及視頻自動(dòng)化,進(jìn)一步提升新聞報(bào)道的時(shí)效性。
Sora還將催生新的內(nèi)容形式和傳播方式,如交互搜索引擎和虛擬數(shù)字人。這些新技術(shù)的應(yīng)用,將推動(dòng)內(nèi)容交互進(jìn)入智媒時(shí)代,為用戶提供更加豐富的新聞體驗(yàn),甚至可以根據(jù)受眾的反饋和偏好調(diào)整播報(bào)風(fēng)格和內(nèi)容,向個(gè)性化服務(wù)發(fā)展。
同時(shí),Sora支持多語言、文化和風(fēng)格的視頻創(chuàng)作,能夠幫助新聞機(jī)構(gòu)提升報(bào)道的跨文化傳播效果,觸達(dá)更廣泛的受眾群體。
(三)競爭格局的劇烈變動(dòng)
Sora的興起也加劇了傳媒市場的競爭程度。在短期內(nèi),Sora的高效視頻生成能力可能會(huì)對視頻剪輯師、后期制作人員和動(dòng)畫師等傳統(tǒng)技術(shù)崗位構(gòu)成挑戰(zhàn)。在美國,已有調(diào)查顯示,好萊塢有高達(dá)36%的從業(yè)者感受到了生成式AI技術(shù)對他們工作的影響。這種影響不僅體現(xiàn)在工作量的減少,更在于工作性質(zhì)的改變,AI技術(shù)的介入使得這些崗位需要更多地與技術(shù)相結(jié)合,進(jìn)行創(chuàng)新性的工作。
從長遠(yuǎn)來看,Sora等AI視頻生成技術(shù)的發(fā)展,可能會(huì)對新聞業(yè)界的生態(tài)產(chǎn)生深遠(yuǎn)的影響。傳統(tǒng)媒體長期以來依賴的重裝備和高技術(shù)門檻,可能會(huì)因?yàn)锳I技術(shù)的普及而逐漸失去優(yōu)勢。例如,傳統(tǒng)新聞機(jī)構(gòu)在報(bào)道重大體育賽事時(shí),需要投入大量的人力物力進(jìn)行現(xiàn)場拍攝和后期制作。而Sora技術(shù)的應(yīng)用,可以在短時(shí)間內(nèi)生成高質(zhì)量的賽事回顧視頻,這不僅提高了報(bào)道的效率,也降低了成本。
此外,科技巨頭如Meta、字節(jié)跳動(dòng)、Google等在新聞資訊和廣告市場的領(lǐng)先地位,可能會(huì)因?yàn)锳I技術(shù)的應(yīng)用而進(jìn)一步鞏固。
三、Sora給新聞行業(yè)帶來的風(fēng)險(xiǎn)及隱患
(一)模糊真實(shí)與虛擬邊界,降低“深度偽造”門檻
Sora模型的推出也帶來了一系列不容忽視的風(fēng)險(xiǎn)和隱患。其中,“深度偽造”(Deepfake)技術(shù)的普及化,使得模糊真實(shí)與虛擬之間界限的應(yīng)用門檻降低,也對公眾的信息判斷能力構(gòu)成了挑戰(zhàn)。以政治選舉為例,深度偽造視頻可以被用來詆毀候選人的名譽(yù),制造虛假新聞,甚至捏造政治丑聞。根據(jù)世界經(jīng)濟(jì)論壇發(fā)布的《2024年全球風(fēng)險(xiǎn)報(bào)告》,信息錯(cuò)誤和虛假信息已被列為未來兩年內(nèi)最嚴(yán)峻的風(fēng)險(xiǎn)之一。如果這些高度逼真的視頻被用于操縱公眾輿論或影響政治選舉,其影響可能波及70多個(gè)國家,涉及40多億人口的看法和投票決策。
另外,新聞媒體在輿論引導(dǎo)方面也將面臨前所未有的考驗(yàn)。輿論場上的信息良莠不齊,隨視頻生成技術(shù)升級(jí)進(jìn)一步加劇。例如,2023年7月浙江紹興警方破獲了一起利用AI技術(shù)制作虛假視頻的團(tuán)伙案件,該團(tuán)伙通過AI一鍵生成視頻,散布謠言以獲取流量和利益。
假新聞和誤導(dǎo)性內(nèi)容的傳播還可能導(dǎo)致公眾對新聞機(jī)構(gòu)的信任度下降。AI生成的虛假內(nèi)容往往難以通過常規(guī)手段識(shí)別,使得媒體在采納二手信息源時(shí)將面臨更大的風(fēng)險(xiǎn)。據(jù)路透社《2023數(shù)字新聞報(bào)告》,2023年公眾對新聞機(jī)構(gòu)的信任度比2022年下降2個(gè)百分點(diǎn)。公眾對新聞機(jī)構(gòu)的信任度的下降可能進(jìn)一步加劇輿論場的撕裂。
(二)迅速生成大量視頻內(nèi)容,引發(fā)更多知識(shí)產(chǎn)權(quán)糾紛
Sora等AI技術(shù)在快速生成大量視頻內(nèi)容方面的能力,也可能導(dǎo)致媒體機(jī)構(gòu)牽涉的知識(shí)產(chǎn)權(quán)糾紛增多。例如,2023年12月27日,美國《紐約時(shí)報(bào)》對OpenAI和微軟提起訴訟,指控這兩家公司未經(jīng)許可使用其數(shù)百萬篇文章來訓(xùn)練聊天機(jī)器人。這一事件凸顯了AI技術(shù)在數(shù)據(jù)使用上的法律風(fēng)險(xiǎn)。當(dāng)AI系統(tǒng)在訓(xùn)練過程中使用受版權(quán)保護(hù)的材料時(shí),如何界定其合法性和版權(quán)歸屬成為一個(gè)復(fù)雜的問題。
此外,AI生成內(nèi)容的著作權(quán)歸屬和責(zé)任問題仍存在法律爭議。2023年2月24日,李某因劉某未經(jīng)允許使用AI繪畫平臺(tái)生成的圖片作品,侵犯了他的署名權(quán)和信息網(wǎng)絡(luò)傳播權(quán),而對劉某提起訴訟。這一案例表明,AI生成的藝術(shù)作品是否構(gòu)成著作權(quán)法意義上的作品,以及誰應(yīng)當(dāng)對這些作品的著作權(quán)負(fù)責(zé),目前尚無明確的法律指導(dǎo)。
新聞行業(yè)在應(yīng)用生成式AI技術(shù)時(shí),也可能面臨合規(guī)風(fēng)險(xiǎn)。新聞機(jī)構(gòu)在利用AI技術(shù)生成內(nèi)容時(shí),必須確保遵守相關(guān)的版權(quán)法規(guī),避免侵犯他人的知識(shí)產(chǎn)權(quán)。
四、建議措施
(一)加快完善配套法律及監(jiān)管機(jī)制
面對Sora等視頻生成技術(shù)的快速成熟和落地,國家需要迅速明確Sora等人工智能技術(shù)在內(nèi)容生成方面的權(quán)責(zé)劃分。這可以通過修訂現(xiàn)行的《著作權(quán)法》《著作權(quán)實(shí)施條例》等相關(guān)法律法規(guī)來實(shí)現(xiàn),或者制定專門針對AI生成內(nèi)容的全新法規(guī)。無論是AI技術(shù)的開發(fā)者、媒體平臺(tái)還是內(nèi)容創(chuàng)作者,都應(yīng)當(dāng)明確各自的法律責(zé)任和義務(wù)。
行業(yè)監(jiān)管部門也應(yīng)當(dāng)制定關(guān)于Sora等人工智能技術(shù)應(yīng)用的風(fēng)險(xiǎn)防范指南。這包括對新技術(shù)可能引發(fā)的風(fēng)險(xiǎn)進(jìn)行分類,明確不同風(fēng)險(xiǎn)的等級(jí),并提供相應(yīng)的識(shí)別方法和應(yīng)對策略。同時(shí),監(jiān)管部門應(yīng)加快完善對虛假信息傳播的預(yù)警和打擊機(jī)制,以預(yù)防技術(shù)可能帶來的內(nèi)容風(fēng)險(xiǎn)和媒體危機(jī)。
(二)建立健全安全合規(guī)審查機(jī)制
傳媒機(jī)構(gòu)和內(nèi)容生產(chǎn)者在使用Sora等AI工具進(jìn)行內(nèi)容創(chuàng)作時(shí),必須強(qiáng)化審查流程。這包括確保所有使用的素材和創(chuàng)意都已獲得合法授權(quán),防止用戶數(shù)據(jù)泄露或被不當(dāng)使用。同時(shí),應(yīng)加大投入,利用技術(shù)和人力資源對信息進(jìn)行嚴(yán)格核實(shí),確保內(nèi)容的真實(shí)性和準(zhǔn)確性,以充分履行內(nèi)容提供者的責(zé)任和保障信息傳播的安全性。
此外,傳媒機(jī)構(gòu)應(yīng)實(shí)施嚴(yán)格的內(nèi)容識(shí)別和標(biāo)記制度。對于AI生成的內(nèi)容,必須進(jìn)行明確標(biāo)識(shí),以維護(hù)公眾的知情權(quán),并為這些內(nèi)容可能帶來的社會(huì)影響承擔(dān)相應(yīng)的法律責(zé)任。
(三)深化落實(shí)“AI治理AI”模式
在用戶保護(hù)方面,網(wǎng)絡(luò)媒體平臺(tái)應(yīng)引入專業(yè)的視頻內(nèi)容檢測工具或平臺(tái),以實(shí)現(xiàn)對新聞內(nèi)容的常態(tài)化合規(guī)性檢測。這包括對內(nèi)容進(jìn)行識(shí)別、標(biāo)注、版權(quán)驗(yàn)證和真?zhèn)舞b定,特別是對深度偽造視頻和具有誤導(dǎo)性的內(nèi)容進(jìn)行有效防御和追蹤。同時(shí),對人工創(chuàng)作和AI生成的內(nèi)容實(shí)施版權(quán)保護(hù)措施,確保所有內(nèi)容均符合版權(quán)法規(guī),不侵犯他人權(quán)益,從而提升新聞內(nèi)容的透明度和可信度。
網(wǎng)絡(luò)平臺(tái)還應(yīng)采用先進(jìn)的數(shù)據(jù)加密技術(shù)和工具,以增強(qiáng)用戶數(shù)據(jù)的安全性。這包括建立嚴(yán)格的數(shù)據(jù)訪問和權(quán)限管理機(jī)制,確保數(shù)據(jù)在存儲(chǔ)和傳輸過程中的安全。同時(shí),定期進(jìn)行數(shù)據(jù)安全審計(jì),以預(yù)防數(shù)據(jù)泄露、篡改或?yàn)E用的風(fēng)險(xiǎn),確保用戶隱私得到充分保護(hù)。
(四)持續(xù)面向公眾開展風(fēng)險(xiǎn)教育
監(jiān)管機(jī)構(gòu)和傳媒機(jī)構(gòu)需不斷普及人工智能的基礎(chǔ)知識(shí),使公眾能夠理解AI的工作原理和功能,并對其應(yīng)用保持關(guān)注與理解,以便更清晰地認(rèn)識(shí)到潛在的風(fēng)險(xiǎn)。此外,還應(yīng)通過教育公眾識(shí)別隱私泄露、深度偽造等AI濫用案例,揭示AI可能帶來的風(fēng)險(xiǎn),從而提高公眾對AI生成內(nèi)容風(fēng)險(xiǎn)的警覺性和自我保護(hù)能力。鼓勵(lì)公眾積極參與人工智能應(yīng)用和治理的討論也具有重要性。通過多角度、多層次的宣傳教育活動(dòng),能夠讓公眾了解自身的需求和期望,為政府和傳媒機(jī)構(gòu)在制定人工智能相關(guān)政策和實(shí)踐提供參考,以便做出更明智的決策。
隨著技術(shù)的不斷進(jìn)步,構(gòu)建一個(gè)既能充分發(fā)揮AI技術(shù)優(yōu)勢,又能確保信息真實(shí)性和公眾利益的新聞傳播新生態(tài),將成為行業(yè)發(fā)展的關(guān)鍵。這不僅依賴于技術(shù)創(chuàng)新,更需要法律、倫理和社會(huì)責(zé)任的同步發(fā)展和各界的共同努力。
作者簡介: 匡文波,中國人民大學(xué)新聞學(xué)院教授、博士生導(dǎo)師; 曹萩兒,中國人民大學(xué)新聞學(xué)院博士生
編輯:徐" 峰