當中國人民仍沉浸在春節(jié)歡樂氛圍中時,大洋彼岸的科技界卻帶來了一個足以引爆業(yè)界的消息。美國當?shù)貢r間2024年2月15日,OpenAI正式發(fā)布文生視頻模型Sora,并發(fā)布了48個文生視頻案例和技術(shù)報告,正式入局視頻生成領(lǐng)域。
Sora的發(fā)布毫無懸念地再次引發(fā)了整個市場的高度關(guān)注。據(jù)了解,Sora能夠根據(jù)提示詞生成60s的連貫視頻,“碾壓”了行業(yè)目前大概只有平均“4s”的視頻生成長度。該模型可以深度模擬真實物理世界,標志著人工智能在理解真實世界場景并與之互動的能力方面實現(xiàn)飛躍,也被認為是實現(xiàn)通用人工智能(AGI)的重要里程碑,通過不斷深入研究和發(fā)展Sora等先進模型,有望在未來實現(xiàn)更加智能、高效和多樣化的視頻生成與處理技術(shù)。
OpenAI 在其網(wǎng)站上解釋說:“Sora能夠生成具有多個角色、特定類型的運動以及主題和背景的準確細節(jié)的復(fù)雜場景?!薄霸撃P筒粌H了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式?!?。
360集團創(chuàng)始人、董事長周鴻祎在其個人社交平臺對Sora進行評價,他表示,Sora將縮短AGI(通用人工智能)實現(xiàn)時間,從10年縮短到1年。OpenAI訓(xùn)練該模型應(yīng)該會以視頻和攝像頭捕捉的畫面為主,人工智能通過觀看大量視頻將對世界有更深入的理解,這離AGI實現(xiàn)不遠?!翱萍几偁幾罱K比拼的是讓人才密度和深厚積累?!敝茗櫟t表示,以往文生視頻軟件都是在2D平面上對圖形元素進行操作,可以把視頻看成是多個真實圖片的組合,并沒有真正掌握這個世界的知識。“這次OpenAI利用它的大語言模型優(yōu)勢,讓Sora實現(xiàn)了對現(xiàn)實世界的理解和對世界的模擬兩層能力,這樣產(chǎn)生的視頻才是真實的,才能跳出2D的范圍模擬真實的物理世界。”
而中國社會科學院法學研究所副研究員唐林垚從行業(yè)發(fā)展方向考慮,他表示,相較于其他視頻類生成式AI,Sora在畫面清晰度、內(nèi)容流暢度、表意深度和精彩程度方面均有大幅提升,如果Sora的能力真如官方公布一樣強大,且之后可以像ChatGPT一樣便捷訪問,那么Sora將給廣告行業(yè)、影視行業(yè)和特效行業(yè)帶來極大的沖擊。
新的科學技術(shù)總是帶有雙面性,Sora的發(fā)布在引爆業(yè)界推崇的同時,也引發(fā)了關(guān)于虛假信息傳播的爭議。其強大的圖像視頻生成能力達到了以假亂真的程度,這不僅改變了人們“眼見為實”的傳統(tǒng)觀念,還可能帶來一系列社會問題,如視頻證據(jù)真實性和有效性的驗證難題。針對Sora的橫空出世,也有不少人開始擔心這項技術(shù)是否存在另一重隱患。如普林斯頓大學計算機科學教授ArvindNarayanan,其對Sora的橫空出世表示了自己的擔憂,他認為根據(jù)OpenAI發(fā)布的視頻,Sora似乎比任何其他視頻生成工具都“先進得多”,這可能會導(dǎo)致“深度偽造”視頻,人們更難識別出人工智能生成的視頻。
此外,Sora可能存在引發(fā)侵權(quán)爭議的風險。一方面,Sora生成的視頻版權(quán)是否受到保護尚不明確,這可能導(dǎo)致使用這些視頻的主體面臨侵權(quán)索賠和版權(quán)保護追溯的風險。另一方面,Sora在訓(xùn)練過程中使用了相關(guān)素材,即使只是用這些素材進行訓(xùn)練,也可能存在潛在的侵權(quán)風險。
Sora的出現(xiàn)掀起了科技巨浪,各界對這項新技術(shù)的好奇和激動可見一斑。顯而易見的是,從ChatGPT到Sora,科技更新迭代的速度超乎想象,其迅猛發(fā)展的同時也帶來了無法預(yù)知的風險和爭議,科技如何平衡“真假”及“善惡”的邊緣,答案或許只有在未來才能獲取。