近來(lái),人工智能領(lǐng)域又迎來(lái)重磅產(chǎn)品。OpenAI公司發(fā)布的人工智能模型Sora,可根據(jù)文字生成逼真的AI視頻,引發(fā)了全世界的關(guān)注和討論。
Sora是一款文生視頻模型,生成的視頻精度、仿真度極高,足以“以假亂真”。在Sora生成的視頻中,有清澈靈動(dòng)的眼眸,有活潑可愛(ài)的萌寵,有神秘莫測(cè)的海底世界,有熙熙攘攘的夏日街區(qū),有充滿科技感的現(xiàn)代都市……由于Sora生成的視頻過(guò)于“好看”,業(yè)界內(nèi)外無(wú)比驚嘆,對(duì)它好評(píng)如潮。盡管目前Sora生成的視頻時(shí)間不長(zhǎng),短期內(nèi)無(wú)法對(duì)影視工業(yè)等行業(yè)造成影響,但足以沖擊短視頻行業(yè)、新聞行業(yè)等。
Sora最令人震撼的并非制作出了“好看”的視頻,而是制作出了逼真的、符合人們認(rèn)知常識(shí)的內(nèi)容。這意味著它能深入學(xué)習(xí)和了解很多元素之間的互動(dòng)關(guān)系。比如,在Sora生成的視頻里,有一只貓去撓床上的主人,主人一翻身,枕頭就被壓皺了——關(guān)鍵就在枕頭。如果是用計(jì)算機(jī)特效制作枕頭的褶皺,絕對(duì)是一個(gè)噩夢(mèng)——要用什么函數(shù)才能描述枕頭的褶皺?這種逼真的效果很難呈現(xiàn)。事實(shí)上,ChatGPT的問(wèn)世,解決了機(jī)器和人之間相互理解和交互的問(wèn)題,因?yàn)樗斫饬苏Z(yǔ)言——語(yǔ)言是人類獨(dú)有的,理解人類語(yǔ)言意味著非常大的進(jìn)步。Sora則比理解人類語(yǔ)言又進(jìn)步了一個(gè)層次。
這一觀點(diǎn)在OpenAI公司對(duì)Sora的定義中也得到了證實(shí)。OpenAI公司并未將其作為單純的文生視頻模型,而是視作“世界模擬器”,這意味著Sora還能夠不斷“進(jìn)化”去理解世界、理解事物因果關(guān)系,在未來(lái)能夠生成更長(zhǎng)的視頻,以及具備構(gòu)建物理世界通用模擬器的能力。
但是,文生視頻模型作為一項(xiàng)新興技術(shù),存在一定的潛在風(fēng)險(xiǎn)。首先,它可能被濫用,比如生成假新聞或者誤導(dǎo)性內(nèi)容,對(duì)社會(huì)秩序構(gòu)成威脅。其次,由于它生成的視頻可能與現(xiàn)實(shí)世界難以區(qū)分,可能導(dǎo)致公眾對(duì)真實(shí)性的認(rèn)知產(chǎn)生混淆。最后,它的決策過(guò)程不透明,可能會(huì)導(dǎo)致責(zé)任歸屬問(wèn)題,當(dāng)生成的視頻出現(xiàn)問(wèn)題時(shí),難以確定責(zé)任方。要想規(guī)避這些風(fēng)險(xiǎn),還需要科技、法律、監(jiān)管等各方面共同努力,最終實(shí)現(xiàn)“科技向善”的目的。