闕政
新年伊始,OpenAI(人工智能研究公司)再次扔出“王炸”——正式發(fā)布首款文生視頻模型“Sora”,繼文本、圖像之后,在視頻領(lǐng)域放大招。48個對外展示的視頻,不僅畫面逼真、光影考究,而且在物理效果(如遮擋和碰撞)、運動連續(xù)性、人物一貫性等方面表現(xiàn)出接近真實世界的高超水平,將同期的其他文生視頻應(yīng)用遠(yuǎn)遠(yuǎn)甩在了身后。
Sora的出現(xiàn),無疑是人工智能發(fā)展歷程中的一個里程碑。
AIGC(人工智能生產(chǎn)內(nèi)容)時代就這么招呼都不打一聲地降臨了。Sora如一滴清水落入油鍋,影視圈炸了,一則以喜,一則以懼。
喜的人,最近張口閉口都把四個字掛在嘴邊:“降本增效”。從前的AI不太理解現(xiàn)實世界的物理規(guī)律,從前的AI生成的視頻像動圖,長度也只有幾秒鐘,而Sora和這些有質(zhì)的不同,就像計算器遇到了計算機(jī)。
影視人已經(jīng)開始盤算可以給Sora派哪些活干:最近美國《綜藝》雜志刊載了一張調(diào)查圖——在影視和游戲行業(yè)從業(yè)者眼中,AI最擅長的活包括:為影視或游戲創(chuàng)建逼真音效、自動完成代碼以協(xié)助游戲編程、為影視和游戲開發(fā)3D虛擬世界、為影視和游戲制作故事板、為影視作外語配音、編寫游戲?qū)υ挕橛耙晞?chuàng)建逼真的合成演員、寫影視劇本……
從前拍電影的總羨慕作家只用一支筆就能寫出千軍萬馬,不像拍戲,要預(yù)算、要找人組局、要置景、要拍還要剪。現(xiàn)在Sora向世人展示了“傻瓜級”視頻制作,僅僅輸入幾個關(guān)鍵詞,就能產(chǎn)出精美畫面。未來,我們普通人做一個白日夢,也可以交付給AI,生成劉慈欣+郭帆范兒的科幻大片,“你行你上”的戲謔即將變成現(xiàn)實。
在影視圈最悲觀的想象里,AI已經(jīng)不再是雙刃劍,而像是核武器,鏈?zhǔn)椒磻?yīng)猶如滅霸(電影人物,擁有強(qiáng)大的破壞力)的響指,搞不好“噼啪”一聲,整個影視行業(yè)都沒了——觀眾想看什么內(nèi)容,自己生成就行——原著AI寫,編劇AI來,電影AI拍。字生文,文生圖,文生視頻,再配上一副虛擬現(xiàn)實的眼鏡,無景弗現(xiàn),無遠(yuǎn)弗至。
Sora到底有沒有超能力?判斷這個問題,我們可以先從前Sora時代的AI入手。
最近,麻省理工學(xué)院主辦了一個“AI for filmmak? ing”電影制作比賽,主題是“Space I call home”(我稱之為家的那片宇宙)。這場比賽面向全世界開放,要求是“主要由AI完成”以及“視頻時長在兩分鐘以上”,有不少中國人參賽,其中蕭飛和王超導(dǎo)演的一段四分鐘視頻入圍技術(shù)獎。
王超是“百夫長影像工作室”的創(chuàng)始人,在視頻制作領(lǐng)域創(chuàng)業(yè)已有十幾年,近年開始關(guān)注到AI。在王超給GPT(生成式預(yù)訓(xùn)練模型)的指令中,他希望AI能將影片最后一句旁白翻譯成莎士比亞式的詩意古英語;在給Midjourney(AI繪畫工具)的指令中,他希望AI可以在片頭做出“末世廢土風(fēng)”,帶一點手繪的感覺,而中間的敘事段落則要以普通人的視角切入,影像風(fēng)格偏真實,“用33毫米電影鏡頭,采用Imax(寬銀幕技術(shù))攝像機(jī)拍攝”;而到了圖生視頻階段,又希望PixVerse(虛擬現(xiàn)實創(chuàng)作工具)為貓咪加上伸懶腰、瞇眼睛的動態(tài)——結(jié)果AI都成功辦到了。
不過,這并不代表制作過程中就不需要人工參與;相反,與人們想象中的“一鍵生成”不同,人力花費的時間長達(dá)八天。
“每個環(huán)節(jié)AI都會暴露一些問題。”王超解釋說,“最大的問題是AI每一次的回應(yīng)都帶有隨機(jī)性,我們戲稱為‘開盲盒:即使你每次都輸入同樣的提示詞,它出來的結(jié)果依然會是不同的。所以用AI做視頻,雖然硬件成本是降低了,但體力成本是一點沒減少?!?h3>把它當(dāng)作工具,而不是做工具人
OpenAI也并不避談Sora的缺點,公司在官網(wǎng)上發(fā)文承認(rèn):交互是目前系統(tǒng)最大的短板之一,AI還不能完全把握時間的因果關(guān)系和物理世界的法則,例如人咬了一口餅干后,餅干的形狀會發(fā)生怎樣的變化。
看過Sora樣片的觀眾應(yīng)該都注意到了其中的“穿幫”之處:打翻水杯的時候,水從杯壁而不是杯口流出;橘貓向主人伸出第三只手;女子左右腳互換;櫻花樹無根系地浮在半空……這無疑給Sora的可靠性打了一個問號。
美國對此也有相似看法?!毒C藝》雜志最近以《為什么OpenAI的Sora還沒有準(zhǔn)備好取代好萊塢》為題,總結(jié)了Sora的三大缺點:連續(xù)性、可控性和版權(quán)。
AI哪怕只是全面替代電影人的工作,路也很長很長。它也許已經(jīng)端掉了一些人的飯碗,但從長遠(yuǎn)來看,就像汽車取代了牛馬,縫紉機(jī)取代了紡織工,AI在消滅一些職業(yè)的同時,也會創(chuàng)造一些新的職業(yè),比方說“roll圖員”“鑒真師”“查重師”“連貫師”“AI協(xié)調(diào)者”“數(shù)字明星經(jīng)紀(jì)人”,一切只是時間問題。
顯然,AI勢必會淘汰一些人,影響一代人,但歸根到底目前還不是AI和人的較量,而是人和人的較量。
AI和外星人有幾分相似。有些人覺得他們是“拯救派”,另一些人覺得他們是“降臨派”。人類的終極恐懼是被異族團(tuán)滅,而自打“圖靈測試”開始,關(guān)于AI“自我意識”的爭論就從未停歇。
智元動力(北京)科技有限公司CEO王博曾經(jīng)和研究AI深度學(xué)習(xí)的微軟科學(xué)家(也是OpenAI研發(fā)Sora的合作科學(xué)家)討論過這個問題,對方覺得,AI有沒有自我意識,看你如何理解自我意識:“就像人看電影的時候,電影里的角色,觀眾覺得是有血有肉,有喜怒哀樂也有悲歡離合的,但演員在塑造角色的時候有沒有自我意識?也許有,也許是設(shè)計出來的。那么你說,人是不是也有可能是由高維度的智力設(shè)計出來的呢?”
科幻電影里有過許多“缸中腦”的設(shè)想,最有名的莫過于《黑客帝國》——假如有一天,發(fā)現(xiàn)人類真的只是玻璃缸里漂浮著的大腦,而另一面卻是色彩斑斕《頭號玩家》一樣的AI元宇宙,你會選擇哪個?科技發(fā)展到最后,提出的是哲學(xué)問題。
其實Sora帶來的負(fù)面問題中,最有可能快速成真的就是“深度偽造”,不但會大肆污染人類的數(shù)據(jù)庫,更可怕的是造成“虛實難分”——假作真時真亦假,上一秒你覺得假視頻是真實生活,下一秒,你可能就會覺得家里的墻壁上隱約出現(xiàn)馬賽克、全世界都是一個巨大的障眼法——人類哪里經(jīng)得起這樣的精神分裂啊。
面對Sora帶來的疾風(fēng)暴雨,人文藝術(shù)家應(yīng)該自信一點,從戰(zhàn)術(shù)上敬畏它,從戰(zhàn)略上藐視它。從GPT到Sora,基本上還只是模擬了大腦神經(jīng)網(wǎng)絡(luò)的很小一部分,我們要像田忌賽馬一樣,別去和AI硬拼算力——下等馬先輸一程沒關(guān)系,還有中等馬和上等馬在后。雖然武無第二,但文也無第一啊。
(摘自《新民周刊》)