春節(jié)過后,作家止庵收到不少朋友發(fā)來的“詩”、“小說”,還有“古文”、“舊體詩詞”、仿某位知名作家文體的“文章”,讓他品鑒,全部為人工智能對話模型DeepSeek所作。DeepSeek是春節(jié)期間,在爆款電影《哪吒2》之外的另一個最熱門話題。
無論詩歌還是文章,它的寫作時間僅以秒來計算,其中不乏高水準作品,更難得的是,它在對話中不像舊有模型那般AI腔,而是顯示出了一絲“人味”。例如,有人問DeepSeek:“聽說你會算命?”它回答:“哈哈,雖然我不會真正的算命……但如果你對某些事情感到好奇……我可以幫你理清思路或給出一些意見?!辈⒃诮Y(jié)尾加上了一個臉紅的微笑表情。
此時,文生圖應(yīng)用Midjourney更新到了第六代,對標Sora的視頻生成大模型可靈已經(jīng)在視頻領(lǐng)域被廣泛應(yīng)用,AI主播“0失誤率”。圖片、影像、文字……內(nèi)容創(chuàng)作者們無一幸免,必須面對人機共存的現(xiàn)實。去年下半年,麥肯錫的一則研究報告預(yù)測,在2030年至2060年之間,全球?qū)⒂?0%的現(xiàn)有職業(yè)被AI取代。
許多人開始產(chǎn)生“存在主義危機”:AI會取代人類創(chuàng)作者嗎?它會成為我們的“伙伴”還是“敵人”?我們是被它替代還是因為有了它的輔助而效率更高?可見的未來和更遠的未來,似乎都正以加速的方式到來。
止庵看了朋友們發(fā)來的AI“大作”,覺得“一概都是勉為其難”。例如一首網(wǎng)絡(luò)上有人叫好的“舊體詩”《七律·黃鶴樓懷古》——昔年仙跡杳難求,獨上危闌瞰九州。千秋鶴影隨云逝,萬里江聲入海流。芳草萋萋鸚鵡渡,煙波渺渺楚客舟。日暮登臨誰共語,西風(fēng)吹盡古今愁?!叭姟幪幙辗翰恢{(diào)。”止庵對《中國新聞周刊》說,“唯一落實的二句‘獨上危闌’和七句‘日暮登臨誰共語’,一個意思說兩遍。莫非已經(jīng)上了一趟,又上一趟,好在黃鶴樓裝有電梯,上下方便。”
雖然看不上這首詩的“文學(xué)造詣”,但止庵聽說它的理解和邏輯分析能力已經(jīng)迭代,于是試著在生活里使用。止庵已經(jīng)喂了一陣子貓,他需要一些科學(xué)喂貓的書籍,DeepSeek迅速推薦了6本,且列有出版社信息、出版時間和鏈接,但止庵查閱后發(fā)現(xiàn)其中5本書都不存在,所謂鏈接打開后是其他書籍,有一本雖然存在但是書名寫錯了。
“一本正經(jīng)地胡說八道”,在專業(yè)領(lǐng)域,這被稱為AI幻覺。既受制于AI理解能力欠缺等天然缺陷,也由于生成式AI基于大量數(shù)據(jù)訓(xùn)練而成,如果沒有向其“投喂”客觀、準確的數(shù)據(jù),就很難保證其會“反芻”出符合常理的回答。網(wǎng)絡(luò)上的信息本就真真假假、充斥偏見,在并不見得有多干凈的池子里打撈內(nèi)容,污染自身在所難免。而當(dāng)前AI的訓(xùn)練數(shù)據(jù)幾乎不包含“我不知道”這樣的表述,因此它們天生不會謙遜。
在一切以準確為前提的創(chuàng)作中,不允許“瞎說”,但在虛構(gòu)的故事里,“瞎說”有時卻可以成為工具??苹米骷谊愰狈诖汗?jié)期間剛剛完成一個新作品《神筆》,里面寫到“控制論之父”美國數(shù)學(xué)家諾伯特·維納在中國的一段經(jīng)歷,但作為科幻小說,陳楸帆假設(shè)了一個平行時空,20世紀30年代中期,維納短暫地在清華大學(xué)任教一年后,并沒有像真實歷史中那樣離開,而是留在了中國,而且受到中國文化的影響,于是,他的控制論思想,包括后世現(xiàn)代計算機的發(fā)明和人工智能的走向完全改變了。
要了解這段歷史的細節(jié),再到關(guān)鍵的時間節(jié)點上做改寫,是工作量巨大的一件事,但如果利用AI梳理歷史并改寫,就可以迅速完成,改寫的歷史也不怕所謂“瞎說”?!拔乙木褪沁@個‘胡說八道’,因為我故事里這段歷史本來就是不存在的。所以,當(dāng)你理解了它的幻覺特質(zhì)后,對寫虛構(gòu)的人來說,我覺得反而是一個好處,關(guān)鍵在于你怎么操控它的幻覺,如果利用得好,其實蠻有意思的。”陳楸帆告訴《中國新聞周刊》。
在作家圈,陳楸帆是最早與AI一起工作的作家。2017年,他在谷歌的前同事、人工智能專家王詠剛幫他編寫了一個基于深度學(xué)習(xí)技術(shù)的寫作程序,從一些無厘頭的句子到出乎意料的“神轉(zhuǎn)折”,陳楸帆發(fā)現(xiàn)與AI共同寫作這件事變得越來越有驚喜。他和AI共同創(chuàng)作的作品《出神狀態(tài)》,在2019年中國的文學(xué)雜志《思南文學(xué)選刊》設(shè)立的“AI文學(xué)榜”評選中,甚至打敗了莫言當(dāng)時的新作《等待摩西》。
幾天前,陳楸帆和“閱文”的編輯朋友聊天,聽這位朋友抱怨說,春節(jié)后工作量劇增,因為接到大量DeepSeek生成的投稿?,F(xiàn)在AI“寫”的小說,會被這些有經(jīng)驗的編輯一眼看出來,但是如果未來它們多次升級迭代,再“寫”東西還能不能被編輯看出來,就成了未知數(shù)。陳楸帆覺得,那種日更幾千字的網(wǎng)文未來完全可以由AI生成,畢竟網(wǎng)文的閱讀習(xí)慣和商業(yè)模式都與傳統(tǒng)文學(xué)不同,對于那樣一種在碎片化時間里僅僅追求情節(jié)發(fā)展迅速、沖突體驗頻繁的閱讀,大模型的水平可能就夠用了。
這和止庵的感受差不多,他覺得以目前DeepSeek的水平,寫請假條、邀請函乃至工作中其他應(yīng)用文應(yīng)該是可以的,未來,也許它還能模仿知名作家寫出小說,但它所能做到的最好的應(yīng)該也就是“替代人類感情、思想、智慧中相對平庸或循規(guī)蹈矩的那一部分,它甚至在這一范圍之內(nèi),可以達到上乘”,如果要給AI定位,它應(yīng)該就在這個位置上。
而一切經(jīng)驗性、總結(jié)性、按部就班的內(nèi)容被取代,并不是今天才發(fā)生。隨意走進一家書店,旅游類圖書、生活類圖書大都已不見蹤跡?!八鼈冊绫欢桃曨l取代了?!敝光指嬖V《中國新聞周刊》,“比如你想做一個菜,以前我給你寫個菜譜,現(xiàn)在還不如直接給你拍個視頻,所以這一類書籍不大多見了?!?/p>
平庸的詩詞如今被如此大范圍地歡呼,反而讓止庵憂慮另一件事:“是不是今天我們的水平太低了呢?”這些年的文化教育、文學(xué)教育(包括古文、古詩詞教育)跟不上,讓我們不知道什么叫作“好”。如果能多加強點這方面的教育(包括自我教育),也就不至于這般歡呼人工智能寫的“古文”和“舊體詩詞”。
止庵覺得,突然大火的DeepSeek讓一件事“水落石出”了——是我們?nèi)祟愓w的不創(chuàng)造,讓我們越來越懶惰,越來越固守,循規(guī)蹈矩,而后平庸,以至于看什么都覺得好,這才是值得悲哀的事情。
一只小貓的眼睛里,映出朝陽下故宮的殿堂樓閣,而后,它輕盈地躍上屋頂,路過熱氣騰騰的早點鋪子,路過下象棋的人,躍入古畫、屏風(fēng)、試卷,走在北京街頭……這是“首屆北京城市形象AI創(chuàng)作征集”活動的獲獎作品《故宮貓貓上班記》,在各個平臺都獲得不錯的流量。
和朋友海辛一起做出《故宮貓貓上班記》的設(shè)計美學(xué)博主、設(shè)計師阿文曾在一年前和《中國新聞周刊》談起AI給予設(shè)計行業(yè)的巨大幫助,在一片“設(shè)計師將要被AI搶走飯碗”話題喧囂的兩三年間,他們這些努力學(xué)習(xí)使用AI的人并沒被搶走飯碗,反而獲得更多飯碗。去年春節(jié)前,阿文和海辛開始一起嘗試制作AI動畫視頻,不過一年時間,曾以平面設(shè)計和幻燈片演示設(shè)計為主業(yè)的他,已經(jīng)幾乎轉(zhuǎn)型為視頻短片制作者。“這完全得益于技術(shù)的發(fā)展。”他對《中國新聞周刊》說。
由于部分影像過于真實,再加上有影棚“實拍”的花絮片段,總有人來問阿文:《故宮貓貓上班記》中,是否有真人實拍鏡頭?答案是:幾乎全部由AI生成,僅有一個鏡頭由PPT制作。
平面設(shè)計師成為短片作者,且編劇、導(dǎo)演、分鏡、剪輯、配樂……全部由二人小組完成,原本封閉的行業(yè)壁壘被打破了。上海大學(xué)上海溫哥華電影學(xué)院副院長陳曉達認為,這是目前“生成式人工智能AIGC”的最大價值。“大家都知道,在影視圈想拍一部片子有多難,要動用到多少資本、工具、資源。現(xiàn)在,我們的學(xué)生一個人就可以制作自己的科幻短片,換成幾年前,這種類型片得搭建一個多么大型的團隊?”
傳統(tǒng)影視制作如同一臺精密運轉(zhuǎn)的工業(yè)機器,從劇本創(chuàng)作到后期特效,每個環(huán)節(jié)都需要專業(yè)團隊數(shù)月乃至數(shù)年的打磨。AI為這一領(lǐng)域帶來了成本結(jié)構(gòu)的巨大變革,無論制作成本還是制作周期,都實現(xiàn)了數(shù)量級的壓縮。中小制作團隊甚至個人創(chuàng)作者都能夠以極低門檻參與生產(chǎn),影視創(chuàng)作的基本單位被重新定義,距離“創(chuàng)意即生產(chǎn)力”的目標越來越近。
2023年2月,OpenAI發(fā)布ChatGPT不久,上海大學(xué)上海溫哥華電影學(xué)院開設(shè)了AI課程,這是當(dāng)時滬上電影院校的首個AI電影課。學(xué)生學(xué)習(xí)利用AI軟件,為自己的短片作品生成美術(shù)概念圖、選角參考圖、分鏡圖等,不光節(jié)約創(chuàng)作時間、提供創(chuàng)作靈感,也可以在未來參與影視節(jié)創(chuàng)投、吸引投資人時提供可視化依據(jù)。
“比如,導(dǎo)演說想找個伊斯特伍德類型的中國演員,選角導(dǎo)演怎么找?”陳曉達對《中國新聞周刊》舉例說,有了AI工具,迅速就可以生成導(dǎo)演想象中的“中國版”伊斯特伍德形象,雖然他不是現(xiàn)實中的人,但有了清晰的依據(jù),效率就會高得多。編劇過程中的對話撰寫,也是AI擅長的,至少可以幫助一個20出頭的年輕人模擬上歲數(shù)的老人或是年過中年的父母。
去年6月,國產(chǎn)視頻生成大模型可靈的上線更是重塑了電影學(xué)院學(xué)生們的創(chuàng)作工具和流程。誰也沒想到,在Sora的60秒視頻震蕩了影視界幾個月后,可以應(yīng)用的國產(chǎn)視頻生成大模型就出現(xiàn)了?!翱伸`非常驚艷,你上傳任何一張照片或是有設(shè)計風(fēng)格的圖片,它都能讓圖自然地動起來,而且非常寫實,像實拍一樣。去年視頻生成大模型中角色一致性無法保證這樣的共性‘短板’,新的工具都在不斷彌補,這一年AIGC發(fā)展變化快得有點夸張了?!卑⑽母嬖V《中國新聞周刊》,也正是可靈的出現(xiàn),讓他換了賽道。
以去年6月為界,在那之前,阿文也嘗試做視頻,但大多是“轉(zhuǎn)繪”,也就是利用AI將普通視頻轉(zhuǎn)化為具有特定藝術(shù)風(fēng)格的視頻,例如把真人視頻轉(zhuǎn)化為油畫、水彩畫、素描、動漫等,相當(dāng)于二次創(chuàng)作,在自媒體平臺,不少博主發(fā)布這樣的視頻,一些修圖軟件也提供類似的“轉(zhuǎn)繪”服務(wù)。
6月之后,伴隨可靈上線,即夢、混元、Vidu等一系列國產(chǎn)視頻生成大模型都冒了出來。整個2024年下半年,阿文的創(chuàng)作進入了第二階段——不停測試這些視頻模型的生成能力,借由它們“做一些天馬行空的事情”,設(shè)計一些夸張夢幻的場景。當(dāng)然,圖片生成模型也在不斷精進,這讓用來制作視頻的靜幀圖在有限的像素里有了更復(fù)雜逼真的細節(jié),因為信息量足夠豐富,間接提升了視頻的真實度,在視覺上,分辨率也顯得更高。很快,他們制作出了一個在社交媒體成為爆款的小視頻——比富士山還要高的卡比獸,傾倒了一桶雪在富士山頂。這個只有幾秒的視頻迅速火遍了各個視頻網(wǎng)站,不少博主開始模仿這個風(fēng)格,制作各種巨型寶可夢視頻。
隨后,阿文和海辛接到了《北京日報》的邀請,參加“我AI北京——首屆北京城市形象AI創(chuàng)作征集”活動。這一次,是長達1分50秒的視頻,可靈的首尾幀功能給了他們很大幫助:“我們自己決定一個片段第一幀和最后一幀長什么樣,然后把這兩張圖片上傳上去,AI就能非常自然地讓兩張圖片進行過渡。我只準備兩張圖就行了,中間過程由AI補,它補得非常好。”于是,故宮里的貓貓們從一個屋檐跳上另一個屋檐,從一幅畫躍入另一幅畫。
“貓貓”的視頻做完沒多久,Pika又出了新功能,它可以把任何物件加入一個視頻片段里。海辛用它制作了一段皮卡丘等寶可夢成員來家里做客的視頻,動漫人物和現(xiàn)實生活融合得毫無違和感,這意味著,在真人電影里加入卡通角色,再也不是難事。
當(dāng)然,無論哪一款視頻大模型,目前穩(wěn)定生成的視頻多為5秒,最多在10秒,要制作長片還不太現(xiàn)實。AI生成視頻的清晰度普遍也只有1080P,但陳曉達認為,以目前大模型的更新迭代速度,實現(xiàn)一個人拍出一部電影,并不會是太過遙遠的事。
可靈AI大模型產(chǎn)品經(jīng)理陳馬克對《中國新聞周刊》說:“在AI的輔助下,我們可以預(yù)見到一個全新的影視制作時代。從劇本創(chuàng)作到場景設(shè)計,從特效到后期制作,影視內(nèi)容生產(chǎn)的多個環(huán)節(jié)都可以借助AI的力量,實現(xiàn)更加高效、精準的創(chuàng)作。隨著技術(shù)的不斷迭代和突破,以可靈AI為代表的視覺大模型及產(chǎn)品將逐漸成為視覺行業(yè)的新基建和新工具。構(gòu)建個人可創(chuàng)作電影/影視劇的視頻生成能力一直是我們努力的方向之一?!?/p>
今年春節(jié)期間,《杭州新聞聯(lián)播》首次采用AI數(shù)字人雙播模式,節(jié)目形態(tài)已無限接近日常播出狀態(tài)。無論是形象、表情、聲音,還是肢體動作,數(shù)字主播們都做到了極致仿真,當(dāng)天采制的所有新聞也全部采用數(shù)字主播來進行配音,所以不管是播報,還是配音,春節(jié)檔《杭州新聞聯(lián)播》都是AI狀態(tài),更重要的是,AI主播做到了零失誤。
在城市新聞聯(lián)播引入AI主播之前,大量數(shù)字人已經(jīng)活躍在多個官方的融媒體平臺,例如湖南吉首融媒AI主播洪小姣、北京順義區(qū)融媒體中心AI主播吳小迪、江蘇淮陰區(qū)融媒體中心AI主播小榮等等。
我看見梵高的
向日葵在代碼田發(fā)芽
莎翁的十四行
爬上光纖電纜開花
但沙漠永遠饑渴
——當(dāng)電線桿
開始吟唱鮑勃·迪倫的
反抗曲
(此詩由DeepSeek結(jié)合本文內(nèi)容創(chuàng)作)
“在AI面前,單項專業(yè)的事最容易被替代,你如果只是一個工具人,那么未來必然會被工具所替代。”陳曉達說。最近,他正在研究AI語音克隆技術(shù),這項技術(shù)能將演員的語音進行模擬和合成,且高度貼合人物的聲線和風(fēng)格,甚至在口型和語氣上都能與原聲匹配,達到以假亂真的效果。曾在網(wǎng)上被廣為傳播的“郭德綱英文說相聲”“趙本山用倫敦腔講述東北故事”運用的就是這項技術(shù)。影視人正在嘗試使用大模型給影視劇配音,尤其是當(dāng)前熱熱鬧鬧出海的短劇,聘請外國配音演員成本過高,如果這個模式可以跑通,將大大降低成本。
2023年,日本動畫導(dǎo)演新海誠攜新片《鈴芽之旅》來上海路演時曾說,AI是一種很好的工具,但是“不要讓AI占領(lǐng)人類市場,希望創(chuàng)作者一起加油,不要輸給AI”。
阿文也持類似的觀點:無論哪個行業(yè),擁抱新工具且真正具有過硬水準的群體不會被取代。其實,淘汰在人工智能的內(nèi)部也隨時上演著。DeepSeek誕生沒幾天,一直是文心一言付費用戶的陳曉達就收到了一封郵件:“2025年4月1日0時起,文心一言將全面免費,符合退款條件的會員訂單正在按序處理……”
在可預(yù)見的一段時間里,任何一個大模型都還停留在效率工具和輔助創(chuàng)意工具的階段,這幾乎是已經(jīng)或計劃開始使用新技術(shù)的文學(xué)藝術(shù)工作者們集體給出的答案。盡管大模型幫助阿文做出了火爆全網(wǎng)的小視頻,但是那個巨型寶可夢的想法和巨型寶可夢向富士山傾倒白雪的創(chuàng)意,仍然來自他的人類大腦。
“它有很強的數(shù)據(jù)綜合能力,但這并不是真正的創(chuàng)造?!敝光终f,他用了一個哲學(xué)術(shù)語——以“有”和“無”來說,AI能在“有”里面盡量完善,但是它達不到“無”,做不到“無中生有”。它也許可以從1到1.1、1.2,但它無法實現(xiàn)從0到1,而創(chuàng)造的真諦恰恰在此。不過話說回來,如果這才算真正的創(chuàng)造,止庵覺得,其實人類能做到的也不多,“屬于我們的最具創(chuàng)造性最鮮活的東西,AI替代不了,可是那個東西在哪兒?我們自己未必知道,也得認識到它必不可少,也得花足夠精力去找”。陳楸帆覺得,在AI出現(xiàn)的時代,一個人如果想要創(chuàng)作,愈發(fā)要回到那個最本源、最樸素的古老原點,這也是創(chuàng)作的珍貴之處——自我記錄,自我表達,在這個過程中,你會理解自己,看清自己,甚至超越自己,這些無法被參數(shù)化的生命痕跡,才是帶著體溫的創(chuàng)作原鄉(xiāng)。