蔡津津
人工智能技術自出現(xiàn)以來就致力于模仿人處理信息的方式來輔助提升人類記憶、思考、分析、識別、判斷的效率和準確度,這類人工智能屬于分析式人工智能(Analytical AI),自2020年5月美國公司OpenAI推出了第三代語言預測模型,人工智能用于生成和創(chuàng)作內(nèi)容開始有了質(zhì)的飛躍,生成式人工智能(Generative AI)首次被提出,迅速成為新的數(shù)字技術熱點,運用到圖片、文字、視頻等內(nèi)容創(chuàng)作與生成的AIGC(AI Generated Content)技術受到的更多關注,到2022年底OpenAI公司開發(fā)的ChatGPT問世后達到了前所未有的高峰。至此AIGC形成了可以通過自然語言和圖文與人類進行對話交互來理解多類任務,并按要求創(chuàng)作或生成相關內(nèi)容的能力,標志著人工智能從感知理解世界進入到生成創(chuàng)造世界的新階段,AIGC技術把內(nèi)容創(chuàng)造和知識工作的邊際成本大幅降低,產(chǎn)生巨大的勞動生產(chǎn)率和經(jīng)濟價值,催生了又一次生產(chǎn)力變革,可以預見人類將開啟第四次工業(yè)革命的時代。
對從事內(nèi)容生產(chǎn)與傳播的傳媒行業(yè)來說,最先感知到AIGC帶來的沖擊,首先是數(shù)據(jù)成為人工智能感知現(xiàn)實世界的媒介,成為關鍵生產(chǎn)要素,其次算法模型從掌握內(nèi)容傳播的權力進化到了掌握內(nèi)容生產(chǎn)的權力。
數(shù)字技術變革對媒體生產(chǎn)和傳播的改變。在萬物皆媒的數(shù)字時代,以數(shù)據(jù)與算法為核心的數(shù)字技術變革在全媒體傳播體系中呈現(xiàn)了四大類發(fā)展趨勢:一是內(nèi)容載體技術變革,內(nèi)容形式如文字、圖像、音視頻通過虛擬人、3D建模、全景聲等方式不斷逼近對現(xiàn)實世界的描述,呈現(xiàn)高仿真趨勢;二是內(nèi)容生產(chǎn)技術變革,多模態(tài)跨模態(tài)內(nèi)容的處理、分析、翻譯、審核等技術不斷突破內(nèi)容形式之間的隔閡,呈現(xiàn)一站式自動化生產(chǎn)趨勢;三是傳播技術的變革,從文字語音對話、手勢體態(tài)、數(shù)字分身等交互方式到機器人、多終端、VR/AR和腦機接口等交互入口,呈現(xiàn)類人類、擬人化趨勢;四是內(nèi)容生態(tài)技術變革,在內(nèi)容載體、生產(chǎn)和傳播技術的發(fā)展上疊加區(qū)塊鏈、智能合約、隱私計算等技術形成的web3.0和元宇宙內(nèi)容協(xié)作生態(tài),呈現(xiàn)出數(shù)實融合協(xié)同共創(chuàng)的趨勢。但這四個趨勢的發(fā)展一直面臨人與機器之間的溝通、交互、協(xié)作方式復雜而帶來的學習門檻、生產(chǎn)成本、創(chuàng)新速度方面的瓶頸,而以ChatGPT等為代表的AIGC技術突破了這一瓶頸,任何人都可以通過人類自然語言向人工智能發(fā)出指令,表達自己的創(chuàng)意和要求,人工智能會學習、理解并運用各種資源完成生產(chǎn)和創(chuàng)作,這一突破將大大顛覆傳統(tǒng)全媒傳播體系。
生成式多模態(tài)超大規(guī)模語言模型的特征。人工智能領域的生成式多模態(tài)超大規(guī)模語言模型,以ChatGPT依賴的大模型GPT-4為例,有以下三個特征。
一是通過三個“大”讓人工智能具備了遠超出人類個體的掌握總結全量知識的能力。即依托由超過4000臺高性能服務器30000張GPU計算芯片組成的大規(guī)模算力,通過由超過3000億單詞量1PB的百科、書籍、期刊、源代碼、網(wǎng)頁論壇和人類專家互動反饋數(shù)據(jù)組成的大規(guī)模數(shù)據(jù)集,訓練出了據(jù)推測由超過1.8萬億參數(shù)組成的大規(guī)模參數(shù)語言模型。因此,GPT-4在一系列與人類對話交互、知識測試、多模態(tài)內(nèi)容理解和生成任務的評測中涌現(xiàn)出了學習與總結能力、理解與記憶能力、創(chuàng)作與生成能力、邏輯推理能力和通用常識能力。
二是通過和人類專家進行交互不斷調(diào)整優(yōu)化和提升自己。大規(guī)模語言模型通過人類反饋強化學習的方式進行進一步訓練、優(yōu)化和微調(diào),使語言模型能夠生成更加真實準確的內(nèi)容,有效減少信息和行為的生成和輸出,并且逐步與人類的意圖和偏好保持一致,更好地模仿人類、理解人類語言指令,產(chǎn)生連貫而有邏輯的內(nèi)容。
三是可以記憶上下文信息,圍繞與人類的多輪語言互動,來調(diào)整、分析、處理和生成復雜信息與內(nèi)容。GPT-4通過對大量開源程序代碼的學習獲得了思考聯(lián)想的能力,也就是思維鏈機制(Chain-of-Thought),結合上下文學習機制(In-context Learning)和提示工程(Prompt Engineering),隨著對話中給出的問題和信息不斷豐富,大模型能夠通過小樣本數(shù)據(jù)掌握新的知識和內(nèi)容,并激發(fā)大模型不斷學習處理復雜任務和生成復雜內(nèi)容。
生成式大規(guī)模語言模型的三大轉(zhuǎn)變。以上三個特征,我們可以看出ChatGPT在“大數(shù)據(jù)+大算力+強算法=大模型”路線基礎上探索出了“基礎大模型+指令微調(diào)”的人工智能新范式,讓生成式大規(guī)模語言模型產(chǎn)生三大轉(zhuǎn)變:一是從單一模型完成特定任務向一個通用模型完成多類任務的轉(zhuǎn)變,不僅生成人類可讀的內(nèi)容,還可以生成機器和應用程序可執(zhí)行的代碼;二是從通過全量訓練來升級模型向在任務執(zhí)行和專業(yè)領域?qū)W習中讓模型不斷分化和進化的轉(zhuǎn)變;三是從模型被動學習向模型有潛力通過生成內(nèi)容自主在網(wǎng)絡上尋找所需信息、調(diào)用各類應用來自動完成新任務的轉(zhuǎn)變。這三個轉(zhuǎn)變讓人工智能向通用人工智能發(fā)展邁進一大步。微軟在2023年3月24日發(fā)表論文稱對 GPT-4 進行了全面評測,認為“鑒于GPT-4 能力的廣度和深度,它應該被合理視作一個通用人工智能(AGI)系統(tǒng)的早期(但仍不完整)版本”。
這一突破使ChatGPT在短短不到兩個月的時間內(nèi)構建起一個圍繞生成式大規(guī)模語言模型驅(qū)動的新的生產(chǎn)力生態(tài)。GPT-4在教育、金融、支付、文化傳承、零售消費、制造業(yè)等垂直領域開始廣泛應用合作,開啟了人工智能賦能全要素生產(chǎn)力率提升的時代;微軟將GPT-4接入Bing搜索和微軟辦公協(xié)同套件引發(fā)了人機協(xié)同生產(chǎn)方式的變革;ChatGPT推出接口服務、插件功能并接入上千種第三方插件,可以基于模型能力開發(fā)衍生應用,其中,網(wǎng)絡瀏覽器插件賦予大模型使用工具、聯(lián)網(wǎng)、運行計算的能力,知識庫檢索插件賦予大模型允許用戶接入垂直領域知識庫成為企業(yè)或個人的第二大腦,代碼解釋器插件賦予自行組織、生產(chǎn)和執(zhí)行代碼與程序的能力,開啟了以人機對話為總?cè)肟?、以?nèi)容為生產(chǎn)力載體的下一代智能互聯(lián)網(wǎng)時代,全媒體傳播體系與數(shù)字經(jīng)濟進一步深度融合。
AIGC技術改變?nèi)襟w傳播體系。從ChatGPT商業(yè)模式和應用生態(tài)的發(fā)展趨勢中,可以感受到AIGC技術讓人工智能根據(jù)需求直接參與生產(chǎn),并能充分補充和突破個人的知識與技能的短板,大大加速了數(shù)據(jù)、信息和知識運用到生產(chǎn)中的效率和進程,極大降低了現(xiàn)實世界進入數(shù)字世界的門檻與成本,將從如下幾個方面改變?nèi)襟w傳播體系。
第一,內(nèi)容生產(chǎn)方式和供給結構發(fā)生變化。AIGC讓全媒體內(nèi)容的創(chuàng)作門檻大幅降低,效率顯著提升,人只要擁有創(chuàng)意和想法,人工智能就可以根據(jù)語言指令快速生成文本、代碼、圖片甚至音視頻、3D建模等多模態(tài)內(nèi)容,并可以理解多模態(tài)內(nèi)容和人類進行互動;專業(yè)內(nèi)容生產(chǎn)和創(chuàng)作技能的門檻降低,人工智能不僅僅是輔助人類生產(chǎn)的工具,更成為生產(chǎn)力的一份子參與到整個生產(chǎn)過程中;掌握和運用專業(yè)知識的速度與數(shù)量的門檻降低,人工智能大模型不僅可以學習全量人類知識還能夠持續(xù)擴充知識量,并運用到內(nèi)容生產(chǎn)中,讓內(nèi)容的知識價值和信息量顯著提高,甚至有可能超過人類個體專家的能力;發(fā)現(xiàn)新知識和新規(guī)律的能力門檻降低,人工智能大模型可以在海量數(shù)據(jù)和信息中發(fā)現(xiàn)和總結新知識和新規(guī)律,輔助人類在內(nèi)容生產(chǎn)中迸發(fā)真知灼見。AIGC類應用與現(xiàn)在的互聯(lián)網(wǎng)社交化新媒體平臺結合,將不斷降低對專業(yè)人員技能和知識積累的依賴,提升普通人參與全媒內(nèi)容生產(chǎn)的效能和質(zhì)量,進一步挑戰(zhàn)傳統(tǒng)媒體機構和專業(yè)內(nèi)容服務機構的優(yōu)勢,加劇內(nèi)容生產(chǎn)對數(shù)據(jù)資源、人工智能算法和算力的依賴。
第二,傳播交互方式和格局發(fā)生變化。用自然語言代替復雜的交互操作,并且可以與應用場景及工作流程深度融合,學習使用的成本極低;用戶專注于提問題、需求和創(chuàng)意,就可以快速地擴展知識視野、尋求解決方案、運用高階內(nèi)容生產(chǎn)技能;并且AIGC處理、分析、生成內(nèi)容的效率遠高于人類,可以大幅簡化工作流程,同時不斷積累數(shù)據(jù)和信息形成高價值的知識資本,這樣低成本高收益的內(nèi)容生產(chǎn)方式具備極大的吸引力。這些特征讓ChatGPT僅用2個月就創(chuàng)造了用戶過億的新紀錄,呈現(xiàn)顯著的“流量虹吸效應”。而高度個性化的對話式交互方式,讓傳播從廣播式的開源傳播逐步轉(zhuǎn)變到以人工智能算法為中心的點對點閉源傳播,內(nèi)容生產(chǎn)、傳播、應用、反饋的鏈條難以跟蹤和收集分析,呈現(xiàn)出顯著的“知識虹吸效應”。因此,全媒生產(chǎn)傳播體系從UGC、PGC向AIGC的發(fā)展,讓互聯(lián)網(wǎng)平臺的流量分配和內(nèi)容價值分配面臨重新洗牌,形成“斷代式”的升級轉(zhuǎn)型,受眾將通過“用腳投票”催生新的超級平臺,淘汰缺乏AIGC技術支撐驅(qū)動的傳統(tǒng)平臺。
第三,內(nèi)容應用和輿論影響發(fā)生變化。AIGC技術來臨之前,內(nèi)容以人為主生產(chǎn)并服務于人,人接受了內(nèi)容之后影響認知和行為進而影響現(xiàn)實世界的運行。而隨著AIGC技術的不斷成熟,人工智能不僅可以生產(chǎn)內(nèi)容,內(nèi)容的服務對象也從人擴充到了應用程序、機器人、生產(chǎn)設備,可以越過人類行為而直接在現(xiàn)實世界中形成生產(chǎn)力和影響力。ChatGPT的GPT-4大模型驅(qū)動的最新實驗性產(chǎn)品AutoGPT便展示了這樣的能力,其可以根據(jù)一個目標要求,自行拆解任務、尋找資源、自問自答,自動執(zhí)行并完成任務。因此,內(nèi)容工具化的趨勢,讓全媒內(nèi)容傳播體系不僅僅是面向人類精神和知識需求的傳播,更進化到了面向機器和物質(zhì)生產(chǎn)需求的傳播。因此,全媒內(nèi)容傳播與人的生產(chǎn)生活融合更加緊密,對人類行為和認知的影響更為深刻,而AIGC內(nèi)容可以富有邏輯性且有效擴展用戶的知識面,運用合理得當可以消除偏激情緒讓輿論回歸理性,更具多樣性和包容性,但因其擬人化和高仿真特點,會使AIGC內(nèi)容真實性的判斷難度加大,若成為不法分子生成和傳播有害信息的工具,則會導致虛假信息、有害內(nèi)容空前泛濫,內(nèi)容生產(chǎn)能力與智能化內(nèi)容分發(fā)技術和社交機器人賬號集群等相結合,可多賬號、跨平臺、大規(guī)模發(fā)布內(nèi)容,更加便捷地操控輿論。
第四,內(nèi)容生產(chǎn)協(xié)作和利益分配發(fā)生變化。人工智能成為內(nèi)容創(chuàng)作和知識工作生產(chǎn)工具甚至是生產(chǎn)力的一份子后,存儲、計算、分析、學習和生產(chǎn)的能力效率遠超過人類個體,過度依賴AIGC內(nèi)容會改變目前開源互聯(lián)網(wǎng)上的內(nèi)容構成,人類原創(chuàng)內(nèi)容和知識發(fā)現(xiàn)會逐步減少,據(jù)國際新聞媒體協(xié)會預測,到2030年將有超過一半的在線內(nèi)容由人工智能生產(chǎn),其中絕大多數(shù)不會來自主流媒體或權威機構;人類專業(yè)技能、思維能力、思考方式會受到人工智能的深刻影響,會配合AIGC生成內(nèi)容的模式而發(fā)生改變。比如,提示工程——如何適應AIGC原理并通過精準的自然語言描述與人工智能進行對話和提示,逐步成為原畫設計師、應用程序開發(fā)者需要掌握的技能;大模型的訓練依賴大量人類原創(chuàng)內(nèi)容和知識以及來自人生產(chǎn)生活中產(chǎn)生的數(shù)據(jù),此前人類免費共享在互聯(lián)網(wǎng)上的內(nèi)容和數(shù)據(jù)通過流量廣告和知識付費等幾種方式進行變現(xiàn)和利益分配,AIGC技術的快速商業(yè)化將深刻改變這一方式,大模型的訓練利用了大量人類以往的知識積累和創(chuàng)作成果。一是擠占了人類開展內(nèi)容生產(chǎn)的工作機會和收益空間,二是缺乏有效的確權技術和合理的利益分配機制,會引發(fā)版權、數(shù)據(jù)權益和隱私保護的問題,三是打擊人們協(xié)作、共享和原創(chuàng)的積極性,長期可能引發(fā)內(nèi)容創(chuàng)意的荒漠化。
筑牢自身優(yōu)勢,面向大模型提升競爭實力。主流媒體和傳統(tǒng)知識內(nèi)容生產(chǎn)機構具備人工智能不可替代的直接面向現(xiàn)實世界進行內(nèi)容采集、原創(chuàng)、探究、觸達的能力優(yōu)勢,在數(shù)據(jù)密集型和知識密集型產(chǎn)業(yè)里,憑借權威主流全媒體內(nèi)容原創(chuàng)生產(chǎn)能力處于AIGC時代內(nèi)容生產(chǎn)傳播新格局的上游,處于現(xiàn)實世界數(shù)字化內(nèi)容生產(chǎn)源頭的有利地位。應融合數(shù)字化技術不斷加強議題發(fā)現(xiàn)與策劃能力、調(diào)查研究能力、垂直領域?qū)I(yè)知識與高質(zhì)量原創(chuàng)內(nèi)容供給能力、優(yōu)質(zhì)可信內(nèi)容的甄別與判斷能力。
加強基礎建設,擴大技術創(chuàng)新源頭供給。為確保主流媒體與國外同行、商業(yè)平臺同臺競爭的“核心競爭力”,迫切需要面向主流大模型加強基礎研究與建設,從源頭和底層把握關鍵技術,解決應用基礎領域的“卡脖子”問題。一是在關鍵領域進一步整合權威、優(yōu)質(zhì)、可信的數(shù)據(jù)資源,形成面向大模型的高標準、安全、可控的訓練數(shù)據(jù)供給;二是形成AI導師機制,集中主流媒體和權威內(nèi)容機構專家形成大模型人類專家訓練團隊,為AIGC大模型人類反饋強化學習和審查提供協(xié)同工作機制;三是聚焦思想宣傳、文化教育、科技創(chuàng)新三大關鍵領域形成代表我國主流價值觀和意識形態(tài)的自主可控的大模型及AIGC生態(tài)。
建立安全防線,構建全媒體傳播內(nèi)容安全管理體系。對AIGC形成價值觀和意識形態(tài)認知的技術邏輯和應用邏輯開展研究,在技術手段與管理機制方面發(fā)力:一是在關鍵領域加強AIGC內(nèi)容的甄別與鑒偽技術手段;二是加強內(nèi)容追溯技術的研究,面向全媒體內(nèi)容生產(chǎn)傳播各環(huán)節(jié)完善以人為主體的內(nèi)容終審負責制度;三是建立面向大模型的訓練數(shù)據(jù)集生產(chǎn)管理標準,研發(fā)數(shù)據(jù)集安全審核技術和評估標準;四是研究面向大模型訓練、調(diào)優(yōu)、動態(tài)學習全過程的安全審核技術,建立全流程安全評估管理體系;五是加強對海外大模型應用的管理,豐富安全監(jiān)測與干預手段,尋求面向海外大模型加強我國主流內(nèi)容供給和傳播影響力的渠道。
探索權益機制,形成人機協(xié)同可持續(xù)發(fā)展的內(nèi)容生態(tài)。人工智能成為新的內(nèi)容生產(chǎn)力后,對新的生產(chǎn)關系與權益分配機制構建提出了迫切需求,OpenAI在聲明中說:“我們希望就三個關鍵問題進行全球?qū)υ挘喝绾喂芾磉@些系統(tǒng),如何公平分配它們產(chǎn)生的利益,以及如何公平分享使用權。”形成融合AIGC、UGC、PGC等模式的新型生產(chǎn)協(xié)同與利益分配的流程和管理方式,是發(fā)展可信安全可控人工智能的前提條件。探索權益機制,應從以下幾方面入手:一是更新內(nèi)容行業(yè)人才能力體系,提升人工智能運用能力和數(shù)字化素養(yǎng),強化發(fā)現(xiàn)需求、發(fā)現(xiàn)問題、綜合判斷和調(diào)查研究能力;二是優(yōu)化內(nèi)容生產(chǎn)技術流程和管理機制,以AIGC技術的上游和下游的特點來分別設計責任和權益機制,以面向人類受眾和面向機器或算法的兩類內(nèi)容生產(chǎn)類型進行新型全媒傳播體系的構建;三是加強全媒體生產(chǎn)對數(shù)據(jù)資源的挖掘利用,充分發(fā)揮合成數(shù)據(jù)作為人工智能融合基礎載體的巨大價值,壯大我國發(fā)展人工智能的數(shù)據(jù)要素優(yōu)勢;四是加強AIGC內(nèi)容識別審核鑒定技術、面向大模型的合成數(shù)據(jù)生產(chǎn)和隱私計算技術、數(shù)據(jù)與模型算法相融合的確權、知識產(chǎn)權保護與收益分配技術和機制的研究與探索,形成人機共融、共創(chuàng)、共生的全媒體生產(chǎn)傳播格局。
綜上所述,人工智能為代表的數(shù)字技術的發(fā)展是一把雙刃劍,對全媒體生產(chǎn)傳播體系服務人類社會的進步與發(fā)展不僅帶來積極的作用,更需要關注的是新生產(chǎn)力變革若沒有相應新型生產(chǎn)關系和制度配套,可能引發(fā)的社會風險和對人類文明發(fā)展的威脅,面向智能化時代的來臨,更需要秉持我國以人為本的發(fā)展理念,堅持如下四個原則:一是以實為本、數(shù)實融合原則。要防止形式大于內(nèi)容信息價值,防止內(nèi)容信息偏離現(xiàn)實世界,防止數(shù)字生產(chǎn)力脫離實體經(jīng)濟生產(chǎn)力。二是以和為本、凝聚共識原則。防止信息繭房、思維繭房操控認知與意識形態(tài),防止片面信息放大引發(fā)焦慮矛盾與撕裂,防止垃圾信息泛濫增加治理與決策成本。三是以人為本、人機共生原則。防止人類創(chuàng)造能力發(fā)展被壓制導致文化與內(nèi)容荒漠化,防止用戶隱私泄露導致的安全風險,防止用戶多渠道交互違規(guī)行為更加隱蔽讓監(jiān)管難度不斷加大。四是以可持續(xù)發(fā)展為本,安全共創(chuàng)原則。防止數(shù)據(jù)濫用導致數(shù)字資產(chǎn)流失,防止確權與溯源缺失導致知識產(chǎn)權難以有效保護,防止沒有合理價值分配導致內(nèi)容生態(tài)無法可持續(xù)發(fā)展。
面對AIGC的影響和挑戰(zhàn),我們要抓緊布局以權威安全可信的數(shù)據(jù)資源、大規(guī)模預訓練模型和大規(guī)模超級算力構成的數(shù)字中國戰(zhàn)略性公共基礎設施,為AIGC時代全媒體生產(chǎn)傳播體系建設和智能互聯(lián)網(wǎng)經(jīng)濟發(fā)展提供土壤,擁抱有中國特色的人工智能新時代。
作者系新華社媒體融合生產(chǎn)技術與系統(tǒng)國家重點實驗室5G融媒體事業(yè)部副主任
【編輯:沈金萍】