[摘要]文章基于AGI技術新思考,探究AIGC模式下新聞生產(chǎn)實踐,分析AIGC模式下新聞生產(chǎn)的邏輯支撐和本質突破,聚焦以AGI技術為基礎的AIGC應用在新聞生產(chǎn)領域不斷推動新聞生產(chǎn)采編、分發(fā)和管理模式變革,為新聞生產(chǎn)塑造多元應用場景,并探討如何進一步規(guī)制人工智能技術風險,助力新聞業(yè)增強產(chǎn)業(yè)效能。研究發(fā)現(xiàn),AIGC模式下新聞生產(chǎn)具有提示員、采編員、調控者和守護者的角色,并提出AIGC模式下新聞生產(chǎn)的實踐進路,即“強化模型思維:加強媒體數(shù)據(jù)庫建設”“優(yōu)化資源配置:完善人機協(xié)同”“加強監(jiān)督管理:強化新聞倫理規(guī)范和行業(yè)技術自律”。
[關鍵詞]AGI;AIGC;大語言模型;新聞生產(chǎn);模型訓練
當前,社會正處于從弱人工智能向強人工智能轉變的過渡期,ChatGPT等掀起新一輪人工智能技術發(fā)展高潮,超越傳統(tǒng)的機器輔助生產(chǎn)和自動化生產(chǎn)范疇,在一定程度上形成能夠復現(xiàn)人類思維和工作模式的智能系統(tǒng),為人類社會智能化生產(chǎn)生活打開新窗口。隨著OpenAI的新一代多模態(tài)預訓練大模型GPT-4發(fā)布并發(fā)揮更強的通用實踐效用,微軟的Bing AI和Copilot、谷歌的Bard也推動大型語言模型(Large Language Model,LLM)更好地適應公眾使用的需求。2024年2月16日,谷歌發(fā)布新一代多模態(tài)大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4。在同一日,OpenAI發(fā)布Sora“文字生成視頻”大模型,超越同類型同級別的應用,凸顯優(yōu)越的AI視頻生成時長,蘊含巨大的市場價值。這標志著人工智能大模型已經(jīng)從純粹的技術理念轉變?yōu)榭晒┩茝V使用的成熟工具,并意味著通用人工智能技術(Artificial General Intelligence,AGI)在現(xiàn)代化社會場景中發(fā)揮著越來越重要的數(shù)字基礎設施作用。
隨著AGI技術迅猛發(fā)展,強人工智能通過自主學習、自我訓練并完成自我調適,AIGC(人工智能生成內容,AI Generated Content)模式下新聞生產(chǎn)領域的邊界被無限拓展,為新聞業(yè)帶來新變革和新發(fā)展。文章基于AGI技術新思考,探究AIGC模式下新聞生產(chǎn)的實踐進路,助力新聞業(yè)應用人工智能技術釋放場景效應,增強產(chǎn)業(yè)效能。
一、AIGC模式下新聞生產(chǎn)的邏輯支撐和本質突破
(一)大模型訓練增強智能生成
當前,生成式人工智能基于大數(shù)據(jù)進行數(shù)據(jù)分析、模型設計以及優(yōu)化更新,并完成深度學習、強化學習,從而助力生產(chǎn)生活實踐。這種以大模型為基礎的生成式人工智能具有一定的思維性,即“靈智主體性”,是擁有部分主體性的行動體。同時,生成式人工智能并非預設文本和結構,也不是模式化的機械復制,而是對未知要素、動態(tài)信息的整合式創(chuàng)新,通過要素、數(shù)據(jù)和信息間的聯(lián)系進行邏輯推演和歸納演繹。具體到新聞生產(chǎn)領域,以AGI技術為基礎形成的AIGC應用發(fā)揮著越來越重要的作用。
在新聞生產(chǎn)過程中,有經(jīng)驗的記者善于發(fā)現(xiàn)新聞價值,激發(fā)新聞靈感,尤其擅長進行豐富聯(lián)想,提煉出更有新意的新聞主題[1],這是傳統(tǒng)機器新聞寫作無法達到的。然而,作為生成式人工智能,以AGI技術為基礎形成的AIGC應用具備較強的感知能力、分析能力和學習能力,基于大模型訓練形成類人甚至是更高的新聞敏感度,可以主動模擬人類思維,適配特定的應用場景和用戶需求,且不依賴于僵化的程序框架,通過開源數(shù)據(jù)訓練進行動態(tài)調整,具有較強的時效性和交互性,使得新聞媒體根據(jù)環(huán)境進行內容生產(chǎn)成為可能。具體來說,以AGI技術為基礎形成的AIGC應用立足于利用強化學習技術進行智能文本輸出的關鍵,先通過建立預訓練語言模型,生成文本初稿數(shù)據(jù),再將該數(shù)據(jù)集運用于獎勵模型,以接收反饋信號,判斷生成文本是否符合人類思維,進而優(yōu)化或微調初始語言模型,最終形成人工智能生成內容。簡言之,以AGI技術為基礎形成的AIGC應用通過強化學習技術、神經(jīng)網(wǎng)絡模型、自然語言模型以及大規(guī)模數(shù)據(jù)訓練等,實現(xiàn)自主進化,模擬人類思維模式,幫助記者完成復雜的新聞生產(chǎn)工作。
(二)強通用性賦能垂直應用場景
傳統(tǒng)的人工智能主要以單個應用場景為目的進行設計,具有特定的任務需求和算法規(guī)則,形成某個領域的算法模型,不利于應用于其他領域。各行業(yè)和企業(yè)推出的個性化專用人工智能,投入較高的人力、物力和財力,在增加成本的同時僅受益于特定領域小范圍的用戶群體,存在供需能力不匹配、技術效能無法釋放的問題。然而,以AGI技術為基礎形成的AIGC應用具有較強的通用性和普適性,在生成模型(Generative Model)經(jīng)過訓練后,可以使用相關的數(shù)據(jù)針對特定內容和領域進行微調,以通用模型和算法賦能垂直應用場景。也就是說,以AGI技術為基礎形成的AIGC應用能夠以多元模態(tài)數(shù)據(jù)為基礎,加強對各垂直領域知識、經(jīng)驗和規(guī)則等的專業(yè)化學習,產(chǎn)生一次研發(fā)、多元發(fā)展、垂直應用的效果,以低成本建立專業(yè)化大模型,為用戶提供更加個性化的服務。值得注意的是,基于人工智能通用大模型開展垂直應用場景的小模型研發(fā)訓練與能力集成,可以實現(xiàn)感知增強、智力增強、知識增強,具備垂直領域的通用能力。具體到新聞生產(chǎn)領域,新聞媒體可以利用以AGI技術為基礎形成的AIGC應用,基于既有的基礎大模型和專業(yè)小模型建構起具有較強專業(yè)性的垂直應用場景,培育出符合新聞風格和目標用戶需求的AIGC新聞產(chǎn)品,呈現(xiàn)較強的場景拓展性。例如,美聯(lián)社與OpenAI正合作探索生成式人工智能在新聞中的應用,并已經(jīng)使用OpenAI的人工智能技術專利來自動生成企業(yè)收益報告、體育賽事回顧以及某些現(xiàn)場賽事的轉錄[2]。
二、AIGC模式下新聞生產(chǎn)的角色定位
(一)提示員:計算新聞采寫
在傳統(tǒng)新聞生產(chǎn)領域,新聞熱點的挖掘、采集和構想主要通過人工完成,在進入互聯(lián)網(wǎng)時代后則可依靠搜索引擎、社交媒體以及智能應用等工具進行輔助采寫,但傳統(tǒng)的計算新聞采寫仍然基于固定結構填充數(shù)據(jù),依靠模板寫稿和自動摘要生成模式化的新聞稿件,且自主生成模式尚未普及[3]。隨著AGI技術及其應用的成熟,新聞熱點和線索的發(fā)掘、采集方式發(fā)生改變,新聞媒體也可以基于新聞生產(chǎn)實際需求、欄目設置需要等利用生成式人工智能自主完成大規(guī)模內容檢索和信息萃取,進而實現(xiàn)新聞選題的深度挖掘、新聞編寫的精準篩選和新聞內容的快速生產(chǎn)。也就是說,以AGI技術為基礎形成的AIGC應用可以發(fā)揮自然語言理解、分析和處理的技術優(yōu)勢,基于多元異構的多模態(tài)信息進行大范圍、深層次的數(shù)據(jù)分析,幫助記者挖掘新聞亮點及價值,提高新聞敏感度,大幅縮短新聞選題發(fā)現(xiàn)和挖掘的準備時間,降低新聞生產(chǎn)成本,并不再限于案例庫進行機械模仿,而自主完成數(shù)據(jù)抓取、要點提煉、類比創(chuàng)新和演繹推斷等較高創(chuàng)造性的文本生成工作。這對記者進行新聞采編具有較高的使用和實用價值,扮演“思維提示器”和“靈感提示員”的角色。換言之,以AGI技術為基礎形成的AIGC應用可以對海量新聞素材進行快速篩選、過濾,并凝練關鍵新聞線索、設計相關主題內容,為記者提供智力支持和靈感提示,提高新聞生產(chǎn)的工作效率和內容質量。
(二)采編員:多元內容創(chuàng)新
有學者指出,新聞邏輯方法生成于記者的日常思維,即記者通過反思經(jīng)驗抽象、概括出具有普遍意義的非日常思維結構,并將此內化于廣大受眾的日常思維[4]。當前,以AGI技術為基礎形成的AIGC應用凸顯較高水平的創(chuàng)造力,包括開展沉淀思考、總結報道經(jīng)驗,進行多模態(tài)、全媒體和跨領域的融合傳播,發(fā)揮全方位模擬人類思維和工作模式的行動能力,最大限度地助力新聞生產(chǎn)。一方面,以AGI技術為基礎形成的AIGC應用可以利用自然語言處理、機器學習、圖像識別等技術自動化地搜集和分析各個領域、多種形態(tài)的新聞素材,以形成貼近前沿社會環(huán)境、符合特定新聞規(guī)范和大眾心理期望的新聞創(chuàng)作邏輯和思維,這也是其超越傳統(tǒng)機器新聞的根本。值得注意的是,多模態(tài)的新聞素材和社會文本是生產(chǎn)高水平新聞的基礎,也是記者學習積累和形成經(jīng)驗的基石。另一方面,以AGI技術為基礎形成的AIGC應用可以憑借卷積神經(jīng)網(wǎng)絡(CNN)、圖像識別等技術,對圖像、圖片等復雜文本進行特征提取和記憶存儲,并基于大規(guī)模數(shù)據(jù)集的訓練提高模型的準確性和泛化能力,深度學習和整合創(chuàng)造海量新聞資源,最終形成“類人類思維”結構。可見,以AGI技術為基礎形成的AIGC應用具有自主化的行動能力,可以在短時間內獲取大規(guī)模、多領域信息,形成全面深入的分析性報道、調查性報道和專業(yè)性評論,也可以分析識別視頻、音頻、圖片等多模態(tài)文本信息,進行多模態(tài)、跨領域融合創(chuàng)新,集合AR/VR/XR等技術生產(chǎn)沉浸式新聞內容,幫助記者完成較為復雜的新聞生產(chǎn)工作。
(三)調控者:動態(tài)內容管理
相比傳統(tǒng)新聞生產(chǎn),以AGI技術為基礎形成的AIGC應用在新聞生產(chǎn)中具有更強的活力,呈現(xiàn)動態(tài)發(fā)展性和生成迭代性,可以基于海量數(shù)據(jù)進行需求分析和判斷、產(chǎn)品定制和模態(tài)轉換。具體來說,首先,在新聞生產(chǎn)領域,以AGI技術為基礎形成的AIGC應用可以實現(xiàn)自動識別與分析文案、照片和視頻中的對象、環(huán)境和情感基調等信息,以此作為自身創(chuàng)造和優(yōu)化新聞文案、價值傾向的重要參照,并進行智能內容分析與分類管理,完成內容識別、用戶分類和情緒感應,以調整新聞內容與用戶需求間的適配關系,幫助記者判定新聞內容是否匹配用戶、是否需要調整。例如,IBM Watson開發(fā)出企業(yè)級人工智能模型,并使用其自動執(zhí)行內容分類、文本標記、情感分析、關鍵字提取等內容管理工作[5]。值得注意的是,以AGI技術為基礎形成的AIGC應用可以標記內容差距識別(Content Gap Identification),即標記不同新聞內容的差距并提出新聞創(chuàng)作的新線索和新建議,以便創(chuàng)造更具新聞價值和市場流量的新鮮內容。其次,以AGI技術為基礎形成的AIGC應用可以憑借圖像識別、自然語言處理等技術,更加深入地比較分析多模態(tài)新聞文本,有意識地生產(chǎn)、演變和傳播符合特定場景需求的新聞內容,即基于文本比較與分析真正理解新聞文本和符號的價值內涵,洞察不斷變化和發(fā)展的新聞市場中的空白,創(chuàng)造出具有影響力、感染力和吸引力的新聞內容。最后,以AGI技術為基礎形成的AIGC應用可以進行智能化效果評估和輿情監(jiān)控,及時收集動態(tài)交互過程中產(chǎn)生的多元信息并進行深度分析和自我學習,感知傳播環(huán)境和目標用戶需求,快速、準確和高質量地對新聞文本進行文字、圖片、語音、音樂、視頻等形態(tài)的創(chuàng)造性轉換,從而實現(xiàn)融合生產(chǎn)和全媒體傳播?;谟脩魧崟r反饋調整新聞生產(chǎn)模式和傳播方式,這是以AGI技術為基礎形成的AIGC應用在新聞生產(chǎn)領域特有的生命力。
(四)守護者:人格化內容運營
在萬物皆媒的時代,新聞內容越來越成為一種高技術產(chǎn)品,人格化則成為賦予技術產(chǎn)品更多人文溫度的重要手段,可以進一步增強新聞傳播效果[6]。在新聞生產(chǎn)領域,以AGI技術為基礎形成的AIGC應用可以賦能AI主播具備類似于專業(yè)主播的高級心智能力,使其基于自我訓練、自我優(yōu)化的自組織能力,依賴于交互過程中產(chǎn)生的反饋數(shù)據(jù)和數(shù)據(jù)庫中的動態(tài)更新數(shù)據(jù)進行訓練,打造符合特定用戶需求的智慧化、人格化新聞內容,逐步發(fā)展出高度自洽的人機交互體系。也就是說,以AGI技術為基礎形成的AIGC應用基于深度學習、神經(jīng)網(wǎng)絡、自然語言處理等技術進行數(shù)據(jù)分析、態(tài)度預測和情感計算,以更具人類情感特征的方式進行陪伴式、人格化的新聞內容輸出。值得一提的是,沉浸式、伴隨式的新聞消費將成為未來消費的重要場景,新聞內容將成為具有一定分析、感知和交互能力的智能技術體,可以基于用戶的日常消費行為和反饋進行價值輸出、心理慰藉和情感補償,形成用戶專屬的人格化行為體。同時,以AGI技術為基礎形成的AIGC應用也可以通過情感分析技術幫助新聞媒體更好地理解用戶的情感和反應,幫助記者和專業(yè)主播通過用戶評論獲取、感知、分析用戶的情感傾向和用戶反饋,提高新聞生產(chǎn)質量,增強用戶黏性和提高用戶忠誠度。對新聞生產(chǎn)來說,人格化運營將成為一種“越陪伴越熟悉,越熟悉越親密”的常態(tài)化存在,用戶依賴新聞內容次數(shù)越多、時間越長,新聞媒體就越了解用戶,并成為用戶專屬的咨詢師、服務員和知心人,為用戶提供個性化的新聞推薦服務。
三、AIGC模式下新聞生產(chǎn)的實踐進路
當前,在新聞生產(chǎn)領域,針對以AGI技術為基礎形成的AIGC應用,新聞媒體仍需要從模型思維、資源配置和監(jiān)督管理等維度優(yōu)化技術應用實踐。
(一)強化模型思維:加強媒體數(shù)據(jù)庫建設
以AGI技術為基礎形成的AIGC應用要更好地嵌入新聞生產(chǎn)流程,新聞媒體必須貼合新時代既有的新聞內容生產(chǎn)業(yè)態(tài),加強其模型訓練和優(yōu)化升級,建設高質量、大體系的媒體數(shù)據(jù)庫,營造高水平自動化的新聞生產(chǎn)培育環(huán)境。也就是說,以AGI技術為基礎形成的AIGC應用要將強化學習技術等與大語言模型相結合,探索、熟悉、學習既有新聞采寫中的規(guī)律、特點和技巧,形成擬定符合特色欄目的選題、撰寫特定結構文本的新聞采寫能力,助力新聞媒體利用多元數(shù)據(jù)建構起具有行業(yè)競爭力的新聞業(yè)務模型,增強在智能新聞生產(chǎn)時代的核心競爭力。例如,彭博社研發(fā)自己的生成式人工智能模型—BloombergGPT,依托積累的大量金融數(shù)據(jù)源,創(chuàng)建一個包含3630億詞例(token)的金融數(shù)據(jù)集FinPile,在金融業(yè)務新聞實踐中表現(xiàn)突出。可見,以AGI技術為基礎形成的AIGC應用越參與新聞生產(chǎn)就越能夠助力新聞生產(chǎn),通過大量的新聞采寫數(shù)據(jù)和經(jīng)驗模型訓練熟練地掌握新聞采編技巧。
(二)優(yōu)化資源配置:完善人機協(xié)同
當前,雖然以AGI技術為基礎形成的AIGC應用在新聞寫作與分發(fā)方面將產(chǎn)生更大的自動化效應,但是依然離不開新聞媒體的監(jiān)督和管理。例如,英國廣播公司(BBC)的創(chuàng)新孵化器—BBC新聞實驗室測試借助GPT-3生成簡短形式的解釋性文章,結果卻存在很多偏差[7]??梢?,在模型生成特定新聞內容之后,以AGI技術為基礎形成的AIGC應用仍需要新聞媒體優(yōu)化資源配置,發(fā)揮記者對新聞內容評估和編輯的作用,完善人機協(xié)同,最大限度地擴大新聞生產(chǎn)效益。具體到新聞采訪的實踐層面,以AGI技術為基礎形成的AIGC應用雖能獲取類似于記者感知社會、分析事件的新聞實踐能力,但接觸到的信息本質上源自網(wǎng)絡世界的二手數(shù)據(jù),即經(jīng)由他者塑造的數(shù)據(jù),難以形成對真實社會的直接認識和經(jīng)驗數(shù)據(jù),在一定程度上無法自主感知環(huán)境,生產(chǎn)爆款內容,僅對新聞生產(chǎn)起到輔助作用。一方面,以AGI技術為基礎形成的AIGC應用要發(fā)揮協(xié)同作用,幫助記者生成思路摘要、整合碎片化信息、提煉新聞線索等。另一方面,以AGI技術為基礎形成的AIGC應用離不開記者對新聞內容的現(xiàn)場調查、實地采訪和資料收集等,需要記者發(fā)揮對內容的把關作用。
(三)加強監(jiān)督管理:強化新聞倫理規(guī)范和行業(yè)技術自律
雖然以AGI技術為基礎形成的AIGC應用基于大數(shù)據(jù)學習產(chǎn)生一定的自主決策和行動能力,但是其難以直接判斷事實真?zhèn)?,在一定程度上導致虛假新聞、謠言以及非合理性信息產(chǎn)生。而完善的規(guī)章制度體系是技術向善的重要保障,這要求相關部門、新聞媒體、社會機構建立管理鏈條,明確開發(fā)、供應和使用的多元主體責任。具體措施有以下方面。首先,用技術控制技術。新聞媒體要進一步加強技術迭代和行業(yè)監(jiān)督管理,提高核查業(yè)務的模型訓練和應用建設。其次,用行業(yè)規(guī)范和條例約束技術。新聞媒體要優(yōu)化業(yè)內使用機器學習和人工審查等方式,相關部門要完善智能生成內容管理政策。最后,充分發(fā)揮用戶監(jiān)督管理作用。新聞媒體要允許用戶評判他人帖子的準確性并添加解釋說明,賦予用戶主體性,鼓勵用戶主動標記新聞內容,從而實現(xiàn)用戶對虛假新聞內容的群體免疫。
四、結語
從ANI(狹義人工智能)迭代到AGI(通用人工智能),從通用大模型到專業(yè)大模型,人工智能技術始終突破奇點并深刻影響各領域發(fā)展格局。可以預計的是,以AGI技術為基礎形成的AIGC應用將在未來的新聞市場發(fā)揮越來越大的基礎性作用和擴展性功能,助力新聞媒體生產(chǎn)可解釋、透明化的新聞內容。新聞媒體要主動擁抱新技術并負責任地使用新技術,實行有效措施降低技術使用存在的風險,積極引導具有更強發(fā)展?jié)摿蛻们熬暗娜斯ぶ悄芗夹g賦能新聞生產(chǎn)。
[參考文獻]
[1]蔡雯,許向東,方潔.新聞編輯學[M].4版.北京:中國人民大學出版社,2019.
[2]Associated Press,OpenAI Partner to Explore Generative AI Use in News[EB/OL].(2023-07-13)[2024-07-20].https://www.usnews.com/news/technology/articles/2023-07-13/associated-press-openai-partner-to-explore-generative-ai-use-in-news.
[3]付曉光,吳雨桐.論AI新聞寫作的邏輯特征:基于Dreamwriter報道與人工報道的對比分析[J].現(xiàn)代出版,2021(01):48-55.
[4]胡華濤.新聞推理與論證的語用邏輯研究[J].國際新聞界,2012(02):58-63.
[5]The Contentstack Team.Content Management and Artificial Intelligence:The Future of Content Ops[EB/OL]. (2023-09-22)[2024-07-20].https://www.contentstack.com/blog/all-about-headless/content-management-artificial-intelligence-content-ops/.
[6]崔潔,童清艷.解構與重構:“人格化”虛擬AI新聞主播再思考[J].電視研究,2022(02):62-64.
[7]方曉,陳曉銳.《今日美國》母集團計劃采用生成式AI發(fā)布新聞:仍需人工審核[EB/OL].(2023-06-19)[2024-07-20].https://www.thepaper.cn/newsDetail_forward_23543439?commTag=true.
[基金項目]2023年國防大學年度計劃項目(項目編號:23GDJ30200B);全軍軍事理論科研計劃重點項目(項目編號:24GDJ30068B)。
[作者簡介]鄭玄(1996—),男,安徽六安人,國防大學軍事文化學院講師。