【摘要】盡管當下全球大模型投建如火如荼,但如何利用大模型賦能媒體融合,路徑尚不明晰。從“涌現(xiàn)”和“同質(zhì)化”入手,深刻理解大模型的技術(shù)特性、技術(shù)局限與潛在風險是必不可少的前置思考。對主流媒體而言,對大模型采取“拿來主義”并不可行,通過價值觀對齊、行業(yè)知識增強等措施建設(shè)安全可控的媒體大模型是媒體融合新的技術(shù)落地方向,能夠驅(qū)動基于智能體的人機協(xié)同的“策采編審發(fā)評饋管”全流程智能升級,加速人工智能生成內(nèi)容新范式的普及化,促進智媒應用生態(tài)的持續(xù)繁榮發(fā)展。人工智能大模型賦能全媒體傳播的切實進路應以媒體大模型為新技術(shù)底座,以大模型核心能力為支點,以內(nèi)容生產(chǎn)、內(nèi)容消費、內(nèi)容安全、媒資管理、協(xié)同辦公等典型行業(yè)場景為切入點,以智能媒體應用創(chuàng)新為落腳點,通過模型賦能、場景賦能與生態(tài)賦能多層次完善主流媒體布局,從而推進媒體深度融合。
【關(guān)? 鍵? 詞】人工智能大模型;全媒體傳播體系;媒體融合;智能媒體;智能傳播
【作者單位】徐琦,中國傳媒大學媒體融合與傳播國家重點實驗室新媒體研究院。
【基金項目】國家社會科學基金項目“基于AIGC的主流媒體智能傳播機理研究”(23BXW035)研究成果。
【中圖分類號】G206【文獻標識碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.03.002
從黨的十八大到黨的二十大,從建設(shè)現(xiàn)代傳播體系、全媒體傳播格局、全媒體傳播工程到全媒體傳播體系,以習近平同志為核心的黨中央不斷從黨和國家全面推進中華民族偉大復興的戰(zhàn)略規(guī)劃高度來強調(diào)加強全媒體傳播體系建設(shè)的重要性,將其作為指導中國媒體融合發(fā)展的行動指南,引領(lǐng)我國媒體融合持續(xù)縱深推進。近10年來,各級主流媒體在媒體融合深水區(qū)奮楫爭先,強化技術(shù)引領(lǐng),重塑內(nèi)容生產(chǎn)流程,拓展傳播渠道,打造平臺矩陣,創(chuàng)新運營模式,現(xiàn)已取得豐碩成果[1]。
隨著媒體融合進程從全媒體、融媒體加速邁向智媒體時代,AI作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量為傳播格局帶來歷史性變革與顛覆性挑戰(zhàn)。2023年ChatGPT全球爆火,成為有史來最快達到1億名月活用戶規(guī)模的消費級應用,讓社會大眾切實感受到AI和第四次工業(yè)革命的驚人潛力。ChatGPT實際上是一種預訓練大語言模型應用,從2018年的初代版本發(fā)展到2023年3月的GPT-4版本,其模型性能在短短5年間產(chǎn)生了質(zhì)的飛躍。2024年2月,谷歌發(fā)布Gemini 1.5,該模型在長語境理解方面取得重大突破。與此同時,OpenAI發(fā)布文生視頻大模型Sora,其基本視頻生成能力(時長、長寬比)、視頻連續(xù)性、真實世界模擬等都具備顯著優(yōu)勢。更重要的是,Sora 作為理解和模擬現(xiàn)實世界模型的基礎(chǔ),它的出現(xiàn)更被視為實現(xiàn)通用人工智能的關(guān)鍵里程碑。當下,科技巨頭紛紛加碼大模型研發(fā),國內(nèi)“百模大戰(zhàn)”正酣,大模型正在諸多社會生產(chǎn)領(lǐng)域全面崛起。盡管當下全球大模型投建如火如荼,但其發(fā)展依舊處于通用智能的初級階段,傳媒學界對該領(lǐng)域的研究基本集中在ChatGPT引發(fā)的人機關(guān)系和交往以及知識生產(chǎn)新機制方面[2],傳媒業(yè)界對大模型的關(guān)注與日俱增,但尚未大面積展開實際的產(chǎn)業(yè)落地。如何利用大模型技術(shù)創(chuàng)新賦能我國媒體融合、推進全媒體傳播體系建設(shè),路徑并不清晰。為此,本文試圖透過當下生成式AI浪潮的喧囂現(xiàn)象,集中探究大模型賦能全媒體傳播體系構(gòu)建的切實進路與創(chuàng)新潛力。
一、前置思考:理解大模型的涌現(xiàn)與同質(zhì)化
人工智能大模型是指在大量數(shù)據(jù)參數(shù)上訓練的模型,其可通過適應來執(zhí)行廣泛的下游任務[3]。在參數(shù)規(guī)模方面,大模型先后經(jīng)歷了預訓練模型、大規(guī)模預訓練模型、超大規(guī)模預訓練模型三個階段,每年參數(shù)規(guī)模至少提升10倍,目前千億級參數(shù)大模型已成為主流。在技術(shù)架構(gòu)方面,變換器架構(gòu)已成為大模型領(lǐng)域的核心技術(shù),其在大語言模型方向催生了GPT和BERT兩大技術(shù)流派。其中,BERT的代表性應用是谷歌AlphaGo。隨著GPT-3.0模型的問世,GPT系列漸成行業(yè)主流。如今,幾乎所有千億級參數(shù)規(guī)模的大型語言模型都采用了GPT架構(gòu)。在模態(tài)支持方面,大模型已從單一模態(tài)(如文本、圖像、語音)的單一任務處理發(fā)展到能支持多模態(tài)和多任務的復雜場景。OpenAI的GPT、CLIP、Sora,谷歌的BERT、Gemini與開源模型Gemma,百度文心、阿里通義、騰訊混元、華為盤古等都是大模型的具體實例。
1.涌現(xiàn)與同質(zhì)化:大模型的技術(shù)特性及其基石意義
大模型通常具備大容量、海量參數(shù)、大算力等特點。究其技術(shù)原理,大模型主要基于深度學習和變換器架構(gòu),同時結(jié)合多種先進的機器學習技術(shù)。變換器架構(gòu)是一種基于自注意力機制的神經(jīng)網(wǎng)絡模型,可有效處理長距離依賴關(guān)系,適用于自然語言處理任務。在預訓練階段,大模型通過自監(jiān)督學習任務從大量無標注的數(shù)據(jù)中學習語言和視覺模式。大模型訓練依賴于大規(guī)模數(shù)據(jù)集,這些數(shù)據(jù)集包含豐富的語言、圖像、聲音、視頻等多種模態(tài)信息,模型可通過訓練學習廣泛的知識和模式。為處理大規(guī)模模型,大模型訓練通常采用模型并行和數(shù)據(jù)并行技術(shù),前者將模型的不同部分分配到不同的計算設(shè)備上,后者則將數(shù)據(jù)集分割成多個部分,每個部分由單個計算設(shè)備處理。在預訓練完成后,大模型可通過微調(diào)來適應特定的下游任務。微調(diào)通常在有標注的數(shù)據(jù)集上進行,使得模型能夠?qū)W到特定任務所需的知識。對多模態(tài)大模型而言,其通常還涉及能捕捉跨模態(tài)關(guān)聯(lián)的網(wǎng)絡結(jié)構(gòu)和訓練策略的設(shè)計,從而具備有效整合和處理不同模態(tài)信息的能力。此外,大模型可通過融入外部知識庫(如知識圖譜)以增強其知識表示和推理能力。簡而言之,大模型的技術(shù)原理和特性是多方面的,其不僅在理論上具有創(chuàng)新性,而且已在多行業(yè)的復雜任務場景中展現(xiàn)超出預期的性能和應用潛力。
大模型可被視為現(xiàn)代AI領(lǐng)域的基石模型,其強大的學習和泛化能力為解決各類復雜問題提供了基礎(chǔ)。事實上,本輪生成式AI最大的突破來自底層大模型。理解大模型的基石意義可以從“涌現(xiàn)”和“同質(zhì)化”兩大關(guān)鍵詞入手?!坝楷F(xiàn)”是指系統(tǒng)行為或特性是隱式誘導而非顯式構(gòu)建的,它是人們?yōu)榭茖W進步深感振奮的源頭,也是人們對廣泛未知后果心懷隱憂的源頭。大模型的“涌現(xiàn)”表現(xiàn)為模型在沒有明確編程的情況下展現(xiàn)新的能力或行為。例如,GPT-3通過上下文學習實現(xiàn)了通過任務提示語來適應下游任務,這實際上是系統(tǒng)“涌現(xiàn)”的結(jié)果,而非專門訓練的結(jié)果?!巴|(zhì)化”是指在機器學習系統(tǒng)中構(gòu)建方法的整合,它為許多任務提供了強大的杠桿作用,但也構(gòu)成了單一的故障點。大模型的“同質(zhì)化”意味著幾乎所有先進的自然語言處理模型都是基于少數(shù)幾個基石模型進行適應的。這種“同質(zhì)化”雖然提供了極高的杠桿效應,但也意味著所有的AI系統(tǒng)都可能會繼承少數(shù)基石模型中相同的隱藏偏見問題。
值得注意的是,大模型“涌現(xiàn)”和“同質(zhì)化”的相互作用可能令人喜憂參半。“同質(zhì)化”意味著多領(lǐng)域均有機會因智能化水平提升而受益,尤其是在特定數(shù)據(jù)有限的情況下。但任何基石模型的缺陷都會被適應模型和下游任務所繼承,這就使得基于這些模型進行的激進“同質(zhì)化”風險重重。加之,目前獲得重要突破的語言大模型和多模態(tài)大模型主要基于深度神經(jīng)網(wǎng)絡,其透明性和可解釋性仍顯不足。這種“黑盒”特性限制了人們對其內(nèi)部工作機制、模型決策過程的理解和信任,凸顯了風險隱憂。
2.達摩克利斯之劍:大模型技術(shù)局限與潛在風險
雖然傳媒業(yè)對大模型的關(guān)注與日俱增,但大模型在主流媒體中的落地應用還處于早期階段。與此同時,大模型的技術(shù)風險、倫理問題和安全挑戰(zhàn)始終是懸在頭頂上的“達摩克利斯之劍”,清醒研判其技術(shù)局限性與潛在風險是必不可少的前置思考。DeepMind團隊曾對語言模型可能帶來的倫理問題和社會風險進行系統(tǒng)分類,他們將已觀察到的風險和預期風險歸為六大領(lǐng)域:歧視、仇恨言論和排斥;真實信息危害;錯誤信息危害;惡意使用;人機交互危害;環(huán)境和社會經(jīng)濟危害[4]。具體到傳媒業(yè),大模型的技術(shù)局限、誤用或惡意使用可能會危及新聞的真實性、及時性與公共性,引發(fā)一系列偏見歧視、意識形態(tài)危機、侵蝕社會信任等社會問題,值得高度警惕。
第一,大模型具有多重伴生技術(shù)風險。一是大模型中所隱藏的偏見與歧視問題,如果訓練數(shù)據(jù)存在偏見或有害歧視,大模型可能會學習并放大這些問題,而其他適應模型與下游任務都將繼承這種偏見與歧視,并導致在實際應用中產(chǎn)生歧視性結(jié)果,影響社會公平和正義,這與傳媒的公共性相悖。二是大模型能快速生成逼真的文本、圖像和視頻內(nèi)容,這可能會加劇深度偽造和假新聞等虛假信息的傳播,侵蝕新聞的真實性,進而對媒體信任、社會信任、政治安全、信息安全構(gòu)成威脅。三是大模型的濫用和操縱問題,惡意用戶可利用大模型生成具有誤導性或煽動性的內(nèi)容,服務于操控公眾輿論、進行網(wǎng)絡欺詐或社會工程攻擊等惡意目的。尤其是在全球選舉大年發(fā)布的Sora,其逼真的視頻生成與世界模擬能力更加模糊了真實與虛擬的界限,這將加劇深度偽造風險,因此當前各界人士都在呼吁全面防范其潛在風險。此外,大模型仍存在安全漏洞,這些安全漏洞可能被攻擊者利用,導致與大模型關(guān)聯(lián)的媒體業(yè)務面臨整體失效的風險,并可能威脅到以其為基礎(chǔ)構(gòu)建的智能媒體應用生態(tài)。
第二,大模型的可靠性尚未得到有效保障,這對強調(diào)真實性、及時性的新聞業(yè)而言是難以接受的。其中,最典型的就是尚未得到有效解決的“機器幻覺”問題,即AI模型在沒有足量數(shù)據(jù)或缺乏相關(guān)數(shù)據(jù)支持的情況下生成或預測不存在的信息或內(nèi)容,這在圖像生成、文本生成和音頻生成等領(lǐng)域的生成模型中尤為常見。上述問題可能導致模型輸出與現(xiàn)實世界的事實不符,甚至產(chǎn)生誤導性信息或有害信息,而目前業(yè)界尚無方法對所合成內(nèi)容做出可靠評估。
第三,大模型的內(nèi)容生成能力在很大程度上依賴于輸入的提問或提示語,這種對提問方式的敏感性導致其生成內(nèi)容具有高度不確定性,極易誘發(fā)意識形態(tài)風險及其他安全隱患。具體來看,大模型通常缺乏對現(xiàn)實世界常識和道德規(guī)范的深入理解,這使得它們在處理涉及道德、法律和安全敏感問題時容易產(chǎn)生不當回答。大模型通常利用海量互聯(lián)網(wǎng)數(shù)據(jù)進行訓練,其中的個人、企業(yè)甚至國家的敏感數(shù)據(jù)可能被編碼進大模型參數(shù)中,而通過提示信息可能會誘發(fā)大模型隱私數(shù)據(jù)泄露的問題。此外,大模型對提問方式的敏感性使其內(nèi)容安全風險更加隱蔽,常規(guī)內(nèi)容風控手段可能無法對其進行有效監(jiān)管。
第四,大模型尚未具備判斷和推理能力,只有形式軀殼,缺乏意志內(nèi)核,其生成內(nèi)容并不具備穩(wěn)定的價值觀。有學者將語言模型比作“隨機鸚鵡”,即語言模型通過大規(guī)模文本數(shù)據(jù)訓練學會了模仿語言的表面結(jié)構(gòu),但并未深入理解語言背后的深層含義。這類問題在大型預訓練語言模型中尤為突出,基于海量數(shù)據(jù)訓練的語言大模型生成的內(nèi)容可能符合語言規(guī)則并通順流暢,但缺乏實際意義或與上下文無關(guān),甚至在邏輯上是荒謬的。這種內(nèi)容生產(chǎn)模式無疑會影響人類的自主性和創(chuàng)造力。
第五,大模型應用部署代價高,這對主流媒體機構(gòu)而言是無法回避的現(xiàn)實考量。由于大模型參數(shù)規(guī)模和數(shù)據(jù)規(guī)模巨大,其存在訓練和推理計算量大、功耗高、應用成本高、端側(cè)推理存在延遲等問題[5],這些現(xiàn)實問題勢必制約其大規(guī)模應用落地。此外,大模型在小數(shù)據(jù)情景下的遷移能力不足,如何應對傳媒業(yè)復雜的業(yè)務需求,增強其對媒體各細分場景的適用性、魯棒性和泛化性仍極具挑戰(zhàn)。
二、模型賦能:基于安全可控的媒體大模型升級技術(shù)底座
大模型因數(shù)據(jù)規(guī)模量變產(chǎn)生智能“涌現(xiàn)”質(zhì)變的同時,帶來了因同質(zhì)化導致的風險問題。這決定了對首要服務黨的新聞輿論工作的全媒體傳播體系構(gòu)建而言,主流媒體對大模型奉行全盤“拿來主義”并不可行,打造安全可控的媒體大模型技術(shù)底座才是破局之道。
1.賦能底座:從通用大模型邁向安全可控的媒體大模型
隨著大模型的持續(xù)迭代,其發(fā)展重點正逐漸從通用大模型轉(zhuǎn)向針對特定行業(yè)或領(lǐng)域的垂直大模型,從通用到行業(yè)垂直,向下扎根,以實現(xiàn)更深入的行業(yè)應用和更高效的服務。行業(yè)大模型相對通用大模型而言,其大模型劃分依據(jù)的是應用領(lǐng)域的維度。通用大模型具有強大的泛化能力,如ChatGPT、百度文心、阿里通義、騰訊混元、華為盤古等,其可在不用微調(diào)或少量微調(diào)的情況下完成多場景任務,這相當于讓AI完成了通識教育。而行業(yè)大模型需要利用行業(yè)知識對大模型進行微調(diào),相當于讓AI完成專業(yè)教育,如金融領(lǐng)域的BloombergGPT、航天-百度·文心等。
通用大模型雖然泛化能力強,但仍存在以下局限性:一是行業(yè)深度不足,通用大模型由于缺乏特定行業(yè)的深度數(shù)據(jù)積累,因此在專業(yè)領(lǐng)域和更加細分的垂直領(lǐng)域中往往難以提供高價值的服務;二是數(shù)據(jù)安全問題,通用大模型通常不是本地部署,也沒有用戶權(quán)限管控,企業(yè)需要將私有化數(shù)據(jù)上傳到大模型方的服務器,其過程可能存在數(shù)據(jù)泄露的風險,這對數(shù)據(jù)安全敏感的行業(yè)來說是極大的挑戰(zhàn);三是運營成本高昂,通用大模型需要處理海量數(shù)據(jù),對算力和算法的要求高,多數(shù)企業(yè)難以承擔其高昂的運營成本。
在通用大模型的基礎(chǔ)上,建設(shè)媒體大模型需要完成價值觀對齊、行業(yè)知識增強等重要工作。具體而言,在大模型領(lǐng)域,對齊是一個關(guān)鍵概念,指確保模型的行為、輸出和決策與人類的價值觀、偏好和預期保持一致。特別是對能生成各類內(nèi)容的大模型而言,價值觀對齊尤為重要。通過設(shè)計與實施倫理框架、提高模型可解釋性、確保訓練數(shù)據(jù)質(zhì)量、引入人類反饋以強化模型對正面價值觀的學習、定期審查與更新等措施,主流媒體方可確保媒體大模型安全可控,有效防止有害內(nèi)容生成,發(fā)揮媒體社會功能。行業(yè)知識增強即結(jié)合傳媒業(yè)知識對大模型進行微調(diào)與知識增強。由于媒體業(yè)覆蓋面廣、應用場景繁多、用戶需求復雜,為使大模型更懂媒體,主流媒體需通過引入更多高質(zhì)量數(shù)據(jù)、領(lǐng)域知識融合、微調(diào)訓練等方式來提升其在特定應用場景中的性能,從而滿足個性化的業(yè)務需求。
從業(yè)界實踐來看,媒體業(yè)大模型建設(shè)正在成為主流媒體轉(zhuǎn)型的新方向。媒體大模型以基礎(chǔ)通用大模型為底座,深度結(jié)合媒體技術(shù)和行業(yè)專屬數(shù)據(jù),可廣泛服務于輔助創(chuàng)作、內(nèi)容風控、智能應答與檢索、多模態(tài)服務等應用場景,以賦能內(nèi)容生產(chǎn)傳播,推進媒體融合發(fā)展。百度與人民網(wǎng)聯(lián)合發(fā)布的專門為傳媒業(yè)設(shè)計的人民網(wǎng)-百度·文心大模型基于百度的文心大模型ERNIE 3.0構(gòu)建,結(jié)合人民網(wǎng)在傳媒業(yè)的豐富經(jīng)驗和行業(yè)知識,以及雙方在預訓練大模型技術(shù)和傳媒領(lǐng)域業(yè)務與算法的經(jīng)驗,在新聞摘編報告生成、新聞內(nèi)容審核分類、輿情分析等場景中得以應用。中央廣播電視總臺和上海人工智能實驗室聯(lián)合推出的央視聽媒體大模型(CMG Media GPT)專注于視聽媒體內(nèi)容生產(chǎn),提供節(jié)目創(chuàng)作、短視頻生成、節(jié)目編輯/剪輯、超寫實AI數(shù)字人、AIGC動畫和AI換臉等功能,現(xiàn)已在部分節(jié)目中實際應用。山東省新型智慧媒體重點實驗室推出的專注于傳媒行業(yè)的內(nèi)容生成和理解的傳媒行業(yè)大語言大模型壹點天璣,使主流媒體能更好地與AI行業(yè)頭部企業(yè)或科研院所展開大模型合作,從而加速AI新技術(shù)在媒體行業(yè)的落地,推動傳媒業(yè)智能化升級。
2.賦能機理:為智能媒體產(chǎn)業(yè)生態(tài)提供新基礎(chǔ)設(shè)施支撐
從結(jié)構(gòu)上看,中國智能媒體產(chǎn)業(yè)生態(tài)在整體上可劃分為基礎(chǔ)層、技術(shù)層和應用層。其中,基礎(chǔ)層和技術(shù)層為智媒發(fā)展提供算據(jù)、算法、算力等基礎(chǔ)支撐,是AI發(fā)展的通用基礎(chǔ)。應用層面向傳媒業(yè)需求和應用場景,提供智能軟硬件產(chǎn)品及解決方案,提升媒體的智能化程度,集中體現(xiàn)了AI對傳媒業(yè)的賦能影響[6]。具體到大模型新技術(shù)背景下:基礎(chǔ)層涵蓋云計算平臺、數(shù)據(jù)存儲和處理服務、算法優(yōu)化等,主要提供基礎(chǔ)設(shè)施支撐;技術(shù)層集成各種預訓練模型和開發(fā)工具,為構(gòu)建和部署各類智能媒體應用提供技術(shù)基礎(chǔ);應用層主要包括智能媒體產(chǎn)品服務及行業(yè)應用,產(chǎn)品服務主要包括文本生成、圖像和視頻處理、語音合成、數(shù)據(jù)分析等各類工具和服務,其行業(yè)應用主要涉及大模型和AIGC在垂直行業(yè)中的具體應用[7]。概言之,大模型的發(fā)展體現(xiàn)了智能媒體技術(shù)層的顯著進步,當前生成式AI最大的技術(shù)突破實際上就來自于底層大模型。
當前階段的數(shù)智化融合是技術(shù)邏輯、制度邏輯和關(guān)系邏輯三重邏輯疊加的產(chǎn)物。數(shù)智化賦能下,媒體融合進入深度融合發(fā)展階段,呈現(xiàn)以數(shù)據(jù)驅(qū)動為新引擎,以AI技術(shù)全面嵌入媒體內(nèi)容生產(chǎn)為新流程,以產(chǎn)業(yè)鏈、供應鏈、價值鏈、創(chuàng)新鏈協(xié)同為新生態(tài)的內(nèi)涵特征[8]。作為媒體融合新的技術(shù)落地方向,安全可控的媒體大模型將成為主流媒體智能化技術(shù)平臺新技術(shù)底座的重要構(gòu)成,其將驅(qū)動基于智能體的人機協(xié)同、人智交互的“策采編審發(fā)評饋管”全流程智能升級,加速人工智能生成內(nèi)容新范式的普及化,促進智媒應用生態(tài)的持續(xù)繁榮發(fā)展。對內(nèi),大模型新技術(shù)底座可推動媒體融合生產(chǎn)方式創(chuàng)新和業(yè)務流程再造,全面提升內(nèi)容生產(chǎn)力和傳播效率,支撐智媒產(chǎn)品更新迭代,創(chuàng)新人智交互體驗,實現(xiàn)提效降本,助推主流媒體數(shù)智化轉(zhuǎn)型。對外,主流媒體可通過智能化技術(shù)平臺將大模型技術(shù)服務能力輸出,賦能區(qū)域聯(lián)盟成員單位、政務服務商務合作伙伴、內(nèi)容創(chuàng)作者等生態(tài)成員,不斷放大技術(shù)外溢價值,全面提升智媒體時代主流媒體的綜合實力與競爭力。但由于大模型處于智能媒體產(chǎn)業(yè)生態(tài)基礎(chǔ)設(shè)施層面,其賦能進路并不直接可見,大模型的技術(shù)優(yōu)勢和賦能效果實際上是通過智能產(chǎn)品服務創(chuàng)新、行業(yè)場景落地與應用創(chuàng)新全面體現(xiàn)的。
三、場景賦能:服務全媒體傳播目標,推動智媒應用創(chuàng)新
模型賦能考驗的是技術(shù)積累和基礎(chǔ)設(shè)施能力,而場景賦能更加考驗主流媒體對于媒體行業(yè)需求及痛點的洞察與破題。對主流媒體而言,大模型技術(shù)首要服務于全媒體傳播體系建設(shè)目標,核心在于對內(nèi)促進“策采編審發(fā)評饋管”核心工作流程智能化升級,目前可重點切入媒體內(nèi)容生產(chǎn)、內(nèi)容消費、內(nèi)容安全、媒資管理、協(xié)同辦公等典型應用場景。
1.大模型智能生成重塑內(nèi)容生產(chǎn)流程
內(nèi)容生產(chǎn)是媒體機構(gòu)的核心業(yè)務流程,基于大模型的內(nèi)容生成是當前被寄予厚望的傳媒業(yè)落地場景。事實上,新聞寫作是AI最早介入的傳媒場景之一,但不同于早期僅限定于體育、財經(jīng)等特定領(lǐng)域的模版式寫作,目前大模型已能完成語言自然流暢、風格多變甚至充滿創(chuàng)意元素的寫作任務。早期基于數(shù)據(jù)表單與寫作模板的程式化自動寫作模式正在加速轉(zhuǎn)變?yōu)榛诖竽P汀⑷伺c智能體協(xié)作的交互式生成范式,媒體機構(gòu)內(nèi)部內(nèi)容生產(chǎn)流程將跟隨生產(chǎn)范式的轉(zhuǎn)變進行迭代升級。
面向內(nèi)容生產(chǎn)場景,大模型技術(shù)及其應用通過提升內(nèi)容生產(chǎn)的“策采編發(fā)”流程智能化水平,持續(xù)推動媒體內(nèi)容供給側(cè)的降本增效與流程再造。在選題策劃與內(nèi)容采集方面,大模型利用文本自然語言理解能力,結(jié)合大數(shù)據(jù)分析能力,輔助新聞策劃人員獲取靈感,完成選題挖掘分析和選題推薦,提高新聞策劃人員的選題決策效率和準確性。在輔助創(chuàng)作方面,大模型可幫助采編人員高效使用內(nèi)容摘要獲取、大綱提取、專題生成、標題優(yōu)化、風格仿寫、改寫、潤色、續(xù)寫、擴寫、縮寫等功能,以提高內(nèi)容創(chuàng)作質(zhì)量和效率。在多模態(tài)內(nèi)容生產(chǎn)方面,大模型通過多模態(tài)生成能力可提供AI搜圖、配圖、文生圖、文生視頻、數(shù)字人、知識問答、智能稿簽、文章裂變、多語種翻譯等生產(chǎn)輔助功能,從而實現(xiàn)內(nèi)容產(chǎn)品創(chuàng)新,提高生產(chǎn)效率。在內(nèi)容傳播環(huán)節(jié),大模型數(shù)據(jù)分析能力有助于精細化分析傳播渠道、傳播鏈路,輔助運營人員分析并提升傳播效果。
2.大模型人智交互創(chuàng)新內(nèi)容消費體驗
內(nèi)容消費是媒體機構(gòu)市場競爭力和社會影響力的基礎(chǔ),也是其商業(yè)價值、品牌價值的基礎(chǔ)。隨著數(shù)字媒體的快速發(fā)展,內(nèi)容消費形態(tài)和方式不斷更新,主流媒體機構(gòu)需要持續(xù)創(chuàng)新以洞察并適應用戶的需求變化,以保持自身的市場競爭力。
面向內(nèi)容消費場景,大模型技術(shù)及其應用有望創(chuàng)造全新的內(nèi)容消費方式,優(yōu)化現(xiàn)有的內(nèi)容發(fā)現(xiàn)與獲取體驗,提升內(nèi)容反饋效果并促進內(nèi)容再消費。在內(nèi)容消費方式方面,不同于傳統(tǒng)的單向式內(nèi)容消費,基于大模型智能體的內(nèi)容消費是人智交互式的,是可通過自然語言來實現(xiàn)多模態(tài)實時內(nèi)容交互的,用戶側(cè)可以定制個性化新聞小助手、新聞主播、數(shù)字分身等智能助理,媒體側(cè)可以研發(fā)各類基于大模型的數(shù)字人應用,通過人智交互的新消費方式來拓寬內(nèi)容增量空間。在優(yōu)化內(nèi)容發(fā)現(xiàn)與獲取方面,大模型可與搜索引擎、推薦系統(tǒng)、社交媒體等系統(tǒng)整合,以提高內(nèi)容的可見度,幫助媒體機構(gòu)贏得用戶注意力競爭。在提升內(nèi)容反饋效果方面,大模型可助力內(nèi)容側(cè)與用戶側(cè)的精細化運營,以激勵用戶完成觀看、收聽、評論、點贊、分享、再創(chuàng)作等內(nèi)容消費與互動行為,以此提升媒體機構(gòu)的內(nèi)容價值。
3.大模型內(nèi)容安全提升風控審核效率
內(nèi)容安全是媒體機構(gòu)的生命線,內(nèi)容審核風控是確保媒體內(nèi)容符合法律法規(guī)、社會價值觀、社會道德標準和平臺政策的關(guān)鍵環(huán)節(jié),其對防止有害信息傳播,營造清朗社會環(huán)境,維護社會秩序與保護用戶權(quán)益至關(guān)重要。內(nèi)容審核通常涉及文字、圖片、視頻、音頻等媒體形式的審查,以識別和過濾不當內(nèi)容。傳統(tǒng)內(nèi)容審核主要依賴人工,普遍存在效率低下、主觀性強、成本高昂、審核員疲勞從而影響判斷力和準確性等局限性。
面向內(nèi)容安全場景,大模型技術(shù)及其應用可極大提升媒體機構(gòu)的內(nèi)容審核風控效率和準確度,使媒體機構(gòu)能有效應對多模態(tài)、多語種、情感識別、深度偽造等全新挑戰(zhàn)。在提高審核效率方面,大模型能快速處理和分析大量多模態(tài)內(nèi)容,提高審核流程的自動化程度,降低人力依賴,顯著提高審核速度,滿足實時或近實時審核需求。在準確性方面,大模型能通過深度學習和自然語言處理綜合考慮內(nèi)容的上下文信息及其關(guān)聯(lián)性,能夠更準確地理解內(nèi)容的微妙語意,包括雙關(guān)語、文化差異等,從而減少誤判和漏判。在跨語言能力與適應性方面,大模型支持多語言處理,能夠理解和審核不同語言的內(nèi)容,以及不同國家和地區(qū)的法律法規(guī)和道德標準,確保內(nèi)容在不同文化和語言環(huán)境中的合規(guī)性。在情感和情緒分析方面,大模型能分析內(nèi)容中的情感和情緒傾向,這不僅可以提高審核的準確度,還能幫助媒體機構(gòu)更好地理解用戶反饋,及時調(diào)整內(nèi)容策略。在深度偽造檢測方面,大模型本就和深度偽造技術(shù)同源,可通過持續(xù)學習和優(yōu)化來識別和分析經(jīng)過高級圖像和視頻處理技術(shù)生成的偽造內(nèi)容,實現(xiàn)深度偽造反制。
4.大模型媒資管理促進內(nèi)容資產(chǎn)增值
媒資系統(tǒng)是媒體機構(gòu)的核心競爭力,它不僅提高了內(nèi)容生產(chǎn)的效率和質(zhì)量,還為媒體業(yè)數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展提供了堅實基礎(chǔ)。媒資系統(tǒng)是一種用于存儲、檢索、管理和分發(fā)各種媒體資產(chǎn)(如視頻、音頻、圖片、文檔等)的軟件系統(tǒng),通常包括內(nèi)容創(chuàng)建、版本控制、版權(quán)管理、工作流程自動化、元數(shù)據(jù)管理等功能,以在確保內(nèi)容的安全性、可訪問性和合規(guī)性的同時,實現(xiàn)內(nèi)容資產(chǎn)的高效管理和利用。傳統(tǒng)媒資系統(tǒng)雖然在一定程度上解決了媒體資產(chǎn)的管理問題,但也存在手動操作煩瑣、搜索效率低下、擴展性不足、智能化處理能力不強等局限性以及安全性和合規(guī)性挑戰(zhàn)。
面向內(nèi)容資產(chǎn)管理場景,大模型技術(shù)及其應用可極大提升媒體機構(gòu)的內(nèi)容管理效率與資產(chǎn)數(shù)字化增值空間。在自動化內(nèi)容分析方面,大模型技術(shù)可高效提取關(guān)鍵幀、場景、情感等信息,生成豐富的元數(shù)據(jù)和內(nèi)容標簽,提高搜索效率和內(nèi)容推薦的準確性。在智能檢索與推薦方面,大模型技術(shù)可以更精準地理解用戶的查詢意圖,并通過自然語言來完成流暢的檢索推薦交互過程。在輔助生產(chǎn)方面,大模型技術(shù)可以輔助用戶更好地進行創(chuàng)意工作,同時自動化處理重復性任務,優(yōu)化工作流程,提高工作效率。在安全與合規(guī)方面,大模型技術(shù)可以輔助監(jiān)測和識別潛在的版權(quán)問題,以確保內(nèi)容的合法合規(guī)使用。在拓展性方面,大模型技術(shù)使得媒資管理系統(tǒng)更加靈活,能夠快速適應新技術(shù)和新格式,如支持高清視頻、虛擬現(xiàn)實內(nèi)容等。
5.大模型協(xié)同辦公優(yōu)化媒體管理流程
協(xié)同辦公平臺是媒體機構(gòu)維持日常運轉(zhuǎn)的重要支撐,也是主流媒體創(chuàng)新管理的具體體現(xiàn)之一。媒體機構(gòu)通常采用辦公自動化系統(tǒng),即OA系統(tǒng)來使用電子郵件、文檔管理、工作流程自動化、會議管理、任務分配、考勤管理等功能。目前,OA系統(tǒng)基本支持媒體機構(gòu)日常的辦公業(yè)務功能,但仍面臨個性化辦公需求難以滿足、跨部門數(shù)據(jù)孤島、用戶界面和交互設(shè)計不友好以及數(shù)據(jù)安全等痛點。
面向協(xié)同辦公場景,大模型技術(shù)及其應用有助于優(yōu)化媒體機構(gòu)的內(nèi)部管理流程,提高機構(gòu)效率與現(xiàn)代化管理水平。協(xié)同辦公實際上也是當前大模型能快速落地的通用場景之一,通過集成大模型,OA系統(tǒng)可以實現(xiàn)更智能的工作流程自動化,減少人工干預,提效降本。在用戶體驗方面,大模型的自然語言處理能力可以提升OA系統(tǒng)中的文本分析、自動回復等功能,優(yōu)化用戶體驗,提高系統(tǒng)的易用性。在跨平臺協(xié)作方面,大模型可以打破數(shù)據(jù)孤島,實現(xiàn)不同系統(tǒng)和平臺之間的數(shù)據(jù)整合,促進信息共享。在個性化辦公需求方面,媒體員工可以根據(jù)自身的工作習慣和偏好來定制服務不同目標的智能體,通過智能助理的形式實現(xiàn)辦公場景的“千人千面”?;诖竽P椭悄荏w的人智協(xié)同辦公有望重塑辦公流程,成為未來主流的辦公方式。
四、生態(tài)賦能:盤活全媒體傳播生態(tài),放大技術(shù)外溢價值
通過近10年的媒體融合探索,主流媒體已實行區(qū)域融媒聯(lián)盟共建共享、政務服務商務運營模式創(chuàng)新、創(chuàng)作者內(nèi)容共建等生態(tài)建設(shè)舉措。隨著主流媒體對大模型的漸次采用,對外技術(shù)賦能將廣泛助力全媒體傳播生態(tài)成員,不斷放大技術(shù)外溢價值。
1.盤活融媒聯(lián)盟生態(tài),促進省市縣技術(shù)資源共享
我國媒體融合發(fā)展遵循資源集約、結(jié)構(gòu)合理、差異發(fā)展、協(xié)同高效的原則,對中央媒體、省級媒體、市級媒體和縣級融媒體中心四級融合發(fā)展布局進行縱向優(yōu)化。統(tǒng)籌建立跨區(qū)域、跨層級的媒體資源共享平臺,形成四級媒體的協(xié)同發(fā)展機制,是健全完善四級媒體融合發(fā)展布局,形成“上下貫通、左右聯(lián)動”的全媒體傳播體系的題中應有之義。
目前,各級主流媒體已在實踐中探索出省帶區(qū)縣融合、全省融合等做法,重點是依托省級媒體平臺技術(shù)支持區(qū)域融媒聯(lián)盟生態(tài),將區(qū)縣融媒體發(fā)展為新型主流媒體平臺的用戶入口和綜合服務端口,以實現(xiàn)渠道下沉、資源整合和數(shù)據(jù)積累,合力擴大主流價值影響力版圖。隨著省級媒體平臺對大模型技術(shù)能力的整合,各區(qū)域融媒聯(lián)盟單位都將廣泛受益于新一輪數(shù)智化升級。例如,傳播大腦科技(浙江)股份有限公司發(fā)布的“天目藍云”,其作為浙江全省統(tǒng)一的新型智能化融媒體技術(shù)平臺,現(xiàn)已推出“融媒通”“智島”“洪澤”等產(chǎn)品,可對省內(nèi)11家市級黨報、90家縣媒、1700余家機構(gòu)等浙江融媒共享聯(lián)盟成員形成廣泛賦能,通過體制機制創(chuàng)新與業(yè)務流程重塑,構(gòu)建“用戶共享、內(nèi)容共享”的一體化傳播體系。持續(xù)深耕“媒體+科技+服務”區(qū)域媒體融合生態(tài)建設(shè)的湖北長江云新媒體集團,于2023年2月與百度集團達成戰(zhàn)略合作,將湖北省移動政務融媒體平臺和縣級融媒體中心省級技術(shù)支撐平臺“長江云”正式接入百度文心一言,入駐長江云平臺的全省100多家各級政務部門以及市縣級融媒體中心可優(yōu)先獲取領(lǐng)先AI支持。
2.共建政務服務商務生態(tài),增強“新聞+”連接力
2020年9月,中共中央辦公廳、國務院辦公廳印發(fā)《關(guān)于加快推進媒體深度融合發(fā)展的意見》,其中提出“新聞+政務服務商務”的運營新模式,為主流媒體深度融合提供了具體可循的路線圖。經(jīng)過數(shù)年探索,“新聞+政務服務商務”已成為當前融媒體的主要運營模式,新聞內(nèi)容是其基底,服務功能是其工具,二者共同發(fā)揮主流媒體的社會作用。截至目前,各級各類主流媒體已廣泛探索政務服務、政府智庫、智慧城市、醫(yī)療服務、就業(yè)服務、交通服務、社會服務、MCN、直播帶貨、文旅產(chǎn)業(yè)等跨界合作。
實際上,“新聞+”是一種生態(tài)思維,即通過“新聞+”匯聚外部資源,實現(xiàn)跨界連接,促進跨界資源反哺新聞業(yè)務,通過生態(tài)位互補形成多元傳播連接新模式,以此推動主流媒體從單一的傳播模式轉(zhuǎn)向“傳播+連接”模式,實現(xiàn)媒體深度融合。未來,主流媒體可通過大模型技術(shù)及其應用賦能政務服務商務生態(tài)合作,進一步提升自身在信息傳播、政府治理、公共服務、商業(yè)服務等方面的綜合服務水平。例如,360公司與北京時間有限公司合作,將北京市政府相關(guān)政策數(shù)據(jù)灌入大模型,通過數(shù)字人“春妮”為學生提供申請助學金等問題的答疑服務,打造出有溫度的“新聞+政務”體驗。又如,界面財聯(lián)社啟動AI金融大模型項目,旨在基于自身優(yōu)勢打造符合金融行業(yè)發(fā)展需求的金融垂直領(lǐng)域?qū)I(yè)大模型。
3.賦能創(chuàng)作者生態(tài),繁榮主流媒體內(nèi)容創(chuàng)作平臺
全媒體傳播體系構(gòu)建強調(diào)“走好全媒體時代群眾路線”,重點是把黨的優(yōu)良傳統(tǒng)和新技術(shù)新手段結(jié)合起來,強化媒體與受眾的連接,以開放平臺吸引廣大用戶參與信息生產(chǎn)傳播。在實踐中,主流媒體已從早期聚合平臺先后轉(zhuǎn)向內(nèi)容開放平臺建設(shè)。領(lǐng)先的主流媒體持續(xù)探索利用AI技術(shù)夯實內(nèi)容生態(tài)基礎(chǔ)設(shè)施,廣泛吸納不同的內(nèi)容創(chuàng)作主體,持續(xù)開放內(nèi)容生產(chǎn)邊界,充分激發(fā)內(nèi)容創(chuàng)新活力。
主流媒體機構(gòu)投入研發(fā)大模型技術(shù)及其應用創(chuàng)新,不僅可助力自身優(yōu)化流程、提高效率,還可通過內(nèi)容開放平臺對外技術(shù)賦能,為各類內(nèi)容創(chuàng)作者提供大模型通用創(chuàng)作工具,促進內(nèi)容智能化生產(chǎn)及協(xié)作,繁榮主流媒體內(nèi)容創(chuàng)作生態(tài),更大程度推動AI賦能媒體融合發(fā)展。2017年新華社發(fā)布的“媒體大腦”持續(xù)迭代,通過AI不斷賦能智能媒體生態(tài),2022年其作為牽頭單位起草《機器生產(chǎn)內(nèi)容自動化分級》團體標準,從標準高度健康引導智能內(nèi)容生產(chǎn)。由人民日報社新媒體中心聯(lián)合多家企業(yè)開發(fā)的開放式媒體技術(shù)創(chuàng)新平臺“人民日報創(chuàng)作大腦”于2020年上線,2023年10月發(fā)布的“人民日報創(chuàng)作大腦AI+”就集納了大模型、自然語言處理、計算機視覺、音頻語義理解、圖像識別等先進的AI技術(shù),通過集智能化、場景化、自動化于一體的全新工作模式平臺廣泛賦能內(nèi)容創(chuàng)作者。
五、結(jié)語
OpenAI首席執(zhí)行官山姆·阿爾特曼曾預測人工智能大模型技術(shù)將成為繼移動互聯(lián)網(wǎng)之后未來最大的技術(shù)平臺,而以聊天機器人為界面,加上圖像、音樂、文本等多模態(tài)模型的發(fā)展模式將催生世界級大型企業(yè)。對全媒體傳播體系構(gòu)建而言,大模型浪潮不僅僅是前沿技術(shù)挑戰(zhàn),更是歷史性發(fā)展機遇。主流媒體唯有加快數(shù)智化布局,善用技術(shù)賦能,合力推進媒體大模型應用生態(tài)建設(shè),方可在智能媒體發(fā)展賽道上奪得先機。
|參考文獻|
[1]朱瑞,李良榮. 加強全媒體傳播體系建設(shè)的邏輯、內(nèi)涵和支撐[J]. 新聞戰(zhàn)線,2022(23):86-89.
[2]涌現(xiàn)的問題域:智能時代的新話題與舊議題的新意涵:2023年新媒體研究述評[EB/OL]. (2024-02-01)[2024-01-15]. https://baijiahao.baidu.com/s?id=1789686049746405618&wfr=spider&for=pc.
[3] On the Opportunities and Risks of Foundation Models[EB/OL]. [2024-01-15]. https://download.csdn.net/download/xiaoxiyang1990/21168934?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-download-2%7Edefault%7EBlogCommendFromBaidu%7EPaid-1-21168934-blog-129937212.235%5Ev43%5Epc_blog_bottom_relevance_base5&depth_1-utm_source=distribute.pc_relevant_t0.none-task-download-2%7Edefault%7EBlogCommendFromBaidu%7EPaid-1-21168934-blog-129937212.235%5Ev43%5Epc_blog_bottom_relevance_base5&utm_relevant_index=1.
[4]Taxonomy of risks posed by language models[EB/OL]. [2024-01-15]. https://dl.acm.org/doi/10.1145/3531146.3533088.
[5]2023中國人工智能系列白皮書[EB/OL]. (2023-12-17)[2024-01-15]. https://www.sohu.com/a/744750336_121851714.
[6]徐琦,趙子忠. 中國智能媒體生態(tài)結(jié)構(gòu)、應用創(chuàng)新與關(guān)鍵趨勢[J]. 新聞與寫作,2020(8):51-58.
[7]中國信通院發(fā)布《2023大模型和AIGC產(chǎn)業(yè)圖譜》[EB/OL]. (2023-07-07)[2024-01-15]. https://www.sh.chinanews.com.cn/kjjy/2023-07-10/113935.shtml.
[8]田園. 數(shù)智時代新型主流媒體的內(nèi)容傳播生態(tài)省思[J]. 青年記者,2023(19):13-17.