摘要:【目的】ChatGPT的火爆出圈使得AIGC的應(yīng)用從小眾走向了分眾和大眾,在技術(shù)紅利釋放的同時(shí)也衍生了諸多風(fēng)險(xiǎn)問題,在拓展技術(shù)應(yīng)用的同時(shí)完善風(fēng)險(xiǎn)規(guī)制有助于產(chǎn)業(yè)高質(zhì)量、可持續(xù)發(fā)展?!痉椒ā课恼聫膬?nèi)容供給、信源采納、模型調(diào)優(yōu)、行業(yè)應(yīng)用等維度對(duì)AIGC帶來的機(jī)遇和挑戰(zhàn)進(jìn)行梳理。【結(jié)果】指出目前AIGC已基本可供、可用,部分可塑、可信,未來可替、可期?!窘Y(jié)論】“負(fù)能”固然存在,“賦能”更為可期,在包容審慎中既要給技術(shù)發(fā)展以邊界約束,更要給技術(shù)應(yīng)用以彈性空間。
關(guān)鍵詞:AIGC;技術(shù)紅利;風(fēng)險(xiǎn)規(guī)制;技術(shù)倫理;ChatGPT" " " " 中圖分類號(hào):G205" " " " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1671-0134(2023)02-007-06" " " " "DOI:10.19483/j.cnki.11-4653/n.2023.02.001
本文著錄格式:向安玲.賦能與負(fù)能:AIGC的技術(shù)紅利與風(fēng)險(xiǎn)規(guī)制[J].中國(guó)傳媒科技,2023(02):7-12.
1.產(chǎn)業(yè)背景:AIGC釋放巨大增量空間
人工智能生成內(nèi)容(Artificial Intelligence Generated Content,簡(jiǎn)稱AIGC)又稱生成式人工智能(Generative AI),是指在滿足用戶個(gè)性化需求的同時(shí),使用AI自動(dòng)化創(chuàng)建信息內(nèi)容的過程。[1]作為Web3.0時(shí)代的內(nèi)容創(chuàng)造新引擎,無(wú)論是在內(nèi)容的集成效率和生產(chǎn)效能上,還是在信息的組織結(jié)構(gòu)和交互模式上,AIGC都超出了Web1.0時(shí)代的PGC(Professional Generated Content,專業(yè)生產(chǎn)內(nèi)容),并且有望在不久的未來超過Web2.0時(shí)代的UGC(User Generated Content,用戶生成內(nèi)容)。《Science》期刊已將AIGC列為“2022年度科學(xué)十大突破”之一,預(yù)計(jì)到2025年AIGC將占據(jù)所有生成數(shù)據(jù)的10%,并由此產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。[2]可以說無(wú)論是從產(chǎn)業(yè)規(guī)模還是經(jīng)濟(jì)增量來看,AIGC均釋放出了巨大增長(zhǎng)潛力。
AIGC的火爆出圈和快速迭代也催生了一系列新的應(yīng)用場(chǎng)景和業(yè)務(wù)模式。從內(nèi)容模態(tài)來看,當(dāng)前AIGC包括文本、語(yǔ)音、代碼、圖像、視頻等多模態(tài),在新聞、音樂、影視制作等行業(yè)應(yīng)用廣泛,極大地豐富了虛擬數(shù)字空間的信息內(nèi)容。[3]從生產(chǎn)方式來看,AIGC顛覆了傳統(tǒng)內(nèi)容產(chǎn)出模式,其基于生成對(duì)抗網(wǎng)絡(luò)GAN、大型預(yù)訓(xùn)練模型等人工智能技術(shù),通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容。[4]從應(yīng)用價(jià)值來看,AIGC以其高通量、低門檻、高自由度的生成能力廣泛適配于各類應(yīng)用場(chǎng)景,2020-2022年,AIGC賽道風(fēng)投增長(zhǎng)了4倍,2021年新發(fā)布的深度合成視頻數(shù)量較2017年已增長(zhǎng)10倍以上。
然而,人工智能領(lǐng)域日新月異的突破也引發(fā)了人類對(duì)技術(shù)發(fā)展的一系列迷思,其中暗含的社會(huì)風(fēng)險(xiǎn)、倫理風(fēng)險(xiǎn),以及對(duì)人主體性的挑戰(zhàn)都引發(fā)較大爭(zhēng)議,這需要對(duì)AIGC發(fā)展保持更冷靜的思考和更綜合的研判。目前而言,學(xué)界和業(yè)界對(duì)AIGC也存在褒貶不一的看法,雖然其強(qiáng)大的生產(chǎn)能力和適配能力在很大程度上解放了人類生產(chǎn)力,但其應(yīng)用過程中所帶來的內(nèi)容失真、內(nèi)容違規(guī)、內(nèi)容侵權(quán)、信息冗余、政治偏見、技術(shù)倫理等問題也廣遭詬病。在充分激活A(yù)IGC技術(shù)紅利的基礎(chǔ)上,強(qiáng)化風(fēng)險(xiǎn)規(guī)制和質(zhì)量保障機(jī)制,對(duì)落實(shí)中共中央《新一代人工智能發(fā)展規(guī)劃》《新一代人工智能倫理規(guī)范》 《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》等政策,實(shí)現(xiàn)數(shù)字內(nèi)容產(chǎn)業(yè)的長(zhǎng)期、穩(wěn)定、健康發(fā)展具有重要意義。
2.技術(shù)紅利:從可供到可用
無(wú)論是從技術(shù)研發(fā)層面還是從行業(yè)應(yīng)用層面,AIGC均在很大程度上解放了生產(chǎn)力、重構(gòu)了生產(chǎn)關(guān)系、釋放了技術(shù)紅利。越來越多的行業(yè)領(lǐng)域開始探索自動(dòng)化內(nèi)容生產(chǎn)并逐漸涌現(xiàn)出與之相適配的新型商業(yè)模態(tài)。在增強(qiáng)媒介可供性問題的基礎(chǔ)上,提升生成內(nèi)容的可用性,是挖掘AIGC技術(shù)紅利之必要。
2.1" "媒介可供性
媒介可供性(media affordance)是指用戶根據(jù)媒介特性、能力與局限性,從自身需求或目的出發(fā),在特定語(yǔ)境中使用媒介展開行動(dòng)的可能性。[5]從用戶視角來看,可供性涉及用戶自身的媒介素養(yǎng)和交互能力;從產(chǎn)品端來看,可供性則更多與其信息供給能力和服務(wù)便捷程度相關(guān)。對(duì)AIGC應(yīng)用而言,其使用門檻目前逐漸下放,從專業(yè)用戶到普通用戶均能以相對(duì)便捷的方式進(jìn)行交互使用。但不同AIGC產(chǎn)品在信息類別、媒介模態(tài)、支持語(yǔ)種、承載能力上差異分化,也會(huì)限制信息內(nèi)容輸出的規(guī)模、速度和類型,對(duì)媒介可供性造成影響。
從信息類別可供性來看,目前主流AIGC產(chǎn)品一般可分為通用型和專業(yè)型兩種。其中通用型AIGC可面向泛知識(shí)領(lǐng)域進(jìn)行信息組織、內(nèi)容創(chuàng)作與輸出;專業(yè)型AIGC產(chǎn)品則側(cè)重于特定領(lǐng)域的信息集成與內(nèi)容輸出,如醫(yī)療、金融、汽車等垂直領(lǐng)域的智能問答系統(tǒng),財(cái)經(jīng)、體育、氣象等領(lǐng)域的機(jī)器新聞產(chǎn)品等。
從應(yīng)用場(chǎng)景來看,通用領(lǐng)域AIGC一般面向大眾級(jí)C端用戶,涉及信息議題更廣、交互模式更多元,但限于訓(xùn)練集的開放性和多源性,其內(nèi)容質(zhì)量相對(duì)受限;專業(yè)領(lǐng)域AIGC一般面向B端、G端及部分專業(yè)級(jí)C端用戶,側(cè)重于特定領(lǐng)域的模型訓(xùn)練與調(diào)優(yōu),其訓(xùn)練語(yǔ)料往往會(huì)有更嚴(yán)格的把控,相比于信息廣度會(huì)更側(cè)重于信息的深度。當(dāng)下包括ChatGPT在內(nèi)的通用領(lǐng)域AIGC已逐步成為大眾級(jí)應(yīng)用,但其商業(yè)模式還有待進(jìn)一步拓展;垂直領(lǐng)域的AIGC商業(yè)空間更大,但在語(yǔ)料標(biāo)注和模型訓(xùn)練上還有待進(jìn)一步調(diào)優(yōu),涉及領(lǐng)域也有待進(jìn)一步拓展。
從媒介模態(tài)可供性來看,目前AIGC廣泛應(yīng)用于文本生成、圖像生成、音頻生成、視頻生成等領(lǐng)域(如表1所示),圖文影音之間的跨模態(tài)生成也逐步成熟。其中文本生成包括交互式文本、非交互式文本(結(jié)構(gòu)化生成和創(chuàng)作型生成),交互式文本生成通常為對(duì)話問答形式,非交互式文本則更多是根據(jù)特定指令進(jìn)行智能寫作,包括結(jié)構(gòu)化寫作(如當(dāng)下主流的機(jī)器新聞產(chǎn)品)和創(chuàng)作型寫作(如文案、詩(shī)歌、文學(xué)作品生成),相比于程式化、模板化的結(jié)構(gòu)化寫作,創(chuàng)作型寫作開放度、自由度、個(gè)性化程度更高,還存在諸多技術(shù)問題有待攻堅(jiān)。與文本類似,圖像生成也可分為圖片智能編輯(結(jié)構(gòu)化)與圖像自主生成(創(chuàng)造型)兩類,前者更多是針對(duì)既有圖像進(jìn)行輔助修改、合成與自動(dòng)調(diào)整,后者則是按照一定指令和風(fēng)格要求自動(dòng)創(chuàng)作一幅全新的畫作,包括2D和3D等多模態(tài)圖像。音視頻的AI生成則可分為克?。òㄉ疃葌卧霥eepFake)、智能編輯、自主創(chuàng)作三大類。此外,包括程序代碼、虛擬人、機(jī)器人操控等方面的生成式AI應(yīng)用也逐步落地,媒介模態(tài)的可供性提升讓所謂的“AI寫手”“AI畫家”“AI程序員”及“AI偶像”大量涌現(xiàn),行業(yè)應(yīng)用場(chǎng)景和商業(yè)模式不斷拓寬。
從交互語(yǔ)種可供性來看,雖然當(dāng)下包括ChatGPT在內(nèi)的主流AIGC產(chǎn)品均支持多語(yǔ)種交互,但不同語(yǔ)種的輸入指令所獲取的內(nèi)容輸出在反饋速度、響應(yīng)概率、輸出準(zhǔn)確度等方面均存在較大差異。由于AIGC產(chǎn)品底層的訓(xùn)練語(yǔ)料庫(kù)所涵蓋的語(yǔ)種大多為英語(yǔ),在交互反饋過程中,其針對(duì)英語(yǔ)指令的信息可供性往往更強(qiáng)。測(cè)試發(fā)現(xiàn),針對(duì)同一個(gè)問題,采用中英文輸入指令其返回結(jié)果存在一定差異,一般而言英文結(jié)果往往更為詳細(xì)、與問題的匹配度也更高。尤其是針對(duì)專業(yè)領(lǐng)域的內(nèi)容輸出,英語(yǔ)交互的效果通常更勝一籌。
此外,AIGC產(chǎn)品的承載能力也在很大程度上影響了其可供性。受限于算力資源的影響,當(dāng)下主流AIGC產(chǎn)品在承載用戶量和交互響應(yīng)效率上均存在一定局限性。以ChatGPT為例,目前其全球用戶量已過億,平均每天的獨(dú)立訪客數(shù)超過千萬(wàn),峰值請(qǐng)求數(shù)更是達(dá)到數(shù)億級(jí)別,自從2023年2月其火爆出圈后長(zhǎng)時(shí)間處于“滿負(fù)荷運(yùn)轉(zhuǎn)”狀態(tài),甚至幾度系統(tǒng)“崩潰”,對(duì)單個(gè)用戶的交互反饋頻次也做了限制。算力、算法、數(shù)據(jù)作為AIGC的三大底層支撐,共同決定了產(chǎn)品的可供性。在降低算力資源邊際成本的基礎(chǔ)上,不斷調(diào)優(yōu)算法、細(xì)化數(shù)據(jù)顆粒度,才能保障AIGC在可供的基礎(chǔ)上進(jìn)一步實(shí)現(xiàn)可用。
2.2" "內(nèi)容可用性
根據(jù)Nielsen的可用性(Usability)框架,可用性主要包括產(chǎn)品的可學(xué)習(xí)性(Learnability)、可記憶性(Memorability)、效率(Efficiency)、出錯(cuò)率(Errors)、滿意度(Satisfaction)五大屬性,此外針對(duì)互聯(lián)網(wǎng)應(yīng)用,安全性和隱私性也常常被考慮在內(nèi)。[6]其中可學(xué)習(xí)性主要指初次接觸使用的門檻,可記憶性主要指后期重新使用是否可迅速恢復(fù)熟練度,效率是指用戶完成任務(wù)的速度,出錯(cuò)率是指產(chǎn)品出現(xiàn)BUG的頻次,滿意度則是用戶的主觀感知。針對(duì)AIGC產(chǎn)品而言,目前可學(xué)習(xí)性、可記憶性和效率問題普遍處于較高水平,影響可用性的關(guān)鍵指標(biāo)為內(nèi)容出錯(cuò)率和用戶主觀體驗(yàn),尤其是內(nèi)容本身的準(zhǔn)確度、差錯(cuò)率、專業(yè)度和冗余度在很大程度上影響了用戶的感知可用性。
從內(nèi)容準(zhǔn)確度來看,由于AIGC本身的輸出能力來自大規(guī)模學(xué)習(xí)而非算法革新,這也使得其在內(nèi)容輸出上受限于其訓(xùn)練的語(yǔ)料,而無(wú)法準(zhǔn)確響應(yīng)訓(xùn)練集之外的指令,甚至出現(xiàn)答非所問的情況。針對(duì)訓(xùn)練語(yǔ)料所涉及范疇問題,目前AIGC輸出準(zhǔn)確度則與用戶指令的精確度直接相關(guān),若指令問題對(duì)應(yīng)著唯一性答案,AIGC給出反饋能保障接近100%的準(zhǔn)確率;而對(duì)沒有特定答案的問題,則需要用戶通過層次遞進(jìn)的追問法不斷獲取準(zhǔn)確反饋。此外受限于訓(xùn)練集的時(shí)效性,部分反饋內(nèi)容也存在明顯的滯后問題(如ChatGPT部分訓(xùn)練集時(shí)效截至2021年),這也對(duì)內(nèi)容的可用性造成了較大影響。
從內(nèi)容出錯(cuò)率來看,包括ChatGPT在內(nèi)的AIGC產(chǎn)品基于大模型訓(xùn)練進(jìn)行實(shí)時(shí)調(diào)優(yōu)和反饋,相比于傳統(tǒng)的深度學(xué)習(xí)模型,大模型的臨場(chǎng)學(xué)習(xí)能力(in-context learning)使得其能夠超出原始訓(xùn)練語(yǔ)料限制,在與用戶交互過程中不斷進(jìn)行學(xué)習(xí),并在這個(gè)過程中進(jìn)行臨場(chǎng)“糾錯(cuò)”以優(yōu)化反饋結(jié)果。例如當(dāng)用戶直接指出ChatGPT反饋結(jié)果存在問題,或?qū)ζ漭敵鲞M(jìn)行質(zhì)疑和批判時(shí),它會(huì)根據(jù)用戶反饋對(duì)其輸出進(jìn)行臨時(shí)調(diào)整和糾正。這種持續(xù)性迭代和自我糾錯(cuò)雖然在一定程度上能降低AIGC的錯(cuò)誤率,但由于用戶交互內(nèi)容本身的質(zhì)量較難保障,往往也會(huì)造成“錯(cuò)上加錯(cuò)”的結(jié)果。這也就對(duì)用戶自身的媒介素養(yǎng)、知識(shí)儲(chǔ)備量和批判思維提出了更高要求。
此外,從AIGC內(nèi)容專業(yè)度和信息冗余度來看,面向特定領(lǐng)域的垂類AIGC在專業(yè)性上往往有較好保障,尤其是醫(yī)療、法律、金融、編程等知識(shí)結(jié)構(gòu)化程度高、訓(xùn)練集質(zhì)量高、專業(yè)型程度強(qiáng)的領(lǐng)域,基于生成式AI進(jìn)行交互問答和內(nèi)容生成可在一定程度上替代基礎(chǔ)性工作。但對(duì)通用領(lǐng)域的AIGC產(chǎn)品而言,經(jīng)測(cè)試發(fā)現(xiàn)當(dāng)下主流AIGC產(chǎn)品輸出內(nèi)容和觀點(diǎn)相對(duì)中庸和常規(guī),存在大量冗余信息,在提供信息增量、超出一般認(rèn)知上還存在優(yōu)化空間。
但整體來看,相比于傳統(tǒng)的信息檢索和交互問答產(chǎn)品,AIGC一方面能實(shí)現(xiàn)對(duì)歷史交互信息的主動(dòng)記憶和上下文理解,在連續(xù)交互的過程中對(duì)內(nèi)容的準(zhǔn)確性、正確性、專業(yè)性進(jìn)行持續(xù)提升,基于臨場(chǎng)交互情境優(yōu)化用戶體驗(yàn);另一方面其極大地提升了用戶信息檢索和內(nèi)容組織效率,對(duì)其所不涉及的指令范疇也可給出對(duì)應(yīng)建議,相比于傳統(tǒng)信息產(chǎn)品具備更強(qiáng)的開放性、靈活性和成長(zhǎng)性。
3.風(fēng)險(xiǎn)規(guī)制:從可塑到可信
在AIGC加速發(fā)展并迅速滲透到各個(gè)行業(yè)的同時(shí),也衍生了包括虛假信息、錯(cuò)誤信息、隱私侵犯、倫理道德、版權(quán)管理等一系列安全問題。涉及訓(xùn)練語(yǔ)料、算法模型、交互指令、內(nèi)容傳播等各個(gè)環(huán)節(jié),面向全鏈條的內(nèi)容風(fēng)險(xiǎn)管理也成為必要。從風(fēng)險(xiǎn)規(guī)制視角來看,一方面需針對(duì)后端的算法模型和底層數(shù)據(jù)進(jìn)行不斷調(diào)優(yōu),另一方面要針對(duì)前端的內(nèi)容輸出和交互功能進(jìn)行規(guī)范約束,在算法模型可塑的基礎(chǔ)上實(shí)現(xiàn)內(nèi)容輸出的可信。
3.1" "模型可塑性
隨著2018年谷歌發(fā)布了自然語(yǔ)言處理預(yù)訓(xùn)練模型BERT,AIGC應(yīng)用進(jìn)入到大模型時(shí)代。相比于早期的機(jī)器學(xué)習(xí)模型,大模型一般基于海量數(shù)據(jù)進(jìn)行自我監(jiān)督學(xué)習(xí)、具備巨量參數(shù)、可快速提取特征,可實(shí)現(xiàn)多任務(wù)、多語(yǔ)言、多模態(tài)信息處理。雖然當(dāng)下主流生成式AI模型參數(shù)多突破了千億(圖1),但值得注意的是,并非參數(shù)規(guī)模越大AIGC表現(xiàn)性能越好,如GPT-3.5模型參數(shù)量為13億個(gè),遠(yuǎn)低于含有1750億個(gè)參數(shù)的GPT-3,但其在反饋內(nèi)容準(zhǔn)確率和道德表現(xiàn)上卻明顯優(yōu)于GPT-3.0。這種大數(shù)據(jù)預(yù)訓(xùn)練和小數(shù)據(jù)微調(diào)的方式擺脫了對(duì)頻繁人工調(diào)整參數(shù)的依賴,使得生成內(nèi)容更加自然,同時(shí)可在交互過程中基于用戶反饋進(jìn)行強(qiáng)化學(xué)習(xí),也即可對(duì)自身的錯(cuò)誤進(jìn)行持續(xù)性修正與迭代。
以ChatGPT為例,其通過引入RLHF(Reinforcement Learning with Human Feedback,基于人類反饋的強(qiáng)化學(xué)習(xí))技術(shù)使得模型輸出內(nèi)容可塑性更強(qiáng),在一定程度上可讓AIGC和人類的常識(shí)、認(rèn)知、需求甚至價(jià)值觀保持一致。這種模型訓(xùn)練模式一方面使得AI自我進(jìn)化能力更快,通過持續(xù)性學(xué)習(xí)能更快且更準(zhǔn)確地響應(yīng)用戶需求,適配于更多場(chǎng)景的用戶交互;但另一方面也增加了AI本身的“規(guī)訓(xùn)”風(fēng)險(xiǎn),除了預(yù)訓(xùn)練語(yǔ)料,在人機(jī)交互過程中所“投喂”給模型的信息也會(huì)被其消化,并影響后續(xù)的內(nèi)容輸出。一旦大量錯(cuò)誤信息、風(fēng)險(xiǎn)信息通過人機(jī)交互用于模型強(qiáng)化學(xué)習(xí),將會(huì)使得對(duì)應(yīng)傳播風(fēng)險(xiǎn)被放大。新的模型范式背后潛在的惡意操縱行為也需警惕。
對(duì)多數(shù)AIGC產(chǎn)品而言,為了降低模型輸出內(nèi)容風(fēng)險(xiǎn),會(huì)對(duì)用戶請(qǐng)求和模型學(xué)習(xí)語(yǔ)料進(jìn)行限制約束。如ChatGPT 增加了過濾處理機(jī)制以解決AI倫理問題,如遇到敏感性問題和指令(包括暴力、犯罪、歧視等),其會(huì)采用拒絕回答或相對(duì)中庸、穩(wěn)妥地回復(fù)來降低傳播風(fēng)險(xiǎn)。這雖然在一定程度上規(guī)避了部分不當(dāng)內(nèi)容生成,但僅從用戶指令層面進(jìn)行限制并不能解決底層語(yǔ)料內(nèi)隱藏的倫理風(fēng)險(xiǎn)。公開資料顯示,包括ChatGPT在內(nèi)的AIGC產(chǎn)品主要訓(xùn)練語(yǔ)料均來自各類用戶生成內(nèi)容(UGC)平臺(tái),如網(wǎng)頁(yè)、維基百科、社交媒體平臺(tái)、博客等。[7]這就使得個(gè)人用戶所持有的偏見歧視、錯(cuò)誤觀點(diǎn)、政治傾向等被AI模型進(jìn)行了學(xué)習(xí),在內(nèi)容輸出過程中也會(huì)暗含相應(yīng)的態(tài)度傾向。對(duì)AIGC產(chǎn)品的風(fēng)險(xiǎn)規(guī)制還需從底層語(yǔ)料、算法參數(shù)、功能約束等多個(gè)層面進(jìn)行調(diào)優(yōu)。
3.2" "內(nèi)容可信度
如果說算法模型的可塑性是影響AIGC風(fēng)險(xiǎn)的隱性因子,那么輸出內(nèi)容的可信度則是決定AIGC應(yīng)用風(fēng)險(xiǎn)的顯性因子?,F(xiàn)有研究表明,AIGC在一定程度上加劇了虛假信息(disinformation)和誤導(dǎo)信息(misinformation)的傳播。[8]包括深度偽造(DeepFake)在內(nèi)的AIGC應(yīng)用已經(jīng)能做到真假難辨,多數(shù)受眾很難從視覺層面區(qū)分AI和人類生成內(nèi)容。[9]盡管AIGC相關(guān)算法本身沒有善惡屬性,但這項(xiàng)技術(shù)已被廣泛用于政治操縱和不正當(dāng)商業(yè)競(jìng)爭(zhēng)等負(fù)面目的。[10]而且伴隨著越來越多的生成式AI模型被開源使用,由此產(chǎn)生的虛假信息、誤導(dǎo)信息和偏見信息對(duì)國(guó)際政治、社會(huì)和人權(quán)發(fā)展都帶來了風(fēng)險(xiǎn)。[11]而要提升AIGC可信度,一方面需要從信源層面盡可能保障內(nèi)容質(zhì)量,另一方面也需從交互應(yīng)用層面對(duì)潛在風(fēng)險(xiǎn)要素進(jìn)行約束和提示。
從當(dāng)下通用領(lǐng)域AIGC產(chǎn)品所采用的信源來看,UGC規(guī)模遠(yuǎn)大于PGC,這也使得信源的權(quán)威性和專業(yè)性受限,進(jìn)一步影響了內(nèi)容輸出的可信度。以ChatGPT為例,其訓(xùn)練數(shù)據(jù)60%來自于Common Crawl數(shù)據(jù)集,該數(shù)據(jù)集涵蓋了2018年以來在全球各大開源網(wǎng)站、社交媒體、維基百科、政府網(wǎng)站等平臺(tái)上采集的數(shù)據(jù),其中博客平臺(tái)(18.69%)和維基百科信息(13%)占據(jù)了相當(dāng)比例,這些普通用戶主導(dǎo)生成的內(nèi)容在可信度上并不能得到保障。除了文本類AI,當(dāng)下典型圖像AIGC產(chǎn)品的訓(xùn)練數(shù)據(jù)多來自于各大開源網(wǎng)站平臺(tái),如Stable Diffusion的數(shù)十億圖片訓(xùn)練數(shù)據(jù)集中約有8.5%來自大型圖片社交網(wǎng)站 Pinterest,6.8%來自WordPress,同時(shí)也涵蓋了各類購(gòu)物平臺(tái)、博客。[12]訓(xùn)練數(shù)據(jù)集的版權(quán)許可不明也使得AIGC面臨著版權(quán)爭(zhēng)議。此外,當(dāng)前ChatGPT對(duì)各國(guó)主流媒體的信息調(diào)用存在限制,其雖然能通過部分開源網(wǎng)站獲取部分權(quán)威媒體的信息觀點(diǎn),但并不能系統(tǒng)調(diào)取其相關(guān)信息進(jìn)行訓(xùn)練學(xué)習(xí),信源內(nèi)容的良莠不齊也影響了其輸出內(nèi)容質(zhì)量的穩(wěn)定性。
除了訓(xùn)練數(shù)據(jù)集中潛藏著內(nèi)容風(fēng)險(xiǎn),交互端的惡意使用也會(huì)使得AIGC成為虛假信息和錯(cuò)誤信息傳播的助推器。美國(guó)新聞可信度評(píng)估與研究機(jī)構(gòu)NewsGuard對(duì)ChatGPT進(jìn)行了測(cè)試,當(dāng)其要求ChatGPT根據(jù)陰謀論和誤導(dǎo)性信息進(jìn)行反饋時(shí),其在80%情況下均做出反饋。此外,當(dāng)測(cè)試人員讓ChatGPT根據(jù)虛假信息進(jìn)行新聞寫作時(shí),其可迅速生成大量看似讓人信服但實(shí)際上無(wú)明確信源的內(nèi)容,新聞結(jié)構(gòu)和敘事手法均接近專業(yè)水平,但內(nèi)容本身卻充斥著錯(cuò)誤信息和虛假引用。[13]對(duì)AIGC的不當(dāng)訓(xùn)練和惡意使用會(huì)助推虛假信息的傳播,這對(duì)用戶本身的媒介素養(yǎng)和批判思維也提出了更高要求。研究發(fā)現(xiàn),相比于歐美國(guó)家用戶對(duì)AIGC的批判性態(tài)度,中國(guó)用戶對(duì)AIGC的應(yīng)用表現(xiàn)出了更明顯的積極態(tài)度[14],在部分場(chǎng)景下用戶對(duì)署名為算法新聞的感知可信度甚至高于對(duì)人類記者的信任度[15],AIGC內(nèi)容的感知可信度、混淆度和冗余度也進(jìn)一步加大對(duì)AIGC風(fēng)險(xiǎn)規(guī)制的必要性。
內(nèi)容可信度之余,包括隱私問題、版權(quán)問題、成癮問題、微政治歧視、不當(dāng)使用造成的“高科技剽竊”和學(xué)術(shù)不端,惡意使用帶來的不正當(dāng)商業(yè)競(jìng)爭(zhēng)和網(wǎng)絡(luò)詐騙、網(wǎng)絡(luò)攻擊等,均成為AIGC多場(chǎng)景應(yīng)用中所面臨的風(fēng)險(xiǎn),在充分利用AIGC技術(shù)紅利的同時(shí)正視其衍生的負(fù)外部性,也是實(shí)現(xiàn)AI技術(shù)生態(tài)可持續(xù)健康發(fā)展的必要。
4.演化趨勢(shì):從可替到可期
隨著深度學(xué)習(xí)進(jìn)入到大模型階段,AIGC打破了早期AI輔助生產(chǎn)的預(yù)定義規(guī)則模式,內(nèi)容生成從“智能編輯”逐步演化到“智能創(chuàng)作”。從AI輔助編輯到AI輔助生產(chǎn)再到AI自主創(chuàng)造,內(nèi)容生產(chǎn)范式的轉(zhuǎn)變給信息產(chǎn)業(yè)帶來巨大沖擊,低成本、高效率、大規(guī)模的應(yīng)用也讓部分職業(yè)的可替性增強(qiáng)。如何在人機(jī)協(xié)同中找到最佳平衡點(diǎn)和最優(yōu)協(xié)作模式,也成為AIGC未來高質(zhì)量發(fā)展和多領(lǐng)域應(yīng)用需要探索的問題。
4.1" "職業(yè)可替性
在AI規(guī)模性應(yīng)用之前,人們普遍認(rèn)為相比于腦力勞動(dòng)者,簡(jiǎn)單重復(fù)的體力勞動(dòng)者被技術(shù)的替代可能性更高。隨著AI在信息組織和知識(shí)生產(chǎn)領(lǐng)域的應(yīng)用深化,在GPT-3等大模型的支撐下AI已初步具備創(chuàng)造能力,除了滿足錯(cuò)誤糾正、簡(jiǎn)單問題回答、自動(dòng)翻譯、素材集成、自動(dòng)填充等輔助性生產(chǎn)工作,在全新內(nèi)容創(chuàng)作、藝術(shù)生產(chǎn)、代碼編程等方面也表現(xiàn)出高度的適應(yīng)性和創(chuàng)造性。牛津大學(xué)在2017年曾對(duì)700多個(gè)職業(yè)被AI的替代率進(jìn)行了分析,指出未來10年將有近一半職業(yè)消失,47%的人面臨失業(yè)風(fēng)險(xiǎn)。[16]而且除了技術(shù)含量較低的流水線工作,包括翻譯、銷售甚至醫(yī)生、作家等專業(yè)性職業(yè)也將面臨著“人機(jī)交接”風(fēng)險(xiǎn)。[17]
以媒體行業(yè)為例,早在16年就有機(jī)構(gòu)統(tǒng)計(jì)指出機(jī)器新聞年產(chǎn)量已突破10億篇,尤其是在財(cái)經(jīng)、體育和自然災(zāi)害等領(lǐng)域機(jī)器的模板化生成能力已相當(dāng)成熟,國(guó)內(nèi)外大量主流媒體機(jī)構(gòu)也自研或引入了機(jī)器新聞產(chǎn)品投入生產(chǎn)應(yīng)用。除了常規(guī)的模板化生產(chǎn),以ChatGPT為主的開放式、自主式新聞生產(chǎn)也逐步滲透到傳媒行業(yè)。測(cè)試發(fā)現(xiàn)ChatGPT生成的新聞與當(dāng)前專業(yè)新聞寫作在結(jié)構(gòu)、框架、邏輯、敘事語(yǔ)言等方面是高度相似的,其內(nèi)容通常會(huì)包含事實(shí)、觀點(diǎn)和引語(yǔ)等常規(guī)要素,且符合倒金字塔寫作結(jié)構(gòu)。盡管AIGC的生產(chǎn)效率和規(guī)模性已經(jīng)遠(yuǎn)超出人類寫手,但與人類寫作的新聞相比,機(jī)器新聞的可讀性往往較差,且在情緒交互上相對(duì)較弱,限于倫理、情感、靈活性等多種因素,目前大多數(shù)學(xué)者對(duì)機(jī)器取代人類寫作仍持否定態(tài)度。[18]
此外,AIGC對(duì)人類創(chuàng)造性工作的替代,也造成了關(guān)于“高科技剽竊”的爭(zhēng)議。運(yùn)用AIGC生成的作品版權(quán)如何界定?“機(jī)器作者”身份是否可被承認(rèn)?AIGC作品的署名問題與侵權(quán)追責(zé)問題?諸多議題還未形成定論。尤其是在學(xué)術(shù)領(lǐng)域AIGC的濫用問題已被部分機(jī)構(gòu)歸類為“學(xué)術(shù)不端”,目前已有超百家學(xué)術(shù)期刊表示將完全禁止或嚴(yán)格限制使用ChatGPT等AI撰寫學(xué)術(shù)論文。
從長(zhǎng)遠(yuǎn)發(fā)展來看,媒介是人的延伸,AIGC作為一種泛媒介也將成為人的延伸,而非完全的替代。不同職業(yè)工種的情感投入度、隨機(jī)應(yīng)變性、程式化程度、專業(yè)性、安全性、探索性、經(jīng)驗(yàn)性等多重特性都會(huì)影響其被AI替代的可能性。但這種替代在某種程度上可視之為對(duì)人類生產(chǎn)力和創(chuàng)造性的解放,AI在造成失業(yè)的同時(shí)也會(huì)增加新的就業(yè)機(jī)會(huì)。通過在人機(jī)協(xié)同中找到平衡點(diǎn),將更多基礎(chǔ)性、常規(guī)性工作交給AI,也會(huì)讓人類有更多時(shí)間投入到創(chuàng)意生產(chǎn)中。
4.2" "應(yīng)用可期性
AIGC除了對(duì)現(xiàn)有職業(yè)存在替代性,其強(qiáng)大的生產(chǎn)和創(chuàng)造能力對(duì)Web2.0時(shí)代各種互聯(lián)網(wǎng)應(yīng)用也造成挑戰(zhàn)。目前主流AIGC產(chǎn)品已具備交互問答、信息檢索、內(nèi)容生成、語(yǔ)言翻譯、程序編寫與調(diào)試、環(huán)境模擬、數(shù)據(jù)處理、創(chuàng)意生成、推理分析等多種功能,在一定程度上可替代既有搜索引擎、翻譯軟件、編程工具、文案工具等,已成為一個(gè)集成多種實(shí)用功能的“工具箱”。隨著AIGC涉及模態(tài)、應(yīng)用場(chǎng)景和技術(shù)倫理的拓展與優(yōu)化,其對(duì)當(dāng)下的社交媒體、新聞資訊、游戲引擎等應(yīng)用也會(huì)構(gòu)成挑戰(zhàn),在重構(gòu)未來職業(yè)結(jié)構(gòu)的同時(shí)也將重構(gòu)全球互聯(lián)網(wǎng)生態(tài)。
Web3.0背景下,AIGC更有望成為元宇宙構(gòu)建的內(nèi)容引擎和底層工具。隨著AI生成3D模型、AI生成虛擬人、AI驅(qū)動(dòng)機(jī)器人、AI生成數(shù)字作品、AI驅(qū)動(dòng)數(shù)字孿生等技術(shù)的發(fā)展成熟和規(guī)?;瘧?yīng)用,AIGC在三維時(shí)空構(gòu)建、數(shù)字靈魂打造和數(shù)字藏品鑄造上將會(huì)發(fā)揮重要作用。這也會(huì)在很大程度上降低元宇宙的構(gòu)建門檻和邊際成本,加速元宇宙在G端、B端及C端不同層面的深度應(yīng)用。
相比于生成式AI在技術(shù)層面的突破,其在應(yīng)用層面更具潛力空間。包括GPT-3、CLIP、Diffusion等大模型在2022年前已在專業(yè)領(lǐng)域得以應(yīng)用,但ChatGPT的爆火讓這些AI技術(shù)從小眾走向了分眾和大眾,應(yīng)用價(jià)值得以釋放,產(chǎn)業(yè)規(guī)模也邁向指數(shù)級(jí)增長(zhǎng)階段。ChatGPT帶動(dòng)了AIGC應(yīng)用場(chǎng)景的大發(fā)展,除了在互聯(lián)網(wǎng)、傳媒、教育、影視、金融等領(lǐng)域的廣泛應(yīng)用,在政務(wù)服務(wù)、工業(yè)、醫(yī)療等領(lǐng)域也具備巨大應(yīng)用空間。
綜合來看,在AIGC爆發(fā)式增長(zhǎng)前夕,更應(yīng)以一種客觀中立、包容審慎的視角去看待技術(shù)的發(fā)展,“負(fù)能”固然存在,“賦能”更為可期,在警惕技術(shù)風(fēng)險(xiǎn)、規(guī)范倫理約束的同時(shí)不斷拓展其與不同產(chǎn)業(yè)的連接點(diǎn),才能在可供、可用、可塑、可信的基礎(chǔ)上實(shí)現(xiàn)可替和可期。
[1] Du HLi ZNiyato Det al. Enabling AI-Generated Content (AIGC) Services in Wireless Edge Networks[J]. arXiv preprint arXiv:2023.
[2] Sonya Huang,Pat Grandy.Generative AI.A Creative New World[EB/OL].https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/.2022-09-19/2023-02-23.
[3] Illia Laura,Colleoni Elanor,Zyglidopoulos Stelios. Ethical implications of text generation in the age of artificial intelligence[J]. Business Ethics, the Environment amp; Responsibility,2022(1):201-210.
[4] Nitzberg MZysman J. Algorithmsdataand platforms: the diverse challenges of governing AI[J]. Journal of European Public Policy,2022(11): 1753-1778.
[5] 蔣俏蕾,張自中.全媒體時(shí)代的決策與素養(yǎng):媒介可供性與分布式認(rèn)知[J].中國(guó)新聞傳播研究,2022(3):120-132.
[6] Kureerung PRamingwong LRamingwong Set al. A Framework for Designing Usability: Usability Redesign of a Mobile Government Application[J]. Information2022(10): 470.
[7] Thompson,A.D..What’s in my Al? A Comprehensive Analysis of Datasets Used to Train GPT-1GPT-2GPT-3GPT-NeoX-20BMega-tron-11B,MT-NLG,and Gopher[EB/OL].https://lifearchitect.ai/whats-in-my-ai/.2022-10-18/2023-02-23.
[8] Vaccari C,Chadwick A. Deepfakes and disinformation: Exploring the impact of synthetic political video on deceptionuncertaintyand trust in news[J]. Social Media+ Society,2020(1): 1-13.
[9] Whittaker LKietzmann T CKietzmann Jet al. “All around me are synthetic faces”: the mad world of AI-generated media[J]. IT Professional,2020(5): 90-99.
[10] Yu PXia ZFei Jet al. A survey on deepfake video detection[J]. Iet Biometrics,2021(6): 607-624.
[11] Illia LColleoni EZyglidopoulos S. Ethical implications of text generation in the age of artificial intelligence[J]. Business Ethicsthe Environment amp; Responsibility,2023(1): 201-210.
[12] Andy B..Exploring 12 Million of the 2.3 Billion Images Used to Train Stable Diffusion’s Image Generator[EB/OL].https://waxy.org/2022/08/exploring-12-million-of-the-images-used-to-train-stable-diffusions-image-generator/.2022-08-30/2023-02-23.
[13] Seth Smalley. Could ChatGPT supercharge 1 narratives?[EB/OL].https://www.poynter.org/ifcn/2023/could-chatgpt-supercharge-1-narratives/?ref=biztoc.com.2023-02-02/2023-02-20.
[14] Yuheng Wu,Yi Mou,Zhipeng Li,Kun Xu. Investigating American and Chinese Subjects’ explicit and implicit perceptions of AI-Generated artistic work[J]. Computers in Human Behavior,2020,104(C).
[15] 蔣忠波,師雪梅,張宏博. 人機(jī)傳播視域下算法新聞可信度的感知研究——基于一項(xiàng)對(duì)大學(xué)生的控制實(shí)驗(yàn)分析[J]. 國(guó)際新聞界,2022(3):34-52.
[16] Frey C B" Osborne M A . The future of employment: How susceptible are jobs to computerisation?[J]. Technological Forecasting and Social Change2017:254-280.
[17]Grace KSalvatier JDafoe Aet al. When will AI exceed human performance? Evidence from AI experts[J]. Journal of Artificial Intelligence Research.2018: 729-754.
[18] 楊逸云.國(guó)內(nèi)外機(jī)器新聞寫作研究進(jìn)程、熱點(diǎn)及展望[J].湖北社會(huì)科學(xué),2022(4) :105-113.
作者簡(jiǎn)介:向安玲(1991-),女,湖北宜昌,中央民族大學(xué)新聞與傳播學(xué)院,講師,研究方向?yàn)槊浇榇髷?shù)據(jù)、智能媒體、網(wǎng)絡(luò)輿論、國(guó)際傳播。
(責(zé)任編輯:李凈)