楊仁文
全球用戶增長速度最快的消費(fèi)級應(yīng)用程序,已經(jīng)從字節(jié)跳動旗下的抖音海外版TikTok,變成美國人工智能公司OpenAI推出的聊天機(jī)器人ChatGPT。這一人工智能對話系統(tǒng)在2022 年11 月30 日上線之后,僅用兩個月時(shí)間,月活用戶就突破1億,并引爆全球?qū)ζ渌诘娜斯ぶ悄埽ˋI)賽道應(yīng)用場景的熱烈討論。
如同蒸汽時(shí)代的蒸汽機(jī)、電氣時(shí)代的發(fā)電機(jī)、信息時(shí)代的計(jì)算機(jī)和互聯(lián)網(wǎng),人工智能(AI)正成為推動人類進(jìn)入智能時(shí)代的決定性力量。全球產(chǎn)業(yè)界充分認(rèn)識到人工智能技術(shù)引領(lǐng)新一輪產(chǎn)業(yè)變革的重大意義,紛紛搶灘布局相關(guān)創(chuàng)新生態(tài),各細(xì)分賽道在持續(xù)創(chuàng)新下變革在即,其中,ChatGPT所在的人工智能生成內(nèi)容(AIGC)領(lǐng)域尤其值得重點(diǎn)關(guān)注。
AIGC,英文全稱為AI-GeneratedContent,指基于生成對抗網(wǎng)絡(luò)(GAN)、大型預(yù)訓(xùn)練模型等人工智能技術(shù),通過已有數(shù)據(jù)尋找規(guī)律,并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。
AIGC的突破進(jìn)展意味著,內(nèi)容生產(chǎn)已經(jīng)從專業(yè)生成內(nèi)容(PGC)、用戶生成內(nèi)容(UGC)時(shí)代,進(jìn)入人工智能生成內(nèi)容時(shí)代。AIGC有望在應(yīng)用領(lǐng)域,成為數(shù)字內(nèi)容創(chuàng)新發(fā)展的新引擎,為數(shù)字經(jīng)濟(jì)發(fā)展注入新能量。因此,其被認(rèn)為是Web3.0的重要基礎(chǔ)設(shè)施。
從技術(shù)場景看,內(nèi)容生成領(lǐng)域?yàn)槲磥鞟IGC的發(fā)展重點(diǎn)。基于不同內(nèi)容模態(tài),我們將AIGC分為文本生成、音頻生成、圖像生成、視頻生成及跨模態(tài)生成等主要細(xì)分場景。其中,底層基礎(chǔ)基本明確的商業(yè)場景,預(yù)計(jì)在未來1-2 年實(shí)現(xiàn)規(guī)?;瘧?yīng)用,為具有快速增長潛力的細(xì)分賽道。
結(jié)合細(xì)分賽道,可將AIGC劃分為內(nèi)容領(lǐng)域及延展領(lǐng)域。其中,內(nèi)容領(lǐng)域目前雖然具備商業(yè)化潛力,但并未有效實(shí)現(xiàn)商業(yè)化,其中存量價(jià)值來自于批量處理同質(zhì)內(nèi)容的降本增效,而增量價(jià)值則來源于跨模態(tài)內(nèi)容生成,以及AI本身帶來的科技感。在該領(lǐng)域,由于發(fā)行商、內(nèi)容最終消費(fèi)渠道具有較強(qiáng)的產(chǎn)業(yè)鏈話語權(quán),我們建議關(guān)注企業(yè)對內(nèi)容渠道的把控力。延展領(lǐng)域則對AIGC的自由度和穩(wěn)定性有更高的技術(shù)要求,本質(zhì)為依托人工智能進(jìn)行定制化及個性化數(shù)字內(nèi)容的自動化創(chuàng)作。
我們認(rèn)為,以下四類場景有明顯增長潛力:個性化內(nèi)容營銷、合成數(shù)據(jù)生成、虛擬陪伴及交互性內(nèi)容(適用于游戲等實(shí)時(shí)變化較大、要求內(nèi)容多樣性的領(lǐng)域)??梢栽谠擃I(lǐng)域下重點(diǎn)關(guān)注企業(yè)數(shù)據(jù)、算法及商業(yè)變現(xiàn)能力。
應(yīng)用場景中,在數(shù)字化程度高且內(nèi)容需求豐富的行業(yè)上,AIGC將帶來顛覆性變革,包括傳媒、電商、影視及娛樂行業(yè)等。
在傳媒領(lǐng)域,AIGC可以通過人機(jī)協(xié)同生產(chǎn),推動媒體融合,例如在采編環(huán)節(jié),實(shí)現(xiàn)采訪錄音語音轉(zhuǎn)寫,提升傳媒工作者的工作體驗(yàn)。在電商領(lǐng)域,AIGC可推進(jìn)虛實(shí)交融,營造沉浸體驗(yàn),例如生成商品3D模型,用于商品展示和虛擬試用,或打造虛擬主播等,提升線上購物體驗(yàn)。在影視領(lǐng)域,AIGC可拓展創(chuàng)作空間,提升作品質(zhì)量,例如賦能影視剪輯,為劇本創(chuàng)作提供思路等。而在娛樂領(lǐng)域,AIGC可擴(kuò)展輻射邊界,獲得發(fā)展動能,例如在視頻社交平臺實(shí)現(xiàn)趣味性圖像或音視頻生成,盤活用戶活躍度。另外,在教育、金融、醫(yī)療及工業(yè)領(lǐng)域等,AIGC可推進(jìn)數(shù)實(shí)融合,加快產(chǎn)業(yè)升級。
在文本生成領(lǐng)域,聊天機(jī)器人(Chatbot)是AIGC核心的應(yīng)用方向,技術(shù)的不斷突破正催化對話式AI產(chǎn)品持續(xù)落地。
1970 年誕生的“Elizzs”,是人類建造的第一個對話機(jī)器人。2000 年前后開發(fā)出來的Alice系統(tǒng),則開始使用人工智能標(biāo)記語言,允許用戶定制聊天內(nèi)容,對話機(jī)器人能按照預(yù)先設(shè)定好的腳本來回答問題。2011年,由IBM基于深度問答(Deep QA)技術(shù)開發(fā)的Watson,能夠利用深度自然語言處理技術(shù),產(chǎn)生候選答案,并交叉驗(yàn)證評估。
2014年,微軟推出“小冰”,此時(shí),對話機(jī)器人產(chǎn)品已可以較為熟練地使用深度學(xué)習(xí)技術(shù)。目前,用于客服、外呼、營銷等環(huán)節(jié)的對話機(jī)器人產(chǎn)品相繼推出,國內(nèi)已有多家AI技術(shù)相關(guān)客服公司成立或?qū)崿F(xiàn)較大的規(guī)模產(chǎn)品方案。
據(jù)市場研究機(jī)構(gòu)Acumen統(tǒng)計(jì),2021 年全球Chatbot市場規(guī)模約為5.21 億美元,預(yù)計(jì)未來9 年年均復(fù)合增長率(CAGR)將為23.7%,2030 年達(dá)到34.11億美元。
截至2022 年8 月,僅FacebookMessenger上已有超過30 萬聊天機(jī)器人。據(jù)艾瑞咨詢數(shù)據(jù),在中國市場,2021年對話式AI核心產(chǎn)品規(guī)模約為45億元,其中軟件產(chǎn)值及服務(wù)產(chǎn)值分別為32 億元及13 億元。預(yù)計(jì)2026 年中國對話式AI核心產(chǎn)品規(guī)模約為108億元。
2022年11月,美國人工智能公司OpenAI上線的聊天機(jī)器人ChatGPT引爆全球。它能夠理解自然的人類語言,并生成類似人類作答的書面文本,不僅可以幫助開發(fā)者解決編碼問題,也能充當(dāng)詩人。起初,任何擁有OpenAI賬號的客戶可以免費(fèi)使用ChatGPT。2023 年2 月,OpenAI推出付費(fèi)版ChatGPT Plus,每月收費(fèi)20美元。OpenAI還計(jì)劃發(fā)布每月收費(fèi)42美元的ChatGPT專業(yè)計(jì)劃(ProfessionalPlan),并在需求低迷時(shí)提供免費(fèi)計(jì)劃。截至2022年12月7日,ChatGPT已擁有超過100萬用戶,這幫助其獲取了大量數(shù)據(jù)。到2023年1月底,ChatGPT的用戶已超過1億,成為迄今為止增長最快的消費(fèi)級應(yīng)用程序。
決定AIGC產(chǎn)出質(zhì)量的三大核心要素,分別是數(shù)據(jù)、算法和算力。數(shù)據(jù)是算法的“飼料”,海量優(yōu)質(zhì)的應(yīng)用場景數(shù)據(jù)是訓(xùn)練算法精確性的關(guān)鍵基礎(chǔ),算法需要通過海量數(shù)據(jù)訓(xùn)練不斷完善。算法是AIGC的“推手”,神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等算法是挖掘數(shù)據(jù)智能的有效方法。算力是“基礎(chǔ)設(shè)施”,計(jì)算機(jī)、芯片等載體為AIGC提供基本的計(jì)算能力。
ChatGPT作為AIGC發(fā)展的里程碑,離不開超級基礎(chǔ)設(shè)施(大算力)下的大模型及大數(shù)據(jù)支撐。GPT-3是OpenAI開發(fā)的一個大型語言預(yù)測和生成模型,能夠生成長序列的原始文本。在GPT-2的150億參數(shù)基礎(chǔ)上,GPT-3將參數(shù)量擴(kuò)大至1750億。在學(xué)界,模型規(guī)模和模型效果呈正相關(guān)關(guān)系為基本共識,但模型規(guī)模擴(kuò)大后,對于CPU的內(nèi)存、計(jì)算能力亦有更高要求。
2020 年,微軟宣布與OpenAI合作,在Azure云中運(yùn)行微軟“AI超級計(jì)算機(jī)”。這個新型超級計(jì)算機(jī)包括超過28.5 萬個CPU內(nèi)核、1 萬個GPU和每個GPU服務(wù)器每秒400GB的網(wǎng)絡(luò)連接。在后續(xù)研究中,OpenAI發(fā)現(xiàn),訓(xùn)練175B的SFT模型需要算力為4.9pflops/s-days,訓(xùn)練175B的PPOptx模型需要60pflops/s-days,訓(xùn)練GPT-3算力消耗約3640pflops/s-days。雖然GPT-3算力成本高昂,但在語言模型RLHF中非常有效,比模型大小增加100倍更加有效。
因此,ChatGPT基于龐大數(shù)據(jù)量進(jìn)行訓(xùn)練的同時(shí),引入了“手動標(biāo)注數(shù)據(jù)+強(qiáng)化學(xué)習(xí)”(RLHF,從人的反饋進(jìn)行強(qiáng)化學(xué)習(xí))來不斷調(diào)整預(yù)訓(xùn)練語言模型。該技術(shù)路徑大幅提升了ChatGPT對人類意圖的理解,從而提升回答信息的準(zhǔn)確性。
ChatGPT具體的訓(xùn)練過程可分為三個階段:一是收集演示數(shù)據(jù)并訓(xùn)練;二是通過人工標(biāo)注訓(xùn)練數(shù)據(jù)來訓(xùn)練回報(bào)模型;三是使用PPO強(qiáng)化學(xué)習(xí)法優(yōu)化回報(bào)模型,根據(jù)回報(bào)模型評分結(jié)果更新預(yù)訓(xùn)練模型的參數(shù)。
雖然ChatGPT“類人化交流”引發(fā)熱議,但由于訓(xùn)練數(shù)據(jù)的缺乏及偏差,ChatGPT仍有缺點(diǎn)與不足,包括出現(xiàn)看似合理但錯誤或荒謬的回答,及無法完全拒絕不合理及不道德的請求等,頗有改進(jìn)空間。
AIGC的興起,源自深度學(xué)習(xí)技術(shù)的快速突破和日益增長的數(shù)字內(nèi)容供給需求,當(dāng)前,其市場潛力逐漸顯現(xiàn)。
結(jié)合人工智能的成長歷程,AIGC賽道的發(fā)展大致可分為三個階段。
早期萌芽階段,為20 世紀(jì)50 年代至90年代中期,受限于科技水平,AIGC僅限于小范圍實(shí)驗(yàn)。
1950 年,艾倫·圖靈發(fā)表了一篇文章《機(jī)器能思考嗎?》,提出著名的“圖靈測試”,并給出了判定機(jī)器是否具有“智能”的試驗(yàn)方法。1957年,美國作曲家萊杰倫·希勒(LejarenHiller)和萊納德·艾薩克森(LeonardIsaacson)將計(jì)算機(jī)程序中的控制變量轉(zhuǎn)換成音符,第一支由計(jì)算機(jī)創(chuàng)作的弦樂四重奏《依利亞克組曲》完成。1966年,世界第一款可人機(jī)對話的機(jī)器人“Eliza”在麻省理工學(xué)院問世,其根據(jù)人工設(shè)計(jì)的腳本與人類交流,沒有語義理解,而是通過模式匹配和智能短語搜索合適的回復(fù)。上世紀(jì)80年代中期,IBM基于隱形馬爾科夫鏈模型(Hidden Markov Model,HMM)創(chuàng)造了語音控制打字機(jī)“Tangora”。此后,由于高昂的系統(tǒng)研發(fā)成本無法帶來相應(yīng)的商業(yè)變現(xiàn),各國政府紛紛減少了在人工智能領(lǐng)域的投入。
中期沉淀積累階段,為20 世紀(jì)90 年代中期至21 世紀(jì)10 年代中期,算力設(shè)備性能提升及海量數(shù)據(jù)基礎(chǔ)下,AIGC從實(shí)驗(yàn)性向?qū)嵱眯赞D(zhuǎn)變,但受限于算法瓶頸,無法直接進(jìn)行內(nèi)容生成。
2006年,深度學(xué)習(xí)算法取得重大突破,同時(shí)期,圖形處理器及張量處理器等算力硬性設(shè)備的性能不斷提升。得益于互聯(lián)網(wǎng)發(fā)展,數(shù)據(jù)規(guī)??焖倥蛎洸槿斯ぶ悄芴峁┝烁哔|(zhì)、海量訓(xùn)練數(shù)據(jù),推動人工智能發(fā)展。2007年,世界第一部完全由人工智能創(chuàng)作的小說《1 The Road》問世。2012年,微軟展示全自動同聲傳譯系統(tǒng),可將英文演講者的內(nèi)容自動翻譯成中文語音。
2010年至今,AIGC步入快速發(fā)展階段。
2014 年,伊恩· 古德費(fèi)洛(lan J.Goodfellow)提出生成式對抗網(wǎng)絡(luò),推動深度學(xué)習(xí)算法的迭代更新。隨后,AIGC百花齊放,產(chǎn)出效果逐漸逼真至接近人類作品。2017 年,微軟“小冰”推出世界首部100%由人工智能創(chuàng)作的詩集《陽光失了玻璃窗》。2018年,英偉達(dá)發(fā)布StyleGAN模型,可以自動生成高質(zhì)量圖片。同年,人工智能生成的畫作在佳士得拍賣行以43.25 萬美元成交,成為首個出售的人工智能藝術(shù)品。2019年,谷歌旗下的DeepMind發(fā)布DVD-GAN模型,用以生成連續(xù)視頻。2021 年,OpenAI推出了DALL-E,主要應(yīng)用于文本與圖像交互生成內(nèi)容。2022年,ChatGPT上線,引發(fā)全球關(guān)注。
相比全球領(lǐng)先企業(yè)的進(jìn)展,中國AIGC產(chǎn)業(yè)仍處萌芽期。據(jù)量子位預(yù)測,AIGC在中國的發(fā)展可分為三個階段。2021-2026 年為助手階段(摸索磨合期),AIGC會輔助人類進(jìn)行生產(chǎn),優(yōu)先變現(xiàn)的關(guān)鍵在于編輯優(yōu)化功能,行業(yè)創(chuàng)新關(guān)鍵能力為素材模塊分拆與個性化推薦。2026-2028年為協(xié)作階段(推廣應(yīng)用期),可實(shí)現(xiàn)人機(jī)共創(chuàng),主要價(jià)值為降本增效及提供創(chuàng)意,預(yù)計(jì)互聯(lián)網(wǎng)大廠將普遍布局,競爭熱度提升。2028年之后為原創(chuàng)階段(價(jià)值增長期),AIGC將獨(dú)立完成內(nèi)容創(chuàng)作,產(chǎn)生附加價(jià)值。
目前,中國AIGC企業(yè)均在初創(chuàng)階段,機(jī)會也許藏在垂直應(yīng)用領(lǐng)域中,對賽道的選擇十分關(guān)鍵。
量子位智庫的研究表明,AIGC在中國大多被作為公司的部分業(yè)務(wù)乃至相對邊緣化的功能進(jìn)行研發(fā),獨(dú)立運(yùn)行的初創(chuàng)公司數(shù)量明顯少于國外,大部分細(xì)分賽道的初創(chuàng)玩家在5家以下。語音合成(TTS)等較為成熟的AIGC能力,大多被綜合性的AI公司打包提供,在應(yīng)用場景上缺乏明確的指向性。另外,底層技術(shù)及產(chǎn)業(yè)應(yīng)用側(cè)的差距,導(dǎo)致中國企業(yè)仍停留在內(nèi)容領(lǐng)域開發(fā),如AI寫作和語音合成領(lǐng)域,虛擬人賽道則剛剛興起。
相比之下,國外企業(yè)則在延展領(lǐng)域進(jìn)行了更為充分的挖掘,例如個性化文本生成、合成數(shù)據(jù)等賽道,均為其重點(diǎn)布局領(lǐng)域。
中外企業(yè)在應(yīng)用進(jìn)展上的差異,除了技術(shù)之外,更大的原因在于此類業(yè)務(wù)拓展的綜合性要求較高,需要需求方有較高的數(shù)字化程度以及供給方對行業(yè)的充分了解,預(yù)計(jì)國內(nèi)外差距短期難以大幅縮小。
從產(chǎn)業(yè)鏈看,我國AIGC產(chǎn)業(yè)還缺失眾多環(huán)節(jié),比如上游的數(shù)據(jù)供給、分拆及標(biāo)注環(huán)節(jié)。產(chǎn)業(yè)鏈中游,我國相關(guān)企業(yè)仍處初創(chuàng)期,垂直賽道值得關(guān)注,優(yōu)秀代表企業(yè)包括文字生成領(lǐng)域的聆心智能、瀾舟科技、彩云科技、秘塔科技及香儂科技等,圖像、音頻及視頻領(lǐng)域的感知階躍、影譜科技、帝視科技及標(biāo)貝科技等,游戲及虛擬人領(lǐng)域的知覺之門、倒映有聲等,綜合領(lǐng)域的紅棉小冰等。產(chǎn)業(yè)鏈下游主要為各類內(nèi)容創(chuàng)作及分發(fā)平臺、第三方分發(fā)渠道及消費(fèi)品廠商等(附圖)。
整體看,國內(nèi)AIGC行業(yè)尚未建立明確的變現(xiàn)方式。以寫作機(jī)器人、自動配音等場景為例,大部分產(chǎn)品仍處在“流量吸引+平臺改良”的免費(fèi)試用階段,變現(xiàn)空間相對較小。此外,據(jù)量子位智庫的研究,由于服務(wù)B端客戶時(shí)話語權(quán)較弱,部分企業(yè)會考慮直接向C端領(lǐng)域延展。但企業(yè)能否在互聯(lián)網(wǎng)流量相對穩(wěn)定的前提下有效接觸C端用戶,并設(shè)計(jì)好產(chǎn)品轉(zhuǎn)化路徑,依舊是一項(xiàng)挑戰(zhàn)。
參考海外企業(yè)的商業(yè)化路徑,我們發(fā)現(xiàn)AIGC相關(guān)企業(yè)的變現(xiàn)方式,主要集中在模型訓(xùn)練、作為底層平臺、產(chǎn)出內(nèi)容、提供軟件服務(wù)等方面。根據(jù)艾瑞咨詢披露的中國對話式AI業(yè)務(wù)占比來看,軟件產(chǎn)值中的私有化部署,包括許可號授權(quán)以及公有云產(chǎn)品(按調(diào)用量/流量收費(fèi)及按訂閱制收費(fèi)),均可成為AIGC企業(yè)核心變現(xiàn)路徑。
總結(jié)來看,中國AIGC產(chǎn)業(yè)發(fā)展的核心困境來自三個層面:其一,關(guān)鍵技術(shù)不夠完全成熟,大規(guī)模推廣落地尚存痛點(diǎn)、難點(diǎn);其二,企業(yè)核心能力參差不齊,威脅網(wǎng)絡(luò)內(nèi)容生態(tài)健康安全發(fā)展;其三,相關(guān)規(guī)范指引尚需完善,發(fā)展與治理之間存在匹配問題。
未來,要把握這一新興賽道的機(jī)遇,可以重點(diǎn)關(guān)注三大關(guān)鍵點(diǎn),包括技術(shù)及產(chǎn)品迭代成熟度、核心場景的確定,以及開源模式的產(chǎn)業(yè)接納態(tài)度。行業(yè)需要關(guān)注的風(fēng)險(xiǎn)包括政策監(jiān)管風(fēng)險(xiǎn)、行業(yè)市場增長的不確定性、競爭環(huán)境不確定性、AIGC企業(yè)商業(yè)化路徑不確定性,以及技術(shù)創(chuàng)新不及預(yù)期等。