畢成良
2024年2月,美國OpenAI公司推出Sora大模型,能根據(jù)文本指令生成具有真人電影畫質(zhì)的模擬3D視頻,其背后與ChatGPT4.0同源的通用大模型基座再次引發(fā)社會熱議。人工智能包含通用人工智能與專用人工智能。長期以來,我國更多注重在工業(yè)、氣象、交通、航空等具體領(lǐng)域的專用人工智能的發(fā)展,美國則致力于研發(fā)能應(yīng)用在所有領(lǐng)域的通用人工智能。從人工智能最新發(fā)展態(tài)勢看,我國應(yīng)進一步加強通用人工智能的研發(fā)與攻關(guān),發(fā)展技術(shù)自主的超大規(guī)模的大模型基座。
(一)大模型的特點與分類
所謂“大模型”(Large Model)實際上是一套使用海量數(shù)據(jù)預(yù)先訓(xùn)練而成的模擬人類神經(jīng)網(wǎng)絡(luò)的知識庫和程序。大模型具有三個特點:預(yù)訓(xùn)練、生成式和大規(guī)模。首先,大模型需要“預(yù)訓(xùn)練”的知識庫。人類把知識與信息轉(zhuǎn)化成海量數(shù)據(jù)來訓(xùn)練大模型,大模型成為能用所有人類語言交互的強大知識庫。其次,大模型能夠自主生成新內(nèi)容的程序。大模型是目前最強大的信息處理和數(shù)據(jù)發(fā)掘工具,可以在不預(yù)先設(shè)定任何規(guī)則的情況下,自主發(fā)現(xiàn)新規(guī)則,并生成和輸出新內(nèi)容。最后,大模型智能水平來自于其硬件與軟件的超大規(guī)模架構(gòu)。大模型的底層架構(gòu)是模擬人腦神經(jīng)細胞和神經(jīng)網(wǎng)絡(luò),每個基本單元的結(jié)構(gòu)與活動都是簡單的,但是860億簡單個體的聚合引發(fā)了智力的涌現(xiàn)。
大模型可根據(jù)預(yù)訓(xùn)練的數(shù)據(jù)規(guī)模和硬件能力分成三個層次,即基礎(chǔ)層、行業(yè)層、應(yīng)用層?;A(chǔ)層是大模型基座(也稱通用大模型),通常具有萬億參數(shù)以上,具有多模態(tài)功能。中間層是行業(yè)大模型,在通用大模型基座之上使用行業(yè)相關(guān)數(shù)據(jù)再次訓(xùn)練而成。應(yīng)用層是垂直行業(yè)的商業(yè)化大模型,大模型基座主要面向個人消費者。大模型基座的“超大規(guī)模”是通用人工智能得以實現(xiàn)的基礎(chǔ)。
(二)通過大模型基座實現(xiàn)通用人工智能具有可行性
2023年之前,業(yè)界對建造大模型基座普遍持懷疑態(tài)度,因為從技術(shù)能力看,搭建大模型采用Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)、核心算法和智算芯片的性能,不過目前這些都沒有得到實質(zhì)性提升。從成本收益來看,通過堆疊超大規(guī)模的芯片,“投喂”海量數(shù)據(jù)的方式實現(xiàn)智能不太現(xiàn)實,需要耗費巨大算力、電力和人力,經(jīng)濟回報也不樂觀。但2023年通用人工智能的發(fā)展態(tài)勢充分說明,通過建造一個規(guī)模巨大的大模型基座來實現(xiàn)通用人工智能(AGI)應(yīng)用的路線在技術(shù)、商業(yè)、文化層面上都是可行的。主要表現(xiàn)如下。
第一,從技術(shù)發(fā)展看,通用人工智能的認知能力正從“量變”轉(zhuǎn)向“部分質(zhì)變”。通用大模型憑借強大的信息處理能力,正從機器學(xué)習(xí)的感知階段走向認知階段。在文字方面,大語言模型可以閱讀、翻譯、潤色、寫作。在語音方面,大模型可以通過聲波的信號分析學(xué)習(xí)語言語音數(shù)據(jù),實現(xiàn)自然語言的識別和語言輸出。在圖像方面,大模型能識別并生成各種風(fēng)格的圖像。在視頻上,視頻大模型Sora則能識別現(xiàn)實世界的物理規(guī)律,構(gòu)建符合真實世界規(guī)律的高仿真模擬視頻。
第二,從產(chǎn)業(yè)金融看,通用人工智能幾乎已成為美國科技界與金融界在未來十年的主攻方向。目前美股市值排名前七的公司均宣布全面進入AI賽道,硅谷有一半創(chuàng)業(yè)企業(yè)圍繞ChatGPT開展業(yè)務(wù)。美國AI產(chǎn)業(yè)格局已基本形成,OpenAI以及微軟公司成為第一梯隊,技術(shù)水平遠超其他同行,谷歌、Mete、特斯拉、亞馬遜、蘋果位于第二梯隊,同時還有Anthropic、Cohere等專業(yè)做大模型的一批小獨角獸企業(yè)作為第三梯隊。美國金融投資界給予AI相關(guān)公司超高估值。
第三,從文教傳媒看,通用人工智能展現(xiàn)出對文化、傳播、教育的強大塑造能力。通用人工智能將要改變?nèi)藗儷@取信息的形式與渠道。作為當前最強大的信息交互手段和知識檢索系統(tǒng),大模型可以進行文字、圖像、音頻、視頻等多模態(tài)交互,將要成為人們習(xí)以為常的數(shù)字內(nèi)容生產(chǎn)與交互的新形式。通用人工智能將改變?nèi)祟惖闹R講述與傳承方式。大模型作為強大的能使用人類自然語言的交互式知識庫,通過動畫、電影、電視劇、3D游戲等方式影響人類的審美觀念,從而影響公眾的價值觀,引導(dǎo)社會輿論。
美國業(yè)界正全面布局通用人工智能賽道(All in AI),希望把通用人工智能作為一項顛覆性技術(shù),以挽回美國經(jīng)濟脫實向虛及產(chǎn)業(yè)空心化的趨勢,展現(xiàn)出“近、中、遠”三步走的路線圖。
第一步是信息產(chǎn)業(yè)界,通用人工智能技術(shù)顛覆性改變現(xiàn)有IT與互聯(lián)網(wǎng)的電子產(chǎn)品,進而掌握未來信息通訊產(chǎn)業(yè)格局及標準。首先是“AI+軟件”。大模型將重構(gòu)現(xiàn)有大部分應(yīng)用產(chǎn)品的交互方式和使用體驗,形成以通用AI為核心的搜索、辦公、編程等一系列工作與生活軟件生態(tài)系統(tǒng)。其次是“AI+終端設(shè)備”。AI版的操作系統(tǒng)將存在于所有電子設(shè)備中,催生新一代的AI手機、AI電腦以及可穿戴設(shè)備和游戲裝備。這個趨勢如同2010年智能手機淘汰上一代的功能手機時一樣。最后是“AI+6G通訊”。未來AI大模型基座將賦能網(wǎng)絡(luò),實現(xiàn)與電信網(wǎng)、衛(wèi)星互聯(lián)網(wǎng)、智能汽車互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的融合對接。
第二步是文化媒體界,通用人工智能技術(shù)將重塑文化傳播與知識獲取方式。一是“AI+社交媒體”。當AI操作系統(tǒng)的手機電腦被普遍使用,AI將重塑獲取、傳播和利用知識的方式。二是“AI+教育”。AI將極大拓寬文化傳播渠道和豐富文化傳播方式。三是“AI+科研”。未來超級AI有望在量子科學(xué)、生物科學(xué)、新材料、核聚變等方面成為科學(xué)家的超級助手。
第三步是工業(yè)產(chǎn)業(yè)界,通用人工智能技術(shù)將顛覆現(xiàn)有工業(yè)生產(chǎn)邏輯,引領(lǐng)智能時代的工業(yè)革命。一是“AI+通用機器人”。通用人工智能使人形機器人能聽懂人類語言,與人實時交互,應(yīng)對復(fù)雜場景。通用人工智能將深刻變革人類的生產(chǎn)生活方式。二是“AI+工業(yè)制造”。人形機器人可以承擔流水線工作,而工業(yè)領(lǐng)域的大模型能夠成為超級工程師,“一個模型,萬種應(yīng)用”,自動分析各行業(yè)的具體問題,顯著縮短設(shè)計和檢驗時間,優(yōu)化生產(chǎn)流程,消除重復(fù)性勞動,提高生產(chǎn)效率和質(zhì)量。
通用大模型產(chǎn)業(yè)的特點是:高層次頂尖人才的投入大,創(chuàng)投科技業(yè)態(tài)發(fā)展靈活,與半導(dǎo)體產(chǎn)業(yè)聯(lián)系緊密,與文化輿論國際傳播高度關(guān)聯(lián)。在上述方面我國還面臨一些挑戰(zhàn)。
(一)現(xiàn)階段全面部署大模型基座對我國半導(dǎo)體與信息產(chǎn)業(yè)具有一定挑戰(zhàn)
我國大模型與美國在模型、算力、數(shù)據(jù)源方面存在一定差距。2023年我國人工智能行業(yè)雖號稱有“百模大戰(zhàn)”,但我國大模型多專注于某具體行業(yè)與垂直領(lǐng)域。在模型架構(gòu)方面,我國互聯(lián)網(wǎng)大廠的大模型多數(shù)是圍繞自身業(yè)務(wù)場景,并且是利用自身行業(yè)知識在國外開源大模型的基礎(chǔ)上訓(xùn)練出來的。在算力方面,我國互聯(lián)網(wǎng)行業(yè)較為依賴英偉達公司的GPU智算芯片及CUDA開發(fā)框架系統(tǒng)。在美國“算力削減”政策打壓之下,AI高端芯片價格非常昂貴,而且被限制采購。在數(shù)據(jù)方面,我國數(shù)據(jù)源的規(guī)模較少、質(zhì)量較低且處理能力較弱,能對大模型需要的海量數(shù)據(jù)進行清洗、加工、處理的產(chǎn)業(yè)鏈還未健全。
(二)發(fā)展通用大模型產(chǎn)業(yè)對我國創(chuàng)新體制提出更高要求
在人才方面,國內(nèi)創(chuàng)業(yè)環(huán)境對高層次技術(shù)人才的吸引力還有待優(yōu)化,國內(nèi)對如何培養(yǎng)和使用頂尖人才尚未達成社會共識。在市場機制方面,原創(chuàng)性創(chuàng)新的生態(tài)體系不健全,缺乏共享軟件的社群文化,制約了創(chuàng)新型企業(yè)群體的涌現(xiàn)。在資金方面,通用大模型基座投入巨大,商業(yè)回報率低,依靠社會力量投資進行大模型基座建設(shè)的機會或已錯失。
(三)通用大模型將對國家數(shù)據(jù)和文化安全帶來挑戰(zhàn)
在數(shù)據(jù)安全方面,人工智能本身也可能成為破壞網(wǎng)絡(luò)安全和管理的工具。用戶把個人信息“投喂”給大模型,這些數(shù)據(jù)中可能包含用戶的大量敏感信息,容易出現(xiàn)數(shù)據(jù)竊取或者“數(shù)據(jù)投毒”風(fēng)險。在文化安全方面,我國面臨更加復(fù)雜的國際輿論環(huán)境。AI給自媒體提供了強大技術(shù)工具,能夠?qū)⒄`導(dǎo)信息、敏感內(nèi)容與真實信息無縫銜接,各國的歷史文化可能被隨意曲解。人類知識庫也面臨被惡意篡改的風(fēng)險。
我國發(fā)展人工智能要形成兩個共識。一是通用人工智能與專用人工智能兩者不能彼此替代,我國必須發(fā)展自己的通用人工智能。二是發(fā)展通用人工智能,必須扎實地從超大規(guī)模的通用大模型基座做起。
(一)在大模型基座方面,發(fā)揮新型舉國體制優(yōu)勢,抓住通用大模型基座“牛鼻子”,形成新質(zhì)生產(chǎn)力
參與主體方面,鑒于當前商業(yè)投資大模型的成功率很小,應(yīng)當從國家層面重點支持2-3家單位,研發(fā)與搭建通用大模型基座。其他科研機構(gòu)、企業(yè)應(yīng)當緊密配合,多措并舉,多路并行,致力構(gòu)建基礎(chǔ)大模型的具體細分方向。從智算芯片的生產(chǎn)、人工智能的開發(fā)框架、大模型底層架構(gòu)設(shè)計等關(guān)鍵環(huán)節(jié)入手,力爭實現(xiàn)自主創(chuàng)新和突破。扎實做好超大規(guī)模大模型基座的基礎(chǔ)研究,鼓勵科研機構(gòu)以及企業(yè),尋找Transformer主流架構(gòu)之外的新架構(gòu)與核心算法,找到更加節(jié)能高效智能的大模型設(shè)計方案。
(二)在AI基礎(chǔ)設(shè)施方面,構(gòu)建國產(chǎn)智能算力芯片全產(chǎn)業(yè)鏈,為實體經(jīng)濟提供堅實算力底座
培養(yǎng)技術(shù)自主的國產(chǎn)算力與芯片生態(tài),包括GPU智算芯片、HBM高帶寬內(nèi)存、AI光通信模塊等。完善以算力為核心的人工智能基礎(chǔ)設(shè)施建設(shè),打造覆蓋全國的公共算力網(wǎng)絡(luò),建設(shè)國家級智能算力中心,為千行百業(yè)賦能,提供充足的廉價的公共算力,降低中小企業(yè)的算力成本,更好打造智能化制造的基礎(chǔ)底座,驅(qū)動制造業(yè)智能化轉(zhuǎn)型。
(三)在AI應(yīng)用市場方面,把開放創(chuàng)新作為培育人工智能生態(tài)體系的必由之路,營造良好的中小企業(yè)創(chuàng)新創(chuàng)業(yè)生態(tài)
通用人工智能在商業(yè)應(yīng)用市場的繁榮發(fā)展與創(chuàng)新要依靠廣大中小企業(yè)。應(yīng)兼顧“閉源”和“開源”兩種發(fā)展路徑,培育以公共開源為中心的產(chǎn)品生態(tài),促進產(chǎn)業(yè)生態(tài)圈的健康發(fā)展。開源大模型有利于中小企業(yè)共享技術(shù)紅利,為行業(yè)應(yīng)用開發(fā)和開源生態(tài)提供低成本技術(shù)支撐,吸引外部人才參與項目協(xié)作,改進相關(guān)技術(shù),共享知識成果,共同推動各種參數(shù)規(guī)模、技術(shù)架構(gòu)、模態(tài)、場景的大模型應(yīng)用。
(四)在數(shù)據(jù)與科研方面,推動大模型與基礎(chǔ)科研結(jié)合,發(fā)展高質(zhì)量數(shù)據(jù)產(chǎn)業(yè)鏈
國家大力支持數(shù)據(jù)類企業(yè)做好大模型預(yù)訓(xùn)練的數(shù)據(jù)集,知識庫和底層數(shù)據(jù)清理工作,以高質(zhì)量數(shù)據(jù)助力大模型迭代升級。建立公共教育大模型平臺和權(quán)威開放的知識交流平臺,處理好數(shù)據(jù)安全、數(shù)據(jù)治理與數(shù)據(jù)開發(fā)利用三者之間的平衡關(guān)系。構(gòu)建以人工智能支撐基礎(chǔ)和前沿科學(xué)研究的新模式,加速我國科學(xué)研究范式變革和能力提升。
(五)在安全與治理方面,推進人工智能治理的國際合作,保障數(shù)據(jù)安全、網(wǎng)絡(luò)安全與文化安全
加強風(fēng)險研判,開發(fā)針對大模型的數(shù)據(jù)防護技術(shù),避免數(shù)據(jù)被不當使用或泄露,保護國家安全、公民隱私和個人權(quán)利。注重和加強全球合作,協(xié)同制定標準和制度規(guī)則,有效防控人工智能帶來的科技倫理風(fēng)險。
(作者單位:中國國際經(jīng)濟交流中心)