◎ 楊明川 胡 婕
提 要:ChatGPT是由美國頂尖AI實(shí)驗(yàn)室OpenAI開發(fā)的一個基于大語言模型的聊天機(jī)器人。與之前的大型語言模型相比,ChatGPT實(shí)現(xiàn)了兩個跨越,即從“玩具”到“工具”的跨越,從學(xué)術(shù)研究到生產(chǎn)力賦能的跨越。預(yù)計(jì)未來五到十年,ChatGPT會像電腦和手機(jī)一樣成為大眾的隨身工具,成為人人必備的功能強(qiáng)大的智能助手。
從整體來看,中美在 AI 基礎(chǔ)技術(shù),尤其是超大規(guī)模模型技術(shù)上的差距在增大。當(dāng)然,ChatGPT也不是萬能的,它在中文能力、安全隱私方面也存在不足,這為國內(nèi)發(fā)展自主大模型提供了機(jī)會。
ChatGPT是由美國頂尖AI實(shí)驗(yàn)室OpenAI開發(fā)的一個基于大語言模型的聊天機(jī)器人,是在3000億單詞的語料基礎(chǔ)上訓(xùn)練出的參數(shù)量為1750億的大語言模型。該模型代表了當(dāng)前人工智能在人機(jī)對話和文本生成領(lǐng)域的最高水平。在ChatGPT推出僅兩個月后,它在2023年1月末的月活用戶已經(jīng)突破了1億,平均每天大約有1300萬人在使用ChatGPT服務(wù),其成為史上面向消費(fèi)者用戶增長速度最快的應(yīng)用程序。
ChatGPT實(shí)現(xiàn)了兩個跨越,即從“玩具”到“工具”的跨越,從學(xué)術(shù)研究到生產(chǎn)力賦能的跨越。相較于GPT-2/3等傳統(tǒng)大模型在問答任務(wù)中經(jīng)常出現(xiàn)的生搬硬套、答非所問、偏離常識等問題,ChatGPT的智能程度實(shí)現(xiàn)了跨越式提高,并具備了一定的“思考力”。具體表現(xiàn)為ChatGPT具備更豐富的專業(yè)領(lǐng)域知識、更強(qiáng)大的數(shù)學(xué)運(yùn)算能力、更強(qiáng)的信息整合能力、可以輸出更加準(zhǔn)確和類人的答案。相較于微軟小冰、蘋果Siri、百度小度等主流對話產(chǎn)品,ChatGPT能夠在一定程度上解決專業(yè)問題,為人類“做有價值的工作”,如實(shí)現(xiàn)自動軟件代碼編寫、查找軟件代碼漏洞、生成營銷文案、回答數(shù)學(xué)問題,甚至撰寫學(xué)術(shù)論文等。ChatGPT讓機(jī)器大規(guī)模涉足知識類和創(chuàng)造性的工作,對部分文字工作者、方案策劃師、程序員、客服人員等的工作內(nèi)容具有替代潛力,未來預(yù)計(jì)能夠產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價值。
由此可見,ChatGPT極大降低了人類使用AI的門檻,其問世是AI產(chǎn)業(yè)發(fā)展的里程碑事件,可類比于瀏覽器對于互聯(lián)網(wǎng)的意義,掀起AI的革命新浪潮。正如比爾·蓋茨將ChatGPT的誕生類比于互聯(lián)網(wǎng)和個人電腦的誕生,可以預(yù)計(jì),未來五到十年,ChatGPT會像電腦和手機(jī)一樣成為大眾的隨身工具,成為人人必備的功能強(qiáng)大的智能助手。
與谷歌、OpenAI、百度等公司之前推出的大模型相比,為了解決傳統(tǒng)大模型的性能瓶頸,ChatGPT創(chuàng)新性地融合多種AI技術(shù),使得模型表現(xiàn)有了質(zhì)的提升。主要技術(shù)包括:1)人類反饋強(qiáng)化學(xué)習(xí)。該技術(shù)通過強(qiáng)化學(xué)習(xí)將人類的反饋?zhàn)饔糜谀P陀?xùn)練的過程,從輸出的整體層面進(jìn)行優(yōu)化,讓AI模型的輸出和人類的認(rèn)識、需求、價值觀保持一致;2)指令微調(diào)。通過將NLP任務(wù)轉(zhuǎn)換為一系列自然語言指令的形式,再將其用于模型的訓(xùn)練;3)代碼訓(xùn)練,該技術(shù)將程序代碼作為輸入數(shù)據(jù),對模型進(jìn)行訓(xùn)練。
從效果上看,ChatGPT充分解鎖了大模型在四個方面的潛力,在人機(jī)對話中取得驚艷表現(xiàn):1)理解和響應(yīng)人類指令,充分理解人類的意圖;2)利用思維鏈進(jìn)行多步推理,能夠在一定程度上解決復(fù)雜的專業(yè)性問題;3)建模超長歷史對話,能夠充分利用上下文信息,作出更準(zhǔn)確的回答;4)回答從未見過的問題。
中國雖已推出諸如百度文心等多種大語言模型,但是它們在模型表現(xiàn)上與ChatGPT 相比依然存在較大差距。目前來看,短時間內(nèi)國內(nèi)難以誕生能與ChatGPT比肩的大模型。整體來看,中美在AI基礎(chǔ)技術(shù),尤其是超大規(guī)模模型技術(shù)上的差距在增大。
中美差距主要體現(xiàn)在三個方面:1)工程化能力:大模型作為黑盒,其調(diào)優(yōu)周期長、難度大,要使得大模型實(shí)現(xiàn)對數(shù)據(jù)的充分吸收與利用,需要有更多新技術(shù)引入到大模型技術(shù)框架中。OpenAI沒有開源GPT-3之后的模型,國內(nèi)研究機(jī)構(gòu)對于大模型的工程化經(jīng)驗(yàn)積累不足,導(dǎo)致短期內(nèi)難以企及ChatGPT的性能;2)國內(nèi)缺乏大規(guī)模高質(zhì)量數(shù)據(jù):目前AI產(chǎn)業(yè)使用的數(shù)據(jù)集多由國外提供,而ChatGPT的成功建立在海量數(shù)據(jù)集和專業(yè)語料庫的基礎(chǔ)上,并且持續(xù)吸收真實(shí)用戶對話反饋,構(gòu)建用戶調(diào)用和模型迭代的飛輪,而國內(nèi)公司缺乏這方面的積累;3)AI芯片與算力上處于劣勢:支撐ChatGPT模型的訓(xùn)練與在線并發(fā)運(yùn)行的是超大體量的智算中心,國外高端AI芯片的限供,增加了國產(chǎn)大模型提升的難度;此外,國內(nèi)在AI芯片領(lǐng)域與美國相比存在較大的差距,進(jìn)一步限制著國內(nèi)大模型的發(fā)展空間。
整體來看,中美在 AI 基礎(chǔ)技術(shù),尤其是超大規(guī)模模型技術(shù)上的差距在增大。圖/中新社
差距現(xiàn)象背后深層次的原因在于,國內(nèi)缺乏催生大模型的創(chuàng)新土壤。國內(nèi)投資環(huán)境相對“急躁”,在ChatGPT出現(xiàn)之前,大模型作為“難而慢”、盈利模式不清晰的研究方向,在國內(nèi)未得到長期持續(xù)的大規(guī)模資金投入,而OpenAI不以盈利為目的,更有“毅力”堅(jiān)持在大模型上的長期研究,量變引起質(zhì)變,最終促成了ChatGPT的爆發(fā)。
ChatGPT使AI能力變得像水、電一樣,成為標(biāo)準(zhǔn)化、規(guī)?;?、流程化、低成本的產(chǎn)物,有望被廣泛作為AI 能力的共用底座使用,成為 AI 新型基礎(chǔ)設(shè)施。主要因?yàn)樗鼭M足高度通用、低成本、可大規(guī)模應(yīng)用的三個條件。首先,ChatGPT展現(xiàn)出更高的通用性,使它可以靈活、穩(wěn)定地提供AI 能力。如果電只能供給電燈使用,則它將永遠(yuǎn)無法成為主流。同理,在 ChatGPT 和專用的小模型表現(xiàn)差異不大的前提下,ChatGPT 廣泛流行的關(guān)鍵在于它可以應(yīng)用于多項(xiàng)任務(wù)。其次,ChatGPT 降低了 AI 能力獲取的成本。對于絕大多數(shù)開發(fā)者而言,基于ChatGPT進(jìn)行二次開發(fā)的性價比遠(yuǎn)高于從零開始搭建專用模型。最后,ChatGPT激活了大量的AI潛在需求,未來使用 ChatGPT 進(jìn)行生產(chǎn)、創(chuàng)作的從業(yè)者預(yù)計(jì)將會井噴式增長,規(guī)模應(yīng)用的前景樂觀。
與此同時,我們也要看到由于研發(fā)大語言模型對資金、數(shù)據(jù)和工程化能力等條件的要求極高,將只有少數(shù)的組織或者公司可以進(jìn)入該領(lǐng)域。據(jù)最新測算,在公有云上從頭開始訓(xùn)練和ChatGPT體量相當(dāng)?shù)哪P?,需要約140萬美金。極高的自研成本將迫使絕大多數(shù)企業(yè)放棄自研轉(zhuǎn)向采購,也使得大模型提供商需要收取費(fèi)用以平衡成本與收益。目前,ChatGPT采用軟件作為服務(wù)(SaaS)的商業(yè)模式,大致以兩種形式提供:1) 提供API 數(shù)據(jù)接口,執(zhí)行自然語言處理任務(wù),按生成的字符數(shù)收費(fèi); 2) ChatGPT Plus提供服務(wù)器忙碌時段優(yōu)先響應(yīng)等特權(quán),并收取20 美元/人/月的訂閱服務(wù)費(fèi)。
ChatGPT作為底層的基礎(chǔ)模型,扮演著類似“瑞士軍刀”的角色,可以直接為B/C端用戶提供具備一定專業(yè)水平的內(nèi)容。然而在專業(yè)程度要求較高的場景,模型生成的內(nèi)容可能無法直接滿足用戶訴求,需要進(jìn)行二次加工。這一差距催生出“中間件”的廣泛機(jī)會。ChatGPT中間件的開發(fā)商以實(shí)際應(yīng)用場景為目標(biāo),通過優(yōu)化整合的方式挖掘大模型的潛力、優(yōu)化大模型的產(chǎn)出,使得大模型能夠提供專業(yè)程度更高的AI能力。
大模型中間件已探索出較為成熟的商業(yè)模式,典型案例如 Jasper.AI 基于 GPT-3的接口提供付費(fèi)文檔生成服務(wù),可實(shí)現(xiàn)75%的毛利率。然而中間件的最優(yōu)策略可能是依托垂直行業(yè)的數(shù)據(jù),形成細(xì)分專業(yè)上的比較優(yōu)勢。
例如在軟件開發(fā)領(lǐng)域,ChatGPT在代碼編寫任務(wù)上的生產(chǎn)力將直接對行業(yè)形成巨大沖擊。未來軟件開發(fā)很可能采取這樣的模式:大模型直接承擔(dān)簡單模塊代碼編寫和調(diào)試工作,程序員在模型結(jié)果的基礎(chǔ)上略作修改,并提交給資深架構(gòu)師。進(jìn)一步地,涌現(xiàn)吃透細(xì)分場景業(yè)務(wù)的“中間件”工具,使資深程序員可以監(jiān)督和指導(dǎo)大模型直接產(chǎn)生系統(tǒng)級代碼,并快速投產(chǎn)。
事實(shí)上代碼生產(chǎn)領(lǐng)域早已有大模型的實(shí)踐。過去一年時間,使用人工智能的程序員中,基于大模型的Copilot程序處理的編碼量高達(dá) 40%。換句話說,每 100 行代碼里,有 40 行就是由人工智能編寫的,項(xiàng)目總時間最多可減少 55%。而ChatGPT的出現(xiàn)將進(jìn)一步加速代碼自動化、智能化進(jìn)程。
國內(nèi)外科技巨頭正在積極跟進(jìn),瞄準(zhǔn)下一代 AI 生態(tài)的主導(dǎo)權(quán)。圖/中新社
ChatGPT作為AI通用基礎(chǔ)設(shè)施,使其在未來AI領(lǐng)域的發(fā)展中將扮演類似于手機(jī)操作系統(tǒng)的角色,提供AI大模型的公司將成為未來AI生態(tài)的主導(dǎo)者。為此,國內(nèi)外巨頭如谷歌、微軟、蘋果和百度等公司面對 ChatGPT 的橫空出世,紛紛采取積極措施,搶占大語言模型的戰(zhàn)略高地。谷歌公司于2023年2月7日發(fā)布下一代對話AI系統(tǒng)Bard,以應(yīng)對ChatGPT對搜索引擎業(yè)務(wù)構(gòu)成的威脅;微軟將ChatGPT等工具整合進(jìn)旗下包括Bing、Office在內(nèi)的所有產(chǎn)品中;百度2023年3月推出大模型新項(xiàng)目文心一言(英文名ERNIE Bot);阿里巴巴也計(jì)劃推出類ChatGPT大模型并深度集成到釘釘中。
ChatGPT并非全能,受訓(xùn)練語料的時間限制,它無法回答最新(2021年6月后)的問題;另外,ChatGPT對自身答案的正確性無法進(jìn)行驗(yàn)證,所以針對專業(yè)性問題的判斷仍需人類專家的協(xié)同。
ChatGPT不受限制的使用也引發(fā)人們對其安全性的擔(dān)憂,主要集中在知識產(chǎn)權(quán)、信息安全與非法使用三個方面。在知識產(chǎn)權(quán)方面,ChatGPT被廣泛用于專業(yè)文檔和代碼的生成工作,引發(fā)知識產(chǎn)權(quán)侵犯及歸屬的爭議。在信息安全方面,用戶的隱私信息可能通過交互行為被模型捕獲,進(jìn)而泄露給其他使用者。事實(shí)上,OpenAI公司也重點(diǎn)提示用戶不要在聊天過程中暴露隱私信息。在非法使用方面,ChatGPT被用于輔助編寫網(wǎng)絡(luò)釣魚代碼、勒索軟件等非法用途,帶來安全隱患。因此,需要加強(qiáng)監(jiān)管,使ChatGPT得到安全、合法的使用。