2月21日,國(guó)內(nèi)AI公司深度求索(DeepSeek)發(fā)布“開(kāi)源周”計(jì)劃,從2月24日開(kāi)始,每日開(kāi)源新內(nèi)容,總共5個(gè)代碼庫(kù)。一系列重磅炸彈,攪得開(kāi)源社區(qū)好不熱鬧。
而在更早前,百度已經(jīng)來(lái)了一個(gè) 180 度轉(zhuǎn)彎。
2月13日,百度宣布聊天機(jī)器人“文心一言”于4月1日起免費(fèi)。2月14日,百度又宣布文心大模型4.5系列陸續(xù)推出,6月30日正式開(kāi)源。
在開(kāi)源的DeepSeek面向大眾之前,百度一直是閉源模型和收費(fèi)服務(wù)的擁護(hù)者。
然而,連人工智能領(lǐng)頭羊OpenAI也扛不住壓力,早一步拋出“免費(fèi)加開(kāi)源”消息;一眾互聯(lián)網(wǎng)巨頭如英偉達(dá)、亞馬遜、微軟均將DeepSeek模型集成到自家平臺(tái);一堆做“DeepSeek入口”的應(yīng)用也趁機(jī)撈了一把流量,包括不缺流量的支付寶和微信。
百度的轉(zhuǎn)變并不是一個(gè)孤立事件。
受DeepSeek的開(kāi)源“刺激”,全球人工智能大模型競(jìng)爭(zhēng)技術(shù)路線(xiàn),逐漸有開(kāi)源壓倒閉源之勢(shì)。開(kāi)源和閉源并沒(méi)有絕對(duì)的優(yōu)劣之分,只是當(dāng)市場(chǎng)上出現(xiàn)顛覆者后,原先的主導(dǎo)者失去閉源的盈利護(hù)城河,不得不借“開(kāi)源盛世”來(lái)擴(kuò)張生態(tài)。
這場(chǎng)由DeepSeek引發(fā)的效率革命,標(biāo)志著大模型競(jìng)爭(zhēng)進(jìn)入“后暴力計(jì)算時(shí)代”:模型效率取代絕對(duì)性能,成為核心競(jìng)爭(zhēng)力;同時(shí),全球AI權(quán)力秩序被重構(gòu),美國(guó)“一家獨(dú)大”霸權(quán)遭到削弱。
在后浪推前浪的趨勢(shì)下,未來(lái)的勝出者將是平衡駕馭二者的“變色龍”,既通過(guò)開(kāi)源獲取生態(tài)勢(shì)能,也利用閉源實(shí)現(xiàn)價(jià)值捕獲。
DeepSeek“以小博大”,顛覆了人工智能大模型玩家的舊格局。
監(jiān)測(cè)網(wǎng)站Similarweb數(shù)據(jù)顯示,2025年1月,DeepSeek網(wǎng)站的訪(fǎng)問(wèn)量環(huán)比增長(zhǎng)2257%,單月訪(fǎng)問(wèn)量達(dá)2.78億次,雖然與ChatGPT高達(dá)38億次的訪(fǎng)問(wèn)量還有不小差距,但依然超過(guò)了蘋(píng)果iCloud、Salesforce等大公司網(wǎng)站。
OpenAI最先亂了陣腳,不斷開(kāi)放新功能“挽尊”。
1月31日,放出推理模型o3-mini。2月3日,搜索網(wǎng)頁(yè)提煉文獻(xiàn)的深度研究(Deep Research)上線(xiàn)。2月5日,帶有網(wǎng)頁(yè)搜索功能的ChatGPT面向所有用戶(hù)開(kāi)放。
2月13日,CEO薩姆·奧特曼在社交媒體宣布下一代AI大模型路線(xiàn)圖,GPT-5大模型基礎(chǔ)版將對(duì)ChatGPT免費(fèi)用戶(hù)無(wú)限量開(kāi)放。ChatGPT的付費(fèi)訂閱者中,Plus版、Pro版訂閱者可以解鎖更“聰明”的GPT-5。模型功能將包含語(yǔ)音、Canvas(寫(xiě)作、編碼工具)、搜索、深度研究等。
幾乎同時(shí),百度也打出“免費(fèi)加開(kāi)源”牌。先是PC端聊天應(yīng)用“文心一言”和移動(dòng)端應(yīng)用“文小言”將于4月1日起全面免費(fèi),文心大模型4.5也將在6月30日開(kāi)源。
環(huán)球同此涼熱,巨頭也擔(dān)心“下課”。
OpenAI和百度齊齊從閉源轉(zhuǎn)向開(kāi)源,原因比較接近:二者都是人工智能模型領(lǐng)域的先行者和主導(dǎo)者,本來(lái)可以靠閉源和收費(fèi)來(lái)賺錢(qián)。如今DeepSeek物特別美、價(jià)尤其廉、人民群眾十分喜歡,他們?cè)俪险{(diào)就真的賺不到錢(qián)了。
在美國(guó),靠ChatGPT一舉成名的OpenAI,最早推出收費(fèi)模式。2022年11月ChatGPT免費(fèi)上線(xiàn),2023年2月便推出20美元/月的Plus會(huì)員。2024年5月GPT-4o面世,12月推出200美元/月的Pro版本。
ChatGPT至今有4個(gè)收費(fèi)計(jì)劃,Team、Enterprise面向企業(yè),Plus、Pro面向個(gè)人。Plus可以使用OpenAI全部模型,也可以創(chuàng)建GPTs;Pro用戶(hù)在Plus的權(quán)益之外,還可以使用今年1月剛推出的智能體功能Operator(操作員)。
在中國(guó),百度較早入局人工智能大模型領(lǐng)域。2021年7月推出文心大模型3.0,2023年3月推出聊天機(jī)器人“文心一言”。2023年6月,文心大模型升級(jí)到3.5版本。10月,文心大模型4.0版本發(fā)布。2024年6月,4.0 Turbo發(fā)布。
據(jù)百度稱(chēng),2024年文心大模型日均調(diào)用量超過(guò)15億次,較2023年增長(zhǎng)超30倍。
2023年11月,百度文心一言推出付費(fèi)會(huì)員模式,連續(xù)包月價(jià)格為49.9元/月,會(huì)員可以使用2023年10月發(fā)布的、目前仍是百度最新的模型文心一言4.0,此外還有圖片生成、網(wǎng)頁(yè)插件等權(quán)益。
中國(guó)其他大模型公司也有收費(fèi)模式。智譜AI的聊天機(jī)器人智譜清言,連續(xù)包月價(jià)格為19元/月,可解鎖最新模型的無(wú)限次使用、視頻生成等功能;月之暗面旗下的Kimi智能助手有打賞功能,但并未綁定使用權(quán)益。
總體來(lái)看,在人工智能大模型本身就存在開(kāi)源路線(xiàn)、Meta的開(kāi)源大模型Llama實(shí)力雄厚的情況下,閉源模型并不存在高枕無(wú)憂(yōu)的護(hù)城河。
開(kāi)源的DeepSeek一問(wèn)世,“頭鐵”的OpenAI、百度就不得不“順勢(shì)而為”了。
開(kāi)源和閉源的“源”,指的是“源代碼”。開(kāi)放源代碼,允許其他開(kāi)發(fā)者使用、傳播,技術(shù)可以持續(xù)改進(jìn)?!伴_(kāi)源”理念源自20世紀(jì)90年代開(kāi)發(fā)者社區(qū)。
“戰(zhàn)爭(zhēng)”是埃隆·馬斯克挑起來(lái)的。2024年2月,作為OpenAI的創(chuàng)始人和最早投資人之一,馬斯克起訴OpenAI違背創(chuàng)始協(xié)議、追逐商業(yè)利益,將AI大模型閉源。OpenAI反唇相譏,稱(chēng)馬斯克早就認(rèn)可其“追逐商業(yè)利益”。
當(dāng)年3月,馬斯克將旗下大模型Grok-1開(kāi)源,以此證明自己“并非逐利”。一個(gè)月后,Meta發(fā)布Llama3系列模型,是當(dāng)時(shí)最強(qiáng)大的開(kāi)源大模型。原本閉源的谷歌也有點(diǎn)坐不住了, 2024年2月發(fā)布開(kāi)源模型系列Gemma。
美國(guó)的開(kāi)源模型陣營(yíng),對(duì)閉源的生成式預(yù)訓(xùn)練模型GPT窮追不舍。業(yè)界普遍認(rèn)為閉源模型的能力把開(kāi)源模型甩開(kāi)“一年半左右”。
在中國(guó),由于算力受到阻礙,開(kāi)源還是閉源的討論很少。2024年,百度創(chuàng)始人、CEO李彥宏多次表示,“模型開(kāi)源的意義其實(shí)不是很大”“開(kāi)源模型會(huì)越來(lái)越落后”。
也有一些公司選擇開(kāi)源路線(xiàn)。
金沙江創(chuàng)投主管合伙人朱嘯虎的言論“不會(huì)投資中國(guó)的基座大模型創(chuàng)業(yè)公司”曾激起熱議,他認(rèn)為開(kāi)源大模型隨時(shí)會(huì)顛覆閉源基座模型。阿里云先后開(kāi)源多個(gè)模型;創(chuàng)業(yè)公司里,零一萬(wàn)物、百川智能、面壁智能都在打造開(kāi)源模型。
中國(guó)各地方政府支持的實(shí)驗(yàn)室或研究所也聚焦開(kāi)源大模型,包括科技部和北京市政府支持成立的智源研究院,深圳市政府主導(dǎo)的鵬城實(shí)驗(yàn)室,上海市政府主導(dǎo)的上海AI實(shí)驗(yàn)室,以及粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院等。
雖然開(kāi)源模型和閉源模型還有一定差距,但隨著技術(shù)路線(xiàn)的清晰和開(kāi)源技術(shù)的迭代,開(kāi)源和閉源的差距將不斷縮小、直至拉平。
但堅(jiān)持“閉源更好”的百度,當(dāng)時(shí)的判斷是,開(kāi)源并不便宜,且技術(shù)會(huì)越發(fā)落后,“開(kāi)源模型沒(méi)有商業(yè)模式”。這一判斷基于三個(gè)條件:一是算力和工程能力門(mén)檻高,只有科技大廠才有實(shí)力主導(dǎo)開(kāi)源模型;二是研發(fā)成本高,傳統(tǒng)開(kāi)源軟件的商業(yè)模式“沒(méi)錢(qián)可燒”;三是閉源模型通過(guò)程序接口(API)調(diào)用,可供企業(yè)部署軟件。
DeepSeek“異軍突起”,恰恰證明這三個(gè)條件并不完全成立。
而且,百度期待的“企業(yè)級(jí)客戶(hù)”也興趣寥寥。因?yàn)閿?shù)據(jù)是企業(yè)最寶貴的資源,一旦放在大廠平臺(tái)上,日后是否真正屬于自己就不好說(shuō)了。移動(dòng)互聯(lián)網(wǎng)時(shí)代的“像素級(jí)復(fù)制”,曾給中國(guó)創(chuàng)業(yè)者最沉重的打擊。
論中國(guó)互聯(lián)網(wǎng)三巨頭BAT,阿里是押注開(kāi)源的典型代表。2022年11月,阿里發(fā)布了中文AI大模型開(kāi)源社區(qū)“魔搭”(Model Scope)。通義千問(wèn)模型也是開(kāi)源的。2023年8月以來(lái),阿里云先后開(kāi)源和更新了數(shù)十個(gè)參數(shù)版本的模型。
騰訊的“混元大模型”去年選擇開(kāi)源,其公開(kāi)說(shuō)法是,經(jīng)過(guò)一年多的探索,在閉源模式下將產(chǎn)品和技術(shù)積累到一定程度后,才選擇了開(kāi)源。
2025年初,DeepSeek第一次令中國(guó)企業(yè)看到了開(kāi)源模式的商業(yè)價(jià)值和影響力、看到了產(chǎn)業(yè)格局變化的可能性、看到了生態(tài)開(kāi)放的沖擊力—技術(shù)民主化的拐點(diǎn)已經(jīng)到來(lái)。
“最后”,百度選擇開(kāi)源。
互聯(lián)網(wǎng)時(shí)代,一貫存在“巨頭守成”加“新銳破局”的競(jìng)爭(zhēng)。
由于“新銳”DeepSeek的顛覆性沖擊,巨頭OpenAI立刻作出“免費(fèi)”反應(yīng),隨即產(chǎn)生了傳導(dǎo)效應(yīng)—GPT-4o免費(fèi)后,中國(guó)AI初創(chuàng)公司的API調(diào)用成本下降30%,百度隨之失去了收費(fèi)壁壘。而OpenAI的閉源數(shù)據(jù)飛輪仍在加速,其日均新增訓(xùn)練數(shù)據(jù)量動(dòng)輒是中國(guó)企業(yè)的5倍以上,技術(shù)代差可能進(jìn)一步拉大。
對(duì)于AI企業(yè)而言,開(kāi)源或閉源只是一種發(fā)展手段,不是什么“絕對(duì)理想”。
要理解開(kāi)源模型和閉源模型的核心差異,可以從基礎(chǔ)條件、技術(shù)原理、應(yīng)用場(chǎng)景、可營(yíng)利性和局限性等五個(gè)維度來(lái)觀察。
從基礎(chǔ)條件看,開(kāi)源模型以公開(kāi)數(shù)據(jù)集、社區(qū)貢獻(xiàn)數(shù)據(jù)為數(shù)據(jù)來(lái)源,以分布式的、開(kāi)發(fā)者自有的GPU集群為算力支撐,開(kāi)發(fā)主體是社區(qū)協(xié)作者,比如GitHub的開(kāi)發(fā)者,需要處理開(kāi)源協(xié)議兼容性,存在一些合規(guī)成本。
閉源模型以專(zhuān)有數(shù)據(jù)如用戶(hù)行為日志、私有數(shù)據(jù)庫(kù)、清洗后公開(kāi)數(shù)據(jù)為數(shù)據(jù)來(lái)源,靠集中式的超算中心為算力支撐,開(kāi)發(fā)主體是企業(yè)級(jí)團(tuán)隊(duì),需要承擔(dān)數(shù)據(jù)隱私、版權(quán)訴訟風(fēng)險(xiǎn)等合規(guī)成本,像紐約時(shí)報(bào)就因數(shù)據(jù)來(lái)源跟OpenAI打過(guò)官司。
光看成本,還是開(kāi)源模型省錢(qián)。Meta的Llama2訓(xùn)練成本約250萬(wàn)美元,OpenAI的GPT-4依賴(lài)微軟Azure算力,單次訓(xùn)練成本超1億美元。
從技術(shù)原理看,開(kāi)源模型的架構(gòu)多為稠密Transformer(注意力機(jī)制深度學(xué)習(xí)模型)變體,訓(xùn)練方法為公開(kāi)強(qiáng)化學(xué)習(xí)框架,靠社區(qū)反饋迭代,靠外部審查保障安全,比如抱臉(Hugging Face)的模型掃描。
閉源模型的架構(gòu)為融合私有架構(gòu),像GPT-4是稀疏化MoE(混合專(zhuān)家模型),訓(xùn)練方法為定制化強(qiáng)化學(xué)習(xí),靠用戶(hù)交互數(shù)據(jù)實(shí)時(shí)反哺迭代,內(nèi)置內(nèi)容過(guò)濾機(jī)制。
閉源模型在稀疏激活(激活極少比例參數(shù)處理每個(gè)Token)和多模態(tài)對(duì)齊(文本—圖像—代碼聯(lián)合表征)領(lǐng)域,領(lǐng)先開(kāi)源模型1.5—2年左右。
從應(yīng)用場(chǎng)景看,開(kāi)源模型可以為企業(yè)做私有化部署,模型剪裁后進(jìn)行邊緣計(jì)算,在手機(jī)端運(yùn)行,可以為社區(qū)貢獻(xiàn)數(shù)據(jù)。閉源模型可以為企業(yè)提供標(biāo)準(zhǔn)化SaaS服務(wù),在云端進(jìn)行計(jì)算和推理,依賴(lài)商業(yè)價(jià)值導(dǎo)向來(lái)處理長(zhǎng)尾需求。
像彭博基于開(kāi)源Llama做了一個(gè)金融領(lǐng)域模型,成本降低了70%。Salesforce Einstein GPT直接調(diào)用了GPT-4的API,開(kāi)發(fā)CRM(客戶(hù)關(guān)系管理)工具。
從收入差異看,開(kāi)源模型靠技術(shù)服務(wù)—模型優(yōu)化和部署賺錢(qián),但定價(jià)受社區(qū)生態(tài)制約,邊際成本會(huì)隨著用戶(hù)增長(zhǎng)而攤?。ㄩ_(kāi)發(fā)者貢獻(xiàn)算力),護(hù)城河則來(lái)自生態(tài)規(guī)模,像“抱臉”積累了15萬(wàn)個(gè)模型。
閉源模型靠訂閱費(fèi)用賺錢(qián),壟斷定價(jià)權(quán),邊際成本則隨用戶(hù)線(xiàn)性增長(zhǎng)而上升(云計(jì)算資源被消耗),護(hù)城河來(lái)自技術(shù)代差。
開(kāi)源模型一般5—7年才能盈利,靠開(kāi)發(fā)出售Linux套件的Red Hat就是例子。閉源模型3年內(nèi)就能實(shí)現(xiàn)正向現(xiàn)金流,OpenAI在2023年?duì)I收超16億美元。
從局限性看,開(kāi)源模型的迭代比較慢,有合規(guī)風(fēng)險(xiǎn)和安全漏洞,一旦開(kāi)發(fā)者流失就失去了可持續(xù)性。閉源模型由于存在技術(shù)黑箱,無(wú)法修改底層模型,很難針對(duì)性?xún)?yōu)化,數(shù)據(jù)隱私問(wèn)題和單點(diǎn)故障也很難解決,還面臨高資本的開(kāi)支壓力。
開(kāi)源模型最大的限制就是生態(tài)碎片化。閉源模型則無(wú)力克服技術(shù)鎖死效應(yīng)。
實(shí)際上,開(kāi)源與閉源并非對(duì)立,二者可能構(gòu)成AI進(jìn)化的雙螺旋結(jié)構(gòu):開(kāi)源加速技術(shù)民主化,閉源推動(dòng)商業(yè)可持續(xù)性。
未來(lái)的勝出者將是平衡駕馭二者的“變色龍”,既通過(guò)開(kāi)源獲取生態(tài)勢(shì)能,也利用閉源實(shí)現(xiàn)價(jià)值捕獲。