2025年春節(jié)的前一周,節(jié)日氣氛正濃,來(lái)自中國(guó)杭州的一家初創(chuàng)公司開始讓華爾街投資人寢食難安。
杭州量化私募機(jī)構(gòu)幻方旗下的大模型公司DeepSeek(深度求索)發(fā)布的一款開源AI模型,在多項(xiàng)測(cè)試中表現(xiàn)優(yōu)于OpenAI的產(chǎn)品,且研發(fā)成本不到600萬(wàn)美元。更讓華爾街投資人震驚的是,DeepSeek1月20日發(fā)布R1模型,上線六天后同時(shí)登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天內(nèi),累計(jì)下載量已突破1600萬(wàn)次。隨后在2月1日突破3000萬(wàn)大關(guān),成為史上最快達(dá)成這一里程碑的應(yīng)用。
華爾街的擔(dān)憂在于,目前投入數(shù)十億美元用于構(gòu)建大型AI模型的做法可能會(huì)打水漂,更廉價(jià)的替代方案將讓華爾街人工智能的泡沫破裂。泡沫破裂帶來(lái)的資本市場(chǎng)危機(jī)短期內(nèi)是否會(huì)再次上演?
到了春節(jié)前一天,這種擔(dān)憂氣氛開始達(dá)到頂峰。1月27日晚間,美股科技巨頭股價(jià)集體下跌:英偉達(dá)股價(jià)下跌約17%,市值蒸發(fā)近6000億美元,創(chuàng)下美國(guó)股市歷史上最大單日市值跌幅紀(jì)錄。博通公司股價(jià)下跌17%,AMD下跌6%,微軟下跌2%。美股指數(shù)當(dāng)日下跌:納斯達(dá)克綜合指數(shù)跌3.07%,標(biāo)普500指數(shù)跌1.46%。人工智能領(lǐng)域的衍生品,如電力供應(yīng)商也受到重創(chuàng)。美國(guó)聯(lián)合能源公司股價(jià)下跌21%,Vistra的股價(jià)下跌29%。
1月27日之后英偉達(dá)股價(jià)在震蕩中回升。老虎國(guó)際數(shù)據(jù)顯示,2月13日英偉達(dá)股價(jià)為135.29美元,較前一交易日上漲3.16%。但這可能不是一次簡(jiǎn)單的技術(shù)性調(diào)整,目前沒有明確的整體持續(xù)回調(diào)趨勢(shì)。
相對(duì)于美股投資者,全球AI產(chǎn)業(yè)界的視角心態(tài)更加復(fù)雜微妙。短暫慌亂和研判之后,中美主流廠商先后拿出了表態(tài)和新的動(dòng)作。
最開始,慌亂情緒蔓延。有大模型公司陷入恐慌情緒,有人反思為何這樣的創(chuàng)新沒有發(fā)生在自己的公司里,有人為新方向出現(xiàn)而興奮,準(zhǔn)備“大干一場(chǎng)”。
很快,新的布局開始了。曾經(jīng)占據(jù)開源模型主導(dǎo)地位的Meta,在過(guò)去幾個(gè)月要求技術(shù)團(tuán)隊(duì)加班加點(diǎn),復(fù)刻DeepSeek路徑。全球大模型領(lǐng)域最知名的公司OpenAI也調(diào)整了模型發(fā)布策略,不再“擠牙膏”。
各大科技廠商(包括亞馬遜AWS、微軟Azure、谷歌云、阿里云、華為云、騰訊云、百度智能云等)在模型商店中迅速上線了開源版的DeepSeek-V3/R1這兩款模型。因?yàn)槠髽I(yè)客戶對(duì)DeepSeek-V3/R1的需求旺盛,此舉可以為科技云廠商帶來(lái)算力收入。
1月29日,阿里云發(fā)布了開源的通義千問Qwen 2.5-Max MoE(混合專家模型),它使用了和DeepSeek-R1類似的技術(shù)路線。谷歌2月5日上線自研大模型Gemini 2.0,推出和DeepSeek-R1功能類似的思維鏈功能。OpenAI CEO(首席執(zhí)行官)薩姆·奧爾特曼2月13日宣布,GPT-4.5/5將很快發(fā)布,ChatGPT將搭載GPT-5,并可無(wú)限制免費(fèi)對(duì)話。百度一度是“閉源模型+模型收費(fèi)”的擁躉,堅(jiān)持不做開源模型,但2月14日百度宣布了一系列動(dòng)作——文心一言4月1日起免費(fèi),未來(lái)數(shù)月推出文心大模型4.5系列,6月30日開源文心大模型。
整體來(lái)說(shuō),它們選擇兩條腿走路——
一方面是擁抱DeepSeek,另一方面是跟進(jìn)技術(shù)方案類似的自研產(chǎn)品。
DeepSeek的開源如同鯰魚,改變了科技大廠們的既定動(dòng)作。過(guò)去,科技廠商對(duì)大模型是否要開源存在大量爭(zhēng)論.如今,國(guó)內(nèi)科技大廠如阿里、騰訊、百度已經(jīng)全部選擇加入開源陣營(yíng)。這意味著曾經(jīng)試圖靠模型收費(fèi)的商業(yè)模式不再成立。
一級(jí)投資市場(chǎng)的反應(yīng)更快,春節(jié)假期還沒結(jié)束,不少投資人已經(jīng)開始四處尋找門路,但“連DeepSeek核心團(tuán)隊(duì)的面都見不到”。更多投資人意識(shí)到這家公司可能不開放融資后,快速調(diào)整策略,大量機(jī)構(gòu)組團(tuán)去杭州約見其他的科技公司,一些在2024年認(rèn)為AI創(chuàng)業(yè)公司估值太高、風(fēng)險(xiǎn)太高的投資人重新燃起熱情,“害怕錯(cuò)過(guò)”的情緒再次蔓延。
不同行為、不同態(tài)度的背后是復(fù)雜的資本、技術(shù)、人才和市場(chǎng)等因素交織作用?!敦?cái)經(jīng)》綜合采訪調(diào)研結(jié)果顯示,DeepSeek帶給中美產(chǎn)業(yè)界的巨大轉(zhuǎn)變有兩點(diǎn)。
其一,人們此前普遍認(rèn)為,大模型的關(guān)鍵突破都在美國(guó),其他國(guó)家都是在反向工程。DeepSeek打破了這一刻板共識(shí),成為近20年來(lái)第一個(gè)拿出革命性方案的中國(guó)創(chuàng)業(yè)公司。人工智能時(shí)代目前仍處于發(fā)展初期,DeepSeek激發(fā)全行業(yè)找到一張階段性新地圖,發(fā)展AI技術(shù)的另一個(gè)解法——并非一味地追求算力膨脹。這意味著在美國(guó)對(duì)中國(guó)實(shí)施算力封鎖的當(dāng)下,中美AI企業(yè)重新站到了一個(gè)新的競(jìng)爭(zhēng)維度上,一個(gè)樂觀的判斷是,雙方差距將快速拉近。
其二,此前全球的AI競(jìng)爭(zhēng)的焦點(diǎn)在于訓(xùn)練,產(chǎn)業(yè)界普遍認(rèn)為推理很重要,但這個(gè)過(guò)程會(huì)很漫長(zhǎng),不是現(xiàn)在。DeepSeek把時(shí)間節(jié)點(diǎn)提前了。當(dāng)產(chǎn)業(yè)界將競(jìng)爭(zhēng)焦點(diǎn)集中到推理,除了算力成本革命性下降,對(duì)整個(gè)AI行業(yè)還有更加深刻的影響——硬軟件協(xié)同會(huì)進(jìn)一步加強(qiáng),基于大模型技術(shù)的千行百業(yè)應(yīng)用將大發(fā)展,而不是僅僅對(duì)話模型了。馬上,人們不僅能看到整個(gè)行業(yè)從芯片、服務(wù)器、算力中心到終端、能源的產(chǎn)業(yè)劇烈變化,還能看到基于大模型技術(shù)的各種應(yīng)用出現(xiàn)百花齊放的局面。
DeepSeek沒有根本改變大模型的經(jīng)濟(jì)規(guī)律,只是持續(xù)成本降低曲線上一個(gè)可預(yù)期的成功。這次的不同之處在于,這是一個(gè)中國(guó)創(chuàng)業(yè)公司
最早注意到DeepSeek并將這家公司推到臺(tái)前的是硅谷科技圈。
2024年6月,據(jù)當(dāng)?shù)孛襟w報(bào)道,多位美國(guó)AI領(lǐng)域?qū)<叶急硎緦?duì)中國(guó)的AI大模型印象深刻,其中包括DeepSeek-V2模型,報(bào)道稱,這款模型在一系列標(biāo)準(zhǔn)的行業(yè)評(píng)估中擊敗了OpenAI的GPT-4 Turbo、谷歌的Gemini 1.5 Pro和Anthropic的Claude 3 Opus。當(dāng)時(shí)就已經(jīng)有不少美國(guó)行業(yè)人士認(rèn)為,中國(guó)的生成式AI起步雖然較晚,但差距比很多人想象的要小。
2024年12月底,剛剛過(guò)完圣誕節(jié)的硅谷科技圈就開始了對(duì)DeepSeek的全面研究。
2024年12月28日,DeepSeek V3模型發(fā)布后的第三天,OpenAI創(chuàng)始人薩姆·奧爾特曼在社交媒體評(píng)論稱,DeepSeek能夠以低價(jià)算力提供這樣的服務(wù)令人驚訝。OpenAI將暫停一些新的發(fā)布,擁有一個(gè)新競(jìng)爭(zhēng)對(duì)手令他感到興奮。
1月31日,他在Reddit論壇回復(fù)網(wǎng)友問題時(shí)提到,DeepSeek的出現(xiàn)改變了過(guò)去幾年OpenAI遙遙領(lǐng)先的情況。
2月7日,OpenAI宣布公開最新模型o3-mini系列模型的思維鏈(并非完整版),即讓用戶看到模型是如何推理思考的,而此前,出于競(jìng)爭(zhēng)考慮,OpenAI沒有完全公開o3-mini及其前身(o1和o1-mini)的推理步驟,僅向用戶提供推理摘要。
DeepSeek對(duì)美國(guó)資本市場(chǎng)帶來(lái)了沖擊,甚至引發(fā)了美國(guó)政策制定者、硅谷科技巨頭及創(chuàng)業(yè)公司的關(guān)注。
美國(guó)總統(tǒng)特朗普1月27日在邁阿密發(fā)表講話時(shí)稱,DeepSeek模型高效且經(jīng)濟(jì),其出現(xiàn)是一種積極的發(fā)展,也給美國(guó)相關(guān)產(chǎn)業(yè)敲響了警鐘。美國(guó)需要集中精力贏得競(jìng)爭(zhēng)。
微軟首席執(zhí)行官薩提亞·納德拉1月27日在瑞士達(dá)沃斯世界經(jīng)濟(jì)論壇表示,應(yīng)當(dāng)非常、非常認(rèn)真地對(duì)待來(lái)自中國(guó)的這些技術(shù)進(jìn)展。
Anthropic是亞馬遜投資的一家AI創(chuàng)業(yè)公司,它是OpenAI的直接競(jìng)爭(zhēng)對(duì)手。Anthropic CEO達(dá)里奧·阿莫代伊(Dario Amodei)1月撰文稱,一個(gè)公正的說(shuō)法是,DeepSeek生產(chǎn)出了一款性能接近美國(guó)七個(gè)至十個(gè)月前模型的模型。它的成本大幅降低,但遠(yuǎn)未達(dá)到人們所說(shuō)的比例。DeepSeek-V3并非一項(xiàng)獨(dú)特的突破,也沒有根本改變大模型的經(jīng)濟(jì)規(guī)律。它只是持續(xù)成本降低曲線上一個(gè)可預(yù)期的成功。但這次不同之處在于,第一個(gè)降低預(yù)期成本的是中國(guó)公司。這在以前從未發(fā)生過(guò),并且具有地緣政治意義。
一位曾在硅谷和歐洲從事多年科技投資的人士向《財(cái)經(jīng)》評(píng)價(jià),DeepSeek之所以能在美國(guó)科技圈引發(fā)地震,主要有三方面因素:一是DeepSeek本身的技術(shù)進(jìn)步,用低成本實(shí)現(xiàn)高性能,且不斷有新的優(yōu)化版本出現(xiàn);二是開源,過(guò)去中國(guó)在世界科技領(lǐng)域的信任度是被美國(guó)所限制的,但開源是透明的,透明就意味著信任,且開源意味著大家都能用,越多人用,就越多人相信這個(gè)模型的實(shí)力;第三,DeepSeek的出現(xiàn),顛覆了美國(guó)科技公司對(duì)AI領(lǐng)域的預(yù)設(shè),他們開始反思并調(diào)整動(dòng)作。“我們?cè)欢日J(rèn)為AI是一座大山,大家努力往上頂爬,現(xiàn)在或許應(yīng)該思考,AI可能是大海,有很多方向可以探索?!?/p>
DeepSeek帶來(lái)的影響不止在美國(guó)科技圈,前述投資人提到,近期所有的相關(guān)會(huì)議里,DeepSeek都變成了最重要的議題。歐洲和印度的一些創(chuàng)業(yè)者和投資人,過(guò)去認(rèn)為大模型是只有中國(guó)和美國(guó)能做的事,他們不太敢投入,現(xiàn)在大家都好像有了底氣,也都在嘗試進(jìn)入這一領(lǐng)域。
在中國(guó),此前大模型行業(yè)主要有兩類玩家,一是科技大廠們,包括字節(jié)跳動(dòng)、百度、阿里巴巴、騰訊、華為等,它們大多擁有相對(duì)完整的AI生態(tài),戰(zhàn)略上重視大模型,人才儲(chǔ)備和資金實(shí)力強(qiáng)大。二是AI創(chuàng)業(yè)公司,最具代表性的是“六小虎”——智譜AI、百川智能、月之暗面、Minimax、階躍星塵、零一萬(wàn)物,它們都拿到了巨額融資,各有發(fā)展側(cè)重。
這個(gè)春節(jié),DeepSeek狂潮的出現(xiàn),兩類玩家陷入壓力之中。
所有大廠中,字節(jié)旗下的豆包感受到的沖擊感相對(duì)強(qiáng)烈。在DeepSeek出現(xiàn)之前,豆包App是中國(guó)活躍用戶量最高的生成式AI應(yīng)用。多位字節(jié)人士曾告訴《財(cái)經(jīng)》,字節(jié)對(duì)大模型的投入“不設(shè)限”,幾乎是字節(jié)內(nèi)部的“一號(hào)工程”。整個(gè)豆包團(tuán)隊(duì),包括研發(fā)、解決方案和商務(wù),人員數(shù)量約2000人-3000人,且不少人員都是加了50%甚至1倍的薪資,從其他大廠里挖來(lái)的。字節(jié)對(duì)于大模型業(yè)務(wù)的要求是要做到“全面領(lǐng)先”。
豆包用高成本堆積的C端領(lǐng)先優(yōu)勢(shì),被DeepSeek用一個(gè)月的時(shí)間超過(guò)了。2月5日,DeepSeek移動(dòng)端上線26天,日活用戶數(shù)突破4000萬(wàn)。前述字節(jié)人士表示,在B端用戶那里,DeepSeek起到了很好的推廣效應(yīng),近期有不少企業(yè)主動(dòng)來(lái)要求推動(dòng)豆包AI合作。但提到對(duì)C端應(yīng)用的影響,他說(shuō),“內(nèi)部打擊不小。”
多位行業(yè)人士提到,大廠很難做出突破性創(chuàng)新,更常見的路徑是,小團(tuán)隊(duì)做出成果,大廠再通過(guò)投資、收購(gòu),或是復(fù)制、優(yōu)化的方式來(lái)跟進(jìn),并擴(kuò)大創(chuàng)新的商業(yè)價(jià)值。
另一大型科技公司的一位中層人員向《財(cái)經(jīng)》提到,以目前AI技術(shù)的進(jìn)程來(lái)看,AI領(lǐng)域里還有很多未知的可能性,但他所在公司的管理層早早就下了判斷,包括“不卷模型,要卷應(yīng)用”“閉源才是未來(lái),開源價(jià)值不大”等。且公司定期會(huì)有員工考試,考試的題目就包含了這些判斷,員工必須“答對(duì)”。公司認(rèn)為這樣能夠?qū)崿F(xiàn)“戰(zhàn)略對(duì)齊”。
但從現(xiàn)在的局面來(lái)看,他覺得有點(diǎn)“被打臉了”。
大廠雖然人才儲(chǔ)備豐富,但涉及多項(xiàng)業(yè)務(wù)和層級(jí),層級(jí)匯報(bào)、不同業(yè)務(wù)部門的溝通協(xié)作都會(huì)消耗時(shí)間精力。DeepSeek的母公司幻方做的是量化投資,是天然的AI大模型應(yīng)用場(chǎng)景,業(yè)內(nèi)認(rèn)為,技術(shù)研發(fā)和應(yīng)用場(chǎng)景的聯(lián)動(dòng),是有效提升技術(shù)實(shí)力的方式之一。前述大廠人士提到,他所在的核心業(yè)務(wù)部門曾多次向大模型團(tuán)隊(duì)提出合作,但都沒有收到積極反饋。
DeepSeek出圈后,大量客戶在詢問云廠商的一線銷售人員,DeepSeek何時(shí)可以上架。過(guò)去,銷售人員為了業(yè)績(jī)通常會(huì)對(duì)客戶說(shuō),自家模型表現(xiàn)最好。如今,客戶質(zhì)疑隨之而來(lái),一線銷售人員很難回答這個(gè)問題。
銷售人員把這些質(zhì)疑也拋給了技術(shù)團(tuán)隊(duì)——為什么你們無(wú)法開發(fā)出客戶真正需要的技術(shù)?某國(guó)際云廠商的一位中國(guó)區(qū)銷售人士向《財(cái)經(jīng)》評(píng)價(jià),自家模型在公開測(cè)評(píng)中得分與DeepSeek差距很大。這款去年底發(fā)布的自研大模型曾被寄予厚望,但如今已悄無(wú)聲息。這家云廠商的銷售人員私下已經(jīng)開始了小范圍的討論和反思,這些復(fù)盤并未上升到公司層面。
類似情況在一家中國(guó)頭部云廠商內(nèi)部也存在。一位中國(guó)頭部云廠商架構(gòu)師最近壓力很大,現(xiàn)有的模型不如DeepSeek-R1,但客戶又對(duì)R1非常感興趣。前線的壓力逐漸傳遞到了后方產(chǎn)研團(tuán)隊(duì)。產(chǎn)研團(tuán)隊(duì)可以承認(rèn)DeepSeek的技術(shù)創(chuàng)新,卻不愿承認(rèn)自己技不如人。
對(duì)比大廠,創(chuàng)業(yè)公司相對(duì)更靈活也更扁平,但有其他阻力。
一家成立超過(guò)七年的AI公司創(chuàng)始人很佩服DeepSeek敢于投入的勇氣。他的感受是,雖然業(yè)內(nèi)很多公司都拿到高融資,宣稱大舉投入,但實(shí)際很少有創(chuàng)業(yè)公司真正花了大價(jià)錢去做大模型的基礎(chǔ)研發(fā)。“大家花的不是自己的錢,燒這種量級(jí)的錢還是謹(jǐn)慎的?!?/p>
此前,一位英偉達(dá)的長(zhǎng)期合作伙伴告訴《財(cái)經(jīng)》,過(guò)去兩年密集購(gòu)買英偉達(dá)GPU的中國(guó)公司主要是自身有業(yè)務(wù)需求的大廠,包括阿里巴巴、騰訊、字節(jié)跳動(dòng)、百度等,創(chuàng)業(yè)公司很少。有一些知名大模型創(chuàng)業(yè)公司會(huì)主動(dòng)要求和他建立戰(zhàn)略合作關(guān)系,以此來(lái)對(duì)外證明自己在投入算力,“不給錢的那種”。
大模型太燒錢,即使是以低成本著稱的DeepSeek在前期的投入也很難估量。第三方機(jī)構(gòu)SemiAnalysis推算,DeepSeek實(shí)際擁有龐大的算力儲(chǔ)備:共堆砌了6萬(wàn)張英偉達(dá)GPU卡,其中包括1萬(wàn)張A100、1萬(wàn)張H100、1萬(wàn)張“特供版”H800以及3萬(wàn)張“特供版”H20。
按照行業(yè)傳統(tǒng),中國(guó)AI創(chuàng)業(yè)公司還有一個(gè)大掣肘因素——?jiǎng)?chuàng)業(yè)公司拿到融資后,就不得不去考慮股東回報(bào),這需要逐步抬高公司估值,而估值越高,IPO(首次公開募股)的時(shí)間表就越緊急。這意味著,一個(gè)AI創(chuàng)業(yè)公司拿不到融資甚至沒理由活下去,但一旦拿到第一筆融資,就被上了發(fā)條,為了上市而草草商業(yè)化。
大模型領(lǐng)域?qū)λ懔蛿?shù)據(jù)的高投入,一度被認(rèn)為是影響創(chuàng)業(yè)公司估值的障礙。一方面,創(chuàng)業(yè)公司很難在這些投入上和大廠抗衡,投入看不到上限。另一方面,這會(huì)讓創(chuàng)業(yè)公司變成一家重資產(chǎn)公司。
大多數(shù)中國(guó)科技公司一開始就會(huì)將重心放在閉源模型上,因?yàn)樾袠I(yè)的普遍預(yù)判是AI商業(yè)化應(yīng)用主要集中在B端,而核心的企業(yè)客戶需要閉源模型,甚至需要本地化部署。
物理AI仿真系統(tǒng)開發(fā)商松應(yīng)科技CEO聶凱旋告訴《財(cái)經(jīng)》,DeepSeek的開源模式一定程度上規(guī)避了這個(gè)矛盾。開源比閉源的模式成本低且進(jìn)步速度快,“DeepSeek沒有做特別多架構(gòu)性的創(chuàng)新,應(yīng)該說(shuō)它是在借鑒開源的基礎(chǔ)上,對(duì)模型能力做了比較陡峭的升級(jí)”。
無(wú)論大公司小公司,之前要贏,是高成本的贏;現(xiàn)在,所有人都有可能低成本贏,這是生態(tài)的本質(zhì)
DeepSeek兩款模型V3/R3是開源的,任何人都可以下載、部署、使用,這也是它能夠快速獲得討論度的核心原因之一。
大年初一,正在丈母娘家吃團(tuán)圓飯的華為工程師張飛飛(化名)被拉進(jìn)一個(gè)電話會(huì),新的動(dòng)作在這次會(huì)上被部署:“準(zhǔn)備安排加班,我們現(xiàn)在就要開始接入DeepSeek V3?!彼奶旌螅袌F(tuán)隊(duì)成員就位。他們的目標(biāo)是一季度就要完成所有的適配工作。
阿里云資深工程師徐陵(化名)所在團(tuán)隊(duì)在年前就已經(jīng)多次開會(huì)討論了。他透露,2025年開年以來(lái)自己“所有工作都是在圍著DeepSeek轉(zhuǎn)?!彼u(píng)價(jià),DeepSeek的技術(shù)路線并不是獨(dú)一無(wú)二的,各家大廠都有類似的產(chǎn)品,但DeepSeek目前展示出的工程能力確實(shí)很強(qiáng)。所謂工程能力,包括但不僅限于訓(xùn)練成本效率、模型性能和技術(shù)創(chuàng)新能力。
工作量陡然加大,徐陵覺得很累,但重拾久違的信心。阿里云現(xiàn)有大模型的云業(yè)務(wù)也有自研AI芯片。他向《財(cái)經(jīng)》表示,在美國(guó)數(shù)次加碼國(guó)產(chǎn)GPU的算力封鎖之后,自家芯片為了合規(guī)已經(jīng)不得不主動(dòng)降低了算力和制程,這讓他一度沮喪,認(rèn)為中美之間AI差距在加大,但是DeepSeek的技術(shù)路線證明了較低算力芯片也有可能做出同樣先進(jìn)的模型效果。
短短十余天,百余家中國(guó)公司已經(jīng)宣布“接入DeepSeek”,覆蓋從芯片、算力服務(wù)商到AI用戶到最終用戶各級(jí)生態(tài)圈。
另一個(gè)新變化是,一些科技公司里閑置的服務(wù)器重新跑了起來(lái)?!拔覀児疽慌旁趲?kù)房吃灰的CPU服務(wù)器,以前從沒想過(guò)還能和AI扯上什么關(guān)系,現(xiàn)在也能帶得動(dòng)大模型了?!蔽挥谏虾K山瓍^(qū)的某云服務(wù)公司的一位技術(shù)人士告訴《財(cái)經(jīng)》,此前大模型應(yīng)用開發(fā)的成本太高了,他認(rèn)為DeepSeek帶來(lái)的大幅降低開發(fā)門檻的趨勢(shì)將會(huì)推動(dòng)產(chǎn)業(yè)向前一大步。
一家中國(guó)芯片設(shè)計(jì)公司已經(jīng)準(zhǔn)備將原定于2026年推出的新產(chǎn)品發(fā)布提前到今年,希望接住DeepSeek帶來(lái)的國(guó)產(chǎn)算力的機(jī)會(huì)。
開源也讓DeepSeek迅速形成產(chǎn)業(yè)生態(tài)——芯片廠商、云廠商、軟件廠商都在主動(dòng)接入或適配DeepSeek。
芯片公司第一時(shí)間擁抱了DeepSeek。包括英偉達(dá)、AMD這些國(guó)際芯片廠商,華為昇騰、百度昆侖芯、海光這幾家國(guó)產(chǎn)芯片廠商也迅速適配DeepSeek,為其專門優(yōu)化Al推理。芯片是AI行業(yè)發(fā)展中最重要的基礎(chǔ)設(shè)施,一個(gè)樸素的經(jīng)濟(jì)學(xué)理論是:技術(shù)進(jìn)步和效率提升雖然能夠降低某資源在單個(gè)領(lǐng)域的使用強(qiáng)度,但最終的結(jié)果是該資源的總消費(fèi)量反而會(huì)增加。
云廠商一直是大模型推廣應(yīng)用的直接受益者,它們?cè)敢馍霞芩袩衢T模型??蛻羰褂肈eepSeek等模型時(shí)會(huì)消耗算力、數(shù)據(jù),進(jìn)而帶動(dòng)其他基礎(chǔ)云產(chǎn)品(計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、軟件)的銷售。因此,包括美國(guó)三大云廠商(亞馬遜AWS、微軟Azure、谷歌云)、中國(guó)科技云廠商(阿里云、華為云、騰訊云、火山引擎、百度智能云、中國(guó)電子云)、電信運(yùn)營(yíng)商(天翼云、移動(dòng)云、聯(lián)通云)都迅速上架了DeepSeek。
軟件公司同樣愿意接入市面上不同的大模型,因?yàn)檫@可以讓軟件更好用。包括釘釘、飛書、金蝶等一批軟件公司已接入DeepSeek。在線辦公系統(tǒng)公司釘釘?shù)囊晃患夹g(shù)人士告訴《財(cái)經(jīng)》,2024年6月開始,釘釘接入了六家模型。此次釘釘使用的DeepSeek部署在阿里云上,專供釘釘使用。另一個(gè)在線辦公系統(tǒng)公司飛書的一位技術(shù)人士告訴《財(cái)經(jīng)》,飛書用的開源版DeepSeek部署在火山方舟和硅基流動(dòng)兩款模型平臺(tái)上,它已和飛書的多維表格、智能伙伴創(chuàng)建平臺(tái)等功能深度結(jié)合。
當(dāng)產(chǎn)業(yè)鏈中的所有人都不約而同往DeepSeek上跑的時(shí)候,DeepSeek初步完成了第一輪生態(tài)布局。目前,DeepSeek生態(tài)呈現(xiàn)出快速擴(kuò)張且規(guī)模龐大的態(tài)勢(shì)。
在用戶端,DeepSeek在1月累計(jì)獲得1.25億用戶(含網(wǎng)站、App累加不去重),2025年1月網(wǎng)站月訪問量達(dá)2.56億,全球榜上以22.3倍的速度增長(zhǎng)。近期DeepSeek訪問使用量急速上升,已成為目前最快突破3000萬(wàn)日活躍用戶量的應(yīng)用程序。
在合作廠商端,國(guó)內(nèi)外眾多云廠商相繼接入,包括亞馬遜、微軟、三大運(yùn)營(yíng)商、阿里云、百度智能云、騰訊云、華為云、360數(shù)字安全、中國(guó)電子云、并行科技、青云科技、UCloud、金山云、云軸科技等,都上線了DeepSeek大模型。手機(jī)、PC等終端廠商也在積極擁抱DeepSeek,如榮耀等手機(jī)廠商已接入,一些地方政府也開始在政務(wù)系統(tǒng)部署,如深圳龍崗區(qū)政務(wù)服務(wù)和數(shù)據(jù)管理局已在政務(wù)外網(wǎng)部署上線了Deepseek-R1全尺寸模型。
在行業(yè)軟件接入方面,DeepSeek覆蓋云計(jì)算、醫(yī)療、教育、汽車、創(chuàng)意設(shè)計(jì)等多個(gè)領(lǐng)域。如中關(guān)村科金的“得助大模型平臺(tái)2.0”、軟通動(dòng)力的“天璇MaaS平臺(tái)”、國(guó)家超算西安中心等都接入了DeepSeek系列模型,醫(yī)療領(lǐng)域的醫(yī)渡科技、鷹瞳科技、萬(wàn)達(dá)信息,創(chuàng)意設(shè)計(jì)與辦公工具領(lǐng)域的萬(wàn)興科技、釘釘AI助理,智能汽車領(lǐng)域的江淮汽車、當(dāng)虹科技,安全與通信領(lǐng)域的北信源、奇安信等都接入了DeepSeek。
DeepSeek也在快速進(jìn)化,模型功能往多元方向演進(jìn),以DeepSeek-V2為代表的模型在代碼生成、數(shù)學(xué)推理、金融分析等場(chǎng)景表現(xiàn)突出,支持文本、圖像、代碼等多模態(tài)輸入,可擴(kuò)展應(yīng)用至智能客服、電商推薦、工業(yè)質(zhì)檢等多個(gè)場(chǎng)景。
另外,DeepSeek開始主動(dòng)適配國(guó)產(chǎn)芯片,對(duì)華為昇騰、寒武紀(jì)等國(guó)產(chǎn)芯片進(jìn)行了優(yōu)化,符合國(guó)產(chǎn)化信創(chuàng)要求,推動(dòng)了國(guó)產(chǎn)芯片在定制化場(chǎng)景中的發(fā)展。
“你可以理解為,之前大模型是大玩家的小范圍游戲,大玩家想做生態(tài),但想進(jìn)入這個(gè)生態(tài),需要高代價(jià)高成本,DeepSeek的作用是把高門檻一下子打掉了?!币晃恢忻繟I產(chǎn)業(yè)資深技術(shù)人士向《財(cái)經(jīng)》評(píng)價(jià):“無(wú)論大公司小公司,之前要贏,是高成本的贏,現(xiàn)在,所有人都可能低成本贏,這是生態(tài)的本質(zhì)?!?/p>
當(dāng)整個(gè)行業(yè)的競(jìng)爭(zhēng)焦點(diǎn)從訓(xùn)練轉(zhuǎn)向推理,大模型就不僅僅是對(duì)話了,基于大模型技術(shù)的千行百業(yè)應(yīng)用都將取得大發(fā)展
相比產(chǎn)業(yè)界的復(fù)雜心態(tài),投資圈迎來(lái)了久違的“活力”。往年春節(jié)假期結(jié)束后,大約還需要一兩周,投資機(jī)構(gòu)們才會(huì)真正投入工作,今年的情況變了,投資人今年還沒等假期過(guò)完,就沖到杭州,希望能和DeepSeek溝通交流。盡管他們絕大多數(shù)都沒能見到創(chuàng)始人,熱情依然不減,大型美元基金、大型政府引導(dǎo)基金們,把杭州的科技創(chuàng)新項(xiàng)目都看了一圈。
大模型的推理和訓(xùn)練都極為重要。訓(xùn)練是大模型的基礎(chǔ),決定了模型的上限;推理是將模型應(yīng)用于實(shí)際場(chǎng)景的關(guān)鍵環(huán)節(jié),推理的速度和準(zhǔn)確性直接決定了模型在實(shí)際應(yīng)用中的表現(xiàn)和用戶體驗(yàn)。
在實(shí)際應(yīng)用中,優(yōu)化推理過(guò)程,降低對(duì)計(jì)算資源的需求,可以顯著降低模型的運(yùn)營(yíng)成本,使得模型能夠在更多的設(shè)備和場(chǎng)景中部署和使用。DeepSeek將全行業(yè)原來(lái)聚焦以訓(xùn)練為中心的競(jìng)爭(zhēng)拉到了以推理為中心的競(jìng)爭(zhēng)格局。這是一個(gè)巨大變化——從資本支出、芯片、基礎(chǔ)設(shè)施架構(gòu)到應(yīng)用開放范式,都會(huì)引發(fā)巨大變化。
當(dāng)全行業(yè)的競(jìng)爭(zhēng)走向推理,一個(gè)重要表現(xiàn)是應(yīng)用大發(fā)展,而不僅僅是目前的對(duì)話模型。從技術(shù)邏輯簡(jiǎn)單說(shuō),推理算力本質(zhì)上是分布式的,需要端側(cè)和邊緣側(cè)配合,接下來(lái),硬件廠商會(huì)與大模型公司緊密合作,針對(duì)推理需求開發(fā)專門的硬件產(chǎn)品,如推理芯片、邊緣計(jì)算設(shè)備等。軟件層面,開發(fā)適配新型硬件的驅(qū)動(dòng)程序和開發(fā)工具,提高硬件資源利用率,降低推理延遲。
在市場(chǎng)和商業(yè)層面,競(jìng)爭(zhēng)焦點(diǎn)從訓(xùn)練向推理的轉(zhuǎn)向也會(huì)帶來(lái)新的變化。
有某頭部金融機(jī)構(gòu)的AI技術(shù)人士向《財(cái)經(jīng)》表示,DeepSeek帶來(lái)的改變很現(xiàn)實(shí)。它的API定價(jià)僅為OpenAI運(yùn)行成本的1/30,每百萬(wàn)詞元僅需2.2美元,這種低成本使得更多的企業(yè)和機(jī)構(gòu)能夠負(fù)擔(dān)得起。
另外,推理技術(shù)的發(fā)展使得大模型可以更高效地部署在各種硬件設(shè)備上,包括一些計(jì)算能力相對(duì)較弱的邊緣設(shè)備和終端設(shè)備。這一下子解決了大模型在很多應(yīng)用場(chǎng)景中的部署難點(diǎn),比如智能家居和智能穿戴設(shè)備。
另有企業(yè)服務(wù)軟件領(lǐng)域的投資人向《財(cái)經(jīng)》表示,大模型應(yīng)用是否能夠繁榮,爆款殺手級(jí)應(yīng)用固然重要,商業(yè)模式的走通更重要。他正看定制化推理服務(wù)相關(guān)的初創(chuàng)項(xiàng)目。“結(jié)合新技術(shù)路線的定制化推理服務(wù)將讓大家前期熟悉的智能安防、智能客服、醫(yī)療影像診斷、金融風(fēng)險(xiǎn)評(píng)估等領(lǐng)域的應(yīng)用準(zhǔn)確度和智能度大大提升,顆粒度更細(xì)?!?/p>
中國(guó)電子云副總裁?;垆h透露,過(guò)去兩年國(guó)內(nèi)AI大模型相關(guān)的項(xiàng)目已經(jīng)涌現(xiàn),不少千萬(wàn)級(jí)的大單,主要是來(lái)自金融等信息化基礎(chǔ)很好的行業(yè),但整體來(lái)說(shuō),AI大模型推理能力跟業(yè)務(wù)的垂直領(lǐng)域結(jié)合才剛剛開始。
這些都是機(jī)會(huì)。
DeepSeek的出現(xiàn)再一次喚起一級(jí)市場(chǎng)的“害怕錯(cuò)過(guò)”心態(tài),且這次比上一次由OpenAI帶來(lái)的影響量級(jí)更上一層?!吧弦淮问敲绹?guó)公司,我們是跟隨;這一次是中國(guó)公司,機(jī)會(huì)更大了。”
AI行業(yè)尚處于發(fā)展初期,門檻和上限遠(yuǎn)比移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)更高。
無(wú)論中國(guó)還是美國(guó),移動(dòng)互聯(lián)網(wǎng)時(shí)代的繁榮不僅體現(xiàn)在巨頭公司的陣列,更具象體現(xiàn)在如雨后春筍般出現(xiàn)的,分布在不同領(lǐng)域、不同規(guī)模的新貴公司身上。由于新的估值模型被認(rèn)可,即便這些公司大多沒有盈利,甚至沒有清晰的商業(yè)模式,也不會(huì)妨礙它們成功上市。
而目前AI技術(shù)研發(fā)的巨量投入本身就是一個(gè)極高門檻,基本都是已經(jīng)盈利多年的巨頭們?cè)诖蟀髷?。初?chuàng)公司若沒有一定的硬實(shí)力,單憑講故事、畫大餅就想融資,是難上加難。
過(guò)去兩年間,中國(guó)AI領(lǐng)域的風(fēng)投出現(xiàn)了一個(gè)特點(diǎn):風(fēng)險(xiǎn)投資資金基本上流到少數(shù)頭部大模型公司,更多細(xì)分領(lǐng)域的創(chuàng)業(yè)公司很難拿到錢。那些頭部大模型創(chuàng)業(yè)公司的估值太高,資金很難進(jìn)去。據(jù)第三方數(shù)據(jù)機(jī)構(gòu)企名片,2024年全年,中國(guó)AI領(lǐng)域融資總額約495億元。其中,月之暗面、百川智能、智譜AI和Minimax四家公司共計(jì)完成了約233億元融資額,占全年行業(yè)融資額的近一半(48%)。
創(chuàng)業(yè)公司估值到了一定階段后,很難繼續(xù)在一級(jí)市場(chǎng)拿到新融資。除非能夠證明自己的技術(shù)有獨(dú)特性和壁壘,否則就必須拿出實(shí)際數(shù)據(jù),包括用戶數(shù)量、用戶增速、營(yíng)收增速等。但創(chuàng)業(yè)公司在這些方面很難與大廠競(jìng)爭(zhēng),大廠們已經(jīng)將模型應(yīng)用的觸角深入各類場(chǎng)景中。
長(zhǎng)此以往,投資人的思維越發(fā)保守,更注重創(chuàng)業(yè)公司的營(yíng)收、利潤(rùn)、用戶量等數(shù)據(jù)。
一家AI頭部創(chuàng)業(yè)公司的投資人告訴《財(cái)經(jīng)》,頭部的六家大模型創(chuàng)業(yè)公司中,至少有四家已經(jīng)面臨融資壓力。而DeepSeek的出現(xiàn)又加劇了這一形勢(shì)。“對(duì)于投資人來(lái)說(shuō),投一個(gè)細(xì)分方向的目的是投中行業(yè)第一,如果這個(gè)第一已經(jīng)出現(xiàn),繼續(xù)投資的意義就不大了。”
前述AI行業(yè)資深觀察人士認(rèn)為,遵循此前美國(guó)技術(shù)路線訓(xùn)練的大模型創(chuàng)業(yè)公司后續(xù)會(huì)比較被動(dòng)。但更多基于大模型應(yīng)用的新創(chuàng)業(yè)公司會(huì)獲得更多機(jī)會(huì)?!叭绻f(shuō)此前的邏輯是垂直的、重資產(chǎn)的,現(xiàn)在是扁平的、輕資產(chǎn)的,接下來(lái)很有可能回到移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)時(shí)代,應(yīng)用為王?!?/p>
換句話說(shuō),DeepSeek徹底反轉(zhuǎn)了敘事體系,資產(chǎn)成本顯得不那么重要了,回到應(yīng)用為王的路徑上。
一位投資人向《財(cái)經(jīng)》預(yù)測(cè),2025年,整個(gè)一級(jí)市場(chǎng)的融資頻率和交易金額會(huì)有明顯提升,這主要是受近期二級(jí)市場(chǎng)科技股股價(jià)普遍上漲的影響。且近期不少美元機(jī)構(gòu)都表現(xiàn)出了投資更早期項(xiàng)目的意愿,會(huì)降低對(duì)業(yè)務(wù)數(shù)據(jù)的要求。
“新一代AI應(yīng)用確實(shí)會(huì)加速,但具體方向不好判斷,要看實(shí)際落地情況?!倍辔唤邮堋敦?cái)經(jīng)》采訪的一級(jí)市場(chǎng)投資人表達(dá)了同一個(gè)觀點(diǎn):必須看到類似“爆款”潛質(zhì)之類的苗頭才能下結(jié)論。
從“大力出奇跡”到“四兩撥千斤”的轉(zhuǎn)變,盤活了不少算力
“暴力美學(xué)”邏輯統(tǒng)治了2023年-2024年的全球大模型產(chǎn)業(yè)。期間中美科技公司對(duì)大模型的發(fā)展共識(shí)是,新一代人工智能產(chǎn)業(yè)發(fā)展需要“大力出奇跡”——只有擁有足夠的芯片、足夠的資金才能支撐大模型迭代以及商業(yè)化。DeepSeek提出的“四兩撥千斤”的技術(shù)路徑推翻了這一模式。
大模型芯片公司行云集成電路CEO季宇告訴《財(cái)經(jīng)》,作為一家芯片公司,他們關(guān)注的不僅僅是模型的效果,更注重模型的經(jīng)濟(jì)性,而經(jīng)濟(jì)性很大程度上取決于運(yùn)行模型的硬件。DeepSeek有望把高質(zhì)量的模型降到人人都用得起的一個(gè)水平,他認(rèn)為,這將會(huì)給硬件,也就是國(guó)產(chǎn)芯片帶來(lái)機(jī)會(huì)。
DeepSeek采用了MoE(混合專家模型)架構(gòu),這種架構(gòu)的優(yōu)勢(shì)在于降低了對(duì)內(nèi)存帶寬的需求,缺點(diǎn)是需要更大的內(nèi)存容量。不過(guò),據(jù)《財(cái)經(jīng)》了解,從技術(shù)角度看,更大的內(nèi)存容量需求相對(duì)是比較好滿足的,且市場(chǎng)上給全國(guó)產(chǎn)方案帶來(lái)探索的機(jī)會(huì)。
對(duì)非顯卡場(chǎng)景而言,這反而是一個(gè)有利的特點(diǎn)。比如使用CPU運(yùn)行的場(chǎng)景,目前甚至使用CPU服務(wù)器也有可能運(yùn)行大模型,這說(shuō)明DeepSeek顯著降低了算力門檻。
總結(jié)來(lái)說(shuō),DeepSeek為此前難以滿足大模型運(yùn)行需求的國(guó)產(chǎn)芯片提供了更多發(fā)展空間,尤其是在推理市場(chǎng)。
峰瑞資本副總裁李罡的觀點(diǎn)是,近年來(lái)新一代AI芯片公司興起,這些新公司和過(guò)去的芯片公司一大區(qū)別就是產(chǎn)品的著力點(diǎn)在優(yōu)化帶寬,不再追求高算力,算力可以用異構(gòu)的方式來(lái)解決。
同時(shí),DeepSeek的熱度可能將會(huì)帶動(dòng)資本市場(chǎng)對(duì)新一代AI芯片的熱度?!叭ツ甏蠹叶歼€是在以孵化為主,一些知名機(jī)構(gòu)已經(jīng)投了一些芯片項(xiàng)目,但是還沒有曝光。今年這些熱度會(huì)很快起來(lái)?!?/p>
他認(rèn)為,隨著時(shí)間推移,芯片的成本能夠降到現(xiàn)在十分之一甚至更低,而這種芯片的降本將會(huì)帶來(lái)應(yīng)用的爆發(fā)?!澳壳耙?yàn)樾酒某杀靖甙海芏郃I應(yīng)用沒辦法免費(fèi),未來(lái)如果再下降一個(gè)數(shù)量級(jí),就會(huì)爆發(fā)很多免費(fèi)的應(yīng)用出來(lái),就將迎來(lái)應(yīng)用大爆發(fā)的階段?!?/p>
并行科技創(chuàng)始人陳健認(rèn)為,DeepSeek確實(shí)會(huì)盤活國(guó)產(chǎn)算力,為國(guó)產(chǎn)算力的成長(zhǎng)提供全新機(jī)遇。
國(guó)內(nèi)大部分算力服務(wù)商主要出售自有算力,并行科技不僅提供自有算力,還將分布在全國(guó)各地的智算中心連接起來(lái),形成統(tǒng)一算力網(wǎng)絡(luò),調(diào)度給前端用戶。陳健介紹,這些智算中心芯片種類多樣,算力參差不齊,算力閑置現(xiàn)象較為普遍。雖然目前絕大多數(shù)國(guó)產(chǎn)芯片均已經(jīng)適配DeepSeek,但在算力調(diào)度、應(yīng)用適配層面還有大量的優(yōu)化工作,而他們當(dāng)下工作重心之一,是評(píng)估哪三種國(guó)產(chǎn)芯片在DeepSeek上性能表現(xiàn)最優(yōu),以及哪三種國(guó)產(chǎn)芯片性價(jià)比最高,以便為客戶使用國(guó)產(chǎn)算力提供參考。
如某國(guó)有大型銀行采用長(zhǎng)江計(jì)算聯(lián)合昇騰、華為云團(tuán)隊(duì)的方案,使用G440K V2服務(wù)器成功部署DeepSeek-V3模型的本地化推理服務(wù),為昇騰芯片等在金融行業(yè)的推廣提供了案例。
隨著DeepSeek在云服務(wù)、手機(jī)、汽車等多領(lǐng)域的廣泛應(yīng)用,國(guó)產(chǎn)芯片將有望在更多行業(yè)實(shí)現(xiàn)規(guī)模化應(yīng)用,AI大模型應(yīng)用生態(tài)也將更加成熟與繁榮。
在算力需求端,中外大型科技公司仍然堅(jiān)持大規(guī)模投資算力。
2024年,美國(guó)科技四巨頭(微軟、亞馬遜、谷歌、Meta)資本支出均達(dá)到史上最高點(diǎn),2025年資本支出總額將超過(guò)3200億美元,總增速約為30%。最新財(cái)報(bào)電話會(huì)顯示,微軟計(jì)劃2025年資本支出將環(huán)比增加;亞馬遜計(jì)劃2025年投入1000億美元資本支出,增速將接近30%;谷歌計(jì)劃在2025年投入750億美元資本支出,增速將超過(guò)40%;Meta預(yù)計(jì)2025年資本支出為600億-650億美元,增速將高達(dá)60%-75%。
包括字節(jié)跳動(dòng)、阿里、百度等科技公司人士的觀點(diǎn)是,短期內(nèi)節(jié)省算力很重要,但投資算力更重要。一位阿里云人士對(duì)《財(cái)經(jīng)》表示,阿里云在2025年的重點(diǎn)之一,仍是大規(guī)模投資算力。
上述中國(guó)科技公司智能算法負(fù)責(zé)人對(duì)《財(cái)經(jīng)》分析,拉到十年的長(zhǎng)周期看,算力需求不會(huì)減少,只會(huì)螺旋上升。因此,面向未來(lái)投資算力更重要。這就像2025年的iPhone,計(jì)算性能一定超過(guò)2007年的iPhone。他所在公司綜合考慮算力資源儲(chǔ)備、市場(chǎng)未來(lái)用量、模型成本下降等因素判斷,2027年每天推理算力的消耗量將增長(zhǎng)100倍以上。
AI產(chǎn)業(yè)邏輯變化,中國(guó)科技股正迎來(lái)重估。近一周,中國(guó)科技公司股價(jià)普漲。阿里(NYSE:BABA)紐交所股價(jià)上漲16.9%,總市值2954億美元,騰訊港交所股價(jià)上漲9.4%,總市值4.4萬(wàn)億港元,百度(NASDAQ:BIDU)在納斯達(dá)克股價(jià)上漲7.2%,總市值346億美元。
舊地圖找不到新世界
陳健的觀點(diǎn)是,一流的性能表現(xiàn)、大幅降低的算力成本,加開源模式是DeepSeek引爆的三個(gè)核心原因。但他表示:“技術(shù)的發(fā)展就是你追我趕的,前兩點(diǎn)其他大模型也很快能做到甚至可能超過(guò)DeepSeek,而開源這一模式為DeepSeek生態(tài)養(yǎng)成和未來(lái)發(fā)展帶來(lái)深遠(yuǎn)的影響力?!?/p>
在DeepSeek推出V3/R1之前,谷歌的AI大模型雖然也開源,但對(duì)中文的支持一般,并且它作為國(guó)外的開源產(chǎn)品在國(guó)內(nèi)關(guān)鍵領(lǐng)域落地存在一定的政策風(fēng)險(xiǎn);國(guó)內(nèi)雖然有開源大模型,性能表現(xiàn)沒那么出色,生態(tài)鏈不少玩家都采取保守觀望的態(tài)度。
“DeepSeek V3/R1性能出色,又開源開得比較徹底,讓人放心跟進(jìn),在這一點(diǎn)上,阿里云作為另一個(gè)也在國(guó)內(nèi)推AI開源大模型的廠家就有點(diǎn)難比,因?yàn)樗瑫r(shí)也有閉源大模型,導(dǎo)致別的玩家多少有點(diǎn)不放心,會(huì)認(rèn)為我在你開源產(chǎn)品上怎么做也比不上你阿里云閉源的大模型,DeepSeek就不會(huì)讓人產(chǎn)生這種顧慮?!蹦吃品?wù)商高管告訴《財(cái)經(jīng)》。
軟件開源并非指將源代碼全部無(wú)條件免費(fèi)提供給別人用,必須遵循一定規(guī)則,即開源協(xié)議。全世界有上百種開源協(xié)議,常用的有五六種,DeepSeek選擇的是比較寬松友好的MIT開源協(xié)議(The Massachusetts Institute of Technology License,麻省理工學(xué)院許可協(xié)議)。
MIT開源協(xié)議最大的特點(diǎn)是支持商用,很多公司在選用開源產(chǎn)品的時(shí)候也都首選支持MIT協(xié)議的,因?yàn)榭梢酝耆刂七@些第三方的代碼,必要的時(shí)候可以修改或者二次開發(fā)。相比之下,一些商業(yè)閉源模型可能每年需要企業(yè)支付數(shù)百萬(wàn)甚至上千萬(wàn)元的授權(quán)費(fèi)用,免費(fèi)又支持商用的DeepSeek大模型對(duì)生態(tài)合作伙伴的吸引力更強(qiáng)。
陳健指出了開源對(duì)DeepSeek未來(lái)發(fā)展的另一種潛在的長(zhǎng)期影響:“在開源世界,你如果被認(rèn)可,那全世界的高手都會(huì)跟你玩,會(huì)在你的代碼基礎(chǔ)上繼續(xù)創(chuàng)新,形成良好的開發(fā)者社區(qū)氛圍,增進(jìn)開源模型應(yīng)用生態(tài)。”
中國(guó)電子首席科學(xué)家、中國(guó)電子云總工程師朱國(guó)平表示,DeepSeek有可能復(fù)制Linux操作系統(tǒng)的成功。Linux通過(guò)開源形成了豐富的生態(tài)系統(tǒng),包括各種開源軟件、工具和應(yīng)用。這些開源項(xiàng)目相互協(xié)作、相互促進(jìn),共同推動(dòng)Linux在服務(wù)器、超級(jí)計(jì)算機(jī)、嵌入式等領(lǐng)域成為全球主流操作系統(tǒng)。
“AI大模型和操作系統(tǒng)一樣,都是平臺(tái)級(jí)軟件,平臺(tái)級(jí)軟件總會(huì)收斂到少數(shù)幾家,盡管當(dāng)前大模型眾多,但最終只有幾家能勝出。”朱國(guó)平說(shuō)。
在中國(guó),受限于美國(guó)不斷收緊的芯片制裁政策,中國(guó)公司無(wú)法從英偉達(dá)等芯片公司購(gòu)買高端芯片,也無(wú)法制造7納米及以上的高端芯片,導(dǎo)致不少中國(guó)AI大模型創(chuàng)業(yè)創(chuàng)新團(tuán)隊(duì)不得不默認(rèn)一個(gè)所謂的“跟隨戰(zhàn)略”:緊跟世界前沿創(chuàng)新的腳步,保證中國(guó)AI大模型不落后三個(gè)至六個(gè)月,并試圖利用中國(guó)豐富的應(yīng)用場(chǎng)景做出“從1-100”的創(chuàng)新。
未來(lái),國(guó)產(chǎn)芯片、DeepSeek大模型、算力服務(wù)商、行業(yè)應(yīng)用,這些環(huán)節(jié)能夠共同形成國(guó)產(chǎn)AI大模型產(chǎn)業(yè)鏈閉環(huán)。
2月11日,百度創(chuàng)始人李彥宏在阿聯(lián)酋迪拜World Governments Summit 2025峰會(huì)上針對(duì)DeepSeek回應(yīng)稱,百度仍需對(duì)芯片、數(shù)據(jù)中心和云基礎(chǔ)設(shè)施持續(xù)投入,以打造下一代模型。
李彥宏認(rèn)為,在AI、IT乃至更多領(lǐng)域,大多數(shù)創(chuàng)新都與降低成本有關(guān)。為此,需要使用更多算力來(lái)嘗試不同的路徑。也許,在某個(gè)時(shí)刻會(huì)找到一條捷徑,比如說(shuō)只需600萬(wàn)美元就能訓(xùn)練出一個(gè)模型,但在此之前,可能已花費(fèi)了數(shù)十億美元,用于探索哪條路才是花費(fèi)這600萬(wàn)美元的正確途徑。
從產(chǎn)業(yè)創(chuàng)新路徑的層面來(lái)看,DeepSeek打破了幾個(gè)“刻板共識(shí)”:AI領(lǐng)域中國(guó)相對(duì)美國(guó)差距不小,而且差距在拉大;美國(guó)的芯片是制約中國(guó)AI產(chǎn)業(yè)發(fā)展的關(guān)鍵,可以卡住中國(guó);目前全球的AI競(jìng)爭(zhēng)的核心是訓(xùn)練,推理是未來(lái)的事;大模型的關(guān)鍵突破都發(fā)生在美國(guó),其他國(guó)家市場(chǎng)都是在反向工程。
這不僅是對(duì)中國(guó)AI產(chǎn)業(yè)創(chuàng)新的實(shí)踐啟示,也是對(duì)全球AI進(jìn)展打破常規(guī)緩慢節(jié)奏的啟示。
如果既有的道路走不通,那么就需要尋找新的道路。在DeepSeek出現(xiàn)之前,AI行業(yè)普遍認(rèn)為,使用的計(jì)算卡數(shù)量越多,模型就越先進(jìn),效果也越好。然而,由于美國(guó)對(duì)中國(guó)實(shí)施芯片封鎖,中國(guó)公司難以獲取大量先進(jìn)的計(jì)算卡。因此,按照這種傳統(tǒng)邏輯參與全球AI競(jìng)爭(zhēng),中國(guó)公司往往會(huì)陷入被動(dòng),只能不斷扮演跟隨者的角色,難以取得先機(jī)。
DeepSeek狂潮的出現(xiàn),從根本上改變了大模型時(shí)代的技術(shù)競(jìng)爭(zhēng)邏輯,為中國(guó)的AI發(fā)展提供了一種全新的思路和可能性。
季宇認(rèn)為,“過(guò)去的四五十年中,經(jīng)驗(yàn)主義對(duì)中國(guó)的經(jīng)濟(jì)騰飛起到了巨大的作用,但也形成了一定的思維定式,如果中國(guó)沒有已經(jīng)走到世界前列的情況下,經(jīng)驗(yàn)主義其實(shí)是一個(gè)非常有效的方法論,但是中國(guó)處在世界前列時(shí),無(wú)論是技術(shù)還是商業(yè)創(chuàng)新是需要反經(jīng)驗(yàn)主義的,反經(jīng)驗(yàn)主義不只是‘反’經(jīng)驗(yàn),更需要新的把事情做成的新的方法論,反經(jīng)驗(yàn)主義或許可以幫助中國(guó)科技創(chuàng)新突破瓶頸?!?/p>