0 引言
近期,杭州深度求索人工智能(AI)基礎(chǔ)技術(shù)研究有限公司(DeepSeek)先后發(fā)布了大語言基座開源模型DeepSeek V3和專為復(fù)雜推理任務(wù)設(shè)計(jì)的開源模型DeepSeek R1,其憑借開源、低能耗、透明的特點(diǎn)成為全球普惠AI的新典范,以硬核技術(shù)實(shí)力展示了中國(guó)人工智能企業(yè)的創(chuàng)新加速度,以及在科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合下順應(yīng)AI趨勢(shì)、引領(lǐng)潮頭的強(qiáng)勁態(tài)勢(shì)。
2024年,中央經(jīng)濟(jì)工作會(huì)議明確提出“推動(dòng)科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新融合發(fā)展”,并將“以科技創(chuàng)新引領(lǐng)新質(zhì)生產(chǎn)力發(fā)展”作為2025年經(jīng)濟(jì)工作的重點(diǎn)任務(wù)之一。在人工智能浪潮席卷全球的背景下,深度求索(DeepSeek)以技術(shù)突破為基、開源共創(chuàng)為勢(shì)、產(chǎn)業(yè)賦能為徑,探索科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新深度融合的“杭州范式”,為現(xiàn)代化產(chǎn)業(yè)體系的發(fā)展提供了可借鑒范本。
1 筑基:以“技術(shù)突破”夯實(shí)普惠AI的數(shù)字基座
DeepSeek專注于前沿技術(shù)的研究與開發(fā),將核心技術(shù)自主研發(fā)作為立身之本。在人工智能領(lǐng)域,DeepSeek聚焦自然語言處理、深度學(xué)習(xí)等前沿方向,構(gòu)建從底層算法到應(yīng)用層面的全棧技術(shù)體系。DeepSeek在大型語言模型(LLM)領(lǐng)域的技術(shù)突破主要體現(xiàn)為創(chuàng)新的混合專家模型(Mixture of Experts,MoE)、多頭潛在注意力機(jī)制(Multi-head Latent Attention,MLA)和多令牌預(yù)測(cè)技術(shù)(Multi-Token Prediction,MTP)。這些創(chuàng)新不僅顯著提升了模型的性能和效率,還大幅降低了模型訓(xùn)練和推理的成本。其中:MoE是DeepSeek的核心架構(gòu)之一(而非傳統(tǒng)Transformer模型),通過動(dòng)態(tài)路由機(jī)制、共享專家機(jī)制和負(fù)載均衡策略,將輸入數(shù)據(jù)分配給多個(gè)專家模型處理,從而保持高性能并降低計(jì)算成本;MLA是DeepSeek在注意力機(jī)制上的創(chuàng)新,通過低秩壓縮、解耦位置編碼、推理加速等技術(shù),減少推理時(shí)的顯存占用并提升處理效率;MTP是DeepSeek在訓(xùn)練目標(biāo)上的創(chuàng)新,通過多Token預(yù)測(cè)(而非傳統(tǒng)單Token預(yù)測(cè))和推測(cè)解碼(Speculative Decoding)框架,顯著提升了數(shù)據(jù)利用效率和訓(xùn)練效果。DeepSeek的技術(shù)突破主要是在原有Transformer模型的算法和工程優(yōu)化等方面進(jìn)行了系統(tǒng)性創(chuàng)新,打破了大語言模型以大算力為核心的性能天花板,為探索普惠人工智能提供了堅(jiān)實(shí)的技術(shù)支撐。
2 立勢(shì):以“開源共創(chuàng)”構(gòu)建普惠AI的技術(shù)生態(tài)
作為科技領(lǐng)軍企業(yè),DeepSeek始終站在全球技術(shù)前沿,致力于構(gòu)建開放共贏的技術(shù)生態(tài)。首先,DeepSeek的模型采用開源模式,任何人均可從DeepSeek網(wǎng)站上自行下載與部署模型,并通過行業(yè)自有數(shù)據(jù)、知識(shí)和經(jīng)驗(yàn)進(jìn)行專業(yè)訓(xùn)練與微調(diào),為全球搭建普惠AI數(shù)字基座。其次,DeepSeek堅(jiān)持“開源+生態(tài)共建”策略,將代碼、模型權(quán)重和訓(xùn)練日志全部公開,吸引全球開發(fā)者參與技術(shù)迭代,形成全球范圍內(nèi)極度活躍的技術(shù)生態(tài)以及覆蓋金融、醫(yī)療、教育、制造等行業(yè)的衍生模型矩陣。再次,DeepSeek以極具競(jìng)爭(zhēng)力的API定價(jià)讓用戶廣泛受益,國(guó)內(nèi)許多云廠商、AI創(chuàng)業(yè)公司等都能以較低成本使用DeepSeek推理模型。DeepSeek的開源之舉使得AI像水和電一樣觸手可及,實(shí)現(xiàn)了“時(shí)時(shí)、處處、人人可用”的普惠AI。而DeepSeek自身也從開放研究和開源共享中獲益匪淺,贏得了業(yè)界的廣泛贊譽(yù)。最后,DeepSeek開展的是“開放化有組織的創(chuàng)新”,在技術(shù)研發(fā)、應(yīng)用落地、市場(chǎng)拓展等方面,與浙江大學(xué)、西湖大學(xué)、中科曙光、騰訊云等各方緊密合作,形成“創(chuàng)新鏈、產(chǎn)業(yè)鏈、服務(wù)鏈、人才鏈”四鏈融合機(jī)制,緊密對(duì)接行業(yè)需求和市場(chǎng)需求。DeepSeek倡導(dǎo)開放的創(chuàng)新文化,培養(yǎng)有強(qiáng)烈好奇心、創(chuàng)造力、自驅(qū)動(dòng)力的研發(fā)團(tuán)隊(duì),鼓勵(lì)員工自由探索,形成了良好的自下而上的創(chuàng)新氛圍。正如梁文峰所言:“DeepSeek的護(hù)城河是技術(shù)團(tuán)隊(duì)的沉淀和創(chuàng)新文化,通過團(tuán)隊(duì)成員的成長(zhǎng)和經(jīng)驗(yàn)積累,形成獨(dú)特的Know-how和創(chuàng)新文化。”DeepSeek的開源共創(chuàng)策略為全球AI產(chǎn)業(yè)發(fā)展注入了新的活力,促進(jìn)了技術(shù)的全球化共享和創(chuàng)新。
3 拓路:以“產(chǎn)業(yè)賦能”實(shí)現(xiàn)普惠AI的場(chǎng)景應(yīng)用
DeepSeek三年間完成了從基礎(chǔ)研究到產(chǎn)業(yè)智能體的價(jià)值躍遷,其開源模型下載量突破2 000萬次,并被廣泛應(yīng)用于教育、醫(yī)療、金融等多個(gè)領(lǐng)域,推動(dòng)了AI技術(shù)的全面落地。DeepSeek聯(lián)合清華大學(xué)、微軟研究院等產(chǎn)學(xué)研力量打造的“聯(lián)合創(chuàng)新實(shí)驗(yàn)室矩陣”,將學(xué)術(shù)前沿與產(chǎn)業(yè)需求深度耦合,通過搭建“垂直大模型知識(shí)蒸餾+行業(yè)知識(shí)圖譜構(gòu)建+智能體聯(lián)邦學(xué)習(xí)”3層技術(shù)架構(gòu),形成了垂直行業(yè)知識(shí)注入的解決方案體系。①在醫(yī)療健康領(lǐng)域,構(gòu)建覆蓋診療全流程的智能輔助系統(tǒng),基于多模態(tài)病歷分析顯著提升診斷效率和精準(zhǔn)度,并通過治療方案模擬引擎縮短個(gè)性化用藥決策時(shí)間。②在金融服務(wù)場(chǎng)景,打造金融風(fēng)控決策鏈,運(yùn)用時(shí)序數(shù)據(jù)建模和動(dòng)態(tài)反欺詐圖譜,顯著提升風(fēng)險(xiǎn)評(píng)估和交易識(shí)別效率。③在智能制造場(chǎng)域,打造工業(yè)智能體集群,通過數(shù)字孿生優(yōu)化和工藝參數(shù)智能調(diào)優(yōu)系統(tǒng)提高產(chǎn)線良品率。④在教育教學(xué)方面,構(gòu)建教育知識(shí)圖譜引擎,基于學(xué)習(xí)者認(rèn)知建模,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)路徑規(guī)劃,提升學(xué)習(xí)者學(xué)習(xí)能力。綜上,DeepSeek積極推動(dòng)各行各業(yè)的AI應(yīng)用,通過技術(shù)創(chuàng)新加速產(chǎn)業(yè)融合與升級(jí),為全球企業(yè)提供了低成本、高性能的AI解決方案,促進(jìn)了AI技術(shù)的普惠和生態(tài)共建。
剛剛閉幕的巴黎人工智能行動(dòng)峰會(huì),全方位展現(xiàn)了AI多元?jiǎng)?chuàng)新、開放普惠的發(fā)展趨勢(shì),凸顯了加強(qiáng)全球協(xié)作、構(gòu)建包容質(zhì)量框架的迫切需要。DeepSeek通過“硬核技術(shù)突破—開源生態(tài)共建—產(chǎn)業(yè)賦能升級(jí)”的范式革命,揭示了現(xiàn)代化產(chǎn)業(yè)體系下科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新融合發(fā)展的智能化、協(xié)同化和場(chǎng)景化新趨勢(shì),同時(shí)彰顯了中國(guó)科技領(lǐng)軍企業(yè)在新興科技領(lǐng)域的無限潛力與擔(dān)當(dāng),為全球AI普惠發(fā)展提供了充滿“東方智慧”的解決方案。