當(dāng)一個新的技術(shù)革命到來時,其實人們往往是避無可避的,在這個視角下,正如人類面對的每一次技術(shù)機遇時那樣,認知技術(shù)、了解技術(shù)再努力去駕馭技術(shù)為人類所用才是我們?yōu)閿?shù)不多的理性選擇
僅用了短短一個月的時間,一款名為DeepSeek的國產(chǎn)AI工具便以“技術(shù)奇跡”與“社交狂歡”的雙重姿態(tài)席卷全球。與以往AI給人“遠離現(xiàn)生”的印象不同,DeepSeek“無所不能”的神奇特質(zhì)吸引了各路用戶,有人用它炒股、有人用它算命、有人用它做旅行攻略……一時間,“你用DeepSeek了嗎?”成為線上線下交流的招呼語句。
這款以“低成本高性能”著稱的AI工具好在哪里?該怎么用?AI又將給普通人的生活帶來什么影響?近日,浙江大學(xué)濱江研究院數(shù)智融合研究中心主任韓蒙研究員向本刊分享了自己的觀點和看法。
本刊記者:此次DeepSeek橫空出世,一舉攪動了全球大模型市場格局,甚至被譽為“國運級”的創(chuàng)新,該如何理解此次DeepSeek“出圈”的意義?
韓蒙:首先,我們要建立對AI的基本認知。AI是一門融合了計算機科學(xué)、統(tǒng)計學(xué)、腦神經(jīng)學(xué)和社會科學(xué)的前沿綜合性學(xué)科。研究AI的目標,是希望計算機有像人一樣的智力及能力,可以共識性地輔助或者部分替代人類完成感知、認知、推理和決策等多種任務(wù)。
事實上,早在20世紀50年代,AI的概念就已經(jīng)出現(xiàn)了。1956年,達特茅斯會議上首次提出了AI的概念,被認為是AI學(xué)科誕生的標志性事件。1997年,轟動全球的人機大戰(zhàn)中,IBM公司研制的超級計算機“深藍”戰(zhàn)勝了國際象棋世界冠軍卡斯帕羅夫。我們通常認為,這一時間段是AI從萌芽到初步探索的階段。
從20世紀90年代中期到21世紀10年代,則屬于AI沉淀積累的階段。這期間也發(fā)生了一系列標志性事件,比如2012年AlexNet發(fā)布,它是第一個在ImageNet圖像分類競賽中取得顯著優(yōu)勢的深度學(xué)習(xí)模型,被認為是深度學(xué)習(xí)圖像分類的“開山鼻祖”;2016年,谷歌AI系統(tǒng)AlphaGo和世界圍棋冠軍李世石展開了一場人機智慧的較量,最終AlphaGo以4:1戰(zhàn)勝李世石。
進入21世紀10年代,隨著在技術(shù)上取得了一系列的突破,AI與公眾的距離越來越近。比如2020年,OpenAI發(fā)布GPT-3模型,推動了自然語言處理領(lǐng)域的創(chuàng)新;2021年,TESLA發(fā)布全自動駕駛beta版,自動駕駛技術(shù)實現(xiàn)實際應(yīng)用;2022年,OpenAI推出ChatGPT推動了全球的大模型浪潮;2023年,OpenAI發(fā)布GPT-4,可接收文本和圖像輸入;2024年,性能超越GPT-4的Claude 3 Opus大模型發(fā)布。還有前段時間,DeepSeek-V3發(fā)布,在知識類任務(wù)和數(shù)學(xué)推理上表現(xiàn)優(yōu)異;DeepSeek-R1發(fā)布,推理能力對標OpenAI o1,并同步完全開放模型權(quán)重。
DeepSeek之所以引起全球性的關(guān)注,與其采用的策略有關(guān)。首先是開放開源,其次是公開深度思考的過程,再就是“性價比”高。從時間線可以看出,近幾年AI領(lǐng)域的顛覆性創(chuàng)新不斷涌現(xiàn),全球圍繞AI的研發(fā)展開了激烈的競爭。一直以來,大模型的研發(fā)投入都是以百億、千億計的,但DeepSeek-R1巧妙地繞過了算力制約,預(yù)訓(xùn)練成本不到GPT-4o訓(xùn)練成本的十分之一,通過相關(guān)架構(gòu)節(jié)省了大量顯存,進而實現(xiàn)底層算力的高效利用,以更低的成本訓(xùn)練出更加出色的模型效果。這種揚長避短的技術(shù)思路讓人們看到,在非常有限的算力資源支持下,通過強大的算法創(chuàng)新,也能突破算力瓶頸,做出具有全球意義的領(lǐng)先成果。
本刊記者:網(wǎng)友在實際體驗DeepSeek之后,對其褒貶不一,為什么會出現(xiàn)這種現(xiàn)象?DeepSeek的優(yōu)勢具體在哪方面?
韓蒙:就使用感受來說,有人對DeepSeek贊賞有佳,有人反而覺得它沒那么好,主要是因為大家對DeepSeek的期望值與其所展現(xiàn)出來的能力存在差值。
從AI出現(xiàn),人們就對它寄予了厚望。無論是“深藍”戰(zhàn)勝卡斯帕羅夫,還是AlphaGo戰(zhàn)勝李世石,AI在人們的期待中帶來了很多驚喜。但也要看到,很多時候AI的能力離預(yù)期還遠,技術(shù)的演進是隨著時間的推移而發(fā)生的,不能用100分的標準去評判當(dāng)下60分或者80分的產(chǎn)品。
這次DeepSeek之所以引起震撼,正是源于其發(fā)布的擁有671B參數(shù)的超大規(guī)?;旌蠈<夷P停∕oE)——DeepSeek V3,在MMLU、MMLU-Pro、GPQA等基準測試中,其性能與GPT-4o和Claude-Sonnet-3.5等領(lǐng)先的閉源模型相當(dāng)?,F(xiàn)在,很多團隊都在利用DeepSeek V3開展場景應(yīng)用,主要是因為DeepSeek V3擁有多個非常杰出的技術(shù)亮點。
首先它有高效的混合專家架構(gòu)(Mixture of Experts,MoE),可以僅使用37B的參數(shù)激活就能保證模型的性能。這一特性也正是大家所驚嘆的。因為通常認為,技術(shù)其實很難有絕對的壁壘,時間才是真正的壁壘。而在一個時間點內(nèi)擁有了超越同行甚至超越國界的技術(shù)領(lǐng)先性,就是壁壘;而這個時間的優(yōu)勢又可以將研發(fā)力量投入去探索更多價值,這期間所產(chǎn)生的差額也是壁壘。DeepSeek V3推理速度更快、需要的算力更少,那相應(yīng)所需要的其他方面的投入就更少,如前所述,在同一時間點上就有了極高的技術(shù)優(yōu)勢。另外,DeepSeek V3作為開源模型,代碼和訓(xùn)練方法向全球開放,這樣的開放態(tài)度也讓全球開發(fā)者和企業(yè)能夠以較低的成本使用和改進模型,打破了硅谷公司對高端AI模型的壟斷,加速了AI技術(shù)的普及和應(yīng)用,為世界貢獻了中國智慧也展現(xiàn)了開放的胸懷。
本刊記者:當(dāng)前,AI快速發(fā)展的同時也帶來了困惑,好像AI在各種場景中都能應(yīng)用,但又好像很多場景不適用。那么AI到底可以應(yīng)用于哪些場景?給普通人的生活會帶來哪些影響?又將面對什么樣的風(fēng)險和挑戰(zhàn)?
韓蒙:目前在一些非嚴肅場景,比如娛樂化、市場化的宣傳場景中AI已經(jīng)得到了廣泛使用。而在容錯率低、試錯成本高的嚴肅場景能不能使用AI,成為公眾非常關(guān)心的問題。而從我們團隊的調(diào)研情況來看,目前在嚴肅場景中AI也已經(jīng)可以越來越廣泛地發(fā)揮作用。
以DeepSeek為例,目前各界都在主動接入DeepSeek,比如三大運營商、深圳的AI公務(wù)員。它的出現(xiàn)在各行各業(yè)中將引爆各式各樣的業(yè)務(wù),如應(yīng)用于工業(yè)領(lǐng)域中的設(shè)計優(yōu)化、3D建模、制造檢測等環(huán)節(jié),醫(yī)療領(lǐng)域的藥物發(fā)現(xiàn)、診斷治療和關(guān)懷陪伴等方向,金融領(lǐng)域的數(shù)字員工、投資管理、風(fēng)險管理等業(yè)務(wù),教育領(lǐng)域的課程生成、智能助教等節(jié)點,以及電商、傳媒、影視、娛樂、游戲等領(lǐng)域,DeepSeek都能為其賦能。
而關(guān)于很多人擔(dān)心的,AI的發(fā)展會不會帶來風(fēng)險。事實上,需要辯證地看待技術(shù)帶來的機會,以便更好地去把握機會。還是以DeepSeek為例,它開啟了一個私有化、小型化、邊緣化部署的可能性,讓原本不能、不敢上傳到云端用以進行分析的數(shù)據(jù)留在了本地進行分析運行,保證了數(shù)據(jù)的安全。此前出現(xiàn)的深圳AI公務(wù)員曾讓人恐慌,大家擔(dān)心自己的工作是否會被AI所替代。但實際上,當(dāng)前AI承擔(dān)的是大量繁瑣基礎(chǔ)且并不一定需要人類來重復(fù)操作的勞動,AI幫助工作人員從這些勞動中解脫出來,從而提升整體工作效率和服務(wù)效率。
與此同時,也需要關(guān)注到,在實際應(yīng)用AI的過程中,關(guān)于數(shù)據(jù)中毒、模型“幻覺”以及模型自我進化過程中出現(xiàn)偏差等問題也非常需要關(guān)注,AI生成內(nèi)容的濫用等已經(jīng)獲得了國家的關(guān)注,相關(guān)的管理制度也在陸續(xù)發(fā)布。特別是在嚴肅場景下,如何審慎適時恰當(dāng)?shù)厥褂肁I,會變成一個持續(xù)且重要的話題。當(dāng)一個新的技術(shù)革命到來時,其實人們往往是避無可避的,在這個視角下,正如人類面對的每一次技術(shù)機遇時那樣,認知技術(shù)、了解技術(shù)再努力去駕馭技術(shù)為人類所用才是我們?yōu)閿?shù)不多的理性選擇。