李璐璐
2022年5月7日,陳云霽展示由他帶領(lǐng)團隊研制的“寒武紀1號”芯片。
在聯(lián)系近一周之后,陳云霽才擠出時間接受了采訪。見面時,這位中科院計算技術(shù)研究所研究員正忙著編程序,辦公桌旁是一張折疊床,側(cè)面墻壁的白板上寫滿了各種結(jié)構(gòu)圖。目前,陳云霽正帶領(lǐng)團隊全力攻克處理器設(shè)計的共性技術(shù)壁壘?!耙恢痹诿?,每天都搞不清楚是星期幾!”他笑著說,“但只要把研究當成興趣,也不覺得累。”這位“80后”科學家,已在國產(chǎn)處理器芯片研制領(lǐng)域耕耘了20余年。
“讓計算機更聰明”“讓機器更好地服務(wù)人類”……這是陳云霽科研路上的夢想和追求。這份夢想在兒時便埋下了種子?!拔倚r候喜歡看書,家里書架上有很多工程、歷史類的書籍?!标愒旗V說,“我也喜歡玩游戲,街機、‘星際爭霸’等玩了不少?!睗u漸地,他對計算機產(chǎn)生了濃厚的興趣。
興趣和求知欲驅(qū)動的探索習慣為陳云霽的科研之路打下了良好的基礎(chǔ)。陳云霽從小在數(shù)學上展現(xiàn)出了過人的天賦,三年級時就學完了全部小學數(shù)學課程,9歲小學畢業(yè)時已經(jīng)把初中數(shù)學課程學完,同時考上了南昌十中的少年班。
14歲時,陳云霽考入中國科學技術(shù)大學少年班。大三時,他把計算機系所有實驗室的門敲了一遍,問是否接收本科生。最終,教計算機體系結(jié)構(gòu)的周學海教授所在的實驗室收下了他。在研發(fā)過程中,盡管做的都是些打下手的“雜活”,卻讓陳云霽感受到計算機的巨大魅力。2002年,陳云霽如愿以償來到了中科院計算所,跟隨胡偉武研究員碩博連讀。當時,計算所正在研制國產(chǎn)通用處理器(龍芯1號),陳云霽成為當時龍芯研發(fā)團隊中最年輕的成員。博士畢業(yè)后,陳云霽順理成章留在了計算所,成為8核龍芯3號的主要架構(gòu)師。 “龍芯3號與龍芯1號、2號有所不同,已從單核發(fā)展到多核了?!标愒旗V解釋說,“好比以前一桌菜給一桌客人吃,現(xiàn)在一桌菜要給8桌客人吃。”
在資源十分匱乏的條件下,陳云霽和同事們邊干邊摸索,提出訪存協(xié)處理器結(jié)構(gòu),有效緩解了龍芯3B運算帶寬比問題;提出片上多核處理器的有界誤差全局時鐘理論,解決了多核處理器驗證和調(diào)試的一系列難題,保障了龍芯3號的研制。研究成果論文被體系結(jié)構(gòu)領(lǐng)域旗艦會議HPCA(高性能計算架構(gòu)國際研討會)錄用,這也是HPCA上第一篇第一作者來自中國大陸的論文。2013年,時任中科院計算所所長孫凝暉讓年僅30歲、只做了1年研究員的陳云霽作為學術(shù)帶頭人主導智能處理器基礎(chǔ)研究。
2010年,以深度學習為代表的人工智能技術(shù)在全球范圍內(nèi)飛速發(fā)展,然而,智能算法規(guī)??焖僭鲩L,硬件系統(tǒng)的發(fā)展仍異常緩慢。為了解決這個矛盾,研究計算機架構(gòu)的陳云霽與計算所研究人工智能的同事展開了交流合作?!拔磥淼闹悄苡嬎阆到y(tǒng)應(yīng)該是什么樣的?”成為了陳云霽每天思考的問題。
科研路上,弟弟陳天石也來到了他的身邊。陳天石同樣畢業(yè)于中科大少年班。2007年,陳天石作為客座博士生從中科大來到了計算所,研究方向是人工智能算法。一個做硬件、一個做軟件,兄弟倆決定聯(lián)手做人工智能和芯片設(shè)計的交叉研究。這是他們年少時的一個想法:“做一個東西讓計算機更聰明,終極目標像人一樣聰明”。
當時,人工智能研究正處于低谷期,人工智能和芯片設(shè)計的交叉研究更不被業(yè)內(nèi)人士認可。學生們擔憂:做完研究,發(fā)不出論文是不是沒法畢業(yè)?項目申請也不順利,兄弟倆只能在日常工作之余開展研究。他們經(jīng)常吃過早飯就坐在電腦前不間斷地工作,等感覺餓了已是晚上。熬夜是家常便飯,累了就在折疊床上囫圇一覺……他們先后提出一系列基于人工智能方法的處理器研發(fā)技術(shù),多次向體系結(jié)構(gòu)頂級會議投稿,但都一一被拒?!袄щy一個接著一個,但問題解決之后的喜悅是常人無法體會的?!标愒旗V說。
陳云霽( 右一)與龍芯研發(fā)團隊成員合影(2007年1月1日攝)。
2022年5月7日,陳云霽(前右)與科研團隊。
功夫不負有心人。2014年,他們研制的國際上首個深度學習處理器芯片與電腦主板成功連接,能效達到傳統(tǒng)芯片的近百倍,圓滿實現(xiàn)預(yù)期目標。在美國鹽湖城召開的國際計算機體系結(jié)構(gòu)支持、編程語言和操作系統(tǒng)國際會議(ASPLOS)上,陳云霽與法國國立計算機及自動化研究院的奧利弗·特曼教授合作的“一種小尺度的高吞吐率機器學習加速器”,獲得了最佳論文獎。這是中國內(nèi)地科研機構(gòu)首次在計算機系統(tǒng)和高性能計算領(lǐng)域頂級國際會議上獲得最佳論文獎,也是亞洲首次、美國之外國家第二次獲得ASPLOS會議的最佳論文。以“DianNao”和“DaDianNao”中文拼音命名的深度學習處理器架構(gòu)正式出現(xiàn)在了計算機體系結(jié)構(gòu)的國際舞臺上。參加國際會議時,陳云霽一遍遍地給外國同行糾正發(fā)音,他自豪地說:“之前沒有中文發(fā)音的芯片,我們借此也傳播了中國文化?!?/p>
2021年7月27日-28日,第二十三屆中國科學技術(shù)協(xié)會年會在北京召開。圖為陳云霽在閉幕式上作《深度學習處理器》主旨報告。
這之后,陳云霽全身心投入實際芯片研發(fā),挑戰(zhàn)深度學習處理器芯片。他帶領(lǐng)團隊突破深度學習處理器設(shè)計中的規(guī)模、適配、能效三個核心挑戰(zhàn),最終,研發(fā)出國際首個深度學習處理器芯片“寒武紀”?!啊浼o’是顯生宙的開始,希望能開啟人工智能的新紀元?!标愒旗V說?!昂浼o”誕生的那一刻,陳云霽高興地隨手抓起身旁的拖把,和身邊的同學們即興表演了一段“棍棒舞”。
2018年2月,世界權(quán)威學術(shù)期刊《科學》雜志刊文稱,寒武紀的一系列成果為深度學習處理器領(lǐng)域作出了“開創(chuàng)性貢獻”,陳云霽和他的團隊被評價為該領(lǐng)域的先驅(qū)和引領(lǐng)者。陳云霽也被評為2015年度全球35位杰出青年創(chuàng)新者。
回顧科研生涯,陳云霽說:“從導師胡偉武身上,不僅學會如何設(shè)計芯片,更明白了一個深刻的道理,科學研究從來沒有捷徑可走,需要苦干實干。 ”
歷時十余年,深度學習處理器芯片已經(jīng)應(yīng)用在數(shù)千萬智能終端上,涉及智能手機、可穿戴設(shè)備、無人機和智能駕駛等多種場景。
除了研發(fā)強大的人工智能處理器,陳云霽尤為看重人工智能時代的生態(tài)布局?!伴_發(fā)芯片的同時,我們提出了一種與通用計算完全不同的指令集。”陳云霽解釋,指令集就是電腦硬件與軟件之間互相“對話”的語言,是構(gòu)筑信息產(chǎn)業(yè)生態(tài)的基礎(chǔ)之一。以往信息產(chǎn)業(yè)主要應(yīng)用X86和ARM兩種指令集,大部分軟件和應(yīng)用程序都以此為基礎(chǔ)開發(fā)——這讓所有后來者難以在傳統(tǒng)信息產(chǎn)業(yè)中做大做強。
“我們原來在這方面幾乎沒有發(fā)言權(quán),但智能時代給了一個機會?!标愒旗V說,“我們已經(jīng)邁出第一步,未來或許能夠建立起開放共贏的信息產(chǎn)業(yè)新生態(tài)?!彼?jīng)常用自己的經(jīng)歷啟發(fā)學生:“不要為了發(fā)論文而一味去追逐熱點,要努力去做那些未來有前景、現(xiàn)在沒被關(guān)注的方向。”
即使碩果累累、榮譽加身,對于陳云霽而言都已經(jīng)是過去時,如今的他,仍然奮斗在智能計算系統(tǒng)研究的前線?!翱茖W技術(shù)的發(fā)展路徑往往會出人意料。未來50年,計算機的計算能力將達到人類大腦的幾十億倍。智能硬件在提升計算能力的同時,也在推進著智能算法的快速發(fā)展。近乎無窮的計算能力也許會革新當前符號主義主導或聯(lián)結(jié)主義主導的已有智能計算范式,帶來人工智能能力的跨越式提升?!标愒旗V說,“作為一名科研人員,做未知領(lǐng)域的科研探索會很孤獨,特別是做別人沒有做過的無人區(qū),會更加孤獨。但是,在我看來,有科學理想的人應(yīng)該偏離一般意義的最優(yōu)路徑,有勇氣探索冷門、未知的領(lǐng)域,人工智能的星辰大海是他值得投入全部精力去探索奮斗的畢生事業(yè)。”
陳云霽喜歡引用茨威格在《人類群星閃耀時》的一段話:“一個人生命中最大的幸運,莫過于在他的人生中途,年富力強的時候,發(fā)現(xiàn)了自己的使命?!彼f:“能把興趣和工作結(jié)合在一起,我感覺特別幸運?!?/p>
1983年出生于江西南昌,中國科學院計算技術(shù)研究所副所長,研究員,博士生導師。主持的項目“深度學習處理器體系結(jié)構(gòu)新范式”獲2020年度國家自然科學獎二等獎。2022年,獲得“全國五一勞動獎?wù)隆薄?/p>