干思思
計算機體系結(jié)構(gòu),處于軟硬這一“接口”位置,對計算機指令、硬件功能分配和對軟件、硬件界面確定等,承擔著基本的“規(guī)劃”功能。隨著摩爾定律放緩和新興應用不斷涌現(xiàn),如何改進計算機體系結(jié)構(gòu)來滿足應用不斷增長的需求,成為一個重要課題。對此,圖靈獎得主約翰·軒尼詩(John Hennessy)和大衛(wèi)·帕特森(David Patterson)指出了計算機體系結(jié)構(gòu)未來發(fā)展趨勢——“領域定制的軟硬件協(xié)同設計”,并稱“計算機體系結(jié)構(gòu)領域?qū)⒂瓉硐乱粋€黃金時代”。這也是北京大學高能效計算與應用中心副教授孫廣宇從研十余年以來一直在努力的方向。
尋尋覓覓:微光點亮的夢想
孫廣宇在清華電子系和原微電子所度過自己的本科和碩士階段,并在學校專項資金的支持下獲得了參與國際學術(shù)會議的機會。在一次學術(shù)會議中,孫廣宇遇到了同樣畢業(yè)于清華大學電子系、在計算機體系結(jié)構(gòu)領域赫赫有名的謝源教授。“和謝老師的交流讓我受益頗多?!睂O廣宇回憶道。在謝源教授的建議下,孫廣宇申請了美國賓夕法尼亞州立大學的博士學位,并于2006年成為計算機體系結(jié)構(gòu)方向的新晉博士生。
然而孫廣宇的博士研究并不是一帆風順的?!芭c我所學的集成電路設計不同,我第一位導師是典型的計算機系背景出身的專家,在研究中他更偏向系統(tǒng)的相關(guān)環(huán)節(jié)。盡管都在體系結(jié)構(gòu)的大領域,但這種學習背景帶來的差別仍是當時的我難以在短時間內(nèi)逾越的。”更嚴重的是,孫廣宇初期欠佳的表現(xiàn)讓他的導師要放棄對其研究經(jīng)費的資助。研究進展緩慢、時刻面臨“斷費”,這樣窘迫的境況幾乎澆滅了孫廣宇的斗志。
就在這個時候,謝源向他伸出了援手。經(jīng)過一番深入交談,謝源主動提出,讓孫廣宇轉(zhuǎn)投自己名下。謝源相信,只要讓孫廣宇回到“合適的軌道”上,他一定可以取得不錯的成績。時隔多年,回憶起當時的經(jīng)歷,孫廣宇仍難掩感激之情:“謝老師對我的幫助,不是一個簡單的、慷慨的故事,他對我研究經(jīng)費、學習方法、論文寫作乃至生活細節(jié)方方面面的幫助,是我得以繼續(xù)攻讀博士最主要的力量。如果當時沒有謝老師的幫助和認可,可能我走的路就和現(xiàn)在完全不同了?!?/p>
孫廣宇也沒有讓謝源失望?!稗D(zhuǎn)換賽道”之后,他終于打破了博士初期的“沉默”狀態(tài),一系列論文相繼發(fā)表。在與包括杜克大學陳怡然教授在內(nèi)的業(yè)內(nèi)翹楚合作的過程中,孫廣宇得以觸摸計算機體系結(jié)構(gòu)的前沿理論和全新器件,他的畢業(yè)論文《基于新型非易失存儲的體系架構(gòu)設計探索》,更是榮獲2012年歐洲設計自動化協(xié)會優(yōu)秀博士論文獎。
這段求學從研經(jīng)歷,開拓了孫廣宇的科研視野,也讓他篤定地走在自己所選的研究道路上。面對未來的選擇,他沒有猶豫:“我出國的時候就決定,我畢業(yè)之后一定要回國。”2011年,在導師謝源的推薦下,剛剛成立的北京大學高能效計算與應用中心向?qū)O廣宇遞出了橄欖枝。感佩于恩師和北京大學的肯定,孫廣宇即刻打點行裝,回到了暌違5年的祖國。
兢兢業(yè)業(yè):青春在科研中閃光
入職后,孫廣宇開始思考“新型計算機體系結(jié)構(gòu)”這一關(guān)鍵核心技術(shù)的破題思路,他決定在新型存儲架構(gòu)和定制計算架構(gòu)兩個方向開展跨層次的研究。
計算機系統(tǒng)中存儲引起的性能開銷和所消耗的能量逐漸增加,而各種新型的非易失存儲器件(NVM)具備大容量、低功耗的優(yōu)點。就此,孫廣宇團隊首先對新型NVM的設計空間進行量化抽象建模,根據(jù)模型實現(xiàn)性能、能耗等設計目標優(yōu)化的快速架構(gòu)探索,進一步提出可擴展、可重構(gòu)的宏單元代替?zhèn)鹘y(tǒng)的固定器件建模單元;并首次提出基于STT-RAM+SRAM的“混合緩存架構(gòu)”,根據(jù)數(shù)據(jù)請求的優(yōu)先級優(yōu)化“混合緩存架構(gòu)”中的數(shù)據(jù)管理,設計了相應的數(shù)據(jù)分配、替換以及遷移策略,有效地提升了新型NVM數(shù)據(jù)訪存性能,同時降低了訪存功耗;此外針對新型NVM獨有的錯誤機制,提出“定位糾錯編碼(p-ECC)”緩存等糾錯架構(gòu),實現(xiàn)了可靠性和能效之間的設計權(quán)衡。
同時,孫廣宇構(gòu)建的高能效、高安全性存儲系統(tǒng)架構(gòu)對于數(shù)據(jù)中心帶來了提升。孫廣宇團隊和百度合作提出將鍵值對存儲(KV存儲)和開放通道式固態(tài)硬盤(SSD)整合在一起,利用開放式通道SSD高并發(fā)的優(yōu)點,對I/O調(diào)度和分發(fā)策略進行優(yōu)化;同時提出了能夠?qū)⒍喾N應用進行混合部署的高效分布式存儲系統(tǒng),有效提升存儲系統(tǒng)利用率并節(jié)省成本;在數(shù)據(jù)中心可信計算場景下,針對不經(jīng)意隨機存儲(ORAM)安全協(xié)議實際應用中存在大量冗余訪存等問題,以路徑合并、緩存優(yōu)化與數(shù)據(jù)復本技術(shù),將ORAM系統(tǒng)的訪存性能顯著提升;此外針對內(nèi)存數(shù)據(jù)庫的索引與跨步訪問等問題,利用新型NVM的特點,設計出一種同時支持行和列訪問的對稱內(nèi)存架構(gòu),可以降低設計成本并提升能效。
隨著深度學習等新興應用領域的拓展,孫廣宇開始針對其應用特點設計定制化的計算機體系結(jié)構(gòu)。由“通用”轉(zhuǎn)向“專用”,是他在這一方向的主要研究形式。以深度學習領域為例,孫廣宇與叢京生教授等合作,提出基于Roofline模型的卷積神經(jīng)網(wǎng)絡加速器設計方法,對計算單元、片上存儲、帶寬等資源進行抽象來構(gòu)造設計空間,并根據(jù)優(yōu)化目標自動探索空間尋找最優(yōu)方案;為提高基于現(xiàn)場可編程邏輯門陣列(FPGA)的神經(jīng)網(wǎng)絡加速器芯片設計效率,提出一系列自動化設計方法,將深度學習框架(如Caffe、TensorFlow)輸出的網(wǎng)絡模型自動化部署到FPGA上,達到同時期最好水平加速性能;同時結(jié)合新型NVM相關(guān)研究成果,提出針對深度學習存內(nèi)計算架構(gòu),可顯著提升深度學習網(wǎng)絡處理能效。
目前,孫廣宇累計發(fā)表論文百余篇,獲最佳論文獎3次、最佳論文提名獎3次,獲CCF-IEEE CS青年科學家獎和“CCF-Intel青年學者提升計劃”支持,并主持和參與多項科研項目。這個執(zhí)著于構(gòu)建新型計算機體系結(jié)構(gòu)的“設計師”,正以他自己的形式,推動這一領域的發(fā)展。
日日夜夜:照亮前行的方向
以10年為期,孫廣宇這樣概括自己在北京大學工作的時光:“5年的沉淀積累,5年的實踐摸索?!鼻?年時間,孫廣宇用來探索行業(yè)的前沿地帶,同時適應高校教師的新身份。在他看來,這段時光“和創(chuàng)業(yè)很像”。與學生一道摸索前行,探秘科研的“無人區(qū)”。談及與學生的相處,孫廣宇笑稱:“他們是團隊的成員,也是同行的戰(zhàn)友。我對他們的唯一要求,就是要明確自己未來的規(guī)劃是怎樣的。學研究是很苦的,尤其是博士階段的‘深研究。這不是一種技能的培訓,我更希望培養(yǎng)他們解決問題的勇氣和魄力。在這個過程中,或許有彎路,但是我們一起走過,功不唐捐。在這個過程中,學生對我的信任也幫助我更好地理解了教師這個角色,不斷壯大的團隊也讓我對于科研更有信心?!?/p>
此外,孫廣宇也深知“紙上得來終覺淺”的道理,在北京大學高能效計算與應用中心工作的第二個5年,他積極推動技術(shù)轉(zhuǎn)化,領域定制的存儲與加速器系統(tǒng)等成果已在實際平臺和產(chǎn)品上進行驗證和應用,關(guān)于高能效計算機體系結(jié)構(gòu)的研究課題得到華為、百度、美國超微半導體公司(AMD)、微軟、字節(jié)跳動等公司項目的支持。
在孫廣宇看來,面向新興計算應用,結(jié)合集成電路設計和新型器件等內(nèi)容的新型計算機體系結(jié)構(gòu)領域,能為我國解決“卡脖子”難題提供新思路?!熬拖裆w房子一樣,或許我們目前無法獲得頂尖的建筑材料,但可以通過更巧妙的結(jié)構(gòu)設計,在現(xiàn)有條件下蓋出頂尖的房子?;氐接嬎銠C體系結(jié)構(gòu)領域,在我國芯片制造工藝與國際頂尖水平有一些差距的情況下,通過結(jié)構(gòu)設計,使整體效果同樣達到國際領先水平,這就是我要做的事情?!笨?/p>
(責編:唐一白)