□ 劉婉茹
當今,人類社會正在經(jīng)歷著信息革命和數(shù)字化浪潮,這是繼農(nóng)業(yè)革命、工業(yè)革命之后的又一次歷史性巨變。誰能更好地認識和把握信息化大勢,誰就能贏得新的全方位綜合國力競爭。習近平總書記曾強調(diào):“我們不斷推進理論創(chuàng)新和實踐創(chuàng)新,不僅走出一條中國特色治網(wǎng)之道,而且提出一系列新思想新觀點新論斷,形成了網(wǎng)絡(luò)強國戰(zhàn)略思想?!庇绕涫请S著網(wǎng)絡(luò)規(guī)模的不斷擴大,網(wǎng)絡(luò)流量成了最高速的數(shù)據(jù)流,稱為網(wǎng)絡(luò)大數(shù)據(jù)。如何感知、測量、利用這些網(wǎng)絡(luò)大數(shù)據(jù)就成為眾多行業(yè)面臨的難題,成為學者們探索科技前沿的研究熱點。
北京大學(以下簡稱“北大”)就有一位80后學者,他年紀不大卻已在網(wǎng)絡(luò)大數(shù)據(jù)研究領(lǐng)域頗有建樹:他在計算機網(wǎng)絡(luò)排名第一的國際會議SIGCOMM 2014上發(fā)表了一篇路由表查找論文,該論文是當時“近10年來大陸科研機構(gòu)作為第一完成單位在該頂級會議上唯一發(fā)表的學術(shù)論文”。他在計算機網(wǎng)絡(luò)排名第一的會議SIGCOMM、數(shù)據(jù)庫方向排名第一的會議SIGMOD、大數(shù)據(jù)方向排名第一的會議SIGKDD這3個會議發(fā)表第一作者或通信作者論文共5篇。大陸單位尚沒有其他研究人員同時在SIGCOMM和SIGMOD這兩個會議上同時發(fā)表論文……他就是楊仝,北大信息科學技術(shù)學院網(wǎng)絡(luò)與信息系統(tǒng)研究所副教授。
顧名思義,網(wǎng)絡(luò)大數(shù)據(jù)即是指“人、機、物”三者在網(wǎng)絡(luò)空間中通過交互產(chǎn)生的,能夠通過網(wǎng)絡(luò)技術(shù)進行查詢和進一步使用的大量數(shù)據(jù)。IDC報告發(fā)布,據(jù)近年來大數(shù)據(jù)增長形式來看,到2020年,網(wǎng)絡(luò)大數(shù)據(jù)集合規(guī)模將實現(xiàn)35ZB。
飛速發(fā)展的網(wǎng)絡(luò)大數(shù)據(jù)好似一柄雙刃劍,既為人們深度挖掘
大數(shù)據(jù)功能和價值帶來了機遇,也對現(xiàn)有的網(wǎng)絡(luò)框架及處理方式帶來了新的挑戰(zhàn),尤其是體現(xiàn)在網(wǎng)絡(luò)大數(shù)據(jù)的核心問題上,即實時轉(zhuǎn)發(fā)和網(wǎng)絡(luò)測量。其一實時轉(zhuǎn)發(fā)問題不難理解。如同大量車流會引發(fā)交通堵塞一樣,網(wǎng)絡(luò)流速度太快時,也易導致網(wǎng)絡(luò)擁塞、中斷,繼而使互聯(lián)網(wǎng)應(yīng)用譬如微信、網(wǎng)頁等出現(xiàn)掉線、卡頓的現(xiàn)象。其二是測量統(tǒng)計。為了維護網(wǎng)絡(luò)質(zhì)量,需要及時準確地了解整個網(wǎng)絡(luò)的運行狀況,如是否存在擁塞、受到攻擊等現(xiàn)象。但網(wǎng)絡(luò)流量太快就給準確測量帶來巨大挑戰(zhàn)。
楊仝(左)參加國際會議
明知山有虎,偏向虎山行。不斷挑戰(zhàn)、敢于突破正是科技取得進步的先決條件。作為該領(lǐng)域的探索學者之一,進入北大信息科學技術(shù)學院網(wǎng)絡(luò)與信息系統(tǒng)研究所后,楊仝就向網(wǎng)絡(luò)大數(shù)據(jù)的這兩個核心問題吹響了沖鋒號。他向記者解釋道:“大數(shù)據(jù)應(yīng)用對現(xiàn)有存儲系統(tǒng)在性能、容量、可擴展性和可靠性等方面提出了重大技術(shù)挑戰(zhàn)。新型非易失性存儲器件(Non-Volatile Memory,NVM),如3D-Xpoint、憶阻器RRAM等,具有高性能、大容量和非易失等特性,彌補了現(xiàn)有存儲體系架構(gòu)中內(nèi)外存特性差異?;贜VM構(gòu)建大數(shù)據(jù)存儲軟硬件系統(tǒng),可以較好地滿足大數(shù)據(jù)存儲對容量、性能與功耗等方面的需求?!?/p>
2016年以來,他先后主持了兩項國家重點研發(fā)計劃的子課題研究,即“新型大數(shù)據(jù)存儲技術(shù)與平臺”的子課題與“高時效、可擴展的大數(shù)據(jù)計算模型、優(yōu)化技術(shù)與系統(tǒng)”的子課題。能夠肩負這樣的重任,對于高校老師來說是一個挑戰(zhàn)更是一種鼓勵,是落實網(wǎng)絡(luò)強國戰(zhàn)略的光榮使命。
對于基于新型存儲器件研制自主可控的大數(shù)據(jù)存儲軟硬件系統(tǒng),楊仝詳細地介紹道:“將重點圍繞基于新型存儲器件的大數(shù)據(jù)存儲體系結(jié)構(gòu)、大數(shù)據(jù)異構(gòu)融合存儲的高效系統(tǒng)軟件、大數(shù)據(jù)存儲可靠性理論與方法,以及大數(shù)據(jù)存儲評估理論與方法4個關(guān)鍵問題方面開展研究與實現(xiàn),并研制出包括自主知識產(chǎn)權(quán)的新型存儲器件NVM的控制器芯片等在內(nèi)的大數(shù)據(jù)軟硬件存儲系統(tǒng)?!?/p>
而在大數(shù)據(jù)存儲體系結(jié)構(gòu)方面,楊仝將重點研究基于新型存儲器件的高性能和高可擴展性的存儲體系結(jié)構(gòu),研究新型NVM的控制訪問方法和協(xié)議,設(shè)計實現(xiàn)基于ARM64架構(gòu)的NVM控制器芯片和基于x86 slave的NVM控制器等問題,以便實現(xiàn)支持系統(tǒng)的可擴展性。
實踐應(yīng)用是對科研成果的最好檢驗。如今,楊仝的部分科研成果已取得了可喜成果。2018年,其發(fā)表于ACM SIGKDD 2018論文的Heavy Guardian算法在“今日頭條”數(shù)據(jù)中心得到應(yīng)用,預(yù)計可節(jié)省軟硬件資源成本達1000萬元人民幣以上,具有良好的經(jīng)濟效益。
“不積跬步,無以至千里”,對于楊仝來說,成功申請國家重點研發(fā)計劃項目、屢獲行業(yè)重要榮譽,這些都是有根可循的。早在博士3年期間,楊仝已經(jīng)在這一領(lǐng)域顯示出自己的天賦,發(fā)表了多篇論文,獲得了國家獎學金、綜合一等獎學金、光華一等獎學金等。而他本人也被評為清華大學計算機系優(yōu)秀畢業(yè)生。
在多年的科研歷程中,這份優(yōu)秀一直跟隨著楊仝,并讓他一次又一次斬獲重要成果。在中國科學院計算技術(shù)研究所謝高崗課題組進行客座訪問期間,楊仝對路由器最核心的技術(shù)——路由查找發(fā)起挑戰(zhàn)。他和團隊其他成員在Intel x86 CPU等主流軟硬件平臺上實現(xiàn)了基于二維劃分思想的路由表查找框架,即SAIL算法。該算法框架的片內(nèi)存儲空間最大只需要4MB。測試結(jié)果表明,該算法的查找速度比常用路由表查找算法提高了7~60倍。該算法后來部署到了華為公司的某項網(wǎng)絡(luò)產(chǎn)品中,華為的應(yīng)用證明顯示:部署后,查找速度提高了一個數(shù)量級。
在計算機網(wǎng)絡(luò)領(lǐng)域最高水平的學術(shù)會議——ACM SIGCOMM 2014上,基于上述研究成果,楊仝發(fā)表了題為“Guarantee IP Lookup Performance with FIB Explosion(針對路由表爆炸增長,確保路由表查找性能)”的學術(shù)論文,成為“近10年來大陸科研機構(gòu)作為第一完成單位在該頂級會議上唯一發(fā)表的學術(shù)論文”的第一作者,轟動業(yè)界。SIGCOMM對論文的質(zhì)量和數(shù)量要求極高,質(zhì)量方面要求具有基礎(chǔ)性貢獻、領(lǐng)導性影響和堅實系統(tǒng)背景,每年只錄用30篇左右的正式會議論文,錄取率只有百分之十幾。由于SIGCOMM錄用的論文大多數(shù)都會被廣泛引用、具有非常大的影響力,因此能在SIGCOMM年會上發(fā)表論文是所有通信、網(wǎng)絡(luò)研究者的無上榮譽。這一榮譽的獲得是對楊仝科研成績的肯定,也成為他科研進程中一座重要的里程碑。
春種一粒粟,秋收萬顆子。多年來,一直在網(wǎng)絡(luò)大數(shù)據(jù)領(lǐng)域默默耕耘的楊仝,如今也迎來了豐收的喜悅:成為中國大陸地區(qū)以第一身份單位發(fā)表ACM SIGCOMM論文最多(2篇)的作者,獲得了2018年度ACM SIGCOMM China新星獎,全國僅3人獲此殊榮?!笆潜贝髮捤傻目蒲蟹諊芯克顣悦?、代亞非、崔斌老師的大力支持,才使我有機會做出成績?!睏钯跐M懷感激地說。初到北大時的那些往事,在他心中記憶猶新……
萬事開頭難。剛進北大時,楊仝沒有項目,也沒有學生,但辦公室、實驗室都需要繳納費用,李老師和代老師就主動幫他承擔了這筆費用,免去了他的后顧之憂。
與此同時,北大寬松的學術(shù)氛圍也讓他能夠在自己最感興趣的領(lǐng)域心無旁騖地搞研究。進入北大的這幾年中,楊仝90%的晚上、80%的周末都是在學校度過,寫代碼、做實驗幾乎成為他生活的全部。一分付出一分收獲,多篇頂級學術(shù)論文的發(fā)表就是楊仝對自己、對網(wǎng)絡(luò)所的最好回報。
興趣是最好的老師。熱愛學生的楊仝一直從學生的角度思考,希望能夠真正激發(fā)出學生們的興趣,從而取得更好的教學效果?!皩W生們都很聰明,我常常和學生們一起討論,如果有分歧,就用實驗來證明誰的想法更好,這種頭腦風暴更能激發(fā)學生思考。尤其是當你發(fā)現(xiàn)你的算法比以往的都要好特別多的時候,那簡直比發(fā)表論文還開心?!背錾目蒲心芰?、對學生們的悉心教導,不僅使楊仝連續(xù)兩年在北大信息科學技術(shù)學院年終考核中被評為優(yōu)秀,而且他指導的兩名本科生畢業(yè)設(shè)計論文也被評為了“信科十佳本科畢設(shè)論文”。
“科技興則民族興,科技強則國家強”。在國家對科技創(chuàng)新高度重視的大背景下,在信息科學技術(shù)學院所有老師的共同努力下,如今北大計算機科學與信息系統(tǒng)學科已在2019 QS世界大學學科排名中躋身前20,在中國大陸高校中名列前茅。未來,楊仝還將奮力求索,用科研創(chuàng)新助力網(wǎng)絡(luò)強國的崛起。