◎本刊特約記者◎陸金路
他是中國工程院院士;
他是清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授;
他實(shí)現(xiàn)了中國存儲系統(tǒng)從“一張白紙”到世界領(lǐng)先的突破;而今70多歲的他依舊踐行著“為祖國健康工作50年的”誓言……
初見鄭院士,看著他走路時矯健的步伐、談起專業(yè)來激情澎湃的樣子,你很難想象這是一位70多歲的老人。
說起清華大學(xué),鄭緯民院士印象最深的還是時任校長蔣南翔先生對學(xué)生提出的那句口號:“為祖國健康工作50年”。鄭緯民院士始終記得這句承諾,記得清華大學(xué)對他的培養(yǎng)。從1970年畢業(yè)到如今,他已經(jīng)為祖國健康工作51年了,但在他看來這還遠(yuǎn)遠(yuǎn)不夠。
科研的道路不會一帆風(fēng)順,在這個過程中,鄭緯民院士始終把清華大學(xué)的校訓(xùn)記在心里——“自強(qiáng)不息,厚德載物”。作為我國網(wǎng)絡(luò)存儲領(lǐng)域的領(lǐng)軍人物,他一直強(qiáng)調(diào)搞科研要自立自強(qiáng),要做自主可控的產(chǎn)品。“要做有用的人,有用的事,先進(jìn)的事”他始終把這句話掛在嘴邊。
20年前,在存儲領(lǐng)域有個叫網(wǎng)絡(luò)存儲器的東西,它并不是簡單意義上的硬盤。這個設(shè)備有很多優(yōu)點(diǎn),但是在當(dāng)時情況下,我們自己還不會做這個東西,就只能依靠購買外國產(chǎn)品。日本、美國的幾家公司看中了我國當(dāng)時無法生產(chǎn)網(wǎng)絡(luò)存儲器的現(xiàn)狀,把價(jià)格定得很高,甚至比主機(jī)賣的還要貴。為了打破這一現(xiàn)狀,鄭緯民院士和團(tuán)隊(duì)暗下決心:一定要做一個自主可控的有知識產(chǎn)權(quán)的網(wǎng)絡(luò)存儲器!
在存儲系統(tǒng)領(lǐng)域,中國曾是“一張白紙”。1965年,當(dāng)鄭緯民考入清華大學(xué)自動控制系的時候,算法、存儲、系統(tǒng)等基礎(chǔ)理論研究,國內(nèi)還比較落后,沒有人能準(zhǔn)確判斷中國計(jì)算機(jī)事業(yè)將會怎樣。2016年,鄭緯民院士和團(tuán)隊(duì)獲得了“戈登·貝爾獎”,這個獎項(xiàng)曾被譽(yù)為世界超級計(jì)算機(jī)應(yīng)用領(lǐng)域的“諾貝爾獎”,鄭緯民院士帶領(lǐng)團(tuán)隊(duì)實(shí)現(xiàn)了我國高性能計(jì)算機(jī)應(yīng)用成果在該獎項(xiàng)上零的突破。從1965年到2016年,這51年的漫長時光里,鄭緯民院士一直在路上。
提起獲得“戈登·貝爾”獎的往事,這位70多歲老人眼里的“光”更亮了。2016年,鄭緯民帶領(lǐng)團(tuán)隊(duì)做了一個天氣預(yù)報(bào)的軟件,這個“千萬核可擴(kuò)展大氣動力學(xué)全隱式模擬”聯(lián)合成果獲得“戈登·貝爾”獎,實(shí)現(xiàn)了我國在此大獎上零的突破。2017年,清華團(tuán)隊(duì)再次借助“神威·太湖之光”超級計(jì)算機(jī),成功設(shè)計(jì)實(shí)現(xiàn)了高可擴(kuò)展性的非線性地震模擬軟件,再次斬獲“戈登·貝爾”獎。兩次獲獎,鄭緯民院士及其團(tuán)隊(duì)付出的努力不言而喻。
51年的時間,鄭緯民院士在和團(tuán)隊(duì)攻關(guān)的過程中,遇到過不少“卡脖子”的事情,但在鄭緯民院士的心里一直明白,人家國外要卡你脖子,最主要的原因還是因?yàn)槲覈谶@方面不行??ú豢ú弊?,關(guān)鍵看自己。就像網(wǎng)絡(luò)存儲器一樣,當(dāng)我們自己掌握這門技術(shù),我們自己會做了,國外就卡不了脖子了。因此,鄭緯民院士一直在想辦法提高我國這方面的技術(shù)水平,不管是計(jì)算機(jī)芯片也好、軟件也好、應(yīng)用也好……當(dāng)我們能做好,國外就沒有辦法制約我們了。
鄭緯民院士所處的領(lǐng)域——計(jì)算機(jī)體系結(jié)構(gòu),在之前很多年都不是熱門,甚至有些冷門,直到近年才慢慢被重視。當(dāng)整個行業(yè)醉心于研究各類復(fù)雜精巧的算法時,鄭緯民院士卻敏銳地意識到數(shù)據(jù)存儲技術(shù)的廣闊發(fā)展前景。
鄭緯民院士告訴記者,在過去,做系統(tǒng)的人相對較少,主要通過向國外購買的方式獲得,因此自己就不去做了。但是國外一旦不賣給你,該怎么辦?并且在早些時候,大家都喜歡做算法,后來發(fā)現(xiàn)互連也很重要,最近這幾年,則是以存儲為中心了。同時,隨著數(shù)字化、信息化的發(fā)展,數(shù)據(jù)量增加的非???,數(shù)據(jù)量也很大,這樣的數(shù)據(jù)要放在哪里?這成為了一個現(xiàn)實(shí)問題。如果把數(shù)據(jù)放在國外的存儲系統(tǒng)里,總歸是不安全的。所以,鄭緯民院士和團(tuán)隊(duì)下定決心,一定要做自己的存儲系統(tǒng),這樣才能保證安全。雖然剛開始的時候,性能、功能會稍弱一些,但是也不要緊,我們總歸是會把它做好的。
在鄭緯民院士看來,自己專業(yè)的冷門表現(xiàn)在,學(xué)生報(bào)考博士生的時候不太喜歡到這個專業(yè)來。在他們眼里,這個專業(yè)讀起來太辛苦!要6-7年才能畢業(yè),畢業(yè)文章也不好寫。其他偏算法類專業(yè)的博士生可能4年就畢業(yè)了,但這個專業(yè)卻要花費(fèi)更多的時間。最近幾年,情況好轉(zhuǎn)了不少。鄭緯民院士告訴記者,隨著被重視程度的提高,國內(nèi)很多公司都要做系統(tǒng),比如華為、阿里、騰訊,都很需要系統(tǒng)專業(yè)人才。因此從鄭緯民院士組里畢業(yè)的學(xué)生很受重視和歡迎。所以,近年來到鄭緯民院士專業(yè)組的人很多。特別是近年來,從計(jì)算機(jī)系畢業(yè)最優(yōu)秀的本科生大多數(shù)選擇不出國,就留在清華大學(xué),留在鄭緯民院士的組里,繼續(xù)為國家計(jì)算機(jī)事業(yè)攻關(guān)。說到這里,鄭緯民院士感到非常欣慰?!昂苄量啵且灿袠啡?,我們很想把這件事情做好”鄭緯民院士這樣告訴記者。
在教學(xué)上,鄭緯民院士一直鼓勵學(xué)生跨領(lǐng)域?qū)W習(xí)。比如,要做天氣預(yù)報(bào)軟件,怎么樣才能把天氣預(yù)報(bào)這個程序?qū)懞??這就需要做這個程序的人既懂大氣方面的專業(yè)知識,又要懂計(jì)算機(jī)。鄭緯民院士告訴記者,清華大學(xué)在幾年前成立了一個地學(xué)中心,里面涉及了一些跟天氣預(yù)報(bào)有關(guān)的研究。當(dāng)時,鄭緯民院士找來了一位青年教師,問他有沒有興趣做交叉研究?并給這位年輕老師出了一個主意:首先把天氣預(yù)報(bào)專業(yè)本科四年的書全部讀一遍,一邊讀一邊做。這位年輕老師按照鄭緯民院士的方法,真的把那些書都找來讀了。后來,他做出來的天氣預(yù)報(bào)軟件比那些只懂計(jì)算機(jī)的人做出來的優(yōu)秀得多,現(xiàn)如今這位年輕教師已然是天氣預(yù)報(bào)領(lǐng)域的專家了!
交叉學(xué)科,要兩者結(jié)合才能做好。學(xué)氣象的人要懂計(jì)算機(jī)結(jié)構(gòu),學(xué)計(jì)算機(jī)的人要懂氣象專業(yè)知識。這樣才是真正意義上的學(xué)科交叉。鄭緯民院士曾經(jīng)帶過一個碩士生,他就是原搜狗公司CEO王小川。他當(dāng)時的研究方向是搜索引擎。后來,他想通過計(jì)算機(jī)做一款基因拼接軟件,當(dāng)時的他對生物學(xué)很感興趣。鄭緯民院士很鼓勵他這一想法,并且告訴他要把生物基因的書讀一遍。后來他在鄭緯民院士的鼓勵下做出了一款基因拼接軟件。
在鄭緯民院士看來,學(xué)科交叉就是深度交叉,只有做到深度交叉,才會獲得成功。在教學(xué)的道路上,他一直這樣鼓勵學(xué)生。
“鼓勵年輕人從頭做先進(jìn)的系統(tǒng)軟件”是鄭緯民院士對于人才培養(yǎng)的思考。他一直倡導(dǎo),做系統(tǒng)軟件要從頭做。從頭并不是基于開源軟件在上面修改,而是鼓勵學(xué)生從頭寫。并且還要寫的比原來的軟件更好、更先進(jìn)。“從頭”、“先進(jìn)”這兩點(diǎn)在鄭緯民院士心中十分重要。
鄭緯民院士說,過去,中國人從0到1這件事情做的少,而在從100到110這件事上做的多。這并不是說從100到110不好,而是我們更需要從“0”到“1”這種突破。尤其是現(xiàn)在,就是“從頭做先進(jìn)軟件”的時候了!我們現(xiàn)在有這個底氣這樣說。這樣的底氣從何而來?鄭緯民院士給出答案……
鄭緯民院士和團(tuán)隊(duì)最近做了一個分布式文件系統(tǒng),這個系統(tǒng)就是鄭緯民院士和團(tuán)隊(duì)從頭開始做的。這個文件系統(tǒng)做完后安裝在了鵬城實(shí)驗(yàn)室“鵬城云腦II”這臺機(jī)器上。值得關(guān)注的是,“鵬城云腦Ⅱ”于去年11月和今年7月接連兩期奪得IO500總榜和10節(jié)點(diǎn)榜的雙料世界冠軍。11月12日,第三屆中國超級算力大會(ChinaSC 2021)在北京舉行,會上發(fā)布了2021國際人工智能性能AIPerf500排行榜,鵬城實(shí)驗(yàn)室“鵬城云腦II”人工智能超算大科學(xué)裝置蟬聯(lián)排行榜冠軍,彰顯了其強(qiáng)大的智能算力優(yōu)勢。今年5月份,“鵬城云腦Ⅱ”還在具有較大業(yè)界影響力的“MLPerf training V1.0”基準(zhǔn)測試中取得了圖像處理領(lǐng)域模型性能第二名和自然語言處理領(lǐng)域模型性能第一名的好成績。
通過這個案例,我們就能理解為什么鄭緯民院士說“現(xiàn)在是時候從頭做先進(jìn)軟件”了。
當(dāng)前5G、大數(shù)據(jù)、人工智能等興新技術(shù)迅速發(fā)展,賦予了各行各業(yè)新的發(fā)展機(jī)遇。未來,網(wǎng)絡(luò)存儲領(lǐng)域如何發(fā)展?
在存儲系統(tǒng)方面,鄭緯民院士一直在做一個大容量、高可靠的存儲系統(tǒng)。這是因?yàn)椋鎯ο到y(tǒng)里硬盤是有壽命的,一旦硬盤損壞,里面的數(shù)據(jù)就存在丟失的風(fēng)險(xiǎn)。為此,鄭緯民院士及其團(tuán)隊(duì)特別想做的就是,硬盤損壞后,里面的數(shù)據(jù)是否可以保留下來。鄭緯民院士介紹說,要達(dá)到這個目的,通常辦法有兩個。第一個方法,在存數(shù)據(jù)的時候存三份,一份數(shù)據(jù)壞了,還有另外兩份數(shù)據(jù),用這個辦法來保證硬盤壞了數(shù)據(jù)不會丟。但是這個辦法的不好之處在于,要多買200%的硬盤。第二個方法,用RAID 5、RAID6的方法做,這個方法的好處在,假如有5塊盤,它允許一塊盤壞,還有4塊盤是好的,就能把數(shù)據(jù)恢復(fù)出來。但是這個方法的缺點(diǎn)就在,一個盤壞了,一定要趕快把這塊盤拔出來,把一塊新的盤插進(jìn)去,這樣才能做數(shù)據(jù)恢復(fù),如果沒有及時把壞盤拔出來,又有一塊盤壞了,那數(shù)據(jù)就丟了。這也是現(xiàn)在數(shù)據(jù)中心管機(jī)器的人最怕的事。
這兩年,鄭緯民院士和團(tuán)隊(duì)做了一個叫糾刪碼的東西,糾刪碼就是為了恢復(fù)數(shù)據(jù)用的。鄭緯民院士介紹說,比如一部電影,分成32段,把每一段都存到一個硬盤里去,存進(jìn)去的同時做一個運(yùn)算,產(chǎn)生糾刪碼。32段電影存入,就產(chǎn)生了16段糾刪碼。這16段糾刪碼,就是為了恢復(fù)數(shù)據(jù)用。它的好處在于當(dāng)小于等于16塊硬盤壞掉都沒有關(guān)系,數(shù)據(jù)都能恢復(fù)出來。
鄭緯民院士的下一個目標(biāo)是:研究一款存儲系統(tǒng),即使盤壞了,數(shù)據(jù)也不會丟;有人來偷數(shù)據(jù),即使偷走了也沒有用。“高可靠、自維護(hù)、高安全”是鄭緯民院士對于存儲系統(tǒng)的要求,也是未來行業(yè)發(fā)展趨勢。
“做有用的人、做有用的事”是鄭緯民院士對團(tuán)隊(duì)每一位成員提出的要求,也是他終身踐行的目標(biāo)。
從“0”到“1”,中國存儲系統(tǒng)的未來到底行不行?
“我看行!”這是一位院士對中國未來計(jì)算機(jī)事業(yè)蓬勃發(fā)展的信心。