陳紅梅等
摘要:高性能計算已被公認為繼理論科學(xué)和實驗科學(xué)之后的第三大科學(xué)研究方法,是科技創(chuàng)新的重要手段。高性能計算機經(jīng)過幾十年的發(fā)展,經(jīng)歷了向量機、MPP、集群等幾個階段,我國高性能計算機的研制和應(yīng)用也得到了快速發(fā)展。國內(nèi)多所高校和科研院所紛紛構(gòu)建高性能計算平臺,江漢大學(xué)也構(gòu)建了自己的高性能計算平臺。對高性能計算機發(fā)展歷程進行了梳理,并分析了其現(xiàn)狀,重點介紹了江漢大學(xué)高性能計算平臺。
關(guān)鍵詞:高性能計算機;向量機;MPP;集群;中國TOP100;國際TOP500
中圖分類號:TP3-0
文獻標(biāo)識碼:A 文章編號:1672-7800(2015)003-0007-02
0 引言
目前,高性能計算科學(xué)與技術(shù)已成為世界各國競相爭奪的戰(zhàn)略制高點[1]。一些發(fā)達國家和發(fā)展中國家紛紛制定戰(zhàn)略計劃,投入大量資金,加速研究開發(fā)步伐。美國從20世紀70年代起就實施了一系列推動計算科學(xué)發(fā)展的國家計劃,包括“戰(zhàn)略計算機計劃”(SCP)、“高性能計算和通訊計劃”(HPCC)、“加速戰(zhàn)略計算計劃”(ASCI)、“先進計算設(shè)施伙伴計劃”(PACI)等。
1 高性能計算機發(fā)展歷程
從20世紀70年代產(chǎn)生第一代高性能計算機開始,經(jīng)過幾十年的發(fā)展,高性能計算機經(jīng)歷了向量機、MPP、集群等幾個發(fā)展階段。
1.1 向量機
1974年,控制數(shù)據(jù)公司(Control Data Corporation,CDC)推出了CDC STAR-100,它是首先使用向量處理器(Vector Processor)的計算機,被認為是第一臺向量機。1982年,克雷公司生產(chǎn)的Cray X-MP/2誕生,它是世界上第一部并行向量計算機。Cray X-MP系列計算機基于并行向量處理機結(jié)構(gòu),并行向量處理機是將向量處理器直接并行的一種體系結(jié)構(gòu)。
當(dāng)時的并行向量機占領(lǐng)高性能計算市場達20年之久,并行向量機處理器數(shù)目的增加,使得定制費用和維護費用越來越昂貴,性價比越來越低,已難以滿足高性能計算機市場化的要求。
1.2 MPP
自20世紀90年代開始,基于微處理器的大規(guī)模并行處理(Massively Parallel Processing, MPP)計算機逐漸成為高性能計算機的主流。大規(guī)模并行處理計算機是指由大量結(jié)點通過高帶寬低延時的專有網(wǎng)絡(luò)互聯(lián)而組成的大規(guī)模計算機,其中每一個結(jié)點由處理器/緩存、局部存儲器和網(wǎng)絡(luò)接口電路構(gòu)成。
MPP系統(tǒng)使用專門的網(wǎng)絡(luò)和操作系統(tǒng)。隨著個人計算機的發(fā)展,集群出現(xiàn)了。
1.3 集群
20世紀90年代中期,個人電腦市場日趨成熟。并且,局域網(wǎng)技術(shù)也快速發(fā)展,在帶寬和延遲上與傳統(tǒng)高性能計算機所采用的專有網(wǎng)絡(luò)的差距也日漸縮小。在軟件方面,1991年出現(xiàn)的Linux操作系統(tǒng),至1994年已經(jīng)相當(dāng)穩(wěn)定,1993年發(fā)布了基于消息傳遞的并行程序設(shè)計標(biāo)準MPI。
集群系統(tǒng)是使用高速通信網(wǎng)絡(luò)將多臺原本獨立、完整的微機或工作站連接在一起,構(gòu)成一個統(tǒng)一的整體,使之可作為一種單一的計算資源來使用[2]。與SMP和MPP相比,集群具有更高的可擴展性、可用性和易維護性,而且價格低、性價比高。
2 我國高性能計算機發(fā)展現(xiàn)狀
國際上,自1993年起每年都會按Linpack的測試性能公布世界范圍內(nèi)已安裝的前500臺高性能計算機排行。2002年之前,我國高性能計算機未曾向國際申報Linpack性能測試結(jié)果,故而未列入國際TOP500排行榜。從2002年起,中國軟件行業(yè)協(xié)會數(shù)學(xué)軟件分會聯(lián)合中國計算機學(xué)會高性能計算專業(yè)委員會與國家“863”高性能計算機評測中心,每年11月在其網(wǎng)站(www.samss.org.cn)及國內(nèi)主要相關(guān)媒體上公開發(fā)布國內(nèi)(目前限于大陸)已經(jīng)安裝運行的、公開的、以Linpack作為基準測試程序(Benchmark)測試的性能最高的100臺計算機系統(tǒng)名單——中國高性能計算機百強(China Top 100 List of High Performance Computing,簡稱中國TOP100)[3]。這一舉動,為促進我國高性能計算機的研制及在眾多領(lǐng)域的應(yīng)用推廣作出了積極貢獻。
在中國高性能計算機排行榜首次發(fā)布的2002年,排行榜中名列第一的聯(lián)想深騰1 800萬億次機群名列該年國際TOP 500排行榜的第43名。2003年,在中國TOP 100排行榜中名列第一的聯(lián)想深騰6 800萬億次機群名列該年國際TOP500第14名。2004年,在中國TOP100排行榜中名列第一的由中科院計算技術(shù)研究所研制的曙-4000A取得了6月份國際TOP500排行榜第10的歷史性突破。2009年10月發(fā)布的由國防科技大學(xué)研制的“天河一號”千萬億次超級計算機以563.1 TFlops的Linpack性能名列2009年11月世界TOP500排行榜的第5名。2010年9月發(fā)布的國產(chǎn)“天河-1A”千萬億次超級計算機以2.56 PFlops的Linpack性能奪取2010年11月世界TOP500排行榜的第一名,是中國國產(chǎn)超級計算機首次奪得世界冠軍。2013年,部署于廣州超級計算中心、由國防科技大學(xué)研制的“天河二號”以33.863 PFlops的Linpack性能奪得國際TOP500排行榜首位。以上數(shù)據(jù)充分展現(xiàn)了我國高性能計算機的研發(fā)能力,證明我國已經(jīng)成為了高性能計算強國。
3 江漢大學(xué)高性能計算平臺
隨著高性能計算機和計算方法的快速發(fā)展,物理、化學(xué)、生物等學(xué)科對計算資源有著迫切需求,國內(nèi)多所高校和科研院所紛紛開始構(gòu)建高性能計算平臺[4]。江漢大學(xué)高性能計算平臺就是在這樣的背景下構(gòu)建的。平臺是集群結(jié)構(gòu),采用DELL模式構(gòu)建, 包括19個計算節(jié)點、2個I/O節(jié)點、2個登陸節(jié)點、1個管理節(jié)點、1組管理網(wǎng)絡(luò)、1組計算網(wǎng)絡(luò)。
19個計算節(jié)點包括:16個刀片式計算節(jié)點和2個GPU計算節(jié)點,每個節(jié)點2個CPU,每個CPU 12核,主頻2.6GHz,節(jié)點內(nèi)存64GB;一個胖節(jié)點,配置為4個CPU,每個CPU 8核,主頻2.0GHz,節(jié)點內(nèi)存1TB。I/O節(jié)點和登陸節(jié)點為:每個節(jié)點2個CPU,每個CPU 8核,主頻2.0GHz,節(jié)點內(nèi)存64GB; 管理節(jié)點為:每個節(jié)點2個CPU,每個CPU 6核,主頻2.0GHz,節(jié)點內(nèi)存64GB。
計算網(wǎng)絡(luò)使用56Gbps速率的Infiniband網(wǎng)絡(luò)將刀片式計算節(jié)點、GPU計算節(jié)點、胖節(jié)點、登陸節(jié)點和I/O節(jié)點全部相連。管理網(wǎng)絡(luò)通過萬兆以太網(wǎng)將計算節(jié)點、登陸節(jié)點、I/O節(jié)點和管理節(jié)點全部相連。
江漢大學(xué)高性能計算平臺操作系統(tǒng)為Redhat Linux Server 6.4,應(yīng)用開發(fā)環(huán)境軟件為Intel Cluster Studio軟件工具包,作業(yè)調(diào)度系統(tǒng)為IBM Platform。
參考文獻:
[1] 周興銘.高性能計算技術(shù)發(fā)展[J].自然雜志,2011,33(5):249-254.
[2] 趙玉廣,孫愛國,郎美娜,等.基于集群技術(shù)的高性能計算系統(tǒng)研究平臺的構(gòu)建[J].吉林醫(yī)藥學(xué)院學(xué)報,2013,34(5):363-366.
[3] 袁國興,孫家昶,張林波,等. 2013年中國高性能計算機發(fā)展現(xiàn)狀分析及系統(tǒng)測評技術(shù)簡析[J].計算機工程與科學(xué),2013,35(11):1-5.
[4] 盛樂標(biāo),游偉倩,周慶林.南京大學(xué)高性能計算中心建設(shè)的探索與實踐[J].實驗技術(shù)與管理,2013,30(11):144-146.
(責(zé)任編輯:孫 娟)