葛 蔚 郭 力 李靜?!£愖髮帯『K太 劉 鑫 中國(guó)科學(xué)院過程工程研究所 北京 0090 國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心 北京 0090
關(guān)于超級(jí)計(jì)算發(fā)展戰(zhàn)略方向的思考*
葛蔚1郭力1李靜海1陳左寧2胡蘇太2劉鑫2
1中國(guó)科學(xué)院過程工程研究所北京100190
2國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心北京100190
超級(jí)計(jì)算能力是國(guó)家科技競(jìng)爭(zhēng)力乃至綜合國(guó)力的重要標(biāo)志,也是經(jīng)濟(jì)社會(huì)發(fā)展、國(guó)防和國(guó)家安全的重要支撐。特別是在網(wǎng)絡(luò)化、大數(shù)據(jù)、云計(jì)算和虛擬現(xiàn)實(shí)迅猛發(fā)展的背景下,超級(jí)計(jì)算不但是科技發(fā)展的利器,正引發(fā)科研模式的根本變革,也將成為重要的社會(huì)基礎(chǔ)設(shè)施,并最終深刻地改變我們的生產(chǎn)和生活方式。但目前超級(jí)計(jì)算正面臨應(yīng)用效率低、能耗高、穩(wěn)定性差和難以應(yīng)用等嚴(yán)峻挑戰(zhàn)?;谠趶?fù)雜系統(tǒng)多尺度模擬方面多年的探索和積累,文章提出,按照計(jì)算對(duì)象、模型、軟件與硬件的邏輯和結(jié)構(gòu)一致的原理優(yōu)化計(jì)算機(jī)體系結(jié)構(gòu),緩解和克服商品化通用硬件系統(tǒng)開發(fā)中的難點(diǎn),可能是突破這些瓶頸的一條具有普遍意義的途徑。
超級(jí)計(jì)算,多尺度計(jì)算模式,能量最小多尺度(EMMS) 范式,虛擬過程工程
超級(jí)計(jì)算是革命性的研發(fā)手段,代表了一個(gè)國(guó)家科學(xué)技術(shù)發(fā)展的水平。同時(shí),它已成為現(xiàn)代社會(huì)重要的信息基礎(chǔ)設(shè)施,正在深刻地改變?nèi)祟惖纳a(chǎn)和生活方式。
2005 年,美國(guó)總統(tǒng)信息技術(shù)咨詢委員會(huì)(PITAC)在給時(shí)任美國(guó)總統(tǒng)的喬治·W·布什的報(bào)告《計(jì)算科學(xué):確保美國(guó)競(jìng)爭(zhēng)力》[1]中多次強(qiáng)調(diào):計(jì)算科學(xué)是繼理論和實(shí)驗(yàn)之后的第三科學(xué)支柱,21 世紀(jì)最偉大的科學(xué)突破將從計(jì)算科學(xué)中獲得。報(bào)告認(rèn)為:如果在此關(guān)鍵時(shí)刻不能高瞻遠(yuǎn)矚,美國(guó)的科學(xué)領(lǐng)導(dǎo)地位和經(jīng)濟(jì)競(jìng)爭(zhēng)力將不堪設(shè)想。而超級(jí)計(jì)算無疑是計(jì)算科學(xué)的前沿與核心。2014 年美國(guó)能源部報(bào)告《E 級(jí)計(jì)算的十大挑戰(zhàn)》[2]更明確指出 E 級(jí)(Exaflops)計(jì)算將改變?nèi)蚪?jīng)濟(jì)。
具體而言,本文認(rèn)為,超級(jí)計(jì)算的重要性集中體現(xiàn)在 3 個(gè)方面:
(1)超級(jí)計(jì)算已經(jīng)是革命性的研發(fā)手段。根據(jù)已有理論在超級(jí)計(jì)算機(jī)上進(jìn)行虛擬實(shí)驗(yàn),即計(jì)算機(jī)模擬,甚至虛擬現(xiàn)實(shí),已經(jīng)在越來越大的程度上輔助甚至替代現(xiàn)實(shí)的實(shí)驗(yàn)。比如禁止核試驗(yàn)后計(jì)算機(jī)模擬的核爆炸就完全代替了核實(shí)驗(yàn)。各國(guó)大飛機(jī)的研制也都依賴計(jì)算力學(xué)與超級(jí)計(jì)算完成氣動(dòng)與結(jié)構(gòu)設(shè)計(jì)。同樣,從新藥研制到精準(zhǔn)醫(yī)學(xué),從催化機(jī)理的分析到反應(yīng)器放大與優(yōu)化,從建筑與橋梁設(shè)計(jì)到地質(zhì)災(zāi)害防治,超級(jí)計(jì)算幾乎在現(xiàn)代科技的所有領(lǐng)域中突破了理論和實(shí)驗(yàn)研究的極限,極大地加快了研發(fā)進(jìn)程,并顯著降低了費(fèi)用。由此形成的產(chǎn)業(yè)技術(shù)帶來的效益更是不可估量,并已成為國(guó)防和國(guó)家安全的一個(gè)重要支點(diǎn)。同時(shí)超級(jí)計(jì)算的綜合性還有效促進(jìn)了不同學(xué)科的交叉融合,從而促進(jìn)復(fù)雜性科學(xué)和腦科學(xué)等 21 世紀(jì)最激動(dòng)人心的科學(xué)前沿的形成。
(2)超級(jí)計(jì)算已成為現(xiàn)代社會(huì)重要的信息基礎(chǔ)設(shè)施??梢院敛豢鋸埖卣f,超級(jí)計(jì)算對(duì)于正在迅速發(fā)展的信息社會(huì)就像能源和交通對(duì)于工業(yè)社會(huì)那樣重要。超級(jí)計(jì)算的應(yīng)用正從傳統(tǒng)的科研領(lǐng)域向社會(huì)經(jīng)濟(jì)的各個(gè)方面滲透。目前電子商務(wù)、金融和社會(huì)管理中已經(jīng)開始用數(shù)據(jù)挖掘等手段分析人們的消費(fèi)和行為習(xí)慣,從而更精準(zhǔn)地指導(dǎo)生產(chǎn)和流通,提高經(jīng)濟(jì)和社會(huì)的運(yùn)行效率。同樣,在交通和物流的管控與優(yōu)化、疾病預(yù)防與控制、天氣預(yù)報(bào)與氣候預(yù)測(cè)、經(jīng)濟(jì)定量預(yù)測(cè)與調(diào)控甚至休閑娛樂等領(lǐng)域的應(yīng)用即將迎來爆發(fā)式增長(zhǎng),帶動(dòng)新興產(chǎn)業(yè)的崛起,使超級(jí)計(jì)算像電力和自來水一樣在日常生活中成為不可或缺的資源。
(3)超級(jí)計(jì)算正在深刻地改變?nèi)祟惖纳a(chǎn)和生活方式。超級(jí)計(jì)算技術(shù)本身正面臨深刻的變革,其前景無可限量。目前龐大的超級(jí)計(jì)算機(jī)將演進(jìn)為緊湊的信息處理設(shè)備而融入生產(chǎn)生活的方方面面,通過云計(jì)算、物聯(lián)網(wǎng)和智能設(shè)備等形成龐大的網(wǎng)絡(luò)。這種泛在的超級(jí)計(jì)算和它驅(qū)動(dòng)與支撐的智能制造、柔性制造、虛擬現(xiàn)實(shí)等技術(shù)與產(chǎn)業(yè)將帶來一個(gè)“萬物有靈”、“虛實(shí)難辨”的時(shí)代。人類在應(yīng)對(duì)能源與資源短缺、環(huán)境污染和氣候變化等可持續(xù)發(fā)展的重大挑戰(zhàn)時(shí)將具備全新的能力。生產(chǎn)效率將極大提高、能源和資源消耗將顯著降低,人類的生存空間將極大地拓展,更加自由而綠色的生活方式將不斷涌現(xiàn)。
超級(jí)計(jì)算對(duì)我國(guó)的自主創(chuàng)新、跨越發(fā)展尤為重要,并將隨著發(fā)展的進(jìn)程變得越來越重要。過去 15 年中,我國(guó)部署了多個(gè)國(guó)家級(jí)科技項(xiàng)目和資助計(jì)劃,有力推動(dòng)了中國(guó)超級(jí)計(jì)算能力的提升?!疤旌印薄ⅰ笆锕狻?、“神威”等系列超級(jí)計(jì)算機(jī)的研制成功,使國(guó)家級(jí)超級(jí)計(jì)算基礎(chǔ)設(shè)施進(jìn)入世界領(lǐng)先行列,形成了相當(dāng)規(guī)模的國(guó)家級(jí)高性能計(jì)算服務(wù)環(huán)境,支撐了一大批重大的領(lǐng)域應(yīng)用。因此,持續(xù)保持國(guó)家對(duì)超級(jí)計(jì)算的投入,不斷攻研和創(chuàng)新超級(jí)計(jì)算機(jī)技術(shù),使我國(guó)超級(jí)計(jì)算的發(fā)展邁上更高的臺(tái)階,對(duì)國(guó)家經(jīng)濟(jì)社會(huì)轉(zhuǎn)型升級(jí)和中華民族偉大復(fù)興具有重要戰(zhàn)略意義。
以商品化通用硬件主導(dǎo)的發(fā)展模式由于效率、能耗、穩(wěn)定性等問題已舉步維艱。以應(yīng)用牽引的模式正逐步成為主流。抓住這一轉(zhuǎn)變的機(jī)遇,我國(guó)超級(jí)計(jì)算有望跨越發(fā)展,全面領(lǐng)先。
盡管超級(jí)計(jì)算意義重大、發(fā)展迅猛,但近年來也遇到了重大的挑戰(zhàn)與發(fā)展的瓶頸,急需新的思路來破解。20 世紀(jì) 90 年代以來,由于商品化通用處理器的快速發(fā)展,極大地促進(jìn)了超級(jí)計(jì)算機(jī)的發(fā)展。據(jù) HPC Top500[3]統(tǒng)計(jì)顯示,2000 年以來,采用商品化通用硬件構(gòu)建超級(jí)計(jì)算機(jī)的數(shù)量最高時(shí)達(dá)到總量的 90% 以上。但隨著計(jì)算機(jī)系統(tǒng)規(guī)模的增大和峰值計(jì)算性能的提高,這種按照“商品化硬件-軟件-應(yīng)用”模式研制的機(jī)器遇到了新的挑戰(zhàn)。
(1)應(yīng)用效率低下。商品化通用軟硬件對(duì)領(lǐng)域高難計(jì)算問題或大數(shù)據(jù)處理問題缺乏針對(duì)性,因而系統(tǒng)計(jì)算資源的利用率較低,使機(jī)器的實(shí)際性能大打折扣,大多數(shù)機(jī)器的實(shí)際應(yīng)用效率不會(huì)超過其峰值性能的 10% 左右。
(2)運(yùn)行功耗大。系統(tǒng)規(guī)模的擴(kuò)大導(dǎo)致機(jī)器耗電量急劇增加,高端超級(jí)計(jì)算系統(tǒng)的能耗已經(jīng)達(dá)到 10 兆瓦量級(jí),但性能能耗比提高緩慢,機(jī)器運(yùn)營(yíng)成本難以承受。
(3)系統(tǒng)可靠性低。隨著系統(tǒng)中處理器的核數(shù)達(dá)到百萬量級(jí)以上,主要器件數(shù)量達(dá)到千萬量級(jí)以上,當(dāng)前一個(gè)高端系統(tǒng)的平均無故障時(shí)間達(dá)到數(shù)小時(shí)已十分困難,對(duì)高可靠性的影響極大。
加之開發(fā)投入上也是前重后輕,特別是我國(guó)在大型應(yīng)用軟件的開發(fā)上投入不足,使得應(yīng)用開發(fā)嚴(yán)重滯后,機(jī)器的潛力遠(yuǎn)遠(yuǎn)沒有發(fā)揮。顯然,在這種模式下,僅僅依靠商品化通用硬件的漸進(jìn)式技術(shù)改善,超級(jí)計(jì)算機(jī)系統(tǒng)的易用性和對(duì)需求的適應(yīng)性會(huì)不斷降低,整機(jī)的實(shí)用性也因算法并行性和系統(tǒng)穩(wěn)定性的限制而大打折扣,從而失去了追求整機(jī)性能的意義。
在這種模式下,即使是面向商品化硬件的軟件和應(yīng)用開發(fā),也只能永遠(yuǎn)滯后于硬件系統(tǒng)的開發(fā)。且商品化底層技術(shù)的迅速發(fā)展使得超級(jí)計(jì)算系統(tǒng)的有效使用年限非常有限(一般只有 5—7 年),并且研發(fā)、制造成本(動(dòng)輒數(shù)億元人民幣)與運(yùn)維費(fèi)用日益高昂(可達(dá)每年數(shù)千萬元),因此這種滯后帶來的資源浪費(fèi)也非常巨大。正是由于對(duì)成本、能耗、效率、容錯(cuò)與穩(wěn)定性等問題尚無可靠的解決方案,國(guó)際上幾個(gè)擬議中的 E 級(jí)計(jì)算項(xiàng)目已被數(shù)度推遲。
這些困境背后的共性問題是:在商品化軟硬件研發(fā)中缺乏對(duì)應(yīng)用對(duì)象的結(jié)構(gòu)分析與利用,即計(jì)算機(jī)與計(jì)算對(duì)象的邏輯結(jié)構(gòu)和物理結(jié)構(gòu)不一致。近年來微電子和集成電路領(lǐng)域的發(fā)展趨勢(shì)是:運(yùn)算部件的速度提升快、能耗低,存儲(chǔ)和通信部件的速度(帶寬與延遲)提升慢、能耗高。為了彌補(bǔ)兩者間的差距,需要引入多級(jí)數(shù)據(jù)高速緩存和交換。但這種補(bǔ)償只有在計(jì)算軟件具有相應(yīng)的并行性與數(shù)據(jù)局部性時(shí)才適用,否則只能帶來處理器設(shè)計(jì)復(fù)雜性的提高、元器件利用率的降低和編程難度的加大。而如果不從應(yīng)用出發(fā),考慮計(jì)算對(duì)象的物理結(jié)構(gòu)和計(jì)算特征,計(jì)算軟件就難以充分挖掘利用問題內(nèi)在的并行性。另一方面,如果深入考慮了計(jì)算對(duì)象的結(jié)構(gòu)和特征,現(xiàn)行的復(fù)雜的硬件設(shè)計(jì)非但沒有必要,反而還會(huì)阻礙內(nèi)在并行性的充分發(fā)揮。
實(shí)際上,大多數(shù)計(jì)算對(duì)象的邏輯結(jié)構(gòu)都是多尺度的,但目前很多超級(jí)計(jì)算系統(tǒng)中的基本處理單元還是同質(zhì)和單一尺度的,由此造成了存儲(chǔ)與通信方面的巨大浪費(fèi)。最新的異構(gòu)超級(jí)計(jì)算系統(tǒng)可支持兩尺度并行,但基本處理單元仍為同質(zhì)。為解決這些問題,根本的出路是改變發(fā)展模式,從商品化硬件牽引變?yōu)閼?yīng)用牽引,從創(chuàng)新應(yīng)用模型入手,帶動(dòng)計(jì)算模型、體系結(jié)構(gòu)及軟硬件的創(chuàng)新。這對(duì)我國(guó)來講是一個(gè)重大機(jī)遇!
繞開商品化通用硬件發(fā)展的瓶頸問題和我國(guó)在硬件制造方面的劣勢(shì),聚焦計(jì)算對(duì)象、模型、軟件與硬件的邏輯和結(jié)構(gòu)一致性是超級(jí)計(jì)算的必然發(fā)展方向,更是我國(guó)超級(jí)計(jì)算自主可控與跨越發(fā)展的寶貴機(jī)遇。
從應(yīng)用角度看,目前國(guó)際上超級(jí)計(jì)算面臨的諸多問題本質(zhì)上都與沒有充分考慮計(jì)算對(duì)象的物理結(jié)構(gòu)和邏輯特征有關(guān)。如果能從這一角度出發(fā),超級(jí)計(jì)算將迎來全新的重大發(fā)展機(jī)遇。其核心是:高效的超級(jí)計(jì)算應(yīng)體現(xiàn)計(jì)算對(duì)象、模型、軟件與硬件的邏輯和結(jié)構(gòu)一致性,而這種結(jié)構(gòu)正是物理過程普遍而內(nèi)在的多尺度結(jié)構(gòu),具有從全局相關(guān)到近程相關(guān)、從穩(wěn)定性約束到動(dòng)力學(xué)控制的共同特征[4]。
利用計(jì)算對(duì)象的結(jié)構(gòu)特征可以有效簡(jiǎn)化硬件系統(tǒng)的設(shè)計(jì),即:通過物理過程的多尺度分解,將大尺度的長(zhǎng)程關(guān)聯(lián)與小尺度的近程作用分離。后者的計(jì)算量非常大,但可以充分并行;前者雖然難以并行,但分解后余留的計(jì)算量較小。兩者結(jié)合可簡(jiǎn)單高效地計(jì)算整個(gè)系統(tǒng)的演化。這里的多尺度分解并不純粹是數(shù)學(xué)上的分解,也是基于物理機(jī)制的簡(jiǎn)化與分解。而引入穩(wěn)定性條件,除了能從數(shù)學(xué)上封閉要求待定參數(shù)的模型,還能在物理上引入合理的約束條件,大大減少計(jì)算量并保證計(jì)算精度。若將此思路貫穿到計(jì)算硬件的設(shè)計(jì)中,帶來的處理器微結(jié)構(gòu)簡(jiǎn)化設(shè)計(jì)也可為我國(guó)核心基礎(chǔ)器件的自主可控發(fā)展和整機(jī)技術(shù)的跨越發(fā)展提供捷徑。
由于計(jì)算對(duì)象、模型、軟件與硬件的邏輯和結(jié)構(gòu)一致性反映了自然界內(nèi)在的層次性和并行性(層次性也是一種垂直的并行性),它具有很強(qiáng)的普遍性。由此設(shè)計(jì)的超級(jí)計(jì)算系統(tǒng)在提高效能的同時(shí)并不會(huì)顯著影響其通用性,反而將促進(jìn)各領(lǐng)域研究方法由單尺度平均向多尺度耦合的方向發(fā)展。同時(shí),這種物理與計(jì)算系統(tǒng)的內(nèi)在一致性也有利于量子計(jì)算和仿生計(jì)算等從更基礎(chǔ)層面利用自然稟賦的顛覆性技術(shù)的發(fā)展和應(yīng)用。
4.1 多尺度模擬和高效能計(jì)算機(jī)系統(tǒng)
中科院過程工程所針對(duì)多相復(fù)雜系統(tǒng)的多尺度模擬,以及國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心針對(duì)國(guó)家“863”計(jì)劃項(xiàng)目研制的基于自主處理器的高效能計(jì)算機(jī)系統(tǒng),在計(jì)算對(duì)象、模型、軟件與硬件的結(jié)構(gòu)和邏輯一致的超級(jí)計(jì)算方面作了有益的探索,展現(xiàn)了這條途徑的廣闊前景,其普遍意義值得深入研究。
4.1.1針對(duì)多相復(fù)雜系統(tǒng)的多尺度模擬
近年來,我國(guó)超級(jí)計(jì)算機(jī)無論在峰值速度還是在實(shí)測(cè)性能上一直保持與世界同步,并逐步達(dá)到了世界領(lǐng)先水平。但我們?cè)诔?jí)計(jì)算軟件和應(yīng)用方面的發(fā)展卻遠(yuǎn)遠(yuǎn)滯后于硬件。同時(shí),我國(guó)支撐超級(jí)計(jì)算的核心基礎(chǔ)元器件和部件(芯片)的研發(fā)水平也與美日等競(jìng)爭(zhēng)對(duì)手有差距,尤其是高性能 CPU 基礎(chǔ)器件的后端生產(chǎn)、封裝、測(cè)試等環(huán)節(jié)以及設(shè)計(jì)工具長(zhǎng)期受制于國(guó)外,國(guó)內(nèi)工藝普遍落后一代以上,難以完全擺脫受制于人的局面。
多年來,中科院過程工程所以應(yīng)用為牽引,按照“計(jì)算對(duì)象、模型、軟件與硬件的邏輯和結(jié)構(gòu)一致”的原理,在超級(jí)計(jì)算發(fā)展的新途徑上做了不懈的努力,其中的很多思路與經(jīng)驗(yàn)值得深入探討與推廣。
在國(guó)家自然科學(xué)基金委等的持續(xù)支持下,中科院過程所從 20 世紀(jì) 80 年代初就開始了對(duì)多相系統(tǒng)多尺度方法的研究,提出了獨(dú)特的能量最小多尺度(EMMS)模型,以全局和介尺度穩(wěn)定性條件約束提高了多相反應(yīng)過程模擬的精度和速度。在檢驗(yàn)、擴(kuò)展和深化該模型的過程中又發(fā)展了擬顆粒等離散化方法,并認(rèn)識(shí)到它們是描述復(fù)雜系統(tǒng)微尺度行為的有效方法并普遍具有高度的并行性,認(rèn)為這將成為超級(jí)計(jì)算的重要應(yīng)用領(lǐng)域。而 EMM S 模型向氣液和湍流等其他領(lǐng)域的擴(kuò)展形成的極值型多尺度方法又使穩(wěn)定性約束成為加速復(fù)雜系統(tǒng)宏尺度和介尺度模擬的共性方法。兩者結(jié)合則定義了一種新的具有普遍意義的超級(jí)計(jì)算模式:EMMS 范式,即用離散化方法模擬系統(tǒng)中的近程強(qiáng)相關(guān)作用,利用極值型多尺度方法描述系統(tǒng)中的長(zhǎng)程關(guān)聯(lián)。前者的計(jì)算具有局部性、可加性等適應(yīng)大規(guī)模、細(xì)粒度并行計(jì)算的良好特性,后者包含的復(fù)雜計(jì)算被大幅減少。兩者結(jié)合為實(shí)現(xiàn)高效超級(jí)計(jì)算提供了全新的途徑。
2007 年以來,通用計(jì)算圖形處理器(GUGPU)的出現(xiàn),為驗(yàn)證這一思路提供了技術(shù)基礎(chǔ)。在財(cái)政部“國(guó)家重大科研裝備研制項(xiàng)目”等的支持下,中科院過程工程所按照上述思路研制了 Mole 系列高效能超級(jí)計(jì)算系統(tǒng),引領(lǐng)了我國(guó)通過異構(gòu)并行趕超世界超級(jí)計(jì)算前沿的征程。在國(guó)內(nèi)率先于 2008 年 2 月建成了 100 萬億次 CPU+GPGPU 并行系統(tǒng)。2010 年 4 月建成的 1 000 萬億次系統(tǒng)[5,6]位列當(dāng)年 Top500 第 19 位和 Green500 第 8 位(在當(dāng)時(shí)全球千萬億次級(jí)超級(jí)計(jì)算系統(tǒng)中列首位)。目前仍在高效運(yùn)行中。該系統(tǒng)還與分布在全國(guó) 6 個(gè)城市的 10 套 100 萬億次以上系統(tǒng)一起在中科院形成了聚合計(jì)算能力超過 5 000 萬億次的分布式 GPGPU 超級(jí)計(jì)算環(huán)境。
考慮到實(shí)際應(yīng)用需求,進(jìn)一步擴(kuò)展峰值性能已無必要,因此研究隨后轉(zhuǎn)向在不同的應(yīng)用實(shí)例中進(jìn)一步探索 EMMS 范式的可行性和通用性,完成了多相流動(dòng)直接數(shù)值模擬、材料和納微系統(tǒng)微觀模擬和生物大分子動(dòng)態(tài)行為模擬等處于世界前沿水平的應(yīng)用,初步證明了該計(jì)算范式的優(yōu)勢(shì)和前景。該系統(tǒng)還獲得了廣泛的工業(yè)應(yīng)用,合作伙伴包括了中石化、中石油、寶鋼、殼牌石油、英國(guó)石油、道達(dá)爾、通用電氣、阿爾斯通、必和必拓、聯(lián)合利華、巴斯夫、法國(guó)電力、兗礦等 10 余家世界 500 強(qiáng)企業(yè)。
與此同時(shí),通過與實(shí)驗(yàn)、測(cè)量、可視化和控制系統(tǒng)的結(jié)合,中科院過程工程所研究人員還建立了全球首套虛擬過程工程的示范系統(tǒng),即通過人機(jī)界面輸入的操作指令可同時(shí)作用于實(shí)驗(yàn)裝置和模擬系統(tǒng),改變各自的操作狀態(tài),從而在可視化系統(tǒng)中直觀在線地對(duì)比兩者的行為。由此在國(guó)際上首次實(shí)現(xiàn)了對(duì)中試規(guī)?;ぱb置的準(zhǔn)實(shí)時(shí)模擬,展示了過程工程研發(fā)模式變革的廣闊前景,引領(lǐng)了這一領(lǐng)域的發(fā)展趨勢(shì)。
在這些應(yīng)用的基礎(chǔ)上,進(jìn)一步明確了在計(jì)算機(jī)體系結(jié)構(gòu)和芯片設(shè)計(jì)層面實(shí)現(xiàn) EMMS 范式的技術(shù)方案。該方案明確了多尺度模擬中不同算法與操作的計(jì)算、存儲(chǔ)和通信特征,歸納了該范式下典型的穩(wěn)定性條件求解、連續(xù)介質(zhì)模型和離散單元演化模擬的算法特征,并提出了相應(yīng)的多尺度體系結(jié)構(gòu)。為驗(yàn)證該方案,借用 Intel M IC 多核處理器實(shí)現(xiàn)了 CPU-M IC-GPGPU 節(jié)點(diǎn)內(nèi)耦合的緊密三層結(jié)構(gòu)(圖 1)[7,8],并以此升級(jí)了既有系統(tǒng),初步展示了未來徹底基于 EMMS 范式的多尺度超級(jí)計(jì)算模式的優(yōu)勢(shì)與可行性(圖 2)[7]。近期中科院過程工程所與國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心正合作探索這種計(jì)算模式的硬件實(shí)現(xiàn)方案,并取得了進(jìn)展(圖 3),有望進(jìn)一步開發(fā)針對(duì)介尺度計(jì)算的新型處理器。
4.1.2基于自主處理器的高效能計(jì)算機(jī)系統(tǒng)
近年來,國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心在承研國(guó)家“863”計(jì)劃項(xiàng)目“基于自主處理器的高效能計(jì)算機(jī)系統(tǒng)研制”過程中,面向聚變與裂變能源、真實(shí)飛機(jī)外形全流場(chǎng)計(jì)算和優(yōu)化設(shè)計(jì)、新藥研發(fā)和蛋白質(zhì)折疊、大型工程設(shè)備結(jié)構(gòu)力學(xué)分析、數(shù)學(xué)工程等國(guó)民經(jīng)濟(jì)與國(guó)防重大挑戰(zhàn)性應(yīng)用需求,以領(lǐng)域應(yīng)用算法和計(jì)算模型為導(dǎo)向,采用面向多目標(biāo)優(yōu)化的平衡結(jié)構(gòu)設(shè)計(jì)方法和多因素相結(jié)合的設(shè)計(jì)優(yōu)化方法,創(chuàng)新提出了多態(tài)多尺度自適應(yīng)體系結(jié)構(gòu),在系統(tǒng)內(nèi)部的不同尺度融合了多種計(jì)算形態(tài),可以根據(jù)不同領(lǐng)域高難應(yīng)用的需求,靈活構(gòu)造計(jì)算規(guī)模,整合計(jì)算形態(tài),優(yōu)化計(jì)算效率。
圖1 Mole-8.5E 系統(tǒng)的三層結(jié)構(gòu)節(jié)點(diǎn)圖[7,8]
圖2 模型-軟件-硬件結(jié)構(gòu)一致性原理圖[7]
圖3 神威·太湖之光計(jì)算機(jī)系統(tǒng)
多態(tài)多尺度自適應(yīng)體系結(jié)構(gòu)支持在多個(gè)尺度上實(shí)現(xiàn)異構(gòu),包括處理器內(nèi)部、處理器之間、節(jié)點(diǎn)之間以及系統(tǒng)級(jí)的異構(gòu)等。其中,在處理器內(nèi)部支持主從異構(gòu);在處理器/節(jié)點(diǎn)間的異構(gòu),支持國(guó)產(chǎn)多核/眾核處理器、商用多核/眾核處理器、GPGPU 等不同處理器的透明共存;系統(tǒng)級(jí)異構(gòu),支撐各種高性能計(jì)算機(jī)系統(tǒng)的無縫耦合。該體系結(jié)構(gòu)能夠充分發(fā)揮不同類型處理器、節(jié)點(diǎn)、高性能計(jì)算系統(tǒng)的優(yōu)勢(shì),根據(jù)應(yīng)用需求和多目標(biāo)優(yōu)化實(shí)現(xiàn)快速靈活地部署。同時(shí),系統(tǒng)通過虛擬化操作系統(tǒng)、面向領(lǐng)域典型應(yīng)用和機(jī)器結(jié)構(gòu)的編譯優(yōu)化技術(shù)、自適應(yīng)精細(xì)平衡調(diào)度等實(shí)現(xiàn)應(yīng)用的高效自適應(yīng)部署,在充分發(fā)揮系統(tǒng)性能的同時(shí),最大程度實(shí)現(xiàn)底層異構(gòu)結(jié)構(gòu)對(duì)用戶的開放。
該項(xiàng)目使用自主眾核處理器的技術(shù)路線,通過片上集成大量精簡(jiǎn)計(jì)算核心,實(shí)現(xiàn)相對(duì)商用處理器更高的計(jì)算能力;通過針對(duì)應(yīng)用特征進(jìn)行處理器結(jié)構(gòu)優(yōu)化,使眾核處理器更為節(jié)能高效;通過在國(guó)產(chǎn)處理器設(shè)計(jì)中提供對(duì)國(guó)家重大應(yīng)用的共性支撐,大幅度提高應(yīng)用效率。目前,該項(xiàng)目實(shí)現(xiàn)的超級(jí)計(jì)算機(jī)系統(tǒng)無論在峰值性能、實(shí)測(cè)性能和性能能耗比等關(guān)鍵技術(shù)指標(biāo)上都已經(jīng)達(dá)到國(guó)際領(lǐng)先水平。
4.2 多尺度計(jì)算模式
基于以上探索,已經(jīng)可以提出具有足夠普遍意義的多尺度計(jì)算模式以支撐未來高效超級(jí)計(jì)算系統(tǒng)的開發(fā)。而此類系統(tǒng)不僅能夠顯著提高實(shí)際運(yùn)行效率與可用性,也將具有普遍性,為我國(guó)超級(jí)計(jì)算的全面跨越發(fā)展提供重要機(jī)遇。
中科院過程工程所和國(guó)家并行機(jī)算計(jì)工程技術(shù)研究中心兩方面的探索分別從物理模型和硬件結(jié)構(gòu)方面表明:計(jì)算對(duì)象、模型、軟件和硬件的結(jié)構(gòu)和邏輯一致性應(yīng)當(dāng)是未來超級(jí)計(jì)算發(fā)展的重要方向,具有廣闊的發(fā)展空間,兩者的結(jié)合有望帶動(dòng)甚至引領(lǐng)未來超級(jí)計(jì)算的發(fā)展。特別值得注意的是,在自然界及工業(yè)系統(tǒng)中,多尺度結(jié)構(gòu)與行為具有相當(dāng)?shù)钠毡樾?,這是物質(zhì)世界的層次結(jié)構(gòu)決定的。因此,根據(jù)上述原理,具有多尺度結(jié)構(gòu)的超級(jí)計(jì)算系統(tǒng)具備天然的普適性。這些共性應(yīng)當(dāng)引起更大關(guān)注。
總體而言,具有多尺度結(jié)構(gòu)的復(fù)雜系統(tǒng)中各部分或單元間的作用方式,從宏觀到微觀逐漸趨于簡(jiǎn)單,能夠被更加清晰與可靠的數(shù)學(xué)模型描述(盡管很多微觀運(yùn)動(dòng)的模型還不成熟,然而一旦建立,其準(zhǔn)確性是毋庸置疑的)。但隨著尺度的縮小,對(duì)應(yīng)的部分或單元的數(shù)量急劇增加,相應(yīng)的直接模擬的計(jì)算量也急劇增加,甚至達(dá)到理論上也不可計(jì)算的程度。
幸運(yùn)的是,基于EMM S范式對(duì)越來越多的系統(tǒng)的研究表明,至少就經(jīng)典的力學(xué)和傳遞、反應(yīng)行為而言,通過引入穩(wěn)定性條件可以在介于基本單元與系統(tǒng)整體的某個(gè)“介尺度”上建立一種“粗?;钡碾x散模型,從而以足夠的精度表述該尺度以上的系統(tǒng)行為,并且這些粗?;x散單元間的作用是局部的和可加的,也是可計(jì)算的。同時(shí)這些單元的運(yùn)動(dòng)還滿足整體穩(wěn)定性條件的約束,通過求解該條件可直接預(yù)測(cè)系統(tǒng)的整體行為,從而簡(jiǎn)化和加快粗?;x散單元的演化計(jì)算。
如果充分利用這些復(fù)雜系統(tǒng)的共性,可以建立針對(duì)其演化模擬的高效超級(jí)計(jì)算系統(tǒng),即通過大量簡(jiǎn)單的具有局部數(shù)據(jù)交換通道的計(jì)算密集處理單元建立高度可擴(kuò)展的底層離散單元模擬子系統(tǒng),而通過若干層次具有更高全局?jǐn)?shù)據(jù)交換速率和復(fù)雜指令處理能力的處理單元陣列提供穩(wěn)定性條件求解子系統(tǒng)。各層處理單元間通過共享存儲(chǔ)或通信網(wǎng)絡(luò)實(shí)現(xiàn)樹狀的連接。越高層次的處理單元越少但復(fù)雜性越高。這種體系結(jié)構(gòu)能充分貼合所解算問題的特征,降低系統(tǒng)整體的復(fù)雜性并提高其實(shí)際使用效率。盡管各層次更具體的結(jié)構(gòu)形式和不同層次間的配比還需要根據(jù)具體的應(yīng)用需求來優(yōu)化與確定,這些結(jié)構(gòu)特征是普遍適用的。同時(shí)通過軟件與硬件的緊密耦合并利用可重構(gòu)硬件等技術(shù),還可以進(jìn)一步優(yōu)化對(duì)具體計(jì)算任務(wù)的執(zhí)行效率,充分體現(xiàn)EMMS范式結(jié)構(gòu)一致性和多層次處理的優(yōu)勢(shì)。
我國(guó)超級(jí)計(jì)算的發(fā)展要以應(yīng)用為牽引,充分重視學(xué)科交叉合作,繼續(xù)推進(jìn)自主超級(jí)計(jì)算機(jī)體系結(jié)構(gòu)創(chuàng)新和系統(tǒng)研制;應(yīng)以解決重 大問題為目標(biāo),繼續(xù)加大對(duì)高性能計(jì)算應(yīng)用軟件研發(fā)的支持力度,為提升高性能計(jì)算應(yīng)用水平打下基礎(chǔ)。
(1)大力推進(jìn)以領(lǐng)域應(yīng)用為牽引的新型計(jì)算機(jī)體系結(jié)構(gòu)研究和系統(tǒng)研制?;谏鲜龇治?,超級(jí)計(jì)算應(yīng)該作為國(guó)家科技和經(jīng)濟(jì)社會(huì)發(fā)展的一個(gè)優(yōu)先領(lǐng)域繼續(xù)給予長(zhǎng)期大力的支持。特別應(yīng)該對(duì)我國(guó)面向應(yīng)用需求自主提出的體系結(jié)構(gòu)給予更大關(guān)注——成立論證小組,通過預(yù)研項(xiàng)目系統(tǒng)總結(jié)既有成果,確定系統(tǒng)的邏輯結(jié)構(gòu),并經(jīng)仿真系統(tǒng)的初步測(cè)試,論證項(xiàng)目整體設(shè)計(jì)的可行性。在此基礎(chǔ)上,組織國(guó)內(nèi)不同領(lǐng)域超級(jí)計(jì)算應(yīng)用的研究單位和人員,對(duì)各自的應(yīng)用特征進(jìn)行深入的調(diào)研分析,細(xì)化對(duì)計(jì)算對(duì)象、模型、軟件結(jié)構(gòu)的分析,形成完整、系統(tǒng)而定量的結(jié)論,為通用硬件系統(tǒng)的設(shè)計(jì)提供可靠數(shù)據(jù)。同時(shí)組織硬件開發(fā)領(lǐng)域的相關(guān)單位(計(jì)算機(jī)與微電子等方面)開展相關(guān)硬件技術(shù)的調(diào)研與預(yù)研。在各方準(zhǔn)備充分后,適時(shí)啟動(dòng)國(guó)家重大專項(xiàng),聯(lián)合國(guó)內(nèi)相關(guān)單位研制高效能 E 級(jí)超級(jí)計(jì)算機(jī)系統(tǒng),同時(shí)開展大規(guī)模應(yīng)用準(zhǔn)備,實(shí)現(xiàn)同步驗(yàn)收。
(2)以解決重大問題為目標(biāo),繼續(xù)加大對(duì)高性能計(jì)算應(yīng)用軟件研發(fā)的支持力度。國(guó)家要切實(shí)加大對(duì)高性能計(jì)算應(yīng)用軟件研發(fā)的支持力度,選擇重要的應(yīng)用領(lǐng)域,建立長(zhǎng)期的高性能計(jì)算應(yīng)用軟件發(fā)展計(jì)劃。不僅在超級(jí)計(jì)算機(jī)研發(fā)過程中要同步開展應(yīng)用軟件的開發(fā),更要在機(jī)器使用的全生命周期內(nèi)持續(xù)開發(fā)應(yīng)用軟件,逐步改變我國(guó)大型并行應(yīng)用軟件依賴外國(guó)的被動(dòng)局面。高性能計(jì)算應(yīng)用軟件的研發(fā)也要突出多學(xué)科的協(xié)作,以提高大規(guī)模并行軟件的技術(shù)水平。
總之,如果能夠在計(jì)算機(jī)體系結(jié)構(gòu)和應(yīng)用模式上進(jìn)行源頭創(chuàng)新,突破計(jì)算效率、功耗、可靠性等技術(shù)瓶頸,實(shí)現(xiàn)我國(guó)核心元器件(處理器芯片)的完全自主可控,我們就一定能在超級(jí)計(jì)算機(jī)技術(shù)領(lǐng)域趕超世界領(lǐng)先水平。多尺度計(jì)算方法與計(jì)算機(jī)體系結(jié)構(gòu)是其中重要而有效的切入點(diǎn),并且我國(guó)在這方面已經(jīng)形成了優(yōu)勢(shì)與特色,應(yīng)當(dāng)予以充分重視。以此為基礎(chǔ),國(guó)家可以在戰(zhàn)略發(fā)展領(lǐng)域形成一大批有重大影響的應(yīng)用范例,使我國(guó)高性能計(jì)算應(yīng)用水平邁上新的臺(tái)階,最終為解決國(guó)家經(jīng)濟(jì)建設(shè)、科技進(jìn)步、國(guó)家安全等一系列重大挑戰(zhàn)性問題作出貢獻(xiàn)。
1 Report to the President on Com putational Science: Ensuring America’s Com petitiveness, 2005. [2016-2-20]. https:// www.nitrd. gov/Pitac/Reports/20050609_ computational/ computational.pdf.
2 Ashby S, Beckman P, Chen J, et al. The Opportunities and Challenges of Exascale Computing. The ASCAC Subcomm ittee on Exascale Computing, USA, 2010.
3 Top500 supercomputer sites. [2016-2-20]. http://www.top500. org/
4 Li J H, Ge W, Wang W, et al. From M ultiscale Modeling to Mesoscience. Berlin: Springer, 2013.
5 Ge W, Wang W, Yang N, et al. Meso-scale oriented simulation tow ards virtual process engineering (VPE) — The EMMS Paradigm. Chemical Engineering Science. 2011. 66, 4426-4458.
6 Wang X, Ge W. Chapter 5: The M ole-8.5 Supercomputing System. In: Vetter, J. S. eds. Contem porary High Performance Computing from Petascale tow ard Exascale. Boca Raton:Chapman & Hall / CRC, 2013.
7 Ge W, Lu L, Liu Sh W, et al. Multiscale discrete supercomputing - A game changer for process simulation? Chemical Engineering Technology. 2015. 38, 575-584.
8 Li B, Zhou G F, Ge W, et al. A mu lti-scale architecture for multi-scale simulation and its application to gas-solid flows. Particuology. 2014. 15, 160-169.
葛蔚中科院過程工程所研究員,博士生導(dǎo)師。1970 年 3 月出生,浙江杭州人。現(xiàn)任多相復(fù)雜系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室主任,“多尺度方法與介尺度科學(xué)”創(chuàng)新研究團(tuán)隊(duì)首席科學(xué)家,研究所學(xué)術(shù)委員會(huì)、學(xué)位委員會(huì)委員,中國(guó)顆粒學(xué)會(huì)理事,Chemical Engineering Science、《過程工程學(xué)報(bào)》《化學(xué)反應(yīng)工程與工藝》《計(jì)算機(jī)與應(yīng)用化學(xué)》《數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用》編委;Particuology 顧問。1992 和 1998 年先后在哈爾濱工業(yè)大學(xué)熱能工程專業(yè)獲工學(xué)學(xué)士和博士學(xué)位。曾獲國(guó)家自然科學(xué)基金委杰出青年基金,周光召基金會(huì)首屆“杰出青年基礎(chǔ)科學(xué)獎(jiǎng)”、中國(guó)顆粒學(xué)會(huì)“寶潔青年顆粒學(xué)獎(jiǎng)”、中科院首屆超級(jí)計(jì)算應(yīng)用獎(jiǎng)及中科院“先進(jìn)工作者”稱號(hào)。主要研究對(duì)象為氣固、顆粒與散料、多孔介質(zhì)及納微多相系統(tǒng),內(nèi)容包括流動(dòng)、傳遞、反應(yīng)及其耦合過程的介尺度機(jī)理與多尺度建模、分子模擬及離散-連續(xù)耦合模擬、高性能計(jì)算及其工業(yè)應(yīng)用。提出并發(fā)展了擬顆粒模擬,以此揭示了氣固流態(tài)化、氣液鼓泡流動(dòng)和微流動(dòng)等系統(tǒng)中多種控制機(jī)制協(xié)調(diào)形成穩(wěn)定性條件的機(jī)理,檢驗(yàn)并擴(kuò)展了多相復(fù)雜系統(tǒng)極值型多尺度方法。主持研制了效能比位居世界前列的 Mole 系列千萬億次多尺度超級(jí)計(jì)算軟硬件系統(tǒng),并由此建立了以實(shí)時(shí)模擬、顯示和人機(jī)交互為特征的虛擬過程工程能力。先后主持國(guó)家自然科學(xué)重點(diǎn)基金、國(guó)家科技支撐計(jì)劃和國(guó)家重大科研裝備研制項(xiàng)目。相關(guān)研究成果已有效服務(wù)于所主持的中石油、中石化、寶鋼、殼牌石油、必和必拓、通用電器、阿爾斯通、聯(lián)合利華等世界500強(qiáng)企業(yè)的工業(yè)項(xiàng)目。已發(fā)表期刊論文 140 余篇,主持譯著 2 本、編著 4 本及 20 余章節(jié)。多次在 CHISA,ISCRE,WCPT 等國(guó)際會(huì)議作 Plenary 或 Keynote 報(bào)告。E-mail: wge@ipe.ac.cn
Ge WeiBorn in 1970, got his B. Sc. in 1992 and then Ph. D. in 1998, both from Harbin Institute of Technology, China. He has been professor of chem ical engineering at Institute of Process Engineering, CAS since 2006. He is mainly engaged in multi-scale simulation of particle-fluid two-phase systems. As project leader, he developed the Mole series multi-scale supercomputing systems to bridge simulation of molecular details to reactor performance. He authored over 140 journal papers and 4 monographs. He won the Outstanding Youth in Basic Science Award of Zhou Guangzhao Foundation in 2008, the P&G Outstanding Youth in Particuology Award of Chinese Society of Particuology in 2011 and the National Science Fund for Distinguished Young Scholars in 2012. He is associate editor of Chemical Engineering Science, council member of The Chinese Society of Particuology, and advisory board member of the international journal Particuology. E-mail: wge@ipe.ac.cn
郭 力男,中科院過程工程所研究員、中國(guó)科學(xué)院大學(xué)兼職教授。山東省濟(jì)南市人,1966年出生。1981年考入中國(guó)科技大學(xué)第五期少年班,1986年畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,1989年在中科院過程工程所獲工學(xué)碩士學(xué)位。曾主持中科院院長(zhǎng)特別支持項(xiàng)目、國(guó)家自然科學(xué)基金委重點(diǎn)基金項(xiàng)目、面上基金項(xiàng)目、中石化信息化項(xiàng)目,參與多項(xiàng)中科院創(chuàng)新研究項(xiàng)目、國(guó)家自然科學(xué)基金委重大研究計(jì)劃子項(xiàng)目、國(guó)家自然科學(xué)基金委重點(diǎn)基金項(xiàng)目、基金項(xiàng)目等。獲中科院科技進(jìn)步獎(jiǎng)二等獎(jiǎng)和三等獎(jiǎng)各一項(xiàng),北京市科學(xué)技術(shù)進(jìn)步獎(jiǎng)三等獎(jiǎng)一項(xiàng)。發(fā)表科技論文及報(bào)告80余篇,作為第一作者出版專著2部,作為第二作者出版專著1部,與他人合作出版譯著1部。曾獲國(guó)務(wù)院政府特殊津貼和中科院盈科優(yōu)秀青年學(xué)者獎(jiǎng)。E-mail: lguo@ipe.ac.cn
Guo LiMale, born in 1966, has been the professor of Institute of Process Engineering, CAS since 1997, is also the professor of University of Chinese Academ y of Sciences. He was admitted to Special Class for young gifted student of University of Science and Technology of China(USTC) in 1981, graduated from the Department of Computer Science and Technology of USTC and got his B. Sc. in 1986, and his M. Sc. Degree at IPE, CAS in 1989. He was a visiting scientist at National Center for Toxicological Research, FDA, US in 2004 and 2008-2009. Research interests include high performance computing, Internet chem istry & chem ical engineering information systems and text/know ledge m ining. He has published more than 80 scientific papers and three books, two as the first author and one as the second author. He also coauthored one translated book. He is an editorial board member of Journal of Computer and Applied Chemistry. He has received the State Council Special Award for Distinguished Scientists and the PCCW Award for Excellent Young Scholars of Chinese Academy of Sciences. He is also the w inner of The Second Prize and The Third Prize of Scientific & Technology Advancement, Chinese Academy of Sciences, and The Third Prize of Scientific & Technology Advancement, Beijing. E-mail: lguo@ipe.ac.cn
胡蘇太男,國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心高級(jí)工程師,1956 年 出生。長(zhǎng)期從事計(jì)算機(jī)裝備發(fā)展戰(zhàn)略、計(jì)算機(jī)體系結(jié)構(gòu)和情報(bào)研究工作。多年來,參加過多項(xiàng)國(guó)家重點(diǎn)型號(hào)工程預(yù)先研究工作。在國(guó)內(nèi)各種報(bào)刊、會(huì)議上發(fā)表論文、報(bào)告 50 余篇,公開出版的著作有《實(shí)用網(wǎng)絡(luò)存儲(chǔ)技術(shù)》《英漢信息安全技術(shù)辭典》《超級(jí)計(jì)算機(jī)發(fā)展研究》等;曾獲省部級(jí)科技進(jìn)步獎(jiǎng)一等獎(jiǎng) 2 項(xiàng)、二等獎(jiǎng) 5 項(xiàng)、三等獎(jiǎng) 5 項(xiàng);獲全國(guó)優(yōu)秀科技信息成果獎(jiǎng)一等獎(jiǎng) 1 項(xiàng)。
Hu SutaiM ale, born on February 1st, 1956, Bachelor's Degree, is a senior engineer at National Research Center of Parallel Com puter Engineering and Technology. His research fields include the development strategy research on computing technology and equipment, computer architecture and information research. He has participated in many national key pre-research projects and published over 50 papers and researchreports in many domestic journals and conferences for years. His major publications include Practical Network Storage Technologies, An English-Chinese Dictionary of Information Security Technology, and The Research on Development of Super Computer. He has won several provincial-level Scientific and Technological Progress Awards and also got First Prize for National Outstanding Scientific and Technological Information Achievement.
劉鑫女,國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心副研究員,2013 起擔(dān)任神威高性能計(jì)算機(jī)系統(tǒng)科學(xué)與工程計(jì)算應(yīng)用平臺(tái)主管設(shè)計(jì)師。1979 年 6 月出生。2006 年獲中國(guó)人民解放軍信息工程大學(xué)獲工學(xué)博士學(xué)位,主要從事并行算法和并行應(yīng)用軟件的研發(fā)工作。在大型并行應(yīng)用軟件的多核、眾核并行算法設(shè)計(jì)和優(yōu)化等方面取得重要進(jìn)展。曾獲省部級(jí)科技進(jìn)步獎(jiǎng) 一等獎(jiǎng)1 項(xiàng)、二等獎(jiǎng)2項(xiàng)、三等獎(jiǎng) 2 項(xiàng)。發(fā)表學(xué)術(shù)論文 10 余篇。
Liu XinFemale, born on July 30th, 1979, is an associate research fellow at National Research Center of Parallel Computer Engineering and Technology. She is the supervising designer of scientific and engineering application platform of Sunway supercomputer and responsible for large-scale parallel algorithm research and application software development on Sunway supercomputer. In this role, she has got a lot of progress in multi-core and many-core parallel algorithm designing and optim izations. In addition, she is the author or co-author of over 15 published papers on parallel algorithm, applications and related fields. She holds PhD degree from PLA Information Engineering University.
Thinkings on Development Strategy of Supercom puting
Ge Wei1Guo Li1Li Jinghai1Chen Zuoning2Hu Sutai2Liu Xin2
(1Institute of Process Engineering, Chinese Academy of Sciences, Beijing 100190, China;
2National Research Centre of Parallel Computer Engineering & Technology, Beijing 100190, China)
Supercomputing power has now become an important index of science and technology competitiveness of a country, and also a great support to the econom ic and social development and national security. Moreover, w ith the drastic development of Internet, big data,cloud computing, and virtual reality technologies, supercomputing w ill bring about profound changes to production and life styles of modern societies. Nevertheless, contem porary supercom puting is facing grand challenges in terms of low efficiency, high power consumption, poor robustness, and difficulties in applications. General-purpose supercomputing based on commercial processors is not likely to solve the problems completely. Based on our explorations in multiscale simulation of complex systems, we suggest that keeping the structural and logical consistency between the computed system, model, software, and hardware is an effective way towards high efficiency and scalability of supercomputing in the future. In fact, multiscale structure is ubiquitous in natural and industrial systems, which is, after all, a reflection of the hierarchical nature of the physical world and is, therefore, of general significance to a w ider range of applications. For classical mechanical and thermal processes, the computational complexity usually decreases w ith decreasing scales, while the computational cost increases exponentially. Fortunately, w ith reasonable coarse-graining based on meso-scale models, this cost can be reduced by several orders by developing additive discrete methods which can achieve good accuracy, efficiency, and scalability for supercomputing. On the other hand, computation at large scales can be accelerated by introducing stability constraints to the dynam ics models. Multiscale computer hardware conform ing to this software framework is expected to have high efficiency and speeds up the com putation even further. We have already explored the feasibility of this multi-scale strategy for model, software, and hardware developments in different applications, and have achieved very encouraging results. We suggest that this strategy should be given enough considerations in the development of future supercom puters.
supercomputing, multi-scale model, EMMS Paradigm, virtual process engineering
10.16418/j.issn.1000-3045.2016.06.004
*資助項(xiàng)目:中科院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(XDA 07080 000), 國(guó)家自然科學(xué)杰出青年基金(21225628)
修改稿收到日期:2016 年6月8日