朱愛軍,卜鵬程,胡 聰,許川佩,古展其
(1.桂林電子科技大學電子工程與自動化學院,廣西桂林 541004;2.廣西自動檢測技術與儀器重點實驗室,廣西桂林 541004)
隨著多核系統(tǒng)中元件數(shù)量的穩(wěn)步增長,傳統(tǒng)的電結構片上網(wǎng)絡已不能滿足系統(tǒng)的性能要求[1-3],并面臨著延遲和功耗等關鍵問題。為解決基于電互連的片上網(wǎng)絡存在的局限性,基于光互連的片上網(wǎng)絡(optical network on chip,ONoC)技術成為未來高性能多核片上網(wǎng)絡設計的一個方向。近十年來,硅基光器件制造工藝方面取得的進展為ONoC的快速發(fā)展鋪平了道路。三維封裝技術逐步走向成熟,使三維ONoC的設計趨于必然。其中最關鍵的問題之一是IP核映射。IP核映射在網(wǎng)絡的不同節(jié)點上將對網(wǎng)絡的通信產(chǎn)生不同的影響,映射結果將影響網(wǎng)絡的功率分布,進而對網(wǎng)絡的溫度分布產(chǎn)生波動,從而影響ONoC中光學器件的正常工作,對網(wǎng)絡的傳輸性能造成影響[4]。
為降低由于網(wǎng)絡功率分配對網(wǎng)絡傳輸可靠性的影響,文獻[5-7]基于串擾噪聲感知使用遺傳算法將IP核自動映射到基于網(wǎng)格的ONoC節(jié)點中。文獻[8]同時考慮IP核映射和波長分配對ONoC可靠性的影響,提出了一種基于可靠性感知的聯(lián)合設計方法。為減少波長分配時波長的數(shù)量,文獻[9]研究了波長數(shù)目與網(wǎng)絡之間的關系,發(fā)現(xiàn)增加網(wǎng)絡大小可以減少所需的波長數(shù)。文獻[10]針對ONoC中的串擾噪聲,提出一種用于串擾噪聲優(yōu)化的啟發(fā)式融合映射算法。文獻[11]提出基于大災變遺傳的模擬退火,解決了采用遺傳算法進行IP核映射求解時出現(xiàn)的算法過早收斂和陷入局部最優(yōu)的問題。
綜上所述,現(xiàn)有的研究均未考慮以溫度均衡為光片上網(wǎng)絡IP核映射目標,從而導致通信性能下降和通信能耗增大。本文提出的趨邊快速映射以溫度均衡為目標,通過將網(wǎng)絡中的流量均勻分散到網(wǎng)絡中以均衡網(wǎng)絡溫度,從而改善通信性能和減小通信能耗。
由于構成光波導的材料為硅基材料,而硅基材料的環(huán)境溫度改變時,其一些參數(shù)也會發(fā)生相應的改變。在波導傳輸損耗的基礎上考慮溫度的影響,得到含溫度系數(shù)的波導傳輸損耗公式:
(1)
式中:LWG0為常溫環(huán)境下的波導傳輸損耗;σc-σd為波導外壁與內(nèi)壁的熱光系數(shù)差值;ΔT為微環(huán)工作環(huán)境溫度與常溫的差值。
從式(1)可以看到,溫度的變化量與波導傳輸損耗存在平方關系,每10 ℃的溫差將會給波導帶來額外0.11%的損耗。
本文在光片上網(wǎng)絡的IP核映射研究中,除考慮IP核映射在網(wǎng)絡節(jié)點中的能耗和固有損耗以外,還考慮了網(wǎng)絡由于溫度影響所帶來的額外傳輸損耗。光片上網(wǎng)絡的網(wǎng)絡結構在很大程度上可以決定網(wǎng)絡運行的功耗和效率。本文采用曼哈頓距離來描述網(wǎng)絡的結構,所使用的三維Folded Torus網(wǎng)絡結構的曼哈頓距離計算公式為
(2)
在計算曼哈頓距離時,要考慮到目標路徑是否連通,如果m,n兩個節(jié)點之間不存在通路,則這兩個節(jié)點的曼哈頓距離dm,n為0。本文所使用的三層三維Folded Torus結構的曼哈頓距離矩陣如圖1所示。
圖1 曼哈頓距離矩陣
通信任務圖是描述通信模型的有向加權圖G(C,L),圖中的每個圓形節(jié)點ci(ci∈C)表示IP核,節(jié)點之間的有向線段lj,k(lj,k∈L,j≠k)表示節(jié)點上的IP核數(shù)據(jù)從cj到ck的傳輸方向,線段上的數(shù)字wj,k表示信息傳輸?shù)膸?數(shù)據(jù)傳輸單位為Mb/s。將IP核有向圖G映射到結構圖T時規(guī)定IP核有向圖的大小不能大于結構圖,即
size(G)≤size(T)
(3)
為評估映射方案的性能,本文以映射結果的總體能耗作為網(wǎng)絡映射的目標,在T.T.Ye等提出的片上網(wǎng)絡通信能耗模型和J.H等提出的能耗估算模型基礎上,對上述模型進行修改,如式(4)所示:
ES=EC+ELWG+ERC
(4)
式中:ES為所有通信節(jié)點進行通信時的能耗和信號在網(wǎng)絡中傳輸時的損耗累加和;EC為系統(tǒng)的通信節(jié)點在無損傳輸時的通信能耗總和;ELWG為網(wǎng)路中波導的能量損耗總和;ERC為每對通信節(jié)點之間的諧振器諧振損耗總和,其包括微環(huán)諧振器的插入損耗以及傳輸損耗。
將式(4)展開后得到的網(wǎng)絡系統(tǒng)能耗傳輸模型如式(5)~式(7)所示。式(5)中,等式右邊的第1項表示網(wǎng)絡傳輸時的通信功耗,第2項表示信號傳輸時在波導上的損耗,第3項為諧振器的諧振損耗量。
(1-rS)·Ci,j,i≠j
(5)
tS=k·ΔT(1+k·ΔT)
(6)
(7)
式中:Ni,j為通信節(jié)點i將信號發(fā)送到通信節(jié)點j時所經(jīng)過的路由器節(jié)點數(shù),即IP核映射在網(wǎng)絡后的曼哈頓距離;Ci,j為節(jié)點i到節(jié)點j的通信量;tS為波導的溫度損耗系數(shù);rS為微環(huán)諧振器的漂移系數(shù);ΔAS為微環(huán)諧振器的諧振波長漂移前后所對應的光信號透射率的差值。
光片上網(wǎng)絡的基本器件在工作時對溫度有要求,過大的溫差不僅會給系統(tǒng)帶來額外的損耗,甚至會造成器件發(fā)生故障而不能正常工作,從而導致系統(tǒng)發(fā)生問題。因此,在基于對稱分布的快速映射算法上,本文提出面向網(wǎng)絡溫度均衡的IP核趨邊映射,降低網(wǎng)絡對溫度的敏感性。算法流程如圖2所示。
圖2 基于對稱分布的IP核趨邊映射算法流程圖
該算法針對片上網(wǎng)絡中心內(nèi)部結構緊湊、通信頻率較大、容易發(fā)生堵塞的特點,將通信量大和通信度復雜的IP核優(yōu)先映射在網(wǎng)絡的邊界節(jié)點。將通信流量高的IP核映射在網(wǎng)絡邊緣節(jié)點后,可以加速網(wǎng)絡的散熱,同時,網(wǎng)絡通信的重心也將由網(wǎng)絡內(nèi)部轉移至網(wǎng)絡邊緣,從而更好地分散流量通信帶來的熱量。因為光信號的傳輸不依賴于時間,并且波導的傳輸損耗要遠低于由硅基器件的溫漂帶來的傳輸損耗。因此,將快速映射算法與趨邊映射算法相結合,能夠在不影響IP核映射速度的同時考慮網(wǎng)絡溫度均衡分布的問題。
根據(jù)流程圖,該算法可分為4部分。第一部分建立光片上網(wǎng)絡的中心值矩陣模型。根據(jù)網(wǎng)絡的拓撲結構建立的網(wǎng)絡結構中心模型能夠反映網(wǎng)絡結構中各節(jié)點所處偏離網(wǎng)絡中心的程度,節(jié)點的中心值越高,則所處的位置距離網(wǎng)絡中心越近。根據(jù)本文所使用的Folded Torus結構,圖3為該結構的中心值矩陣。
圖3 三維3層Folded Torus網(wǎng)絡熱度值矩陣
熱度值矩陣的大小表示網(wǎng)絡節(jié)點在工作時溫度改變的權重。熱度值越高的節(jié)點,表示該節(jié)點距離網(wǎng)絡的中心區(qū)域越近,被其他通信節(jié)點經(jīng)過的概率更大,數(shù)量更多,信道的負載量越大,其溫度的變化量將更大。而熱度值越小的節(jié)點,則其溫度的變化量就越小。
第二部分是通信流量的熱度模型的建立。該模型以M個通信節(jié)點間的通信量Cm和連接數(shù)Lm作為依據(jù),將所有節(jié)點根據(jù)通信量的大小和通信復雜度分配歸一化的熱度值,并根據(jù)式(8)計算每個節(jié)點的熱度系數(shù)T_Cm。根據(jù)通信權重值對IP核進行重新排序,生成基于熱度系數(shù)的CPL表。
(8)
式中:α為通信量系數(shù),α=0.2;β為連接量系數(shù),β=0.6。
第三部分生成網(wǎng)絡結構ITS節(jié)點映射集合,在原來映射集合流程的基礎上新增網(wǎng)絡結構的熱度矩陣,并在生成對稱分布集合ITS的基礎上為非對稱節(jié)點分配熱度值。
第四部分將IP核根據(jù)新的CPL列表映射到ITS集合的節(jié)點中,每次映射都會根據(jù)IP核選擇策略進行下一個IP核映射位置的選擇。IP核選擇策略會計算IP核映射在下一次所有待選位置時的功耗,然后從中選擇相對功耗最小的位置作為本次IP核映射的目標。若在映射IP核的過程中遇到多個待選位置功耗相同的節(jié)點,則對以上節(jié)點進行預分配。最后將兩次映射所需要的功耗進行比較,選擇兩次映射的功耗最低的一組映射方案,直到CPL列表中的所有元素都完成映射,得到當前映射方案的總體能耗。
為驗證本文所提出的映射算法,使用3D Folded Torus光片上網(wǎng)絡結構,用MPEG-4、VOPD、Core-10和Core-24 4個應用作為測試實例對比算法的能耗,與隨機映射算法、蟻群映射算法和粒子群映射算法作對比,并分析映射算法在網(wǎng)絡不同溫度分布情況下的性能。
表1為使用的網(wǎng)絡仿真參數(shù)。網(wǎng)絡節(jié)點數(shù)表示可被IP核映射的數(shù)量,信道損耗為光信號在波導中傳輸時的損耗,節(jié)點耦合損耗表示信號通過微環(huán)諧振器時的插入損耗以及耦合損耗;另外,下文中的均勻溫度分布N表示的是網(wǎng)絡中的所有節(jié)點位置的溫度均相同,并且在系統(tǒng)開始工作時仍然保持溫度不變;中心溫度分布M表示網(wǎng)絡中心節(jié)點位置的溫度最高,并呈球形向網(wǎng)絡的四周擴散;隨機溫度分布R表示網(wǎng)絡有兩個以上的熱源出現(xiàn)在網(wǎng)絡中的隨機位置。
表1 仿真參數(shù)
圖4為4種映射在不同的通信任務下完成映射到網(wǎng)絡所需的時間,同時對比了算法在每個通信任務的不同網(wǎng)絡溫度分布下的運行時間。在網(wǎng)絡均勻溫度分布的情況下,如圖4中的N部分所示,提出的趨邊快速映射在VOPD、MPEG-4、Core-10和Core-24 4個通信任務中的映射速度都大幅度領先于蟻群映射和粒子群映射,而略慢于隨機映射。而在網(wǎng)絡中心溫度分布和隨機溫度分布下,4種映射算法的映射速度與均勻溫度分布時的映射速度差別不大。由此可見,提出的趨邊映射算法可以保證算法映射的速度。
圖4 映射算法在不同通信任務下的所需時間
圖5展示了4種映射結果下的網(wǎng)絡能耗,從圖5可以看到,在相同的通信任務下,網(wǎng)絡溫度隨機分布的能耗要高于中心溫度,這是由于網(wǎng)絡在隨機溫度分布下的平均溫度要高于中心溫度分布,因此網(wǎng)絡的整體能耗也就隨之增加。在隨機溫度分布下,提出的趨邊映射在不同的通信任務下均低于隨機映射,而略高于蟻群和粒子群映射。這是由于蟻群和粒子群在尋找網(wǎng)絡的映射位置時犧牲了時間而進行多次的迭代搜索,從而尋找到網(wǎng)絡相對能耗最優(yōu)的映射位置。
圖5 映射算法在不同通信任務下的能耗總和
表2為映射算法在不同的網(wǎng)絡溫度分布情況下循環(huán)10次,每次循環(huán)依次完成VOPD,MPEG-4,Core-10和Core-24通信任務的平均能耗。
表2 不同溫度分布下映射算法完成所有通信任務的平均能耗 J
從表2可以看到,提出的趨邊快速映射算法與蟻群映射和粒子群映射相近,優(yōu)于隨機映射。在3種不同的溫度分布下,提出的趨邊映射比隨機映射平均少了22.5%的能耗,與粒子群映射相比平均少了13.7%的能耗,與蟻群映射的能耗持平。
ONoC中的IP核映射問題是光片上網(wǎng)絡的研究重點之一,應用在網(wǎng)絡中的映射結果對網(wǎng)絡的能耗有較大的影響。分析光片上網(wǎng)絡中IP核映射對網(wǎng)絡能耗的影響,提出了面向溫度均衡的光片上網(wǎng)絡映射算法。分析ONoC網(wǎng)絡結構的特點,建立了網(wǎng)絡的能耗模型。然后根據(jù)網(wǎng)絡的對稱性結構和溫度分布特點提出一種趨邊快速映射算法。仿真結果表明:提出的映射算法在快速獲得映射結果的同時,具有更低的網(wǎng)絡能耗,并且能夠得到分布較均衡的網(wǎng)絡映射結果。