劉蓉
(揚(yáng)州大學(xué)物理科學(xué)與技術(shù)學(xué)院,江蘇 揚(yáng)州225002)
在現(xiàn)代超大規(guī)模集成(VLSI)技術(shù)中,高速性能是最重要特性之一。通過在超大規(guī)模集成電路設(shè)計(jì)中引入高速算法,可以做到在數(shù)據(jù)處理中是非常小的延遲。一般高性能集成電路的特點(diǎn)是它們工作時(shí)的時(shí)鐘頻率較高。因此,高速設(shè)計(jì)可以提高各設(shè)計(jì)階段的性能。時(shí)鐘信號(hào)由同步性元件執(zhí)行,如觸發(fā)器(FF)或鎖存器,其如何操作取決于所應(yīng)用的時(shí)鐘脈沖。在實(shí)際計(jì)算的系統(tǒng)中可能存在兩種計(jì)時(shí)錯(cuò)誤,即保持時(shí)間違例和設(shè)置時(shí)間違例。當(dāng)輸入信號(hào)在時(shí)鐘主動(dòng)轉(zhuǎn)換后變化太快時(shí),就會(huì)發(fā)生時(shí)間步長的計(jì)算錯(cuò)誤。在設(shè)定時(shí)間誤差時(shí),信號(hào)到達(dá)太晚,錯(cuò)過了應(yīng)該提前的時(shí)間。信號(hào)到達(dá)時(shí)間的變化有很多原因,是輸入數(shù)據(jù)的變化、電路的不同操作、溫度和電壓的變化以及設(shè)計(jì)中各個(gè)部分的特性參數(shù)差異導(dǎo)致的。
人們?cè)啻螄L試?yán)没煦绗F(xiàn)象產(chǎn)生隨機(jī)數(shù),尤其采用一維混沌映射來設(shè)計(jì)出各種類型的混沌序列。在蒙特卡羅模擬中,隨機(jī)數(shù)的產(chǎn)生是最重要的環(huán)節(jié)。此外,為了提高蒙特卡羅模擬的準(zhǔn)確性,我們需要周期很長的隨機(jī)數(shù),最好是無限周期的物理隨機(jī)數(shù)。產(chǎn)生具有特定統(tǒng)計(jì)性質(zhì)的非周期隨機(jī)數(shù)的方法之一是后處理物理隨機(jī)數(shù)或模擬混沌電路產(chǎn)生的非周期隨機(jī)數(shù)。例如,我們提出了使用LFSR(線性反饋移位寄存器)生成相關(guān)二進(jìn)制序列的后處理方法,其中利用了混沌理論的伯努利映射。然而,這種基于LFSR 的后處理生成的二進(jìn)序列的自相關(guān)函數(shù)并不是指數(shù)消失的,即它們不是馬爾科夫二進(jìn)序列。
HM-FF 觸發(fā)器的單時(shí)鐘脈沖基于掃描寄存器,使用3 個(gè)復(fù)用器組成D-FF,如圖1 所示。
圖1 保持模式觸發(fā)器
圖2 無保持模式觸發(fā)器
與D-FF 等其他觸發(fā)器相比,具有保持模式(HM-FF)的單時(shí)鐘脈沖多一個(gè)輸入和一個(gè)輸出。除了時(shí)鐘和Din (數(shù)據(jù)輸入),scan-enable(scen)存在。Scan-output (Sout)是額外添加的輸出。內(nèi)部邏輯提供以保持模式運(yùn)行的寄存器,它可以繞過寄存器直接驅(qū)動(dòng)(Scin)的值。
而無保持模式單時(shí)鐘脈沖(WHMFF) 觸發(fā)器基于掃描寄存器,使用2 個(gè)多路復(fù)用器形成D-FF,如圖2 所示。與傳統(tǒng)的D-FF 相比,單時(shí)鐘脈沖無保持模式(WHMFF)觸發(fā)器多一個(gè)輸入和一個(gè)輸出。除了時(shí)鐘和Din (Data in),還有scan-enable(Scen)。Scan-output (Sout)是額外添加的輸出。它被用來減少保持模式(HM)觸發(fā)器的單時(shí)鐘脈沖的面積。
采用單時(shí)鐘脈沖保持模式(HM-FF)觸發(fā)器可以構(gòu)造串行輸入串行輸出(SISO)移位寄存器。這種類型的移位寄存器串行地接收數(shù)據(jù),即一次接收一位數(shù)據(jù),并在其輸出上串行地產(chǎn)生存儲(chǔ)的信息。這里,四個(gè)具有保持模式(HM-FF)觸發(fā)器的單時(shí)鐘脈沖級(jí)聯(lián)。由于每個(gè)HM- FF 只能存儲(chǔ)一位,寄存器最多可以存儲(chǔ)四位。更多的觸發(fā)器可以級(jí)聯(lián)存儲(chǔ)超過4 位。時(shí)鐘在一個(gè)時(shí)間內(nèi)應(yīng)用于所有觸發(fā)器同步計(jì)時(shí)。另外還有一個(gè)信號(hào)叫掃描使能信號(hào),它有兩行選擇信號(hào),掃描使能信號(hào)選擇輸出信號(hào)。使用Scan enable 的主要優(yōu)點(diǎn)是它在一個(gè)時(shí)間內(nèi)只選擇特定的輸出,從而減少了定時(shí)延遲。
雖然鎖存可以用來替換FFs,但由于其寬透明窗口,出現(xiàn)了定時(shí)限制。因此,PL RFs 可以在FF 和latch RFs 之間提供最佳的折衷,因?yàn)樗鼈兊亩〞r(shí)模型接近FFs,同時(shí)它們消耗更少的面積和電力。唯一額外的開銷是增加脈沖發(fā)生器。然而,這個(gè)開銷很小,因?yàn)橄嗤拿}沖將在相同寄存器的鎖存器之間共享。此外,由于脈沖電路控制鎖存的透明度,它可以取代FF RFs 寫入邏輯所需的時(shí)鐘門控單元。
利用Xilinx Virtex 6 低功耗系列,對(duì)采用D-FF、單時(shí)鐘脈沖保持模式 (HM-FF) 觸發(fā)器和單時(shí)鐘脈沖無保持模式(WHM-FF)觸發(fā)器的移位寄存器進(jìn)行靜態(tài)時(shí)序分析比較。從設(shè)計(jì)中得到的延遲比較如下。
圖3 觸發(fā)器的延遲比較圖
使用UMC 28nm 技術(shù)實(shí)現(xiàn)了具有不同寄存器數(shù)目的普通32 位射頻。由于SRAM 的位元是用最小的尺寸設(shè)計(jì)的,由標(biāo)準(zhǔn)單元組成的存儲(chǔ)單元預(yù)計(jì)會(huì)大得多。然而,對(duì)于小尺寸的RFs,SRAM 外圍電路的區(qū)域開銷可能非常大。比較不同的實(shí)現(xiàn),基于PL 的RFs 的面積總是比對(duì)應(yīng)的FF 要小20%以上。與SRAM 相比,區(qū)域上的差異將取決于寄存器的數(shù)量。對(duì)于32 字RF, PL RF 的面積比SRAM 高出17%。
假設(shè)我們有如圖3 所示的具有正或負(fù)自相關(guān)的非周期隨機(jī)二進(jìn)制序列,將其輸入到所提出的后處理電路中。目標(biāo)是(p1,p2) =(1/4,1/4)和(p1,p2) =(3/4,3/4)的2 態(tài)馬爾可夫源。
二值序列后處理后的自相關(guān)函數(shù),在這些k = 4 的情況下,我們發(fā)現(xiàn)一些較大的誤差。另一方面在k = 10 的情況下,我們找不到這樣的誤差。為了研究誤差與k 之間的關(guān)系,我們使用自相關(guān)函數(shù)與相應(yīng)的理論自相關(guān)函數(shù)MSE。
與傳統(tǒng)寄存器方案相比,多端口RFs 是超標(biāo)量微處理器的關(guān)鍵部件。然而,隨著端口數(shù)量的增加,面積和功耗都顯著增加。多端口sram 的直接實(shí)現(xiàn)方式是增加更多的接入晶體管。因此,位單元需要更大的尺寸。加上多余的字行和位行布線,內(nèi)存大小可以隨端口的總數(shù)呈二次增長。為了減少面積,使用了兩種技術(shù):時(shí)間多路復(fù)用和陣列復(fù)制。在時(shí)間多路復(fù)用中,同一個(gè)端口可以在同一個(gè)時(shí)鐘周期內(nèi)被訪問多次。在數(shù)組復(fù)制中,內(nèi)存數(shù)組被復(fù)制到兩個(gè)或多個(gè)銀行,每個(gè)銀行都有一些讀端口,同時(shí)共享相同的寫端口。類似地,標(biāo)準(zhǔn)單元RFs 可以擴(kuò)展為具有多個(gè)讀和寫端口。
由于PL 操作依賴于使用脈沖發(fā)生器,這些脈沖發(fā)生器可以在相同的時(shí)鐘周期內(nèi)多次訪問相同的寄存器。此外,還可以將其他脈沖發(fā)生器分組,對(duì)讀或?qū)戇^程執(zhí)行一些必要的控制操作。這將導(dǎo)致?lián)碛幸粋€(gè)具有許多虛擬端口的RF,這些虛擬端口由數(shù)量少得多的物理端口生成,使用一些控制邏輯用于讀和寫端口。在這些控制邏輯中,除了保存一些中間數(shù)據(jù)如內(nèi)部讀寫地址和數(shù)據(jù)外,還使用不同的脈沖組來產(chǎn)生所需的控制信號(hào)。
在本文中簡要地研究了不同的寄存器文件實(shí)現(xiàn),比較了用SRAM 和觸發(fā)器實(shí)現(xiàn)1R1W 寄存器文件的傳統(tǒng)方法,提出了一種適用于小尺寸寄存器文件的脈沖鎖存實(shí)現(xiàn)及基于動(dòng)態(tài)MCML三態(tài)緩沖區(qū)的動(dòng)態(tài)寄存器。對(duì)所提出的寄存器的檢查表明,在存在時(shí)鐘重疊時(shí)所提出的寄存器的行為會(huì)發(fā)生偏差,因此提出了兩種處理方法。為了實(shí)現(xiàn)高速設(shè)計(jì),討論了不同的觸發(fā)器和移位寄存器。提出了利用單時(shí)鐘脈沖保持模式(HM-FF)觸發(fā)器、無保持模式(WHM-FF)觸發(fā)器和移位寄存器實(shí)現(xiàn)D-FF 的各種實(shí)現(xiàn)方法。比較了各模型靜態(tài)時(shí)序分析的各個(gè)方面。該方法針對(duì)Xilinx Virtex 6 族,在速度上有一定的提高。與現(xiàn)有方法相比,該方法可減少41.9%的延遲。仿真結(jié)果表明,當(dāng)k 足夠大時(shí),所提出的后處理電路可以產(chǎn)生馬爾可夫二值序列。此外,簡要討論了多端口寄存器的文件結(jié)構(gòu),并介紹了一種新的脈沖鎖存器實(shí)現(xiàn)。與其他實(shí)現(xiàn)相比,提出的虛擬端口實(shí)現(xiàn)在面積和電力方面都有巨大的節(jié)省。