近年來,分子生物學(xué)發(fā)展快速,加上基因組技術(shù)的研發(fā),產(chǎn)生許多生物相關(guān)數(shù)據(jù)。這些大量積累的數(shù)據(jù)需要適當(dāng)?shù)膬?chǔ)存、組織,并且能夠被加以分析、利用及搜尋。因此,配合最近突飛猛進(jìn)的信息科技,生物信息學(xué)乃應(yīng)運(yùn)而生。
生物信息學(xué)是結(jié)合基因蛋白質(zhì)學(xué)及信息科技的新興研究領(lǐng)域,其最終目標(biāo)在發(fā)現(xiàn)新的生物認(rèn)知、厘清細(xì)胞各階段的表現(xiàn),以利人們對(duì)疾病和藥物使用有更精確的了解。故其現(xiàn)階段執(zhí)行的任務(wù)有分析核酸序列、蛋白質(zhì)序列、蛋白質(zhì)結(jié)構(gòu)、蛋白質(zhì)家族及其生化反應(yīng)等。
其中,需要信息及半導(dǎo)體技術(shù)協(xié)助的研究包括:序列組合、序列分析、比較基因組學(xué)、計(jì)算基因遺傳學(xué)、基因認(rèn)定、蛋白質(zhì)三維結(jié)構(gòu)分析、基因微數(shù)組芯片分析、分子演化、藥物設(shè)計(jì)等領(lǐng)域。
高性能計(jì)算設(shè)備方能應(yīng)付大量運(yùn)算需求
測(cè)序是基因研究的基礎(chǔ),目前高通量基因測(cè)序設(shè)備及配套硬軟件均依賴進(jìn)口,如何讓此核心技術(shù)生根關(guān)系著本土相關(guān)產(chǎn)業(yè)的發(fā)展。而此高性能的設(shè)備多用于以下兩個(gè)主要應(yīng)用一一、基因搜索及比對(duì):將已知之DNA結(jié)構(gòu)辨別標(biāo)準(zhǔn)輸入計(jì)算器內(nèi),可判斷樣本序列是否存在,以及此序列與不同物種間之DNA關(guān)聯(lián)性;二、蛋白質(zhì)折迭仿真及計(jì)算器輔助藥物設(shè)計(jì):利用重組或擴(kuò)展已有的蛋白質(zhì)是預(yù)防疾病和藥物設(shè)計(jì)的關(guān)鍵,因此計(jì)算器圖學(xué)技術(shù)與計(jì)算方法至關(guān)重要。以幾何、能量與活性等三大方向來探討如何使用最小能最原理來改進(jìn)藥物設(shè)計(jì)中的分子對(duì)接過程之效能、加速藥物設(shè)計(jì)時(shí)程與降低研發(fā)成本是目前最迫切的課題。
為生物基因計(jì)算應(yīng)用設(shè)計(jì)之FPGA系統(tǒng)
NVIDIA的CUDA平臺(tái),其擁有通過C語言來控制GPU的開發(fā)環(huán)境,適合并行運(yùn)算。在CUDA架構(gòu)中,作DNA測(cè)序、短序列拼裝,可發(fā)揮并行計(jì)算之優(yōu)勢(shì),加速計(jì)算并生成三維基因圖譜。
Invitrogen和Active Motif兩大生技公司也合作利用FPGA技術(shù)分析新一代的測(cè)序數(shù)據(jù)。TimeLogic生物計(jì)算系統(tǒng)由一至多片的PCI Express×1之FPGA板卡組成,其整合FPGA加速器和基因組學(xué)算法,能將新發(fā)現(xiàn)的數(shù)據(jù)和已知的基因進(jìn)行快速比對(duì),處理速度等同于普通CPU的100倍以上。
在要求更高的蛋白質(zhì)折迭仿真算法中,研究人員先以遺傳算法來加速接合位置的幾何搜尋;再以能量為重點(diǎn),于實(shí)驗(yàn)中使用李亞普諾夫函數(shù)中的穩(wěn)定理論來降低接合位置數(shù),以便進(jìn)一步增進(jìn)分子對(duì)接的效能;同時(shí)使用NURBS曲線中的插入頂點(diǎn)與權(quán)重調(diào)整來加速分子系統(tǒng)達(dá)到最小能量狀態(tài);最后以各種不同的藥物受體模型來做計(jì)算機(jī)仿真計(jì)算,利用最小能量原理,判斷出接近全局能量最小區(qū)域的對(duì)接狀態(tài)之穩(wěn)定度,并對(duì)其各種分子活性進(jìn)行評(píng)估。
為了運(yùn)用FPGA主芯片實(shí)現(xiàn)計(jì)算應(yīng)用分子力場(chǎng),以及配合LYAPUNOV指數(shù)求出降低分子對(duì)接的幾何位置數(shù)量與穩(wěn)定度,我們提出以圖2中所示之系統(tǒng)架構(gòu)來滿足更高層級(jí)研究人員所需。
如圖2所示,單片系統(tǒng)的主要功能是將高速輸入之?dāng)?shù)據(jù),利用4組GigE網(wǎng)口,提供給后端FPGA進(jìn)行序列比對(duì)處理。高硬件架構(gòu)的核心部份為雙DDR2 SODIMM模塊之Multi-Port Controller,內(nèi)存的管理單元及總線設(shè)計(jì)是提升整體高速運(yùn)算效能之關(guān)鍵。為了將序列比對(duì)時(shí)重要之LinkedList數(shù)據(jù)結(jié)構(gòu)以硬件FPGA實(shí)現(xiàn),另外安排了特殊ZBT(ZeroBus Turnaroundl SRAM以儲(chǔ)存Pointer之部份。使兩個(gè)讀寫總在線的子系統(tǒng)可以同時(shí)平行運(yùn)作而不互相干擾,進(jìn)而達(dá)到動(dòng)態(tài)并行處理的效能。
由于PC主板以DMA方式收送軟件處數(shù)據(jù),為了符合要求,系統(tǒng)以PCI Express x8提供16Gb/s帶寬,系統(tǒng)并提供2個(gè)HSMC接頭做為板卡互連之高速接口,而HSMC接頭的關(guān)鍵帶寬由8對(duì)能承受10Gb/s之高速訊號(hào)線擔(dān)任。
以HSPICE仿真克服10Gb/s系統(tǒng)設(shè)計(jì)瓶頸
高速FPGA開發(fā)平臺(tái)的訊號(hào)完整性是系統(tǒng)成功與否之關(guān)鍵。因此在設(shè)計(jì)過程中,我們運(yùn)用包含Hspice在內(nèi)的多種仿真分析工具,通過對(duì)具體問題進(jìn)行分析來優(yōu)化零配件選擇和設(shè)計(jì)折衷,如層迭結(jié)構(gòu)、介電材料、訊號(hào)線拓樸結(jié)構(gòu)、線長、線寬和阻抗匹配組件等,并根據(jù)仿真結(jié)果對(duì)設(shè)計(jì)進(jìn)行調(diào)整,以便在設(shè)計(jì)時(shí)間內(nèi)解決大多數(shù)的訊號(hào)完整性問題。
圖3為我們使用仿真分析阻抗匹配組件對(duì)DDR2地址訊號(hào)的影響,透過仿真可以看到終端匹配電阻的使用將使訊號(hào)擁有較少的ovemhoot與undershoot。
為了達(dá)成10Gb/s以上之HSMC接頭傳輸,基板層中的介電材料產(chǎn)生之傳輸損耗現(xiàn)象必需被考慮,因此我們透過HSPICE仿真來驗(yàn)證板材對(duì)損耗的影響。圖4為仿真10 inch的傳輸距離,傳輸10Gb/s時(shí)之眼圖結(jié)果:
圖5為最后依據(jù)多方研究人員需求,開發(fā)完成之FPGA平臺(tái)。目前由臺(tái)灣在蛋白質(zhì)折迭及藥物設(shè)計(jì)方面之專家進(jìn)行算法加速上之測(cè)試。