白冰 裴麗 左曉燕
摘要:提出了利用硅基光電子芯片進(jìn)行人工神經(jīng)網(wǎng)絡(luò)計(jì)算處理的方法。硅基光電子芯片憑借光子的獨(dú)特性質(zhì),能夠在人工神經(jīng)網(wǎng)絡(luò)的計(jì)算處理中發(fā)揮高帶寬、低時(shí)延等優(yōu)勢(shì)。在處理深度學(xué)習(xí)中大量的矩陣計(jì)算的乘加任務(wù)時(shí),硅基光電子芯片擁有更高的處理速度和更低的能耗,從而有利于深度學(xué)習(xí)中的人工神經(jīng)網(wǎng)絡(luò)計(jì)算速度和性能的提升。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò);硅基光電子芯片;人工智能;深度學(xué)習(xí)
Abstract: Silicon photonic chips are used to perform artificial neural network computation. Because of the unique properties of photons, silicon photonic chips have the advantages of high bandwidth and low delay in the computation and processing of artificial neural network. When dealing with the multiplication and addition task of a large number of matrix calculations in deep learning, silicon photonic chips have higher processing speed and lower energy consumption, which is beneficial to the improvement of the computational speed and performance of artificial neural network in deep learning.
Keywords: artificial neural network; silicon photonic chips; artificial intelligence; deep learning
人工智能發(fā)展的著眼點(diǎn)之一是強(qiáng)大的大型數(shù)據(jù)集處理工具。這就要求計(jì)算機(jī)在沒(méi)有獲得明確指令的條件下,能快速高效地學(xué)習(xí)并組合分析大量信息。人工神經(jīng)網(wǎng)絡(luò)就是可以進(jìn)行學(xué)習(xí)的數(shù)據(jù)處理計(jì)算機(jī),而以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的深度學(xué)習(xí)算法因其在圖像識(shí)別、問(wèn)題決策、語(yǔ)言翻譯、自動(dòng)駕駛[1]、醫(yī)療輔助[2]等方面的應(yīng)用而受到學(xué)術(shù)界和工業(yè)界的關(guān)注。
目前,人工神經(jīng)網(wǎng)絡(luò)幾乎全部依賴于傳統(tǒng)的電域集成芯片,包括中央處理器(CPU)、圖形處理器(GPU)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、專用集成電路(ASIC)。微電子芯片因其結(jié)構(gòu)上無(wú)法規(guī)避的缺陷,在處理大量的矩陣運(yùn)算時(shí),面臨帶寬低、功耗大、速度慢等問(wèn)題,但人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的基礎(chǔ)就是大量的矩陣運(yùn)算;因此,要想實(shí)現(xiàn)深度的人工神經(jīng)網(wǎng)絡(luò),就需要更多的時(shí)間和能耗成本。我們可以通過(guò)不斷提高芯片集成度,進(jìn)行存內(nèi)計(jì)算等方法解決這個(gè)問(wèn)題;但與此同時(shí),晶體管尺寸不斷縮小,晶體管的性能也越來(lái)越受到量子效應(yīng)的影響,這限制了集成度的不斷提高。另外,存內(nèi)計(jì)算的方法與現(xiàn)有的人工神經(jīng)網(wǎng)絡(luò)算法匹配度不高也限制了存內(nèi)計(jì)算這種方法的應(yīng)用。
為了解決上述問(wèn)題,學(xué)術(shù)界和工業(yè)界越來(lái)越多地致力于開發(fā)新的硬件架構(gòu),以適應(yīng)人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的應(yīng)用。借助光子器件優(yōu)勢(shì)(帶寬大、速度快),業(yè)界提出將一部分信息承載和計(jì)算處理用于改善電域芯片存在的問(wèn)題。相比于傳統(tǒng)的三五族或鈮酸鋰光器件,硅基光電子芯片上的光器件集成在同一硅襯底上,集成度更好且基本與成熟的互補(bǔ)金屬氧化物半導(dǎo)體(COMS)工藝兼容。
利用光電子技術(shù)實(shí)現(xiàn)的人工神經(jīng)網(wǎng)絡(luò)主要包括前饋神經(jīng)網(wǎng)絡(luò)(FNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、脈沖神經(jīng)網(wǎng)絡(luò)(SNN)3種類型。馬赫·曾德?tīng)柛缮鎯x(MZI)和微環(huán)諧振器(MRR)具有干涉、諧振等物理特性,可以實(shí)現(xiàn)調(diào)制器、濾波器等多種器件功能,被廣泛地用于通信、傳感等領(lǐng)域。目前相對(duì)比較完善的、主流的硅基集成通信芯片是基于MZI和MRR的兩種類型,因此人工神經(jīng)網(wǎng)絡(luò)芯片也主要基于這兩種類型。本文中,我們圍繞這兩種類型對(duì)硅基光電子人工智能芯片的進(jìn)展進(jìn)行簡(jiǎn)要闡述,并對(duì)未來(lái)的發(fā)展態(tài)勢(shì)進(jìn)行展望。
1 利用光網(wǎng)絡(luò)進(jìn)行矩陣運(yùn)算
人工神經(jīng)網(wǎng)絡(luò)的思路是首先將輸入的事物轉(zhuǎn)化為矩陣,然后經(jīng)過(guò)大量的矩陣運(yùn)算,最終得到所需要的結(jié)果。不同算法的處理流程可能會(huì)有一些差異,但是都會(huì)包含大量的矩陣運(yùn)算。矩陣運(yùn)算的基礎(chǔ)就是乘積累加運(yùn)算(MAC)。在光子領(lǐng)域?qū)崿F(xiàn)MAC操作并不會(huì)在本質(zhì)上消耗能量,這是光子集成電路的優(yōu)勢(shì)之一。
1.1 集成MZI進(jìn)行矩陣運(yùn)算的原理
利用MZI進(jìn)行片上矩陣運(yùn)算的原理是基于M. RECK等于1994年提出的酉矩陣分解方法[3]的。在該方法中,可調(diào)反射率和透過(guò)率的分束器和可調(diào)的移相器組成基本單元,并通過(guò)電壓控制分束器的分光比和移相器的相位實(shí)現(xiàn)控制輸出端口的光強(qiáng),如圖1所示[3]。酉矩陣運(yùn)算中輸入的N×1列向量元素大小由輸入光強(qiáng)大小來(lái)表示,位置由輸入端口的位置表示,輸入的多束光分別從入口端MZI的一個(gè)臂進(jìn)入MZI陣列,N×N酉矩陣中的元素使用MZI陣列中每一個(gè)MZI包含的2個(gè)移相器和分光器的參數(shù)來(lái)表示。這使得光通過(guò)這些MZI時(shí),相位和幅度會(huì)發(fā)生改變,進(jìn)而達(dá)到計(jì)算效果。最后根據(jù)輸出端的N×1個(gè)輸出光強(qiáng)大小來(lái)計(jì)算結(jié)果列向量元素大小,元素位置由輸出端口的位置表示。在進(jìn)行輸入光強(qiáng)的調(diào)制和輸出光強(qiáng)的探測(cè)后,利用光網(wǎng)絡(luò)可實(shí)現(xiàn)酉矩陣的計(jì)算。
圖1為光路酉矩陣分解結(jié)構(gòu)。其中,較大黑橫矩形表示分光比可調(diào)分束器,小黑斜矩形表示移相器,上方細(xì)長(zhǎng)黑矩形為全反射鏡面。
在酉矩陣實(shí)現(xiàn)之后,我們可以利用奇異值分解(SVD)的方法對(duì)任意矩陣進(jìn)行分解,即SVD將矩陣分解為2個(gè)酉矩陣和1個(gè)對(duì)角矩陣酉矩陣,光路對(duì)角矩陣的模擬用衰減器即可完成,MZI也可以做衰減器。這樣就實(shí)現(xiàn)了利用MZI進(jìn)行矩陣運(yùn)算。
1.2 集成MRR實(shí)現(xiàn)矩陣運(yùn)算的原理
MRR可以先將特定波長(zhǎng)的光信號(hào)耦合到環(huán)上進(jìn)行調(diào)制,然后再耦合進(jìn)直波導(dǎo)。MRR實(shí)現(xiàn)矩陣運(yùn)算的原理為:通過(guò)透過(guò)率的調(diào)節(jié)來(lái)實(shí)現(xiàn)矩陣的表示。首先矩陣運(yùn)算中輸入的N×1列向量中的元素大小用光強(qiáng)大小表示,列向量中元素的位置由不同的波長(zhǎng)表示(因?yàn)檩斎肓邢蛄縼?lái)自于電域信號(hào),所以需要通過(guò)調(diào)制器進(jìn)行電光轉(zhuǎn)換)。M×N矩陣的每一列元素用同一個(gè)波長(zhǎng)表示,不同列用不同的波長(zhǎng)表示,也就是說(shuō)同一列的MRR耦合的是同一個(gè)波長(zhǎng)。矩陣的每一行用一個(gè)公共波導(dǎo)以及耦合在其上的MRR表示,然后每行上的MRR根據(jù)諧振波長(zhǎng)的不同,分別對(duì)輸入的不同波長(zhǎng)的光信號(hào)進(jìn)行強(qiáng)度調(diào)制以實(shí)現(xiàn)乘法器,強(qiáng)度的大小表示的是此行元素的大小,然后MRR再將不同波長(zhǎng)的光信號(hào)耦合入公共的波導(dǎo)實(shí)現(xiàn)加法器。最后矩陣運(yùn)算結(jié)果是一個(gè)M×1列向量,其元素大小通過(guò)光強(qiáng)大小來(lái)表示,然后經(jīng)光電探測(cè)器進(jìn)行光電轉(zhuǎn)換后,再通過(guò)測(cè)量電流大小后得到。
圖2所示的是YANG L.等提出的一種利用MRR來(lái)實(shí)現(xiàn)矩陣運(yùn)算的方法[4]。這種MRR光網(wǎng)絡(luò)結(jié)構(gòu)可以執(zhí)行一個(gè)M×N矩陣A和一個(gè)N×1向量B的乘法。B是輸入向量,用N個(gè)不同波長(zhǎng)光信號(hào)的光功率大小來(lái)表示向量B中的元素。這一個(gè)列向量B是通過(guò)N個(gè)外部調(diào)制或直接調(diào)制激光二極管所生成的。N個(gè)光信號(hào)通過(guò)一個(gè)多路復(fù)用器被多路復(fù)用到一個(gè)公共波導(dǎo)上,然后通過(guò)一個(gè)1×M的光分路器將其平行投影到M行調(diào)制器上。矩陣A的aij元素由位于矩陣第i行和第j列的MRR的透射率表示,位于同一行的每個(gè)MRR僅對(duì)具有特定波長(zhǎng)的光信號(hào)進(jìn)行操作。隨著M×N光脈沖通過(guò)MRR矩陣,光信號(hào)就在環(huán)上進(jìn)行了所有的M×N乘法過(guò)程。在M個(gè)環(huán)上進(jìn)行乘法運(yùn)算后,其累加過(guò)程在公共輸出波導(dǎo)中進(jìn)行。因?yàn)椴煌ㄩL(zhǎng)的信號(hào)在公共波導(dǎo)中幾乎不會(huì)互相干擾。結(jié)果向量C的元素由光檢測(cè)器陣列檢測(cè)到的M個(gè)光功率表示。由此,利用MRR進(jìn)行的矩陣運(yùn)算便得以實(shí)現(xiàn)。
2 現(xiàn)階段片上人工神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)
由光來(lái)進(jìn)行矩陣運(yùn)算是解決人工神經(jīng)網(wǎng)絡(luò)需要大量矩陣運(yùn)算的思路之一。現(xiàn)階段,硅基集成的、可用于搭建人工神經(jīng)網(wǎng)絡(luò)的典型基礎(chǔ)器件就是MZI和MRR。通過(guò)這些器件的光學(xué)特性實(shí)現(xiàn)了MAC運(yùn)算和脈沖神經(jīng)元的模擬。借助光子數(shù)據(jù)處理方面的優(yōu)勢(shì),我們將軟件和硬件進(jìn)行深度匹配,使用高效的光電計(jì)算取代微電子處理器的計(jì)算[5]。光電子集成、數(shù)學(xué)和軟件算法等領(lǐng)域的深度交叉是解決人工神經(jīng)網(wǎng)絡(luò)算法大量密集計(jì)算問(wèn)題的路徑之一,也是人工神經(jīng)網(wǎng)絡(luò)算法片上實(shí)現(xiàn)的發(fā)展趨向。
2.1 MZI型片上人工神經(jīng)網(wǎng)絡(luò)
在基于MZI構(gòu)建的前饋人工神經(jīng)網(wǎng)絡(luò)中,信息從輸入層單向傳遞到輸出層。信號(hào)前向傳播時(shí),不需要將輸出再次反饋,只需要進(jìn)行加、乘,以及比較操作即可,這與擅長(zhǎng)矩陣運(yùn)算的光網(wǎng)絡(luò)相匹配;因此,此種方法的光路硬件的實(shí)現(xiàn)獲得了廣泛的探索和關(guān)注。雖然M. RECK等發(fā)現(xiàn)以MZI進(jìn)行酉矩陣的分解方法時(shí)并未考慮集成[3],但是MZI型人工神經(jīng)網(wǎng)絡(luò)日漸向集成發(fā)展。W. R. CLEMENTS等在2016年基于M. RECK等的三角分解法提出了矩形分解法[6],將MZI進(jìn)行重新排布來(lái)實(shí)現(xiàn)酉矩陣運(yùn)算。通過(guò)將MZI的排布形狀從三角轉(zhuǎn)化為矩形,減少一半的光學(xué)深度,同時(shí)也增加了計(jì)算網(wǎng)絡(luò)的誤差容忍度。酉矩陣的分解過(guò)程如圖3所示。酉矩陣矩形分解方法比酉矩陣三角分解方法更有優(yōu)勢(shì)。這是因?yàn)橛暇仃嚾欠纸夥椒ǖ墓饴肥遣粚?duì)稱的,從而導(dǎo)致了一些傳輸過(guò)程中的誤差。矩形設(shè)計(jì)減小了線路不對(duì)稱性,并縮短了最長(zhǎng)鏈路的長(zhǎng)度,從而減少了光傳播的路徑損耗和誤差。在對(duì)500個(gè)隨機(jī)生成含誤差酉矩陣傳輸?shù)哪M中,隨著酉矩陣規(guī)模N從2擴(kuò)大到50,三角分解方法的準(zhǔn)確度由100%下降到約82%;但是矩形分解方法的準(zhǔn)確度并未發(fā)生明顯下降,一直保持在約100%,具體如圖4所示。
2017年,SHEN Y. C.等利用56個(gè)MZI實(shí)現(xiàn)了可以用于元音識(shí)別的全連接片上神經(jīng)網(wǎng)絡(luò),制成了光子干涉單元芯片。芯片的部分結(jié)構(gòu)如圖5所示[7]。在這個(gè)設(shè)計(jì)中,通過(guò)MZI陣列進(jìn)行神經(jīng)元線性部分的運(yùn)算,人工神經(jīng)網(wǎng)絡(luò)中的非線性激活函數(shù)采用電域仿真的方法得以實(shí)現(xiàn),最終可實(shí)現(xiàn)全連接神經(jīng)網(wǎng)絡(luò)的片上系統(tǒng)。該芯片搭建了2層、每層4個(gè)神經(jīng)元的全連接神經(jīng)網(wǎng)絡(luò)。圖5所示的芯片結(jié)構(gòu)只有1個(gè)酉矩陣和1個(gè)對(duì)角陣,所以應(yīng)用時(shí)要先將元音信號(hào)轉(zhuǎn)為光信號(hào),取得結(jié)果放到電域中處理為光信號(hào)再傳進(jìn)來(lái),至此完成一層計(jì)算。將以上過(guò)程循環(huán)兩遍即為2層神經(jīng)網(wǎng)絡(luò)。上述結(jié)構(gòu)在對(duì)4個(gè)元音的分類的實(shí)驗(yàn)中,能夠從大量不同元音的語(yǔ)音信號(hào)中正確識(shí)別和分類元音,準(zhǔn)確率達(dá)到76.7%。
2019年,M. Y. S. FANG等研究了兩種類型的MZI神經(jīng)網(wǎng)絡(luò),分別為GridNet(網(wǎng)格網(wǎng)絡(luò))、FFTNet(快速傅里葉變換網(wǎng)絡(luò)),其物理結(jié)構(gòu)如圖5所示[8]。其中,矩陣的分解采用的是SVD。FFT酉矩陣乘法器是非通用性的乘法器,它由Cooley-Tukey FFT算法啟發(fā)而來(lái),用犧牲通用性的方式來(lái)?yè)Q取結(jié)構(gòu)上的緊湊性。由圖6可以看出,GridNet和四邊形結(jié)構(gòu)是同一種結(jié)構(gòu),它和FFTNet結(jié)構(gòu)皆為8×4的線性矩陣運(yùn)算器。這兩種結(jié)構(gòu)均為仿真,在零誤差的情況下,GridNet的準(zhǔn)確率約為98%,F(xiàn)FTNet的準(zhǔn)確率約為95%,因此零誤差時(shí)的GridNet準(zhǔn)確率比FFTNet的準(zhǔn)確率高;但是在有差錯(cuò)的情況下,F(xiàn)FTNet的容錯(cuò)率要比GridNet高。在綜合誤差從0升高到0.02時(shí),F(xiàn)TTNet的準(zhǔn)確率由約95%降到約93%,而GridNet的準(zhǔn)確率由約97%降到約48%。越小的網(wǎng)絡(luò)差錯(cuò)傳播所帶來(lái)的誤差就會(huì)越小,這導(dǎo)致了FFTNet的穩(wěn)定性要優(yōu)于GridNet。
綜上可得,無(wú)論是在矩陣規(guī)模擴(kuò)大還是誤差增加的情況下,三角結(jié)構(gòu)的準(zhǔn)確率低于矩形結(jié)構(gòu)。矩形結(jié)構(gòu)和GridNet是同種結(jié)構(gòu),它和FFTNet結(jié)構(gòu)各有利弊:GridNet結(jié)構(gòu)的通用性好,但在存在誤差的情況下,準(zhǔn)確率低;FFTNet通用性差,但在誤差存在的情況下,準(zhǔn)確率高。
2.2 MRR型片上人工神經(jīng)網(wǎng)絡(luò)
MRR神經(jīng)網(wǎng)絡(luò)主要用來(lái)實(shí)現(xiàn)脈沖神經(jīng)網(wǎng)絡(luò)(SNN)。這種網(wǎng)絡(luò)考慮了時(shí)間信息,相比于FNN和RNN更加接近于真實(shí)的人腦運(yùn)作情況,被稱為第3代神經(jīng)網(wǎng)絡(luò)[9]。
圖7所示為A. N. TAIT等于2017年提出的一種廣播式MRR權(quán)值庫(kù)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò) [10]。這是一種以MRR調(diào)制器作為神經(jīng)元,由MRR權(quán)值庫(kù)連接而成的網(wǎng)絡(luò)。每一個(gè)MMR都承擔(dān)著一個(gè)權(quán)值,每一橫條聚集在一起的MMR叫權(quán)值庫(kù)。該芯片結(jié)構(gòu)包含4個(gè)節(jié)點(diǎn),帶有16個(gè)MRR。該結(jié)構(gòu)證明了硅光子電路與連續(xù)神經(jīng)網(wǎng)絡(luò)模型之間存在數(shù)學(xué)同構(gòu)關(guān)系。根據(jù)這種同構(gòu)性,我們利用“神經(jīng)編譯器”對(duì)一個(gè)模擬的24節(jié)點(diǎn)硅光子神經(jīng)網(wǎng)絡(luò)進(jìn)行編程,完成了微分系統(tǒng)仿真任務(wù)。根據(jù)推算,與傳統(tǒng)的解決相同問(wèn)題的CPU相比,此結(jié)構(gòu)的處理速度將提高294倍。
2019年,A. N. TAIT等提出了一種神經(jīng)擬態(tài)的片上結(jié)構(gòu)[11],該結(jié)構(gòu)主要由2個(gè)光探測(cè)器和1個(gè)MRR組成,如圖8(a)所示。神經(jīng)元陣列由電脈沖強(qiáng)度調(diào)控單元及延時(shí)單元構(gòu)成,除泵浦激光器外,整體網(wǎng)絡(luò)可實(shí)現(xiàn)片上集成。每個(gè)MRR只有一個(gè)波長(zhǎng)(λi)。該結(jié)構(gòu)將MRR強(qiáng)度調(diào)制器和平衡的光電探測(cè)器組成電光脈沖強(qiáng)度和延遲調(diào)控單元,并使用電光脈沖進(jìn)行調(diào)控,以實(shí)現(xiàn)復(fù)雜的脈沖神經(jīng)網(wǎng)絡(luò)。當(dāng)輸入為2 ns脈沖偶極子,第2次的輸入相比于第1次輸入延遲一個(gè)波長(zhǎng),進(jìn)而產(chǎn)生t = 0時(shí)的脈沖重合。據(jù)此測(cè)得的加強(qiáng)、飽和、抑制3種情況下的結(jié)果如圖8(b)所示。在圖8(b)中,在可見(jiàn)增強(qiáng)情況下,脈沖出現(xiàn)過(guò)沖現(xiàn)象(超過(guò)57%);而在飽和情況下,脈沖只為輸入脈沖和的56%,且單脈沖抑制不完全。雖然存在一些問(wèn)題,但是這種結(jié)構(gòu)形成了全光廣播權(quán)值神經(jīng)網(wǎng)絡(luò)的組件類型,在一個(gè)集成的光子組件中包含了光到光的非線性、扇入和非確定性級(jí)聯(lián),實(shí)現(xiàn)了光子神經(jīng)元的網(wǎng)絡(luò)兼容的能力。
目前MRR人工神經(jīng)網(wǎng)絡(luò)偏向于貼合神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)同構(gòu)模型的研究,采用比較統(tǒng)一的采用扇入結(jié)構(gòu)、光電光轉(zhuǎn)換等實(shí)現(xiàn)方案。
2.3 MZI型與MRR型片上人工神經(jīng)網(wǎng)
絡(luò)的對(duì)比
MZI型片上人工神經(jīng)網(wǎng)絡(luò)是根據(jù)酉矩陣分解和計(jì)算來(lái)設(shè)計(jì)數(shù)學(xué)同構(gòu)性的;而MRR型片上人工神經(jīng)網(wǎng)絡(luò)則直接以普通矩陣的計(jì)算來(lái)設(shè)計(jì)數(shù)學(xué)同構(gòu)性。兩者本質(zhì)上都是用光器件來(lái)表現(xiàn)數(shù)學(xué)計(jì)算。由于MRR型仍在結(jié)構(gòu)探索階段,相比于MZI型,準(zhǔn)確性遠(yuǎn)遠(yuǎn)不足;而MZI型有較為成熟的應(yīng)用測(cè)試,但相比于傳統(tǒng)芯片,準(zhǔn)確性仍有不足。
3 片上人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)方案面臨的挑戰(zhàn)
利用光子進(jìn)行計(jì)算具有諸多優(yōu)勢(shì),但目前仍存在一些問(wèn)題:
(1)非線性激活函數(shù)是用來(lái)增加神經(jīng)網(wǎng)絡(luò)非線性的一種S形狀的函數(shù),它的硬件實(shí)現(xiàn)起來(lái)比較困難?,F(xiàn)在非線性函數(shù)的實(shí)現(xiàn)方式分為兩種:一種就是轉(zhuǎn)換到電域再處理[7]或利用電域輔助處理[12];另一種就是利用特殊材料,如可飽和吸收體和石墨烯等進(jìn)行處理。一方面,光電轉(zhuǎn)換限制了數(shù)據(jù)處理速度的進(jìn)一步提升;另一方面,大部分特殊材料的片上集成較為困難,不能與互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)工藝兼容。
(2)MZI的長(zhǎng)度約為200 μm,MRR的長(zhǎng)度約為25 μm。相比于電域的器件,芯片集成度差,目前工藝方面還有進(jìn)一步提升的空間。雖然看起來(lái)MRR要比MZI小一些,但是它們基本都屬于一個(gè)數(shù)量級(jí)。另外,由于目前硅基集成光器件的工藝仍舊不夠成熟,器件的一致性、穩(wěn)定性較差。
(3)目前我們需要對(duì)光電人工智能芯片的匹配算法和外圍電路進(jìn)行設(shè)計(jì)[13],并需要將各領(lǐng)域技術(shù)深度融合。這個(gè)結(jié)合的過(guò)程需要重新進(jìn)行布局和設(shè)計(jì),在目前沒(méi)有統(tǒng)一標(biāo)準(zhǔn)的情況下。每一個(gè)光網(wǎng)絡(luò)結(jié)構(gòu)的出現(xiàn)都可能會(huì)導(dǎo)致外圍匹配的電路和算法重新被調(diào)整和優(yōu)化。
4 結(jié)束語(yǔ)
光電神經(jīng)網(wǎng)絡(luò)能夠利用光子技術(shù)的優(yōu)點(diǎn)并配合外圍電域進(jìn)行處理,在提升計(jì)算速度的同時(shí)也可以降低運(yùn)行功耗。無(wú)論是基于FNN的MZI前向人工神經(jīng)網(wǎng)絡(luò)芯片,還是基于SNN的MRR神經(jīng)擬態(tài)人工神經(jīng)網(wǎng)絡(luò)芯片,都可以利用硅基光電子技術(shù)進(jìn)行實(shí)現(xiàn)。此外,光電神經(jīng)網(wǎng)絡(luò)亦會(huì)隨著硅基光電子技術(shù)的成熟而不斷取得突破,如硅基片上光源、放大器、硅基單片集成、硅基新材料融合等新型硅基光電子技術(shù),都將為光電神經(jīng)網(wǎng)絡(luò)的物理研究提供嶄新的、開闊的思路。同時(shí),隨著與光電神經(jīng)網(wǎng)絡(luò)相匹配的算法演進(jìn),相信在將來(lái)的研究中,硅基光電子技術(shù)、硅基光電子芯片將為人工智能領(lǐng)域帶來(lái)全新的技術(shù)架構(gòu)和重大的產(chǎn)業(yè)升級(jí)。
參考文獻(xiàn)
[1] AL-QIZWINI M, BARJASTEH I, AL-QASSAB H, et al. Deep learning algorithm for autonomous driving using GoogLeNet [C]//2017 IEEE Intelligent Vehicles Symposium (IV). Los Angeles, USA: IEEE, 2017. DOI:10.1109/ ivs.2017.7995703
[2] ESTEVA A, KUPREL B, NOVOA R A, et al. Dermatologist-level classification of skin cancer with deep neural networks [J]. Nature, 2017, 542(7639): 115-118. DOI: 10.1038/nature21056
[3] RECK M, ZEILINGER A, BERNSTEIN H J, et al. Experimental realization of any discrete unitary operator [J]. Physical review letters, 1994, 73(1): 58. DOI:10.1103/physrevlett.73.58 DOI:10.1103/physrevlett.73.58
[4] YANG L, JI R Q, ZHANG L, et al. On-chip CMOS-compatible optical signal processor [J]. Optics express, 2012, 20(12): 13560. DOI:10.1364/oe.20.013560
[5] 白冰, 趙斌, 楊釗. 一種光子神經(jīng)網(wǎng)絡(luò)芯片以及數(shù)據(jù)處理系統(tǒng): CN110503196A [P]. 2019-11-26
[6] CLEMENTS W R, HUMPHREYS P C, METCALF B J, et al. Optimal design for universal multiport interferometers [J]. Optica, 2016, 3(12): 1460. DOI:10.1364/optica.3.001460
[7] SHEN Y C, HARRIS N C, SKIRLO S, et al. Deep learning with coherent nanophotonic circuits[C]//2017 IEEE Photonics Society Summer Topical Meeting Series (SUM). San Juan, USA: IEEE, 2017: 441-447. DOI:10.1109/ phosst.2017.8012714
[8] FANG M Y S, MANIPATRUNI S, WIERZYNSKI C, et al. Design of optical neural networks with component imprecisions [J]. Optics express, 2019, 27(10): 14009. DOI:10.1364/ oe.27.014009
[9] MAASS W. Networks of spiking neurons: the third generation of neural network models [J]. Neural networks, 1997, 10(9): 1659-1671. DOI: 10.1016/s0893-6080(97)00011-7
[10] TAIT A N, DE LIMA T F, ZHOU E, et al. Neuromorphic photonic networks using silicon photonic weight banks [J]. Scientific reports, 2017, 7: 7430. DOI: 10.1038/s41598-017-07754-z
[11] TAIT A N, DE FERREIRA L T, NAHMIAS M A, et al. Silicon photonic modulator neuron [J]. Physical review applied, 2019, 11(6): 064043. DOI: 10.1103/physrevapplied.11.064043
[12] WILLIAMSON I A D, HUGHES T W, MINKOV M, et al. Reprogrammable electro-optic nonlinear activation functions for optical neural networks [J]. IEEE journal of selected topics in quantum electronics, 2020, 26(1): 1-12. DOI:10.1109/jstqe.2019.2930455
[13] 白冰, 趙斌, 楊釗. 一種計(jì)算電路以及數(shù)據(jù)運(yùn)算方法: CN110597756A [P]. 2019
作者簡(jiǎn)介
白冰,北京交通大學(xué)光波技術(shù)研究所在讀博士研究生;主要從事硅光集成計(jì)算器件、光電異構(gòu)計(jì)算架構(gòu)和光電融合神經(jīng)網(wǎng)絡(luò)算法等領(lǐng)域的研究;已申請(qǐng)專利12項(xiàng)。
裴麗,北京交通大學(xué)教授、博士生導(dǎo)師;主要從事全光交換、特種光纖、光電器件及基于智能光纖傳感的物聯(lián)網(wǎng)的研究;主持科研項(xiàng)目10余項(xiàng),發(fā)表SCI、EI論文200余篇。
左曉燕,北京交通大學(xué)光波技術(shù)研究所在讀博士研究生;主要從事光神經(jīng)網(wǎng)絡(luò)、光電器件領(lǐng)域的研究。