寇麗杰 ,葉 楠 ,李福山
(1.福州理工學院 計算與信息科學學院,福建 福州 350506;2.福州大學 物理與信息工程學院,福建福州 350118)
隨著人工智能的飛速發(fā)展,能夠模擬生物神經網絡的類腦計算系統(tǒng)受到廣泛的關注。突觸是人腦計算與存儲的關鍵基礎單元,憶阻器因其低功耗、高集成度等優(yōu)勢在電子突觸器件中脫穎而出,是一種很有前途的模擬生物突觸實現(xiàn)神經形態(tài)計算的電子元件[1-2]。憶阻器自身阻值隨流經電荷而發(fā)生變化,在電場作用下因阻變層中的陽離子或氧空位運動而導致導電絲形成與斷裂從而改變器件的電導值[3-4],這與生物突觸權重受不同離子濃度的控制后發(fā)生變化的動力學機制極其相似?;诓煌橘|材料的憶阻器實現(xiàn)神經突觸功能的模擬成為近來研究的熱點[5-11]。憶阻器的導電機制包括導電絲憶阻機制[12]、電子俘獲機制[13]、價態(tài)轉變機制[14]等。
目前可被憶阻器模擬生物神經突觸的功能主要包括突觸可塑性(Synaptic Plasticity)、長時程增強(Long-Term Potentiation,LTP)和短時程增強(Short-Term Potentiation,STP)、雙脈沖易化(PPF)等[15-16],除了上述功能外,對刺激信號的脈寬和強度的依賴可塑性也是生物突觸一種重要的信息處理方式。此外目前研究的憶阻器通常需要經過相對復雜的制備工藝,器件成本較高。因此探尋簡單易操作、低成本的方法制備性能穩(wěn)定的憶阻器也是本技術研究的關鍵問題。
本文從簡化制備工藝、降低成本的思路出發(fā),設計實現(xiàn)了結構簡單、性能穩(wěn)定的憶阻器件。本研究選用常見低價的聚乙烯吡咯烷酮(PVP)作為介質主體材料,選擇CuCl2作為摻雜體引入Cu2+,采用易操作、低成本的溶液法旋涂制備憶阻功能層;由于PVP 是一種非離子型高分子化合物,成膜退火后具有較高的穩(wěn)定性和環(huán)境耐受力,CuCl2在引入Cu2+的同時不會帶入其他干擾雜質,兩種材料的合理配合能高效地調控電荷輸運過程。因此基于Ag/PVP ∶Cu2+/ITO 結構的憶阻器能夠表現(xiàn)出穩(wěn)定的循環(huán)特性,此外該憶阻器還表現(xiàn)出對刺激強度依賴的可塑性和對刺激脈寬依賴的可塑性,這些特性的實現(xiàn)使電突觸器件向生物神經突觸的模擬更近了一步。
混合溶液的制備:將PVP 溶于無水乙醇配制20 mg/mL 的乙醇溶液,將氯化銅溶于無水乙醇配制50 mg/mL 的氯化銅乙醇溶液,將溶液在磁力攪拌條件下攪拌2 h,之后靜置待用。配制溶液的原材料是氯化銅,采用乙醇作為溶劑,配置溶液性能穩(wěn)定且長期低溫妥善保存,溶液顯淡藍色,為二價銅離子的顏色。將配置好的PVP 溶液與CuCl2溶液分別以不同的體積比10 ∶1,50 ∶1,100 ∶1 混合,然后將混合溶液超聲10 min 靜置形成PVP ∶Cu2+混合溶液待用。
器件的制備:首先將鍍有ITO 的玻璃依次經去離子水、丙酮、異丙醇超聲清洗20 min,清洗后放入60℃真空烘箱1 h 至干燥,然后將干燥后的ITO 玻璃經過氧等離子清洗機處理15 min。緊接著進行功能層成膜工藝,通過旋涂工藝將配置好的PVP ∶Cu2+混合溶液旋涂在清洗干凈的ITO 上成膜,采用低速300 r/min旋涂1 s,高速3000 r/min 旋涂40 s,之后經過100 ℃退火10 min。最后,將退火后的樣品轉移到真空鍍膜機中,在PVP ∶Cu2+薄膜層上蓋上具有1 mm 直徑圓孔的掩模版,在3×10-3Pa 壓強環(huán)境下通過真空熱蒸鍍法形成厚度為100 nm 的Ag 作為頂電極。同樣方法制備無Cu2+摻雜的PVP 器件作為參考樣品。
通過半導體測試儀4200 對器件的電學性能進行測試。所有的測試是在室溫和大氣環(huán)境中進行。
生物突觸是兩個神經元的接觸部位,由突觸前膜、突觸間隙和突觸后膜組成,通過機能上的聯(lián)系,突觸在受到前后神經元活動的刺激時,自身權重發(fā)生變化,同時將信息從一個神經元向另一個神經元進行傳導[17]。本文所制備的憶阻器結構屬于簡單的三明治結構,如圖1 所示,在底電極ITO 和蒸鍍的頂電極Ag之間夾著憶阻功能層,憶阻薄膜層是突觸存儲和處理信息的關鍵部分。該核心部分是通過在PVP 中均勻引入銅離子形成活性層,當電荷注入時,憶阻器自身電導發(fā)生變化,同時給出不同的響應現(xiàn)象,表現(xiàn)出與生物突觸類似的功能。
圖1 Ag/PVP ∶Cu2+/ITO 器件平面結構示意圖Fig.1 Schematic diagram of the planar structure of the device based on Ag/PVP ∶Cu2+/ITO
通過對比試驗發(fā)現(xiàn)PVP 溶液與氯化銅溶液體積比取50 ∶1 時,電突觸的性能最好,沒有摻雜Cu2+的PVP 作為憶阻材料制備的器件沒有表現(xiàn)出憶阻效應,而是表現(xiàn)為純電阻。圖2(a)展示了該比例下制備器件在多次被施加0~2.0 V 直流三角波掃描電壓情況下的表現(xiàn)。第一次掃描電壓作用下,器件表現(xiàn)出低電導狀態(tài),接著每次掃描都會使電導值高于前一次的電導值,即器件電導隨著掃描次數(shù)增加逐漸增大,且沒有出現(xiàn)明顯跳變。經過多次掃描后,器件阻值逐漸趨于低導狀態(tài)。從圖2(b)看到當?shù)谝淮问┘臃聪螂妷簳r(-1.3 V),器件的電導值再次來到反向狀態(tài),反向電壓施加下器件電導值表現(xiàn)出隨著施加電壓次數(shù)增大而減小的現(xiàn)象,正反向電壓施加下,發(fā)現(xiàn)器件的高低電導狀態(tài)是可以重復擦寫的。可以注意到器件的反向電導值與正向電導值具有比較大的差值,這是由PVP 的半導體性質所帶來的現(xiàn)象。電突觸在直流電壓的不斷刺激下,其電導狀態(tài)逐漸發(fā)生變化,也就是電突觸的權重逐漸發(fā)生變化,這種現(xiàn)象類似于生物突觸的表現(xiàn)。
圖2 器件在(a)連續(xù)直流正電壓和(b)負電壓作用下的I-V 特性曲線Fig.2 I-V characteristic curves under continuous (a)positive and (b) negative DC voltage sweeps of devices
圖3 分別給出了PVP 溶液與CuCl2溶液以體積比100 ∶1 和10 ∶1 混合分別制備器件,測試所得的電壓電流特性曲線,通過數(shù)據看到Cu2+的摻入對電突觸的憶阻性能具有非常重大的影響。摻入濃度太小,較難實現(xiàn)電荷有效輸運,器件表現(xiàn)出微小的憶阻性能,且不穩(wěn)定,如圖3(a)所示;摻入濃度太大,則可能改變PVP 溶液自身特性,導致難以形成穩(wěn)定的膜層,器件憶阻性能很不穩(wěn)定,如圖3(b)。
圖3 不同摻雜比例(a) 100 ∶1 和(b) 10 ∶1 樣品器件在多次直流正電壓作用下的I-V 特性曲線Fig.3 I-V characteristic curves of devices with different doping ratios of (a)100 ∶1 and (b)10 ∶1,under multiple DC positive voltages
突觸是神經元之間的連接部位,突觸權重根據刺激情況發(fā)生變化這一特性叫做突觸可塑性。突觸可塑性是大腦記憶和學習的神經生物學基礎,也是人工突觸需要實現(xiàn)的首要功能。圖4 展示了基于Ag/PVP ∶Cu2+/ITO 結構的憶阻器所表現(xiàn)出的突觸可塑性。
對電突觸施加連續(xù)重復的脈沖電壓刺激器件的響應如圖4 所示。其中圖4(a)和(b)分別為脈沖作用下電流變化情況和電導變化情況。在圖4(a)中,上圖為所施加的脈沖波形,20 個正脈沖和20 個負脈沖交替地施加到器件上。由于所制備的憶阻器的電導值具有不對稱性,所采用的正脈沖電壓為2 V,負脈沖電壓為-1.3 V,脈寬為0.1 s,間隔為0.4 s。下圖為器件的響應,為了使觀察更加細致清晰,右上角插圖為負向脈沖電壓作用下的電流波形放大圖。器件在正脈沖電壓作用下,流過的電流值逐漸增大,說明電導狀態(tài)由低電導逐漸變?yōu)楦唠妼?。當反向電壓脈沖施加到器件時,器件又從高電導狀態(tài)逐漸減小。隨著脈沖個數(shù)逐漸增加,電導值逐漸減小,反復施加連續(xù)的正負脈沖,器件能夠重復出現(xiàn)電導的變化狀態(tài),呈現(xiàn)出電脈沖時序依賴的突觸可塑性。
圖4 器件在連續(xù)正負脈沖信號刺激下的(a)電流及(b)電導變化情況Fig.4 (a)Current and (b)conductance changes of device stimulated by continuous pulse signals
圖4(b)是器件在一個周期的脈沖電壓刺激下,經計算后獲得每個脈沖刺激所對應的電導值的變化曲線??梢婋娡挥|在每次正脈沖刺激下的電導值會比上一次的電導值高;而每次負脈沖刺激下的電導值會比上一次的電導值低,即突觸權重發(fā)生變化,也就是突觸在每次受到刺激時會記得上一次學習的狀態(tài),在之前狀態(tài)的基礎上進一步學習,這一現(xiàn)象即表明Ag/PVP ∶Cu2+/ITO 結構的電突觸表現(xiàn)出短時增強和抑制學習,即STP 和STD。此外,可以看到當連續(xù)的脈沖施加到憶阻器時,電導變化率逐漸減小,并且最終都達到一個飽和值。也就是說,突觸的學習是一種指數(shù)型學習過程,在施加脈沖的早期階段,學習深度最為明顯,之后的學習僅僅是緩慢被加強,并最終達到飽和狀態(tài),這樣的一種突觸飽和現(xiàn)象與生物學習現(xiàn)象也是一致的。正向和負向電導值的不一致,主要是由于器件在不同方向施加電壓時電子所需要克服的勢壘稍有不同,以及阻變膜層的半導體性質所致,器件表現(xiàn)出不完全對稱的電導值。
生物突觸的記憶行為分為短期記憶和長期記憶,對器件記憶特性進行測試,如圖5(a)所示,在器件經過脈沖刺激完成學習到達高電導狀態(tài)后,每隔160 s用0.1 V 的單脈沖對器件進行一次讀電導,可以看到突觸的電導值緩慢下降,經過1 h 左右器件幾乎回到了初始狀態(tài),也就是形成了突觸的遺忘曲線。曲線變化趨勢展現(xiàn)出緩慢線性的變化,參考艾賓浩斯提出的記憶遺忘曲線[18],該記憶屬于長期記憶,即Ag/PVP ∶Cu2+/ITO 結構的電突觸表現(xiàn)出LTD 現(xiàn)象。由于器件的阻變層采用PVP 材料,經退火后具有很好的穩(wěn)定性,因此器件表現(xiàn)出較好的綜合穩(wěn)定性,如圖5(b)所示,經過近千次的循環(huán)脈沖刺激后器件仍然保持較好的穩(wěn)定性。
圖5 (a)人工突觸在每隔160 s 的0.1 V 單脈沖刺激下遺忘曲線;(b)經過近千次循環(huán)脈沖刺激后人工突觸的脈沖響應表現(xiàn)Fig.5 (a)Forgetting curve of e-synapse under single pulse of 0.1 V once every 160 s;(b)Impulse response performance of e-synapses after nearly one thousand cycles of pulse stimulation
在某些生物神經環(huán)路中,突觸的可塑性不僅表現(xiàn)出時序依賴關系,突觸前后刺激的幅值強度、刺激時長都能夠誘發(fā)突觸的增強或抑制。本文制備的電突觸也做了強度和脈寬依賴性的測試,分別如圖6 和圖7所示。圖6(a)中的上圖為所施加的脈沖波形,分別用相同個數(shù)不同幅度的正脈沖刺激突觸,在每次刺激之后用-1.3 V 負脈沖電壓進行復位。在圖6(a)下圖中可見突觸在不同幅度的脈沖刺激中,刺激幅度越大,電流值變化越快,且經過相同個數(shù)的脈沖刺激,幅度越大的刺激達到的電流值越大。圖6(b)給出了隨著突觸前脈沖幅度變化其電導值的變化情況,一方面在幾種不同幅值脈沖刺激下電突觸均表現(xiàn)出STP,值得注意的是所施加脈沖電壓幅值越大,電導在前幾次脈沖刺激時上升越快,即學習速度越快;另一個方面,可以明顯觀察到脈沖電壓越大突觸最終電導值越大,即飽和權重越大,學習深度越強。
圖6 人工突觸的脈沖幅度依賴性學習行為:在不同幅度脈沖刺激下的(a)電流響應和(b)電導變化情況Fig.6 Amplitude dependent learning behavior of e-synapses:(a) Current responses and (b)conductance value change curves of e-synapses under pulses stimulations of different amplitudes
突觸學習的脈寬依賴性如圖7 所示,其中圖7(a)上圖為所施加的脈沖電壓,分別對突觸施加相同個數(shù)、相同頻率、不同占空比(25%,50%,75%)的脈沖刺激,脈沖幅值均為1.5 V,電突觸表現(xiàn)出明顯的脈寬依賴性。圖7(b)給出三個不同脈寬刺激下突觸電導值變化曲線對比圖,脈沖脈寬增大時,突觸較快速學習進入高電導狀態(tài);脈沖脈寬降低時,突觸進入高電導的速率變緩。此外在較大脈寬脈沖刺激下突觸的飽和電導值較高,即突觸權重較大,反之,在較小脈寬脈沖刺激下,飽和權重值較小。綜上可見,電突觸對不同幅度和脈寬的脈沖給出不同的響應,且脈寬越大,突觸的學習強度越深,達到的飽和權重值越大。
圖7 人工突觸的脈沖寬度依賴性學習行為:在不同寬度的脈沖刺激下的(a)電流響應和(b)電導變化情況Fig.7 Pulse width dependent learning behavior of e-synapses:(a) Current responses and (b)conductance value of e-synapses under pulses stimulations of different widths
結合前文報道研究Cu2+可以改變聚合物的導電狀態(tài),在聚合物中摻入Cu2+可以調控器件電導狀態(tài)[19-21],本文推測對器件施加電壓后的可逆憶阻現(xiàn)象總體來說是由器件中陽極氧化、離子遷移以及Cu2+還原共同作用過程形成的。當對器件陽極Ag 電極施加正向電壓時,在電壓作用下,活性電極Ag 能夠被部分氧化形成金屬陽離子,這部分離子和器件中固有摻入的Cu2+在電場作用下向底電極緩慢遷移,Cl-向正電極遷移。離子遷移的過程中金屬Cu2+遇到陰極飄來的電子,部分離子獲得電子被還原成金屬原子,從而形成導電絲,使器件的導電狀態(tài)發(fā)生變化。由于陽極氧化所得離子和固有摻入的Cu2+濃度都較低,這種還原的導電絲并不是由金屬原子連續(xù)排列而成,而是由一系列金屬原子團簇間隔納米量級距離形成,較小的間隔距離使電子能夠有效地發(fā)生隧穿效應,導電絲對外展現(xiàn)出較高的電導率。當?shù)诙问┘诱螂妷簳r,繼續(xù)發(fā)生著陽離子氧化和離子的遷移被還原,導電絲在前一次的基礎上得到延伸,電導值增大,因此器件展現(xiàn)出憶阻效應。當施加反向電壓時,陽極氧化過程消失,而ITO 陰極無法提供氧化的陽離子,導電絲發(fā)生斷裂直至消失,器件逐漸回到高阻態(tài)。此外由于所施加脈沖幅值和脈沖寬度影響注入電荷速率、陽極氧化過程以及離子遷移速度,因此基于Ag/PVP ∶Cu2+/ITO 結構的電突觸的學習行為對脈沖幅值和寬度具有依賴性。
綜上所述,本文通過易操作的旋涂和蒸鍍工藝制備了基于Ag/PVP ∶Cu2+/ITO 的簡單結構的憶阻器,器件對所施加電信號表現(xiàn)出時間依賴可塑性,類似生物突觸。隨著所施加電信號的脈沖個數(shù)增加,憶阻器電導值逐漸發(fā)生變化,即電突觸的突觸權重逐漸發(fā)生變化;此外基于此結構的電突觸還表現(xiàn)出與所施加脈沖幅度和脈沖寬度依賴的學習規(guī)則,當所施加電脈沖個數(shù)一樣但幅度越大時,電突觸權重變化越快,且達到的飽和權重值越大,學習強度越深;同時所施加脈沖信號脈寬越寬,相當于對突觸施加的單脈沖有效刺激時長越長時,電突觸的學習強度越深,達到的飽和權重值越大。憶阻器工作的導電機理主要源自于摻雜在PVP 中的Cu2+遷移后被還原形成導電絲,從而調控電荷的輸運。該人工突觸的導電機制的探索還不夠深入,有待進一步對該器件在工作時的導電通道的建立過程進行進一步表征和研究。