• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于靜態(tài)隨機存取存儲器的存內(nèi)計算研究進展

    2022-11-29 11:00:32藺智挺童忠瑱吳秀龍汪方銘彭春雨盧文娟陳軍寧
    電子與信息學報 2022年11期

    藺智挺 徐 田 童忠瑱 吳秀龍 汪方銘 彭春雨盧文娟 趙 強 陳軍寧

    (安徽大學電子信息工程學院 合肥 230601)

    1 引言

    人工智能(Artificial Intelligence, AI)在各個領域得到了特別的關注和廣泛的應用,同時也促使著“算力時代”的到來。與AI相關的算法,如深度神經(jīng)網(wǎng)絡(Deep Neural Networks, DNN)、卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks, CNN)等需要進行大量的數(shù)據(jù)處理。然而,大多數(shù)現(xiàn)代計算系統(tǒng)是以傳統(tǒng)的馮·諾依曼結構為基礎建立的,物理結構上包括獨立的計算單元和存儲單元,其在執(zhí)行各種計算任務的過程中,需要在存儲單元和計算單元之間反復傳輸大量的數(shù)據(jù),這將導致巨大的延遲和能量損耗[1–3],從而限制了數(shù)據(jù)處理的效率。處理器和存儲設備長期非均衡的發(fā)展,使得存儲器和處理器之間的速度差距越來越大,這種差距稱為“內(nèi)存墻”,由此產(chǎn)生眾所周知的馮·諾依曼瓶頸。只有解決馮·諾依曼瓶頸,才能將人工智能應用到能量預算和效率有嚴格限制的設備中(如物聯(lián)網(wǎng)、可移動設備、可穿戴設備等)實現(xiàn)“人工智能無處不在”。

    為了克服傳統(tǒng)馮·諾依曼結構帶來的計算限制,存內(nèi)計算(Computing In Memory, CIM)的概念被提出,其不需要將數(shù)據(jù)從存儲器傳輸?shù)教幚砥?,直接將運算部分整合到存儲陣列內(nèi)部執(zhí)行計算,這不僅減少了中間數(shù)據(jù)的傳輸,還減輕了處理器的運算量。由于總線的帶寬不再是吞吐量的限制因素,從而顯著地提高了吞吐量和能效[4–7]。存內(nèi)計算的另一個顯著的優(yōu)勢是能夠?qū)崿F(xiàn)多行讀取,從而減少了存儲訪問的次數(shù),增加了數(shù)據(jù)吞吐量。

    隨著有效緩解馮·諾依曼瓶頸的存內(nèi)計算成為一個熱門的研究領域,越來越多的學者開始從事這方面的研究,乘法計算、加減法運算以及邏輯運算已通過存內(nèi)計算實現(xiàn),相關的研究在國際等級的期刊、會議陸續(xù)出現(xiàn)。隨著學者對存內(nèi)計算技術研究的深入,一些學者發(fā)現(xiàn)在各種存儲器中實現(xiàn)存內(nèi)計算具有可行性,由于靜態(tài)隨機存取存儲器(Static Random-Access Memory, SRAM)單元穩(wěn)定性高,讀取速度快而且在最先進的處理器中普遍存在,這使得在芯片上集成計算能力具有可行性?;赟RAM的存內(nèi)計算也受到國內(nèi)外學者的關注。在SRAM陣列中實現(xiàn)存內(nèi)計算技術包括數(shù)字信號[8–10]、模擬信號[11–14]和混合信號方法,基于SRAM存內(nèi)計算技術的具體實現(xiàn)將在之后的章節(jié)概述。

    本文其余部分的組織結構如下,第2節(jié)主要介紹SRAM存內(nèi)計算的應用背景,例如卷積神經(jīng)網(wǎng)絡、機器學習分類器、編碼、存內(nèi)加解密算法等;第3節(jié)闡述基于SRAM存內(nèi)計算的邏輯運算、乘法累加操作(Multiply ACcumulation, MAC)等運算功能的實現(xiàn)。第4節(jié)介紹以模數(shù)轉(zhuǎn)換器為核心的量化技術和不同數(shù)模轉(zhuǎn)換器的特點;第5節(jié)分析存內(nèi)計算架構中存在的一些挑戰(zhàn)與問題;第6節(jié)從不同研究方向展望存內(nèi)計算技術。

    2 存內(nèi)計算技術應用背景

    現(xiàn)有存內(nèi)計算能實現(xiàn)的計算原語已經(jīng)廣泛應用于各個AI領域之中,從要求大量數(shù)據(jù)訪問的圖像語音識別到確保數(shù)據(jù)安全性的加解密算法。在本節(jié)中,介紹了存內(nèi)計算技術的應用背景,并且分析了SRAM陣列如何與這些應用相結合。

    2.1 應用于機器學習

    2.1.1 卷積神經(jīng)網(wǎng)絡

    CNN作為DNN的延續(xù)和發(fā)展,主要應用于圖像處理。如圖1所示,其中展示的是CNN中的卷積層。卷積層提取了輸入的不同特征,全連接層組合這些特征映射到最終的輸出。對于每一個卷積層都包含一系列卷積核(Weight, W)、輸入特征映射(Input Feature MaP, IFMP)、輸出特征映射(Output Feature MaP, OFMP)。輸出特征映射是由卷積核與輸入相卷積得到,其中主要的運算就是MAC。所以很多研究者致力于實現(xiàn)存內(nèi)的MAC運算,而且SRAM單元互補對稱的結構很利于應用于MAC。通常把權重存儲到SRAM單元內(nèi)部,輸入可通過外圍電路應用于字線上或者通過數(shù)字輔助電路應用于陣列之中。為了進一步減小功耗和硬件開銷使存內(nèi)運算更好地滿足SRAM陣列,文獻[15,16]實現(xiàn)了存內(nèi)的二值化神經(jīng)網(wǎng)絡(Binary Neural Networks,BNN),其輸入和權重都是二值為“+1”或者“–1”,其精度相較于傳統(tǒng)的CNN算法相差不大。Chih等人[17]提出基于6T SRAM的全數(shù)字存內(nèi)計算用于實現(xiàn)CNN中的乘法累加操作,具有較高的能量效率和吞吐率。SRAM陣列具體如何實現(xiàn)這些乘累加操作,后面的章節(jié)會具體介紹。

    圖1 SRAM陣列應用于卷積神經(jīng)網(wǎng)絡

    2.1.2 機器學習分類器

    在機器學習中,分類器對所需處理的數(shù)據(jù)進行分類,用于判斷一個新的觀察樣本所屬的類別。然而,由于分類器算法的高數(shù)據(jù)訪問速率及高度不規(guī)則的數(shù)據(jù)訪問模式,實現(xiàn)低開銷的分類器算法具有挑戰(zhàn)性。所以,學者開始關注存內(nèi)實現(xiàn)分類器,并且其中較多的工作是基于SRAM陣列實現(xiàn)分類器。

    文獻[18, 19]提出了一種機器學習分類器,其中計算是在標準6T SRAM陣列中執(zhí)行的。外圍電路通過SRAM列來實現(xiàn)混合信號的弱分類器,通過組合多個列來克服電路的非理想性,實現(xiàn)強分類器。其中輸入是以字線電壓體現(xiàn),而權重是固定存儲在陣列單元內(nèi)部。此設計在采用標準訓練算法時將能耗降低了113倍。Kang等人[20]介紹了一種隨機森林機器學習分類算法的存內(nèi)實現(xiàn)。同樣地,該設計也是基于6T SRAM陣列,支持大規(guī)模的并行處理,從而最大限度地減少了數(shù)據(jù)與存儲器之間往返的次數(shù)。在存內(nèi)實現(xiàn)高數(shù)據(jù)訪問量算法將會是未來的趨勢。

    2.2 應用于編碼

    數(shù)據(jù)傳輸差錯控制編碼中一個重要的算法就是漢明距離。漢明距離是比較兩個相同長度字節(jié)中有多少位不同的算法,其在信號處理和模式識別中都有廣泛應用。

    Kang等人[21]提出了一種基于6T SRAM陣列的存內(nèi)漢明距離計算。該設計中一個數(shù)據(jù)存儲在單元內(nèi)部,而另外一個數(shù)據(jù)是應用于字線上,最后的漢明距離計算結果以兩個位線電壓差得到。由于結果是以位線電壓體現(xiàn),所以該設計的計算方式只能按列進行,這就與SRAM按行存儲模式有所沖突,降低了計算效率。為了解決此類問題, Ali等人[22]提出了一種9T SRAM單元用于漢明距離計算,該計算方式是按行進行的。其中輸入向量應用于兩根讀位線即上讀位線(Read Bit Line, RBL)、讀位線非 (Read Bit Line Bar, RBLB),另一個數(shù)據(jù)也是存儲在單元內(nèi),異或(eXclusive OR, XOR)結果最終在按行連接的電源線(Source Line, SL)。為了打破漢明距離算法在存內(nèi)空間上的限制,接下來的研究方向可以著眼于可同時按行、按列進行漢明距離計算。

    2.3 應用于存內(nèi)加解密算法

    在大數(shù)據(jù)時代對數(shù)據(jù)加密尤為重要,但是通過數(shù)字域?qū)崿F(xiàn)一套加密算法,例如高級加密標準(Advanced Encryption Standard, AES),其功耗和延時會限制系統(tǒng)整體性能,而存內(nèi)實現(xiàn)AES就是很好的選擇。

    如圖2所示,為AES加解密算法的全流程,其中包括字節(jié)替換、行移位、列混合、輪密鑰加這4個步驟。Wang等人[23,24]實現(xiàn)了存內(nèi)全流程AES。Agrawal等人[2]基于8T SRAM提出了“讀算存”策略,其中將運算得到的XOR結果通過每一列尾部的數(shù)據(jù)選擇器存儲到另外一行,可以實現(xiàn)AES中迭代式XOR部分操作,但是這樣的策略同時也增加了存儲陣列的面積開銷,需要額外空出一行來存儲運算結果。Huang等人[25]修改了帶有雙字線的6T SRAM位單元,以在不犧牲并行計算效率的情況下實現(xiàn) XOR 加密,這可以保護 CIM中的DNN模型數(shù)據(jù)不被泄露。

    圖2 AES流程圖

    3 SRAM存內(nèi)計算實現(xiàn)的運算功能

    基于SRAM的存內(nèi)計算設計既可以實現(xiàn)SRAM的基本讀寫功能,也可以通過設置位線電壓,改變單元結構以及修改外圍電路來實現(xiàn)計算功能。目前一些存內(nèi)設計主要實現(xiàn)的功能有布爾運算、內(nèi)容可尋址存儲器(Content Addressable Memory,CAM)、乘法累計以及減法運算。

    3.1 布爾運算

    由于陣列單元結構的重復性,所以在存內(nèi)較易實現(xiàn)簡單重復的布爾邏輯運算。現(xiàn)階段大多數(shù)布爾運算是通過激活相鄰的兩個或多個單元的字線,用靈敏放大器(Sensa Amplifier, SA)感測位線電壓所實現(xiàn)[25–28]。然而對于使用傳統(tǒng)的6T陣列執(zhí)行存內(nèi)操作,同時開啟多行會帶來一些挑戰(zhàn),例如讀干擾問題。因此電路設計者采用讀寫分離的SRAM單元[6,26,29]或降低字線(Word Line, WL)電壓的方法來緩解這些挑戰(zhàn)。Agrawal等人[2]則提出了8T SRAM和8+T SRAM單元結構實現(xiàn)布爾邏輯運算,提高了吞吐率和計算速度。這里主要介紹其或非(Not OR,NOR)和與非(Not AND , NAND)邏輯運算。8T SRAM單元結構如圖3(a)所示,通過控制一列中兩個位單元的讀操作,在RBL上實現(xiàn)布爾邏輯運算。如圖3(b)所示,為了實現(xiàn)NOR邏輯運算,首先將RBL預充到VDD,同時激活一列中相鄰兩個單元的字線,當單元1和單元2中存儲的數(shù)據(jù)都為0時,兩個單元的放電路徑同時截止,RBL保持預充高電平,經(jīng)過兩個反相器(INVerter, INV)后,NOR輸出為1,其余輸出為0。

    圖3 布爾運算

    NAND邏輯運算通過準確控制兩條讀字線(Read Word Line, RWL)的脈沖寬度實現(xiàn),只有當單元1和單元2中存儲的數(shù)據(jù)都為1時,兩個單元中的M1, M3同時導通放電(此時放電速度最快),單元1和單元2其中一個為1時,只有一個放電路徑使得RBL放電不完全。如圖3(c)所示,這兩種情況下RBL上的電壓會有所不同。通過選擇INV3的跳變點,使得它僅在“11”情況下輸出高電平,此時INV4輸出NAND操作。兩種運算的真值表如圖3(d)所示,此單元具有解耦的讀寫路徑,同時激活兩條讀字線不會帶來讀干擾問題。另一種設計是將8T SRAM結構改進為8T+SRAM結構,其使用非對稱SA檢測兩條讀位線上的電壓差實現(xiàn)布爾邏輯運算,因為此單元結構允許差分讀取檢測,所以與8T單元結構相比具有更高的魯棒性。

    表1比較了5種現(xiàn)有的存內(nèi)計算實現(xiàn)布爾運算的技術,結果表明,大多數(shù)方案是通過修改標準單元實現(xiàn)各種布爾運算。文獻[30,31]提出創(chuàng)新的策略使用6T SRAM 單元執(zhí)行布爾運算,避免了讀寫干擾的風險。其將兩個被訪問的單元連接到不同的局部位線,最終在全局位線連接的SA端輸出運算結果。類似于上述策略的大多數(shù)存內(nèi)設計在單個周期只能實現(xiàn)兩個輸入的布爾運算,若要實現(xiàn)復合布爾邏輯運算至少需要兩個周期。文獻[32]提出新的12T雙端口雙互鎖存儲單元在單個周期內(nèi)同時實現(xiàn)兩對數(shù)據(jù)集的布爾運算。安徽大學的Lin團隊[33]充分利用傳統(tǒng)8T的雙字線和3個讀端口實現(xiàn)多輸入布爾運算,有效地突破了現(xiàn)有方案的瓶頸。這些工作則解決了多輸入布爾邏輯需要兩周期的問題,能做到在1個周期內(nèi)就可完成復合布爾邏輯運算。

    表1 CIM實現(xiàn)布爾運算的相關設計參數(shù)以及性能指標

    3.2 乘法及累加

    DNN的關鍵算法是矩陣向量乘法(Matrix-Vector Multiply, MVM),包括乘法和累加計算。然而,算法頻繁的訪問存儲被限制了能效和速度,為了解決這個問題,學者提出BNN將權重和神經(jīng)元激活二值化[34–36],MVM被簡化成按位XNOR運算。Agrawal等人[14]實現(xiàn)了XNOR運算通過模擬累加方式把結果累加到SL之上,原理如圖4所示。

    其中操作分為兩步:預備階段如圖4(a)所示,在執(zhí)行運算之前2維向量輸入A1和K1被存儲在存儲陣列之中,RBL/RBLB預充到VDD。接著,A1相應行的字線RWL打開,RBL/RBLB根據(jù)相應存儲陣列存儲的值進行放電,然后,所對應行的SL接地。例如,存儲陣列存儲的數(shù)值為“1”(Q=VDD,QB=0 V),則RBL通過M2, M1放電到0 V。運算階段如圖4(c)所示,首先,對K1進行操作,K1值的大小是存儲陣列存儲值設定的。如果Q=0,則K1=0;如果Q=1,則K1=1。然后K1所在行的SL上寄生電容存儲了初始電壓,并且其對應行的RWL開啟。最后SL上積累XNOR計算結果。例如,A1=0,K1=0,則SL電壓“上拉”;A1=0,K1=1,則SL電壓“下拉”。通過上面兩步實現(xiàn)了A1*K1,也就是XNOR運算。對應的真值表可由圖4(b)看出。完成了單次XNOR運算后,運算的累加結果體現(xiàn)在SL電壓上。

    圖4 乘法運算

    整個存內(nèi)乘法技術的關鍵是如何累加XNOR計算結果。一些存內(nèi)計算設計[11,37,38]以模擬的方式在SRAM陣列中實現(xiàn)乘法累加,以加速人工智能算法。表2總結了部分存內(nèi)設計實現(xiàn)乘法運算的參數(shù)以及性能指標。雖然有些方法可以顯著提高能量效率和執(zhí)行效率,但也存在一些不足,例如使用ADC/DAC會產(chǎn)生額外的面積開銷或者受到模擬非理想性的影響降低了推理的準確性。針對這些問題一些學者做了分析研究,例如文獻[37]提出了奇偶雙通道策略增加了運算吞吐量和整體系統(tǒng)的能耗效率。文獻[39]研究了模擬運算的非理想性對基于6T SRAM單元實現(xiàn)點乘運算的影響,并提出有效的緩解方案。文獻[40]將基于6T SRAM的內(nèi)存運算與數(shù)字近內(nèi)存計算多位積和運算相結合,以提高讀取精度并減少面積開銷。

    表2 存內(nèi)實現(xiàn)乘法運算的參數(shù)以及性能指標

    3.3 減法

    減法運算是廣泛使用的匹配模式算法,根據(jù)脈寬調(diào)制技術研究者提出基于SRAM的減法運算。減法運算實現(xiàn)如圖5所示,將減數(shù)以4位二進制的形式輸入到字線脈沖產(chǎn)生電路,脈沖產(chǎn)生電路根據(jù)輸入的特征值選擇開啟一條字線(輸入為1時開啟WL,反之開啟WLB),4條字線開啟的時間根據(jù)輸入特征值的權重高低分別為8T, 4T, 2T, 1T。被減數(shù)以4位二進制形式存儲在一列相鄰的4個存儲單元。如果局部位線(Local Bit Line, LBL)和局部位線非(Local Bit Line Bar, LBLB)與存儲節(jié)點“0”連接則使其放電,與節(jié)點“1”相連則保持預充電壓。之后通過比較兩條局部位線的電壓差獲得減法的計算結果,這種多行開啟的方式實現(xiàn)減法運算極大地提高了吞吐量。

    圖5 減法運算原理圖

    3.4 內(nèi)容可尋址

    CAM主要分為二進制內(nèi)容可尋址(Binary Content Addressable Memory, BCAM)和三進制內(nèi)容可尋址(Ternary Content Addressable Memory,TCAM)。通過對需要檢索的數(shù)據(jù)與存儲器內(nèi)的數(shù)據(jù)進行比較匹配得到存儲位置,這樣操作可以極大程度地減少待檢索數(shù)據(jù)的搬移。

    3.4.1 二進制內(nèi)容可尋址

    文獻[9]使用如圖6(a)所示的push-rule 6T SRAM單元構成的陣列,BCAM操作時,搜索數(shù)據(jù)和待查找數(shù)據(jù)都是由4位二進制組成的,搜索數(shù)據(jù)以電壓的形式加載到字線,待查找數(shù)據(jù)存儲在一列相鄰的4個單元。每列的匹配結果通過位線BL與BLB接的SA和與門體現(xiàn)。文獻[41]提出了基于SRAM 6T的可重配置CAM/SRAM結構,如圖6(b)所示,該結構可通過CAM_MODE在CAM模式和SRAM模式下進行切換,提高了單元利用率。在CAM模式下執(zhí)行并行數(shù)據(jù)搜索,并通過單端靈敏放大器輸出結果表示尋址是否匹配。但是此設計以面積和功耗為代價實現(xiàn)并行數(shù)據(jù)搜索。利用CAM搜索數(shù)據(jù)的功能,文獻[42]提出CAM輔助電路技術,該技術通過提高寫速度來提高能量效率。文獻[43]則利用3D-CAM設計一種新穎的存內(nèi)數(shù)模轉(zhuǎn)換器。

    圖6 二進制內(nèi)容可尋址

    3.4.2 三進制內(nèi)容可尋址

    另外一種尋址模式為TCAM三進制尋址。由于TACM在存內(nèi)中可以有無關態(tài),因此其可以匹配多個搜索字符串。表3比較了多種現(xiàn)有的內(nèi)容可尋址方案,如圖7(a)所示為TCAM陣列[33],其中TCAM的3種狀態(tài):0/1/X(X為無關態(tài)),分別由00/11/10表示。搜索的數(shù)據(jù)存儲在SRAM陣列同一行相鄰的兩列中,目標數(shù)據(jù)由RWL和WLL的電平表示。文獻[44]同樣使用讀寫分離的8T單元實現(xiàn)TCAM功能,如圖7(b)所示,通過控制其RWL和搜索字線USL和LSL的開關實現(xiàn)尋址。此單元不僅可配置為TCAM,還可以執(zhí)行左移、右移功能。

    圖7 三進制內(nèi)容可尋址

    表3 存內(nèi)CAM芯片參數(shù)以及性能指標總結

    與上述不同的是,文獻[45]提出的10T SRAM提高存內(nèi)計算的穩(wěn)定性,通過重新配置數(shù)據(jù)線、讀出放大器和讀端口可實現(xiàn)內(nèi)容可尋址,由于其單元結構的對稱性可提供按行或列的數(shù)據(jù)搜索??紤]到三進制內(nèi)容可尋址存儲器受到單元面積大、高搜索功率以及匹配線上搜索速度和信號余量的折中等限制,Xue等人[46]采用分離控制14T TCAM單元和一種3倍裕量電壓檢測放大器緩解上述問題,同時降低了搜索延遲和搜索能量。

    4 SRAM存內(nèi)計算量化技術

    在SRAM陣列中執(zhí)行乘法累加運算的本質(zhì)是模擬運算,其將權重存儲在單元陣列中,輸入激活應用到字線,運算結果以模擬電壓的形式體現(xiàn),那么如何量化該模擬電壓以及提高量化精度顯得尤為重要。

    4.1 Flash ADC應用于存內(nèi)計算

    常見的ADC結構有積分型ADC[12,14,47]、逐次逼近型ADC[3,48–50](Successive Approximation Register Analog-to -Digital Converter, SAR-ADC)以及Flash ADC [11,13,51,52],其中Flash ADC由多個比較器構成,是目前轉(zhuǎn)換速率最快的一種結構。文獻[4, 5]在外圍電路中嵌入11級Flash ADC,將代表每列MAC結果的模擬電壓進行數(shù)字化處理。每個ADC由10個基于采樣的自校準單端比較器組成,其操作分為兩個步驟,首先,在每列MAC計算期間,將代表運算結果的MBL通過傳輸門連接到比較器的電容Vcap,同時RSTB=1產(chǎn)生負反饋。之后,將電容的輸入節(jié)點切換到參考電壓VREF,并且關閉負反饋路徑。VREF和VMBL之間的電壓差將導致電容的充放電,使反相器被驅(qū)動為高電平或低電平,之后通過增益反相器鏈放大輸出數(shù)字值。文獻[53]使用strong-arm比較器構成的11級Flash ADC進行數(shù)字化,并且通過多路復用器在64列之間共享ADC,減少了面積開銷。與非線性量化相比,其采用受限線性量化方案,由于更寬的參考電壓間隔將CIFAR-10的精度提高到88.8%。與上述不同的是文獻[13]在功耗、性能和面積之間權衡選擇了4 bit Flash ADC,此ADC使用SA代替模擬比較器以節(jié)省面積降低功耗。

    4.2 應用于存內(nèi)計算中的逐次逼近型ADC

    與Flash ADC相比,SAR-ADC的結構相對簡單,廣泛用于處理存內(nèi)計算中產(chǎn)生的模擬運算結果??紤]到CIM中的ADC面積和能量開銷,文獻[49]采用SAR架構的ADC提供8位輸出,用于后續(xù)數(shù)字計算。文獻[3]使用SAR-ADC將多位乘法運算累加的模擬電壓轉(zhuǎn)換為數(shù)字輸出,由于采用SA作為比較器和電容陣列的DAC,從而降低了SAR-ADC的靜態(tài)功耗。文獻[37]利用了電容陣列經(jīng)過多周期操作生成了不同的參考電壓用于處理位線的模擬電壓,并且利用了電容陣列對位線電壓進行了高低位合并,也就是進行了加權。在此ADC中是將不同數(shù)值的電容通過開關依次接到SA兩端中的一端,也就是通過多個操作階段進行逐次比較,從而對位線的模擬電壓進行量化。盡管此逐次逼近型ADC相較于Flash ADC在量化速度上有所不足,但是使用多周期可以節(jié)省大量的面積開銷。

    4.3 數(shù)字電路輔助型ADC

    如何將低精度ADC應用于存內(nèi)計算之中一直是關鍵技術。下面的工作就是利用了數(shù)字電路進行輔助,使得低精度ADC在量化模擬電壓時也能提高量化結果。

    文獻[14]提出基于電荷共享方法來執(zhí)行XNOR和近似popcount運算。最終的結果以模擬電壓的形式體現(xiàn)在源極SL上,為了檢測該模擬電壓,他們提出了一種低開銷、低精度電荷共享的串行積分型ADC。由于低精度的ADC很難檢測準確地模擬電壓。所以該方案還采用雙字線和雙級ADC技術來最小化脈沖計數(shù)輸出的誤差。雙字線技術存儲器陣列每行的前1/2單元連接到RWL1,另1/2連接到RWL2。以確保一次只有1/2的單元參與電荷共享,從而減少待檢測的SL上電壓狀態(tài)的數(shù)量。雙級ADC如圖8(a)所示。在ADC檢測的第1階段,ADC控制模塊產(chǎn)生信號VREFN, VREFP以及使能信號SAE,并將其饋送到兩個SA,以確定SL上模擬電壓的子類。其他的控制信號用于ADC檢測的第2階段對虛擬單元進行操作,虛擬單元根據(jù)子類在每個周期向SL注入或從SL泵出電荷,同時數(shù)字電路計數(shù)器在產(chǎn)生ADC輸出的最后3位期間對周期數(shù)進行計數(shù)。

    如圖8(b)所示,文獻[40]提出了自參考多級讀出器(Self-Reference Multi Level Reader, SRMLR)用于量化兩個位線的模擬電壓值。SRMLR是由電壓型SA、數(shù)據(jù)線預充選擇器、輸出鎖存器和編碼器所組成的。無論是Flash ADC、逐次逼近型ADC還是數(shù)字電路輔助型ADC都是對位線運算結果進行量化,并在面積、功耗、精度之間的折中。

    圖8 數(shù)字輔助型ADC

    5 存算架構面臨的挑戰(zhàn)及解決策略

    為了實現(xiàn)存內(nèi)計算中的特定功能,國內(nèi)外學者對單元結構的重構或外圍電路的增添方面進行了大量的研究。各種存算策略的出現(xiàn)同時也帶來很多架構問題,下面針對存算架構中幾個關鍵問題進行分析。

    5.1 存算加權技術分析

    5.1.1 晶體管尺寸加權技術

    在實現(xiàn)多比特乘法中,晶體管的寬長比經(jīng)常被用來作為加權。如圖9(a)所示,8T陣列中通過調(diào)整不同列的讀取訪問管尺寸大小作為數(shù)據(jù)的權值[1],在此8T陣列中第1列的M1和M2的寬長比等于8,以此類推第2列、第3列、第4列的M1, M2的寬長比分別為4, 2, 1,因此可以實現(xiàn)多位乘1位的點積和運算。此工作合并4列的位線放電電流,最后通過運算放大器將電流值轉(zhuǎn)化成電壓值進行量化。相同地,文獻[37]基于傳統(tǒng)8T提出了twin-8T結構,將其中一組讀取晶體管寬長比調(diào)至另外一組的2倍,實現(xiàn)了兩比特輸入加權。

    圖9 晶體管尺寸加權

    如圖9(b)所示,文獻[38,54]提出一種可轉(zhuǎn)置運算單元結構,其內(nèi)部也是利用晶體管的寬長比進行加權。此策略是基于傳統(tǒng)6T單元增加額外的晶體管,可以實現(xiàn)水平方向和垂直方向的乘法運算。上述的研究均是利用了位線放電電流與晶體管寬長比成正比的特點,所以可以通過調(diào)節(jié)其尺寸得到多位乘法運算。但是由于需要調(diào)大管子的尺寸,所以在芯片之中所需要的面積開銷也很大。如果想要實現(xiàn)更高位的運算,那么面積開銷是需要呈指數(shù)倍增長,文獻[37,38,54]利用寬長比方法只做了兩位加權。寬長比對運算進行加權的實質(zhì)是對電流進行等比例擴大,之后研究的方向可致力于尋找另一種等比例擴大電流的策略來代替寬長比加權,減少面積開銷帶來的挑戰(zhàn)。

    5.1.2 電容陣列加權技術

    電容陣列在實現(xiàn)運算結果的高低位合并是一項常用的技術,也就是通過電容陣列提高運算的位數(shù)[11,13]。如圖10(a)所示,RBL[3]-RBL[0]每一列上的電容總值都為9CU,然而每根位線上分享的電容數(shù)值比例為8:4:2:1,因此可通過打開S0和S1分別在N3-N0得到8 /9?v, 4 /9?v, 2 /9?v, 1 /9?v。文獻[55, 56]通過比例為16:1的電容陣列,完成了低4位運算同高4位運算的合并,基本操作與上述類似。上述的研究都是通過電容的數(shù)值完成加權操作的,此技術與晶體管尺寸技術加權同樣有較大的面積消耗。另外一種做法是通過多周期多運算結果進行分享[57]得到與電容加權相同的結果,如圖10(b)所示,如果需要1/8加權,位線在第1個周期連接到端口2,電壓降低到1/4。第2個周期,位線連接到端口1,電荷再平分,所以現(xiàn)在的電荷變成原來的1/8。為了獲得其他權重,可以在類似于上述操作的多周期操作中完成,此技術比上述電容數(shù)值加權技術增加了計算周期,但是減小了面積開銷 。

    圖10 電容加權技術

    通過電容陣列,無論是電容數(shù)值加權還是多周期分享,都是在面積開銷和速度開銷之間的折中。而且,電容分享在通過開關共享時也會有損耗,影響計算結果的精度。過大的電容雖然可以增加計算結果的線性度,但是也會給電路帶來額外的功耗。

    5.1.3 脈沖個數(shù)/高度/寬度加權技術

    Sinangil 等人[13]提出的用于機器學習的CIM芯片采用了脈沖個數(shù)調(diào)制電路,如圖11(a)所示,利用字線 RWL 上不同的脈沖數(shù)目代表不同的權重。這些脈沖是由計數(shù)器根據(jù)輸入數(shù)據(jù)的數(shù)值所產(chǎn)生的,再應用到字線開啟單元,從而實現(xiàn)多比特輸入。脈沖高度加權可以由如圖11(b)所示電路產(chǎn)生,字線DAC電路由二進制權值電流源和復制單元所組成[19],此電路可根據(jù)輸入數(shù)據(jù)不同生成不同比例的電流,電流再通過二極管連接的MA,R產(chǎn)生應用于字線的電壓,輸出電壓根據(jù)數(shù)字量0000-1111一一對應,從而實現(xiàn)了不同權重的輸入。除了脈沖個數(shù)與脈沖高度加權技術,還有另外一種控制訪問管放電時間的脈寬加權。如圖11(c)所示,文獻[55,56]提出了一種功能性讀技術對存儲的權重進行4位加權。該策略的實現(xiàn)是基于脈寬調(diào)制,而且在位線電壓保持在一定的范圍內(nèi),位線放電電壓與字線開啟時間成正比,所以可以通過調(diào)整WL0-WL3開啟時間為8:4:2:1實現(xiàn)4位加權運算。

    圖11 脈沖加權

    3種技術的核心問題在位線上等效電阻與寄生電容不是恒定的,在整個計算過程中位線電壓是動態(tài)變化的,因此會使整個系統(tǒng)計算精度下降。而且整個陣列中字線長度較長,所以應用于字線的電壓會隨著寄生電容不同發(fā)生畸變,導致相同的計算數(shù)值在不同列產(chǎn)生不同的放電電壓,產(chǎn)生計算結果有不一致性。

    為了保障存內(nèi)計算中的一致性以及提高線性度,文獻[58]提出了一種共源共柵電流鏡(Cascade Current Mirror, CCM)用于鉗制位線電壓,如圖12(a)所示,每條位線上增加4個晶體管,鉗制位線電壓并按比例鏡像讀取電流,從而提高計算的線性度。時序如圖12(b)所示,在預充電過程中,BL充電至VDD/2左右,Vout接地,VCM/VG連接至VDD;然后CCM進入預讀取階段,VG連接到 BL,為了確保晶體管在飽和區(qū)工作,VCM的偏置電壓被設置為VDD/2左右,CCM需要很短的預讀取時間,以使BL 的電壓在 WLR脈沖到達之前保持穩(wěn)定。最后多行讀取開始,多行字線被激活,M1和M3按比例鏡像多行讀取時位線上的總電流IBL,并且通過電容收集鏡像的電流形成輸出電壓Vout表示計算結果。由于此電路采用雙字線6T單元結構,減少了字線上的脈沖寬度延遲,從而保證電路計算的一致性。仿真結果顯示,在0.8 V電壓下,CCM電路可將非線性降低70%,在0.9 V電壓下,計算一致性提高54.85%。此研究不僅探索了非線性和不一致性產(chǎn)生的原因,還提出相應的解決方案是當前技術的一個突破。Kim等人[59]提出了全數(shù)字位串行計算架構,基于其新穎的可重構位串行結構,輸入和權重精度可從1 bit配置到6 bit,此設計不受上述模擬計算的非理想性影響,但是提供的面積優(yōu)勢是以降低吞吐率為代價。

    圖12 共源共柵電流鏡

    5.2 外圍電路占比過大

    存內(nèi)計算的架構為了執(zhí)行額外的計算功能需要大量的外圍輔助電路來完成。例如,在實現(xiàn)數(shù)字功能中的邏輯運算時,每一列位線上需要兩個SA來區(qū)別不同輸入;在執(zhí)行模擬運算中的乘累加時,就需要外圍輔助電路量化這些電壓值。典型的做法是引用ADC進行量化,這都會增加外圍電路的占比。此外,多比特輸入生成也會占據(jù)很大部分的面積。

    外圍電路占比過大是研究者在設計電路過程中需要去解決的問題,為了減少外圍電路的開銷,Yin等人[53]通過64列共用一個ADC,分64次對位線電壓進行量化。Biswas等人[12]實現(xiàn)了存內(nèi)基于脈寬的6 bit輸入,傳統(tǒng)的做法是通過外圍電路生成64種不同脈寬,再根據(jù)輸入將對應的脈寬作用到陣列之上,這樣策略的外圍電路面積開銷過大。此工作中提出了GBL_DAC(Global Bit Line Digital-to-Analog Converter)電路,該電路使用了3個2:1多路復用器(MUltipleXing, MUX)和一個8:1MUX實現(xiàn)了64:1MUX的功能,通過組合8種不同的脈寬就可生成64種與輸入對應的脈寬,大大減少面積開銷。在存內(nèi)計算系統(tǒng)級設計時也不能一味為了實現(xiàn)更復雜的運算增加外圍電路而忽視了輔助電路的復雜性。

    5.3 讀破壞問題

    在存內(nèi)計算中經(jīng)常需要同時開啟多行進行操作,增加數(shù)據(jù)處理的吞吐量。但是,同時開啟多行會導致存儲節(jié)點與位線直接相連接,讀取過程中很容易造成數(shù)據(jù)被翻轉(zhuǎn),導致最后的計算結果發(fā)生錯誤。如圖13(a)所示,在一列中相鄰4個單元中存儲的數(shù)據(jù)為“0111”,相對應的4根字線WL0-WL3被激活,其開啟時間分別為8T0, 4T0, 2T0, T0。BLB電流根據(jù)單元內(nèi)部存儲的數(shù)據(jù)從M3, M2, M1流向存儲“0”數(shù)據(jù)單元的M0。傳統(tǒng)SRAM基本單元為左右對稱互補結構,所以BL上電流正好與BLB相反,并且BL可以通過3個路徑放電,會使位線電壓快速降低。如果位線電壓降得過低,會影響3個存儲“1”的單元,使內(nèi)部數(shù)據(jù)容易發(fā)生翻轉(zhuǎn),這樣會導致存內(nèi)計算中讀取魯棒性降低。最壞的情況會發(fā)生在放電為8T0時,此時位線放電量最大。

    為了解決上述討論的讀破壞問題,Kang等人[60]則通過降低字線WL的開啟電壓來減緩位線的速度,并且調(diào)節(jié)每個T0的時間使其放電的線性度最優(yōu)。如圖13(b)所示,有研究者通過重構傳統(tǒng)SRAM單元提出了7T, 8T, 9T, 10T等一系列讀寫分離結構[6,14,44,52],這樣把讀、寫操作分開,被隔離的位線不會影響到內(nèi)部節(jié)點,也就不會出現(xiàn)讀破壞的現(xiàn)象。為了不影響存儲密度,其他研究者選擇將基本6T單元結構的存儲陣列分割成較小的部分[30,31],如圖13(c)所示,其將兩部分被訪問的小陣列模塊連接到不同的局部位線,最終在全局位線連接的SA端輸出運算結果,從而降低了讀破壞的風險。

    圖13 多行讀取的讀破壞

    6 展望

    6.1 多模式下模塊電路的建模

    以應用為導向的存內(nèi)計算系統(tǒng)是需要考慮存儲器密度、計算精度、功耗等因素的。想要進行敏捷的CIM系統(tǒng)設計,研究者可以針對電路單元庫的不同層次,研究多模式下電路的自動建模,快速獲得各層次電路模塊的參數(shù)以支撐芯片綜合算法。

    電路執(zhí)行不同任務,在性能、功耗等方面顯示出不同的需求,這使得最終的電路的設計和結構會有所不同。這一點在存內(nèi)計算場景下將變得更加突出,因此,如圖14所示,需要建立一個高能效的電路單元庫,可以滿足盡可能多的任務場景。已有的電路模塊中,相同功能的不同電路模塊往往具有不同的電路接口,這不利于在電路迭代時進行敏捷設計。因此為了實現(xiàn)CIM芯片的敏捷設計,可以應當構建具有相同接口的模塊電路庫。當硬件參數(shù)、需求改變時,通過迭代關鍵路徑關鍵模塊可以提升目標性能,以此縮短存內(nèi)計算芯片迭代時間,提升電路設計的敏捷性。

    圖14 電路單元庫模型實例

    6.2 面向多種AI算法的CIM資源規(guī)劃與調(diào)度

    CIM的最大優(yōu)勢在于減少數(shù)據(jù)的搬移,而不在于復雜計算。若某種算法其數(shù)據(jù)并不需要頻繁搬移或者改變,同時運算卻較為復雜,那么“存內(nèi)”并不合適。因此,如圖15所示,研究者應當首先分析SRAM特點、CIM的限制以及主流人工智能算法的需求。之后需要提煉算法共性基本算子、提煉算法位數(shù)、容量需求。根據(jù)所提煉的共性基本算子、各種需求,規(guī)劃電路模塊功能接口、規(guī)劃精度位數(shù)可調(diào)范圍、規(guī)劃共享的層次數(shù)目、每個層次的計算資源共享模式。之后再設計計算資源調(diào)度策略,實現(xiàn)計算資源調(diào)度器。調(diào)度器需考慮SRAM的狀態(tài)以及計算資源的狀態(tài),根據(jù)請求進行調(diào)度選擇合適的計算資源,避免沖突。

    圖15 計算資源調(diào)度方式研究方案

    6.3 面向CIM的異構多處理器系統(tǒng)關鍵技術

    想要充分發(fā)揮CIM的優(yōu)勢,可以將其看成系統(tǒng)的一部分而不僅是一個割裂的輔助加速器。在CIM系統(tǒng)中,并不是所有的數(shù)據(jù)都適合在存內(nèi)處理,部分數(shù)據(jù)在處理器中計算,部分數(shù)據(jù)在CIM中計算。程序在CIM中執(zhí)行的部分必須與在處理器中繼續(xù)執(zhí)行的部分保持一致。但是由于一致性消息消耗了大量的片外通信,CIM體系結構無法使用傳統(tǒng)的方法來實現(xiàn)緩存一致性,對于許多數(shù)據(jù)密集型應用程序來說,這可能會抵消CIM執(zhí)行的好處。研究思路如圖16所示,未來研究方向可能是在傳統(tǒng)粒度一致性的基礎上,通過準預測的思想,減少CIM提交來減少沖突發(fā)生回滾的開銷。這樣不僅避免了大量不必要的數(shù)據(jù)刷新所造成的功耗,還保障了數(shù)據(jù)的一致性。

    圖16 面向CIM的異構多處理器系統(tǒng)關鍵技術的研究思路

    7 結論

    存內(nèi)計算技術作為“算力時代”中的前沿技術之一,其具有劃時代意義。SRAM存內(nèi)計算是克服傳統(tǒng)馮·諾依曼架構中存在的“存儲墻”問題的有效策略,可以高能效地實現(xiàn)AI算法,為未來的智慧生活奠定了基礎。本文概述了SRAM存內(nèi)計算的應用背景,并且討論了現(xiàn)有SRAM架構所能實現(xiàn)的運算功能。用于復雜的應用時電路需具有要高精度的量化能力,為此我們還研究了SRAM存內(nèi)計算架構中各種量化技術。并且探討了SRAM存內(nèi)計算技術中存在的一系列問題和面臨的挑戰(zhàn)。存內(nèi)計算架構的競爭力體現(xiàn)在芯片的整體性能,而整體性能本質(zhì)是各種問題之間的折中,基于存內(nèi)計算架構的芯片在未來定會廣泛地應用于各個領域。

    男女床上黄色一级片免费看| 久久亚洲真实| 香蕉丝袜av| 少妇裸体淫交视频免费看高清 | 精品午夜福利视频在线观看一区| 国产激情久久老熟女| 亚洲天堂国产精品一区在线| 国产高清videossex| 法律面前人人平等表现在哪些方面| 正在播放国产对白刺激| 一级毛片女人18水好多| 国产99久久九九免费精品| 成人一区二区视频在线观看| 日日爽夜夜爽网站| 国产午夜精品论理片| 757午夜福利合集在线观看| 欧美精品啪啪一区二区三区| 在线播放国产精品三级| 国产单亲对白刺激| 国产欧美日韩一区二区精品| 亚洲成人久久爱视频| 首页视频小说图片口味搜索| 日本三级黄在线观看| 国产激情久久老熟女| 夜夜躁狠狠躁天天躁| 亚洲中文日韩欧美视频| 欧美激情久久久久久爽电影| 日韩中文字幕欧美一区二区| 男人舔女人的私密视频| 女人高潮潮喷娇喘18禁视频| av国产免费在线观看| 免费av毛片视频| 亚洲精品美女久久av网站| 久久人妻福利社区极品人妻图片| 国产成人精品久久二区二区91| 99riav亚洲国产免费| 三级毛片av免费| 午夜福利成人在线免费观看| 精品久久久久久久久久免费视频| 国产1区2区3区精品| 国产精品乱码一区二三区的特点| 欧美三级亚洲精品| 欧美又色又爽又黄视频| 久久精品夜夜夜夜夜久久蜜豆 | 麻豆成人午夜福利视频| 老司机午夜十八禁免费视频| 国产成人啪精品午夜网站| 中文字幕久久专区| 亚洲av成人一区二区三| 久久久久免费精品人妻一区二区| 搞女人的毛片| 黑人巨大精品欧美一区二区mp4| 一进一出抽搐gif免费好疼| 一级a爱片免费观看的视频| 精品乱码久久久久久99久播| 露出奶头的视频| 午夜福利在线观看吧| 亚洲免费av在线视频| 少妇的丰满在线观看| 亚洲男人的天堂狠狠| 啦啦啦观看免费观看视频高清| 欧美乱色亚洲激情| 麻豆久久精品国产亚洲av| av在线播放免费不卡| 欧美日韩中文字幕国产精品一区二区三区| 国产精品综合久久久久久久免费| 日韩中文字幕欧美一区二区| 亚洲片人在线观看| 亚洲精品美女久久av网站| 久久久久久久午夜电影| 国产成人精品无人区| 91国产中文字幕| 非洲黑人性xxxx精品又粗又长| 欧美国产日韩亚洲一区| 黄色a级毛片大全视频| 成人永久免费在线观看视频| 国产视频一区二区在线看| 婷婷精品国产亚洲av在线| 久久99热这里只有精品18| 女生性感内裤真人,穿戴方法视频| 亚洲av熟女| 久99久视频精品免费| 久久久久国产一级毛片高清牌| 伦理电影免费视频| 精品高清国产在线一区| 一级黄色大片毛片| 免费看a级黄色片| 宅男免费午夜| 国内毛片毛片毛片毛片毛片| 成人手机av| 熟女少妇亚洲综合色aaa.| 窝窝影院91人妻| 国产黄片美女视频| 男人舔奶头视频| 免费av毛片视频| 91av网站免费观看| 好男人在线观看高清免费视频| 欧美3d第一页| 男女那种视频在线观看| 在线十欧美十亚洲十日本专区| 亚洲 欧美 日韩 在线 免费| 午夜福利18| 99在线人妻在线中文字幕| 免费人成视频x8x8入口观看| 久久这里只有精品19| 成年女人毛片免费观看观看9| 法律面前人人平等表现在哪些方面| 亚洲欧洲精品一区二区精品久久久| 国产激情欧美一区二区| 一本综合久久免费| 女同久久另类99精品国产91| 欧美日韩黄片免| 女人高潮潮喷娇喘18禁视频| 久久99热这里只有精品18| 天堂√8在线中文| 久久人妻福利社区极品人妻图片| 青草久久国产| 亚洲男人的天堂狠狠| 亚洲av片天天在线观看| 欧美精品亚洲一区二区| 999久久久精品免费观看国产| 国内少妇人妻偷人精品xxx网站 | 久久久久国产精品人妻aⅴ院| 国产精品国产高清国产av| 久久精品亚洲精品国产色婷小说| 欧美色欧美亚洲另类二区| 亚洲在线自拍视频| 我的老师免费观看完整版| 久久中文看片网| 亚洲精华国产精华精| svipshipincom国产片| 又黄又粗又硬又大视频| 精品一区二区三区视频在线观看免费| 成人三级黄色视频| 欧美黄色片欧美黄色片| 18禁美女被吸乳视频| 桃红色精品国产亚洲av| xxxwww97欧美| 欧美大码av| 一本综合久久免费| 老汉色∧v一级毛片| 美女大奶头视频| 亚洲av美国av| 免费看美女性在线毛片视频| 毛片女人毛片| 亚洲国产中文字幕在线视频| 91在线观看av| 午夜福利18| cao死你这个sao货| 老司机午夜福利在线观看视频| 中文资源天堂在线| 亚洲精品久久成人aⅴ小说| 欧美成狂野欧美在线观看| 99国产精品99久久久久| 中文字幕人成人乱码亚洲影| 精品熟女少妇八av免费久了| 白带黄色成豆腐渣| 久久久国产精品麻豆| 久久精品国产99精品国产亚洲性色| 午夜激情av网站| 免费高清视频大片| 国产精品久久电影中文字幕| 国产精品综合久久久久久久免费| 日本免费a在线| 天堂影院成人在线观看| av天堂在线播放| 欧美在线一区亚洲| 国产激情偷乱视频一区二区| 一级a爱片免费观看的视频| 午夜免费激情av| 日日爽夜夜爽网站| 欧美日韩瑟瑟在线播放| 麻豆国产av国片精品| 日韩欧美国产在线观看| 欧美乱色亚洲激情| 久久久久亚洲av毛片大全| 国产精品九九99| 亚洲欧美日韩高清专用| 淫妇啪啪啪对白视频| 日韩中文字幕欧美一区二区| 在线永久观看黄色视频| 99久久无色码亚洲精品果冻| 久久精品国产99精品国产亚洲性色| netflix在线观看网站| 久久久久国内视频| 精品欧美一区二区三区在线| 国产片内射在线| 亚洲午夜理论影院| ponron亚洲| 黄色视频不卡| 精品欧美国产一区二区三| 精品第一国产精品| 麻豆成人av在线观看| 国产精品av视频在线免费观看| 亚洲aⅴ乱码一区二区在线播放 | 成人国产综合亚洲| 亚洲av成人不卡在线观看播放网| 午夜a级毛片| 亚洲九九香蕉| 99热6这里只有精品| 久久热在线av| 欧美性长视频在线观看| 免费看a级黄色片| 国产精品九九99| 制服诱惑二区| 黑人欧美特级aaaaaa片| 757午夜福利合集在线观看| 又粗又爽又猛毛片免费看| www.999成人在线观看| 黄片大片在线免费观看| 久久伊人香网站| 欧美日韩瑟瑟在线播放| 国产一区二区在线观看日韩 | 成人18禁高潮啪啪吃奶动态图| 手机成人av网站| 啦啦啦免费观看视频1| 51午夜福利影视在线观看| 色综合欧美亚洲国产小说| 岛国在线观看网站| 欧美在线黄色| 51午夜福利影视在线观看| 婷婷丁香在线五月| 欧美精品啪啪一区二区三区| 在线观看一区二区三区| 亚洲国产精品成人综合色| 蜜桃久久精品国产亚洲av| 成年版毛片免费区| 丰满的人妻完整版| 99riav亚洲国产免费| 欧美久久黑人一区二区| 亚洲一区二区三区色噜噜| 亚洲精品美女久久久久99蜜臀| 亚洲一卡2卡3卡4卡5卡精品中文| 午夜精品一区二区三区免费看| 变态另类成人亚洲欧美熟女| 久久精品夜夜夜夜夜久久蜜豆 | 欧美国产日韩亚洲一区| 婷婷亚洲欧美| 国产蜜桃级精品一区二区三区| 日本 欧美在线| 伦理电影免费视频| 在线观看免费视频日本深夜| 国产精品久久久人人做人人爽| 99riav亚洲国产免费| 高清在线国产一区| 欧美日韩瑟瑟在线播放| 国产高清激情床上av| 国产精品久久视频播放| 精品第一国产精品| 亚洲专区中文字幕在线| 久久久久久大精品| 国产日本99.免费观看| 午夜日韩欧美国产| 国产精品av视频在线免费观看| 日韩有码中文字幕| av免费在线观看网站| 一个人免费在线观看的高清视频| 精品第一国产精品| 欧美午夜高清在线| 桃色一区二区三区在线观看| 好男人电影高清在线观看| 久久精品91无色码中文字幕| 手机成人av网站| 国产一区二区三区在线臀色熟女| 丁香六月欧美| 中文字幕人妻丝袜一区二区| √禁漫天堂资源中文www| 午夜福利在线在线| 欧美日韩一级在线毛片| 亚洲欧美精品综合一区二区三区| 69av精品久久久久久| netflix在线观看网站| 亚洲国产欧洲综合997久久,| 中文字幕最新亚洲高清| 国内揄拍国产精品人妻在线| 亚洲第一欧美日韩一区二区三区| 午夜免费成人在线视频| 午夜精品久久久久久毛片777| 岛国在线观看网站| 午夜福利免费观看在线| 成人欧美大片| 哪里可以看免费的av片| 国内精品久久久久精免费| 两个人免费观看高清视频| 欧美中文日本在线观看视频| 人人妻,人人澡人人爽秒播| 后天国语完整版免费观看| 国产精品一区二区精品视频观看| 欧美日韩乱码在线| 久久精品亚洲精品国产色婷小说| 久久中文字幕人妻熟女| 国产亚洲精品综合一区在线观看 | 香蕉久久夜色| 国产精品自产拍在线观看55亚洲| 成人精品一区二区免费| 国产亚洲欧美在线一区二区| 成人欧美大片| 女生性感内裤真人,穿戴方法视频| 观看免费一级毛片| 国产欧美日韩一区二区三| 国产v大片淫在线免费观看| 久久精品人妻少妇| 禁无遮挡网站| 中文亚洲av片在线观看爽| 色播亚洲综合网| 国产免费男女视频| 香蕉丝袜av| 久久久久久久久中文| 天堂动漫精品| 中文字幕久久专区| 国产av不卡久久| 观看免费一级毛片| 欧美黄色片欧美黄色片| 久久热在线av| 男女床上黄色一级片免费看| 淫妇啪啪啪对白视频| 久久天堂一区二区三区四区| 国产精品永久免费网站| 国产高清激情床上av| 精品欧美一区二区三区在线| 啦啦啦免费观看视频1| 国产97色在线日韩免费| 亚洲全国av大片| 欧美乱妇无乱码| av福利片在线观看| 日本 欧美在线| 国产精品国产高清国产av| 一个人免费在线观看电影 | 2021天堂中文幕一二区在线观| 日韩有码中文字幕| 成人国产一区最新在线观看| 精品无人区乱码1区二区| 99久久久亚洲精品蜜臀av| 亚洲精品av麻豆狂野| 97人妻精品一区二区三区麻豆| 男人的好看免费观看在线视频 | 精品乱码久久久久久99久播| 国产精品美女特级片免费视频播放器 | 国产免费av片在线观看野外av| 制服诱惑二区| 欧美日韩国产亚洲二区| 亚洲美女视频黄频| 久久香蕉激情| www日本在线高清视频| 亚洲18禁久久av| 欧美丝袜亚洲另类 | 国产探花在线观看一区二区| 最好的美女福利视频网| 又大又爽又粗| 欧美乱码精品一区二区三区| 国产欧美日韩一区二区三| 99热6这里只有精品| 亚洲成人免费电影在线观看| 亚洲成av人片免费观看| 亚洲中文字幕一区二区三区有码在线看 | 一进一出好大好爽视频| 成人av在线播放网站| 在线十欧美十亚洲十日本专区| 久久久久久久久久黄片| 很黄的视频免费| 777久久人妻少妇嫩草av网站| av有码第一页| 中出人妻视频一区二区| 在线a可以看的网站| 色综合站精品国产| 色综合欧美亚洲国产小说| 999精品在线视频| 精品免费久久久久久久清纯| 50天的宝宝边吃奶边哭怎么回事| 亚洲自拍偷在线| 亚洲成av人片免费观看| 久久久久国产精品人妻aⅴ院| 亚洲熟妇熟女久久| 99久久综合精品五月天人人| 久久国产乱子伦精品免费另类| 老司机午夜十八禁免费视频| 午夜免费成人在线视频| 国产单亲对白刺激| 一区福利在线观看| svipshipincom国产片| 久久精品国产亚洲av香蕉五月| 欧美国产日韩亚洲一区| 亚洲av美国av| 丁香六月欧美| 久久中文字幕人妻熟女| 久久久久国产精品人妻aⅴ院| 国产成人精品无人区| 亚洲av五月六月丁香网| 国产成人影院久久av| 日韩中文字幕欧美一区二区| 久9热在线精品视频| 欧美一区二区精品小视频在线| 日本一二三区视频观看| 熟妇人妻久久中文字幕3abv| 国产高清视频在线观看网站| 国产亚洲欧美98| 中文亚洲av片在线观看爽| 一夜夜www| 一本精品99久久精品77| 美女大奶头视频| 欧美日韩一级在线毛片| 国产精品1区2区在线观看.| 国产精品精品国产色婷婷| 国产精品永久免费网站| av中文乱码字幕在线| 亚洲精品久久国产高清桃花| 国产亚洲精品av在线| 国产精品,欧美在线| 性欧美人与动物交配| 999精品在线视频| 性色av乱码一区二区三区2| 精品国内亚洲2022精品成人| 一区福利在线观看| 国产视频内射| 麻豆久久精品国产亚洲av| 亚洲精品中文字幕一二三四区| 天堂av国产一区二区熟女人妻 | 制服诱惑二区| 在线观看66精品国产| 久久中文字幕一级| 啦啦啦韩国在线观看视频| 美女黄网站色视频| 熟女少妇亚洲综合色aaa.| av天堂在线播放| 麻豆成人午夜福利视频| 精品不卡国产一区二区三区| 亚洲欧美一区二区三区黑人| 看片在线看免费视频| 中文字幕人妻丝袜一区二区| 99热这里只有精品一区 | 999精品在线视频| 中国美女看黄片| 天天一区二区日本电影三级| 欧美一区二区国产精品久久精品 | 亚洲国产高清在线一区二区三| 一个人观看的视频www高清免费观看 | a级毛片a级免费在线| 99久久综合精品五月天人人| 成人国产一区最新在线观看| 91国产中文字幕| 白带黄色成豆腐渣| 叶爱在线成人免费视频播放| 最新美女视频免费是黄的| 精华霜和精华液先用哪个| 午夜成年电影在线免费观看| 亚洲男人天堂网一区| 啦啦啦韩国在线观看视频| 最近视频中文字幕2019在线8| 超碰成人久久| a在线观看视频网站| 一区二区三区高清视频在线| 欧美丝袜亚洲另类 | 欧美黑人巨大hd| 久久香蕉精品热| 欧美人与性动交α欧美精品济南到| 久久久久亚洲av毛片大全| 91麻豆av在线| 久久久久久久久久黄片| 日韩欧美在线乱码| 国产精品久久久久久人妻精品电影| 又紧又爽又黄一区二区| 可以在线观看的亚洲视频| 精品久久久久久,| 日本在线视频免费播放| 亚洲精品美女久久久久99蜜臀| 欧美高清成人免费视频www| 国产黄色小视频在线观看| 精品福利观看| 香蕉国产在线看| 午夜福利在线在线| 欧美中文综合在线视频| АⅤ资源中文在线天堂| 好看av亚洲va欧美ⅴa在| 国产精品 国内视频| 麻豆久久精品国产亚洲av| 国产视频内射| 免费av毛片视频| 日日摸夜夜添夜夜添小说| 久久中文字幕一级| 国产亚洲av高清不卡| 国产成人aa在线观看| 丁香欧美五月| 国产精品一区二区免费欧美| 精品久久久久久久毛片微露脸| 成年女人毛片免费观看观看9| 草草在线视频免费看| 精品国内亚洲2022精品成人| 性色av乱码一区二区三区2| 757午夜福利合集在线观看| 亚洲精品中文字幕一二三四区| 天天一区二区日本电影三级| 免费观看人在逋| 99国产精品99久久久久| 九色成人免费人妻av| 级片在线观看| 国产精品av视频在线免费观看| 精品久久久久久成人av| 搡老岳熟女国产| 老司机午夜福利在线观看视频| 无遮挡黄片免费观看| 亚洲成a人片在线一区二区| ponron亚洲| 欧美色视频一区免费| 色哟哟哟哟哟哟| 久久性视频一级片| 三级男女做爰猛烈吃奶摸视频| 人成视频在线观看免费观看| 亚洲色图av天堂| 亚洲黑人精品在线| 欧美日韩精品网址| 69av精品久久久久久| 婷婷亚洲欧美| 久久天躁狠狠躁夜夜2o2o| 亚洲午夜精品一区,二区,三区| 亚洲黑人精品在线| 不卡av一区二区三区| 我要搜黄色片| 亚洲专区字幕在线| а√天堂www在线а√下载| 国产亚洲精品综合一区在线观看 | 欧美大码av| 在线观看一区二区三区| 熟女少妇亚洲综合色aaa.| www日本黄色视频网| 亚洲欧美精品综合久久99| 亚洲欧美日韩无卡精品| 久久久久国产一级毛片高清牌| 午夜福利欧美成人| 特大巨黑吊av在线直播| 国产不卡一卡二| 亚洲国产精品久久男人天堂| 久久精品国产亚洲av香蕉五月| 色尼玛亚洲综合影院| 午夜免费观看网址| 50天的宝宝边吃奶边哭怎么回事| 天堂√8在线中文| 真人做人爱边吃奶动态| 亚洲狠狠婷婷综合久久图片| 两性午夜刺激爽爽歪歪视频在线观看 | 黄色片一级片一级黄色片| 好男人电影高清在线观看| 久久久久性生活片| 少妇人妻一区二区三区视频| 国产区一区二久久| 国产亚洲精品第一综合不卡| 女警被强在线播放| 亚洲 国产 在线| 久久精品国产99精品国产亚洲性色| 欧美在线黄色| 丰满人妻熟妇乱又伦精品不卡| 1024香蕉在线观看| 夜夜躁狠狠躁天天躁| 久久久久久国产a免费观看| 黑人操中国人逼视频| 制服丝袜大香蕉在线| 国产精品国产高清国产av| 久久精品成人免费网站| 不卡一级毛片| av福利片在线| 2021天堂中文幕一二区在线观| 精品欧美一区二区三区在线| 黄色女人牲交| 亚洲欧美日韩高清在线视频| 久久精品综合一区二区三区| 好看av亚洲va欧美ⅴa在| 欧美在线一区亚洲| 国产精品久久久久久久电影 | av在线播放免费不卡| 天堂影院成人在线观看| 亚洲熟妇中文字幕五十中出| 精品高清国产在线一区| 国产伦人伦偷精品视频| 国产精品98久久久久久宅男小说| 成人手机av| 男人舔奶头视频| 精品欧美一区二区三区在线| 欧美黑人精品巨大| 欧美一级a爱片免费观看看 | 一区二区三区国产精品乱码| 日本免费a在线| 黄色成人免费大全| 在线观看免费日韩欧美大片| 伊人久久大香线蕉亚洲五| 久久精品国产99精品国产亚洲性色| 亚洲国产看品久久| 伦理电影免费视频| 久久精品影院6| 香蕉久久夜色| 最近最新免费中文字幕在线| 亚洲精品中文字幕在线视频| aaaaa片日本免费| 男女下面进入的视频免费午夜| 制服人妻中文乱码| 亚洲精品美女久久久久99蜜臀| 人人妻人人看人人澡| 日本a在线网址| 欧美日韩瑟瑟在线播放| 丝袜人妻中文字幕| 妹子高潮喷水视频| 久久久精品国产亚洲av高清涩受| 国产真人三级小视频在线观看| 日本三级黄在线观看| 国产91精品成人一区二区三区| 国产av麻豆久久久久久久| 午夜亚洲福利在线播放| 精品少妇一区二区三区视频日本电影| 麻豆国产av国片精品| 久久人人精品亚洲av| www.熟女人妻精品国产| 国产精品九九99| 亚洲欧美日韩东京热| 男人的好看免费观看在线视频 | 99久久国产精品久久久| 国产真人三级小视频在线观看| 男女那种视频在线观看|