摘" 要:隨著人工智能和計(jì)算機(jī)視覺(jué)技術(shù)的快速發(fā)展,圖像識(shí)別在許多領(lǐng)域中變得尤為重要,而中餐食物的復(fù)雜性和多樣性給圖像分類(lèi)帶來(lái)了巨大挑戰(zhàn)。ResNet因其高效信息傳遞能力,在多個(gè)領(lǐng)域有廣泛應(yīng)用?,F(xiàn)有的ResNet結(jié)構(gòu)在處理中餐食物圖像時(shí),可能無(wú)法充分應(yīng)對(duì)其獨(dú)有的特征和復(fù)雜性。通過(guò)在統(tǒng)一條件下對(duì)ResNet結(jié)構(gòu)進(jìn)行研究,訓(xùn)練和比較不同的ResNet結(jié)構(gòu),選出最適合中餐食物圖像識(shí)別的模型,并進(jìn)一步優(yōu)化網(wǎng)絡(luò)性能。實(shí)驗(yàn)結(jié)果表明,本實(shí)驗(yàn)中探索到的ResNet結(jié)構(gòu)在提高分類(lèi)準(zhǔn)確率方面具有顯著優(yōu)勢(shì)。研究結(jié)果為中餐圖像識(shí)別領(lǐng)域的應(yīng)用提供了新的技術(shù)路徑和理論支持。
關(guān)鍵詞:圖像識(shí)別;殘差神經(jīng)網(wǎng)絡(luò);中餐;神經(jīng)網(wǎng)絡(luò);人工智能
中圖分類(lèi)號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2025)03-0073-06
A ResNet Network Structure Suitable for Image Recognition of Chinese Food
SHI Chenwei
(School of Information Science and Engineering, East China University of Science and Technology, Shanghai" 200237, China)
Abstract: With the rapid development of Artificial Intelligence and Computer Vision technology, image recognition has become particularly important in many fields, and the complexity and diversity of Chinese food have brought great challenges to image classification. ResNet is widely used in many fields due to its efficient information transmission capability. The existing ResNet structure may not adequately cope with the unique characteristics and complexity of Chinese food images. By studying the ResNet structure under the unified conditions, training and comparing different ResNet structures, the most suitable model for Chinese food image recognition is selected, and the network performance is further optimized. The experimental results show that the ResNet structure explored in this experiment has significant advantages in improving the classification accuracy. The research results provide a new technical path and theoretical support for the application of Chinese food image recognition.
Keywords: image recognition; ResNet; Chinese food; Neural Network; Artificial Intelligence
0" 引" 言
在人類(lèi)歷史上,食物作為人類(lèi)進(jìn)行各種活動(dòng)的唯一能量來(lái)源,占據(jù)了生活中極其重要的位置,與之相關(guān)的諸多事物也在生活中占有舉足輕重的地位。目前,隨著人們生活質(zhì)量的不斷提高,人們開(kāi)始在飲食上有了更多的追求,例如如何得到更好吃的食物與如何吃的更健康,為滿足這些要求,一大批基于食物圖像識(shí)別的應(yīng)用出現(xiàn),例如食物評(píng)分、營(yíng)養(yǎng)跟蹤和智能購(gòu)物等。食物圖像識(shí)別相關(guān)的研究從20世紀(jì)末便開(kāi)始了,目前已有不錯(cuò)的進(jìn)展,如Subhi等人提出了一種適用于馬來(lái)西亞食物識(shí)別的深度神經(jīng)網(wǎng)絡(luò)[1],武若琪等人提出了一種使用特征融合進(jìn)行的亞洲食物圖片分類(lèi)方法[2],徐冰則研究了如何使用深度學(xué)習(xí)對(duì)亞洲食物圖像進(jìn)行分類(lèi)[3]。在當(dāng)前人工智能蓬勃發(fā)展的時(shí)代,涌現(xiàn)出了不少適用于圖像的卷積神經(jīng)網(wǎng)絡(luò),如LeNet[4]、AlexNet[5]、VGGNet[6]、GoogleNet[7]、ResNet[8]等,為食物圖像識(shí)別技術(shù)不斷提供新的思路。
本文提出一種適用于中餐食物圖像識(shí)別的ResNet網(wǎng)絡(luò)結(jié)構(gòu)。ResNet通過(guò)運(yùn)用殘差連接的思想提高了神經(jīng)網(wǎng)絡(luò)中信息的傳輸效率,運(yùn)用廣泛,在表情識(shí)別[9]、癌癥診斷[10-11]、故障檢測(cè)[12]等均有重要應(yīng)用。本文通過(guò)控制變量法,通過(guò)在相同條件下訓(xùn)練不同結(jié)構(gòu)的ResNet網(wǎng)絡(luò)并比較其訓(xùn)練結(jié)果,進(jìn)而尋找到一種適用于中餐食物識(shí)別任務(wù)的ResNet。本文首先介紹本實(shí)驗(yàn)所有的關(guān)鍵技術(shù),其次介紹實(shí)驗(yàn)設(shè)計(jì)及流程,最后進(jìn)行結(jié)果分析。本文希望可以為中餐食物圖像識(shí)別提供一種新的思路,以使其可以更好地運(yùn)用到需要食物圖像識(shí)別的應(yīng)用上。
1" 關(guān)鍵技術(shù)
1.1" 殘差神經(jīng)網(wǎng)絡(luò)
將卷積神經(jīng)網(wǎng)絡(luò)與殘差連接兩種技術(shù)相互結(jié)合的神經(jīng)網(wǎng)絡(luò),稱(chēng)為殘差神經(jīng)網(wǎng)絡(luò),即ResNet。
1.1.1" 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)自20世紀(jì)80年代開(kāi)始登上了歷史舞臺(tái),其為一種前饋神經(jīng)網(wǎng)絡(luò),核心組件是卷積層和池化層組成的神經(jīng)網(wǎng)絡(luò)模型,包含輸入層、卷積層、池化層、全連接層、輸出層五種網(wǎng)絡(luò)層級(jí),用于圖像識(shí)別任務(wù)[13]。其結(jié)構(gòu)如圖1所示,其中“×x”表示該網(wǎng)絡(luò)層級(jí)重復(fù)堆疊x次。
在每種層級(jí)具體作用方面,卷積層通過(guò)卷積核對(duì)輸入圖像進(jìn)行局部特征提取,生成特征圖。池化層用于減少參數(shù)數(shù)量和縮小特征圖的大小,防止過(guò)擬合。全連接層則將池化層輸出的圖像特征轉(zhuǎn)化為一維向量,以便進(jìn)行圖像分類(lèi)[13]。
1.1.2" 殘差連接
對(duì)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),隨著網(wǎng)絡(luò)深度的增加,準(zhǔn)確性會(huì)趨于飽和,即在達(dá)到一定程度后不再提升。這是由于梯度爆炸和梯度消失問(wèn)題阻礙了神經(jīng)網(wǎng)絡(luò)的收斂。為了解決這一問(wèn)題,引入了殘差連接,從而加速了信息傳遞,緩解了梯度爆炸和梯度消失問(wèn)題,提高了模型的學(xué)習(xí)能力[8]。神經(jīng)網(wǎng)絡(luò)殘差連接方式如圖2所示。
1.2" 網(wǎng)頁(yè)爬蟲(chóng)
網(wǎng)頁(yè)爬蟲(chóng)是一種高效的系統(tǒng),用于自動(dòng)遍歷互聯(lián)網(wǎng)上的網(wǎng)頁(yè)并下載內(nèi)容,它在搜索引擎、網(wǎng)絡(luò)數(shù)據(jù)挖掘、歸檔服務(wù)和監(jiān)控系統(tǒng)等應(yīng)用中發(fā)揮著關(guān)鍵作用。通過(guò)應(yīng)用特定的算法和策略,爬蟲(chóng)能夠識(shí)別和抓取網(wǎng)頁(yè)上的鏈接,遞歸地訪問(wèn)新頁(yè)面,并從這些頁(yè)面中提取有用信息。面對(duì)互聯(lián)網(wǎng)的龐大規(guī)模和不斷變化的內(nèi)容,爬蟲(chóng)設(shè)計(jì)需要解決如何高效管理數(shù)據(jù)結(jié)構(gòu)、遵守網(wǎng)絡(luò)禮節(jié)、平衡內(nèi)容覆蓋和實(shí)時(shí)更新等挑戰(zhàn)。此外,爬蟲(chóng)還必須能夠識(shí)別和避免冗余內(nèi)容、爬蟲(chóng)陷阱和網(wǎng)絡(luò)垃圾等潛在問(wèn)題,以確保收集的數(shù)據(jù)既全面又相關(guān)。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,爬蟲(chóng)技術(shù)也在不斷進(jìn)步,以適應(yīng)不斷變化的網(wǎng)絡(luò)環(huán)境和用戶需求[14]。
在本實(shí)驗(yàn)中,網(wǎng)頁(yè)爬蟲(chóng)技術(shù)被運(yùn)用到了在網(wǎng)頁(yè)中采集數(shù)據(jù)集圖片上,具體操作見(jiàn)后。
2" 實(shí)驗(yàn)流程
2.1" 實(shí)驗(yàn)環(huán)境
本實(shí)驗(yàn)基于Windows 11操作系統(tǒng),使用的編程語(yǔ)言為Python,使用Python的TensorFlow機(jī)器學(xué)習(xí)第三方庫(kù)構(gòu)建ResNet神經(jīng)網(wǎng)絡(luò)。硬件方面,本實(shí)驗(yàn)使用NVIDIA GeForce RTX 4060 Laptop GPU進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練任務(wù),處理器為Intel Core i9-14900HX。
2.2" 數(shù)據(jù)集制作
本實(shí)驗(yàn)使用自行制作的Food-168數(shù)據(jù)集,數(shù)據(jù)集圖片示例如圖3所示,下述為詳細(xì)制作流程。
2.2.1" 數(shù)據(jù)爬取與分類(lèi)
本實(shí)驗(yàn)數(shù)據(jù)來(lái)源為網(wǎng)絡(luò)。首先編輯一個(gè)爬蟲(chóng)程序,要求其可按關(guān)鍵詞列表中食物名稱(chēng)順序爬取食物圖片,并將不同食物存儲(chǔ)于不同以食物名稱(chēng)命名的文件夾中。其次,設(shè)置每個(gè)類(lèi)別食物爬取圖片數(shù)量為300,經(jīng)前期測(cè)試該數(shù)量可以保證每個(gè)食物類(lèi)別樣本數(shù)量以及質(zhì)量,在確保樣本數(shù)量足夠的同時(shí)避免爬取到無(wú)關(guān)或低質(zhì)量數(shù)據(jù)。最后,查詢最常見(jiàn)的168種中餐食物,將其依次輸入爬蟲(chóng)程序的關(guān)鍵詞列表。運(yùn)行爬蟲(chóng)程序,便可得到所需的168種中餐食物的圖片。該數(shù)據(jù)集文件夾內(nèi)部結(jié)構(gòu)如圖4所示。
2.2.2" 數(shù)據(jù)清洗
由于爬取的圖片中仍舊含有大量的無(wú)關(guān)或低質(zhì)量樣本圖片,數(shù)據(jù)集需要進(jìn)行人工的清洗操作。通過(guò)刪去每個(gè)類(lèi)別300張圖片中不合要求的樣本圖片0至150張,可得到一個(gè)更高質(zhì)量的數(shù)據(jù)集。在清洗完成后,數(shù)據(jù)集共剩余46 430張圖片。
2.3" 準(zhǔn)備工作
準(zhǔn)備工作包括數(shù)據(jù)加載、預(yù)處理、增強(qiáng)等。
數(shù)據(jù)預(yù)處理操作可以使樣本數(shù)據(jù)規(guī)格統(tǒng)一化且更適用于作為神經(jīng)網(wǎng)絡(luò)的輸入,數(shù)據(jù)增強(qiáng)操作則可以增加樣本圖片的豐富性,從而使模型擁有更豐富更多的訓(xùn)練樣本,提高訓(xùn)練所得模型的泛化能力。
本實(shí)驗(yàn)在加載訓(xùn)練圖像及標(biāo)簽后,將兩者轉(zhuǎn)化為NumPy數(shù)組形式并對(duì)標(biāo)簽進(jìn)行編碼,后再將標(biāo)簽轉(zhuǎn)化為獨(dú)熱編碼以確保每個(gè)類(lèi)別的區(qū)分性與獨(dú)立性。之后,按照8∶2的比例隨機(jī)劃分出訓(xùn)練及驗(yàn)證所用的樣本圖像及標(biāo)簽,以作為訓(xùn)練集和驗(yàn)證集。
數(shù)據(jù)預(yù)處理部分包括將圖片像素值縮放到[0,1],加大神經(jīng)網(wǎng)絡(luò)的收斂速度。數(shù)據(jù)增強(qiáng)部分包括隨機(jī)水平翻轉(zhuǎn)、隨機(jī)亮度和隨機(jī)對(duì)比度,在隨機(jī)亮度處,設(shè)置最大亮度變化量為10%,對(duì)比度在原對(duì)比度的80%至120%之間隨機(jī)變化。將這些操作運(yùn)用到所有的樣本數(shù)據(jù)上,得到一個(gè)更優(yōu)的訓(xùn)練集和驗(yàn)證集。
最后,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行隨機(jī)打亂,同時(shí)進(jìn)行分批操作,每批包含32張圖像,完成數(shù)據(jù)準(zhǔn)備工作。
2.4" 模型結(jié)構(gòu)
本實(shí)驗(yàn)在模型結(jié)構(gòu)上保持輸入層和初始卷積層以及殘差塊內(nèi)部結(jié)構(gòu)不變,只改變殘差塊的數(shù)量及超參數(shù)、全連接層的數(shù)量及是否正則化與采用丟棄技術(shù)。
2.4.1" 輸入層和初始卷積層
這一部分包括輸入層、卷積層、批量歸一化層、激活層、最大池化層。其中,卷積層超參數(shù)設(shè)置為卷積核數(shù)量64、卷積核大小7×7、步長(zhǎng)2、添加零值填充,激活層選擇ReLU激活函數(shù)、最大池化層超參數(shù)設(shè)置為池化窗口大小3×3、步長(zhǎng)2、添加零值填充。這一部分結(jié)構(gòu)如圖5所示。
2.4.2" 殘差塊
為了讓實(shí)驗(yàn)中網(wǎng)絡(luò)結(jié)構(gòu)的修改更加便捷,本實(shí)驗(yàn)預(yù)先定義了殘差塊來(lái)體現(xiàn)ResNet中殘差連接。殘差塊有四個(gè)超參數(shù)可供修改,分別是卷積核數(shù)量filters、卷積核大小kernel_size、步長(zhǎng)stride以及激活函數(shù)Activation(本實(shí)驗(yàn)中只考慮使用ReLU激活函數(shù))。
殘差塊內(nèi)部結(jié)構(gòu)包含卷積層、批量歸一化層、激活函數(shù)、殘差連接及輸出,具體連接關(guān)系如圖6所示。
2.4.3" 實(shí)驗(yàn)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
測(cè)試了40余種不同結(jié)構(gòu)的殘差神經(jīng)網(wǎng)絡(luò),在其中篩選出16種典型的結(jié)構(gòu),這16種殘差神經(jīng)網(wǎng)絡(luò)的具體結(jié)構(gòu)如表1所示。其中輸入層和初始卷積層用縮寫(xiě)ILICL(Input Layer and Initial Convolutional Layer)表示。ResBlock表示一個(gè)殘差塊,這里用RB縮寫(xiě),有三個(gè)參數(shù),按順序依次是卷積核數(shù)量(filters)、卷積核大小(kernal_size)與步長(zhǎng)(stride)。GAP2D表示全局平均池化(Global Average Pooling 2D)。FC表示全連接層(Fully Connected Layers),有三個(gè)參數(shù),按順序依次是神經(jīng)元數(shù)量、激活函數(shù)(本實(shí)驗(yàn)?zāi)J(rèn)使用ReLU激活函數(shù),下表不顯示)、正則化項(xiàng)(本實(shí)驗(yàn)使用以0.01為正則化強(qiáng)度的L2正則化)。Dropout表示丟棄層,設(shè)置超參數(shù)丟棄率為0.5。
2.5" 超參數(shù)設(shè)置
神經(jīng)網(wǎng)絡(luò)采用的損失函數(shù)為交叉熵?fù)p失,優(yōu)化器為Adam,設(shè)置初始學(xué)習(xí)率為0.000 1。在本實(shí)驗(yàn)中,為了保證網(wǎng)絡(luò)充分學(xué)習(xí)到圖像中的特征,設(shè)置迭代次數(shù)為600,同時(shí)設(shè)置60代驗(yàn)證集損失不下降后的提前終止以防止神經(jīng)網(wǎng)絡(luò)模型過(guò)擬合。學(xué)習(xí)率設(shè)置10代驗(yàn)證集損失不下降后的折扣,設(shè)定折扣因子為0.5。
2.6" 評(píng)價(jià)指標(biāo)
實(shí)驗(yàn)中主要使用到了以下四個(gè)評(píng)價(jià)指標(biāo),依次是驗(yàn)證集損失、驗(yàn)證集準(zhǔn)確率、驗(yàn)證集前三準(zhǔn)確率和迭代次數(shù),其中前三者表示神經(jīng)網(wǎng)絡(luò)模型的識(shí)別預(yù)測(cè)能力,后者顯示神經(jīng)網(wǎng)絡(luò)的收斂速度。
在本實(shí)驗(yàn)中,加入驗(yàn)證集前三準(zhǔn)確率的主要原因是有些菜品相似度過(guò)高,甚至達(dá)到肉眼無(wú)法辨別的程度,如數(shù)據(jù)集中的紅燒鯽魚(yú)與紅燒鯉魚(yú)兩個(gè)菜品,且部分菜品的配料可能有個(gè)體間差異,導(dǎo)致了這些菜品很難被正確識(shí)別。
3" 結(jié)果分析
3.1" 結(jié)果展示
16個(gè)模型訓(xùn)練完成后,得到的模型性能指標(biāo)如表2所示,包括驗(yàn)證集損失(val_loss)、驗(yàn)證集準(zhǔn)確率(val_accuracy)、驗(yàn)證集前三準(zhǔn)確率(val_top_3_accuracy)及迭代次數(shù)(epoch)。
由表2可以看出,模型12在驗(yàn)證集上的準(zhǔn)確率和前三準(zhǔn)確率最高,分別達(dá)到了0.606 8和0.824 1,說(shuō)明它從中餐食物圖像數(shù)據(jù)集Food-168中學(xué)習(xí)到了最多的特征,表現(xiàn)出了最佳性能,是本次實(shí)驗(yàn)中最適合進(jìn)行中餐食物識(shí)別的模型。
3.2" 訓(xùn)練過(guò)程曲線
圖7(a)是模型12訓(xùn)練損失和驗(yàn)證損失隨訓(xùn)練次數(shù)變化的曲線圖,圖7(b)是模型12訓(xùn)練和驗(yàn)證準(zhǔn)確率及前三準(zhǔn)確率隨訓(xùn)練次數(shù)變化的曲線圖。從這兩張圖可以看出,模型12的訓(xùn)練過(guò)程曲線隨著迭代次數(shù)的增加逐漸收斂到了一個(gè)穩(wěn)定的值。
3.3" 識(shí)別效果測(cè)試
在將模型12模型保存后,運(yùn)用日常生活中拍攝的4張中餐食物圖片進(jìn)行測(cè)試,4張圖片分別為白切雞、麻辣豆腐、涼拌海帶絲及蒸蛋,效果如圖8所示,可見(jiàn)對(duì)于4張測(cè)試圖片,模型識(shí)別效果較好,其中后兩張圖片識(shí)別準(zhǔn)確率極高,證明該模型在測(cè)試中具有良好的性能。
4" 結(jié)" 論
為提高中餐食物識(shí)別的準(zhǔn)確性,本實(shí)驗(yàn)研究了使用合適的ResNet網(wǎng)絡(luò)結(jié)構(gòu)來(lái)進(jìn)行中餐食物識(shí)別,主要在網(wǎng)絡(luò)層級(jí)的中后部分(殘差塊、全連接層)進(jìn)行了結(jié)構(gòu)上的探索,通過(guò)不斷調(diào)參與修改網(wǎng)絡(luò)結(jié)構(gòu),尋找到了一種相對(duì)適合于中餐食物識(shí)別的特定結(jié)構(gòu)的ResNet網(wǎng)絡(luò)。本實(shí)驗(yàn)尋找到的網(wǎng)絡(luò)結(jié)構(gòu)用合適數(shù)量的殘差塊并設(shè)定了合適的超參數(shù),不僅保證了網(wǎng)絡(luò)能夠充分提取中餐食物圖片的特征,還成功避免提取到一些無(wú)關(guān)的噪聲。
該實(shí)驗(yàn)也存在以下不足,有待繼續(xù)研究。首先,該模型的驗(yàn)證集準(zhǔn)確率還有提升空間,可以通過(guò)將多種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)結(jié)合或探索新的神經(jīng)網(wǎng)絡(luò)解決或改善這一問(wèn)題。此外,實(shí)驗(yàn)中的數(shù)據(jù)集所含有的菜品種類(lèi)也可以變得更加豐富,可以加入其他地區(qū)的菜品,增加模型的通用性。
參考文獻(xiàn):
[1] SUBHI M A,ALI S M. A Deep Convolutional Neural Network for Food Detection and Recognition [C]//2018 IEEE-EMBS Conference on Biomedical Engineering and Sciences(IECBES).Sarawak:IEEE,2018:284-287.
[2] 武若琪,徐冰,曲志堅(jiān).基于特征融合的亞洲食物圖片分類(lèi) [J].計(jì)算機(jī)工程與設(shè)計(jì),2020,41(12):3464-3471.
[3] 徐冰.基于深度學(xué)習(xí)的亞洲食物圖像分類(lèi)方法研究 [D].淄博:山東理工大學(xué),2021.
[4] LECUN Y ,BOTTOU L,BENGIO Y,et al. Gradient-based Learning Applied to Document Recognition [J].Proceedings of the IEEE,1998,86(11):2278-2324.
[5] KRIZHEVSKY A,SUTSKEVER I,HINTON G E. ImageNet Classification with Deep Convolutional Neural Networks [J].Communications of the ACM,2017,60(6):84-90.
[6] SIMONYAN K,ZISSERMAN A. Very Deep Convolutional Networks for Large-scale Image Recognition [J/OL].arXiv:1409.1556 [cs.CV].(2014-09-04).https://arxiv.org/abs/1409.1556.
[7] SZEGEDY C,LIU W,JIA Y Q,et al. Going Deeper with Convolutions [J/OL].arXiv:1409.4842 [cs.CV].(2014-09-17).https://arxiv.org/abs/1409.4842.
[8] HE K M,ZHANG X Y,REN S Q,et al. Deep Residual Learning for Image Recognition [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas:IEEE,2016:770-778.
[9] 周婕,馬明棟.基于改進(jìn)的ResNet網(wǎng)絡(luò)的人臉表情識(shí)別 [J].計(jì)算機(jī)技術(shù)與發(fā)展,2022,32(1):25-29.
[10] 張文悅,賈子彥,李青,等.基于ResNet和UNet的胃癌病理圖像診斷系統(tǒng) [J].河北大學(xué)學(xué)報(bào):自然科學(xué)版,2024,44(4):433-440.
[11] 鄧輝,張潔.基于改進(jìn)的ResNet50網(wǎng)絡(luò)的黑色素瘤分類(lèi)方法 [J].計(jì)算機(jī)技術(shù)與發(fā)展,2023,33(2):64-70.
[12] 謝俊波,顧詩(shī)渤,許為龍.基于M-LSTM與Resnet并聯(lián)網(wǎng)絡(luò)的同軸線纜開(kāi)路故障定位方法 [J].機(jī)電工程技術(shù),2024,53(6):221-226.
[13] 羅富貴,宋倩,覃運(yùn)初,等.基于卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用研究 [J].電腦與信息技術(shù),2024,32(3):51-54.
[14] OLSTON C,NAJORK M. Web Crawling [J].Foundations and Trends in Information Retrieval,2010,4(3):175-246.
作者簡(jiǎn)介:施晨煒(2003—),男,漢族,浙江上虞人,本科在讀,研究方向:神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)。