周夕翔
重慶市科源能源技術(shù)發(fā)展有限公司,重慶,400020
在現(xiàn)代社會建設(shè)發(fā)展中,智能機器人作為日常生活和工作處理的先進技術(shù)手段,由于它具備與人類相同的感官能力,能在接收分析感官信息的基礎(chǔ)上,調(diào)節(jié)改善應(yīng)用環(huán)境或復(fù)雜背景,所以目前各國學(xué)者在加強智能機器人技術(shù)理論研究力度的同時,針對不同領(lǐng)域的應(yīng)用需求提出了多項實踐課題。在人工智能時代,面對呈現(xiàn)爆炸式增長的網(wǎng)絡(luò)信息數(shù)據(jù),智能機器人如何運用大量圖像信息提高目標(biāo)識別率,是目前國內(nèi)外科研學(xué)者探究的主要問題。而目標(biāo)識別作為計算機實現(xiàn)人類視覺感知的有效方法,能在目標(biāo)物體中獲取所需的圖像特征,綜合運用分類器構(gòu)成相應(yīng)模型,最終有序完成圖像識別檢測分析,確保機器人擁有圖像識別功能。因此,本文主要研究智能機器人視覺系統(tǒng)中的目標(biāo)識別技術(shù)方法,以期為新時期人工智能技術(shù)發(fā)展提供有效依據(jù)。
機器人視覺系統(tǒng)是指運用計算機對客觀的三維世界進行識別分析。通常來講,機器視覺系統(tǒng)包含了照明、鏡頭、攝像、圖像處理等系統(tǒng)內(nèi)容,在實踐應(yīng)用中要充分考慮系統(tǒng)運行速度和圖像處理速度,準(zhǔn)確判斷檢測目標(biāo)的尺寸以及是否存在缺陷等問題,只有這樣才能保障機器人視覺系統(tǒng)可以正常運行。從應(yīng)用功能角度來看,典型的機器視覺系統(tǒng)主要分為三部分內(nèi)容,首先是指圖像采集部分,其次是指圖像處理部分,最后是指運動控制部分[1]?,F(xiàn)如今,機器人視覺系統(tǒng)的應(yīng)用領(lǐng)域越發(fā)廣泛,已經(jīng)深入到社會居民的生活生產(chǎn)和工作的方方面面,按照視覺傳感器的數(shù)量和特征通??梢苑譃閱文恳曈X、雙目立體視覺、全景視覺、混合視覺等多種類型。
從本質(zhì)上講,這項技術(shù)主要是運用雷達和計算機對遙感目標(biāo)進行辨別分析,通過掌握雷達回波中的幅度、頻譜、相位等目標(biāo)特征信息,利用數(shù)學(xué)領(lǐng)域提出的多維空間變化估算目標(biāo)的大小、重量、形狀等物理特征參數(shù),最終在大量訓(xùn)練樣本后確定鑒別函數(shù),在分類器中實現(xiàn)識別判斷。
以機器人視覺為核心的目標(biāo)識別就是圖像識別,要先收集處理所需圖像信息,而后在提取特征的基礎(chǔ)上,將特征向量運送到模型中,最終經(jīng)過分類識別輸出結(jié)果。從整體操作角度來看,由于攝像頭拍攝的圖像信息會受外界因素影響,直接提取特征和有效識別的效果并不能達到預(yù)期要求,所以要想掌握更多有價值的原始資料,要先做好預(yù)處理工作。根據(jù)實踐操作累積經(jīng)驗來看,圖像預(yù)處理工作分為兩方面:一方面,注重優(yōu)化圖像的原始特征信息,確保原始信號具有真實性;另一方面,要降低噪聲產(chǎn)生的干擾信號,進一步提高圖像呈現(xiàn)的清晰程度,保障提取識別工作具有較高的準(zhǔn)確度[2]。
現(xiàn)如今,科研學(xué)者經(jīng)常使用的圖像預(yù)處理方法有很多,其中最常見的就是圖像降噪,它能有效提高機器視覺理解能力。而在圖像分類過程中,要在提取原始特征信息后,有序完成網(wǎng)絡(luò)訓(xùn)練、目標(biāo)模擬等操作,其中特征信息的有效性直接影響著最終識別效果。面對當(dāng)前高維度圖像信息輸入網(wǎng)絡(luò)訓(xùn)練速度較慢、信息使用率過低等問題,學(xué)者通過特征提取簡化圖像信息和降低圖像維度、掌握更多有價值的特征信息,來提高網(wǎng)絡(luò)系統(tǒng)的識別概率。
在人工智能時代背景下,深度學(xué)習(xí)具有模擬訓(xùn)練和目標(biāo)識別等獨特優(yōu)勢,但極容易出現(xiàn)過度擬合問題,因此在研究應(yīng)用期間很容易出現(xiàn)過度擬合現(xiàn)象。通常來講,部分?jǐn)M合現(xiàn)象的解決方案如下所示:首先,在深度學(xué)習(xí)框架訓(xùn)練期間,要利用調(diào)節(jié)分類器的乘法參數(shù)等方式處理擬合問題;其次,要運用增加訓(xùn)練數(shù)據(jù)集合的方式來避免過度擬合現(xiàn)象。在訓(xùn)練數(shù)據(jù)不充足的情況下,可以通過隨機剪裁、尺度變化等方式處理原始訓(xùn)練圖像,以此擴充現(xiàn)有數(shù)據(jù)集合;最后,利用Dropout方法降低深度學(xué)習(xí)出現(xiàn)過度擬合的概率。在訓(xùn)練迭代期間,在概率值為0.5的情況下,隨機將部分隱層神經(jīng)元連接的相應(yīng)數(shù)值歸零,這樣不僅能控制訓(xùn)練參數(shù)和向量,而且可以讓每次訓(xùn)練的網(wǎng)絡(luò)框架隨機應(yīng)變,以此提高網(wǎng)絡(luò)系統(tǒng)的魯棒性和泛化能力[3]。
根據(jù)經(jīng)典深度學(xué)習(xí)框架的目標(biāo)識別和傳統(tǒng)分類器目標(biāo)識別的對比分析結(jié)果來看,本文主要研究以AlexNet模型為核心的目標(biāo)識別方法,其中AlexNet具備訓(xùn)練分析和準(zhǔn)確識別大批量圖像信息的獨特優(yōu)勢;而ReLU能進一步提高網(wǎng)絡(luò)訓(xùn)練的速度。AlexNet框架可以看作是分類前的特征提取,整體操作是利用多層卷積形成的,真正體現(xiàn)了深度學(xué)習(xí)算法的核心。具體操作流程如圖1所示。
圖1 AlexNet 框架的流程圖
結(jié)合圖1分析可知,在預(yù)處理數(shù)據(jù)集合時,一方面要平衡圖像的數(shù)量,這是因為數(shù)據(jù)集合中的所有圖像集合數(shù)量并不一致,為了保障網(wǎng)絡(luò)訓(xùn)練圖像數(shù)量具有公平性,要將圖像數(shù)量最少的集合看作基本依據(jù),每個圖像的隨機抽取基數(shù)為實驗圖像;另一方面要做好圖像大小歸一化處理,有效保留原本圖像的高寬比。在AlexNet模型訓(xùn)練過程中,深度學(xué)習(xí)訓(xùn)練包含兩大階段,一種是指正向傳播,另一種是指反向傳播[4]。其中,前者是指將訓(xùn)練集合輸送到AlexNet框架中訓(xùn)練生成AlexNet模型,而后者是利用原本數(shù)據(jù)和輸出數(shù)據(jù)準(zhǔn)確計算兩者之間的誤差,同時利用反向傳播準(zhǔn)確掌握誤差調(diào)節(jié)的權(quán)重數(shù)值,最終可以得到預(yù)期設(shè)定的訓(xùn)練效果。在圖像預(yù)測時,要利用收集到的測試圖像和訓(xùn)練AlexNet模型,在Softmax分類器中掌握分類數(shù)量的概率分布情況,由此明確掌握各類圖像信息。
所有卷積都具備一個激活函數(shù)層,它主要是利用激活函數(shù)實現(xiàn)特征映射,有效清除數(shù)據(jù)當(dāng)中的冗余。將Sigmoid看作是非線性激活函數(shù),在輸入內(nèi)容接近無窮大或無窮小的情況下,輸出的神經(jīng)元梯度趨向于零。在這一狀態(tài)下,激活函數(shù)的訓(xùn)練時間較長,而且具有梯度彌散的特征。現(xiàn)如今,利用深度學(xué)習(xí)的多層網(wǎng)絡(luò)框架識別分析,會將ReLU函數(shù)看作激活函數(shù),既要控制模型訓(xùn)練時間,又要提高網(wǎng)絡(luò)學(xué)習(xí)效率。因此,本文在研究機器人視覺系統(tǒng)目標(biāo)識別技術(shù)時,提出了以AlexNet模型為核心的ReLU層特征提取目標(biāo)方法,這種方法在獲取全新的網(wǎng)絡(luò)模型之后,要在激活函數(shù)層中掌握特征向量,重新構(gòu)成適宜的訓(xùn)練分類器,同時還要選擇全連接層作為特征提取層進行分類識別,具體結(jié)構(gòu)如圖2所示。
圖2 基于AlexNet 模型的目標(biāo)識別框架圖
結(jié)合圖2分析可知,圖像集合被輸入訓(xùn)練網(wǎng)絡(luò)模型中后,經(jīng)過有效處理提取特征向量。從實踐應(yīng)用角度來看,這種技術(shù)方法可以強調(diào)有效特征,提高特征提取的工作效率,在訓(xùn)練期間有效控制梯度彌散對AlexNet模型收斂性構(gòu)成的影響,降低數(shù)據(jù)冗余數(shù)量,確保最終得到的特征向量具備說明性[5]。
在明確目標(biāo)識別技術(shù)框架后,將訓(xùn)練數(shù)據(jù)輸入AlexNet中,經(jīng)過30次迭代訓(xùn)練就可以生成AlexNet模型;將訓(xùn)練和測試圖像數(shù)據(jù)集合輸入AlexNet中提取特征向量,在特征向量輸入分類器中后訓(xùn)練測試;在多分類測試分析后記錄相應(yīng)結(jié)果,并利用訓(xùn)練集合和測試集合進行三者交叉驗證,計算求取實驗的平均數(shù)值,依據(jù)數(shù)據(jù)結(jié)果綜合評估。最終實驗結(jié)果證明,AlexNet模型不僅能保障數(shù)據(jù)特征向量的識別效率,還可以提高整體訓(xùn)練數(shù)據(jù)操作的靈活度。如果網(wǎng)絡(luò)系統(tǒng)具有充足的魯棒性,那么針對不同目標(biāo)識別任務(wù)提出的圖像范圍,系統(tǒng)用戶只需要提取輸入圖像的網(wǎng)絡(luò)特征,就能在訓(xùn)練多分類SVM中掌握有效結(jié)果。由于特征提取向量和圖像維度會持續(xù)下降,所以多分類SVM的訓(xùn)練測試速度會越來越快,進而提高機器人視覺系統(tǒng)的圖像識別效率。
從本質(zhì)上講,機器視覺作為智能機器人感知周圍環(huán)境的有效途徑之一,能利用視覺傳感器獲取周邊環(huán)境的二維圖像,依據(jù)視覺處理器分析轉(zhuǎn)換成符號,讓智能機器人可以準(zhǔn)確識別物體并確定位置。在智能機器人視覺系統(tǒng)和目標(biāo)識別技術(shù)研究初期,科研學(xué)者提出的光電成像技術(shù)只能獲取二維信息,無法準(zhǔn)確掌握距離信息,而隨著社會經(jīng)濟和科學(xué)技術(shù)的不斷發(fā)展,以三維立體視覺為核心的解決方案得到了全面推廣,其中包含時間差法、狹縫光投影法、雙目立體視覺等多種方法?,F(xiàn)如今,各國學(xué)者在研究移動機器人視覺系統(tǒng)時,一方面會利用傳感器獲取圖像信息,另一方面會利用計算機處理器完成圖像操作。雖然目前我國掌握的理論知識和技術(shù)手段相對較少,但隨著經(jīng)濟技術(shù)的不斷發(fā)展,未來必然可以根據(jù)行業(yè)發(fā)展需求不斷創(chuàng)新,持續(xù)完善機器視覺、計算機視覺等基本理論,充分展現(xiàn)智能機器人信息感知的獨特優(yōu)勢。
現(xiàn)如今,科研學(xué)者在掌握智能機器人視覺系統(tǒng)和目標(biāo)識別技術(shù)后,基于規(guī)避障礙和尋找最優(yōu)路徑問題,提出了全新的路徑規(guī)劃方法,主要是運用格柵法構(gòu)建機器人工作平面的坐標(biāo)系,整體系統(tǒng)分為兩部分內(nèi)容,一方面是指全局路徑規(guī)劃,另一方面是指局部避碰規(guī)劃。從實踐應(yīng)用角度來看,全局規(guī)劃要運用改進之后的蟻群算法得到初步全局優(yōu)化路徑,而局部避碰規(guī)劃要在跟蹤全局優(yōu)化路徑之后,通過環(huán)境探測和碰撞預(yù)測提出解決策略,以此確保智能機器人可以安全有效到達目標(biāo)位置。這種方法不僅可以在短時間內(nèi)幫助機器人尋找最佳的運輸路徑,還能有效掌握路徑周邊的動態(tài)障礙物。在這一過程中,視覺處理程序的功能主要體現(xiàn)在以下幾點:首先,在USB攝像頭中實時讀取視頻信息,針對圖像信息進行簡單的預(yù)處理;其次,在圖像處理期間實現(xiàn)圖像增強,在應(yīng)用背景下提取目標(biāo)小球;最后,準(zhǔn)確計算目標(biāo)位置和旋轉(zhuǎn)角度,利用驅(qū)動程序控制機器人頭部對目標(biāo)物體進行跟蹤調(diào)查。移動機器人作為目前智能機器人領(lǐng)域研究的重難點,其中包含了計算機科學(xué)、傳感器技術(shù)、控制理論、人工智能等多門學(xué)科知識。
我國機器人技術(shù)發(fā)展主要經(jīng)歷了三個階段,首先是指簡單個體機器人,其次是指群體勞動機器人,最后是指類似人類的智能機器人?,F(xiàn)如今,面對持續(xù)增加的機器人研究應(yīng)用要求,機器人技術(shù)理論開始向著智能化和擬人化的方向穩(wěn)步發(fā)展,而機器人視覺系統(tǒng)作為計算機學(xué)科研究的重要分支,在整合運用計算機軟硬件、電子、機械、光學(xué)等理論知識的同時,被廣泛運用在機電一體化、信號處理、人工智能、模式識別等多個領(lǐng)域中?,F(xiàn)代科技創(chuàng)新推動了社會經(jīng)濟高速發(fā)展,轉(zhuǎn)變了傳統(tǒng)城市建設(shè)發(fā)展模式,為實現(xiàn)可持續(xù)發(fā)展目標(biāo)奠定了基礎(chǔ)保障[6]。尤其是在進入知識經(jīng)濟一體化發(fā)展時代后,人工智能技術(shù)理論的高效性、自主性、先進性等特征越發(fā)顯著,不僅擺脫了傳統(tǒng)人們對人工智能的預(yù)期想象,還在電子科技、機器人研究、金融領(lǐng)域等方面發(fā)揮著重要作用。雖然目前我國針對機器人的學(xué)習(xí)研究還處于摸索前進階段,但隨著社會經(jīng)濟和科學(xué)技術(shù)的不斷提升,未來智能機器人將會擁有更加廣闊的發(fā)展空間。現(xiàn)如今,人工智能領(lǐng)域開始逐步拓展創(chuàng)新,智能機器人的應(yīng)用技術(shù)手段越來越高,很多智能產(chǎn)品都在生活和工作中充當(dāng)重要角色,對城市建設(shè)和行業(yè)創(chuàng)新具有積極作用。人工智能與計算機技術(shù)等現(xiàn)代科技的有效結(jié)合,既推動了人工智能理論技術(shù)研究,為人工智能企業(yè)創(chuàng)新發(fā)展奠定了堅實基礎(chǔ),又提高了社會經(jīng)濟發(fā)展的綜合水平,切實改善了智能機器人的應(yīng)用效率和質(zhì)量。
綜上所述,在社會經(jīng)濟和科學(xué)技術(shù)飛速發(fā)展中,我國人工智能的理論研究和技術(shù)應(yīng)用取得了優(yōu)異成績,大量先進有效的智能機器人產(chǎn)品被應(yīng)用到生產(chǎn)生活和現(xiàn)實工作中,逐漸轉(zhuǎn)變了傳統(tǒng)經(jīng)濟建設(shè)發(fā)展模式,充分體現(xiàn)了人工智能技術(shù)的實用性和可行性。因此,未來我國科研學(xué)者要繼續(xù)整合研究人工智能和機器人技術(shù),注重結(jié)合各行業(yè)發(fā)展要求研究推廣機器人視覺系統(tǒng)和目標(biāo)識別技術(shù),有效解決數(shù)據(jù)分析的高效性、故障診斷的準(zhǔn)確性、運行路徑的最優(yōu)化等問題。