江蘇大學 趙楊杰 封曉果
隨著我國人工智能技術水平的提高,人們開始重視高新科技領域的創(chuàng)新發(fā)展。智能機器人作為新時代下各行研究人員關注的焦點,在持續(xù)探索與優(yōu)化的過程中,不僅為智能化領域發(fā)展提供了全新方向,而且加快了我國未來工業(yè)革新發(fā)展步伐。本文在了解當前只能機器人的內(nèi)容和發(fā)展情況的基礎上,根據(jù)深度學習方法對其應用方向進行分析,并明確了未來的領域發(fā)展趨勢。
最初“深度學習”這一理念來自于人工神經(jīng)網(wǎng)絡,屬于實現(xiàn)機器學習的一種優(yōu)秀技術。從本質(zhì)上講,通過構建包含多項隱層的機器學習架構模型,正確訓練大量數(shù)據(jù)信息,能獲取更多具有意義的特殊信息,以此為樣本分類與預測提供有效依據(jù)。這一過程也是運用深度學習模式來實現(xiàn)初期目標的一種方式,將其與智能機器人研究工作融合到一起,不僅能拓展人們的視野范圍,而且可以為實踐應用提供更多機遇。由于深度學習需要人們了解樣本數(shù)據(jù)的變化規(guī)律和應用層次,所以研究智能機器人的專業(yè)工作者可以在學習時得到更多具有深意的聲音、圖像及文字等數(shù)據(jù)信息。深度學習法的智能機器人在應用中,能讓機器人擁有與人類相近的分析能力,而且可以提高整體設計性能,拓展應用范圍,這也是現(xiàn)階段國內(nèi)外研究關注的焦點方向。在二十世紀八十年代末期,人們開始運用人工神經(jīng)網(wǎng)絡的“反向傳播算法”,在多個樣本數(shù)據(jù)中掌握統(tǒng)計的規(guī)律,這樣既能準確預測未知信息,又開啟了“深度學習法”的智能機器人研究工作。
一般來講,最常應用的智能機器人是由多種復雜結構形成的,且彼此之間相互聯(lián)系,共同幫助智能機器人實現(xiàn)所需功能。一方面,傳感部分。其作為智能機器人連接內(nèi)外環(huán)境的重要結構,可以更好掌控自身工作狀態(tài),并將內(nèi)外環(huán)境變化及時反饋給控制系統(tǒng),科學調(diào)節(jié)執(zhí)行系統(tǒng),確保機器人可以在有效完成工作的同時,提升自身的適應力。另一方面,控制部分。這類智能機器人主要有兩種:一種是集中控制模式,另一種是分散控制模式。前者是指運用一臺機器人控制所有機器人的行為,而后者是指運用多臺計算機對機器人行為進行分層管控。根據(jù)當前智能機器人研制道路分析,其主要分為三階段:第一,初期研制的機器人需要提前依據(jù)程序進行設定,且只能實施重復工作,沒有智能判斷和優(yōu)先處理的能力;第二,再次研制的機器人在以往基礎上設計了自動處理和部分感知的功能;第三,現(xiàn)階段的智能機器人不僅擁有自我感知、判斷及適應學習等能力,而且可以在不斷完善中與其他行業(yè)結合發(fā)展。
目前針對智能機器人的研究方向主要集中在學習抓取工作上,其中包含位姿判別、智能學習及活動規(guī)劃、系統(tǒng)控制等。在特定的目標場景下,機器人在多模特征學習中可以正確判斷出最佳的抓取姿勢,并且在時間延長的情況下依舊可以保障抓取的準確率,不僅是當前我國研究關注的焦點,更是實際應用的主要方向。
要想運用多模特征深度學習與融合的方式來處理位姿判斷問題,需要從以下幾步入手:第一,依據(jù)堆疊降噪自動編碼的方式構建深度網(wǎng)絡模型;第二,結合體感傳感器明確目標和深度多模數(shù)據(jù),同時引用融合的方式有效解決深層抽象表達;第三,全面整合機器人與多模特征深度學習模型。這樣不僅能更好完成位姿判斷工作,而且可以根據(jù)不同形態(tài)或方向選擇正確的抓取姿勢和位置。需要注意的是,在設計過程中構建完善的深度網(wǎng)絡模型能全面提高抓取和判斷的準確率。因此,在構建深度網(wǎng)絡模型時,必須要先處理降噪問題,而后再對訓練數(shù)據(jù)實施降噪編碼。在具體應用時,要保障機器人在獲取完整場景圖的基礎上,先分離目標,后獲取初始特征,只有這樣才能提高抓取位置和姿勢的有效性。為了更好解決實踐應用中的問題,研究人員提出將特定時間看作t,機器人抓取目標是n,假設特征序列為X(t),那么最終將會有無數(shù)種最佳抓取位姿,相應的位置與姿態(tài)之間具有某種關系。通過將這類問題轉(zhuǎn)變?yōu)槿绾吻笕「怕誓P偷淖畲蠡?,并運用L層深度學習網(wǎng)絡構建對應的判斷模型,這樣只需要輸入具體數(shù)量,就可以得到相應的邏輯關系。
隨著人工智能科技水平的不斷提升,現(xiàn)有智能機器人逐漸取代了部分存在危險性的工作內(nèi)容,這樣不僅為人類日常生活和工作帶來了便利性,而且有效控制了事態(tài)嚴重的影響范圍。例如,礦山施工、工程建造及化學材料的研制等,雖然都是促進社會經(jīng)濟不斷發(fā)展的重要行業(yè),但長久工作不管是環(huán)境還是技術等都會對人類的身體和精神產(chǎn)生負面影響。相反,結合智能機器人進行實踐工作,既能減少工作問題,提升整體效率,又能避免技術或環(huán)境對人類產(chǎn)生不必要的傷害。
以挖掘工作為例,在研制具備自主工作能力的挖掘機器人時,最重要的是思考如何在控制成本支出的情況下構建完整的環(huán)境地圖。一般來講,人們會結合單目視覺傳感器來優(yōu)化挖掘機器人的視覺系統(tǒng),這樣不僅能保障其快速得到所處環(huán)境的各類信息,而且可以由此為依據(jù)進行后續(xù)工作。需要注意的是,研究人員要考慮視覺系統(tǒng)中圖像識別的跟蹤與檢測工作,尤其是對圖像而言,一方面要運用灰度化和直方圖均衡化的方式優(yōu)先做好前期處理工作,另一方面要結合中值濾波處理其中潛藏的噪音,并做好對應的檢測工作。除此之外,還要依據(jù)深度學習處理圖像,這樣有助于在自主學習和不斷訓練的基礎上,對圖像進行科學分類,最終確保自編碼系統(tǒng)可以更快掌握圖像邊緣特征。在挖掘機器人解決周邊環(huán)境問題后,接下來要優(yōu)化鏟斗目標檢查和跟蹤的相關問題。其中,“鏟斗目標檢查算法”整合了三幀算法和混合高斯背景建模法,而“鏟斗目標跟蹤算法”是以Kalman濾波和Mean-shift算法為依據(jù)的全新計算形式。通過在工業(yè)分揀智能機器人中全面融合深度學習,不僅能解決以往識別工作中的問題,而且可以進行準確定位復雜內(nèi)容,提升整體工作效率。
在社會經(jīng)濟水平不斷提高,家居生活質(zhì)量越來越強的過程中,智能機器人在家庭服務中也展現(xiàn)出了獨特優(yōu)勢,其不僅能進行簡單或復雜的日常操作,而且可以幫助人們解決部分生活問題,如智能控制家電、清理衛(wèi)生及娛樂休閑等。一般來講,在整合發(fā)展智能機器人與家庭服務時,主要從兩點入手:一方面要讓機器人可以正確識別室內(nèi)環(huán)境,快速接收任務信息;另一方面要與人便捷交流,能理解現(xiàn)代化的語言信息。要想讓智能機器人在家庭服務中展現(xiàn)出獨特性和便捷性,首先要保障日常交流沒有問題,此時就需要運用大數(shù)據(jù)系統(tǒng)幫助機器人了解和掌握不同時期的人類語言。
以人臉識別為例,其作為當前非常便捷的身份認證方式,受到了各國科研人員的關注?;谏疃染矸e神經(jīng)網(wǎng)絡的人臉識別的基本算法框架圖如圖1所示,其中上半部分為基礎內(nèi)容,只需要將交叉熵看作損失函數(shù),而下半部分結構與上半部分類似,只是在全連接層添加了Center loss損失函數(shù)。整合兩者進行網(wǎng)絡訓練,有助于不斷優(yōu)化“fc”層的特征向量。需要注意的是,每個人的臉部特征各有不同,因此訓練中累積的樣本類別對整體數(shù)量而言少之又少,這就要求研究人員在關注訓練識別準確性的同時,注重在“Softmax”層獲取特征向量代表的所有區(qū)分性。最終實驗結果表明,運用這種方式能全面提高跨年齡人臉識別的準確性。
圖1 人臉識別的基本算法框架
整合實踐案例分析,為訓練提供跨年齡變化人臉圖像數(shù)據(jù)集CACD,雖然能在一定意義上優(yōu)化模型識別效果,但也要對圖像數(shù)據(jù)實施預處理。而實驗所選評估指標分為兩點:其一為從圖片庫檢索到第一張臉的平均準確率;其二為圖像檢索中的平均精度均值,具體計算公式為:
其中,Precision(X)表示查詢結果為X時獲取的證樣本比例,隨著平均精度均值的增加,其越能表現(xiàn)人臉特征的類間區(qū)分性。
結語:綜上所述,面對全球化經(jīng)濟發(fā)展趨勢,隨著人工智能科技水平的不斷提高,為了更好解決現(xiàn)有智能機器人技術問題,加強基于深度學習方法的智能機器人研究力度至關重要。這樣不僅能改變原有技術形式,如語音識別、圖像判斷等,而且可以有效處理機器人應用問題,如位姿等。雖然當前我們對智能機器人的了解不深,在日常生活中也很難看到,但隨著科研人員的不斷創(chuàng)新,相信在未來發(fā)展中智能機器人必將得到廣泛利用,促使人們的生活向著智能化和科學化的方向穩(wěn)步前進。