鄭振峰,邱 燕,屈寶鵬,劉沛靜,王古森
(陜西國(guó)防工業(yè)職業(yè)技術(shù)學(xué)院,陜西 西安 710300)
隨著未來(lái)智能機(jī)器人的不斷發(fā)展,人們對(duì)人機(jī)交互的要求也越來(lái)越高,智能化、流暢化、擬人化,這都深深考驗(yàn)著我們對(duì)各種機(jī)器模塊的應(yīng)用能力。文章將探討機(jī)器視覺與人工智能的人機(jī)交互問(wèn)題,并從機(jī)器人視覺人工智能和機(jī)器人控制三個(gè)方面來(lái)進(jìn)行闡述。
機(jī)器視覺是一項(xiàng)綜合性技術(shù),包括圖像處理、控制電光源照明、光成像傳感器、數(shù)字模擬計(jì)算機(jī)軟件等一系列的模塊組成,機(jī)器視覺的主要應(yīng)用是提高生產(chǎn)的靈活性和自動(dòng)化程度,一些不適合人工勞動(dòng)的場(chǎng)所內(nèi),使用機(jī)器視覺來(lái)代替人工勞力,或者在一些自動(dòng)化程度比較高的生產(chǎn)線上,機(jī)器視覺可以極大地提高生產(chǎn)效率。
機(jī)器視覺的設(shè)計(jì)理念首先就是教會(huì)機(jī)器如何分辨物體或人臉,在以往的傳統(tǒng)技術(shù)下,我們無(wú)法做到智能識(shí)別這一功能,但是伴隨著科技的不斷發(fā)展,識(shí)別技術(shù)也應(yīng)運(yùn)而生,使得機(jī)器視覺得到了進(jìn)一步提升的可能性。機(jī)器視覺的目標(biāo)就是模仿人類的識(shí)別能力,所以說(shuō)就需要機(jī)器識(shí)別系統(tǒng)具有足夠的運(yùn)算能力,以及相應(yīng)的硬件支持,如光傳感器,圖像處理等硬件,并且IT人員需要進(jìn)行大量的算法優(yōu)化、標(biāo)注增加機(jī)器世界的識(shí)別效率。機(jī)器識(shí)別的主要方式,就是通過(guò)已有的編程,識(shí)別出物體的具體特征,在對(duì)數(shù)據(jù)庫(kù)的已知物理特征進(jìn)行對(duì)比,進(jìn)而識(shí)別出眼前物體。
機(jī)器視覺的主要理念思路先進(jìn)行圖像處理再進(jìn)行圖像識(shí)別。在圖像處理的過(guò)程當(dāng)中,篩選出識(shí)別物體的各項(xiàng)物理特征,對(duì)圖像進(jìn)行預(yù)制處理,過(guò)濾掉其余的干擾因素,將最真實(shí)有效的物體特征保留下來(lái)。圖像識(shí)別階段就是在圖像處理之后的過(guò)程當(dāng)中,對(duì)篩選過(guò)的物體特征,進(jìn)行識(shí)別處理,根據(jù)初始系統(tǒng)圖像特征的處理范圍,進(jìn)而對(duì)已知數(shù)據(jù)庫(kù)中數(shù)據(jù)進(jìn)行匹配分析,從而得出結(jié)論。
在日常生活中,機(jī)器視覺的處理技術(shù)十分常,比如說(shuō)在圖像審核中,對(duì)視頻中的各項(xiàng)圖文信息進(jìn)行收集分析,在預(yù)制篩選結(jié)果之后留下疑惑信息,并與已知數(shù)據(jù)庫(kù)信息進(jìn)行對(duì)比參照,進(jìn)而做出審核判斷。又或者聞名于世的阿爾法狗也是機(jī)器視覺的典型應(yīng)用,在阿爾法狗圍棋人工智能系統(tǒng)的應(yīng)用過(guò)程中,需要擁有圖像矯正修正圖像二極化、圖像格式轉(zhuǎn)和畫直線方圖分析等識(shí)別算法,首先為了實(shí)現(xiàn)人機(jī)博弈的目的,就必須建立一個(gè)直角坐標(biāo)系在棋盤當(dāng)中,以此作為后續(xù)捕捉棋子位置的基礎(chǔ),然后根據(jù)已做好的模板進(jìn)行棋子查找,將棋盤上的棋子對(duì)應(yīng)到直角坐標(biāo)系中,這樣就實(shí)現(xiàn)了機(jī)器視覺,后續(xù)就可以由人工智能進(jìn)行決定落子,這個(gè)就是機(jī)器算法的作用所在。
阿法狗智能圍棋系統(tǒng)之所以可以做到如此地步,正是因?yàn)楫?dāng)今的世界人工智能技術(shù)的飛速發(fā)展。人工智能的飛速發(fā)展得益于處理器等硬件算法能力的不斷提高,使得人工智能可以進(jìn)一步地應(yīng)用于人們?nèi)粘I町?dāng)中,隨著技術(shù)的不斷發(fā)展,出現(xiàn)了越來(lái)越多關(guān)于人工智能的應(yīng)用,如智能識(shí)別系統(tǒng)、圍棋軟件、機(jī)器人深度學(xué)習(xí),或者眾所周知的蘋果語(yǔ)音智能系統(tǒng)SIRI。
普通的圍棋系統(tǒng)大概有三層神經(jīng)網(wǎng)絡(luò),分別為預(yù)測(cè)網(wǎng)絡(luò),預(yù)測(cè)對(duì)方可能下的棋子,并在系統(tǒng)中進(jìn)行算法預(yù)測(cè),在局勢(shì)的不斷改變中,調(diào)整網(wǎng)絡(luò)中落子概率的分布列表。第二層網(wǎng)絡(luò)為策略網(wǎng)絡(luò),該網(wǎng)絡(luò)用于判斷各個(gè)不同落子所可能產(chǎn)生的不同結(jié)果,并對(duì)不同落子進(jìn)行不同的優(yōu)劣分析。第三層為戰(zhàn)略網(wǎng)絡(luò),即對(duì)整個(gè)局勢(shì)進(jìn)行長(zhǎng)期分析,并決定落子方位,為整個(gè)系統(tǒng)運(yùn)行確定一個(gè)大方向,進(jìn)行遠(yuǎn)期的勝負(fù)評(píng)估。最后三層網(wǎng)絡(luò)互相交融,在最后對(duì)數(shù)據(jù)進(jìn)行量化分析,以此得出最優(yōu)的落子點(diǎn)。
要想實(shí)現(xiàn)上述操作,就必須有一套運(yùn)行穩(wěn)定的硬件系統(tǒng),以CPU為核心進(jìn)行浮點(diǎn)運(yùn)算,基礎(chǔ)硬件的運(yùn)算能力,決定了多層神經(jīng)網(wǎng)絡(luò)算法處理的運(yùn)行能力,這就要求系統(tǒng)平臺(tái)需要提供運(yùn)算能力較強(qiáng)的硬件設(shè)備,保證人工智能系統(tǒng)擁有足夠的運(yùn)算能力。算速度不僅有CPU決定也與GPU相關(guān),對(duì)于人工智能深度學(xué)習(xí)功能而言,GPU的內(nèi)存帶寬起到至關(guān)重要的作用。
但是僅僅有這些還不夠,人工智能系統(tǒng)還要進(jìn)行不斷的AI測(cè)試,需要進(jìn)行海量的自動(dòng)運(yùn)算作為預(yù)測(cè)標(biāo)準(zhǔn)。
在經(jīng)歷了人工智能和機(jī)器視覺的過(guò)程之后,就進(jìn)入機(jī)器人控制的環(huán)節(jié)。世界上第一臺(tái)商用工業(yè)機(jī)器人由美國(guó)制造,至今已有六十余年,現(xiàn)如今無(wú)論是科技水平和運(yùn)算能力都遠(yuǎn)超那時(shí),但是機(jī)器人承擔(dān)的主要工作,還是簡(jiǎn)單的篩選焊接工程處理等方面,沒有做到智能化無(wú)人化,如果我們想讓機(jī)器人從事更高級(jí)的工程應(yīng)用方面,就要求機(jī)器人擁有更加強(qiáng)大的感知能力和運(yùn)算能力,做到機(jī)器視覺、人工智能、機(jī)器人控制三維一體的統(tǒng)一工作。
機(jī)器人之間是如何實(shí)現(xiàn)人工模塊,機(jī)器視覺系統(tǒng)和人工智能的相互配合,從而實(shí)現(xiàn)人機(jī)交互的目的,就拿智能圍棋系統(tǒng)為例。如果想要達(dá)到人機(jī)交互,我們就需要選用合適的機(jī)器人,在選擇機(jī)器人的情況之前需要考慮,應(yīng)該選擇何種驅(qū)動(dòng)方式的機(jī)器人,是液壓還是氣壓,并且還要考慮其負(fù)載能力,以保證人機(jī)交互工程可以正常運(yùn)行。如果圍棋系統(tǒng)想實(shí)現(xiàn)人機(jī)交互,就必須考慮安置視覺攝像頭、吸盤等裝置,側(cè)面安置機(jī)械臂,保證其活動(dòng)范圍可以覆蓋到整個(gè)棋盤之上。
人機(jī)交互指的是人與計(jì)算機(jī)或機(jī)器設(shè)備之間應(yīng)用某種方式或者某種語(yǔ)言進(jìn)行一定程度上的交流,而人機(jī)交互在我們的日常生活中也極為常見,小到收音機(jī)按鈕,電腦開關(guān)鍵,大至汽車方向盤,核反應(yīng)堆控制室,都可以理解為人機(jī)交互。就如同阿爾法狗圍棋系統(tǒng)一般,就是借助機(jī)器視覺、人工智能、深度學(xué)習(xí)等功能的基礎(chǔ)之上進(jìn)行圍棋運(yùn)算,進(jìn)而實(shí)現(xiàn)人機(jī)交互的目的。盡管機(jī)器視覺和機(jī)器人控制廣泛的應(yīng)用于我們的生活當(dāng)中,但是兩者往往沒有做到相互統(tǒng)一,傳統(tǒng)的生產(chǎn)工序往往集中于一點(diǎn),比如說(shuō)運(yùn)用機(jī)器視覺進(jìn)行樣品篩選,通過(guò)機(jī)器視覺篩選出殘次品,進(jìn)而提高成品率。又或者遙控機(jī)器人,使用遙控機(jī)器人進(jìn)行高危工作,由人工遠(yuǎn)程操作?,F(xiàn)在的機(jī)器人技術(shù)往往沒有做到智能化,那么就更談不上人機(jī)交互的實(shí)習(xí),如今隨著科技水平的不斷提高,人機(jī)交互的應(yīng)用能力也不斷提高,開始出現(xiàn)一些智能機(jī)器人,內(nèi)置視覺傳感器,外置機(jī)械骨骼,可以如同吃常人一般具有基本邏輯思維能力,與人溝通,甚至發(fā)生動(dòng)作互動(dòng)。
現(xiàn)如今人機(jī)交互的技術(shù)領(lǐng)域逐漸向智能化發(fā)展,如我們所用的手機(jī)智能語(yǔ)音,無(wú)人機(jī),智能家居等技術(shù)就是十分典型的人機(jī)交互功能的應(yīng)用,我相信在未來(lái)會(huì)出現(xiàn)越來(lái)越多結(jié)合機(jī)器視覺人工智能機(jī)器控制的機(jī)器人出現(xiàn),為我們帶來(lái)更加流暢的人機(jī)交互體驗(yàn)。
如果可以實(shí)現(xiàn)機(jī)器視覺,機(jī)器人控制人工智能三維一體合理整合,那么就可以很好地實(shí)現(xiàn)人機(jī)交互功能,實(shí)現(xiàn)智能機(jī)器人的第一步。雖然目前機(jī)器人的人機(jī)交互能力較弱,智能化屬性較低,但是我相信在未來(lái),這項(xiàng)技術(shù)一定可以長(zhǎng)足發(fā)展,造福大眾。