金 晶,姜 宇,李丹丹,沈 毅
(哈爾濱工業(yè)大學 控制科學與工程系,黑龍江 哈爾濱 150001)
人工智能技術具有典型的多學科交叉融合,應用覆蓋面廣,前沿基礎研究、應用研究和產業(yè)化技術開發(fā)同步發(fā)展等特點。隨著我國人工智能產業(yè)的飛速發(fā)展以及國家重大戰(zhàn)略工程的逐步推進,形成了對相關領域學術型、應用型、技能型等多層次人才的迫切需求[1]。在人工智能專業(yè)人才的培養(yǎng)過程中,傳統(tǒng)的本科教育模式存在理論學習與實踐教學嚴重脫節(jié)的問題,無法滿足人工智能產業(yè)對多層次人才的需求,成為我國人工智能應用向更高水平發(fā)展的瓶頸問題[2]。
冰壺運動是以隊為單位進行的一種投擲性競賽項目,具有既鍛煉體力、又鍛煉腦力的特點,被稱作“冰上的國際象棋”,是智力要求很高的體育賽事,也是冬奧會上關注度極高的一個項目。國家體育總局將冰壺比賽列入2022年北京冬奧會的重點項目,將極大地促進冰壺運動在我國的快速發(fā)展[3]。
受室內冰場造價昂貴限制,冰球運動無法進行大規(guī)模推廣[4]。借鑒冰壺比賽的相關規(guī)則[5],通過數(shù)字化[6]、小型化[7]、地面化[8]等方式分別搭建數(shù)字冰壺、桌上冰壺、陸地冰壺等三類人工智能實驗教學平臺,能夠支撐機器學習、深度學習、強化學習等人工智能相關的實驗教學工作。
將人工智能技術與冰壺運動緊密結合,自制冰壺機器人實驗教學設備,搭建基于冰壺機器人實驗教學平臺,能夠培養(yǎng)和鍛煉學生的智力和體力,激發(fā)學生探索人工智能新技術、新方法的積極性,提升學生的動手實踐能力,是一種能夠長期堅持、可持續(xù)發(fā)展、軟硬件均可實現(xiàn)的優(yōu)秀實驗教學項目。
數(shù)字冰壺實驗教學平臺是基于 Box2D系統(tǒng)來模擬真實冰壺比賽環(huán)境,如圖1所示,并開源提供基于VS2017平臺的模擬器、服務器和人工智能選手。學生可根據實驗教學平臺提供的開源模擬器自行訓練人工智能選手,給出冰壺出手速度和角度等信息,進行數(shù)字比賽對抗。
圖1 數(shù)字冰壺實驗教學平臺
數(shù)字冰壺實驗教學平臺采用 Windows 7 Professional 64位操作系統(tǒng)、Intel(R)Core i7-6700K@4.00 GHz(8核)處理器、16 GB RAM(DDR4 2133 MHz)內存。
學生通過數(shù)字冰壺實驗教學平臺可以圖形化地了解冰壺比賽規(guī)則,分析諸如摩擦力等場地參數(shù)對冰壺運動的影響,根據場上冰壺分布與得分情況制定投擲策略,以及建立冰壺出手速度、角度與最終停止位置之間的定量關系。
桌上冰壺實驗教學平臺包括桌上冰壺機器人和實驗場地兩部分。桌上冰壺機器人由英偉達JetBot機器人加裝推球器組成,其中,JetBot的核心是Jetson Nano開發(fā)板。該開發(fā)板支持高分辨率傳感器,可以并行處理多個傳感器,甚至可以在每個傳感器流上運行最新的神經網絡,可提供472 GFLOPS的計算性能,功率高,耗電量卻僅為5 W。
學生不僅可以在JetBot上進行深度學習模型的訓練和部署,還可以學習如何收集數(shù)據集。配合相應的教程,從基本的運動操控到基于人工智能的躲避障礙等都可以上手實踐,除了在Jupyter Notebook[9]瀏覽器上基于Python語言進行交互式控制以外,還可以使用無線藍牙手柄進行遙控。
桌上冰壺的實驗場地尺寸長140 cm、寬60 cm,用PVC薄膜打印指定圖案,如圖2所示。場地分為四個區(qū)域,包括出發(fā)區(qū)、投擲區(qū)、防守區(qū)、大本營。出發(fā)區(qū)尺寸長為25 cm,寬為60 cm。投擲區(qū)尺寸長為68 cm,寬為60 cm。大本營區(qū)上方安裝攝像頭,提供影像用于計算得分,并可用于制定相關決策算法。實驗用球為桌上冰壺球,底部鋼制滾珠冰壺球(桔藍兩色),重量30 g,直徑2.5 cm,高度2 cm。
圖2 桌上冰壺實驗教學平臺
陸地冰壺實驗教學平臺包括陸地冰壺機器人和實驗場地兩部分。陸地冰壺機器人由大疆Robomaster S1機器人加裝機械手爪組成,如圖3所示。Robomaster S1擁有具備強大算力的智能中控,同時支持低延時高清圖傳、人工智能運算、編程開發(fā)等功能,并能夠協(xié)調各路命令信號的傳輸與執(zhí)行,支持46個編程控制部件和線路識別、視覺標簽識別、行人識別、掌聲識別、姿勢識別、機器人識別等6類人工智能編程模塊,可通過Scratch語言或Python語言進行編程控制。
圖3 陸地冰壺機器人
陸地冰壺的實驗場地采用世界陸地冰壺(地壺球)聯(lián)會指定的U12賽道,尺寸長8 m、寬1.6 m,是由塑料材質底板拼接而成的平面。場地分為三個區(qū)域,出發(fā)區(qū)、投擲區(qū)、核心區(qū)。出發(fā)區(qū)尺寸長為2 m,寬為1.6 m。投擲區(qū)尺寸長為2 m,寬為1.6 m。實驗用球為世界陸地冰壺(地壺球)聯(lián)會指定用球,為底部 3鋼制滾珠冰壺實物球(紅黃兩色),重量1.225 kg,周長53.5 cm,高度8.5 cm。
實驗教學課程設計以機器人參加冰壺比賽所涉及的人工智能實踐需求為出發(fā)點,以加強創(chuàng)新能力、工程實踐能力培養(yǎng)為核心,堅持教學與科研相結合,以下為具體的實驗教學課程內容設計。
冰壺機器人將阿拉伯數(shù)字的圖像分類作為運動觸發(fā)信號。利用計算機自動辨認阿拉伯數(shù)字的技術是光學字符識別的一個分支[10]。因為阿拉伯數(shù)字的通用性,且數(shù)字的識別和處理也常常是一些自動化系統(tǒng)的核心和關鍵,因此對數(shù)字分類的研究通用性強,且意義重大。
深度神經網絡可以在訓練過程中自動提取圖像中區(qū)分度最高的特征實現(xiàn)分類,而無需關心具體的圖像處理算法,只要調整網絡結構及訓練參數(shù),即可得到很好的分類結果。實驗教學平臺基于卷積神經網絡實現(xiàn)數(shù)字圖像的分類,并給出詳細的模型訓練過程和部署代碼,可以幫助學生快速實現(xiàn)相關案例。
冰壺機器人通過語義分割,能夠得到影響比分因素的雙方冰壺、大本營等類別的準確位置,該圖像語義分割問題可以理解為圖像分類的一種泛化,在這種泛化過程中,類的預測以更細的粒度進行,可以細到像素級[11]。在推理過程中,會生成輸入圖像的網格掩碼,其中網格中每個元素的值表示輸入圖像中相應像素對應的對象的類別。
學生通過冰壺機器人實驗教學平臺學習如何制作圖像語義分割數(shù)據集,特別是制作圖像分割標簽,設計基于全卷積網絡在自建的極小數(shù)據集上實現(xiàn)圖像語義分割模型的訓練,并完成訓練模型,應用TensorRT實現(xiàn)加速后的圖像語義分割模型部署。
冰壺機器人通過目標檢測算法來定位場地中冰壺的位置,即冰壺機器人通過感知場地環(huán)境,解析場景并最終做出相應的反應。冰壺機器人提供的目標檢測模型能夠識別場景中存在的所有冰壺類型的目標,一旦識別出目標冰壺的類型,模型即通過在每個冰壺目標周圍定義邊界框來定位這些冰壺目標的位置[12]。
冰壺機器人采用的YOLO目標檢測模型,可每秒實時處理 45幀。將圖像目標檢測看作是一個回歸問題,可以實時處理流視頻,延遲小于25 s。在訓練過程中,YOLO可以看到整個冰壺場地圖像,因此能夠在目標檢測中包含上下文信息。
冰壺機器人通過強化學習來制定投擲策略。強化學習是由環(huán)境反饋獎勵信號對冰壺機器人產生動作的好壞進行評價,而不是告訴冰壺機器人如何去產生正確的動作。由于環(huán)境提供的信息很少,冰壺機器人必須靠自身的經歷進行學習,冰壺機器人在動態(tài)-獎勵的環(huán)境中獲得知識,改進動作方案以適應環(huán)境。
通過數(shù)字冰壺為虛擬冰壺機器人中的神經網絡訓練提供實驗教學平臺,學生可根據冰壺當前位置和動作來預測機器人的策略。通過學習得到精確模型之后,就可以直接用模型來訓練冰壺機器人,而不必放在真實環(huán)境中進行訓練。通過虛擬仿真進行模擬,可以節(jié)省機器人訓練的時間和成本。只要虛擬環(huán)境足夠真實,即使在虛擬環(huán)境中訓練的冰壺機器人也完全可以在真實環(huán)境中達到很好的性能。
DIGITS是一個用于訓練深度學習模型的網絡化平臺,支持的深度學習框架包括 Caffe、Torch和TensorFlow。DIGITS可以為深度學習框架提供圖形化的網絡接口,將原本需要靠腳本完成的模型訓練和推理過程簡化為網絡平臺下的一些簡單操作,使學生無需深入學習即可使用深度學習算法完成相關實驗。
DIGITS可以用來快速訓練高度精確的深度神經網絡,完成圖像分類、分割、目標檢測等任務。它簡化了常見的深度學習任務,例如管理數(shù)據、在多GPU系統(tǒng)上設計和訓練神經網絡、使用高級可視化實時監(jiān)控性能,以及從結果瀏覽器中選擇最佳性能模型進行部署等。DIGITS強大的交互功能使學生可以專注于設計和訓練網絡,而不是編程和調試。
ISAAC用于加速冰壺機器人強化學習策略的開發(fā)和部署。ISAAC SDK包括ISAAC Robot Engine、ISAAC GEMs、APP等三部分。ISAAC Robot Engine允許學生輕松編寫模塊化應用程序并將其部署在冰壺機器人上,支持冰壺機器人的高性能數(shù)據處理和深度學習。ISAAC GEMs具有感知、規(guī)劃和驅動的模塊化功能,可輕松插入冰壺機器人應用程序,是從計劃到感知的機器人算法集合,其中大多數(shù)是 GPU加速。APP提供基本樣本的各種示例應用程序,突出冰壺機器人引擎的特征或關注特定 GEM的功能,顯示冰壺機器人應用程序的特定功能。
ISAAC SIM 提供虛擬冰壺機器人和高保真三維世界模擬器。在ISAAC SIM中使用虛擬冰壺機器人和模擬傳感器,可以實現(xiàn)高保真模擬環(huán)境中的測試與應用。ISAAC SIM的嵌入式 URDF加載器,還允許將JetBot、Robomaster S1等機器人的URDF模型加載到ISAAC SIM中,并模擬其關節(jié)和運動。
通過自制冰壺機器人實驗教學設備,搭建了數(shù)字冰壺、桌上冰壺、陸地冰壺等人工智能實驗教學平臺?;诒鶋貦C器人智能對抗需求,完善機器學習、深度學習、強化學習等人工智能實驗教學課程體系、結構和內容,為組織國家級冰壺人工智能挑戰(zhàn)賽奠定基礎。