李文俊
隨著社會(huì)的快速發(fā)展,垃圾存量急劇上升,“垃圾圍城”“垃圾圍村”正日益成為困擾中國(guó)城市、鄉(xiāng)村的難解之題。面對(duì)日益增長(zhǎng)的垃圾產(chǎn)量和環(huán)境狀況惡化的局面,如何通過(guò)垃圾分類(lèi)管理,最大限度地實(shí)現(xiàn)垃圾資源利用,減少垃圾處置量,改善生存環(huán)境質(zhì)量,是當(dāng)今世界各國(guó)共同關(guān)注的迫切問(wèn)題之一。
由此產(chǎn)生的垃圾分類(lèi),就是在源頭將垃圾分類(lèi)投放,并通過(guò)分類(lèi)的清運(yùn)和回收使之重新變成資源。垃圾分類(lèi)是社會(huì)進(jìn)步和生態(tài)文明的標(biāo)志,是人人均可參與其中來(lái)保護(hù)環(huán)境和改善環(huán)境的方式。
設(shè)計(jì)與思路
智能垃圾分類(lèi)實(shí)物識(shí)別學(xué)習(xí)機(jī),就是在這種情況下產(chǎn)生的,通過(guò)使用開(kāi)源硬件和物體智能識(shí)別技術(shù)跟垃圾分類(lèi)結(jié)合,讓學(xué)生親身體驗(yàn)智造的快樂(lè)。同時(shí)隨著垃圾分類(lèi)工作的不斷推進(jìn),垃圾分類(lèi)意識(shí)越來(lái)越深入人心,垃圾分類(lèi)也越分越細(xì),進(jìn)而實(shí)現(xiàn)“教育一個(gè)孩子、帶動(dòng)一個(gè)家庭”,讓孩子們能更有趣地學(xué)習(xí)和體驗(yàn)什么是可回收物,什么是有害垃圾、廚余垃圾、其他垃圾。
智能垃圾分類(lèi)實(shí)物識(shí)別學(xué)習(xí)機(jī),是視覺(jué)識(shí)別技術(shù)中的物體識(shí)別技術(shù),是一種能以與人類(lèi)智能相似的方式做出反應(yīng)的智慧設(shè)備,物體識(shí)別技術(shù)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)基礎(chǔ)研究。物體檢測(cè)是機(jī)器視覺(jué)中經(jīng)常見(jiàn)到的應(yīng)用之一,有極為廣泛的用途。例如識(shí)別體育影像,就是在需要人用眼睛做物體識(shí)別時(shí),通過(guò)機(jī)器來(lái)完成,如東京奧運(yùn)會(huì)智能化的游泳賽道,能實(shí)時(shí)識(shí)別出參賽隊(duì)員的各種信息。
物體檢測(cè)技術(shù),通常是指在一張圖像中檢測(cè)出物體出現(xiàn)的位置及對(duì)應(yīng)的類(lèi)別,主要包括物體類(lèi)別。它是一項(xiàng)非常基礎(chǔ)的任務(wù),圖像分割、物體追蹤、關(guān)鍵點(diǎn)檢測(cè)等通常都要依賴(lài)于物體檢測(cè)。它的任務(wù)是識(shí)別出圖像中有什么物體,并報(bào)告出這個(gè)物體在圖像表示的場(chǎng)景中的位置和方向。
目前,物體識(shí)別方法可以歸為兩類(lèi):基于模型或者基于上下文的識(shí)別方法、二維物體或者三維物體識(shí)別方法。對(duì)于物體識(shí)別方法的評(píng)價(jià)標(biāo)準(zhǔn),Grimson總結(jié)出了大多數(shù)研究者認(rèn)可的四個(gè)標(biāo)準(zhǔn):健壯性(robustness)、正確性(correctness)、效率(efficiency)和范圍(scope)。
編程與搭建
該作品訓(xùn)練模型使用了幾十種物體,由于這個(gè)原因,作品放棄使用Arduino主控板,而選擇使用K210小齊以及小齊拓展板,用4個(gè)舵機(jī)來(lái)控制垃圾桶開(kāi)合,K210性?xún)r(jià)比不錯(cuò),具有雙核64位處理器,并自帶獨(dú)立FPU,有一塊KPU用于神經(jīng)網(wǎng)絡(luò)加速單元,還有一塊APU用于語(yǔ)音數(shù)據(jù)處理。它的內(nèi)存短板是,內(nèi)置8MByte的高速SRAM,在減小系統(tǒng)復(fù)雜度的同時(shí),也給軟件帶來(lái)了優(yōu)化難度。在PC上訓(xùn)練的上百M(fèi)模型,如何在移動(dòng)端壓縮到幾十M的大小,將模型降低一個(gè)數(shù)量級(jí)塞進(jìn)8M SRAM,是個(gè)難點(diǎn)。
此芯片還自主研發(fā)了一塊用于邊緣計(jì)算的KPU進(jìn)行神經(jīng)網(wǎng)絡(luò)加速,官方Demo中提供了一些人臉檢測(cè)、圖像識(shí)別、圖像分類(lèi)的視覺(jué)任務(wù),分類(lèi)任務(wù)最高可達(dá)到240fps的分類(lèi)網(wǎng)絡(luò)推理速度,檢測(cè)任務(wù)在QVGA的網(wǎng)絡(luò)下,模型幀率最高可達(dá)35fps,常被嵌入到門(mén)禁系統(tǒng)、考勤系統(tǒng)等。
另外一個(gè)設(shè)計(jì)亮點(diǎn)在于芯片號(hào)稱(chēng)1TOPS算力,卻只有0.3W的功耗,遠(yuǎn)遠(yuǎn)小于設(shè)備1W左右的功耗,所以,作為智能垃圾分類(lèi)的首選,筆者選了K210主控的小齊板。智能垃圾分類(lèi)實(shí)物識(shí)別學(xué)習(xí)機(jī),在功能設(shè)計(jì)上,主要體現(xiàn)了使用人工智能物體識(shí)別技術(shù)作為亮點(diǎn)。
1.模型訓(xùn)練功能設(shè)計(jì)
首先準(zhǔn)備數(shù)據(jù)集,即不同種類(lèi)垃圾的圖片(數(shù)據(jù)集越大精度越高),再處理成224*224大小的統(tǒng)一格式,調(diào)整好參數(shù),采用目標(biāo)分類(lèi)的形式進(jìn)行訓(xùn)練,獲得對(duì)應(yīng)的模型文件,再通過(guò)燒錄工具燒錄到主板中或復(fù)制到SD卡中。
如果想要識(shí)別出一個(gè)物體,就需要對(duì)這個(gè)物體進(jìn)行多次學(xué)習(xí)訓(xùn)練。圖1是使用訓(xùn)練的模型的程序,去識(shí)別的物體包括塑料、紙張、大米、金屬、塑料瓶、西紅柿、玻璃、電池、紙板等,包含有害垃圾、可回收垃圾、廚余垃圾、其他垃圾,制作出離線模型文件和固件燒錄到主控板中。
2.控制程序編寫(xiě)
智能垃圾分類(lèi)實(shí)物識(shí)別學(xué)習(xí)機(jī)的代碼使用了Mixly圖形編程軟件,Mixly軟件編寫(xiě)程序的實(shí)現(xiàn)如圖2所示,核心功能是物體識(shí)別,識(shí)別到的垃圾種類(lèi)和置信度會(huì)顯示在彩屏LCD上,并且根據(jù)垃圾的不同種類(lèi)自動(dòng)打開(kāi)對(duì)應(yīng)的垃圾桶,提示人們將物體放進(jìn)對(duì)應(yīng)的桶內(nèi)。
作品調(diào)試與總結(jié)
這些創(chuàng)意的實(shí)現(xiàn)更多地體現(xiàn)了人工智能技術(shù)教育中的體驗(yàn),能讓孩子更容易理解人工智能最簡(jiǎn)單的定義:讓機(jī)器像人一樣能聽(tīng)、能說(shuō)、會(huì)思考和自行學(xué)習(xí),并且還能參與項(xiàng)目式學(xué)習(xí),能更好地有興致地學(xué)習(xí)和理解垃圾分類(lèi)知識(shí)。
不斷調(diào)試程序會(huì)讓學(xué)生不斷發(fā)現(xiàn)問(wèn)題、解決問(wèn)題,以此來(lái)增強(qiáng)項(xiàng)目式學(xué)習(xí)和垃圾分類(lèi)的學(xué)習(xí)體驗(yàn):
(1)在顯示物體名稱(chēng)與置信度時(shí),要注意改變置信度的x坐標(biāo)或者y坐標(biāo),文字可能會(huì)重疊,需要及時(shí)調(diào)整x、y坐標(biāo)。
(2)加載的模型不要與之前的一致,以及錨點(diǎn)參數(shù)的幾個(gè)數(shù)值不是初始化的值,因?yàn)閿?shù)值過(guò)長(zhǎng)所以Mixly中省略的一部分,可以參考Python程序中的相應(yīng)值。
(3)理解for循環(huán),以及使用for循環(huán)遍歷code的意義。
信息技術(shù)教師應(yīng)充分利用信息技術(shù)學(xué)科特點(diǎn),重點(diǎn)培養(yǎng)學(xué)生的跨學(xué)科思維,整合多學(xué)科領(lǐng)域內(nèi)容,螺旋式上升地培養(yǎng)學(xué)生的思維能力,最終培養(yǎng)學(xué)生的跨學(xué)科思維能力。