林條達(dá),林夏想,崔月娟,吳浩森,蔡奇倡,何韋穎(通訊作者)
(廣州理工學(xué)院 廣東 廣州 510540)
隨著社會(huì)經(jīng)濟(jì)和互聯(lián)網(wǎng)的發(fā)展,近年來(lái)人們?cè)絹?lái)越關(guān)注個(gè)人的生活品質(zhì)和健康問(wèn)題,堅(jiān)持運(yùn)動(dòng)已成為人們首選的健康之路,對(duì)于如何保證高效、高標(biāo)準(zhǔn)運(yùn)動(dòng)已成為人們?nèi)找骊P(guān)注和討論的話(huà)題[1-2]。
面對(duì)傳統(tǒng)的運(yùn)動(dòng)或訓(xùn)練,人們一般會(huì)選擇對(duì)著鏡子一遍又一遍地練習(xí),要想獲得更多的指導(dǎo)和隨時(shí)了解自身動(dòng)作的完成情況,傳統(tǒng)的方式會(huì)聘請(qǐng)教練或者讓他人直接指導(dǎo),對(duì)不足之處給出個(gè)人意見(jiàn)。雖然教練可以快速地指出錯(cuò)誤、有效地進(jìn)行指導(dǎo),但是聘請(qǐng)教練更多地需要考慮錢(qián)和場(chǎng)地的問(wèn)題,一旦牽扯到錢(qián)的問(wèn)題,人們或許會(huì)選擇放棄聘請(qǐng)教練或者自己對(duì)著鏡子繼續(xù)練習(xí)。而我們的人工智能視頻運(yùn)動(dòng)對(duì)比平臺(tái)可以滿(mǎn)足以上兩方面的要求,人們對(duì)著平臺(tái)自帶攝像頭錄下視頻,平臺(tái)會(huì)對(duì)此視頻快速、標(biāo)準(zhǔn)地評(píng)分,給出運(yùn)動(dòng)時(shí)間和消耗卡路里量,同時(shí)會(huì)指出達(dá)不到標(biāo)準(zhǔn)之處[3-4]。除此之外,互聯(lián)網(wǎng)是有記憶的,運(yùn)動(dòng)者即可通過(guò)對(duì)比視頻一遍又一遍地糾正自己的不足之處。平臺(tái)亦是教練,我們把這個(gè)教練稱(chēng)為“人工智能”[5]。人工智能視頻對(duì)比分析平臺(tái)亦是一個(gè)教學(xué)平臺(tái),可以利用這個(gè)系統(tǒng),選擇在自家或者免費(fèi)場(chǎng)地進(jìn)行運(yùn)動(dòng)。它打破了傳統(tǒng)的面對(duì)面真人教練指導(dǎo)的方式,利用網(wǎng)絡(luò)技術(shù)更好地幫助人們省錢(qián)、省時(shí)間、省空間,符合科學(xué)發(fā)展觀(guān)。
(1)社會(huì)需求方面。人工智能視頻運(yùn)動(dòng)對(duì)比分析平臺(tái)與傳統(tǒng)的運(yùn)動(dòng)方式有所不同,它適用于全網(wǎng)人民,時(shí)間、場(chǎng)地隨用戶(hù)自由化。打造一款“健身教練”運(yùn)動(dòng)APP,快速給出指導(dǎo)建議,幫助用戶(hù)高效、高質(zhì)量、高標(biāo)準(zhǔn)地提升運(yùn)動(dòng)質(zhì)量[6],正是網(wǎng)民急需的運(yùn)動(dòng)軟件。
快節(jié)奏、高效率、省時(shí)間的社會(huì),人們急迫需要一個(gè)便捷、簡(jiǎn)單、有效的運(yùn)動(dòng)平臺(tái)。
(2)開(kāi)發(fā)成本、技術(shù)方面。視頻運(yùn)動(dòng)對(duì)比分析平臺(tái)是基于AI人工智能人臉識(shí)別、圖像識(shí)別技術(shù)研發(fā)系統(tǒng),用戶(hù)可通過(guò)瀏覽器網(wǎng)址訪(fǎng)問(wèn)、安卓小程序訪(fǎng)問(wèn)或者平臺(tái)APP注冊(cè)使用,頁(yè)面操作簡(jiǎn)單,功能人性化。
(3)用戶(hù)操作方面。人工智能視頻運(yùn)動(dòng)對(duì)比分析平臺(tái)操作簡(jiǎn)單,用戶(hù)登錄之后,一鍵開(kāi)啟系統(tǒng)自帶攝像頭開(kāi)始運(yùn)動(dòng),一鍵保存視頻,一鍵提交視頻即可,短時(shí)間內(nèi)會(huì)收到系統(tǒng)的判斷和建議等[7]。
在系統(tǒng)開(kāi)發(fā)可行情況下,開(kāi)展相關(guān)的需求。
2.2.1 對(duì)用戶(hù)進(jìn)行分析
用戶(hù)在注冊(cè)時(shí)填寫(xiě)真實(shí)年齡,系統(tǒng)通過(guò)采集用戶(hù)運(yùn)動(dòng),給出建議。同時(shí),系統(tǒng)也可人性化地為用戶(hù)推薦相關(guān)的健身運(yùn)動(dòng)。
2.2.2 對(duì)管理員(系統(tǒng))進(jìn)行分析
系統(tǒng)管理員具有最高權(quán)限,可以對(duì)系統(tǒng)用戶(hù)進(jìn)行增刪改查,其可以劃分為以下幾個(gè)子模塊。
(1)普通用戶(hù)管理。對(duì)用戶(hù)的信息進(jìn)行新增、刪除、修改、查詢(xún)等。
(2)設(shè)備管理。對(duì)設(shè)備(攝像頭、監(jiān)控器)等設(shè)備進(jìn)行新增、刪除、修改、查詢(xún)等。
(3)管理員。對(duì)系統(tǒng)管理員進(jìn)行劃分為普通管理員、超級(jí)管理員等進(jìn)行新增、刪除、修改、查詢(xún)等。
視頻運(yùn)動(dòng)分析是每天執(zhí)行的一項(xiàng)簡(jiǎn)單任務(wù),無(wú)需多加考慮。人類(lèi)生理學(xué)已經(jīng)從原始祖先的視力發(fā)展到如今的感知檢測(cè)和分析的水平?!斑\(yùn)動(dòng)分析”一詞是自我描述的,用術(shù)語(yǔ)來(lái)說(shuō),它使人們了解對(duì)象在環(huán)境中的移動(dòng)方式。在醫(yī)學(xué)相關(guān)機(jī)構(gòu)中,運(yùn)動(dòng)分析被用作觀(guān)察行動(dòng)不便患者的運(yùn)動(dòng)的非侵入性方法。在視頻監(jiān)控中,運(yùn)動(dòng)分析被用于視頻跟蹤和面部識(shí)別。
運(yùn)動(dòng)分析是一項(xiàng)首要任務(wù),可以分解為許多組件,如物體/人物檢測(cè)、運(yùn)動(dòng)檢測(cè)、姿勢(shì)估計(jì)等。
(1)物體/人物檢測(cè)。此處的關(guān)鍵字是“檢測(cè)”。為了理解和進(jìn)行人體分析,我們首先必須在提供用于分析的數(shù)字內(nèi)容(圖像序列)中檢測(cè)人體。對(duì)象檢測(cè)的任務(wù)通常涉及在感興趣的對(duì)象的實(shí)例周?chē)@示邊界框,并識(shí)別檢測(cè)到的對(duì)象所屬的類(lèi)。在特定情況下,我們專(zhuān)注于識(shí)別圖像中的一個(gè)對(duì)象;在其他情況下,我們對(duì)多個(gè)對(duì)象進(jìn)行檢測(cè)會(huì)更加敏感。有一些對(duì)象檢測(cè)應(yīng)用程序蓬勃發(fā)展的場(chǎng)景示例,例如視覺(jué)搜索引擎、面部檢測(cè)、動(dòng)作檢測(cè)、ariel圖像分析、行人檢測(cè)和手勢(shì)識(shí)別。通常,使用機(jī)器學(xué)習(xí)技術(shù),有兩種主要的對(duì)象檢測(cè)實(shí)現(xiàn)方法,第一種是從頭開(kāi)始設(shè)計(jì)和訓(xùn)練網(wǎng)絡(luò)體系結(jié)構(gòu),包括層的結(jié)構(gòu)和權(quán)重參數(shù)值的初始化等[8]。
(2)運(yùn)動(dòng)檢測(cè)。運(yùn)動(dòng)檢測(cè)是一種過(guò)程,其中包含運(yùn)動(dòng)對(duì)象的圖像要經(jīng)過(guò)能夠通過(guò)差分方法或背景分割實(shí)現(xiàn)運(yùn)動(dòng)跟蹤的圖像處理技術(shù)。在圖像中,通過(guò)丟棄圖像的靜止部分來(lái)提取圖像中的運(yùn)動(dòng)部分,隔離運(yùn)動(dòng)部分。該技術(shù)主要取決于對(duì)圖像中像素強(qiáng)度的觀(guān)察,以確定像素是否屬于背景類(lèi)別。通過(guò)識(shí)別幀或圖片之間像素強(qiáng)度的級(jí)數(shù),可以在強(qiáng)度發(fā)生明顯變化的地方繪制運(yùn)動(dòng)的推論。運(yùn)動(dòng)檢測(cè)是運(yùn)動(dòng)分析的基本方面,因?yàn)樾枰\(yùn)動(dòng)檢測(cè)才能確定執(zhí)行分析的內(nèi)容和位置。更重要的是,計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)已將運(yùn)動(dòng)檢測(cè)的要求從受控環(huán)境內(nèi)的硬件監(jiān)視設(shè)備降低到僅需要相機(jī)進(jìn)行檢測(cè)和進(jìn)一步分析的最新算法[9]。
(3)姿勢(shì)估計(jì)。姿勢(shì)估計(jì)是從圖像或圖像序列中得出人體重要部位和關(guān)節(jié)的位置和方向的過(guò)程。姿勢(shì)估計(jì)的輸出是圖像中身體姿勢(shì)配置的2D或3D剛性表示。這種估算分析的應(yīng)用程序的輸出一般是由一些復(fù)雜算法生成的圖像,該算法以某種形式或方式描述了感興趣對(duì)象的重要身體部位和關(guān)節(jié)在原始圖像中的位置。姿勢(shì)估計(jì)已在計(jì)算機(jī)視覺(jué)中發(fā)展,并已成為一個(gè)突出的領(lǐng)域。姿勢(shì)估計(jì)與計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)中其他研究領(lǐng)域的關(guān)系,例如對(duì)象檢測(cè),跟蹤和運(yùn)動(dòng)分析,促進(jìn)了解決姿勢(shì)估計(jì)的各種技術(shù)的發(fā)展。旨在解決姿態(tài)估計(jì)問(wèn)題的較早方法提出了基于組件或已實(shí)現(xiàn)的模塊化解決方案的技術(shù)。一些解決方案最初將人的輪廓從具有靜止背景的圖像中分離出來(lái),然后估計(jì)關(guān)節(jié)和四肢的位置。其他解決方案提出的技術(shù)也是基于階段的解決方案,涉及檢測(cè)和提取視頻序列或圖像序列中代表人類(lèi)的2D圖形,然后繼續(xù)基于2D圖形和軌跡生成3D姿態(tài)估計(jì)[10]。
隨著人們生活質(zhì)量的提升與生活習(xí)慣的轉(zhuǎn)變,越來(lái)越多的人認(rèn)識(shí)到了運(yùn)動(dòng)的重要性,社會(huì)上逐漸興起一股運(yùn)動(dòng)風(fēng),視頻運(yùn)動(dòng)也受到了更多人的關(guān)注與喜愛(ài)。在互聯(lián)網(wǎng)時(shí)代,計(jì)算機(jī)視覺(jué)在社會(huì)各領(lǐng)域得到了普遍關(guān)注,尤其是人體動(dòng)作識(shí)別技術(shù)已廣泛應(yīng)用于監(jiān)控、安防、視頻教學(xué)等領(lǐng)域。傳統(tǒng)的視頻教學(xué)采用單一的灌輸式教學(xué)模式,無(wú)法知曉學(xué)習(xí)者的知識(shí)掌握情況,此問(wèn)題在動(dòng)作教學(xué)方面尤為突出。灌輸式教學(xué)模式已然落后,當(dāng)學(xué)習(xí)者不知道自身知識(shí)掌握程度的時(shí)候很難提升學(xué)習(xí)積極性,容易喪失學(xué)習(xí)熱情,也難以取得理想的學(xué)習(xí)成果。當(dāng)前,人們采用人工智能技術(shù)對(duì)于視頻中的人物動(dòng)作實(shí)施特征提取,借助攝像頭捕捉學(xué)習(xí)者的畫(huà)面,通過(guò)對(duì)比教學(xué)視頻與學(xué)習(xí)者的學(xué)習(xí)動(dòng)作便能夠有效評(píng)估學(xué)習(xí)者的學(xué)習(xí)效果,并分析評(píng)估結(jié)果以便于更具針對(duì)性地對(duì)學(xué)習(xí)者進(jìn)行指導(dǎo)[11]。
如今,我國(guó)民眾關(guān)注健康,運(yùn)動(dòng)已經(jīng)成為許多人日常生活中的必備活動(dòng)。科學(xué)技術(shù)極大程度地影響了人們的生產(chǎn)生活方式,在運(yùn)動(dòng)鍛煉時(shí),很多人因?yàn)榭床坏阶约旱某晒茨軋?jiān)持下去,通過(guò)人工智能視頻運(yùn)動(dòng)分析教學(xué)平臺(tái)能夠讓人們掌握自己的學(xué)習(xí)進(jìn)度,了解自身的不足,有針對(duì)性地加以改進(jìn)。并且合理應(yīng)用該教學(xué)平臺(tái)可有效提升人們的學(xué)習(xí)自主性,人們能夠針對(duì)自身實(shí)際情況合理安排學(xué)習(xí)內(nèi)容。對(duì)于人工智能視頻運(yùn)動(dòng)分析教學(xué)平臺(tái)能夠更好地提高傳授知識(shí)的水平,對(duì)教學(xué)界做出了一定貢獻(xiàn)。所以,該教學(xué)平臺(tái)有著較好的發(fā)展前景。