柏寧 孫永梅
摘要:傳統(tǒng)的網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割方法,在發(fā)球動作的輪廓提取上不夠精確,導(dǎo)致圖像分割精度較低。因此,提出基于深度掩碼的網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割方法。首先,輸入需要配對的網(wǎng)球運動員發(fā)球技術(shù)圖像,生成偽標簽,將具有形狀先驗信息的標簽作為輔助掩碼,對圖像進行標注處理,使用深度掩碼,根據(jù)技術(shù)動作圖像的標注結(jié)果,對具有完整輪廓的網(wǎng)球運動員發(fā)球動作類目標進行閾值分割,精確提取發(fā)球動作的輪廓,并使用Canny邊緣支持方法,構(gòu)建輪廓的邊緣矩陣,形成分割后的網(wǎng)球運動員發(fā)球技術(shù)動作圖像。進行實驗,結(jié)果表明,本文設(shè)計的方法對網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割精度達到97.61%,能實現(xiàn)較高精度的發(fā)球技術(shù)動作圖像分割,應(yīng)用效果較好。
關(guān)鍵詞:深度掩碼;網(wǎng)球運動員;發(fā)球輪廓識別
中圖分類號:P208文獻標志碼:A文章編號:1001-2443(2024)01-0069-06
引言
對網(wǎng)球運動員發(fā)球技術(shù)動作進行分析,有助于運動員更加了解在發(fā)球過程中出現(xiàn)的差錯,將網(wǎng)球發(fā)球動作進行分割,能夠更加精確地進行識別與分析,從而進行針對性地訓(xùn)練[1]。目前,主要采用圖像信息融合,對發(fā)球技術(shù)進行信息處理與識別,圖像分割也成為重要的研究內(nèi)容。圖像分割技術(shù)包含了圖像重建等,主要通過對圖像處理,建立圖像的分割信息,作為運動學(xué)圖像處理的重要方法,得到了廣泛的應(yīng)用[2]。在網(wǎng)球運動員的發(fā)球技術(shù)動作技術(shù)分析上,傳統(tǒng)的動作特征分析,主要是結(jié)合聯(lián)合特征進行圖像分割[3]。
在圖像分割技術(shù)的研究上,目前主要有以下幾種,文獻[3]提出,通過特征混合的方式,構(gòu)建完全卷積,將網(wǎng)絡(luò)分為兩部分,一部分提取語義特征,用于把卷積操作替換掉,另一部分分類檢測卷積神經(jīng)網(wǎng)絡(luò),用于恢復(fù)到原分辨率。該方法分割效果較好,但需要大量的訓(xùn)練圖像,不太適合用于圖像樣本較少的分割中。文獻[4]提出,利用容易獲得的標注,設(shè)置邊界框等訓(xùn)練深度進行學(xué)習(xí),同時通過標注訓(xùn)練,對卷積神經(jīng)網(wǎng)絡(luò)進行學(xué)習(xí),通過特征混合的方式,進行圖像的分割[4]。文獻[5]提出,使用弱監(jiān)督學(xué)習(xí)方法,利用容易獲得的標注,進行訓(xùn)練深度,通過多個階段的分割方法,對網(wǎng)球運動員發(fā)球技術(shù)圖像進行識別[5]。本文基于這些研究,使用深度掩碼的技術(shù),對網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割進行研究。
1 基于深度掩碼的網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割方法
1.1 標注網(wǎng)球運動員發(fā)球技術(shù)動作
為了達到有效的圖像分割,對圖像進行標注處理。輸入需要配對的網(wǎng)球運動員發(fā)球技術(shù)圖像,生成偽標簽,將具有形狀先驗信息的標簽作為輔助掩碼。先對網(wǎng)球運動員發(fā)球技術(shù)動作圖像進行靜態(tài)采集,采集的圖像分辨率
為1920像素×1080像素[6]。同時,從網(wǎng)球運動員發(fā)球的視頻中對圖像進行采集,得到采集的圖像并進行處理,其流程如圖1所示。
在給出訓(xùn)練圖像后,使用低成本非配對,對訓(xùn)練網(wǎng)絡(luò)的圖像進行標簽掩碼的處理[7]。主要采用相互對應(yīng)的運動員技術(shù)動作圖像域,對其進行輔助掩碼,其中偽標簽的生成器結(jié)構(gòu)如圖2所示。
對于形狀比較簡單的運動員技術(shù)動作,采用形狀建模進行輔助,為了使得建模生成的輔助掩碼的數(shù)據(jù),能夠較好地進行擬合,將分割的目標物體,依照物體的形狀進行實際分割[8]。先對長寬高進行設(shè)定,根據(jù)設(shè)定的對輔助掩碼的長寬比,進行改進,建立輔助掩碼,輔助掩碼后的圖像如圖3所示。
若存在更加復(fù)雜的分割結(jié)構(gòu),使用公開數(shù)據(jù)集中的人工標注圖像進行配對,并使用掩碼域的訓(xùn)練模型進行掩碼處理[9]。在此基礎(chǔ)上,依照訓(xùn)練圖像像素的實際大小,對真實需要分割的物體進行匹配,得到匹配后的圖像和輔助掩碼,利用輔助掩碼進行標注,標注出具有完整輪廓的網(wǎng)球運動員發(fā)球動作,得到標注后的網(wǎng)球運動員發(fā)球技術(shù)動作圖像。
1.2 基于深度掩碼提取網(wǎng)球運動員發(fā)球動作輪廓
使用深度掩碼,從標注后的技術(shù)動作圖像中,提取發(fā)球動作的輪廓。根據(jù)標注的技術(shù)動作圖像,排除存在較多截斷與遮擋的動作圖像,同時在對圖像中所有的目標分割過程中,產(chǎn)生較多的噪聲點影響較大,因此對圖像中具有完整輪廓的網(wǎng)球運動員發(fā)球動作類目標進行閾值分割[10]。在假設(shè)完整的網(wǎng)球運動員發(fā)球動作類目標基礎(chǔ)上,分別對網(wǎng)球運動員發(fā)球動作中,各個部位進行檢測并處理,處理流程如圖4所示。
為了加強其分割的精度,在檢測之后進行判定,其判定公式如下所示。
[x1-x2≤0.01(w+h)] (1)
其中,[w]為圖像的長度,[h]為圖像的寬度,[x1]為檢測的x軸坐標,[x2]為檢測的y軸坐標。根據(jù)判別公式,將符合條件的數(shù)據(jù)提取出來,作為坐標點的數(shù)據(jù),進行迭代計算,得到檢測目標的各個點的數(shù)據(jù),將每個點進行連接,得到網(wǎng)球運動員發(fā)球動作輪廓。
1.3 分割網(wǎng)球運動員發(fā)球技術(shù)動作圖像
根據(jù)提取網(wǎng)球運動員發(fā)球動作輪廓,建立邊緣矩陣,進行圖像分割。對于檢測的網(wǎng)球運動員發(fā)球動作,從網(wǎng)球運動員發(fā)球動作開始到結(jié)束,依次進行檢測,建立出邊緣矩陣,同時需要對矩陣進行調(diào)整,調(diào)整的流程如圖5所示。
得到調(diào)整后的邊緣矩陣,將其分割計算的輸入端,在像素點在不同方向上的梯度上,加入主干網(wǎng)絡(luò)進行計算,并根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)對圖像進行分割,其主干網(wǎng)絡(luò)的結(jié)構(gòu)如圖6所示。
其中,上面一層為卷積層,其大小為2*2,卷積層的通道數(shù)為128,下層為邊框的損失值,根據(jù)卷積層的網(wǎng)絡(luò)結(jié)構(gòu),對模塊的分類損失進行計算,其計算過程如下,對圖像的深度密度數(shù)值進行表示,得到其函數(shù)表達式為
其中,[s]為轉(zhuǎn)換函數(shù),[t]為圖像的距離參數(shù),由此可以求圖像的平均深度,用函數(shù)表達式為
其中,[z]為運動員發(fā)球動作圖像的像素距離,[z]為圖像的深度均值,在此基礎(chǔ)上,使用高斯函數(shù),對深度均值的灰度參數(shù)進行計算,可以得到其灰度為
其中,[y]為深度密度函數(shù),[e]為圖像去除后的噪聲,由此得到圖像分割的灰度,在此基礎(chǔ)上,加入像素的距離算子,對圖像密度進行優(yōu)化,深度密度對比圖像如圖7所示。
在此基礎(chǔ)上,分級處理深度灰色圖形,并且默認灰度為10級,在以1像素為單位的基礎(chǔ)上,對在同一個像素線上的位置進行連接,得到其數(shù)值,通過對這些數(shù)值的集合,并對其進行填充,進行像素的處理,其中像素處理的流程圖如圖8所示。
得到輸出的深度掩碼坐標信息,將其坐標進行連接,得到最終的運動員發(fā)球技術(shù)動作圖像分割效果。
2 實驗與分析
為了驗證設(shè)計方法對網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割的有效性,進行實驗。
2.1 實驗準備
使用PyTorch深度學(xué)習(xí)框架進行實驗,其中框架的參數(shù)如表1所示。
對不同樣本集進行訓(xùn)練,將不同訓(xùn)練集對應(yīng)的訓(xùn)練任務(wù),分別分配到不同的工作站,采集運動員發(fā)球的深度圖像,生成遠動員動作目標區(qū)域掩碼,圖像模型如圖9示。
訓(xùn)練過程中,使用的圖形處理器為Tesla K40,圖像的分辨率為1024*1024,總計圖像為3500張,實驗平臺的參數(shù)如表2所示。
在數(shù)據(jù)處理過程中,利用多層小尺寸卷積核,組合出更多的細節(jié)特征,形成實驗數(shù)據(jù)集,如表3所示。
對相同的數(shù)據(jù)集,使用本文方法以及其他兩種方法進行實驗,統(tǒng)計其圖像分割的精度。
2.2 實驗結(jié)果與分析
使用三種方法進行圖像分割,得到分割效果,并與人工標注結(jié)果進行對比,得到本文設(shè)計的圖像分割方法下的分割效果如圖10所示。
從圖中可以看出,本文設(shè)計方法,分割的輪廓與人工標注的結(jié)果,較為相近,說明其分割的精度相對較高,使用基于MaskR-CNN的圖像分割方法得到如圖11所示的分割效果。
從圖中可以看出,使用基于MaskR-CNN的圖像分割方法分割精度相對較高,有一定的誤差,使用基于DeepLabv3的圖像分割方法進行分割效,得到的分割效果如圖12所示。
可以看出,本文設(shè)計的分割方法,在網(wǎng)球運動員發(fā)球技術(shù)動作的分割上,其像素交并比較好,其風(fēng)格精度較高。
對分割精度進行統(tǒng)計,可以得到其分割精度IOU情況如表4所示。
從表中可以看出,本文設(shè)計的方法,在分割精度上達到97.61%,相對比與其他兩種傳統(tǒng)方法分割效果較好,主要原因在于傳統(tǒng)的網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割方法,在發(fā)球動作的輪廓提取上不夠精確,導(dǎo)致圖像分割精度較低。本文設(shè)計的圖像分割方法,通過輸入需要配對的網(wǎng)球運動員發(fā)球技術(shù)圖像,將具有形狀先驗信息的標簽作為輔助掩碼,對圖像進行了標注處理,增加了分割后的網(wǎng)球運動員發(fā)球技術(shù)動作圖像的分割精度,能實現(xiàn)較高精度的網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割。
3 結(jié)論
網(wǎng)球是一項具有高速和復(fù)雜動作的運動項目,發(fā)球是其中最重要的技術(shù)之一。準確識別和分析網(wǎng)球運動員發(fā)球動作的輪廓可以幫助教練員和運動員更好地理解技術(shù)要領(lǐng)和改進訓(xùn)練方法。因此,本文在深度掩碼基礎(chǔ)上,對網(wǎng)球運動員發(fā)球技術(shù)動作進行圖像分割。將具有形狀先驗信息的標簽作為輔助掩碼,對圖像進行了標注處理,并使用深度掩碼,從標注后的技術(shù)動作圖像中,對發(fā)球動作的輪廓進行提取,并使用Canny邊緣支持方法,構(gòu)建出了輪廓的邊緣矩陣,分割精度達到97.61%,分割效果較好,希望能為網(wǎng)球運動員發(fā)球技術(shù)動作圖像分割提供一些借鑒意義。未來將進一步研究網(wǎng)球運動員發(fā)球動作的關(guān)鍵點和軌跡分析,探索影響發(fā)球質(zhì)量的關(guān)鍵因素。根據(jù)發(fā)現(xiàn)的規(guī)律,提供更專業(yè)、個性化的指導(dǎo)建議,幫助運動員改善技術(shù)表現(xiàn)。
參考文獻:
[1] 劉雨,周繼和.對世界優(yōu)秀男子網(wǎng)球運動員不同站位發(fā)球技術(shù)的運動學(xué)對比分析[J].體育科學(xué),2020,40(8):58-64..
[2] 張凱,余義斌.基于Generalized Region Loss的代價函數(shù)及在圖像分割中的應(yīng)用[J].計算機測量與控制,2023,31(3):215-222.
[3] 李娜,譚韶生.基于空間鄰域信息的擊劍連續(xù)動作圖像分割[J].吉林大學(xué)學(xué)報(工學(xué)版),2022,52(7):1639-1644.
[4] 周宏宇,嚴春峰,宋旭,等.基于加權(quán)三視角運動歷史圖像與時序分割的動作識別算法[J].電子測量與儀器學(xué)報,2020(11):194-203.
[5] 張偉.基于圖像分割的網(wǎng)球發(fā)球動作誤差識別方法[J].宜春學(xué)院學(xué)報,2021,43(9):102-105.
[6] 李學(xué)明,吳國豪,周尚波,等.基于分數(shù)階網(wǎng)絡(luò)和強化學(xué)習(xí)的圖像實例分割模型[J].計算機應(yīng)用,2022,42(2):574-583.
[7] 田治國.基于特征提取的武術(shù)散打鞭腿動作視覺圖像識別方法[J].齊齊哈爾大學(xué)學(xué)報(自然科學(xué)版),2021,37(1):51-55.
[8] 任欣雨,溫華放,王飛,等.BGA焊點的圖像分割識別方法[J].科技風(fēng),2023(1):10-12
[9] 賀秋歌,管孟,甘露.改進DeepLabv3+的服飾圖像分割算法[J].福建電腦,2023,39(2):21-26
[10 ] 覃學(xué)標,黃冬梅,宋巍,等.基于目標檢測及邊緣支持的魚類圖像分割方法[J].農(nóng)業(yè)機械學(xué)報,2023,54(1):280-286.
A Method for Identifying the Contour of Tennis Players' Serve Technique Movements Based on Depth Mask
BAI Ning1,SUN Yong-mei2
(1.Department of Physical Education,Anhui University of Finance and Economics,Bengbu 233000,China; (2.College of Physical Education,Anhui Normal University,Wuhu 241002,China)
Abstract: The traditional image segmentation method for tennis players' serve techniques is not accurate enough in extracting the contour of serve movements, resulting in low image segmentation accuracy. Therefore, a depth mask based image segmentation method for tennis players' serve techniques is proposed. Firstly, input the image of the tennis player's serving technique that needs to be paired, generate a pseudo label, use the label with shape prior information as an auxiliary mask, annotate the image, use a depth mask, and based on the annotation results of the technical action image, perform threshold segmentation on the tennis player's serving action target with complete contour, and extract the contour of the serving action. Use the Canny edge support method, and Construct an edge matrix of the contour to form a segmented image of the tennis player's serve technique movements. The experimental results show that the designed method in this paper achieves a segmentation accuracy of 97.61% for the image of tennis players' serve technique movements, and can achieve high accuracy in image segmentation of tennis players' serve technique movements. The application effect is good.
Key words: depth mask; tennis players; serve contour recognition
(責任編輯:葉松慶)
收稿日期:2023-08-31
基金項目:安徽省哲學(xué)社科孵化項目(AHSKF2021D23);安徽財經(jīng)大學(xué)校級重點教學(xué)研究項目(acjyzd2022028);安徽省高校自然科學(xué)研究重點項目(KJ2019A0497);安徽省高校人文社科研究重點項目(SK2020A0041).
作者簡介:柏寧(1986—),男,安徽蚌埠市人,碩士,副教授,研究方向為體育產(chǎn)業(yè)與教育.
引用格式:柏寧,孫永梅.深度掩碼下的網(wǎng)球運動員發(fā)球技術(shù)動作輪廓識別方法[J].安徽師范大學(xué)學(xué)報(自然科學(xué)版),2024,47(1):69-74.