摘 要:跌倒已成為公共安全最大的風險之一,及時發(fā)現(xiàn)跌倒是開展有效救助的首要前提?;谟嬎銠C視覺的目標檢測是當前跌倒檢測的主流方法,但真實場景中的復雜因素導致現(xiàn)有模型仍面臨準確率不高、魯棒性不強和部署困難等問題,在EfficientDet基礎上提出輕量級跌倒檢測模型FD-EfficientDet,該模型首先將EMA注意力機制引入主干網(wǎng)絡來增強對輸入數(shù)據(jù)的理解和表示能力,提升檢測準確率;其次,設計EMA-Fused-MBConv模塊用于主干網(wǎng)絡,加快模型訓練和防止模型退化;最后,提出SKIPS-BiFPN結構并用其構建Neck層,實現(xiàn)主干網(wǎng)絡不同階段特征的加權融合,進而增強模型魯棒性。實驗結果表明,F(xiàn)D-EfficientDet模型相比EfficientDet模型mAP提升17.65%,魯棒性、輕量化等方面具有較好優(yōu)勢。
關鍵詞:跌倒檢測;EfficientDet;輕量級;魯棒性;準確性
中圖分類號:TP183;TP391.4 文獻標識碼:A 文章編號:2096-4706(2025)02-0038-08
Efficient Fall Detection Model Combining Attention Mechanism and Feature Weighted Fusion
MU Xuenan1, YU Jieyi1, WANG Yin1,4, HU Wenjun1,2,3
(1.School of Information Engineering, Huzhou University, Huzhou 313000, China; 2.Huzhou Key Laboratory of Aquatic Robot Technology, Huzhou University, Huzhou 313000, China; 3.Zhejiang Province Key Laboratory of Smart Management and Application of Modern Agricultural Resources, Huzhou 313000, China; 4.Zhejiang Xingjian Medical Union Technology Co., Ltd., Huzhou 313399, China)
Abstract: Fall has become one of the greatest risks to public safety, and timely detection of fall is the primary prerequisite for performing effective rescue. Object Detection based on Computer Vision is currently the mainstream method for fall detection. However, due to the complex factors in the real scenes, the existing models still face problems such as low accuracy, weak robustness, difficult deployment, and so on. The lightweight fall detection model FD-EfficientDet is proposed based on EfficientDet. Firstly, the model introduces the EMA Attention Mechanism into the backbone network to enhance the understanding and representation abilities of input data, improving detection accuracy. Secondly, the EMA-Fused-MBConv module is designed for the backbone network, to accelerate model training and prevent model degradation. Finally, the SKIPS-BiFPN structure is proposed and used to construct the Neck layer, to realize feature weighted fusion from different stages of the backbone network, thereby enhancing the robustness of the model. The experimental results show that the FD-EfficientDet model improves the mAP by 17.65% compared with the EfficientDet model, and it has good advantages in robustness, lightweight, and other aspects.
Keywords: fall detection; EfficientDet; lightweight; robustness; accuracy
DOI:10.19850/j.cnki.2096-4706.2025.02.007
0 引 言
世界衛(wèi)生組織指出,每年因跌倒導致的死亡人數(shù)占公共安全導致死亡人數(shù)的近6%,跌倒已成為公共安全最大的風險之一[1]。并且隨著老齡化社會的到來加重,跌倒的風險和后果變得更加嚴重。因此,研究和開發(fā)高效、準確的跌倒檢測方法具有重要的現(xiàn)實意義,不僅能夠及時提供幫助,減少傷害,還能顯著減輕醫(yī)療系統(tǒng)的負擔。
目前,跌倒檢測方法主要包括基于環(huán)境設備的檢測方法[2-4]、基于穿戴式傳感器的檢測方法[5-8]和基于計算機視覺的檢測方法[9]?;诃h(huán)境設備的檢測方法存在誤報率較高,魯棒性較差等缺點,尤其是在復雜的家庭環(huán)境中,容易受到家具和其他障礙物的干擾。而基于穿戴式傳感器的檢測方法則易受溫濕度等環(huán)境因素的干擾,并且依賴用戶的主動佩戴,存在忘記佩戴或佩戴不當?shù)娜秉c。隨著手機、攝像頭等移動端設備的廣泛使用,基于計算機視覺的檢測方法已成為當前跌倒檢測的主流方法。該方法通過分析視頻或圖像數(shù)據(jù),旨在給定的場景幀中快速檢測并對目標進行精準定位,具有適用性廣、實時性強等優(yōu)勢。此外,基于計算機視覺的方法能夠利用深度學習技術,不斷提高檢測準確率和魯棒性,并且可以集成到智能家居系統(tǒng)中,實現(xiàn)全天候的監(jiān)控和保護,極大地提高了跌倒檢測的效率和可靠性。
近年來,多種基于計算機視覺的跌倒檢測方法被提出,例如Min等人[9]使用Faster-RCNN方法分析人體和家具的空間關系并實現(xiàn)了對目標活動特征的檢測,獲得了較好的跌倒檢測準確率,但其實驗場景較為理想,并無外界干擾因素,魯棒性無法保證。針對場景中外界因素干擾的情形,Zhao等人[10]提出在Faster-RCNN模型的基礎上使用多分支特征金字塔網(wǎng)(Multi-Scale Feature Pyramid Network, M-FPN)和注意力區(qū)域建議網(wǎng)絡(Squeeze-and-Excitation Region Proposal Network, SE-RPN),通過融合不同尺度特征圖和增強模型對關鍵信息的捕捉能力來減小環(huán)境干擾影響。Xu等人[11]將深度SORT算法中的級聯(lián)匹配及IoU匹配引入到YOLOv3結構,將不同時間幀中的目標進行關聯(lián),進而實現(xiàn)了外界干擾的處理。謝輝等人[12]通過數(shù)據(jù)增強和引入注意力機制子網(wǎng)絡,增強模型特征選擇能力以及實現(xiàn)對輸入圖像不同特征進行動態(tài)權重分配,進而提升了YOLOv3對外界干擾的處理能力。Chen等人[13]提出一種在復雜背景下使用Mask-CNN和注意力引導的雙向LSTM模型(Long Short-Term Memory Model, LSTM),通過同時關注空間和時間方面的信息來處理外界干擾問題。本質上,上述方法是通過投入更多的計算資源來換取更好的性能,而且這些方法的網(wǎng)絡結構較為復雜、計算量較大,這些因素限制了這些方法在移動終端上的應用。同時,上述方法需要訓練大量的數(shù)據(jù)集來確保檢測精度,需要消耗大量時間和人力來收集數(shù)據(jù),這些因素都進一步影響了上述方法在實際跌倒檢測領域的應用。
為了更好地解決上述問題,在EfficientDet基礎上設計輕量級跌倒檢測模型FD-EfficientDet。具體地,首先使用EMA注意力機制(Efficient Multi-scale Attention, EMA)替換主干網(wǎng)絡中原SE注意力機制(Squeeze-and-Excitation Attention, SE),目的是通過增強主干網(wǎng)絡對輸入數(shù)據(jù)的理解和表示能力,以提高模型檢測的準確性;其次,提出EMA-Fused-MBConv模塊并用其替換主干網(wǎng)絡第2-4階段的MBConv模塊,以減小主干網(wǎng)絡層數(shù)和合理分配計算資源,進而防止模型退化和加快模型訓練速度;最后,基于BiFPN結構提出了SKIPS-BiFPN結構,并用其構建Neck層,通過新增跨層數(shù)據(jù)流充分融合主干網(wǎng)絡不同階段的輸出特征和,以增強模型魯棒性。
1 相關工作
1.1 雙階段檢測模型
典型的雙階段檢測模型有Faster-RCNN[14]模型和Mask-RCNN[15]模型等,這里僅對Faster-RCNN進行回顧,F(xiàn)aster-RCNN模型結構包括Backbone、Region Proposal Network(RPN)和Classification and Regression三部分。
在Faster-RCNN模型中,其主干網(wǎng)絡Backbone包含圖像壓縮和特征提取兩個步驟,前者的作用是壓縮輸入圖像以便降低后續(xù)的計算成本,而后者則是從壓縮后的圖像中獲取特征圖(Feature Map)。Region Proposal Network是候選區(qū)域生成模塊,此模塊首先通過滑動窗口機制在特征圖的每個像素點上生成多個預定義大小的錨框來捕捉所有可能出現(xiàn)的目標,之后,將這些錨框輸入到Class Prediction和Box Prediction分支中,前者的作用是預測錨框中是否有目標,后者是通過回歸調整錨框的大小和位置以生成候選區(qū)域,并最終輸出預測得分較高的候選區(qū)域(Proposal)。Classification and Regression是目標分類及邊界回歸模塊,此模塊通過ROI Pooling將不同維度的Proposal池化到固定維度并輸入到Class Prediction和Box Predicition中,以輸出每個Proposal的類別概率分布及檢測框的預測坐標。
Faster R-CNN通過RPN模塊,使模型檢測擁有較高的準確率,但也因此導致其檢測速度較慢。另外,F(xiàn)aster-RCNN模型結構相對復雜,參數(shù)量較大,訓練Faster-RCNN模型需要大量的計算資源和時間成本。
1.2 單階段檢測模型
1.2.1 EfficientDet模型
該模型于2020年由Tan等人[16]提出,其結構包括Backbone、Neck和Class/Box Prediction三部分。在EfficientDet模型中,其主干網(wǎng)絡Backbone為EfficientNet主干網(wǎng)絡,它由3×3標準卷積和MBConv兩種卷積模塊構成,分8個階段的輸出特征。Neck部分是特征融合模塊,它由多個雙向特征金字塔BiFPN重復堆疊組成,此結構通過雙向特征傳播機制實現(xiàn)了淺層結構上的位置信息與深層結構上的語義信息之間的交互傳遞,并最終在最后一個BiFPN上融合輸出兩路特征。Class/Box Prediction是類/框預測模塊,該模塊包含Class Prediction和Box Prediction兩條分支,分別接收Neck的輸出進行卷積處理,以生成每個位置對應的邊界框坐標預測和類別概率分布。
與傳統(tǒng)目標檢測模型相比,EfficientDet在保持準確率的同時大幅減少了參數(shù)量和計算量,適合在移動端進行部署。但EfficientDet因在主干網(wǎng)絡中使用MBConv模塊,使得大部分顯存資源投入非計算操作以及SE注意力機制參數(shù)更新抖動較大,導致了其訓練速度較慢和產(chǎn)生過擬合現(xiàn)象。另外,對于EfficientDet中的雙向特征金字塔BiFPN,一方面缺乏對高分辨率特征圖的重復使用,另一方面BiFPN在垂直方向因特征流交互較少而面臨特征融合不充分問題,在檢測任務的角度該模型的魯棒性不強。
1.2.2 YOLOv3模型
該模型由Redmon等人[17]提出,其結構包括Backbone、Neck和YOLO Head三部分。在YOLOv3模型中,其主干網(wǎng)絡Backbone采用DarkNet-53主體結構,由3×3標準卷積和Residual模塊組成,前者的作用是初步特征提取和空間信息捕捉,以確保輸入圖像的特征可以被后續(xù)模塊有效提取,后者的作用是更深層次提取特征,并且其通過殘差連接來緩解梯度消失,提高計算效率。Neck為多尺度特征融合模塊,由Conv Set模塊和1×1標準卷積等結構組成,Conv Set用于融合和細化特征圖以提供高質量的特征表示,1×1標準卷積用于調整通道數(shù)來降低計算成本。YOLO Head為檢測模塊,由1×1標準卷積和3×3標準卷積組成,用于輸出預測目標的邊界框位置坐標和類別概率分布。
YOLOv3模型相對與EfficientDet和Faster-RCNN來說,其檢測速度更快,更適合用于視頻分析和實時監(jiān)控等應用,同時通過引入多尺度檢測策略,可以更好地檢測不同尺寸的目標。但是,YOLOv3對輸入圖像的質量和背景要求較高,在復雜背景情況下,檢測任務會受到較大影響,魯棒性不強。
2 FD-EfficientDet模型
2.1 FD-EfficientDet模型框架
如上所述,EfficientDet具有參數(shù)量小和檢測速度快的優(yōu)勢,但其準確率、訓練速度及魯棒性方面有明顯不足。導致不足的原因有:1)主干網(wǎng)絡中SE注意力機制對特征的局部細節(jié)處理能力不強;2)MBConv模塊中深度可分離卷積增加了主干網(wǎng)絡層數(shù)和將大部分GPU資源投入非計算操作;3)BiFPN對特征流交互不充分和缺少對高分辨率特征圖的使用。為此,本文將EMA注意力機制引入主干網(wǎng)絡,通過增強主干網(wǎng)絡對輸入數(shù)據(jù)的理解和表示,以提高檢測準確率;其次,設計EMA-Fused-MBConv模塊并將其用到主干網(wǎng)絡淺層,通過減少主干網(wǎng)絡層數(shù)和合理分配GPU資源來防止模型退化和加快模型訓練速度;最后,提出SKIPS-BiFPN結構并用其構建Neck模塊,一方面充分融合特征流,另一方面充分利用高分辨率特征圖和增強模型魯棒性。提出的FD-EfficientDet跌倒檢測模型結構如圖1所示。
FD-EfficientDet模型包括Backbone、Neck和Class/Box Prediction三部分。Backbone是由3×3標準卷積、EMA-Fused-MBConv模塊和MBConv模塊構建的八階段主干網(wǎng)絡,P1-P8為相應階段的輸出特征,第1階段的3×3標準卷積是為了對輸入圖像進行初步特征提取和通道數(shù)調整,第2~4階段的EMA-Fused-MBConv模塊的作用提取特征、減少主干網(wǎng)絡層數(shù)和合理分配GPU,以防止模型退化和加快訓練速度,第5~8階段的MBConv模塊的作用是提取深層次特征、降低模型參數(shù)量和計算成本;Neck模塊是由5個SKIPS-BiFPN雙向特征金字塔堆疊構成,其作用是融合來自Backbone不同階段的特征流來增強模型的魯棒性;Class/Box Prediction部分是類/框預測模塊,其作用是利用Neck的輸出預測目標邊界框坐標結果和生成目標類別概率分布。若用fBackbone、fNeck、fCBP分別定義為Class/Box Prediction、Neck和Backbone模塊函數(shù)的輸出,用fFD-EfficientDet定義為FD-EfficientDet模型函數(shù)的輸出,則FD-EfficientDet框架的輸出函數(shù)為:
(1)
2.2 主干網(wǎng)絡結構
本文提出的FD-EfficientDet跌倒檢測模型采用了一個8階段的主干網(wǎng)絡來獲得更高的準確率和更快的訓練速度,其結構模塊如表1所示。
本文在主干網(wǎng)絡各階段模塊中引入EMA注意力機制用于特征局部細節(jié)處理和提升模型準確率、穩(wěn)定性。EMA注意力機制是一種高效的多尺度注意力機制,它通過重新組織通道和批次維度,使用全局信息編碼校準并行分支中每個通道的權重以及將并行分支的輸出特征進行跨維度交互,捕捉像素級別的成對關系,以提高主干網(wǎng)絡對輸入數(shù)據(jù)的理解和表示能力[18],進而提升模型檢測的準確率。另外,EMA注意力機制不僅可以平滑地更新參數(shù),有效解決因參數(shù)更新抖動幅度大可能導致模型過擬合的問題,而且EMA注意力機制還能夠對參數(shù)進行指數(shù)加權平均,以抵抗訓練過程中的噪聲和不穩(wěn)定性。
主干網(wǎng)絡第2~4階段引入的EMA-Fused-MBConv模塊用來減少主干網(wǎng)絡層數(shù)和合理分配GPU資源,以防止模型退化和加快模型訓練速度,其原因是EMA-Fused-MBConv模塊采用3×3標準卷積操作來提取特征和通道數(shù)調整,其提取的特征圖對于深度可分離卷積來說需要更多卷積層才能獲得,故可有效減少了主干網(wǎng)絡層數(shù)和防止模型退化。同時,該模塊采用3×3標準卷積可避免大多數(shù)GPU投入非計算操作,故可加快模型訓練速度。另外,該模塊還對提取的特征進行ReLU6激活函數(shù)處理,不僅可以防止訓練過程因數(shù)據(jù)過大導致的數(shù)據(jù)不穩(wěn)定,還可以減小模型在移動端等計算精度較低設備上的計算損失。
若用C3、fEFMConv、fMBConv分別為3×3標準卷積函數(shù)、EMA-Fused-MBConv模塊函數(shù)和MBConv模塊函數(shù)的輸出,并用Pi定義為主干網(wǎng)絡第i階段的輸出,則主干網(wǎng)絡各階段輸出為:
(2)
2.3 Neck結構
Neck結構是由5個SKIPS-BiFPN雙向特征金字塔堆疊而成。設計的SKIPS-BiFPN不僅可以保持特征的豐富語義和位置信息,而且通過新增垂直方向的特征流來充分融合淺層結構的位置信息和深層結構的語義信息。因此,設計的SKIPS-BiFPN能夠更充分利用高分辨率特征圖來增強模型魯棒性。
圖2給出了SKIPS-BiFPN的結構,結構中的和分別為Neck模塊中第n個SKIPS-BiFPN第i水平層級中間特征輸出和最終特征輸出,C1為1×1標準卷積函數(shù),D3為3×3深度可分離卷積函數(shù),則各水平層的輸出為:
(3)
其中,,。Neck結構的最終輸出為兩路相同特征流,具體是對最后一個SKIPS-BiFPN的各輸出進行特征加權得到。若用ONeck定義為Neck結構的特征流輸出,則其具體計算式為:
(4)
其中,ωi為訓練得到的權重,ε為可調參數(shù)用于防止訓練不穩(wěn)定,后續(xù)實驗我們將其設置為0.000 1。
3 實驗研究
3.1 實驗環(huán)境與數(shù)據(jù)集
實驗所用GPU是NVIDIA A100,編程語言為Python,深度學習框架為PyTorch 1.13.1,CUDA版本為11.7。訓練輪數(shù)設置為300,批量大小為16,學習率初始為0.003。 PP_Fall公開數(shù)據(jù)集約1 500張圖像,但該圖像數(shù)據(jù)含外界干擾因素較小,為了充分說明FD-EfficientDet跌倒檢測模型性能,本文在PP_Fall公開數(shù)據(jù)集基礎上擴充至2 500張圖像,擴充數(shù)據(jù)主要包括了交通道路、人群擁擠等不同場景下的圖像數(shù)據(jù),這些圖像均具有不同程度的外界干擾因素,如圖3所示。實驗中,將兩種數(shù)據(jù)集按照8:2的比例隨機分為訓練集和測試集,使用這兩種數(shù)據(jù)集分別進行實驗對比驗證,以充分說明本文提出方法的有效性。
3.2 評價指標
本文為了對FD-EfficientDet模型進行性能評估,采用Precision(P)、Recall(R)、mAP和F1分數(shù)(F)分別來衡量模型正確檢測正類別樣本的能力,正確檢測真實目標的能力,在不同類別上檢測平均表現(xiàn),及全面性,具體如下所示:
(5)
其中,TP為模型正確地將正類樣本分為正類的個數(shù)。FP為模型錯誤地將負類樣本分為正類的個數(shù)。
(6)
其中,F(xiàn)N為模型錯誤地將正類樣本分為負類的個數(shù)。
(7)
其中,N為類別數(shù)量,APi為第i個類別的平均準確率即Precision-Recall曲線下的面積。
(8)
3.3 實驗結果與分析
3.3.1 EMA注意力機制對比實驗
為獲得更好的準確率,將EMA注意力機制入主干網(wǎng)絡。經(jīng)驗證,引入EMA注意力機制后模型準確率明顯提升,具體實驗結果如圖4所示。
3.3.2 EMA-Fused-MBConv模塊對比實驗
為了加快模型訓練速度和防止模型退化,本文提出了EMA-Fused-MBConv模塊,并將其引入到主干網(wǎng)絡的淺層,該結構避免了將大部分GPU資源用于數(shù)據(jù)讀取而不計算以及SE注意力機制參數(shù)抖動的問題,與此同時還提高了主干網(wǎng)絡對特征的表達能力。然而,在實際應用中,直接確定要替換的MBConv模塊數(shù)量是不切實際的。因此,本文通過多次實驗對比,找到了最佳替換方案。具體實驗結果如表2所示。
由表2可見,將主干網(wǎng)絡第2~4階段的MBConv模塊替換為EMA-Fused-MBConv模塊后,100個Epoch的訓練時間從216 mins縮短為194 mins,節(jié)省了近10%的訓練時間,并且mAP增長13.7%。而將第2~6階段的MBConv模塊替換為EMA-Fused-MBConv模塊后,雖然模型的mAP相較于替換第2~4階段的MBConv模塊多增長3.96%,但訓練時間從216 mins增加到253 mins,增加近17%。而將第2~8階段的MBConv模塊替換為EMA-Fused MBConv模塊后,mAP和訓練時間均表現(xiàn)不佳。故本文認為將主干網(wǎng)絡第2~4階段的MBConv模塊替換為EMA-Fused-MBConv模塊,F(xiàn)D-EfficientDet跌倒檢測模型綜合性能最佳。實驗結果表明,使用EMA-Fused-MBConv模塊可以顯著提升模型的訓練速度和穩(wěn)定性,同時保持較高的檢測性能。
3.3.3 Neck模塊對比實驗
為了增強模型魯棒性,提出SKIPS-BiFPN模塊,并用其構建Neck層,其一方面對特征流更充分地整合深層結構上的語義信息和淺層結構上的位置信息,另一方面更充分使用高分辨特征圖,從而實現(xiàn)增強模型魯棒性。經(jīng)實驗驗證,F(xiàn)D-EfficientDet綜合性能明顯改善,具體實驗結果如表3所示。
由表3可見,使用SKIPS-BiFPN模塊構建Neck模塊,F(xiàn)D-EfficientDet跌倒檢測模型的mAP增長了5.91%,且其余各項評價指標也均有明顯提升。除此之外,該結構未明顯增加模型參數(shù)。
3.3.4 FD-EfficientDet綜合對比實驗
為了充分說明FD-EfficientDet跌倒檢測模型的有效性,本文分別準備了PaddlePaddle發(fā)布的PP_Fall公開跌倒數(shù)據(jù)集和對PP_Fall進行適當擴充的數(shù)據(jù)集,并分別在兩個數(shù)據(jù)集上與其他經(jīng)典模型進行實驗對比,具體實驗結果如表4和表5所示。此外,為了評估FD-EfficientDet跌倒檢測模型的性能,本文在不同場景下與EfficientDet模型進行了對比實驗。實驗結果如圖5、圖6和圖7所示,位于實驗結果圖左側的為EfficientDet檢測結果圖,右側為FD-EfficientDet檢測結果圖。從圖中可以明顯看出,F(xiàn)D-EfficientDet的檢測準確率(P)、魯棒性都有明顯提升。
3.3.5 消融實驗
消融實驗旨在驗證所提出的每個模塊對模型性能均有所提升,模塊更新順序為EMA注意力機制、EMA-Fused-MBConv模塊和SKIPS-BiFPN模塊,實驗結果如表6所示。由表5可見,EMA注意力機制使模型的mAP提高4.59%。EMA-Fused-MBConv模塊使模型的mAP提高9.11%,SKIPS-BiFPN模塊使模型的mAP提高3.55%。
4 結 論
本文針對目前基于計算機視覺的跌倒檢測方法所面臨的問題,提出FD-EfficientDet跌倒檢測模型。通過對比實驗驗證,相較EfficientDet模型,F(xiàn)D-EfficientDet在準確率上實現(xiàn)了顯著提升,具體增幅達17.65%,訓練時間縮短10%,魯棒性也明顯改善。FD-EfficientDet模型在處理目標遮擋問題時展現(xiàn)出優(yōu)越的性能。但該模型網(wǎng)絡層數(shù)較多,訓練時占用顯存過多。因此,我們計劃未來聚焦實現(xiàn)網(wǎng)絡結構的輕量級優(yōu)化,進一步提升算法性能,以期在跌倒檢測領域取得更為顯著的突破。
參考文獻:
[1] 王瀾,孫博,隆昌宇,等.一種基于共線特征點的線陣相機內(nèi)參標定方法 [J].紅外與激光工程,2015,44(6):1878-1883.
[2] GUO R H, LI H,HAN D L,et al. Feasibility Analysis of Using Channel State Information (CSI) Acquired from Wi-Fi Routers for Construction Worker Fall Detection [J].International Journal of Environmental Research and Public Health,2023,20(6):4998-4998.
[3] PENNONE J,AGUERO F N,MARTINI M D,et al. Fall prediction in a quiet standing balance test via machine learning: Is it possible? [J].PloS one,2024,19(4):e0296355-e0296355.
[4] LI Y,HO K C,POPESCU M. A microphone array system for automatic fall detection [J].IEEE Transactions on Biomedical Engineering,2012,59(5):1291-1301.
[5] VINEETH C,ANUDEEP J,KOWSHIK G,et al. An enhanced, efficient and affordable wearable elderly monitoring system with fall detection and indoor localization [J].International Journal of Medical Engineering and Informatics,2021,13(3):254-268.
[6] DEDABRISHVILI M,MAMAIASHVILI N,MATIASHVILI I. Fall Detection System based on iOS Smartphone Sensors [J].Journal of Technical Science and Technologies,2024,8(1):35-44.
[7] KUMAR V S,ACHARYA K G,SANDEEP B,et al. Wearable Sensor-BASed Human Fall Detection Wireless system [C]//Wireless Communication Networks and Internet of Things:Select Proceedings of ICNETS2,Volume VI.Singapore:Springer,2019:217-234.
[8] MEHMOOD A,NADEEM A,ASHRAF M,et al. A Novel Fall Detection Algorithm for Elderly Using SHIMMER Wearable Sensors [J].Health and Technology,2019,9(4):631-646.
[9] MIN W D,CUI H,RAO H,et al. Detection of Human Falls on Furniture Using Scene Analysis Based on Deep Learning and Activity Characteristics [J].IEEE Access,2018:9324-9335.
[10] ZHAO Z Y,MA J W,MA C,et al. An Improved Faster R-CNN Algorithm for Pedestrian Detection [C]//2021 11th international conference on information technology in medicine and education (ITME).Wuyishan:IEEE,2021:76-80.
[11] XU T,CHEN J,LI Z Y. Fall Detection Based on Person Detection and Multi-Target Tracking [C]//2021 11th International Conference on Information Technology in Medicine and Education (ITME).Wuyishan:IEEE,2021:60-65.
[12] 謝輝,師后勤,齊宇霄,等.基于注意力機制子網(wǎng)絡的時空跌倒檢測算法 [J].計算機與現(xiàn)代化,2022(3):70-75+81.
[13] CHEN Y,LI W T,WANG LU,et al. Vision-Based Fall Event Detection in Complex Background Using Attention Guided Bi-Directional LSTM [J].IEEE Access,2020:161337-161348.
[14] REN S Q,HE K M,GIRSHICK R,et al. Faster R-CNN: Towards real-time object detection with region proposal networks [J].IEEE transactions on pattern analysis and machine intelligence,2017,39(6):1137-1149.
[15] HE K M,GKIOXARI G,DOLLAR P,et al. Mask R-CNN [EB/OL].[2024-07-08].https://openaccess.thecvf.com/content_iccv_2017/html/He_Mask_R-CNN_ICCV_2017_paper.html.
[16] TAN M X,PANG R M,LE Q V. Efficientdet: Scalable and Efficient Object Detection [C]//2020 IEEE/CVF conference on computer vision and pattern recognition.Seattle:IEEE,2020:10778-10787.
[17] REDMON J,F(xiàn)ARHADI A. Yolov3: An Incremental Improvement [J].arXiv:1804.02767 [cs.CV].[2024-07-08].https://arxiv.org/abs/1804.02767.
[18] OUYANG D,HE S,ZHANG G Z,et al. Efficient Multi-Scale Attention Module with Cross-Spatial Learning [C]//ICASSP 2023-2023 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP).Rhodes Island:IEEE,2023:1-5.
作者簡介:牟雪楠(1998—),男,漢族,安徽蚌埠人,碩士,研究方向:目標檢測;余潔鐿(1997—),女,漢族,廣東中山人,碩士,研究方向:分類預測;王胤(1982—),男,漢族,河南周口人,講師,博士,研究方向:數(shù)字醫(yī)療;胡文軍(1977—),男,漢族,安徽宣城人,教授,博士,研究方向:機器學習。
收稿日期:2024-08-01