摘要 該文提出了一種基于聯(lián)邦學(xué)習(xí)的高速監(jiān)控圖像智能分析技術(shù),旨在通過集成多個(gè)主體的數(shù)據(jù)資源來提高圖像數(shù)據(jù)處理的效率和準(zhǔn)確性,同時(shí)確保數(shù)據(jù)的隱私和安全。引入了一個(gè)專為高速圖像數(shù)據(jù)設(shè)計(jì)的新型聯(lián)邦學(xué)習(xí)框架,各參與主體在本地通過數(shù)據(jù)訓(xùn)練深度學(xué)習(xí)模型,最終交由數(shù)據(jù)中心完成全局模型參數(shù)的集中更新,能避免數(shù)據(jù)和模型的直接交互,有效保護(hù)了數(shù)據(jù)隱私。試驗(yàn)結(jié)果顯示:該技術(shù)在不犧牲隱私的情況下,能實(shí)現(xiàn)高效的深度學(xué)習(xí),并能達(dá)到與中心化處理相當(dāng)?shù)膶W(xué)習(xí)性能。
關(guān)鍵詞 聯(lián)邦學(xué)習(xí);高速監(jiān)控圖像智能分析;人工智能
中圖分類號(hào) U495 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-8949(2025)04-0007-03
0 引言
在當(dāng)今社會(huì),高速公路運(yùn)行狀態(tài)的有效監(jiān)控對(duì)于確保交通安全、流暢以及及時(shí)響應(yīng)緊急情況至關(guān)重要。隨著監(jiān)控設(shè)備的普及和技術(shù)的進(jìn)步,產(chǎn)生的圖像數(shù)據(jù)量呈爆炸式增長(zhǎng),傳統(tǒng)的人工圖像分析方法已經(jīng)無法滿足快速、準(zhǔn)確處理大規(guī)模數(shù)據(jù)的需求。因此,智能圖像分析技術(shù)[1]成為研究的熱點(diǎn),并以其自動(dòng)化處理和深入分析的能力,顯著提高了監(jiān)控系統(tǒng)的效率和反應(yīng)速度。
隨著圖像分割、識(shí)別、分類等技術(shù)的發(fā)展,越來越多的領(lǐng)域都開始采用計(jì)算機(jī)視覺的方案代替原有的人工圖片識(shí)別與標(biāo)注,例如交通擁堵識(shí)別[2]、交通圖像檢測(cè)[3]。但針對(duì)某一具體問題訓(xùn)練圖像識(shí)別模型卻往往需要消耗大量的算力與物質(zhì)資源,這為缺乏計(jì)算力資源的傳統(tǒng)工業(yè)領(lǐng)域帶來了相當(dāng)大的困擾。因此McMahan等[4]研究者提出了聯(lián)邦學(xué)習(xí)——一種新的分布式算力共享的學(xué)習(xí)方法,旨在讓多個(gè)參與者協(xié)同訓(xùn)練一個(gè)共享模型。在聯(lián)邦學(xué)習(xí)中,每個(gè)參與者(可以是設(shè)備、邊緣節(jié)點(diǎn)、組織等)都維護(hù)其本地?cái)?shù)據(jù),并在本地對(duì)模型進(jìn)行訓(xùn)練。然后,本地訓(xùn)練的模型參數(shù)被匯總到中心服務(wù)器上,以更新全局共享模型,再次分發(fā)給各個(gè)參與者。這個(gè)過程周期性地重復(fù),以逐步提升全局模型的性能。
現(xiàn)有高速公路監(jiān)控?cái)?shù)據(jù)存在數(shù)據(jù)來源主體多、各主體間互不從屬、各主體訓(xùn)練資源有限等眾多問題,這導(dǎo)致能在實(shí)際應(yīng)用中發(fā)揮作用的高速監(jiān)控圖像數(shù)據(jù)量較小。通過聯(lián)邦學(xué)習(xí)將各主體數(shù)據(jù)進(jìn)行整合訓(xùn)練,能達(dá)成較好的高速公路監(jiān)控圖像識(shí)別與分析的效果。
該文主要研究成果有:(1)提出了一種基于聯(lián)邦學(xué)習(xí)的高速公路監(jiān)控圖像智能分析技術(shù),旨在提高圖像數(shù)據(jù)處理的效率和準(zhǔn)確性,同時(shí)確保交通數(shù)據(jù)的隱私和安全;(2)介紹了一種聯(lián)邦學(xué)習(xí)框架,專為高速圖像數(shù)據(jù)設(shè)計(jì),能夠有效處理大規(guī)模圖像數(shù)據(jù),并在多點(diǎn)間實(shí)現(xiàn)協(xié)同學(xué)習(xí)而無須共享原始圖像數(shù)據(jù);(3)通過試驗(yàn),驗(yàn)證了該方法在保護(hù)數(shù)據(jù)隱私的同時(shí),實(shí)現(xiàn)了與傳統(tǒng)中心化方法相當(dāng)?shù)男阅堋?/p>
1 研究現(xiàn)狀
高速監(jiān)控圖像智能分析一直是交通領(lǐng)域的研究重點(diǎn)之一,很多學(xué)者都曾提出過相應(yīng)解決方案。曹科[5]提出一種結(jié)合云計(jì)算和深度學(xué)習(xí)的高速公路圖像監(jiān)控智能分析系統(tǒng),旨在解決現(xiàn)有系統(tǒng)壓力和差異,實(shí)現(xiàn)全國(guó)統(tǒng)一的智能圖像監(jiān)控;萬敏達(dá)等[6]在其研究中介紹了一種基于深度學(xué)習(xí)的廣深高速公路圖像智能分析系統(tǒng),該系統(tǒng)能夠自主學(xué)習(xí)并智能識(shí)別多種異常事件,實(shí)現(xiàn)自動(dòng)報(bào)警,同時(shí)構(gòu)建高速公路大數(shù)據(jù)平臺(tái),提供準(zhǔn)確的數(shù)據(jù)分析;朱國(guó)剛等[7]探討了使用深度學(xué)習(xí)等AI技術(shù)解決高速公路圖像監(jiān)控中存儲(chǔ)、監(jiān)看誤差及資源利用不足問題,建立基于大數(shù)據(jù)的圖像智能分析平臺(tái),以提升高速公路運(yùn)營(yíng)管理和服務(wù)的科學(xué)性和效率。在現(xiàn)有文獻(xiàn)中,已證明通過深度學(xué)習(xí)能有效完成交通事件、圖像、視頻分析的問題,但并未解決在隱私保護(hù)與安全數(shù)據(jù)共享環(huán)境下,由各交通分支機(jī)構(gòu)在數(shù)據(jù)與模型不出域的條件下,完成深度學(xué)習(xí)模型訓(xùn)練的問題。聯(lián)邦學(xué)習(xí)作為一種新的分布式學(xué)習(xí)方法,在諸多領(lǐng)域廣受好評(píng)。McMahan等[4]研究者首次提出一種基于迭代模型平均的聯(lián)邦學(xué)習(xí)方法,用于在分布式數(shù)據(jù)上高效地學(xué)習(xí)深度網(wǎng)絡(luò),該方法能有效地利用多平臺(tái)的深度學(xué)習(xí)算力,實(shí)現(xiàn)安全、高效、可靠的深度學(xué)習(xí)?;诖耍撐奶岢鐾ㄟ^聯(lián)邦學(xué)習(xí)解決交通領(lǐng)域內(nèi)的分布式深度學(xué)習(xí)問題。
2 針對(duì)高速公路監(jiān)控圖像的聯(lián)邦學(xué)習(xí)架構(gòu)
通過采用橫向聯(lián)邦學(xué)習(xí)的框架,能解決算力分散、數(shù)據(jù)利用率不高的問題。在高速公路數(shù)據(jù)中心的應(yīng)用場(chǎng)景下,通過該框架,整合各主體的數(shù)據(jù)資源,進(jìn)行統(tǒng)一的訓(xùn)練,以期實(shí)現(xiàn)更高效的高速監(jiān)控圖像識(shí)別與分析功能。
聯(lián)邦學(xué)習(xí)的基本架構(gòu)如圖1所示。
(1)數(shù)據(jù)采集:在該架構(gòu)中,各路段分中心作為核心參與者,負(fù)責(zé)高速公路監(jiān)控圖像基礎(chǔ)數(shù)據(jù)的生產(chǎn),并保證其數(shù)據(jù)質(zhì)量滿足總數(shù)據(jù)中心平臺(tái)訓(xùn)練要求。
(2)數(shù)據(jù)融合:在該架構(gòu)中,總數(shù)據(jù)中心負(fù)責(zé)整合各路段提供的訓(xùn)練數(shù)據(jù),完成數(shù)據(jù)驗(yàn)證與數(shù)據(jù)對(duì)齊等工作,最后將對(duì)齊后數(shù)據(jù)標(biāo)簽返還給參與者。
(3)模型訓(xùn)練與參數(shù)上傳:在該架構(gòu)中,各級(jí)路段分中心利用本地?cái)?shù)據(jù)在中央服務(wù)器的指引下完成模型訓(xùn)練,并向中心服務(wù)器同步模型參數(shù)。
(4)交通圖像識(shí)別:在該架構(gòu)中,各級(jí)路段分中心既可以通過本地算力與訓(xùn)練模型完成交通圖像的本地識(shí)別與分析,亦可以申請(qǐng)由中心服務(wù)器完成算力分配與圖像分析。
聯(lián)邦學(xué)習(xí)的本質(zhì)是為數(shù)據(jù)共享、模型可信的多方深度學(xué)習(xí)提供條件。通過構(gòu)建聯(lián)邦學(xué)習(xí)模型,能夠有效地解決在數(shù)據(jù)不出域,數(shù)據(jù)可用不可見要求下的實(shí)現(xiàn)深度學(xué)習(xí)模型的訓(xùn)練。
3 高速監(jiān)控圖像智能分析
基于深度學(xué)習(xí)模型與聯(lián)邦學(xué)習(xí)技術(shù),構(gòu)建高速監(jiān)控圖像智能分析方案,能在參與訓(xùn)練的各主體間數(shù)據(jù)相互獨(dú)立的情況下,實(shí)現(xiàn)協(xié)同的深度學(xué)習(xí)模型訓(xùn)練。該文采用橫向聯(lián)邦學(xué)習(xí)框架構(gòu)建了一個(gè)實(shí)現(xiàn)數(shù)據(jù)與算力資源整合,完成高速監(jiān)控圖像學(xué)習(xí)的框架。目前針對(duì)高速監(jiān)控圖像,需要進(jìn)行的識(shí)別主要有車輛信息識(shí)別,車輛狀態(tài)識(shí)別兩類。該文選擇ResNet18模型進(jìn)行圖像智能分析,驗(yàn)證前文構(gòu)建的聯(lián)邦學(xué)習(xí)框架的有效性。
ResNet18[8]模型是一個(gè)經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型,具有18層卷積神經(jīng)網(wǎng)絡(luò),主要用于圖像識(shí)別、分類和目標(biāo)檢測(cè)等任務(wù)。其主要特點(diǎn)在于引入了殘差連接,旨在解決傳統(tǒng)CNN網(wǎng)絡(luò)中的梯度消失和梯度爆炸問題。具體的聯(lián)邦深度學(xué)習(xí)模型如圖2所示,在聯(lián)邦學(xué)習(xí)模型部分,該文采用了ResNet18的深度學(xué)習(xí)算法模型。
在監(jiān)控圖像識(shí)別任務(wù)中,ResNet18模型需要進(jìn)行數(shù)據(jù)預(yù)處理,包括圖像的縮放、歸一化和數(shù)據(jù)增強(qiáng)等步驟,以提高模型的訓(xùn)練效果和泛化能力。將標(biāo)注數(shù)據(jù)輸入到ResNet18模型中進(jìn)行訓(xùn)練,增強(qiáng)其識(shí)別車輛圖像特征能力和車流類別判別能力。
4 試驗(yàn)設(shè)計(jì)、結(jié)果與分析
該文為驗(yàn)證通過平臺(tái)進(jìn)行圖像識(shí)別的技術(shù)的準(zhǔn)確性,評(píng)估試驗(yàn)結(jié)果與討論平臺(tái)表現(xiàn),主平臺(tái)部署在云服務(wù)器上,其云服務(wù)器擁有一張A100顯卡,1TB的內(nèi)存,分別采用了六臺(tái)擁有兩張4090顯卡的電腦,模擬參與平臺(tái)訓(xùn)練的服務(wù)器,深度學(xué)習(xí)相關(guān)代碼用python語(yǔ)言編寫。
(1)聯(lián)邦學(xué)習(xí)效率評(píng)估。
聯(lián)邦學(xué)習(xí)的效率問題,一直是學(xué)術(shù)界關(guān)注的重點(diǎn),該文評(píng)估了聯(lián)邦學(xué)習(xí)各個(gè)流程的時(shí)間花費(fèi)。聯(lián)邦學(xué)習(xí)框架完成數(shù)據(jù)入庫(kù)、數(shù)據(jù)融合、模型訓(xùn)練、參數(shù)上傳、識(shí)別結(jié)果反饋五個(gè)主流程的流程平均時(shí)間為3.09 s,可見該技術(shù)的時(shí)間花費(fèi)是可接受的。
(2)聯(lián)邦學(xué)習(xí)結(jié)果驗(yàn)證。
該文部署了多個(gè)深度學(xué)習(xí)模型,驗(yàn)證不同模型的學(xué)習(xí)效果。所有模型的訓(xùn)練輪次均設(shè)定在100輪,批量大小為16,初始學(xué)習(xí)率為0.001,在模型無提升后,訓(xùn)練終止。為便于驗(yàn)證模型識(shí)別的準(zhǔn)確性,選擇高速公路監(jiān)控視頻圖像數(shù)據(jù)集進(jìn)行驗(yàn)證,將數(shù)據(jù)集中70%的數(shù)據(jù)選作訓(xùn)練集,20%作為驗(yàn)證集,10%作為測(cè)試集。
為了衡量平臺(tái)進(jìn)行聯(lián)邦學(xué)習(xí)的效果,除方法性驗(yàn)證的ResNet18模型之外,亦選擇了ResNet101,EfficientNet與MobileNet-V2等其他三個(gè)基準(zhǔn)模型完成圖像識(shí)別任務(wù)。并采用識(shí)別準(zhǔn)確度作為衡量模型預(yù)測(cè)的準(zhǔn)確性,識(shí)別準(zhǔn)確度越高,說明模型識(shí)別與訓(xùn)練效果越好。如圖3所示,采用該平臺(tái)部署不同模型進(jìn)行聯(lián)邦學(xué)習(xí),其精確度在交通圖像數(shù)據(jù)集上均能達(dá)到90%以上的識(shí)別精確度,其訓(xùn)練效果與單節(jié)點(diǎn)深度學(xué)習(xí)精度相近,不受訓(xùn)練平臺(tái)影響。
5 總結(jié)
該文針對(duì)高速公路監(jiān)控系統(tǒng)中圖像數(shù)據(jù)處理的效率和隱私保護(hù)問題,成功應(yīng)用聯(lián)邦學(xué)習(xí)技術(shù)。通過橫向聯(lián)邦學(xué)習(xí)框架的實(shí)施,不僅解決了數(shù)據(jù)孤島問題,還在保護(hù)個(gè)體數(shù)據(jù)隱私的前提下,實(shí)現(xiàn)了數(shù)據(jù)和算力的有效共享。通過使用深度學(xué)習(xí)模型如ResNet18,該研究展示了聯(lián)邦學(xué)習(xí)在處理大規(guī)模分散數(shù)據(jù)時(shí)的有效性和可行性,最終,該系統(tǒng)展示了優(yōu)秀的圖像識(shí)別精度和處理效率,驗(yàn)證了聯(lián)邦學(xué)習(xí)在智能交通系統(tǒng)中的應(yīng)用潛力。
參考文獻(xiàn)
[1]王慶.基于人工智能的圖像識(shí)別與分類技術(shù)分析[J].集成電路用, 2024(2):164-165.
[2]余暢,蘇躍江,韋清波.基于門架數(shù)據(jù)的高速公路擁堵識(shí)別研究[J].科技和產(chǎn)業(yè), 2023(22):113-118.
[3]張河山,譚鑫,范夢(mèng)偉,等.無人機(jī)高空航拍視角下小尺度車輛精確檢測(cè)方法[J/OL].交通運(yùn)輸系統(tǒng)工程與信息, 1-12[2024-05-06]
[4]McMahan Brendan, Moore Eider et al.Proceedings of the 20th International Conference on Artificial Intelligence and Statistics, PMLR 54:1273-1282, 2017.
[5]曹科.基于云平臺(tái)的高速公路視頻監(jiān)控智能分析系統(tǒng)研究與實(shí)現(xiàn)[D].成都:西南交通大學(xué), 2021.
[6]萬敏達(dá),王昌偉,喬建軍,等.廣深高速智能監(jiān)控分析系統(tǒng)[J].中國(guó)交通信息化, 2020(11):102-106.
[7]朱國(guó)剛,楊壯,王忠旗,等.基于Al的高速監(jiān)控視頻智能化研究及應(yīng)用實(shí)踐[J].中國(guó)交通信息化, 2019(S1):192-196.
[8]K. He, X. Zhang, S. Ren and J. Sun, \"Deep Residual Learning for Image Recognition,\" 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, USA, 2016, pp. 770-778.
收稿日期:2024-08-06
作者簡(jiǎn)介:李曉春(1974—),女,本科,高級(jí)工程師,研究方向:交通工程。