蔡默晗,劉晨煜,張辛沅
(北方工業(yè)大學(xué)信息學(xué)院,北京 100144)
隨著經(jīng)濟(jì)增長(zhǎng),生活水平的提升,道路上車輛數(shù)目不斷增加,帶來了車輛事故的風(fēng)險(xiǎn)。對(duì)車道線和路標(biāo)的識(shí)別可以保證駕駛員的安全,從而降低交通事故的風(fēng)險(xiǎn)。基于神經(jīng)網(wǎng)絡(luò)的的計(jì)算機(jī)視覺算法研究成為車輛輔助駕駛研究的熱點(diǎn)課題,也是智能運(yùn)輸系統(tǒng)的重要部分?;贙eras 神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)對(duì)車道線的識(shí)別具有重要的現(xiàn)實(shí)意義。
車道線是限制車輛按照規(guī)定路線行駛的路面信號(hào)。準(zhǔn)確檢測(cè)車道線并保持實(shí)時(shí)跟蹤是智能車實(shí)現(xiàn)無人駕駛、車道偏離檢測(cè)等的首要條件。然而在實(shí)際情況下,車道線被遮擋、光照環(huán)境的變化或其他不可抗因素都會(huì)干擾車道線檢測(cè),使其結(jié)果精度下降。近年來為實(shí)現(xiàn)車道線檢測(cè),國內(nèi)外有諸多不同的解決方法。2019 年王其東等提出了一種運(yùn)用投影統(tǒng)計(jì)與雙曲線擬合的車道線識(shí)別方法,利用近視野車道直線信息和雙曲線擬合,對(duì)存在彎曲車道的車道線進(jìn)行車道線尋優(yōu)。2020 年洪偉等基于DBSCAN 算法實(shí)現(xiàn)聚類簇劃分,利用基于拋物線模型的隨機(jī)采樣一致性擬合方法初步完成車道線提取,并針對(duì)不同的環(huán)境干擾,制定了相應(yīng)的優(yōu)化策略,實(shí)現(xiàn)了自車道線的魯棒檢測(cè)。2021 年李茂月等為消除噪聲干擾以及提高特征檢測(cè)效率,設(shè)計(jì)了一種自適應(yīng)道路感興趣區(qū)域(ROI)計(jì)算方法,針對(duì)不同情況的車道可自適應(yīng)地將車道區(qū)域與非車道區(qū)域分離,該算法可有效識(shí)別出各種道路工況下的車道線。
本文提出了一種Keras 神經(jīng)網(wǎng)絡(luò)模型的車道線識(shí)別技術(shù),實(shí)現(xiàn)在不同環(huán)境因素影響下對(duì)車道線的識(shí)別。
Keras 分為輸入層、卷積層、輸出層,輸入層的作用就是規(guī)定了模型輸入的shape;網(wǎng)絡(luò)層包括全連接層、卷積層、LSTM 層、自定義網(wǎng)絡(luò)層,是Keras 的主體部分;輸出層在Keras 中沒有像輸入層一樣專門的層定義,而是在模型的最后接入一個(gè)全連接層(dense)作為輸出層。
Keras 有兩種類型的模型,函數(shù)式模型(model)和序貫?zāi)P停╯equential)。函數(shù)式模型通過多輸入多輸出,層與層之間任意連接,但這種模型編譯速度慢。序貫?zāi)P屯ㄟ^單輸入單輸出,一條路通到底,層與層之間只有相鄰關(guān)系,沒有跨層連接。這種模型編譯速度快,操作也比較簡(jiǎn)單,因此本篇采用效率較高使用較為便捷的序貫?zāi)P汀?/p>
圖像數(shù)據(jù)集一共有12764張照片,圖片來源于十字路口、維修路口和不同路線彎曲的路口,數(shù)據(jù)集中照片尺寸為(80,160,3),標(biāo)簽文件大小為(80,160,1)。其中選擇劃分80%的比例作為訓(xùn)練集,20%作為驗(yàn)證集。
神經(jīng)網(wǎng)絡(luò)搭建過程:輸入打包好的訓(xùn)練圖片文件和相對(duì)應(yīng)的標(biāo)簽文件,神經(jīng)網(wǎng)絡(luò)搭建過程如圖1所示,首先使用批歸一化層對(duì)輸入的訓(xùn)練數(shù)據(jù)進(jìn)行歸一化處理;每?jī)蓚€(gè)卷積層(conv)后面加上一層池化層(max-pool)作為編碼器(encoder)部分;后面通過上采樣層和反卷積層,將其特征進(jìn)一步還原,作為解碼器(decoder)。最后輸出結(jié)果,且其輸入網(wǎng)絡(luò)數(shù)據(jù)shape 與輸出shape保持一致。
圖1 神經(jīng)網(wǎng)絡(luò)搭建過程
在車道線識(shí)別訓(xùn)練好模型的基礎(chǔ)上,即可對(duì)視頻或圖像中的車道線進(jìn)行檢測(cè)。先導(dǎo)入準(zhǔn)備好的模型圖像,使用神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行預(yù)測(cè),首先使用批歸一化層對(duì)輸入的車道線數(shù)據(jù)進(jìn)行歸一化處理;之后通過多層迭代的卷積層逐步提取出車道線的特征,并適當(dāng)使用池化層去除冗余信息,使識(shí)別更為精準(zhǔn)。后面通過上采樣層和反卷積層,將車道線特征進(jìn)一步還原。之后重新創(chuàng)建一個(gè)RGB 圖像的車道,與原有車道重疊,最后輸出檢測(cè)結(jié)果。
圖2 圖像識(shí)別過程
本文實(shí)驗(yàn)的硬件環(huán)境為處理器1.1 GHz 四核Intel Core i5,GPU 為Intel Iris Plus Graphics,操作系統(tǒng)為macOS Monterey,深度學(xué)習(xí)框架為Keras,后端采用Tensorflow。實(shí)驗(yàn)結(jié)果如圖3 所示,使用車道線的檢驗(yàn)算法將圖片中的車道線部分提取出來,識(shí)別區(qū)域較為精準(zhǔn),可標(biāo)記出當(dāng)前行駛車道區(qū)域。
圖3 原始圖像與車道線識(shí)別
如圖4 所示,本實(shí)驗(yàn)的平均準(zhǔn)確度為96.02%,識(shí)別車道線準(zhǔn)確度高。經(jīng)過方法測(cè)試環(huán)節(jié),機(jī)器視覺車道線檢測(cè)方法和卷積神經(jīng)網(wǎng)絡(luò)車道線檢測(cè)方法所得結(jié)果都符合預(yù)期。
圖4 準(zhǔn)確度曲線
本文基于Keras 深度學(xué)習(xí)模型實(shí)現(xiàn)了識(shí)別車道線技術(shù),可以較為準(zhǔn)確地識(shí)別目標(biāo)物體。結(jié)果表明,在運(yùn)算速度和精準(zhǔn)度上對(duì)于交通檢測(cè)有一定幫助,該技術(shù)擁有較為廣闊的應(yīng)用前景。由于現(xiàn)實(shí)問題的多元化以及技術(shù)上的缺陷,該系統(tǒng)仍存在場(chǎng)景識(shí)別不夠準(zhǔn)確的問題,因此在未來需要進(jìn)一步改進(jìn)提升識(shí)別準(zhǔn)確率,以應(yīng)對(duì)實(shí)際交通路況中出現(xiàn)的特殊情況。