陳寶權(quán),虞晶怡,周昆,郭裕蘭,黃惠,劉利剛,劉燁斌,徐凱,章國(guó)鋒,周曉巍
1. 北京大學(xué), 北京 100091; 2. 上海科技大學(xué), 上海 201210; 3. 浙江大學(xué), 杭州 310058; 4. 國(guó)防科技大學(xué), 長(zhǎng)沙 410073; 5. 深圳大學(xué), 深圳 518052; 6. 中國(guó)科學(xué)技術(shù)大學(xué), 合肥 230026; 7. 清華大學(xué), 北京 100085
在無(wú)人駕駛、虛擬/增強(qiáng)現(xiàn)實(shí)、智能機(jī)器人和人機(jī)交互等新興應(yīng)用的牽引下,在三維成像傳感器、人工智能算法和高性能計(jì)算等能力升級(jí)的保障下,三維視覺與智能圖形技術(shù)發(fā)展迅速,相互交融,在學(xué)術(shù)界和產(chǎn)業(yè)界均引起極大的關(guān)注。目前,在三維數(shù)據(jù)獲取、三維場(chǎng)景建模、三維語(yǔ)義理解和高真實(shí)感繪制等方面依然存在諸多挑戰(zhàn)。緊密結(jié)合人工智能與大數(shù)據(jù)技術(shù)的最新進(jìn)展,推動(dòng)三維視覺與智能圖形理論與方法的進(jìn)一步發(fā)展,促進(jìn)相關(guān)技術(shù)的應(yīng)用落地,都將對(duì)未來(lái)的學(xué)術(shù)、產(chǎn)業(yè)和社會(huì)帶來(lái)重要影響。
為了促進(jìn)我國(guó)三維視覺與智能圖形相關(guān)技術(shù)、方法與應(yīng)用研究的深入開展,及時(shí)反映我國(guó)學(xué)者在相關(guān)領(lǐng)域的最新研究進(jìn)展,《中國(guó)圖象圖形學(xué)報(bào)》邀請(qǐng)業(yè)內(nèi)專家共同策劃推出“三維視覺與智能圖形”???,主要收錄國(guó)內(nèi)學(xué)者在相關(guān)理論方法、關(guān)鍵技術(shù)、數(shù)據(jù)平臺(tái)和典型應(yīng)用等方面具有創(chuàng)新性、突破性的研究成果。
經(jīng)過(guò)嚴(yán)格的評(píng)審,“三維視覺與智能圖形”??彩珍泴W(xué)術(shù)論文24篇,包括5篇“綜述”、1篇“數(shù)據(jù)集”論文、6篇“深度估計(jì)與三維重建”論文、4篇“三維形狀分析”論文、3篇“三維點(diǎn)云分割”論文、5篇“圖像視頻分析”論文。
5篇“綜述”主要針對(duì)單目深度估計(jì)、三維點(diǎn)云配準(zhǔn)、多源融合SLAM進(jìn)行了系統(tǒng)性的總結(jié)與探討,并對(duì)未來(lái)的研究方向和發(fā)展趨勢(shì)進(jìn)行了展望。
1)《基于深度學(xué)習(xí)的單目深度估計(jì)技術(shù)綜述》對(duì)2014—2021年間深度學(xué)習(xí)用于單目深度估計(jì)的經(jīng)典方法以及最新進(jìn)展進(jìn)行了全面綜述,回顧了基于監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)方法的發(fā)展歷程。并對(duì)當(dāng)前研究的現(xiàn)狀、面臨的問題及可能的解決方案進(jìn)行了討論。
2)《深度學(xué)習(xí)剛性點(diǎn)云配準(zhǔn)前沿進(jìn)展》聚焦于深度學(xué)習(xí)點(diǎn)云配準(zhǔn),重點(diǎn)闡述領(lǐng)域最新方法和發(fā)展趨勢(shì);對(duì)不同算法進(jìn)行了詳細(xì)闡述與歸納比較;介紹了多種度量指標(biāo)以及在不同基準(zhǔn)下的對(duì)比數(shù)據(jù);最后討論了當(dāng)前深度點(diǎn)云配準(zhǔn)面臨的挑戰(zhàn),并對(duì)未來(lái)研究方向進(jìn)行展望。
3)《三維點(diǎn)云配準(zhǔn)方法研究進(jìn)展》分別就非學(xué)習(xí)和基于學(xué)習(xí)的點(diǎn)云配準(zhǔn)方法進(jìn)行綜述與對(duì)比分析,從應(yīng)用場(chǎng)景、配準(zhǔn)性能、應(yīng)用條件、算法通用性方面指出了點(diǎn)云配準(zhǔn)技術(shù)面臨的挑戰(zhàn),并展望了未來(lái)的發(fā)展趨勢(shì)。
4)《多源融合SLAM的現(xiàn)狀與挑戰(zhàn)》從多傳感器融合(相機(jī)、激光雷達(dá)、慣性測(cè)量單元等兩種或多種傳感器的組合使用)、多特征基元融合(特征法與直接法,線、面等多維幾何特征相結(jié)合)和多維度信息融合(幾何信息、語(yǔ)義信息、物理信息、學(xué)習(xí)方法等相融合)3個(gè)層面對(duì)當(dāng)前多源融合SLAM研究的狀態(tài)、面臨的挑戰(zhàn)及未來(lái)方向進(jìn)行綜述。
5)《深度學(xué)習(xí)單目深度估計(jì)研究進(jìn)展》分別論述了單圖像訓(xùn)練模型、多圖像訓(xùn)練模型和輔助信息優(yōu)化訓(xùn)練的單目深度估計(jì)模型,系統(tǒng)分析了單目深度估計(jì)的最新研究現(xiàn)狀和各類方法的優(yōu)缺點(diǎn),總結(jié)歸納了單目深度估計(jì)的未來(lái)研究趨勢(shì)。
“數(shù)據(jù)集”論文《面向本征圖像分解的高質(zhì)量渲染數(shù)據(jù)集與非局部卷積網(wǎng)絡(luò)》建立了新的高質(zhì)量本征圖像數(shù)據(jù)集,并提出一種基于圖卷積的神經(jīng)網(wǎng)絡(luò)。由于顯式地結(jié)合了非局部先驗(yàn),該網(wǎng)絡(luò)得到了更優(yōu)的本征分解結(jié)果,并通過(guò)一系列應(yīng)用任務(wù)得到了進(jìn)一步的驗(yàn)證。
“深度估計(jì)與三維重建”欄目6篇論文分別:提出一種快速、魯棒的結(jié)構(gòu)化重建算法以自動(dòng)生成輕量的多邊形網(wǎng)格;提出一種基于多階段指導(dǎo)網(wǎng)絡(luò)的稠密深度圖構(gòu)建方法;為實(shí)現(xiàn)高精度的雙目視差估計(jì),提出采用單、雙邊多尺度相似性迭代查找的方法;提出一種顯微光學(xué)系統(tǒng)成像模糊程度與景物深度關(guān)系曲線的獲取方法;對(duì)多視圖立體三維重建中的特征提取模塊和代價(jià)體正則化模塊進(jìn)行研究,提出一種基于注意力機(jī)制的端到端深度學(xué)習(xí)架構(gòu);提出一種基于場(chǎng)景幾何的方法在自動(dòng)駕駛領(lǐng)域?qū)崿F(xiàn)真實(shí)尺度恢復(fù)。
“三維形狀分析”欄目4篇論文分別:提出了一種基于顯著性圖的點(diǎn)云替換對(duì)抗攻擊方法;利用網(wǎng)格簡(jiǎn)化的邊收縮操作建立網(wǎng)格層次結(jié)構(gòu),提出了一種新的網(wǎng)格池化操作;提出一種新穎的無(wú)翻轉(zhuǎn)體映射計(jì)算方法,其核心是一種新的變形方法;為更好地提取殘缺點(diǎn)云的局部特征信息,使得點(diǎn)云補(bǔ)全的結(jié)果更加準(zhǔn)確,提出了嵌入注意力模塊的多尺度點(diǎn)云補(bǔ)全算法。
“三維點(diǎn)云分割”欄目3篇論文分別:為建立三維模型語(yǔ)義部件之間的對(duì)應(yīng)關(guān)系并實(shí)現(xiàn)模型自動(dòng)分割,提出一種利用隱式解碼器的無(wú)監(jiān)督三維模型簇協(xié)同分割網(wǎng)絡(luò);為更好地在從無(wú)序的點(diǎn)云中挖掘形狀特征,提出一種能夠端到端且魯棒地處理點(diǎn)云數(shù)據(jù)的多維度多層級(jí)神經(jīng)網(wǎng)絡(luò)MM-Net;提出了一種基于多特征融合幾何卷積神經(jīng)網(wǎng)絡(luò)(MFFGCNN)的機(jī)載激光雷達(dá)點(diǎn)云地物分類方法。
“圖像視頻分析”欄目5篇論文分別:提出了聚合細(xì)粒度特征的深度注意力自動(dòng)裁圖方法DAIC-Net;針對(duì)從單幅人臉圖像中恢復(fù)面部紋理圖時(shí)獲得的信息不完整、紋理細(xì)節(jié)不夠真實(shí)等問題,提出一種基于生成對(duì)抗網(wǎng)絡(luò)的人臉全景紋理圖生成方法;針對(duì)因視差過(guò)大和視差突變?cè)斐梢曈X不舒適度這一問題,提出了一種基于時(shí)空聯(lián)合視差優(yōu)化的立體視頻重定向方法,將視頻視差范圍控制在舒適區(qū)間;提出一種多尺度可視化形狀表示方法;提出一種基于熱力圖的6D物體姿態(tài)估計(jì)算法。
我們期待廣大讀者和科技人員通過(guò)本期“三維視覺與智能圖形”???,能夠更深入、更全面地了解該領(lǐng)域的最新方法和應(yīng)用,吸引更多學(xué)者從事相關(guān)研究并產(chǎn)生具有國(guó)際影響力的優(yōu)秀成果,為本領(lǐng)域的發(fā)展做出新的貢獻(xiàn)。