摘 要:三維點(diǎn)云重建技術(shù)在眾多領(lǐng)域中有著廣泛的應(yīng)用,作為二維點(diǎn)云重建技術(shù)的改進(jìn)版,它能夠輸出更豐富的信息,但同時(shí),三維點(diǎn)云技術(shù)還有很大的發(fā)展空間。而深度學(xué)習(xí)是人工智能技術(shù)的核心,基于深度學(xué)習(xí)的三維點(diǎn)云重建技術(shù)則更加智能,配合神經(jīng)網(wǎng)絡(luò)模型性和PointNet網(wǎng)絡(luò)結(jié)構(gòu),能夠準(zhǔn)確高效地提取處理點(diǎn)云信息,精準(zhǔn)輸出目標(biāo)特征,本文就將對其進(jìn)行探究。
關(guān)鍵詞:機(jī)器學(xué)習(xí);點(diǎn)云重建;卷積神經(jīng)網(wǎng)絡(luò)
引言:
人工智能是目前我國計(jì)算機(jī)技術(shù)發(fā)展的重要分支,基于深度學(xué)習(xí)的人工智能讓很多基于計(jì)算機(jī)技術(shù)的設(shè)想成為現(xiàn)實(shí),如無人機(jī)、無人駕駛、人臉識別都已經(jīng)是人們熟知的應(yīng)用成果。深度學(xué)習(xí)作為人工智能的核心,與三維點(diǎn)云重建技術(shù)相結(jié)合也產(chǎn)生不同凡響的效果。
一、深度學(xué)習(xí)技術(shù)概述
(一)人工智能與機(jī)器學(xué)習(xí)
人工智能的概念在20世紀(jì)50年代被提出,經(jīng)過數(shù)十年的研究才發(fā)展到今天的水平。盡管目前人工智能?已經(jīng)取得了突破性成就,但不久前還存在的技術(shù)障壁問題任然被質(zhì)疑。直到2012年之后,人工智能技術(shù)才在世界頻繁地出現(xiàn)在人們的視野。人工智能技術(shù)開始爆發(fā)式進(jìn)步的關(guān)鍵就是機(jī)器學(xué)習(xí)新算法的出現(xiàn),機(jī)器學(xué)習(xí)是一門多領(lǐng)域交叉的學(xué)科,主要研究計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為的原理。
(二)卷積神經(jīng)網(wǎng)絡(luò)的組成與訓(xùn)練
卷積神經(jīng)網(wǎng)絡(luò)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的算法之一。輸入層作為處理多維數(shù)據(jù)的結(jié)構(gòu),可以接受一維、二維或三維數(shù)據(jù),這取決于卷積神經(jīng)網(wǎng)絡(luò)的維度。隱含層又包含卷積層、池化層和全連接層這三類常見構(gòu)筑,其中卷積層主要負(fù)責(zé)對數(shù)據(jù)進(jìn)行特征提取,池化層在卷積層工作后過濾輸出的特征圖,全連接層的作用只有一個(gè),就是向其他全連接層傳遞信號。輸出層是全連接層的下游結(jié)構(gòu),主要輸出分類標(biāo)簽或者分類結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程分為兩個(gè)階段:數(shù)據(jù)由低層次向高層次傳播階段和將誤差向底層傳播階段,即向前傳播和向后傳播兩個(gè)階段。
(三)深度學(xué)習(xí)的邏輯原理
深度學(xué)習(xí)的優(yōu)勢在于讓機(jī)器也能具有學(xué)習(xí)、思考的能力,簡單來說,借助數(shù)據(jù)的形式錄入圖像與聲音等信息,讓機(jī)器能夠根據(jù)之前的圖像或聲音進(jìn)行判斷,使得機(jī)器能夠獲得一定的思考能力。因此,深度學(xué)習(xí)項(xiàng)目必須要先有圖片或聲音的“基礎(chǔ)”,不同的“基礎(chǔ)”會促使機(jī)器開展不同方向的研究。
二、基于三維點(diǎn)云的深度學(xué)習(xí)算法
(一)3DCNN
3DCNN可以從卷積過程中提取單一類型的特征,這是由于在整個(gè)卷積股過程中卷積核的權(quán)值都一致,相當(dāng)于共享權(quán)值,也就是屬于同一種卷積核,因此需要采用多種卷積核才能提取多種特征, 例如人臉檢測算法就是使用了這樣的信息輸入方法,具體來說,很多高精度制造都應(yīng)用了這一技術(shù),例如車輛重建、輔助醫(yī)學(xué)診斷、測量大范圍地貌、三維數(shù)字化城市、三維地圖、VR&AR游戲等等。
(二)PointNet
PointNet的關(guān)鍵在于權(quán)重共享的卷及操作,這是一種將數(shù)據(jù)等信息載體轉(zhuǎn)化為其他信息形式。由于點(diǎn)云的無序性特征增加了數(shù)據(jù)處理的難度,針對無序點(diǎn)云數(shù)據(jù)深度學(xué)習(xí)的發(fā)法研究進(jìn)展緩慢。PointNet網(wǎng)絡(luò)模型的出現(xiàn)解決了這一問題,它允許直接輸入點(diǎn)云進(jìn)行處理,在這之后,依照所有點(diǎn)的特征生成全面的點(diǎn)云特征,不需要增加額外的規(guī)整點(diǎn)云的操作。不過PointNet也有不足之處,其一是提取特征的過程缺少對局部特征的處理及提取,對點(diǎn)云空間的鄰近點(diǎn)沒有區(qū)分,其二是均勻采樣的點(diǎn)云訓(xùn)練忽視了現(xiàn)實(shí)中點(diǎn)云的疏密變化。
(三)PointNet++
PointNet++是對PointNet進(jìn)行了改進(jìn)的版本,解決了PointNet存在的問題。PointNet++可以實(shí)現(xiàn)對點(diǎn)云的局部劃分,從而準(zhǔn)確處理和提取局部特征,點(diǎn)云密度不均時(shí)的處理學(xué)習(xí)實(shí)際上和局部處理的問題存在關(guān)聯(lián),在對點(diǎn)云進(jìn)行局部特征提取后,按照局部點(diǎn)的密度去組合它們。
三、基于深度學(xué)習(xí)的三維點(diǎn)云重建
(一)點(diǎn)云尺度空間
點(diǎn)云的概念是指某個(gè)坐標(biāo)系下的點(diǎn)集合,包含豐富的數(shù)據(jù)信息,在逆向工程中通過測量儀器得到的產(chǎn)品外觀表面的點(diǎn)數(shù)據(jù)集合也可以被稱為點(diǎn)云,根據(jù)點(diǎn)數(shù)量與點(diǎn)間距的差別可以將其分為稀疏點(diǎn)云和密集點(diǎn)云。尺度空間即觀測、獲取或者處理信息的不同尺度的一種數(shù)學(xué)集合,也可以理解為一種在多個(gè)尺度下觀察目標(biāo)然后加以綜合的分析和理解的技術(shù)。尺度空間的主要思路是,在處理模型中首先引入一個(gè)可以被視為尺度的參數(shù),其次不斷變化尺度參數(shù)捕捉并提取不同尺度下對應(yīng)的模型特征信息,最后綜合這些相互補(bǔ)充的信息,完整地還原模型的本質(zhì)特征。
(二)MSS-PointNet結(jié)構(gòu)設(shè)計(jì)
點(diǎn)云數(shù)據(jù)是多種信息的載體表現(xiàn)形式,其中3D voxel grids或圖片的集合是點(diǎn)云數(shù)據(jù)的常見表現(xiàn)形式,點(diǎn)云數(shù)據(jù)具有不規(guī)則性,這意味著點(diǎn)云數(shù)據(jù)必須先轉(zhuǎn)化為其他形式的信息表達(dá)方式才能被處理。網(wǎng)絡(luò)直接處理場景的點(diǎn)云數(shù)據(jù)較少,但是能夠極大提高點(diǎn)云數(shù)據(jù)處理效率,PointNet網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)并不復(fù)雜,卻能夠高效準(zhǔn)確的處理數(shù)據(jù)。要直接使用原始點(diǎn)云數(shù)據(jù)輸入,在進(jìn)行空間網(wǎng)絡(luò)設(shè)計(jì)需要考慮到點(diǎn)云只是一系列點(diǎn)的集合,所以需要額外進(jìn)行一些操作。
(三)多尺度結(jié)構(gòu)
多尺度方法實(shí)際上就是對信息的多尺度特征進(jìn)行采樣,在不同的尺度下捕捉到不同的特征,并提取這些特征。一般來說尺度越小粒度越小,采樣的密度更高,能夠得到更精密的特征信息,尺度越大粒度越大,采樣點(diǎn)精確性就越低,對信息的捕捉就更粗糙。在未來市場中,人工智能的應(yīng)用必然集中在輕工業(yè)或精細(xì)化研究中,代替?zhèn)鹘y(tǒng)人力完成復(fù)雜、精細(xì)或勞累的工作,人工智能具備的觀察和感知的能力,可以使得其做到簡單理解和推理,代替人力完成一些較為淺顯的邏輯任務(wù),而強(qiáng)人工技能具有的自適應(yīng)能力(即機(jī)器學(xué)習(xí)),更是使得其能夠獨(dú)立分析解決遇到過的問題。目前,三維重建技術(shù)已在醫(yī)療、安保、娛樂、城市建設(shè)等多個(gè)領(lǐng)域得到了廣泛的應(yīng)用,具體來說,很多高精度制造都應(yīng)用了這一技術(shù),例如車輛重建、輔助醫(yī)學(xué)診斷、測量大范圍地貌、三維數(shù)字化城市、三維地圖、VR&AR游戲等等。面對不斷增長的3D技術(shù)需求,未來還會有更多領(lǐng)域引入三維點(diǎn)云重建技術(shù),并反推其發(fā)展進(jìn)步。
四、結(jié)束語
綜上,三維點(diǎn)云重建技術(shù)是二維點(diǎn)云重建技術(shù)的進(jìn)一步發(fā)展,深度學(xué)習(xí)是人工智能的重要算法,兩種技術(shù)結(jié)合帶來了更高效的工作效率。基于深度學(xué)習(xí)的三維點(diǎn)云重建算法研究已經(jīng)取得了一定成就,但是還有很多問題待解決。技術(shù)和領(lǐng)域的交叉已經(jīng)成為科技發(fā)展的趨勢,未來三維點(diǎn)云重建技術(shù)會越來會成熟。
參考文獻(xiàn):
[1]孔德慧,劉彩霞,王少帆,李敬華,王立春. 一種基于深度學(xué)習(xí)的三維重建方法[P]. 北京市:CN109993825A,2019-07-09.
[2]白靜, 司慶龍, 秦飛巍. 輕量級實(shí)時(shí)點(diǎn)云分類網(wǎng)絡(luò)LightPointNet[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2019, 31(04):102-111.
[3]邵昀岑. 基于深度學(xué)習(xí)的三維目標(biāo)檢測算法綜述[J]. 信息與電腦(理論版), 2019(23).
[4]肖仕華, 桑楠, 王旭鵬. 基于深度學(xué)習(xí)的三維點(diǎn)云頭部姿態(tài)估計(jì)[J]. 計(jì)算機(jī)應(yīng)用, 2020, 40(4):996-1001.
[5]馮智鍵, 周燕, 曾凡智,等. 基于深度學(xué)習(xí)的三維模型重建檢索算法研究[J]. 福建電腦, 2017, 033(011):9-10,53.
作者簡介:
楊學(xué)偉(1983—),男,漢族,籍貫:河北遷安,學(xué)歷:本科,職稱:工程師 ,單位:上海商湯智能科技有限公司,研究方向:三維重建及應(yīng)用。