沈為,過一路,趙凱
①上海大學 通信與信息工程學院,上海 200444;②南開大學 計算機與控制工程學院,天津 300071
人從降生的那一刻起,便帶有了年齡這一個屬性。年齡伴隨著人的一生,是一個人的重要生物特征。從年輕到衰老,年齡的變化常常反映在人的容貌上。人們第一次見面時,總是會在心中估計對方的年齡從而更好地進行交流。但是,有些人長得年輕,而有些人比較顯老,因此,一個大概的年齡容易估計而準確的年齡往往難以估計。有許多因素都會影響人的容貌,主要包含內因和外因兩部分:內因主要是先天基因的影響,由于每個人的基因都有所不同,導致了不同人的容貌千差萬別,而且容貌隨年齡的變化也各有不同;而外因主要是后天生活環(huán)境的影響,如大量接觸紫外線會導致皮膚老化,長期喝酒抽煙也容易衰老,生活不如意、長期高強度的勞動也會使衰老速度加快。各種因素都影響著人的容貌,每個人的容貌隨著時間的推移各自以不同的方式在發(fā)生著改變,所以將容貌與年齡準確地聯(lián)系起來是一個比較困難的任務。
那么是否可以借助計算機,也就是人工智能技術,來自動實現(xiàn)年齡估計呢?人工智能一直是許多科學家的夢想,其目標是讓計算機具有和人類一樣的能夠感知和識別周圍場景的能力。比如讓計算機根據(jù)攝像頭的輸入圖像或者視頻,識別圖像中有哪些物體,這些物體在什么地方,這些物體的類別是什么,有什么屬性。這樣一些問題對于人類來說很簡單,但是對于計算機來說是不容易的。隨著人工智能技術的不斷發(fā)展,尤其是近幾年深度學習技術的飛速發(fā)展,人工智能正在逐步普及到我們的日常生活中。戰(zhàn)勝柯潔和李世石的AlphaGo、綜藝節(jié)目中的智能機器人、Siri智能語音識別、人臉識別門禁系統(tǒng),這些產品的背后都是基于深度學習的人工智能技術。
借助人工智能技術實現(xiàn)自動年齡估計,一直是人工智能領域的一個熱門問題。在這個問題上,計算機相比人類甚至還具備一些優(yōu)勢。因為人類也無法做到精確地去估計一個陌生人的年齡,而計算機可以通過海量的數(shù)據(jù)學習,去作出最優(yōu)的估計?,F(xiàn)在,自動年齡估計在我們的生活中也有一些應用。比如,我們用有些智能手機拍攝人臉的時候,人臉旁邊會顯示出一個年齡。一些網站也推出這樣的應用:根據(jù)一個人的照片估計他的年齡(圖1)。
隨著互聯(lián)網的發(fā)展,各種潛在應用的需求日益增加,人們對面部圖像的年齡估計越來越感興趣。它可以應用于許多場景,例如:法醫(yī)學研究——用于刑事案件的偵察;基于年齡的人機交互系統(tǒng)——根據(jù)用戶的不同年齡,提供不同的交互界面,更好地為用戶服務;基于年齡的訪問控制,如禁止未成年人訪問色情網站、購買煙酒等。
如前所述,人類的衰老是一個非常復雜、不受人的意志控制的過程,具有多樣性和不確定性的特點。這使得容貌與年齡之間的關系難以刻畫,而年齡估計需要從單個人臉圖像中固定不變的人臉角度、表情來估計年齡,所以自動年齡估計依然是一個很困難的問題。隨著深度學習的發(fā)展,人臉年齡估計這個問題被越來越廣泛地研究,估計效果也在變得越來越好。
接下來,本文將深入淺出地介紹一些自動年齡估計的方法,包括基于傳統(tǒng)人工智能技術的方法和基于深度學習技術的方法,其中詳細介紹我們發(fā)表在2017年人工智能領域頂級國際會議——IEEE計算機視覺與模式識別大會上的研究成果《基于深度森林的年齡估計》[1]。
圖1 圖像中的人臉年齡估計
如果給你一個人的正臉和側臉圖像讓你估計他的年齡,肯定是正臉的更容易估計,也更容易估計得準確,因為我們能從正臉得到更多的信息,所以通常年齡估計需要的人臉圖像是正臉。在得到人臉圖像后,一般需要對人臉圖像進行對齊、剪裁:將形狀各異的人臉圖像進行歸一化處理,根據(jù)眼睛、鼻子、嘴角等人臉上的一些關鍵點進行幾何變換,讓人臉盡可能處于正對的狀態(tài),同時剪裁掉多余的背景,去掉一些背景的干擾,讓人臉圖像更符合估計模型的需要,有利于提取人臉圖像的特征。
年齡估計主要可以分為年齡組估計和實際年齡估計兩類。實際年齡估計是根據(jù)人臉圖像估計出人的真實年齡,也就是實足年齡;而年齡組估計是判斷人臉圖像屬于哪一個年齡范圍。從人工智能技術角度來說,年齡組估計是一個分類問題,即把年齡或者年齡范圍看成一個類別;實際年齡估計是一個回歸問題,即把實足年齡看成一個數(shù)值。不論是分類還是回歸,都需要解決兩個問題,一個是提取能夠表示人臉圖像的特征(通常為一個向量),另一個是找到一個函數(shù),使其能表示人臉圖像特征到年齡之間的映射。這樣一個函數(shù)(通常稱為分類器或者回歸器)需要通過學習得到。所謂學習,如同我們人類學習過程一樣,需要大量的已經標記好年齡的人臉圖像,讓計算機知道什么樣的人臉對應什么樣的年齡。所以研究人臉年齡估計需要大量標注好年齡的人臉圖片,目前較為常用的是FG-NET數(shù)據(jù)集[2]和Morph數(shù)據(jù)集[3]。FG-NET中包括了82個人從小到大共1 002張照片,年齡范圍在0歲到69歲之間;Morph是一個較大的人臉年齡數(shù)據(jù)集,包含大約13 000人的50 000多張照片,年齡范圍在16歲到77歲之間。
下面將對于年齡估計中的基于傳統(tǒng)人工智能技術的方法與基于深度學習的方法進行一些介紹。
基于傳統(tǒng)人工智能技術的年齡估計方法著重于如何設計一個對于年齡變化更有代表性、更豐富、更合適的特征。雖然這樣設計出的特征有很好的可解釋性,但要設計一個好的特征往往比較困難。
早期的年齡估計方法精度較低,大多是年齡組估計,通過人工設計的一些方法來提取特征,然后判斷人臉圖像屬于哪一個年齡范圍。Kwon和Lobo[4]在1994年最早對人臉年齡估計進行了研究,那時的研究只是粗略地將年齡分成了小孩、年輕人、老年人三類。雖然工作看似簡單,但是這是年齡估計的一個開端。Kwon和Lobo的方法主要受到顱面發(fā)展理論的啟發(fā)。顱面發(fā)展理論認為顱骨的變化可以用一個充滿液體的球體來模擬,該模型能有效地描述一個人從孩童成長為成年人過程中頭部輪廓的變化規(guī)律。他們根據(jù)面部模板檢測出臉部的輪廓并找到眼睛、鼻子、嘴巴、下巴等人臉關鍵點的位置,然后由這些位置計算一系列幾何比例(圖2),經過統(tǒng)計設置一個合適的閾值用于區(qū)分兒童與成年人。在人發(fā)育成熟后骨骼結構一般不會有太大的改變,但皮膚會隨著衰老變得松弛而產生皺紋。他們根據(jù)之前檢測的人臉關鍵點和皺紋地理圖譜得到人臉主要的皺紋區(qū)域(圖2),然后放大這些區(qū)域提取snakelet(蛇形的曲線段),以蛇形曲線段的數(shù)量作為皺紋特征用來區(qū)分年輕人與老年人。
圖2 面部模板與皺紋地理圖譜[4]
主動外觀模型(active appearance model,AAM)[5]是一個將形狀與灰度結合起來用主成分分析建模的統(tǒng)計模型,它通過對人臉形狀特征和紋理特征進行統(tǒng)計分析,建立人臉混合模型。Lanitis等人[6]首次將主動外觀模型應用于人臉的特征提取中,以AAM模型參數(shù)作為人臉特征參數(shù),建立特征參數(shù)與年齡之間的函數(shù)關系,并在訓練集中對函數(shù)參數(shù)進行訓練優(yōu)化。在對一張新的人臉圖像進行年齡估計時,先利用AAM提取人臉特征,將提取到的特征代入優(yōu)化好的年齡函數(shù)中就能計算出人臉圖像的年齡。Lanitis等人[7]之后又分別運用最近鄰分類器、自組織映射網(SOM)、多層感知器分類器(MLP)對基于主動外觀模型提取到的特征進行人臉估計。他們通過實驗發(fā)現(xiàn)多層感知器分類器的效果比較好。多層感知器是最簡單也是最常見的一種神經網絡結構,可以說是其他各種神經網絡結構的基礎,但由于當時計算機的計算能力的限制,神經網絡一般只有2~3層,性能并不特別突出。
每個人的臉會以不同的方式成熟、衰老,對于特定的某個人來說,他在不同年齡的臉部圖像一般來說和他在其他年齡時期的圖像更相近。Xin等人[8]由此提出了一種年齡成長模式子空間模型。該模型把每個人的衰老過程作為一個獨立的年齡成長模式,每個人的年齡成長模式由其不同年齡時期的人臉圖像按時間順序排列構成,人臉圖像在圖像序列中的位置點對應該人的年齡值。也就是說,根據(jù)圖像的相似度找到圖像在年齡成長模式中的位置就能得到相應的年齡(圖3)。將不同個體的年齡成長模式按照一定的關系進行映射得到年齡成長模式子空間,年齡成長模式子空間中的每一個點代表了一個年齡成長模式,每一個點中的各個位置又對應了一個年齡。給定一張人臉圖像,提取其特征向量,找出它在年齡成長模式子空間中最合適的點、最合適的位置,根據(jù)位置就能得到人臉相應的年齡。年齡成長模式子空間將每個人的年齡成長模式作為一個整體來看待,更符合年齡成長的客觀特點,在FG-NET數(shù)據(jù)集上平均絕對誤差(mean absolute error,MAE)達到了6.77歲,但這種方法要求每個人有不同年齡上的多幅人臉圖像,對數(shù)據(jù)采集要求較高。
圖3 年齡成長模式[8]
人臉隨著年齡增長而變化,具有時間特性,所以人臉圖像的年齡特征中可能會顯示出一些低維的序列模式。Fu等人[9]將流形學習引入到人臉圖像的年齡模型中來挖掘這種序列模式。流形學習的觀點認為,我們所能觀察到的數(shù)據(jù)實際上是由一個低維流形映射到高維空間上的,高維數(shù)據(jù)在維度上是有冗余的。流形學習要做的就是發(fā)現(xiàn)高維數(shù)據(jù)分布的內在規(guī)律,將高維數(shù)據(jù)映射回低維,并且使該低維數(shù)據(jù)保留原高維數(shù)據(jù)的某些結構特征,能夠反映數(shù)據(jù)的本質。年齡特征的流形學習就是尋找一種特征空間,將人臉原始圖像數(shù)據(jù)通過該特征空間轉化為一組具有序列模式的低維年齡特征用于年齡估計中。流形學習極大地減少了年齡特征的維度冗余,能夠捕獲潛在的臉部年齡成長結構,使模型擬合更加容易。
Guo等人[10]將流形學習與支持向量回歸(support vector regression,SVR)結合來進行年齡估計。他們認為年齡估計是一個復雜的非線性回歸問題,年齡變化的差異很大,為了提高模型的泛化能力,SVR傾向于找到一條平滑的曲線來擬合年齡特征,這樣SVR能擬合出數(shù)據(jù)集中年齡變化的大致趨勢,但對于精確的年齡估計效果較差。為了改進SVR方法的缺陷,Guo等人提出了局部調整魯棒回歸方法(locally adjusted robust regression,LARR)。LARR先用SVR估計出年齡變化的大致趨勢,然后在得到的估計值附近的一個年齡范圍采用支持向量機(support vector machine,SVM)進行分類,對估計值進行局部調整,以得到更準確的年齡估計值。局部調整魯棒回歸方法在FG-NET數(shù)據(jù)集上平均絕對誤差達到了5.07歲。
Guo等人[11]利用Gabor濾波器提取人臉紋理特征,并提出了一種生物啟發(fā)式特征(biologically inspired features,BIF)用于年齡估計。BIF的提出受到“HMAX”模型[12]的影響。研究發(fā)現(xiàn)從初級視覺皮層到顳下葉皮層視覺信息的復雜度越來越高,而“HMAX”模型模擬了大腦皮層的視覺處理過程。該模型由簡單和復雜單元交替組成,模擬了這種復雜度遞增的結構。Guo等人根據(jù)年齡估計的特點只選用了“HMAX”模型的S1層和C1層,并且調整了波段和方向,然后將得到的特征進行降維用于年齡估計。他們利用生物啟發(fā)式特征使年齡估計的效果又有了提升,在FG-NET數(shù)據(jù)集上平均絕對誤差達到了4.77歲。
近年來深度學習席卷了人工智能的各個領域,在使用了深度學習技術后很多任務的性能都得到極大的提升。卷積神經網絡(convolutional neural network,CNN)是深度學習技術中一種重要的模型,在計算機視覺領域中得到廣泛的應用?;趥鹘y(tǒng)人工智能的方法采用的人工設計的特征雖然解釋性較好,但是在對任務目標的表示性上通常有所欠缺。在卷積神經網絡中,如圖4所示,圖像通過卷積層、池化層等操作提取特征,根據(jù)具體任務設計相應的損失函數(shù),損失函數(shù)產生的殘差通過梯度反向傳導對網絡中的參數(shù)進行更新優(yōu)化。卷積神經網絡將原本相對獨立的特征提取與任務學習有機地結合在一起,使得產生的特征包含的信息更加豐富,與任務更加契合。一般來說,越深的神經網絡可以表示的特征抽象程度越高,對函數(shù)的擬合能力也越強,特征的表示性也越好。
近幾年,有許多人將深度學習應用于年齡估計中。相比基于傳統(tǒng)人工智能的方法,基于深度學習的年齡估計方法取得了極大的性能提升。
圖4 神經網絡示意圖
Levi等人[13]較早地將卷積神經網絡用于年齡估計。他們設計了一個較為淺層的網絡,采用了3個卷積層和3個全連接層來提取人臉年齡特征,將年齡劃分成8個年齡組并用Softmax進行分類。Softmax是一種常用的多類分類器,它產生的是屬于各類別的概率,我們從中挑選概率值最大的類別作為結果。
年齡是具有順序性質的。平時我們估計一個人的年齡時,會將他與我們熟悉且知道年齡的人進行比較,通過大量的比較結果來判斷年齡。Niu等人[14]基于這樣的思路提出了ORCNN(ordinal regression CNN)網絡。他們將年齡標簽看作是一個次序,將年齡估計問題轉換為待估計年齡是大于某個年齡還是小于某個年齡的問題,這樣就能將其分成多個二值分類的子問題來處理。他們對原本標簽為年齡的數(shù)據(jù)集進行處理,形成多個子數(shù)據(jù)集,第i個子數(shù)據(jù)集中大于i的圖片標簽為1,小于等于i的圖片標簽為0。經過卷積神經網絡訓練學習,每個二分類器對應一個子數(shù)據(jù)集,輸出的結果判斷了年齡是否大于分類器對應的次序,將所有結果結合起來就能輸入圖像對應的次序,也就能得到年齡了。同時,這多個二分類子問題被視為多個任務,在同一個卷積神經網絡中進行處理共享了網絡的權重,能夠利用任務之間的相關性,讓多個任務在訓練中相互促進,有利于提高最終的性能。
神經網絡是一種數(shù)據(jù)驅動模型,借助大量的數(shù)據(jù)訓練神經網絡往往能對性能產生一些提升。Rothe等人[15]將一種較深的VGG網絡[16]運用于年齡估計,同時利用大量的數(shù)據(jù)去訓練,取得了很好的效果。VGG最早是用于圖像分類的,它在大規(guī)模圖像識別競賽(ILSVRC2014)上取得了第二名的成績。由于VGG簡潔合理的網絡結構、優(yōu)秀的特征提取能力,之后在許多任務上得到了應用。Rothe等人一開始嘗試以歐式距離作為最后的回歸函數(shù),但是網絡難以收斂且結果很不穩(wěn)定,后來他們使用Softmax進行分類。他們將每一個年齡值作為一個類別,Softmax產生的就是屬于各個年齡值的概率,將年齡值與相應的概率相乘再累加起來得到一個估計值,以數(shù)學期望的方式很直觀地將Softmax分類轉化成回歸。這種方法在FG-NET數(shù)據(jù)集上平均絕對誤差達到4.63歲,在Morph數(shù)據(jù)集上平均絕對誤差達到3.25歲。
人臉年齡估計可以看作是人臉年齡特征與年齡之間的一個非線性映射問題,但非線性映射往往不容易解決,那能不能將年齡估計問題轉化成線性映射問題呢?Agustsson等人[17]提出了一個錨定回歸網絡(anchored regression networks,ARN)。ARN的設計基于在特征的局部區(qū)域內回歸問題可以被線性化的假設,將非線性映射進行了分段,劃分成一個個局部區(qū)域,然后在局部區(qū)域內進行線性映射。在特征空間中選取一組錨點,每個錨點都有相應的線性函數(shù),為每一個特征計算與各個錨點的相似度,選擇與其相似度最高的錨點對應的線性函數(shù)進行年齡計算。如果將特征完全歸屬于各個錨點,這樣硬性的劃分在計算上不可導(梯度不存在),就不能與神經網絡進行結合。所以,ARN采用一種軟性的劃分,對特征計算了所有錨點對應的線性函數(shù),再按相似度的高低對這些線性函數(shù)的結果進行加權求和作為最后的結果。錨點的選取和線性函數(shù)的參數(shù)都能通過卷積神經網絡進行自動的優(yōu)化。ARN在Morph數(shù)據(jù)集上平均絕對誤差達到3.00歲。
在介紹了前面這些深度學習的方法后,下面著重介紹一下基于深度回歸森林的年齡估計方法[1]。深度回歸森林是卷積神經網絡與隨機森林的一種有機結合。隨機森林是一種基于決策樹的集成學習模型[18]。下面我們先簡單介紹決策樹。
決策樹是一種常見的機器學習模型,通過樹的結構表示了對象屬性與結果之間的一種映射關系。樹中每一個內部節(jié)點表示一個屬性或特征,根據(jù)這些特征的取值分配其子節(jié)點,最終達到葉節(jié)點,葉節(jié)點則對應著最后的輸出結果。決策樹在每個節(jié)點處選取信息增益最大的特征作為分裂的判斷條件。決策樹可以看成是一個“如果—那么”規(guī)則的集合,從根節(jié)點到葉節(jié)點的每一條路徑構建了一種規(guī)則,內部節(jié)點對應著規(guī)則的條件,葉節(jié)點對應著規(guī)則的結論。決策樹能夠對非線性關系進行較好的映射,它能看作是對輸入空間的一系列劃分以及在各個劃分區(qū)域上的輸出值。
決策樹對應的一系列的規(guī)則具有天然的解釋性。如圖5所示,我們用一棵決策樹對一組水果進行分類。首先,我們可以用顏色把這些水果分成綠色、黃色和紅色的水果;然后又可以通過形狀或者大小對這三種顏色的水果進行進一步的細分。決策樹對數(shù)據(jù)量的需求較小,沒有復雜的參數(shù)設置。由于這些優(yōu)點,決策樹在許多方面都有應用。但是決策樹很容易過擬合,“設置的規(guī)則過于復雜”,使得在測試數(shù)據(jù)中效果很差。決策樹的泛化能力也較差,對于沒有“見過”的數(shù)據(jù),其效果往往不好。為了解決決策樹的這些缺陷,人們提出了隨機森林算法。就像“三個臭皮匠頂一個諸葛亮”,隨機森林算法采用了多棵決策樹來進行處理,結合多棵樹的結果產生最后的結果。但多棵樹的結果就一定比一棵樹的好嗎?也不一定。如果每棵樹產生的結果都是一樣的,那最后綜合起來的結果和一棵樹的并沒有差別。要讓多棵樹的效果優(yōu)于一棵樹,那就需要讓每棵樹都有其他樹不具備的“能力”。因此,隨機森林引入了“隨機”,每一棵樹隨機地從數(shù)據(jù)集中選擇學習數(shù)據(jù),從特征中隨機選擇一部分,再取其中最優(yōu)的特征作為分裂的條件。這樣每棵樹都與眾不同,具有了不同的“能力”,增加了樹之間的獨立性,整體的效果就提升了。
圖5 決策樹示意圖
在傳統(tǒng)的決策樹中,決策樹的分裂生長是“非左即右”的離散過程,從一個節(jié)點往下分裂只能通向它的一個子節(jié)點,這個過程是不可導的。為了使決策樹能與神經網絡結合,Kontschieder等人[19]提出了可導的決策樹,將原本“非左即右”的分裂方式改變成了按概率分裂,這樣整個過程就變得可導了;而且傳統(tǒng)的決策樹是在節(jié)點處局部最優(yōu),采用按概率分裂的模式使得節(jié)點之間聯(lián)系在一起,從而使全局最優(yōu)成為可能。
如前所述,人臉容貌和年齡之間的關系是很復雜的,之間的映射不是一種均勻映射。比如,嬰兒的臉與年齡之間的映射函數(shù)和老人的臉與年齡之間的映射函數(shù)顯然是不同的。既然決策樹可以自然地對數(shù)據(jù)空間進行劃分,那么我們利用決策樹來對年齡空間進行劃分,使得各個子空間中的人臉圖像和年齡間的映射為均勻的,這樣更容易得到一個有效的回歸器。基于這樣一個思路,我們提出基于深度回歸森林的年齡估計方法。下面我們詳細介紹該方法的細節(jié)。
我們采用卷積神經網絡作為深度回歸森林的前端部分來提取特征。圖6表示深度回歸森林的大致結構,其中紅色圓圈表示這個卷積神經網絡最后的全連接層(FC layer)輸出的特征值。將這個特征值通過一個sigmoid函數(shù)歸一化到0~1之間,然后隨機分配到各個樹內部節(jié)點(藍色圓圈)上作為分裂概率。每張人臉圖像在每棵樹內部節(jié)點處以分裂概率被劃分到左右,最終落入葉節(jié)點(綠色圓圈)中。該人臉圖像所經過路徑上的各個概率相乘得到路徑函數(shù),表示了人臉圖像屬于這個葉節(jié)點的概率。落入到各個葉節(jié)點中的人臉圖像對應的年齡數(shù)據(jù)符合不同的高斯分布,表示不同的年齡分布結構。每個葉節(jié)點可以看成是一個局部回歸器,能夠在網絡學習過程中優(yōu)化。葉節(jié)點中的高斯分布與其相應的路徑函數(shù)構成一個混合高斯模型的結構,決策樹的輸出由各個高斯分布與路徑函數(shù)加權得到,再對多棵決策樹產生的結果進行平均得到最后的年齡估計。卷積神經網絡與隨機森林結合在一起,形成端到端的網絡結構。這樣特征提取與樹的節(jié)點在網絡中共同學習優(yōu)化。深度回歸森林有這樣幾個優(yōu)點:①深度回歸森林構建在深度神經網絡上,這樣保證了提取的人臉特征具有強大的表示能力;②深度森林的數(shù)據(jù)劃分是基于概率的軟劃分,而分裂概率又取決于提取的特征,所以深度森林的數(shù)據(jù)空間劃分與數(shù)據(jù)相關,是一種數(shù)據(jù)驅動的劃分,這樣的劃分更符合數(shù)據(jù)的分布特性;③在深度回歸森林中,特征提取、數(shù)據(jù)劃分和回歸器的學習同時優(yōu)化,使得整個端到端的模型能達到一個全局最優(yōu)。深度回歸森林在FG-NET數(shù)據(jù)集上MAE達到3.85歲,在Morph數(shù)據(jù)集上MAE達到2.91歲,是當前最好的年齡估計結果。
圖6 深度回歸森林示意圖[1]
本文從基于傳統(tǒng)人工智能技術的方法與基于深度學習的方法兩個方面對人臉年齡估計進行了介紹,并著重對第二種方法中的深度回歸森林進行了闡述。從基于傳統(tǒng)人工智能的方法中對各種特征提取的探究到基于深度學習的方法中對網絡結構的設計,人臉年齡估計的性能已經越來越好,但是目前較好的算法平均絕對誤差依然還有3歲左右。需要注意的是,當前的人臉年齡估計的研究普遍采用經過對齊的人臉,而在實際應用中往往需要在不受約束的環(huán)境下解決年齡估計問題。在這種情況下,背景復雜,人臉的姿勢也無法保證是正面,人臉很難對齊。 因此,從人臉圖像中精確可靠地估計年齡仍然是一個任重而道遠的任務,尤其在實際應用中存在著更多需要克服的難點與挑戰(zhàn)。
(2018年3月20日收稿)