文紫鑫,李少英,王斌成,劉 博
(1.河北農(nóng)業(yè)大學(xué)信息科學(xué)與技術(shù)學(xué)院,河北 保定 071001; 2.河北省農(nóng)業(yè)大數(shù)據(jù)重點實驗室,河北 保定 071001)
深度學(xué)習(xí)技術(shù)的發(fā)展極大地提升了人臉識別模型的性能,但面對復(fù)雜的真實場景,大規(guī)模的標(biāo)注數(shù)據(jù)仍然是決定其性能上限的主要因素之一[1]。人臉聚類主要是對數(shù)據(jù)集中的人臉圖像進行分組,通過計算人臉圖像之間的相似性,將相似的人臉圖像分為一組。借助于人臉聚類算法提供的高質(zhì)量偽標(biāo)注信息,從而在有效降低標(biāo)注負擔(dān)的同時提升識別模型的性能。
人臉圖像由于受到姿態(tài)、遮擋、光照、年齡及表情等因素的影響,導(dǎo)致其特征分布復(fù)雜,傳統(tǒng)的聚類算法,如K均值聚類算法[2]、DBSCAN[3]、譜聚類[4]等,依賴對數(shù)據(jù)簡單分布的假設(shè),或者具有較高的計算復(fù)雜度,使其很難適用于大規(guī)模的人臉聚類任務(wù)。
基于層次聚類的算法,如近似感知層次聚類[5](PAHC)、基于支持向量數(shù)據(jù)域描述(SVDD)設(shè)計的深度密度聚類[6](DDC)、基于Rank-Order距離的聚類[7]等,弱化了對人臉分布的先驗假設(shè),但仍然面臨著可遷移性不足的問題。
基于連接預(yù)測[8]的聚類算法,如近似等級排序聚類算法(ARO)[9]、共識驅(qū)動傳播算法(CDP)[10]、基于以圖卷積網(wǎng)絡(luò)為代表的聚類算法(L-GCN)[11]等,將聚類問題轉(zhuǎn)化成連接預(yù)測問題,極大地緩解了上述傳統(tǒng)聚類算法和層次聚類算法對數(shù)據(jù)分布和計算資源的限制,成為大規(guī)模人臉聚類的一種有效框架。其中,基于GCN的人臉聚類算法,仍然存在隨著模型深度增加導(dǎo)致的特征表示過平滑問題[12-13],從而限制了其從近鄰中提取高階信息的能力。
本文提出一種基于近鄰關(guān)系聚合的(Nearest Neighborhood Aggregation Clustering, NNAC)人臉聚類模型(整體結(jié)構(gòu)如圖1所示)。該模型由近鄰聚合模塊、基于殘差結(jié)構(gòu)的全連接特征提取模塊(Residual Fully-Connected Feature Extraction Block, ResFCB)、連接預(yù)測模塊3個部分組成。最后通過啟發(fā)式地合并模型輸出成對關(guān)系,從而推理出各個樣點的簇間歸屬。
圖1 基于近鄰關(guān)系聚合的人臉聚類模型結(jié)構(gòu)圖
本文主要貢獻分為以下2個方面:
1)提出一種融合局部近鄰信息的人臉聚類框架,相比GCN同時建模圖中的各個樣本點間的多元關(guān)系,該框架有選擇地建模樣本點間成對的二元關(guān)系,從而在減少計算量的同時實現(xiàn)了更深的網(wǎng)絡(luò)結(jié)構(gòu),避免了使用GCN學(xué)習(xí)聚類表示時的過平滑問題。
2)通過實驗對比,該模型下的MS-Celeb-1M人臉數(shù)據(jù)集,相比基準(zhǔn)方法,在提升聚類準(zhǔn)確率的同時降低計算時間,取得了更加有利于人臉識別模型的結(jié)果。
傳統(tǒng)的聚類算法依賴于對輸入特征做出簡單的假設(shè),如K均值聚類算法[2]假設(shè)每個簇的分布是凸的;DBSCAN[3]要求不同簇的密度具有一致性;譜聚類[4]傾向于產(chǎn)生相對平衡的樣本分組。然而,真實人臉圖像不僅數(shù)據(jù)量大而且分布不平衡,特別是受到遮擋、表情、光照等條件的影響導(dǎo)致數(shù)據(jù)內(nèi)在結(jié)構(gòu)復(fù)雜,傳統(tǒng)聚類方法往往無法直接應(yīng)用到該類數(shù)據(jù)上。
隨著深度學(xué)習(xí)的發(fā)展,基于層次聚類(Agglomerative Hierarchical Clustering, AHC)的算法[5-7]應(yīng)用于人臉聚類任務(wù),其弱化了傳統(tǒng)聚類算法對數(shù)據(jù)分布假設(shè)的限制。Lin等人[5]提出了近似感知層次聚類(Proximity-Aware Hierarchical Clustering, PAHC)算法,是一種應(yīng)用線性支持向量機對局部正樣本和負樣本進行分類的層次聚類方法,該方法可有效提升對噪聲數(shù)據(jù)的魯棒性。Lin等人[6]還提出了基于支持向量數(shù)據(jù)域描述(Support Vector Domain Description, SVDD)的深度密度聚類(Deep Density Clustering, DDC)算法,其通過度量特征空間中局部鄰居的密度以提升聚類算法對不平衡數(shù)據(jù)的適應(yīng)性。Zhu等人[7]提出了一種Rank-Order距離的聚類級親和度度量方法來替代之前的距離,此方法能夠有效抑制噪聲對聚類的影響。雖然在無約束的人臉聚類中上述算法表現(xiàn)較好,但因其計算復(fù)雜度較高,限制了其在大規(guī)模聚類任務(wù)中的應(yīng)用。
基于連接預(yù)測[8]的聚類算法為大規(guī)模人臉聚類提供了一種新思路。Otto等人[9]提出的近似等級排序聚類算法(Approximate Rank-Order Clustering, ARO),解決了人臉聚類中對數(shù)據(jù)規(guī)模的限制,其核心是計算一個節(jié)點與其K個最近鄰的距離,并預(yù)測節(jié)點與K個最近鄰是否連接。Zhan等人[10]提出的共識驅(qū)動傳播算法(Consensus-Driven Propagation, CDP)通過委員會(committee)模塊和調(diào)解員(mediator)判別模型選出圖像的“候選對”,并輸出每對圖像具有相同身份的概率。近來,基于圖卷積網(wǎng)絡(luò)(GCN)的模型被大量應(yīng)用于人臉聚類問題[11,14]。Wang等人[11]提出了一種利用圖卷積網(wǎng)絡(luò)判斷圖中節(jié)點對之間連通性的方法,取得了較好的聚類結(jié)果。王文博等人[14]提出了一種基于GCN的完全圖人臉聚類算法,該算法有效地減少冗余數(shù)據(jù),提升了聚類效果。然而,由于此類算法使用的多是淺層圖卷積網(wǎng)絡(luò)結(jié)構(gòu),其對高階鄰居的信息提取能力受到限制。但堆疊更多的層數(shù)時往往會由于過平滑問題降低GCN的性能。對于過平滑問題,Li等人[15]解釋道GCN的每一層為一種特別的拉普拉斯平滑變換,目的是讓節(jié)點與其近鄰節(jié)點盡可能相似,每個節(jié)點的特征更新就是其近鄰接點特征的加權(quán)均值,進行多次圖卷積會導(dǎo)致圖中的節(jié)點趨于相同的值,使得圖中不同類別的節(jié)點無法區(qū)分。
所以本文提出一種基于近鄰關(guān)系聚合的人臉聚類模型(NNAC),該方法可以通過堆疊多個改進的基于殘差-全連接模塊(ResFCB),提取多個尺度下的近鄰信息,并且緩解GCN中過高的計算及開銷問題。
近來,基于多層感知機(Multi-Layer Perception, MLP)的網(wǎng)絡(luò)結(jié)構(gòu)在各類任務(wù)中表現(xiàn)優(yōu)異。Tolstikhin等人[16]提出了MLP-Mixer,它是一種基于多層感知機的簡單網(wǎng)絡(luò)結(jié)構(gòu),在圖像分類工作中取得CNN、Transformer等模型相當(dāng)?shù)臏?zhǔn)確率。Ding等人[17]提出了一種高效的RepMLP網(wǎng)絡(luò),利用全連接層出色的全局表達能力、位置感知能力以及局部結(jié)構(gòu)提取能力相結(jié)合,在ImageNet數(shù)據(jù)集取得78.17%的準(zhǔn)確率,同時在人臉識別及語義分割等任務(wù)中準(zhǔn)確率均有提升。Touvron等人[18]提出了ResMLP,它是一種完全基于多層感知機的圖像分類網(wǎng)絡(luò)結(jié)構(gòu),該模型借鑒了知識蒸餾技術(shù)[19],在ImageNet數(shù)據(jù)集取得的準(zhǔn)確率,在機器翻譯任務(wù)中也表現(xiàn)良好。
受到以上工作的啟發(fā),本文提出一種基于近鄰關(guān)系聚合的人臉聚類模型,此模型的核心部分是基于殘差結(jié)構(gòu)的全連接特征提取模塊(ResFCB),其通過級聯(lián)多個該簡單模塊以提取人臉數(shù)據(jù)中不同尺度下的局部結(jié)構(gòu)關(guān)系,緩解GCN由于過平滑問題無法加深網(wǎng)絡(luò)的限制。
本文解決的任務(wù)為人臉聚類任務(wù),現(xiàn)有的聚類任務(wù)大多預(yù)測點對之間的連通性,即認為具有相同標(biāo)簽的點對之間應(yīng)該相連,不同標(biāo)簽的點對不應(yīng)相連。因此本文提出一種基于近鄰關(guān)系聚合的人臉聚類模型,通過預(yù)測每個樣本和其鄰居樣本是否相連得到多個人臉簇,并對簇中樣本標(biāo)記相同偽標(biāo)簽以解決人臉聚類問題。
本文提出的基于近鄰關(guān)系聚合(NNAC)的人臉聚類模型整體框架如圖1所示。整個網(wǎng)絡(luò)以使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)提取的特征集合作為輸入,分成3個部分。第一部分,對人臉特征集合X中每個樣例計算其K近鄰,目的是根據(jù)K近鄰融合鄰居信息的特征,用于送入后續(xù)的連接預(yù)測模塊。第二部分,為一個改進的基于殘差結(jié)構(gòu)的全連接特征提取模塊(ResFCB),用來提取近鄰關(guān)系的深層表示。第三部分,對上一步預(yù)測的連接結(jié)果進行合并,并對合并后的簇通過偽標(biāo)簽傳播策略輸出最終的聚類指派。
(1)
(2)
(3)
(4)
其表示每個子特征矩陣中心樣本和其k1個直接鄰居屬于相同標(biāo)簽(label)的概率。為了優(yōu)化網(wǎng)絡(luò),在訓(xùn)練階段,本文將計算得到的概率與真實結(jié)果送入交叉熵損失函數(shù)(Cross Entropy Loss)得到損失,再進行反向傳播更新網(wǎng)絡(luò)參數(shù),交叉熵損失函數(shù)如公式(5):
(5)
其中,j∈{1,2,…,k1}表示k1個直接鄰居的預(yù)測結(jié)果,p(j)∈[0,1]是網(wǎng)絡(luò)預(yù)測第j個直接鄰居和中心樣本連接的概率,q(j)為真實情況是否連接,若為1則連接,0則不連接。通過最小化交叉熵損失函數(shù)訓(xùn)練網(wǎng)絡(luò),進而引導(dǎo)網(wǎng)絡(luò)預(yù)測中心樣本和其k1個直接鄰居是否相連。
連接合并部分主要根據(jù)網(wǎng)絡(luò)獲得的中間結(jié)果,進行合并并且標(biāo)記偽標(biāo)簽,以達到聚類的目的。
衡量人臉聚類算法的性能主要有3個評價指標(biāo),歸一化互信息(Normalized Mutual Information, NMI)[22]和Bcubed F-score[23]、Pairwise F-score[24]。
3.1.1 歸一化互信息
歸一化互信息主要用來度量聚類結(jié)果與真實標(biāo)簽的相似程度,歸一化互信息的計算方法如公式(6)所示:
(6)
其中,Ω是聚類樣本的真實類標(biāo),C是聚類樣本的預(yù)測類標(biāo),H(Ω)、H(C)是信息熵,I(Ω;C)=H(Ω)-H(Ω|C)是互信息,互信息的最小值為0,當(dāng)聚類算法的結(jié)果與真實標(biāo)簽完全獨立時,互信息為0;如果聚類算法的結(jié)果完全重現(xiàn)了真實類標(biāo),則互信息為1。
3.1.2 Bcubed F-score、Pairwise F-score
Bcubed F-score主要從樣本角度進行衡量; Pairwise F-score主要從樣本對角度進行衡量,更強調(diào)大規(guī)模聚類,因為樣本對的數(shù)量隨著聚類的大小呈二次方增長。上述2個聚類評價指標(biāo)[25]計算方式均為精確率(precision)和召回率(recall)的諧波平均值,但2種指標(biāo)的精確率和召回率定義不同。
在Bcubed F-score中,精確率的定義為同一簇中都是同一個人臉圖像的比例,召回率的定義為同一人的所有圖像都聚在一個簇中的比例。用L(i)表示人臉圖像i所屬類別,用C(i)表示人臉圖像i所屬簇,定義人臉圖像i和人臉圖像j間正確性如公式(7)所示:
(7)
精度率定義如公式(8)所示:
(8)
其中,|C(i)|表示數(shù)據(jù)集C(i)的大小。
召回率定義如公式(9)所示:
(9)
其中,|L(i)|表示數(shù)據(jù)集L(i)的大小。
在Pairwise F-score中,精確率的定義是在屬于同一類的配對總數(shù)中,被正確聚類到一起的配對數(shù)的比例。召回率的定義是在屬于同一簇的配對總數(shù)中,被正確聚類到一起的配對數(shù)的比例。因此,定義TP(True Positive)是代表數(shù)據(jù)預(yù)測為同一類且被分到同一個人臉簇、FP(False Positive)是代表數(shù)據(jù)預(yù)測為不同類且被分到不同人臉簇、FN(False Negative)是代表數(shù)據(jù)預(yù)測為同一類且被分到不同人臉簇。則成對精確率和成對召回率計算分別如公式(10)、公式(11)所示:
(10)
(11)
F-score定義如公式(12)所示:
(12)
本文的實驗采用MS-Celeb-1M數(shù)據(jù)集[26]。
MS-Celeb-1M人臉識別數(shù)據(jù)集由1000萬張人臉照片,10萬個身份組成。由于從互聯(lián)網(wǎng)上自動獲取的原始身份標(biāo)注信息噪聲較大,因此本文使用Arc-Face[27]論文中提出的清洗后的數(shù)據(jù)集,清洗后的數(shù)據(jù)集包含86000個身份,共580萬張人臉圖像,將其均勻隨機分成10個部分,每部分包含8600個身份,約58萬張人臉圖像。如表1所示,實驗中選擇子集序號為0的數(shù)據(jù)集對模型進行訓(xùn)練,其余部分用作測試。將清洗過后的數(shù)據(jù)通過ResNet50+Arcface進行特征提取,得到網(wǎng)絡(luò)的輸入特征,該模型在MS-Celeb-1M數(shù)據(jù)集和VGGFace2數(shù)據(jù)集上聯(lián)合訓(xùn)練。
表1 MS-Celeb-1M子集劃分
3.3.1 實驗環(huán)境
實驗環(huán)境是Ubuntu 18.04 64位操作系統(tǒng),處理器為Intel i7-9800x@16x 4.4 GHz,顯卡為24 GB顯存的NVIDIA GeForce RTX 3090,顯卡驅(qū)動版本為455.45.01,CUDA版本為11.1,采用深度學(xué)習(xí)框架Pytorch1.7.0。
3.3.2 實驗設(shè)置
訓(xùn)練過程中Batchsize設(shè)置為32,epoch次數(shù)為4。采用隨機梯度下降(Stochastic Gradient Descent,SGD)算法優(yōu)化,動量(momentum)為0.9,權(quán)重衰減參數(shù)為1×10-4,采用學(xué)習(xí)率衰減策略,設(shè)置初始學(xué)習(xí)率(learning rate, lr)為0.01,每個epoch學(xué)習(xí)率衰減為原來的0.1倍。
3.3.3 方法比較與實驗結(jié)果
本文提出的基于近鄰關(guān)系聚合的人臉聚類算法與下述6種聚類算法進行對比,簡要介紹如下:
1)K均值聚類算法[28](K-means):是一種常用的聚類算法,聚類效果依賴于初始類別中心K的選擇,但需要預(yù)先設(shè)定聚類中心數(shù)量。
2)DBSCAN[3](Density-Based Spatial Clustering of Applications with Noise):基于密度的聚類算法,將高密度的區(qū)域劃分為簇,并將低密度點看做噪聲。
3)層次聚類算法[29](Agglomerative Hierarchical Clustering, AHC):是層次聚類算法中的一種,以自下而上的方式計算點對之間相似度,根據(jù)閾值進行聚類合并。
4)近似排序聚類[9](Approximate Rank-Order Clustering, ARO):用近似的最近鄰搜索方式和可修正的距離度量進行聚類。
5)基于共識驅(qū)動傳播的聚類算法[10](Consensus-Driven Propagation, CDP):基于圖的連接預(yù)測算法,通過不同預(yù)測方式獲取更具魯棒性的成對關(guān)系。
6)基于圖卷積網(wǎng)絡(luò)的人臉聚類算法[11](Linkage Based Face Clustering via Graph Convolution Network, L-GCN):將每張人臉圖像看作圖結(jié)構(gòu)中一個點,并通過圖卷積網(wǎng)絡(luò)(GCN)使每個點與鄰居進行信息交互,充分學(xué)習(xí)局部信息,進行成對預(yù)測,最后根據(jù)輸出的成對預(yù)測信息進行聚類。
實驗結(jié)果如表2所示,結(jié)果表明:K-means的聚類性能受簇的數(shù)量C影響,需要在一定范圍內(nèi)找到使F-score最高的C值,算法泛化性不強,不適用于大規(guī)模聚類任務(wù);DBSCAN假設(shè)不同簇之間的密度是相似的,但其無法有效處理不同簇間密度差異過大的問題,所以聚類效果不理想;AHC同樣對參數(shù)較為敏感,在人臉聚類任務(wù)上效果較差;ARO的性能過于依賴鄰居數(shù)量的選擇,因此在MS-Celeb-1M數(shù)據(jù)集的效果較差;CDP利用未標(biāo)記數(shù)據(jù)進行人臉識別,平衡Recall和Precision以得到較高的F-score,為了公平起見,本文將CDP與單個模型版本進行比較;L-GCN通過4層圖卷積網(wǎng)絡(luò)對鄰接矩陣計算獲取局部圖中的節(jié)點信息進行聚類,聚類性能明顯優(yōu)于其他聚類算法。本文提出的基于近鄰關(guān)系聚合的人臉聚類模型應(yīng)用堆疊的ResFCB對人臉樣本及其鄰居特征進行學(xué)習(xí),使提取出的人臉特征類內(nèi)樣本更相似,取得了優(yōu)于L-GCN的聚類結(jié)果,從而驗證了本文模型的有效性。
表2 MS-Celeb-1M數(shù)據(jù)集人臉聚類實驗結(jié)果對比
從表3的時間對比上看NNAC模型訓(xùn)練時間小于L-GCN和部分傳統(tǒng)聚類模型。L-GCN網(wǎng)絡(luò)需要構(gòu)建鄰接矩陣和特征矩陣,而根據(jù)KNN構(gòu)建鄰接矩陣的時間復(fù)雜度為O(n2),需要消耗大量時間。本模型直接根據(jù)KNN對特征集合進行索引直接獲取鄰居特征,因此節(jié)省大量時間。
表3 時間對比
3.4.1 敏感性分析及參數(shù)選擇
輸入特征矩陣的構(gòu)建需要確定直接鄰居、間接鄰居的數(shù)量k1、k2。在訓(xùn)練階段,對于直接鄰居k1的選擇,為了保證更多信息被反向傳播且正樣本與負樣本盡可能平衡,因此本實驗設(shè)置較大的鄰居數(shù)量k1=200;對于間接鄰居k2,本文設(shè)置k2=10,因為間接鄰居一般與中心樣本相似度比較小,屬于相同標(biāo)簽的可能性較低,同樣為了保證正負樣本均衡,因此選擇比較小的值;同時本文設(shè)置聚合的鄰居個數(shù)K為10。本文模型在測試階段選擇k1=160、k2=6、K=10。為了研究k1和k2對實驗性能的影響,本文進行2組實驗,結(jié)果如圖2、圖3所示。
圖2 k1、k2的值對Bcubed F-score的影響
圖3 k1、k2的值對Pairwise F-score的影響
實驗保持K=10不變,改變k1和k2,觀察圖2、圖3發(fā)現(xiàn),隨著k1和k2的增大,Bcubed F-score和Pairwise F-score也會增加。k1越大,預(yù)測的候選連接越多,召回率越高;k2越大,涉及的間接鄰居數(shù)量越多,輸入特征的描述更精確,預(yù)測更加準(zhǔn)確。然而當(dāng)k1和k2達到某個較大值時,性能達到飽和,繼續(xù)增加其結(jié)果基本不變,并且發(fā)現(xiàn)k2選擇4~12之間,k1選擇160~200之間整體結(jié)果變化并不大,因此表明本文對于關(guān)鍵參數(shù)具有良好的適應(yīng)性。
3.4.2 聚合方式對比
表4 聚合方式
sum聚合能保存每個鄰居樣本的特征,但得到的特征值一般較大,使網(wǎng)絡(luò)不容易學(xué)習(xí),且特征較大易引發(fā)梯度爆炸問題;max聚合方式雖然解決了特征值較大的問題,但容易受到鄰居中離群樣本或特殊樣本的影響,比如模糊圖像、側(cè)面圖像等。這些特殊樣本的特征與其他鄰居特征差別比較大,使max聚合方式產(chǎn)生誤差;mean聚合方式很好地解決了聚合后特征較大的問題,并且這種聚合方式受到特殊樣本的影響也較小,通過分析與對比實驗本文最后選擇使用mean聚合方式。
3.4.3 ResFCB數(shù)量選擇
本節(jié)對ResFCB中的模塊數(shù)量進行對比實驗,模塊數(shù)量對2種聚類指標(biāo)的影響如圖4、圖5所示。從圖中可以看出隨著模塊數(shù)量的增加,2種指標(biāo)的數(shù)值也在快速上升,值在Block=6時得到最大值,而Bcubed F-score值在Block=2、4、6時總體變化并不大。當(dāng)Block塊數(shù)大于6時,2種指標(biāo)都產(chǎn)生明顯下降,表明模型已經(jīng)過擬合。雖然本文已在ResFCB中加入殘差與層歸一化,但由于MLP的擬合能力過強,無法完全解決過擬合問題,因此本文把ResFCB的數(shù)量設(shè)置為6。
圖4 模塊數(shù)量對Bcubed F-score的影響
圖5 模塊數(shù)量對Pairwise F-score的影響
3.4.4 MLP與ResFCB對比
本節(jié)對MLP與ResFCB進行對比實驗,MLP由2層FC和一個Prelu激活函數(shù)構(gòu)成。從表5中發(fā)現(xiàn),MLP與ResFCB實驗結(jié)果具有較大差距,表明ResFCB更適合人臉聚類任務(wù)。由于MLP模型在堆疊多層時會出現(xiàn)過擬合現(xiàn)象,降低模型性能。本文提出的ResFCB中,通過加入層歸一化LN對特征進行歸一化處理,使模型更容易收斂;加入殘差[30]緩解深度神經(jīng)網(wǎng)絡(luò)中由于深度增加帶來的過擬合問題,因此本文提出的ResFCB更適合人臉聚類任務(wù)。
表5 MLP與ResFCB對比
本文提出了一種基于近鄰關(guān)系聚合(NNAC)的人臉聚類算法,通過堆疊基于殘差結(jié)構(gòu)的全連接特征提取模塊(ResFCB)對人臉數(shù)據(jù)的局部結(jié)構(gòu)進行學(xué)習(xí),從而獲得高判別性的人臉聚類特征表示。此方法緩解圖卷積網(wǎng)絡(luò)在特征學(xué)習(xí)時因網(wǎng)絡(luò)加深導(dǎo)致的過平滑問題,且實驗結(jié)果表明本網(wǎng)絡(luò)能有效提高聚類性能。此外,本模型主要解決人臉聚類中的關(guān)系學(xué)習(xí)問題,與其他對比的方法類似,仍然包括了關(guān)系合并與推理的后處理模塊,如何進一步簡化后處理操作,提升該部分的學(xué)習(xí)性,從而構(gòu)建更統(tǒng)一的人臉聚類學(xué)習(xí)框架成為后續(xù)研究的重點。