王曉峰,于 卓,趙 健,曹澤軒
(1.北方民族大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,銀川 750021;2.北方民族大學(xué) 圖像圖形智能處理國(guó)家民委重點(diǎn)實(shí)驗(yàn)室,銀川 750021;3.西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,西安 710127)
最大團(tuán)問(wèn)題(Maximum Clique Problem,MCP)是圖論中的一個(gè)經(jīng)典問(wèn)題,同時(shí)也是一類非確定性多項(xiàng)式(Non-deterministic Polynomial,NP)難問(wèn)題,被廣泛應(yīng)用在故障診斷[1]、生物信息學(xué)[2]、計(jì)算機(jī)視覺(jué)[3]、社會(huì)網(wǎng)絡(luò)分析[4]等領(lǐng)域。在社交網(wǎng)絡(luò)問(wèn)題中,團(tuán)代表了緊密聯(lián)系的團(tuán)體,研究最大團(tuán)及其松弛模型(Clique Relaxation,CR)能夠?qū)ι鐣?huì)網(wǎng)絡(luò)映射關(guān)系做出理論性分析[4]。在生物信息領(lǐng)域,比較蛋白質(zhì)之間的結(jié)構(gòu)相似度是生物領(lǐng)域的重要任務(wù),由于蛋白質(zhì)之間的結(jié)構(gòu)相似可以通過(guò)氨基酸序列轉(zhuǎn)化而來(lái)的匹配圖近似模擬,因此在對(duì)比蛋白質(zhì)結(jié)構(gòu)問(wèn)題中可以將其轉(zhuǎn)化為最大團(tuán)問(wèn)題,并推測(cè)未知蛋白質(zhì)功能[2]。所以,最大團(tuán)問(wèn)題具有較高的理論價(jià)值和現(xiàn)實(shí)意義。但隨著最大團(tuán)在真實(shí)世界的應(yīng)用發(fā)展,部分領(lǐng)域在求解最大團(tuán)問(wèn)題時(shí)出現(xiàn)求解效率差、得不到最優(yōu)解的情況。研究發(fā)現(xiàn),與傳統(tǒng)最大團(tuán)研究測(cè)試用圖例不同,真實(shí)世界所映射出的圖模型通常為大規(guī)模無(wú)向圖,這類圖通常密度低,頂點(diǎn)數(shù)量巨大,并具有小世界屬性[5]、冪律分布[6]、聚類[7]等共同的統(tǒng)計(jì)特征。因此,在此類大規(guī)模圖模型中研究最大團(tuán)具有重要意義。
為解決大規(guī)模最大團(tuán)問(wèn)題,研究人員利用大數(shù)據(jù)技術(shù),使用MapReduce[8]、Pregel[9]等面向海量數(shù)據(jù)和密集型計(jì)算的并行處理框架求解大規(guī)模最大團(tuán)問(wèn)題。這些框架具有較好的容錯(cuò)性和可擴(kuò)展性,且提供了簡(jiǎn)單的處理方法和功能強(qiáng)大的編程模型。
本文對(duì)大規(guī)模最大團(tuán)問(wèn)題研究算法進(jìn)行分析,通過(guò)算法分類的方法總結(jié)各種算法的優(yōu)點(diǎn)與不足,對(duì)主要算法進(jìn)行對(duì)比分析,并提供未來(lái)解決方案與研究方向。
給定圖G=(V,E),V表示頂點(diǎn)集,E表示邊集。C是V的子集(C?V),如果C中任意的2 個(gè)頂點(diǎn)vi,vj∈C,均有(vi,vj)∈E,則稱C為G的一個(gè)團(tuán)。團(tuán)C的大小指C包含的頂點(diǎn)個(gè)數(shù)|C|。由C構(gòu)成的子圖G[C]是G的完全子圖。最大團(tuán)問(wèn)題是指在G中尋找包含頂點(diǎn)個(gè)數(shù)最多的一個(gè)團(tuán)。
最大團(tuán)問(wèn)題也被稱為最大獨(dú)立集問(wèn)題,獨(dú)立集是指在圖G中兩兩頂點(diǎn)之間沒(méi)有邊相連。頂點(diǎn)數(shù)最多的集合即為最大頂點(diǎn)獨(dú)立集。當(dāng)圖G轉(zhuǎn)化為,即轉(zhuǎn)化為G的補(bǔ)圖時(shí),圖G的最大團(tuán)問(wèn)題即為的最大頂點(diǎn)獨(dú)立集問(wèn)題。
最大團(tuán)問(wèn)題作為一個(gè)組合優(yōu)化問(wèn)題,可以進(jìn)行等價(jià)描述,整型規(guī)劃問(wèn)題的描述如下:
設(shè)t:(0,1)n→2v,?x∈{0,1}n,?S∈2v,則x=t-1(S)={xi:1=1,2,…,n},其中,n為圖的頂點(diǎn)數(shù)。minf(x)=,s.t:xi+xj≤1,?(i,j)∈,x∈{0,1}n。如果x*是最優(yōu)解,那么集合C=t(x*)是圖G的最大團(tuán),且|C|=-f(x*)。由于xi xj∈{0,1},因此xi+xj≤1,?(i,j)∈,其中為圖G邊的補(bǔ)集。圖1 所示是一個(gè)由6 個(gè)頂點(diǎn)構(gòu)成最大團(tuán)為3 的圖。
圖1 最大團(tuán)為3 的無(wú)向圖Fig.1 Undirected graph with maximum clique 3
求解最大團(tuán)問(wèn)題的常規(guī)算法大致分為3 類:精確算法,啟發(fā)式算法和分布式算法。
1)精確算法主要有枚舉法[10]、回溯法[11]、分支限界法[12]等。這類算法能求得精確解,但時(shí)間復(fù)雜度相對(duì)較大[13]。例 如HOSSEINIAN 等[13]提出利用MCP 的整數(shù)(線性)規(guī)劃結(jié)合拉格朗日松弛技術(shù),導(dǎo)出最大團(tuán)的界,結(jié)合分支限界法得到一種新的精確算法。PLACHETTA 等[12]指出分支限界法可滿足求解器減少分支的需求,能夠通過(guò)最大團(tuán)與頂點(diǎn)覆蓋的映射方法進(jìn)行回溯求解。
2)啟發(fā)式算法主要為遺傳算法、蟻群算法、貪婪算法等。這類算法通過(guò)借鑒一些自然現(xiàn)象以及人類思維方式的指導(dǎo)來(lái)展開(kāi),對(duì)精確算法的時(shí)間復(fù)雜度進(jìn)行了改善,但存在容易陷入局部最優(yōu)及無(wú)法找到精確解[14]的缺點(diǎn)。例如BABKIN 等[14]將遺傳算法與禁忌搜索算法相結(jié)合來(lái)研究最大團(tuán)問(wèn)題,使種群多樣性增加,加快跳出局部最優(yōu)解并獲得全局最優(yōu)解。JI 等[15]提出一種基于多目標(biāo)蟻群算法和新的團(tuán)表示方案來(lái)檢測(cè)重疊社區(qū)。
3)分布式算法主要為最大積置信傳播算法和m-tree算法,此類算法通過(guò)將最大團(tuán)問(wèn)題的線性規(guī)劃方程,利用消息傳遞的分布式性質(zhì)進(jìn)行并行計(jì)算,從而縮短求解時(shí)間,提高算法效率。例如文獻(xiàn)[16]提出一種改進(jìn)的分布式最大權(quán)獨(dú)立集算法,使用最大積信念傳播算法框架,啟發(fā)式地提出了一種相鄰節(jié)點(diǎn)間交換信息的計(jì)算方法,使算法可以在環(huán)型無(wú)向圖內(nèi)進(jìn)行消息傳遞與消息計(jì)算,彌補(bǔ)了置信傳播算法求解此類問(wèn)題在環(huán)形圖中收斂困難的缺陷。表1結(jié)合求解最大團(tuán)問(wèn)題的研究[17-19]給出了基于常規(guī)算法的最大團(tuán)求解方法對(duì)比。
表1 基于常規(guī)算法的最大團(tuán)求解方法對(duì)比Table 1 Comparison of maximum clique solution methods based on conventional algorithms
傳統(tǒng)最大團(tuán)算法主要使用頂點(diǎn)數(shù)量在幾千以內(nèi)的隨機(jī)生成圖、人工構(gòu)造圖數(shù)據(jù)集以及以DIMACS 和BHOSLIB 為代表的中小規(guī)模標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集。而真實(shí)世界中大規(guī)模圖例無(wú)論在頂點(diǎn)規(guī)模還是在圖結(jié)構(gòu)特征上均存在明顯區(qū)別,因此傳統(tǒng)求解最大團(tuán)算法在大規(guī)模圖例中并不適用。例如CBB[20]算法、MaxCLQ[21]算法、MMCQ[22]算法、IncMaxCLQ[23]等算法對(duì)DIMACS數(shù)據(jù)集中的圖例有較好的效果,但難以處理數(shù)量達(dá)到百萬(wàn)級(jí)的真實(shí)世界大規(guī)模圖。針對(duì)大規(guī)模圖例的MCP求解問(wèn)題,由于數(shù)據(jù)量巨大且計(jì)算復(fù)雜,部分研究人員利用大數(shù)據(jù)計(jì)算平臺(tái)與計(jì)算框架對(duì)圖例進(jìn)行簡(jiǎn)化預(yù)處理和并行搜索處理以提高求解效率。在求解大規(guī)模圖例的MCP問(wèn)題中,主要使用的大數(shù)據(jù)技術(shù)為MapReduce編程框架[24]、Spark 分布式內(nèi)存計(jì)算框架以及Hadoop分布式云計(jì)算平臺(tái)[9]。圖2 給出了利用MapReduce 進(jìn)行并行計(jì)算的流程。
圖2 MapReduce 并行調(diào)度流程Fig.2 MapReduce parallel scheduling process
在大數(shù)據(jù)背景下,將大數(shù)據(jù)計(jì)算平臺(tái)與圖劃分方法相結(jié)合以求解大規(guī)模圖例的最大團(tuán)是一種有效的方法。所謂圖劃分方法就是通過(guò)將大規(guī)模圖例劃分為多個(gè)小規(guī)模的子圖圖例,使其他搜索算法可以精確快速求解的方法。圖劃分方法分為預(yù)處理階段和搜索階段2 個(gè)階段。如圖3 所示為一般圖劃分求解大規(guī)模圖例最大團(tuán)的方案。
圖3 一般圖劃分求解大規(guī)模圖例的方案Fig.3 Scheme for solving large-scale graph by dividing general graph
為解決傳統(tǒng)模式下求解大規(guī)模圖例最大團(tuán)過(guò)程中存在的存儲(chǔ)大規(guī)模圖例問(wèn)題與單機(jī)處理圖數(shù)據(jù)問(wèn)題,文獻(xiàn)[25]提出一種基于MapReduce 的計(jì)算方法,通過(guò)圖著色進(jìn)行子圖劃分,并使用分支定界法獨(dú)立計(jì)算不同分區(qū)的最大團(tuán)數(shù)并選出最優(yōu)解。圖劃分作為求解的關(guān)鍵一步,劃分后的子圖是否有利于求解直接影響搜索速率。針對(duì)子圖劃分的改進(jìn),文獻(xiàn)[26]提出一種新的多圖層劃分求解最大方法(Parallel Multilayer Graph Partitioning method for Solving Maximum Clique,PMGP_SMC)來(lái)提高求解效率,提出多圖層劃分(Multi-layer Graph Partitioning,MGP)算法,將MGP 算法與Spark 的GraphX 圖計(jì)算相結(jié)合,并基于大數(shù)據(jù)平臺(tái)的并行計(jì)算方法提出并行多圖層劃分(Parallel MGP,PMGP)方法。
文獻(xiàn)[27]針對(duì)大規(guī)模圖例求解效率提出一種基于并行約束規(guī)劃的最大團(tuán)識(shí)別研究算法BMT,使用多層劃分方法并加入任務(wù)時(shí)間預(yù)測(cè)函數(shù),提出基于任務(wù)時(shí)間預(yù)測(cè)模型的并行圖劃分方法,該預(yù)測(cè)模型f(|G|,ρ(G))與g(ρ(G))是頂點(diǎn)數(shù)目和圖密度的多項(xiàng)式函數(shù),g(ρ(G))是圖的密度二次函數(shù),定義為ρ(G)2+bρ(G)+c,同時(shí)對(duì)函數(shù)f(|G|,ρ(G))進(jìn)行泰勒展開(kāi),得到時(shí)間預(yù)測(cè)模型如式(1)所示:
其中:k用來(lái)控制模型自由度,即泰勒函數(shù)展開(kāi)級(jí)數(shù);ai,j、b和c為未知變量系數(shù),由實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證得出。
BMT 算法通過(guò)時(shí)間預(yù)測(cè)函數(shù)實(shí)現(xiàn)了2 個(gè)需求:
1)有效圖分割。將復(fù)雜圖分割為更易求解的若干更小且獨(dú)立子圖,使Spark 集群中計(jì)算節(jié)點(diǎn)可獨(dú)立計(jì)算,降低通信開(kāi)銷。
2)保證各點(diǎn)負(fù)載均衡。通過(guò)預(yù)測(cè)時(shí)間模型估算求解時(shí)間,決定圖分割的深度。將子圖分配給Spark集群計(jì)算節(jié)點(diǎn),每個(gè)計(jì)算節(jié)點(diǎn)采用約束規(guī)劃的方法對(duì)分割產(chǎn)生的子問(wèn)題分別進(jìn)行建模和求解,實(shí)現(xiàn)最大團(tuán)問(wèn)題的并行化處理,提高大規(guī)模圖例下的最大團(tuán)問(wèn)題求解速率。
對(duì)于子圖中的局部搜索問(wèn)題,文獻(xiàn)[28]提出Random_BLS 算法,通過(guò)聯(lián)合局部搜索和自適應(yīng)擾動(dòng)策略來(lái)探索解空間,但算法的搜索多樣性較差。文獻(xiàn)[29]提出PBLS 算法能夠解決搜索不全面問(wèn)題,提高算法搜索解的多樣性,PBLS 算法加入了懲罰因子,根據(jù)懲罰值與禁忌值對(duì)節(jié)點(diǎn)進(jìn)行選擇優(yōu)化搜索階段多樣性。由于迭代次數(shù)固定,小規(guī)模子圖和大規(guī)模子圖求解時(shí)間相同,導(dǎo)致總求解速度慢。文獻(xiàn)[27]對(duì)PBLS 算法進(jìn)行改進(jìn),提出可以根據(jù)子圖大小自動(dòng)設(shè)定迭代次數(shù)的SPBLS 算法,該算法使用迭代公式模型增加PBLS 的靈活性,提高了算法的執(zhí)行效率,使SPBLS 算法根據(jù)子圖規(guī)模自動(dòng)設(shè)置迭代次數(shù),從而降低總求解時(shí)間,提高求解效率。SPBLS 算法的迭代公式模型如式(2)所示:
其中:T表示最大迭代數(shù);N表示圖中節(jié)點(diǎn)的個(gè)數(shù);m是取值范圍為10~100 的常量;c是取值范圍為在0~1 的常量。當(dāng)所求節(jié)點(diǎn)個(gè)數(shù)越多時(shí),SPBLS 求解最大團(tuán)所需的次數(shù)越多,當(dāng)求得的迭代次數(shù)為小數(shù)時(shí),迭代次數(shù)向上取整。
上述措施主要針對(duì)圖劃分方法,對(duì)大規(guī)模圖例的預(yù)處理和搜索子圖進(jìn)行改進(jìn),有效增強(qiáng)劃分后子圖的可搜索性,提高求解速率,避免了在求解過(guò)程的復(fù)雜緩慢計(jì)算。從本質(zhì)上來(lái)說(shuō),對(duì)原始圖例進(jìn)行多次劃分、利用大數(shù)據(jù)并行計(jì)算平臺(tái)能顯著降低算法的搜索時(shí)間復(fù)雜度[30],但也帶來(lái)了計(jì)算平臺(tái)固有的缺陷,在使用大數(shù)據(jù)技術(shù)求解最大團(tuán)問(wèn)題時(shí),MapReduce 并不總對(duì)求解有正面影響。當(dāng)子圖數(shù)量大且重復(fù)數(shù)據(jù)多時(shí),需要多次的迭代進(jìn)行求解,但MapReduce 的多次調(diào)用需要消耗巨大的內(nèi)存空間,因此不利于提高求解速率。為此,算法在改進(jìn)時(shí)還應(yīng)該考慮多層劃分時(shí)多次迭代所使用的內(nèi)存空間。當(dāng)前有效的解決方法是使用Spark 的GraphX 這一類即使進(jìn)行多次迭代,但耗費(fèi)內(nèi)存較小的并行計(jì)算平臺(tái)進(jìn)行多層劃分[27],這類并行計(jì)算平臺(tái)可以有效減少迭代次數(shù),雖然增加了計(jì)算次數(shù)但相較于使用MapReduce進(jìn)行多次迭代,求解速率更快。表2所示為圖劃分方法的對(duì)比分析結(jié)果。
表2 不同圖劃分方法的對(duì)比分析結(jié)果Table 2 Comparative analysis results of different graph division methods
3.1.1 PMGP_SMC 算法結(jié)果分析
由表3 可知,PSGP_SMC 算法與PMGP_SMC 算法在求解精度上均能滿足枚舉算法PMGP_MCE 所求得的精確解。
表3 不同算法求解大規(guī)模圖例最大團(tuán)的結(jié)果對(duì)比Table 3 Comparison of the results of solving the largest clique of large-scale graph with different algorithms
由圖4可知,PMGP_SMC 算法在總運(yùn)行時(shí)間上有明顯優(yōu)勢(shì),特別是在email-Enron中表現(xiàn)最為明顯。結(jié)合總運(yùn)行時(shí)間對(duì)比發(fā)現(xiàn),在求解精度相同的條件下,圖劃分時(shí)間較長(zhǎng)的PMGP_SMC算法的子圖搜索時(shí)間遠(yuǎn)優(yōu)于PSGP_SMC 算法。這是由于多層圖劃分雖然耗費(fèi)較多時(shí)間,但是所搜索到的子圖更適合子圖搜索,能夠使子圖快速求解。此外,自適應(yīng)迭代函數(shù)針對(duì)使用圖劃分方法后產(chǎn)生較多子圖的大規(guī)模圖例有更高的求解速率。針對(duì)結(jié)合圖劃分方法,本文主要改進(jìn)方向?yàn)槿绾问箞D劃分后的子圖得到更優(yōu)解,以及如何在多個(gè)子圖中快速求解。對(duì)于子圖較多、求解較復(fù)雜的情況可以同時(shí)將2 種計(jì)算方式布置在大數(shù)據(jù)并行計(jì)算平臺(tái)中,從而提高求解速度。
圖4 不同算法的實(shí)驗(yàn)結(jié)果對(duì)比Fig.4 Comparison of experimental results of different algorithms
3.1.2 BMT 算法結(jié)果分析
與BMC 算法相比,BMT 算法使用了多層圖劃分方法且啟發(fā)式地提出了時(shí)間預(yù)測(cè)函數(shù)。由圖5(a)、圖5(b)可知,BMT 算法在相同圖分割次數(shù)下得到的子圖數(shù)量較少,但是平均子圖頂點(diǎn)數(shù)目小于BMC 算法,說(shuō)明BMT 算法在相同分割條件下對(duì)圖中求解最大團(tuán)所連接的無(wú)效邊有更好的刪除效果。圖5(c)、圖5(d)展示了BMT 算法分別使用了1、3、6 這3 種數(shù)量的處理器(4 核16 GB 內(nèi)存,1 個(gè)主節(jié)點(diǎn),6 個(gè)從節(jié)點(diǎn))進(jìn)行處理圖劃分,可以看出對(duì)大規(guī)模圖例并行處理能夠大幅縮短運(yùn)行時(shí)間,而對(duì)小規(guī)模圖例并不適合使用并行處理,因?yàn)樘幚砥鞯脑龆酂o(wú)法帶來(lái)求解速率的提升,且在高密度圖中最少需要3層劃分才能優(yōu)于BMC 算法。BMT算法對(duì)處理器有較高的要求,并且此次算法實(shí)驗(yàn)所使用的圖例密度均為0.9的高密度圖,且頂點(diǎn)數(shù)范圍為125~1 500,泛化性較弱。
圖5 2 種算法的實(shí)驗(yàn)結(jié)果對(duì)比Fig 5 Comparison of experimental results of two algorithm
k-core 的概念由WATTS 提出,并且指出k-core 可用來(lái)幫助識(shí)別網(wǎng)絡(luò)中緊密相連的組,以及可以表示結(jié)構(gòu)性質(zhì)和層次性質(zhì)[32]。k-core 算法通過(guò)逐漸遞增k值來(lái)挖掘圖中的最大團(tuán),同時(shí)也可以作為一種社會(huì)網(wǎng)絡(luò)分析作用于中心性分析和社區(qū)檢測(cè)。文獻(xiàn)[33]根據(jù)網(wǎng)絡(luò)分析問(wèn)題提出一種共享內(nèi)存算法,該算法用于多核平臺(tái)的k-core 分解,在求解大規(guī)模最大團(tuán)問(wèn)題上對(duì)圖例類型有較好的泛化性。支限界法作為求解最大團(tuán)問(wèn)題最主流的算法,使用k-core 縮小最大團(tuán)上界并對(duì)候選集進(jìn)行剪枝來(lái)提高求解速率。在分支限界法中,文獻(xiàn)[34]提出一種針對(duì)大型稀疏圖的快速并行最大團(tuán)(Parallel Maximum Clique,PMC)算法。PMC算法在查詢前利用啟發(fā)式算法獲得初始團(tuán),然后采用分支定界的方法,使用圖著色方法與k-core 結(jié)構(gòu)估計(jì)最大團(tuán)的上界,并搜索樹(shù)剪枝。在并行搜索的過(guò)程中,根據(jù)搜索到的結(jié)果對(duì)最大團(tuán)的上界和下界進(jìn)行更新,使PMC 算法在求解時(shí)可以縮小求解空間,提高求解速率。文獻(xiàn)[35]同樣使用剪枝方法,利用k-core 算法提出新的剪枝策略和搜索區(qū)域限制策略,該算法結(jié)合圖著色的上界估計(jì),將搜索區(qū)域限制在根據(jù)core 值得到的每個(gè)子問(wèn)題的頂點(diǎn)子集內(nèi),通過(guò)剪枝操作對(duì)無(wú)法形成比當(dāng)前團(tuán)更大的子問(wèn)題進(jìn)行刪除,從而加快求解過(guò)程。但不足的是,該算法與PMC 算法相比,所使用的圖例規(guī)模不夠大。對(duì)于現(xiàn)實(shí)世界的無(wú)標(biāo)度網(wǎng)絡(luò)圖[36],文獻(xiàn)[37]提出一種利用初始啟發(fā)算法改進(jìn)的搜索算法,該算法在得到初始團(tuán)大小后,通過(guò)k-core 算法結(jié)合剪枝策略減小圖的尺寸,并基于貪婪算法對(duì)選定的頂點(diǎn)及其鄰居節(jié)點(diǎn)進(jìn)行圖著色,提升搜索過(guò)程的求解速率。
由于core結(jié)構(gòu)對(duì)于化簡(jiǎn)大規(guī)模圖模型有顯著效果,隨著研究的發(fā)展,研究人員發(fā)現(xiàn)k-community對(duì)化簡(jiǎn)大規(guī)模圖例有同樣好的效果。針對(duì)這2種化簡(jiǎn)方法,文獻(xiàn)[38]提出FC算法,利用2種團(tuán)松弛結(jié)構(gòu),將網(wǎng)絡(luò)實(shí)例減少到現(xiàn)有求解器可處理的尺寸,同時(shí)保持求解最優(yōu)性。在團(tuán)松弛的過(guò)程中,利用貪婪式啟發(fā)算法求解最大團(tuán)問(wèn)的下界(ωlower),并利用二進(jìn)制搜索算法或線性搜算法求解最大團(tuán)上界(ωupper),得到1個(gè)最小整數(shù)k,使(k+1)-core或k-community為圖G的1個(gè)空集。通過(guò)core的屬性將(k+1)標(biāo)為團(tuán)數(shù)的上界,并使用k-community重復(fù)修改原始圖的整個(gè)邊集。通過(guò)線性策略從k=ωlower-2開(kāi)始增加到k來(lái)搜索問(wèn)題上界。因?yàn)閗是遞增的,所以在尋找k-community中被刪除的任何邊在(k+1)-community中也將被刪除,并且整個(gè)圖不需要在每次迭代中重復(fù)使用。再次使用搜索算法找到圖例的最大(ωupper-1)-core或者(ωupper-2)-community,如果圖中上界足夠小,則可以通過(guò)精確算法求解最大團(tuán)的下界。
針對(duì)大規(guī)模稀疏圖的特征,文獻(xiàn)[39]描述了一種利用core 算法對(duì)邊界進(jìn)行優(yōu)化的分支定界求解稀疏圖問(wèn)題最大團(tuán)的算法(Branch-and-Bound Maximum Clique algorithm of Sparse graphs Problem,BBMCSP),BBMCSP算法在預(yù)處理階段可以在多項(xiàng)式時(shí)間內(nèi)有效減少問(wèn)題的規(guī)模,并在搜索階段通過(guò)遞歸搜索求解最大團(tuán)。與BBMCSP 算法不同的是,PMC 算法使用了一個(gè)輔助列表來(lái)存儲(chǔ)不能作為解的一部分頂點(diǎn),而B(niǎo)BMCSP 算法則使用確定的核心數(shù)作為初始節(jié)點(diǎn),只對(duì)根節(jié)點(diǎn)進(jìn)行剪枝操作,使剩余節(jié)點(diǎn)可以通過(guò)core 值來(lái)判斷邊界。新算法在遞歸搜索過(guò)程中利用并行性降低求解時(shí)間,且算法結(jié)構(gòu)比PMC 算法更清晰簡(jiǎn)單。
上述算法主要針對(duì)k-core 算法對(duì)分支限界法進(jìn)行了改進(jìn),有效增強(qiáng)了分支限界法的剪枝操作,顯著減少了算法的搜素空間與搜索難度,避免了內(nèi)存浪費(fèi)。從本質(zhì)上來(lái)說(shuō),使用分支限界法求解大規(guī)模最大團(tuán)問(wèn)題是對(duì)最優(yōu)解無(wú)用頂點(diǎn)的冗余刪除,即剪枝操作,為此使用k-core 算法有助于分析圖中頂點(diǎn)結(jié)構(gòu),從而快速剪枝。對(duì)于這一思路的相關(guān)操作,有研究人員使用k-community 方法,同樣取得了優(yōu)異的剪枝效果。在求解過(guò)程中,k-community 方法對(duì)密集圖的處理效果低于圖劃分方法,但在大規(guī)模稀疏圖中卻表現(xiàn)優(yōu)異。圖6為使用core 算法求解大規(guī)模最大團(tuán)問(wèn)題的一般流程。
圖6 core 算法求解大規(guī)模圖例最大團(tuán)問(wèn)題的一般流程Fig.6 General process of core algorithm to solve the maximum clique problem of large scale graph
3.2.1 PMC 算法結(jié)果分析
圖7(a)展示了在30個(gè)困難的社交和網(wǎng)絡(luò)圖例中分別使用完整算法、無(wú)core 算法、無(wú)Degenerace 排序算法的效果對(duì)比。由圖7(a)可知,完整算法與不使用core算法之間的差別很小,但完整算法與不使用Degeneracr排序算法有較大差別,當(dāng)速度差因子為2.5 時(shí)完整算法可以求解全部的難解圖例,而不使用Degeneracr算法則只能求解大約78%的圖例。這說(shuō)明PMC算法有利于處理這類部分頂點(diǎn)度數(shù)大的社交與網(wǎng)絡(luò)圖例,并且在度數(shù)較大圖中算法對(duì)于Degeneracr排序依賴性較大,對(duì)core算法依賴性較低。對(duì)于求解困難的并行DIMACS-Hard圖例,從圖7(b)中可知完整算法與不使用core 算法的求解效果相差巨大,當(dāng)速度差因子為0.4 時(shí)完整算法基本能夠解決所有并行難解圖例,而不使用core 算法在速度差因子為2.7 時(shí)才能全部求解并行難解圖例,說(shuō)明core 算法在并行化計(jì)算求解難解圖問(wèn)題上效果更好。
圖7 不同算法的實(shí)驗(yàn)結(jié)果對(duì)比Fig.7 Comparison of experimental results of different algorithm
3.2.2 BBMCSP 算法結(jié)果分析
圖7(c)所示為BBMCSP 算法和PMC 算法在頂點(diǎn)為0~300 萬(wàn)的測(cè)試圖例中的對(duì)比結(jié)果。BBMCSP算法在初始解不相同的情況下的所有求解結(jié)果均優(yōu)于PMC 算法。其中在大規(guī)模數(shù)目點(diǎn)的soc-dogster中求解速度表現(xiàn)最好,算法求解效率比PMC 算法高出數(shù)個(gè)量級(jí)。在具有相同初始解和不同初始解的平均情況下,BBMCSP 算法比PMC 算法效率提高了428 倍。尤其是與具有相同初始解的BBMCSP 算法相比,擁有不相同初始解的BBMCSP 算法具有更高的求解效率[39]。與PMC 算法對(duì)比發(fā)現(xiàn),對(duì)于現(xiàn)實(shí)世界所對(duì)應(yīng)的大規(guī)模稀疏圖,BBMCSP 算法的平均求解效率高于PMC 算法。
文獻(xiàn)[40]提出在MapReduce 框架下使用排序的并行枚舉團(tuán)(Parallel Enumeration of Cliques using Ordering,PECO)算法。PECO 算法只枚舉不重復(fù)的最大團(tuán),不添加已刪除的重復(fù)最大團(tuán)和非最大團(tuán),減少了重復(fù)搜索步驟。PECO 算法提升求解效率的關(guān)鍵在于圖的頂點(diǎn)總排序,可以使求解之前的工作分配均衡,并且消除處理器間的冗余工作。PECO 算法提出了度排序、三角排序、字典排序和隨機(jī)排序4 種方法,在現(xiàn)實(shí)生活所映射的大規(guī)模稀疏圖中基于度數(shù)排序和三角排序的表現(xiàn)最好,既減少了枚舉時(shí)間,又有利于負(fù)載平衡。
在精確算法求解大規(guī)模稀疏圖的最大團(tuán)問(wèn)題上,使用最多的方法為分支限界法,對(duì)于上界的求解最大團(tuán)問(wèn)題,文獻(xiàn)[41]通過(guò)對(duì)最大團(tuán)問(wèn)題的轉(zhuǎn)化,將最大團(tuán)問(wèn)題轉(zhuǎn)化為同是NP 難問(wèn)題的MaxSAT 問(wèn)題進(jìn)行上界估計(jì)[42],并提出針對(duì)大規(guī)模稀疏圖的最大團(tuán)(shot for Large MaxClique,LMC)算法。LMC 算法由2 個(gè)子程序構(gòu)成,1 個(gè)預(yù)處理程序Initialize 和1 個(gè)主查詢程序SearchMaxClique。LMC使用單個(gè)預(yù)處理程序完成PMC算法和BBMCSP 算法的3 項(xiàng)任務(wù),并對(duì)原始圖G進(jìn)行預(yù)處理,在搜索樹(shù)第1 層子圖中調(diào)用Initialize 程序進(jìn)行預(yù)處理,改進(jìn)順序染色的上界,并估計(jì)準(zhǔn)確度[43]。從程序的時(shí)間復(fù)雜度來(lái)比較,LMC算法的時(shí)間復(fù)雜度O(|E|)[41]優(yōu)于PMC 算法與BBMCSP 算法的時(shí)間復(fù)雜度O(|E|×Δ(G))[34],其中Δ(G)是G中頂點(diǎn)的最大度數(shù)。對(duì)于空間結(jié)構(gòu),LMC 算法使用空間效率更高的鄰接表代替鄰接矩陣,在搜索階段,LMC 算法通過(guò)將動(dòng)態(tài)函數(shù)與漸進(jìn)MaxSAT 算法[42]相結(jié)合,生成結(jié)合漸進(jìn)MaxSAT推理的動(dòng)態(tài)排序最大團(tuán)求解器(Dynamic ordering MaxClique Solver,DoMC1)算法[44]提高求解效率。
在求解大規(guī)模的最大團(tuán)問(wèn)題上,并行計(jì)算是一個(gè)非常重要的方法。文獻(xiàn)[45]提出一種基于并行核且使用watched 方法的最大團(tuán)求解算法BBMCW,該算法可以直接編碼在內(nèi)存中,通過(guò)使用2 個(gè)新指針?lè)謩e監(jiān)視第1 個(gè)和最后1 個(gè)塊位,有效地將集合操作限制在較少的頂點(diǎn)上,從而減少空位塊操作的數(shù)量,降低性能損失并減少BBMCW 算法的偽計(jì)算次數(shù)。此外,當(dāng)圖例的稀疏性較高時(shí),BBMCW 算法使用標(biāo)準(zhǔn)的順序貪婪著色計(jì)算邊界顏色,從而減少求解規(guī)模,增加求解時(shí)間。這種技術(shù)也可以應(yīng)用在SAT 領(lǐng)域,當(dāng)子句的文字很少時(shí),可以看作是稀疏的,從而提高求解速率。
在大規(guī)模圖例求解最大團(tuán)問(wèn)題的算法中,需要對(duì)算法以及圖例自身結(jié)構(gòu)進(jìn)行研究。2020年WALTEROs和BUCHANAN[46]發(fā)現(xiàn)一些大規(guī)模圖例在滿足某種關(guān)系時(shí),最大團(tuán)問(wèn)題是好解的,有些則是難解的。已知g=(d+1)-ω,其中:ω為團(tuán)數(shù);d為Degeneracy 度,d值可通過(guò)k-core 計(jì)算。已知當(dāng)g<10 時(shí),求解最快;當(dāng)g在10~100 之間時(shí),效果良好;當(dāng)g>100 后求解較為困難,求解難度與頂點(diǎn)數(shù)和邊數(shù)無(wú)關(guān)。因此,根據(jù)g的結(jié)構(gòu)變化提出Main 算法[46],通過(guò)構(gòu)建Degeneracy 度排序的方法,利用最大團(tuán)與最大頂點(diǎn)獨(dú)立集之間的關(guān)系,對(duì)特殊的子圖使用最大頂點(diǎn)獨(dú)立集的算法求解。結(jié)果顯示,在g∈[10,100)之間的求解效率優(yōu)于文獻(xiàn)[46]中所提到的3 類算法。
上述算法主要針對(duì)精確算法求解大規(guī)模圖例最大團(tuán)問(wèn)題進(jìn)行了補(bǔ)充,分別從3 個(gè)角度使用精確算法對(duì)最大團(tuán)問(wèn)題進(jìn)行分析。經(jīng)典的分支限界法通過(guò)對(duì)與已給出的圖結(jié)構(gòu)進(jìn)行分析,獲取圖結(jié)構(gòu)信息以進(jìn)行有效的剪枝操作,從而達(dá)到有效預(yù)處理的目的,提高求解速率。由于大多數(shù)精確算法都是基于圖結(jié)構(gòu)自身的分支定界法,近年來(lái)研究?jī)?nèi)容較多,算法更新改進(jìn)較為困難。對(duì)于NP 難問(wèn)題的轉(zhuǎn)移求解,LMC算法展示出了較好的效果。LMC 算法將圖結(jié)構(gòu)信息轉(zhuǎn)化為MaxSAT 問(wèn)題,對(duì)其進(jìn)行沖突檢測(cè)來(lái)推導(dǎo)上界估計(jì),并啟發(fā)式地給出了基于其他NP 難問(wèn)題的結(jié)構(gòu)轉(zhuǎn)化方法的求解算法。圖著色、最大頂點(diǎn)獨(dú)立集、頂點(diǎn)覆蓋等問(wèn)題對(duì)分析最大團(tuán)問(wèn)題也存在啟發(fā)式的意義,但是NP 難問(wèn)題的轉(zhuǎn)變?nèi)允荖P 難問(wèn)題,對(duì)于有效信息的轉(zhuǎn)化利用則是問(wèn)題的研究難點(diǎn)。對(duì)于圖結(jié)構(gòu)的相變研究,Main 算法通過(guò)已發(fā)現(xiàn)的相變規(guī)律設(shè)計(jì)了更高效的算法,因此,構(gòu)建相變表達(dá)式與分析相變技術(shù)是未來(lái)可以研究的重要方向。
3.3.1 LMC 算法結(jié)果分析
圖8(a)所示為L(zhǎng)MC 算法與PMC 算法、BBMCSP算法的搜索解對(duì)比結(jié)果。對(duì)比算法求解時(shí)間可知,無(wú)論LMC 算法在初始解相同或是在小于其他兩類算法的情況下,對(duì)大規(guī)模圖例子圖的搜索速度均優(yōu)于其他兩類算法。尤其是在圖例twitter_mpi 中,LMC 的初始解小于其他兩類算法,但求解時(shí)間為149.5 s,而其他兩類算法則在5 h 內(nèi)無(wú)法找到正確解。說(shuō)明MaxSAT 方法在求解最大團(tuán)問(wèn)題上對(duì)于初始解的依賴性較低,有利于搜索最大團(tuán)的上界估計(jì)。通過(guò)對(duì)原始圖進(jìn)行化簡(jiǎn),子圖中的頂點(diǎn)數(shù)顯著降低,且當(dāng)原圖的密度較低時(shí),如圖8(b)所示,子圖第1 層數(shù)目的化簡(jiǎn)與原始圖頂點(diǎn)數(shù)目存在正相關(guān)的關(guān)系。但當(dāng)原始圖密度較高時(shí),第1 層化簡(jiǎn)的密度仍然很大,說(shuō)明MaxSAT 推理上界方法對(duì)求解大規(guī)模最大團(tuán)問(wèn)題有較好的效果,但在高密度圖中預(yù)處理結(jié)果較差,求解時(shí)間不穩(wěn)定。
圖8 不同算法在預(yù)處理階段的結(jié)果對(duì)比Fig 8 Comparison of results of different algorithm in pretreatment stage
3.3.2 Main 算法結(jié)果分析
通過(guò)設(shè)置Main 算法中不同核間距g[46]的大小,驗(yàn)證大規(guī)模圖例中g(shù)對(duì)求解速度的影響,實(shí)驗(yàn)結(jié)果如圖9 所示。由圖9可知,當(dāng)g<10時(shí),求解速度最快;當(dāng)g在10~100之間,求解速度適中;當(dāng)g>100后,求解較為困難。提出一個(gè)新的因素用來(lái)衡量圖模型是否可解,并在實(shí)驗(yàn)結(jié)果中驗(yàn)證核間距的正確性,求得該圖例是成為難解圖結(jié)構(gòu)的相變點(diǎn)。通過(guò)g在0~100 之間的求解效率優(yōu)于文中所提到的3類算法[46]可以看出頂點(diǎn)數(shù)與邊數(shù)的大小無(wú)關(guān),與圖模型的結(jié)構(gòu)相關(guān),即無(wú)論頂點(diǎn)和邊為多少,只要不接近所提出相變點(diǎn)位置的大規(guī)模最大團(tuán)問(wèn)題,就都是好解的。
圖9 參數(shù)g 對(duì)不同算法求解速度的影響Fig 9 Influence of parameter g on the speed of different algorithms
近年來(lái),在求解圖例規(guī)模大、計(jì)算復(fù)雜度高的最大團(tuán)問(wèn)題中涌現(xiàn)出了很多優(yōu)秀的算法,在應(yīng)用過(guò)程中展示了一定的優(yōu)勢(shì),但也暴露出了一些自身的局限性,將這些算法進(jìn)行總結(jié)分析,結(jié)果如表4 所示。
表4 大規(guī)模圖例的最大團(tuán)問(wèn)題算法的對(duì)比分析Table 4 Comparative analysis of algorithms for maximum clique problem based on large-scale lgraph
續(xù)表
基于大規(guī)模圖例求解最大團(tuán)問(wèn)題時(shí)需要先對(duì)原始圖例進(jìn)行預(yù)處理,將大規(guī)模圖例轉(zhuǎn)化為多個(gè)小規(guī)模子圖或單個(gè)多剪枝化簡(jiǎn)圖,使其有利于子圖搜索解。為簡(jiǎn)化數(shù)據(jù)計(jì)算復(fù)雜度并增強(qiáng)計(jì)算效率,使用大數(shù)據(jù)并行計(jì)算平臺(tái)進(jìn)行多線程并行操作,逐步轉(zhuǎn)化為可求解規(guī)模圖例。
目前對(duì)于求解大規(guī)模圖例最大團(tuán)問(wèn)題的主要?jiǎng)?chuàng)新點(diǎn)在預(yù)處理上,一般分為2 種處理方式:
1)將大規(guī)模圖例劃分為多個(gè)小規(guī)模圖例,主要基于單層圖劃分和多層圖劃分,且劃分方法為圖著色劃分。單層圖劃分有較快的劃分速度,能更大限度地保持原有圖結(jié)構(gòu),但劃分時(shí)間較長(zhǎng)。多層劃分則劃分較慢但劃分后的子圖更利于搜索解,且在時(shí)間函數(shù)約束下更有利于求解密集圖。由于大規(guī)模圖例劃分的復(fù)雜性和密集性,因此主要使用MapReduce 方法進(jìn)行并行計(jì)算獲得多個(gè)子圖。因?yàn)镸apReduce 方法不適用于多層圖劃分,所以采用更有利于圖計(jì)算的Spark 集群框架進(jìn)行多層劃分。
2)將大規(guī)模圖例基于k-core 進(jìn)行剪枝操作,轉(zhuǎn)化為小規(guī)模圖例。k-core 方法能夠有效地反應(yīng)圖的度數(shù)和團(tuán)數(shù)量的關(guān)系,有利于分支限界法的剪枝操作,化簡(jiǎn)大規(guī)模圖,提高求解速率。對(duì)于分支限界法的研究,部分研究人員利用MaxSAT 問(wèn)題的子句沖突與最大團(tuán)問(wèn)題上界估計(jì)的關(guān)聯(lián)關(guān)系,使用編碼公式將最大團(tuán)問(wèn)題轉(zhuǎn)化為最大可滿足問(wèn)題后,通過(guò)求解子句沖突集進(jìn)行最大團(tuán)的快速剪枝,從而提高上界精度與預(yù)處理速度,MaxSAT 方法在大規(guī)模稀疏圖中的處理效果提升顯著。
本文旨在對(duì)近年來(lái)有關(guān)大規(guī)模圖例求解最大團(tuán)問(wèn)題的研究進(jìn)行了分析與綜述,重點(diǎn)分析了各類算法的特點(diǎn)與優(yōu)劣性。深度強(qiáng)化學(xué)習(xí)作為當(dāng)前的研究熱點(diǎn),在解決組合優(yōu)化問(wèn)題上展示出了求解速度快、模型泛化能力強(qiáng)的優(yōu)勢(shì),例如文獻(xiàn)[48]利用GNN+RL 方法求解圖著色問(wèn)題,文獻(xiàn)[49]通過(guò)GNN+監(jiān)督式訓(xùn)練求解最小支配集問(wèn)題,文獻(xiàn)[50]基于GNN+RL 解決最小頂點(diǎn)覆蓋集問(wèn)題,均表現(xiàn)出顯著的求解效果,與傳統(tǒng)方法相比是一種全新的求解方式,也是一類新型的交叉學(xué)科[51]。雖然深度強(qiáng)化學(xué)習(xí)及其應(yīng)用已經(jīng)取得了一定進(jìn)展,現(xiàn)有研究也展示出了在深度強(qiáng)化學(xué)習(xí)、解決圖上組合和優(yōu)化問(wèn)題上的優(yōu)勢(shì)[52-53],但大規(guī)模組合優(yōu)化問(wèn)題的求解速度仍有待提高。因此,對(duì)基于深度強(qiáng)化學(xué)習(xí)方法解決經(jīng)典組合優(yōu)化問(wèn)題的算法進(jìn)行改進(jìn),擴(kuò)大求解規(guī)模,使其可以解決大規(guī)模圖例的難解問(wèn)題是未來(lái)一個(gè)很好的研究方向[51]。
針對(duì)深度強(qiáng)化學(xué)習(xí)難以求解大規(guī)模圖例最大團(tuán)的問(wèn)題、傳統(tǒng)方法求解大規(guī)模圖例最大團(tuán)問(wèn)題的數(shù)據(jù)計(jì)算量復(fù)雜問(wèn)題、分支限界法中的上界精確推理問(wèn)題以及圖結(jié)構(gòu)分析問(wèn)題,有如下可借鑒技術(shù):
1)使用分層式強(qiáng)化學(xué)習(xí)將大規(guī)模圖例進(jìn)行預(yù)處理,劃分為多個(gè)可解子問(wèn)題,并進(jìn)行分層式學(xué)習(xí)策略,再將子問(wèn)題進(jìn)行組合,形成全局最優(yōu)策略,從而解決大規(guī)模圖例的最大團(tuán)問(wèn)題。
2)針對(duì)大規(guī)模圖例的數(shù)據(jù)計(jì)算復(fù)雜問(wèn)題,目前使用最多的是大數(shù)據(jù)平臺(tái)下的分布式計(jì)算平臺(tái),該平臺(tái)能夠提高計(jì)算效率,但同時(shí)也帶來(lái)一些不足,例如MapReduce 多次迭代將消耗較多內(nèi)存空間。針對(duì)內(nèi)存消耗問(wèn)題,可以結(jié)合量子計(jì)算方法對(duì)具有高復(fù)雜度的數(shù)據(jù)結(jié)構(gòu)進(jìn)行求解。量子計(jì)算根據(jù)量子力學(xué)疊加原理使量子信息單元的狀態(tài)能夠處于多種可能性的疊加狀態(tài),從而使量子信息處理從效率上相比于經(jīng)典信息處理有更大的潛質(zhì)[54]。此外,還可以將分布式計(jì)算平臺(tái)應(yīng)用于求解大規(guī)模數(shù)據(jù)結(jié)構(gòu)的其他組合優(yōu)化問(wèn)題中。
3)針對(duì)分支限界法的上界精確推理問(wèn)題,LMC 算法在求解大規(guī)模圖例最大團(tuán)問(wèn)題上效果良好。由于精確估計(jì)上界對(duì)分支定界法的求解速率有決定性影響[23],因此利用MaxSAT 在編碼后的圖結(jié)構(gòu)中進(jìn)行尋找沖突子句從圖,從而縮小最大團(tuán)問(wèn)題上界至關(guān)重要[44]。與MaxSAT 問(wèn)題相對(duì),MinSAT 問(wèn)題的目標(biāo)是確定一個(gè)命題公式的最少可滿足子句數(shù)量,MaxSAT 問(wèn)題與最大團(tuán)的上界緊密相連。所以,在下一步研究中,可以以MaxSAT求解最大團(tuán)為啟發(fā),對(duì)MinSAT算法進(jìn)行改進(jìn),使其有利于求解大規(guī)模圖例的最大團(tuán)問(wèn)題[55]。
4)針對(duì)圖結(jié)構(gòu)分析問(wèn)題,在Main 算法中,研究人員啟發(fā)式地提出度量圖結(jié)構(gòu)難度的參數(shù)g并作出了有效的說(shuō)明與分析,驗(yàn)證了圖結(jié)構(gòu)難解度的相變點(diǎn)。對(duì)于圖結(jié)構(gòu)分析而言,樹(shù)寬[56]與結(jié)構(gòu)熵[57]均為分析圖結(jié)構(gòu)的有力工具。結(jié)構(gòu)熵可以反映網(wǎng)絡(luò)的動(dòng)態(tài)復(fù)雜性,樹(shù)寬則是在樹(shù)分解階段利用最大團(tuán)的大小判斷樹(shù)的寬度,反映圖的復(fù)雜性。這2 種結(jié)構(gòu)在一定條件下均反映最大團(tuán)的結(jié)構(gòu)與難解程度。對(duì)求解大規(guī)模圖例的最大團(tuán)問(wèn)題,下一步可以通過(guò)對(duì)圖結(jié)構(gòu)進(jìn)行研究,定義新的相變表達(dá)式,求得難解相變點(diǎn),從圖結(jié)構(gòu)的角度分析最大團(tuán)的求解難度,并設(shè)計(jì)相應(yīng)結(jié)構(gòu)算法,從而提高求解效率。
通過(guò)上述分析,基于大規(guī)模圖例的最大團(tuán)問(wèn)題具有較大的研究空間與研究潛力,值得繼續(xù)研究。
求解大規(guī)模圖例的最大團(tuán)問(wèn)題是將常規(guī)最大團(tuán)理論應(yīng)用于真實(shí)世界的關(guān)鍵方法,具有重要的研究意義。本文對(duì)基于常規(guī)圖例求解最大團(tuán)問(wèn)題進(jìn)行了簡(jiǎn)單的介紹與總結(jié),對(duì)基于大規(guī)模圖例求解最大團(tuán)問(wèn)題從算法分類的角度進(jìn)行綜述,詳細(xì)介紹了將目前主流算法與大數(shù)據(jù)技術(shù)相結(jié)合的求解方法,闡述了各類算法的優(yōu)點(diǎn)與不足。此外,分析了目前基于大規(guī)模復(fù)雜圖例求解最大團(tuán)問(wèn)題的難點(diǎn)及解決方案,通過(guò)對(duì)算法進(jìn)行對(duì)比分析發(fā)現(xiàn),目前在計(jì)算優(yōu)化和難解問(wèn)題映射求解上仍有一定的進(jìn)步空間。在求解大規(guī)模圖例最大團(tuán)問(wèn)題中,下一步將繼續(xù)研究結(jié)合分層深度強(qiáng)化學(xué)習(xí)的劃分方法和分析圖結(jié)構(gòu)的相變方法。