汪 超,馬亮亮,張凱倫,王 璐
(1.安徽工程大學(xué) 建筑工程學(xué)院,安徽 蕪湖;2.安徽工業(yè)大學(xué) 復(fù)雜系統(tǒng)多學(xué)科管理與控制重點(diǎn)實(shí)驗(yàn)室,安徽 馬鞍山)
隨著信息技術(shù)的發(fā)展,社會(huì)已然演化為一個(gè)高度復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。為了有效地進(jìn)行輿論導(dǎo)向和危機(jī)公關(guān), 迫切需要揭示信息在這樣錯(cuò)綜復(fù)雜的社會(huì)網(wǎng)絡(luò)中的傳播規(guī)律。復(fù)雜網(wǎng)絡(luò)理論為我們提供了一個(gè)行之有效的分析工具。通過構(gòu)建網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、分析節(jié)點(diǎn)度分布和聚類系數(shù)等統(tǒng)計(jì)學(xué)特征, 可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)的識(shí)別[1]。這些節(jié)點(diǎn)往往起著網(wǎng)絡(luò)樞紐的作用,是控制信息傳播的流量和節(jié)奏的關(guān)鍵所在。因此,如何識(shí)別信息傳播網(wǎng)絡(luò)中的重要節(jié)點(diǎn)具有重要的現(xiàn)實(shí)意義。
無標(biāo)度特性[2]表明不同節(jié)點(diǎn)在網(wǎng)絡(luò)結(jié)構(gòu)和功能中的作用可能有很大不同。事實(shí)上,識(shí)別某些結(jié)構(gòu)或功能目標(biāo)相關(guān)的重要節(jié)點(diǎn)非常重要,這使我們能夠更好地控制流行病的爆發(fā),為電子商務(wù)產(chǎn)品進(jìn)行成功的廣告,防止災(zāi)難性的后果。到目前為止,研究人員提出了許多有效的方法來識(shí)別信息傳播網(wǎng)絡(luò),包括度中心性、介數(shù)中心性、特征向量中心性和PageRank 算法等。此外,Xu[3]開發(fā)了一種新的節(jié)點(diǎn)排名算法來識(shí)別信息網(wǎng)絡(luò)傳播中的重要節(jié)點(diǎn)。Mekonnen Tulu 等人[4]基于社區(qū)結(jié)構(gòu)識(shí)別影響力節(jié)點(diǎn)加速復(fù)雜網(wǎng)絡(luò)信息傳播。Xu 等人[5]利用信息熵的思想,設(shè)計(jì)了一種基于節(jié)點(diǎn)鄰接信息熵的方法,并提出了適用于不同類型網(wǎng)絡(luò)(如無向網(wǎng)絡(luò)、有向網(wǎng)絡(luò)和帶權(quán)網(wǎng)絡(luò))的有效算法來識(shí)別重要節(jié)點(diǎn)。Asgharian Rezaei[6]開發(fā)了一個(gè)基于機(jī)器學(xué)習(xí)的方法來識(shí)別重要節(jié)點(diǎn)。Ren 等人[7]采用反向貪婪法來識(shí)別信息傳播網(wǎng)絡(luò)中的重要節(jié)點(diǎn)。近年來,元啟發(fā)式算法的興起為復(fù)雜網(wǎng)絡(luò)重點(diǎn)節(jié)點(diǎn)識(shí)別提供了新思路。粒子群優(yōu)化算法[8]、人工蜂群優(yōu)化算法[9]、飛蛾火焰優(yōu)化算法[10]和樽海鞘優(yōu)化算法[11]等智能優(yōu)化算法相繼被提出。盡管智能優(yōu)化算法在處理復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)方面有其優(yōu)勢,但隨著信息時(shí)代的到來,數(shù)據(jù)量的劇增使得僅依賴智能優(yōu)化算法已不再能有效地解決問題。為了應(yīng)對(duì)這一挑戰(zhàn),數(shù)據(jù)驅(qū)動(dòng)方法逐漸被應(yīng)用。其中,RBF 神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neural Network)模型[12]是基于徑向基函數(shù)的機(jī)器學(xué)習(xí)模型,用于非線性模式識(shí)別和函數(shù)逼近問題。
本文首先采用RBF 神經(jīng)網(wǎng)絡(luò)馴化LT 傳播模型下的數(shù)據(jù)預(yù)測器,然后在該預(yù)測器上,采用兔子優(yōu)化人工智能算法來進(jìn)行信息傳播網(wǎng)絡(luò)載體的關(guān)鍵節(jié)點(diǎn)識(shí)別。
LT 傳播模型可以被定義為:給定一個(gè)信息網(wǎng)絡(luò)圖G(V,E)、初始節(jié)點(diǎn)和集合個(gè)數(shù),假設(shè)初始集合中的節(jié)點(diǎn)狀態(tài)是活躍的?;谝环N影響力傳播模型機(jī)制,從初始集合開始向整個(gè)網(wǎng)絡(luò)傳播影響力。目標(biāo)是找到這些初始節(jié)點(diǎn)集合,以使網(wǎng)絡(luò)中受到影響的節(jié)點(diǎn)數(shù)量最大化。
RBF 模型是一種基于徑向基函數(shù)的機(jī)器學(xué)習(xí)模型。在RBF 模型中,模型的隱藏層由一系列的徑向基函數(shù)組成。徑向基函數(shù)的中心是根據(jù)訓(xùn)練數(shù)據(jù)在輸入空間中的分布來確定的。每個(gè)基函數(shù)具有一個(gè)中心和一個(gè)半徑,它衡量輸入數(shù)據(jù)與基函數(shù)中心之間的距離,式(2)為高斯基函數(shù)。RBF 模型的輸出由隱藏層基函數(shù)和其對(duì)應(yīng)的權(quán)重線性組合而得到。模型的訓(xùn)練過程包括選擇合適的基函數(shù)中心,計(jì)算基函數(shù)的權(quán)重,以及確定基函數(shù)的半徑。
人工兔子優(yōu)化算法(artificial rabbits optimization,ARO)[13]是一種基于兔子在自然界生存的元啟發(fā)式算法。ARO 算法包括繞道覓食和隨機(jī)躲藏兩種策略。兔子通過繞道覓食策略來迫使其吃掉其他兔子巢附近的草,從而防止它們的巢被掠食者發(fā)現(xiàn)。同時(shí),通過隨機(jī)隱藏策略,兔子能夠從它們自己的洞穴中隨機(jī)選擇一個(gè)來躲藏,從而減少被敵人捕獲的可能性。此外,兔子能夠自適應(yīng)調(diào)節(jié)能量,從而可以在繞道覓食和隨機(jī)躲藏之間切換。兔子的能量因子表示如式(4)
式中,A 代表兔子的能量;t 是當(dāng)前的迭代次數(shù);T 是最大迭代次數(shù);r 是(0,1)的隨機(jī)數(shù)。
兔子繞道覓食和隨機(jī)躲藏策略的數(shù)學(xué)形式如式(5)、公式(6):
首先選取socfb-nips-ego 信息傳播網(wǎng)絡(luò)數(shù)據(jù)[14]作為載體,然后度中心性(DC)、介數(shù)中心性(BC)、Pagerank 值等三個(gè)常用中心性度量作為每個(gè)樣本節(jié)點(diǎn)的代表特征,替代節(jié)點(diǎn)成為輸入變量,同時(shí)以指標(biāo)為輸出變量,使用RBF 預(yù)測器來挖掘變量之間的潛在關(guān)系。步長設(shè)為10,迭代次數(shù)設(shè)為5 萬。從圖1 可以看出,根據(jù)信息網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練出的模型預(yù)測精度均達(dá)到90%以上。其次,識(shí)別目標(biāo)函數(shù)和決策變量,其具體表達(dá)式如式(7)。最后,利用人工兔子優(yōu)化器取得目標(biāo)函數(shù)的近似值。
圖1 RBF 預(yù)測
式中,N 是社會(huì)網(wǎng)絡(luò)的大小;λ 是平衡參數(shù),φ (S)是在LT 模型中從初始種子S*可以到達(dá)的網(wǎng)絡(luò)上的節(jié)點(diǎn)數(shù)。
用數(shù)據(jù)預(yù)測器RBF 作為目標(biāo)中函數(shù)變換黑盒,同時(shí)采用兔子優(yōu)化器獲得重要節(jié)點(diǎn)。其中,兔子優(yōu)化器的種群規(guī)模為100,最大迭代次數(shù)為200,獲取的優(yōu)化目標(biāo)迭代情況如圖2 所示,可以看出在25 代左右就達(dá)到最優(yōu)值。表1 反映了優(yōu)化后獲取的10 個(gè)重要信息傳播節(jié)點(diǎn)索引,同時(shí)對(duì)比了度中心性、介數(shù)中心性方法獲取的結(jié)果,可以看出本文的求解方法具有較強(qiáng)的可行性。
表1 不同算法下的信息傳播關(guān)鍵節(jié)點(diǎn)索引
圖2 優(yōu)化迭代
本文充分發(fā)揮了人工智能方法的優(yōu)越性,提出了一套綜合數(shù)據(jù)預(yù)測與元啟發(fā)式算法的方法,用于挖掘信息傳播網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)。首先,本文將信息傳播網(wǎng)絡(luò)的拓?fù)涮匦耘c信息傳播模型相結(jié)合,構(gòu)建了大量的數(shù)據(jù)樣本,并運(yùn)用RBF 建立了高效的預(yù)測模型。接著,將預(yù)測模型與優(yōu)化算法緊密結(jié)合,將節(jié)點(diǎn)索引作為變量,以信息傳播影響力作為目標(biāo),實(shí)現(xiàn)了重要節(jié)點(diǎn)的準(zhǔn)確識(shí)別。通過算例驗(yàn)證,本文提出的預(yù)測模型擬合精度高,優(yōu)化結(jié)果可靠,具備實(shí)際應(yīng)用價(jià)值。