李隴豫
(中國(guó)民航大學(xué) 中歐航空工程師學(xué)院,天津 300300)
現(xiàn)有的影響力度量方法主要有基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)[1-2]、基于用戶行為[3-4]和基于用戶交互行為[5]的影響力度量方法。本文根據(jù)民航旅客訂座數(shù)據(jù)(Passenger Name Record,簡(jiǎn)稱為“PNR”),基于民航旅客社會(huì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和旅客共同出行行為,提出一種民航旅客影響力的度量方法。
PageRank算法是一種基于鏈接結(jié)構(gòu)的網(wǎng)頁排名算法,該算法通過網(wǎng)頁之間的鏈接關(guān)系對(duì)網(wǎng)頁的重要性作出評(píng)判。PageRank算法的數(shù)學(xué)公式如下:
式(1)中:PR(vi)為網(wǎng)頁vi的PageRank值;PR(vj)為鏈接到網(wǎng)頁vi的網(wǎng)頁vj的PageRank值;L(vj)為網(wǎng)頁vj包含的鏈接數(shù)量;q為對(duì)網(wǎng)絡(luò)中所有頁面公平引入的阻尼系數(shù)。
由于民航旅客社會(huì)網(wǎng)絡(luò)是一個(gè)有向加權(quán)的社會(huì)網(wǎng)絡(luò),PageRank算法中對(duì)初始權(quán)重平均分配并不合理,因此我們利用改進(jìn)后的PageRank算法來計(jì)算網(wǎng)絡(luò)中節(jié)點(diǎn)的影響力大小。改進(jìn)后節(jié)點(diǎn)PR值的計(jì)算公式如下:
式(2)中:W(vj,vi)表示節(jié)點(diǎn)vj對(duì)節(jié)點(diǎn)vi的影響強(qiáng)度;Sout(vj)表示節(jié)點(diǎn)vj的出強(qiáng)度,其計(jì)算公式為:
由此,我們得到了網(wǎng)絡(luò)中所有節(jié)點(diǎn)基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的影響力大小。
每名旅客與其他旅客的共同出行行為對(duì)該旅客自身的影響力也有一定程度的影響,若一名旅客與其他旅客共同乘機(jī)的次數(shù)越多、頻率越高,則該旅客越容易對(duì)其他旅客產(chǎn)生影響,則其自身的影響力也就越大。因此,度量旅客影響力時(shí)需要考慮該旅客與其他旅客的共同出行行為。本文使用旅客共同出行的次數(shù)和共同出行的頻次來量化旅客vi,vj之間的共同出行行為,具體計(jì)算方法如式(4):
式(4)中:Tvi,vj和Fvi,vj分別表示旅客vi,vj在一段時(shí)間內(nèi)的共同出行次數(shù)和旅客vi,vj最近一次出行日期與統(tǒng)計(jì)日期的間隔天數(shù);和分別表示網(wǎng)絡(luò)中所有旅客間的共同出行次數(shù)和出行頻次的平均值;β為旅客共同出行次數(shù)和頻次的調(diào)節(jié)因子。因此,我們得到旅客vi的平均共同出行量為:
式(5)中:ivM表示旅客vi的鄰居節(jié)點(diǎn)集合;Ni為旅客的
2.1.1 政府要大力發(fā)展農(nóng)村經(jīng)濟(jì)。政府要立足于社會(huì)的發(fā)展,發(fā)展農(nóng)村經(jīng)濟(jì),農(nóng)村經(jīng)濟(jì)有了政府政策的傾斜,可以反哺農(nóng)村空巢老人生活環(huán)境的改善,使其為空巢老人在內(nèi)所有老人的晚年生活提供經(jīng)濟(jì)保障。這樣不僅可以緩解城市的就業(yè)壓力,而且可以吸引外出工作的子女返鄉(xiāng),讓空巢老人真正實(shí)現(xiàn)“老有所依”。
鄰居節(jié)點(diǎn)個(gè)數(shù),
綜合民航旅客社會(huì)網(wǎng)絡(luò)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和旅客的出行行為,我們得到民航旅客影響力計(jì)算模型CAPI-Rank如式(6)所示:
式(6)中:α為基于網(wǎng)絡(luò)拓?fù)涞穆每陀绊懥突诼每统鲂行袨榈挠绊懥Φ钠胶庖蜃樱?≤α≤1.
本文采用節(jié)點(diǎn)數(shù)為2 034、邊數(shù)為13 328的民航旅客社會(huì)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)的硬件環(huán)境為Inter(R)Core(TM)i5-2400 CPU@3.10 GHz×4,4 GB內(nèi)存。
本文通過IC模型模擬旅客影響力的傳播,將每個(gè)旅客最終激活的節(jié)點(diǎn)數(shù)作為他們真實(shí)的影響力值。由于民航旅客社會(huì)網(wǎng)絡(luò)模型的間邊權(quán)重表示旅客之間的影響強(qiáng)度,因此這里我們用網(wǎng)絡(luò)中的邊權(quán)重作為IC模型中的激活概率p.
將本文提出的CAPI-Rank影響力度量方法與度中心性DC、接近中心性CC、介數(shù)中心性BC和PageRank算法4種常用的影響力度量方法進(jìn)行對(duì)比,采用斯皮爾曼相關(guān)系數(shù)ρ來衡量不同度量方法得出的旅客排名與真實(shí)旅客影響力排名的相關(guān)性。
CAPI-Rank模型中共有α,β兩個(gè)參數(shù),α用來調(diào)節(jié)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和旅客出行行為對(duì)影響力的影響,β用來調(diào)節(jié)旅客出行行為中出行次數(shù)和出行頻次的比例。下面通過實(shí)驗(yàn)討論兩個(gè)參數(shù)的取值問題。
圖1展示了CAPI-Rank模型在不同α,β下的變化情況。從圖中可以看出,CAPI-Rank模型在α=0.765、β=0.824時(shí)取得最大值。
圖1 不同參數(shù)取值CAPI-Rank模型ρ值變化情況
在得到CAPI-Rank中的最優(yōu)參數(shù)α,β后,我們通過實(shí)驗(yàn)比較了CAPI-Rank和度中心性DC、接近中心性CC、介數(shù)中心性BC、PageRank算法的表現(xiàn)。
圖2為5種度量方法在民航旅客社會(huì)網(wǎng)絡(luò)下的ρ值。從圖中我們可以看出,CAPI-Rank相比于其他度量方法能取得最大的ρ值,說明CAPI-Rank在該網(wǎng)絡(luò)中能夠取得最好的度量效果。由于網(wǎng)絡(luò)中節(jié)點(diǎn)連接不緊密,并且節(jié)點(diǎn)之間的影響強(qiáng)度很小,節(jié)點(diǎn)的影響力很難在網(wǎng)絡(luò)中傳播開來,大多數(shù)節(jié)點(diǎn)只能影響網(wǎng)絡(luò)中與它相近的小部分節(jié)點(diǎn)。正因?yàn)槿绱耍珼C的效果相對(duì)較好,因?yàn)镈C僅按照網(wǎng)絡(luò)中節(jié)點(diǎn)的度數(shù)排序,能夠找到不同區(qū)域內(nèi)影響力相對(duì)較大的節(jié)點(diǎn);而CC考慮網(wǎng)絡(luò)中節(jié)點(diǎn)與其他節(jié)點(diǎn)之間的路徑長(zhǎng)短,但事實(shí)上,處于網(wǎng)絡(luò)中心的節(jié)點(diǎn)由于影響強(qiáng)度的限制很難將其影響力擴(kuò)散開,因此CC的效果并不理想。而CAPI-Rank模型由于考慮可網(wǎng)絡(luò)拓?fù)浜吐每统鲂行袨閮煞矫娴囊蛩?,在最終結(jié)果上要優(yōu)于僅考慮網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的度量方法。
圖2 不同度量方法在民航旅客社會(huì)網(wǎng)絡(luò)下的ρ值
本文根據(jù)民航旅客訂座數(shù)據(jù)的特點(diǎn),基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和旅客共同出行行為,提出了一種旅客影響力的計(jì)算模型。實(shí)驗(yàn)表明,本文提出的CAPI-Rank模型在民航旅客影響力度量準(zhǔn)確性方面要優(yōu)于傳統(tǒng)的影響力度量方法。
[1]Page L,Brin S,Motwani R,et al.The PageRank citation ranking:Bringing order to the web[J].Food Microstructure,1999(01):1-17.
[2]金迪,馬衍民.PageRank算法的分析及實(shí)現(xiàn)[J].經(jīng)濟(jì)技術(shù)協(xié)作信息,2009(18):118.
[3]Rabiger S,Spiliopoulou M.A framework for validating the merit of properties that predict the influence of a twitter user[J].Expert Systems with Applications,2015,42(5):2824-2834.
[4]毛佳昕,劉奕群,張敏,等.基于用戶行為的微博用戶社會(huì)影響力分析[J].計(jì)算機(jī)學(xué)報(bào),2014,37(4):791-800.
[5]史艷翠,楊巨成,陳亞瑞,等.基于移動(dòng)數(shù)據(jù)的用戶間影響力計(jì)算方法[J].華中科技大學(xué)學(xué)報(bào),2017,45(7):110-114.
[6]張琨,李配配,朱保平,等.基于PageRank的有向加權(quán)復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)估方法[J].南京航空航天大學(xué)學(xué)報(bào),2013(03):429-434.