郭 崇 慧, 王 欣, 孫 磊 磊
(大連理工大學(xué) 管理科學(xué)與工程學(xué)院,遼寧大連116024)
互聯(lián)網(wǎng)文化市場(chǎng)作為搭建在互聯(lián)網(wǎng)上的新型平臺(tái),為人們?cè)诰W(wǎng)絡(luò)空間中的精神活動(dòng)及其商品提供虛擬場(chǎng)所,包括網(wǎng)絡(luò)新聞、網(wǎng)絡(luò)動(dòng)漫、網(wǎng)絡(luò)視頻、網(wǎng)絡(luò)音樂(lè)、網(wǎng)絡(luò)文學(xué)以及網(wǎng)絡(luò)論壇,等等。相較于其他文化市場(chǎng)而言,互聯(lián)網(wǎng)文化市場(chǎng)具有非常鮮明的優(yōu)勢(shì),如內(nèi)容的海量性、載體的開(kāi)放性、傳輸?shù)亩鄻有浴⑿畔⒌墓蚕硇院椭黧w的自由性。然而,正是由于互聯(lián)網(wǎng)文化市場(chǎng)的這些特點(diǎn),使得用戶很難從海量信息中選擇出心儀的商品。
為了提高互聯(lián)網(wǎng)文化市場(chǎng)用戶選擇商品的效率,很多商品排名系統(tǒng)應(yīng)運(yùn)而生[1][2]。在互聯(lián)網(wǎng)文化商品排名系統(tǒng)中應(yīng)用最為廣泛的排名方法是通過(guò)采集用戶體驗(yàn)、下載、轉(zhuǎn)發(fā)或者評(píng)價(jià)商品的次數(shù),根據(jù)次數(shù)的多少進(jìn)行推薦。用戶可以依靠商品排名系統(tǒng)提供的信息去選擇大家正在觀看的電影、試聽(tīng)的歌曲、熱議的新聞或者好評(píng)的圖書(shū),快速了解分享最新、最流行的互聯(lián)網(wǎng)文化商品。然而在互聯(lián)網(wǎng)文化商品排名系統(tǒng)給用戶選擇商品帶來(lái)很多便利、節(jié)省很多瀏覽時(shí)間的同時(shí),也不可避免地對(duì)互聯(lián)網(wǎng)文化市場(chǎng)造成了一定的影響。Salganik等在現(xiàn)場(chǎng)實(shí)驗(yàn)研究中發(fā)現(xiàn),商品排名系統(tǒng)在社會(huì)影響力的影響下加劇了互聯(lián)網(wǎng)文化市場(chǎng)的不均衡性和不可預(yù)測(cè)性[3]。隨后,Muchnik設(shè)計(jì)了一個(gè)大規(guī)模隨機(jī)實(shí)驗(yàn),將一個(gè)社會(huì)新聞網(wǎng)站上的新聞隨機(jī)分為三組,分別對(duì)新聞的好評(píng)次數(shù)實(shí)施積極的、消極的和對(duì)應(yīng)的社會(huì)影響力影響,實(shí)驗(yàn)結(jié)果表明積極的社會(huì)影響力有助于提高后續(xù)的好評(píng)數(shù)量[4]。通過(guò)以上研究可以看到,商品排名系統(tǒng)在社會(huì)影響力的影響下加劇了互聯(lián)網(wǎng)文化市場(chǎng)的不均衡性,擴(kuò)大了互聯(lián)網(wǎng)文化市場(chǎng)固有的“富者更富”現(xiàn)象[5][6]。
圖1 兩階段歌曲下載行為示意圖
由于互聯(lián)網(wǎng)文化市場(chǎng)“富者更富”現(xiàn)象的影響,如果商品排名系統(tǒng)的排名信息被惡意操縱,會(huì)將次優(yōu)商品推薦給用戶,將降低用戶的滿意程度、危害大眾的消費(fèi)權(quán)益和影響互聯(lián)網(wǎng)文化市場(chǎng)的正常運(yùn)營(yíng)秩序。網(wǎng)絡(luò)水軍是通過(guò)集中點(diǎn)擊、發(fā)帖和回復(fù)惡意操控商品排名信息,對(duì)特定目標(biāo)進(jìn)行宣傳營(yíng)銷或惡意攻擊的網(wǎng)絡(luò)人員。目前,網(wǎng)絡(luò)水軍已經(jīng)受到譚真[7]、王愛(ài)玲和Tang等多名研究者的關(guān)注[8][9],闡述網(wǎng)絡(luò)水軍危害性,并予以譴責(zé)。
因此網(wǎng)絡(luò)水軍是如何操控商品排名信息的,對(duì)互聯(lián)網(wǎng)文化市場(chǎng)的危害有多大,就非常值得探索與研究。目前相關(guān)研究主要分為兩大類:第一類是采用實(shí)驗(yàn)的方法[4][10][11];第二類是采用文本挖掘的方法[12][13]。
為了研究網(wǎng)絡(luò)水軍操控互聯(lián)網(wǎng)商品排名信息的過(guò)程、影響要素及其對(duì)互聯(lián)網(wǎng)文化市場(chǎng)造成的危害,本文通過(guò)仿真的方法建立了互聯(lián)網(wǎng)文化市場(chǎng)中歌曲下載模型,采用控制變量法進(jìn)行多次灌水實(shí)驗(yàn),研究網(wǎng)絡(luò)水軍的危害性,明晰網(wǎng)絡(luò)水軍操控互聯(lián)網(wǎng)商品排名信息的過(guò)程,同時(shí)發(fā)現(xiàn)了網(wǎng)絡(luò)水軍影響互聯(lián)網(wǎng)文化市場(chǎng)的三點(diǎn)要素。
本文通過(guò)研究現(xiàn)場(chǎng)實(shí)驗(yàn)中歌曲試聽(tīng)和試聽(tīng)后下載的行為特點(diǎn),建立了互聯(lián)網(wǎng)文化市場(chǎng)中歌曲下載行為和網(wǎng)絡(luò)水軍灌水行為的仿真模型。其中,互聯(lián)網(wǎng)歌曲下載行為模型分為兩個(gè)階段:第一階段只受社會(huì)影響力影響選擇試聽(tīng)歌曲;第二階段只受歌曲質(zhì)量影響決定試聽(tīng)后是否下載。兩個(gè)階段歌曲下載行為如圖1所示。
在Salganik等設(shè)計(jì)的現(xiàn)場(chǎng)實(shí)驗(yàn)中[3],共邀請(qǐng)了14 341個(gè)志愿者試聽(tīng)48首不流行的歌曲,志愿者可以根據(jù)他們的喜好選擇是否下載歌曲。歌曲以16×3網(wǎng)格(實(shí)驗(yàn)1)或單個(gè)列(實(shí)驗(yàn)2)的形式展示在屏幕上,志愿者被隨機(jī)分配到兩個(gè)實(shí)驗(yàn)中。
如圖2所示,兩個(gè)實(shí)驗(yàn)又分別分為有社會(huì)影響和無(wú)社會(huì)影響兩種條件。在無(wú)社會(huì)影響條件對(duì)照下,志愿者僅能看見(jiàn)歌曲名稱和演唱者,去決定試聽(tīng)的歌曲,因此仿真模型通過(guò)無(wú)社會(huì)影響條件下仿真下載次數(shù)刻畫(huà)歌曲質(zhì)量q。在有社會(huì)影響仿真條件下,志愿者還能夠看到先前志愿者的下載次數(shù);在這種條件下,除了志愿者個(gè)人的音樂(lè)偏好,還加入了社會(huì)影響力s。在有社會(huì)影響仿真條件下,志愿者被隨機(jī)分到8個(gè)組中,每組相互獨(dú)立。通過(guò)研究多個(gè)相互平行的獨(dú)立組,進(jìn)而研究文化市場(chǎng)中的不可預(yù)測(cè)性。在無(wú)社會(huì)影響仿真條件下,志愿者被隨機(jī)分為兩部分進(jìn)行不可預(yù)測(cè)性研究。
圖2 志愿者社會(huì)影響力分組
仿真模型假設(shè):
(1)歌曲質(zhì)量q服從正態(tài)分布。
(2)志愿者i試聽(tīng)歌曲li數(shù)量服從正態(tài)分布。
(3)志愿者下載歌曲的數(shù)量d服從正態(tài)分布,仿真初始時(shí),歌曲下載次數(shù)d均為0。
(4)在無(wú)社會(huì)影響條件下(即社會(huì)影響力s=0),試聽(tīng)歌曲為隨機(jī)選擇;在有社會(huì)影響條件下(即社會(huì)影響力s≠0),試聽(tīng)歌曲受先前下載次數(shù)和隨機(jī)值擾動(dòng)共同影響,社會(huì)影響力s符合正態(tài)分布。
(5)志愿者i個(gè)人偏好εi決定歌曲是否下載。
建立互聯(lián)網(wǎng)文化市場(chǎng)中歌曲下載行為仿真模型的具體過(guò)程如下:
階段1:選擇試聽(tīng)歌曲。
志愿者i受社會(huì)影響力s影響,根據(jù)列表中歌曲j下載次數(shù)的市場(chǎng)份額?j,利用隨機(jī)值ri進(jìn)行擾動(dòng),決定志愿者i試聽(tīng)歌曲j的概率為:
根據(jù)志愿者i試聽(tīng)歌曲能力Ci,利用Order排序算子,找到志愿者i試聽(tīng)歌曲概率從大到小前Ci首歌曲,即:
階段2:決定是否下載試聽(tīng)歌曲。
志愿者i的個(gè)人偏好εi由市場(chǎng)品位差異μ和歌曲j的質(zhì)量qi共同影響,利用隨機(jī)值ri進(jìn)行擾動(dòng),得到志愿者i對(duì)歌曲j的個(gè)人偏好程度。
如果志愿者i對(duì)歌曲j的個(gè)人偏好程度εi,j,達(dá)到下載閾值ti,該歌曲即被下載一次,反之則不被下載,可以表示為:
至此,建立了互聯(lián)網(wǎng)文化市場(chǎng)中歌曲下載行為的仿真模型,接下來(lái)建立互聯(lián)網(wǎng)文化市場(chǎng)中網(wǎng)絡(luò)水軍灌水實(shí)驗(yàn)?zāi)P汀?/p>
歌曲j的勝出概率θi,α,表示在一次仿真實(shí)驗(yàn)中,網(wǎng)絡(luò)水軍對(duì)歌曲j集中下載α次(即灌水量為α),重復(fù)仿真實(shí)驗(yàn)x次,歌曲j在n首歌曲中下載次數(shù)排名達(dá)到前y名(即勝出)的概率。首先,利用Order排序算子對(duì)歌曲j的下載次數(shù)從高到低進(jìn)行排名,歌曲j在灌水量為α的排名次序?yàn)椋?/p>
利用πj,α判斷歌曲j下載次數(shù)排名是否達(dá)到前y名,即:
仿真實(shí)驗(yàn)進(jìn)行x次的勝出概率為:
在Salganik等的現(xiàn)場(chǎng)實(shí)驗(yàn)中,用基尼系數(shù)G衡量互聯(lián)網(wǎng)文化市場(chǎng)的不均衡性[3],計(jì)算公式為:
其中,?i表示歌曲i的地位,即歌曲i市場(chǎng)下載份示第i首歌曲的下載次數(shù),n表示市場(chǎng)中歌曲的數(shù)量。
一個(gè)歌曲市場(chǎng)的不可預(yù)測(cè)性U表示為:
其中,U表示一個(gè)歌曲市場(chǎng)的不可預(yù)測(cè)性,n表示市場(chǎng)中歌曲的數(shù)量,ui表示一首歌曲i在影響條件相同下不同組(組或子集)中地位的平均差異,可以表示為:
其中,?i,j表示歌曲i在組j的市場(chǎng)下載份額,W表示組的數(shù)量。
模型中主要參數(shù)值及含義如表1所示。其中,n、p、l、t的參數(shù)值是對(duì)現(xiàn)場(chǎng)實(shí)驗(yàn)提供的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析得到的。s、μ的參數(shù)值選取是由于基尼系數(shù)隨s的增大而單調(diào)遞增、隨μ的增大而單調(diào)遞減,根據(jù)現(xiàn)場(chǎng)實(shí)驗(yàn)的基尼系數(shù)計(jì)算得到的。x、y的參數(shù)值是本文根據(jù)灌水實(shí)驗(yàn)設(shè)定的。由于本文將無(wú)社會(huì)影響條件作為對(duì)照,所以在無(wú)社會(huì)影響條件下實(shí)驗(yàn)一與實(shí)驗(yàn)二參數(shù)一致。
表1 模型中的主要參數(shù)值
建立仿真模型后,通過(guò)與現(xiàn)場(chǎng)實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比分析,驗(yàn)證仿真模型的有效性。本文從互聯(lián)網(wǎng)文化市場(chǎng)中的不均衡性和不可預(yù)測(cè)性兩個(gè)方面具體分析,互聯(lián)網(wǎng)文化市場(chǎng)中的不均衡性采用基尼系數(shù)G衡量,實(shí)驗(yàn)結(jié)果如圖3所示。比較仿真模型和現(xiàn)場(chǎng)實(shí)驗(yàn)中互聯(lián)網(wǎng)文化市場(chǎng)的不可預(yù)測(cè)性U,結(jié)果如圖4所示。
圖3 不同社會(huì)影響力對(duì)互聯(lián)網(wǎng)文化市場(chǎng)基尼系數(shù)的影響
圖4 不同社會(huì)影響力對(duì)互聯(lián)網(wǎng)文化市場(chǎng)不可預(yù)測(cè)性的影響
通過(guò)圖3與圖4實(shí)驗(yàn)結(jié)果可以看到,仿真模型與現(xiàn)場(chǎng)實(shí)驗(yàn)擬合度很高,說(shuō)明本文的仿真模型擬合效果良好。
當(dāng)網(wǎng)絡(luò)水軍在灌水時(shí)刻T=0,歌曲質(zhì)量q隨機(jī)的條件下,對(duì)互聯(lián)網(wǎng)文化市場(chǎng)中的歌曲進(jìn)行灌水,灌水量α從1增長(zhǎng)至100,每個(gè)灌水量α對(duì)應(yīng)實(shí)驗(yàn)100次,被灌水歌曲的勝出概率θ如圖5所示。從圖5可知,隨著灌水量α的不斷增多,兩組實(shí)驗(yàn)勝出概率θ隨之升高。當(dāng)灌水量α達(dá)到35,兩組實(shí)驗(yàn)的被灌水歌曲均勝出,可見(jiàn)網(wǎng)絡(luò)水軍的參與使得文化市場(chǎng)勝出的預(yù)測(cè)成為可能。
圖5 互聯(lián)網(wǎng)文化市場(chǎng)被灌水歌曲勝出概率
社會(huì)影響力在本實(shí)驗(yàn)中具體表示為歌曲排名對(duì)參與者選擇試聽(tīng)歌曲的影響力。社會(huì)影響力越大,表示參與者對(duì)歌曲排名越信賴,越容易選擇試聽(tīng)勝出歌曲,也就越容易受到灌水的影響。因此,在初始階段,實(shí)驗(yàn)一的仿真參與者受到灌水影響小,所以被灌水歌曲勝出概率低于實(shí)驗(yàn)二。最終實(shí)驗(yàn)一先于實(shí)驗(yàn)二達(dá)到百分之百勝出,這是由于實(shí)驗(yàn)二的市場(chǎng)不可預(yù)測(cè)性大。所以,互聯(lián)網(wǎng)文化市場(chǎng)的社會(huì)影響力越大,市場(chǎng)的不可預(yù)測(cè)性越大。
如果網(wǎng)絡(luò)水軍在歌曲質(zhì)量q隨機(jī),灌水時(shí)刻T不同的條件下,在兩組實(shí)驗(yàn)中對(duì)文化市場(chǎng)中的一首歌曲進(jìn)行灌水,灌水量α從1增長(zhǎng)至100,每個(gè)灌水量α對(duì)應(yīng)實(shí)驗(yàn)100次,被灌水歌曲的勝出概率θ如圖6所示。圖6顯示,T越小,即灌水時(shí)間越早,同樣灌水量的被灌水歌曲勝出概率越大,且實(shí)驗(yàn)二中不同T曲線差異更大,即社會(huì)影響力越大,灌水時(shí)間對(duì)勝出概率的影響越明顯。
圖6 互聯(lián)網(wǎng)文化市場(chǎng)灌水效果受灌水時(shí)刻影響
如果網(wǎng)絡(luò)水軍在灌水時(shí)刻T=0,歌曲質(zhì)量q不同的條件下,在兩組實(shí)驗(yàn)中對(duì)文化市場(chǎng)中的一首歌曲進(jìn)行灌水,灌水量α從1增長(zhǎng)至100,每個(gè)灌水量α對(duì)應(yīng)實(shí)驗(yàn)100次,則被灌水歌曲的勝出概率θ的數(shù)據(jù)結(jié)果如圖7所示。
圖7 互聯(lián)網(wǎng)文化市場(chǎng)灌水效果受歌曲質(zhì)量影響(含灌水)
圖7顯示,在兩組實(shí)驗(yàn)中,歌曲質(zhì)量q即排名越高,完全勝出所需的灌水量越少。當(dāng)歌曲質(zhì)量最差,即q=48時(shí),對(duì)兩組實(shí)驗(yàn)灌水量α=10,該歌曲才有可能勝出,且勝出概率θ極低;對(duì)兩組實(shí)驗(yàn)灌水量α=40,歌曲可以完全勝出。這表明當(dāng)歌曲質(zhì)量很差時(shí),對(duì)該歌曲進(jìn)行少量灌水,是不能達(dá)到勝出效果的;而對(duì)該歌曲進(jìn)行大量灌水時(shí),該歌曲雖然可以勝出,但其中包含大量灌水,就沒(méi)有達(dá)到網(wǎng)絡(luò)水軍快速有效的操控網(wǎng)民意識(shí)的作用。
在現(xiàn)實(shí)網(wǎng)絡(luò)文化市場(chǎng)中,灌水量是不會(huì)被刪除的。為了分析灌水之后,下載次數(shù)中有多少是網(wǎng)民的下載量,本研究在灌水影響網(wǎng)民之后再減去灌水量α的勝出概率θ得到圖8。從圖8中可以看出,在互聯(lián)網(wǎng)文化市場(chǎng)中,灌水效果也是由商品質(zhì)量決定的,商品質(zhì)量太差,那么即使灌水再多,效果也不好。也證明了在互聯(lián)網(wǎng)文化市場(chǎng)中,質(zhì)量好的商品,勝出概率不會(huì)很低,質(zhì)量差的商品,勝出概率很難很高,而商品質(zhì)量一般的, 則難以預(yù)測(cè)。
圖8 互聯(lián)網(wǎng)文化市場(chǎng)灌水效果受歌曲質(zhì)量影響(不含灌水)
本研究得出以下結(jié)論:(1)網(wǎng)絡(luò)水軍的參與使得網(wǎng)絡(luò)歌曲勝出的預(yù)測(cè)成為可能,網(wǎng)絡(luò)水軍的灌水量越大,網(wǎng)絡(luò)歌曲的勝出概率越大。(2)互聯(lián)網(wǎng)文化市場(chǎng)的社會(huì)影響力越大,歌曲排名受網(wǎng)絡(luò)水軍的影響越明顯。(3)網(wǎng)絡(luò)水軍灌水時(shí)間越早,被灌水歌曲勝出概率越大,并且社會(huì)影響力越大,灌水時(shí)間對(duì)勝出概率的影響越明顯。(4)被灌水歌曲質(zhì)量越高,其勝出概率越大;如果被灌水歌曲質(zhì)量過(guò)低,即使灌水再多,也不能控制網(wǎng)民意識(shí),達(dá)到營(yíng)銷目的。
網(wǎng)絡(luò)水軍蓄意操控網(wǎng)民意識(shí)的能力是不可忽視的,將影響互聯(lián)網(wǎng)市場(chǎng)的正常運(yùn)營(yíng)秩序。在未來(lái)的互聯(lián)網(wǎng)文化市場(chǎng)監(jiān)管中,應(yīng)采取有效措施防范治理網(wǎng)絡(luò)水軍灌水這一不正當(dāng)營(yíng)銷行為。
[1]GHOSE A,IPEIROTIS P G.Designing novel review ranking systems:predicting the usefulness and impact of reviews[A].ACM.Proceedings of the Ninth International Conference on Electronic Commerce[C].Minneapolis:ACM Press,2007.19-22.
[2]LIM K P.Ranking market efficiency for stock markets:a nonlinear perspective[J].Physica A:Statistical Mechanics and its Applications,2007,376:445-454.
[3]SALGANIK M J,DODDS P S,WATTS D J.Experimental study of inequality and unpredictability in an artificial cultural market[J].Science,2006,311(5762):854-856.
[4]MUCHNIK L,ARAL S,TAYLOR S J.Social influence bias:a randomized experiment[J].Science,2013,341(6146):647-651.
[5]CLAUSET A,SHALIZI C R,NEWMAN M E J.Powerlaw distributions in empirical data[J].SIAM Review,2009,51(4):661-703.
[6]大衛(wèi)·伊斯利,喬恩·克萊因伯格.網(wǎng)絡(luò)、群體與市場(chǎng)[M].李曉明,王衛(wèi)紅,楊韞利譯.北京:清華大學(xué)出版社,2011.30.
[7]譚真.“網(wǎng)絡(luò)水軍”百害無(wú)一利[N].光明日?qǐng)?bào),2012-12-31(14).
[8]王愛(ài)玲.網(wǎng)絡(luò)媒介下提升中國(guó)主流意識(shí)形態(tài)吸引力分析[J].大 連 理 工 大 學(xué) 學(xué) 報(bào) (社 會(huì) 科 學(xué) 版),2013,34(4):103-107.
[9]TANG J,SUN J,WANG C,et al.Social influence analysis in large-scale networks[A].ACM.Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining[C].New York:ACM Press,2009.807-816.
[10]DAVIS C J,BOWERS J S,MEMON A.Social influence in televised election debates:apotential distortion of democracy[J].Plos One,2011,6(3):1-7.
[11]CHEUNG C M K,LEE M K O.A theoretical model of intentional social action in online social networks[J].Decision Support Systems,2010,49(1):24-30.
[12]CAO W Y.Explore the role of QQ groups in Chinese tuishou operations[D].Macau:University of Macau,2011.
[13]CHEN C,WU K,SRINIVASAN V,et al.Battling the internet water army:detection of hidden paid posters[EB/OL].http://arxiv.org/abs/1111.4297Ⅴ1,2013-07-05.
大連理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2014年3期