唐長兵,曹夢文,陳凌鵬
(浙江師范大學(xué)數(shù)理與信息工程學(xué)院,金華 321004)
信息網(wǎng)絡(luò)化時(shí)代,虛擬空間與技術(shù)的興起,使在線社會(huì)網(wǎng)絡(luò)應(yīng)運(yùn)而生,不但方便了信息交流和分享,而且使社會(huì)活動(dòng)空間得以拓展,網(wǎng)絡(luò)動(dòng)態(tài)社區(qū)互動(dòng)模式廣受人們歡迎。在線社會(huì)網(wǎng)絡(luò)中涵蓋了兩個(gè)重要組成部分,社交網(wǎng)絡(luò)與社會(huì)媒體網(wǎng)絡(luò),前者的關(guān)系構(gòu)造基于現(xiàn)實(shí)生活當(dāng)中的家人和朋友的關(guān)系而建立,并確保其延伸到網(wǎng)絡(luò)之中,形成較為明顯的關(guān)聯(lián);后者則多呈現(xiàn)出單一關(guān)聯(lián)性,其中呈現(xiàn)的關(guān)系并不明顯。因此深入探究基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演化發(fā)展情況具有重要的意義。
在線社會(huì)網(wǎng)絡(luò)的演變發(fā)展過程當(dāng)中,部分動(dòng)態(tài)化的網(wǎng)絡(luò)主要以時(shí)間階段或者時(shí)間窗口的形成作為判斷和依據(jù),其中最為關(guān)鍵的重要問題便是如何科學(xué)利用數(shù)據(jù)信息,使其發(fā)揮出一定的可移動(dòng)性,讓實(shí)用性更加突出。鑒于分時(shí)間窗口數(shù)據(jù)收集情況的影響,一旦數(shù)據(jù)規(guī)模數(shù)量的下降低,必然會(huì)讓從前進(jìn)行觀察以及收集到的信息與數(shù)據(jù)無法發(fā)揮出相應(yīng)的作用,所運(yùn)用到的技術(shù)也受到了限制,比如:可能形成數(shù)據(jù)的缺少以及噪音數(shù)據(jù)的情況,對相關(guān)研究產(chǎn)生不良的影響。對于在線社會(huì)網(wǎng)絡(luò)構(gòu)造而言,其原有的稀疏性問題,導(dǎo)致分窗口當(dāng)中的數(shù)據(jù)也存在此種不良的情況,對有關(guān)計(jì)算造成一定的干擾。同時(shí)合理設(shè)置時(shí)間窗口也非常關(guān)鍵。
凡是存在于在線社會(huì)網(wǎng)絡(luò)當(dāng)中的個(gè)體,實(shí)際上都屬于現(xiàn)實(shí)生活當(dāng)中的真實(shí)的人,那么由于在線網(wǎng)絡(luò)當(dāng)中,人們的言語交流和互動(dòng)常會(huì)遭受到時(shí)間、空間、個(gè)人行為習(xí)慣以及社會(huì)環(huán)境等諸多因素的限制和影響,所以存在一定的隨機(jī)性,復(fù)雜特征十分明顯。那么以人為方式合理設(shè)置時(shí)間窗口,可以讓動(dòng)態(tài)網(wǎng)絡(luò)數(shù)據(jù)得以控制,把社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)演化的整個(gè)過程以清晰的數(shù)據(jù)形式呈現(xiàn),其中時(shí)間窗口長度與其劃分處的選擇又緊密相關(guān),直接對動(dòng)態(tài)社區(qū)的構(gòu)造、形成以及演化產(chǎn)生很大的影響。
基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演變發(fā)展的研究過程當(dāng)中,應(yīng)該注重動(dòng)態(tài)社區(qū)的變化發(fā)展情況,尤其針對動(dòng)態(tài)社區(qū)的相應(yīng)質(zhì)量以及其和相鄰時(shí)間段的社區(qū)之間的變化狀況,科學(xué)予以評價(jià)顯得十分重要和關(guān)鍵。對于各類不同的情景當(dāng)中,實(shí)際上對于動(dòng)態(tài)社區(qū)的界定是各不相同的,那么在其研究的過程當(dāng)中的評價(jià)方法選擇也應(yīng)該保證一定的合理性和適用性,以便針對各類的動(dòng)態(tài)社區(qū)加以分析。比如:對于以模塊度評價(jià)為主要根據(jù)的動(dòng)態(tài)社區(qū)的分析研究過程,則主要采用基于圖切的分析方法,以便達(dá)到良好的研究效果。那么,一般來說,對于同一網(wǎng)絡(luò)而言,為了深入探究在線社會(huì)網(wǎng)絡(luò)的演變情況,運(yùn)用不同的計(jì)算分析方法實(shí)施不同動(dòng)態(tài)社區(qū)的分析是非常必要的,從科學(xué)的評價(jià)體系當(dāng)中,最終獲得對動(dòng)態(tài)社區(qū)構(gòu)造情況的掌握。
從時(shí)間窗口設(shè)置、評定情況、社區(qū)數(shù)量設(shè)置以及數(shù)據(jù)質(zhì)量等方面的因素可知,基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演變進(jìn)程受到了很大的影響,并且出現(xiàn)了很多全新的研究模型與計(jì)算方法,以便有效掌握在線社會(huì)網(wǎng)絡(luò)演化與動(dòng)態(tài)社區(qū)之間的重要差異。從目前的相關(guān)研究發(fā)展情況來說,其中以時(shí)空獨(dú)立評價(jià)分析、時(shí)空集成評價(jià)分析以及統(tǒng)一評價(jià)分析等三種分析法作為主要研究方法?,F(xiàn)具體闡述如下:
運(yùn)用時(shí)空獨(dú)立評價(jià)法的過程當(dāng)中,是具有一定的獨(dú)立性的,以適用在線社會(huì)網(wǎng)絡(luò)演化發(fā)展研究為主,通過科學(xué)利用,達(dá)到掌握在線社會(huì)網(wǎng)絡(luò)演化發(fā)展中的規(guī)律的目的,同時(shí)針對其中的異常動(dòng)態(tài)的變化和意外事件予以了解?;诓煌膯栴}發(fā)生背景,很多研究人員結(jié)合動(dòng)態(tài)社區(qū)的發(fā)展情況,運(yùn)用各異的靜態(tài)在線社會(huì)網(wǎng)絡(luò)發(fā)現(xiàn)計(jì)算法,對單時(shí)間段快照之上的在線社會(huì)網(wǎng)絡(luò)構(gòu)造予以辨別。通過對在線社會(huì)網(wǎng)絡(luò)構(gòu)造演變情況的分析,以準(zhǔn)確的計(jì)算結(jié)果,掌握在線社會(huì)網(wǎng)絡(luò)演化發(fā)展的狀況。通常情況下,會(huì)以內(nèi)容、網(wǎng)絡(luò)節(jié)點(diǎn)、子構(gòu)造等諸多方面入手,從而掌握在線社會(huì)網(wǎng)絡(luò)演化指標(biāo)、動(dòng)態(tài)社區(qū)類型以及動(dòng)態(tài)社區(qū)相似度等情況。
利用Jaccard系數(shù)動(dòng)態(tài)社區(qū)相似度計(jì)算方法,實(shí)現(xiàn)對動(dòng)態(tài)社區(qū)關(guān)系的深入了解。學(xué)者Pallo曾在其相關(guān)研究中運(yùn)用有關(guān)公式計(jì)算,得出最終結(jié)果。下式依次表示的為臨近時(shí)間段不同的動(dòng)態(tài)社區(qū)構(gòu)造匹配度情況、表示的為不同序列狀態(tài)的相應(yīng)平均聯(lián)系情況。
式中,A(t)代表的是t時(shí)段的社區(qū);tc代表的為初始階段社區(qū)形成的時(shí)間;tamx代表的是社區(qū)最終消失的時(shí)間;|A|代表的是A社區(qū)的節(jié)點(diǎn)數(shù)量。
與此同時(shí),以信息論為基礎(chǔ)依據(jù)的歸一化信息NMI方法也較為常用,主要進(jìn)行的是動(dòng)態(tài)社區(qū)構(gòu)造的匹配度情況的計(jì)算,其中運(yùn)用到如下計(jì)算公式:
式中,CA,CB依次代表的為不同社區(qū)集中的設(shè)區(qū)數(shù)量情況;Nij,Ni,Nj依次代表的是i與j社區(qū)一起存在的節(jié)點(diǎn)數(shù)量、i社區(qū)的節(jié)點(diǎn)數(shù)量以及j社區(qū)的節(jié)點(diǎn)數(shù)量。
對于在線社區(qū)網(wǎng)絡(luò)的演化發(fā)展分析,主要基于動(dòng)態(tài)社區(qū)的演變下進(jìn)行,參考其鄰近時(shí)間快照之上的社區(qū)構(gòu)造的變化加以分析。具體來說,第一,對不同時(shí)間段區(qū)間的社區(qū)匹配予以準(zhǔn)確辨別分析,通常出現(xiàn)最大的共享邊或者最大的共享點(diǎn)的不同時(shí)間順序位置的社區(qū)匹配最為明顯,可以體現(xiàn)出處于同一個(gè)社區(qū)之下的不同時(shí)間點(diǎn)的變化情況。
由于問題模型當(dāng)中存在的需要分析對象是不相同的,所以可以采用不同的評價(jià)分析計(jì)算方法。其中基于進(jìn)化聚類的計(jì)算方法是較為常用的。鑒于基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演化發(fā)展是和挖掘數(shù)據(jù)過程當(dāng)中的進(jìn)化聚類相關(guān)問題的分析非常相近的。因此有外國學(xué)者早在2009年的相關(guān)研究論著之中首次提出了進(jìn)化聚類的相關(guān)模型與問題,使進(jìn)化聚類過程當(dāng)中的每一個(gè)時(shí)間段t之上的任務(wù)模型最大化,形成下述的目標(biāo)函數(shù)。
sq()-cp,hc(Ct-1,Ct)
式中,sq表示的為時(shí)間面上的聚類質(zhì)量;Ct,Mt則分別代表的為t時(shí)間段的聚類模型與真實(shí)網(wǎng)絡(luò)構(gòu)造;hc表示的為臨近時(shí)間段的聚類模型的平滑性評價(jià)情況;cp表示的為用戶自行設(shè)定的某個(gè)參數(shù)。實(shí)際上,此分析模型也可以理解為,通過相應(yīng)的權(quán)重將時(shí)間段快照之上的社區(qū)質(zhì)量的評定與時(shí)間段中發(fā)生的演變情況評價(jià)作和,形成相應(yīng)的綜合評價(jià)標(biāo)準(zhǔn),最后實(shí)現(xiàn)最優(yōu)化的效果。其中所需要進(jìn)行完善優(yōu)化的宗旨便是確保快照質(zhì)量最大化,演化開銷最小化。與此同時(shí),還有國外相關(guān)學(xué)者使用了k-means計(jì)算法、相似計(jì)算方法以及進(jìn)化譜聚類計(jì)算法等多種方法,分析了基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演化過程當(dāng)中的短期平滑性特點(diǎn),并且參考進(jìn)化聚類的思想理念,以信息理論作為依據(jù),運(yùn)用下述公式進(jìn)行了單時(shí)間快照社區(qū)的有關(guān)評價(jià)與多快照區(qū)間的演化評定加權(quán)和的分析和計(jì)算,以便達(dá)到最終的優(yōu)化宗旨。
在以上的計(jì)算公式當(dāng)中,主要將網(wǎng)絡(luò)模型與實(shí)際網(wǎng)絡(luò)的演化狀況的擬合差異度數(shù)值當(dāng)作快照之上的社區(qū)評價(jià),如下式所示。
通過將臨近時(shí)間段上的社區(qū)構(gòu)造的差別度情況當(dāng)作在線社會(huì)網(wǎng)絡(luò)演化分析的重要參考,即動(dòng)態(tài)社區(qū)的演化評定,如下式所示。
式中,Xt表示的為nhm矩陣,指的為在t時(shí)刻的n個(gè)節(jié)點(diǎn)處于m個(gè)社區(qū)當(dāng)中所產(chǎn)生的交互概率覆蓋情況;At表示的為在t時(shí)刻的社區(qū)與社區(qū)之間的交互情況。
所謂基于隱空間分析法,其作用理念可以理解為把動(dòng)態(tài)社區(qū)的構(gòu)造當(dāng)作網(wǎng)絡(luò)構(gòu)造的隱空間,并且說明了社區(qū)構(gòu)造的隱空間之上,相較于遠(yuǎn)距離節(jié)點(diǎn),近距離節(jié)點(diǎn)之間構(gòu)件相應(yīng)的關(guān)聯(lián)更加簡單,但是需要具備下述幾點(diǎn)前提條件:第一,相鄰近的時(shí)間段的隱空間構(gòu)造的變化趨于平緩;第二,動(dòng)態(tài)社區(qū)在演化過程當(dāng)中的t+1狀態(tài)下的隱空間與t時(shí)刻之前的隱空間沒有關(guān)聯(lián),只和t時(shí)刻下的隱空間緊密相關(guān);第三,目前的測定數(shù)值只和目前的隱空間的構(gòu)造情況緊密相關(guān)。當(dāng)滿足上述前提條件之后,對于基于動(dòng)態(tài)社區(qū)演化下的在線社會(huì)網(wǎng)絡(luò)演化的分析,便可以集中到最大后驗(yàn)概率的求解上,如下式所示。其中的后驗(yàn)概率模型主要包含2個(gè)不同的組成部分,分別為測定模型與轉(zhuǎn)化模型,前者主要指的為處于同一時(shí)間段快照之上所隱含的網(wǎng)絡(luò)構(gòu)造形成的測定網(wǎng)絡(luò)的概率模型,后者則指的為相臨近時(shí)間段快照之上所隱含的網(wǎng)絡(luò)構(gòu)造形成的概率模型。
式中,Xt,Xt-1依次是t,t-1時(shí)刻下的隱含的網(wǎng)絡(luò)構(gòu)造;Gt代表的是t時(shí)刻下的測定網(wǎng)絡(luò)。
通過采用此種分析計(jì)算方法,可以掌握符合后驗(yàn)概率最大化的社區(qū)情況,通過結(jié)合單時(shí)間段快照當(dāng)中的社區(qū)構(gòu)造和觀察到的網(wǎng)絡(luò)擬合情況加以合理評價(jià),掌握相臨近的社區(qū)構(gòu)造的相似性特征,從而為分析在線社會(huì)網(wǎng)絡(luò)的演化提供借鑒。
從此次論文的分析和闡述中可知,深入探究基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演化發(fā)展情況具有重要的意義,其重要性不言而喻,十分有利于相關(guān)研究者針對在線社會(huì)網(wǎng)絡(luò)演變發(fā)展情況的深入分析。為此,本文通過闡述基于動(dòng)態(tài)社區(qū)下現(xiàn)在社會(huì)網(wǎng)絡(luò)演化發(fā)展中的關(guān)鍵因素:注重?cái)?shù)據(jù)質(zhì)量并合理設(shè)置時(shí)間窗口、科學(xué)予以評價(jià)并注意社區(qū)數(shù)量與演化,同時(shí)分析了基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演化情況:時(shí)空獨(dú)立評價(jià)分析法的應(yīng)用、時(shí)空集成評價(jià)分析法的應(yīng)用、基于隱空間分析法的應(yīng)用。望此次的研究的內(nèi)容和結(jié)果,能夠得到有關(guān)部門人員的關(guān)注與重視,并從中獲取到相應(yīng)的啟示,從而有利于我國在線社會(huì)網(wǎng)絡(luò)演化的分析和研究發(fā)展。
[1] 王文,凡慶濤,楊萍.基于動(dòng)態(tài)社區(qū)下的在線社會(huì)網(wǎng)絡(luò)演化研究和分析[J].管理觀察,2017,38(17):46-49.