編譯 翟立建
如果社會(huì)個(gè)體之間的相互作用可以描述,那么社會(huì)集體行為就可以建模和分析。
2 4年前,2008年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主保羅·克魯格曼(Paul Krugman)寫道:“經(jīng)濟(jì)學(xué)比物理學(xué)更難;幸運(yùn)的是,不如社會(huì)學(xué)難?!?3年前,多因·法默(Doyne Farmer,圣塔菲研究所金融經(jīng)濟(jì)學(xué)家)、馬丁·舒彼克(Martin Shubik,耶魯大學(xué)數(shù)理制度經(jīng)濟(jì)學(xué)家)和埃里克·史密斯(Eric Smith,圣塔菲研究所自組織研究專家)提出了這樣一個(gè)問(wèn)題:經(jīng)濟(jì)學(xué)是一門新的物理科學(xué)嗎?如果你過(guò)去對(duì)社會(huì)學(xué)是一門新的物理科學(xué)表示懷疑,那么現(xiàn)在你可能會(huì)更加懷疑。
對(duì)這兩個(gè)學(xué)科的正常懷疑可能確實(shí)比今天一些物理學(xué)論文中的過(guò)度樂(lè)觀要好。但是,在物理學(xué)和社會(huì)科學(xué)交叉地帶有取得豐碩成果的跡象,其中大部分與計(jì)算社會(huì)科學(xué)這一新興領(lǐng)域有關(guān)。這種趨勢(shì)是由工程師和計(jì)算機(jī)科學(xué)家提供的新的社會(huì)數(shù)據(jù)驅(qū)動(dòng)的,工程師制造了記錄我們?nèi)粘I顢?shù)據(jù)的傳感器,計(jì)算機(jī)科學(xué)家研發(fā)了收集這些數(shù)據(jù)的專門軟件。為了闡明社會(huì)學(xué)、經(jīng)濟(jì)學(xué)與物理學(xué)之間發(fā)展中的關(guān)系,我們不妨回到歷史。
蘇格蘭哲學(xué)家休謨(David Hume,1711—1767)在著作《人性論》(A Treatise of Human Nature)中提出以數(shù)學(xué)和物理的精神建立人類的新科學(xué)。在19世紀(jì),新的物理理論出現(xiàn)。電磁學(xué)表明,電和磁兩種看似不同的現(xiàn)象其實(shí)可以從共同角度理解。熱力學(xué)引入了一個(gè)新的抽象概念:“系統(tǒng)”。法國(guó)哲學(xué)家?jiàn)W古斯特·孔德(1798—1857)提出,社會(huì)遵循一般規(guī)律,就像物理世界一樣。為了確定法律的經(jīng)驗(yàn)基礎(chǔ),比利時(shí)統(tǒng)計(jì)學(xué)家阿道夫·凱特勒(Adolphe Quetelet,1796—1874)將概率論應(yīng)用于有關(guān)人類的數(shù)據(jù)。在他的著作《論社會(huì)物理學(xué)》(Essays on Social Physics,1835年)中,他根據(jù)正態(tài)分布導(dǎo)出了普通人的統(tǒng)計(jì)規(guī)律。例如,他定義了體重指數(shù)來(lái)量化肥胖,他還分析了犯罪和公共衛(wèi)生。凱特勒用“社會(huì)物理學(xué)”這個(gè)術(shù)語(yǔ)稱呼自己的統(tǒng)計(jì)方法,孔德知曉之后,造了“社會(huì)學(xué)”一詞來(lái)稱呼他的人類和社會(huì)新科學(xué)。
20世紀(jì),在設(shè)計(jì)新的基礎(chǔ)理論時(shí),物理學(xué)再次成為模板。相對(duì)論修正了空間和時(shí)間的概念,量子力學(xué)引入了不確定性原理,二者為觀察者的角色和觀察過(guò)程帶來(lái)新的認(rèn)識(shí)?,F(xiàn)代物理學(xué)對(duì)哲學(xué)和社會(huì)科學(xué)有著廣泛的影響,其影響程度似乎令人驚嘆。20世紀(jì)后半葉,這種影響不再是通過(guò)一般理論,而是通過(guò)通用和抽象的建模方法。早在20世紀(jì)40年代,晶格模型(lattice models,后來(lái)被廣泛稱為元胞自動(dòng)機(jī))就被用于研究社會(huì)隔離(social segregation)。這些模型具有可調(diào)參數(shù),如遷移距離、街區(qū)內(nèi)可容忍居民與不可容忍居民的比例。
元胞自動(dòng)機(jī)的價(jià)值明顯在于其模擬和可視化社會(huì)動(dòng)力學(xué)的能力。然而,一些元胞自動(dòng)機(jī)也可以進(jìn)行正式分析。恩斯特·伊辛(Ernst Ising)在1924年提出了伊辛模型,作為解釋鐵磁性的抽象自旋系統(tǒng)。具有 +1 或-1值的旋轉(zhuǎn)位于一維或二維晶格上。根據(jù)相鄰自旋之間的成對(duì)耦合常數(shù)的強(qiáng)度,從伊辛模型中可得到鐵磁相(各格點(diǎn)的自旋值都相同,稱為自旋平行)或反鐵磁相(相鄰自旋值都不同,也稱自旋反平行)。通用模型后來(lái)成為觀點(diǎn)動(dòng)力學(xué)的典范,正面和反面的旋轉(zhuǎn)代表不同觀點(diǎn)。但是,伊辛模型在社會(huì)現(xiàn)象方面獲得的洞察力是相當(dāng)有限的。在觀點(diǎn)動(dòng)力學(xué)中,我們比較感興趣的是兩個(gè)問(wèn)題,一是達(dá)成共識(shí)的條件(對(duì)應(yīng)于鐵磁相),二是不同觀點(diǎn)如何穩(wěn)定共存。選民模型和其他簡(jiǎn)化模型形式化了此類的分析,并且把這類分析擴(kuò)展到各種的拓?fù)浣Y(jié)構(gòu),包括網(wǎng)絡(luò)。但選民們并不在這些模式中投票。相反,他們復(fù)制了隨機(jī)選擇的自旋的 “觀點(diǎn)”。
圖1 文化動(dòng)力學(xué)。二維正則點(diǎn)陣上每個(gè)個(gè)體(agent)為代表其文化的特征向量,特征可以是飲食、宗教等,其不同的可能性(如粵語(yǔ)、佛教等)稱為特質(zhì)。圖上不同的深淺表示不同的文化。一個(gè)個(gè)體與近鄰個(gè)體相互作用的概率隨特質(zhì) 重疊程度而增大。因此相似的個(gè)體會(huì)變得更加相似。模擬初始時(shí)刻,給各個(gè)體隨機(jī)賦予特質(zhì)(見(jiàn)左圖),大部分情況導(dǎo)致共享相同文化的個(gè)體的共存(見(jiàn)右圖),其他模擬則形成單一文化
這些模型令社會(huì)物理學(xué)家興致盎然,但并沒(méi)有給社會(huì)學(xué)家?guī)?lái)什么影響。復(fù)制物理見(jiàn)解(如相變和標(biāo)度定律)的一般建模方法可能會(huì)揭示很多關(guān)于統(tǒng)計(jì)物理的知識(shí),但很少揭示關(guān)于社會(huì)動(dòng)力學(xué)的知識(shí)。僅僅使用物理隱喻和類比并不能使物理獲得應(yīng)用,物理學(xué)家注意到現(xiàn)有的社會(huì)理論屬于極少數(shù)情況下的明顯例外。其中一個(gè)例子就是社會(huì)影響理論(social impacttheory),社會(huì)心理學(xué)家在20世紀(jì)80年代提出了這一理論,用以描述個(gè)人如何成為社會(huì)影響的來(lái)源和目標(biāo)。這個(gè)理論的基礎(chǔ)是社會(huì)力的概念,與物理力的概念類似。個(gè)人可以說(shuō)服與自己意見(jiàn)相左的人,支持與自己意見(jiàn)相同的人,但是他們的影響力與社交距離呈比例關(guān)系。將這種相互作用進(jìn)行計(jì)算機(jī)模擬時(shí),能觀察到志同道合的個(gè)體形成團(tuán)體,但是這種現(xiàn)象比伊辛模型之類的模型要豐富得多。
社會(huì)理論應(yīng)用于社會(huì)物理學(xué)并取得豐碩成果的另一個(gè)例子是文化傳播模型。文化傳播模型是美國(guó)政治學(xué)家羅伯特·阿克塞爾羅德(Robert Axelrod)于1997年最早提出的(見(jiàn)圖1)。其社會(huì)物理學(xué)版本可以看作是波次(Potts)模型中的意見(jiàn)動(dòng)力學(xué)的一般化。Potts模型是伊辛模型的推廣,其自旋可以具有兩個(gè)以上的值。文化傳播模型旨在結(jié)合社會(huì)機(jī)制,如同化(個(gè)體通過(guò)互動(dòng)變得更加相似)、同質(zhì)(相似的人互動(dòng)更頻繁)。
20世紀(jì)70年代,自組織(現(xiàn)在復(fù)雜系統(tǒng)理論的前身)等概念形成,不同的社會(huì)物理模型遍地開(kāi)花。自組織被看作是一個(gè)普遍的概念: 系統(tǒng)動(dòng)力學(xué)的關(guān)鍵不是系統(tǒng)的元素,而是它們的動(dòng)態(tài)交互。因此,對(duì)貝洛索夫-扎鮑廷斯基(Belousov-Zhabotinsky)反應(yīng)和其他物理化學(xué)系統(tǒng)的結(jié)構(gòu)形成原理的洞察可以推廣到生物或社會(huì)系統(tǒng)。自組織理論確實(shí)在社會(huì)物理學(xué)中找到了應(yīng)用,主要是作為社會(huì)動(dòng)力學(xué)的正式方法。它的應(yīng)用包括遷移和觀點(diǎn)動(dòng)力學(xué)。但是,正如其時(shí)代的典型,它缺乏與社會(huì)數(shù)據(jù)的聯(lián)系。
1995—2005年的10年間,隨著小規(guī)模模擬的便宜計(jì)算能力成為可能,社會(huì)物理學(xué)話題在物理學(xué)界開(kāi)始興起,幾乎所有社會(huì)問(wèn)題都被建模和模擬,意見(jiàn)動(dòng)力學(xué)、婚外情、有性生殖、語(yǔ)言演化、等級(jí)出現(xiàn)等,所有這些現(xiàn)象都引起了社會(huì)物理學(xué)家的注意。這些模型的優(yōu)點(diǎn)和缺點(diǎn)在于其簡(jiǎn)單化。比如,在模擬兒童如何學(xué)會(huì)說(shuō)話時(shí),生成機(jī)制(產(chǎn)生某種效應(yīng)的過(guò)程)是未經(jīng)證實(shí)的先驗(yàn)假設(shè)。對(duì)系統(tǒng)動(dòng)力學(xué)的生成機(jī)制的影響和某些反饋機(jī)制的作用進(jìn)行研究,并不需要將問(wèn)題的所有細(xì)節(jié)都考慮進(jìn)去。
最近,物理學(xué)家對(duì)社會(huì)經(jīng)濟(jì)問(wèn)題的興趣一定程度上是所謂大數(shù)據(jù)的驅(qū)動(dòng)。在20世紀(jì)90年代中期,物理學(xué)家開(kāi)始分析金融市場(chǎng)的大數(shù)據(jù),其熱情不亞于20世紀(jì)80年代中期分析高能物理實(shí)驗(yàn)的大數(shù)據(jù),導(dǎo)致了經(jīng)濟(jì)物理學(xué)的大發(fā)展。在2005年左右,物理學(xué)家開(kāi)始對(duì)互聯(lián)網(wǎng)上,尤其是在線社交網(wǎng)絡(luò)上的大數(shù)據(jù)感興趣,最關(guān)注是搜索數(shù)據(jù)中的特征模式和普遍的統(tǒng)計(jì)規(guī)律,與經(jīng)濟(jì)物理學(xué)的情況很類似。
經(jīng)濟(jì)物理學(xué)的探索很好地呼應(yīng)了凱特勒早期總結(jié)統(tǒng)計(jì)規(guī)律的工作,并得到很多有意思的發(fā)現(xiàn)。比如,人際交流中,兩緊鄰消息之間的時(shí)間間隔滿足冪律分布(見(jiàn)圖2),并且指數(shù)普遍適用于各種交流媒介。發(fā)現(xiàn)的其他普適分布還有比例代表制中的選舉投票、學(xué)術(shù)論文引用次數(shù)等。
圖2 人際交流似乎是無(wú)標(biāo)度現(xiàn)象。同一人發(fā)出的兩個(gè)連續(xù)消息之間的時(shí)間間隔,也稱為交互時(shí)間間隔:τ,遵循冪律分布P(τ)∝τ^(-α),其中α≈3/2。不管是何種媒介(信件、email、在線聊天)的分析,結(jié)果都很可靠(圖中所示)。曲線在103分鐘處的輕微鼓包表明的是以天為周期的節(jié)律性
這些發(fā)現(xiàn)恰說(shuō)明了英國(guó)經(jīng)濟(jì)學(xué)家尼古拉斯·卡爾多(Nicholas Kaldor)提出的“程式化事實(shí)”(stylized facts):即社會(huì)世界的規(guī)律性在不同的觀察中都是可靠的。物理學(xué)家發(fā)現(xiàn)了可以重現(xiàn)這種規(guī)律性的動(dòng)態(tài)機(jī)制,但并不聲稱這些機(jī)制能捕捉到社會(huì)互動(dòng)的要點(diǎn)。盡管如此,物理學(xué)家強(qiáng)調(diào)的普遍性也激起了經(jīng)濟(jì)學(xué)家和社會(huì)學(xué)家的關(guān)注,并對(duì)其重要性和起源提出了質(zhì)疑。如果社會(huì)現(xiàn)象屬于物理普遍性的范疇,這對(duì)人類意味著什么呢?如果社會(huì)現(xiàn)象不屬于物理普遍性的范疇,這對(duì)人類又意味著什么?
社會(huì)物理學(xué)當(dāng)前的趨勢(shì)與現(xiàn)在所謂的“計(jì)算社會(huì)科學(xué)”密切相關(guān),計(jì)算社會(huì)科學(xué)以數(shù)據(jù)驅(qū)動(dòng)的方式研究社會(huì)現(xiàn)象。這些數(shù)據(jù)顯示了人類在使用手機(jī)、在線社交網(wǎng)絡(luò)、搜索引擎、網(wǎng)上銀行等方面的電子化。社會(huì)學(xué)既沒(méi)有要求使用也沒(méi)有準(zhǔn)備好使用這樣的數(shù)據(jù)庫(kù),盡管數(shù)據(jù)庫(kù)將以往經(jīng)驗(yàn)分析的范圍擴(kuò)大了若干數(shù)量級(jí)。這樣就產(chǎn)生了數(shù)據(jù)空洞,這個(gè)空洞由工程師和計(jì)算機(jī)科學(xué)家填充,即工程師建造和安裝更多的傳感器,計(jì)算機(jī)科學(xué)家收集和處理巨量的數(shù)據(jù)。
亞歷克斯·彭特蘭(Alex Pentland)的著作《社會(huì)物理學(xué)》(Social Physics)和最近其他有關(guān)社會(huì)物理學(xué)的論著與物理學(xué)幾乎無(wú)關(guān),更多是關(guān)于大數(shù)據(jù)的分析。在這方面,他們與孔德哲學(xué)的初衷是共通的,即將知識(shí)建立在觀察和實(shí)驗(yàn)的基礎(chǔ)上。但是,大數(shù)據(jù)分析不去理解現(xiàn)象背后的一般機(jī)制,而是聚焦于以下方面:監(jiān)管過(guò)程(如交通流量)、開(kāi)發(fā)應(yīng)用程序(如利用大數(shù)據(jù)的優(yōu)步)、實(shí)際問(wèn)題(如預(yù)測(cè)熱門網(wǎng)購(gòu)產(chǎn)品)。
盡管大數(shù)據(jù)分析不注重對(duì)現(xiàn)象的理解,但大數(shù)據(jù)的新趨勢(shì)為創(chuàng)建完全基于數(shù)據(jù)處理的新社會(huì)科學(xué)帶來(lái)了希望。2008年,《連線》雜志主編、物理學(xué)家克里斯·安德森(Chris Anderson)在文章中寫道:“面對(duì)巨量數(shù)據(jù),假說(shuō)、模型、驗(yàn)證的科學(xué)方法已經(jīng)過(guò)時(shí)?!薄哆B線》雜志要報(bào)道的是千兆時(shí)代:“傳感器無(wú)處不在、無(wú)限存儲(chǔ)空間、云端處理器。我們捕獲、存儲(chǔ)、理解巨量數(shù)據(jù)的能力正在改變科學(xué)……隨著我們收集的事實(shí)和數(shù)字的增長(zhǎng),我們找到基本問(wèn)題的答案的機(jī)會(huì)也在增大。因?yàn)樵诖髷?shù)據(jù)時(shí)代,多不僅是多,多是不同。
亞歷克斯·彭特蘭的著作《社會(huì)物理學(xué)》
安德森聲稱:新科學(xué)由數(shù)據(jù)和技術(shù)驅(qū)動(dòng),這沒(méi)有什么錯(cuò)。但是,科學(xué)最重要的成分是(且一直是)研究的問(wèn)題。數(shù)據(jù)科學(xué)可能有助于回答一些基礎(chǔ)的研究問(wèn)題,但是本身卻不會(huì)提出問(wèn)題。首先收集數(shù)據(jù),然后查看可以提取哪些模式的做法將識(shí)別新的和主要是假的相關(guān)性,但這不會(huì)使我們理解因果關(guān)系。在社會(huì)學(xué)中,問(wèn)題不僅僅在于如何,還在于為什么。因此,我們需要新類型的模型來(lái)體現(xiàn)社會(huì)系統(tǒng)動(dòng)態(tài)背后的 “推理”。
開(kāi)發(fā)這樣的模型是物理學(xué)面臨的技術(shù)挑戰(zhàn)和概念挑戰(zhàn)。物理學(xué)家依賴對(duì)復(fù)雜系統(tǒng)的一般理解,而復(fù)雜系統(tǒng)是物理學(xué)家與其他學(xué)科的研究人員合作開(kāi)發(fā)的。復(fù)雜系統(tǒng)由大量強(qiáng)相互作用的元素組成,這些元素一般稱為個(gè)體(agent)。在統(tǒng)計(jì)物理學(xué)的傳統(tǒng)中,復(fù)雜系統(tǒng)的研究目的是預(yù)測(cè)個(gè)體相互作用的集體效應(yīng)。復(fù)雜系統(tǒng)研究主要有兩種形式化的方法:導(dǎo)出系統(tǒng)宏觀動(dòng)力學(xué)的隨機(jī)方程、建立系統(tǒng)模型的數(shù)值方法。事實(shí)上,基于粒子的模擬方法與基于個(gè)體的模型方法有頗多共同之處,前者應(yīng)用于計(jì)算物理學(xué),后者存在于社會(huì)學(xué)、經(jīng)濟(jì)學(xué)以及計(jì)算機(jī)科學(xué)。
如前所述,過(guò)去的大多數(shù)社會(huì)物理學(xué)模型旨在揭示一般觀點(diǎn),這些模型的有限復(fù)雜性不能反映任何特定社會(huì)系統(tǒng)的復(fù)雜性。因此,這些模型不能根據(jù)實(shí)際數(shù)據(jù)進(jìn)行校準(zhǔn)和驗(yàn)證,大數(shù)據(jù)也無(wú)法解決驗(yàn)證問(wèn)題。我們需要的模型是可以根據(jù)實(shí)際數(shù)據(jù)進(jìn)行校準(zhǔn)和驗(yàn)證的模型。
以前的大多數(shù)社會(huì)物理學(xué)模型所忽視的另一個(gè)問(wèn)題是個(gè)體本身的復(fù)雜性。表示人的個(gè)體幾乎不可能僅用向上和向下的自旋表示。人的決定反映了個(gè)人偏好、社會(huì)規(guī)范、他人影響等。把這些因素都考慮進(jìn)去不僅僅是增加自由度的問(wèn)題。在社會(huì)經(jīng)濟(jì)系統(tǒng)里,個(gè)體還是異質(zhì)的,即在類似情形下,個(gè)體卻有大為不同的相互作用方式。個(gè)體還具有適應(yīng)性,能通過(guò)從經(jīng)驗(yàn)中學(xué)習(xí)而對(duì)系統(tǒng)的激勵(lì)和變化做出響應(yīng)。同時(shí),個(gè)體還會(huì)通過(guò)消耗資源、創(chuàng)新等活動(dòng)改變系統(tǒng)。異質(zhì)性和適應(yīng)性使得對(duì)社會(huì)經(jīng)濟(jì)系統(tǒng)的預(yù)測(cè)變得非常困難。
成功的社會(huì)物理學(xué)模型往往與經(jīng)驗(yàn)數(shù)據(jù)和社會(huì)理論都有聯(lián)系。如果不聯(lián)系社會(huì)理論,人們也依然可以發(fā)現(xiàn)有趣的現(xiàn)象和新的結(jié)果;但是,在這樣的情況下,這些現(xiàn)象和結(jié)果如何與現(xiàn)有的學(xué)科知識(shí)進(jìn)行聯(lián)系并不清楚,發(fā)現(xiàn)的影響也比較低。與經(jīng)驗(yàn)數(shù)據(jù)的聯(lián)系有助于定義模型要解決的問(wèn)題,通常是在需要解釋或甚至創(chuàng)建的新數(shù)據(jù)方面。盡管機(jī)器學(xué)習(xí)方法本身也可以對(duì)數(shù)據(jù)進(jìn)行分類和做出預(yù)測(cè),但不能創(chuàng)建生成機(jī)制背后的模型。
成功的社會(huì)物理學(xué)模型也可以將微觀和宏觀聯(lián)系起來(lái),即將局域小尺度上的相互作用的個(gè)體與整個(gè)系統(tǒng)層面的大尺度上的動(dòng)力學(xué)聯(lián)系起來(lái),并且所建立的聯(lián)系是具體和可檢驗(yàn)的。理想情況下,這樣的社會(huì)物理學(xué)模型遵循數(shù)據(jù)驅(qū)動(dòng)建模的原則:根據(jù)相關(guān)學(xué)科(如語(yǔ)言學(xué)、人類學(xué))的標(biāo)準(zhǔn)對(duì)個(gè)體進(jìn)行建模,基于個(gè)體的模型允許用經(jīng)驗(yàn)數(shù)據(jù)校準(zhǔn)相互作用機(jī)制,模型將通過(guò)模擬的系統(tǒng)動(dòng)態(tài)與觀測(cè)的定量對(duì)比進(jìn)行驗(yàn)證。
該方法的一個(gè)應(yīng)用是行人動(dòng)力學(xué)。個(gè)體模型考慮到了行人間的社會(huì)力、優(yōu)先行進(jìn)方向、障礙。結(jié)果是行人集體動(dòng)態(tài)的實(shí)際模擬,可應(yīng)用于模擬恐怖襲擊或其他恐慌情形下的逃生動(dòng)態(tài),也可用于優(yōu)化建筑和街道的設(shè)計(jì)。類似的模型可描述各種動(dòng)物的群行現(xiàn)象。
成功數(shù)據(jù)模型的另一個(gè)例子是預(yù)測(cè)流行病的擴(kuò)散,比如:通過(guò)全球航空運(yùn)輸,根據(jù)校準(zhǔn)后的模型提出控制流行病的策略。第三個(gè)例子是模擬集體情緒動(dòng)態(tài),個(gè)體之間的情緒互動(dòng)的假說(shuō)已經(jīng)用數(shù)據(jù)進(jìn)行檢驗(yàn)。校準(zhǔn)后的模型可以正確重復(fù)多個(gè)在線平臺(tái)上的大尺度情緒影響。
人們?cè)趤嗰R遜網(wǎng)站上閱讀書籍和其他產(chǎn)品的評(píng)論時(shí),可以對(duì)評(píng)論進(jìn)行評(píng)級(jí),如有幫助或無(wú)幫助。人們也可能受到啟發(fā),撰寫并提交自己的評(píng)論,除了對(duì)產(chǎn)品進(jìn)行0至5星的評(píng)分外,還可以體現(xiàn)評(píng)論者的情緒,從惡語(yǔ)相加到熱情洋溢等。亞馬遜網(wǎng)購(gòu)客戶在情緒上相互影響的程度如何?
為解決這個(gè)問(wèn)題,我和同事大衛(wèi)·加西亞(David Garcia)分析了亞馬遜網(wǎng)上16 670 件產(chǎn)品的180萬(wàn)條匿名評(píng)論。我們用文本情感檢測(cè)器自動(dòng)對(duì)評(píng)論進(jìn)行打分[10分制、最低-5分(高度負(fù)面)、滿分5分(高度正面)、0分不計(jì)]。我們利用布朗個(gè)體框架(Brownian agent framework)得到了集體情緒分布。
行人、流行病、情緒動(dòng)態(tài)的模型似乎與電磁學(xué)、熱力學(xué)以及物理其他分支相距甚遠(yuǎn)。但是,與傳統(tǒng)物理一樣,這些模型使我們對(duì)真實(shí)世界的現(xiàn)象(這里是社會(huì)現(xiàn)象)理解更深刻。盡管物理學(xué)的概念不可以推廣至其他學(xué)科,但物理學(xué)方法可以對(duì)社會(huì)科學(xué)的系統(tǒng)建模作出大有裨益的貢獻(xiàn),尤其在一般方法方面。方法方面的貢獻(xiàn)不限于相互作用的系統(tǒng),還可延伸至統(tǒng)計(jì)模型,前者主要處理基于個(gè)體的模型,后者主要是檢驗(yàn)數(shù)據(jù)生成過(guò)程中的假設(shè)。
這些模型屬于機(jī)器學(xué)習(xí)的領(lǐng)域,因?yàn)橛芯蘖繑?shù)據(jù)可資利用。機(jī)器學(xué)習(xí)現(xiàn)在非常重要。高效處理TB級(jí)數(shù)據(jù)在技術(shù)上很有挑戰(zhàn);另外,因?yàn)閿?shù)據(jù)包含的關(guān)系信息,處理結(jié)構(gòu)復(fù)雜、中等數(shù)量的數(shù)據(jù)在科學(xué)上也很有挑戰(zhàn)。結(jié)構(gòu)復(fù)雜數(shù)據(jù)的例子有:朋友和家庭成員的在線社交網(wǎng)絡(luò)、學(xué)術(shù)論文引用網(wǎng)絡(luò)、專利數(shù)據(jù)庫(kù)和其他知識(shí)庫(kù)的搜索模式等。物理學(xué)家發(fā)展的信息提取方法超越了計(jì)算機(jī)科學(xué)或社會(huì)科學(xué)的方法。該方法屬于社會(huì)物理學(xué)的另一個(gè)領(lǐng)域:復(fù)雜網(wǎng)絡(luò)。我們下面詳細(xì)談?wù)劇?/p>
復(fù)雜網(wǎng)絡(luò)是復(fù)雜系統(tǒng)的一種表示方法。個(gè)體用節(jié)點(diǎn)表示,個(gè)體之間的相互作用用網(wǎng)絡(luò)的鏈接表示。系統(tǒng)的特征取決于相互作用的結(jié)構(gòu),即網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。和基于個(gè)體的模型相比,網(wǎng)絡(luò)模型有不同的強(qiáng)項(xiàng)和弱點(diǎn)。網(wǎng)絡(luò)節(jié)點(diǎn)(即個(gè)體)的內(nèi)部動(dòng)態(tài)沒(méi)有明確的模型。另外,所有類型的相互作用都分解為個(gè)體之間的兩兩相互作用。如果個(gè)體之間有多個(gè)相互作用,復(fù)雜網(wǎng)絡(luò)方法的適用性就很受限制。
另一方面,利用拓?fù)淠P蛯?duì)復(fù)雜系統(tǒng)進(jìn)行建模,在社會(huì)科學(xué)中產(chǎn)生了可應(yīng)用的、有影響力的見(jiàn)解。一個(gè)例子是小世界網(wǎng)絡(luò): 當(dāng)節(jié)點(diǎn)與其本地鄰居之間的某些鏈接重新連接到遙遠(yuǎn)的節(jié)點(diǎn)時(shí),這樣的網(wǎng)絡(luò)就會(huì)出現(xiàn)在正則晶格結(jié)構(gòu)中。重新布線會(huì)產(chǎn)生短路徑長(zhǎng)度 (任何兩個(gè)節(jié)點(diǎn)之間的連接) 和高聚類系數(shù)(三相鄰節(jié)點(diǎn)之間的鏈接形成三角形)。社會(huì)科學(xué)家已經(jīng)獨(dú)立討論過(guò)類似性質(zhì),因此他們可以把社會(huì)學(xué)的理論基礎(chǔ)與明確的生成機(jī)制聯(lián)系起來(lái)。
左圖 為框架示意圖,里面包含一個(gè)得到公認(rèn)的情緒影響心理模型:環(huán)形模型。個(gè)體的情緒狀態(tài)用效價(jià)v(valence)定量,效價(jià)表示情緒的愉悅度,取值范圍從-5(高度負(fù)面)到滿分5(高度正面)。喚醒度a(Arousal)表示情緒引起的活動(dòng),比如購(gòu)買或評(píng)價(jià)。當(dāng)a超過(guò)某閾值時(shí),個(gè)體就會(huì)表達(dá)某種情緒,情緒水平用s表示。個(gè)體通過(guò)社交媒體和其他方式傳播和接受情緒信息h,信息媒介受制于外部情緒影響I,比如主流媒體對(duì)產(chǎn)品的報(bào)道右圖 為將模型應(yīng)用于圖書《哈利波特與死亡圣器》所得模擬結(jié)果。淺條是評(píng)論的真實(shí)情感值,深條是對(duì)應(yīng)的模擬結(jié)果。研究表明,個(gè)人確實(shí)會(huì)受到其他人影響
另一個(gè)利用拓?fù)浣Y(jié)構(gòu)的例子是谷歌的佩奇排名(Page R-ank)。Page Rank算法根據(jù)鏈接到某網(wǎng)頁(yè)的其他網(wǎng)頁(yè)的數(shù)目和重要性來(lái)定量確定該網(wǎng)頁(yè)的重要性。從數(shù)學(xué)上講,Page Rank算法包含了一個(gè)本征值問(wèn)題的解;本征值問(wèn)題在物理學(xué)中是眾所周知的,其重要性度量與特征向量中心度有關(guān)。由于特征值問(wèn)題的一般性質(zhì),網(wǎng)頁(yè)排名根據(jù)其互連性而不是內(nèi)容來(lái)評(píng)估網(wǎng)站的相關(guān)性。
這種拓?fù)浞治鲂枰W(wǎng)絡(luò)的知識(shí),而網(wǎng)絡(luò)知識(shí)必須從數(shù)據(jù)中重建。默認(rèn)情況下,網(wǎng)絡(luò)是時(shí)間積累的,不考慮用戶到達(dá)一個(gè)給定的網(wǎng)頁(yè)前訪問(wèn)其他網(wǎng)頁(yè)的順序。然而,如果把時(shí)間相關(guān)性也包括進(jìn)去,重要性排序?qū)l(fā)生非常大的變化,可以獲得與內(nèi)容相關(guān)的信息(如圖3所示)。利用高階馬爾可夫模型可計(jì)算時(shí)間條件,在這種情況下,階表示瀏覽路徑中記憶的持久性。從馬爾可夫模型我們還可以確定:在什么條件下,重構(gòu)網(wǎng)絡(luò)時(shí)可以忽略時(shí)間相關(guān)性。
社會(huì)學(xué)家早已使用社會(huì)網(wǎng)絡(luò)分析來(lái)刻畫靜態(tài)網(wǎng)絡(luò)中節(jié)點(diǎn)的結(jié)構(gòu)位置。物理學(xué)家的主要貢獻(xiàn)是提供了集成方法。與統(tǒng)計(jì)熱力學(xué)一樣,復(fù)雜網(wǎng)絡(luò)中的整體決定何種拓?fù)浣Y(jié)構(gòu)能夠兼容:具體約束、各種可能的結(jié)構(gòu)、網(wǎng)絡(luò)的預(yù)期特性等。比如:利用集成方法,我們可以確定個(gè)體的特性,如性別、共同朋友、愛(ài)好、影響鏈接的形成。這樣的結(jié)果可用于形成關(guān)于因果機(jī)制的假說(shuō),社會(huì)學(xué)家可以在相關(guān)領(lǐng)域檢驗(yàn)該假說(shuō)。
圖3 高階網(wǎng)絡(luò)模型可以改善網(wǎng)站的信息排名,這可以通過(guò)分析用戶瀏覽維基百科的點(diǎn)擊數(shù)據(jù)加以說(shuō)明。兩圖展示了用PageRank算法獲得的排名前30位的維基百科條目。兩圖由相同的數(shù)據(jù)獲得,但有兩種網(wǎng)絡(luò)模型。一階模型只考慮維基百科條目的圖的結(jié)構(gòu),排名結(jié)果是含糊的。二階模型添加了隱藏于用戶訪問(wèn)順序的時(shí)間信息,排名結(jié)果更好匹配用戶認(rèn)為的最重要條目和更準(zhǔn)確的語(yǔ)義環(huán)境
物理、社會(huì)科學(xué)、計(jì)算機(jī)科學(xué)和工程在內(nèi)的所有學(xué)科都能從社會(huì)物理學(xué)和計(jì)算社會(huì)科學(xué)的研究中受益。在社會(huì)物理學(xué)和計(jì)算社會(huì)科學(xué)中,進(jìn)一步推進(jìn)研究的挑戰(zhàn)和障礙是什么?
無(wú)疑,制度方面要改革。大學(xué)教育應(yīng)該要開(kāi)設(shè)社會(huì)物理學(xué)所需相關(guān)知識(shí)的課程和學(xué)位,網(wǎng)絡(luò)科學(xué)和復(fù)雜系統(tǒng)領(lǐng)域的現(xiàn)有課程可以作為起點(diǎn)。社會(huì)物理學(xué)還需要高質(zhì)量的學(xué)術(shù)期刊,期刊以課題和問(wèn)題為中心而不是以方法和學(xué)科為中心;相關(guān)科研成果可以集中展示在這樣的期刊上,這樣就不會(huì)散落于各學(xué)科的邊緣,得不到廣泛關(guān)注。教職招聘和評(píng)定委員會(huì)也應(yīng)該認(rèn)識(shí)到多學(xué)科背景的科學(xué)家額外努力的價(jià)值。
必須鼓勵(lì)不同學(xué)科的人互相尊重彼此對(duì)學(xué)科的貢獻(xiàn)?;ハ嘧鹬氐钠瘘c(diǎn)可以是承認(rèn):在當(dāng)下,沒(méi)有一個(gè)學(xué)科具備真正理解人類社會(huì)的所有工具、方法、理論、知識(shí)。數(shù)據(jù)挖掘、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)以及人工智能的其他應(yīng)用目前還不是物理學(xué)的核心方法,但是,物理學(xué)家應(yīng)該歡迎這些方法,因?yàn)檫@些方法可以使物理學(xué)家接觸到通常沒(méi)有的數(shù)據(jù)和分析方法。
對(duì)社會(huì)現(xiàn)象真正感興趣的物理學(xué)家也應(yīng)該深入了解社會(huì)科學(xué)所積累的巨量知識(shí)。事實(shí)上,缺乏對(duì)社會(huì)科學(xué)家工作的意識(shí)和理解,正是社會(huì)科學(xué)家對(duì)社會(huì)物理學(xué)論文的主要批評(píng)之一。對(duì)于社會(huì)學(xué)家來(lái)說(shuō),他們應(yīng)該認(rèn)識(shí)到,將計(jì)算科學(xué)應(yīng)用到社會(huì)領(lǐng)域,他們需要與其他學(xué)科的研究者進(jìn)行前所未有的合作。社會(huì)學(xué)家對(duì)程序化事實(shí)和普適分布的厭惡可以通過(guò)形成模型而克服,這樣的模型可以解釋基于學(xué)科理論的發(fā)現(xiàn)。
在合作開(kāi)始之前,合作方對(duì)多學(xué)科協(xié)作的期望要現(xiàn)實(shí)一些。認(rèn)為不同學(xué)科的科學(xué)家湊在一起就能填補(bǔ)彼此的知識(shí)欠缺,然后就能共同創(chuàng)造出合作領(lǐng)域最新水平的結(jié)果,這是天真的想法。許多合作最終歸于失敗的原因如下:不同學(xué)科之間的科學(xué)語(yǔ)言障礙、科學(xué)文化的差異、哪里發(fā)表結(jié)果的爭(zhēng)議等。
科學(xué)家個(gè)人還應(yīng)該對(duì)自己的期望現(xiàn)實(shí)一些。雖然面臨從方法驅(qū)動(dòng)轉(zhuǎn)向問(wèn)題驅(qū)動(dòng)的挑戰(zhàn),許多社會(huì)物理學(xué)家最終發(fā)現(xiàn),他們的真正興趣在于基于物理的方法,而不是社會(huì)現(xiàn)象或數(shù)據(jù)處理。因此,潛在的社會(huì)物理學(xué)家可能會(huì)放棄前期的投入,搜集社會(huì)科學(xué)和計(jì)算機(jī)科學(xué)的必要知識(shí)。這么做有相當(dāng)大的風(fēng)險(xiǎn),可能不會(huì)得到社會(huì)科學(xué)家、物理學(xué)家或機(jī)構(gòu)的認(rèn)可。
然而,那些愿意付出努力的人可以受到越來(lái)越多的社會(huì)物理學(xué)成功應(yīng)用的激勵(lì)和指導(dǎo)。他們可以從迷人的發(fā)現(xiàn)、復(fù)雜的方法和現(xiàn)實(shí)世界的問(wèn)題中汲取靈感。他們可以為正在發(fā)展中的計(jì)算社會(huì)科學(xué)奠定基礎(chǔ)。