【摘要】 計算社會科學和引爆人工智能的深度學習均是在大數據的催生下興起的。通過對計算社會科學和人工智能的簡要考察可以發(fā)現,人工智能與計算社會科學的關系是雙向的,也就是說,前者能夠積極地推動后者的研究和發(fā)展,后者也可以對前者產生正向的作用或者將前者作為研究對象。如果能實現人工智能與計算社會科學的“攜手”,我們不但能更清晰地描述人與人之間的信息互動過程和模式,而且能更合理地解釋社會現象及其發(fā)生機制,更準確地預言人的日常行為和社會系統的發(fā)展趨勢。
【關鍵詞】計算社會科學? 人工智能? 智能社會
【中圖分類號】TP18? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2019.20.001
近年來,由深度學習引爆的“人工智能”,迅速成為科技領域乃至日常生活中的流行詞;差不多同時,在社會現象的研究中,亦興起了一門頗受關注的新學科——計算社會科學。從成因上看,深度學習和計算社會科學均是在大數據的催生下產生和走紅的。那么,它們之間是否存在內在的關聯?或者,是否可以展開實質的互動?如果兩者“攜手”,對于人類社會的未來又有什么意義?本文中,我們試圖對這些問題作些探究。
社會研究的計算進路
中國有句古語:“秀才不出門,盡知天下事”。在信息媒介十分有限的古代,這只是一種夸張的說法。而如今,幾乎每個人都成了“秀才”:只要打開手機,天下大事便可一目了然。當我們被各種各樣的信息所包圍、沖擊時,與以往任何時候相比,我們似乎對人世間所發(fā)生的事知道得更多也更及時了。但是,我們真的理解人類社會的當下狀態(tài)及其運作機制嗎?我們真的可以預料這個社會將會如何演進嗎?答案似乎又是否定的。于是,當許多人面對這個日新月異的世界時,陷入了一種“知情的困惑”("informed bewilderment")的境地。[1]
人類社會之所以很難研究和理解,一個重要原因在于它是一個動態(tài)演進的復雜系統。這種復雜性不僅體現在個體層面:每個人具有自主性和決策能力,因而在行為上顯得獨特,更體現在個體之間、個體與群體之間以及群體與群體之間互動方式的多樣性和不確定性,結果,生成了許多突現的社會現象。不僅如此,人類發(fā)明的技術(尤其是媒介技術)還使得社會成員之間交往的方式和頻度不斷發(fā)生改變,總體上導致社會系統的復雜性日益增加。
因為缺乏有效的工具和方法對社會成員之間多樣的、實時的互動進行實證的考察,傳統的社會科學面對社會系統的復雜性時顯得“力不從心”,只得依賴于個案研究、抽樣調查和宏觀分析等局部的或粗略的方法,難以揭示復雜社會現象生成的機制和模式。進入21世紀后,這種情況開始發(fā)生改變。
技術導致社會系統復雜性的增加。不過,技術也可以把人的活動限制在所設定的范圍,且有些技術產品還能記錄處理個體或群體的行為和互動的信息,這樣,就為研究社會現象及其產生機制創(chuàng)造了條件和工具。如今,人類正處于技術的這種兩重性凸顯的時代:以計算機和互聯網為標志的信息技術在不斷增加社會復雜性的同時,也為我們認識和理解這種復雜性提供了工具和方法。具體一點說,隨著互聯網等媒介的迅速發(fā)展和普及,人類社會中個體或群體之間傳播和交流信息變得比以往任何時候都便捷、快速,且極大地突破了地域的限制,社會系統的復雜性和演進的不確定性也大大增加。與此同時,可廣泛進行信息收集和記錄的工具也應運而生,如目前已普遍使用的各種網絡監(jiān)控設備和傳感器,加之計算機處理信息的能力不斷提升,這就能為研究復雜的社會現象和人的行為提供大量的、多類型的和實時的數據。正是在這樣的背景下,一條社會研究的新進路——計算社會科學——得以產生和發(fā)展。
那么,究竟什么是計算社會科學?雖然有關的研究甚至這一概念此前已經存在,但作為一個交叉學科或研究進路的名稱,計算社會科學2009年春才開始流行。當時,一群社會科學家和計算機科學家聯名在《科學》上發(fā)表了“計算社會科學”一文。[2]但在這篇帶有宣言性質的文章中,作者們并沒有給出“計算社會科學”的定義,而是強調了它的兩個特點:它是由數據驅動的研究人的行為和社會互動的新進路,它是由一群計算機科學家、物理學家和社會科學家等協同創(chuàng)立的交叉學科。晚些時候,主要由歐洲學者聯合發(fā)表的“計算社會科學宣言”中,同樣沒有關于計算社會科學的界定,也只是強調了它是一門交叉學科,并由信息通信技術所驅動。[3]由于信息通訊技術是數據收集和處理的工具,故數據驅動和信息通信技術驅動之間并沒有實質的不同。2011年成立的美國計算社會科學學會的網站上倒是給出了一個定義:“計算社會科學是一門借助社會模擬、社會網絡分析和社會媒介分析研究社會的和行為的動態(tài)(dynamics)的科學。”[4]不過,這個定義似乎并不十分恰當,因為其沒有明示上述兩份宣言所強調的特點。在第一本以計算社會科學命名的教科書中,作者喬菲里維拉(C. Cioffi-Revilla)下了這樣一個工作定義:“計算社會科學是運用計算手段,在個體到群體的多個尺度上,對社會世界(social universe)進行跨學科研究的新領域”,同時指出它并不限于“大數據,或社會網絡分析,或社會模擬模型”。[5]可以看出,這個定義較好地刻畫了計算社會科學的特點。
近10年來,這門新興的交叉學科得到了蓬勃發(fā)展。研究成果頻頻出現在《科學》和《自然》等以往主要刊登自然科學論文的頂級雜志上;2018年,專業(yè)性的《計算社會科學期刊》正式面世;研究中心和專業(yè)學會相繼成立;不少世界著名大學已設立相應的課程或學位。從研究的對象看,計算社會科學幾乎包括人類社會的方方面面,特別是經濟、政治、文化和社會生活中的復雜現象,形成了計算社會學、計算經濟學、計算歷史學、計算政治學和計算法學等數量眾多的分支。
目前,在計算社會科學中,存在著兩種基本的研究策略。一種是通過抽象來建立可操作的基于自主體模型(Agent Based Modeling)。采取這一策略,盡管無法對社會網絡的結構和過程進行逼真的復制和再現,但通過抓住體現自主體(個體或群體)之間互動的基本的或主要的屬性和關系,在計算機上實現模型的運行,可以探索相對應的社會結構和過程的一般模式。如今,基于自主體模型是進行社會理論研究和為決策提供優(yōu)化方案的主要方法之一。另一種更為自然的策略是對社會現象進行直接研究。既然一個社會系統可看作自主體之間信息互動的動態(tài)網絡,那么,只要擁有記錄和處理承載信息的數據的工具和方法,就能對信息分布和互動的模式進行直接的描述,從而直觀地把握社會現象和過程。事實上,大數據和云計算等技術工具,可為我們理解社會現象提供更廣、更深和更豐富的經驗數據。正因為如此,運用大數據分析社會現象和人的行為已經成為計算社會科學研究的熱點。[6]
引爆人工智能的深度學習
在簡要地闡述了計算社會科學之后,我們再來說說人工智能。近年來,在科技界、產業(yè)界乃至傳媒領域,恐怕再難以找到比“人工智能”更奪人眼球的專業(yè)詞匯了;國內的高等學校也紛紛成立人工智能專業(yè)甚至學院。這中間,當然存在著大量的“虛火”,但有一點是肯定的:一些人工智能技術或產品開始進入人們的生活。
人工智能作為一門學科,如果從1956年正式命名算起,已有60余年。這期間,在大學里,人工智能基本上只是作為計算機科學的一個分支甚至一門課程,而它的發(fā)展歷史也相當曲折,幾起幾落。究其原因,主要還是在于人工智能自身的特質。盡管不同的研究者對于人工智能所要實現的具體目標在理解上不盡相同(如有人傾向于對智能本質的探究,而另一些人則更側重建構有用的智能系統),但該共同體核心的多數成員對基本目標的認識還是一致的:即通過建構人工的智能系統而理解智能,尤其是人類級的智能。就基本目標而言,人工智能理應被看作一門經驗科學。[7]不過,與其他經驗科學相比,人工智能所運用的方法卻是非常獨特的。一般地,經驗科學是在預設對象存在的前提下,運用實驗等手段獲取關于對象的數據,提出假設以解釋或預言這些數據,并實現兩者之間的互動。人工智能則并不著眼于對存在的智能(如人的智能)的直接研究,而是試圖通過建構人工的智能系統以達到對智能(包括自然的和人工的)的理解。由于建構這樣的系統是一個發(fā)明的過程,其方法和產品也可以為人所用,故人工智能又常常被看作是一門技術。正是由于這一獨特的方法,人工智能在學科性質上具有科學和技術的兩重性。
由于人具有智能,這就為建構人工的智能系統提供了存在證明。而從現象上看,最能體現人的智能似乎是知識和對知識的操作(推理),于是,在人工智能發(fā)展的早期,形成了基于知識處理的符號主義范式。在這一范式的指導下,多數研究者將智能視作知識+推理,于是,注意力集中于知識表示、自動推理和自然語言的形式處理等,并且往往只側重于某一方面。這樣的研究雖然發(fā)展出了不少有用的技術,也融入了各種應用的計算系統,但卻沒有形成一個真正能夠在實際環(huán)境中展現智能(哪怕是動物智能)的人工系統,于是乎,只是“為他人做嫁衣”。結果,在20世紀80年代初,這種主流的人工智能落入了低谷。
也許,理解智能不應先著眼于像知識和知識處理這樣到了人的階段才發(fā)展出的高級智能,而應關注像視覺識別和適應性學習這些更為基本的能力。這些能力均由動物(包括人)的神經網絡來實現,因此,人工智能應該模擬和建構人工的神經網絡。事實上,這種想法比電子計算機的問世還早,但一直未能發(fā)展起來。首先改變這種局面的當推物理學家霍普菲爾德(J.J.Hopfield)。他在1982年成功地運用統計物理學方法研究人工神經網絡,于是出現了一個研究人工神經網絡的小高潮。不過,由于在人工智能領域,基于知識處理的符號主義還占據統治地位,加之人工神經網絡的實現條件尚未成熟,結果,這些神經網絡的研究者一直處于邊緣的地位。
只有到了2012年,“時來運轉”的局面才開始發(fā)生。對人工神經網絡的理論研究表明,要讓一個系統(機器)具有較強的學習能力,需要建構具有多個中間層(深度)并帶有反饋等機制的神經網絡,但這需要所實現硬件具有強大的計算力。2012年前后,人們開始意識到,原本用于圖形的處理機(GPU)可以提供這種計算力。同時,要讓系統能夠通過學習并在此基礎上作出決策或預測,還需要輸入大量數據對其進行訓練,而網絡和各種數據收集器可以提供豐富的數據。在計算力和大數據這兩個主要條件滿足后,基于深度神經網絡的深度學習(機器學習的一種)開始引起人們的關注。
2016年春,當谷歌公司旗下的DeepMind基于深度學習和強化學習開發(fā)出擊敗圍棋世界冠軍的AlphaGo以后,人工智能在大眾媒體中迅速走紅,并通過人臉識別和語音處理等開始影響人們的生活。目前,深度學習等人工智能技術已經在圖像分類和聚類、自然語言處理等方面取得了很大的成功,并在網絡安全、自動駕駛、醫(yī)療健康、教育和科學研究等領域展示出巨大的應用前景。
人工智能“遇見”計算社會科學
接下來,我們就可以來談談人工智能與計算社會科學之間的關聯。如前所述,計算社會科學很大程度上是在大數據的催生下興起的。如今,生成關于人的行為和人與人之間互動的數據最多的場景就是網絡世界,特別是社交媒體,而且隨著人們的工作和生活越來越依賴網絡,可用于研究人的行為和社會互動的數據也就愈加豐富和全面。
因此,計算社會科學的一個主要任務是利用由網絡世界提供的大數據來探尋人的行為模式和社會演變的規(guī)律。但面對體量極大、類型眾多和實時生成的大數據,又該如何處理和分析,以便從中挖掘出有價值的行為模式和社會規(guī)律呢?顯然,單靠人的能力和傳統的統計工具是無法勝任這項工作的。這里,就需要人工智能等技術的幫助。例如,在社交網絡中,假新聞或謠言是如何傳播的?這是計算社會科學家關注的一個重要議題。借助于人工智能等技術手段,通過對網絡中形成的大數據進行分析,研究人員發(fā)現:達到相同的傳播深度,假新聞的傳播速率是真新聞的20倍。[8]近年,人們還基于深度學習開發(fā)出辨認謠言的監(jiān)測模型。
計算社會科學家,運用計算進路尋求社會中成員的行為和成員之間互動的模式,不僅希望借此能對社會現象(特別是社會系統的復雜現象)作出合理的解釋,更希望能對社會系統演進的狀態(tài)或事件作出盡可能準確的預言(預測)。目前,人們之所以熱衷于收集和處理大數據,主要目的也是為了預言人的行為或社會演進的趨勢。然而,由于人和社會均是復雜系統,這使得作出準確的預言非常困難。事實上,傳統的社會科學,即使是運用了大量數學的經濟學,雖總能解釋社會現象或事件,但這種解釋基本上屬于“馬后炮”,而在預言尚未發(fā)生的社會現象方面則幾乎是一部失敗的歷史。那么,計算社會科學是否能夠克服傳統社會科學在預言上的“無能”呢?這是目前關于計算社會科學以及大數據究竟有多大價值的爭論中所關注的一個焦點問題。
近年來的研究和實踐表明:如果能與人工智能(特別是機器學習)技術相結合,計算社會科學的預言功能可以得到較大幅度的提升。其實,深度學習就是通過對實現于深度神經網絡的學習算法進行大量數據的訓練,以便在新的數據輸入后,能產生最優(yōu)的輸出,即作出最好的預測或決策。這樣,當計算社會科學家獲得了描述人的行為或社會現象的更多、更可靠的數據和經驗規(guī)律后,就可以基于這些成果建構和訓練一個具有學習功能的智能系統,從而更好地預言相應系統的狀態(tài)和行為。這種結合人工智能技術預言人的行為和社會現象的努力是計算社會科學研究的主要任務。目前,借助網絡等提供的大數據,在預測消費者的行為、某個區(qū)域發(fā)生惡性犯罪的可能性和金融市場的趨向等方面大大地提高了效率和可靠性。據報道,最近美國總統特朗普也要求社交網絡公司開發(fā)可以預言潛在槍擊者的軟件技術。[9]
顯然,預言人(個體和群體)的行為或社會現象對于決策和行動都是極其重要的。如果一種理論或技術能提高預言的精準度,必定會引起人們的關注和重視。正因為如此,2018年春,《科學》雜志推出專題討論社會科學中的預言問題。[10]可實際上,鑒于人和社會系統都是復雜的,即使運用了大數據和人工智能技術,對人的行為和社會演進的狀態(tài)等的預言也存在很大的限制。近年來,許多實際應用的成功表明,對于重復性的行為和社會演進的趨勢性(實際上也是重復的)現象,運用計算社會科學的成果,再結合大數據和人工智能技術,確實能夠提高預言的精準度。然而,對于人的突現行為和社會系統的突現現象,復雜性理論和計算理論已經告訴我們,原則上無法作出準確的預言,而這是由復雜系統的內在特性決定的。[11]不過,由于人的絕大多數日常行為是重復性的或者是對他人行為的模仿,且在許多情況下,社會系統演進的趨勢也往往會持續(xù)一段時間,所以,運用大數據和人工智能技術作出更準確的預言仍是大有可為的。
其實,人工智能與計算社會科學的關系是雙向的,也就是說,前者能夠積極地推動后者的研究和發(fā)展,后者也可以對前者產生正向的作用或者將前者作為研究對象。這主要表現在三個方面。其一,由于社會系統的復雜性,對于計算社會科學面對的許多具體問題(如金融領域的突現現象,社交網絡中人們觀點的極化現象,等等)并不存在通用的人工智能算法,故需要人工智能的研究者針對問題探尋和設計具體的智能算法,因而,可以推動人工智能本身的發(fā)展和應用。比如,為了向網絡上的用戶精準地推送信息,就推動了基于機器學習和貝葉斯推理的智能推薦算法的開發(fā),也促進了對具有一定自主性的智能體的研究。
其二,計算社會科學的成果可以為人工智能的研究提供思想資源或方法。比如,人工智能的主要目標之一是建造具有決策功能的智能體,它能代表設計者或使用者,且有一定的自主性來展開行動。當建造具有多個智能體組成的系統時,研究者就需要賦予每個智能體以自我利益和基于某種理性原則的實用推理機制。而這樣的智能體以及其與環(huán)境相互作用時表現出的決策行為和影響這些行為的機制正是經濟學(特別是計算經濟理論)所研究的問題。事實上,前些年,人工智能研究者已經根據經濟學的市場原理建構了計算市場模型,用于設計多智能體系統。
其三,隨著人工智能技術和產品越來越多地應用于經濟、政治、文化以及其他社會生活,勢必會改變社會的結構和人們的工作、生活的方式,因此,要求社會科學的研究及時跟進甚至作出前瞻性的判斷或預測。而在這方面,計算社會科學可以發(fā)揮重要甚至特殊的作用,因為它能對社會結構和人的行為變化作出定量的、實時的刻畫,并發(fā)現其中的模式。例如,智能機器人在制造業(yè)乃至服務業(yè)的廣泛使用,必將導致就業(yè)人員和結構的改變,繼而又改變社會中資源和財富的增長和分配方式,而運用計算進路對于這些問題進行研究,不僅可以更好地理解社會現象和社會變遷,而且能夠為政策的制定提供思想和理論支撐。
“攜手”創(chuàng)建智能社會
誠然,當下人們關于人工智能的聚焦點主要集中在自動駕駛、圖像分類和聚類、語音識別和機器翻譯等方面,以及具有巨大應用前景的物聯網、醫(yī)療健康和教育等領域;相對而言,對于其與計算社會科學的關系則關注得并不多。然而,一些有識之士已經敏銳地注意到兩者相結合的重要性和巨大價值。比如,著名的人工智能學者、圖靈獎得主萊迪(R. Reddy)兩年前就在一次國際會議上倡議:“計算機科學和人工智能必須擁抱計算社會科學”。[12]當越來越多的人工智能技術應用于社會生活的各種領域,定會改變人們的行為和人與人之間的互動方式,也會改變人所處的社會環(huán)境甚至自然環(huán)境。這就要求計算社會科學家探究社會中個體或群體之間相互作用的基本模式,發(fā)現這些模式隨著智能技術和產品的介入而導致的種種問題,并積極地尋找解決問題的方案;而這中間,他們也可以利用人工智能提供的工具和方法。因此,這種“擁抱”是很有必要也是十分自然的。
不論是從歷史還是當下,均可以看出,技術驅動社會演進的趨勢是無法逆轉的。當人工智能發(fā)展到可產生實際應用的技術和產品時,這種驅動力也就開始發(fā)揮作用。與以往不同的是,智能技術和產品可以放大人的自然智能,或者替代人的智能活動,而“智能”(嚴格地說高級智能)通常被看作是人之所以為人的特質。因此,在人的自然智能和人工智能的協同作用下,總體上,人類社會將進入一個智能的新時代。在這樣的大背景和大趨勢下,拒絕或回避這個時代是不太可能的。所以,現實的選擇是積極地擁抱人工智能,并通過社會的計算研究來認識其對人的正向的和負面的效應,并盡力發(fā)揮其對于人類社會的正向作用,扼制或避免可能帶來的副作用(比如對個人權力的不正當侵犯)。也就是說,讓人工智能與計算社會科學之間實現“攜手”,來共同設計和建構一個更加美好的智能社會。
我們知道,人類社會的具體制度和規(guī)則正是人自身選擇和設計的產物,因此,究竟依據什么來指定目標和設計制度就成為社會科學研究的主要任務之一。從理性的角度講,科學地理解社會現象并弄清其中的機理和規(guī)律,在此基礎上對社會演進的可能性作出客觀的評估,是人們指定社會目標和設計制度的基本前提。人類社會的歷史一再表明:倘若基于某種非科學的信仰,或者盲目武斷地,指定目標和設計制度,那就不是理性的,通常會對社會和人自身產生可怕的后果;如果僅僅依據經驗作出這樣的決策,則雖然可以是理性的,卻往往顯得短視和片面,所設計的制度很可能缺乏效率,或者產生的結果違背設計者的初衷。誠然,傳統的社會科學在指定目標和設計制度方面一直發(fā)揮著作用,但由于其自身存在的局限,從效果上說并不那么理想。
如今,如果能實現人工智能與計算社會科學的“攜手”,那么,我們不但能更清晰地描述人與人之間的信息互動過程和模式,而且能更合理地解釋社會現象及其發(fā)生機制,更準確地預言人的日常行為和社會系統的發(fā)展趨勢。特別是,雖然對于人的復雜行為和社會的復雜現象無法作出準確的預言,但這不妨礙我們運用機器學習等手段建立相應的模型,并通過對模型演化的種種可能性進行探索和分析,從中找到產生突現現象的條件和機制,從而為理解和設計社會系統提供可參考的合理依據。
事實上,對如何利用人工智能和計算社會科學的成果來進行社會系統設計,從而為人類建構更好的未來社會,近年來已經有人作了有益的探索。例如,幾年前,由計算社會科學家佩特蘭(A.Pentland)所帶領的團隊,運用大數據、智能技術和計算社會科學的方法,對大小不等的社會系統進行了實證研究,發(fā)現一個系統的效能(生產能力和創(chuàng)造性輸出等)主要取決于其中個體思想交流的參與程度和從外部引進新思想的探索能力。然后,他們將這些成果用于設計或改進公司和商業(yè)社交網絡中思想交流的結構,結果,生產效率、創(chuàng)造力或盈利能力均有了明顯的提高。[13]可以預期,隨著人工智能與計算社會科學的攜手發(fā)展,在推進社會進步和人類福祉方面,兩者均將發(fā)揮越來越大的作用。
(本文系國家社科基金重大項目“基于虛擬現實的實驗研究對實驗哲學的超越”的階段性成果,項目批準號:15ZDB016)
注釋
[1]https://www.edge.org/conversation/john_naughton-the-state-of-informed-bewilderment.
[2]D. Lazer, et al., "Computational Social Science", Science, Vol. 323, Issue 5915, 2009, pp. 721-723.
[3]R. Conte. et al., "Manifesto of Computational Social Science", The European Physical Journal, Special Topics 214, 2012, pp. 325-346.
[4]https://computationalsocialscience.org.
[5]C. Cioffi-Revilla, Introduction to Computational Social Science, London: Springer-Verlag, 2014, p. 2.
[6]C. Cioffi-Revilla, "Bigger Computational Social Science: data, theories, models, and simulations—not just big data", The 8th International ACM Web Science Conference, Hanover, Germany, May 22–25, 2016.
[7]H.A.Simon, "Artificial Intelligence: an empirical science", Artificial Intelligence, 77(1), 1995, pp. 95-127.
[8]S. Vosoughi, D. Roy and S. Aral, "The spread of true and false news online", Science, Vol. 359, Issue 6280, 2018, pp. 1146–1151.
[9]https://www.theverge.com/2019/8/5/20754761/trump-social-media-companies-mass-shooting-predictions-el-paso-texas-dayton-ohio.
[10]Science, Vol. 355, Issue 6324, 2017.
[11]酈全民:《用計算的觀點看世界》,廣州:中山大學出版社,2009年,第46~48頁。
[12]http://static.springer.com/sgw/documents/1652325/application/pdf/WWWJ+CFP+-+Computational+Social+Science.pdf.
[13]A.Pentland, Social Physics, New York: The Penguin Press, 2014, pp. 25-42.
責 編/馬冰瑩