摘要:隨著云計(jì)算技術(shù)的發(fā)展,數(shù)據(jù)化浪潮來(lái)勢(shì)洶洶,對(duì)原本因?yàn)椤畬?shí)證性與自然科學(xué)涇渭分明的社會(huì)科學(xué)提出嚴(yán)峻挑戰(zhàn)。面對(duì)此挑戰(zhàn)社會(huì)科學(xué)積極應(yīng)對(duì),嘗試借助數(shù)據(jù)科學(xué)的技術(shù),將數(shù)據(jù)為己所用,將挑戰(zhàn)轉(zhuǎn)為機(jī)遇。計(jì)算社會(huì)科學(xué)應(yīng)運(yùn)而生,數(shù)據(jù)科學(xué)與社會(huì)科學(xué)的合作越來(lái)越多。展望社會(huì)科學(xué)的發(fā)展,應(yīng)當(dāng)借助數(shù)據(jù)工具,鞏固本學(xué)科,并積極嘗試跨學(xué)科研究,把握機(jī)遇,建立學(xué)科自信。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;社會(huì)科學(xué);數(shù)據(jù)科學(xué);計(jì)算社會(huì)科學(xué)
一、社會(huì)科學(xué)與數(shù)據(jù)科學(xué)的互助合作
顯而易見(jiàn)的,數(shù)據(jù)科學(xué)是迎接大數(shù)據(jù)發(fā)出的挑戰(zhàn)的最直接并且有效的方法。數(shù)據(jù)處理技術(shù)、機(jī)器學(xué)習(xí)、算法、模型等一系列有力工具,能夠更加迅速、敏捷、從容地處理巨量數(shù)據(jù)。社會(huì)科學(xué)并不是脫離數(shù)據(jù)的,許多社會(huì)理論的出現(xiàn)少不了數(shù)據(jù)結(jié)果的支撐。但是不可否認(rèn)在與數(shù)據(jù)信息的接觸、應(yīng)用方面需要向數(shù)據(jù)科學(xué)學(xué)習(xí)的地方還很多。如果說(shuō)過(guò)去社會(huì)科學(xué)對(duì)數(shù)據(jù)的應(yīng)用屬于‘計(jì)量科學(xué)‘,那么大數(shù)據(jù)時(shí)代,一個(gè)非常明顯的趨勢(shì)是向計(jì)算時(shí)代‘的轉(zhuǎn)變。這種轉(zhuǎn)變的完成,不過(guò)是時(shí)間問(wèn)題。我們總說(shuō)世界變化得越來(lái)越快了。這個(gè)邏輯落/追溯在信息領(lǐng)域是可以找到解釋的:信息/數(shù)據(jù)傳輸速度越來(lái)越快-信息越來(lái)越多也越來(lái)越豐富-人類文明會(huì)加速各個(gè)領(lǐng)域的產(chǎn)出來(lái)應(yīng)對(duì)這些信息,這些加速落在微觀/個(gè)人層面,人們難免會(huì)覺(jué)得自己的生活由綠皮火車改成了高鐵動(dòng)車。
在這一背景下,社會(huì)科學(xué)向數(shù)據(jù)科學(xué)取經(jīng),勢(shì)在必行。在呼嘯而來(lái)的大數(shù)據(jù)浪潮中,社會(huì)科學(xué)做出了哪些回應(yīng)呢?
1.1 計(jì)算社會(huì)科學(xué):社會(huì)科學(xué)對(duì)大數(shù)據(jù)的回應(yīng)
計(jì)算社會(huì)科學(xué)(Computational social science)指的是在社會(huì)科學(xué)中采用計(jì)算機(jī)運(yùn)算方法的學(xué)術(shù)分支,運(yùn)算用以建立模型、模擬、分析社會(huì)現(xiàn)象。次分支學(xué)科包括計(jì)算經(jīng)濟(jì)學(xué)、計(jì)算社會(huì)學(xué)、自動(dòng)媒體分析等等,內(nèi)容則專注在透過(guò)模擬、建模、網(wǎng)絡(luò)分析、媒體分析等觀察社會(huì)與行為關(guān)系及互動(dòng)。
計(jì)算社會(huì)科學(xué)的產(chǎn)生是大數(shù)據(jù)時(shí)代社會(huì)科學(xué)發(fā)展的必然趨勢(shì)。在過(guò)去(20世紀(jì)90年代前后)社會(huì)科學(xué)關(guān)于人類行為的研究常為時(shí)代條件所限制。在上個(gè)本世紀(jì)末到二十一世紀(jì)的前十年,互聯(lián)網(wǎng)、人工智能的發(fā)展以及各類電子技術(shù)的發(fā)展,推動(dòng)了計(jì)算機(jī)行動(dòng)模擬方法以及社會(huì)科學(xué)研究方法的發(fā)展,為計(jì)算社會(huì)學(xué)的產(chǎn)生提供了基礎(chǔ)條件。
“計(jì)算社會(huì)科學(xué)”一詞是在2009年出現(xiàn)在《科學(xué)》(Science)上,由15位優(yōu)秀學(xué)者共同署名發(fā)表。文章預(yù)言在互聯(lián)網(wǎng)和新的電腦技術(shù)的時(shí)代背景下,將會(huì)出現(xiàn)能量巨大的新的計(jì)算社會(huì)科學(xué)。如今,物聯(lián)網(wǎng)、云計(jì)算、各類智能電子設(shè)備,給社會(huì)科學(xué)研究者提供了更有力、更廣泛的的收集和處理數(shù)據(jù)的途徑。2014年召開(kāi)了“新計(jì)算社會(huì)學(xué)研討會(huì)”,預(yù)示著“綜合運(yùn)用當(dāng)代計(jì)算機(jī)和互聯(lián)網(wǎng)及其他高新技術(shù)與大數(shù)據(jù)分析手段的社會(huì)學(xué)研究方法體系越來(lái)越受到關(guān)注”。
計(jì)算社會(huì)科學(xué)既是順應(yīng)技術(shù)與時(shí)代進(jìn)步,順應(yīng)社會(huì)生產(chǎn)力和發(fā)展方向的必然選擇,同時(shí)又體現(xiàn)了社會(huì)科學(xué)家積極應(yīng)對(duì)新事物、新環(huán)境,不斷探索與追求的科學(xué)精神與境界。
1.2 社會(huì)科學(xué)與數(shù)據(jù)科學(xué)的合作
“數(shù)據(jù)+技術(shù)”之于社會(huì)學(xué)的重要性在傳統(tǒng)數(shù)據(jù)時(shí)代就已體現(xiàn),并在研究過(guò)程的速率、研究的信度和效度、研究結(jié)果的展示方面都對(duì)社會(huì)學(xué)有很大的提升。比如利用開(kāi)放的公共數(shù)據(jù)資源(如人口普查)在計(jì)算機(jī)上進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)分析或繪制某地區(qū)的人口密度圖示。這種影響不僅是對(duì)定量研究,對(duì)于以深度訪談為主要研究手段的質(zhì)性研究,大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)中每日產(chǎn)出的大量交互性數(shù)據(jù)可以輕易地采集到比訪談更加豐富多樣的數(shù)據(jù)。紙質(zhì)資料的數(shù)字化趨勢(shì),也為史料分析、文獻(xiàn)分析補(bǔ)充了更廣泛的研究資料。
以數(shù)據(jù)匹配這一環(huán)節(jié)為例,從不同的社交網(wǎng)站上獲得的數(shù)據(jù),為了服務(wù)同一變量,少不了經(jīng)過(guò)數(shù)據(jù)匹配。但不同網(wǎng)站,同類數(shù)據(jù)并非以同樣字段命名,甚至分類標(biāo)準(zhǔn)也存在差異。那么僅僅這一環(huán)節(jié)所需要用到就有自然語(yǔ)言處理技術(shù)、分詞技術(shù)、正則表達(dá)等多項(xiàng)技術(shù)。
《新計(jì)算社會(huì)學(xué):大數(shù)據(jù)是地的社會(huì)學(xué)研究》中指出了計(jì)算社會(huì)學(xué)的五方面內(nèi)涵:數(shù)據(jù)獲取與分析、質(zhì)性研究與定量研究的融合、社會(huì)學(xué)互聯(lián)網(wǎng)實(shí)踐、ABM模擬、新型社會(huì)計(jì)算工具的研制與開(kāi)發(fā)。并從上述五個(gè)方面列舉了多個(gè)大數(shù)據(jù)與社會(huì)科學(xué)合作的研究成果。(見(jiàn)下表)。
如,在數(shù)據(jù)獲取與分析的應(yīng)用中有一個(gè)關(guān)于“名氣”的研究:從報(bào)紙上獲取個(gè)體姓名出現(xiàn)次數(shù),次數(shù)越多,名氣越大。利用莉迪亞文本分析系統(tǒng)(將文本變?yōu)闀r(shí)序化的數(shù)據(jù)進(jìn)行定量分析)。此次研究篩查了2004-2009年2200中美國(guó)各類日?qǐng)?bào)和周刊;初步提取了十萬(wàn)個(gè)姓名并進(jìn)行了合理化剔除,最終對(duì)姓名出現(xiàn)頻率在1萬(wàn)次以上的幾百個(gè)姓名進(jìn)行了分布分析與流動(dòng)性分析。
再如,將質(zhì)性研究和定量研究融合的嘗試中,一項(xiàng)研究試圖分析網(wǎng)民線上線下政治行為的動(dòng)態(tài)關(guān)系,也即對(duì)人們?cè)谏缃幻襟w上關(guān)于國(guó)會(huì)選舉的政治討論進(jìn)行分析。具體的研究方法是通過(guò)大數(shù)據(jù)+文本資料量化分析,利用數(shù)據(jù)挖掘獲得社交媒體的文本資料;利用“自動(dòng)文本分析系統(tǒng)”(LIWC,能夠識(shí)別60多種人類情緒)進(jìn)行內(nèi)容分析。此次研究分析了三萬(wàn)名用戶的11萬(wàn)條推文。
此外還有很多研究,如通過(guò)刊登的文章內(nèi)容進(jìn)行學(xué)術(shù)分析探索學(xué)術(shù)創(chuàng)新的規(guī)律及其影響因素,文化產(chǎn)品市場(chǎng)不公平性的社會(huì)實(shí)驗(yàn):文化產(chǎn)品在市場(chǎng)上流行程度的影響因素,關(guān)于個(gè)體成就的互聯(lián)網(wǎng)實(shí)驗(yàn),社會(huì)地位形成機(jī)制的研究等等,都因?yàn)槎嗔恕當(dāng)?shù)據(jù)工具‘而得到了更進(jìn)一步的發(fā)展。
可見(jiàn)社會(huì)科學(xué)和數(shù)據(jù)科學(xué)的助力是相互的。社會(huì)科學(xué)龐大的理論庫(kù)能夠?yàn)閿?shù)據(jù)科學(xué)提供數(shù)據(jù)處理的新思路、新視角。既有的、成熟的社會(huì)科學(xué)理論,可以幫助數(shù)據(jù)科學(xué)家以更具結(jié)構(gòu)化的視角看待多源龐雜的數(shù)據(jù),進(jìn)行數(shù)據(jù)融合;對(duì)數(shù)據(jù)進(jìn)行更加準(zhǔn)確的價(jià)值分類,增加數(shù)據(jù)資源利益視角,提高數(shù)據(jù)資源利用率。
總而言之,在面對(duì)大數(shù)據(jù),數(shù)據(jù)科學(xué)和社會(huì)科學(xué)有各自不同的獨(dú)具特色的應(yīng)對(duì)機(jī)制,也存在需要向?qū)Ψ郊捌渌鼘W(xué)科汲取營(yíng)養(yǎng)的‘短板‘。二者應(yīng)當(dāng)各展其能并且相互學(xué)習(xí),相輔相成。共同應(yīng)對(duì)大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)。
二、展望:社會(huì)科學(xué)的發(fā)展之路
大數(shù)據(jù)時(shí)代社會(huì)科學(xué)面臨著機(jī)遇,同時(shí)也面臨著挑戰(zhàn)。大數(shù)據(jù)使得社會(huì)科學(xué)有了跟多的可能性,能夠減少社會(huì)研究的主觀性,對(duì)于社會(huì)研究的縱向研究和動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)研究都將有新的促進(jìn);而數(shù)據(jù)的非結(jié)構(gòu)性、海量性也使得社會(huì)科學(xué)研究遭遇新的困難。為了更好地迎接挑戰(zhàn),化挑戰(zhàn)為機(jī)遇,社會(huì)科學(xué)應(yīng)當(dāng)在增強(qiáng)本學(xué)科實(shí)力的同時(shí),需要開(kāi)放心態(tài),整合資源,進(jìn)行跨學(xué)科合作研究,牢牢把握機(jī)遇,建立學(xué)術(shù)自信。
(一)鞏固和發(fā)展本學(xué)科理論
大數(shù)據(jù)帶來(lái)的挑戰(zhàn)還體現(xiàn)為在學(xué)科的研究?jī)?nèi)容、研究對(duì)象等方面增加了研究難度。新的時(shí)代衍生出了新的問(wèn)題,部分傳統(tǒng)的理論可能在解釋力度上出現(xiàn)削弱甚至失效的情況,如美國(guó)特朗普競(jìng)選結(jié)果預(yù)測(cè)失敗。因此,各社會(huì)學(xué)科首先應(yīng)當(dāng)做的還是加強(qiáng)和鞏固自身的理論,建立更符合時(shí)代發(fā)展的,更具解釋性的、強(qiáng)有力的理論。
(二)跨學(xué)科合作研究
計(jì)算社會(huì)科學(xué)與傳統(tǒng)社會(huì)科學(xué)相比,跨學(xué)科特性更為突出,各學(xué)科之間的關(guān)系也更為緊密。這表現(xiàn)為,完成社會(huì)研究需要越來(lái)越多地使用計(jì)算科學(xué)的工具;而新的社會(huì)計(jì)算工具的開(kāi)發(fā),需要多個(gè)社會(huì)科學(xué)領(lǐng)域的專家合作完成。在跨學(xué)科意識(shí)的指引下,進(jìn)行不同學(xué)科間的學(xué)習(xí)、合作、融合、促進(jìn),協(xié)同發(fā)展。迎接大數(shù)據(jù)時(shí)代,傳統(tǒng)的社會(huì)科學(xué)需要在數(shù)據(jù)的獲取、分析、定性研究于定量研究的融合方面努力突破,克服原有的缺陷和障礙,積極拓展和創(chuàng)新;同時(shí)也要學(xué)習(xí)和使用數(shù)據(jù)科學(xué)及其它學(xué)科的研究技術(shù)和工具,利用好互聯(lián)網(wǎng)和計(jì)算機(jī)模擬系統(tǒng),進(jìn)行更具時(shí)代感的社會(huì)研究。
(三)把握機(jī)遇,建立學(xué)術(shù)自信
科學(xué)界,尤其是社會(huì)科學(xué)界已經(jīng)形成了以西方科學(xué)界為中心的格局。這一定程度上得益于西方科學(xué)啟蒙和發(fā)展較早,使其積累了眾多使“思想萌芽”得以快速成長(zhǎng)的沃土。大數(shù)據(jù)時(shí)代的到來(lái),拉近了世界的距離,縮小了世界之間信息和只知識(shí)的差距,為世界也為中國(guó)提供了“彎道超車”的新機(jī)遇。尤其是近來(lái)中國(guó)“5G”技術(shù)的突破,更提醒我們需要牢牢把握機(jī)會(huì),充分認(rèn)識(shí)并發(fā)揮自己的優(yōu)勢(shì),發(fā)展符合我國(guó)社會(huì)的社會(huì)科學(xué)理論,建立中國(guó)社會(huì)科學(xué)的學(xué)術(shù)自信。
參考文獻(xiàn):
[1]陳云松.大數(shù)據(jù)中的百年社會(huì)學(xué)——基于百萬(wàn)書籍的文化影響力研究[J].社會(huì)學(xué)研究,2015,30(01):23-48+242-243.
[2]徐嵐.大數(shù)據(jù)背景下的“數(shù)據(jù)新聞”研究[D].上海社會(huì)科學(xué)院,2014.
[3]孟小峰,李勇,祝建華.社會(huì)計(jì)算:大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(12):2483-2491.
[4]沈浩,黃曉蘭.大數(shù)據(jù)助力社會(huì)科學(xué)研究:挑戰(zhàn)與創(chuàng)新[J].現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)),2013,35(08):13-18.
[5]李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國(guó)科學(xué)院院刊,2012,27(06):647-657.
作者簡(jiǎn)介:
黎嘉雯(1995—),女,新疆巴州人,天津師范大學(xué)碩士。研究方向:性別社會(huì)學(xué)。