文/鮑 雨
?
社會學(xué)視角下的大數(shù)據(jù)方法論及其困境
文/鮑 雨
摘要:大數(shù)據(jù)不僅是一種龐大數(shù)據(jù)資料的稱謂,也是一種獲取和分析資料的方法。在社會學(xué)研究領(lǐng)域,大數(shù)據(jù)的引入被認(rèn)為是定量研究的范式下所做出的收集和分析資料方法的創(chuàng)新。但是大數(shù)據(jù)在多大程度上反映人群的狀況、能否解決被研究者的主觀性問題、如何洞悉變量間關(guān)系的真?zhèn)?、如何解決數(shù)據(jù)缺失問題等方面,還存在一定程度的方法論困境。這就要求研究者在使用大數(shù)據(jù)進(jìn)行研究時,能夠在研究對象與問題的選擇、變量的選取、數(shù)據(jù)的清理等一系列工作中更加謹(jǐn)慎,切勿犯簡化社會生活、盲目推廣分析結(jié)果的錯誤。
關(guān)鍵詞:大數(shù)據(jù);方法論;定量研究;方法論;困境
近年來,“大數(shù)據(jù)”(big data)作為一個熱門話題在社會各領(lǐng)域被廣泛討論。一般認(rèn)為擁有“4V”的特征的數(shù)據(jù)集合是大數(shù)據(jù):1)規(guī)模性(Volume),數(shù)據(jù)的體積巨大;2)高速性(Velocity),數(shù)據(jù)產(chǎn)生、處理和分析的速度快,數(shù)據(jù)具有實時性,且數(shù)據(jù)流量大。3)多樣性(Variety),大數(shù)據(jù)的類型復(fù)雜,除傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)之外,還包括大量非結(jié)構(gòu)化數(shù)據(jù)。4)價值性(Value),數(shù)據(jù)的整體價值及商業(yè)利潤高,潛力巨大。[1]李天柱等在大數(shù)據(jù)的“4V”特征的基礎(chǔ)上進(jìn)一步指出:“假設(shè)存在規(guī)模龐大、類型多樣、動態(tài)產(chǎn)生且價值巨大的‘特殊數(shù)據(jù)’集合,那么大數(shù)據(jù)可以定義為,在此‘特殊數(shù)據(jù)’集合的基礎(chǔ)上,借助計算科學(xué)及其它新興技術(shù)來實現(xiàn)特定功能的整體架構(gòu)。”[2]大數(shù)據(jù)的魅力除了“大”,更在于它將多學(xué)科、跨領(lǐng)域的數(shù)據(jù)結(jié)合在一起,開辟了傳統(tǒng)方法所不能實現(xiàn)的、更為創(chuàng)新的研究路徑。
需要注意的是,大數(shù)據(jù)不僅是用于研究的經(jīng)驗材料,也是一種獲取材料的方式和運(yùn)用材料的方法,具有獨(dú)特的方法論邏輯。從已有的文獻(xiàn)來看,大部分是對大數(shù)據(jù)的贊揚(yáng)之聲,一些學(xué)者甚至斷言大數(shù)據(jù)帶來了社會科學(xué)范式的革命,[3]超越了定量與定性研究的對立,[4]少數(shù)對大數(shù)據(jù)方法的質(zhì)疑也僅僅停留在數(shù)據(jù)獲取的倫理問題上。[5]然而,大數(shù)據(jù)作為一種收集和分析資料的方法,能不能用于社會學(xué)研究之中,它在方法論上的基礎(chǔ)是什么,其適用性和邊界又在哪里,這些問題依然沒有得到充分探討和回答。本文正是以此為起點,試圖在梳理社會科學(xué)領(lǐng)域大數(shù)據(jù)研究的基礎(chǔ)之上,闡述大數(shù)據(jù)在社會學(xué)研究中的方法論邏輯,并說明大數(shù)據(jù)在應(yīng)用過程中的方法論困境。
大數(shù)據(jù)是將社會生活數(shù)字化、數(shù)據(jù)化、變量化,再通過測量這些變量,提取量化信息,得到關(guān)于這個變量的描述以及多變量關(guān)系的分析。大數(shù)據(jù)方法與定量研究范式有著共同的認(rèn)識論基礎(chǔ),但又有其特有的方法論特征。
(一)樣本趨近總體
社會學(xué)定量研究為調(diào)查某一社會現(xiàn)象在總體中的情況,在抽樣框中隨機(jī)抽取一定比例的樣本,通過描述和統(tǒng)計等一系列方法,得到樣本之中不同變量間的關(guān)系,并以此為依據(jù)推論總體之中這些變量之間的狀況。而以大數(shù)據(jù)為經(jīng)驗材料的研究不涉及隨機(jī)抽樣的問題,而是將全部總體納入到分析的框架內(nèi),得出的變量之間的關(guān)系也無需參數(shù)檢驗,而直接用于反映總體趨勢。例如,2015年12月淘寶聯(lián)合第一財經(jīng)商業(yè)數(shù)據(jù)中心推出的《淘寶大數(shù)據(jù)解讀中國消費(fèi)趨勢》的系列報告,[6]并不是將用戶做隨機(jī)抽樣形成樣本,然后調(diào)查他們的性別、地理位置、購物傾向等,而是直接將3.86億淘寶用戶這一總體作為分析的對象,描述總體的消費(fèi)狀況并預(yù)測未來消費(fèi)趨勢。
(二)利用非傳統(tǒng)方式獲取數(shù)據(jù)
一方面,大數(shù)據(jù)不同于傳統(tǒng)問卷調(diào)查依靠被研究者的主訴來獲得資料,而是直接利用技術(shù)手段對被研究者的行為進(jìn)行檢測。另一方面,大數(shù)據(jù)的獲取不依賴傳統(tǒng)的社會統(tǒng)計部門。例如,全國性人口普查是關(guān)于人口的最“大”的數(shù)據(jù),理論上涵蓋每一個個人的信息,體量巨大,卻不能被稱為“大數(shù)據(jù)”,因為人口普查數(shù)據(jù)通過接觸被調(diào)查者直接獲取,并依賴傳統(tǒng)的社會統(tǒng)計部門逐級上報。大數(shù)據(jù)往往基于現(xiàn)代科技手段,采取實時監(jiān)控、測量、存儲的方式整合海量信息,例如交通流量監(jiān)控、氣象水文監(jiān)測數(shù)據(jù)、環(huán)境監(jiān)測數(shù)據(jù)、商業(yè)物流的數(shù)據(jù)記錄,尤其是近年來基于互聯(lián)網(wǎng)的瀏覽、搜索引擎、上傳下載等行為的大數(shù)據(jù),更是成為了大數(shù)據(jù)的主流——甚至幾乎成為了“大數(shù)據(jù)”的同義詞。
(三)通過歸納建立模型
傳統(tǒng)的定量研究先提出假設(shè),并設(shè)計基于假設(shè)的待檢驗?zāi)P停M(jìn)而通過分析數(shù)據(jù)證明或證偽假設(shè)及相關(guān)統(tǒng)計模型。而大數(shù)據(jù)方法是通過對海量的數(shù)據(jù)進(jìn)行分析,尋找變量之間的關(guān)系,而后建立模型。正如張曉強(qiáng)等所說:“數(shù)據(jù)科學(xué)以海量的數(shù)據(jù)為研究對象,通過數(shù)據(jù)挖掘等手段來尋找海量數(shù)據(jù)中潛在的規(guī)律。它研究各個科學(xué)領(lǐng)域所遇到的具有共性的數(shù)據(jù)問題,通過對數(shù)據(jù)的規(guī)律的研究來實現(xiàn)對科學(xué)問題的解答?!盵7]這也就意味著通過大數(shù)據(jù)方法建立的模型并不反應(yīng)必然規(guī)律,而是在非實驗控制的條件下,一系列影響因素綜合作用的結(jié)果。雖然這種模型具有模糊性與偶然性,卻可以在一定程度上預(yù)測現(xiàn)象發(fā)展的趨勢。
(四)呈現(xiàn)相關(guān)關(guān)系而非因果關(guān)系
舍恩伯格等認(rèn)為,大數(shù)據(jù)“不是因果關(guān)系,而是相關(guān)關(guān)系”。[8]定量研究目的是為變量的變異性提供因果解釋,用其他變量解釋所要研究的變量的變異性。而應(yīng)用大數(shù)據(jù),尤其在商業(yè)領(lǐng)域,其目的是銷售商品,這種情況下商家只需要了解用戶的行為與銷售額的相關(guān)關(guān)系為何,并以此作為決策依據(jù),向用戶推薦可能需要的商品,指導(dǎo)商業(yè)活動,而不需要為這種相關(guān)性做出解釋。例如,在美國沃爾瑪在季節(jié)性風(fēng)暴到來時,將蛋撻和颶風(fēng)用品擺放在一起,以增加蛋撻的銷售量。[9]分析兩個變量關(guān)系時,僅僅止步于相關(guān)關(guān)系,即使這個相關(guān)關(guān)系是虛假關(guān)系,或者通過其他變量相互關(guān)聯(lián)。這并不是說大數(shù)據(jù)不能為因果解釋提供數(shù)據(jù)基礎(chǔ),而是說因為在一些大數(shù)據(jù)廣泛應(yīng)用的領(lǐng)域,人們并不探究因果,而是利用大數(shù)據(jù)呈現(xiàn)現(xiàn)象,預(yù)測現(xiàn)象發(fā)展的趨勢,為決策提供依據(jù)。
大數(shù)據(jù)的使用雖然也建立在統(tǒng)計與計算的基礎(chǔ)之上,但是卻有著不同于傳統(tǒng)定量研究范式的方法論特征,這些特征使得研究者在運(yùn)用大數(shù)據(jù)的過程中不可避免地遇到一些方法論困境,這就要求研究者在分析和結(jié)論推演時謹(jǐn)慎行事。
(一)被研究者的主觀性問題
大數(shù)據(jù)更多強(qiáng)調(diào)對個體活動的監(jiān)測來獲取數(shù)據(jù),而非如傳統(tǒng)的定量調(diào)查采取問卷的方式。其中隱含的預(yù)設(shè)是,個體的主訴是含混不清的,被研究者有意隱瞞或是無意遺忘都可能會影響到數(shù)據(jù)的信度與效度,而對個體活動監(jiān)測得來的數(shù)據(jù)就可以避免被研究者主觀意向的介入對數(shù)據(jù)質(zhì)量的影響,例如我們在調(diào)查被研究者的收入情況時,如果采用問卷調(diào)查的方法,由被研究者自主填寫,可能會出現(xiàn)由于記憶不準(zhǔn)導(dǎo)致誤報或者故意瞞報的情況,而如果有技術(shù)可以做到對被研究者銀行賬戶收支的數(shù)據(jù)進(jìn)行監(jiān)測,那么后者將最為接近被研究者收入的“真實”情況。
但是在研究之中,排除被研究者的主觀參與而對其行為的監(jiān)測存在很多問題。首先,社會學(xué)的研究對象是社會現(xiàn)象,社會現(xiàn)象需要人的參與,但是個人的行為與社會現(xiàn)象是兩個不同的概念。行為必須與外部世界中的他人發(fā)生聯(lián)系并主觀指向他人才能被稱為社會現(xiàn)象,所以任何社會現(xiàn)象都有作為主體的人的主觀參與,僅僅依靠觀察個人的活動軌跡并不能說明發(fā)生了某種社會現(xiàn)象。例如,我們可以利用視頻監(jiān)控觀察一定時間地點內(nèi)的人群流動狀況,但是我們無法區(qū)分人群是隨機(jī)地在該地出現(xiàn),還是發(fā)生了集會、游行等社會運(yùn)動。所以用行動代替社會現(xiàn)象是一種概念的偷換。
其次,當(dāng)我們利用行為監(jiān)測來獲得可供研究的經(jīng)驗數(shù)據(jù)時,數(shù)據(jù)的完整性依靠于我們監(jiān)測的手段和方法的可及性與適用性。以調(diào)查收入為例,如果要完整地掌握一個人的收入狀況,我們不僅需要將他名下的賬戶收支都調(diào)查清楚,還要考慮到他日常生活中的現(xiàn)金流動狀況,即便我們可以使用銀行的數(shù)據(jù),但是還是難以監(jiān)測他在日常生活中的收支狀況,也就是說僅利用銀行大數(shù)據(jù)也無法監(jiān)測到此人的完整收入信息。所以在現(xiàn)有手段和技術(shù)的條件下,直接向被研究者詢問的問卷法,依然是最有效的調(diào)查方法。
再次,雖然大數(shù)據(jù)的使用者聲稱用監(jiān)測其行為的方式替代了被研究者的自我敘述,避免了其主觀意志的干擾,但是在互聯(lián)網(wǎng)的虛擬環(huán)境下,數(shù)據(jù)化的信息有很大一部分來自于被研究者的鍵入。例如社交網(wǎng)站上的性別、地點、愛好等信息,依然主要依賴被研究者的自我鍵入,他們有可能會胡亂填寫一些錯誤信息,那么這種利用互聯(lián)網(wǎng)大數(shù)據(jù)的調(diào)查方法比面對面的問卷調(diào)查更加難以保證材料的真實性。
(二)研究對象的局限性
大數(shù)據(jù)方法把總體作為分析的樣本,直接分析總體的情況并建立模型,免去了隨機(jī)抽樣的過程。這種方法認(rèn)為將總體作為樣本避免了隨機(jī)抽樣過程中的抽樣誤差的產(chǎn)生,能夠精確地反映總體的變化趨勢。但是大數(shù)據(jù)方法能夠獲取的“總體”本身是存在偏差的。[10]
首先,由于大數(shù)據(jù)抓取方式的特殊性,研究者的分析可能產(chǎn)生系統(tǒng)性偏誤。也就是說,研究者僅能獲得“能夠被抓取”的信息,而大量不能被抓取的信息則被排除在了總體之外。到2016年初,中國有6.88億網(wǎng)民,[11]而中國總?cè)丝?3.68億,那么通過網(wǎng)絡(luò)抓取個人信息的方式來獲得的大數(shù)據(jù)依然無法涵蓋不會在網(wǎng)上留下痕跡的6.8億非網(wǎng)民。在實際的研究中,研究者往往僅依靠一個或幾個網(wǎng)站的后臺數(shù)據(jù)作為分析資料,那么這種大數(shù)據(jù)僅是使用該網(wǎng)站的用戶的數(shù)據(jù),不能將分析結(jié)果推論到其他網(wǎng)民,更不能推論到全體國民。因此,研究者必須注意,大數(shù)據(jù)中所謂的總體是有限的總體,大部分難以通過大數(shù)據(jù)方法抓取的個體并不被作為研究對象包含在總體中。
第二,即使在同一數(shù)據(jù)收集平臺上,由于不同的個人活躍性不同,其信息被抓取的概率也不同,因此這些大數(shù)據(jù)的形成既不是抽樣,也遠(yuǎn)非隨機(jī),而是具有極大的偶然性。英國廣播公司在2011年通過互聯(lián)網(wǎng)上自助填寫問卷的形式進(jìn)行了一項英國階層調(diào)查,并以此為根據(jù)將英國社會分為7個階層。[12]該調(diào)查共有161458人參加,樣本規(guī)模遠(yuǎn)超傳統(tǒng)的問卷調(diào)查,有的學(xué)者將該調(diào)查所獲得的數(shù)據(jù)界定為大數(shù)據(jù),并認(rèn)為該調(diào)查由被研究者填寫,可以擺脫以往的大數(shù)據(jù)方法多是對行為進(jìn)行觀察而忽視個人主觀性的方法論困境。[13]然而網(wǎng)絡(luò)調(diào)查的樣本僅僅是在問卷投放網(wǎng)絡(luò)的一段時間內(nèi)發(fā)現(xiàn)并有意愿填寫問卷的網(wǎng)民,如果一個網(wǎng)民在這一時間并不活躍,那么他將不被納入調(diào)查的樣本之中,因此通過該網(wǎng)絡(luò)調(diào)查得出的結(jié)果只是一種偶然關(guān)聯(lián),一種統(tǒng)計學(xué)上的相關(guān),而不具有任何推論價值。
(三)變量關(guān)系的真?zhèn)螁栴}
如前所述,一般情況下人們在使用大數(shù)據(jù)時僅僅關(guān)注兩個事件的相關(guān)關(guān)系。而對社會學(xué)研究來說,研究者需要描述特定社會現(xiàn)象的變異,再通過了解該社會想象與其他社會現(xiàn)象(變量)的因果關(guān)系,為該現(xiàn)象的變異提供解釋依據(jù)。所以當(dāng)我們試圖用大數(shù)據(jù)作為材料來進(jìn)行解釋社會現(xiàn)象時需要非常謹(jǐn)慎,可能兩個具有高度統(tǒng)計相關(guān)的變量并不具有社會學(xué)意義上的因果關(guān)系。
第一,在一些領(lǐng)域應(yīng)用的大數(shù)據(jù)變量間的關(guān)系為虛假關(guān)系。例如颶風(fēng)用品的銷售量和蛋撻的銷售量呈現(xiàn)成比例相關(guān),但是二者并不具有因果關(guān)系,而是共同的受到另一變量即颶風(fēng)天氣因素的影響,控制天氣因素則二者相關(guān)關(guān)系自動解除。所以在使用大數(shù)據(jù)分析兩個變量關(guān)系時往往需要控制其他變量,以達(dá)到辨別相關(guān)關(guān)系真?zhèn)?,進(jìn)而對社會現(xiàn)象進(jìn)行因果解釋的目的。
第二,由于大數(shù)據(jù)旨在一個較大的數(shù)量級上關(guān)注兩個變量變異的總體趨勢預(yù)測,所以往往忽視樣本內(nèi)部個體之間的差異,試圖用一個變量完全解釋另一個變量的變異,導(dǎo)致層次謬誤。Artés對西班牙選舉日的天氣和投票大數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)如果天氣狀況不佳,則保守政黨得票比例將增高。如果分析止步于此,就會得到結(jié)論:天氣狀況影響保守派的得票率。但是作者將投票者的社會經(jīng)濟(jì)地位作為變量帶入分析之中,進(jìn)而論述天氣不佳會影響較低階層的人們出行,而較低階層的人群更多地將選票投給左翼政黨,所以天氣不佳,較低階層的投票者數(shù)量減少,左翼政黨得票比例下降,保守政黨得票比例上升。[14]控制社會經(jīng)濟(jì)地位這一變量,則可以看到天氣僅對低階層人群的投票率產(chǎn)生影響,所以僅關(guān)注數(shù)據(jù)的整體趨勢則可能導(dǎo)致層次謬誤的出現(xiàn)。
第三,利用大數(shù)據(jù)方法獲取資料是否要進(jìn)行顯著性檢驗、應(yīng)該如何進(jìn)行相關(guān)檢驗,依然存疑。一方面,大數(shù)據(jù)方法聲稱其樣本即總體,那么既然直接分析總體趨勢的變化則可以免去顯著性檢驗的過程。然而如前所述,大數(shù)據(jù)方法能夠獲取到的“總體”和作為研究對象的“總體”總是存在著錯位,大數(shù)據(jù)“總體”(樣本)的獲取也并不是采用概率抽樣,所以該不該進(jìn)行顯著性檢驗的問題就擺在了研究者面前。另一方面,即使暫且認(rèn)為大數(shù)據(jù)需要進(jìn)行顯著性檢驗,通常顯著性檢驗是針對正態(tài)分布的較小樣本而進(jìn)行的,樣本規(guī)模會對顯著性檢驗的結(jié)果產(chǎn)生影響,而大數(shù)據(jù)由于樣本規(guī)模龐大,所以在分析的過程中很容易發(fā)現(xiàn)統(tǒng)計顯著性,[15]那么就有可能導(dǎo)致這樣一種錯誤:被發(fā)現(xiàn)變量之間的關(guān)系是偶然出現(xiàn)的而并不具有任何規(guī)律性,卻僅僅由于龐大的樣本量而被證明具有顯著性。
(四)數(shù)據(jù)缺失問題
不管是辨別相關(guān)關(guān)系的真?zhèn)?,還是避免層次謬誤,都離不開數(shù)據(jù)本身包含的變量的規(guī)模,只有在數(shù)據(jù)包括足夠豐富的其他變量時,我們才能夠引入或者控制這些變量,已達(dá)到解釋因變量變異的目的。舉例說明,當(dāng)研究者對人群的收入進(jìn)行研究時,不僅僅要看作為整體的收入變量如何分布,還需要收集人群的其他變量,例如性別、年齡、收入、職業(yè)等,分別分析收入在不同人群之中的變異情況,從而對收入不平等進(jìn)行解釋。也就是說,社會學(xué)研究需要的是多變量的數(shù)據(jù)矩陣,而不是樣本龐大但變量單一的大數(shù)據(jù)。然而做到這一點并不容易。
第一,如果一個大數(shù)據(jù)樣本量巨大,但只包括單一的變量,那么只能對這個大數(shù)據(jù)中的這個變量進(jìn)行描述統(tǒng)計,則這個大數(shù)據(jù)不能作為社會學(xué)分析的材料,例如單一的地區(qū)人均收入數(shù)據(jù)、流行病死亡率數(shù)據(jù)等。如果研究者想要使用這些數(shù)據(jù),必須將時間、地點等內(nèi)容作為中間變量,將該大數(shù)據(jù)與其他數(shù)據(jù)庫進(jìn)行對接,以此獲得較多的分析所需的變量。
第二,一些網(wǎng)絡(luò)大數(shù)據(jù)由于其獲取形式的非常規(guī)問題,導(dǎo)致數(shù)據(jù)本身的模糊性和混雜性,致使不可避免地出現(xiàn)數(shù)據(jù)缺失的情況。假設(shè)要對一個匿名的不需要身份驗證的社交網(wǎng)站上的內(nèi)容做分析,我們難以保證所有用戶都鍵入了研究所要分析的社會特征信息,例如性別、畢業(yè)學(xué)校、薪資等內(nèi)容,這就必然導(dǎo)致大量的數(shù)據(jù)缺失,面對海量的缺失數(shù)據(jù),任何刪除和填補(bǔ)的補(bǔ)救措施都會對分析的結(jié)果產(chǎn)生影響,因此關(guān)鍵變量的大量數(shù)據(jù)缺失使得任何統(tǒng)計分析的結(jié)果都存在偏誤。
大數(shù)據(jù)近年來的廣泛應(yīng)用,大大拓展了社會學(xué)的理論視野。然而,任何單一范式中的理論與方法都有其適用性和解釋邊界。大數(shù)據(jù)將社會生活數(shù)字化、數(shù)據(jù)化、定量化,認(rèn)為社會生活的本質(zhì)是由信息構(gòu)成的,[16]主張測量一切,實質(zhì)上是用一種科學(xué)主義簡化論的世界觀來看待社會生活。社會學(xué)是一門多研究范式的學(xué)科,以統(tǒng)計分析為特征的大數(shù)據(jù)方法,充其量只能作為社會學(xué)諸多研究范式中的一種,并不會帶來社會學(xué)的范式革命。
數(shù)據(jù),是世界通過我們的感覺和工具呈現(xiàn)給我們的東西,而知識,是我們對數(shù)據(jù)的理解與詮釋。大數(shù)據(jù)不是“告訴”了我們世界如何運(yùn)作,而僅僅是呈現(xiàn)給我們需要解讀的材料,如何對數(shù)據(jù)進(jìn)行理解與詮釋,還需要具有一定知識結(jié)構(gòu)和理論背景的研究者發(fā)揮社會學(xué)的想象力。大數(shù)據(jù)是我們認(rèn)識世界的工具,并不能代替研究者的理性思考,也不會帶來社會學(xué)研究范式的根本轉(zhuǎn)變,因此神化大數(shù)據(jù)的諸多論斷,在本文看來都是不可取的。
注釋:
[1]趙勇、林輝、沈寓實:《大數(shù)據(jù)革命——理論、模式與技術(shù)創(chuàng)新》, 北京:電子工業(yè)出版社, 2014年, 第3頁。
[2]李天柱、王圣慧、馬佳:《基于概念置換的大數(shù)據(jù)定義研究》,《科技管理研究》2015年第12期。
[3]羅瑋、羅教講:《新計算社會學(xué):大數(shù)據(jù)時代的社會學(xué)研究》,《社會學(xué)研究》2015年第3期。
[4]夏國美:《大數(shù)據(jù)時代的社會學(xué)審視》,《新疆師范大學(xué)學(xué)報》(哲學(xué)社會科學(xué)版)2016年第1期。
[5]靜恩英:《大數(shù)據(jù)及其反思》,《湛江師范學(xué)院學(xué)報》2014年第4期。
[6]《淘寶最全數(shù)據(jù)解讀消費(fèi)趨勢》,2015 年12月8日,http://roll.sohu.com/20151208/ n430227084.shtml,2016年1月4日。
[7]張曉強(qiáng)、楊君游、曾國屏:《大數(shù)據(jù)方法:科學(xué)方法的變革和哲學(xué)思考》,《哲學(xué)動態(tài)》2014年第8期。
[8]維克托·邁爾-舍恩伯格、肯尼思·庫克耶:《大數(shù)據(jù)時代:生活、工作與思維的大變革》,盛楊燕、周濤譯,杭州: 浙江人民出版社,2015年,第67頁。
[9]維克托·邁爾-舍恩伯格、肯尼思·庫克耶:《大數(shù)據(jù)時代:生活、工作與思維的大變革》,第73頁。
[10]D.A.McFarland, H.R.McFarland, “Big Data and the Danger of Being Precisely Inaccurate”,Big Data & Society, vol.2, no.2(2015), pp.1-4.
[11]中國互聯(lián)網(wǎng)絡(luò)信息中心:《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,2016年1月22日,http://cnnic.cn/gywm/xwzx/rdxw/2015/201601/ t20160122_53283.htm,2016年2月4日。
[12]BBC Science: The Great British Class Survey Results, 2013年4月3日, http://www.bbc. co.uk/science/0/21970879, 2016年1月22日。
[13]R.Burrows, M.Savage, “After the Crisis?Big Data and the Methodological Challenges of Empirical Sociology”,Big Data & Society, vol.1, no.1(2014),pp.1-6.
[14]J.Artes, “The Rain in Spain: Turnout and Partisan Voting in Spanish Elections”,European Journal of Political Economy, vol.34(2014), pp.126-141.
[15]R.Tinati, S.Halford, L.Carr, C.Pope,“Big Data: Methodological Challenges and Approaches for Sociological Analysis”,Sociology, vol.48, no.4(2014),pp.663-681.
[16]維克托·邁爾-舍恩伯格、肯尼思·庫克耶:《大數(shù)據(jù)時代:生活、工作與思維的大變革》,第125頁。
責(zé)任編輯 劉秀秀
作者簡介:鮑雨,江蘇省社會科學(xué)院社會學(xué)所助理研究員,社會學(xué)博士,南京市,210003。
中圖分類號:C91-03
文獻(xiàn)標(biāo)識碼:A
文章編號:1006-0138(2016)03-0048-05