◎ 徐明華 馮亞凡
近幾年隨著 互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)和人工智能技術的迅猛發(fā)展,有關“大數(shù)據(jù)”“社會計算”等概念在新聞傳播領域的研究呈井噴趨勢,成果豐富,角度多元。然而在大量的研究文獻中,有關“社會計算”和“大數(shù)據(jù)”在概念和方法的運用上經(jīng)常混淆不清、相互串用。相關研究內(nèi)容龐雜多元,亟待梳理出清晰的研究體系。
在新聞傳播領域,“大數(shù)據(jù)”的相關研究大都從宏觀層面概括性闡述大數(shù)據(jù)的概念與社會意義,或探析它為新聞傳播學科帶來的相關思考,仍較缺少用具體的案例來解讀大數(shù)據(jù)方法的應用和問題的解決。例如喻國明教授指出大數(shù)據(jù)時代傳播學研究的模式、邏輯和手段已經(jīng)產(chǎn)生了新的變化。彭蘭也認為大數(shù)據(jù)技術將在一定程度上對現(xiàn)有新聞生產(chǎn)的模式與機制產(chǎn)生影響,新聞業(yè)務發(fā)展需要更多跨界的合作。而“社會計算”被提及的次數(shù)更是微乎其微,相關的研究內(nèi)容也停留在宏觀概念的敘述和探究上,缺乏深入具體的應用與分析。對于“社會計算”與“大數(shù)據(jù)”,學者們尚未厘清及統(tǒng)一它的概念和界限,相關定義模糊不清,不同學者各執(zhí)一詞。例如沈浩指出,大數(shù)據(jù)時代下進行社會計算會讓我們越來越多地從數(shù)據(jù)中觀察到人類社會的復雜行為模式。他認為“大數(shù)據(jù)”是環(huán)境和時代的特征,而“社會計算”是研究方法的存在。但在王飛躍等學者的研究中,社會計算利用大數(shù)據(jù)來解析復雜系統(tǒng),即大數(shù)據(jù)是社會計算視域下的一種計算方法和解決思路。綜上,這種未將“大數(shù)據(jù)”“社會計算”的概念定義明確,甚至將其界限混為一談的現(xiàn)象,容易造成方法論使用上的混淆。本文試圖通過對兩者進行概念梳理和內(nèi)涵思辨,為新聞傳播學領域的相關發(fā)展建言獻策。
“大數(shù)據(jù)”的概念首見于1998年《科學》(Science)中的《大數(shù)據(jù)的管理者》(A Handler for Big Data)一文。2008年9月《自然》(Nature)出版了“big data”專刊,使得“大數(shù)據(jù)”爆發(fā),在學術界得到認可和廣泛利用。究竟何為大數(shù)據(jù)?學者Manyika等認為“大數(shù)據(jù)”是指超越傳統(tǒng)典型數(shù)據(jù)各方特性的新型數(shù)據(jù)集合。研究機構Gartner對“大數(shù)據(jù)”的定義是海量、高增長率和多樣化的信息資產(chǎn)。國內(nèi)學者劉建明、丁柏銓等也曾論述,“大數(shù)據(jù)”是信息爆炸的表現(xiàn),是巨量資料、浩瀚信息的另一種稱呼。所以,“大數(shù)據(jù)”被理解為一種超越常規(guī)工具收集和處理極限的巨量數(shù)據(jù)集合。而另一方面,一些學者則對“大數(shù)據(jù)”的概念持有更廣義的詮釋。方環(huán)非指出大數(shù)據(jù)在指向數(shù)據(jù)集合或信息資產(chǎn)之外,更多地意味著技術層面的大數(shù)據(jù)技術概念。喻國明在其研究中表示,大數(shù)據(jù)分析的關鍵其實并不在于掌握大的數(shù)據(jù),而是在于從數(shù)據(jù)中提取意義的能力,以及發(fā)現(xiàn)隱藏的模式與可能的關系的能力。因而,“大數(shù)據(jù)”不僅只強調(diào)數(shù)據(jù)的海量,更進一步指出數(shù)據(jù)背后的復雜形式以及對數(shù)據(jù)的分析、處理等專業(yè)化能力,體現(xiàn)了多重技術的協(xié)同。在新聞傳播領域,關于“大數(shù)據(jù)”概念的爭論,不同的學者往往圍繞上述兩個方向各抒己見。
而“社會計算”的概念早于“大數(shù)據(jù)”,在1994年就已經(jīng)第一次出現(xiàn),Schuler認為:“社會計算可以是任何一種類型的計算應用, 以軟件作為社交關系的媒介或聚焦”。在英文中“Social Computing”實質(zhì)內(nèi)容多指“社會軟件(Social Software)”,而非面向社會活動、社會過程、社會組織等的計算方法研究和應用。但隨著信息網(wǎng)絡的興起和科學技術的快速發(fā)展,社會計算被不斷賦予新的內(nèi)涵和意義。近年來,社會計算不僅是一種技術、一種社會現(xiàn)象,也成為各學科研究的手段和趨勢,對其概念的理解和界定也存在著較大差異。王飛躍指出,除了技術層面的認識之外,“社會計算”可以理解為是技術與人文交融、研究視角多元的學科領域。王琳琳也指出社會計算是一門現(xiàn)代計算技術與社會科學之間的交叉學科,是一個社會行為和計算系統(tǒng)交叉融合而成的研究領域。而另有一些學者,對于“社會計算”的概念思辨偏向于研究范式的理解。孟小峰等認為社會計算是一種理論和方法論體系,使用系統(tǒng)科學、人工智能、數(shù)據(jù)挖掘等科學計算理論作為研究方法,結合社會科學理論與計算理論,來解決復雜性社會問題。
由此,“大數(shù)據(jù)”和“社會計算”的概念并未在學術界得到統(tǒng)一,它們的內(nèi)涵和意義仍然不斷蛻化、不斷發(fā)展,在各個研究者的論述與定義中一直流變。
其實大數(shù)據(jù)從提出伊始在信息科學領域并不存在較大爭議,即具有規(guī)模性(volu me)、多樣性(variety)、高速性(velocity)和有價值(value)等特點的數(shù)據(jù)集合。自然科學中“大數(shù)據(jù)”作為瑣碎龐大的原材料,需要經(jīng)歷諸多步驟才能實現(xiàn)其最終的價值;如圖1所示,“原材料”首先被篩選成“目標數(shù)據(jù)”;經(jīng)過預處理、變換后,成為數(shù)據(jù)結構完整的規(guī)則數(shù)據(jù);然后通過智能化數(shù)據(jù)挖掘和可視化得到“能讀懂的信息”。而后,在跨學科領域的后半段過程中,人文社會科學等再對其進行進一步的歸納和解釋,通過對一些研究方法的運用和既有理論的再加工,將“信息”處理成為“知識”。而對“知識”的后續(xù)思辨根據(jù)人文社科的研究格局可分為三個遞進領域:一是“知識發(fā)現(xiàn)”,指通過對基礎數(shù)據(jù)的計算展開的現(xiàn)象描述,例如對傳播要素、傳播過程的解釋和分析等;二是“知識提取”,是在現(xiàn)象描述的基礎上,發(fā)現(xiàn)和探索現(xiàn)象背后的組織構造和運行原理,即機制,例如深入論證各要素之間的因果關系;三是“模式分析”,是基于前兩者,通過科學方法對事物的發(fā)展趨勢具有預測性的推理,以期實現(xiàn)人們看待事物的方法或者學科思維結構上的“創(chuàng)新”。綜上,數(shù)據(jù)的挖掘、處理,信息的加工,知識的生產(chǎn),是一個需要多重學科知識、跨領域的復雜過程。期間環(huán)環(huán)相扣,缺少任何一個步驟都不能完全實現(xiàn)數(shù)據(jù)最終的有效價值。
圖1 跨學科領域中數(shù)據(jù)處理及知識生產(chǎn)流程圖
以上過程中,自然科學領域研究者通常關注如何將原始“大數(shù)據(jù)”一步步處理變換得到所謂的“信息”與“知識”,沉浸在算法優(yōu)化等客觀表述中。而社會科學領域的研究者對問題具有較高敏感度,更擅長于對所謂的“知識”進行分析、發(fā)現(xiàn)和提取。所以在跨學科合作的研究中,信息計算學者實現(xiàn)的往往是知識生產(chǎn)前的計算工作,而社會科學學者更偏向于人文思辨的知識生產(chǎn)。由于對前一部分的計算工作了解并不深入,社會科學經(jīng)常提及的“大數(shù)據(jù)”便囊括了數(shù)據(jù)從獲取、篩選到各種處理變換的整個過程。所以,社會科學領域出現(xiàn)了一批將“大數(shù)據(jù)”理解為方法技術的學者。
而“大數(shù)據(jù)”實質(zhì)上是不斷增長的海量復雜信息的客觀存在。繁雜瑣碎的數(shù)據(jù)必須經(jīng)過一套系統(tǒng)化的方法處理才能實現(xiàn)其應有的價值。其實從19世紀開始,社會學者們便一直致力于建構系統(tǒng)的方法論。網(wǎng)絡科學的出現(xiàn)使原本相對獨立的自然科學和社會科學,相互交匯誕生了社會計算科學、計算廣告學、計算傳播學等一系列跨學科研究?!吧鐣嬎悖╯ocial computing)”的概念就是在這種背景下被提出的,它的產(chǎn)生并不是簡單的自然科學技術與人文社會科學的疊加, 而是來自于學者們試圖擺脫傳統(tǒng)思辨,科學探索問題的一種思維創(chuàng)新。傳播學之父施拉姆就曾指出,將自然科學的概念引入人文社會科學用以研究人類的傳播方式與過程,將成為一種新的研究模式。
“社會計算”便是這樣一種新的研究模式和研究范式,利用信息科學和計算機技術來解決社會科學的相關議題。它實現(xiàn)了知識共享,為社科研究引進了全新的計算方法和工具。如圖2所示,以一個形象的比喻來描述“大數(shù)據(jù)”和“社會計算”的關系?!按髷?shù)據(jù)”可以理解為建筑原材料,研究中所涉及的方法(如復雜網(wǎng)絡分析法、數(shù)據(jù)建模等)則是建筑的設計圖,運用的軟件工具(如Ucinet、CiteSpace、Python等)是建筑的工具,最后可視化呈現(xiàn)的是建筑的外觀,而“社會計算”則類比為整個建筑過程。
圖2 “大數(shù)據(jù)”與“社會計算”關系類比圖
所以,“社會計算”就是以“大數(shù)據(jù)”為前提,利用相關計算方法來挖掘數(shù)據(jù)背后所蘊含的有意義的信息和價值的一套方法論。社會計算關注的重點:一是信息技術中如何嵌入人文知識使之更好地服務于社會活動,二是信息技術如何作為研究工具被使用和發(fā)展。祝建華指出,“社會計算”是最近10年內(nèi)興起的一種采用互聯(lián)網(wǎng)、大數(shù)據(jù)、機器學習等計算技術來研究社會科學問題的新思潮和新方法?!吧鐣嬎恪辈皇巧鐣茖W家們的專利,而是一個涉及科學、技術、醫(yī)學、社會、人文等各領域的跨學科“群眾運動”。作為新興崛起的研究范式和方法論,將“社會計算”引入新聞傳播學科將受益無窮。沈浩也認為,網(wǎng)絡科學和社會網(wǎng)絡分析等社會計算方法是“大數(shù)據(jù)”分析的重要技術和方法論。王成軍也在“社會計算”和計算社會科學的基礎上提出了計算傳播學的概念。因此,“社會計算”應當比“大數(shù)據(jù)”這一說法更加切合當下的技術發(fā)展前景。
新聞傳播學科正在經(jīng)歷一場變革與創(chuàng)新,其研究范式正在從以定性描述為主轉(zhuǎn)向以數(shù)據(jù)實證為主,分析格局由傳統(tǒng)的個體統(tǒng)計數(shù)據(jù)轉(zhuǎn)向海量的關系數(shù)據(jù)。在這樣的時代背景下,新聞傳播領域的方法論將注入更多復雜、龐大的計算特色??捎嬎愕姆椒ㄊ沟贸了臄?shù)據(jù)寶藏逐漸蘇醒。從傳播學研究的立場來看,如何在當前技術和信息科學的影響下,立足于人文社會的本質(zhì)問題,加強學科建設,是傳播研究者們的關注焦點。 總之,傳播學和媒介研究在保持對最前沿技術的關注的同時,更應深入思考一個關鍵性問題:“社會計算”等新型研究范式的崛起能否又如何成為傳播學學科變革與繼續(xù)發(fā)展的生長基質(zhì)?縱觀技術革新背景下整個新聞傳播學科格局的衍化及走向,由此產(chǎn)生以下兩點反思。
第一,傳統(tǒng)的量化方法無法解決日益復雜的傳播行為,由此突顯了“計算”的重要性。隨著技術的發(fā)展演進,媒體的更迭激發(fā)了受眾無上限的信息欲望,不斷沖擊著信息的產(chǎn)生和流動,引導著受眾,使其傳播行為更加復雜化。如圖3左所示,傳統(tǒng)量化研究方法基于人類對社會已形成的認知和判斷之上,采用一定的統(tǒng)計方法對既有理論、對社會問題或規(guī)律提出相關假設并驗證真?zhèn)?。而大?shù)據(jù)時代的新型計算過程在部分保留傳統(tǒng)研究思維的同時,更多地呈現(xiàn)出一種逆向思維模式。如圖3右所示,在價值密度低、量級龐大、爆炸式增長的大數(shù)據(jù)中,通過智能化的機器算法,從沒有形成人類“知識預判”的數(shù)據(jù)中挖掘隱匿復雜的人類行為模式,并以此為基礎深入探索新型的社會特征、演化規(guī)律、受眾需求等。這種逆向思維的計算過程可以幫助現(xiàn)有的經(jīng)典理論在技術發(fā)展視角下完成新的驗證,也可以展開對未知領域的探索,實現(xiàn)認知上的創(chuàng)新,為傳播學的發(fā)展帶來不可多得的機會與革命。
圖3 量化研究的“正向思維”與“逆向思維”
第二,算法和闡釋相粘合才易產(chǎn)生新的學科發(fā)展。機器算法能夠通過標簽幫助實現(xiàn)受眾的精準分類,更能基于不同的社會群體提供不同的媒介服務。然而這種依賴于算法的傳播路徑侵蝕了人文社會領域的建設和發(fā)展,思維容易囿于惰性并僵化。提出對大數(shù)據(jù)和社會計算方法的重視,并非意味著對機器算法的依賴,甚至停止人類的思考。對于不斷數(shù)字化、信息化的未來社會,學術領域為此或?qū)⒎殖蓛膳蛇M行博弈:一是技術理性派,認為機器算法等科學技術是揭示人類社會的有效途徑;二是技術批判派,認為盲目的技術壟斷會阻礙社會進步,造成更多的倫理困境。然而,技術理性和人文探索之間的取舍并非一道難解命題。隨著人文社會科學領域的研究、算法、數(shù)據(jù)、模型等不斷更迭,方法體系的嬗變從未影響人們對未知領域的探索和創(chuàng)新,哲學思辨一直是人類思考的最高境界。兩者更加融洽的粘合而非相互排斥,才能拓寬人類社會科學的領域范疇,甚至促成一個嶄新的認知體系。
注釋:
① 喻國明,王斌,李彪,楊雅.傳播學研究:大數(shù)據(jù)時代的新范式[J].新聞記者,2013 (06):22-27.
② 彭蘭“.大數(shù)據(jù)”時代:新聞業(yè)面臨的新震蕩[J]. 編輯之友, 2013(1):6-10.
③ 沈浩,黃曉蘭.大數(shù)據(jù)助力社會科學研究:挑戰(zhàn)與創(chuàng)新[J].現(xiàn)代傳播,2013(08):13-18.
④ 王飛躍,曾大軍,毛文吉.社會計算的意義、發(fā)展與研究狀況[J].科研信息化技術與應用, 2010(2):3-15.
⑤ Cass T. A Handler for Big Data[J]. Science, 1998, 282(5389):636-636.
⑥ 劉紅,胡新和.數(shù)據(jù)革命:從數(shù)到大數(shù)據(jù)的歷史考察[J].自然辯證法通訊,2013(6):33-39.
⑦ 馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應用[J].國防科技, 2013(2):10-17.
⑧ Schuler D. Social computing[J]. Communication of the ACM,1994,37(1):28-29
⑨ 王琳琳,陳云芳,耿路.社會計算:計算的新應用方向[J].淮海工學院學報(自然科學版), 2012(2):19-22.
⑩ 孟小峰,李勇,祝建華.社會計算:大數(shù)據(jù)時代的機遇與挑戰(zhàn)[J].計算機研究與發(fā)展, 2013,(12):2483-2491.
? 陳浩,樂國安,李萌,等.計算社會科學:社會科學與信息科學的共同機遇[J].西南大學學報(社會科學版), 2013 (3):87-93.
? 祝建華,彭泰權,梁海,等.計算社會科學在新聞傳播研究中的應用[J].科研信息化技術與應用,2014(02):3-13.
? 沈浩,黃曉蘭.大數(shù)據(jù)助力社會科學研究:挑戰(zhàn)與創(chuàng)新[J].現(xiàn)代傳播,2013(08):13-18.
? 王成軍.社交網(wǎng)絡上的計算傳播學[M] .北京:高等教育出版社,2015:3-5.