孫 玨
(上海師范大學學報期刊雜志社,上海200234)
大數(shù)據(jù)時代中學術(shù)期刊的困惑及思維創(chuàng)新
孫玨
(上海師范大學學報期刊雜志社,上海200234)
綜觀目前在出版領(lǐng)域的大數(shù)據(jù)相關(guān)研究成果,可以發(fā)現(xiàn)兩年來相關(guān)研究主要集中在出版產(chǎn)業(yè)的宏觀發(fā)展圖景、戰(zhàn)略性政策、應用價值和商業(yè)運作模式上,極少涉及社科類學術(shù)期刊。筆者以教育學專業(yè)期刊為例,闡述學術(shù)期刊在大數(shù)據(jù)浪潮沖擊下所產(chǎn)生的困惑,思考大數(shù)據(jù)思維對學術(shù)期刊深層次的影響和啟發(fā)。
大數(shù)據(jù);學術(shù)期刊;思維
2013年被定義為“大數(shù)據(jù)元年”[1],兩年來,大數(shù)據(jù)研究已經(jīng)從計算機科學“一枝獨秀”到各行各業(yè)“全面開花”。目前,大數(shù)據(jù)在IT產(chǎn)業(yè)、信息通訊、市場消費及金融貿(mào)易等行業(yè)已經(jīng)產(chǎn)生了一定的規(guī)模效應,由此也引起了公共管理部門及學術(shù)領(lǐng)域的高度關(guān)注。與大數(shù)據(jù)相關(guān)的社會科學方面的研究呈現(xiàn)出以下的特點和局限。
綜合目前在出版領(lǐng)域的大數(shù)據(jù)相關(guān)研究,可以發(fā)現(xiàn)近年來研究的特點如下:研究主要集中在出版產(chǎn)業(yè)的宏觀發(fā)展圖景以及戰(zhàn)略性政策方針上;介紹西方出版業(yè)大數(shù)據(jù)運用的成功案例,以此對我國出版業(yè)走向有比較借鑒意義;將大數(shù)據(jù)作為出版體制改革的技術(shù)工具來論述的也比較普遍,主要探討大數(shù)據(jù)的概念、內(nèi)涵、特點、出版領(lǐng)域應用價值和商業(yè)運作模式。
出版業(yè)發(fā)展日新月異,責任和使命并行,正在積極把握大數(shù)據(jù)全球化這一發(fā)展趨勢所帶來的契機和挑戰(zhàn)。而學術(shù)期刊也是媒介,離不開媒介發(fā)展的大環(huán)境。因此,身處出版業(yè)之中,遵循出版發(fā)展的規(guī)律,順應出版發(fā)展的趨勢,是學術(shù)期刊必須轉(zhuǎn)變的觀念,2011年,國家新聞出版總署要求學術(shù)期刊進行體制轉(zhuǎn)型改革,目的是為了以改革促發(fā)展。作為學術(shù)期刊的編輯,筆者深切地感受到這次轉(zhuǎn)型的意義重大。而與此同時,大數(shù)據(jù)正在進入出版業(yè)的方方面面,對這一領(lǐng)域的未來發(fā)展產(chǎn)生著深遠的影響,并已經(jīng)引起了相關(guān)專業(yè)的學者們的關(guān)注。目前,出版學界對于大數(shù)據(jù)的研究仍處于比較初步的階段,關(guān)鍵在于操作性的敘述較多,深層次的思考不夠,無論深度還是廣度都十分有限,大數(shù)據(jù)研究極少涉及學術(shù)出版自身來探討,即便有所涉及,將大數(shù)據(jù)與學術(shù)期刊轉(zhuǎn)型結(jié)合起來的研究幾乎沒有深入下去。筆者以教育學專業(yè)期刊為例,闡述學術(shù)期刊面臨大數(shù)據(jù)浪潮的困惑,嘗試讓學術(shù)期刊在思維上能有所突破。
按照維基百科的定義,大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集。大數(shù)據(jù)具有規(guī)模性、多樣性、高速性和價值性等特點[2]。因此不少學術(shù)期刊認為大數(shù)據(jù)與以市場盈利為目的的大型出版集團有關(guān),主要運用在出版的商業(yè)運作環(huán)節(jié)上,而學術(shù)期刊是以產(chǎn)生社會效益為辦刊宗旨,不以盈利為目的,讀者和作者都是小眾群體,因此與大數(shù)據(jù)關(guān)系不大。他們產(chǎn)生這樣的疑問在所難免。以下三點困惑是比較普遍存在的。
2.1困惑一:大數(shù)據(jù)等同于規(guī)模超大的海量數(shù)據(jù)嗎?
若是以維基百科定義大數(shù)據(jù)的標準,可以說能稱得上大數(shù)據(jù)的數(shù)據(jù)庫真的非常少,普通的學術(shù)期刊編輯部甚至期刊雜志社日常的數(shù)據(jù)集絕大多數(shù)與大數(shù)據(jù)沾不上邊。其實,大數(shù)據(jù)的大是相對而言的,不是絕對的大。對于學術(shù)期刊來說,能夠盡可能地搜集創(chuàng)刊以來的所有數(shù)據(jù)和資料,越全面詳細越好。因為所有這些數(shù)據(jù)就是元數(shù)據(jù),即大數(shù)據(jù)的數(shù)據(jù)??梢哉f,每一家學術(shù)期刊編輯部都應該建立自己的大數(shù)據(jù)規(guī)劃圖。反過來說,海量數(shù)據(jù)并不一定能稱其為大數(shù)據(jù),因為真正體現(xiàn)大數(shù)據(jù)能量的是不僅要具備收集數(shù)據(jù)的能力,還要具備低成本分析數(shù)據(jù)的能力[3]。學術(shù)期刊對于大數(shù)據(jù)的關(guān)注,應該更多地放在對出版資源的獲取與利用方面,因為對信息的獲取和利用也是非常有價值的大數(shù)據(jù)研究一部分。
2.2困惑二:數(shù)據(jù)挖掘和分析全部需要技術(shù)支持嗎?
大數(shù)據(jù)本身就是屬于高科技領(lǐng)域的產(chǎn)物,整個大數(shù)據(jù)的處理流程可以定義為在合適工具的輔助下,對廣泛異構(gòu)的數(shù)據(jù)源進行抽取和集成,結(jié)果按照一定的標準統(tǒng)一存儲。利用合適的數(shù)據(jù)分析技術(shù)對存儲的數(shù)據(jù)進行分析,從中提取有益的知識并利用恰當?shù)姆绞綄⒔Y(jié)果展現(xiàn)給終端用戶[4]??梢姶髷?shù)據(jù)的每一個環(huán)節(jié)都離不開計算機技術(shù)的支撐,但是大數(shù)據(jù)發(fā)展的趨勢是,從數(shù)據(jù)集成到數(shù)據(jù)分析,直到最后的數(shù)據(jù)解釋,簡單易用應當貫穿整個流程之中。目前大數(shù)據(jù)的易用性研究還處在起步階段,易用性表現(xiàn)為易見、易學、易用[4]。這將意味著學術(shù)期刊不必在內(nèi)部開發(fā)或引入所有的大數(shù)據(jù)技術(shù),可以利用云服務或預先設(shè)置好的應用程序來解決數(shù)據(jù)分析需求從而專注于學術(shù)出版業(yè)務。
2.3困惑三:社會科學研究將被大數(shù)據(jù)分析所取而代之嗎?
大數(shù)據(jù)與社會科學研究一結(jié)合,就遭到了一些社會科學學者的反對和質(zhì)疑。教育學教授閻光才指出:“在幾乎所有的社會科學實證性研究中,研究問題的確定本身就來自人的意向性……如果沒有研究者對生活世界的體驗、關(guān)切、理解和自我偏好甚至價值‘偏見’在先,數(shù)據(jù)的生成和獲取就成為不可思議的事情。”[5]閻光才一針見血地批判現(xiàn)在的教育研究為了迎合大眾趣味,為了大數(shù)據(jù)而進行各種缺乏意義深度詮釋的數(shù)據(jù)分析,完全是徒有形式的計數(shù)而已[5]。此番話語不無道理,這樣的大數(shù)據(jù)研究只是形式上的簡單模仿,根本沒有掌握大數(shù)據(jù)精髓其中一二。《大數(shù)據(jù)時代》作者同樣認為:“我們也要繼續(xù)重視那些數(shù)據(jù)不能解釋的事物:由人類的智慧、獨創(chuàng)性、創(chuàng)造力造就的理念,這是大數(shù)據(jù)分析無法預測的。”[6]任何將大數(shù)據(jù)妖魔化的狂熱想法或行為都是有悖于大數(shù)據(jù)精神的。在大數(shù)據(jù)出現(xiàn)之前,人類探索世界所使用的科學方法和工具不僅不會被大數(shù)據(jù)取代,而且會和大數(shù)據(jù)并存。大數(shù)據(jù)可以完善和補充社會科學現(xiàn)有的研究體系,使之更加多元多樣、合乎學術(shù)規(guī)范以及精確有效。
“因為社會所受到的影響要比技術(shù)上的滯后幾十年,真正的革命不會是一個從A點到B點的有序過渡。相反,A點到B點之間可能經(jīng)過一個長期的混亂。在此混亂時期,舊的體系已經(jīng)崩潰,而新的體系尚未確立。”[7]筆者認為學術(shù)期刊所受到大數(shù)據(jù)的影響可能還要滯后更長的時間,許多學術(shù)期刊人或許不會被要求投入到創(chuàng)新如此之大的體系中,但他們至少需要對大數(shù)據(jù)有全面和充分的認識,知道在今天這樣的出版環(huán)境下如何更好地運用大數(shù)據(jù)思維,來應對學術(shù)期刊自身的轉(zhuǎn)型和變革。
什么是思維?杜威對思維作了這樣的定義:“知識僅僅是已經(jīng)獲得并儲存起來的學問;而智慧(思維)則是運用學問去指導改善生活的各種能力。”[8]為什么我們首先需要啟發(fā)“思維”?因為“(思維能力的各種價值是指)每個人每日、每時、每刻都需要確定他沒有直接觀察到的事實:這不是出于增加他的知識貯存的一般目的,而是因為事實本身對他的興趣或者他的職業(yè)來說是重要的?!保?]所以說“誰在大數(shù)據(jù)價值鏈中獲益最大呢?應該是那些擁有大數(shù)據(jù)思維或者說創(chuàng)新性思維的人?!保?]由此可見,數(shù)據(jù)的價值已經(jīng)從技術(shù)轉(zhuǎn)移到了數(shù)據(jù)自身和大數(shù)據(jù)思維上[6]。筆者以教育學術(shù)期刊為例,結(jié)合編輯具體實務,闡述學術(shù)期刊的大數(shù)據(jù)思維可以從以下幾個方面進行創(chuàng)新。
3.1相關(guān)性思維,即“是什么”的問題研究
大數(shù)據(jù)時代探求的是“是什么”,而不是“為什么”,也就是關(guān)注數(shù)據(jù)值之間的相關(guān)關(guān)系。相關(guān)關(guān)系的核心是量化兩個數(shù)據(jù)值之間的數(shù)理關(guān)系,相關(guān)關(guān)系強是指當一個數(shù)據(jù)值增加時,另一個數(shù)據(jù)值很有可能也會隨之增加[6]。而不同于基于假設(shè)和推理分析的方法,相關(guān)關(guān)系分析法是利用數(shù)據(jù)驅(qū)動的方法來分析,它不易受到偏見或傳統(tǒng)觀點的影響,因此這種方法更加精準和高效。
以教育學術(shù)論文為例,在一篇教育專業(yè)文章的結(jié)論部分,作者通常會總結(jié)自己的研究成果,結(jié)論通常由兩部分組成:①描述研究結(jié)果或調(diào)研發(fā)現(xiàn)了某些相關(guān)性特征及因果;②推斷兩個或兩個以上研究的變量之間因果關(guān)系。此外,期刊編輯或評審常常要求作者在他們文章中來推測其研究對時間和政策的推動作用,因為這樣會使文章體現(xiàn)出實踐意義和應用價值,從而使其更具可讀性和吸引力。不少作者被編輯引導去相信這樣做會增加文章的發(fā)表概率。結(jié)果是,每篇文章幾乎都包含有研究的重要性和實踐意義,從而有些研究者會為了顯示研究的意義而刻意設(shè)計實踐中存在的問題、難點和挑戰(zhàn),以此來預測本研究潛在地帶來的解決方案和測量。如此完美的設(shè)計看似沒有缺陷,其實毫無價值,完全背離科學研究的初衷。
學術(shù)論文作者應該嚴格區(qū)別這兩個問題:“是什么”與“可能是什么”。報告研究數(shù)據(jù),主要是對某一研究現(xiàn)象盡可能全面的數(shù)據(jù)進行分析和挖掘,以及研究結(jié)論。有關(guān)實踐建議應該存在于研究者和那些實踐或政策領(lǐng)域的專家之間對話交流中,思想火花在碰撞中產(chǎn)生真理。這樣的實踐策略公開發(fā)表才合情合理,會受到政策制定的政府部門的關(guān)注,社會影響自然也會隨之而來。而編輯應該理解學術(shù)刊物的學術(shù)生產(chǎn)和再生產(chǎn)之間的關(guān)系、尊重和保護學術(shù)創(chuàng)作的獨立性與自由性,還需要與作者之間建立起一種新型的真正的學術(shù)關(guān)系,不以功利目的和固有模式來影響作者寫作。
3.2復雜性思維:即整合跨學科的學術(shù)資源
從數(shù)據(jù)到大數(shù)據(jù)的演變是一個漸進的過程,它不是大數(shù)據(jù)時代簡單地代替小數(shù)據(jù)時代,而是一個由簡單到復雜的各種形式相互包容、不斷完善的過程。在大數(shù)據(jù)時代,理論并非不重要,而是變得更加重要。我們所指的理論也并非僵化一成不變的固守舊有理論,而是在處理問題的過程中意識到海量數(shù)據(jù)所帶來的復雜性,堅持分析方法和理論的不斷創(chuàng)新[10]。如今的大數(shù)據(jù)先行者們通常都有著交叉學科和整合學科的背景,他們會將這些知識與自己所掌握的數(shù)據(jù)技術(shù)相結(jié)合,應用于廣泛的領(lǐng)域之中。由此可見,復雜性思維可以影響著學術(shù)期刊編輯能夠收集的數(shù)據(jù)類型以及我們對這些數(shù)據(jù)的挖掘分析方式,從而影響學術(shù)期刊對教育學專業(yè)領(lǐng)域內(nèi)的學術(shù)研究展開全新的理解。
國外學術(shù)界主張發(fā)表在學術(shù)刊物上的文章,是具有科學規(guī)范的學術(shù)論文,不同于單純的個人意見和見解。而這一點,是中國內(nèi)地的很多社科類期刊,包括教育學術(shù)期刊所忽視的[11]。不少教育學論文類似于對教育教學實踐、教育政策的建議,并沒有樣本、環(huán)境、廣泛的條件、大量的調(diào)查研究概括而得來。這些建議削弱了政策和實踐結(jié)論的復雜性,使建議顯得淺薄而沒有說服力。復雜的政策和教育實踐不可能建立在如此單一的研究調(diào)查之上,甚至無論規(guī)模大小,是作者精心設(shè)計的隨機干預的研究。這種推理性的建議將作者一己之見與科學依據(jù)混為一談,不但沒有任何價值,而且減弱了證據(jù)的公正性。因此,單一研究結(jié)果經(jīng)各方面證實是存在缺陷的,即使表面上無缺陷,也不能普及運用[12]。
復雜性思維告訴我們,對研究成果的概括和歸納具有復雜性和艱巨性。教育學術(shù)期刊需要關(guān)注兩方面的研究:一方面是研究綜述、總和,包括對研究成果轉(zhuǎn)化為實踐或政策的實際影響的探討等等;另一方面是針對某一項特定研究潛在的實踐意義,由期刊組織評論或者對話形式的欄目,以專業(yè)視野來評估,而不同于僅僅來自于單一論文形式的研究,更多地鼓勵跨學科、多學科、交叉學科以及整合學科的研究能夠不斷涌現(xiàn)。除此之外,復雜性思維還要求對學術(shù)期刊的評價也不能簡單地運用某方面的統(tǒng)計數(shù)據(jù)就可以地進行學術(shù)評判等等,一系列的問題將來都將在大數(shù)據(jù)時代運用人類的思維和技術(shù)來得以一一解決。
3.3個性化思維:即挖掘具有巨大潛力的大數(shù)據(jù)
個性化特別是智能個性化,是大數(shù)據(jù)思維的核心,個性化技術(shù)是大數(shù)據(jù)時代最重要的技術(shù)。在大數(shù)據(jù)時代,僅僅為客戶提供一個簡單的登錄頁面已遠遠不能滿足客戶的需求,網(wǎng)站的設(shè)計還要給人以視覺上的吸引力。此外,網(wǎng)站的內(nèi)容還應更加翔實,應能發(fā)揮其潛能并能實現(xiàn)客戶的有效轉(zhuǎn)化。隨著社會化媒體和搜索變化更加側(cè)重于有趣的內(nèi)容及與人類有關(guān)的話題,網(wǎng)站的設(shè)計也要做出改變。他們需要更加重視數(shù)據(jù)驅(qū)動型設(shè)計,以創(chuàng)建吸引人的網(wǎng)站和內(nèi)容——而不是去適應機器[3]。對于學術(shù)期刊來說,用戶就是讀者,而讀者當中有不少都是作者,包括是潛在的作者,因此其個性化思維就是能在網(wǎng)絡(luò)時代的海量數(shù)據(jù)中,挖掘出潛在的研究議題和不斷變化的讀者需求。
大數(shù)據(jù)時代,用戶的任何一個想法或不經(jīng)意的舉動都是個性化需求的契機或信號。谷歌公司曾經(jīng)開發(fā)了一種用戶在線交互的副產(chǎn)品,包括瀏覽的網(wǎng)頁內(nèi)容、瀏覽的時間、鼠標光標停留的位置、上傳了信息內(nèi)容等,谷歌對其進行分析并反饋給系統(tǒng)。許多公司因此對系統(tǒng)進行了設(shè)計,使自己能夠得到這些數(shù)據(jù)并循環(huán)利用,以改善現(xiàn)有的服務或開發(fā)新服務[6]。而學術(shù)期刊恰恰在這一方面是軟肋,甚至是空白一片。缺少個性是困擾相當數(shù)量的教育學術(shù)期刊的嚴重問題。打開一些學術(shù)期刊的網(wǎng)站,瀏覽其目錄如果不是看刊名,根本就分不清是哪本刊物。千刊一面、毫無特色、內(nèi)容拼盤已經(jīng)波及了學術(shù)期刊的網(wǎng)站、微博、微信公眾號等數(shù)字出版形式,導致大多數(shù)學術(shù)期刊在新媒體應用方面差強人意,這些應用只是表面熱鬧繁榮,在專業(yè)方面有影響力的微信公眾號里根本找不到學術(shù)期刊的聲音,對紙質(zhì)媒體的照搬做法已經(jīng)遠遠不能滿足當今讀者的多元化需求。另外,數(shù)字發(fā)行的價值也被嚴重低估,很多學術(shù)期刊只管埋頭收稿發(fā)稿,根本不問讀者在哪里,他們在思考什么。
筆者曾經(jīng)和一名資深編審交流過如何辦刊問題,他提出最多的問題就是:“讀者在哪里?”“你們找到讀者了嗎?”由此述及,學術(shù)數(shù)據(jù)庫以及期刊的網(wǎng)站里有哪些讀者在下載或在線瀏覽哪些文章?他們是在有目的地精讀還是無意地略讀?如何能夠找到這些讀者并與他們進行點對點的交流?這些是學術(shù)期刊的最大價值來源,而大量的潛在的有價值的數(shù)據(jù)還沒有被開發(fā)就白白地流失掉了。一旦能夠掌握這些數(shù)據(jù),不僅可以挖掘出學術(shù)研究的潛在議題,而且還能夠反復利用開發(fā),從中找到真正的讀者群和作者群。
真正的思維必然以認識到新的價值而告終的[8]。對于學術(shù)期刊來說,出版業(yè)進入大數(shù)據(jù)時代已經(jīng)不再是遙遠的未來,大數(shù)據(jù)帶來的全新理念和價值也是不可估量。數(shù)據(jù)的價值最根本還是來自于思維上的創(chuàng)新,文章主要闡述了相關(guān)性思維、復雜性思維、個性化思維的內(nèi)涵以及它們對學術(shù)期刊編輯方式和刊物內(nèi)容的影響,大數(shù)據(jù)思維遠遠不止上述的這三條。筆者認為在大數(shù)據(jù)語境下,學術(shù)期刊應結(jié)合刊物自身特點,積極應對時代所帶給期刊人的挑戰(zhàn)和問題,不斷進行思維創(chuàng)新、觀念的突破,努力與大數(shù)據(jù)對接。因此,對于這一變革能夠給學術(shù)期刊帶來怎么的創(chuàng)新和發(fā)展還值得進一步探討和研究。
[1]馮海超.大數(shù)據(jù)時代正式到來[J].互聯(lián)網(wǎng)周刊,2012(24):36-38.
[2]Big data [EB/OL].[2015-07-15].http://.en.wikipedia.org/wiki/Big-data.
[3]大衛(wèi)·芬雷布.大數(shù)據(jù)云圖[M].盛楊燕,譯.杭州:浙江人民出版社,2014:62.
[4]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):151.
[5]閻光才.教育及社會科學研究中的數(shù)據(jù)——兼議當前的大數(shù)據(jù)熱潮[J].北京大學教育評論,2013(4):82-83.
[6]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.與大數(shù)據(jù)同行:學習和教育的未來[M].趙中建,張燕南,譯.上海:華東師范大學出版社,2015:113.
[7]舍基.人人時代:無組織的組織力量[M].胡泳,沈滿琳,譯.北京:中國人民大學出版社,2012:55.
[8]約翰·杜威.我們怎樣思維·經(jīng)驗與教育[M].姜文閔,譯.北京:人民教育出版社,2005.
[9]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2013.
[10]劉德寰,李雪蓮.大數(shù)據(jù)的風險和現(xiàn)存問題[J].廣告大觀:理論版,2013(3):70.
[11]李濤.中國教育國際化戰(zhàn)略中的教育學術(shù)期刊國際化發(fā)展[J].教育學術(shù)月刊,2011(10):12.
[12]Staines G L.The causal generalization paradox: the case of treatment outcome research [J].Review of General Psychology,2008,12:236-252.