簡(jiǎn)東
(鄭州大學(xué)文學(xué)院,河南鄭州450000)
大數(shù)據(jù)時(shí)代的中文之美
——解析大數(shù)據(jù)在中文閱讀與寫作中的意義
簡(jiǎn)東
(鄭州大學(xué)文學(xué)院,河南鄭州450000)
我們已經(jīng)進(jìn)入了“大數(shù)據(jù)”的時(shí)代,在這樣的一個(gè)數(shù)字化的時(shí)代,其背后起巨大支撐作用的就是“大數(shù)據(jù)”。作為我們母語體系的中文,如何在“大數(shù)據(jù)”的時(shí)代再次迸發(fā)出燦爛多姿的魅力,如何實(shí)現(xiàn)“大數(shù)據(jù)”與中文閱讀、寫作的結(jié)合,正是本文所要討論的問題。
大數(shù)據(jù);中文之美;閱讀寫作;數(shù)據(jù)庫
提到“大數(shù)據(jù)”,可能還有部分人對(duì)其準(zhǔn)確含義不甚了解,究竟什么是“大數(shù)據(jù)”?它的含義是否就可以等同于“數(shù)字化”“電子化”“信息化”?其實(shí)不然。
大數(shù)據(jù)(bigdata),又叫巨量資料,指的是這樣的一種信息和資訊:它可以幫助學(xué)術(shù)研究、企業(yè)經(jīng)營、經(jīng)濟(jì)市場(chǎng)分析、政府決策,但其所涉資料規(guī)模量巨大,以至于通過目前主流軟件工具也無法在合理時(shí)間內(nèi)完成對(duì)其的擷取、整理和管理。而在維克托·邁爾·舍恩伯格及肯尼思·庫克耶編寫的《大數(shù)據(jù)時(shí)代》中,大數(shù)據(jù)指采用所有數(shù)據(jù)而不用抽樣調(diào)查等隨機(jī)分析的捷徑的方法。而且大數(shù)據(jù)具有“4V”特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)??梢姟按髷?shù)據(jù)”這種海量、高增長率和多樣化的信息資產(chǎn),正是憑借新處理模式才擁有了更強(qiáng)的決策力、洞察力,才更便于分析研究與流程優(yōu)化。需要明確的還有數(shù)據(jù)與信息、知識(shí)是不同的——數(shù)據(jù)僅是信息與知識(shí)的根據(jù)和基礎(chǔ),而大數(shù)據(jù)技術(shù)的戰(zhàn)略意義就在于對(duì)這些富有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理,而非僅僅是對(duì)龐大數(shù)據(jù)的掌握。換言之,如果大數(shù)據(jù)是一種產(chǎn)業(yè),該產(chǎn)業(yè)欲圖盈利,則其關(guān)鍵在于提高加工數(shù)據(jù)的能力,通過“加工”實(shí)現(xiàn)“增值”。大數(shù)據(jù)“增值”的核心手段就在于將海量數(shù)據(jù)進(jìn)行存儲(chǔ)、闡釋和分析。較其他的現(xiàn)有技術(shù)來說,大數(shù)據(jù)之“廉價(jià)、優(yōu)化、迅速”三方面的綜合成本是最理想的。
明白了大數(shù)據(jù)的確切含義,那么接下來我們所要做的工作就是讓它更好地服務(wù)于新時(shí)代下的中文閱讀與寫作。
進(jìn)入大數(shù)據(jù)的時(shí)代后,我們?cè)谌粘I钪薪佑|最多的就是這類數(shù)據(jù)以及對(duì)這些數(shù)據(jù)科技化、精確化的分析。各類的指標(biāo)均以量化的形式出現(xiàn),使我們感覺到精密如尖端儀表一般。誠然,數(shù)據(jù)分析和指標(biāo)量化為人們?cè)趯W(xué)習(xí)、工作、生產(chǎn)、生活上最大程度地實(shí)現(xiàn)其目的計(jì)劃提供了堅(jiān)實(shí)的依據(jù),但如若過分依賴于其,人類勢(shì)必有異化之感。例如,通過大量的實(shí)例,科學(xué)家總結(jié)出了最科學(xué)的學(xué)習(xí)作息時(shí)間,何時(shí)最適宜進(jìn)行什么樣的學(xué)習(xí)等,每一項(xiàng)安排背后都有詳實(shí)的數(shù)據(jù)支撐。這種類似的科學(xué)解釋在生產(chǎn)中也很多見。如果我們嚴(yán)格遵循它們,我們就被高度機(jī)械化了。
這樣,“大數(shù)據(jù)”便取代了一切,海德格爾“詩意棲居”的人文精神將何從談起?人的行為完全被數(shù)據(jù)所束縛,在獲得科學(xué)性和行為慣性便利的同時(shí),人類也喪失了部分的自主性。因此,維克托·邁爾·舍恩伯格在《大數(shù)據(jù)時(shí)代》最后一部分中也點(diǎn)明了大數(shù)據(jù)的風(fēng)險(xiǎn):當(dāng)數(shù)據(jù)主宰一切時(shí)的隱憂。大數(shù)據(jù)會(huì)帶來作偽和隱私的威脅,造成機(jī)械化和繁雜化。
由此我們?cè)诮邮芎屠么髷?shù)據(jù)的時(shí)候,也應(yīng)對(duì)其持一定的批判態(tài)度,切莫陷入“唯數(shù)據(jù)主義”的泥淖。人類最具有自由性的思維便是感性思維,也被稱作詩性思維。這正是人類思想和創(chuàng)造力的精靈。數(shù)據(jù)及其分析本身不是終極意義,它們不足以闡明世間所有;中文則是有靈性的文字,即使是在大數(shù)據(jù)即將一統(tǒng)天下的時(shí)代,中文也不應(yīng)喪失其獨(dú)特的地位。例如詩歌的創(chuàng)作,在唐代所取得的獨(dú)一無二的輝煌成就,今人是難望其項(xiàng)背的。中文在大數(shù)據(jù)中不應(yīng)淪陷!如何使大數(shù)據(jù)與中文相得益彰,繼而弘揚(yáng)文字的魅力,是我們當(dāng)代不斷著力研究的課題。
中文,充滿靈感的象形文字,自其創(chuàng)作伊始便具有了非凡的美感。它是古代中國先人們實(shí)踐和智慧的結(jié)晶,更是全人類共同的財(cái)富。在大數(shù)據(jù)時(shí)代的話語權(quán)方面,中文與漢語理應(yīng)占有較為可觀的一席之地。從現(xiàn)有中文類數(shù)字化學(xué)術(shù)期刊的狀況看,幾乎所有的出版編輯單位都不同程度地針對(duì)傳統(tǒng)學(xué)術(shù)期刊開展了數(shù)字出版工作,如加入了中國知網(wǎng)、萬方、中文科技期刊等大型期刊數(shù)據(jù)庫,有的還建有自己獨(dú)立的網(wǎng)站。一批以中文數(shù)字化學(xué)術(shù)期刊為經(jīng)營核心的企業(yè)所建立的數(shù)據(jù)庫已經(jīng)形成了一定的市場(chǎng)規(guī)模,其數(shù)據(jù)庫平臺(tái)功能強(qiáng)大,使讀者能十分方便地獲取相關(guān)信息。中文大數(shù)據(jù)的話語權(quán)初步得到了強(qiáng)化。但是我們必須看到,中文類學(xué)術(shù)期刊數(shù)字化進(jìn)程雖然初見成效,但我國大多數(shù)中文學(xué)術(shù)期刊出版編輯單位的數(shù)字化工作,只是簡(jiǎn)單地將傳統(tǒng)中文學(xué)術(shù)期刊的紙質(zhì)版內(nèi)容不加改動(dòng)地交給了大型數(shù)據(jù)庫,由其統(tǒng)一制作、全文上網(wǎng)。即使是建有獨(dú)立網(wǎng)站的學(xué)術(shù)期刊,也大多格局雷同,僅僅是將“千刊一面”的中文傳統(tǒng)紙質(zhì)媒體置換成了“千網(wǎng)一面”的數(shù)字媒體,實(shí)質(zhì)是在網(wǎng)絡(luò)空間里依舊無法延續(xù)傳統(tǒng)品牌的效力。況且,各大型中文學(xué)術(shù)期刊數(shù)據(jù)庫也尚未達(dá)到用戶在“大數(shù)據(jù)”時(shí)代獲取信息的要求。由此看來,離“大數(shù)據(jù)”時(shí)代的基本要求尚且還相差很遠(yuǎn),更何談中文與大數(shù)據(jù)的完美結(jié)合以超越“唯大數(shù)據(jù)”的局限性呢?
鑒于此,還必須加強(qiáng)使“大數(shù)據(jù)”有效服務(wù)于中文學(xué)術(shù)創(chuàng)作的技術(shù)研究。在“大數(shù)據(jù)”背景下,嚴(yán)謹(jǐn)?shù)闹形膶W(xué)術(shù)創(chuàng)作不僅是理念上的要求,還需要技術(shù)的支持。探索如何在“大數(shù)據(jù)”平臺(tái)上精細(xì)設(shè)計(jì)中文學(xué)術(shù)研究數(shù)據(jù)庫平臺(tái),并深層次地探討其構(gòu)建過程中涉及的關(guān)鍵技術(shù)。同時(shí),還要以需求為指引,以信息技術(shù)與人文精神融合為重點(diǎn),結(jié)合“大數(shù)據(jù)”學(xué)術(shù)平臺(tái)服務(wù)模式的內(nèi)涵和特征,研究中文“大數(shù)據(jù)”學(xué)術(shù)平臺(tái)的基礎(chǔ)框架體系、交互體系、處理體系、過程管理體系、分析與決策體系等。
讓數(shù)據(jù)和數(shù)據(jù)分析服務(wù)于中文最直接的運(yùn)用就是其在閱讀和寫作領(lǐng)域發(fā)揮的價(jià)值。但是數(shù)據(jù)庫的龐大足以使我們?cè)趨⒖?、使用時(shí)有“眩暈”之感。我們所暈非其“大”,而是其“雜”。大數(shù)據(jù)是個(gè)魚龍混雜的地方,常常使我們?cè)诓牧线x擇與行為指引方面感覺手足無措。這里面最關(guān)鍵的原因就是真?zhèn)坞y辨。例如,當(dāng)我們?cè)趯懽髦行枰獜哪硞€(gè)時(shí)代的背景出發(fā)去展現(xiàn)人物的行為與心理時(shí),關(guān)于這樣的時(shí)代背景的界定就成為了首先要考慮的問題。而我們?cè)谶M(jìn)行界定時(shí),時(shí)代背景的資料是可以通過一系列的的數(shù)據(jù)與數(shù)據(jù)分析進(jìn)行萃取的。那么,我們可以提煉當(dāng)時(shí)GDP水平、CPI指數(shù)等等背后的原因。這些提供出來的原因是完全客觀的嗎?不但不是,而且還有著獲取方式的差異性、主體的絕對(duì)在場(chǎng)性。能不能信、該怎么信等問題是我們不得不思考以及無法逃避的。在閱讀方面更是如此。
閱讀作為一種社會(huì)行為,其對(duì)象、性質(zhì)、形式的變化每次都會(huì)受到媒體語境變遷和傳播技術(shù)革新的深刻影響,處于大數(shù)據(jù)、新媒體環(huán)境下的中文閱讀更是如此。除傳統(tǒng)紙質(zhì)閱讀外,現(xiàn)階段的閱讀還包括網(wǎng)絡(luò)在線閱讀、電子閱讀器閱讀、手機(jī)閱讀等多種方式。這些方式給中文閱讀帶來了沖擊,產(chǎn)生了一些新問題。受當(dāng)下閱讀消費(fèi)性、閱讀時(shí)空隨意性的影響,事實(shí)上出現(xiàn)了泛閱讀、淺閱讀、偽閱讀、娛樂性閱讀、功利性閱讀、非導(dǎo)向性閱讀、重圖輕文等問題,中文閱讀自然也不可幸免。閱讀本身是人從圖文符號(hào)中獲取意義的一種心理過程和社會(huì)實(shí)踐活動(dòng),閱讀方式的改變并不一定就導(dǎo)致閱讀理解的困難或閱讀心理的退化。無論讀者選擇何種媒介進(jìn)行閱讀,都面臨著一個(gè)選擇閱讀內(nèi)容的問題——可信度甄別、閱讀側(cè)重點(diǎn)和引用思考。面對(duì)中文閱讀的嬗變,我們作為接受者,應(yīng)能建設(shè)性地整合、梳理各類信息、知識(shí),對(duì)閱讀內(nèi)容進(jìn)行“二次提煉”以達(dá)到科學(xué)地建構(gòu)與評(píng)估,來改善并促進(jìn)中文閱讀。
由此可知,對(duì)大數(shù)據(jù)進(jìn)行具有彈性深度的“二次提煉”是十分必要的。同時(shí),還由于主體的絕對(duì)在場(chǎng)性,追求所謂的“絕對(duì)真實(shí)性”與“冷靜客觀性”其實(shí)是不切實(shí)際的。這里所說的“真”是指在閱讀或?qū)懽鞯哪骋痪唧w情境中能夠最準(zhǔn)確、最完整、最大化地展現(xiàn)中文之美的要求。這也是要讓大數(shù)據(jù)服務(wù)于中文的閱讀與寫作的應(yīng)有之義。準(zhǔn)確說來,中文中有很多多義性、委婉性的語言或文字現(xiàn)象,故當(dāng)中文遭遇條分縷析的大數(shù)據(jù)時(shí)很有尷尬之感。中文更多的是感性的世界,象形文字背后跳躍著更多的是靈感和靈性,而數(shù)據(jù)所能提供的信息看似豐富、多樣、高速,實(shí)則干癟而缺乏靈動(dòng)。然而“大數(shù)據(jù)”就是以科學(xué)又極具理性的形式出現(xiàn),它的整體詳實(shí)而有真實(shí)依據(jù)感沖擊著人們的思維和判斷力。若完全以大數(shù)據(jù)來支撐中文的閱讀與寫作的話,則必使文字材料僵硬、冗雜而少美感和靈氣。表現(xiàn)力的降低反而造成了對(duì)“內(nèi)蘊(yùn)真實(shí)”的削弱。
但從另一方面而言,通過本文第一部分對(duì)“大數(shù)據(jù)”真實(shí)含義的把握,我們不難發(fā)現(xiàn)它也是新時(shí)代下技術(shù)美的鮮明體現(xiàn)。它將中文閱讀與寫作變得多媒體化,它的4V特征、“廉價(jià)、迅速、優(yōu)化”的成本,以及對(duì)事物本質(zhì)、內(nèi)在規(guī)律性盡力地揭示,反映出了科學(xué)實(shí)驗(yàn)美和技術(shù)事實(shí)美。這樣的一種美符合人類對(duì)高效便利理想生活的共同期望與共同情感,使我們印象深刻。如若能夠正確地加以利用,它必然使我們的操作性體驗(yàn)充滿愉悅,從而得心應(yīng)手。
于是,在對(duì)大數(shù)據(jù)的“真”進(jìn)行了上述兩方面的“拷問”,并對(duì)其技術(shù)美進(jìn)行發(fā)掘后,我們對(duì)其在閱讀與寫作上的應(yīng)用就要“去偽而存真”,凸顯其技術(shù)之美了。這樣,大數(shù)據(jù)的技術(shù)美方能服務(wù)于中文之美。在這一領(lǐng)域內(nèi),中文與大數(shù)據(jù)是可以相得益彰的。在閱讀之中,我們不能盲目,不能迷信數(shù)據(jù)和數(shù)據(jù)分析,要發(fā)揮思維的積極主動(dòng)性,要有存疑的精神。就這一點(diǎn)而言,“大膽假設(shè),小心求證”對(duì)于大數(shù)據(jù)也是通用的。不僅如此,在我們思考的過程中應(yīng)進(jìn)行“二度提煉”,讓數(shù)據(jù)靈動(dòng)起來,統(tǒng)籌文字和數(shù)字兩種思維模式。在寫作時(shí),就更要服務(wù)于主觀真實(shí),在理性依據(jù)的基礎(chǔ)上展開靈動(dòng)感性的文字,共同致力于中文之美的綻放。
[1](英)維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013: 9,167.
[2]李晨暉,崔建明,陳超泉.大數(shù)據(jù)知識(shí)服務(wù)平臺(tái)構(gòu)建關(guān)鍵技術(shù)研究[J].情報(bào)資料工作,2013(2):29-34.
[3]吳斌.產(chǎn)業(yè)重構(gòu)時(shí)代的出版與閱讀——大數(shù)據(jù)背景下出版業(yè)應(yīng)深度思考的五個(gè)關(guān)鍵命題[J].出版廣角,2013(12):35.
I206
A
1673-0046(2015)7-0186-02
太原城市職業(yè)技術(shù)學(xué)院學(xué)報(bào)2015年7期