文/鄭州工業(yè)應(yīng)用技術(shù)學(xué)院圖書(shū)館 宇婷
高校圖書(shū)館學(xué)科服務(wù)嵌入式大數(shù)據(jù)知識(shí)服務(wù)研究
——以幾種辯證關(guān)系及認(rèn)識(shí)誤區(qū)為例
文/鄭州工業(yè)應(yīng)用技術(shù)學(xué)院圖書(shū)館宇婷
高校圖書(shū)館學(xué)科服務(wù)嵌入式大數(shù)據(jù)知識(shí)服務(wù)已成為高校圖書(shū)館創(chuàng)新服務(wù)模式類(lèi)型。為進(jìn)一步提高其服務(wù)質(zhì)量和水平,以幾種辯證關(guān)系及認(rèn)識(shí)誤區(qū)為例,對(duì)高校圖書(shū)館學(xué)科服務(wù)嵌入式大數(shù)據(jù)知識(shí)服務(wù)進(jìn)行了研究。
高校圖書(shū)館;學(xué)科服務(wù);大數(shù)據(jù);嵌入式知識(shí)服務(wù)
高校圖書(shū)館學(xué)科服務(wù)中的嵌入式知識(shí)服務(wù)是學(xué)科服務(wù)的延伸和深化,它是以在學(xué)科專(zhuān)業(yè)中嵌入知識(shí)元素為研究對(duì)象的學(xué)科服務(wù)中更深層次的用戶(hù)服務(wù)。而其中的高校圖書(shū)館學(xué)科服務(wù)嵌入式大數(shù)據(jù)知識(shí)服務(wù),則是更進(jìn)一步將學(xué)科專(zhuān)業(yè)服務(wù)的層次和內(nèi)容深入到大數(shù)據(jù)知識(shí)層面的各種要素中,并由此產(chǎn)生了嵌入式大數(shù)據(jù)知識(shí)服務(wù)模式。對(duì)高校圖書(shū)館學(xué)科服務(wù)嵌入式大數(shù)據(jù)知識(shí)服務(wù)中的相關(guān)辯證關(guān)系及認(rèn)識(shí)誤區(qū)進(jìn)行研究,可以有效地提升高校圖書(shū)館學(xué)科服務(wù)的質(zhì)量和水平。
(一)頭部大數(shù)據(jù)與長(zhǎng)尾大數(shù)據(jù)的辯證關(guān)系。從大數(shù)據(jù)的整體狀況看,它同樣符合二八律的規(guī)律,也就是占據(jù)所謂“頭部”地位的20%的數(shù)據(jù),實(shí)際具有或創(chuàng)造了80%的數(shù)據(jù)價(jià)值;而另外占據(jù)所謂“長(zhǎng)尾”地位的80%的數(shù)據(jù),則僅僅具有或創(chuàng)造了20%的數(shù)據(jù)價(jià)值。所以,在高校圖書(shū)館學(xué)科服務(wù)嵌入式大數(shù)據(jù)知識(shí)服務(wù)中,要注意正確地處理頭部大數(shù)據(jù)和長(zhǎng)尾大數(shù)之間的辯證關(guān)系。若從優(yōu)先度方面考慮,應(yīng)當(dāng)首先照顧20%的頭部數(shù)據(jù),而若從全面性方面考慮,則也要對(duì)80%的長(zhǎng)尾數(shù)據(jù)予以關(guān)注。關(guān)于兩者之間的這種辯證關(guān)系,在高校圖書(shū)館開(kāi)展互聯(lián)網(wǎng)金融信息延伸服務(wù)中表現(xiàn)得尤為突出。因?yàn)閭鹘y(tǒng)的銀行金融機(jī)構(gòu)主要是為20%的頭部用戶(hù)服務(wù)的,而互聯(lián)網(wǎng)金融則與之相反,把服務(wù)的重點(diǎn)客戶(hù)群體瞄向了80%的長(zhǎng)尾客戶(hù)。盡管他們每個(gè)單獨(dú)個(gè)體的資金數(shù)量并不大,但由于客戶(hù)群體的人數(shù)眾多,最終聚集起來(lái)的資金數(shù)量則是一筆不可小覷的巨大金額。正是由于過(guò)去幾年中向來(lái)以財(cái)大氣粗著稱(chēng)的傳統(tǒng)銀行金融機(jī)構(gòu)忽視了互聯(lián)網(wǎng)金融長(zhǎng)尾客戶(hù)群體的存在,往往對(duì)他們的金融投融資需求采取金融排斥的態(tài)度,客觀上將他們拒之門(mén)外,主動(dòng)推向了自己的競(jìng)爭(zhēng)對(duì)手——互聯(lián)網(wǎng)金融領(lǐng)域,使得互聯(lián)網(wǎng)金融取得了突飛猛進(jìn)的發(fā)展。如到2015年10月互聯(lián)網(wǎng)金融交易總額達(dá)到第1個(gè)萬(wàn)億,用時(shí)為7年多。而2016年5月完成第2個(gè)萬(wàn)億,僅僅用時(shí)7個(gè)月,體現(xiàn)了近年來(lái)互聯(lián)網(wǎng)金融行業(yè)飛速發(fā)展的事實(shí)。正因如此,銀行的大量資金外流進(jìn)入互聯(lián)網(wǎng)金融領(lǐng)域,最終對(duì)傳統(tǒng)銀行業(yè)的主要存款業(yè)務(wù)造成了巨大沖擊。傳統(tǒng)銀行業(yè)的失誤就在于沒(méi)有正確地認(rèn)識(shí)和處理20%的頭部客戶(hù)人數(shù)與資金數(shù)據(jù)和80%的長(zhǎng)尾客戶(hù)人數(shù)和資金數(shù)據(jù)之間的辯證關(guān)系所致。如今,傳統(tǒng)銀行已經(jīng)開(kāi)始意識(shí)到其中的問(wèn)題所在,以中國(guó)工商銀行為首,開(kāi)始虛心向互聯(lián)網(wǎng)金融的長(zhǎng)處學(xué)習(xí),充分利用自己所具有的信譽(yù)優(yōu)勢(shì),開(kāi)始關(guān)注和接納80%的長(zhǎng)尾客戶(hù)群體,也開(kāi)始增加類(lèi)似余額寶之類(lèi)的活期貨幣基金理財(cái)產(chǎn)品。
(二)最新大數(shù)據(jù)與歷史大數(shù)據(jù)的辯證關(guān)系。在一般情況下,用戶(hù)總是喜歡最新的大數(shù)據(jù)資源,因?yàn)樗鼈兛梢詾橛脩?hù)帶來(lái)最新的信息與最高的利用價(jià)值。而對(duì)于那些陳舊過(guò)時(shí)的大數(shù)據(jù)資源,則會(huì)隨著時(shí)間的流逝而逐漸失去其應(yīng)有的使用價(jià)值,逐漸淡出用戶(hù)關(guān)注的視線(xiàn)。然而,世界上的事情總不會(huì)是絕對(duì)的,總是會(huì)遵循辯證法的。有相當(dāng)比例的一些大數(shù)據(jù),在隨著時(shí)間的流逝逐漸失去使用價(jià)值達(dá)到一定程度的最低點(diǎn)后,往往會(huì)發(fā)生意想不到的歷史性轉(zhuǎn)折,其使用價(jià)值往往又會(huì)隨著時(shí)間的延長(zhǎng)而重新獲得研究與利用的價(jià)值。例如,高校圖書(shū)館文獻(xiàn)型數(shù)據(jù)資源中的古籍文獻(xiàn)資源就具有這樣的特征?,F(xiàn)在來(lái)看,越是距離今天年代久遠(yuǎn)的古籍文獻(xiàn),其利用和研究?jī)r(jià)值就越高。以目前實(shí)際存世的古籍文獻(xiàn)資源情況看,宋代的古籍文獻(xiàn)利用價(jià)值已經(jīng)非常高,其中的各種文獻(xiàn)內(nèi)容和數(shù)據(jù)內(nèi)容,正是今天用戶(hù)研究的重要依據(jù)和線(xiàn)索。這就是歷史大數(shù)據(jù)與最新大數(shù)據(jù)知名的辯證關(guān)系。再如,大家都對(duì)新創(chuàng)建的大學(xué)充滿(mǎn)興趣與期待。然而,隨著時(shí)間和歲月的流逝,那些成立百年以上的古老大學(xué),反而會(huì)煥發(fā)出勃勃生機(jī),它們之所以能夠歷盡百年滄桑而不衰,正是其存世的魅力所在。
(三)實(shí)時(shí)大數(shù)據(jù)與延時(shí)大數(shù)據(jù)的辯證關(guān)系。實(shí)時(shí)大數(shù)據(jù)是指大數(shù)據(jù)具有隨時(shí)體現(xiàn)數(shù)據(jù)變化的實(shí)時(shí)性特征的大數(shù)據(jù)類(lèi)型。由于它可以實(shí)時(shí)反映事物的動(dòng)態(tài)變化情況,用戶(hù)利用借助這種實(shí)時(shí)大數(shù)據(jù)實(shí)現(xiàn)許多非實(shí)時(shí)大數(shù)據(jù)所無(wú)法完成的工作和任務(wù)。例如,用戶(hù)可以利用互聯(lián)網(wǎng)攝像頭在線(xiàn)直播實(shí)時(shí)視頻數(shù)據(jù),實(shí)時(shí)了解國(guó)內(nèi)外各地此時(shí)此刻正在實(shí)時(shí)發(fā)生的現(xiàn)場(chǎng)實(shí)況。其中包括交通類(lèi)的航空、鐵路、公路、水運(yùn)等交通狀況,教育類(lèi)的各級(jí)各類(lèi)學(xué)校課內(nèi)外教育教學(xué)狀況,電臺(tái)直播類(lèi)的電臺(tái)和電視臺(tái)的新聞、經(jīng)濟(jì)、旅游、交通、娛樂(lè)、音樂(lè)、故事等直播狀況,旅游類(lèi)的各地旅游景點(diǎn)的實(shí)時(shí)游客流量狀況等。實(shí)時(shí)科學(xué)大數(shù)據(jù)則可以動(dòng)態(tài)反映相關(guān)大數(shù)據(jù)的實(shí)時(shí)狀況,如世界或某國(guó)人口的出生與死亡數(shù)據(jù),電子文獻(xiàn)的出版與發(fā)行數(shù)據(jù),電子郵件的發(fā)送和接收數(shù)據(jù)等。其他諸如某種特定事物的實(shí)時(shí)數(shù)據(jù)狀況,如“火幣網(wǎng)”和“okcoin”網(wǎng)站中作為世界數(shù)字虛擬貨幣的比特幣和萊特幣的實(shí)時(shí)交易數(shù)據(jù)等。而延時(shí)大數(shù)據(jù)則是相對(duì)于實(shí)時(shí)大數(shù)據(jù)而言的,正是由于它們不具有實(shí)時(shí)性,所以,數(shù)據(jù)的內(nèi)容往往更加具有穩(wěn)定性和確定性,成為有此類(lèi)需求用戶(hù)使用的大數(shù)據(jù)資源。
(一)大數(shù)據(jù)認(rèn)識(shí)及其樣本選取范圍的誤區(qū)。大數(shù)據(jù)的客觀性讓它成為發(fā)掘問(wèn)題本質(zhì)和尋找事物規(guī)律所需要的最有效手段之一。人們經(jīng)常說(shuō)要用事實(shí)和數(shù)據(jù)說(shuō)話(huà)。但數(shù)據(jù)雖然是客觀,由于使用數(shù)據(jù)用戶(hù)的認(rèn)識(shí)不同,同樣的大數(shù)據(jù)有時(shí)也會(huì)產(chǎn)生欺騙人的假象。因此,當(dāng)用戶(hù)在與大數(shù)據(jù)打交道的過(guò)程中需要謹(jǐn)慎對(duì)待,防止一些可能會(huì)出現(xiàn)的數(shù)據(jù)認(rèn)識(shí)錯(cuò)誤,從而導(dǎo)致數(shù)據(jù)分析結(jié)論出現(xiàn)較大的偏頗。這就是在高校圖書(shū)館學(xué)科服務(wù)大數(shù)據(jù)嵌入式知識(shí)服務(wù)中進(jìn)行數(shù)據(jù)文獻(xiàn)分析時(shí),需要警惕一些認(rèn)識(shí)方面的誤區(qū)。由于大數(shù)據(jù)樣本選取的范圍不同以及代表性不同,可能會(huì)出現(xiàn)不同的數(shù)據(jù)分析結(jié)果。例如,在2008年奧運(yùn)會(huì)上,姚明的三分投籃命中率為100%,而科比的三分投籃命中率僅為32%。如果單從這兩個(gè)數(shù)據(jù)的對(duì)比角度看,顯然姚明的三分投籃命中率要比科比高得多,然而實(shí)際情況則并非如此。因?yàn)樵谀菍脢W運(yùn)會(huì)上,姚明只投了一個(gè)三分球命中,科比則投了53個(gè)三分球,其中命中了17個(gè)。由于兩者數(shù)據(jù)統(tǒng)計(jì)樣本選取的數(shù)量不同,所以會(huì)得出不正確的分析結(jié)論。這個(gè)例子說(shuō)明,在做數(shù)據(jù)對(duì)比分析時(shí),對(duì)于樣本范圍的選取,需要制定相同的抽樣統(tǒng)計(jì)數(shù)據(jù)規(guī)則,以此來(lái)減少或消除由于數(shù)據(jù)樣本選取范圍不同而造成出現(xiàn)分析結(jié)果和結(jié)論的偏差。
(二)大數(shù)據(jù)單方面認(rèn)識(shí)的誤區(qū)。自從數(shù)字化電子文獻(xiàn)出現(xiàn)以后,它就在不斷地對(duì)用戶(hù)傳統(tǒng)的閱讀習(xí)慣發(fā)出挑戰(zhàn)。盡管開(kāi)始大多數(shù)用戶(hù)出于長(zhǎng)期以來(lái)養(yǎng)成的紙質(zhì)文獻(xiàn)閱讀習(xí)慣,對(duì)于電子文獻(xiàn)的數(shù)字化閱讀普遍采取抵制、挑戰(zhàn)和輕視的態(tài)度,并且紛紛發(fā)表文章,認(rèn)為電子文獻(xiàn)的數(shù)字化閱讀屬于淺閱讀、碎片化閱讀,難以與紙質(zhì)文獻(xiàn)的經(jīng)典閱讀和深閱讀。而且,隨著紙質(zhì)文獻(xiàn)閱讀率的逐漸下降,尤其是高校圖書(shū)館紙質(zhì)文獻(xiàn)借閱量數(shù)據(jù)顯示的跳水式下跌,似乎可以鐵定得出文獻(xiàn)閱讀率下降的結(jié)論。然而,真實(shí)的閱讀情況卻是在紙質(zhì)文獻(xiàn)閱讀率逐漸下降的同時(shí),電子文獻(xiàn)數(shù)字化閱讀率出現(xiàn)了明顯上升。2016年4月第13次全國(guó)國(guó)民閱讀調(diào)查結(jié)果發(fā)布的數(shù)據(jù)顯示,在我國(guó)成年國(guó)民圖書(shū)閱讀率上升0.4個(gè)百分點(diǎn)的情況下,數(shù)字化閱讀率則上升了5.9個(gè)百分點(diǎn),后者是前者的14.75倍。調(diào)查大數(shù)據(jù)還顯示,從2009年以來(lái),我國(guó)成年國(guó)民數(shù)字化閱讀方式的接觸率連續(xù)7年持續(xù)上升,首次超過(guò)了60%,其中手機(jī)數(shù)字化閱讀率連續(xù)兩年超過(guò)網(wǎng)絡(luò)在線(xiàn)閱讀率。因此,結(jié)合傳統(tǒng)紙質(zhì)文獻(xiàn)閱讀率下降和數(shù)字化文獻(xiàn)閱讀率上升兩方面的大數(shù)據(jù),可以得出總體閱讀率是保持上升的態(tài)勢(shì)。
(三)過(guò)度依賴(lài)大數(shù)據(jù)的誤區(qū)。世界上的任何事物都是具有關(guān)聯(lián)性的,不存在沒(méi)有任何關(guān)聯(lián)性的純粹獨(dú)立的事物,區(qū)別僅僅在于事物之間關(guān)聯(lián)性的大小、強(qiáng)弱、遠(yuǎn)近而已,大數(shù)據(jù)也同樣如此。在高校圖書(shū)館學(xué)科服務(wù)嵌入式大數(shù)據(jù)知識(shí)服務(wù)過(guò)程中,既要充分有效地利用大數(shù)據(jù),同時(shí)又不能過(guò)度依賴(lài)大數(shù)據(jù)。否則,如果對(duì)于大數(shù)據(jù)過(guò)度依賴(lài),一方面,會(huì)讓我們浪費(fèi)大量的時(shí)間和精力做許多沒(méi)有價(jià)值的大數(shù)據(jù)分析;另一方面,也會(huì)限制人們那些來(lái)自于大數(shù)據(jù)之外的、本來(lái)應(yīng)該具有和產(chǎn)生的靈感和創(chuàng)意。例如,如果科研人員一味地分析和研究普通輪軌式火車(chē)的大數(shù)據(jù),就很可能得出旅客需要更快速度的輪軌式火車(chē),從而限制和抹殺了取消火車(chē)的輪軌,實(shí)現(xiàn)無(wú)輪軌的磁懸浮式高速火車(chē)的創(chuàng)新理念。也就是說(shuō),如果過(guò)度依賴(lài)大數(shù)據(jù)本身,往往就會(huì)使我們的思維囿于已有的局限,也就不會(huì)有時(shí)速400公里磁懸浮火車(chē)的誕生,更不會(huì)有時(shí)速高達(dá)4000公里真空管道磁懸浮高速火車(chē)新思維的出現(xiàn)。再如,如果囿于南水北調(diào)的大數(shù)據(jù),就不會(huì)產(chǎn)生引渤濟(jì)新和引渤濟(jì)錫,將深入內(nèi)地540公里的渤海水經(jīng)過(guò)淡化引入灌溉中國(guó)8個(gè)沙漠的大膽科學(xué)設(shè)想。因?yàn)樵S多優(yōu)秀甚至偉大的決策,并非都是通過(guò)大數(shù)據(jù)發(fā)現(xiàn)的,而是人類(lèi)頭腦風(fēng)暴和綜合智慧的結(jié)晶與體現(xiàn)。當(dāng)然,一旦確定新的科學(xué)設(shè)想后,卻是離不開(kāi)利用大數(shù)據(jù)進(jìn)行詳細(xì)周密的科學(xué)論證,為科學(xué)設(shè)想提供大數(shù)據(jù)證據(jù)的,這點(diǎn)是毋庸置疑的。所以,對(duì)于大數(shù)據(jù)的依賴(lài)要適度,找到其中的平衡點(diǎn),不可過(guò)分依賴(lài),也不可不依賴(lài),這才是正確對(duì)待大數(shù)據(jù)的科學(xué)態(tài)度。
[1]李嬰.大數(shù)據(jù)環(huán)境下圖書(shū)館知識(shí)服務(wù)和管理模式研究[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2016,28(5):168-170.
[2]鄧?guó)P儀,鄧海榮.大數(shù)據(jù)時(shí)代數(shù)字出版的“長(zhǎng)尾效應(yīng)”[J].出版發(fā)行研究,2014(10):27-29.
[3]李紅梅.大數(shù)據(jù)時(shí)代對(duì)歷史研究影響芻議[J].北方論叢,2016(2):77-79.
[4]呂明新,劉兆惠,孫婷婷等.基于大數(shù)據(jù)的道路擁堵對(duì)實(shí)時(shí)交通安全的影響研究[J].山東交通科技,2016(2):12-15.
[5]解明明.政府統(tǒng)計(jì)視角下的大數(shù)據(jù)樣本與總體關(guān)系探討[J].中國(guó)統(tǒng)計(jì),2014(12):54-55.
[6]第十三次全國(guó)國(guó)民閱讀調(diào)查結(jié)果發(fā)布:數(shù)字化閱讀迅猛增長(zhǎng),微信閱讀人數(shù)過(guò)半[EB/OL].[2016-06-22].http://news. xinhuanet.com/politics/2016-04/18/c_1118659452.htm.
[7]戴明鋒,劉展.大數(shù)據(jù)理解誤區(qū)解讀[J].中國(guó)衛(wèi)生信息管理雜志,2015,12(1):61-63;70.