蘭孝慈
〔摘 要〕隨著大數據時代的到來,我國各領域對大數據理論層面的研究遠超于實證探索,導致理論與實踐間呈現脫節(jié)、失衡狀態(tài)。本文首先借用大數據和SWOT等相關理論對高校圖書館實施大數據管理進行前置分析,繼而以東北林業(yè)大學圖書館實施的大數據管理為例,在指出實踐與理論間存在的實然落差基礎上,提出了高校圖書館優(yōu)化大數據管理的應然策略。
〔關鍵詞〕SWOT;大數據管理;實然;應然;圖書館
DOI:10.3969/j.issn.1008-0821.2015.11.026
〔中圖分類號〕G2507 〔文獻標識碼〕A 〔文章編號〕1008-0821(2015)11-0147-05
Reality Gap and Ought Path of University Library Large Data
Management Implement Based on SWOT Visual Threshold
Lan Xiaoci
(Library,Northeast Forestry University,Harbin 150040,China)
〔Abstract〕As the coming of large date times,the theoretical research of the big data has been far beyond the empirical research in all areas of China,leading to disconnecting and imbalance between theory and practice.First,university librarys large data management was pre-analyzed by borrowing the correlation theory of the large data and SWOT etc.Then,the large data management implemented by our library was acted as an instance and on this basis of pointing out the reality gap between practice and theory,the ought strategy of university library for the optimizing large data management was proposed.
〔Key words〕SWOT;large data management;reality;ought;library
我國高等教育進入了發(fā)展的快車道,特別是“211工程”大學,但作為高校發(fā)展三大支柱之一的高校圖書館卻處于學校尷尬的邊緣化地位。究其關鍵,在于圖書館一直以來的墨守成規(guī),使其與各層次讀者不斷增長的訴求、所需服務的深度及廣度間形成了一定的實然落差。大數據時代的到來,無疑為處于信息流聚合中心的高校圖書館突圍提供了一種可能。圖書館應抓住契機,開拓優(yōu)勢與實踐對接,收集、挖掘、提取大數據背后隱藏的價值,利用大數據分析,推動圖書館服務的創(chuàng)新與升級,而不應局限于以往那種僅對新詞、新術語(泛在、移動圖書館、云計算等)的植入性或嵌套性的理論研究。這是圖書館界當前應加以關注且需重點解決的課題。
1 大數據、SWOT等相關理論在圖書館的轉化
11 圖書館大數據的解析
2013年被稱為中國的大數據元年。各領域對大數據的研究可謂如火如荼。概念并未統(tǒng)一,本文采用權威IT研究與顧問咨詢公司 Gartner對它的定義,即:“在一個或多個維度上超出傳統(tǒng)信息技術處理能力的極端信息管理和處理問題”。大數據的特點為Variety(多樣化)、Volume(海量)、Velocity(快速)、Vitality(靈活)以及Complexity(復雜)等。
縱觀大數據的理論研究,基本認為大數據不僅應從數據量方面進行考量,更要從數據結構上進行區(qū)分,傳統(tǒng)意義上僅有幾個服務器存儲的數據庫是不能稱其為大數據的。同時認為,由簡單、規(guī)律、重復性的龐大數據組合而成的、運用傳統(tǒng)分析工具或者簡單的數據挖掘方式可以進行分析歸類的數據,也不能稱之為大數據。既如此,那么圖書館有大數據嗎?就大數據的海量特點而言,國內單個圖書館的MARC數據、讀者的借閱記錄數,目前還達不到PB級,從嚴格意義上講不屬大數據。目前,學界將數據規(guī)模巨大、文獻類型多樣、內容交叉、載體數字化的大量數據庫資源、電子書資源、紙質轉換的數字資源及各種音頻、視頻資源、讀者書目查詢、檢索、下載存在于不同數據庫商家系統(tǒng)中的以及借還產生在圖書館集成系統(tǒng)中的OPAC日志和流通日志等含有大數據特征的數據皆認定為圖書館的大數據。本文研究定位于此。
何為圖書館的大數據?筆者以例說明。讀者到圖書館借閱圖書,當圖書館讀到該讀者卡信息后,可初步了解到讀者目前所屬單位、借閱冊數、郵箱、電話等簡單結構性信息,當通過聯(lián)機CRM系統(tǒng),該讀者以前的查詢、瀏覽、鏈接記錄、Web網絡日志等隱性信息展現出來,通過挖掘這些非結構性信息行為數據,可進一步分析出該讀者的閱讀傾向與研究方向等相關性因素,由此歸納出讀者感興趣的主題,并為該讀者提供圖書館與其相關聯(lián)的增值服務,進而實現了圖書館知識服務的橫向擴展,這就是圖書館的大數據。
2015年11月 第35卷第11期 現?"代?"情?"報 Journal of Modern Information Nov,2015 Vol35 No11
2015年11月 第35卷第11期 SWOT視閾下高校圖書館大數據管理踐行的實然落差與應然路徑 Nov,2015 Vol35 No11endprint
12 圖書館實施大數據管理的SWOT分析
任何一項新事物的開展,首先應做前置態(tài)勢分析。SWOT分析也稱態(tài)勢分析,指通過影響組織內外環(huán)境發(fā)展的優(yōu)勢﹙Strengths﹚、劣勢﹙Weaknesses﹚、機會﹙Opportunities﹚、威脅﹙Threats﹚四要素,構建SWOT矩陣進行系統(tǒng)分析,最終得以制定適合本組織實際情況的發(fā)展戰(zhàn)略和對策方法。因實施大數據管理硬件及相關條件的要求,本文借用SWOT理論以在人、財、物上優(yōu)于全國千所普通高校的“211工程”大學圖書館為例進行分析。
121 內因微觀SW說:內部優(yōu)勢(Strengths)與劣勢(Weaknesses)
(1)優(yōu)勢說
其一,“211工程”大學的評估,從客觀上促進了圖書館文獻資源、基礎設施、特別是數字化建設方面水平的提升;其二,近十年來圖書館進人基本為碩士以上學歷,圖書館“高學歷、高水平、高職稱”的三高態(tài)勢為開展大數據的收集、分析、傳輸、應用等高層次的知識服務提供了智力保障;其三,區(qū)域性高校圖書館聯(lián)盟加速,資源共享格局初步建立。
(2)劣勢說
一是,大學評估在一定程度上促進了圖書館的發(fā)展,但數據量、非結構性數據、新的數據源和數據類型的增多,保護高度分布式基礎設施和數據的可信應用體系的軟硬件基礎設施明顯滯后,使得圖書館存儲與計算能力不足的問題得以凸顯。二是,目前僅有清華大學、復旦大學、東北林業(yè)大學等為數不多的高校圖書館實施了大數據管理,總體上看大數據思維意識仍很淡薄。三是,個人職業(yè)成長與圖書館發(fā)展相對割裂,激勵機制不強、館員創(chuàng)新意識不足、大數據深層次分析人才短缺、研發(fā)能力薄弱,服務模式在傳統(tǒng)中徘徊。
122 外因宏觀OT說。外部機遇(Opportunities)與威脅(Threats)
(1)機遇說
其一,信息技術的發(fā)展驅動了圖書館業(yè)務向外有效地延展。通過大數據技術可實現對非結構化數據的挖掘、獲取、數據建模及數據可視化的利用,能夠有效確定圖書館未來服務模式的發(fā)展走向。其二,大數據時代,讀者不再僅僅滿足于被動接收者、只提服務訴求的角色定位,同時也希望是圖書館信息知識制造和重組的主動生產者。其三,讀者不斷提升的需求是圖書館發(fā)展的原動力與基礎。
(2)威脅說
一是,大型實力派數字化產品開發(fā)商(超星等)的研發(fā)經費較為充足、專業(yè)主攻人才能力突出、競爭力較強,對圖書館造成了較大的沖擊。二是,網絡時代資源獲取途徑多元化,一些數據開發(fā)商在一定程度上代替甚至“剝奪”了圖書館的某些職能,悄無聲息地分化著圖書館的讀者源。三是,大數據時代,由于數據挖掘技術的大量使用,單位和個人的信息安全、個人隱私保護受到威脅。
2 東北林業(yè)大學圖書館對大數據管理的踐行與認知
21 大數據管理的踐行
我館自2013年5月起實施大數據管理,每月以館報形式向全館公布實施情況。筆者以當年5月各部室對其服務或資源利用情況所做的當月或當年的統(tǒng)計與分析為例制圖表,兩年來,我館基本以這種數據形式報送每月工作小結。希望通過下列可視化的信息圖表可以幫助我們將枯燥的信息與數據轉換成有意義、有價值的分析材料。
22 大數據管理踐行的表征與實然落差
221 大數據理念確立,但對其定位仍不夠明確
我館實施大數據管理兩年多,大數據理念可以說已經確立,與以往相比,實施大數據管理,加快了我館一些重要政策制定、修改、完善時間,但圍繞著大數據相關的因素分析并未融入研究,如:哪些數據屬于大數據的范疇以
圖1 2013年5月各學院讀者平均入館情況(網絡系統(tǒng)部)〖〗注:該表中的統(tǒng)計數據為各院系讀者在統(tǒng)計時間段內刷卡通過門禁的次數與該院系讀者總數的比值,為避免讀者擁擠,實際工作中在讀者入館高峰期多 采用直接開門放行,所以該統(tǒng)計數據存在一定的誤差。
圖2 2013年5月館藏圖書利用情況(圖書管理部)注:在館藏文獻利用中,社會科學類圖書的總利用率比自然科學類圖書總利用率高。其中利用率最高為文學藝術類,其次為語言文字、自動化計算機和 建筑類,最低為天文地理醫(yī)藥類圖書。
圖3 2012年圖書館數據庫使用情況(文獻資源建設部)注:全文數據庫整體利用中文庫高于外文庫。利用率最高的是CNKI,其次是萬方和維普,國研網由于其涉及的專業(yè)范圍較單一,下載量低。外文庫SD 全文下載量遠遠高于其他外文全文庫。國外博碩士學位論文庫PQDT下載量最少,利用率最低。 文摘數據庫的利用情況通過文摘瀏覽次數體現:CAB、BP、AGRIS、Agricola是生物學和農學專業(yè)文摘數據庫,其中以CAB利用率最高。PQDDB是外 文博碩士論文文摘庫,其利用率最低。
及應該被分析和預測?大數據如何挖掘、分析?待分析的這些數量巨大的非結構化的靜態(tài)和動態(tài)數據真的具有所需價值嗎?服務模式是否應當改變或重構?大數據如何嵌入到學科服務中等,這無疑說明我館對實施大數據管理的定位還存有一定的偏差。
222 大數據思維意識有之,但大數據內涵仍不清晰
分析之前要厘清一對概念——數據和大數據,大數據前邊已闡釋,不再贅述。何為數據,它指包括各種文字、
數字、影像視頻形式的文本或信息。上述圖表表明我館已產生了用數據說話的思維意識,并有將之付諸實踐的行為。但不容忽視的是,與大數據內涵、特點比照來看,我館對何為大數據還沒有清晰的認知,甚至有些混淆了數據和大數據概念之間的區(qū)別。實際上,大數據并非圖書館內所有數據的統(tǒng)稱,也不是把傳統(tǒng)業(yè)務進行簡單的數據化錄入就可形成,圖1、圖2、圖3與表1挖掘方式呈現出一定的大數據特點,但分析較淺明顯沒有體現出大數據應有的內涵;表2、表3與表4這些由簡單的數據方式歸類而成且未進行深度分析的則明顯不屬于大數據范疇。endprint
223 大數據呈現能力有之,但深層分析欠之
前邊列表可看出,僅有網絡系統(tǒng)部和圖書管理部、館藏資源建設對各學院讀者平均入館情況、館藏圖書讀者利用情況、數據庫使用情況作了簡要的介紹。實操中像圖書流通、OPAC檢索日志、學科館員服務、電子資源使用等大量非結構性數據、深層次時間軸的趨勢大有深度分析的必要,只有對上述內容做進一步的探究與解讀,才能有效地呈現數據間關聯(lián)關系、讀者個性化需求和聚類需求。兩年來,我館對數據管理僅做簡單的和疊加匯總且數據儲備不足,沒有足夠的數據積累,也是不能進行深層次分析的主要原因之一。
224 大數據管理理念有之,但運行制度與機制并不匹配
實施大數據管理,透過數據可以分析出讀者需求是有所偏移的。然而,我館的運行機制和服務模式卻沒有因之做出合理的調整與重構,仍沿襲傳統(tǒng)的組織結構與制度安排。圖書館服務中讀者群體激增、分散,需求頻率加快等特性沒有通過大數據進行深度挖掘,圖書館內部大數據處理流程鏈條不暢,各種信息流轉的周期仍在原位徘徊,造成大數據管理形式大于實質。
225 參與大數據管理僅限于圖書館中層管理者,并未做到全員參與
我館館員本科以上達到90%、碩士以上學歷高達56%,但實施大數據管理卻僅局限于館內中層干部,其他館員與大數據管理并未對接,僅以館報形式了解大數據管理的簡單實施狀況。圖書館要實現管理目標歸根結底是對人力資源的管理,一線的館員往往可以在繁雜瑣碎的非結構化數據中發(fā)現常規(guī)服務所不能體現的內在邏輯,沒有調動全員參與大數據管理,沒有館員幫助讀者對服務進行深度地解讀,大數據踐行便不能真正地內化。
3 SWOT視閾下高校圖書館優(yōu)化大數據管理的應然策略31 理念先行、意識跟上,打造SO(優(yōu)勢——機會)組合策略 理念是行動的指南。身處大數據之中的高校圖書館,無論屬于服務型、學術型抑或研究型等何種身份,要去邊緣化與高校同步發(fā)展,必須由與時俱進的服務理念來引領。何為理念?指為一種思想或是一種想法。那何為意識?它是指一種覺悟、一種了解或一種認知。兩者關系,一般認為是當有了一種對理念認知之后才產生意識,并按其既定模式去行動。圖書館要落實“大數據管理”的辦館理念,就要根據SWOT理論建構SO(優(yōu)勢——機會)模式,全方位宣傳建構由這種理念轉換的群體實踐意識,并使其從哲學思考的層面上走下來,化為圖書館每一個人對自己崗位責任的理解與實踐。這就要求圖書館領導團隊發(fā)揮其導引的功能,培養(yǎng)全體館員的數據素養(yǎng),在全館興起來自每一個人的主體自覺,使圖書館員在面對可能是機會數據時,能夠具有將此類數據轉化為知識的思維意識和對非結構化數據處理和深度分析的能力以及對預測圖書館未來發(fā)展及面臨的生存危機的清醒認識,讓每一個人都承擔起主體責任,讓每一個崗位都成為“大數據管理”理念的接觸點。
32 定位先行、制度跟上,打造ST(優(yōu)勢——威脅)組合策略 圖書館實施大數據管理是為了實現自身的科學管理。既然談到科學管理,就離不開發(fā)展定位問題。圖書館的發(fā)展定位決定了圖書館要走向何方,以及如何走的問題。高校圖書館大數據管理定位,基本應圍繞著本校中長期發(fā)展規(guī)劃而定,這是宏觀戰(zhàn)略層面的問題,一經制定,不應輕易更改。在中觀層面,圖書館應規(guī)定大數據管理的內容、服務功能、組織機構保障與支撐運行機制等,這就涉及大數據的挖掘、收集、分析和運用。微觀上,圖書館界始終沒有一部成文法來規(guī)范其運行,那么要保證其正常運行,就離不開圖書館制度的規(guī)制。制度是什么,一般認為它是要求大家共同遵守的辦事規(guī)程或行動準則。圖書館應根據時代的變化、自身提供了怎樣的服務、解決了怎樣的問題以及何種層面的問題而從制度上加以調整。在這個過程中,圖書館應根據SWOT理論的矩陣模式建構ST(優(yōu)勢——威脅)模式,發(fā)揮圖書館的各種優(yōu)勢來應對挑戰(zhàn),對圖書館人力資源管理、資源配置方法、組織管理結構、資金投入、基礎設施改善、數據商合作等多層面變革進行統(tǒng)籌的制度安排和機制的調整,以此提升圖書館大數據管理的實效性,加速圖書館的發(fā)展。
33 服務先行、模式跟上,打造WO(劣勢——機會)+WT(劣勢——威脅)組合策略 目前,通過網絡調研來看,“211工程”大學圖書館實施大數據管理的寥寥可數,身處大數據之中的高校圖書館與大數據管理之間的實然落差不言而喻,當然外在的挑戰(zhàn)和自身困境都不少,但是,圖書館長期以來的“小安即?!彼枷胍沧璧K著圖書館人發(fā)展上的突圍。大數據時代的到來,高校圖書館應走出勇于踐行的腳步,打造WO(劣勢——機會)+WT(劣勢——威脅)組合策略,利用機會、克服劣勢、化解威脅、發(fā)揮優(yōu)勢、調整發(fā)展策略,在探索中,創(chuàng)造與之相適應的服務模式。這體現在借助已有的數據分析手段及研究方法,注重收集和存儲讀者信息行為數據,建立完整的數據保存與歸檔體系;搭建大數據管理平臺,提升數據挖掘技術,挖掘讀者需求,努力使圖書館的服務從靜態(tài)走向動態(tài);優(yōu)化讀者服務的管理體系,調整組織機構和人員結構,保障大數據管理運行機制順暢;激發(fā)大數據管理人才多元文獻的復合整序能力和挖掘能力,挖掘隱性和潛在的讀者,擴大讀者源、規(guī)避讀者的流失;培養(yǎng)館員的數據素養(yǎng),用良好的數據分析獲取讀者的訴求,形成深層次、個性化的服務;在培養(yǎng)內部優(yōu)秀的設計人員同時,也要積極開展與相關行業(yè)、館際間的合作,引進和吸收技術優(yōu)勢,減少與行業(yè)間的技術差距,縮小數據商帶來的技術威脅,擴大圖書館的向心力和輻射力。
近期,針對大數據管理我館又推出了中層干部座談分析法。盡管我館踐行中存在著諸多的不足,但勇于探索而不是僅僅將理念及各種數據嵌套在理論之上的精神是值得贊揚與推廣的,相信今后的探索會使其更加完善。期待本文對日后他校實施大數據管理及豐富圖書館學實證研究起到一點積極的作用。
參考文獻
[1]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數據”[J].圖書館雜志,2012,(11):63-68,77.
[2]韓翠峰.大數據帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012,(5):37-40.
[3]鄧景康.大數據環(huán)境下清華大學圖書館的實踐[N].中國新聞出版報,2013-08-29,(005).
[4]初景利,吳冬曼.圖書館發(fā)展趨勢調研報告(三)[J].國家圖書館學刊,2010,(3):3-9.
[5]王宗義.圖書館“核心”能力建設的思考[J].圖書館建設,2003,(3):1-4.
[6]The New York Times.Harvard Releases Big Data forBooks[EB].http:∥bits.blogs.ny-times.com/2012/4/24/harvard-releases-big-data-for-books,2012-08-11.
[7]和婷.大數據思維對圖書館信息服務工作的啟示[J].圖書館建設,2014,(1):64-68.
[8]陳峰,梁戰(zhàn)平.論SWOT分析方法在競爭情報實踐中的應用[J].情報學報,2001,(12):720-727.
(本文責任編輯:郭沫含)endprint