文/翟婧
(山東政法學(xué)院圖書館 山東 濟(jì)南 250014)
隨著全球通信技術(shù)、互聯(lián)網(wǎng)技術(shù)、人工智能等大數(shù)據(jù)技術(shù)的快速發(fā)展,大眾越來越偏向使用網(wǎng)絡(luò)作為獲取信息的渠道和喜歡把網(wǎng)絡(luò)當(dāng)成學(xué)習(xí)和交流的工具,移動(dòng)智能閱讀設(shè)備性能不斷地提升,推進(jìn)智能化、移動(dòng)化和服務(wù)化的社會建設(shè)也越來越深入,數(shù)字智能化也成為當(dāng)今社會人類生活中不可少的環(huán)節(jié)。當(dāng)計(jì)算機(jī)技術(shù)啟蒙時(shí),科學(xué)研究人員就在不斷地創(chuàng)新,嘗試著將計(jì)算機(jī)技術(shù)應(yīng)用到數(shù)字人文領(lǐng)域中。中國引進(jìn)數(shù)字人文技術(shù)已彈指10年有余。國際上數(shù)字人文的發(fā)展已經(jīng)有很豐富的成果,數(shù)字人文項(xiàng)目建設(shè)的蓬勃發(fā)展直接推動(dòng)了中國數(shù)字人文發(fā)展步伐,但數(shù)字人文不是一個(gè)新的領(lǐng)域,隨著計(jì)算機(jī)軟件技術(shù)的不斷更新發(fā)展,現(xiàn)如今研究數(shù)字人文領(lǐng)域已變得十分廣泛。
數(shù)字人文的概念具有包容性與演進(jìn)性的基本特點(diǎn),有時(shí)也被稱為人文計(jì)算。數(shù)字人文是數(shù)字技術(shù)與人文科學(xué)張力性的結(jié)合,它是針對計(jì)算與人文科學(xué)之間的交叉領(lǐng)域進(jìn)行學(xué)習(xí)、研究、發(fā)明以及創(chuàng)新的一門學(xué)科,但它又是一門交叉學(xué)科,它的研究涉及到對互聯(lián)網(wǎng)信息的研究、分析、識別等綜合技術(shù),它致力于如何利用媒體來影響人文科學(xué)。
從大學(xué)圖書館事業(yè)發(fā)展的角度談個(gè)性化服務(wù),就是以讀者為中心,在研究讀者的興趣愛好、專業(yè)和習(xí)慣的基礎(chǔ)下,根據(jù)讀者的個(gè)性化需要,向讀者推薦基于其需求和愛好的個(gè)性化圖書,來滿足讀者需求而開展的信息服務(wù)。個(gè)性化服務(wù)模式打破了傳統(tǒng)的被動(dòng)式服務(wù)模式,主動(dòng)開展以滿足讀者個(gè)性化需求為目的的全方位服務(wù)。對那種渴望精準(zhǔn)定位、針對所學(xué)專業(yè)性強(qiáng)和根據(jù)自己具體所研究課題和研究方向成果需求需要的個(gè)性化師生而言,大學(xué)圖書館就要充分利用數(shù)字人文平臺的個(gè)性化資源,來開展主動(dòng)性定位的個(gè)性化服務(wù),滿足讀者數(shù)字人文需求下的全方位服務(wù)。
數(shù)字信息檢索廣義上講是指用數(shù)字技術(shù),將各類信息按一定的方式進(jìn)行采集、加工處理存儲起來,并根據(jù)信息用戶的需要找出有關(guān)的信息過程的一種新型模式。這種新型模式被各行各業(yè)看作是一種即將發(fā)出變革的新力量,包括高校圖書館在內(nèi),都希望通過大數(shù)據(jù)的共享、跨界、快捷、開發(fā)等資源來創(chuàng)造更多的價(jià)值。在這樣的背景驅(qū)動(dòng)下,高校圖書館有必要結(jié)合自身的發(fā)展需要,在數(shù)字資源權(quán)益的領(lǐng)域下積極開展深入的研究和實(shí)踐探索。
書目信息的檢索是根據(jù)讀者的需求借用網(wǎng)絡(luò)數(shù)字資源和專業(yè)的技術(shù)手段,對有序化的圖書信息集合起來進(jìn)行查詢,來獲取符合和滿足讀者檢索要求的信息資料。
在搜索框中輸入書名、作者或者關(guān)聯(lián)詞,即可獲取該書目相關(guān)館藏的點(diǎn)擊條,點(diǎn)開點(diǎn)擊條就可以一目了然地查看該書目館藏的信息,通常包括書目的書名、責(zé)任者、出版信息、價(jià)格、該書目在哪個(gè)書庫收藏、是否在館、該書目的預(yù)約等借閱本書目的流通情況。例如米哈伊爾·肖洛霍夫編著的《靜靜的頓河》這本書目信息,當(dāng)從搜索框中搜索后,此書目會顯示在中文文學(xué)書庫以字母I開頭編輯入庫的藏本和外文語言書庫以H字母開頭編輯的藏本,如果讀者想看原版的來提升自身的學(xué)習(xí)就點(diǎn)擊外文語言書庫。如果流通點(diǎn)擊條中顯示為“在架”說明該書目在圖書館可以借出。
登錄學(xué)校圖書館的網(wǎng)站,進(jìn)入圖書館界面跳轉(zhuǎn)頁面,就會彈跳出電子資源、服務(wù)指南、本館要覽、分類查找等點(diǎn)擊欄。然后點(diǎn)擊分類查找欄中的館藏文獻(xiàn)檢索,在文獻(xiàn)檢索框中輸入書目的書名或者作者就會呈現(xiàn)出讀者所要查找的圖書信息了。電子資源分為中文數(shù)據(jù)庫、外文數(shù)據(jù)庫、電子期刊數(shù)據(jù)庫、電子圖書、學(xué)科電子導(dǎo)航等條目。隨便點(diǎn)擊任何的電子資源,就會彈跳出圖書館免費(fèi)下載或者館內(nèi)購買來的電子文獻(xiàn),提供給各個(gè)學(xué)科領(lǐng)域有需求的師生訪問閱讀。如讀者需求中文方面的資料,就可以直接點(diǎn)擊中文數(shù)據(jù)庫網(wǎng)站的鏈接。例如檢索《圖書情報(bào)工作》這本期刊中文雜志,從搜索框中輸入《圖書情報(bào)工作》雜志名,網(wǎng)頁就會彈跳出該雜志的文獻(xiàn)資料,讀者就可以選擇性的免費(fèi)閱讀或者下載自己有需求的部分了。但這種方法搜索也有利弊,好處是可以搜尋到很多的文獻(xiàn)資料,而且信息還比較全面,弊端就是需要讀者從大量的文獻(xiàn)資料中整理尋找自己需要的資料。
高級檢索一般被應(yīng)用在一些數(shù)據(jù)庫中作為信息檢索入口的三種檢索途徑之一,高級檢索功能包括字段檢索、布爾邏輯檢索等,利用這些檢索功能搜索引擎可以獲取某Web站點(diǎn)被連接的次數(shù),比較各站點(diǎn)的聲望高低等。同時(shí)高級檢索也可以方便讀者精準(zhǔn)地查找數(shù)據(jù)資料。
進(jìn)入高級檢索界面里,主要由檢索欄和歷史記錄兩部分組成。檢索欄是有上下兩個(gè)檢索框組成,上方檢索框可以輸入書名、作者等關(guān)鍵詞,可以直接跳轉(zhuǎn)到具體檢索到的文獻(xiàn)頁面。而下面的檢索框則是可以查看具體的檢索方式。高級搜索檢索欄中有很多類別,其中比較常用的有作者檢索、雜志檢索、日期檢索、標(biāo)題檢索和摘要檢索等。
高級搜索第二個(gè)部分是歷史檢索。在高級檢索中,除了可以自定義檢索文獻(xiàn)還可以檢索歷史記錄。在檢索歷史記錄中可以看到每一個(gè)自定義檢索的檢索方式以及有多少個(gè)相關(guān)聯(lián)的文獻(xiàn)資料。自定義檢索的結(jié)果,PubMed都會為檢索的歷史記錄進(jìn)行編號,這樣方便讀者查找。除了使用編號進(jìn)行檢索之外,歷史檢索還有一個(gè)Actions的功能。Action又包括三個(gè)選項(xiàng):刪除檢索記錄、添加到檢索欄、以及創(chuàng)建提醒。每一次讀者使用高級搜索之后都會留下閱覽記錄,而歷史記錄只顯示具體的檢索結(jié)果,不會把文獻(xiàn)內(nèi)容返回。但歷史檢索完整記錄了本次以來所有檢索式的具體內(nèi)容及命令中的結(jié)果。包括檢索式序號、檢索式、檢索結(jié)果以及檢索的時(shí)間。運(yùn)用歷史檢索的好處可以幫助讀者分步檢索,且可以方便讀者調(diào)整、修正檢索的策略。
在線詞典、在線翻譯、文本標(biāo)記、語料庫等工具都是數(shù)字人文中常用的熱門工具。數(shù)字可視化是通過多媒體、三維、傳感、智能交換、實(shí)時(shí)跟蹤等多種方法,將虛擬的信息與真實(shí)的現(xiàn)實(shí)和歷史相結(jié)合起來疊加、融為一體的技術(shù)。
數(shù)字可視化與信息圖形、信息可視化、科學(xué)可視化、以及統(tǒng)計(jì)圖形密切相關(guān)。數(shù)字可視化主要是利用數(shù)據(jù)分析和開發(fā)工具等手段將大型、比較集中的數(shù)據(jù)借助圖形圖像形式去處理其中未知的信息的過程,并能清晰有效地傳達(dá)和讀者網(wǎng)絡(luò)信息溝通的能力。大數(shù)據(jù)時(shí)代數(shù)字人文的數(shù)據(jù)價(jià)值亟需被挖掘利用起來助力時(shí)代的發(fā)展,有了可視化數(shù)字人文真正地提高了運(yùn)維工作的效率,把復(fù)雜的工作簡單化,很好地改進(jìn)了重復(fù)性和繁重的定位工作問題。
圖書館數(shù)字可視化的開發(fā)人員多是通過讀者大數(shù)據(jù)的靜態(tài)信息和動(dòng)態(tài)信息的電子資源對讀者進(jìn)行分析研究的。如讀者的動(dòng)態(tài)信息有:讀者的借閱數(shù)據(jù)、借閱刊物的類型、借閱的時(shí)間、和讀者訪問電子資源的活躍時(shí)間段等讀者操作電子信息留下痕跡的動(dòng)態(tài)信息;讀者的靜態(tài)信息:如師生們的校園一卡通、身份證、所在年級和專業(yè)學(xué)科等比較固定的基本信息和讀者本身外露出來的本質(zhì)信息。開發(fā)研究人員通過大數(shù)據(jù)靜態(tài)信息和動(dòng)態(tài)信息對讀者個(gè)人進(jìn)行深入挖掘分析就能精準(zhǔn)地了解讀者的需求。
例如數(shù)字信息顯示某位讀者經(jīng)常在下午的時(shí)間段瀏覽教育方面的資料,從靜態(tài)的信息反饋是一名三十歲左右的女讀者,那從動(dòng)態(tài)信息就會反饋出這位女士有可能是一位寶媽,在從她瀏覽的痕跡中判斷出她有個(gè)七八歲的孩子,從她看教育書的類型,數(shù)字信息還可以分析出她的寶寶是女孩,那么在她下次再來閱覽時(shí),電子信息直接就會給這位讀者跳躍出兒童讀物中女孩子喜歡的書如《白雪公主》等信息。還有《兒童營養(yǎng)膳食》等寶媽喜愛的刊物。先進(jìn)的數(shù)字人文就是采集讀者檢索、瀏覽等使用電子數(shù)據(jù)留下的痕跡,根據(jù)讀者的興趣點(diǎn)將不同的內(nèi)容推送給相應(yīng)的個(gè)性化的用戶。
目前國內(nèi)外數(shù)字可視化的大數(shù)據(jù)發(fā)展,還停留在獨(dú)立的電子數(shù)據(jù)庫的數(shù)字信息分析研究階段,還不能將多個(gè)電子數(shù)據(jù)庫信息融合起來統(tǒng)一建數(shù)據(jù)庫。在數(shù)字可視化檢索領(lǐng)域中,用戶查找數(shù)據(jù)都是一對一的互訪,并且還要從多個(gè)檢索數(shù)據(jù)中進(jìn)行局部的數(shù)據(jù)分析,保證全部檢索結(jié)果的準(zhǔn)確性。對不同數(shù)據(jù)進(jìn)行合并的同時(shí),還要滿足合并后的結(jié)果的精準(zhǔn)性,對科研工作者來說是一項(xiàng)艱難的任務(wù)。隨著大數(shù)據(jù)信息技術(shù)的發(fā)展,各行各業(yè)的多渠道獲取的信息將會融合成一個(gè)庫集(如:交通管制、軍事領(lǐng)域、病例診斷等)將成為可能。將多個(gè)單獨(dú)的數(shù)據(jù)庫的信息合并起來組成海量的多元數(shù)據(jù)庫彌補(bǔ)了人類認(rèn)知的局限性,將平臺原有的數(shù)字資源進(jìn)行重組后,能使新的數(shù)據(jù)進(jìn)行文本分析,為用戶進(jìn)行個(gè)性化服務(wù),更加先進(jìn)快捷,推動(dòng)國內(nèi)科研人員研究多元數(shù)據(jù)庫的數(shù)字可視化的技術(shù),將成為一個(gè)研究熱點(diǎn)。
在大數(shù)據(jù)時(shí)代背景下,2018年5月25日,歐盟開始實(shí)施《通用數(shù)據(jù)保護(hù)條例》,各國也紛紛加強(qiáng)對數(shù)據(jù)信息、個(gè)人隱私等重要的信息加以保護(hù)。數(shù)字可視化具有明確的開放性和流動(dòng)性,因此圖書館在利用數(shù)字可視化對讀者的隱私和作者的信息安全也存在不可忽視的隱患。大規(guī)模的數(shù)據(jù)信息難免會存在風(fēng)險(xiǎn),會侵犯到個(gè)人的隱私導(dǎo)致糾紛。如大數(shù)據(jù)對圖書館知識產(chǎn)權(quán)風(fēng)險(xiǎn)研究中的專利權(quán)、著作權(quán)、商業(yè)秘密三種類型的知識產(chǎn)權(quán)作為科學(xué)數(shù)據(jù)保護(hù)的權(quán)利。針對上述的信息風(fēng)險(xiǎn)問題就需要圖書館的數(shù)據(jù)網(wǎng)絡(luò)研究人員建立數(shù)據(jù)安全保護(hù)機(jī)制,對存在的問題進(jìn)行系統(tǒng)化、規(guī)范化,積極探討、落實(shí)有效的保護(hù)辦法和研究創(chuàng)新的科學(xué)技術(shù),根據(jù)相應(yīng)的法律明文規(guī)定,利用法律武器來追究相應(yīng)的責(zé)任,更高水平地維護(hù)圖書館的數(shù)字資源系統(tǒng)的管理和保護(hù)。
合并數(shù)字資源,刷新后的原始數(shù)據(jù)丟失,會使現(xiàn)有的系統(tǒng)數(shù)據(jù)不完整,影響用戶查找結(jié)果的準(zhǔn)確性和可視化網(wǎng)絡(luò)分析用戶精確性。如:靜態(tài)數(shù)據(jù)身份識別、院系等動(dòng)態(tài)的訪問數(shù)據(jù)等信息。解決的途徑可以考慮如下策略,首先需要數(shù)字網(wǎng)絡(luò)人員更加詳細(xì)的編錄數(shù)據(jù)字段,對那些有限制條件的檢索組配進(jìn)行加權(quán),對讀者的瀏覽方式進(jìn)行更加細(xì)致的分類,對讀者的閱覽痕跡加入更加專業(yè)的格式化,便于電子信息更加個(gè)性化的分析信息,來提高讀者對圖書館電子資源的利用效率。其次更加詳細(xì)地把讀者的靜態(tài)數(shù)據(jù)資料入檔,把動(dòng)態(tài)數(shù)據(jù)留存,幫助大數(shù)據(jù)進(jìn)行更全面的分析。最后拓展數(shù)據(jù)的來源,強(qiáng)化數(shù)據(jù)的質(zhì)量,挖掘新穎數(shù)據(jù),便于更新?lián)Q代與持續(xù)改進(jìn)。
數(shù)字人文的發(fā)展,為現(xiàn)如今的圖書館事業(yè)開辟出一條新的道路,是人文學(xué)科發(fā)展的未來。數(shù)字人文不僅僅是一種工具、方法和平臺,還可以把科研人員從繁雜的資料整理中解脫出來,更加專注于高層次的科學(xué)研究。圖書館在數(shù)字人文方面的進(jìn)步,意味著加速科研人員的研究速度和效率,因此促進(jìn)數(shù)字人文的發(fā)展具有重大的現(xiàn)實(shí)意義。