嚴 珊
(中南財經(jīng)政法大學(xué)圖書館,湖北 武漢 430073)
中國人民大學(xué)復(fù)印報刊資料庫(以下簡稱“資料庫”)搜集、整理、編輯人文社會科學(xué)資料,具有較高的學(xué)術(shù)價值,通過摘編、濃縮、匯集某一學(xué)科領(lǐng)域的高質(zhì)量研究成果,以優(yōu)質(zhì)的資源和便捷的方式,為學(xué)者提供知識管理與知識服務(wù)。筆者以資料庫中的《圖書館學(xué)情報學(xué)》為數(shù)據(jù)來源,對其所載文章的內(nèi)容特征進行研究分析,旨在快速了解該學(xué)科領(lǐng)域的研究熱點、研究成果及研究趨勢。
筆者統(tǒng)計后發(fā)現(xiàn),《圖書館學(xué)情報學(xué)》2021年選文的來源期刊共有23種,共收錄文章206篇。原發(fā)期刊及相關(guān)指標數(shù)據(jù)詳見表1(被轉(zhuǎn)載量占比是指期刊被資料庫轉(zhuǎn)載的相對值,轉(zhuǎn)載率是指期刊當(dāng)年被轉(zhuǎn)載量占期刊當(dāng)年發(fā)文總數(shù)的比例)。表1顯示,排名前18的均為核心期刊,說明資料庫選文要求文章具有較高的學(xué)術(shù)價值。排名第20的《科技情報研究》是2019年新創(chuàng)立的期刊,雖不是核心期刊但轉(zhuǎn)載率達到8.33%,說明該刊在論文質(zhì)量和研究熱點方面把關(guān)較嚴。
表1 被轉(zhuǎn)文章前20的原發(fā)期刊統(tǒng)計
(續(xù)表)
收錄論文的時效性是指入選論文的收錄年與發(fā)文年之間的時間差,時效性反映了資料庫對學(xué)科領(lǐng)域研究熱點的反應(yīng)速度。如下頁表2所示,論文被資料庫轉(zhuǎn)載的時間差為0的文章比例為89.91%,時間差為1的文章比例為10.19%,時間差為2及以上的文章比例為0,說明當(dāng)年新發(fā)表論文是資料庫選文的主要來源。進一步分析發(fā)文年和收錄年的期數(shù)后可知,時間差為1的文章的原期刊發(fā)表時間大多是當(dāng)年的最后1期,導(dǎo)致未能在《圖書館學(xué)情報學(xué)》出刊前被錄入,由此也說明資料庫收錄論文非常重視時效性。
表2 收錄年與發(fā)文年差值情況
從基金項目看,《圖書館學(xué)情報學(xué)》收錄的論文中國家級項目占59.92%,其中國家社會科學(xué)基金占比為41.62%,國家自然科學(xué)基金占比為11.35%,教育部人文社會科學(xué)研究項目占比為5.95%。
資料庫2021年轉(zhuǎn)載文獻的第一作者共有181人,其中被轉(zhuǎn)3篇的作者有5人,被轉(zhuǎn)2篇的作者有15人,詳見表3。表3顯示,被轉(zhuǎn)論文排名前20的作者的H指數(shù)均大于12,平均數(shù)為23.4,說明資料庫收錄的高被轉(zhuǎn)作者通常也是高被引作者。
表3 被轉(zhuǎn)排名前20的作者(第一作者)統(tǒng)計
(續(xù)表)
筆者分析資料庫收錄的作者所屬的一級機構(gòu)可知,206篇文章的來源機構(gòu)共107家,均為國內(nèi)機構(gòu),大部分為高校和研究所。因篇幅有限,筆者僅列出總被轉(zhuǎn)載量排名前20的機構(gòu),詳見表4。表4中的機構(gòu)大部分在我國圖情領(lǐng)域具有較強的學(xué)術(shù)影響力,其中被轉(zhuǎn)載論文排名前9的機構(gòu)均為高校,且均在全國第4次學(xué)科評估中排名靠前,說明資料庫選文時較注重作者所屬機構(gòu)的學(xué)術(shù)地位。
表4 轉(zhuǎn)載量排名前20的機構(gòu)統(tǒng)計
為進一步了解圖情領(lǐng)域的選文熱點,筆者利用高頻關(guān)鍵詞可視化圖譜選取出現(xiàn)頻次≥7的高頻詞進行分析,發(fā)現(xiàn)數(shù)字人文、新文科、社交媒體、人工智能等是高頻關(guān)鍵詞網(wǎng)絡(luò)圖譜中聯(lián)系最緊密、出現(xiàn)最多的關(guān)鍵詞。
圖書館是數(shù)字人文天然的孵化器,圖書館學(xué)情報學(xué)與人文學(xué)科的深度融合更容易實現(xiàn)數(shù)字與人文之間的實用性和效益性,有利于人文學(xué)科在實際應(yīng)用層面上的推廣利用。圖情界可通過為史料數(shù)字化建設(shè)提供標準參考、為學(xué)科融合提供高層互操作框架、為數(shù)字資源提供可長期保存的基礎(chǔ)設(shè)施、提供共建共享的數(shù)據(jù)平臺服務(wù)等方式參與人文學(xué)科的融合建設(shè)。例如,黃如花等從圖書情報的角度探索了數(shù)據(jù)信息領(lǐng)域的新問題,內(nèi)容包括面向政府決策的數(shù)據(jù)素養(yǎng)培訓(xùn)、基于Altmetrics(學(xué)術(shù)產(chǎn)出的社會傳播指標)的網(wǎng)絡(luò)科學(xué)論文擴散追蹤、信息流行病與健康信息學(xué)、面向知識的用戶畫像、社交媒體信息歸類存檔等;劉瀏等從多個角度對《春秋》三傳中的女性人物進行知識標注和新的解讀;李惠等以《四庫全書總目》為研究對象,采用提要網(wǎng)絡(luò)分析模型構(gòu)建了古籍目錄分析工具,并整合提要的元數(shù)據(jù)和語義信息到推薦算法中,完善提要推薦系統(tǒng);曾蕾等通過舉證圖檔博對珍貴文化遺產(chǎn)進行數(shù)據(jù)和信息源處理的三個階段,即數(shù)字化、數(shù)據(jù)化和語境化,論證了語義增強技術(shù)應(yīng)用于圖檔博對數(shù)字人文發(fā)展的支持。
在大數(shù)據(jù)時代,社交媒體作為網(wǎng)絡(luò)信息的重要載體,成為記錄人類活動信息與保存人類記憶的重要形式和不可忽視的數(shù)據(jù)來源,對其歸檔有利于拓展人類記憶空間。例如,安璐等構(gòu)建了社交媒體高影響力用戶完整畫像,幫助突發(fā)事件管理部門快速識別并掌握社交媒體中關(guān)鍵用戶的態(tài)度傾向和關(guān)注熱點,為輿情管理和應(yīng)急預(yù)案提供數(shù)據(jù)支持;李綱等以圖像語義理解框架為研究基礎(chǔ),通過機器學(xué)習(xí)與深度學(xué)習(xí)構(gòu)建圖文相關(guān)性的多標簽分類方法,以此分析、理解災(zāi)害情境下的微博圖文內(nèi)容;王晰巍等通過構(gòu)建區(qū)塊鏈網(wǎng)絡(luò)謠言甄別模型,凈化網(wǎng)絡(luò)信息,保證輿情信息傳播的安全性、完整性和可追溯性;李旭光等將信息生態(tài)理論應(yīng)用于信息搜尋行為當(dāng)中,探索用戶搜尋行為的影響因素以及引導(dǎo)用戶搜索健康信息。
學(xué)科融合、復(fù)合型高素質(zhì)人才稀缺、社會問題復(fù)雜化是新文科提出的背景。在新文科背景下,新技術(shù)諸如大數(shù)據(jù)、人工智能、5G、物聯(lián)網(wǎng)、云計算、區(qū)塊鏈的快速崛起與發(fā)展對圖情領(lǐng)域產(chǎn)生了深刻影響。在教育定位上,程煥文等認為中國圖書館學(xué)教育需在“培養(yǎng)什么人、怎樣培養(yǎng)人、為誰培養(yǎng)人”方面交好答卷;柯平認為在新文科建設(shè)背景下新圖情檔建設(shè)需通過技術(shù)賦能構(gòu)建人文技術(shù)一體式教育,滿足社會需求,突出中國特色;馬費成等認為要以新文科建設(shè)為契機,通過面向社會需求、重視理論創(chuàng)新、加強交叉融合、恪守人文傳統(tǒng)等措施推動圖書情報學(xué)科未來的發(fā)展;初景利等認為新文科背景下圖情檔建設(shè)應(yīng)從軟學(xué)科走向硬學(xué)科,在理論與實踐中加強圖情檔一級學(xué)科內(nèi)的深度發(fā)展,探究跨學(xué)科的交叉融合,并努力促進和擴大圖情檔學(xué)科的滲透與輸出。
在圖情領(lǐng)域人工智能技術(shù)研究方面,孫二林等完善了情報轉(zhuǎn)化理論,在理論與實踐中解決人工和機器、信息和情報的轉(zhuǎn)換與融合問題;張智雄等構(gòu)建了“科技文獻庫”向“科技知識引擎”轉(zhuǎn)變的路徑,探討了如何把深度學(xué)習(xí)技術(shù)應(yīng)用到情報分析中的知識挖掘當(dāng)中。人工智能技術(shù)作為新一輪科技革命和產(chǎn)業(yè)變革的重要推動力,在疫情防控信息管理中具有巨大的潛能,同時也存在數(shù)據(jù)、算法和信息安全等問題和挑戰(zhàn)?;诖耍w楊等分析了人工智能技術(shù)在疫情防控、社會治理、疾病診療、復(fù)工復(fù)產(chǎn)等場景中的應(yīng)用作用,并從數(shù)據(jù)、場景、技術(shù)三個維度構(gòu)建與人工智能技術(shù)相匹配的疫情防控大數(shù)據(jù)平臺,形成以人工智能為核心技術(shù)的疫情防控“硬核”支撐。