張 晨(中國(guó)人民大學(xué)信息資源管理學(xué)院)
科研項(xiàng)目同期刊和專著一樣承載著知識(shí)主體和知識(shí)客體的相關(guān)信息,因此,科學(xué)基金項(xiàng)目也可以在一定程度上反映學(xué)者在該學(xué)科領(lǐng)域的關(guān)注重點(diǎn),而國(guó)家級(jí)科學(xué)基金項(xiàng)目則能反映一個(gè)國(guó)家在該學(xué)科的具體研究動(dòng)向和趨勢(shì),以及整體的學(xué)術(shù)研究發(fā)展和社會(huì)經(jīng)濟(jì)發(fā)展?fàn)顩r。本研究旨在對(duì)比分析圖情檔學(xué)科領(lǐng)域中美兩國(guó)的基金資助項(xiàng)目,具體調(diào)研了2013-2020年我國(guó)國(guó)家社會(huì)科學(xué)基金立項(xiàng)項(xiàng)目(以下簡(jiǎn)稱“國(guó)社科”)和國(guó)家自然科學(xué)基金立項(xiàng)項(xiàng)目(以下簡(jiǎn)稱“國(guó)自科”)以及美國(guó)國(guó)家科學(xué)基金會(huì)(National Science Foundation,NSF)對(duì)開設(shè)圖情檔學(xué)科的院校資助的科研項(xiàng)目,具體分析了中美兩國(guó)基金資助項(xiàng)目的高頻詞和主題,梳理總結(jié)兩國(guó)的研究熱點(diǎn),為我國(guó)圖情檔學(xué)科的進(jìn)一步發(fā)展提出建議。
已有研究大多從論文和基金資助項(xiàng)目?jī)蓚€(gè)角度分析學(xué)科的研究熱點(diǎn)。①對(duì)論文的分析。論文是學(xué)者研究成果的直接展示,通過分析論文可以直接得到相關(guān)領(lǐng)域的研究主題和研究?jī)?nèi)容,進(jìn)而可總結(jié)出某一特定領(lǐng)域的研究熱點(diǎn)。圖情檔領(lǐng)域基于論文進(jìn)行的熱點(diǎn)問題研究主要集中在期刊刊載論文、碩博論文、會(huì)議論文和參考文獻(xiàn)這幾種類型。②對(duì)基金資助項(xiàng)目的分析?;鹳Y助項(xiàng)目代表了資助機(jī)構(gòu)對(duì)該項(xiàng)目的肯定,通過分析基金資助項(xiàng)目可以發(fā)現(xiàn)某一特定領(lǐng)域的研究動(dòng)向。目前,關(guān)于基金資助項(xiàng)目的分析研究主要從基金論文和基金立項(xiàng)兩個(gè)角度展開,本研究將重點(diǎn)關(guān)注基金資助項(xiàng)目對(duì)研究熱點(diǎn)的反映情況,因此詳細(xì)調(diào)研了基金立項(xiàng)的相關(guān)研究狀況。
基金論文是指在學(xué)術(shù)期刊上發(fā)表的有基金資助的論文,這些論文代表了基金項(xiàng)目的產(chǎn)出成果,也從側(cè)面反映了該項(xiàng)目的科研價(jià)值。近年來,圖情檔學(xué)科正在積極開展對(duì)于基金論文的研究,相關(guān)研究的主要內(nèi)容見表1。
表1 基金論文的主要研究?jī)?nèi)容
已有研究主要從基金立項(xiàng)的外部特征和內(nèi)容特征方面分析了圖情檔學(xué)科的研究情況(見表2)。通過對(duì)基金立項(xiàng)的內(nèi)容特征,尤其是主題詞、關(guān)鍵詞與高頻詞進(jìn)行歸納與總結(jié),學(xué)者們梳理出了當(dāng)前圖情檔學(xué)科的研究熱點(diǎn):圖書館、國(guó)際化發(fā)展和創(chuàng)新服務(wù)、“大數(shù)據(jù)”環(huán)境下相關(guān)研究、古籍整理與文獻(xiàn)研究、弱勢(shì)群體、輿情、圖書館、創(chuàng)新、文化、突發(fā)事件、用戶、大數(shù)據(jù)、知識(shí)化、智慧化、互聯(lián)網(wǎng)+、學(xué)科交叉、數(shù)字人文等。
表2 基金立項(xiàng)的研究
(1)中國(guó)國(guó)家級(jí)基金立項(xiàng)數(shù)據(jù)。國(guó)家級(jí)基金項(xiàng)目能夠較好地反映科研動(dòng)態(tài),圖情檔學(xué)科的科研人員極其關(guān)注和重視國(guó)家級(jí)基金項(xiàng)目。通過全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室網(wǎng)站和科學(xué)網(wǎng),筆者統(tǒng)計(jì)了2013-2019年國(guó)社科和國(guó)自科中“圖書館、情報(bào)與文獻(xiàn)學(xué)”類及學(xué)科代碼為G041401的“圖書情報(bào)檔案管理”類目下的相關(guān)項(xiàng)目,分別獲取國(guó)社科項(xiàng)目1,106條、國(guó)自科項(xiàng)目132條。
(2)美國(guó)國(guó)家級(jí)基金立項(xiàng)數(shù)據(jù)。作為美國(guó)的國(guó)家級(jí)基金立項(xiàng)單位,NSF按學(xué)科分門別類地建設(shè)了各個(gè)委員會(huì),向各大院校提供研究贈(zèng)款和資助。由于從NSF網(wǎng)站無法直接獲取圖情檔學(xué)科的項(xiàng)目信息,筆者嘗試從開設(shè)圖情檔學(xué)科的院校逐個(gè)收集其2013-2020年的科研項(xiàng)目。iSchool是一個(gè)致力于推動(dòng)信息技術(shù)、圖書館學(xué)、情報(bào)學(xué)等學(xué)科發(fā)展的非營(yíng)利性組織,由來自世界各地的院校組成,截至2020年8月12日,已經(jīng)有了116所成員院校,其中美國(guó)院校44所。U.S.News&World Report對(duì)獲得美國(guó)圖書館協(xié)會(huì)認(rèn)證的開設(shè)圖書館和信息研究碩士學(xué)位的院校進(jìn)行了統(tǒng)計(jì)與評(píng)估,相關(guān)的美國(guó)院校共計(jì)51所。筆者在合并這兩個(gè)渠道統(tǒng)計(jì)的院校并排除無圖情方向的院校后,最終確認(rèn)了57所相關(guān)院校。首先逐一瀏覽這57所院校的官方網(wǎng)站并整理出其中由NSF資助的項(xiàng)目,再以其中提到的圖情方向教師的姓名為檢索條件在NSF網(wǎng)站篩選2013-2020年的基金項(xiàng)目,截至2020年8月12日共收集到相關(guān)數(shù)據(jù)326條。
本研究主要采用文本挖掘的方法提取中美兩國(guó)基金項(xiàng)目數(shù)據(jù)中的高頻詞,再通過K-means算法進(jìn)行主題聚類。從數(shù)據(jù)清洗、分詞、抽取高頻詞、可視化、TF-IDF構(gòu)建詞權(quán)重到K-means聚類,整個(gè)過程利用Python編程語言實(shí)現(xiàn)。
3.1.1 關(guān)鍵詞分析
筆者利用Jieba對(duì)每個(gè)項(xiàng)目名稱進(jìn)行分詞處理,在剔除無用詞后得到熱點(diǎn)關(guān)鍵詞,再利用Python的PyEcharts工具將關(guān)鍵詞繪制為交互式可視化詞云圖,并提取出現(xiàn)頻率Top15的關(guān)鍵詞繪制條形圖(見圖1),從中可以看出國(guó)家級(jí)基金項(xiàng)目的研究主題分布以及我國(guó)國(guó)家基金項(xiàng)目的分布特點(diǎn)。
圖1 中國(guó)國(guó)家級(jí)基金項(xiàng)目關(guān)鍵詞Top15
(1)“圖書館”研究是基金項(xiàng)目的重中之重?!皥D書館”的出現(xiàn)頻次最高,學(xué)者主要從圖書館類型、評(píng)價(jià)、創(chuàng)新建設(shè)、數(shù)字圖書館、服務(wù)、圖書館員、圖書館發(fā)展史等方面展開研究。如,重點(diǎn)項(xiàng)目“基于績(jī)效和成效集成的公共圖書館評(píng)估理論與評(píng)估標(biāo)準(zhǔn)創(chuàng)新研究”“基于知識(shí)組織的圖書館資源發(fā)現(xiàn)服務(wù)體系研究”“中國(guó)古代圖書館學(xué)研究”等。
(2)“服務(wù)”成為圖情檔學(xué)科的重要研究?jī)?nèi)容?!胺?wù)”的出現(xiàn)頻率較高說明圖情檔學(xué)科的研究呈現(xiàn)服務(wù)化趨勢(shì),其中信息服務(wù)和知識(shí)服務(wù)是研究重點(diǎn)。如,重點(diǎn)項(xiàng)目“面向國(guó)家發(fā)展與安全決策的情報(bào)服務(wù)創(chuàng)新研究”“創(chuàng)新驅(qū)動(dòng)的中國(guó)特色新型智庫知識(shí)服務(wù)發(fā)展機(jī)制研究”“大數(shù)據(jù)環(huán)境下戰(zhàn)略性新興產(chǎn)業(yè)的信息資源服務(wù)創(chuàng)新研究”等。
(3)“信息”“知識(shí)”“數(shù)據(jù)”仍然是重點(diǎn)研究對(duì)象。根據(jù)DIKW(數(shù)據(jù)—信息—知識(shí)—智慧)模型,當(dāng)數(shù)據(jù)轉(zhuǎn)換為信息再轉(zhuǎn)換為知識(shí)后,數(shù)據(jù)能實(shí)現(xiàn)更高的價(jià)值,而如何組織、利用信息、數(shù)據(jù)和知識(shí)仍然是學(xué)者們重點(diǎn)研究的問題。其中與“信息”相關(guān)的研究數(shù)量最多(詞頻位居第2),其次是“知識(shí)”(詞頻位居第4),再次是“數(shù)據(jù)”(詞頻位居第12)。2013年是我國(guó)的“大數(shù)據(jù)元年”,從2013年開始,我國(guó)學(xué)者對(duì)于大數(shù)據(jù)的研究呈蓬勃發(fā)展之勢(shì),2013-2019年,“大數(shù)據(jù)”的詞頻超過了傳統(tǒng)的“數(shù)據(jù)”。如,“面向企業(yè)技術(shù)創(chuàng)新的專利大數(shù)據(jù)挖掘與分析研究”“大數(shù)據(jù)時(shí)代政府?dāng)?shù)據(jù)治理體系建構(gòu)研究”“大數(shù)據(jù)環(huán)境下戰(zhàn)略性新興產(chǎn)業(yè)的信息資源服務(wù)創(chuàng)新研究”等。
(4)對(duì)傳統(tǒng)文獻(xiàn)資源的研究仍受關(guān)注。以“文獻(xiàn)”“檔案”“資源”為關(guān)鍵詞的研究項(xiàng)目占據(jù)較大比例,這些研究主要集中在文獻(xiàn)整理、檔案管理、信息資源方面。如,“新時(shí)代我國(guó)檔案管理體制改革研究”“民國(guó)時(shí)期革命歷史文獻(xiàn)整理與研究”“大數(shù)據(jù)環(huán)境下戰(zhàn)略性新興產(chǎn)業(yè)的信息資源服務(wù)創(chuàng)新研究”等。
(5)新興網(wǎng)絡(luò)技術(shù)擴(kuò)大學(xué)科研究范圍。“數(shù)字”“網(wǎng)絡(luò)”等高頻關(guān)鍵詞標(biāo)志著圖情檔學(xué)科的研究已進(jìn)入數(shù)字化和網(wǎng)絡(luò)化環(huán)境,新方法和新技術(shù)為圖情檔學(xué)科的一些問題提供了新的解決方案,促使立項(xiàng)項(xiàng)目轉(zhuǎn)向創(chuàng)新性研究。因此,“創(chuàng)新”也是已立項(xiàng)的基金項(xiàng)目中一個(gè)不可忽視的關(guān)鍵詞。如,“社會(huì)連接和認(rèn)知負(fù)荷視角下網(wǎng)絡(luò)用戶從眾信息行為研究”“數(shù)字保存的風(fēng)險(xiǎn)型元數(shù)據(jù)與風(fēng)險(xiǎn)監(jiān)控研究”“學(xué)術(shù)出版體制機(jī)制創(chuàng)新研究”等。
3.1.2 主題分析
筆者使用K-means算法對(duì)我國(guó)國(guó)家級(jí)基金項(xiàng)目的名稱進(jìn)行共詞聚類,結(jié)合手肘法與輪廓系數(shù)判斷出8類最佳聚類簇,每個(gè)類簇的關(guān)鍵詞Top10見表3。
表3 中國(guó)國(guó)家級(jí)基金項(xiàng)目主題聚類
(1)信息資源管理。第1類簇的研究較為宏觀,其主題主要為在國(guó)家戰(zhàn)略背景下進(jìn)行的信息資源管理研究,具體涉及數(shù)據(jù)治理、信息政策、信息安全、智庫建設(shè)、非物質(zhì)文化遺產(chǎn)數(shù)字化、數(shù)字檔案等方面。如,“面向智慧服務(wù)的多源多維公共文化數(shù)據(jù)治理及政策保障研究”“個(gè)人信息保護(hù)政策的國(guó)際比較研究”“國(guó)際智庫當(dāng)代中國(guó)研究數(shù)據(jù)庫與重要專題研究”“瀕危土家族非物質(zhì)文化遺產(chǎn)的征編與數(shù)字化保護(hù)研究”等。
(2)電子政務(wù)。第2類簇的研究圍繞政府內(nèi)部業(yè)務(wù)的信息化展開,利用現(xiàn)代信息技術(shù)對(duì)政府的信息化業(yè)務(wù)進(jìn)行重組與改造,利用網(wǎng)絡(luò)與社交媒體加強(qiáng)公眾對(duì)政府服務(wù)的監(jiān)督,使政府工作更有效、更公開,具體涉及數(shù)字政府、開放政府?dāng)?shù)據(jù)、政府信息服務(wù)、社交媒體等方面。如,“數(shù)字政府背景下電子文件單軌制管理的數(shù)字連續(xù)性保障框架研究”“共生視角下政府?dāng)?shù)據(jù)開放的運(yùn)行機(jī)制與實(shí)現(xiàn)路徑研究”“我國(guó)地方政府公信力的網(wǎng)絡(luò)媒體評(píng)價(jià)機(jī)制研究”等。
(3)信息分析。第3類簇的研究主題可歸納為信息分析,這也是近年來情報(bào)學(xué)科的研究熱點(diǎn),主要包括信息評(píng)價(jià)、學(xué)術(shù)資源、語義分析、社會(huì)網(wǎng)絡(luò)分析等相關(guān)研究。如,“大數(shù)據(jù)環(huán)境下移動(dòng)社會(huì)網(wǎng)絡(luò)中多維信任評(píng)價(jià)機(jī)制及實(shí)施路徑研究”“基于文本內(nèi)容挖掘的學(xué)術(shù)論文影響力評(píng)價(jià)研究”“基于專利語義分析的潛在競(jìng)爭(zhēng)對(duì)手識(shí)別方法研究”等。
(4)古籍文獻(xiàn)整理。第4類簇的研究主題可歸納為古籍文獻(xiàn)整理。我國(guó)文化歷史悠久、地域遼闊、民族眾多,產(chǎn)生并傳承了眾多古籍文獻(xiàn)和檔案資源,整理這些資料對(duì)于我國(guó)的文化認(rèn)知具有重要意義。該主題的研究具體涉及檔案保護(hù)、檔案數(shù)字化、數(shù)據(jù)庫建設(shè)、文獻(xiàn)整理與研究、史料整理與研究等。如,“彝文古籍及其數(shù)字化保護(hù)與利用研究”“廣西京族口述歷史資料收集整理與其有聲數(shù)據(jù)庫建設(shè)”“晚清、民國(guó)時(shí)期地方志中圖書館史料的整理和研究”等。
(5)圖書館建設(shè)與服務(wù)。第5類簇主要是與圖書館建設(shè)及服務(wù)相關(guān)的應(yīng)用實(shí)踐問題。數(shù)字化、大數(shù)據(jù)、云服務(wù)等技術(shù)推動(dòng)了圖書館的發(fā)展,圖書館在大的社會(huì)背景下不斷尋求創(chuàng)新與突破,這一主題的研究具體包括圖書館建設(shè)、圖書館服務(wù)、數(shù)字圖書館、移動(dòng)圖書館、智慧圖書館等方面。如“圖書館服務(wù)體系層級(jí)結(jié)構(gòu)與效能優(yōu)化研究”“‘互聯(lián)網(wǎng)+’背景下數(shù)字圖書館發(fā)展與創(chuàng)新研究”“移動(dòng)圖書館的用戶體驗(yàn)?zāi)P团c服務(wù)質(zhì)量提升研究”“智慧圖書館情境感知微服務(wù)模式研究”等。
(6)知識(shí)管理。第6類簇圍繞“知識(shí)”這一主題聚類,體現(xiàn)了圖情檔學(xué)科對(duì)“知識(shí)”的重視與關(guān)注,主要涉及知識(shí)組織、知識(shí)服務(wù)、知識(shí)圖譜、知識(shí)社區(qū)、知識(shí)挖掘、知識(shí)創(chuàng)新、知識(shí)共享、知識(shí)庫構(gòu)建等內(nèi)容。如,“基于知識(shí)組織的圖書館資源發(fā)現(xiàn)服務(wù)體系研究”“大數(shù)據(jù)環(huán)境下面向圖書館資源的跨媒體知識(shí)服務(wù)研究”“基于深度學(xué)習(xí)的學(xué)術(shù)全文本知識(shí)圖譜構(gòu)建及檢索研究”“信息生態(tài)鏈視角下在線知識(shí)社區(qū)用戶貢獻(xiàn)行為評(píng)價(jià)及預(yù)測(cè)研究”等。
(7)圖書館史與館藏書目。第7類簇主要討論的是與圖書館發(fā)展史以及圖書館館藏書目相關(guān)的理論問題,具體涉及圖書館學(xué)研究、圖書館史研究、圖書館教育、專題館藏研究、館藏資源整理、總目編纂等方面。如,“信息科學(xué)視野下的圖書館學(xué)原理研究”“民國(guó)時(shí)期新知識(shí)群體圖書館學(xué)術(shù)思想史研究”“國(guó)家圖書館藏清宮戲曲文獻(xiàn)研究”“百年中國(guó)苗學(xué)論著總目編纂與知識(shí)圖譜研究(1917—2016)”等。
(8)信息服務(wù)。第8類簇涵蓋的研究主要是醫(yī)學(xué)視角下的信息服務(wù)。醫(yī)學(xué)信息學(xué)和健康信息學(xué)是近年來的研究熱點(diǎn),旨在滿足公眾對(duì)醫(yī)療健康信息與技術(shù)的需求[12],主要涉及健康信息服務(wù)、健康知識(shí)組織體系、健康信息行為、健康信息檢索、健康信息挖掘、電子病歷、醫(yī)學(xué)知識(shí)管理等內(nèi)容。如,“大眾健康信息服務(wù)體系中公共圖書館參與研究”“面向知識(shí)服務(wù)的健康知識(shí)組織體系構(gòu)建研究”“融合SOR理論的網(wǎng)絡(luò)健康信息搜尋行為與優(yōu)化策略研究”“信息鏈視域下電子病歷數(shù)據(jù)驅(qū)動(dòng)健康服務(wù)供給側(cè)決策的路徑與模式研究”等。
3.2.1 關(guān)鍵詞分析
筆者結(jié)合NSF資助項(xiàng)目的名稱和摘要,利用NLTK進(jìn)行分詞,統(tǒng)計(jì)并繪制了高頻詞Top15水平條形圖(見圖2)。由于項(xiàng)目文本材料中的一些專業(yè)術(shù)語更多是以二元詞組形式出現(xiàn)的,因此筆者通過2-gram方法抽取了二元詞組的高頻詞Top15(見圖3),據(jù)此綜合分析美國(guó)國(guó)家級(jí)基金項(xiàng)目的研究熱點(diǎn)。
圖2 NSF基金項(xiàng)目高頻詞Top15
圖3 NSF基金項(xiàng)目二元高頻詞組Top15
在高頻詞Top15中,“數(shù)據(jù)”(Data)的出現(xiàn)頻率遠(yuǎn)遠(yuǎn)超過了其他關(guān)鍵詞,是美國(guó)國(guó)家級(jí)基金項(xiàng)目研究的重要關(guān)注點(diǎn)。綜合分析可以發(fā)現(xiàn)美國(guó)國(guó)家級(jí)基金項(xiàng)目的分布具有以下特點(diǎn)。
(1)“數(shù)據(jù)科學(xué)”(Data Science)是熱點(diǎn)研究領(lǐng)域。2012年,Davenport T H等發(fā)表文章稱“數(shù)據(jù)科學(xué)家是21世紀(jì)最性感的職業(yè)”[13],該文將數(shù)據(jù)科學(xué)帶入大眾視野,引起了人們的廣泛討論與關(guān)注?!皵?shù)據(jù)科學(xué)”在NSF基金項(xiàng)目中的出現(xiàn)頻率最高,與其相關(guān)聯(lián)的“數(shù)據(jù)收集”(Data Collection)、“數(shù)據(jù)分析”(Data Analysis)、“機(jī)器學(xué)習(xí)”(Machine Learning)等術(shù)語的出現(xiàn)頻次也較高。
(2)研究具有學(xué)科交叉性。在出現(xiàn)頻次較高的關(guān)鍵詞中,“計(jì)算機(jī)科學(xué)”(Computer Science)、“社會(huì)科學(xué)”(Social Science)分別占據(jù)第3位和第9位,為圖情檔學(xué)科呈現(xiàn)出新的研究視角?!吧鐣?huì)媒介”(Social Medium)在詞頻統(tǒng)計(jì)中占據(jù)第2位,也體現(xiàn)了不同領(lǐng)域的交叉融合。
(3)學(xué)生實(shí)踐教育是重要資助項(xiàng)目。與我國(guó)的國(guó)家級(jí)基金資助不同,NSF會(huì)資助學(xué)生參加學(xué)術(shù)研討會(huì)、學(xué)術(shù)會(huì)議、學(xué)校實(shí)踐項(xiàng)目等活動(dòng),“研究生”(Graduate Student)和“博士討論會(huì)”(Doctoral Colloquium)顯示了NSF對(duì)學(xué)生實(shí)踐教育的關(guān)注。
(4)重視數(shù)據(jù)管理及與數(shù)據(jù)相關(guān)的倫理與安全問題?!皵?shù)據(jù)管理”(Data Management)是圖情檔學(xué)科的一項(xiàng)重要研究?jī)?nèi)容,大數(shù)據(jù)的發(fā)展帶來的數(shù)據(jù)倫理和數(shù)據(jù)隱私問題引起了研究者極高的重視,在NSF的圖情檔學(xué)科的基金項(xiàng)目中,“數(shù)據(jù)倫理”(Data Ethic)、“隱私安全”(Privacy Security)、“安全隱私”(Security Privacy)作為高頻詞匯出現(xiàn)。
(5)緊跟時(shí)事,出臺(tái)資助項(xiàng)目較為迅速。NSF資助項(xiàng)目具有一個(gè)突出的特點(diǎn)——與社會(huì)的相關(guān)性較強(qiáng)。2020年,新型冠狀病毒肺炎(Corona Virus Disease 2019,COVID-19)席卷全球,在NSF資助的項(xiàng)目中,筆者檢索到了42項(xiàng)2020年立項(xiàng)的基金,其中有14項(xiàng)與COVID-19直接相關(guān)。
3.2.2 主題分析
筆者利用TF-IDF結(jié)合2-Gram方法提取NSF資助項(xiàng)目的關(guān)鍵詞,并利用k-means算法對(duì)基金項(xiàng)目材料進(jìn)行共詞聚類,判斷出8類最佳聚類簇,每個(gè)類簇的關(guān)鍵詞Top10見表4。
表4 美國(guó)國(guó)家級(jí)基金項(xiàng)目主題聚類
(1)學(xué)生教育。第1類簇的研究主題主要圍繞學(xué)生理論教育與實(shí)踐教育,具體包括科學(xué)、技術(shù)、工程和數(shù)學(xué)教育、學(xué)生學(xué)習(xí)、服務(wù)學(xué)習(xí)、課堂設(shè)置、iConference會(huì)議資助、博士討論會(huì)等。如,雪城大學(xué)連續(xù)兩年申請(qǐng)了NSF基金資助博士參與iConference會(huì)議。
(2)數(shù)據(jù)管理與社群信息學(xué)。第2類簇的研究多與人相關(guān),主要涉及社群信息學(xué)、數(shù)字不平等、計(jì)算機(jī)交互、社會(huì)計(jì)算、數(shù)據(jù)管理等內(nèi)容,是圖情檔學(xué)科與計(jì)算機(jī)科學(xué)和社會(huì)科學(xué)的交叉研究領(lǐng)域。如,“社區(qū)決策的數(shù)據(jù)分析”項(xiàng)目的目的是通過多學(xué)科、多社區(qū)的努力,從社會(huì)技術(shù)視角實(shí)現(xiàn)智慧社區(qū)建設(shè)。
(3)數(shù)據(jù)科學(xué)與數(shù)據(jù)倫理。第3類簇的主題是數(shù)據(jù)科學(xué)以及與之相關(guān)的數(shù)據(jù)倫理問題,該主題主要涉及數(shù)據(jù)科學(xué)、數(shù)據(jù)密集、數(shù)據(jù)驅(qū)動(dòng)、數(shù)據(jù)分析、數(shù)據(jù)倫理等內(nèi)容。如今科學(xué)研究的范式已經(jīng)轉(zhuǎn)向第四科學(xué)范式,即數(shù)據(jù)密集型科學(xué)[14],隨之而來的一系列研究方向值得學(xué)者們深入探索。如,“培養(yǎng)數(shù)據(jù)科學(xué)的倫理:學(xué)術(shù)界和產(chǎn)業(yè)界的挑戰(zhàn)和機(jī)遇”項(xiàng)目旨在通過比較工業(yè)領(lǐng)域和學(xué)生領(lǐng)域的數(shù)據(jù)倫理的狀態(tài)、結(jié)構(gòu)和實(shí)質(zhì),提出提高跨社會(huì)背景和專業(yè)部門數(shù)據(jù)倫理的有效策略。
(4)數(shù)據(jù)安全與隱私。第4類簇的研究主題是數(shù)據(jù)安全與隱私,主要包括數(shù)據(jù)安全、安全設(shè)計(jì)、隱私安全、數(shù)據(jù)隱私、人類行為、數(shù)字素養(yǎng)等。如,“賓夕法尼亞州保障安全的數(shù)據(jù)科學(xué)勞動(dòng)力開發(fā)”項(xiàng)目為年輕專業(yè)人員提供了一種保障安全的數(shù)據(jù)科學(xué)基礎(chǔ)教育模式和課程,以實(shí)現(xiàn)智慧醫(yī)療,提高社會(huì)公益、智慧交通、社會(huì)進(jìn)步、經(jīng)濟(jì)科學(xué)和保證智能分析的安全性。
(5)圖書館與數(shù)據(jù)分析。第5類簇的主題較為多元,包含數(shù)字圖書館、數(shù)據(jù)分析、數(shù)據(jù)驅(qū)動(dòng)、計(jì)算基礎(chǔ)設(shè)施、會(huì)議研討會(huì)等。數(shù)字圖書館可以將各類信息資源存儲(chǔ)為數(shù)字化內(nèi)容,既能方便用戶獲取文獻(xiàn)和信息,也能避免因紙張破損或丟失導(dǎo)致的信息缺失問題。如,“通過項(xiàng)目評(píng)估改善研究問責(zé)制”項(xiàng)目的一個(gè)目的是開發(fā)評(píng)價(jià)系統(tǒng)EASE,使用者可以用其將他們的實(shí)驗(yàn)內(nèi)容上傳并存檔于數(shù)字圖書館中。
(6)數(shù)據(jù)檢索。第6類簇的研究主題是信息檢索,包括多重搜索、聚合搜索、敏感內(nèi)容檢索、檢索系統(tǒng)、搜索引擎等內(nèi)容。如,“用于探索性和協(xié)作性搜索的知識(shí)表示和重用”項(xiàng)目通過分析搜索系統(tǒng)捕獲、共享和重用在搜索過程中開發(fā)知識(shí)的方法,幫助用戶提高檢索質(zhì)量。
(7)信息技術(shù)。第7類簇主要討論了與圖情檔學(xué)科相關(guān)的一些技術(shù)和方法,包括人工智能、機(jī)器學(xué)習(xí)、算法系統(tǒng)、自然語言處理、用戶生成內(nèi)容、網(wǎng)絡(luò)科學(xué)、社會(huì)計(jì)算、計(jì)量經(jīng)濟(jì)學(xué)等內(nèi)容。如,“消費(fèi)者對(duì)安全事件和數(shù)據(jù)泄露通知的響應(yīng)”項(xiàng)目將計(jì)量經(jīng)濟(jì)學(xué)技術(shù)與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,旨在識(shí)別由不良安全事件或違規(guī)通知而導(dǎo)致的用戶行為變化程度。
(8)社交媒體。第8類簇的研究項(xiàng)目圍繞社交媒體展開,具體涉及社會(huì)網(wǎng)絡(luò)、媒體網(wǎng)站、媒體平臺(tái)、輿情監(jiān)督、應(yīng)急事件管理等內(nèi)容。如,“通過社會(huì)媒體的使用,了解在抗災(zāi)能力方面的社會(huì)和地理差異”項(xiàng)目研究了在緊急情況管理的不同階段如何挖掘?qū)崟r(shí)社交媒體數(shù)據(jù),從而分析其中存在的社會(huì)和地理差異。
4.1.1 相同之處
(1)重視圖書館研究。作為數(shù)量眾多、分布廣泛的公共文化機(jī)構(gòu),無論是中國(guó)還是美國(guó)對(duì)圖書館的研究始終熱度不減。物聯(lián)網(wǎng)、云計(jì)算、云服務(wù)等技術(shù)的更新和發(fā)展使得圖書館逐漸轉(zhuǎn)向數(shù)字化和個(gè)性化,圖書館研究也得以不斷推進(jìn),主要集中在數(shù)字圖書館的發(fā)展過程中圖書館本身的建設(shè)和技術(shù)應(yīng)用、圖書館資源的整理和利用、以及圖書館員的培養(yǎng)上。
(2)重視對(duì)大數(shù)據(jù)及數(shù)據(jù)科學(xué)的探討。我們的科學(xué)研究已經(jīng)經(jīng)歷了實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)這三種范式,正在轉(zhuǎn)向數(shù)據(jù)密集型科學(xué)范式。大數(shù)據(jù)時(shí)代催生了“數(shù)據(jù)科學(xué)”這一新興學(xué)科,因此中美兩國(guó)的基金項(xiàng)目中都對(duì)大數(shù)據(jù)問題進(jìn)行了深入探討,如,我國(guó)國(guó)家級(jí)基金項(xiàng)目關(guān)鍵詞中排在第10位的“大數(shù)據(jù)”,NSF基金項(xiàng)目二元高頻詞組排在第1位的“數(shù)據(jù)科學(xué)”。
(3)對(duì)用戶的關(guān)注程度較高?!坝脩簟笔侵忻纼蓢?guó)基金項(xiàng)目中共有的一個(gè)高頻詞,圖情檔學(xué)科的研究主題均呈現(xiàn)出服務(wù)化趨勢(shì)[15],以用戶為中心正是服務(wù)化的前提,因此結(jié)合用戶的需求開展用戶畫像、用戶行為評(píng)價(jià)、用戶行為分析、用戶信息搜索、用戶情感分析、用戶生成內(nèi)容、用戶隱私行為等研究是中美兩國(guó)基金項(xiàng)目的重要組成部分。
4.1.2 不同之處
(1)“信息”與“數(shù)據(jù)”分別是兩國(guó)的研究焦點(diǎn)。從詞頻來看,在我國(guó)國(guó)家級(jí)基金項(xiàng)目關(guān)鍵詞中,“信息”的數(shù)量?jī)H次于“圖書館”;在NSF基金項(xiàng)目高頻詞中,“數(shù)據(jù)”的數(shù)量遠(yuǎn)超其他關(guān)鍵詞。從項(xiàng)目主題來看,我國(guó)國(guó)家級(jí)基金項(xiàng)目中關(guān)于“信息”的主題包括信息資源管理、信息分析、信息服務(wù);NSF基金項(xiàng)目中關(guān)于“數(shù)據(jù)”的主題包括數(shù)據(jù)管理、數(shù)據(jù)科學(xué)與數(shù)據(jù)倫理、數(shù)據(jù)安全與數(shù)據(jù)隱私、數(shù)據(jù)分析。
(2)“古籍文獻(xiàn)整理”是我國(guó)基金項(xiàng)目中的重要研究主題。“古籍文獻(xiàn)整理”在我國(guó)的基金項(xiàng)目研究中占較大比例,而NSF基金項(xiàng)目的研究主題中沒有關(guān)于古籍文獻(xiàn)的內(nèi)容。我國(guó)歷史上各個(gè)朝代都非常重視對(duì)史料的記載與傳承,既有專門的史官記錄本朝代發(fā)生的大事并整理前朝史書,也有民間文人進(jìn)行非官方的記錄。出于對(duì)歷史的研究考證及對(duì)傳統(tǒng)文化保護(hù)的支持,我國(guó)的基金項(xiàng)目對(duì)古籍文獻(xiàn)整理的研究課題給予了眾多資助。
(3)美國(guó)的基金項(xiàng)目對(duì)于大數(shù)據(jù)帶來的衍生問題研究較多。NSF較多地將數(shù)據(jù)安全、數(shù)據(jù)隱私、數(shù)據(jù)倫理等衍生問題納入研究主題范圍。由于我國(guó)對(duì)大數(shù)據(jù)的研究剛剛起步,故仍將研究重點(diǎn)聚焦在大數(shù)據(jù)的技術(shù)與方法、大數(shù)據(jù)在其他學(xué)科的應(yīng)用等與大數(shù)據(jù)本身相關(guān)的問題上,而對(duì)大數(shù)據(jù)衍生問題的探討較少。
(4)美國(guó)的基金項(xiàng)目對(duì)于產(chǎn)業(yè)與實(shí)踐活動(dòng)的資助較多。NSF對(duì)于與學(xué)生培養(yǎng)、教育等主題有關(guān)的項(xiàng)目給予了較多資助,為學(xué)生提供了較多的實(shí)踐項(xiàng)目和科研計(jì)劃,重視從實(shí)踐活動(dòng)中鍛煉學(xué)生的能力,而我國(guó)基金項(xiàng)目的覆蓋范圍幾乎僅限于科研領(lǐng)域。
(1)深入數(shù)據(jù)科學(xué)及其相關(guān)問題的研究。2012年,Davenport T H等在
(《哈佛商業(yè)評(píng)論》)上發(fā)表了《數(shù)據(jù)科學(xué)家——21世紀(jì)最性感的職業(yè)》一文[13],使數(shù)據(jù)科學(xué)進(jìn)入大眾視野。我國(guó)自2014年起,多所學(xué)校開設(shè)了“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè),但目前已有研究和相關(guān)課程設(shè)置較多集中在機(jī)器學(xué)習(xí)和統(tǒng)計(jì)領(lǐng)域,我國(guó)圖情檔學(xué)科對(duì)數(shù)據(jù)科學(xué)與大數(shù)據(jù)的重視程度還不足,與數(shù)據(jù)科學(xué)和大數(shù)據(jù)相關(guān)的數(shù)據(jù)倫理、數(shù)據(jù)安全、數(shù)據(jù)隱私等問題的研究還比較欠缺,對(duì)數(shù)據(jù)科學(xué)及其相關(guān)問題的研究應(yīng)成為日后重要的研究?jī)?nèi)容。大數(shù)據(jù)是情報(bào)學(xué)科的一個(gè)重要研究對(duì)象,隨著數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)的迅猛推進(jìn),其必將深入滲透到圖情檔學(xué)科的相關(guān)領(lǐng)域并為圖情檔學(xué)科發(fā)展帶來新的契機(jī)。
(2)深化人文關(guān)懷。我國(guó)國(guó)家級(jí)基金項(xiàng)目中多是對(duì)信息、數(shù)據(jù)、知識(shí)等資源本身的研究,較少關(guān)注人文關(guān)懷,即對(duì)人、人性、人的精神、文化、生活的關(guān)注和理解。社群信息學(xué)旨在研究與社群/社區(qū)的信息相關(guān)的領(lǐng)域,為數(shù)字時(shí)代信息不平等現(xiàn)象提供解決方案,這是近些年在我國(guó)發(fā)展起來的一個(gè)新興板塊。2019年,中共中央辦公廳和國(guó)務(wù)院辦公廳發(fā)布《數(shù)字鄉(xiāng)村發(fā)展戰(zhàn)略綱要》[16],提出要著力彌合城鄉(xiāng)“數(shù)字鴻溝”,培育信息時(shí)代新農(nóng)民,體現(xiàn)了國(guó)家政策層面對(duì)信息社會(huì)人文關(guān)懷的保障。此外,與用戶相關(guān)的研究體現(xiàn)了圖情檔學(xué)科對(duì)信息用戶的重視,必將在未來的研究中繼續(xù)占據(jù)重要地位。
(3)同時(shí)兼顧信息技術(shù)。除了人文關(guān)懷這樣的“軟研究”,也需要同時(shí)兼顧信息技術(shù)這一圖情檔學(xué)科研究中不可忽視的重要硬性方面。云計(jì)算、物聯(lián)網(wǎng)、機(jī)器學(xué)習(xí)、圖譜挖掘、實(shí)時(shí)計(jì)算、數(shù)據(jù)倉(cāng)庫等信息技術(shù)拓寬和加深了圖情檔學(xué)科的研究廣度和深度,隨著技術(shù)的不斷更迭,學(xué)科研究也須及時(shí)跟上技術(shù)發(fā)展的腳步。
(4)開展社交媒體的相關(guān)研究。社交媒體是人們?nèi)粘I詈蛫蕵分幸粋€(gè)必不可少的平臺(tái),如國(guó)外的Facebook、Twitter、LinkedIn等,國(guó)內(nèi)的微博、貼吧、豆瓣、知乎等,人們通常在這些社交媒體上進(jìn)行信息獲取、信息利用、信息檢索、信息擴(kuò)散等活動(dòng),分析和研究這些信息行為及其動(dòng)因有利于提高用戶體驗(yàn)、實(shí)施個(gè)性化推薦、提高社交媒體的影響力和內(nèi)容質(zhì)量;且社交媒體在對(duì)突發(fā)事件、緊急情況等的應(yīng)對(duì)和管理上也能發(fā)揮有效作用。因此,社交媒體與其他領(lǐng)域的交叉研究是值得研究的一個(gè)方向。此外,與社交媒體相關(guān)的信息安全與隱私也是一個(gè)重要的研究課題。