摘要:分析我國(guó)學(xué)術(shù)出版領(lǐng)域研究現(xiàn)狀,為探索學(xué)術(shù)出版未來(lái)發(fā)展路徑提供借鑒參考。文章通過(guò)在中國(guó)知網(wǎng)獲取學(xué)術(shù)出版相關(guān)期刊文獻(xiàn),采用BERTopic 主題建模方法,對(duì)學(xué)術(shù)出版領(lǐng)域1998—2024年CSSCI 期刊的發(fā)文趨勢(shì)、高產(chǎn)作者、作者合作情況,以及研究主題進(jìn)行梳理總結(jié)。研究發(fā)現(xiàn):學(xué)術(shù)出版領(lǐng)域的發(fā)文數(shù)量保持穩(wěn)定增長(zhǎng)態(tài)勢(shì);高產(chǎn)作者較多,達(dá)到87 名,所屬機(jī)構(gòu)較廣,包括但不限于高校學(xué)院、專業(yè)雜志社、研究所和研究院等;在合作模式方面,學(xué)術(shù)出版領(lǐng)域的作者傾向于通過(guò)團(tuán)隊(duì)合作進(jìn)行研究和發(fā)表論文,已形成較為穩(wěn)定的社團(tuán)關(guān)系;研究主要圍繞開(kāi)放獲取與開(kāi)放科學(xué)、學(xué)術(shù)出版?zhèn)惱砼c版權(quán)保護(hù)、科技期刊評(píng)價(jià)與指標(biāo)、人工智能與智慧出版、出版國(guó)際化、圖書(shū)館學(xué)術(shù)出版服務(wù)、學(xué)術(shù)期刊出版數(shù)字化轉(zhuǎn)型、數(shù)據(jù)出版等八個(gè)方面展開(kāi),人工智能與智慧出版成為學(xué)界關(guān)注的熱點(diǎn)話題。展望未來(lái),智能體技術(shù)的引入將顯著提升學(xué)術(shù)出版流程效率,大語(yǔ)言模型則有望推動(dòng)學(xué)術(shù)出版研究朝著跨學(xué)科方向深入發(fā)展。
關(guān)鍵詞:學(xué)術(shù)出版;科技出版;人工智能;智慧出版;研究綜述;BERTopic
DOI:10.19619/j.issn.1007-1938.2025.00.007
作者單位:上海理工大學(xué)出版學(xué)院
引文格式:李文科,鐘子琪,叢挺. 基于BERTopic模型的我國(guó)學(xué)術(shù)出版研究主題與趨勢(shì)展望[J]. 出版與印刷,2025(1):57-71.
一、引言
學(xué)術(shù)出版是以推進(jìn)科研、探究學(xué)問(wèn)、弘揚(yáng)學(xué)術(shù)、傳播新知為根本宗旨,以學(xué)術(shù)著作、學(xué)術(shù)論文等為基本形式,以學(xué)術(shù)成果發(fā)布、展示、傳播以及交流為基本內(nèi)容,遵守出版管理規(guī)定與學(xué)術(shù)規(guī)范,涵蓋社會(huì)科學(xué)與自然科學(xué)范疇的一種出版形態(tài)。[1] 作為科研成果傳播和知識(shí)生產(chǎn)的關(guān)鍵環(huán)節(jié),學(xué)術(shù)出版在推動(dòng)國(guó)家科技創(chuàng)新能力提升和增強(qiáng)國(guó)際競(jìng)爭(zhēng)力方面發(fā)揮著至關(guān)重要的作用。它不僅是科研成果轉(zhuǎn)化為實(shí)際生產(chǎn)力的重要媒介,更是促進(jìn)學(xué)術(shù)交流、推動(dòng)科技進(jìn)步的關(guān)鍵驅(qū)動(dòng)力。黨的二十大報(bào)告指出,高質(zhì)量發(fā)展是全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家的首要任務(wù)。在當(dāng)前全球科技競(jìng)爭(zhēng)日益激烈的背景下,高質(zhì)量的學(xué)術(shù)出版對(duì)于提升國(guó)家的科研競(jìng)爭(zhēng)力和創(chuàng)新能力具有深遠(yuǎn)影響。
近二十年來(lái),在多重因素作用下我國(guó)學(xué)術(shù)出版發(fā)展日新月異,以數(shù)字化轉(zhuǎn)型、集團(tuán)化改革、國(guó)際化發(fā)展為主要方向的學(xué)術(shù)出版轉(zhuǎn)型持續(xù)推進(jìn),與此同時(shí)全球范圍內(nèi)的開(kāi)放科學(xué)運(yùn)動(dòng)促進(jìn)了本土學(xué)術(shù)出版的開(kāi)放化進(jìn)程,而大數(shù)據(jù)、區(qū)塊鏈與人工智能技術(shù)的興起則對(duì)學(xué)術(shù)出版帶來(lái)顛覆性挑戰(zhàn)。作為學(xué)術(shù)出版實(shí)踐發(fā)展的理論支撐,學(xué)術(shù)出版研究本身亦呈現(xiàn)出高度多元復(fù)雜態(tài)勢(shì),亟須通過(guò)系統(tǒng)地梳理以揭示其整體性脈絡(luò),從而為探索學(xué)術(shù)出版未來(lái)發(fā)展路徑提供借鑒參考。
當(dāng)前,在學(xué)術(shù)出版研究綜述領(lǐng)域,國(guó)內(nèi)一些學(xué)者采用CiteSpace 計(jì)量統(tǒng)計(jì)軟件或其他量化分析方法對(duì)該領(lǐng)域的期刊文獻(xiàn)進(jìn)行關(guān)鍵詞分析與主題聚類研究,張建中[2] 基于Webof Science 數(shù)據(jù),通過(guò)關(guān)鍵詞共現(xiàn)和文獻(xiàn)共被引分析,揭示了國(guó)際學(xué)術(shù)出版近十年的研究熱點(diǎn)與趨勢(shì),將研究主題歸納為掠奪性出版、替代計(jì)量學(xué)、開(kāi)放獲取出版等六個(gè)方面;王維嘉等[3] 利用PQDT 數(shù)據(jù)庫(kù)和CNKI 學(xué)位論文平臺(tái),對(duì)國(guó)內(nèi)外學(xué)術(shù)出版領(lǐng)域的學(xué)位論文進(jìn)行了主題和關(guān)鍵詞的定量比較分析,探討國(guó)內(nèi)外學(xué)術(shù)出版發(fā)展差異,為國(guó)內(nèi)學(xué)術(shù)出版發(fā)展提供了建議;叢挺等[4] 基于中國(guó)知網(wǎng)數(shù)據(jù)庫(kù),采用共詞分析方法,梳理了國(guó)內(nèi)學(xué)術(shù)出版領(lǐng)域十年來(lái)的主題演變。還有部分學(xué)者從定性角度對(duì)學(xué)術(shù)出版的發(fā)展脈絡(luò)進(jìn)行了分析梳理 。[5?7] 然而,整體上現(xiàn)有學(xué)術(shù)出版研究呈現(xiàn)出碎片化特征,針對(duì)該領(lǐng)域系統(tǒng)綜述的研究相對(duì)匱乏,使得研究者往往陷于“樹(shù)木”而不見(jiàn)“森林”,難以全面把握學(xué)術(shù)出版的整體發(fā)展現(xiàn)狀。在方法應(yīng)用層面,基于關(guān)鍵詞頻率統(tǒng)計(jì)的傳統(tǒng)綜述方法在進(jìn)行文獻(xiàn)主題分析時(shí),往往難以精確捕捉和表征研究?jī)?nèi)容中的細(xì)微且關(guān)鍵的語(yǔ)義細(xì)節(jié)。這些局限性使得我們難以深入理解學(xué)術(shù)出版研究的內(nèi)在聯(lián)系和演進(jìn)趨勢(shì)。
鑒于此,本研究選擇采用BERTopic 主題模型對(duì)國(guó)內(nèi)學(xué)術(shù)出版領(lǐng)域的研究現(xiàn)狀、主題趨勢(shì)展開(kāi)綜述。BERTopic 作為一種先進(jìn)的深度學(xué)習(xí)模型,能夠更好地理解和處理文本的語(yǔ)義信息,從而克服傳統(tǒng)關(guān)鍵詞分析方法的局限性。通過(guò)深入主題語(yǔ)義關(guān)系層面進(jìn)行綜述,可以更全面地揭示學(xué)術(shù)出版研究中主題結(jié)構(gòu)和主題間的潛在關(guān)聯(lián),整合分析當(dāng)下學(xué)術(shù)出版領(lǐng)域的各類研究方向,為學(xué)術(shù)出版的未來(lái)發(fā)展提供參考和啟示。
二、研究設(shè)計(jì)
1. 研究思路
本研究的研究思路如圖1 所示。首先,通過(guò)在中國(guó)知網(wǎng)檢索相關(guān)論文導(dǎo)出其題錄信息做數(shù)據(jù)清洗,剔除無(wú)關(guān)信息后將論文的摘要數(shù)據(jù)作為文檔嵌入,向量嵌入模型選擇“gte-base-zh”,通過(guò)使用UMAP(uniformmanifold approximation and projection)降維以及HDBSCAN 聚類方法得到文檔的“主題—詞分布”結(jié)果,使用KeyBERTInspired 以及maximal marginal relevance(最大邊際相關(guān)性,英文縮寫MMR)作為主題微調(diào)模型。借助BERTopic 內(nèi)置的動(dòng)態(tài)主題建模(dynamic topicmodel,英文縮寫DTM)獲得主題演化趨勢(shì)結(jié)果。其次,使用Python 將導(dǎo)出的題錄信息中的作者列數(shù)據(jù)構(gòu)建共現(xiàn)矩陣,將其導(dǎo)入Gephi可視化軟件中生成作者合作網(wǎng)絡(luò)。
2. 數(shù)據(jù)來(lái)源與數(shù)據(jù)處理
一般而言,學(xué)術(shù)出版是以遵守學(xué)術(shù)規(guī)范為前提,以傳播科學(xué)研究與學(xué)術(shù)成果為宗旨,以學(xué)術(shù)著作和學(xué)術(shù)論文為基本形式的一種出版活動(dòng)。[8] 通常情況下,學(xué)術(shù)出版涵蓋了學(xué)術(shù)圖書(shū)出版和學(xué)術(shù)期刊出版。在預(yù)實(shí)驗(yàn)階段發(fā)現(xiàn),將“學(xué)術(shù)期刊”作為檢索關(guān)鍵詞會(huì)導(dǎo)致主題建模結(jié)果出現(xiàn)顯著的主題偏差和噪聲。而科技出版與學(xué)術(shù)出版兩個(gè)概念雖然同樣具有一定包含關(guān)系,但前者主要指向以科技期刊和科技圖書(shū)為主的出版,后者則泛指包含人文社科在內(nèi)的出版活動(dòng),兩者檢索結(jié)果的重合度較低?;诖?,本研究采用更為合理的檢索策略,將關(guān)鍵詞定位于學(xué)術(shù)出版本體及與其密切關(guān)聯(lián)的科技出版領(lǐng)域,并以中國(guó)知網(wǎng)期刊全文數(shù)據(jù)庫(kù)作為核心數(shù)據(jù)源進(jìn)行實(shí)證研究。通過(guò)構(gòu)建檢索策略:TS =(主題:學(xué)術(shù)出版)OR(主題:科技出版),同時(shí)限定文獻(xiàn)類型為期刊論文、期刊來(lái)源設(shè)定為《中文社會(huì)科學(xué)引文索引》(簡(jiǎn)稱CSSCI),經(jīng)查詢過(guò)濾,發(fā)現(xiàn)我國(guó)最早涉及學(xué)術(shù)出版的研究論文發(fā)表于1998 年,因此本研究以1998 年為檢索起始點(diǎn),時(shí)間范圍設(shè)定為1998 年1 月至2024 年5 月,共篩選出期刊論文3243 篇。通過(guò)導(dǎo)出文獻(xiàn)的標(biāo)題、作者、期刊名稱及被引次數(shù)等關(guān)鍵信息,人工排除重復(fù)條目,剔除非研究性內(nèi)容(如通知、會(huì)議紀(jì)要等),并針對(duì)摘要進(jìn)行數(shù)據(jù)清洗(移除版權(quán)聲明、圖書(shū)館情報(bào)類等無(wú)關(guān)信息) , 最終剩余有效文獻(xiàn)2164 篇。
3. 研究方法
本研究使用BERTopic 進(jìn)行主題建模,BERTopic 是基于BERT(bidirectional" encoderrepresentations from transformers)詞向量的主題建模技術(shù),它利用BERT 嵌入、統(tǒng)一面域逼近和UMAP 降維、HDBSCAN 聚類算法來(lái)創(chuàng)建密集的集群,輕松解釋主題并在主題中保留重要詞。[9]在傳統(tǒng)主題建模領(lǐng)域,潛在狄利克雷分配(latent dirichlet allocation,英文縮寫LDA)模型占據(jù)著核心地位。然而,LDA模型在處理文本數(shù)據(jù)時(shí),往往將文本簡(jiǎn)化為詞的無(wú)序集合,從而忽視了詞匯間的序列關(guān)系及其上下文信息,這種簡(jiǎn)化在一定程度上限制了模型對(duì)文本深層語(yǔ)義的捕捉能力。隨著B(niǎo)ERT詞向量技術(shù)的興起,其為文本分析領(lǐng)域帶來(lái)了新的視角。BERT 詞向量技術(shù)通過(guò)雙向transformer模型捕獲詞匯的上下文信息,從而為文本中的每個(gè)詞賦予更為豐富和精確的語(yǔ)義。BERTopic模型能夠直接利用BERT 詞向量進(jìn)行文本表示,從而避免了傳統(tǒng)文本主題建模中去除停用詞這一煩瑣且必要的預(yù)處理步驟。這種方法不僅提高了模型對(duì)文本語(yǔ)義的理解精度,同時(shí)也顯著提升了主題建模的效率。鑒于BERTopic 在文本主題建模方面的這些優(yōu)勢(shì),本文將采用BERTopic 模型作為分析工具,對(duì)相關(guān)文獻(xiàn)進(jìn)行深入分析。
三、研究現(xiàn)狀
1. 發(fā)文趨勢(shì)分析
圖2為1998—2024年學(xué)術(shù)出版領(lǐng)域CSSCI期刊發(fā)文量。根據(jù)其發(fā)文量數(shù)據(jù),可將學(xué)術(shù)出版領(lǐng)域的發(fā)展趨勢(shì)劃分為三個(gè)顯著的階段。①初始發(fā)展階段(1998—2010年):在這一時(shí)期,學(xué)術(shù)出版領(lǐng)域的文獻(xiàn)發(fā)表數(shù)量相對(duì)較低,顯示出研究尚處于起步和發(fā)展的初期。②快速增長(zhǎng)階段(2011—2019年):此階段的發(fā)文量呈現(xiàn)出逐年穩(wěn)定增長(zhǎng)的趨勢(shì)。從2011年的80篇逐漸上升至2019年的186篇,表明學(xué)術(shù)出版領(lǐng)域研究正在逐漸成熟,吸引了更多學(xué)者的參與。③振蕩調(diào)整階段(2020—2024 年):自2020年起,該領(lǐng)域的發(fā)文量呈現(xiàn)出波動(dòng)調(diào)整的趨勢(shì)。盡管整體上發(fā)文量有所增長(zhǎng),但其間出現(xiàn)了明顯的數(shù)量下跌。推測(cè)這一現(xiàn)象可能與新冠疫情導(dǎo)致的實(shí)驗(yàn)室和研究機(jī)構(gòu)關(guān)閉或活動(dòng)受限有關(guān),這些因素可能引發(fā)研究進(jìn)程的放緩,進(jìn)而對(duì)學(xué)術(shù)論文的產(chǎn)出量造成一定影響??傮w而言,學(xué)術(shù)出版領(lǐng)域文獻(xiàn)的數(shù)量呈現(xiàn)穩(wěn)步增長(zhǎng)態(tài)勢(shì)。
2. 高產(chǎn)作者分析
在所屬機(jī)構(gòu)方面,國(guó)內(nèi)學(xué)術(shù)出版領(lǐng)域的高產(chǎn)發(fā)文作者分布在不同的學(xué)術(shù)機(jī)構(gòu)和研究單位,具有廣泛的代表性,包括長(zhǎng)安大學(xué)人文學(xué)院、中華醫(yī)學(xué)會(huì)雜志社,以及武漢大學(xué)數(shù)字出版研究所和信息管理學(xué)院等。這些作者所屬的機(jī)構(gòu)包括但不限于高校學(xué)院、專業(yè)雜志社、研究所和研究院等,涵蓋了從理論研究到實(shí)踐應(yīng)用的多個(gè)層面。此外,部分作者來(lái)自同一機(jī)構(gòu),如中華醫(yī)學(xué)會(huì)雜志社的劉冰、沈錫賓和魏均民等,反映了該機(jī)構(gòu)在學(xué)術(shù)出版領(lǐng)域的集中優(yōu)勢(shì)和特色研究方向。從所屬機(jī)構(gòu)的性質(zhì)來(lái)看,這些作者大多有出版、信息管理、數(shù)字技術(shù)等相關(guān)的學(xué)科背景,這與他們的研究方向和成果產(chǎn)出緊密相關(guān)。
3. 作者合作分析
使用Python將題錄信息中的作者列導(dǎo)出為共現(xiàn)矩陣表,將共現(xiàn)矩陣表導(dǎo)入Gephi可視化軟件中,使用Fruchterman Reingold算法進(jìn)行圖布局,運(yùn)用濾波發(fā)現(xiàn)網(wǎng)絡(luò)分割社團(tuán),將作者共現(xiàn)合著網(wǎng)絡(luò)分割后得到101個(gè)社團(tuán)。使用K-Core算法進(jìn)行網(wǎng)絡(luò)過(guò)濾以呈現(xiàn)聯(lián)系度較高的社團(tuán),設(shè)置K 核數(shù)為2來(lái)選定網(wǎng)絡(luò)中所有節(jié)點(diǎn)度數(shù)至少為2 的最大子圖,生成圖3作者合作網(wǎng)絡(luò)關(guān)系圖。Gephi統(tǒng)計(jì)軟件顯示,此時(shí)導(dǎo)入的節(jié)點(diǎn)有333個(gè)(N=333),邊有336條(E=336)。各節(jié)點(diǎn)的平均度為2.024,表明每個(gè)節(jié)點(diǎn)平均與2 個(gè)其他節(jié)點(diǎn)相連;平均加權(quán)度為5.337,反映了節(jié)點(diǎn)之間連接的強(qiáng)度。網(wǎng)絡(luò)直徑為5,說(shuō)明網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)之間的最長(zhǎng)路徑為5 步; 網(wǎng)絡(luò)密度( density) 為0.006,表明網(wǎng)絡(luò)中的連接較為稀疏;模塊化為0.956,說(shuō)明網(wǎng)絡(luò)中存在較為明顯的社區(qū)結(jié)構(gòu);平均聚類系數(shù)為0.757,表明節(jié)點(diǎn)之間具有較強(qiáng)的聚類傾向;平均路徑長(zhǎng)度為1.579,說(shuō)明節(jié)點(diǎn)之間的信息傳遞效率較高。然而,盡管網(wǎng)絡(luò)具有一定的聚類性和信息傳遞效率,其較低的密度和較小的平均度表明節(jié)點(diǎn)之間的連接較為有限,科研合作尚未形成廣泛且緊密的網(wǎng)絡(luò)結(jié)構(gòu)。因此,可以認(rèn)為該領(lǐng)域暫未形成高影響力的科研合作群體。但也從側(cè)面反映了作者間的合作網(wǎng)絡(luò)正在逐漸形成,還有待加強(qiáng)和完善。
圖中的節(jié)點(diǎn)大小代表某一作者的直接關(guān)聯(lián)節(jié)點(diǎn)數(shù),而節(jié)點(diǎn)間的連線粗細(xì)則反映了作者間的合作頻次。在合作模式方面,學(xué)術(shù)出版領(lǐng)域的作者傾向于通過(guò)團(tuán)隊(duì)合作進(jìn)行研究和發(fā)表論文,形成了較為穩(wěn)定的社團(tuán)關(guān)系,例如,社團(tuán)一:魏均民、劉紅霞、沈錫賓、王海娟、李鵬、趙巍等;社團(tuán)二:路文如、程維紅、任勝利、嚴(yán)謹(jǐn)、王應(yīng)寬、方梅;社團(tuán)三:徐麗芳、叢挺、周伊、鄒青、羅婷、田崢崢等。
四、主題分析
1. 研究主題識(shí)別
本文采用BERTopic 進(jìn)行主題建模,識(shí)別學(xué)術(shù)出版領(lǐng)域的研究主題與研究方向。具體參數(shù)設(shè)置如下:①文檔向量嵌入選擇“gtebase-zh”模型;②向量降維采取UMAP 算法,經(jīng)筆者多次實(shí)驗(yàn),確定參數(shù)設(shè)置為最近鄰數(shù)(n_neighbors)為10,投影后的維數(shù)(n_components)為5,點(diǎn)之間的最小距離( min_dist)為0,空間距離計(jì)算方法(metrics)采用余弦相似度(cosine)。③聚類方法采取HDBSCAN 聚類,將nr_topics 設(shè)置為“auto”,由模型自主決定聚類數(shù)量。④主題表示模型,采取KeyBERTInspired與MMR相結(jié)合的表示方式,KeyBERT 是一個(gè)關(guān)鍵詞提取工具,它結(jié)合了BERT 模型和關(guān)鍵詞提取技術(shù),KeyBERTInspired基于KeyBERT 并優(yōu)化了推理速度。相比于C-TF-IDF 僅計(jì)算詞在整個(gè)文檔集合中出現(xiàn)的頻率來(lái)進(jìn)行主題詞表示,KeyBERTInspired使用BERT 嵌入和簡(jiǎn)單的余弦相似性來(lái)查找文檔中與文檔本身最相似的子短語(yǔ),更深層次地理解了文本的語(yǔ)義結(jié)構(gòu),使得抽取出的關(guān)鍵詞更加精準(zhǔn)和富有代表性。MMR 能夠在保持主題詞一致性的同時(shí),揭示同一主題內(nèi)部的多樣化表達(dá),并有助于發(fā)掘更多潛在的主題詞,從而促進(jìn)對(duì)跨領(lǐng)域研究?jī)?nèi)容的探索。通過(guò)調(diào)整MMR 中的diversity(多樣性)參數(shù),可以控制主題詞的多樣性程度:當(dāng)該參數(shù)值接近1 時(shí),所生成的主題詞表現(xiàn)出更高的多樣性;而當(dāng)其接近0 時(shí),則主題詞更加集中于核心話題。基于此,為了確保在圍繞核心話題展開(kāi)討論的同時(shí),仍能獲得相對(duì)豐富的主題詞集合,本研究將MMR 的多樣性參數(shù)設(shè)定為0.3。這一設(shè)置旨在平衡主題聚焦性與主題詞的多樣性,以期達(dá)到更全面的研究視角。研究將主要依據(jù)KeyBERTInspired的主題詞,并結(jié)合MMR 主題詞的分析結(jié)果,通過(guò)人工概括與抽象過(guò)程,為每一個(gè)主題簇定義相應(yīng)的主題標(biāo)簽。人工概括并抽象出每一個(gè)主題簇對(duì)應(yīng)的主題標(biāo)簽。結(jié)果見(jiàn)表2。
表2 顯示,Topic 0涵蓋學(xué)術(shù)出版、數(shù)字化和增強(qiáng)出版,歸納為學(xué)術(shù)期刊數(shù)字化出版;Topic 1涉及科技期刊、科技圖書(shū)及出版社等,關(guān)注科技圖書(shū)出版創(chuàng)新;Topic 2聚焦開(kāi)放科學(xué),關(guān)鍵詞包括開(kāi)放獲取和同行評(píng)議等;Topic 3關(guān)注高校圖書(shū)館的學(xué)術(shù)服務(wù)能力建設(shè),涉及學(xué)術(shù)交流與知識(shí)服務(wù)模式等;Topic 4 圍繞人工智能與生成式人工智能在學(xué)術(shù)出版中的應(yīng)用;Topic 5和Topic 6聚焦學(xué)術(shù)出版的國(guó)際化,探討中國(guó)國(guó)際學(xué)術(shù)話語(yǔ)體系及科技期刊的國(guó)際化與推廣;Topic 7討論學(xué)術(shù)期刊開(kāi)放獲取模式,關(guān)鍵詞包括掠奪性期刊與開(kāi)放存取等;Topic 8探討學(xué)術(shù)出版領(lǐng)域的倫理規(guī)范建設(shè),涉及學(xué)術(shù)不端與倫理問(wèn)題;Topic 9聚焦學(xué)術(shù)期刊數(shù)字化轉(zhuǎn)型,關(guān)鍵詞有優(yōu)先與網(wǎng)絡(luò)首發(fā)等;Topic 10圍繞科技期刊的專題策劃出版;Topic 11 關(guān)注科技數(shù)據(jù)共享與出版管理,關(guān)鍵詞有數(shù)據(jù)共享與倉(cāng)儲(chǔ)等;Topic 12聚焦科技期刊引用分析;Topic 13 關(guān)注科技期刊集團(tuán)化運(yùn)營(yíng)管理;Topic 14討論學(xué)術(shù)出版項(xiàng)目資助管理,關(guān)鍵詞有基金與資助等;Topic 15關(guān)注高校學(xué)報(bào)數(shù)字化出版變革。
圖4為研究主題的層次聚類結(jié)構(gòu)。層次聚類是一種無(wú)監(jiān)督學(xué)習(xí)方法,通過(guò)遞歸地對(duì)數(shù)據(jù)點(diǎn)進(jìn)行合并,將數(shù)據(jù)點(diǎn)分組為一系列嵌套簇。每個(gè)數(shù)據(jù)點(diǎn)最初被看作是一個(gè)單獨(dú)的簇,然后通過(guò)計(jì)算相似度或距離逐步合并成更大的簇。在圖4 中,橫軸表示不同簇之間的距離或不相似性程度,縱軸列出了各個(gè)數(shù)據(jù)點(diǎn)或簇。隨著向右移動(dòng),簇間的距離逐漸增加,表明它們之間的差異變大。在距離約0.8處形成最終的兩個(gè)主要類簇,第一個(gè)主類簇包含類目15至類目9(從上往下),顯示這些類目間具有較強(qiáng)的相似性;第二個(gè)主類簇包含類目12、10與14,這三個(gè)類目直到較高的距離值才與其他類簇合并,表明這些層次的類目與其他類目的差異性較大。
結(jié)合表2 的數(shù)據(jù),從圖4 聚類結(jié)構(gòu)的整體特征來(lái)看:①學(xué)術(shù)期刊_學(xué)術(shù)_學(xué)術(shù)出版(類目0)與科技_科技圖書(shū)_競(jìng)爭(zhēng)力(類目1)作為傳統(tǒng)核心節(jié)點(diǎn),與走出去_話語(yǔ)_中國(guó)(類目5)、人工智能_AI_ChatGPT(類目4)等新興主題形成了緊密的關(guān)聯(lián)集群。這種關(guān)聯(lián)模式反映了傳統(tǒng)出版范式向數(shù)字智能范式轉(zhuǎn)型的發(fā)展趨勢(shì);②在開(kāi)放獲取(類目2)領(lǐng)域,通過(guò)與圖書(shū)館服務(wù)(類目3)、數(shù)據(jù)出版(類目11)等主題的深度融合,形成開(kāi)放數(shù)據(jù)驅(qū)動(dòng)的出版服務(wù)創(chuàng)新生態(tài);③圖書(shū)館學(xué)術(shù)出版服務(wù)(類目3)與開(kāi)放科學(xué)實(shí)踐(類目2、類目7)、數(shù)據(jù)出版服務(wù)(類目11)等多個(gè)維度形成了緊密的聚類關(guān)聯(lián),這種結(jié)構(gòu)特征預(yù)示著機(jī)構(gòu)知識(shí)服務(wù)正在經(jīng)歷從傳統(tǒng)資源管理向創(chuàng)新服務(wù)轉(zhuǎn)型的范式轉(zhuǎn)換;④出版?zhèn)惱砼c版權(quán)保護(hù)(類目8)和數(shù)字化轉(zhuǎn)型(類目9)之間形成的顯著關(guān)聯(lián),凸顯了區(qū)塊鏈、智能合約等新興技術(shù)的引入,正在重構(gòu)學(xué)術(shù)出版的倫理治理體系;⑤在科技期刊評(píng)價(jià)與指標(biāo)體系方面,聚類分析顯示科技期刊(類目10)與指標(biāo)評(píng)價(jià)(類目12)形成了相互支撐的關(guān)聯(lián)結(jié)構(gòu)。這一關(guān)聯(lián)特征在一定程度上反映了當(dāng)前學(xué)術(shù)評(píng)價(jià)體系的演進(jìn)趨勢(shì),即評(píng)價(jià)方式正從傳統(tǒng)的單一引文計(jì)量,逐步向多源數(shù)據(jù)融合的綜合評(píng)價(jià)模式轉(zhuǎn)變。
綜上所述,為了清晰劃分學(xué)術(shù)出版領(lǐng)域當(dāng)前的主要研究問(wèn)題,我們對(duì)原始的主題簇進(jìn)行刪除與合并,主題2與主題7都聚焦于開(kāi)放獲取與開(kāi)放科學(xué)的討論,因此可以歸為一類主題;主題10、主題12大多在探討科技期刊的相關(guān)話題,因此可以進(jìn)行主題合并;主題5、主題6 聚焦于出版國(guó)際化相關(guān)的討論,可以歸為一類主題;主題0、主題9分別圍繞學(xué)術(shù)出版核心議題及期刊數(shù)字化轉(zhuǎn)型等內(nèi)容,可以合并為一類主題。參照以上數(shù)據(jù),經(jīng)過(guò)人工去除無(wú)關(guān)主題以及合并集群數(shù)量較少及相似主題,如主題13、主題14、主題15 呈現(xiàn)出相對(duì)較低的聚類密度,其討論內(nèi)容與學(xué)術(shù)研究領(lǐng)域的相關(guān)性較弱,故予以剔除;主題1包含科技圖書(shū)等相關(guān)詞匯,經(jīng)數(shù)據(jù)檢查發(fā)現(xiàn)實(shí)際有效文獻(xiàn)數(shù)較少,大部分文獻(xiàn)為述評(píng)類文章,因此不納入最終主題匯總。最后,我們把我國(guó)學(xué)術(shù)出版領(lǐng)域1998—2024 年發(fā)表的論文劃分為“開(kāi)放獲取與開(kāi)放科學(xué)”“學(xué)術(shù)出版?zhèn)惱砼c版權(quán)保護(hù)”“科技期刊評(píng)價(jià)與指標(biāo)”等八個(gè)研究方向,具體如表3所示。
2. 研究趨勢(shì)
使用BERTopic內(nèi)置的動(dòng)態(tài)主題建模進(jìn)行演化趨勢(shì)圖的繪制,經(jīng)筆者多次調(diào)試,設(shè)置參數(shù)nr_bins=20,evolution_tuning=False,global_tuning=False能確保主題詞更準(zhǔn)確地反映階段性的主題演化。結(jié)果如圖5所示:呈現(xiàn)了八個(gè)主題隨時(shí)間的發(fā)文頻次變化,這些變化能夠反映各主題隨時(shí)間的演化過(guò)程,T-7作為學(xué)術(shù)出版領(lǐng)域的核心討論話題發(fā)文量較多,因此對(duì)坐標(biāo)軸比例進(jìn)行適當(dāng)調(diào)整以方便研究者準(zhǔn)確把握該領(lǐng)域的發(fā)展動(dòng)態(tài)與演變規(guī)律。從整體的發(fā)文趨勢(shì)而言,學(xué)術(shù)出版領(lǐng)域各個(gè)主題在近些年基本呈現(xiàn)穩(wěn)步增長(zhǎng)的態(tài)勢(shì)。
基于前述所劃分的時(shí)間段進(jìn)行深入分析,可以觀察到1998—2010年,T-1(開(kāi)放獲取與開(kāi)放科學(xué))、T-3(科技期刊評(píng)價(jià)與指標(biāo))、T-7(學(xué)術(shù)期刊出版數(shù)字化轉(zhuǎn)型)這三個(gè)領(lǐng)域率先起步,并在該時(shí)期末尾呈現(xiàn)出顯著的文獻(xiàn)發(fā)表高峰。與此同時(shí),T-2(學(xué)術(shù)出版?zhèn)惱砼c版權(quán)保護(hù))和T-5(出版國(guó)際化)相關(guān)主題雖已嶄露頭角,但未深入探討。2011—2019年,T-2(學(xué)術(shù)出版?zhèn)惱砼c版權(quán)保護(hù))、T-6(圖書(shū)館學(xué)術(shù)出版服務(wù))及T-8(數(shù)據(jù)出版)領(lǐng)域的論文發(fā)表數(shù)量顯著增多。2020年后,T-4(人工智能與智慧出版)和T-5(出版國(guó)際化)領(lǐng)域的文獻(xiàn)發(fā)表量呈明顯上升趨勢(shì),進(jìn)一步反映了學(xué)術(shù)界對(duì)這些新興領(lǐng)域的關(guān)注度不斷提高。綜合來(lái)看,學(xué)術(shù)出版領(lǐng)域相關(guān)研究主題的熱度仍然保持上升態(tài)勢(shì),尤其是在全球開(kāi)放獲取運(yùn)動(dòng)和人工智能技術(shù)迅速發(fā)展的背景下,相關(guān)研究的廣度與深度均得到了顯著拓展。
以下是對(duì)八大主題的具體分析。
(1)開(kāi)放獲取與開(kāi)放科學(xué)
開(kāi)放科學(xué)運(yùn)動(dòng)的核心是開(kāi)放獲取,開(kāi)放獲取模式允許學(xué)術(shù)成果免費(fèi)在線訪問(wèn)。中國(guó)的制度優(yōu)勢(shì)和龐大的科研產(chǎn)出為開(kāi)放科學(xué)的發(fā)展提供了強(qiáng)有力的條件,這使得中國(guó)在開(kāi)放科學(xué)領(lǐng)域已經(jīng)初具規(guī)模。[11] 但在學(xué)術(shù)出版方面,中國(guó)學(xué)術(shù)期刊在開(kāi)放科學(xué)實(shí)踐中存在一些問(wèn)題,例如多元出版格局尚未建立、重傳播渠道建設(shè)輕知識(shí)內(nèi)容服務(wù)、開(kāi)放同行評(píng)議任重道遠(yuǎn)等。
(2)學(xué)術(shù)出版?zhèn)惱砼c版權(quán)保護(hù)
近年來(lái),學(xué)術(shù)不端行為如重復(fù)發(fā)表、抄襲剽竊和一稿多投等問(wèn)題依然存在,并且對(duì)學(xué)術(shù)期刊的可持續(xù)發(fā)展構(gòu)成了威脅。[12] 為了應(yīng)對(duì)這一問(wèn)題,許多學(xué)術(shù)期刊制定了嚴(yán)格的出版?zhèn)惱硪?guī)范,要求作者、審稿人和編輯在出版過(guò)程中遵循道德規(guī)范和行為準(zhǔn)則,以防范和預(yù)警學(xué)術(shù)不端行為的發(fā)生。[13] 在版權(quán)保護(hù)方面,隨著開(kāi)放獲取出版模式的興起,學(xué)術(shù)期刊面臨著如何平衡版權(quán)保護(hù)與知識(shí)傳播的挑戰(zhàn)。開(kāi)放獲取期刊的著作權(quán)協(xié)議存在諸多問(wèn)題,如未明確著作權(quán)轉(zhuǎn)讓范圍、協(xié)議生效和失效方式不合理等。因此,完善著作權(quán)協(xié)議,避免可能存在的糾紛成為當(dāng)務(wù)之急。[14]此外,新興技術(shù)如區(qū)塊鏈在版權(quán)保護(hù)中的應(yīng)用也作為解決數(shù)字版權(quán)保護(hù)失衡的一種可能方案被提出。通過(guò)增強(qiáng)學(xué)術(shù)出版相關(guān)主體的版權(quán)意識(shí),推進(jìn)區(qū)塊鏈技術(shù)的落地及版權(quán)保護(hù)標(biāo)準(zhǔn)的統(tǒng)一,可以有效應(yīng)對(duì)數(shù)字化轉(zhuǎn)型帶來(lái)的版權(quán)挑戰(zhàn)。[15]141
(3)科技期刊評(píng)價(jià)與指標(biāo)
當(dāng)前的科技期刊評(píng)價(jià)體系主要由數(shù)據(jù)庫(kù)主導(dǎo),但這種體系存在不足,如量化指標(biāo)被過(guò)度推崇和人為操縱,以及中外科技期刊未被同質(zhì)等效使用。[16] 一些期刊通過(guò)過(guò)度自引或人為操控載文量來(lái)提高其影響因子,從而在評(píng)價(jià)體系中獲得更高的排名。這種行為不僅扭曲了學(xué)術(shù)評(píng)價(jià)的公平性,還可能誤導(dǎo)學(xué)術(shù)界對(duì)某些研究成果的重視程度。[17] 隨著開(kāi)放科學(xué)的深入發(fā)展,科技期刊的評(píng)價(jià)指標(biāo)體系將更加注重學(xué)術(shù)出版過(guò)程的開(kāi)放性、透明性和可復(fù)現(xiàn)性。例如,在同行評(píng)議過(guò)程中公開(kāi)審稿內(nèi)容和作者與審稿人之間的直接交流,將有助于減少偏倚并提高評(píng)審質(zhì)量。[18] 同時(shí),完善開(kāi)放科學(xué)基礎(chǔ)設(shè)施和重構(gòu)科研資助模式也將為科技期刊提供更好的支持。[19]
(4)人工智能與智慧出版
人工智能對(duì)學(xué)術(shù)出版的影響重點(diǎn)聚焦于生成式人工智能。一方面,基于強(qiáng)大的自然語(yǔ)言處理模型,生成式人工智能在學(xué)術(shù)出版的諸多環(huán)節(jié)可進(jìn)行場(chǎng)景式優(yōu)化。例如,《新醫(yī)學(xué)》應(yīng)用生成式人工智能的海量數(shù)據(jù)收集與分析能力,輔助選題策劃,提高了選題的科學(xué)性和前瞻性。[20] 另一方面,人工智能學(xué)術(shù)倫理也成為學(xué)者們研究的熱點(diǎn)話題,從開(kāi)始的理性討論,到現(xiàn)在的規(guī)范性使用,學(xué)術(shù)出版界對(duì)AI 工具的使用態(tài)度和政策也在不斷演變。相關(guān)學(xué)者就AIGC 在學(xué)術(shù)出版中的信任機(jī)制建構(gòu)問(wèn)題,提出AIGC 技術(shù)介入下的學(xué)術(shù)出版信任建設(shè)需要技術(shù)信任、人際信任和制度信任三維協(xié)同以“責(zé)任鏈”范式調(diào)動(dòng)技術(shù)研發(fā)者、科研人員、出版機(jī)構(gòu)、行業(yè)協(xié)會(huì)、政府機(jī)構(gòu)等主體共同參與。[21] 一些期刊已經(jīng)開(kāi)始制定關(guān)于AI 使用的規(guī)范政策,以確保學(xué)術(shù)誠(chéng)信和原創(chuàng)性。這些政策通常涉及對(duì)AI 工具本身的界定、作者身份的限定、使用方式、版權(quán)處理以及編輯和同行評(píng)議的使用規(guī)定。[22]英國(guó)醫(yī)學(xué)雜志(British Medical Journal,英文縮寫B(tài)MJ)出版集團(tuán)就生成式人工智能用于學(xué)術(shù)出版物的立場(chǎng)謹(jǐn)慎而明確,要求在作者貢獻(xiàn)聲明中披露AI 技術(shù)的名稱、使用原因、完成任務(wù),在補(bǔ)充材料中說(shuō)明原始輸入提示和輸出內(nèi)容。[23] 換言之,作者不僅需要明確披露AI 工具的使用情況,更需提供令人信服的理由,以證明在特定研究背景下,AI 的應(yīng)用確有必要且恰當(dāng),預(yù)示著學(xué)術(shù)出版界正朝著建立AI 工具使用倫理規(guī)范和最佳實(shí)踐的方向邁進(jìn),力求在創(chuàng)新與嚴(yán)謹(jǐn)之間取得平衡。
(5)出版國(guó)際化
出版國(guó)際化指中國(guó)學(xué)術(shù)出版“走出去”以及國(guó)際話語(yǔ)權(quán)體系的建立。學(xué)術(shù)出版“走出去”是提升國(guó)家學(xué)術(shù)話語(yǔ)權(quán)的重要手段,也是推動(dòng)中國(guó)文化軟實(shí)力和國(guó)際影響力的關(guān)鍵途徑。然而,中國(guó)學(xué)術(shù)出版在國(guó)際化進(jìn)程中還存在一些短板。在國(guó)際話語(yǔ)權(quán)的競(jìng)爭(zhēng)中,西方國(guó)家已基本占據(jù)壟斷地位,因此中國(guó)需要打造具有國(guó)際話語(yǔ)權(quán)和競(jìng)爭(zhēng)力的學(xué)術(shù)期刊,積極參與國(guó)際話語(yǔ)權(quán)的競(jìng)爭(zhēng)??梢酝ㄟ^(guò)多語(yǔ)種翻譯、資源二次開(kāi)發(fā)等方式,提高海外影響力,講好中國(guó)故事。[24] 例如,中國(guó)人民大學(xué)出版社積極推動(dòng)學(xué)術(shù)出版業(yè)“走出去”,在羅馬尼亞和蒙古國(guó)開(kāi)設(shè)了學(xué)術(shù)出版合作中心和圖書(shū)翻譯出版中心。[25] 還可以通過(guò)與國(guó)外大學(xué)簽署版權(quán)轉(zhuǎn)讓協(xié)議,實(shí)現(xiàn)校際學(xué)術(shù)成果的傳播,并利用國(guó)際出版商的平臺(tái)和渠道,策劃出版高水準(zhǔn)的學(xué)術(shù)品牌系列叢書(shū)。
(6)圖書(shū)館學(xué)術(shù)出版服務(wù)
圖書(shū)館學(xué)術(shù)出版服務(wù)在數(shù)字化轉(zhuǎn)型中也面臨著智能化技術(shù)的應(yīng)用以及服務(wù)質(zhì)量與用戶體驗(yàn)等新的挑戰(zhàn)。對(duì)于圖書(shū)館而言,開(kāi)放獲取對(duì)其學(xué)術(shù)出版服務(wù)產(chǎn)生了深遠(yuǎn)影響。高校圖書(shū)館需要調(diào)整業(yè)務(wù)和服務(wù)功能布局,以適應(yīng)開(kāi)放獲取出版及轉(zhuǎn)換的需求,并探索適合本國(guó)國(guó)情的開(kāi)放獲取出版模式。[26] 同時(shí),高校圖書(shū)館還應(yīng)積極關(guān)注智慧圖書(shū)館的建設(shè),通過(guò)優(yōu)化用戶體驗(yàn)場(chǎng)景,提高智慧信息服務(wù)和系統(tǒng)服務(wù)的質(zhì)量,增強(qiáng)用戶對(duì)智慧圖書(shū)館服務(wù)的積極態(tài)度。[27] 例如,上海交通大學(xué)圖書(shū)館將傳統(tǒng)印本文獻(xiàn)、口述歷史資料、網(wǎng)絡(luò)原創(chuàng)作品,乃至微信、微博、抖音等社交媒體信息,納入知識(shí)倉(cāng)儲(chǔ)范疇,通過(guò)智能挖掘和語(yǔ)義關(guān)聯(lián),形成智慧化知識(shí)圖譜,支持用戶基于問(wèn)題場(chǎng)景便捷獲取高質(zhì)量知識(shí)資源,進(jìn)行深度學(xué)習(xí)與創(chuàng)造。
(7)學(xué)術(shù)期刊出版數(shù)字化轉(zhuǎn)型
學(xué)術(shù)期刊出版的數(shù)字化轉(zhuǎn)型正在經(jīng)歷深刻的變革,這一過(guò)程受到多種因素的影響和推動(dòng)。首先,數(shù)字技術(shù)如人工智能、互聯(lián)網(wǎng)、大數(shù)據(jù)、物聯(lián)網(wǎng)和云計(jì)算等,正在重塑期刊出版的全產(chǎn)業(yè)鏈條,提高出版效率和傳播范圍,解決傳統(tǒng)出版模式中存在的效率低和實(shí)時(shí)性差等問(wèn)題。其次,智慧出版作為一種新興的出版模式,通過(guò)新媒體平臺(tái)傳播學(xué)術(shù)內(nèi)容,探索新的出版路徑,為學(xué)術(shù)期刊提供了新的發(fā)展機(jī)遇。與此同時(shí),學(xué)術(shù)期刊在數(shù)字化轉(zhuǎn)型過(guò)程中也面臨諸多問(wèn)題與挑戰(zhàn),例如,數(shù)字化期刊產(chǎn)品與服務(wù)的可持續(xù)運(yùn)營(yíng)問(wèn)題尚未得到充分解決。[28] 數(shù)字版權(quán)保護(hù)在學(xué)術(shù)期刊中也存在失衡問(wèn)題,需要通過(guò)增強(qiáng)版權(quán)意識(shí)和推進(jìn)區(qū)塊鏈技術(shù)的應(yīng)用來(lái)加以應(yīng)對(duì)。[15]144學(xué)術(shù)期刊應(yīng)加強(qiáng)內(nèi)容質(zhì)量監(jiān)控,拓展品牌價(jià)值,激勵(lì)編輯多元化轉(zhuǎn)型,并積極借鑒國(guó)際經(jīng)驗(yàn),以實(shí)現(xiàn)高質(zhì)量發(fā)展。例如,英國(guó)老牌出版商愛(ài)墨瑞德(Emerald)通過(guò)構(gòu)建豐富的期刊矩陣和知識(shí)服務(wù)體系,順應(yīng)開(kāi)放獲取出版潮流,積極開(kāi)發(fā)數(shù)字服務(wù)產(chǎn)品,成功實(shí)現(xiàn)了轉(zhuǎn)型和融合發(fā)展。[29]
(8)數(shù)據(jù)出版
數(shù)據(jù)出版相關(guān)話題伴隨高質(zhì)量發(fā)展、新質(zhì)生產(chǎn)力等關(guān)鍵詞成為近些年研究的熱點(diǎn)話題。數(shù)據(jù)出版是使科學(xué)數(shù)據(jù)獲得“可溯源”“可引用”“質(zhì)量審查”“承認(rèn)作者貢獻(xiàn)”“長(zhǎng)期保存”等特征的出版活動(dòng)。[30] 數(shù)據(jù)要素在出版業(yè)中逐漸成為關(guān)鍵的生產(chǎn)要素,具有低成本、易獲取、用途廣泛等特點(diǎn),并具備虛擬性、非競(jìng)爭(zhēng)性、部分排他性、規(guī)模報(bào)酬遞增及智能即時(shí)性特征。這些特性使得數(shù)據(jù)要素在出版業(yè)中具有重要的應(yīng)用價(jià)值,能夠推動(dòng)出版新業(yè)態(tài)的創(chuàng)新和發(fā)展。[31] 同時(shí),數(shù)據(jù)資產(chǎn)化成為出版業(yè)高質(zhì)量發(fā)展的關(guān)鍵手段,可以通過(guò)數(shù)據(jù)驅(qū)動(dòng)重構(gòu)出版活動(dòng)各個(gè)環(huán)節(jié)。例如,人民交通出版社等機(jī)構(gòu)通過(guò)接入百度的文心一言,試圖打造“出版+人工智能”的全系產(chǎn)品與服務(wù)。因此,數(shù)據(jù)要素在推動(dòng)出版業(yè)轉(zhuǎn)型升級(jí)、實(shí)現(xiàn)高質(zhì)量發(fā)展方面展現(xiàn)出巨大潛力,其與智能技術(shù)等新質(zhì)生產(chǎn)力的融合發(fā)展值得持續(xù)關(guān)注和深入研究,以期構(gòu)建更加繁榮、高效、創(chuàng)新驅(qū)動(dòng)的出版生態(tài)。
五、結(jié)論和展望
1. 研究結(jié)論
本文通過(guò)使用計(jì)量統(tǒng)計(jì)分析以及主題建模的方法,揭示了國(guó)內(nèi)學(xué)術(shù)出版領(lǐng)域的發(fā)展態(tài)勢(shì)和研究熱點(diǎn)。經(jīng)過(guò)研究,可以得出以下結(jié)論。
一是從整體發(fā)文量來(lái)看,學(xué)術(shù)出版領(lǐng)域的文獻(xiàn)數(shù)量呈現(xiàn)持續(xù)增長(zhǎng)態(tài)勢(shì),除了個(gè)別年份有所降低,總體發(fā)文量持續(xù)增加。初始發(fā)展階段(1998—2010年):研究文獻(xiàn)數(shù)量較少,增長(zhǎng)緩慢,話題較為單一,主要聚焦于開(kāi)放獲取運(yùn)動(dòng);快速增長(zhǎng)階段(2011—2019年):數(shù)字化平臺(tái)發(fā)展所帶來(lái)的新的出版、管理和盈利模式,為學(xué)術(shù)出版領(lǐng)域的研究注入了新的血液,研究主題呈現(xiàn)多元化和深度化的特征,學(xué)術(shù)出版研究進(jìn)入快速增長(zhǎng)階段;振蕩調(diào)整階段(2020—2024年):發(fā)文量有較小波動(dòng),但整體保持穩(wěn)定,除了持續(xù)聚焦開(kāi)放科學(xué)運(yùn)動(dòng)等,人工智能、數(shù)智化出版發(fā)展等相關(guān)研究主題開(kāi)始涌現(xiàn)。
二是從研究熱點(diǎn)看,近年來(lái),學(xué)術(shù)出版領(lǐng)域呈現(xiàn)出一系列高頻關(guān)鍵詞,其中包括人工智能、ChatGPT、智慧出版、數(shù)據(jù)出版以及出版融合等。這些關(guān)鍵詞的頻繁出現(xiàn)不僅反映了學(xué)術(shù)出版領(lǐng)域的研究熱點(diǎn),更凸顯了科技創(chuàng)新在推動(dòng)學(xué)術(shù)出版高質(zhì)量發(fā)展中的核心作用。作為知識(shí)傳播和學(xué)術(shù)交流的重要載體,學(xué)術(shù)出版正經(jīng)歷著由數(shù)字化轉(zhuǎn)型到數(shù)據(jù)智能深度賦能的變革過(guò)程。特別是2023年以來(lái),生成式人工智能的迅猛發(fā)展與高質(zhì)量發(fā)展內(nèi)在要求的政策推動(dòng),顯著擴(kuò)展了學(xué)術(shù)出版領(lǐng)域的研究范疇,簡(jiǎn)而言之,這些研究熱點(diǎn)反映了學(xué)術(shù)出版領(lǐng)域正處于技術(shù)創(chuàng)新與傳統(tǒng)價(jià)值重塑的交匯點(diǎn),預(yù)示著該領(lǐng)域未來(lái)發(fā)展將更加注重科技創(chuàng)新與優(yōu)質(zhì)出版能力的融合。
2. 研究展望
縱觀全局,我國(guó)學(xué)術(shù)出版領(lǐng)域的研究正處于蓬勃發(fā)展階段,不斷涌現(xiàn)出新的研究主題和創(chuàng)新性內(nèi)容,在理論建構(gòu)的同時(shí)也更加注重實(shí)踐經(jīng)驗(yàn)的總結(jié)。與此同時(shí),科技的飛速進(jìn)步,特別是人工智能技術(shù)的突破性發(fā)展,正在深刻改變學(xué)術(shù)內(nèi)容的生產(chǎn)、傳播和消費(fèi)模式。面對(duì)這些機(jī)遇與挑戰(zhàn),學(xué)術(shù)界需要持續(xù)拓寬研究視野,完善理論體系,探索創(chuàng)新模式。故此,筆者認(rèn)為,關(guān)于學(xué)術(shù)出版領(lǐng)域的未來(lái)研究,應(yīng)當(dāng)在出版數(shù)據(jù)內(nèi)容挖掘與研究方法創(chuàng)新層面進(jìn)行深度思考。
在出版數(shù)據(jù)內(nèi)容挖掘?qū)用?,隨著智能科技的發(fā)展,新的智能體不斷涌入學(xué)術(shù)出版生產(chǎn),為學(xué)術(shù)出版研究領(lǐng)域注入了新的活力,其通過(guò)自動(dòng)化和智能化處理,大幅提高了文獻(xiàn)檢索、數(shù)據(jù)分析、文本生成等環(huán)節(jié)的效率,從而優(yōu)化了整個(gè)學(xué)術(shù)出版流程。然而,智能體的參與也帶來(lái)了前所未有的倫理挑戰(zhàn),我們需要審慎考慮其在學(xué)術(shù)創(chuàng)作中的角色定位、著作權(quán)歸屬、學(xué)術(shù)倫理等問(wèn)題。此外,如何確保智能體生成的內(nèi)容符合學(xué)術(shù)標(biāo)準(zhǔn),如何平衡人機(jī)協(xié)作,等等,都是亟待解決的難題。
在研究方法創(chuàng)新層面,現(xiàn)有研究主要采用案例分析或文獻(xiàn)調(diào)研的方式展開(kāi)對(duì)學(xué)術(shù)出版領(lǐng)域的相關(guān)研究。大語(yǔ)言模型(large languagemodel,英文縮寫LLM)作為典型的新質(zhì)生產(chǎn)力,具備跨領(lǐng)域知識(shí)整合的能力,可以幫助研究者發(fā)現(xiàn)不同學(xué)科間的潛在聯(lián)系,促進(jìn)學(xué)術(shù)出版研究的跨學(xué)科創(chuàng)新,推動(dòng)知識(shí)服務(wù)模式創(chuàng)新??梢越柚鶯LM 優(yōu)化現(xiàn)有領(lǐng)域研究,例如科技期刊的評(píng)價(jià)指標(biāo)與影響因素分析,開(kāi)放科學(xué)領(lǐng)域的政策文本分析,以輔助優(yōu)化傳統(tǒng)的量化分析方法和文本分析方法,加速科學(xué)知識(shí)的發(fā)現(xiàn)。
盡管本研究嘗試引入基于BERTopic主題建模的文獻(xiàn)分析方法,但在研究主題詞上限定于“學(xué)術(shù)出版”或“科技出版”,對(duì)“學(xué)術(shù)期刊”或“科技期刊”這一關(guān)聯(lián)主題文獻(xiàn)或存在一定缺漏,且針對(duì)相關(guān)細(xì)分主題的分析有待深化。未來(lái)隨著學(xué)術(shù)出版實(shí)踐領(lǐng)域的不斷發(fā)展,需要持續(xù)地跟蹤和分析學(xué)術(shù)出版新興主題和研究動(dòng)態(tài)。