逯 萬 輝
(中國社會科學院 中國社會科學評價研究院,北京 100732)
2016年5月17日,習近平總書記在哲學社會科學工作座談會上的重要講話中,首次明確提出了“加快構建中國特色哲學社會科學”的重大論斷和戰(zhàn)略任務[1],深刻闡明了加快構建中國特色哲學社會科學學科體系、學術體系、話語體系的基本原則,為新時代我國哲學社會科學事業(yè)的發(fā)展指明了前進方向,也為我國哲學社會科學工作者開展科研活動提供了根本遵循。學科體系是加快構建中國特色哲學社會科學的根本依托。在加快構建學科體系過程中,我們要強化全局性、前瞻性、戰(zhàn)略性、儲備性、基礎性研究,堅持問題意識和需求導向,這也是三大體系建設的基礎工程[2]。開展學科體系建設與研究工作,需要我們對學科基礎知識、學科發(fā)展脈絡與演進方向、學科研究前沿與熱點問題等具有較強的理解力與洞察力。但是,我們處于信息爆炸時代,科技創(chuàng)新演變與知識交叉融合加速發(fā)展,科學研究與技術研發(fā)環(huán)境愈加復雜,學術成果數(shù)量的增長速度顯著提升,科研工作者在科研活動過程中面臨的問題和對象也更加復雜多樣,與此同時,學術研究范式也在發(fā)生著劇烈轉變,以密集型數(shù)據(jù)計算為基礎的第四范式的興起,不僅為科學研究活動提供了新的方法和工具,同時也促使科研人員的知識創(chuàng)新方式在廣度和深度上都發(fā)生著質的變化,基于知識的創(chuàng)新驅動發(fā)展過程越來越依賴于對已有學術成果的挖掘與拓展[3-4]。
從理論層面上來看,領域研究熱點與研究前沿識別一直都是科學學與圖書情報學領域的研究重點之一,對其進行信息分析和挖掘,有助于科研人員對其所在學科領域形成較為全面的認識。但是當前在研究前沿識別方面的相關研究多集中于自然科學領域,社會科學領域的研究前沿是否存在,其表現(xiàn)形式與表現(xiàn)特征與自然科學領域的研究前沿有何差別,是當前迫切需要解決和回答的問題。開展人文社會科學領域研究前沿的相關研究,可以進一步豐富研究前沿的形式與內涵,拓展情報研究方法的應用邊界與范圍,并進一步豐富和完善研究前沿識別方法。從應用層面來說,人文社會科學研究熱點與研究前沿主題的識別與發(fā)現(xiàn),是學者們了解科學研究發(fā)展動態(tài),把握學科研究方向必不可少的環(huán)節(jié),也是促進人文社會科學繁榮發(fā)展、加快構建人文社會科學學科體系、學術體系與話語體系的重要步驟。通常,研究熱點或研究前沿本質上是指科研共同體高度關注并積極開展研究的領域,在一定程度上代表了學科的研究重點和未來發(fā)展方向,對于研究熱點和研究前沿的識別是科研活動中探明知識基礎、梳理知識發(fā)展脈絡與發(fā)掘前沿趨勢的必要手段,不僅可以為科研工作者開展學術研究提供基礎支撐,也可以為科研管理部門和政府決策部門制定科技政策提供參考依據(jù)。
1.研究熱點與研究前沿的概念辨析
美國學者Price在1965年提出了研究前沿的概念。他認為研究前沿是用來描述某一科學研究領域的一項瞬時性特征,表現(xiàn)為引文網(wǎng)絡中經(jīng)常被引用且在近期發(fā)表的文獻集合所代表的研究領域[5]。后續(xù)學者以此為基礎,對研究前沿的概念界定不斷得到優(yōu)化。1974年,Small等人在Price的研究前沿概念的基礎上,從研究領域的核心文獻識別出發(fā),采用文獻共被引的聚類分析方法,來研究領域內較早發(fā)表的、基礎性的核心文獻,反映當前活躍的研究領域及其結構,其研究結果認為通過共被引聚類分析所得到的高被引文獻簇能更好地表征研究前沿,從而進一步豐富和拓展了研究前沿基本概念與識別方法[6-7]。1989年,Garfield基于前人的研究成果并在實際工作中對研究前沿的概念進行了擴展,認為科學研究發(fā)展進程中存在著的新興的熱點領域或隨著研究領域的發(fā)展而不斷產生新的研究分支即研究前沿,在定量研究中表現(xiàn)為近3年內的高被引文獻集合、共被引聚類的核心論文和引用這些核心論文的最新文獻[8]。2006年,陳超美把研究前沿定義為一組突現(xiàn)的動態(tài)概念和潛在的研究問題(即正在興起的理論趨勢和新主題的涌現(xiàn)),并利用Kleinberg的突破檢測算法[9]識別高頻詞作為研究前沿詞匯,以共被引文獻簇表示知識基礎來進行研究前沿的探測工作,開發(fā)了CiteSpace分析工具[10]。近些年來,國內學者在研究前沿識別領域也開展了大量卓有成效的工作。譚宗穎認為學科熱點前沿與發(fā)展趨勢作為學科戰(zhàn)略情報研究的重要內容,是科技戰(zhàn)略決策研究的重要組成部分,對其研究內涵、主要內容、研究層面、研究理論基礎與方法進行了梳理,并對戰(zhàn)略情報研究的分析指標做了詳細闡釋[11]。鄭彥寧等在梳理國內外研究前沿定義、歸納研究前沿特性的基礎上界定研究前沿的內涵,進而提出識別研究前沿的指標體系,構建基于關鍵詞共現(xiàn)的研究前沿識別方法,并在LED領域進行應用分析[12]。冷伏海等在研究前沿識別與應用方面做了大量的研究和實踐,在研究前沿識別方法、基于研究前沿的國際科技對比等領域做了許多具有開創(chuàng)性的工作,在此基礎上,中國科學院與科睿唯安合作,定期發(fā)布研究前沿報告[13-14]。從總體上來看,目前有關研究前沿識別的相關研究仍主要集中在自然科學研究領域,對人文社會科學研究領域的研究前沿識別還較少涉及。
一般來說,研究熱點是反映了某個領域中受到學者高度關注、深入探討分析或有效開發(fā)應用的研究主題;研究前沿是科學研究中最新、最先進或最具有發(fā)展?jié)摿Φ难芯恐黝},其本質是在某一科學領域內處于領先地位的研究成果和思想;新興趨勢是科學研究中暫未引發(fā)廣泛關注但是極具發(fā)展?jié)摿Φ难芯恐黝},會隨著時間推移引起越來越多的研究興趣和更加廣泛的現(xiàn)實應用的主題領域。從其外延范圍來看,研究熱點的范圍要大于研究前沿,新興趨勢則在發(fā)展到一定程度后有可能成為研究前沿,如圖1所示。
圖1 研究前沿的相關概念辨析
區(qū)別于自然科學研究,人文社會科學研究具有其強烈的時代性與意識形態(tài)屬性,研究對象更加復雜多樣,其研究內容又易受到經(jīng)濟社會發(fā)展與科技進步的影響,在開展人文社會科學研究前沿與學科發(fā)展態(tài)勢分析過程中,我們將更加側重于通過對其研究熱點的分析與挖掘,展現(xiàn)研究主題在當前時段內的表現(xiàn)情況與發(fā)展趨勢,因此,本文將對人文社會科學領域研究前沿與研究熱點進行統(tǒng)一表述。
2.人文社會科學研究熱點與前沿的主要特征
通過上文對研究熱點與研究前沿的概念辨析,以及對人文社會科學研究較之自然科學研究特殊性的分析,我們認為研究熱點或研究前沿本質上是指科研共同體高度關注并積極開展研究的領域,從一定程度上代表了學科在某一時間段內的研究重點和未來發(fā)展方向。作為研究領域最活躍的部分,研究熱點與前沿對研究領域的發(fā)展具有重要的推動作用。鄭彥寧等從當前國內外學者對研究前沿定義及相關理論研究和梳理后,總結了研究前沿具備新穎性、時效性與集中性三大特征[12],這也可以作為人文社會科學研究熱點與研究前沿判斷的主要特征,但是限于人文社會科學區(qū)別于自然科學研究特點,在其特征表述與計算方法上也略有不同,因此,本文在其基礎上進一步將人文社會科學研究熱點與前沿的特征表述為以下3個方面:
(1)時效性。研究熱點與研究前沿應該是動態(tài)發(fā)展的,隨著時間的變化,研究熱點與研究前沿可能發(fā)生變化,因此,在研究熱點與研究前沿識別過程中描述研究熱點與研究前沿時要把其限定到某個時間段。
(2)集中性。研究熱點與研究前沿應該是在短時間內引起科學家高度關注的研究主題,在文獻計量上應該表現(xiàn)為關鍵詞的爆發(fā)式增長或突現(xiàn)、某些主題的文章發(fā)表數(shù)量的驟增以及關注該主題作者數(shù)量的驟增等。
(3)新穎性。從人文社會科學的學科屬性出發(fā),人文社會科學研究熱點與研究前沿應該來源于經(jīng)濟社會發(fā)展過程中出現(xiàn)的新的理論或現(xiàn)實問題所觸發(fā)的學術研究與探討,是一個研究領域最為關注的研究問題。從學術層面來看,人文社會科學研究熱點與研究前沿是解決該時段研究領域關鍵問題、突出矛盾的鑰匙,在文獻計量指標上應該體現(xiàn)為高質量的學術文獻以及新主題的出現(xiàn)。
通過對不同學者對研究前沿定義的梳理總結以及對研究前沿特性的歸納,本文把人文社會科學研究熱點與研究前沿定義為某個研究領域在某時間段內新出現(xiàn)或正在興起的引起學界高度關注的研究主題。
目前在研究前沿識別過程中,常用的方法有:基于引文的方法(包含直接引用、共被引、文獻耦合等)、基于詞頻的方法、基于共詞分析的方法、基于主題模型的方法等,眾多學者在該領域展開了廣泛和深入的研究,并對各種方法的基礎理論、代表性成果、方法的優(yōu)點和局限性等進行了深入探討[15-16]。從總體來看,每一種方法的提出都有其特定的技術背景和應用場景,都在某種程度上解決了當時的問題,并為后續(xù)學者開展進一步研究提供了理論和方法層面的支撐。但是由于人文社會科學各學科引文半衰期整體較長,其引文時滯性表現(xiàn)與影響也更為突出,如考古學、歷史學、文學等學科的引文半衰期均在10年以上,而引文半衰期較短的經(jīng)濟學、圖書情報學、新聞與傳播學等學科也在3年左右[17]。因此,較之于引文分析方法,基于文本內容分析的研究熱點與研究前沿識別方法相對更適用于進行人文社會科學領域。在此背景下,針對人文社會科學研究熱點與前沿識別,本文將采用基于主題詞共現(xiàn)的研究前沿識別分析方法并對其進行優(yōu)化改進,在基于主題詞共現(xiàn)的網(wǎng)絡圖挖掘基礎上進行主題聚類,從而識別出研究主題,并設計和改進研究主題的測度指標算法,以期實現(xiàn)人文社會科學研究熱點與研究前沿的識別。基于上述方法,本文構建的人文社會科學研究熱點與前沿識別模型如圖2所示:
圖2 基于詞共現(xiàn)的研究熱點與研究前沿識別一般流程
1.基于詞共現(xiàn)的研究熱點與前沿識別實施步驟
基于主題詞共現(xiàn)網(wǎng)絡挖掘的研究熱點與前沿識別主要包含以下幾個步驟:
(1)確定數(shù)據(jù)源并提取相關領域文獻數(shù)據(jù)集,并對文獻集進行時間段劃分。
(2)在對文獻集進行時間段劃分的基礎上,對每一時間段內的文本進行主題詞抽取,并建立主題詞共現(xiàn)關系。本文在主題詞抽取的過程中,采用TFIDF算法進行主題詞提取。
(1)
式(1)中ni,j是詞i在文件j中的出現(xiàn)次數(shù),∑knk,j是在文件j中所有字詞的出現(xiàn)次數(shù)之和,|D|為語料庫中的文件總數(shù),|{j:ti∈dj}|為文檔集中包含詞語i的文檔數(shù)。
(3)在主題詞抽取的基礎上,構建主題詞共現(xiàn)網(wǎng)絡,并對網(wǎng)絡圖進行挖掘,識別研究領域主題。在進行主題識別的過程中,鑒于譜聚類算法(Spectral Clustering)在稀疏數(shù)據(jù)及高維矩陣上的良好表現(xiàn),能在任意形狀的樣本空間上聚類且收斂于全局最優(yōu)解等優(yōu)點[18],本文采用譜聚類進行基于詞共現(xiàn)網(wǎng)絡的主題識別。
(4)基于前文的時間段劃分,對每一個時間段上的文獻集進行主題詞抽取及共現(xiàn)網(wǎng)絡構建,并滑動時間窗口,對每個時間段內的主題進行相似度計算,構建主題演化關系網(wǎng)絡,梳理研究領域主題演變關系。
(5)在主題識別與主題演化關系挖掘的基礎上,構建研究主題的主題強度、主題成熟度和主題輻射性測度指標,判斷研究領域熱點和前沿主題。
2.人文社會科學研究熱點與前沿判斷指標
在主題識別的基礎上,我們進一步通過構建測度指標來判斷不同研究主題的熱度與前沿。根據(jù)前文中所探討的人文社會科學研究熱點與前沿的特性,設計出以下3個指標來進行不同研究主題間的對比:
(1)主題強度
主題研究強度與包含該主題的文獻數(shù)量有關,包含該主題的研究文獻數(shù)量越多,該研究主題的強度越大。此處所指的該研究主題內容的文獻界定為包含該主題內兩個或兩個以上的關鍵詞的文獻[19]。
(2)主題成熟度
對主題研究成熟度的測算采用網(wǎng)絡凝聚性指標進行展示,具體計算過程中以主題的網(wǎng)絡密度進行表征。網(wǎng)絡密度(Density)是反映網(wǎng)絡中各個節(jié)點間聯(lián)系緊密程度的重要指標,該指標通過對網(wǎng)絡連接的擴散性和連通性測度進而體現(xiàn)整體網(wǎng)絡的結構特性,其計算公式表示為網(wǎng)絡中實際存在的節(jié)點連線與可能存在的節(jié)點連線之比[20],網(wǎng)絡密度的取值范圍在0~1之間,其值越接近1表示網(wǎng)絡內各節(jié)點間的聯(lián)系越頻繁。
(2)
公式(2)中,m為網(wǎng)絡中實際存在的連線數(shù),n為網(wǎng)絡中的節(jié)點數(shù)目。
(3)主題輻射性
對主題的輻射性測度采用主題的群體網(wǎng)絡中心度指標進行展示。為了考察整體網(wǎng)絡中的某個子群在網(wǎng)絡中發(fā)揮的作用和所處位置等特征,Everett等學者將中心度測量從網(wǎng)絡中的單個行動者擴展到一系列行動者(即子群)中,形成了群體中心度測量指標。根據(jù)Everett的定義,對一個大型網(wǎng)絡中的某個小群體來說,該群體的度數(shù)中心度是指該群體之外與其內部成員有直接關聯(lián)的點數(shù),如果該群體有多個節(jié)點與群體外的一點相連,則只計算一次。歸一化后的群體中心度計算公式為:
(3)
公式(3)中,C為整體網(wǎng)絡V中的某個子群節(jié)點個數(shù),N(C)表示子群C之外與該群有直接聯(lián)系的節(jié)點個數(shù)。研究主題的群體中心度數(shù)值越大,說明該主題與其他主題或文檔關聯(lián)越大,熱度越高,前沿價值越高。
在群體的中介中心度計算過程中,假設C是一個網(wǎng)絡中的一個子群,令g(u,v)代表連接點u和點v的捷徑數(shù),令g(u,v)(C)代表連接點u和點v的經(jīng)過點集C的捷徑數(shù),那么子群C的中介中心度為:
(4)
3.基于戰(zhàn)略坐標分析的研究熱點與前沿識別
在研究熱點與前沿判斷過程中,本文采用基于巴斯德象限思想的戰(zhàn)略坐標分析法來進行不同研究主題間的對比分析,該方法可以通過可視化的形式來描述研究主題的內部聯(lián)系和不同主題之間的相互聯(lián)系[21-22]。在戰(zhàn)略坐標圖中,橫軸表示研究主題的輻射性,具體用上文中的群體中心度(Group Betweenness)指標度量;縱軸表示主題的成熟度,具體用網(wǎng)絡密度(Density)指標度量,通過該方法可以直觀地描述各主題的研究發(fā)展狀況及發(fā)展趨勢。其中,主題的網(wǎng)絡密度高,說明該主題內部聯(lián)系緊密,研究趨向成熟; 主題的中心度高,則說明該主題處于網(wǎng)絡的中心,主題輻射性較強,與其余主題連接緊密,對其他主題的影響力較大。
圖3 主題分析戰(zhàn)略坐標圖
1.馬克思主義理論學科研究熱點與前沿識別
基于上述方法,本研究以馬克思主義理論學科為例進行實證研究。以中國社會科學評價研究院建設的中國人文社會科學期刊引文數(shù)據(jù)庫(CHSSCD)為實驗數(shù)據(jù)源,選取2012~2018年的馬克思主義學科期刊所刊載的3.4萬余篇論文為實驗對象,進行馬克思主義理論學科研究熱點和前沿識別。
首先,基于上文所述方法進行主題詞抽取,并以“年”為時間單位構建歷年的主題詞共現(xiàn)關系網(wǎng)絡,在此基礎上采用譜聚類算法對主題詞共現(xiàn)網(wǎng)絡進行聚類,在譜聚類及主題識別過程中,在每個子圖(主題)中選取詞頻最高的前3個詞作為該主題簇的類標簽,得到歷年的主要研究主題及主題演化關系,如圖4所示,圖中圓點的大小代表主題的研究熱度,圓點越大,與該主題相關的研究成果數(shù)量越多,主題研究熱度越高。從圖4中可以較為明顯地看出該學科研究主題的熱度變化情況。如黨的十八大以來,有關中國特色社會主義的相關研究和闡釋一直是馬克思主義理論學科的研究熱點,同時“思想政治教育”“社會主義核心價值觀”等主題研究熱度也較為突出;黨的十九大以來,有關習近平新時代中國特色社會主義思想的相關研究一直是馬克思主義理論學科最為重要和前沿的研究主題。此外,2017年是《資本論》第一卷發(fā)表150周年,有關該主題的相關研究相對較多;2018年是馬克思誕辰200周年和《共產黨宣言》發(fā)表170周年,有關這方面的相關學術研究成果表現(xiàn)也較為突出。
圖4 2012~2018年馬克思主義理論學科主要研究主題及其演化關系
在主題演化分析的基礎上,為進一步識別該領域的研究熱點與前沿主題,采用上文的計算指標對歷年各個主題的主題強度、主題輻射性與主題成熟度等進行計算,并將其計算結果放置于戰(zhàn)略坐標中,對主題的重要性和成熟度等進行對比分析,圖5中展示了2018年的主要研究主題情況,圖中橫軸為主題網(wǎng)絡中心度所表征的主題輻射性指標,縱軸為主題網(wǎng)絡密度所表征的主題成熟度指標,圖中圓圈代表主題,并以該主題中詞頻最高的前3個詞作為該主題的標簽,圓圈的大小代表該主題的研究強度,即與該主題相關的文獻數(shù)量。從圖5中可以明顯看出,在2018年,有關習近平新時代中國特色社會主義思想的相關研究是該學科最為重要的新興研究主題,其研究強度最大、主題的輻射性也最強,表明以習近平新時代中國特色社會主義思想為指導是馬克思主義理論學科最為重要的基本特征,這也是整個中國學術界的根本遵循;此外,2018年是馬克思誕辰200周年和《共產黨宣言》發(fā)表170周年,有關這方面的相關學術研究成果表現(xiàn)也較為突出;與此同時,“人類命運共同體/一帶一路/全球化”相關主題也是該學科較為關注的重要研究主題之一。
圖5 2018年馬克思主義理論學科研究熱點與前沿主題分布
圖6 黨的十九大以來馬克思主義理論學科研究熱點與前沿主題分布
黨的十九大以來,有關習近平新時代中國特色社會主義思想的相關研究與闡釋一直是馬克思主義理論學科最為重要和前沿的研究主題,也是該學科領域研究強度最高的主題,此外,“思想政治教育”“社會主義核心價值觀”“全面從嚴治黨”“人類命運共同體”等主題在這一時段內的研究熱度也相對較高。
通過對馬克思主義理論學科研究熱點與前沿主題的識別,我們可以較為直觀地看出該領域的主要研究內容及其在時間維度上的演化軌跡,對科研人員或科研管理部門了解和掌握該領域的研究重點和研究趨勢等有一定的支撐作用。在此基礎上,通過對主題維度下不同機構的表現(xiàn)情況進行挖掘分析,可以進一步鎖定特定主題下不同機構的研究優(yōu)勢或研究側重,對于從宏觀上掌握不同學科領域學術發(fā)展態(tài)勢、開展學術評價以及面向重大問題攻關中整合不同研究機構的研究特長與學術優(yōu)勢等也都具有一定的支撐作用。
運用上述研究方法,習近平新時代中國特色社會主義思想主要研究機構有中國人民大學馬克思主義學院、清華大學馬克思主義學院、中央黨史和文獻研究院、中國社會科學院馬克思主義研究院、武漢大學馬克思主義學院等機構。馬克思主義基本理論的相關研究作為馬克思主義理論學科的理論基礎,也是該學科領域的研究重點,該研究主題位于巴斯德象限的第一象限中,主題成熟度和主題輻射性都相對較高,通過對該主題的相關研究進行統(tǒng)計分析,得到該研究領域的主要研究機構有中央黨史和文獻研究院、中國社會科學院馬克思主義研究院、北京大學馬克思主義學院、中國人民大學馬克思主義學院、南京大學哲學系等。
人文社會科學研究作為整個科學體系中的重要分支,在經(jīng)濟社會發(fā)展進程中發(fā)揮著重要的作用。當前,在國家治理體系現(xiàn)代化建設與社會經(jīng)濟高質量發(fā)展進程中,繁榮發(fā)展哲學社會科學并服務于重大理論和現(xiàn)實問題需要是哲學社會科學工作者的重要使命。研究和識別學科研究熱點和前沿問題,可以為科研管理部門把握學科發(fā)展戰(zhàn)略與演進方向、進行項目布局提供支撐,這也是服務“三大體系”建設的重要環(huán)節(jié)?;诖?,本文對人文社會科學研究熱點與前沿的相關概念進行了辨析,并重點研究了人文社會科學研究熱點與研究前沿的主要特征,在此基礎上構建了人文社會科學研究熱點與研究前沿識別方法,并以馬克思主義理論學科為例進行了實踐。
從研究結果來看,本文構建的人文社會科學研究熱點與前沿識別方法能夠較為有效地識別出研究領域的熱點與前沿,在此基礎上還進一步統(tǒng)計了不同研究主題下的研究機構分布情況,對于了解學科發(fā)展態(tài)勢有一定的幫助,且該方法避免了基于引文分析研究前沿識別中的時滯性問題,具有較強的擴展性,可以較為容易地擴展到人文社會科學其他學科領域。但是,本研究也具有一定的局限性,即在數(shù)據(jù)源的選擇過程中以單一學科的學術期刊為對象進行了實證分析,鑒于人文社會科學研究內容的交叉性,后續(xù)我們需要進一步拓展研究和探索學術論文的領域屬性劃分方法,以期為研究領域熱點和研究前沿的識別提供更加準確和全面的分析數(shù)據(jù)源。