朱喜安,陳巧玉,2
(1.中南財經(jīng)政法大學 統(tǒng)計與數(shù)學學院,武漢 430073;2.河南科技大學 數(shù)學與統(tǒng)計學院,河南 洛陽471003)
貝葉斯方法是基于貝葉斯定理而發(fā)展起來用于解決統(tǒng)計問題的方法,貝葉斯分析包括先驗信息的確定、數(shù)據(jù)及似然函數(shù)模型的構(gòu)造、效用函數(shù)的選擇、后驗分布的確定和貝葉斯決策。貝葉斯推斷的思想是將未知參數(shù)的先驗信息與樣本信息綜合;然后利用貝葉斯定理,得出參數(shù)的后驗分布;最后依據(jù)后驗分布對未知參數(shù)進行估計和檢驗等推斷。
20世紀90年代,由于高維計算的困難,貝葉斯方法的應用受到了很大的限制。但隨著計算機技術的發(fā)展和貝葉斯方法的改進,特別是MCMC方法的發(fā)展及WinBUGS等軟件的開發(fā)應用,使原來復雜異常的數(shù)值計算問題變得非常簡單,參數(shù)后驗分布的模擬也趨于方便,所以現(xiàn)代貝葉斯理論和應用得到了迅速的發(fā)展[1]。貝葉斯方面的研究論文越來越多,貝葉斯學派已發(fā)展成為一個有影響的統(tǒng)計學派,打破了經(jīng)典統(tǒng)計一統(tǒng)天下的局面[2]。
貝葉斯方法作為科學科研究前沿領域,已得到國內(nèi)各界的廣泛關注。本文借助南京大學中國社會科學研究評價中心《中文社會科學引文索引》(Chinese Social Science Citation Index,簡稱CSSCI)數(shù)據(jù)庫1998~2010的有關“貝葉斯”收錄論文進行計量分析,本文檢索方法是在CSSCI來源數(shù)據(jù)庫中檢索論文題名或關鍵字中含“貝葉斯”或“bayes”的論文,共從CSSCI來源數(shù)據(jù)庫中檢索到來源文獻377篇[3]。在此基礎上,本文從統(tǒng)計論文的年代分布、期刊分布、基金項目統(tǒng)計、作者與機構(gòu)分布以及主題分布與研究熱點等方面進行計量分析;文章還利用共被引分析方法對論文所引的參考文獻進行作者被引和著作共引分析。通過這些分析,可以深入了解我國貝葉斯發(fā)展的進展和存在的不足,以及貝葉斯領域研究前沿的知識基礎,對于更好的去研究這一前沿學科提供足夠的數(shù)據(jù)支持,利于更好地去把握當前的研究熱點。
由圖1可以看出,1998年CSSCI期刊僅有6篇關于貝葉斯的文章刊載,1998~2002年期間每年的發(fā)文數(shù)量都不超過10篇,總計發(fā)文量為41篇,說明我國貝葉斯研究起步較晚且我國在貝葉斯研究領域尚處于起步階段,但也正是這一時期的研究為貝葉斯在我國的進一步發(fā)展奠定了基礎。2002年之后,發(fā)文數(shù)量呈現(xiàn)不斷遞增的趨勢,到2010年發(fā)文累積量已達377篇,說明貝葉斯研究在我國不斷發(fā)展、完善,步入蓬勃興起的階段。圖1中的論文累計篇數(shù)的擬合線近似為指數(shù)曲線,由此可以看出,按照普賴斯(D.Price)的邏輯曲線增長理論,現(xiàn)階段我國“貝葉斯”論文數(shù)量以指數(shù)方式快速增長,說明仍處于發(fā)展時期。
圖1 年代分布與累計數(shù)
1998年至今,CSSCI中共有96種期刊收錄了貝葉斯方面的論文,論文總量為377篇。其中《統(tǒng)計與決策》、《數(shù)理統(tǒng)計與管理》等27種期刊收錄了3篇及以上貝葉斯方面的論文,收錄論文達286篇,占全部CSSCI期刊收錄的貝葉斯方面論文的75.86%?!督y(tǒng)計與決策》刊載論文比例最大,占總載文量的27.32%;另外,《數(shù)理統(tǒng)計與管理》(占7.69%)和《中國管理科學》(占4.24%)所占比例較大;《統(tǒng)計研究》、《預測》、《心理科學》和《數(shù)量經(jīng)濟技術經(jīng)濟研究》載文數(shù)量均超過10篇,均達到載文總量的3%?!督?jīng)濟研究》、《金融論壇》等期刊僅刊載1篇相關論文,其載文總量(45篇)占總刊文量的11.94%;《生產(chǎn)力研究》、《中國軟科學》等期刊僅刊載2篇相關論文,其載文總量(46篇)占總刊文量的12.20%。
表1 發(fā)文量超過3篇的期刊
從期刊所屬研究學科來看絕大部分論文所屬的刊物都是統(tǒng)計學類,如《統(tǒng)計與決策》、《統(tǒng)計研究》、《數(shù)理統(tǒng)計與管理》,我國統(tǒng)計學界對貝葉斯理論發(fā)展與繼承做出了重要的貢獻;除此之外,管理類權(quán)威期刊如《中國管理科學》《預測》《管理工程學報》《管理科學學報》《管理世界》,以及經(jīng)濟類權(quán)威期刊《數(shù)量經(jīng)濟與技術經(jīng)濟研究》《財經(jīng)研究》《金融研究》《經(jīng)濟理論與經(jīng)濟管理》,也刊載了相當數(shù)量的貝葉斯方面論文,說明經(jīng)濟與管理是貝葉斯重要的應用領域;情報學、心理學與哲學等相關領域也有較多論文應用貝葉斯方法結(jié)合各自研究領域解決實際問題。由此可以看出,隨著貝葉斯方法在多學科交叉應用的發(fā)展,貝葉斯方法擁有廣闊的應用領域與發(fā)展空間。
在377篇相關論文中,共有652位作者,其中第一作者310位。發(fā)文量超過2篇(第一作者或獨撰)的作者如表2所示。在310位作者中,有269位作者僅發(fā)過1篇貝葉斯方面的論文,占全部作者的86.77%,說明貝葉斯在我國學者群內(nèi)仍未獲得足夠重視,很多作者只是偶然性的研究和關注。發(fā)文2篇的作者共32位,占全部作者的10.32%,說明這32人對貝葉斯進行了較為持續(xù)的研究。發(fā)文3篇以上的作者共9位,占全部作者的2.90%,他們對貝葉斯進行了更為深入、持續(xù)的研究,為目前我國貝葉斯方面的主要研究者;發(fā)文量最多的為朱慧明,達15篇,為我國貝葉斯領域的發(fā)展傳播作出了貢獻。
表2 發(fā)文量超過2篇的作者(第一作者或獨撰)
上述310位第一作者來源于165個機構(gòu)單位,發(fā)文量超過4篇以上的機構(gòu)及機構(gòu)發(fā)文篇數(shù)如表3所示。
由表3可以看出,發(fā)文量超過4篇以上的機構(gòu)共有30個,且集中分布在高校,這30個高校的在貝葉斯方面的發(fā)文量(78篇)占全部發(fā)文量(377篇)的20.69%。在貝葉斯方面發(fā)文最多的機構(gòu)是湖南大學,共發(fā)文18篇,是貝葉斯研究領域的領頭羊;發(fā)文10篇以上的有5所高校,它們都是貝葉斯研究領域的中堅力量。可以看出,高校是我國貝葉斯領域的研究基石,是貝葉斯在我國發(fā)展、完善及日益廣泛應用中不可或缺的力量。
表3 發(fā)文量超過4篇的作者機構(gòu)(第一作者或獨撰)
一篇文獻的關鍵詞是論文核心內(nèi)容的濃縮和提煉,如果某一關鍵詞在某領域的研究文獻中反復出現(xiàn),則稱其為高頻詞,高頻詞反映了該領域的研究熱點。因而可以通過詞頻分析法,利用能夠揭示或表達文獻核心內(nèi)容的關鍵詞或主題詞在期刊中出現(xiàn)的頻次高低來確定該領域的研究熱點和發(fā)展動向,從而對其學術特征與動態(tài)發(fā)展有一個比較準確、全面的把握[4]。本文根據(jù)文獻關鍵詞,對CSSCI(1998~2010年)收錄的有關貝葉斯的377篇學術論文的關鍵詞進行詞頻統(tǒng)計[5],且僅保留頻數(shù)大于3的高頻關鍵詞,如表4所示。
表4 頻數(shù)大于3的高頻詞
貝葉斯相關學術論文的頻數(shù)大于20的高頻主題詞主要有貝葉斯估計(36)、貝葉斯推理(30)、貝葉斯網(wǎng)絡(26)、貝葉斯方法(23)與MCMC模擬(23);頻數(shù)介于10到20之間的高頻詞主要有Gibbs抽樣(12)、貝葉斯均衡(12)、貝葉斯統(tǒng)計(11)、貝葉斯決策(10)、先驗分布(10)??梢钥闯?,目前貝葉斯領域的研究焦點是利用貝葉斯方法進行估計、推理及網(wǎng)絡分析;貝葉斯決策、貝葉斯均衡和先驗分布的確定也是目前的研究熱點;同時,可以看出Gibbs抽樣和MCMC模擬是目前主要的估計方法,也正是這些方法的出現(xiàn),極大的解決了貝葉斯中的高維積分等難題,進而推動了貝葉斯在各領域的應用。
在貝葉斯學術論文高頻關鍵詞統(tǒng)計的基礎上,為了更清晰地展示我國貝葉斯研究的熱點,本文利用樣本文獻的標題,借助可視化技術和Netdraw軟件,繪制如圖3所示的高頻主題詞共現(xiàn)網(wǎng)絡,從而體現(xiàn)其近13年來的研究熱點與關聯(lián),以期了解熱點主題詞之間的關聯(lián)[6,7],為相關學者提供參考。
圖1 高頻主題詞共現(xiàn)網(wǎng)絡
圖1節(jié)點間的矢量線說明主題詞間的共現(xiàn)情況,連線粗細或權(quán)重大小體現(xiàn)了共現(xiàn)頻次,反映高頻主題詞的關聯(lián)緊密程度。由圖1可以明顯看出我國貝葉斯研究的特點:
第一,與貝葉斯有關的方法主要涉及企業(yè)、金融、銀行、市場、信用、管理、分類和算法等領域;
第二,利用貝葉斯方法進行推斷、評估、抽樣、組合、評價、分類、預測、實證、影響、決策、理論、博弈和損失等是當前研究的主要目的;
第三,貝葉斯方法、推理、預測為我國博弈、決策和分類等分析問題提供了新的研究視角;
第四,利用實證分析研究企業(yè)風險、金融、管理方面的推理、預測等分析研究,以及模型參數(shù)的分布是我國現(xiàn)階段貝葉斯領域的研究熱點。
1998~2010 期間CSSCI來源數(shù)據(jù)庫中,我國貝葉斯研究領域方面的377論文中所引用的所有的參考文獻(引文),構(gòu)成了我國貝葉斯研究的知識基礎[8]。本文利用CiteSpace軟件使用共引分析方法對這些論文及其引文進行作者共引和文獻共引分析,以進一步分析貝葉斯領域研究前沿的知識基礎,找出在推動我國貝葉斯發(fā)展過程中,有著杰出貢獻的作者和有著重要影響的著作。
圖2 貝葉斯研究領域重要作者的科學知識圖譜
作者共引分析的科學知識圖譜如圖2所示,其中節(jié)點代表被引作者,連線代表作者共被引關系,較大的節(jié)點集代表在貝葉斯研究領域中有突出貢獻的作者群。頻次反應節(jié)點被引得頻繁程度,中心性反應了節(jié)點在網(wǎng)絡中處于怎樣的中心地位,即在網(wǎng)絡中的影響力。由圖4所示的頻率及中心性可以看出,對我國貝葉斯研究影響較大的作者主要有茆詩松、張維迎、張堯庭、陳希孺、朱慧明、Amold Zellner、王春峰、Berger J.O.、周茜和江天驥等。
被引頻次多于5次的文獻如表5所示,這些重要文獻構(gòu)成我國貝葉斯研究最重要的知識基礎。
表5 文獻共引科學知識圖譜中的關鍵節(jié)點
由圖2和表5可以看出,茆詩松是國內(nèi)貝葉斯研究領域被引次數(shù)最多(38次)、網(wǎng)絡影響最大(中心性0.54)的作者,他的《高等數(shù)理統(tǒng)計》和《貝葉斯統(tǒng)計》也是該領域的重要文獻。1998年茆詩松教授著作了《高等數(shù)理統(tǒng)計》,1999年又編著出版了《貝葉斯統(tǒng)計》,用生動有趣的例子說明貝葉斯統(tǒng)計的基本思想和方法,為實際中使用和研究貝葉斯統(tǒng)計打下良好基礎,是一門很不錯的入門教材,該書的出版引發(fā)了讀者的學習貝葉斯興趣及使用貝葉斯方法去認識和解決實際問題的愿望和動力[2]。兩本著作均是我國貝葉斯研究領域早期的文獻之一,出版后即被國內(nèi)學者迅速引用且一直保持較高的被引頻次。
朱慧明也是國內(nèi)貝葉斯研究領域被引次數(shù)(5次)較多、網(wǎng)絡影響較大(0.4)的作者。朱慧明教授等在2006年出版了《貝葉斯多元統(tǒng)計推斷理論》和2009年出版的《貝葉斯計量經(jīng)濟學模型》,書中均附有實際案例的理論與結(jié)果分析,對從事貝葉斯計量和推斷理論研究和實際工作的讀者具有一定的參考價值,對貝葉斯推斷和貝葉斯計量的普及也做出了貢獻[9,10]。
2002年度美國經(jīng)濟學聯(lián)合會將“杰出資深會員獎”授予芝加哥大學的Amold Zellner教授,以表彰他在“貝葉斯方法”方面對計量經(jīng)濟學方面的杰出貢獻。1971年,他的名著《An Introduction to Bayesian Inference in Econometrics》問世,在貝葉斯計量經(jīng)濟學的發(fā)展史上具有里程碑的意義;1985年他在Econometrica上發(fā)表的論文“Bayesian Econometrics”再次引發(fā)了貝葉斯計量經(jīng)濟學研究的狂潮[11]。隨后逐漸形成貝葉斯計量經(jīng)濟學這一方向。在貝葉斯領域,Amold Zellner至今仍是在網(wǎng)絡中保有較高的影響力的學者之一。2005年,張堯庭教授將該著作翻譯成中文并添加了一些材料,《計量經(jīng)濟學-貝葉斯推斷引論》一書的引入,必將引導國人更進一步的了解貝葉斯方法的本質(zhì)[12]。
綜合全文的分析結(jié)果可以看出,我國貝葉斯研究有以下特點:
第一,我國貝葉斯研究進程具有自己的特點。我國貝葉斯研究起步較晚,目前正經(jīng)歷不斷發(fā)展、完善,步入蓬勃興起的階段。統(tǒng)計學類期刊在我國貝葉斯研究中起著重要的推動作用。高校是我國貝葉斯研究的中堅力量。國家級基金等各類項目的資助學術論文也有效地保證了論文的學術水平和創(chuàng)新水平。茆詩松、Zellner Amold等眾多學者及其文章和著作也是貝葉斯研究進程中不可或缺的讀物。
第二,貝葉斯主要應用及關注領域。貝葉斯方法在經(jīng)濟學、管理學、情報學、心理學以及哲學等學科領域都有其重要的應用。與貝葉斯有關的方法、推理、預測、決策,以及在企業(yè)、金融、銀行、市場等領域的應用是貝葉斯研究的重點關注領域。
第三,貝葉斯主要研究方法及研究熱點。Gibbs抽樣和MCMC模擬成為目前貝葉斯領域的主流方法。貝葉斯方法進行估計、推理、預測及網(wǎng)絡分析為我國博弈、決策和分類等分析問題提供了新的研究視角。貝葉斯方法對企業(yè)風險、金融、管理方面的推理、預測等實證分析研究,以及模型參數(shù)的分布是我國現(xiàn)階段貝葉斯領域的研究熱點。國際上,無論是在理論研究還是應用研究,貝葉斯方法都顯示出迅猛的發(fā)展勢頭。盡管我國CSSCI收錄的各領域的貝葉斯方面的論文數(shù)量逐年上升,但是在國內(nèi),對貝葉斯的研究似乎還處于蓬勃發(fā)展的前期階段,大多還處于對國外研究方法等成果的引入及消化中,尚未形成系統(tǒng)的理論及自己的特色。我國貝葉斯理論及應用研究的空間依然很廣闊,如何推動貝葉斯方法在我國的全面發(fā)展還需要不懈的努力。
[1]Brooks S.Markov Chain Monte Carlo Method and its Applicatoin[J].The Statistcian,Part 1,1998,47(1).
[2]茆詩松.貝葉斯統(tǒng)計[M].北京:中國統(tǒng)計出版社,2005.
[3]劉樂平,袁衛(wèi).現(xiàn)代貝葉斯分析與現(xiàn)代統(tǒng)計推斷[J].經(jīng)濟理論與經(jīng)濟管理,2004,(6).
[4]南京大學中國社會科學評價中心.中國社科引文索引(CSSCI)[EB/OL].http://cssci.nju.edu.cn.
[5]馬費成,張勤.國內(nèi)外知識管理研究熱點——基于詞頻的統(tǒng)計分析[J].情報學報,2006,(2).
[6]湯建民.2006年國內(nèi)科學學研究的詞頻分析與計量研究[J].科學學研究,2007,(S2).
[7]蔣永新,詹華清.基于共現(xiàn)關鍵詞統(tǒng)計的圖書館學情報學學科研究趨勢分析[J].圖書情報工作,2008,(9).
[8]陳超美,陳悅,侯劍華,等.CiteSpaceII:科學文獻中新趨勢與新動態(tài)的識別與可視化[J].情報學報,2009,(3).
[9]朱慧明,韓玉啟.貝葉斯多元統(tǒng)計推斷理論[M].北京:科學出版社,2009.
[10]朱慧明,林靜.貝葉斯計量經(jīng)濟學模型[M].北京:科學出版社,2009.
[11]Zellner Bayesian Econometrics[J].Econometrica,1985,53(2).
[12]張堯庭.計量經(jīng)濟學-貝葉斯推斷引論[M].上海:上海財經(jīng)大學出版社,2005.