[摘要]通過(guò)建立上海世博會(huì)研究文獻(xiàn)的數(shù)學(xué)模型,從文獻(xiàn)計(jì)量學(xué)視角描述了本研究領(lǐng)域的文獻(xiàn)增長(zhǎng)趨勢(shì)、作者頻率分布、高產(chǎn)與核心作者、期刊區(qū)域劃分等問(wèn)題。并通過(guò)本研究驗(yàn)證了普賴(lài)斯定律、洛特卡定律、布拉德福定律。
〔關(guān)鍵詞〕上海世博會(huì);文獻(xiàn)計(jì)量學(xué);普賴(lài)斯定律;洛特卡定律;布拉德福定律
DOI:10.3969/j.issn.1008-0821.2011.07.023
〔中圖分類(lèi)號(hào)〕G250.252 〔文獻(xiàn)標(biāo)識(shí)碼〕B 〔文章編號(hào)〕1008-0821(2011)07-0098-04
Bibliometrics Theory Based on the Establishment of Expo Shanghai China
Mathematical Model of the Research LiteratureZhang Mingwei
(1.Library,Harbin Medical University,Hrbin 150081,China;
2.Heilongjiang Medical Information Institute,Hrbin 150081,China)
〔Abstract〕Through the establishment of Expo Shanghai China mathematical model of the research literature,from the perspective of bibliometrics described the research in the field of Literature growth trends,frequency distribution of author,high yield and core authors,periodical zoning,etc.And through this research verified Price Law,Lotka Law,Bradford餾 law.
〔Keywords〕Expo Shanghai China;Bibliometrics;Price餾 law;Lotka餾 law;Bradford餾 law
1 數(shù)據(jù)來(lái)源與研究策略
1.1 數(shù)據(jù)來(lái)源
以中國(guó)知識(shí)基礎(chǔ)設(shè)施工程——中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)為數(shù)據(jù)源。
1.2 研究策略
通過(guò)高級(jí)檢索方式,以下列邏輯關(guān)系式及匹配條件檢索:
(題名=上海世界博覽會(huì))或者(題名=上海世博會(huì))(精確匹配)
檢出我國(guó)申辦和舉辦上海世博會(huì)期間的所有關(guān)于上海世博會(huì)的研究文獻(xiàn)(檢索截止日期2011年1月15日)。經(jīng)下載、篩選,剔除無(wú)作者、報(bào)道、通知等不相關(guān)的文獻(xiàn)。使用Excel、Access、超功能計(jì)算器等工具對(duì)其進(jìn)行分類(lèi)統(tǒng)計(jì)、排序整理、分析處理。分別建立普賴(lài)斯定律模型、洛特卡定律模型、布拉德福定律模型,系統(tǒng)分析上海世博會(huì)研究文獻(xiàn)的客觀(guān)規(guī)律。
2 建模分析
2.1 文獻(xiàn)增長(zhǎng)趨勢(shì),普賴(lài)斯曲線(xiàn)分析
2002年5月上海世博會(huì)的成功申辦,奠定了研究上海世博會(huì)的基礎(chǔ)。它的第一篇研究文獻(xiàn)產(chǎn)生于2001年,題為“2010上海世博會(huì)規(guī)劃概念設(shè)計(jì)國(guó)際競(jìng)賽回顧”一文,開(kāi)創(chuàng)了我國(guó)在學(xué)術(shù)界研究上海世博會(huì)的先河。經(jīng)統(tǒng)計(jì),在2001-2010年的10年間,共發(fā)表上海世博會(huì)研究文獻(xiàn)1 974篇(見(jiàn)表1)。通過(guò)表1擬合繪制了普賴(lài)斯曲線(xiàn)(見(jiàn)圖1),直觀(guān)呈現(xiàn)出指數(shù)增長(zhǎng)趨勢(shì),基本符合普賴(lài)斯指數(shù)增長(zhǎng)規(guī)律。通過(guò)觀(guān)察普賴(lài)斯曲線(xiàn)也可以看出,由于我國(guó)舉辦2010上海世博會(huì)的特殊使命,而衍生出上海世博會(huì)研究領(lǐng)域。所以2001-2007年屬于起步研究階段,2008年進(jìn)入快速增長(zhǎng)態(tài)勢(shì)[1],2010年上海世博會(huì)舉辦期間達(dá)到頂峰1 209篇。按一般研究領(lǐng)域的發(fā)展規(guī)律,它將進(jìn)入穩(wěn)定研究階段,但在特定歷史背景下,受客觀(guān)因素的影響,本研究領(lǐng)域基本不會(huì)出現(xiàn)穩(wěn)定研究階段,它將隨著后世博時(shí)代的影響而逐漸衰減,直至淡出歷史舞臺(tái)[2]。表1 上海世博會(huì)研究文獻(xiàn)年代分布統(tǒng)計(jì)
年代文獻(xiàn)量年代文獻(xiàn)量200112007752002142008121200321200939020043420101 209200543合計(jì)1 976200668
圖1 普賴(lài)斯曲線(xiàn)
2011年7月第31卷第7期基于文獻(xiàn)計(jì)量學(xué)理論建立上海世博會(huì)研究文獻(xiàn)的數(shù)學(xué)模型July,2.2 作者頻率分布,洛特卡定律分析
作者頻率分布規(guī)律一般遵循洛特卡定律。它是定量描述論文作者與論文數(shù)量之間的分布規(guī)律[3]。筆者將根據(jù)洛特卡定律,分析本研究領(lǐng)域的作者與文獻(xiàn)數(shù)量之間的關(guān)系,同時(shí)驗(yàn)證洛特卡定律和平方反比經(jīng)典公式。
洛特卡定律y(x)=c/x琻(c>0),其中:y(x)為作者頻率,c為某一研究領(lǐng)域的特征常數(shù)。
該表達(dá)式的文字描述:即發(fā)表x篇論文的作者占作者總數(shù)的比例y(x)與所發(fā)表的論文數(shù)x的n方成反比。當(dāng)n=2時(shí),即為平方反比經(jīng)典公式y(tǒng)(x)=c/x2,(c=0.6079)。
經(jīng)統(tǒng)計(jì),本研究領(lǐng)域的文獻(xiàn),系由1 426位作者所撰寫(xiě)。將作者發(fā)表文獻(xiàn)按數(shù)量排序,并計(jì)算出所需相關(guān)數(shù)據(jù)列于表2。由于洛特卡定律是一個(gè)冪函數(shù),所以首先要利用最小二乘法估算出n值,經(jīng)數(shù)學(xué)解析轉(zhuǎn)換得出:
n=N∑xy-∑x∑yN∑x2-(∑x)2 (N為作者總數(shù))
將表2數(shù)據(jù)代入上式,求得本研究領(lǐng)域的n=0.8618,由于n值不等于或不接近于2,所以不符合洛特卡平方反比經(jīng)典公式[4],符合洛特卡定律的一般表達(dá)形式,y(x)=c/x0.8618。
下面通過(guò)y(x)=c/x0.8618,公式推導(dǎo)出c=∑(1/x0.8618),將表2中的x數(shù)據(jù)代入,得出:C=2.973。所以本研究領(lǐng)域的作者頻率分布的洛特卡定律描述為:y(x)= 2.973/x0.8618。表2 作者發(fā)文數(shù)量分布統(tǒng)計(jì)
(篇/人)論文數(shù)x作者人數(shù)y論文數(shù)XYXYX2111111.0414001.084510110100162120.77820.3010.23420.6056512600.69891.07920.75430.4885416640.60211.20410.72490.36253772310.47711.88650.90.227622715420.3012.43290.73230.090611 0461 04603.019500∑1 4261 9764.89879.92323.34573.8593注:X=lgx,Y=lgy2.3 高產(chǎn)與核心作者,普賴(lài)斯定律分析
普賴(lài)斯描述了核心生產(chǎn)者分布的平方根定律(亦稱(chēng)普賴(lài)斯定律)。即:在特定的領(lǐng)域中,全部論文的半數(shù)系由該領(lǐng)域中全部作者數(shù)量的平方根的那些人發(fā)表的[6]。無(wú)疑“那些人”即為高產(chǎn)作者。本研究領(lǐng)域中,全部作者人數(shù)為1 426位作者,那么高產(chǎn)作者:n=(1426)1/2=37.76≈38人,對(duì)照表2可以看出,發(fā)文4篇以上的作者有32位,可以確定他們即為本研究領(lǐng)域的高產(chǎn)作者(見(jiàn)表3)。
同理普賴(lài)斯根據(jù)平方根定律進(jìn)一步解析出核心作者理論。即:發(fā)表m篇以上論文的作者為核心作者[5],表達(dá)式為m=0.749(x璵ax)1/2,其中:x璵ax為發(fā)文量最多作者的發(fā)文篇數(shù)。
將表2數(shù)據(jù)代入求得:m=0.749(11)1/2=2.484≈3篇。說(shuō)明本研究領(lǐng)域的核心作者系發(fā)文3篇以上的作者。
又根據(jù)普賴(lài)斯“在某一研究領(lǐng)域約有75%的科學(xué)家一生中只發(fā)表一篇論文”的闡述[5]。由表2得出本研究領(lǐng)域發(fā)表1篇論文的作者占總作者人數(shù)的73.35%,結(jié)論與普賴(lài)斯闡述的一致。
另外,從表3的統(tǒng)計(jì)結(jié)果可以看出,在32位高產(chǎn)作者中,高校占21位,而同濟(jì)大學(xué)占18位,可見(jiàn)高校且同濟(jì)大學(xué)是本研究領(lǐng)域的核心機(jī)構(gòu)。表3 高產(chǎn)作者分布統(tǒng)計(jì)(發(fā)文4篇以上)
序號(hào)作者單 位發(fā)文量
(篇)1樂(lè) 云同濟(jì)大學(xué)112吳志強(qiáng)同濟(jì)大學(xué)103陳小鴻同濟(jì)大學(xué)64何清華同濟(jì)大學(xué)65周華林上海市建工總公司56薛偉辰同濟(jì)大學(xué)57杜豫川同濟(jì)大學(xué)58王恒棟上海市政工程設(shè)計(jì)研究院59陳建輝東華大學(xué)510林選泉上海浦東建筑設(shè)計(jì)研究院有限公司511龍文志中國(guó)建筑金屬結(jié)構(gòu)協(xié)會(huì)
光電建筑應(yīng)用委員會(huì)512唐子來(lái)同濟(jì)大學(xué)513劉月琴同濟(jì)大學(xué)514孫立軍同濟(jì)大學(xué)515胡 玎同濟(jì)大學(xué)516張其林同濟(jì)大學(xué)517龍惟定同濟(jì)大學(xué)418胡 玎上海市風(fēng)景園林學(xué)會(huì)419邵 丹上海城市綜合交通規(guī)劃所420王 越上海同濟(jì)城市規(guī)劃設(shè)計(jì)院421朱 昊上海城市綜合交通規(guī)劃所422李永奎同濟(jì)大學(xué)423王 越同濟(jì)大學(xué)4 續(xù)表3
序號(hào)作者單 位發(fā)文量
(篇)24李克平同濟(jì)大學(xué)425沈友弟上海市消防總隊(duì)426王 越《城市規(guī)劃學(xué)刊》427張 姿同濟(jì)大學(xué)428李武英上海《建筑時(shí)報(bào)》社429郭英之復(fù)旦大學(xué)430張青萍南京林業(yè)大學(xué)431胡 翔同濟(jì)大學(xué)432章 明同濟(jì)大學(xué)42.4 期刊區(qū)域劃分,布拉德福定律分析
文獻(xiàn)在期刊上的分布遵循布拉德福定律。它是定量描述科學(xué)論文在相關(guān)期刊中,集中與離散狀況的一個(gè)規(guī)律[7]。根據(jù)布拉德福期刊區(qū)域劃分規(guī)則,將某一研究領(lǐng)域的載文期刊劃分為3個(gè)區(qū)域(核心區(qū)、相關(guān)區(qū)、離散區(qū)),盡可能使每個(gè)區(qū)所包含的論文數(shù)量大體相當(dāng),如果3個(gè)區(qū)域的期刊數(shù)量之比滿(mǎn)足:n1∶n2∶n3=1∶a∶a2(其中:n1、n2、n3為3個(gè)區(qū)域的期刊數(shù)量,a為布拉德福系數(shù),a>1),則它的分布規(guī)律符合布拉德福定律。
經(jīng)統(tǒng)計(jì),本研究領(lǐng)域的1 976篇文獻(xiàn)分布在782種期刊中。按上述規(guī)則繪制布拉德福期刊分區(qū)表(見(jiàn)表4)。分析表明,3個(gè)區(qū)域的論文數(shù)量大體相當(dāng),核心區(qū)的論文來(lái)自數(shù)量不多但效率最高的39種期刊,相關(guān)區(qū)包括數(shù)量較多,效率一般的146種期刊,而離散區(qū)包括數(shù)量最多而效率很低的597種期刊[6]。三者的期刊數(shù)量之比為:
39∶146∶597≈40∶160∶640=1∶a∶a2 本例布拉德福系數(shù)a=4
即:39∶146∶597≈1∶4∶42
顯然上述表達(dá)式與布拉德福定律相吻合,說(shuō)明本研究領(lǐng)域的期刊分布規(guī)律符合布拉德福定律。表5列出了論文數(shù)量占總文獻(xiàn)1/3的核心區(qū)載文期刊,39種核心期刊只占期刊總數(shù)的4.98%;載文612篇,占總文獻(xiàn)的30.97%。所以,可以認(rèn)定列在核心區(qū)的39種期刊,即為本研究領(lǐng)域的核心期刊。
表4 布拉德福期刊分區(qū)表
分區(qū)類(lèi)別期刊載文數(shù)量n期刊數(shù)量論文數(shù)量占論文總數(shù)%平均載文密度(篇/種)核心區(qū)n≥93961230.9715.69相關(guān)區(qū)3≤n<914664032.394.38離散區(qū)n<359772436.341.21表5 核心區(qū)載文期刊分布(載文9篇以上)
期 刊 名 稱(chēng)期刊數(shù)量
(種)每種期刊
載文量期刊數(shù)量
累計(jì)和C期刊數(shù)量
累計(jì)和lgC載文量
累計(jì)和R(n)時(shí)代建筑1591059建筑施工15220.3010111規(guī)劃師12430.4771135上海建設(shè)科技12340.6020158建筑學(xué)報(bào)12250.6989180建筑創(chuàng)作/新安全東方消防22170.8451222施工技術(shù)/裝飾22090.9542262對(duì)外傳播/建筑結(jié)構(gòu)219111.0413300建筑技術(shù)117121.0792317城市環(huán)境設(shè)計(jì)116131.1139333交通與運(yùn)輸115141.1461348廣西城鎮(zhèn)建設(shè)/建筑與文化/園林314171.2304390China餾 Foreign Trade/現(xiàn)代電視技術(shù)213191.2787416上海城市規(guī)劃112201.3010428網(wǎng)印工業(yè)/制冷技術(shù)211221.3424450國(guó)際市場(chǎng)/滬港經(jīng)濟(jì)/建設(shè)科技/暖通空調(diào)/智能建筑與城市信息/中國(guó)建筑裝飾裝修/中國(guó)廣告/中國(guó)無(wú)線(xiàn)電/中國(guó)園林910311.4914540城市規(guī)劃學(xué)刊/城市交通/浦東開(kāi)發(fā)/上?;ぃ虾F髽I(yè)/消防科學(xué)與技術(shù)/中國(guó)殘疾人/中國(guó)建筑金屬結(jié)構(gòu)89391.591161288471.6721676127591.7709760(相關(guān)區(qū)期刊從略)146731.8633844135861.93459094641322.12061 0935331852.26721 252(離散區(qū)期刊從略)12723122.49421 50647017822.89321 976
為了進(jìn)一步直觀(guān)描述期刊的集中與離散現(xiàn)象,根據(jù)表5的相關(guān)數(shù)據(jù),以期刊數(shù)量的對(duì)數(shù)lgC為橫坐標(biāo),以“期刊數(shù)量”乘以“每種期刊載文量的累計(jì)和R(n)”為縱坐標(biāo),擬合出布拉德福曲線(xiàn)(見(jiàn)圖2)。分析可見(jiàn),它由兩部分構(gòu)成,首先AB段是一條上升的指數(shù)曲線(xiàn)[8],它對(duì)應(yīng)為核心區(qū);B(1.5911,612)點(diǎn)為核心區(qū)的拐點(diǎn),PB段是一段線(xiàn)性上升的直線(xiàn),對(duì)應(yīng)為相關(guān)區(qū)和離散區(qū)。這充分說(shuō)明了本研究領(lǐng)域的期刊分布規(guī)律存在明顯的集中與離散現(xiàn)象。
圖2 布拉德福曲線(xiàn)
3 討 論
3.1 應(yīng)用洛特卡定律要慎重
洛特卡定律最經(jīng)典的、最有影響的,也是應(yīng)用最廣泛的,是他的平方反比公式。只有擬合為平方反比關(guān)系,其結(jié)論才有意義。而本研究領(lǐng)域擬合的作者頻率分布模型,不符合洛特卡平方反比經(jīng)典公式,其驗(yàn)證結(jié)果出乎筆者期望。經(jīng)查閱相關(guān)資料證明,即:無(wú)論是國(guó)外的還是國(guó)內(nèi)的學(xué)者,通過(guò)不同的研究方式來(lái)驗(yàn)證洛特卡定律,有的研究數(shù)據(jù)符合洛特卡定律,有的則不支持,甚至相反于洛特卡定律。因此,洛特卡定律在某些領(lǐng)域內(nèi)是符合的,在有些領(lǐng)域內(nèi)卻是有出入的[5]。
所以,在應(yīng)用洛特卡定律時(shí)一定要慎重。如果擬合結(jié)果出現(xiàn)較大偏離,必要時(shí)可以通過(guò)K—S檢驗(yàn)來(lái)進(jìn)一步驗(yàn)證,最終證明是否符合洛特卡分布[5]。
3.2 普賴(lài)斯定律的局限性
普賴(lài)斯定律是在洛特卡定律的基礎(chǔ)上推演而來(lái)的,不能孤立的研究普賴(lài)斯定律[5]。而本例中應(yīng)用普賴(lài)斯平方根定律產(chǎn)生的高產(chǎn)作者,經(jīng)驗(yàn)證表明,發(fā)文數(shù)量不足200篇,并非全部論文的半數(shù),說(shuō)明普賴(lài)斯平方根定律的應(yīng)用環(huán)境是有條件的,且與洛特卡定律是分不開(kāi)的。究其原因在于:其一,洛特卡定律是由一般規(guī)則導(dǎo)致的理論模式,是一種靜態(tài)表述,而文獻(xiàn)的發(fā)展是動(dòng)態(tài)的,恰好是洛特卡定律的缺陷[3],而直接的表現(xiàn)就是洛特卡定律的參數(shù)n是通過(guò)最小二乘法的方式估算出來(lái)的。通過(guò)很多學(xué)者的驗(yàn)證,確實(shí)存在應(yīng)用領(lǐng)域的局限性,同時(shí)也提出了一些改進(jìn)算法,如用回歸分析的估算方法求解n值,其擬合結(jié)果將更具一般性[5];其二,洛特卡的數(shù)據(jù)抽取方法欠科學(xué),在數(shù)據(jù)量大的情況下應(yīng)用洛特卡定律,其結(jié)果才比較客觀(guān)[6]。所以由于洛特卡定律不夠嚴(yán)謹(jǐn)[5],而導(dǎo)致普賴(lài)斯定律的應(yīng)用局限。而本研究領(lǐng)域恰好是新興學(xué)科,統(tǒng)計(jì)年限跨度較短、樣本量少,也是導(dǎo)致這一結(jié)果的重要原因之一。
通過(guò)上述分析,應(yīng)用洛特卡定律與普賴(lài)斯定律應(yīng)注意它的相對(duì)靜止的適用環(huán)境。即:某一研究領(lǐng)域已進(jìn)入穩(wěn)定的研究期;數(shù)據(jù)采集年限跨度要長(zhǎng);樣本量要大。
3.3 布拉德福定律的核心效應(yīng)顯著
本研究應(yīng)用布拉德福定律,成功的建立了期刊區(qū)域劃分模型和布拉德福曲線(xiàn),數(shù)據(jù)擬合的非常理想。無(wú)論是布拉德福期刊分區(qū)表,還是布拉德福曲線(xiàn)圖,均高度驗(yàn)證了期刊的核心與離散現(xiàn)象。
又因?yàn)椴祭赂O禂?shù)a,一直被核心期刊研究領(lǐng)域堅(jiān)信,它是反映任何學(xué)科期刊分布狀況的一個(gè)重要參數(shù),a值越大,核心效應(yīng)越強(qiáng),反之核心效應(yīng)越弱[6]。本例中a≈4,a值相對(duì)較大[6],由此可見(jiàn),其核心效應(yīng)是顯著的。
參考文獻(xiàn)
[1]張明偉,張胉,等.5.12汶川大地震相關(guān)研究文獻(xiàn)的分布調(diào)查[J].情報(bào)雜志,2010,(11):57-61.
[2]張明偉,張胉,等.我國(guó)MARCh研究文獻(xiàn)的發(fā)展趨勢(shì)與預(yù)測(cè)[J].圖書(shū)情報(bào)工作,2006,50(1):49-50,99.
[3]王靜,王宏鑫,等.關(guān)于Lotka定律的研究[J].情報(bào)雜志,2007,(4):94-96.
[4]周愛(ài)民.洛特卡參數(shù)的新評(píng)估法[J].現(xiàn)代情報(bào),2010,30(12):18-21.
[5]劉婧.文獻(xiàn)作者分布規(guī)律研究——對(duì)十五年來(lái)國(guó)內(nèi)洛特卡定律、普賴(lài)斯定律研究成果綜述[J].情報(bào)科學(xué),2004,22(1):123-128.
[6]邱均平.信息計(jì)量學(xué)[M].武漢:武漢大學(xué)出版社,2007.
[7]邱均平,劉敏,等.1998-2007年我國(guó)競(jìng)爭(zhēng)情報(bào)領(lǐng)域論文的計(jì)量規(guī)律研究[J].情報(bào)科學(xué),2009,27(9):1281-1285.
[8]趙玉珍.運(yùn)用布拉德福定律研究沙棘文獻(xiàn)的核心期刊[J].情報(bào)科學(xué),2009,18(5):462-464.
注:“本文中所涉及到的圖表、公式、注解等請(qǐng)以PDF格式閱讀”