楊文霞 鄧三鴻 胡昊天 孔 嘉 閆曉慧
(南京大學(xué)信息管理學(xué)院,南京,210023)
16世紀(jì)后期,論文引用制度形成,參考文獻(xiàn)成為學(xué)術(shù)論文的特征[1]。隨著國際參考文獻(xiàn)格式的逐漸規(guī)范,引文分析領(lǐng)域逐漸發(fā)展,由此引申出幾種常見引用關(guān)系,即直接引用關(guān)系、耦合關(guān)系[2]、共被引關(guān)系[3]等。其中,共被引關(guān)系是指文獻(xiàn)A、B被文獻(xiàn)C同時引用,耦合關(guān)系是指文獻(xiàn)B、C同時引用文獻(xiàn)A,直接引用關(guān)系是指文獻(xiàn)A、B、C之間存在直接引用。Liu等[4]綜合了三種引用關(guān)系,提出了三角引用的概念,指的是文獻(xiàn)A和文獻(xiàn)B被文獻(xiàn)C引用,同時文獻(xiàn)A也被文獻(xiàn)B引用的引用關(guān)系(見圖1)。他們以文獻(xiàn)A為源頭,得到文獻(xiàn)B、C的三角引用,本文稱之為正向三角引用;但若同一篇文章在三角引用中分別以文獻(xiàn)B和文獻(xiàn)C為源頭時,分別得到文獻(xiàn)A、C和文獻(xiàn)A、B的三角引用(見圖2),本文稱之為“雙向三角引用”和“逆向三角引用”,對于這兩種三角引用是否存在,若存在,那么三種三角引用數(shù)據(jù)集的范圍是否會有不同,以及三種數(shù)據(jù)集的數(shù)據(jù)特征、引用特征是否相同等問題,Liu等則未做研究。
圖1 三角引用圖示[4]
圖2 三角引用結(jié)構(gòu)及其詳解
為了補(bǔ)足三角引用的研究,本文首先對相關(guān)研究進(jìn)行了綜述,并通過對比之前的研究討論本文的貢獻(xiàn)。其次,討論三種三角引用關(guān)系在實際引用網(wǎng)絡(luò)中是否存在、存在概率;分析三種三角引用的數(shù)據(jù)特征和引用特征。最后,對以上研究進(jìn)行總結(jié)與討論,并給出未來研究展望。對三角引用關(guān)系進(jìn)行分析,有助于在更廣泛意義上統(tǒng)一引文網(wǎng)絡(luò)的基礎(chǔ)單元和結(jié)構(gòu)。
三角引用指的是A和B被C引用,同時A也被B引用的關(guān)系[4]。A、B、C分別被命名為“原始文獻(xiàn)”“中介文獻(xiàn)”和“追隨文獻(xiàn)”。其中引用-被引關(guān)系包括直接引用關(guān)系、耦合關(guān)系和共被引關(guān)系。結(jié)合社會網(wǎng)絡(luò)分析來看,三角引用屬于社會網(wǎng)絡(luò)中三方組譜系的——三方傳遞關(guān)系[5],映射到引用網(wǎng)絡(luò)中,可以理解為三方傳遞引用關(guān)系。
Liu等[6]認(rèn)為,C通過B引用A具有間接引用的特點(diǎn),并對正向三角引用中的C間接引用A的動機(jī)進(jìn)行了分析。首先,通過B→A和C→A的引文內(nèi)容相似度,識別出引文相似度較高的C,分析C間接引用A的語境和動機(jī);其次,基于內(nèi)容標(biāo)注分析三角引用關(guān)系中功能性和情感性的引用動機(jī)[7];最后,基于全文本內(nèi)容分析對三角引用關(guān)系中的引用強(qiáng)度、引用位置、引用順序和引用情感等進(jìn)行分析[8]??梢钥闯?Liu雖提出了正向三角引用,并基于此進(jìn)行了后續(xù)研究,但并未涉及本文所提出的雙向三角引用和逆向三角引用,為了拓展三角引用的研究,本文將對這三種三角引用進(jìn)行分析。
文獻(xiàn)間引用關(guān)系主要包括直接引用關(guān)系、耦合關(guān)系和共被引關(guān)系三種。不少學(xué)者采用多種引用關(guān)系結(jié)合的方式,對文獻(xiàn)進(jìn)行了比較和實證對比研究。例如,Boyack等[9]以生物醫(yī)學(xué)領(lǐng)域為例,比較了直接引用、共被引、耦合和引文上下文混合方法的聚類準(zhǔn)確性,結(jié)果表明,耦合的效果優(yōu)于共被引,同時混合方法也進(jìn)一步優(yōu)化了文獻(xiàn)耦合的結(jié)果,而直接引用最不準(zhǔn)確。然而,該文獻(xiàn)并未將三種引用關(guān)系結(jié)合分析,而若將三者結(jié)合將會發(fā)掘出更多的價值[10]。Wang、王菲菲等[11-12]以基因編輯領(lǐng)域為例,從作者角度將共被引、耦合和直接引用這三種引用關(guān)系結(jié)合得到加權(quán)直接引用網(wǎng)絡(luò)指標(biāo),結(jié)果發(fā)現(xiàn)了更多在領(lǐng)域知識交流與傳播中的重要貢獻(xiàn)者。而Liu等[4]則從引用網(wǎng)絡(luò)的角度分析三種引用關(guān)系,并將三者結(jié)合形成三角引用結(jié)構(gòu)。相比于加權(quán)引用指標(biāo),三角引用結(jié)構(gòu)更加清晰、簡潔,更能從微觀角度深入理解引用結(jié)構(gòu)。
一些學(xué)者從學(xué)科、文獻(xiàn)類型、國家、期刊影響因子等方面,分析了引用外部特征。例如,Bornmann等[13]以化學(xué)領(lǐng)域為例發(fā)現(xiàn),小領(lǐng)域發(fā)表的論文數(shù)量較少,相比一般領(lǐng)域,得到的引用機(jī)會也較少,論文被引次數(shù)更少;Moed等[14]通過研究各學(xué)科中論文下載量和被引頻次之間的相關(guān)性發(fā)現(xiàn),兩者相關(guān)性在不同學(xué)科、期刊、文獻(xiàn)類型中存在差異;Pichap-pan等[15]從作者自引的特點(diǎn)和影響等方面綜合論述了作者自引的優(yōu)勢與存在的缺點(diǎn)。此外,不同的國家由于科學(xué)背景和財政支持不同,發(fā)表的論文質(zhì)量也有高低,例如,美國機(jī)構(gòu)發(fā)表的論文通常比其他國家的機(jī)構(gòu)發(fā)表的論文得到更多的引用[16];最后,在高影響因子的期刊上發(fā)表論文會比在低影響因子的期刊上獲得更多的引用[17]。
此外,一些學(xué)者還從多個角度分析了文獻(xiàn)影響的特征。Gomes等[18]從期刊影響因子、合著者數(shù)量和機(jī)構(gòu)地址的數(shù)量三個方面得出期刊影響因子越高、合著者數(shù)量越多、機(jī)構(gòu)地址數(shù)量越多,文章的引用次數(shù)越多的研究結(jié)論。Tahamtan等[19]通過系統(tǒng)地回顧相關(guān)文獻(xiàn)指出,影響被引頻次的因素包括論文、作者、期刊三個方面的論文質(zhì)量、參考文獻(xiàn)、影響因子、出版形式、作者性別等28個因素,如龔凱樂等[20]從語言、文獻(xiàn)類型、期刊、學(xué)科等角度對中國期刊論文中的跨語言引用進(jìn)行多維分析發(fā)現(xiàn),中國學(xué)者有五種獨(dú)特的引文國際化模式。
以上研究雖然包含多種文獻(xiàn)的外部引用特征,但是未涉及三角引用,因此在上述研究的基礎(chǔ)上,本文將從數(shù)據(jù)特征、引用時間、跨語言、跨學(xué)科、文獻(xiàn)類型以及自我引用等方面研究三角引用文獻(xiàn)的外部引用特征和內(nèi)部發(fā)展趨勢。此外,三角結(jié)構(gòu)的網(wǎng)絡(luò)基礎(chǔ)片段,是整個引文網(wǎng)絡(luò)中的基本單元,傳統(tǒng)的研究或從引文的角度進(jìn)行分析,或從結(jié)構(gòu)的宏觀特征角度進(jìn)行分析,本文則從中觀層面對三角引用進(jìn)行了更為細(xì)致的分析,這對于系統(tǒng)理解引文關(guān)系以及引文網(wǎng)絡(luò)具有重要的價值和意義。
綜上所述,三角引用關(guān)系是社會網(wǎng)絡(luò)分析映射到引用網(wǎng)絡(luò)中的特殊引用結(jié)構(gòu),為了驗證雙向三角引用和逆向三角引用的存在,并分析其特征,本文提出以下問題:
1.三種三角引用是否存在?若存在,三種三角引用的特點(diǎn)、引用結(jié)構(gòu)是怎樣的?
2.三種三角引用數(shù)據(jù)集的數(shù)據(jù)特征、引用時間、跨語言引用、跨學(xué)科引用、文獻(xiàn)類型、自我引用等是否不同?
(1)不同文獻(xiàn)類型定義
原始文獻(xiàn)是同時被中介文獻(xiàn)和追隨文獻(xiàn)引用的文獻(xiàn),中介文獻(xiàn)在引用原始文獻(xiàn)的同時又被追隨文獻(xiàn)引用,追隨文獻(xiàn)則同時引用原始文獻(xiàn)和中介文獻(xiàn)。為了便于理解,本文在不同類型的三角引用中使用相同的文獻(xiàn)種類名稱,原始文獻(xiàn)、中介文獻(xiàn)和追隨文獻(xiàn)統(tǒng)一表示為A、B和C。A、B、C兩兩之間存在的引用關(guān)系,則被稱為三角引用關(guān)系。
(2)三角引用關(guān)系定義及三種三角引用
正向三角引用是以原始文獻(xiàn)為核心文獻(xiàn),基于引證文獻(xiàn)的向前檢索得到中介文獻(xiàn)和追隨文獻(xiàn)。雙向三角引用是以中介文獻(xiàn)為核心文獻(xiàn),基于引證文獻(xiàn)和參考文獻(xiàn)的向前向后相結(jié)合得到原始文獻(xiàn)和追隨文獻(xiàn)。逆向三角引用是以追隨文獻(xiàn)為核心文獻(xiàn),基于參考文獻(xiàn)的向后檢索得到原始文獻(xiàn)和中介文獻(xiàn)。
(3)三種三角引用結(jié)構(gòu)
三種三角引用不同的內(nèi)在引用結(jié)構(gòu)詳見圖2。虛線表示未真實發(fā)生三角引用,實線表示發(fā)生了引用,粗線表示發(fā)生了真實的三角引用,帶底色的A、B、C表示以該類文獻(xiàn)為核心文獻(xiàn)。
在正向三角引用中,集合Di表示原始文獻(xiàn)的引證文獻(xiàn)。由于中介文獻(xiàn)和追隨文獻(xiàn)同時引用了原始文獻(xiàn),因此中介文獻(xiàn)和追隨文獻(xiàn)都需要從原始文獻(xiàn)的引證文獻(xiàn)集合Di中析出,所以,原始文獻(xiàn)的引證文獻(xiàn)集合D中引用了其他Di的文獻(xiàn)即為追隨文獻(xiàn)C(D2、D3、D4),被其他Di引用的文獻(xiàn)即為中介文獻(xiàn)B(D1、D2)。可以看出,中介文獻(xiàn)和追隨文獻(xiàn)以集合形式出現(xiàn),且兩者存在重復(fù)文獻(xiàn)。A與集合Bi和集合Ci就組成了三角引用關(guān)系。
在雙向三角引用中,集合Ai表示中介文獻(xiàn)的參考文獻(xiàn),集合Ci表示中介文獻(xiàn)的引證文獻(xiàn)。根據(jù)中介文獻(xiàn)的參考文獻(xiàn)和引證文獻(xiàn)是否發(fā)生引用關(guān)系,得到原始文獻(xiàn)和追隨文獻(xiàn),所以Ci中引用了Ai的文獻(xiàn)即為追隨文獻(xiàn)C(C2、C4),Ai中被Ci所引用的文獻(xiàn)即為原始文獻(xiàn)A(A2、A3、A4)。原始文獻(xiàn)和追隨文獻(xiàn)以集合形式出現(xiàn),且兩者并不存在重復(fù)文獻(xiàn)。集合Ai、B與集合Ci就組成了三角引用關(guān)系。
在逆向三角引用中,集合Di表示追隨文獻(xiàn)的參考文獻(xiàn)。原始文獻(xiàn)和中介文獻(xiàn)同時被追隨文獻(xiàn)所引用,因此兩者都需要從追隨文獻(xiàn)的參考文獻(xiàn)Di中得到,所以追隨文獻(xiàn)的參考文獻(xiàn)集合D中引用了其他Di的文獻(xiàn)即為中介文獻(xiàn)C(D2、D3、D4),被其他Di引用的文獻(xiàn)即為原始文獻(xiàn)B(D1、D2)??梢钥闯?原始文獻(xiàn)和中介文獻(xiàn)以集合形式出現(xiàn),且兩者存在重復(fù)文獻(xiàn)。集合Ai、集合Bi與C就組成了三角引用關(guān)系。為了區(qū)分三種三角引用,本文對三種三角引用關(guān)系的核心文獻(xiàn)、引用過程、引用狀態(tài)和引用方向做了對比,見表1。
表1 不同三角引用對比
本文首先獲取三種三角引用關(guān)系數(shù)量以及對應(yīng)的各類文獻(xiàn)的數(shù)量;其次,分析三種三角引用關(guān)系以及對應(yīng)的各類文獻(xiàn)的存在概率;最后,對比分析三種三角引用的數(shù)據(jù)特征和引用特征,研究流程詳情見圖3。
圖3 研究流程圖
4.2.1 存在概率
確定和比較三種三角引用關(guān)系在實際引用網(wǎng)絡(luò)中的存在與覆蓋范圍,有助于確保本研究的可行性和價值。因此,對三角引用關(guān)系存在概率和三種三角引用中各類文獻(xiàn)存在概率進(jìn)行了定義,見表2。
表2 三種三角引用中各類文獻(xiàn)及引用關(guān)系存在概率公式
由圖2中三種引用結(jié)構(gòu)可知,三角引用關(guān)系是從三種文獻(xiàn)之間的直接引用關(guān)系、耦合關(guān)系和共被引關(guān)系中析出的。其中正向三角引用的中介文獻(xiàn)和追隨文獻(xiàn)都是從原始文獻(xiàn)的引證文獻(xiàn)中得到,雙向三角引用的原始文獻(xiàn)和追隨文獻(xiàn)分別是從中介文獻(xiàn)的參考文獻(xiàn)和引證文獻(xiàn)得到,逆向三角引用的原始文獻(xiàn)和中介文獻(xiàn)都是從追隨文獻(xiàn)的參考文獻(xiàn)得到,由此得到三種三角引用中各類文獻(xiàn)存在的概率公式。
4.2.2 引用特征分析
(1)引用時間分析
時間在整個科學(xué)的發(fā)展和進(jìn)化過程中扮演著重要的角色。通過搜集三種三角引用關(guān)系對應(yīng)文獻(xiàn)的出版年份,將發(fā)表時間間隔分別計算為年(A←B)、年(B←C)和年(A←C),分析比較三種三角引用關(guān)系在引用時間方面的特征。年(A←B)表示中介文獻(xiàn)B引用原始文獻(xiàn)A的時間間隔,年(A←C)表示追隨文獻(xiàn)C引用原始文獻(xiàn)A的時間間隔,年(B←C)表示追隨文獻(xiàn)C引用中介文獻(xiàn)B的時間間隔。
隨著我國經(jīng)濟(jì)的發(fā)展,人們的生活水平逐漸提高,人們在滿足物質(zhì)需求的同時,對生命質(zhì)量加強(qiáng)了重視,為了有效的提高護(hù)理質(zhì)量,現(xiàn)階段我國醫(yī)院提倡對患者進(jìn)行預(yù)見性護(hù)理,本實驗中,對研究組婦產(chǎn)科手術(shù)患者實行預(yù)見性護(hù)理,實驗結(jié)果顯示,觀察組患者護(hù)理滿意度為94.29%,高于對照組的82.54%,而并發(fā)癥發(fā)生率卻遠(yuǎn)低于對照組,這就表明預(yù)見性護(hù)理效果良好,可以有效的改善患者的心理狀態(tài),提高護(hù)理有效率,減少并發(fā)癥的發(fā)生[12-15]。
(2)跨語言分析
跨語言引用對于很多學(xué)者來說存在閱讀和理解障礙[21]。通過搜集三種三角引用關(guān)系中文獻(xiàn)的語言,了解是否存在跨語言的引用情境,并分析三種三角引用中出現(xiàn)跨語言引用的概率。由于核心文獻(xiàn)為英語,因此,根據(jù)是否為英語分為五種跨語言引用。跨語言分類見表3。
表3 三種三角引用分類情況
(3)跨學(xué)科分析
跨學(xué)科引用與參考體現(xiàn)了不同學(xué)科間知識的輸入與輸出,能夠促進(jìn)知識的發(fā)展與創(chuàng)新[22]。對三種三角引用關(guān)系中文獻(xiàn)所屬研究領(lǐng)域進(jìn)行分類,了解是否有跨學(xué)科傾向,及三種三角引用中出現(xiàn)了跨學(xué)科引用的概率。由于核心文獻(xiàn)為LIS學(xué)科,因此,根據(jù)文獻(xiàn)所屬學(xué)科是否為LIS學(xué)科,對跨學(xué)科引用進(jìn)行分類,具體見表3。
(4)文獻(xiàn)類型分析
科學(xué)文獻(xiàn)是知識的載體,主要包括期刊論文、學(xué)位論文、會議論文、報紙、圖書、專利、標(biāo)準(zhǔn)等,不同的科學(xué)文獻(xiàn)類型在科學(xué)交流中起到的作用不同,從文獻(xiàn)類型的角度,分析和比較三種三角引用關(guān)系中的文獻(xiàn)類型,找到各自側(cè)重的文獻(xiàn)類型,探討不同文獻(xiàn)類型對引用行為偏好的影響。文獻(xiàn)類型分類見表3。
(5)作者自我引用分析
一般認(rèn)為,如果一篇文獻(xiàn)中的某一位或多位作者也存在于另一篇文獻(xiàn)的作者中,那么這兩篇文獻(xiàn)之間就存在作者自我引用。本文定義了5種作者自我引用的類型,見表3。
從20篇高被引論文的正向三角引用、雙向三角引用和逆向三角引用的統(tǒng)計數(shù)據(jù)中發(fā)現(xiàn),三種三角引用包含的文獻(xiàn)總數(shù)分別為4765篇、6012篇和876篇,并分別形成了9125條、17438條和1550條三角引用關(guān)系。表4—表6和表7分別為三種三角引用的不同文獻(xiàn)和引用關(guān)系及其出現(xiàn)概率的統(tǒng)計數(shù)據(jù)和描述性統(tǒng)計。
表4 正向三角引用的統(tǒng)計數(shù)據(jù)(部分)
表5 雙向三角引用的統(tǒng)計數(shù)據(jù)(部分)
表6 逆向三角引用的統(tǒng)計數(shù)據(jù)(部分)
表7 三角引用關(guān)系中不同文獻(xiàn)和引用關(guān)系及其出現(xiàn)概率的描述性統(tǒng)計
從表4—表6可以看出,在正向三角引用中,中介文獻(xiàn)數(shù)量與追隨文獻(xiàn)數(shù)量相差較大;在雙向三角引用中,原始文獻(xiàn)數(shù)量和追隨文獻(xiàn)數(shù)量相差非常大;相比于前兩者,逆向三角引用的原始文獻(xiàn)數(shù)量和中介文獻(xiàn)數(shù)量相差較小。表7中三種三角引用中不同文獻(xiàn)類型數(shù)量之間的平均值之差和出現(xiàn)概率之差也可以側(cè)面證明以上結(jié)果。由于正向三角引用是基于引證文獻(xiàn)的前向引用,隨著時間的推移,中介文獻(xiàn)數(shù)量與追隨文獻(xiàn)數(shù)量保持動態(tài)增加,且由于C←(A、B)形成動態(tài)的共被引關(guān)系,隨著時間的拉長,C集合中新的Ci不斷出現(xiàn)。因此相對于中介文獻(xiàn),追隨文獻(xiàn)的數(shù)量在后期會保持增加,圖4可以佐證。逆向三角引用是基于參考文獻(xiàn)的后向引用,參考文獻(xiàn)是靜態(tài)的,不會隨著時間的逆向發(fā)展而一直處于增加的狀態(tài),因此出現(xiàn)了原始文獻(xiàn)數(shù)量和中介文獻(xiàn)數(shù)量相差不大的情況。而雙向三角引用是同時基于引證文獻(xiàn)和參考文獻(xiàn)的前后向結(jié)合的三角引用,引證文獻(xiàn)為動態(tài),參考文獻(xiàn)為靜態(tài),中介文獻(xiàn)一旦出版就意味著原始文獻(xiàn)的數(shù)量被固定下來,而追隨文獻(xiàn)的數(shù)量可以一直保持增長,因此,追隨文獻(xiàn)的數(shù)量和原始文獻(xiàn)的數(shù)量相差懸殊。從所有文獻(xiàn)的總和來看,雙向三角引用最多,正向三角引用次之,逆向三角引用最少。這正是由于三種三角引用的引用方向不同導(dǎo)致。
圖4 正向三角引用的年(A←B)、年(A←C)和年(B←C)分布圖
從表4—表7可以看出,三種三角引用都有相關(guān)文獻(xiàn)和三角引用關(guān)系存在,這表明,在實際引用網(wǎng)絡(luò)中,不但存在正向三角引用[4],也同樣存在雙向三角引用和逆向三角引用。雖然三種三角引用存在數(shù)量有較大差別,但是出現(xiàn)概率存在相似之處。從出現(xiàn)概率的平均值來看,雙向三角引用>正向三角引用=逆向三角引用,中值也可以側(cè)面證實。因此,在三角引用關(guān)系中較容易存在雙向三角引用。三種三角引用數(shù)據(jù)集存在明顯不同的特征,在正向三角引用中,追隨文獻(xiàn)出現(xiàn)概率的均值要大于中介文獻(xiàn),表明追隨文獻(xiàn)較中介文獻(xiàn)更易存在;在雙向三角引用中,追隨文獻(xiàn)出現(xiàn)的概率大于原始文獻(xiàn),表明追隨文獻(xiàn)較原始文獻(xiàn)更易存在;在逆向三角引用中,中介文獻(xiàn)出現(xiàn)的概率要遠(yuǎn)遠(yuǎn)大于原始文獻(xiàn),表明中介文獻(xiàn)較原始文獻(xiàn)更易存在。從時間尺度上看,除核心文獻(xiàn)外,三種三角引用中越靠前的文獻(xiàn)就越容易存在。
5.2.1 引用時間分析
分別對三種三角引用中不同類別文獻(xiàn)發(fā)表的年份間隔進(jìn)行計算。圖4—圖6分別代表正向三角引用、雙向三角引用和逆向三角引用各自的文獻(xiàn)類別年份間隔分布,其中橫軸代表時間間隔,縱軸代表文獻(xiàn)數(shù)量,不同的顏色代表不同的引用關(guān)系。
在圖4中,年份間隔出現(xiàn)負(fù)值是由于目前存在優(yōu)先發(fā)表制度。年(A←B)和年(B←C)呈典型的正態(tài)分布且兩者差距較小,年(A←C)與前兩者走勢差距較大,在0-9年呈增長趨勢,9-10年略微下降。在0-6的年份間隔中,年(A←B)和年(B←C)的數(shù)量要高于年(A←C),且分別有86.48%、84.58%的文獻(xiàn)數(shù)量分布在該年份間隔;而在6—10的年份間隔中,年(A←C)的數(shù)量則要高于前兩者,且有77.19%的文獻(xiàn)數(shù)量分布在較大的年份間隔。在較小的年份間隔區(qū)間,年(A←B)和年(B←C)的數(shù)量增加較快,且分別在4年和3年的間隔年達(dá)到峰值,而(A←C)的數(shù)量增加則較慢;隨著時間間隔變大,前兩者都在下降,而年(A←C)則是繼續(xù)增加且增加速度較快,然后在8年的年份間隔達(dá)到峰值后下降。因此,年(A←B)和年(B←C)在年份較小的間隔內(nèi)分布較多,年(A←C)在年份較大的間隔內(nèi)分布較多。
從圖5中可以看出,年(A←C)呈正態(tài)分布,年(A←B)也大致呈正態(tài)分布,其年份間隔較長則是基于參考文獻(xiàn)的角度向后引用。而年(B←C)則一直增長到8的年份間隔然后下降,其年份間隔較短是基于施引文獻(xiàn)的角度向前引用,由于來源文獻(xiàn)為2011年,因此截至2021年,最長時間為11年。就現(xiàn)有數(shù)據(jù)來看,年(B←C)雖然在8的年份間隔達(dá)到最大值,但有一直增長的可能性,而年(A←B)在6的年份間隔達(dá)到最大值,卻沒有增長潛力,意味著追隨文獻(xiàn)C對中介文獻(xiàn)B的引用可持續(xù)性更強(qiáng),這說明向前引用要比向后引用具有更強(qiáng)的發(fā)展性。雖然雙向三角引用的三種引用關(guān)系與正向三角引用并不完全相同,但仍然是年(A←B)和年(B←C)先達(dá)到峰值并在年份較小的間隔內(nèi)分布較多,年(A←C)后達(dá)到峰值,且在年份較大的間隔內(nèi)分布較多。年(A←B)在年份間隔較大時分布并不連續(xù),且在年份較大的間隔時有跳躍性增加,如30年和38年的年份間隔。
圖5 雙向三角引用的年(A←B)、年(A←C)和年(B←C)分布圖
在圖6中,三種三角引用的年份間隔基本呈正態(tài)分布,且年(A←B)和年(B←C)年份間隔的發(fā)展趨勢基本一致,但是前8年的間隔都是年(B←C)要高于年(A←B),8—13年的間隔出現(xiàn)反復(fù),之后則年(A←B)高于年(B←C)。與前兩種三角引用相比,相似的是,年(A←B)和年(B←C)先達(dá)到峰值,年(A←C)后達(dá)到峰值;年(B←C)和年(A←B)在年份較小的間隔內(nèi)分布較多,年(A←C)在年份較大的間隔內(nèi)分布較多;不同的是,在年份間隔較大時,三種引用關(guān)系分布都不連續(xù),尤其是年(B←C)。前兩種三角引用的年(A←C)分布走勢都較為和緩平滑,而逆向三角引用的年(A←C)則顯示出明顯的跳躍式走勢。
圖6 逆向三角引用的年(A←B)、年(A←C)和年(B←C)分布圖
總體來看,三種三角引用的文獻(xiàn)類別年份間隔分布完全不同,正向三角引用的年份間隔較短,為[-2,10];雙向三角引用和逆向三角引用的年份間隔則較長,分別為[0,66]和[0,56]。從數(shù)據(jù)量角度來看,雙向三角引用的引用關(guān)系數(shù)量最多,其次是正向三角引用,逆向三角引用的引用關(guān)系數(shù)量最少。綜合來看,無論在哪種三角引用中,年份間隔較短時年(A←B)和年(B←C)的文獻(xiàn)數(shù)量較多,年(A←C)的文獻(xiàn)數(shù)量較少,隨著年份間隔的拉長,年(A←B)和年(B←C)的文獻(xiàn)數(shù)量變少,年(A←C)的文獻(xiàn)數(shù)量則在增加。這意味著年份間隔較短時,年(A←B)和年(B←C)的直接引用關(guān)系反應(yīng)較快,年(A←C)的間接引用關(guān)系反應(yīng)較慢;隨著年份間隔拉長,要經(jīng)過兩個直接引用關(guān)系才能實現(xiàn)追隨文獻(xiàn)引用原始文獻(xiàn),因此,在文獻(xiàn)數(shù)量上體現(xiàn)為年(A←C)較為滯后。知識需要經(jīng)過A←B的內(nèi)化和B←C的外顯,才能實現(xiàn)A←C的知識外化。因為一篇論文被引用需要經(jīng)過同行評議、出版、閱讀、分析理解、引用等過程。經(jīng)過時間的洗禮,有價值的文獻(xiàn)被逐漸篩選出來,得到更多追隨文獻(xiàn)的引用,這也是((A、B)←C)共被引關(guān)系的動態(tài)性的表現(xiàn)。該原因較為容易理解,正向三角引用對其他兩種三角引用的原理分別是雙向和逆向的知識擴(kuò)散,正是由于正向知識擴(kuò)散的存在,才使得雙向和逆向知識擴(kuò)散和溯源成為可能。
5.2.2 跨語言分析
分別對三種三角引用關(guān)系中A、B、C所屬語言進(jìn)行分類統(tǒng)計,見表8。在本研究中,主要語言是英語。
表8 三種三角引用的語言差異
從語言類型來看,全英語引用的類型占絕對優(yōu)勢,尤其是在逆向三角引用中,說明在A、B、C都是英語的情況下,更易出現(xiàn)三角引用;在耦合英語引用中,正向三角引用和雙向三角引用較多,而逆向三角引用不存在該類型;連續(xù)英語引用和共被引英語引用則分別少量出現(xiàn)在正向三角引用和雙向三角引用中;無相同語言引用則完全沒有出現(xiàn)在任何類型的三角引用中,意味著三種文獻(xiàn)語言都不同的三角引用幾乎不可能出現(xiàn)。
通過閱讀耦合英語引用類型中的文獻(xiàn)發(fā)現(xiàn),在正向三角引用和雙向三角引用中,C引用B的內(nèi)容和B引用A的內(nèi)容存在較高的相似度。意味著在引用過程中,當(dāng)A和B同時為英語,而C為其他語言時,文獻(xiàn)C的作者是通過B來引用A的。原因是文獻(xiàn)C的作者可能受到語言閱讀和理解障礙,因此更傾向于參考或復(fù)制B的參考文獻(xiàn),從而間接引用A。而逆向三角引用中沒有出現(xiàn)該類型,是由于逆向三角引用是以C為核心文獻(xiàn),向后追溯相關(guān)研究內(nèi)容,由于受到語言障礙,更傾向于引用同種語言。
此外,本文還統(tǒng)計了正向和逆向三角引用中涉及的其他九種語言,其中西班牙語最多,在49條三角引用關(guān)系中出現(xiàn),最少的是匈牙利語,只有1條,說明和其他語言相比,西班牙語的追隨文獻(xiàn)更傾向于引用原始文獻(xiàn)A和中介文獻(xiàn)B。以上結(jié)果意味著語言差異也是影響三角引用出現(xiàn)的重要因素。
5.2.3 跨學(xué)科分析
分別對三種三角引用關(guān)系中A、B、C所屬學(xué)科進(jìn)行分類統(tǒng)計,見表9。
表9 三種三角引用的跨學(xué)科引用分布
在表9中,正向、雙向和逆向三角引用關(guān)系中跨學(xué)科引用分別為7131條、17571條和1792條,分別占三種三角引用關(guān)系的78.15%、78.39%和74.32%,其余則為同學(xué)科引用??梢钥闯?相比于同學(xué)科引用,跨學(xué)科引用在引用關(guān)系中占大部分,且更傾向于出現(xiàn)在雙向三角引用中,其次是正向三角引用,最后是逆向三角引用。耦合跨學(xué)科引用更傾向于出現(xiàn)在正向和雙向三角引用中,在逆向三角引用中共被引跨學(xué)科引用最多;連續(xù)跨學(xué)科引用在雙向和逆向三角引用中的數(shù)量都是最少的,正向三角引用中共被引跨學(xué)科引用則最少;全部跨學(xué)科引用在三種三角引用中都出現(xiàn)較多。
此外,本文還統(tǒng)計了正向三角引用、雙向三角引用和逆向三角引用中所涉及的學(xué)科,研究發(fā)現(xiàn),三種三角引用的LIS跨學(xué)科引用分別包括113種、112種和38種學(xué)科,涉及數(shù)量較多的跨學(xué)科包括computer science、business &economics、engineering、psychology、medical informatics、health care sciences &services等。這一結(jié)果與Huang等[23]和Chang等[24]的LIS跨學(xué)科研究結(jié)果基本一致。
5.2.4 文獻(xiàn)類型分析
分別對三種三角引用關(guān)系中A、B、C的文獻(xiàn)類型進(jìn)行了分類統(tǒng)計,計算不同文獻(xiàn)組合的數(shù)量和占比。表10顯示了三種三角引用關(guān)系中各類文獻(xiàn)類型組合中的排名前10的組合,圖7為三種三角引用中文獻(xiàn)類型組合的概括對比。
表10 三種三角引用中各類文獻(xiàn)類型組合分布
圖7 三種三角引用中文獻(xiàn)類型組合的概括對比
綜合來看,在三種三角引用中,A、B、C的文獻(xiàn)類型主要是article、review,其次是editorial material、proceedings paper,其他文獻(xiàn)類型包括letter、software review、book review、note、news item和discussion。一方面,article、review、editorial material和proceedings paper在三種三角引用中占有絕對優(yōu)勢,其組成的A-B-C文獻(xiàn)類型組合在三種三角引用中都在99%以上;另一方面,article、review、editorial material和proceedings paper類文獻(xiàn)在人文社科領(lǐng)域承擔(dān)著記錄和傳播主要研究成果的重任,在知識交流中扮演著重要角色,因此在引用網(wǎng)絡(luò)中也具有絕對的數(shù)量優(yōu)勢。
在三種三角引用的A-B-C文獻(xiàn)類型組合中,數(shù)量最多的是article-article-article,分別占49.61%、41.08%和43.09%,其次分別是review-article-article、article-review-article、article-article-review,各自占比17.14%、21.71%和24.58%。在圖7中,A-B-C文獻(xiàn)類型組合最多的仍然是相同文獻(xiàn)類型,如article-article-article和review-review-review,最少的則是A-B-C屬于三種不同的文獻(xiàn)類型??梢钥闯?無論是哪種三角引用,A-B-C文獻(xiàn)類型相同的組合數(shù)量都是最多的,A-B-C文獻(xiàn)類型都不同的組合數(shù)量都是最少的,這意味著,三角引用更傾向于在前者中出現(xiàn),更少在后者中出現(xiàn)。但是三種三角引用也存在不同之處,對于正向三角引用來說,共被引文獻(xiàn)類型相同的組合較多,如review-article-article,review-proceedings paper-proceedings paper等;對于雙向三角引用來說,連續(xù)文獻(xiàn)類型相同的組合較多,如article-review-article,review-article-review等;對于逆向三角引用來說,耦合文獻(xiàn)類型相同的組合則較多,review-review-article,editorial material-editorial material-article等。
5.2.5 自我引用分析
分別對三種三角引用關(guān)系中A、B、C之間自我引用進(jìn)行分類統(tǒng)計,分析結(jié)果見圖8和圖9—圖11。在圖8中,橫坐標(biāo)為文獻(xiàn)的序號,縱坐標(biāo)為作者自引在引用關(guān)系中的百分比;在圖9—圖11中,橫坐標(biāo)為文獻(xiàn)的序號,縱坐標(biāo)為不同種類的作者自引數(shù)量。
圖8 三種三角引用的作者自我引用占比
圖9 正向三角引用的自我引用分布
圖10 雙向三角引用的自我引用分布
圖11 逆向三角引用的自我引用分布
從圖8可以看出,三種折線的走勢具有一致性,意味著同一文獻(xiàn)在不同三角引用中的作者自引占比情況具有相似性,其中在三種三角引用中占比都較低的文獻(xiàn)為6—8號、12號和15號,而16號文獻(xiàn)則占比都比較高。其余文獻(xiàn)雖然在三種三角引用中占比有高有低,但基本相差不大,而10號文獻(xiàn)比較特殊,在正向和雙向三角引用中占比都較低,但在逆向三角引用中卻占比最高,且是所有占比最高的。經(jīng)查證發(fā)現(xiàn),10號文獻(xiàn)的逆向三角引用關(guān)系只有1條,且為共被引作者自引,因此出現(xiàn)了這種極端占比。
在圖9—圖11中,正向、雙向和逆向三角引用關(guān)系中作者自引分別為2591條、3887條和382條,分別占三種三角引用關(guān)系的28.39%、22.29%和24.64%??梢钥闯?相比于無作者自引,包含作者自引的引用關(guān)系占比較少,表示大部分文獻(xiàn)都是非自引,自引在三角引用中出現(xiàn)得較少,意味著有很多其他領(lǐng)域作者從事相關(guān)領(lǐng)域的研究。雖然作者自引占比較少,但是三種三角引用也存在區(qū)別,最常出現(xiàn)作者自引的是正向三角引用,其次是逆向三角引用,最后是雙向三角引用。
從圖9—圖11的縱坐標(biāo)可以看出,雙向三角引用中作者自引出現(xiàn)的次數(shù)最多,其次是正向三角引用,逆向三角引用則最少,這和上文的作者自引總量具有一致性。正向三角引用和雙向三角引用中數(shù)量最多的類型是耦合作者自引,而逆向三角引用中數(shù)量最多的則是共被引作者自引,連續(xù)作者自引在三角引用中的數(shù)量都是最少的,尤其在雙向三角引用中最少。根據(jù)作者自引類型的定義可知,耦合作者自引和共被引作者自引在引用關(guān)系中屬于直接引用,而連續(xù)作者自引屬于間接引用,因此,在正向三角引用中,向前引用時作者自引較多;在雙向和逆向三角引用中,向后引用時作者自引較多;而在三種三角引用中,連續(xù)作者自引都較少出現(xiàn)。這表示三角引用中作者的自我引用更傾向于直接引用,如B直接引用A、C直接引用B,而間接引用較少,如C引用A。這意味著文獻(xiàn)A和B之間、B和C之間大多是相似的、系統(tǒng)的或連續(xù)的研究,他們傾向于同時引用之前完整和相關(guān)的研究成果;而文獻(xiàn)A和C之間出現(xiàn)的作者自引較少,意味著文獻(xiàn)A和C之間產(chǎn)生自引較為困難,可能是由于文獻(xiàn)A和C之間的研究內(nèi)容出現(xiàn)了變化,或者對之前的研究進(jìn)行了創(chuàng)新或改進(jìn)。
此外,全作者引用在三種三角引用的作者自引中出現(xiàn)的概率分別為14.70%、8.41%和13.35%,圖9—圖11的全作者引用類型與該數(shù)據(jù)一致,可以看出,全作者引用在正向和逆向三角引用中出現(xiàn)較多,而在雙向三角引用中出現(xiàn)非常少。當(dāng)然,在三種三角引用中也存在一些全作者引用數(shù)量都較高的文獻(xiàn),如序號為11的文獻(xiàn),意味著這些文獻(xiàn)的A、B、C之間形成了系統(tǒng)性的研究,其傳承性和完整性較強(qiáng)。除了以上相同的文獻(xiàn)序號,三種三角引用之間也相互交叉一些文獻(xiàn)序號,如正向三角引用和雙向三角引用的文獻(xiàn)3和9,正向三角引用和逆向三角引用中的文獻(xiàn)2,雙向三角引用和逆向三角引用中文獻(xiàn)16和20。三種三角引用中的全作者引用數(shù)量較高的文獻(xiàn)序號既有相同又存在不同,表明三種三角引用既存在一些相似性又保持著各自的獨(dú)特性。
本文從同一篇文章在三角引用中不同位置的角度提出了正向三角引用、雙向三角引用和逆向三角引用,并對三種引用的特點(diǎn)和引用結(jié)構(gòu)進(jìn)行了分析。本文從高被引論文的角度出發(fā),獲得了三種引用的數(shù)據(jù)集,發(fā)現(xiàn)三種三角引用關(guān)系都存在于實際引用網(wǎng)絡(luò)中,且雙向三角引用中最易出現(xiàn)三角引用關(guān)系。從文獻(xiàn)數(shù)量來看,雙向三角引用最多,正向三角引用次之,逆向三角引用最少。
從引用特征來看,在引用時間上,三種三角引用中年份間隔較短時,年(A←B)和年(B←C)的數(shù)量較多,年(A←C)的數(shù)量較少,隨著時間間隔的拉長,則相反;其次,在跨語言引用上,同種語言更易出現(xiàn)三角引用,跨語言引用較少產(chǎn)生,這是由于跨語言引用時存在語言障礙;在跨學(xué)科引用上,跨學(xué)科引用在三種三角引用中占大部分,且更傾向于出現(xiàn)在雙向三角引用中,其次是正向三角引用,最后是逆向三角引用;對于文獻(xiàn)類型,三種三角引用的A、B、C文獻(xiàn)類型主要是article、review,A-B-C文獻(xiàn)類型組合中,數(shù)量最多的是相同文獻(xiàn)類型,數(shù)量最少的是不同文獻(xiàn)類型;作者自引在三種三角引用中出現(xiàn)的都較少,且都更傾向于出現(xiàn)在耦合作者自引和共被引作者自引中,較少出現(xiàn)在連續(xù)作者自引和全作者引用中。
三種三角引用既有相同之處,也存在不同之處。在文獻(xiàn)類型和作者自引中,三種三角引用表現(xiàn)一致;在出現(xiàn)概率、文獻(xiàn)數(shù)量特征,以及引用時間、跨語言引用和跨學(xué)科引用上存在區(qū)別。不同的引用方向、引用結(jié)構(gòu)都會導(dǎo)致三種三角引用存在差別。
在實際應(yīng)用方面,三角引用結(jié)構(gòu)結(jié)合文本相似度與耦合引用強(qiáng)度分析漏引、非相關(guān)引用的不合理引用行為,有助于科學(xué)合理地評價文章的影響力。以雙向三角引用為例,以文獻(xiàn)B為核心文獻(xiàn)得到文獻(xiàn)A、C,對文獻(xiàn)A、C兩兩配對得到三角引用關(guān)系的數(shù)據(jù),并刪除發(fā)生過三角引用關(guān)系的數(shù)據(jù),之后計算文章的相似度和耦合引用強(qiáng)度,其中耦合引用強(qiáng)度是指文獻(xiàn)A和C共同引用的文章數(shù)量。若相似度高且耦合引用強(qiáng)度也高,表明文獻(xiàn)存在漏引情況。以雙向三角引用為例,對三角引用關(guān)系中文獻(xiàn)A、C的相似度和耦合引用強(qiáng)度進(jìn)行計算,若相似度低且耦合引用強(qiáng)度也低,表明存在非相關(guān)引用。以上兩種不合理引用都可結(jié)合三角引用結(jié)構(gòu),從文章內(nèi)容和共同參考文獻(xiàn)數(shù)量兩方面共同分析,從而合理進(jìn)行科學(xué)計量評價。
綜上所述,本研究對三角引用進(jìn)行分類,證明了三種三角引用實際存在于引用網(wǎng)絡(luò)中,并對三種三角引用數(shù)據(jù)集的數(shù)據(jù)特征和引用特征進(jìn)行了分析。但是也存在不足,如作為一項探索性研究,數(shù)據(jù)僅限于LIS學(xué)科的高被引論文,數(shù)據(jù)量有限,不一定適應(yīng)于其他學(xué)科或引用量較少的論文;數(shù)據(jù)樣本基本為英文,不能挖掘論文的語言特征是否對三角引用有影響;在時間間隔變化過程中各個引用關(guān)系的數(shù)據(jù)表現(xiàn)、引用特征、網(wǎng)絡(luò)特征、知識流動特征的變化都有待研究。因此,為了解決以上問題,有必要對更大規(guī)模的數(shù)據(jù)進(jìn)行實證研究。
三角引用是文獻(xiàn)計量學(xué)中一種特殊的引用關(guān)系和實際存在的現(xiàn)象,具有較高的研究價值和意義。為了從更深層次了解三角引用的引用機(jī)制和知識流動特征,今后將以多個學(xué)科的文獻(xiàn)數(shù)據(jù)為研究對象,并從三類潛在三角引用的角度對三種三角引用進(jìn)行進(jìn)一步分析和深入研究,即,從文本相似度和耦合引用強(qiáng)度兩方面確定漏引和非相關(guān)引用是否存在;從語言差異、文獻(xiàn)類型、學(xué)科差異、期刊影響力、發(fā)表時間差異、文獻(xiàn)影響力、作者影響力等方面研究三角引用中漏引與非相關(guān)引用的影響因素;從引用強(qiáng)度、引用位置、引用動機(jī)、引用情感、作者自引等方面分析非相關(guān)引用的特點(diǎn),從而規(guī)避漏引與非相關(guān)引用的不合理引用行為。