□孫玉偉
數(shù)字環(huán)境下科學交流模型的分析與評述
□孫玉偉
詳細介紹數(shù)字環(huán)境下國外具有代表性的幾種科學交流模型,包括Hurd模型、S?ndergaard模型、SCLC模型、arXiv的路徑模型。在此基礎(chǔ)上,從研究角度、研究內(nèi)容、研究方法、研究的深度和廣度方面對4個模型進行對比分析和客觀評述,指出4個模型的不同點和共同之處,最后對數(shù)字時代科學交流模型的進展做出展望。
數(shù)字化 科學交流模型 開放獲取
從米哈伊洛夫在1976年出版的《科學交流與情報學》提出科學交流包括正式和非正式交流過程[1]以來,國外一些有代表性的數(shù)字化科學交流模型也相繼提出。近年來隨著開放獲取運動的開展,科學交流的模式也發(fā)生了巨大變化,基于開放獲取的數(shù)字化科學交流模型也在蓬勃發(fā)展之中。
20世紀70年代,社會學家William Garvey和Belver Griffith斷言:“交流是科學的本質(zhì)”[2],并基于心理學領(lǐng)域的研究提出了科學交流模型——Garvey—Griffith模型[3],此模型描述了科學交流從原始的研究到研究成果發(fā)布的詳細過程,在時間跨度上,不同的學科會有所不同,但本質(zhì)核心的階段是通用的??紤]到數(shù)字環(huán)境對科學交流帶來的變化,美國學者Julie M.Hurd從20世紀90年代針對互聯(lián)網(wǎng)上出現(xiàn)的電子郵件、列表服務器以及電子出版物等數(shù)字化要素,重新對Garvey—Griffith模型提出的科學交流過程進行數(shù)字化改進,并于2004年把互聯(lián)網(wǎng)上出現(xiàn)的自存檔和機構(gòu)庫也納入思考范圍,提出了2020的學術(shù)交流模型[4],稱為Hurd模型,如圖1所示。
Hurd模型將數(shù)字信息鏈中出現(xiàn)的一系列現(xiàn)象納入了思考范圍:Internet上預印本服務器和機構(gòu)倉儲庫的增多;集成商在數(shù)字圖書館與出版商之間發(fā)揮越來越大的作用;電子檔案長期保存的需求。并基于以下假設(shè):第一,科學研究的實施是基于合作的,而不是個人行為;第二,研究報告的內(nèi)容包括研究結(jié)果和支持研究的隱含信息;第三,所有與研究相關(guān)的成果都以數(shù)字形式發(fā)布。
圖1 科學交流模型:2020年
此模型描述了學術(shù)文章生命周期的多層次信息鏈的集成[5],從生命周期的最后端往前集成:大規(guī)模的電子檔案將擔負長期保存各種數(shù)字圖書館館藏的功能;數(shù)字圖書館從多個集成商獲取數(shù)字資料;集成商本身包括來自電子期刊的內(nèi)容;電子期刊以來自不同的預印本服務器發(fā)布的資料為基礎(chǔ);預印本和電子期刊發(fā)布的資料來自大量的合作實驗室或者個人作者。
UNISIST是科技信息領(lǐng)域一個政府間的合作項目,而 UNISIST模型是聯(lián)合國教科文組織(UNESCO)和國際科學聯(lián)盟理事會(ICSU)合作四年的成果[7]。UNISIST模型基于文獻的分類將科學交流中的信息分為三類:一次信息源、二次信息源、三次信息源;科學交流的參與者包括:信息生產(chǎn)者、使用者、信息中介;并通過三種渠道交流科研成果:非正式交流渠道、正式交流渠道、表單渠道。UNISIST模型為科學交流的進一步研究提供了通用框架模型。
由于UNISIST模型的提出沒有考慮到互聯(lián)網(wǎng)給科學交流帶來的變化以及不同學科領(lǐng)域科學交流的差異,Fjordback S?ndergaard等人對 UNISIST模型進行修改和升級,于2003年提出S?ndergaard模型[8],分為三個子模型:①基于互聯(lián)網(wǎng)的學術(shù)交流模型;②反映數(shù)字交流和傳統(tǒng)交流并適用于一切學科領(lǐng)域的通用科學交流模型;③反映學科差異并適用于某一具體學科領(lǐng)域的學科交流模型,如圖2所示。在不同的學科,預印本的作用差異是比較大的,高能物理學科的預印本在科學交流過程中的作用,就比預印本在化學和藥理學科研過程中發(fā)揮的作用大得多??梢詫?ndergaard學科交流模型看作是三個子模型的綜合,因為此模型既反映了互聯(lián)網(wǎng)給傳統(tǒng)科學交流帶來的變化又考慮了不同學科科學交流的差異。
圖 2 S? ndergaard學科交流模型
在S?ndergaard學科交流模型中,非正式交流要素包括傳統(tǒng)的講演會議和基于互聯(lián)網(wǎng)的新聞組、列表服務器、E-mail、電子/網(wǎng)絡(luò)會議、公告牌。正式交流要素包括:傳統(tǒng)的已經(jīng)出版的正式出版物和未正式出版發(fā)行的論文報告以及基于互聯(lián)網(wǎng)的電子期刊、在線期刊、科研組織服務器上未出版的論文報告、預印本、電子圖書館、搜索引擎、虛擬圖書館等。從科學交流的要素分析,S?ndergaard模型加入了數(shù)字科學交流要素,充分考慮了數(shù)字環(huán)境中新技術(shù)的應用。S?ndergaard等人基于20世紀90年代倡導的領(lǐng)域分析(Domain-Analytic)方法,創(chuàng)建了學科模型,將S?ndergaard通用模型用橢圓包括起來,以表示特定學科領(lǐng)域的科學交流,輸入和輸出表示某一特定學科領(lǐng)域是開放的,它與其他學科領(lǐng)域能夠互相依存,相互重疊,并融合于整個自然科學、社會科學和人文科學之中。S?ndergaard等人引入地理維度和時間維度,以地理維度來說明不同的國家和地區(qū)有不同的學術(shù)交流傳統(tǒng),相同的學科在不同的國家受矚目的程度不同,從而影響科學交流;而時間維度是借鑒Garvey-Griffith模型關(guān)于科學交流周期的思想來修正S?ndergaard模型。
科學交流的生命周期模型(SCLC模型)是2000-2006年歐盟資助的科學信息交流自組織機構(gòu)庫建設(shè)(SciX)和芬蘭科學院資助的開放科學交流(OACS)兩個項目的部分研究成果,由芬蘭的B.-C.Bj?rk于2005年提出 SCLC模型的第三版,圖 3是SCLC模型眾多圖表中的A0綜合圖表,用于理解科學交流的層次結(jié)構(gòu)具有重要意義。此模型利用制造業(yè)中的企業(yè)流程再造模型方法IDEF0建立,目的是為政策制定者提供了一個詳細的路線圖,涵蓋從開始研究到應用研究成果再到改善日常生活的整個科學交流價值鏈。SCLC模型包括正式和非正式交流以及原始數(shù)據(jù)的出版,并重點關(guān)注以下幾點:傳統(tǒng)的同行評議期刊的出版索引過程;讀者發(fā)現(xiàn)以及獲取文獻的一系列活動;互聯(lián)網(wǎng)上出現(xiàn)的新的交流方式,如開放獲取期刊和電子預印本文庫等。
SCLC模型的整個過程包括用5個大的要素來描述:活動 、輸入、輸出、控制、機制,其中活動包括 4個階段:資助研發(fā)、進行研究、交流成果、應用知識,這4個階段分別有相應的輸入、輸出、控制、機制。4個階段中的任何一個子活動又可以分解為不同的子階段,并有相應的輸入、輸出、控制、機制作用于子階段,以此類推,構(gòu)成等級式的圖表。如圖3是所有圖表中的A0綜合圖表,其中的“資助研發(fā)1”階段又可以有A11、A12……階段,A11又可以有A111、A112……。目前的版本(Version 7.0)包括:53個圖表,190個活動,并處于不斷完善之中。2008年,由英國的聯(lián)合信息系統(tǒng)委員會(JISC)資助的澳大利亞的維多利亞大學和英國的拉夫堡大學兩個團隊對芬蘭學者Bo-Christer Bj?rk在2007年提出的模型進行升級[10],提出了科學出版的經(jīng)濟學模型(EI-ASPM),主要包括兩個方面[11]:①強調(diào)了不同出版模型的不同之處;②對模型中的每一處活動所涉及到的花費進行經(jīng)濟分析。目的是衡量科學交流的整個過程中的花費和帶來的利益,以幫助利益相關(guān)者理解正在興起的科學出版模型(如:提交、開放獲取以及自存檔三種出版模型)的制定、預算和經(jīng)濟含義。
圖3 SCLC模型——A0綜合圖表:研究、交流、成果的運用
20世紀90年代,Roosendaal和Geurts在對正式科學交流分析的基礎(chǔ)上,提出每個科學交流系統(tǒng)必須實現(xiàn)的五部分功能,包括:注冊、確認、認知、歸檔、獎勵[12];21世紀初,Herbert Van de Sompel等人在分析了當前學術(shù)交流存在的時滯問題和不同數(shù)據(jù)格式轉(zhuǎn)化問題的基礎(chǔ)上,認為將來的數(shù)字化學術(shù)交流系統(tǒng)應該支持分布式的異構(gòu)數(shù)據(jù)源的互操作,并結(jié)合Roosendaal和Geurts的研究成果從價值鏈的角度將以上五部分功能鏈接在一起,提出了學術(shù)交流的通用路徑模型[13]。
Herbert Van de Sompel等人通過在物理學領(lǐng)域已經(jīng)出現(xiàn)的arXiv學術(shù)生態(tài)系統(tǒng)來描述科學交流的通用路徑模型,如圖 4所示,某一科學交流單元——電子手稿從進入arXiv到經(jīng)過一系列的功能節(jié)點,實現(xiàn)了科學交流過程的各部分功能,信息流的每一步用帶數(shù)字的箭頭表示,箭頭的方向和每個節(jié)點的多個數(shù)字箭頭分別表示電子手稿在科學交流系統(tǒng)中前進的方向和可以通過不同的路徑到達下一功能節(jié)點。整個過程描述為:用戶將某一科學交流單元(如:數(shù)據(jù)、非正式科研成果、預印本等)提交到科學交流系統(tǒng),通過注冊他的成果;確認成果的有效性;讓其他學者知曉他的研究發(fā)現(xiàn);保存研究成果;最后通過評價可以獲得相應的獎勵。
此模型將學術(shù)交流的每個節(jié)點功能都加入了數(shù)字化的特征來區(qū)別傳統(tǒng)的學術(shù)交流模式,如:在認知節(jié)點,arXiv通過讓提交的手稿在網(wǎng)絡(luò)上自由獲取,并讓搜索引擎索引手稿內(nèi)容,以及將研究成果通知相關(guān)學者等數(shù)字化手段來實現(xiàn)認知功能;又如歸檔功能,通過對網(wǎng)絡(luò)上的分布式控制鏡像系統(tǒng)的操作來保證有足夠的空間對科研成果進行備份;再如在獎勵節(jié)點,傳統(tǒng)的學術(shù)評價是通過作者在在ISI收錄的期刊中發(fā)表論文的次數(shù)及其影響因子等方式來確定獎勵的標準,而在arXiv路徑模型中,引入了一個免費的支持在線搜索的引文搜索引擎——Citebase[14],試圖讓Citebase來記錄科研成果從注冊到使用以及引用的情況,繼而確定科研獎勵的標準。
圖4 arXiv的路徑模型
此模型作為一個通用的路徑模型,描述了數(shù)字化科學交流的基本步驟,有利于進行擴展。由澳大利亞聯(lián)邦政府科教培訓部資助的DART項目[15],對arXiv的路徑模型中的科學交流過程重新概念化,在原來五個功能節(jié)點的基礎(chǔ)上加入了研究和標注兩個功能節(jié)點,將科學交流的路徑更新為:研究、注冊、確認、認知、歸檔、標注、獎勵。此模型對每個節(jié)點給研究者和公眾帶來的利益進行分析,并對如何帶來利益進行了模型化構(gòu)建。有關(guān)該模型的詳細描述請參見網(wǎng)站http://dart.edu.au/文檔下載。
Hurd模型是從信息鏈的角度建立模型,描述學術(shù)文章生命周期的多層次信息鏈的集成;S?ndergaard模型是從三個角度包括基于互聯(lián)網(wǎng)的角度、傳統(tǒng)和數(shù)字相結(jié)合的通用角度以及學科的角度分別建立模型,但其特色之處在于從學科的角度建立用來反映學科差異并適用于某一具體學科領(lǐng)域的學科交流模型;SCLC模型及其擴展模型是從經(jīng)濟學的角度考慮科學交流整個過程中的活動、輸入、輸出、質(zhì)量控制以及保障機制所用到的成本和帶來的利益,它的層次化的等級機構(gòu)正印證了米哈伊洛夫等人在《科學交流與情報學》的論斷[16]:“等級機構(gòu)是科學交流系統(tǒng)最穩(wěn)定的結(jié)構(gòu)”。arXiv的路徑模型是從微觀價值鏈的角度建立的基于開放獲取的路徑模型,探討所有數(shù)字化科學交流的基本步驟。
研究角度的不同決定了研究內(nèi)容的側(cè)重點,Hurd模型通過對數(shù)字信息鏈中出現(xiàn)的預印本服務器、開放存取庫、數(shù)字圖書館等新數(shù)字節(jié)點的研究,重新考慮了數(shù)字化給科學交流帶來的影響,重點研究了這些數(shù)字節(jié)點的多層次集成;S?ndergaard等人將信息分為一次信息源、二次信息源、三次信息源,分別建立基于互聯(lián)網(wǎng)的學術(shù)交流模型、通用科學交流模型、學科交流模型,并著重研究了學科交流模型;SCLC模型是圍繞企業(yè)流程再造模型方法中的活動、輸入、輸出、控制、機制等方面進行詳細描述,將涉及到的成本和利益進行評估;arXiv的路徑模型的初衷是建立適用于所有數(shù)字化科學交流的基本步驟,同一功能節(jié)點可以通過不同的路徑到達。
Hurd模型是對傳統(tǒng)Garvey-Griffith模型的過程進行數(shù)字化重構(gòu),因此可以認為是通過過程模型法構(gòu)建的;S?ndergaard學科模型是基于20世紀90年代倡導的領(lǐng)域分析(Domain-Analytic)方法創(chuàng)建的模型,該方法強調(diào)在信息檢索、知識組織等科學交流活動中,比較和分析各知識領(lǐng)域交流機構(gòu)之間差異性的重要意義。SCLC模型是利用制造業(yè)中的企業(yè)流程再造模型方法IDEF0建立,arXiv的路徑模型是抽取數(shù)字化科學交流系統(tǒng)的基本流程作為建模的根據(jù),因此我們可以認為此模型利用的是抽象模型法。這些方法涉及了哲學、管理學、情報學、經(jīng)濟學等社會科學領(lǐng)域。
Hurd模型從宏觀上系統(tǒng)地考慮了數(shù)字信息鏈各要素的集成,但無學科劃分,沒有考慮從傳統(tǒng)到數(shù)字化科學交流在經(jīng)濟、法律以及行為等領(lǐng)域要解決的問題,比如出版商要考慮傳統(tǒng)出版物到電子出版物的價格以及版權(quán)等問題。S?ndergaard模型對UNISIST模型進行擴展,在充分考慮數(shù)字化給科學交流帶來變化的基礎(chǔ)上,引入地理緯度考慮不同國家地區(qū)對同一學科的重視程度,建立了能反映不同學科交流特征的S?ndergaard學科交流模型,并借鑒Hurd模型中引入的時間緯度,從科學交流的生命周期角度完善科學交流模型。DART項目對arXiv的路徑模型進行擴展,將功能節(jié)點擴展到七個,并對每個節(jié)點進行了成本收益的分析,說明arXiv的路徑模型具有較好的擴展性。與其他三種模型相比,SCLC模型對科學交流中的每個階段進行細分,充分考慮了每個階段所涉及到的活動、機制、控制、經(jīng)濟等因素。其特點有:涵蓋更多的系統(tǒng)要素;包括更多的功能建模;將科學交流的價值鏈延伸到科研成果的消化和吸收;重點突出了它在經(jīng)濟分析中的可擴展性[11]。
四個模型的相同之處是均考慮了數(shù)字化給科學交流帶來的影響:Hurd模型中的E-mail、列表服務器、電子出版物以及自存檔、機構(gòu)庫[17]等;S?ndergaard學科交流模型中的正式和非正式數(shù)字交流要素如:新聞組、列表服務器 、E-mail、電子/網(wǎng)絡(luò)會議、公告牌、電子期刊、在線期刊、科研組織服務器上未出版的論文報告、預印本、電子圖書館、搜索引擎、虛擬圖書館等。SCLC模型也考慮了開放獲取數(shù)據(jù)庫和成果采集庫的建立,以及后來的經(jīng)濟學擴展模型也考慮了開放獲取和自存檔模型的成本利益分析;arXiv的路徑模型是基于開放獲取理念提出的,它的數(shù)字化特征和Hurd模型均比較明顯。
對以上四種模型的簡單介紹和評述,我們可以看到不同的模型采用的研究角度、方法都有差異,目前還沒有一個能夠囊括科學交流所有要素的完備模型。筆者通過總結(jié)發(fā)現(xiàn),盡管不同的科學交流模型采用不同的論文提交和評審模式來保證論文的質(zhì)量,但同行評議是所有數(shù)字化科學交流模型的共同特征[18],將來的數(shù)字化學術(shù)交流系統(tǒng)研究應該具有以下特點:支持分布式的異構(gòu)數(shù)據(jù)源的互操作[13],保證數(shù)據(jù)安全,自動建立索引,減少成果發(fā)布的時滯和花費,適應不同學科標準的變化[19]。另外,基于美國圖書館學會對“科學交流”的定義[20]:科學交流是一個系統(tǒng),通過這一系統(tǒng)研究成果和作品被創(chuàng)造,其質(zhì)量被評價,被擴散到學術(shù)社團,并且為未來的使用而長期保存。科學交流模型要遵循系統(tǒng)化的觀點,在考慮過程的同時要將經(jīng)濟、法律、行為等相關(guān)因素考慮在內(nèi)。當前的數(shù)字化科學交流模型正處于蓬勃發(fā)展之中,其中基于作者付費的開放獲取模型是當前研究的熱點[5]。
1 米哈伊洛夫,喬爾內(nèi)等.科學交流與情報學.北京:科學技術(shù)文獻出版社,1980:49-61
2 Garvey,W.D.Communication:the essence of science.Elmsford,NY:Pergamon Press,1979
3 Garvey,W.D.,Belver,C.Communication and information processing within scientific disciplines:empirical findings for psychology.Information Storage and Retrieval,1972:8,3,123-136
4 Hurd,J.M.T he transformation of scientific communication:a model for 2020.Journal of the American Society for Information Science,2000,51(14):1279—1283
5 Mackenzie Owen.J.The scientific article in the age of digitization.Netherlands:Springer,2007:74-75
6 徐麗芳.Unisist模型及其數(shù)字化發(fā)展.圖書情報工作,2008(10):68
7 Hj? rland,B.,Fjordback S? ndergaard,T.&Andersen,J.UNISIST model and knowledge domains.Encyclopedia of Library and Information Science,2005(4):1-4
8 Fjordback S? ndergaard,T.Andersen,J.&Hj? rland,B.Documents and the communication of scientific and scholarly information:revising and updating the UNISIST model.Journal of Documentation,2003,59(3):278-320
9 Bj? rk,B-C.A model of scientific communication as a g lobal distributed information system.Information Research,2007,12(2).[2009-03-27] http://informationr.net/ir/12-2/paper307.html
10 [2009-02-20].http://www.cfses.com/EI-ASPM/SCLCM-V7/.
11 Houghton,J.W.,Rasmussen,B.,Sheehan,P.J.,Oppenheim,C.,Morris,A.,Creaser,C.,Greenwood,H.,Summers,M.and Gourlay,A.Economic implications of alternative scholarly publishing models:exploring the costs and benefits.[2009-02-21]http://www.jisc.ac.uk/media/documents/publications/rpteconomicoapublishing.pdf
12 Roosendaal,Hans E.and Geurts,Peter A.Th.M.Forces and functions in scientific communication:an analy sis of their interplay.[2009-03-28].http://doc.utwente.nl/60395/1/Roosendaal97forces.pdf.
13 Van de Sompel,H.,Pay ette,S.,Erickson,J.,Lag oze,C.,Warner,S.,Rethinking scholarly communication:building the system that scholars deserve,D-Lib M agazine 2004,10(9).[2009-03-27].http://www.dlib.org/dlib/september04/vandesompel/09vandesompel.html
14 在線引文搜索引擎.[2009-03-18].http://www.citebase.org/search.
15 澳大利亞莫納什大學DART項目組.[2009-03-18].http://dart.edu.au/.
16 同1:66
17 Hurd,J.Scientific communication:new roles and new players.Science&Technology Libraries,2004:25(1-2):5-22
18 Julie M.Hurd.T he transformation of scientific communication:a model for 2020.Journal of the American Society for Informaion Science,2000,51(14):1281
19 Buck,A.,Flagan,C.&Coles,B.Scholar's forum:a new model for scholarly communication.[2009-02-21].http://library.caltech.edu/publications/scholarsforum/scholarsforum.pdf
20 徐佳寧,羅金增.現(xiàn)代科學交流體系的重組與功能實現(xiàn).圖書情報工作,2007(11):94
Analysis on Scientific Communication Models in Digital Environments
Several representative scientific communication models are illustrated in detail,including Hurd model,S?ndergaard model,SCLC model,and arXiv Pathways model.Based on which the author makes analysis and comments about similarities and differences among angles,contents,methods,scopes and depths in research.Finally,an outlook on digitizing scientific communication models is made.
Digitization;Scientific Communication Model;Open Access
山東師范大學圖書館,濟南,250014
2009年5月6日