摘要:[目的/意義]通過收集日本大學機構(gòu)知識庫的社會化應(yīng)用行為相關(guān)信息,分析日本大學機構(gòu)知識庫的社會化應(yīng)用行為現(xiàn)狀。[方法/過程]通過文獻調(diào)研了解目前有關(guān)機構(gòu)知識庫社會化應(yīng)用行為相關(guān)研究的研究情況,并且通過訪問不同機構(gòu)知識庫網(wǎng)站、不同大學的校內(nèi)數(shù)據(jù)庫網(wǎng)站與日本國立信息學研究所的相關(guān)網(wǎng)站來梳理機構(gòu)知識庫與其他領(lǐng)域數(shù)據(jù)庫的關(guān)聯(lián)關(guān)系。[結(jié)果/結(jié)論]日本大學機構(gòu)知識庫通過在出臺的政策文件中明確自身定位,針對IR資源發(fā)布專門描述元數(shù)據(jù)格式,OAI-PMH的應(yīng)用以及數(shù)據(jù)庫之間數(shù)據(jù)互操作等措施來加強社會化應(yīng)用程度。在未來數(shù)據(jù)互操作對象還將擴展到出版行業(yè)等相關(guān)領(lǐng)域并開展更加深入的數(shù)據(jù)服務(wù)。
關(guān)鍵詞:機構(gòu)知識庫 社會化應(yīng)用 開放獲取 社會化
分類號:G250
引用格式:李肸. 日本大學機構(gòu)知識庫社會化應(yīng)用行為現(xiàn)狀研究[J/OL]. 知識管理論壇, 2016, 1(6): 423-432[引用日期]. http://www.kmf.ac.cn/p/1/71/.
1 引言
機構(gòu)知識庫(institutional repository,以下簡稱IR)作為開放獲取的重要實現(xiàn)途徑之一,逐漸為人們所重視。大學作為社會中重要的科研教育機構(gòu),數(shù)量眾多、種類多樣,大學建設(shè)的IR成為實現(xiàn)資源開放獲取的重要渠道。隨著大學對于開放獲取的認識不斷加深,對于學術(shù)資源開放共享的需求不斷增加,越來越多的大學開始嘗試建設(shè)自己的IR。
IR自誕生之日起至今不過十余年時間,與傳統(tǒng)學術(shù)期刊相比普遍缺少知名度,加之涉及到IR的知識產(chǎn)權(quán)問題較為復雜,使得IR在采集資源方面存在一定困難;資源的不足又使得IR自身知名度提升障礙重重,從而產(chǎn)生惡性循環(huán),IR的功能無法被充分發(fā)揮。
知識產(chǎn)權(quán)的問題需要在現(xiàn)有法律條文基礎(chǔ)上,通過出臺相應(yīng)的規(guī)范加以解決,這是一個長期的過程,需要不斷地開展理論研究與實踐方面的工作;但通過采取特定方式開展IR工作,如積極開放自身數(shù)據(jù)、開展宣傳活動,或借助一定計算機技術(shù)手段,積極開發(fā)與其他數(shù)據(jù)庫的互操作功能,與其他數(shù)據(jù)庫內(nèi)數(shù)據(jù)建立關(guān)聯(lián)共同發(fā)揮作用,可以迅速提高IR的知名度,提升IR在學術(shù)活動中的地位,從而積極發(fā)揮作用。上述活動可視為IR的社會化應(yīng)用行為的具體內(nèi)容。
1 IR社會化應(yīng)用行為概述
1.1 基本含義
IR社會化應(yīng)用行為,即IR收錄數(shù)據(jù)的社會化應(yīng)用行為,是指通過加強IR及其數(shù)據(jù)的開放程度,努力提高IR及其數(shù)據(jù)的社會認知,并與現(xiàn)有其他數(shù)據(jù)庫及其中數(shù)據(jù)建立聯(lián)系,在各個領(lǐng)域積極滿足信息需求的各類行為。通過多種方式將資源信息推送給用戶,幫助用戶無障礙獲取到全文,提高IR知名度,是推動IR社會化應(yīng)用的根本目的。IR社會化應(yīng)用行為的數(shù)據(jù)對象包括IR收錄的各種數(shù)據(jù)以及IR未收錄但能夠與之直接或間接建立關(guān)聯(lián)的各類數(shù)據(jù);IR社會化應(yīng)用行為的參與者除IR管理者自身外,也包括IR成果的提供者、各類用戶、IR成果的正式出版者、商業(yè)數(shù)據(jù)庫公司等各類社會群體與機構(gòu),這些社會群體與機構(gòu)能夠與IR數(shù)據(jù)建立聯(lián)系,并積極促進IR資源的廣泛應(yīng)用。
1.2 相關(guān)要求
IR社會化應(yīng)用行為受到自身角色定位、數(shù)據(jù)結(jié)構(gòu)與內(nèi)容、技術(shù)手段等方面因素的影響。另外IR管理者開展的宣傳推廣、培訓交流等活動也會對IR的社會化應(yīng)用行為產(chǎn)生影響。從宏觀層面來說,IR社會化應(yīng)用要求IR能夠較好地融入社會數(shù)據(jù)大環(huán)境中,提高社會參與度,發(fā)揮開放獲取的優(yōu)勢來促進信息資源的共享交流;從微觀層面來說,IR社會化應(yīng)用行為的有效推進,要求IR自身要有準確的角色定位與規(guī)范的數(shù)據(jù)格式。
在角色定位上,IR應(yīng)明確自身是實現(xiàn)開放獲取的重要途徑之一,而數(shù)據(jù)的高度開放是關(guān)鍵前提。開放的數(shù)據(jù)不僅包括內(nèi)容數(shù)據(jù)的開放獲取,也包括IR內(nèi)元數(shù)據(jù)以及利用統(tǒng)計數(shù)據(jù)等各類IR服務(wù)產(chǎn)生的數(shù)據(jù)的公開??傮w而言,IR管理者在運營維護IR時所產(chǎn)生的數(shù)據(jù)之中,除涉及個人隱私以及處于延遲開放獲取階段的資源的相關(guān)數(shù)據(jù)外,其余均應(yīng)開放獲取,以滿足不同利用者的個性化信息需求。
規(guī)范的數(shù)據(jù)格式是指IR內(nèi)部資源組織的數(shù)據(jù)格式符合國際行業(yè)規(guī)范,采用國際通用的元數(shù)據(jù)標準來描述數(shù)據(jù),或者采用在通用元數(shù)據(jù)標準基礎(chǔ)上進行改造的符合本機構(gòu)和IR資源特點、具備一定擴展功能的元數(shù)據(jù)格式。規(guī)范的數(shù)據(jù)格式首先可以允許某機構(gòu)IR能夠與同領(lǐng)域內(nèi)其他IR資源數(shù)據(jù)建立關(guān)聯(lián);其次則便于與其他領(lǐng)域數(shù)據(jù)建立關(guān)聯(lián),突破領(lǐng)域限制來發(fā)揮作用。數(shù)據(jù)格式的規(guī)范也便于借助統(tǒng)一的元數(shù)據(jù)協(xié)議來收割元數(shù)據(jù),實現(xiàn)IR元數(shù)據(jù)與內(nèi)容數(shù)據(jù)的區(qū)域性聚合,從而為國家層面IR服務(wù)或搜索引擎檢索提供可能,最終促進IR自身的發(fā)展。
1.3 IR社會化應(yīng)用與IR開放獲取的區(qū)別
IR社會化應(yīng)用模式具有單純的開放獲取所沒有的特點。首先,社會化應(yīng)用模式強調(diào)積極開放,主動服務(wù)。通過IR主動服務(wù),來為各類型IR用戶甚至潛在的IR用戶提供便利,幫助其獲取需要的文獻資源。與圖書館工作中強調(diào)的主動服務(wù)直接面向用戶的服務(wù)方式有所不同,有些IR社會化應(yīng)用行為,如與其他數(shù)據(jù)庫建立數(shù)據(jù)互操作等并未涉及IR的用戶,但實際上仍是在為用戶訪問、使用IR提供便利。其次,IR社會化應(yīng)用行為涉及參與者較多。IR社會化應(yīng)用的參與者應(yīng)包括所有能夠為IR數(shù)據(jù)利用提供便利的組織或個人,而不單是IR管理者。因此,IR的開放獲取不等于IR的社會化應(yīng)用。兩者主要區(qū)別在于前者僅停留在IR各類型數(shù)據(jù)開放獲取的階段,較少涉及IR應(yīng)用;而后者則在開放獲取的基礎(chǔ)上嘗試突破機構(gòu)、領(lǐng)域的限制,與其他各類型數(shù)據(jù)集建立關(guān)聯(lián),開展數(shù)據(jù)服務(wù)。IR社會化應(yīng)用模式要比開放獲取更強調(diào)主動服務(wù),開放獲取只是IR社會化應(yīng)用模式的基礎(chǔ)。
正如海量信息環(huán)境與用戶特定信息需求之間的矛盾促使圖書館服務(wù)理念從被動服務(wù)向主動服務(wù)轉(zhuǎn)變一樣,IR也面臨著類似的問題。要想充分發(fā)揮IR作用,發(fā)揮所收錄文獻資源的價值,IR便不能停留在開放獲取的階段。
2 研究現(xiàn)狀與研究方法
2.1 國內(nèi)外研究現(xiàn)狀
目前關(guān)于IR社會化應(yīng)用的研究,主要集中于數(shù)據(jù)互操作方面,為滿足數(shù)據(jù)的互操作需求,數(shù)據(jù)交換協(xié)議以及系統(tǒng)關(guān)聯(lián)等成為常見的研究主題。
姚曉娜等論述了OAI-PMH的相關(guān)功能,并探討了應(yīng)用OAI-PMH時存在的一些問題并給出了解決方法[1]。陳曉鳳等在OAI-PMH的基礎(chǔ)上論述了OAI-ORE在IR建設(shè)及功能發(fā)揮中的作用[2]。千葉大學尾城孝一等在《日本學術(shù)機構(gòu)知識庫構(gòu)建的嘗試——以千葉大學和國立信息學研究所合作事例為例》一文中探討了OAI-PMH相關(guān)概念理論,并詳細論述了千葉大學學術(shù)成果知識庫借助OAI-PMH與日本國立信息學研究所元數(shù)據(jù)數(shù)據(jù)庫進行元數(shù)據(jù)的交互情況[3]。九州大學林豊等探討了OAI-ORE并將其稱為OAI-PMH的后續(xù)規(guī)范協(xié)議[4]。王?;ǖ忍接懥薕RCID、iAuthor與IR之間的數(shù)據(jù)交互模式,提出了基于iAuthor的技術(shù)框架,并在蘭州大學IR平臺上開展了應(yīng)用實踐[5]。
在系統(tǒng)關(guān)聯(lián)實踐方面,以倫敦大學學院為代表的英國大學圖書館推行了RIOJA項目(Repository Interface for Overlaid Journal Archives)[6]。該項目嘗試開發(fā)融合自存檔平臺arXiv與電子出版系統(tǒng)OJS(Open Journal Systems)部分功能的工具來提高文獻資源的收錄、共享速率。在系統(tǒng)數(shù)據(jù)互操作方面,名古屋大學山本哲也等在不同系統(tǒng)之間的數(shù)據(jù)轉(zhuǎn)換方面開展了相關(guān)研究[7];同樣是來自名古屋大學的棚橋是之等在責任者名稱規(guī)范處理系統(tǒng)開發(fā)方面開展了研究[8]。
2.2 研究方法與數(shù)據(jù)來源
筆者主要通過文獻調(diào)研的方法來開展研究。在梳理日本大學IR社會化現(xiàn)狀時,借助Office Visio軟件繪制數(shù)據(jù)利用結(jié)構(gòu)圖,以此來直觀表現(xiàn)日本大學IR開展的社會化應(yīng)用開展現(xiàn)狀。筆者通過訪問日本國立信息學研究所(National Institute of Informatics,以下簡稱NII)學術(shù)機構(gòu)知識庫構(gòu)筑合作支援事業(yè)網(wǎng)站來收集日本國內(nèi)大學IR的相關(guān)信息;通過該網(wǎng)站委托事業(yè)欄目來收集大學在建設(shè)IR過程中參與、開展的與IR社會化應(yīng)用行為相關(guān)的研究活動信息;通過OAI-PMH官方網(wǎng)站以及NII的“元數(shù)據(jù)-數(shù)據(jù)庫共同構(gòu)建事業(yè)網(wǎng)站”來收集日本大學IR應(yīng)用OAI-PMH協(xié)議的相關(guān)信息;通過日本國內(nèi)最大的研究者信息平臺researchmap和一些大學IR來收集IR與相關(guān)系統(tǒng)嵌套的實際案例信息。
3 日本大學IR社會化應(yīng)用現(xiàn)狀
3.1 日本IR發(fā)展環(huán)境
在21世紀初期,NII等機構(gòu)開始實施“最先進學術(shù)信息基礎(chǔ)項目”(Cyber Science Infrastructure),借助互聯(lián)網(wǎng)建設(shè)共享的信息資源網(wǎng)絡(luò)。為推動該項目的進展,NII開始與國內(nèi)大學密切合作,科研成果傳播網(wǎng)絡(luò)的建設(shè)是其中重要的合作內(nèi)容[9]。在大學產(chǎn)出的研究成果向社會傳播的過程中,大學IR發(fā)揮的作用備受期待,因此通過開展IR委托項目為大學建設(shè)IR提供幫助被納入到體系建設(shè)之中。為了幫助大學建設(shè)IR,NII自2005年開始與國內(nèi)有意向建設(shè)IR的大學共同開展IR委托項目。委托項目涉及IR建設(shè)發(fā)展的各個方面,NII會給予確定的IR委托項目一定的資金支持。
2013年,獨立行政法人科學技術(shù)振興機構(gòu)(Japan Science and Technology Agency,以下 簡稱JST)發(fā)布了開放獲取政策的正式方針文件[10],促進IR利用的相關(guān)政策策略被寫入方針的具體措施部分。該方針的公布加快了日本國內(nèi)開放獲取的進程。JST運營管理的數(shù)字雜志免費公開系統(tǒng)——科學技術(shù)信息發(fā)布-流通綜合系統(tǒng)(Japan Science and Technology Information Aggregator,Electronic,以下簡稱J-STAGE)發(fā)布的《利用規(guī)約》中,也明確了J-STAGE的定位與目的,即促進數(shù)字化科學技術(shù)文獻在國內(nèi)及國際范圍內(nèi)的流通傳播,推動開發(fā)獲取不斷發(fā)展的信息發(fā)送-流通基礎(chǔ)平臺[11]。上述政策文件自然也對開放獲取重要實現(xiàn)途徑之一的IR的整體發(fā)展產(chǎn)生了積極的影響
眾多大學圖書館在數(shù)字資源的共建共享方面也開展了更為廣泛、深入的合作與交流。2010年10月,NII與國公私立大學圖書館合作委員會達成了一份有關(guān)數(shù)字資源建設(shè)與利用的合作協(xié)議書。在此基礎(chǔ)上,2011年4月,成立了以確保日本大學教學與研究所需的電子資源能夠穩(wěn)定、持續(xù)被獲取為目的的大學圖書館共同體聯(lián)盟(Japan Alliance of University Library Consortia for E-Resources,以下簡稱JUSTICE)。JUSTICE會與出版商等版權(quán)所有者交涉電子資源的購入與利用條件,并且在電子資源管理系統(tǒng)方面為各個會員館提供支援。為了提高館員的數(shù)字資源方面的管理與利用能力,JUSTICE還舉辦研修會,發(fā)布專門面向負責數(shù)字資源工作的館員的培訓資料與宣傳材料[12]??梢哉fJUSTICE從資源、平臺、人才等多個角度積極影響著大學圖書館數(shù)字資源的建設(shè)情況,其中,作為數(shù)字資源建設(shè)的重要內(nèi)容之一的IR也不斷引起學界的重視,其影響力也在不斷提高。
3.2 日本大學建設(shè)IR現(xiàn)狀
根據(jù)文部科學省面向國內(nèi)國立、公立和私立大學開展的“學術(shù)信息基礎(chǔ)實態(tài)調(diào)查”2015年度調(diào)查結(jié)果可得日本國內(nèi)大學建設(shè)IR統(tǒng)計數(shù)據(jù),如表1所示[13]:
在此基礎(chǔ)上,根據(jù)文部科學省統(tǒng)計的日本大學數(shù)量,可以計算出日本國內(nèi)約有56.5%的大學建設(shè)有IR,其中98.8%的國立大學、69.8%的公立大學和48.6%的私立大學建設(shè)有自己的IR;此外還有約24%的大學有建設(shè)IR的意愿。由此可見,在日本國內(nèi),大學建設(shè)的IR數(shù)量規(guī)模較大,研究、實踐活動已取得較為豐富的成果,建設(shè)、發(fā)展環(huán)境相對成熟,因此研究日本大學IR的社會化應(yīng)用現(xiàn)狀能夠為完善IR相關(guān)理論提供參考,能夠發(fā)現(xiàn)IR在社會化應(yīng)用過程中凸顯的優(yōu)勢與不足。
3.3 日本大學開展的IR社會化應(yīng)用行為相關(guān)研究活動
通過調(diào)研統(tǒng)計,筆者發(fā)現(xiàn)自2006年開始直到2011年共6年間,每年都會有兩個以上的研究項目與IR社會化應(yīng)用行為有關(guān),以下選取較為典型的研究項目進行介紹,這些項目的信息如表2[14]所示:
提高機構(gòu)知識庫資源發(fā)現(xiàn)及獲取成功率的調(diào)查研究開發(fā)項目(Access path to Institutional Resources via link resolvers,以下簡稱AIRway項目)是以建立集中呈現(xiàn)IR等數(shù)據(jù)庫內(nèi)收錄的開放獲取資源的門戶為目的。通過AIRway,訪問者可以在具有使用權(quán)限的數(shù)據(jù)庫中快速定位、獲取某一資源的可獲取鏈接,從而縮短獲取原文的時間[15]。
面向知識庫與電子出版合作模型構(gòu)建的實驗性開發(fā)項目由早稻田大學、京都大學、廣島大學、長崎大學和佐賀大學等5所高校共同承擔,其目的是開發(fā)具有出版審查功能的日語版本數(shù)字出版系統(tǒng),來幫助紀要論文等校內(nèi)發(fā)行物更快地被收錄入IR從而實現(xiàn)開放獲取[16]。
3.4 日本大學IR社會化應(yīng)用模型結(jié)構(gòu)
IR社會化應(yīng)用行為多種多樣,凡是能夠促進IR資源應(yīng)用、提高IR知名度的社會群體均應(yīng)被納入到到IR社會化應(yīng)用模式范疇之中。目前,日本國內(nèi)IR在社會化應(yīng)用參與方面,主要參與對象除IR領(lǐng)域內(nèi)各類IR及輔助應(yīng)用數(shù)據(jù)庫如IRDB成果分析系統(tǒng)、日本國內(nèi)的國家層面IR服務(wù)JAIRO外,還包括校內(nèi)研究者信息數(shù)據(jù)庫、日本國家層面的研究者信息數(shù)據(jù)庫researchmap等研究者信息平臺、各個高校校內(nèi)研究者數(shù)據(jù)庫、日本國立國會圖書館(National Diet Library,以下簡稱NDL)等圖書館、J-GLOBAL等學術(shù)信息門戶網(wǎng)站和Google等搜索引擎。日本大學IR社會化應(yīng)用結(jié)構(gòu)如圖1所示,圖中實線箭頭代表已經(jīng)實現(xiàn)的較為可行的數(shù)據(jù)互操作行為,虛線箭頭代表仍處于探索階段的數(shù)據(jù)互操作行為。
各個大學IR以及其他校內(nèi)數(shù)據(jù)庫例如研究者信息數(shù)據(jù)庫等是開展IR社會化應(yīng)用活動的基礎(chǔ),IR可直接面向用戶提供服務(wù),也可以通過IRDB系統(tǒng)或JAIRO來提供訪問、檢索與資源獲取,同時還可以通過與校內(nèi)其他數(shù)據(jù)庫之間建立數(shù)據(jù)互操作關(guān)聯(lián),來為用戶提供種類多樣的訪問方式:用戶訪問其他校內(nèi)數(shù)據(jù)庫時可以通過特定鏈接訪問IR,也可以借助以校內(nèi)研究者信息數(shù)據(jù)庫、科研成果數(shù)據(jù)庫為數(shù)據(jù)基礎(chǔ)的researchmap、J-GLOBAL等各類信息平臺門戶來增加用戶訪問IR的途徑。通過OAI-PMH,Google等搜索引擎可以對IR內(nèi)元數(shù)據(jù)進行收割,因此通過搜索引擎用戶可以直接檢索到IR內(nèi)的文獻資源,并通過搜索引擎提供的鏈接訪問IR并獲取資源。
隨著一些國家層面的開放獲取文獻政策的變化,圖書館的OPAC檢索功能也在IR社會化應(yīng)用中發(fā)揮了作用。例如自2013年日本博士論文提交政策變化后,越來越多的IR開始收錄本校的博士論文。在政策變化之前,博士論文呈繳工作主要由NDL來負責。隨著NDL與IR的數(shù)據(jù)共享,NDL會自動采集收錄到IR中的博士論文的相關(guān)數(shù)據(jù),用戶可以通過NDL的OPAC檢索功能來檢索IR中的博士論文資源。
與出版領(lǐng)域數(shù)據(jù)庫開展合作是推進IR社會化應(yīng)用的重要一環(huán)。在研究方面,很早便有大學如早稻田大學、名古屋大學等開展過相關(guān)研究。早稻田大學自2006年開始便在NII開展的IR委托項目中,主持“電子出版(編輯審查)系統(tǒng)開發(fā)”項目[16],其目的可概括為簡化IR登記收錄紀要文獻、校內(nèi)發(fā)行物等資源的操作流程,實現(xiàn)校內(nèi)發(fā)行物的電子出版。2006-2009年間,該項目不斷取得進展,并建立了專題網(wǎng)站。2008年,利用OJS開發(fā)的出版系統(tǒng)開發(fā)完成。在電子資源出版過程中,電子出版系統(tǒng)作為平臺,為資源創(chuàng)作者提供投稿功能,待出版完成后供圖書館員提取數(shù)據(jù),向IR內(nèi)登錄出版成果相關(guān)數(shù)據(jù)。IR與出版系統(tǒng)建立數(shù)據(jù)的交互,使得符合要求的成果在正式出版之時便能夠被IR收錄,從成果生命周期角度來看,能夠?qū)⒊晒拈_放獲取時間提前至其誕生之時,甚至還處于創(chuàng)作階段、未正式發(fā)表的成果,也能夠被納入開放獲取的范疇內(nèi),從而延長了成果的開放獲取時間。
ERDB-JP數(shù)據(jù)庫,是由眾多學會、出版社、大學等機構(gòu)共同建設(shè),集中呈現(xiàn)日本國內(nèi)出版發(fā)行的電子雜志、電子數(shù)據(jù)等文獻資源數(shù)據(jù)的開放性知識空間。該數(shù)據(jù)庫來源于ERDB(Electronic Resources Database)項目,開始于2012年,是由NII和日本國內(nèi)多所大學圖書館共同推動開展的科研項目。日本大學IR內(nèi)收錄的大量的紀要論文及校內(nèi)發(fā)行物,通過在大學IR與ERDB-JP之間進行數(shù)據(jù)共享,可以使得IR內(nèi)收錄的上述類型資源相關(guān)數(shù)據(jù)被高效廣泛傳播,拓展了IR數(shù)據(jù)的利用途徑,也為提高IR內(nèi)成果的利用創(chuàng)造了有利條件。ERDB-JP計劃通過程序自動抓取IR內(nèi)數(shù)據(jù),將抓取信息的網(wǎng)址錄入ERDB-JP用戶信息數(shù)據(jù)庫中。相關(guān)工作已在2016年6月啟動[17]。
researchmap與JAIRO Cloud之間也正積極開展合作,信州大學研究者總覽數(shù)據(jù)庫與信州大學IR之間的數(shù)據(jù)互操作發(fā)展,正是在researchmap與JAIRO Cloud合作基礎(chǔ)上進行的探索性實踐之一。與researchmap等系統(tǒng)的數(shù)據(jù)交互,為IR與社會其他領(lǐng)域信息系統(tǒng)開展合作探索了方法道路,積累了合作經(jīng)驗,為IR更好地融入社會大數(shù)據(jù)環(huán)境產(chǎn)生了積極影響。
訪問IR途徑的多樣化提高了用戶訪問IR的可能性,降低了獲取資源的時間成本,使IR應(yīng)用更加便利,對于IR的發(fā)展利用極為有利。在日本大學IR社會化應(yīng)用的實踐中,通過調(diào)研筆者發(fā)現(xiàn)總體呈現(xiàn)快速發(fā)展的良好勢頭,但在某些領(lǐng)域依然存在不足,后續(xù)發(fā)展空間很大。在日本國內(nèi),絕大多數(shù)大學建設(shè)的IR已經(jīng)實現(xiàn)了資源的開放獲取,獲取IR內(nèi)收錄的文獻資源基本沒有障礙。然而,有一些IR在收錄資源并實行開放獲取后沒有進一步開展相關(guān)服務(wù)。IR只有在用戶訪問IR網(wǎng)站,瀏覽、下載資源時才會發(fā)揮作用。在IR與出版領(lǐng)域?qū)崿F(xiàn)數(shù)據(jù)交互方面的實踐非常有限,相關(guān)進展依然處于實驗探索階段。
4 社會化應(yīng)用行為相關(guān)措施
IR作為復雜的信息系統(tǒng),其社會化應(yīng)用行為的實現(xiàn)需要基于多方面因素的共同作用才能實現(xiàn)。筆者認為,IR應(yīng)用政策即IR自身定位、IR數(shù)據(jù)格式、元數(shù)據(jù)收割協(xié)議的應(yīng)用以及IR與相關(guān)系統(tǒng)的互操作等4個因素較為重要,前三者是IR社會化應(yīng)用模式的基礎(chǔ),與相關(guān)系統(tǒng)的互操作是社會化應(yīng)用模式的具體表現(xiàn),且這4個因素目前比較容易實現(xiàn)。因此筆者嘗試圍繞上述4個因素進行介紹、分析。
4.1 IR自身定位
筆者通過調(diào)研日本國內(nèi)大學IR的網(wǎng)站、圖書館收集IR運營方針及政策性文件,來了解該大學對IR的定位情況以及開放獲取方式。IR網(wǎng)站上公布的對于自身職能的界定、著作權(quán)說明信息、合理使用規(guī)范等,可以為判斷IR開放政策提供參考依據(jù)。
經(jīng)過調(diào)研,筆者收集到大學IR運營政策文件、IR定位描述信息共計291份。在運營政策文件中,一般會在顯著位置或條款的第一條中,對于本校IR的定位給予明確說明。例如北海道大學IR的運營政策文件——《北海道大學學術(shù)成果收藏運用要項》[18]第一條中,就有IR的定位說明性文字:“通過互聯(lián)網(wǎng)向校內(nèi)外公開”,《北海道大學學術(shù)成果收藏資料提供-公開細則》和《北海道大學學術(shù)成果收藏利用細則》中也有相關(guān)條款的詳細說明。收集到的IR角色定位信息既包括IR管理者對本機構(gòu)IR的定位說明,也有IR管理者給出的合理使用說明。前者一般是對本機構(gòu)IR的簡單介紹,其中均會出現(xiàn)“公開”“免費”“無償”等字樣,而后者則是IR管理者在著作權(quán)法案的基礎(chǔ)上制定的針對IR的合理使用說明,只要在該使用說明提及范圍內(nèi)使用均是允許的。
4.2 IR數(shù)據(jù)格式
日本大學的IR若想能夠被IRDB系統(tǒng)收割元數(shù)據(jù),需要滿足兩個條件[19]:首先是要有規(guī)范的URI,以能夠被IRDB系統(tǒng)準確定位;其次,IR內(nèi)數(shù)據(jù)格式要符合特定規(guī)范的元數(shù)據(jù)標準,即支持元數(shù)據(jù)收割協(xié)議——OAI-PMH和Junii2標準。
Junii2是NII在2006年發(fā)布的元數(shù)據(jù)格式。junii2的推出使得各IR原有元數(shù)據(jù)得以更加靈活地應(yīng)用,便于收割各個IR收錄資源的元數(shù)據(jù)。2010年3月發(fā)布第一版,2013年3月經(jīng)過修改后發(fā)布第三版。JAIRO、JAIRO Cloud以及IRDB成果分析系統(tǒng)都是借助junii2才能在所收割元數(shù)據(jù)的基礎(chǔ)上集成、聚合并開展相關(guān)服務(wù)的。
Junii2共有64個描述項目,每個描述項目有8個著錄項,包括題名、是否必須、是否可重復、最大出現(xiàn)次數(shù)、最小出現(xiàn)次數(shù)、錄入格式等[20]。Junii2可與國際眾多標注系統(tǒng)實現(xiàn)數(shù)據(jù)的互操作,這一點在很多著錄項中得到了體現(xiàn)。很多著錄項內(nèi)為國際著名分類法、主題詞表設(shè)置了專門的著錄子項。例如在著錄項“主題”中,設(shè)置了11個著錄子項,分別是“著者關(guān)鍵詞” “國立信息學研究所元數(shù)據(jù)主題詞詞匯集” “日本十進分類法”“國立國會圖書館分類表” “日本標題表” “國立國會圖書館標題表” “醫(yī)學標題
表” “杜威十進分類法” “美國國會圖書館分類表”
“國際十進分類法” “美國國會圖書館標題表”,后4個著錄項均是為國際分類法、主題詞表設(shè)置的著錄項。在著錄項 “ID” 中,共有4個著錄子項, 分別是“PubMed編號” “DOI” “NII論文ID”和“醫(yī)中志ID”,同樣也為國際通行的ID編號設(shè)置了著錄項目。這樣的著錄項目設(shè)置,使得IR在收錄信息時能夠按照國際分類法、主題詞表對資源進行描述著錄。
在Junii2的元素區(qū)域內(nèi)提供有各個著錄項目的英文內(nèi)容,可以將本國語言的元素詞匯與國外的元數(shù)據(jù)格式建立聯(lián)系,為元數(shù)據(jù)聚合與集成奠定語言基礎(chǔ),進而實現(xiàn)系統(tǒng)的互操作。同時也有利于將按照Junii2格式進行組織的資源元數(shù)據(jù)以XML語言的格式進行發(fā)布。
4.3 元數(shù)據(jù)收割協(xié)議——OAI-PMH的應(yīng)用
日本大學的IR能夠被IRDB系統(tǒng)收割元數(shù)據(jù)的第二個要求中,OAI-PMH的支持是必不可少的。OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)是由OAI(Open Archives Initiative)開發(fā)、維護的互操作協(xié)議標準,目前最新版本為2002年發(fā)布的2.0版。OAI- PMH以HTTP協(xié)議為基礎(chǔ),可以傳輸各種以XML作為數(shù)據(jù)格式的數(shù)據(jù)集。在OAI-PMH協(xié)議下,可以根據(jù)需要,從目標IR中收割單個元數(shù)據(jù)、元數(shù)據(jù)框架或數(shù)據(jù)集等。沒有OAI-PMH的應(yīng)用,IR內(nèi)的元數(shù)據(jù)信息便無法被自動收割,大規(guī)模的開放應(yīng)用自然無從談起。OAI-PMH也是IR與搜索引擎等實現(xiàn)元數(shù)據(jù)交互的標準協(xié)議。NII自2002年10月啟動的元數(shù)據(jù)-知識庫共同構(gòu)建事業(yè)便開始探討OAI-PMH的實際應(yīng)用,同一時期千葉大學也開始嘗試使用OAI-PMH[3]。
OAI-PMH也有其自身不足,例如只涉及元數(shù)據(jù)的收割傳輸,而不具備規(guī)范內(nèi)容數(shù)據(jù)的相關(guān)功能,使得其應(yīng)用范圍有限,這一局限在網(wǎng)絡(luò)資源類型越來越復雜的情況下愈發(fā)明顯。OAI-ORE(Open Archives Initiative Object Reuse and Exchange),是為彌補OAI-PMH不足而誕生的新一代交互協(xié)議,它可以在傳輸元數(shù)據(jù)的基礎(chǔ)上,使數(shù)字資源從一個平臺傳輸?shù)搅硪粋€平臺成為可能。目前OAI-ORE在IR中的應(yīng)用仍處于理論研究階段。
4.4 IR與相關(guān)系統(tǒng)的互操作
IR與相關(guān)系統(tǒng)的互操作,是IR實現(xiàn)社會化的具體表現(xiàn)之一,有利于提高IR內(nèi)資源利用狀況的互操作系統(tǒng)對象包括校內(nèi)外各類研究成果數(shù)據(jù)庫、研究者信息庫、出版領(lǐng)域數(shù)據(jù)庫以及搜索引擎等。
筆者主要介紹金澤大學教育研究業(yè)績數(shù)據(jù)庫與IR的互操作應(yīng)用[21-22]以及信州大學研究者總覽與IR的互操作應(yīng)用[23-24]。
金澤大學教育研究業(yè)績數(shù)據(jù)庫內(nèi)置有與IR互操作的功能模塊。校內(nèi)研究者登錄自己在教育研究業(yè)績數(shù)據(jù)庫中的個人賬戶后,可以在該功能模塊中向IR內(nèi)在線發(fā)送研究成果而不用再次在IR中輸入相關(guān)信息。研究者或教師可以在該模塊中選擇所要發(fā)送的信息內(nèi)容,進行簡單的元數(shù)據(jù)描述后便可以向IR傳輸信息。而在IR方面,IR管理者登錄IR管理后臺之后便會看到來自校內(nèi)人員在線發(fā)送的研究成果信息,經(jīng)過審核確認不存在諸如版權(quán)糾紛等問題的情況下便可以點擊確認收錄。在收錄之前,若IR管理者認為描述信息不恰當,可對該成果的描述信息進行適當?shù)男薷摹?/p>
在信州大學研究者總覽數(shù)據(jù)庫中,在某位校內(nèi)研究者的個人界面中,可以看到該研究者的組織信息、職稱、研究領(lǐng)域、研究課題、所屬學會以及研究成果信息。若某一研究成果已經(jīng)被收錄進信州大學IR中,則會在該研究者的研究成果信息中的相關(guān)成果介紹區(qū)域看到全文的鏈接標識,通過點擊該標識便可以鏈接至IR中該研究成果全文的頁面。反之,在IR中某一成果的頁面,可以看到通過研究者信息鏈接至信州大學研究者總覽數(shù)據(jù)庫的反向鏈接,通過點擊該鏈接可以跳轉(zhuǎn)至該研究者在研究者總覽中的頁面,從而獲取有關(guān)該研究者的更加全面的信息。
研究成果數(shù)據(jù)庫與IR間的互操作,減少了研究者再向IR中提交研究成果時的輸入信息量,簡化了提交流程,使得提交功能更加簡單易用,不會引起研究者的反感;同時也較大幅度地簡化了IR管理者的管理工作,不必一一輸入成果的相關(guān)數(shù)據(jù)。研究者信息數(shù)據(jù)庫與IR的互操作,則使得兩者在信息內(nèi)容上優(yōu)勢互補:IR具有文獻資源的全文,但是沒有研究者的全面的信息,而研究者信息數(shù)據(jù)庫恰好相反,通過兩者之間的數(shù)據(jù)共享,使得研究者信息數(shù)據(jù)庫能夠間接地具備提供文獻資源的能力,使得IR具備介紹、宣傳、識別研究者的能力。
5 應(yīng)用展望
5.1 社會化應(yīng)用活動范圍更加廣泛
目前,IR開展的社會化應(yīng)用輻射范圍除IR領(lǐng)域內(nèi)的各類數(shù)據(jù)庫外,還主要包括各類研究者信息數(shù)據(jù)庫、研究成果數(shù)據(jù)庫等。然而,在出版領(lǐng)域、商業(yè)數(shù)據(jù)庫以及學術(shù)信息門戶網(wǎng)站等方面,存在著與IR建立更為廣泛的數(shù)據(jù)互操作關(guān)系的潛力。
在出版領(lǐng)域,各類學術(shù)成果在正式出版時會產(chǎn)生大量的出版數(shù)據(jù);在商業(yè)數(shù)據(jù)庫中,學術(shù)成果的正式出版版本等文獻資源會具有自己的描述數(shù)據(jù);在學術(shù)信息門戶網(wǎng)站方面,作為綜合性的學術(shù)信息平臺,各類學術(shù)成果的信息說明網(wǎng)頁會發(fā)布各類有關(guān)的信息內(nèi)容。與出版數(shù)據(jù)建立關(guān)聯(lián),可以更加便于IR管理者審查相關(guān)資源的版權(quán)狀況、出版情況,從而為資源的收錄、管理提供便利;與商業(yè)數(shù)據(jù)庫的關(guān)聯(lián),可以便于IR利用者看到某一成果正式出版的相關(guān)內(nèi)容,這對于IR內(nèi)收錄的科研數(shù)據(jù)、同行評審前的論文版本等資源而言尤為有利;與學術(shù)信息門戶網(wǎng)站的關(guān)聯(lián),可以豐富門戶網(wǎng)站收錄的信息類型,提高網(wǎng)站整體服務(wù)能力,并且為IR資源的利用提供更為便利的訪問渠道,有利于提高IR知名度。
5.2 社會化應(yīng)用服務(wù)更加深入
IR已經(jīng)可以和研究者信息數(shù)據(jù)庫、研究成果數(shù)據(jù)庫等實現(xiàn)互操作,但是這種互操作涉及數(shù)據(jù)范圍依然有限,受版權(quán)限制等因素影響,并非所有的成果信息都可以實現(xiàn)共享。隨著開發(fā)獲取的推進,越來越多的資源會通過多種合理使用形式為人所用,甚至資源全文轉(zhuǎn)變?yōu)殚_放獲取資源。通過IR獲取其他存在數(shù)據(jù)互操作關(guān)系的數(shù)據(jù)庫內(nèi)收錄數(shù)據(jù)的服務(wù)將會得到深入開展,用戶可以通過訪問IR獲取其他數(shù)據(jù)庫的更多信息。
隨著IR收錄的成果內(nèi)容不斷增多,對于成果之間關(guān)聯(lián)的發(fā)現(xiàn)會變得更加重要。通過JAIRO已經(jīng)可以檢索超過200萬件成果的相關(guān)信息,如此龐大的數(shù)據(jù)量為開展知識發(fā)現(xiàn)、關(guān)聯(lián)發(fā)現(xiàn)提供了數(shù)據(jù)基礎(chǔ)。加上IR與研究者信息庫、成果信息庫之間信息網(wǎng)絡(luò)的建立與發(fā)展,可以依托該信息網(wǎng)絡(luò)開展國家層面、機構(gòu)層面和個人層面的知識管理活動。在研究者信息庫方面,researchmap的部分功能已經(jīng)具備提供個人知識管理的能力,在某些研究中甚至可以發(fā)揮國家層面知識管理的功能。目前,researchmap 也已經(jīng)通過與各個大學獨立的研究者信息庫建立聯(lián)系的方式實現(xiàn)了與IR數(shù)據(jù)的交互,從而與IR建立了間接性的聯(lián)系。隨著技術(shù)的發(fā)展成熟,IR與researchmap間的信息網(wǎng)絡(luò)將會更加完備,信息共享將會更加暢通,機構(gòu)或國家機關(guān)便可以借助該信息網(wǎng)絡(luò)開展更為全面、深入的機構(gòu)層面或國家層面的知識管理活動。
參考文獻:
[1] 姚曉娜, 祝忠明, 盧利農(nóng), 等. 機構(gòu)知識庫OAI互操作數(shù)據(jù)同步策略研究[J]. 現(xiàn)代圖書情報技術(shù), 2014(3): 14-18.
[2] 陳曉鳳, 張志平, 白海燕. OAI-ORE在機構(gòu)知識庫中的應(yīng)用研究與實現(xiàn)[J]. 現(xiàn)代圖書情報技術(shù), 2010(11): 69-74.
[3] 尾城孝一, 杉田茂樹, 阿蘓品治夫, 等. 日本における學術(shù)機関リポジトリ構(gòu)築の試み-千葉大學と國立情報學研究所の事例を中心として-[J]. 情報の科學と技術(shù), 2004, 54(9): 475-482.
[4] 林豊. ResourceSync: OAI-PMH の後継規(guī)格[EB/OL].[2016-09-10]. http://current.ndl.go.jp/ca1845.
[5] 王?;?, 黃金霞, 劉雪梅. ORCID在機構(gòu)知識庫建設(shè)中的應(yīng)用研究[J]. 圖書情報工作, 2015, 59(17): 134-140,133.
[6] University College London.RIOJA[EB/OL]. [2016-09-10].http://www.ucl.ac.uk/ls/rioja/.
[7] 山本哲也. 汎用のデータ変換フレームワークを開発する[J]. 名古屋大學附屬図書館研究年報, 2007(6): 71-79.
[8] 棚橋是之, 山本哲也, 梶田健史, 等. システム間連結(jié)のための著者名典拠ディレクトリシステムの開発[J].名古屋大學附屬図書館研究年報, 2007(6): 63-70.
[9] 國立情報學研究所. 次世代學術(shù)コンテンツ基盤共同構(gòu)築事業(yè)委託事業(yè)公募要項[EB/OL].[2016-09-10].https://www.nii.ac.jp/irp/rfp/2006/pdf/rfp.pdf.
[10] 科學技術(shù)振興機構(gòu). オープンアクセスに関するJSTの方針[EB/OL]. [2016-09-10]. http://www.jst.go.jp/pr/intro/pdf/policy_openaccess.pdf.
[11] 科學技術(shù)振興機構(gòu). 科學技術(shù)情報発信·流通総合システム利用規(guī)約[EB/OL]. [2016-09-10]. https://www.jstage.jst.go.jp/pub/html/AY04S090_ja.html.
[12] 國立情報學研究所. 大學図書館コンソーシアム連合概要[EB/OL]. [2016-09-10]. http://www.nii.ac.jp/content/justice/overview/.
[13] 文部科學省. 學術(shù)情報基盤実態(tài)調(diào)査平成27年度大學図書館編機構(gòu)知識庫編機関リポジトリについて[EB/OL].[2016-09-10].http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001070838&cycode=0.
[14] 國立情報學研究所. 學術(shù)機関リポジトリ構(gòu)築連攜支援事業(yè)-委託事業(yè)[EB/OL]. [2016-09-10]. https://www.nii.ac.jp/irp/rfp/.
[15] 北海道大學附屬図書館. AIRwayプロジェクトリンクリゾルバを通じた機関資源ヘのアクセス[EB/OL]. [2016-09-10]. http://airway.lib.hokudai.ac.jp/index_ja.html.
[16] 早稲田大學. リポジトリと電子出版の連攜モデルを確立するための実験開発[EB/OL]. [2016-09-10]. http://www.wul.waseda.ac.jp/ir/epubs/.
[17] 片岡真. これまでの取り組みと今後のプラン-JAIRO Cloud等とのデータ自動連攜·システムアップデート-[EB/OL]. [2016-09-10]. http://www.nii.ac.jp/csi/openforum2016/track/pdf/20160526_ERDBJP_4_kataoka.
[18] 北海道大學図書館委員會. 北海道大學學術(shù)成果收藏運用要項[EB/OL]. [2016-09-10]. http://eprints.lib.hokudai.ac.jp/siryo/unyo.pdf.
[19] 國立情報學研究所. IRDBハーベスト対象IRの條件[EB/OL]. [2016-09-10]. http://www.nii.ac.jp/irp/archive/system/irdb_harvest.html.
[20] 國立情報學研究所. メタデータフォーマットjunii2(バージョン3.1)各データ要素の入力內(nèi)容一覧[EB/OL]. [2016-09-10]. https://www.nii.ac.jp/irp/archive/system/pdf/junii2_elements_guide_ver3.1.pdf.
[21] 金沢大學. 金沢大學研究者情報[EB/OL]. [2016-09-10].http://ridb.kanazawa-u.ac.jp/public/.
[22] 金沢大學. 金沢大學學術(shù)情報リポジトリ[EB/OL].[2016-09-10]. http://dspace.lib.kanazawa-u.ac.jp/dspace/.
[23] 信州大學. 研究者総覧[EB/OL]. [2016-09-10]. http://soar-rd.shinshu-u.ac.jp/search/index.html?lang=ja.
[24] 信州大學. 機関リポジトリ[EB/OL]. [2016-09-10].https://soar-ir.repo.nii.ac.jp/?lang=japanese.
Research on the Socialized Application of Institutional Repositories of Universities in Japan
Li Xi
School of Computer Science and Information Technology, Northeast Normal University, Changchun 130117
Abstract: [Purpose/significance] Based on the information of institutional repositories in Japan which have been collected and studied, this paper makes research on the present situation about the socialized application of institutional repositories in Japan. [Method/process] By the literature investigation, the author visited different sites of institutional repositories, libraries and databases of universities, as well as the sites of National Institute of Informatics to research the relationship between institutional repositories and other databases. [Result/conclusion] Based on the analysis, the socialized application of institutional repositories in Japan is known and this paper discusses it from four views: self-localization, data format, OAI-PMH protocol and system interoperability.
Keywords: institutional repository socialized application open access socialization