孫海燕?解登峰?孟祥蓮
摘 要 日本開放獲取知識(shí)庫聯(lián)盟(JPCOAR)為應(yīng)對(duì)近年來國際形勢變化和學(xué)術(shù)信息發(fā)布技術(shù)發(fā)展、促進(jìn)日本學(xué)術(shù)成果的國際流通,開發(fā)出了取代junii2的新一代元數(shù)據(jù)模型,對(duì)完善我國機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)模型具有較強(qiáng)的借鑒意義。本文梳理了JPCOAR元模型的開發(fā)背景、基本原則和特點(diǎn),并在此基礎(chǔ)上分析了日本機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)模型未來的發(fā)展趨勢。研究發(fā)現(xiàn),未來元數(shù)據(jù)最重要的是正確提供標(biāo)識(shí)符并使其成為易于處理的數(shù)據(jù)結(jié)構(gòu),而不是專注于精細(xì)化描述。
關(guān)鍵詞 JPCOAR 元模型 特點(diǎn)分析 發(fā)展趨勢
分類號(hào) G250
DOI 10.16810/j.cnki.1672-514X.2020.03.015
Abstract In response to the recent changes in the international situation and the development of academic information dissemination technology, and in order to promote the international circulation of Japanese academic achievements, JPCOAR has developed a new generation metadata model that replaces junii2. It has strong reference for improving the metadata model of institutional repository of our country. By thorough inspection of the development background, basic principles and characteristics of the JPCOAR Schema, this paper concludes the future development trend of the Japanese Institutional Repository metadata model. The results show that the most important thing about future metadata is to correctly provide the identifier and make it an easy-to-handle data structure, rather than focusing on fine-grained descriptions.
Keywords JPCOAR. Schema. Characteristic analysis. Development trend.
0 引言
21世紀(jì)初興起的機(jī)構(gòu)知識(shí)庫在世界范圍內(nèi)掀起持續(xù)的研究和建設(shè)熱潮,近年來機(jī)構(gòu)知識(shí)庫建設(shè)在我國也引發(fā)了廣泛關(guān)注和研究,但當(dāng)前國內(nèi)機(jī)構(gòu)知識(shí)庫建設(shè)仍然處于成果積累和模式摸索階段,政策和聯(lián)盟環(huán)境還有待進(jìn)一步完善[1]。其中DC元數(shù)據(jù)是目前我國機(jī)構(gòu)知識(shí)庫使用最廣泛、最基礎(chǔ)的元數(shù)據(jù)標(biāo)準(zhǔn),由15個(gè)核心元素構(gòu)成,輔以限定詞描述,適合網(wǎng)絡(luò)語義關(guān)系下的存儲(chǔ)、管理及查詢利用[2]。日本各機(jī)構(gòu)知識(shí)庫資源的元數(shù)據(jù)長期以來采用的junii2元數(shù)據(jù)模型,其前身同為DC元數(shù)據(jù)標(biāo)準(zhǔn)。由于我國機(jī)構(gòu)知識(shí)庫建設(shè)起步晚,目前尚無統(tǒng)一的元數(shù)據(jù)模型。因此,JPCOAR元數(shù)據(jù)模型的開發(fā)背景、基本原則及發(fā)展趨勢,對(duì)我國機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)模型的開發(fā)有極強(qiáng)的借鑒意義。
日本各機(jī)構(gòu)知識(shí)庫資源的元數(shù)據(jù)長期采用的junii2元數(shù)據(jù)模型通過日本國立情報(bào)學(xué)研究所(NII)的學(xué)術(shù)機(jī)構(gòu)知識(shí)庫數(shù)據(jù)庫(IRDB)廣泛傳播。“高校圖書館和國立情報(bào)學(xué)研究所聯(lián)合推進(jìn)會(huì)”下設(shè)的機(jī)構(gòu)知識(shí)庫推廣委員會(huì)為了應(yīng)對(duì)近年來國際上學(xué)術(shù)信息交流形勢變化和新技術(shù)發(fā)展、促進(jìn)日本學(xué)術(shù)成果的國際流通,于2016年設(shè)立了元數(shù)據(jù)研討專家組。該專家組自設(shè)立之初就致力于研發(fā)取代junii2的下一代元模型。2017年開放獲取機(jī)構(gòu)知識(shí)庫聯(lián)盟(JPCOAR)成立后,其下設(shè)的元數(shù)據(jù)標(biāo)準(zhǔn)專家組接替了元數(shù)據(jù)研討專家組的工作,并于2017年10月份正式發(fā)布“JPCOAR元模型ver1.0”。本文將詳細(xì)闡述這一元模型的開發(fā)背景、基本原則和特點(diǎn),并在此基礎(chǔ)上分析日本機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)模型未來的發(fā)展趨勢,以期為我國機(jī)構(gòu)知識(shí)庫建設(shè)提供有益借鑒。
1 JPCOAR元模型的開發(fā)背景與基本原則
1.1 JPCOAR元模型的開發(fā)背景
1.1.1 Dublin Core——junii2的前身
日本機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)模型的歷史可以追溯到2002年的“NII元數(shù)據(jù)數(shù)據(jù)庫共建項(xiàng)目”[3]。這一項(xiàng)目初衷是全日本的大學(xué)、研究機(jī)構(gòu)共建線上學(xué)術(shù)信息資源的元數(shù)據(jù)數(shù)據(jù)庫,使得注冊(cè)的元數(shù)據(jù)能通過“大學(xué)Web資源檢索”(JuNii:高校信息元數(shù)據(jù)試用門戶網(wǎng)站)系統(tǒng)開放。這一項(xiàng)目的開展需要一個(gè)通用的元數(shù)據(jù)模型,于是,2001年經(jīng)NII內(nèi)部組建的元數(shù)據(jù)數(shù)據(jù)庫研討工作組的研究,參照Dublin Core Metadata Element Set(DCMES),從中選用了15個(gè)元數(shù)據(jù)描述元素。隨著2005年NII前沿學(xué)術(shù)情報(bào)基礎(chǔ)設(shè)施項(xiàng)目(CSI)的啟動(dòng),構(gòu)筑機(jī)構(gòu)知識(shí)庫的機(jī)構(gòu)越來越多,JuNii便發(fā)揮了機(jī)構(gòu)知識(shí)庫門戶的作用。NII致力于JuNii元數(shù)據(jù)模型的修訂,并于2006年開發(fā)了日本沿用至今的元模型junii2,用于收集機(jī)構(gòu)知識(shí)庫的元數(shù)據(jù)。隨后,NII試運(yùn)行了機(jī)構(gòu)知識(shí)庫門戶網(wǎng)站JuNii+之后,又試運(yùn)行了為學(xué)術(shù)機(jī)構(gòu)知識(shí)庫提供服務(wù)的門戶網(wǎng)站JAIRO。這兩個(gè)網(wǎng)站于2009年相繼正式投入使用。然而由于各機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)描述方法不統(tǒng)一,導(dǎo)致檢索效果不佳。因此,2009年NII經(jīng)廣泛征求意見后,對(duì)junii2進(jìn)行了一系列修訂,次年3月發(fā)布了ver1.0。之后為了應(yīng)對(duì)學(xué)位制度改革,NII又對(duì)junii2進(jìn)行了多次修訂,到2017年10月junii2的版本已經(jīng)更新到ver3.1。
1.1.2 學(xué)術(shù)信息傳播時(shí)代的變遷
日本2015年內(nèi)閣報(bào)告書提出“機(jī)構(gòu)知識(shí)庫要作為支撐開放科學(xué)的基礎(chǔ)設(shè)施發(fā)揮作用”[4]。在日本,隨著構(gòu)筑國際性網(wǎng)絡(luò)的呼聲越來越高漲,IRDB于2016年開始向歐洲開放獲取平臺(tái)OpenAIRE提交元數(shù)據(jù)[5](如圖1)。
機(jī)構(gòu)知識(shí)庫推廣委員會(huì)順應(yīng)這一潮流,由下設(shè)的幾個(gè)工作組針對(duì)元數(shù)據(jù)所需元素進(jìn)行調(diào)研,充分把握論文開放獲取情況、元數(shù)據(jù)及資源內(nèi)容的多樣性,以確保開發(fā)的元模型具有良好的國際互操作性。調(diào)研發(fā)現(xiàn),為了應(yīng)對(duì)開放科學(xué)運(yùn)動(dòng),必須對(duì)junii2進(jìn)行全面修訂。自此,JPCOAR開始就開發(fā)新的元模型進(jìn)行研討。
1.2JPCOAR元模型開發(fā)的基本原則
2016年10月,JPCOAR公布了全面修訂junii2的基本原則,并廣泛征求意見后,發(fā)布了JPCOAR元模型開發(fā)方案。這一開發(fā)方案于2017年3月開始正式實(shí)施。基本原則有以下幾點(diǎn)[6]。
(1) 有利于開放科學(xué)、開放獲取原則。在歐美,近年來政府資助機(jī)構(gòu)要求獲得公共基金資助的學(xué)術(shù)成果開放獲取已成為新常態(tài)。在日本,關(guān)于開放科學(xué)的研討也已經(jīng)上升到政策層面,除了學(xué)術(shù)論文外,要求開放獲取作為論文支撐的科研數(shù)據(jù)的呼聲也越來越高漲。執(zhí)行OA政策的大學(xué)、資助機(jī)構(gòu)的數(shù)量也在不斷增加。JPCOAR為順應(yīng)這一潮流,在開發(fā)JPCOAR元模型過程中追加了滿足研究數(shù)據(jù)管理等社會(huì)新需求的元素。
DataCite作為一個(gè)幫助研究者發(fā)現(xiàn)、識(shí)別和引用研究數(shù)據(jù)的非營利性機(jī)構(gòu),為科研數(shù)據(jù)等數(shù)字資料提供了持久標(biāo)識(shí)符DOI(數(shù)據(jù)對(duì)象標(biāo)識(shí)符)。JPCOAR元模型開發(fā)過程中,借鑒了DataCite的元數(shù)據(jù)模型,使其能夠描述各類貢獻(xiàn)者的屬性。此外,為了標(biāo)識(shí)獲得公共基金資助的研究成果,促進(jìn)其開放獲取,JPCOAR還增加了與資助機(jī)構(gòu)相關(guān)的元素及描述資源OA狀態(tài)的訪問權(quán)限元素。
(2) 有利于準(zhǔn)確識(shí)別信息原則。要準(zhǔn)確識(shí)別資源,將一個(gè)實(shí)體與另一個(gè)實(shí)體明確區(qū)分的標(biāo)識(shí)符顯得尤為重要。修改元數(shù)據(jù)結(jié)構(gòu)、擴(kuò)展標(biāo)識(shí)符,最終目的都是為了準(zhǔn)確識(shí)別信息?,F(xiàn)代學(xué)術(shù)信息交流要求學(xué)術(shù)成果元數(shù)據(jù)不僅僅在所屬機(jī)構(gòu)內(nèi)傳播,同時(shí)還要在日本國內(nèi)外傳播。這就要求JPCOAR使用具有良好國際流通性的標(biāo)識(shí)符?;谶@一點(diǎn),新的元模型增加了論文、研究人員、機(jī)構(gòu)層面的標(biāo)識(shí)符。此外,當(dāng)前junii2的構(gòu)造是各元素以平面方式描述信息,元素之間的關(guān)系無法被機(jī)器識(shí)別。為解決這一問題,JPCOAR元模型將關(guān)聯(lián)信息分組(分層)描述,提升信息識(shí)別度。
(3) 有利于提升國際互操作性原則。為促進(jìn)日本學(xué)術(shù)信息的國際交流,JPCOAR在充分調(diào)查了國際動(dòng)態(tài)后,決定參照國際互操作性較高并極有可能成為未來IRDB主要合作對(duì)象OpenAIRE的指南開展修訂工作。此外,OpenAIRE為了走出歐洲、在世界范圍內(nèi)收集并傳播研究成果,也在不斷修訂其指南[7]。JPCOAR元模型整個(gè)開發(fā)過程中注意一直保持與OpenAIRE的溝通交流,以便能夠與OpenAIRE指南兼容。因?yàn)镺penAIRE采用了COAR的controlled vocabularies(受控詞表),所以JPCOAR元模型也采用了其資源類型和訪問權(quán)限。COAR的受控詞表遵循SKOS標(biāo)準(zhǔn),提供指向URI、定義多語言詞匯表名稱及其他受控詞表的鏈接,以提高元數(shù)據(jù)的準(zhǔn)確性和國際互操作性。JPCOAR元數(shù)據(jù)標(biāo)準(zhǔn)專家組的部分成員加入了COAR受控詞表編制委員會(huì),在詞表翻譯、詞匯補(bǔ)充等方面做出貢獻(xiàn)。COAR中的資源類型在詞匯方面是分層次的,并且存在多種資源,因此在準(zhǔn)確運(yùn)用方面有難度。鑒于此,JPCOAR元模型通過精煉詞匯的方法避免類似概念詞匯的混用。這樣雖然主要架構(gòu)基本上沿用了國際性元數(shù)據(jù)模型的做法,但JPCOAR對(duì)其進(jìn)行了一系列修改使其更加適合日本國情,并且用指南明確定義并提供與主要合作對(duì)象的映射,以確?;ゲ僮餍?。
2 JPCOAR元模型的特點(diǎn)
JPCOAR元模型由三層、79元素、15種屬性構(gòu)成,如表1所示,與junii2相比,JPCOAR元模型不僅增加了元素、屬性的種類,還增加了規(guī)定使用詞匯的受控詞表及語言屬性的可用元素?cái)?shù)。此外,JPCOAR元模型還通過增加標(biāo)識(shí)符或URI格式的描述符,實(shí)現(xiàn)更復(fù)雜的元數(shù)據(jù)描述和流通。
JPCOAR和junii2的目標(biāo)資源都以學(xué)術(shù)論文為主,但JPCOAR元模型還支持科研數(shù)據(jù)等多種資源類型。Junii2在促進(jìn)日本學(xué)術(shù)信息傳播和保障機(jī)構(gòu)知識(shí)庫穩(wěn)定運(yùn)行方面發(fā)揮了巨大作用。JPCOAR元模型繼承了junii2的優(yōu)勢,且兼具良好的國際互操作性和可持續(xù)性。JPCOAR元模型主要特點(diǎn)有以下幾個(gè)方面。
2.1 采用外部模型
如上所述,在開發(fā)JPCOAR元模型過程中,JPCOAR充分考慮到元數(shù)據(jù)的國際互操作性,參考了OpenAIRE、DataCite、DC-NDL,DublinCore、RIOXX等多種外部元模型[8]。JPCOAR的頂級(jí)元素中有17個(gè)使用了外部模型,如表2所示,在選用外部模型時(shí),JPCOAR優(yōu)先選用了更通用模型的元素。比如,表示資源標(biāo)題的元素在各模型中都有出現(xiàn),但JPCOAR選用了最為通用的Dublin Core元素。
JPCOAR元模型主要通過捕捉公共基金資助的研究成果的開放度來響應(yīng)開放科學(xué)運(yùn)動(dòng)。因此,元數(shù)據(jù)要能夠清楚的地表示OA狀態(tài),如是否開放獲取及開放日期。關(guān)于這一元素,JPCOAR在充分研討RIOXX的free-to-read,OpenAIRE的Access Level及Embargo End Date的基礎(chǔ)上,選定了在表示開放獲取狀況和日期信息方面有優(yōu)勢的OpenAIRE。
管理公共基金資助信息是實(shí)現(xiàn)開放科學(xué)的一項(xiàng)重要工作。DataCite的FundingReference、OpenAIRE的Project Identifier,RIOXX的project都是與此有關(guān)的元素。由于OpenAIRE和RIOXX使用自己的詞匯和描述規(guī)則來描述科研課題信息,因此JPCOAR選用了更為通用的dataCite處理日本課題信息。但是,為了實(shí)現(xiàn)日英雙語描述的語言屬性,必須分別定義資助機(jī)構(gòu)名稱(jpcoar:funderName)和項(xiàng)目名稱(jpcoar:awardTitle),因此,其上位元素資助信息(jpcoar:fundingReference)也必須分別定義。
JPCOAR元模型在描述學(xué)位論文方面因?yàn)榭紤]到與國立國會(huì)圖書館(NDL)的合作,主要采用了DC-NDL的元素。與junii2相比,JPCOAR元模型因?yàn)椴捎昧薈OAR的受控詞表描述資源類型,所以能夠區(qū)分博士論文、碩士論文和學(xué)士論文。因此,在JPCOAR元模型中不再需要junii2中用于識(shí)別博士論文的著者標(biāo)識(shí)“ETD”??紤]到與標(biāo)識(shí)符的對(duì)應(yīng)關(guān)系,JPCOAR元模型將學(xué)位授予機(jī)構(gòu)和創(chuàng)建者都定義為唯一元素??傮w來說,JPCOAR元模型與junii2相比,元素配置上更加考慮元數(shù)據(jù)互操作性。
2.2 采用外部詞匯
JPCOAR元模型考慮到國際互操作性,詞匯方面原則上采用外部受控詞表。例如,用COAR的受控詞表Resource Type Vocabulary(資源類型詞匯表)替代了junii2使用的日本特有資源類型NIItype并充分考慮二者差異性。比如junii2的“Departmental Bulletin Paper(紀(jì)要論文)”“Learning Material(教材)”等,在Resource Type Vocabulary里沒有與之對(duì)應(yīng)的詞匯,于是采用了日本特有的詞匯,元數(shù)據(jù)國際流通時(shí),分別對(duì)應(yīng)“Journal Article”“Others”。但是,由于“Departmental Bulletin Paper(紀(jì)要論文)”是日本機(jī)構(gòu)知識(shí)庫的主要資源類型,“Learning Material(教材)”在國際上也是重要資源類型,因此JPCOAR將來考慮將其添加到Resource Type Vocabulary中。訪問權(quán)限主要采用了COAR受控詞表Access Rights Vocabulary中的詞匯,另有一部分詞匯選自DataCite。比如各種日期信息(發(fā)布日期、創(chuàng)建日期等)最初仿照junii2被定為單獨(dú)元素,但最終發(fā)現(xiàn)使用DataCite的日期元素等屬性更為合理。但是,學(xué)位論文的學(xué)位授予時(shí)間采用了DC-NDL的元素。表示資源開放日期時(shí),將訪問權(quán)限(dcterms:accessRights)作為開放權(quán)限“embargoed access”。date元素方面,指定date Type=“Available”,輸入解禁日期。解禁后,須將訪問權(quán)限修改為“Open access”。另外,貢獻(xiàn)者(jpcoar:contributor)種類相關(guān)的詞匯也選自DataCite。JPCOAR通過選擇DataCollector、DataCurator等角色表示的詞匯來明確表達(dá)研究人員的貢獻(xiàn)度。
2.3 擴(kuò)充元素及屬性
JPCOAR元模型的頂級(jí)元素中,有18個(gè)名稱為“jpcoar:~”的元素是自定義的,是外部標(biāo)準(zhǔn)元模型中沒有的。如表3所示。雖然盡可能減少自定義元素有利于提升日本元數(shù)據(jù)的國際互操作性,但完全使用外部元素描述元數(shù)據(jù)又會(huì)出現(xiàn)種類不夠或過剩的情況。因此,JPCOAR在整體把握整個(gè)JPCOAR元模型時(shí),有必要考慮自定義元素與其他元素的平衡以及與junii2的向后兼容性。基于這些原因,JPCOAR決定在外部元模型原有元素基礎(chǔ)上適當(dāng)修改,盡可能減少日本特色形成特有元素。
(1)創(chuàng)建者(jpcoar:relation)。雖然junii2也可以輸入作者ID,但JPCOAR元模型中,創(chuàng)建者標(biāo)識(shí)符(jpcoar:nameIdentifier)屬性還可以描述作者ID的類型(如e-Rad, NRID, ORCID, ISNI, VIAF, AID等)。例如,日本廣泛使用的科研資助人員編號(hào)就使用NRID。關(guān)于創(chuàng)建者姓名,JPCOAR在描述作者姓名讀音時(shí),如果引入一個(gè)類似creator Transcription的子元素,則國際互操作性變差,因此,JPCOAR是在創(chuàng)建者姓名(jpcoar:creatorName)上使用xml:lang=“ja-Kana”語言標(biāo)簽來描述。在創(chuàng)建者所屬機(jī)構(gòu)(jpcoar:affiliation)中,作為基礎(chǔ)的datacite:affiliation是自由描述,與輸入的所屬機(jī)構(gòu)ID(kakenhi,ISNI,Ringgold,GRID)相對(duì)應(yīng)。如圖2所示。
(2)關(guān)聯(lián)信息(jpcoar:relation)。JPCOAR元模型強(qiáng)調(diào)標(biāo)識(shí)符的正確處理,并且只有真正指向內(nèi)容本身的標(biāo)識(shí)符(DOI, Handle URL, URI)才被描述為標(biāo)識(shí)符(jpcoar:identifier),相關(guān)資源的標(biāo)識(shí)符描述為關(guān)聯(lián)信息(jpcoar:relation)。這兩者是明確區(qū)分的。明確描述關(guān)系顯然有助于實(shí)現(xiàn)更好的服務(wù)。junii2中描述關(guān)聯(lián)信息的元素是獨(dú)立的。(relation, isVersionOf, hasVersion, isReplacedBy,? replaces, isRequiredBy, requires, isPartOf, hasPart, isReferencedBy, references, isFormatOf, hasFormat)在JPCOAR元模型中歸為一個(gè)元素類型,與屬性relationType相區(qū)別,如圖3所示。
3 JPCOAR元模型的未來發(fā)展趨勢
3.1 JPCOAR元模型被加速普及
2018年底NII對(duì)JPCOAR元模型進(jìn)行了最后的修改,目前IRDB與JPCOAR元模型已經(jīng)能夠兼容。IRDB從703個(gè)機(jī)構(gòu)知識(shí)庫(截至2019年3月底)收集元數(shù)據(jù)提供給CiNii等外部服務(wù)網(wǎng)站[9]。目前元數(shù)據(jù)幾乎按原樣提供給外部服務(wù)網(wǎng)站,但在下一代CiNii中,日本計(jì)劃在論文、圖書、期刊和博士學(xué)位論文基礎(chǔ)上整合研究支持信息和研究數(shù)據(jù)等元數(shù)據(jù),使這些元數(shù)據(jù)能夠鏈接至IRDB的元數(shù)據(jù)。從國際性流通的角度來看,收集和提供高質(zhì)量的元數(shù)據(jù)很重要。因此,在升級(jí)之后的IRDB中,元數(shù)據(jù)的標(biāo)準(zhǔn)化和權(quán)限驗(yàn)證得以實(shí)現(xiàn)。收集和提供盡可能準(zhǔn)確無誤的元數(shù)據(jù),將有助于改善日本國內(nèi)外的學(xué)術(shù)信息流通環(huán)境。此外,截至2019年3月,日本有558家機(jī)構(gòu)知識(shí)庫使用由JPCOAR和NII共同運(yùn)營的機(jī)構(gòu)知識(shí)庫云服務(wù)JAIRO Cloud[10]。與JPCOAR元模型兼容的JAIRO Cloud新版也已經(jīng)在2019年開始試運(yùn)行。這一舉措將大大加速JPCOAR元模型的普及。
3.2 JPCOAR元模型目標(biāo)資源進(jìn)一步拓展
在JPCOAR元模型的開發(fā)中,除了學(xué)術(shù)期刊文章和學(xué)位論文外,還納入了研究數(shù)據(jù)和會(huì)議資料所必需的元素,以便能夠處理多種類型的學(xué)術(shù)信息。最終目的是組織元數(shù)據(jù)流通所需信息、促進(jìn)學(xué)術(shù)成果的順利流通。將來,可以用作研究素材的數(shù)字化學(xué)術(shù)信息也將越來越多,如數(shù)字化的書籍、文獻(xiàn)、博物館資料等。日本的大學(xué)圖書館從很早就開始為有價(jià)值的資料制作數(shù)字檔案,有的大學(xué)圖書館還將這些數(shù)字檔案通過機(jī)構(gòu)知識(shí)庫進(jìn)行公開。然而,數(shù)字檔案一般是與其原件合并為一條獨(dú)立存在的元數(shù)據(jù),且由于它們分散在所藏機(jī)構(gòu)中,不便于整合利用。 JPCOAR今后的重點(diǎn)課題之一便是研討如何將貴重資料數(shù)字檔案納入JPCOAR元模型的目標(biāo)資源。為了實(shí)現(xiàn)國際性信息流通,JPCOAR將OpenAIRE作為假想的元數(shù)據(jù)交換對(duì)象進(jìn)行日本機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)整合。因此,數(shù)據(jù)合作對(duì)象極為明確??紤]到近年來各種Web服務(wù)的廣泛應(yīng)用,JPCOAR今后將考慮提供其他格式的數(shù)據(jù)。鑒于對(duì)各個(gè)機(jī)構(gòu)知識(shí)庫的影響,JPCOAR決定目前維持OAI-PMH協(xié)議,但會(huì)密切關(guān)注國際動(dòng)向的變化,并根據(jù)國際形勢研討未來的協(xié)議。
4 對(duì)我國機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)模型構(gòu)建及應(yīng)用啟示
與日本相比,我國機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)范化程度還不夠高,體系有待完善,并且尚無統(tǒng)一的元數(shù)據(jù)模型。在今后的發(fā)展中,我國不僅要加強(qiáng)自身技術(shù)建設(shè),更應(yīng)增加與國外相關(guān)機(jī)構(gòu)的合作學(xué)習(xí),深層次推進(jìn)機(jī)構(gòu)知識(shí)庫元數(shù)據(jù)模型的構(gòu)建工作[11]。
(1) 在已有元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,根據(jù)需要進(jìn)行修改,最終形成適合我國機(jī)構(gòu)知識(shí)庫情況的元數(shù)據(jù)模型。考慮到元數(shù)據(jù)模型規(guī)范設(shè)計(jì)和長期維護(hù)的復(fù)雜性及國際化環(huán)境和互操作的需要,我國應(yīng)充分比較各元數(shù)據(jù)標(biāo)準(zhǔn)的特點(diǎn),分析資源管理、共享、應(yīng)用等各方面的需求,并充分考慮各機(jī)構(gòu)知識(shí)庫資源的特有屬性、功能需求和服務(wù)對(duì)象范圍,從中選出適當(dāng)?shù)臉?biāo)準(zhǔn),再根據(jù)需求進(jìn)行調(diào)整與修改,形成適合我國國情的元數(shù)據(jù)模型。
(2) 構(gòu)建具有實(shí)用性、準(zhǔn)確性、可擴(kuò)展性和前瞻性的元數(shù)據(jù)模型,推進(jìn)機(jī)構(gòu)知識(shí)庫建設(shè)。一方面,元數(shù)據(jù)模型的設(shè)計(jì)應(yīng)針對(duì)于不同類型用戶,根據(jù)實(shí)際應(yīng)用過程中的需求進(jìn)行元素?cái)U(kuò)展;另一方面,元數(shù)據(jù)模型應(yīng)容納較多的元素,具有較強(qiáng)的描述概括能力。由于用戶的具體需求是多樣的,動(dòng)態(tài)變化的,資源描述與信息檢索的技術(shù)的發(fā)展是迅速的,因此,一個(gè)元素豐富的元數(shù)據(jù)模型對(duì)信息資源的組織管理、內(nèi)容揭示,數(shù)據(jù)檢索會(huì)有較強(qiáng)的應(yīng)用彈性;反之,一個(gè)元素匱乏的元數(shù)據(jù)模型,在面對(duì)技術(shù)升級(jí)、用戶需求細(xì)化時(shí),模型的實(shí)用性會(huì)很大程度上受到限制[12]。
(3) 重視國際合作。在提升自身技術(shù)能力的基礎(chǔ)上,增加與國際相關(guān)機(jī)構(gòu)的合作。在構(gòu)建元數(shù)據(jù)模型時(shí),應(yīng)及時(shí)與國際相關(guān)機(jī)構(gòu)負(fù)責(zé)人進(jìn)行情報(bào)交換,重視元數(shù)據(jù)類型的數(shù)據(jù)兼容性,以促進(jìn)學(xué)術(shù)信息的國際流通。
5 結(jié)語
為推進(jìn)開放科學(xué),JPCOAR一直強(qiáng)調(diào)標(biāo)識(shí)符的重要性。JPCOAR元模型的基本思想是:未來元數(shù)據(jù)最重要的是正確提供標(biāo)識(shí)符并使其成為易于處理的數(shù)據(jù)結(jié)構(gòu),而不是專注于精細(xì)化描述。如果能從外部服務(wù)獲得明確的信息標(biāo)識(shí)符,日本圖書館員則必須擁有必要的元數(shù)據(jù)能力,以便專注于機(jī)構(gòu)知識(shí)庫中的原始信息管理。隨著JPCOAR元模型的普及,在不久的將來,日本的學(xué)術(shù)信息有望被用于開展更多種類的服務(wù)。
參考文獻(xiàn):
龔亦農(nóng),朱茗.我國機(jī)構(gòu)知識(shí)庫建設(shè)現(xiàn)狀調(diào)查[J].數(shù)字圖書館論壇,2018(9):20-28.
魏來,寧子晨.基于RDA的圖書館書目數(shù)據(jù)與機(jī)構(gòu)知識(shí)庫數(shù)據(jù)關(guān)聯(lián)研究[J].圖書館工作與研究,2018(7):43-49.
杉田茂樹.國立情報(bào)學(xué)研究所メタデータ·データベース共同構(gòu)築事業(yè)について[EB/OL].[2019-07-23].https://www.jstage.jst.go.jp/article/jkg/53/10/53_KJ00000979930/_pdf/-char/ja.
內(nèi)閣府.國際的動(dòng)向を踏まえたオープンサイエンスに関する検討會(huì)[EB/OL].[2019-08-13].https://www8.cao.go.jp/cstp/sonota/openscience/150330_openscience_1.pdf.
國立情報(bào)學(xué)研究所.“OpenAIREにデータ提供を開始しました”[EB/OL].[2019-07-23].https://www.nii.ac.jp/irp/2016/08/openaire.html.
機(jī)関リポジトリ推進(jìn)委員會(huì)メタデータ検討タスクフォース. junii2改訂の基本方針[EB/OL].[2019-04-23].https://jpcoar.repo.nii.ac.jp/?action=common_download_main&upload_id=179.
科塔學(xué)術(shù).OpenAIRE(歐洲開放獲取基礎(chǔ)設(shè)施研究項(xiàng)目)[EB/OL].[2019-08-13].https://www.sciping.com/18604.html.
文部科學(xué)省.“學(xué)術(shù)情報(bào)のオープン化の推進(jìn)について(審議まとめ)”[EB/OL].[2019-08-20].http://www.mext.go.jp/component/b_menu/shingi/toushin/__icsFiles/afieldfile/2016/04/08/1368804_2_1_1.pdf.
學(xué)術(shù)機(jī)関リポジトリ構(gòu)築連攜支援事業(yè).“公開IR數(shù)·コンテンツ數(shù)の推移”[EB/OL].[2019-07-23]. https://www.nii.ac.jp/irp/archive/statistic/.
學(xué)術(shù)機(jī)関リポジトリ構(gòu)築連攜支援事業(yè).“公開機(jī)関數(shù)の推移”[EB/OL].[2019-08-20].https://www.nii.ac.jp/irp/archive/statistic/.
崔佳偉,吳思竹,鄔金鳴,等.科學(xué)數(shù)據(jù)倉儲(chǔ)元數(shù)據(jù)標(biāo)準(zhǔn)研究與啟示[J].數(shù)字圖書館論壇,2019(6):19-28.
艾雪松,石憲,彭超,等.文物信息資源元數(shù)據(jù)模型構(gòu)建與應(yīng)用研究[J].情報(bào)科學(xué),2019,37(6):69-74.
孫海燕 中國海洋大學(xué)圖書館館員。 山東青島,266100。
解登峰 中國海洋大學(xué)圖書館資源建設(shè)部主任、副研究館員。 山東青島,266100。
孟祥蓮 中國海洋大學(xué)圖書館館員。 山東青島,266100。
(收稿日期:2019-08-20 編校:左靜遠(yuǎn),謝艷秋)