• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多維度關(guān)聯(lián)的機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)模型的構(gòu)建與分析

      2018-07-25 09:10:30上海交通大學(xué)圖書館上海200240上海旅游高等??茖W(xué)校圖書館上海2048
      現(xiàn)代情報(bào) 2018年7期
      關(guān)鍵詞:數(shù)據(jù)模型知識(shí)庫(kù)關(guān)聯(lián)

      孫 翌 胡 愛(.上海交通大學(xué)圖書館,上海 200240;2.上海旅游高等專科學(xué)校圖書館,上海 2048)

      我國(guó)于2004年簽署了旨在支持開放存取的《柏林宣言》。2014年全球研究理事會(huì)(Global Research Council,GRC)在北京召集各國(guó)科技界領(lǐng)袖共同推進(jìn)開放獲取,國(guó)務(wù)院總理李克強(qiáng)在大會(huì)上的致辭中指出:“各國(guó)應(yīng)采取多種方式,促進(jìn)知識(shí)科學(xué)的廣泛傳播與共享……。中國(guó)奉行互利共贏的開放戰(zhàn)略……,支持建立公共財(cái)政資助的科學(xué)知識(shí)開放獲取機(jī)制,促進(jìn)中國(guó)和世界科學(xué)事業(yè)共同發(fā)展”[1]。這從國(guó)家層面提出了國(guó)家支持的科技成果最大限度全民共享的要求[2]。機(jī)構(gòu)知識(shí)庫(kù)是開放獲取中的重要知識(shí)服務(wù)基礎(chǔ)設(shè)施,稱為開放獲取運(yùn)動(dòng)中的綠色OA模式,對(duì)各種數(shù)字化產(chǎn)品(尤其是學(xué)術(shù)機(jī)構(gòu)中專家、教授、學(xué)生的知識(shí)成果)進(jìn)行收集、保護(hù)和傳播[3],是科研人員跨機(jī)構(gòu)傳播知識(shí)、交流知識(shí),科研機(jī)構(gòu)管理知識(shí)的重要平臺(tái),它消除了利用學(xué)術(shù)資源的價(jià)格壁壘和許可壁壘,在促進(jìn)學(xué)術(shù)信息免費(fèi)獲取、自由使用中發(fā)揮了重要作用。

      機(jī)構(gòu)知識(shí)庫(kù)經(jīng)過(guò)多年的建設(shè),在高校等科研機(jī)構(gòu)開放獲取資源的數(shù)量日益增多,并呈海量增長(zhǎng)的態(tài)勢(shì)。然而,隨著資源數(shù)量激增,相關(guān)問題也逐漸涌現(xiàn),主要表現(xiàn)在如下幾個(gè)方面:

      1)數(shù)據(jù)的大量涌現(xiàn)給人們利用機(jī)構(gòu)知識(shí)庫(kù)查找和利用知識(shí)增加了難度,“信息超載”和“信息孤島”問題越來(lái)越嚴(yán)峻。學(xué)科館員和學(xué)者向機(jī)構(gòu)知識(shí)庫(kù)存繳的學(xué)術(shù)資源逐日增加,從數(shù)據(jù)海洋中獲取有用資源如大海撈針。

      2)機(jī)構(gòu)知識(shí)庫(kù)內(nèi)部存儲(chǔ)的科研成果數(shù)據(jù)在建設(shè)時(shí)缺乏標(biāo)準(zhǔn),組織方式不完善??v觀近些年的機(jī)構(gòu)知識(shí)庫(kù)研究,關(guān)注重點(diǎn)是開放獲取、長(zhǎng)期保存、機(jī)構(gòu)知識(shí)庫(kù)政策等[4],對(duì)于知識(shí)組織架構(gòu)的研究較少,以科研與教學(xué)角度出發(fā)的系統(tǒng)架構(gòu)相關(guān)研究則更少,從而,無(wú)法為用戶提供深層次的知識(shí)服務(wù)。

      3)機(jī)構(gòu)科研環(huán)境的變化也對(duì)機(jī)構(gòu)知識(shí)庫(kù)提出了新的要求。機(jī)構(gòu)知識(shí)庫(kù)已由最初的教育、科研機(jī)構(gòu)存儲(chǔ)本機(jī)構(gòu)成果的工具,轉(zhuǎn)變?yōu)橹匾闹R(shí)管理和傳播平臺(tái)。機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)逐漸以資源收集為中心到以利用為中心的轉(zhuǎn)變,這要求機(jī)構(gòu)知識(shí)庫(kù)建設(shè)人員轉(zhuǎn)變理念,深度整合資源,重視知識(shí)產(chǎn)出之間語(yǔ)義關(guān)聯(lián)關(guān)系管理[5]。

      機(jī)構(gòu)知識(shí)庫(kù)建設(shè)環(huán)境的變化指明了機(jī)構(gòu)庫(kù)發(fā)展的新模式。為滿足科研人員日益增長(zhǎng)的知識(shí)需求,機(jī)構(gòu)知識(shí)庫(kù)建設(shè)者需要提出系統(tǒng)的資源組合方式,積極探索知識(shí)對(duì)象間的多維關(guān)聯(lián)組織。

      1 研究現(xiàn)狀調(diào)研

      科研領(lǐng)域的開放關(guān)聯(lián)環(huán)境促使機(jī)構(gòu)知識(shí)庫(kù)向促進(jìn)學(xué)術(shù)成果廣泛傳播、利用轉(zhuǎn)變。機(jī)構(gòu)知識(shí)庫(kù)越來(lái)越強(qiáng)調(diào)科研成果內(nèi)容單元的深度揭示與關(guān)聯(lián)組織。然而,學(xué)者對(duì)機(jī)構(gòu)知識(shí)庫(kù)的知識(shí)組織方面關(guān)注尚缺,研究多集中在開放獲取、長(zhǎng)期保存、機(jī)構(gòu)知識(shí)庫(kù)政策和建設(shè)實(shí)踐的探討上。目前,從科研成果的深層次關(guān)聯(lián)角度進(jìn)行研究的,有開放獲取知識(shí)庫(kù)聯(lián)盟的Eloy Rodrigues[6],在2012年的中國(guó)開放獲取推介周國(guó)際研討會(huì)上他強(qiáng)調(diào),要發(fā)揮機(jī)構(gòu)知識(shí)庫(kù)的最大價(jià)值需要實(shí)現(xiàn)機(jī)構(gòu)庫(kù)間的互操作性。郎慶華[7]于2011年提出機(jī)構(gòu)知識(shí)庫(kù)多注重?cái)?shù)字對(duì)象本身的聯(lián)系,對(duì)知識(shí)之間關(guān)聯(lián)揭示不足,無(wú)法實(shí)現(xiàn)對(duì)知識(shí)關(guān)聯(lián)形成的知識(shí)網(wǎng)絡(luò)進(jìn)行瀏覽,極大地阻礙了機(jī)構(gòu)知識(shí)庫(kù)知識(shí)的再創(chuàng)造。李春秋[8]指出機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)過(guò)程中,知識(shí)組織十分必要,唯有健全的知識(shí)組織方法,才能讓更多的用戶使用IR。梁娜[9]等提出機(jī)構(gòu)知識(shí)庫(kù)應(yīng)不斷加強(qiáng)對(duì)內(nèi)容的結(jié)構(gòu)化語(yǔ)義化組織,拓展與其他服務(wù)內(nèi)容的動(dòng)態(tài)關(guān)聯(lián)。解金蘭[10]等認(rèn)為有效的數(shù)據(jù)管理和分析,有利于機(jī)構(gòu)庫(kù)進(jìn)一步實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)、數(shù)據(jù)融合與語(yǔ)義檢索。王思麗等[11]在建設(shè)CASIR過(guò)程中,探索利用關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)了機(jī)構(gòu)知識(shí)庫(kù)的語(yǔ)義擴(kuò)展。侯瑞芳等[12]設(shè)計(jì)了一個(gè)數(shù)據(jù)轉(zhuǎn)換模型,以實(shí)現(xiàn)文獻(xiàn)實(shí)體與高校實(shí)體間的精準(zhǔn)關(guān)聯(lián)。李晨英等[13]組織內(nèi)容時(shí)以人為中心,將教師與學(xué)術(shù)成果信息關(guān)聯(lián)起來(lái),使IR內(nèi)容形成網(wǎng)狀組織結(jié)構(gòu)。周宇等[14]提出一種面向關(guān)聯(lián)數(shù)據(jù)的機(jī)構(gòu)知識(shí)庫(kù)構(gòu)建方法,用于支持機(jī)構(gòu)知識(shí)的資源整合。知識(shí)組織的精髓在于揭示知識(shí)及知識(shí)間的關(guān)聯(lián)[15]。面對(duì)全新的科研環(huán)境,需要提出一個(gè)多維知識(shí)聚合模型的組織架構(gòu),進(jìn)一步揭示知識(shí)間細(xì)粒度的關(guān)聯(lián)關(guān)系,為科研成果的廣泛傳播服務(wù)。而國(guó)內(nèi)學(xué)者對(duì)機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)組織的研究多停留在對(duì)組織知識(shí)的必要性的探討,由此可見,機(jī)構(gòu)知識(shí)庫(kù)建設(shè)對(duì)資源整合尚缺乏完善的標(biāo)準(zhǔn)。

      2 主要技術(shù)調(diào)研

      數(shù)據(jù)模型搭建的標(biāo)準(zhǔn)化資源描述框架,集成組織異構(gòu)資源,對(duì)文本與非文本的科研成果進(jìn)行信息揭示、描述、組織,提高了資源的可見性和檢索性。本文對(duì)目前應(yīng)用較廣的Dspace系統(tǒng)和Fedora系統(tǒng)的數(shù)據(jù)模型進(jìn)行了分析。

      2.1 Dspace[16]數(shù)據(jù)模型

      2002年,美國(guó)麻省理工學(xué)院和惠普公司開發(fā)了DSpace@MIT,CALIS成員館的機(jī)構(gòu)知識(shí)庫(kù)大部分基于DSpace來(lái)構(gòu)建[17]。Dspace構(gòu)建的機(jī)構(gòu)知識(shí)庫(kù)以促進(jìn)知識(shí)資產(chǎn)的長(zhǎng)期保存為主要目標(biāo),數(shù)據(jù)模型組織數(shù)據(jù)的方式是映射機(jī)構(gòu)的組織結(jié)構(gòu)。Dspace6.x系統(tǒng)的數(shù)據(jù)模型主要由Community(社區(qū))、Collection(合集)、Item(條目)、Bundle(數(shù)據(jù)包)、Bitstream(數(shù)據(jù)流)、Bitstream Format(數(shù)據(jù)流格式)這幾個(gè)實(shí)體組成。單個(gè)的機(jī)構(gòu)知識(shí)庫(kù)組成一個(gè)社區(qū),每個(gè)社區(qū)能根據(jù)機(jī)構(gòu)的組織架構(gòu)進(jìn)一步劃分為小社區(qū)。社區(qū)由合集組成,合集可以在多個(gè)社區(qū)呈現(xiàn)。合集由若干條目構(gòu)成。每條條目由一個(gè)合集唯一擁有但可以在若干合集中呈現(xiàn)。一條條目由多個(gè)數(shù)據(jù)包組成,數(shù)據(jù)包內(nèi)包含多個(gè)數(shù)據(jù)流。每個(gè)數(shù)據(jù)流都與獨(dú)一無(wú)二的數(shù)據(jù)流格式相聯(lián)系。其中,社區(qū)包含Handle屬性,唯一標(biāo)識(shí)一條社區(qū)記錄。條目是歸檔的基本存檔單元,包含Handle屬性以唯一標(biāo)識(shí)一條記錄;Dublin Core屬性使每個(gè)資源有一條Qualified Dublin Core元數(shù)據(jù)記錄,用于實(shí)現(xiàn)互操作和自由獲??;Withdrawn屬性用于移除一條條目記錄,移除后的條目雖然還存儲(chǔ)在庫(kù)中但不能被用戶查看。大多數(shù)條目包含了原件、縮略圖、許可等信息。數(shù)據(jù)流格式包含Support Level屬性,表明機(jī)構(gòu)未來(lái)保護(hù)知識(shí)內(nèi)容的能力。

      2.2 Fedora數(shù)據(jù)模型

      Fedora是康奈爾大學(xué)在美國(guó)國(guó)家科學(xué)基金會(huì)和美國(guó)國(guó)防部高級(jí)研究項(xiàng)目機(jī)構(gòu)共同資助下進(jìn)行的關(guān)于復(fù)合數(shù)字對(duì)象模型的研究項(xiàng)目[18]。為了長(zhǎng)期保存和傳遞各種類型的數(shù)字內(nèi)容的本質(zhì)特征,F(xiàn)edora定義了一個(gè)通用數(shù)字對(duì)象模型。數(shù)字對(duì)象的基本組成包括數(shù)字對(duì)象唯一標(biāo)識(shí)符、對(duì)象屬性和數(shù)據(jù)流。一個(gè)數(shù)字對(duì)象可以包含一條或者多條數(shù)據(jù)流,數(shù)據(jù)流的內(nèi)容可以是數(shù)據(jù)、元數(shù)據(jù)、關(guān)系描述等信息。通過(guò)使用數(shù)據(jù)流,數(shù)據(jù)和元數(shù)據(jù)統(tǒng)一封裝。為了有效管理數(shù)字對(duì)象,模型定義了4種數(shù)字對(duì)象類型,包括Data Object(數(shù)據(jù)對(duì)象)、Service Definition Object(服務(wù)定義對(duì)象)、Service Deployment Object(服務(wù)配置對(duì)象)和Content Model Object(內(nèi)容模型對(duì)象)。在Fedora3.0以后,引入了內(nèi)容模型框架(Content Model Architecture,CMA)的管理方式,CMA為數(shù)字內(nèi)容的管理對(duì)象化、服務(wù)化,提供了一個(gè)更加高效、靈活的管理模式[19],但主要的管理還是關(guān)注在數(shù)字資源上。

      Dspace和Fedora構(gòu)建的資源存儲(chǔ)結(jié)構(gòu)以知識(shí)資源為中心,能較好地實(shí)現(xiàn)保存資源的任務(wù),并且具有一定的擴(kuò)展性。隨著機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)逐漸成熟,機(jī)構(gòu)知識(shí)庫(kù)的目標(biāo)向促進(jìn)資源機(jī)構(gòu)內(nèi)外傳播、助力知識(shí)發(fā)現(xiàn)創(chuàng)新的應(yīng)用方向發(fā)展,關(guān)注點(diǎn)應(yīng)跳出資源本身,對(duì)資源存在的環(huán)境和關(guān)聯(lián)關(guān)系及時(shí)捕獲。Dspace和Fedora模型對(duì)科研情境的關(guān)注不夠,因此,無(wú)法完全適應(yīng)機(jī)構(gòu)知識(shí)庫(kù)進(jìn)一步發(fā)展的需要。故在對(duì)這兩種模型進(jìn)行深入分析后,本文針對(duì)它們科研環(huán)境揭示不足、關(guān)聯(lián)關(guān)系維度單一等問題,設(shè)計(jì)了一個(gè)多維關(guān)聯(lián)科研成果及其科研環(huán)境的靈活可拓展的數(shù)據(jù)模型,以完善資源組織方式,促進(jìn)機(jī)構(gòu)資源的全面利用。

      3 概念與觀點(diǎn)

      3.1 多維度關(guān)聯(lián)

      維度是具有某一相同特征數(shù)據(jù)的集合,多維度則是從不同層次、不同角度呈現(xiàn)數(shù)據(jù),數(shù)據(jù)之間可以有交叉。多維數(shù)據(jù)模型中的數(shù)據(jù)是以多維邏輯方式組織,數(shù)據(jù)在各個(gè)維之間相互交叉,形成立體的數(shù)據(jù)視圖[20]。本文所述的多維度關(guān)聯(lián)研究就是研究高校機(jī)構(gòu)知識(shí)庫(kù)資源之間的相互關(guān)系,從客觀角度挖掘潛在的知識(shí)信息。

      3.2 研究觀點(diǎn)

      從支持科研與教學(xué)的角度出發(fā),尋找機(jī)構(gòu)成果資源間、成果與人員、成果與機(jī)構(gòu)、成果與團(tuán)隊(duì)的關(guān)聯(lián)關(guān)系,并進(jìn)行合理組織來(lái)滿足科研工作者日益增長(zhǎng)的知識(shí)發(fā)現(xiàn)的需求。針對(duì)高校機(jī)構(gòu)知識(shí)庫(kù)構(gòu)建過(guò)程中普遍存在的知識(shí)組織、知識(shí)整合難題,通過(guò)設(shè)計(jì)數(shù)據(jù)模型,將科研機(jī)構(gòu)的各類研究成果保存到機(jī)構(gòu)知識(shí)庫(kù)中,從而在機(jī)構(gòu)知識(shí)庫(kù)平臺(tái)的建設(shè)實(shí)踐中實(shí)現(xiàn)研究成果對(duì)象間深層次、多維度的數(shù)據(jù)關(guān)聯(lián)。

      4 數(shù)據(jù)模型概述

      機(jī)構(gòu)知識(shí)庫(kù)面向機(jī)構(gòu)內(nèi)所有的用戶,包括科研人員、學(xué)生、管理人員,收集、存儲(chǔ)他們的研究成果。由于高校的科學(xué)研究存在學(xué)科類型多樣,資源類型豐富等特點(diǎn),機(jī)構(gòu)知識(shí)庫(kù)在對(duì)多學(xué)科成果構(gòu)建模型時(shí),無(wú)法使用通用的概念去描述全部多學(xué)科異構(gòu)資源,因此,本研究設(shè)計(jì)一個(gè)通用的機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)描述框架,建立一個(gè)可供多種元數(shù)據(jù)標(biāo)準(zhǔn)共存的模型[21],為科學(xué)成果的集中、規(guī)范化組織管理與服務(wù)。

      4.1 總體架構(gòu)

      為了總體了解機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)模型的邏輯框架,本文首先給出概念結(jié)構(gòu)圖,以期能簡(jiǎn)要呈現(xiàn)數(shù)據(jù)模型的面貌。這個(gè)概念模型模擬機(jī)構(gòu)知識(shí)庫(kù)的全部業(yè)務(wù),羅列出機(jī)構(gòu)內(nèi)的科研對(duì)象以及對(duì)象間的關(guān)系。這一概念結(jié)構(gòu)作為便于理解模型的工具,并不存在于數(shù)據(jù)模型中,它只是用于組織本文的虛擬結(jié)構(gòu),如圖1所示。其中圓角矩形代表科研對(duì)象(圓角矩形內(nèi)的詞組即科研對(duì)象名稱),直線代表科研對(duì)象間存在著聯(lián)系。圓弧表示科研對(duì)象間的遞歸關(guān)系,即同一個(gè)科研對(duì)象間的關(guān)系。

      圖1 數(shù)據(jù)模型實(shí)體間關(guān)系圖

      在構(gòu)建的模型中,客觀世界中的科研對(duì)象被抽象成由一系列描述特征的屬性構(gòu)成的科研實(shí)體。為了便于理解,本文采用了一套配色方案以表現(xiàn)數(shù)據(jù)模型中涉及的不同實(shí)體類型以及特征,并用一套表示方法讓計(jì)算機(jī)可識(shí)別,具體如表1所示。

      在概念上,數(shù)據(jù)模型由一系列實(shí)體類型和特征組織而成。實(shí)體類型分為核心實(shí)體、二級(jí)實(shí)體、鏈接實(shí)體和虛擬實(shí)體。在特征上具有多語(yǔ)言、語(yǔ)義和附加特征。這一概念模型的部分將會(huì)在下文持續(xù)以抽象圖的形式呈現(xiàn)。物理層的技術(shù)細(xì)節(jié)則會(huì)以ERM(實(shí)體—關(guān)系—模型)子模型的形式呈現(xiàn)。抽象圖中,實(shí)體名是以完整名來(lái)描述概念(Person),在物理圖中則是以ir做前綴的簡(jiǎn)稱(irPers)。

      表1 數(shù)據(jù)模型類型及表示方法

      為了更好地理解模型,表2具體列出了機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)模型實(shí)體分類的詳情表,實(shí)體名后是實(shí)體在數(shù)據(jù)模型中的名稱表示。表中列舉了所有的核心實(shí)體和二級(jí)實(shí)體,由于鏈接實(shí)體含義相似數(shù)量龐大,為避免贅余故此處只列舉出部分。

      核心實(shí)體是機(jī)構(gòu)知識(shí)庫(kù)的主要組成部分。二級(jí)實(shí)體以核心實(shí)體為基礎(chǔ)拓展,對(duì)研究的語(yǔ)境進(jìn)行呈現(xiàn)。鏈接實(shí)體確立了實(shí)體以及實(shí)體之間的關(guān)系,實(shí)現(xiàn)語(yǔ)義關(guān)聯(lián)。為了降低模型的復(fù)雜性,本文建立了多種成果類型的虛擬集合,即成果實(shí)體(irDocumentX),方便對(duì)多種類型的資源進(jìn)行統(tǒng)一管理。它是數(shù)據(jù)模型中的唯一一個(gè)虛擬實(shí)體,也屬于核心實(shí)體。成果實(shí)體的成果類型根據(jù)需求調(diào)研中研究人員的期望選出,包括學(xué)術(shù)論文、學(xué)位論文、專著、報(bào)告、標(biāo)準(zhǔn)文獻(xiàn)、專利、數(shù)據(jù)集、音視頻、課件、圖片這11種資源。與成果實(shí)體關(guān)聯(lián)的各類資源繼承它的屬性并且擁有各自的屬性。把機(jī)構(gòu)內(nèi)的數(shù)據(jù)實(shí)體劃分為核心實(shí)體、二級(jí)實(shí)體、鏈接實(shí)體這3種類型,使模型結(jié)構(gòu)更加清晰,這3類實(shí)體對(duì)具有相同特征的實(shí)體歸類,并不描述機(jī)構(gòu)的任何科研對(duì)象。

      表2 機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)模型實(shí)體分類表

      此外,每個(gè)實(shí)體對(duì)應(yīng)具有特定屬性,用于描述該實(shí)體。下面以人員實(shí)體、機(jī)構(gòu)實(shí)體以及人員與機(jī)構(gòu)的鏈接實(shí)體為例呈現(xiàn)實(shí)體對(duì)應(yīng)的屬性描述。

      1)irPers實(shí)體屬性

      為了唯一識(shí)別一條人員記錄,提供了irPersId屬性。任何人員都可以在數(shù)據(jù)庫(kù)中建立一條記錄。

      表3 irPers實(shí)體屬性

      2)irOrg實(shí)體屬性

      主要描述的是人員所屬的機(jī)構(gòu)信息,此處所述機(jī)構(gòu)表現(xiàn)的是高校內(nèi)部的層級(jí)架構(gòu),機(jī)構(gòu)的信息相對(duì)固定。

      表4 irOrg實(shí)體屬性

      3)irPers_Org實(shí)體屬性

      人員與機(jī)構(gòu)之間存在歸屬關(guān)系,一個(gè)人可以歸屬于某個(gè)機(jī)構(gòu),也可以歸屬于多個(gè)機(jī)構(gòu),這個(gè)關(guān)系表表示的是人員與機(jī)構(gòu)內(nèi)部組織的從屬關(guān)系。開始時(shí)間和結(jié)束時(shí)間表示人員與機(jī)構(gòu)的關(guān)系在某個(gè)時(shí)期內(nèi)存在。

      表5 irPers_Org實(shí)體屬性

      4.2 實(shí)體類型

      4.2.1 核心實(shí)體

      核心實(shí)體是機(jī)構(gòu)知識(shí)庫(kù)的主要組成部分,傳統(tǒng)的機(jī)構(gòu)知識(shí)庫(kù)以典藏的角度演變而來(lái),主要以成果資源為核心實(shí)體,而本研究以成果實(shí)體(irDocumentX,其中X代表多種文獻(xiàn)類型)、團(tuán)體實(shí)體(irGroup)、人員實(shí)體(irPerson)和機(jī)構(gòu)實(shí)體(irOrganization)4個(gè)核心實(shí)體組成,以滿足從團(tuán)隊(duì)、人員、機(jī)構(gòu)3個(gè)角度進(jìn)行研究成果的深度分析。如圖2所示,表現(xiàn)了實(shí)體之間的連接關(guān)系,每個(gè)核心實(shí)體不僅自身內(nèi)部數(shù)據(jù)需要進(jìn)行關(guān)聯(lián),同時(shí)也需要與其他核心實(shí)體相關(guān)聯(lián)。圖中的圓圈表示實(shí)體之間的遞歸關(guān)系,即同一個(gè)實(shí)體間的關(guān)系。機(jī)構(gòu)、團(tuán)體、人員實(shí)體都存在遞歸關(guān)系。由于irDocumentX是作為虛擬實(shí)體存在的,它的遞歸關(guān)系在多種資源實(shí)體中得以體現(xiàn),并且每一種類型的資源實(shí)體都能與機(jī)構(gòu)、人員、團(tuán)體相連。此處使用虛擬實(shí)體是用irDocumentX實(shí)體來(lái)指代各種類型的資源實(shí)體,便于管理的同時(shí)使模型關(guān)聯(lián)關(guān)系更加簡(jiǎn)潔,同時(shí)讓成果類型可以根據(jù)機(jī)構(gòu)需要任意添加,具備擴(kuò)展性。

      圖2 數(shù)據(jù)模型中的核心實(shí)體(抽象圖)

      圖3以ERM視角展示了成果、團(tuán)體、機(jī)構(gòu)、人員4個(gè)核心實(shí)體以及一些與它們相關(guān)的實(shí)體。在圖3中的遞歸關(guān)系是指單個(gè)實(shí)體間的聯(lián)系,即Person間、Group間、Organization間和DocumentX間。在圖中,這些實(shí)體的遞歸關(guān)系以鏈接實(shí)體(irPers_Pers、irOrg_Org、irGro_Gro)的方式體現(xiàn)。由于成果實(shí)體是虛擬實(shí)體,其多種類型的資源間的遞歸關(guān)系在此不詳細(xì)呈現(xiàn),其與其他實(shí)體之間的鏈接關(guān)系在圖中呈現(xiàn)。圖中名稱為irPers_DocX、irPers_Gro、irPers_Org、irGro_DocX、irGro_Org、irOrg_DocX的實(shí)體也叫做鏈接實(shí)體,主要闡述兩個(gè)實(shí)體之間的關(guān)聯(lián)意義,其作用將會(huì)在鏈接實(shí)體部分做具體介紹。

      4.2.2 二級(jí)實(shí)體

      除了核心實(shí)體外,數(shù)據(jù)模型中還添加了很多的二級(jí)實(shí)體,名稱分別是irMetrics、irCite、irIndicator、irFund、irProject、irPrize、irQualification、irPAddress、irEAddress、irEdition。如圖4所示,二級(jí)實(shí)體圍繞著4個(gè)核心實(shí)體展開,通過(guò)與核心實(shí)體連接以實(shí)現(xiàn)對(duì)研究語(yǔ)境的呈現(xiàn)。

      二級(jí)實(shí)體與核心實(shí)體相關(guān)聯(lián)。每一個(gè)二級(jí)實(shí)體都有一些共同的屬性特征,例如至少都有ID和URI屬性。二級(jí)實(shí)體之間的聯(lián)系以及它們的多語(yǔ)言特征在圖中并沒有完全呈現(xiàn)出,這部分內(nèi)容將在模塊分析時(shí)逐一介紹。二級(jí)實(shí)體與其他實(shí)體關(guān)聯(lián)生成的鏈接實(shí)體具有的語(yǔ)義通過(guò)ClassId和ClassSchemaId屬性在語(yǔ)義層中定義。

      4.2.3 鏈接實(shí)體

      鏈接實(shí)體的是本模型表現(xiàn)多維度關(guān)聯(lián)的重要環(huán)節(jié),數(shù)據(jù)模型中用于表示實(shí)體與實(shí)體之間的聯(lián)系或者關(guān)系的實(shí)體為鏈接實(shí)體,通常將兩個(gè)實(shí)體連接起來(lái)。圖5為核心實(shí)體之間的聯(lián)系抽象圖,圖中展現(xiàn)出核心實(shí)體之間關(guān)聯(lián)產(chǎn)生的鏈接實(shí)體(Person_Organization、Person_Group、Person_DocumentX、Group_Organization、Group_DocumentX、Organization_DocumentX)。其中,表示人員發(fā)表各類成果、人員隸屬于高校的某個(gè)機(jī)構(gòu)、幾個(gè)歸屬于某個(gè)團(tuán)隊(duì)、團(tuán)隊(duì)產(chǎn)生成果、團(tuán)隊(duì)可能屬于某個(gè)部門之下、機(jī)構(gòu)是成果的擁有者等。

      數(shù)據(jù)模型中所有的鏈接實(shí)體的結(jié)構(gòu)和功能在物理層面上是一致的,表6從元數(shù)據(jù)的角度展現(xiàn)了鏈接實(shí)體的結(jié)構(gòu)和功能。

      圖3 核心實(shí)體、核心實(shí)體間的遞歸以及其他鏈接關(guān)系(物理視圖)

      表6 數(shù)據(jù)模型元數(shù)據(jù)視角的鏈接實(shí)體圖

      鏈接實(shí)體的物理名稱由兩個(gè)相連的實(shí)體的物理名稱共同組成,并且包括機(jī)構(gòu)知識(shí)庫(kù)的前綴ir,表示方法如下所示:irEntity1Name_Entity2Name。鏈接實(shí)體名稱的順序意味著它們的兩個(gè)唯一標(biāo)識(shí)符屬性的順序,第一個(gè)(irInheritedEntity1Identifier)繼承于irEntity1Name;第二個(gè)(irInheritedEntity2Identifier)繼承于irEntity2Name。在鏈接實(shí)體中所有的標(biāo)識(shí)符在元數(shù)據(jù)層面都會(huì)標(biāo)記為繼承,因?yàn)樗鼈儾⒉粊?lái)自于鏈接實(shí)體,而是從其他實(shí)體中繼承的,例如從irEntity1、irEntity2、irClass、irClassScheme繼承。所有的鏈接實(shí)體在兩個(gè)實(shí)體間建立聯(lián)系都是通過(guò)繼承兩個(gè)實(shí)體的唯一標(biāo)示符irInheritedEntity1Identifier和irInheritedEntity2Identifier(即ID)建立起來(lái)的。除此之外,通過(guò)irInheritedClassIdentifier和irInheritedClassSchemeIdentifier映射到語(yǔ)義層以及通過(guò)irFraction屬性給分類(角色或類型)引用指派部分值,鏈接實(shí)體攜帶了語(yǔ)義。Classification和ClassificationScheme引用是強(qiáng)制要求的,但是Fraction屬性不是必須的。同時(shí),每個(gè)連接記錄要求有起始時(shí)間和結(jié)束時(shí)間,以清楚說(shuō)明鏈接作用的時(shí)間范圍。繼承的標(biāo)識(shí)符屬性和日期屬性一起構(gòu)成鏈接實(shí)體的主鍵。

      4.3 數(shù)據(jù)模型特征

      4.3.1 多語(yǔ)言特征

      在學(xué)術(shù)環(huán)境下,許多學(xué)術(shù)信息在記錄時(shí)需要不止一種語(yǔ)言去表達(dá)。多語(yǔ)言特征對(duì)于用多種語(yǔ)言保存學(xué)術(shù)信息的機(jī)構(gòu)具有重要意義。圖7展示了部分具有多語(yǔ)言特征的實(shí)體。它們的標(biāo)識(shí)符(irProjId、irOrgId、irGroId)指向了它們?cè)瓉?lái)的實(shí)體。存儲(chǔ)在irLangCode屬性之下的編碼語(yǔ)言有兩種值,中文(irLangCode=ch)和英文(irLangCode=en)。名字、標(biāo)題、描述、關(guān)鍵詞、研究興趣等以特定的語(yǔ)言存儲(chǔ)文本。

      圖4 數(shù)據(jù)模型的二級(jí)實(shí)體(物理視圖)

      4.3.2 語(yǔ)義特征

      數(shù)據(jù)模型的語(yǔ)義特征是對(duì)應(yīng)鏈接實(shí)體中關(guān)聯(lián)關(guān)系的表現(xiàn),也是通常所指的語(yǔ)義層。它利用Classification Schema來(lái)存儲(chǔ)實(shí)體與實(shí)體、實(shí)體與屬性之間的關(guān)聯(lián)內(nèi)容,在此語(yǔ)義特征部分提供了語(yǔ)義類型、扮演的角色、專業(yè)分類或映射等多個(gè)語(yǔ)義方式。語(yǔ)義特征層存儲(chǔ)鏈接實(shí)體描述的語(yǔ)義值,通過(guò)ClassSchemaId屬性,把每個(gè)語(yǔ)義值指派到特定的Classification Schema中。數(shù)據(jù)模型的語(yǔ)義層由Class和ClassSchema兩種class類型的實(shí)體組成。另外,它允許對(duì)多語(yǔ)種的術(shù)語(yǔ)(irClassTerm)和術(shù)語(yǔ)描述(irClassDescr)的說(shuō)明。這兩種class類型的實(shí)體(irClass和irClassSchema)用兩種遞歸實(shí)體(irClass_Class、irClassScheme_ClassScheme)內(nèi)連接以說(shuō)明結(jié)構(gòu)和Classification和Classification Schema間的映射。數(shù)據(jù)模型語(yǔ)義層的遞歸實(shí)體始終支持Classification參考的小數(shù)部分的值[22]。

      4.3.3 附加特征

      根據(jù)機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)環(huán)境,可建立不同的附加特征。例如將機(jī)構(gòu)知識(shí)庫(kù)的數(shù)據(jù)字段與Dublin Core等各類元數(shù)據(jù)模型進(jìn)行字段映射,方便數(shù)據(jù)共享與交換。

      圖5 數(shù)據(jù)模型鏈接實(shí)體關(guān)系圖(抽象圖)

      圖6 數(shù)據(jù)模型的鏈接實(shí)體樣例(物理視圖)

      5 實(shí)體分析

      5.1 人員實(shí)體(irPerson)

      人員實(shí)體指的是所有成果資源的人員信息,包括創(chuàng)建者、申請(qǐng)人、受益人等。如圖8摘錄了部分Person實(shí)體與其他實(shí)體的連接關(guān)系,Person實(shí)體與其他核心實(shí)體的關(guān)系已在前文中介紹,在此不贅述。每個(gè)Person實(shí)體創(chuàng)建一個(gè)irPersID,由此ID與所有的外部實(shí)體以及屬性進(jìn)行關(guān)聯(lián),例如一個(gè)人可能有多個(gè)姓名的表達(dá)方式并且可能會(huì)變化,因此構(gòu)建irPersName與irPers實(shí)體關(guān)聯(lián),關(guān)聯(lián)后生成一個(gè)新的實(shí)體(irPers_PersName),通過(guò)實(shí)體的irClassId和irClassSchemeId屬性映射到語(yǔ)義層對(duì)人名進(jìn)行說(shuō)明。

      圖7 部分有多語(yǔ)言特征的數(shù)據(jù)模型實(shí)體(物理視圖)

      圖8 數(shù)據(jù)模型核心實(shí)體irPerson(物理視圖)

      如圖8所示,人員實(shí)體與其它實(shí)體也建立了關(guān)聯(lián),進(jìn)行關(guān)聯(lián)的實(shí)體包括irPerson、irPrize、irQualification、irPostAddress、irElectronic Address、irExpertiseAndSkills、irPersonName、irCurriculumVitae、irClassification,所建立的關(guān)系分別為irPers_Pers、irPers_Prize、irPers_Qual、irPers_PAddr、irPers_EAddr、irPers_ExpSkills、irPersName_Pers、irPers_CV、irPers_Class。每個(gè)關(guān)系或者鏈接實(shí)體使用time-stamped屬性通過(guò)irClassId和irClassSchemeId映射到語(yǔ)義層。此外,人員實(shí)體的人員關(guān)鍵詞(irPersKeyw)、人員研究興趣(irPersResInt)具有多語(yǔ)言特征。個(gè)人與個(gè)人進(jìn)行合作。個(gè)人有獲獎(jiǎng)經(jīng)歷、職稱、電子郵箱和通訊地址、強(qiáng)項(xiàng)、名字等信息。

      5.2 機(jī)構(gòu)實(shí)體(irOrganization)

      本模型所闡述的機(jī)構(gòu)指的是相對(duì)較穩(wěn)定的學(xué)術(shù)團(tuán)體,例如學(xué)院、研究所、實(shí)驗(yàn)室等。與Person實(shí)體的創(chuàng)建方式類似,在每個(gè)irOrg提供了id屬性(irOrgId),機(jī)構(gòu)實(shí)體與其他實(shí)體建立聯(lián)系,包括Organization、Person、Prize、Expertise and Skills、Post Address、Classification,可分別表示為irOrg_Org、irOrg_Pers、irOrg_Prize、irOrg_ExpSkills、irOrg_PAddr、irOrg_Class。每個(gè)關(guān)系或者鏈接實(shí)體使用time-stamped屬性通過(guò)irClassId和irClassSchemeId映射到語(yǔ)義層。另外,機(jī)構(gòu)實(shí)體的機(jī)構(gòu)名(irOrgName)、機(jī)構(gòu)關(guān)鍵詞(irOrgKeyw)、機(jī)構(gòu)研究活動(dòng)(irOrgResAct)具有多語(yǔ)言的特征。

      5.3 團(tuán)體實(shí)體(irGroup)

      跨學(xué)科和跨機(jī)構(gòu)的合作交流頻繁,涌現(xiàn)出許多跨地區(qū)跨領(lǐng)域的科學(xué)研究。A機(jī)構(gòu)人員研究成果可能B機(jī)構(gòu)人員也參與其中,這類情況在項(xiàng)目合作、論文合作、專利合作等諸多方面均有體現(xiàn)。這樣的團(tuán)隊(duì)合作信息可以被科研人員使用,用于尋找合作伙伴、追蹤競(jìng)爭(zhēng)對(duì)手。在此背景下,本模型設(shè)計(jì)了團(tuán)體實(shí)體并將其作為核心實(shí)體,以記錄團(tuán)隊(duì)合作產(chǎn)生的成果以及團(tuán)隊(duì)情況。此類科學(xué)研究涉及多家機(jī)構(gòu),除了本機(jī)構(gòu)的科研人員參與外,也有其他科研人員做出貢獻(xiàn)。本模型所闡述的團(tuán)隊(duì)實(shí)體相對(duì)機(jī)構(gòu)實(shí)體而言較為松散,指的是非正式的創(chuàng)造出科研產(chǎn)出的科研人員的合集。

      核心實(shí)體irGro提供了id屬性(irGroId)。機(jī)構(gòu)實(shí)體的通用屬性還包括首字母縮寫詞、統(tǒng)一資源標(biāo)識(shí)符以及團(tuán)體成立和解散的時(shí)間(irAcro、irURI、irStartDate、irEndDate)。團(tuán)體實(shí)體與許多其他實(shí)體可建立聯(lián)系,包括:Group、Organization、Person、DocumentX、Classification,可分別表示為irGro_Gro、irGro_Org、irGro_Pers、irGro_DocX、irGro_Class。每個(gè)關(guān)系或者鏈接實(shí)體使用time-stamped屬性通過(guò)irClassId和irClassSchemeId映射到語(yǔ)義層。另外,團(tuán)體實(shí)體的團(tuán)體名(irGroName)、團(tuán)體關(guān)鍵詞(irGroKeyw)、團(tuán)體描述(irGroDes)也同樣具有多語(yǔ)言的特征。

      5.4 成果實(shí)體(irDocumentX)

      成果資源的收集、建設(shè)是機(jī)構(gòu)知識(shí)庫(kù)生存、發(fā)展的關(guān)鍵。在傳統(tǒng)的學(xué)術(shù)交流體系中,期刊論文是最重要的研究成果,也是研究人員獲取學(xué)術(shù)信息的重要途徑。在E-science環(huán)境下,信息化的科研環(huán)境得以建立。期刊論文作為科研過(guò)程中的最終產(chǎn)出,伴隨著科研同時(shí)產(chǎn)生的數(shù)據(jù)集、圖片、手稿等成果類型,對(duì)于重現(xiàn)科研流程、供研究人員研究學(xué)習(xí)同樣具有極高的價(jià)值。在此環(huán)境下,科學(xué)研究開始向數(shù)據(jù)密集型科研轉(zhuǎn)變:越來(lái)越多的科學(xué)研究不再?gòu)念^開始,而是建立在對(duì)已有數(shù)據(jù)的重新認(rèn)識(shí)、組織、解析、分析和利用的基礎(chǔ)上,用不同的工具或方法、不同的時(shí)間段對(duì)同一組科學(xué)數(shù)據(jù)進(jìn)行分析可以產(chǎn)生不同的結(jié)果[23]。在機(jī)構(gòu)知識(shí)庫(kù)中對(duì)多種類型資源進(jìn)行保存、管理,使科研成果能為今后的科研人員獲得對(duì)科研創(chuàng)新意義重大。

      成果實(shí)體(irDocumentX)是四大核心實(shí)體之一,用于存放學(xué)術(shù)成果和數(shù)據(jù)資源。在此概念結(jié)構(gòu)中irDocumentX是唯一的虛擬實(shí)體,它不作為實(shí)體存在而是用于指代機(jī)構(gòu)知識(shí)庫(kù)中不同類型的成果。機(jī)構(gòu)知識(shí)庫(kù)的成果資源中常用類型包括:學(xué)術(shù)論文、學(xué)位論文、專著、報(bào)告、標(biāo)準(zhǔn)文獻(xiàn)、專利、數(shù)據(jù)集、音視頻、課件、圖片等。為了識(shí)別一條成果記錄,成果實(shí)體irDocX提供了id屬性(irDocXId)。如圖9所示,本模型用irDocX指代了所有類型的資源,通過(guò)irDocXId與其他類型資源進(jìn)行關(guān)聯(lián),生成例如irDocBook_DocX、irDocArticle_DocX、irDocPat_DocX等關(guān)系,既表明了資源與自身之間的關(guān)聯(lián),又表明了資源與其他類型資源之間的關(guān)聯(lián)。以irDocBook_irDocX為例,當(dāng)irDocX指代的是irDocBook時(shí),表明了irDocBook與自身相關(guān)聯(lián)(irDocBook_DocBook);當(dāng)irDocX指代除irDocBook以外的資源時(shí),表明了irDocBook與其他資源存在關(guān)聯(lián)(如irDocBook_DocArticle、irDocBook_DocPat、irDocBook_DocImage)。資源自身的相互鏈接以及與其他類型資源的鏈接所生成的實(shí)體稱為鏈接實(shí)體。資源實(shí)體之間鏈接實(shí)體的存在,指明了不同資源之間存在著或多或少的聯(lián)系。期刊論文、會(huì)議論文、學(xué)位論文、專著、專利等傳統(tǒng)文獻(xiàn)出版物系由科研人員創(chuàng)作,經(jīng)過(guò)同行評(píng)議出版發(fā)布,因此,這些出版物類型的文獻(xiàn)知識(shí)產(chǎn)出由科研人員最初創(chuàng)作的研究手稿變化而來(lái),文獻(xiàn)出版物之間具有引用關(guān)系[24]。另外,在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,科學(xué)數(shù)據(jù)集與科學(xué)文獻(xiàn)的關(guān)系越來(lái)越密切??茖W(xué)文獻(xiàn)中為佐證結(jié)論形成過(guò)程,往往也包含文本格式的科學(xué)數(shù)據(jù)[25]。因此,為了數(shù)據(jù)模型的可擴(kuò)展性,對(duì)不同資源間存在的相關(guān)關(guān)系會(huì)在irDocX與資源關(guān)聯(lián)生成的鏈接實(shí)體中使用time-stamped屬性通過(guò)irClassId和irClassSchemeId映射到語(yǔ)義層去定義。

      5.5 其他實(shí)體

      5.5.1 Metrics(irMetrics)

      Metrics在機(jī)構(gòu)知識(shí)庫(kù)中的主要作用是機(jī)構(gòu)評(píng)估,不同的機(jī)構(gòu)知識(shí)庫(kù)可以對(duì)其進(jìn)行不同的定制,并且可以設(shè)置多個(gè)相關(guān)屬性,以用來(lái)對(duì)科研人員、科研機(jī)構(gòu)、科研團(tuán)隊(duì)和科研成果的評(píng)估,從而管理人才、選擇優(yōu)勢(shì)學(xué)科、比較與競(jìng)爭(zhēng)者的差距。

      5.5.2 引用實(shí)體、貢獻(xiàn)度實(shí)體(irCite & irIndicator)

      Indicator和Cite都是針對(duì)成果(即DocumentX)的測(cè)量實(shí)體。Indicator在本模型中指的是對(duì)文獻(xiàn)的貢獻(xiàn)度,主要是對(duì)不同的人給予不同的貢獻(xiàn)度的屬性,以便對(duì)成果進(jìn)行深入分析預(yù)評(píng)估;Cite在本機(jī)構(gòu)庫(kù)中指的是文獻(xiàn)的引用情況。

      5.5.3 項(xiàng)目實(shí)體、基金實(shí)體(irProject & irFund)

      Project在本機(jī)構(gòu)庫(kù)中指的是產(chǎn)生成果輸出的科研項(xiàng)目;Fund指的是科研成果所屬的科研基金。

      6 案例分析

      根據(jù)多維度關(guān)聯(lián)的機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)模型進(jìn)行數(shù)據(jù)模擬,從上海交大學(xué)者王如竹的部分成果進(jìn)行分析。他所屬的研究領(lǐng)域?yàn)橹评浼暗蜏毓こ?,在上海交大的制冷與低溫研究所工作。他與吳靜怡、王麗偉、郭開華、孫志高有科研協(xié)作關(guān)系。產(chǎn)出的大量論文中,《制冷技術(shù)發(fā)展與全球環(huán)境問題》為個(gè)人研究產(chǎn)出,《低品位熱能驅(qū)動(dòng)的高效熱化學(xué)吸附式制冷研究》與王麗偉合作產(chǎn)出,另外6部作品分別是參與的團(tuán)隊(duì)A、團(tuán)隊(duì)B的共同產(chǎn)出。

      圖9 成果實(shí)體內(nèi)各資源類型的關(guān)系(物理視圖)

      圖10 學(xué)者成果關(guān)聯(lián)示意圖

      通過(guò)成果關(guān)聯(lián)示意圖可以看出,數(shù)據(jù)關(guān)聯(lián)可實(shí)現(xiàn)以下功能:

      1)關(guān)聯(lián)發(fā)現(xiàn)學(xué)者個(gè)人信息:將個(gè)人履歷、電子郵箱、通訊地址、獎(jiǎng)項(xiàng)、職稱與王如竹關(guān)聯(lián),通過(guò)王如竹可以直接獲取與他相關(guān)的個(gè)人信息。王如竹的研究歸屬于制冷及低溫工程研究所,通過(guò)機(jī)構(gòu)實(shí)體將王如竹與王麗偉聯(lián)系起來(lái)。

      2)發(fā)現(xiàn)合作者:王如竹與王麗偉共同發(fā)表了《低品位熱能驅(qū)動(dòng)的高效熱化學(xué)吸附式制冷研究》這篇論文,通過(guò)資源實(shí)體可認(rèn)定他們是合作者關(guān)系。王如竹與吳靜怡同樣都是團(tuán)隊(duì)A的成員,那他們也具有合作者關(guān)系。通過(guò)是否擁有共同成果來(lái)鑒別,可以有效識(shí)別發(fā)現(xiàn)合作者關(guān)系。共同成果越多,合作關(guān)系越緊密。合作關(guān)系可用可視化圖表來(lái)表示,某位學(xué)者與其他學(xué)者距離的遠(yuǎn)近,即代表合作關(guān)系的親疏。

      3)個(gè)人成果聚合:可以對(duì)各個(gè)學(xué)者的成果聚合,集中展示,其中包括個(gè)人作品、合作產(chǎn)出作品。

      4)關(guān)聯(lián)檢索合作團(tuán)隊(duì):王如竹除了存在于上海交大的制冷與低溫研究院,還與其他學(xué)者組成相對(duì)松散的科研團(tuán)隊(duì)。將研究人員與團(tuán)隊(duì)也進(jìn)行綁定,可以找到合作團(tuán)隊(duì)信息以及衍生作品。

      5)個(gè)人評(píng)估:使用一套個(gè)人評(píng)價(jià)體系,分析科研人員的學(xué)術(shù)成就,從而進(jìn)行個(gè)人評(píng)估。

      從機(jī)構(gòu)、團(tuán)隊(duì)、成果資源、項(xiàng)目等多個(gè)角度均可進(jìn)行如圖10相似的關(guān)聯(lián)關(guān)系分析,經(jīng)過(guò)分析發(fā)現(xiàn),模型能較好地組織與聚合知識(shí)資源,實(shí)現(xiàn)關(guān)聯(lián)知識(shí),使科研人員更快、更完整地了解到相關(guān)信息。

      1)關(guān)聯(lián)檢索:支持由一條成果記錄,從作者、團(tuán)隊(duì)、機(jī)構(gòu)、基金、主題等方式進(jìn)行關(guān)聯(lián)檢索,發(fā)現(xiàn)相關(guān)知識(shí);由一條研究人員記錄,關(guān)聯(lián)檢索其個(gè)人信息(包括個(gè)人履歷、電子郵箱、獲獎(jiǎng)經(jīng)歷等),從研究領(lǐng)域、合作者、團(tuán)隊(duì)、機(jī)構(gòu)關(guān)聯(lián)檢索,發(fā)現(xiàn)相關(guān)知識(shí)。由一條機(jī)構(gòu)記錄,關(guān)聯(lián)檢索機(jī)構(gòu)學(xué)者、團(tuán)隊(duì)等內(nèi)容;由一條團(tuán)隊(duì)信息,從團(tuán)隊(duì)成員、所屬機(jī)構(gòu)等方式進(jìn)行關(guān)聯(lián)檢索,發(fā)現(xiàn)相關(guān)內(nèi)容。

      2)聚合知識(shí):提供從機(jī)構(gòu)、院系、團(tuán)隊(duì)、研究人員、基金方式聚合的成果目錄和聚類;根據(jù)文本間的引用與被引關(guān)系,揭示成果集合內(nèi)蘊(yùn)含的關(guān)系,進(jìn)行成果引證關(guān)系的聚合;將內(nèi)容上具有關(guān)聯(lián)性和相似性的成果整合分析,聚合結(jié)構(gòu)不同、表現(xiàn)形式不同的成果;提供語(yǔ)種、發(fā)布時(shí)間的知識(shí)聚合。

      3)識(shí)別各類協(xié)作關(guān)系:支持通過(guò)數(shù)據(jù)挖掘和統(tǒng)計(jì)分析,識(shí)別研究人員間的協(xié)作關(guān)系、機(jī)構(gòu)科研協(xié)作關(guān)系、成果引證關(guān)系。

      4)科研產(chǎn)出力分析:統(tǒng)計(jì)個(gè)人、學(xué)院、團(tuán)隊(duì)每年成果產(chǎn)出量,通過(guò)比較個(gè)人間、學(xué)院間、團(tuán)隊(duì)間的投入和產(chǎn)出,從而進(jìn)行績(jī)效分析。

      5)學(xué)科貢獻(xiàn)度分析:統(tǒng)計(jì)屬于某學(xué)科各類科研成果的個(gè)人、團(tuán)隊(duì)、院系貢獻(xiàn)度,與其他機(jī)構(gòu)比較,從而識(shí)別出機(jī)構(gòu)具有學(xué)術(shù)競(jìng)爭(zhēng)力的學(xué)者,發(fā)現(xiàn)優(yōu)勢(shì)學(xué)科,為人才評(píng)估、學(xué)科評(píng)估服務(wù)。

      7 結(jié) 語(yǔ)

      隨著開放存取運(yùn)動(dòng)日趨深入人心,機(jī)構(gòu)知識(shí)庫(kù)建設(shè)也逐漸成熟,從最初長(zhǎng)期保存知識(shí)資產(chǎn)為目標(biāo)轉(zhuǎn)變?yōu)橄蛱峁┛蒲小⒔虒W(xué)服務(wù)的應(yīng)用方向發(fā)展。不同于反映機(jī)構(gòu)的等級(jí)結(jié)構(gòu)的Dspace數(shù)據(jù)模型和將所有數(shù)字對(duì)象使用統(tǒng)一方式揭示的Fedora通用數(shù)字對(duì)象模型,本模型明確定義了人員、機(jī)構(gòu)、團(tuán)隊(duì)、成果四類核心實(shí)體和具備一系列操作的二級(jí)實(shí)體,實(shí)體內(nèi)容與行為操作分離使得數(shù)據(jù)模型具有拓展性。在以結(jié)構(gòu)固定的機(jī)構(gòu)架構(gòu)組織的同時(shí),學(xué)術(shù)團(tuán)隊(duì)的引入也是本模型的一大特色,團(tuán)體相較于機(jī)構(gòu)結(jié)構(gòu)松散,在以往的數(shù)據(jù)模型中往往被忽視,但對(duì)于研究人員發(fā)現(xiàn)知識(shí)和尋找學(xué)術(shù)合作具有一定的意義。機(jī)構(gòu)知識(shí)庫(kù)作為機(jī)構(gòu)知識(shí)基礎(chǔ)設(shè)施,促進(jìn)知識(shí)的長(zhǎng)期保存,促進(jìn)知識(shí)內(nèi)外傳播從而促進(jìn)學(xué)術(shù)信息交流與評(píng)價(jià)的目標(biāo)將會(huì)逐步實(shí)現(xiàn),機(jī)構(gòu)知識(shí)庫(kù)也會(huì)朝著支持文本與多媒體知識(shí)、支持教育科研活動(dòng)、支持機(jī)構(gòu)知識(shí)管理方向發(fā)展,進(jìn)而成為一個(gè)知識(shí)服務(wù)平臺(tái)。

      猜你喜歡
      數(shù)據(jù)模型知識(shí)庫(kù)關(guān)聯(lián)
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
      面板數(shù)據(jù)模型截面相關(guān)檢驗(yàn)方法綜述
      奇趣搭配
      加熱爐爐內(nèi)跟蹤數(shù)據(jù)模型優(yōu)化
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
      基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
      圖書館研究(2015年5期)2015-12-07 04:05:48
      面向集成管理的出版原圖數(shù)據(jù)模型
      一種顧及級(jí)聯(lián)時(shí)空變化描述的土地利用變更數(shù)據(jù)模型
      张掖市| 伊川县| 武定县| 景宁| 泰顺县| 营山县| 白河县| 阿荣旗| 馆陶县| 金山区| 尉氏县| 新田县| 台北市| 卢龙县| 曲水县| 绿春县| 德钦县| 石渠县| 那坡县| 秀山| 呼图壁县| 西青区| 仲巴县| 乌恰县| 五家渠市| 山西省| 松桃| 武汉市| 汨罗市| 东安县| 怀安县| 临夏县| 舒兰市| 阿克| 九龙县| 北宁市| 民勤县| 侯马市| 全州县| 广丰县| 曲麻莱县|