• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    關(guān)于語義網(wǎng)背景下信息組織方法變化的思考

    2018-01-18 10:52:41,
    圖書館界 2017年6期
    關(guān)鍵詞:本體關(guān)聯(lián)語義

    ,

    (首都圖書館,北京 100021)

    1 引 言

    信息組織是人類檢索信息、利用信息的前提,是圖書館學(xué)研究的核心。隨著信息資源數(shù)量激增、形式和載體形態(tài)的不斷發(fā)展,信息組織方法也從早期的分類法、主題法、分類主題一體化,發(fā)展到搜索引擎、主題樹、元數(shù)據(jù)等方法。20世紀(jì)以來信息組織方法與計算機(jī)、互聯(lián)網(wǎng)技術(shù)的發(fā)展更加密不可分。1998年語義網(wǎng)設(shè)想的提出,為信息組織方法向關(guān)聯(lián)性、細(xì)粒度的知識組織方法發(fā)展提供了一個契機(jī)。完整的語義網(wǎng)絡(luò)模型從下至上包括Unicode與URI層、XML Schema層、RDF Schema層、Ontology Voca-bulary層、Logic層、Proof層、Trust層這7層結(jié)構(gòu)。由于語義網(wǎng)絡(luò)模型過于復(fù)雜,其應(yīng)用基本局限于學(xué)術(shù)研究領(lǐng)域的試驗性開發(fā)。2006年,蒂姆·伯納斯-李拋開語義網(wǎng)絡(luò)模型中的復(fù)雜成分,在URI和RDF技術(shù)基礎(chǔ)上,再次提出“關(guān)聯(lián)數(shù)據(jù)”的概念。關(guān)聯(lián)數(shù)據(jù)是以URI作為數(shù)據(jù)標(biāo)識,以資源描述框架RDF的三元組結(jié)構(gòu)作為數(shù)據(jù)模型,并基于HTTP發(fā)布到互聯(lián)網(wǎng)上的數(shù)據(jù)應(yīng)用形式。由于關(guān)聯(lián)數(shù)據(jù)是將相關(guān)數(shù)據(jù)鏈接起來,是語義鏈接,而不是將相關(guān)文件、網(wǎng)頁鏈接起來,所以關(guān)聯(lián)數(shù)據(jù)可看作是語義網(wǎng)的簡化實現(xiàn),旨在構(gòu)建計算機(jī)可理解的語義數(shù)據(jù)網(wǎng)絡(luò),而非只有人才能讀懂的文檔網(wǎng)絡(luò)。語義網(wǎng)與關(guān)聯(lián)數(shù)據(jù)帶來了信息組織對象的新變化,數(shù)據(jù)的龐大以及數(shù)據(jù)間網(wǎng)狀的語義關(guān)系,讓信息組織工作者開始利用新的技術(shù)手段和方法,對知識、信息進(jìn)行更科學(xué)的組織。本文在對信息組織方法做簡單梳理的過程中,結(jié)合語義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)等背景,對未來信息組織的對象及方法進(jìn)行了思考與探索。

    2 信息組織到知識組織的傳承與發(fā)展

    任何事物都離不開歷史的傳承,梳理信息組織方法的發(fā)展歷程,不難發(fā)現(xiàn)信息組織方法正在從傳統(tǒng)文獻(xiàn)組織階段、網(wǎng)絡(luò)信息組織階段,向知識組織的階段過渡。

    2.1 傳統(tǒng)文獻(xiàn)信息組織方法

    分類法和主題法是傳統(tǒng)的信息組織方法,是幾代哲學(xué)家、科學(xué)家、圖書情報學(xué)家集體智慧和經(jīng)驗的結(jié)晶。分類法是指依據(jù)一定的分類體系,根據(jù)文獻(xiàn)的內(nèi)容屬性和其他特征,對文獻(xiàn)分門別類地、系統(tǒng)的組織與揭示的方法。主題法一般指直接以表示文獻(xiàn)主題的詞語做標(biāo)識,提供字順檢索途徑,并主要采用參照系統(tǒng)揭示詞間關(guān)系的標(biāo)引和檢索文獻(xiàn)的方法。分類法是語法信息組織和語義信息組織的綜合,從學(xué)科角度集約信息,便于族性檢索;主題法建立在自然語言基礎(chǔ)之上,是另一種形式的語義信息與語法信息組織的綜合,是從事物角度集約信息,便于特性檢索。這兩類方法在傳統(tǒng)文獻(xiàn)組織階段發(fā)揮了巨大作用。直到現(xiàn)在,我國圖書館領(lǐng)域在非數(shù)字化文獻(xiàn)的信息組織方面仍在采用這兩種方法。由于這兩種方法誕生于紙質(zhì)文獻(xiàn)時期,對信息組織對象的揭示還屬于線性和粗粒度的,所以隨著時代和技術(shù)的發(fā)展,這兩種信息組織方法也必然會發(fā)生改變。

    2.2 網(wǎng)絡(luò)環(huán)境下信息組織方法

    從1969年10月29日22點30分,阿帕網(wǎng)加州大學(xué)洛杉磯分校(UCLA)第一節(jié)點與斯坦福研究院(SRI)第二節(jié)點的聯(lián)通,實現(xiàn)了分組交換網(wǎng)絡(luò)的遠(yuǎn)程通訊,就宣告了互聯(lián)網(wǎng)的誕生。從此以后,網(wǎng)絡(luò)信息資源鋪天蓋地而來。在信息資源的主導(dǎo)類型已由印刷型轉(zhuǎn)變?yōu)閿?shù)字型的現(xiàn)實背景下,元數(shù)據(jù)的研究更是十分具有現(xiàn)實意義的課題。1995年由圖書館領(lǐng)域和計算機(jī)領(lǐng)域的專家共同提出DC元數(shù)據(jù)方案,DC元數(shù)據(jù)來自于圖書館文獻(xiàn)標(biāo)引和電子文件管理的結(jié)合,并成為這個交叉領(lǐng)域語義描述的主導(dǎo)標(biāo)準(zhǔn)格式。元數(shù)據(jù)對信息資源進(jìn)行描述和解釋,促進(jìn)信息資源的檢索、管理和利用。通常元數(shù)據(jù)方案的總體結(jié)構(gòu)可以分為三個層次:內(nèi)容結(jié)構(gòu)、句法結(jié)構(gòu)、語義結(jié)構(gòu);這種特征讓元數(shù)據(jù)為分布的、多種信息資源組成的信息系統(tǒng)提供了整合的工具和紐帶。

    此后,圖書館學(xué)領(lǐng)域和計算機(jī)領(lǐng)域分別在各自方向上進(jìn)行網(wǎng)絡(luò)信息資源組織的探索。圖書館學(xué)主要以網(wǎng)絡(luò)信息資源為研究對象,側(cè)重于傳統(tǒng)的文獻(xiàn)信息分類組織思想與主題詞表對網(wǎng)絡(luò)信息資源組織的科學(xué)性、完備性和適應(yīng)性等問題的研究,關(guān)注元數(shù)據(jù)研究,同時對傳統(tǒng)的信息組織方法進(jìn)行改造,如分類主題詞表的網(wǎng)絡(luò)化和自動構(gòu)建、自動分類、自動標(biāo)引、元數(shù)據(jù)的互操作等。計算機(jī)科學(xué)主要以互聯(lián)網(wǎng)環(huán)境下用戶信息搜索行為為研究對象,注重于網(wǎng)絡(luò)信息資源組織管理的智能化、高效率和簡便性研究,關(guān)注搜索引擎技術(shù)、超本文方法、自然語言檢索等。二者之間缺乏有效的融合,且對信息資源的組織仍停留在較大粒度的文獻(xiàn)和文件層面。

    2.3 語義網(wǎng)背景下信息組織向知識組織發(fā)展

    語義網(wǎng)的誕生、關(guān)聯(lián)技術(shù)的發(fā)展,讓信息之間通過網(wǎng)絡(luò)發(fā)生了千絲萬縷的聯(lián)系。信息之間邏輯意義上的關(guān)系,通過計算機(jī)技術(shù)得到立體的、多維的實現(xiàn),形成了一個巨大的網(wǎng)絡(luò)。這個網(wǎng)絡(luò)在某種意義上與人類認(rèn)識事物時,頭腦中形成的知識地圖是有一定相似性的。同時,網(wǎng)絡(luò)化、關(guān)聯(lián)化、語義化可以將信息變成更有價值的知識,為人們最大限度地獲取信息提供了可能。從本體論意義上說,信息泛指一切事物(物質(zhì)的、精神的)運動的狀態(tài)和運動的方式;從認(rèn)識論意義上說,信息是關(guān)于事物運動狀態(tài)和運動方式的反映。人類認(rèn)識世界的過程,就是不斷從外界取得信息和加工信息的過程。沒有信息,就不能認(rèn)識和改造世界。而知識是比信息更高層次的人類的精神財富,是信息的一部分,是經(jīng)過提煉、推理、整理了的信息。在語義網(wǎng)時代,信息通過關(guān)聯(lián)可以產(chǎn)生知識。信息組織在語義網(wǎng)背景下,也必定會向知識組織方向發(fā)展。

    信息組織向知識組織轉(zhuǎn)變,計算機(jī)、互聯(lián)網(wǎng)技術(shù)起了決定性因素。這些科學(xué)技術(shù)讓信息組織的對象、信息組織的方法以及人們對信息組織的需求都發(fā)生了改變。URI允許用戶對任何(包括本地和互聯(lián)網(wǎng))的資源通過特定的協(xié)議進(jìn)行交互操作,信息資源通過使用URI標(biāo)識在網(wǎng)上發(fā)布,讓開放獲取成為可能。RDF作為元數(shù)據(jù)的統(tǒng)一描述框架和標(biāo)記語言,由資源、屬性和聲明語句組成。RDF三元組對元數(shù)據(jù)基本描述方式的定義,將網(wǎng)絡(luò)資源與特征、性質(zhì)、關(guān)系等屬性都聯(lián)系起來了。這種關(guān)聯(lián)讓無序的信息查詢向有序的知識組織發(fā)展了一大步。RDF的誕生讓信息的揭示更加細(xì)致,并且可以在不同的信息中建立起相關(guān)的語義關(guān)系,解決語義異構(gòu)的問題。這種細(xì)粒度的揭示,是以前平面二維的信息組織方法無法比擬的。細(xì)粒度是知識化的一個標(biāo)志。

    3 知識組織方法與單元信息組織

    3.1 知識組織方法

    知識組織的概念最初由美國圖書館學(xué)家布利斯(H.E.Bliss)于1929年提出,他最早闡述了以圖書分類為基礎(chǔ)的知識組織思想。隨后,美國圖書館學(xué)家謝拉(J.H.Shera)全面論述了知識組織在圖書館工作中的重要作用和方法。所謂知識組織,是指對知識客體進(jìn)行諸如整理、加工、揭示、控制等一系列組織序化過程。廣義的知識組織則是針對知識的兩個構(gòu)成要素進(jìn)行的,即知識因子的有序化和知識關(guān)聯(lián)的網(wǎng)絡(luò)化?,F(xiàn)在主要使用的知識組織方法有本體、知識地圖等。

    “本體”一詞源于哲學(xué)領(lǐng)域,20世界90年代中期以來,人類將“本體”概念引入人工智能、知識工程和圖書情報領(lǐng)域。目前大家比較認(rèn)同的是美國斯坦福大學(xué)知識系統(tǒng)實驗室的Gruber在1993年提出的定義,即本體是概念體系的規(guī)范。本體創(chuàng)建是本體知識獲取的核心,即從某個領(lǐng)域中抽取知識,形成描述該領(lǐng)域的語義概念、實例和其間的關(guān)系。知識本體在描述領(lǐng)域知識時,將領(lǐng)域知識的一些重要屬性和操作與知識本身緊密聯(lián)系,因此其表示方法更加形象、準(zhǔn)確與合理。

    “知識地圖”概念最早由布魯克斯于1988年在其經(jīng)典著作《情報學(xué)的基礎(chǔ)》中提出,他認(rèn)為人類的客觀知識結(jié)構(gòu)可繪制成以各個單元概念為節(jié)點的學(xué)科認(rèn)知地圖。知識地圖是一個包括了各種知識及其關(guān)系的集合體,它的構(gòu)建涉及知識資源的分類、聚類,知識的挖掘、鏈接、檢索和可視化等方面。以計算機(jī)智能技術(shù),如自動標(biāo)引技術(shù)、自動分類技術(shù)、信息提取技術(shù)、關(guān)聯(lián)挖掘技術(shù)、可視化技術(shù)等為基礎(chǔ)。通過對知識的挖掘、聚類來形成語義和知識層次上描述知識的模型??梢哉f,知識地圖在知識組織方面是綜合了上述多種組織方法,是一種綜合性的方法。

    3.2 文獻(xiàn)單元信息知識組織

    文獻(xiàn)單元、信息單元、知識單元一直是信息組織研究的對象。只不過在互聯(lián)網(wǎng)誕生之前,人們只能對物質(zhì)載體進(jìn)行信息收集、組織、整理、保管,對文獻(xiàn)內(nèi)容進(jìn)行簡單揭示。但是隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,元數(shù)據(jù)、本體、關(guān)聯(lián)數(shù)據(jù)讓知識組織方法有了更廣闊的探索空間。知識組織可以從揭示一本書、一張光盤,到揭示書中的某一篇、某一段,盤上的一段樂曲、一首歌。對信息、知識細(xì)粒度的揭示,是知識組織在語義網(wǎng)階段發(fā)展的必然。

    3.2.1 單元信息的界定。語義網(wǎng)背景下,知識組織的對象可以突破傳統(tǒng)的印刷型文獻(xiàn)、網(wǎng)絡(luò)信息資源,轉(zhuǎn)入文獻(xiàn)粒度更細(xì)的單元信息領(lǐng)域。所謂單元信息,也稱精粹信息,是指原始文本中隱含的有價值的觀點、方法、資料、事實、結(jié)論等片段語句。單元信息不同于信息單元,也不同于知識單元。文庭孝等曾在《知識單元研究述評》一文中指出:文獻(xiàn)單元是一個載體單元或物理單元。以一定形式的載體形態(tài)或物理形態(tài)表達(dá)和存貯知識。文獻(xiàn)單元是知識單元的一種形態(tài),文獻(xiàn)單元中包含著知識單元,知識單元最終附著在一定形式的文獻(xiàn)單元中,體現(xiàn)為文獻(xiàn)單元。由此不難看出文獻(xiàn)單元與知識單元有著相互滲透的關(guān)系。本文中的單元信息與文獻(xiàn)單元和知識單元均有著密切聯(lián)系,單元信息來自于文獻(xiàn)單元,是隱含在文獻(xiàn)單元中的有價值的片段信息。另一方面,單元信息屬于廣義層面的知識單元,是知識單元的一種形式。

    3.2.2 單元信息知識組織方法構(gòu)想。單元信息組織方法以本體構(gòu)建為主體,本體作為語義網(wǎng)的關(guān)鍵技術(shù),是從語義層面進(jìn)行知識組織的方法,其所涵蓋的主題詞和詞間關(guān)系更豐富,適合于對內(nèi)容的深度揭示。通過本體對單元信息的標(biāo)注,實現(xiàn)語義檢索和可視化顯示。具體實現(xiàn)示意圖如圖1。

    圖1

    3.2.3 單元信息組織過程中的關(guān)鍵點。

    (1)單元信息的抽取。單元信息來源于文獻(xiàn),通過文獻(xiàn)信息的搜集獲得文獻(xiàn)資源集合,接著通過對文獻(xiàn)的分析,按照一定的標(biāo)準(zhǔn)和原則抽選出有價值的單元信息,最后形成單元信息集合。單元信息的抽取分為人工抽取和計算機(jī)抽取兩種方式。人工抽取獲得的單元信息質(zhì)量較高,但耗時耗力。計算機(jī)抽取需要采用文本分析、中文分詞等相關(guān)技術(shù)并通過一定的算法實現(xiàn),效率高但是抽取的質(zhì)量較差。因此,最好將兩者相結(jié)合,實現(xiàn)機(jī)器半自動抽取,并配合人工審校完成單元信息的抽取。

    (2)構(gòu)建領(lǐng)域本體?;诒倔w的信息組織方法的核心是構(gòu)建領(lǐng)域本體,包括領(lǐng)域范圍的確定;主題概念和詞間關(guān)系的確定,以及形式化表示。領(lǐng)域本體的構(gòu)建是一項非常專業(yè)和耗時耗力的工作,領(lǐng)域范圍以及詞和詞間關(guān)系的確定必須要有領(lǐng)域?qū)<业膮⑴c。目前本體形式化的工具很多,常用的是斯坦福大學(xué)開發(fā)的Protégé軟件,該軟件可將主題概念以及概念之間的關(guān)系形式化表達(dá)并可視化顯示。本體在單元信息組織中的作用主要是對單元信息進(jìn)行主題標(biāo)引,形成主題詞索引,并借助本體概念之間的關(guān)聯(lián)實現(xiàn)語義檢索。

    (3)語義檢索與可視化顯示。語義網(wǎng)環(huán)境下的知識組織的特點是語義關(guān)聯(lián)。本體是語義網(wǎng)的關(guān)鍵技術(shù),利用本體技術(shù)進(jìn)行單元信息的標(biāo)注,可以借助概念之間的語義關(guān)系實現(xiàn)單元信息的語義關(guān)聯(lián),從而構(gòu)建單元信息網(wǎng)絡(luò)。知識組織實現(xiàn)了知識單元的有序化和知識關(guān)聯(lián)的網(wǎng)絡(luò)化,信息可視化相關(guān)技術(shù)能夠?qū)崿F(xiàn)對信息數(shù)據(jù)的分析和提取,然后以圖形、圖像、虛擬現(xiàn)實等易為人們所辨識的方式展現(xiàn)原始數(shù)據(jù)間的復(fù)雜關(guān)系、潛在信息以及發(fā)展趨勢,以便能夠更好地利用所掌握的信息資源。信息可視化不僅給信息以形象,為我們提供直觀的結(jié)果,方便我們觀察;而且能夠揭示信息之間的關(guān)聯(lián),挖掘隱含的模式和結(jié)構(gòu),讓我們有效地利用信息、發(fā)現(xiàn)知識。

    4 對未來信息組織方法的展望

    信息組織的最終目的是為了用戶需求,在面向用戶需求的基礎(chǔ)上,通過數(shù)據(jù)、信息、文獻(xiàn)等相互映射和語義關(guān)聯(lián),使數(shù)據(jù)、信息、文獻(xiàn)等上升為能夠?qū)崿F(xiàn)知識服務(wù)的知識組織。面向單元信息的知識組織的方法,是語義網(wǎng)階段知識組織方法的一個新的嘗試。單元信息精準(zhǔn)、靈活、關(guān)聯(lián)的特點,更符合人類思維習(xí)慣。按這種方法生產(chǎn)的單元信息知識庫,將為用戶知識服務(wù)提供新的體驗。經(jīng)過知識關(guān)聯(lián)重組后的信息,不僅可以使用戶在組織化的知識系統(tǒng)中快捷、準(zhǔn)確地獲得所需知識,而且由于改變了知識因子間的原有聯(lián)系,往往能夠提供新知識,這些新知識將成為知識創(chuàng)新的直接動因。

    隨著各種計算機(jī)技術(shù)、通信技術(shù)、控制技術(shù)、傳感技術(shù)的不斷發(fā)展,像自動標(biāo)引、數(shù)據(jù)挖掘、知識發(fā)現(xiàn)、標(biāo)記語言等技術(shù)都會為知識組織向單元信息、片段信息發(fā)展提供良好的發(fā)展條件。未來知識組織的方法可能會出現(xiàn)更先進(jìn)的技術(shù)支持,但是細(xì)粒度、語義化應(yīng)該是知識組織的一個基本要求。希望單元信息的知識組織方法能為將來信息組織方法的改變提供一點參考。

    [1]李 潔,丁 穎.語義網(wǎng)關(guān)鍵技術(shù)概述[J].計算機(jī)工程與設(shè)計,2007(4):1831—1836.

    [2]劉 煒,胡小菁,張春景,等.RDA與關(guān)聯(lián)數(shù)據(jù)[J].中國圖書館學(xué)報,2012(1):34—42.

    [3]劉 煒,夏翠娟,張春景.大數(shù)據(jù)與關(guān)聯(lián)數(shù)據(jù):正在到來的數(shù)據(jù)技術(shù)革命[J].現(xiàn)代圖書情報技術(shù),2013(4):2—9.

    [4]謝 銘.關(guān)聯(lián)數(shù)據(jù)和知識表示的自動語義標(biāo)注技術(shù)[D].武漢:武漢大學(xué),2012.

    [5]司 莉.信息組織原理與方法[M].武漢:武漢大學(xué)出版社,2011.

    [6]周 寧,吳佳鑫.信息組織[M].武漢:武漢大學(xué)出版社,2010.

    [7]劉 煒,樓向英,趙 亮.DC元數(shù)據(jù)的歷史、現(xiàn)狀及未來[EB/OL].[2017-05-27].https:∥core.ac.uk/download/pdf/11878293.pdf.

    [8]索傳軍.網(wǎng)絡(luò)信息資源組織研究的新視角[J].圖書情報工作,2013(4):5—12.

    [9]劉 嘉.網(wǎng)絡(luò)信息資源的組織:從信息組織到知識組織[M].北京:北京圖書館出版社,2002:2—3.

    [10]從信息組織到知識組織[EB/OL].[2012-05-09].https:∥wenku.baidu.com/view/307b29380912a21614792920.html.

    [11]常 娥,夏 婧.多種知識組織方法比較[J].圖書館論壇,2016(8):1—6.

    [12]B.C Brookers.情報學(xué)的基礎(chǔ)(四)——第四篇情報學(xué):變化中的范式[J].王崇德,鄧亞橋,劉繼剛,譯.情報科學(xué),1984(1):66—77.

    [13]蘇 潔.知識地圖在高校圖書館流通服務(wù)工作中的應(yīng)用[J].高等教育,2011(10):26.

    [14]倪曉建.基于新信息環(huán)境下的精粹信息鑒選研究[J].深圖通訊,2008(2):6—9.

    [15]周靜怡,孫 坦.信息可視化在數(shù)字圖書館中應(yīng)用淺析[J].現(xiàn)代圖書情報技術(shù),2005(1):5—8.

    [16]周 寧,張會平,陳勇躍.信息可視化與知識組織[J].現(xiàn)代圖書情報技術(shù),2006(7):62—65.

    [17]徐緒堪,蘇新寧,馮蘭萍.面向知識服務(wù)的知識組織過程研究[J].情報資料工作,2015(1):7—13.

    猜你喜歡
    本體關(guān)聯(lián)語義
    Abstracts and Key Words
    對姜夔自度曲音樂本體的現(xiàn)代解讀
    語言與語義
    “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
    奇趣搭配
    智趣
    讀者(2017年5期)2017-02-15 18:04:18
    “上”與“下”語義的不對稱性及其認(rèn)知闡釋
    《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
    認(rèn)知范疇模糊與語義模糊
    Care about the virtue moral education
    卷宗(2013年6期)2013-10-21 21:07:52
    卢湾区| 南江县| 南安市| 楚雄市| 开原市| 射洪县| 临夏县| 曲水县| 玉门市| 巴里| 陵水| 安西县| 阿勒泰市| 中超| 盱眙县| 翼城县| 三亚市| 道真| 紫阳县| 道孚县| 若尔盖县| 绥宁县| 蒙城县| 赣州市| 安达市| 平阴县| 汤原县| 体育| 灵武市| 芦山县| 阜阳市| 长阳| 南岸区| 兴化市| 兴和县| 仁怀市| 德清县| 马鞍山市| 资中县| 盘锦市| 万盛区|