• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    XML標(biāo)記的語(yǔ)義

    2016-05-30 08:55:03艾蘭瑞尼爾戴維德杜賓斯芬伯格麥奎因克勞斯惠特福德王曉光王俊芳
    出版科學(xué) 2016年4期
    關(guān)鍵詞:語(yǔ)義

    艾蘭?瑞尼爾 戴維德?杜賓 斯芬伯格?麥奎因 克勞斯?惠特福德(著)王曉光 王俊芳(譯)

    [摘 要] 盡管XML文檔類(lèi)型定義提供了一種機(jī)器可讀形式的、能夠說(shuō)明XML語(yǔ)言語(yǔ)法的機(jī)制,但目前并沒(méi)有類(lèi)似的機(jī)制來(lái)指定XML詞匯表的具體語(yǔ)義。這意味著沒(méi)辦法說(shuō)明XML標(biāo)記的意義,由XML形式呈現(xiàn)的事實(shí)和關(guān)系無(wú)法清晰、全面和規(guī)范地定義。這在實(shí)踐和理論上都引起了嚴(yán)重的后果。從積極的方面看,XML結(jié)構(gòu)能被賦予任意語(yǔ)義,并可用于最初的設(shè)計(jì)者無(wú)法預(yù)見(jiàn)的領(lǐng)域。從不太積極的方面來(lái)看,內(nèi)容開(kāi)發(fā)者和軟件工程師必須依靠乏味的文檔,或者更糟的情況是,只能依靠猜測(cè)標(biāo)記語(yǔ)言設(shè)計(jì)者的意圖來(lái)開(kāi)展工作。這一過(guò)程既費(fèi)時(shí)費(fèi)力,又易出錯(cuò),還無(wú)法核實(shí)驗(yàn)證。即便是設(shè)計(jì)者當(dāng)初的建檔工作做得相當(dāng)完美,不如意的情況還是會(huì)發(fā)生。另外,對(duì)標(biāo)記語(yǔ)義本質(zhì)研究的匱乏也意味著屬于工程應(yīng)用領(lǐng)域的數(shù)字文檔處理根本沒(méi)有什么理論。盡管目前正在進(jìn)行的一些工程(XML模式、RDF、語(yǔ)義網(wǎng))已經(jīng)取得了一些成績(jī),但是這些工程都沒(méi)有直接全面地解決XML標(biāo)記語(yǔ)義的核心問(wèn)題。本文回顧了標(biāo)記意義這個(gè)概念的發(fā)展歷史,闡明了解釋XML正式語(yǔ)義的動(dòng)機(jī),并介紹了一個(gè)研究語(yǔ)義的科研項(xiàng)目——BECHAMEL 標(biāo)記語(yǔ)義計(jì)劃。

    [關(guān)鍵詞] SGML XML 標(biāo)記 語(yǔ)義 知識(shí)表示

    [中圖分類(lèi)號(hào)] G238 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1009-5853 (2016) 04-0018-09

    [Abstract] Although XML Document Type Definitions provide a mechanism for specifying, in machine-readable form, the syntax of an XML markup language, there is no comparable mechanism for specifying the semantics of an XML vocabulary. That is, there is no way to characterize the meaning of XML markup so that the facts and relationships represented by the occurrence of XML constructs can be explicitly, comprehensively, and mechanically identified. This has serious practical and theoretical consequences. On the positive side, XML constructs can be assigned arbitrary semantics and used in application areas not foreseen by the original designers. On the less positive side, both content developers and application engineers must rely upon prose documentation, or, worse, conjectures about the intention of the markup language designer — a process that is time?consuming, error-prone, incomplete, and unverifiable, even when the language designer properly documents the language. In addition, the lack of a substantial body of research in markup semantics means that digital document processing is undertheorized as an engineering application area. Although there are some related projects underway (XML Schema, RDF, the Semantic Web) which provide relevant results, none of these projects directly and comprehensively address the core problems of XML markup semantics. This paper (i) summarizes the history of the concept of markup meaning, (ii) characterizes the specific problems that motivate the need for a formal semantics for XML and (iii) describes an ongoing research project : the BECHAMEL Markup Semantics Project —that is attempting to develop such a semantics.

    [Key words] SGML XML Markup Semantics Knowledge representation

    1 引 言

    近年來(lái),隨著數(shù)字出版的發(fā)展、萬(wàn)維網(wǎng)應(yīng)用的迸發(fā)以及電子商務(wù)領(lǐng)域的快速發(fā)展,我們?nèi)粘5纳鐣?huì)、商業(yè)、文化、生活等方方面面都開(kāi)始應(yīng)用閃標(biāo)準(zhǔn)化通用標(biāo)記語(yǔ)言(Standard Generalized Markup Language,SGML)和可擴(kuò)展標(biāo)記語(yǔ)言(Extensible Markup Language,XML)的文本標(biāo)記系統(tǒng)。SGML/XML是一種定義描述性標(biāo)記語(yǔ)言的機(jī)器可讀技術(shù)。除去一些需要特別處理的部分,這種語(yǔ)言能清晰地定義文檔結(jié)構(gòu)及其潛在意義。SGML/XML發(fā)展速度很快,廣泛使用這種技術(shù)能夠支持高性能的文檔互操作處理和出版。

    這種美好的愿望已經(jīng)部分實(shí)現(xiàn)了,SGML/XML的優(yōu)越性超出了人們的預(yù)期,但是SGML/XML文檔系統(tǒng)在功能性、互操作性、多樣性和可獲取性上仍有待提高。若不抓住這個(gè)機(jī)會(huì),后果會(huì)非常嚴(yán)重:實(shí)業(yè)界已經(jīng)花費(fèi)了高昂的財(cái)務(wù)成本,也失去了很多機(jī)會(huì);在關(guān)鍵的安全應(yīng)用上還有可能導(dǎo)致一些災(zāi)難;對(duì)于殘疾人來(lái)說(shuō),這會(huì)阻礙他們平等地獲取當(dāng)代社會(huì)文化和商業(yè)福利。此外,久已存在的一些問(wèn)題也在不斷提醒我們,當(dāng)下最好的數(shù)字文檔模型仍存在缺陷,至少是不夠完善的。

    這些問(wèn)題的根源在于,盡管SGML/XML能為文檔提供有意義的結(jié)構(gòu),但是SGML/XML不能以系統(tǒng)的機(jī)器可處理的方式來(lái)表示文檔組件和主題之間的基本語(yǔ)義關(guān)系。SGML/XML支持對(duì)機(jī)器可讀的“語(yǔ)法”進(jìn)行說(shuō)明,但是它沒(méi)有提供解釋某種語(yǔ)法的語(yǔ)義內(nèi)涵的機(jī)制,所以一個(gè)SGML/XML詞匯的潛在意義到底是什么,還沒(méi)有辦法進(jìn)行形式化表達(dá)。利用當(dāng)下的SGML/XML甚至無(wú)法表達(dá)非常簡(jiǎn)單的有關(guān)文檔標(biāo)注系統(tǒng)的基本語(yǔ)義事實(shí),這些事實(shí)通常是標(biāo)記語(yǔ)言設(shè)計(jì)師預(yù)先設(shè)計(jì)的,但具體實(shí)現(xiàn)仍舊依賴(lài)于標(biāo)記語(yǔ)言用戶(hù)和軟件。

    這種表達(dá)功能的缺失使得SGML/XML用戶(hù)必須猜測(cè)標(biāo)記語(yǔ)言設(shè)計(jì)師想到的但沒(méi)有形式化表達(dá)出來(lái)的那些語(yǔ)義關(guān)系。內(nèi)容開(kāi)發(fā)者必須猜測(cè)設(shè)計(jì)者的意圖,在內(nèi)容編碼時(shí)依靠這些推斷開(kāi)展工作,無(wú)法將自己的推斷和意圖清晰地表達(dá)給其他人或者傳遞給處理編碼內(nèi)容的應(yīng)用程序。軟件設(shè)計(jì)師也需要猜測(cè)標(biāo)記語(yǔ)言設(shè)計(jì)師的可能意圖,并將這種猜想設(shè)計(jì)到軟件工具和應(yīng)用系統(tǒng)中。有時(shí)候二階的猜想是必須的:軟件設(shè)計(jì)師要猜測(cè)內(nèi)容開(kāi)發(fā)者對(duì)標(biāo)記語(yǔ)言設(shè)計(jì)師意圖的推斷。

    很顯然,這些猜測(cè)是不完整的、易錯(cuò)的和未經(jīng)證實(shí)的。而且,制作和實(shí)現(xiàn)過(guò)程都費(fèi)時(shí)費(fèi)力,功能性和互操作性也很差。為一般的自然語(yǔ)言文檔配備一個(gè)SGML/XML的說(shuō)明書(shū)并不能完美地解決這個(gè)問(wèn)題。當(dāng)然,普通的自然語(yǔ)言文檔能給內(nèi)容提供者和軟件工程師提供一些提示,但是目前SGML/XML文檔還沒(méi)有通用的規(guī)則。不管怎么樣,普通的自然語(yǔ)言文檔不是機(jī)器可讀的形式,這就是我們要說(shuō)的 SGML/XML標(biāo)記系統(tǒng)的問(wèn)題。

    與SGML和XML相關(guān)的機(jī)器可處理的語(yǔ)義描述方面的設(shè)想還未形成,這是目前工程領(lǐng)域的問(wèn)題和未來(lái)發(fā)展障礙的根源 [25] [23] [43] [25] [36],相關(guān)的語(yǔ)義學(xué)研究也很少,但是很多學(xué)者已經(jīng)開(kāi)始關(guān)注此問(wèn)題。W3C Schema方面的工作與此相關(guān),但也只是覆蓋了這個(gè)問(wèn)題中的很小一部分(比如數(shù)據(jù)類(lèi)型)。W3C的“語(yǔ)義網(wǎng)”計(jì)劃也與此相關(guān),但它是為了發(fā)展通用的基于XML的知識(shí)表示技術(shù)。我們的研究重點(diǎn)是文檔標(biāo)記的語(yǔ)義,它隱藏在實(shí)際的文檔處理系統(tǒng)中。人們可能會(huì)說(shuō)語(yǔ)義網(wǎng)的本質(zhì)就是設(shè)計(jì)語(yǔ)義標(biāo)記,然而在本文中,我們認(rèn)為解決以上問(wèn)題還必須要深入考慮標(biāo)記的本質(zhì)意義。

    接下來(lái),本文首先從歷史背景方面說(shuō)明標(biāo)記的意義問(wèn)題(標(biāo)記在文本處理方法的發(fā)展中扮演了有趣的角色);其次,詳細(xì)描述是何種因素產(chǎn)生了形式語(yǔ)義標(biāo)記需求,何種因素決定了語(yǔ)義需求;最后簡(jiǎn)要介紹一項(xiàng)多個(gè)機(jī)構(gòu)正在參與實(shí)施的研究計(jì)劃——BECHAMEL標(biāo)記語(yǔ)義計(jì)劃,該計(jì)劃正努力解決標(biāo)記的語(yǔ)義問(wèn)題。

    2 歷史背景

    文檔“標(biāo)記”大概可以算作傳播系統(tǒng)的一部分,包括早期的書(shū)寫(xiě)、抄寫(xiě)出版和印刷,但是隨著數(shù)字文本處理和排版的發(fā)展,標(biāo)記的使用變得自覺(jué)又常見(jiàn),同時(shí)也成了系統(tǒng)開(kāi)發(fā)中一個(gè)重要的創(chuàng)新領(lǐng)域[4] [40]。20世紀(jì)60年代到80年代是文檔標(biāo)記系統(tǒng)全面系統(tǒng)化發(fā)展的時(shí)期,重點(diǎn)工作是提升數(shù)字排版和文本處理的有效性和功能性[12] [22] [19] [10] [26] [17] [18]。20世紀(jì)80年代初期,人們依舊致力于研究標(biāo)記的理論框架,并利用該框架支持高性能系統(tǒng)的開(kāi)發(fā)。這方面的一些成果已經(jīng)發(fā)表[11] [27] [4] [40],但大部分成果還只是記錄在工作文檔和各種標(biāo)準(zhǔn)形式的產(chǎn)品上。

    在這個(gè)階段出現(xiàn)的一種觀點(diǎn)是,文檔作為一種智力成果,更適合被抽象為一系列對(duì)象(如章節(jié)、段落、公式等)的有序?qū)哟位Y(jié)構(gòu)模型,而不是一維文本字符流模型。字符流常夾雜著大量定義格式的編碼、描述設(shè)計(jì)布局的結(jié)構(gòu)(如頁(yè)碼、分欄、印刷行)、像素值矩陣,以及其他一些在不同的文檔處理及存儲(chǔ)系統(tǒng)中潛在的表達(dá)形式[5]。有序?qū)蛹?jí)結(jié)構(gòu)模型概括了兩種具有本質(zhì)差別的標(biāo)注,分別是識(shí)別編輯文本對(duì)象(標(biāo)題、章節(jié)等)的標(biāo)注和說(shuō)明版面要求的標(biāo)注。前者的應(yīng)用已經(jīng)取得一些成果[11] [27] [4]。諸如標(biāo)題、章節(jié)、段落、方程式、引文之類(lèi)的相關(guān)文檔元素能被分隔標(biāo)記清晰地標(biāo)示出來(lái),之后通過(guò)映射給元素類(lèi)型的規(guī)則來(lái)對(duì)元素進(jìn)行間接處理。這種內(nèi)容和形式的分離,能夠以常見(jiàn)的組合經(jīng)濟(jì)的方式實(shí)現(xiàn)基礎(chǔ)層面的間接性和抽象化。在文檔處理的所有方面,這種分離形式有巨大而多樣的實(shí)用價(jià)值[4],更重要的是它似乎說(shuō)明了“文檔到底是什么”這個(gè)問(wèn)題[5]。用于實(shí)現(xiàn)如此功能的描述性標(biāo)記不只是標(biāo)出了元素的范圍,也攜帶了文檔模型想要揭示的意義(如這段文本是一個(gè)章節(jié))。

    20世紀(jì)80年代初期,美國(guó)國(guó)家標(biāo)準(zhǔn)化局(ANSI/ISO)發(fā)布了很有影響力的SGML文檔標(biāo)記元語(yǔ)法,并梳理了標(biāo)記和文檔結(jié)構(gòu)方面之前所做的理論和分析工作。SGML為定義描述性標(biāo)記語(yǔ)言提供了一種機(jī)器可讀的形式。作為一種元語(yǔ)法,SGML沒(méi)有定義標(biāo)記語(yǔ)言,而是詳述了開(kāi)發(fā)標(biāo)記語(yǔ)言中的機(jī)器可讀的技術(shù)。這個(gè)定義的核心是一種類(lèi)似于巴科斯-諾爾范式(Backus-Naur Form,BNF)的形式化表達(dá)機(jī)制。這一機(jī)制攜帶有用于定義類(lèi)型化屬性及其取值的規(guī)則,以及其他一些用于進(jìn)一步抽象化和間接化的設(shè)計(jì)(參見(jiàn)注釋[30]中對(duì)文檔類(lèi)型定義(Document Type Definitions,DTDs)和巴科斯-諾爾范式相似程度方面的總結(jié))。從結(jié)構(gòu)上來(lái)說(shuō),SGML文檔是一種具備有序分支和帶標(biāo)記節(jié)點(diǎn)的樹(shù),它是其相應(yīng)的DTD的形式化產(chǎn)物。

    經(jīng)過(guò)多年的分析和實(shí)踐,SGML背后的基本理念已經(jīng)眾所周知。利用元語(yǔ)法層面的行業(yè)級(jí)標(biāo)準(zhǔn)和詞表層面的本地化創(chuàng)新帶來(lái)的優(yōu)點(diǎn),SGML的特有機(jī)制(類(lèi)巴科斯-諾爾范式的元語(yǔ)法,類(lèi)型化屬性/屬性值對(duì),實(shí)體引用等)在應(yīng)用程序和工具方面得到了高效實(shí)現(xiàn)。SGML標(biāo)記語(yǔ)言本身在發(fā)展中似乎也同時(shí)支持和優(yōu)化用于文檔系統(tǒng)設(shè)計(jì)、實(shí)施和利用的理想的工作流程。20世紀(jì)80年代中期到90年代初期,大量基于SGML的標(biāo)注系統(tǒng)發(fā)展起來(lái)[1] [42] [39]。

    盡管SGML的發(fā)展得到很多關(guān)注,其想法也不錯(cuò),并在多個(gè)領(lǐng)域成功實(shí)施,但在最初的十年里,幾乎沒(méi)人使用它。導(dǎo)致這個(gè)結(jié)果的因素有很多,但最重要的還是SGML自身過(guò)于復(fù)雜,特別是SGML中包含了許多復(fù)雜的可選屬性,對(duì)應(yīng)的軟件可能根本沒(méi)必要對(duì)其實(shí)現(xiàn),導(dǎo)致SGML軟件開(kāi)發(fā)速度非常緩慢。更糟糕的是,如果文檔未經(jīng)DTD驗(yàn)證,進(jìn)一步的分析就不可能實(shí)現(xiàn)。縮寫(xiě)控制意味著如果不考慮文檔語(yǔ)法,元素邊界都無(wú)法確定下來(lái)。另外,SGML還包含了一些其他屬性,它們會(huì)導(dǎo)致已有的語(yǔ)法分析工具不適用于形式語(yǔ)法,無(wú)法進(jìn)行高效的語(yǔ)法分析。

    在網(wǎng)絡(luò)出版和交流方面,SGML系統(tǒng)可應(yīng)用于HTML(超文本標(biāo)記語(yǔ)言)方面。最初的HTML版本定義很松散,缺乏正式的語(yǔ)法說(shuō)明。后來(lái)人們對(duì)HTML的SGML DTD有了興趣,事實(shí)證明為已經(jīng)成為“正確”實(shí)踐的東西設(shè)計(jì)DTD是很困難的。更重要的是,由于在最初的HTML說(shuō)明書(shū)中,供應(yīng)商隨意地把程序性標(biāo)記(如)添加到關(guān)鍵性的描述性標(biāo)記中(如

    當(dāng)然,這夸大了實(shí)際情況。從某種意義上說(shuō),在標(biāo)記語(yǔ)言開(kāi)發(fā)人員提供的純自然語(yǔ)言文檔中,每個(gè)標(biāo)記的意義基本可以表達(dá)清楚。但是,即使是工業(yè)和學(xué)術(shù)領(lǐng)域中標(biāo)記格式最好的DTD文檔,也沒(méi)有從根本上解決問(wèn)題。

    設(shè)計(jì)一款反映標(biāo)記語(yǔ)言中語(yǔ)義關(guān)系的軟件時(shí),語(yǔ)言設(shè)計(jì)人員必須能夠?qū)⑽臋n中各部分之間的關(guān)系表示清楚;之后軟件工程師必須能夠(搜索、查找、打開(kāi))使用這個(gè)標(biāo)記語(yǔ)言文檔,并設(shè)計(jì)應(yīng)用程序來(lái)表現(xiàn)其優(yōu)點(diǎn)。這兩個(gè)步驟都無(wú)法用機(jī)器進(jìn)行驗(yàn)證,可信度無(wú)法保證。如果要人工參與的話(huà),就會(huì)有礙高性能網(wǎng)絡(luò)文檔處理和發(fā)布系統(tǒng)的發(fā)展。所以我們需要一個(gè)機(jī)制保證標(biāo)記語(yǔ)言設(shè)計(jì)人員能夠詳細(xì)地、形式化地指定語(yǔ)義關(guān)系,還能被應(yīng)用程序讀取加工,并完成自我配置,無(wú)需一個(gè)個(gè)地人工參與。

    下面我們來(lái)看一些具體的語(yǔ)義關(guān)系。這些關(guān)系或多或少地存在潛在的實(shí)用價(jià)值,但目前它們無(wú)法方便系統(tǒng)地得以利用,因?yàn)樯袩o(wú)標(biāo)準(zhǔn)的機(jī)器可處理的表現(xiàn)形式。事實(shí)上,許多關(guān)系至關(guān)重要,軟件設(shè)計(jì)師常以特定的方式推斷它們?cè)谖臋n中的存在,并構(gòu)建特定的系統(tǒng)對(duì)其加以利用。

    類(lèi)關(guān)系。SGML / XML中不包含用以表達(dá)元素、特征或特征值中類(lèi)的層級(jí)結(jié)構(gòu)或類(lèi)成員關(guān)系的通用結(jié)構(gòu)。類(lèi)是目前軟件工程主流結(jié)構(gòu)中最基本和最實(shí)用的模塊。我們不能說(shuō),段落是一種結(jié)構(gòu)上的元素(isa關(guān)系),或者所有結(jié)構(gòu)元素都是可編輯的元素(ako關(guān)系)。兩種基本的SGML/XML設(shè)計(jì)有時(shí)可以按照屬性/值實(shí)現(xiàn)基礎(chǔ)分類(lèi)(具體可以使用“type”和“class”這兩種屬性)。這種分類(lèi)技術(shù)尚不夠成熟,SGML和XML沒(méi)能提供更好的機(jī)制來(lái)控制和限制其使用。在實(shí)際應(yīng)用中,許多文檔類(lèi)型設(shè)計(jì)師都采用類(lèi)的層級(jí)結(jié)構(gòu)來(lái)進(jìn)行設(shè)計(jì)。XML Schema提供了類(lèi)關(guān)系的清晰聲明,但它本身并不能在語(yǔ)義上說(shuō)明這些復(fù)雜類(lèi)型與其他復(fù)雜類(lèi)型到底有哪些區(qū)別。

    繼承關(guān)系。在許多標(biāo)記語(yǔ)言(例如TEI 和HTML4.0)中,某些屬性會(huì)被包含元素所繼承,某些情況下被包含的文本內(nèi)容也會(huì)繼承這些屬性。例如,如果一個(gè)元素的屬性/值符號(hào)為“l(fā)ang="de"”,這表明這一段文本是德語(yǔ),那意味著它的所有子元素屬性都是德語(yǔ)。但是DTD沒(méi)有提供正式說(shuō)明用以指定哪些特征可以被繼承。而且,這樣的繼承關(guān)系并不是固定不變的,有時(shí)也會(huì)因?yàn)榘氐亩味x而改變。繼承的方式也有很多種,有些涉及元素的屬性,有些涉及屬性的屬性,另一些則涉及文本和元素的內(nèi)容。例如,如果標(biāo)記表示一個(gè)句子是德語(yǔ),這意味著句子中的所有單詞(除非特殊情況)都是德語(yǔ)。同樣地,所有單詞短語(yǔ)中標(biāo)記了刪除屬性的就刪掉,標(biāo)記了重點(diǎn)屬性的就強(qiáng)調(diào),將一部分內(nèi)容標(biāo)記為一個(gè)段落,就意味著這部分內(nèi)容中的所有單詞(或元素)都屬于這個(gè)段落。無(wú)法指定DTD繼承哪些屬性,也不能指定其繼承邏輯(包括規(guī)則錯(cuò)誤)。軟件設(shè)計(jì)師經(jīng)常對(duì)特定標(biāo)記語(yǔ)言中的這些關(guān)系進(jìn)行推理(判斷正誤),然后在其開(kāi)發(fā)的工具和應(yīng)用程序中加以實(shí)現(xiàn)[36] 。

    語(yǔ)境關(guān)系和引用關(guān)系。在許多標(biāo)記語(yǔ)言中,即使某元素有一個(gè)固定的意義用于標(biāo)記相同元素類(lèi)型,這個(gè)元素也可能會(huì)因?yàn)樯舷挛年P(guān)系的不同而表示不同的含義。例如,某些文本的標(biāo)記為“”,其具體所指還要依賴(lài)文本的結(jié)構(gòu)位置?!?/p>

    (3)開(kāi)發(fā)并測(cè)試形式化的、機(jī)器可讀的表示框架,在這種框架需要能夠表示標(biāo)記語(yǔ)言的語(yǔ)義。

    (4)探索語(yǔ)義表示技術(shù)的應(yīng)用形式,如支持轉(zhuǎn)碼、信息檢索、可獲得性增強(qiáng)等。目前我們關(guān)心的重點(diǎn)是支持文檔數(shù)據(jù)庫(kù)實(shí)例的語(yǔ)義推理,因?yàn)槲覀兿嘈胚@是應(yīng)用知識(shí)表示技術(shù)最好的著力點(diǎn)。

    (5)與人文計(jì)算研究領(lǐng)域的數(shù)字圖書(shū)館內(nèi)容編碼計(jì)劃合作,聯(lián)合軟件工具開(kāi)發(fā)人員,進(jìn)行語(yǔ)義表示方案的大規(guī)模測(cè)試。

    早期的Prolog 實(shí)驗(yàn)臺(tái)[36]已經(jīng)全面發(fā)展成為一個(gè)知識(shí)表示原型平臺(tái),用于表示結(jié)構(gòu)性文檔中的事實(shí)和推理規(guī)則[6] [38]。該系統(tǒng)允許分析人員指定某些事實(shí)(如通用標(biāo)識(shí)符和屬性值),并將其與語(yǔ)義實(shí)體和屬性有關(guān)的推論性事實(shí)分開(kāi)。

    該系統(tǒng)還提供了一個(gè)抽象層,使得標(biāo)記的意義能夠以機(jī)器可讀的和可執(zhí)行的形式明確表達(dá)。在此基礎(chǔ)上可以根據(jù)文檔組成部分進(jìn)行推論,包括那些模糊的結(jié)構(gòu),如層次重疊的組成部分。我們已經(jīng)開(kāi)發(fā)出一個(gè)謂詞集合,能夠模仿W3C的文檔對(duì)象模型中用于節(jié)點(diǎn)層級(jí)結(jié)構(gòu)導(dǎo)航的方法,并且可以在文檔類(lèi)型定義中檢索各種屬性取值和有關(guān)信息。這樣就能明確區(qū)分解析器分析的語(yǔ)法信息,分析人員表達(dá)的文檔語(yǔ)義。

    初步的研究結(jié)果顯示語(yǔ)義推理識(shí)別的復(fù)雜性[36][29]以及語(yǔ)境不確定理解的復(fù)雜性[28]。這個(gè)雛形推理系統(tǒng)證明有關(guān)標(biāo)記的自動(dòng)推理是可行的,并且Prolog的規(guī)則可以處理非單調(diào)性和情景模糊性等復(fù)雜情況[37]。進(jìn)一步的研究可以參考引文[38][35]。

    5 標(biāo)記的語(yǔ)義建模

    文檔標(biāo)記的語(yǔ)義是能夠被標(biāo)記語(yǔ)言用戶(hù)理解的抽象結(jié)構(gòu)、屬性和關(guān)系,標(biāo)記及其語(yǔ)法隱含著這種語(yǔ)義線(xiàn)索。標(biāo)記的語(yǔ)義可以借助知識(shí)表示技術(shù)通過(guò)明確結(jié)構(gòu)、關(guān)系和屬性來(lái)構(gòu)建相應(yīng)的計(jì)算化模型。

    參考如下XML標(biāo)記文檔的片段:

    The Translation Problem

    Translation between different

    SGML/XML applications, or

    reconciliation of incompatible

    document classes is a well-known

    challenge Fausey and Shafer

    (1997). A variety of

    techniques are used...

    熟悉結(jié)構(gòu)化標(biāo)記的讀者自然知道文檔元素中的標(biāo)簽P代表段落,該段落有一個(gè)標(biāo)題,標(biāo)題元素之后的段落內(nèi)容形成了文本主體,它從標(biāo)題元素之后開(kāi)始,并在段落結(jié)束標(biāo)簽之前結(jié)束。標(biāo)簽的意義和用法并不一目了然,所以作者或讀者可以參考標(biāo)記集合的說(shuō)明文檔。

    明顯的標(biāo)記是為方便人類(lèi)讀者而設(shè)計(jì)的。這些標(biāo)記并不能借助文檔語(yǔ)法分析器,從數(shù)據(jù)結(jié)構(gòu)中抽取出來(lái)。正如圖1所示,解析樹(shù)(樣式表程序員所用)展示了頭部、引文以及引文前后的文本,這些部分每個(gè)都是段落的獨(dú)立子節(jié)點(diǎn),但解析樹(shù)沒(méi)法展示以下特征:頭部是整個(gè)段落的一個(gè)屬性,文本是內(nèi)容結(jié)構(gòu)中的兩個(gè)部分,引文嵌入在文本內(nèi)部。

    事實(shí)上,數(shù)據(jù)結(jié)構(gòu)本身并沒(méi)有段落和引文之分或與之相關(guān)的東西。數(shù)據(jù)結(jié)構(gòu)僅僅是關(guān)聯(lián)信息的圖型結(jié)構(gòu),就像一個(gè)有著“段落”取值的通用標(biāo)識(shí)符。程序應(yīng)當(dāng)能推斷出文檔意義與使用標(biāo)簽之間的一致性,并能在樹(shù)形結(jié)構(gòu)從一種形式轉(zhuǎn)換為另一種形式時(shí)利用這種知識(shí)。但是,這種轉(zhuǎn)換(例如,通過(guò)XSLT、DSSSL或者類(lèi)似C++的程序語(yǔ)言進(jìn)行轉(zhuǎn)換)依靠的是語(yǔ)義推理,而不是顯性的編碼。

    圖2展示了如何通過(guò)利用語(yǔ)義知識(shí)來(lái)豐富和增強(qiáng)語(yǔ)法樹(shù)。利用知識(shí)表示技術(shù)能夠在更高的層面上將整體和部分之間的關(guān)系進(jìn)行編碼,更適合計(jì)算機(jī)處理。此圖展示了一種傳統(tǒng)的語(yǔ)義網(wǎng)絡(luò)表示方法,當(dāng)然其他的方法也正在發(fā)展中,包括框架表示法、規(guī)則表示法、形式語(yǔ)法以及基于邏輯的表示法等[31] [41]。語(yǔ)義網(wǎng)計(jì)劃(本文第八部分)的發(fā)展甚至能為標(biāo)記語(yǔ)言本身提供合適的表示方法。問(wèn)題的關(guān)鍵在于,要為無(wú)法由傳統(tǒng)的XML/SGML解析器建模和執(zhí)行的抽象概念、關(guān)聯(lián)和約束建立一個(gè)層次體系。

    在機(jī)器可讀的文件(如DTD或者語(yǔ)法結(jié)構(gòu))里的編碼知識(shí)能夠被用于驗(yàn)證文檔的語(yǔ)義約束,為應(yīng)用程序提供更強(qiáng)大的文檔模型。這些更有表現(xiàn)力的表示方法為更好的文檔處理系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)提供了強(qiáng)有力的支持。

    6 應(yīng) 用

    近年來(lái),許多新技術(shù)的發(fā)展使得常規(guī)的結(jié)構(gòu)化標(biāo)注越來(lái)越盛行。這些技術(shù)在信息管理中主要強(qiáng)調(diào)以下幾個(gè)方面的問(wèn)題。

    轉(zhuǎn)換和聯(lián)合。對(duì)于SGML/XML開(kāi)發(fā)人員來(lái)說(shuō),最常見(jiàn)的工作就是設(shè)計(jì)轉(zhuǎn)換形式,從一種應(yīng)用語(yǔ)法轉(zhuǎn)換到另一種應(yīng)用語(yǔ)法[21]。這樣做是為了創(chuàng)建新型文件表示方式,或者方便其存儲(chǔ)于數(shù)據(jù)庫(kù)中。有時(shí)候,開(kāi)發(fā)人員需要整合或調(diào)整大型的數(shù)字文檔集合,每個(gè)數(shù)字文檔都由一種無(wú)法進(jìn)行互操作的標(biāo)記語(yǔ)言表示[3] [32]。不考慮轉(zhuǎn)換的范圍大小,常規(guī)的解決方式是使用一種在語(yǔ)法解析樹(shù)上起直接作用的轉(zhuǎn)換程序語(yǔ)言[8]。源文件分析中產(chǎn)生的樹(shù)結(jié)構(gòu)轉(zhuǎn)換成目標(biāo)語(yǔ)言的樹(shù)結(jié)構(gòu)實(shí)例。轉(zhuǎn)換之后的樹(shù)被序列化成新的文檔實(shí)例、圖形或音頻。

    信息孤島。這個(gè)問(wèn)題與上述的轉(zhuǎn)換問(wèn)題很相似,但是其目標(biāo)不是將一個(gè)形式的文檔轉(zhuǎn)換為另一種形式的文檔,而是允許分布存儲(chǔ)的文檔或文檔片段能夠向系統(tǒng)用戶(hù)提供一個(gè)通用的透明訪問(wèn)接口[9] [13]。盡管沒(méi)必要將文檔從一種標(biāo)記語(yǔ)言逐字逐句地轉(zhuǎn)換成另一種標(biāo)記語(yǔ)言,但是系統(tǒng)必須能夠保證文檔內(nèi)容表面上看起來(lái)是無(wú)縫融合的,盡管文檔的編碼可能差別很大。

    可獲得性。創(chuàng)作工具逐漸接受了結(jié)構(gòu)化標(biāo)記,這已經(jīng)成為視覺(jué)障礙用戶(hù)獲取數(shù)字文檔的福音。聲明性標(biāo)記使得人們能夠借助屏幕閱讀器或盲文顯示器進(jìn)行閱讀,并在助記符幫助下進(jìn)行推斷,而不是利用圖形線(xiàn)索。但是,目前這樣的應(yīng)用需要依賴(lài)用戶(hù)自身的能力或界面軟件,基于獨(dú)立的標(biāo)簽內(nèi)容或語(yǔ)法得出的結(jié)構(gòu)性推論。正如標(biāo)簽集文檔中描述的一樣,標(biāo)記語(yǔ)法約束及標(biāo)記的意義和使用都嚴(yán)格地依賴(lài)于文檔作者的可信性。遺憾的是,作者經(jīng)常會(huì)誤用標(biāo)簽,最糟糕的例子就是在web頁(yè)面上使用“頭部”標(biāo)簽來(lái)標(biāo)記某些特別的版式。

    安全處理。發(fā)展更有表達(dá)力的標(biāo)記模式語(yǔ)言(比如W3C的XML Schema語(yǔ)言)的部分動(dòng)力是人們認(rèn)識(shí)到標(biāo)記錯(cuò)誤、誤用和濫用的后果遠(yuǎn)比糟糕的格式化輸出要嚴(yán)重得多。聲明性標(biāo)記不僅用于電子商務(wù),也用于安全信息領(lǐng)域,比如醫(yī)療記錄[33]和航空工業(yè)[7]。這些領(lǐng)域的開(kāi)發(fā)人員不但要確保數(shù)字文檔的語(yǔ)法結(jié)構(gòu)規(guī)范,也要確保其遵守某些安全協(xié)議,以保證文檔的安全處理、存儲(chǔ)、傳輸和表示。

    7 標(biāo)記語(yǔ)義的優(yōu)點(diǎn)

    目前BECHAMEL計(jì)劃的調(diào)研結(jié)果顯示,標(biāo)記語(yǔ)義能夠通過(guò)以下幾種方式解決上述問(wèn)題。

    聲明性的、機(jī)器可讀的語(yǔ)義描述。就目前的實(shí)際情況而言,結(jié)構(gòu)化標(biāo)記語(yǔ)言設(shè)計(jì)師用自然語(yǔ)言文本表達(dá)了標(biāo)簽的意義,明確了其合適的使用方式。形式化的標(biāo)記語(yǔ)義體系使得本體之間的聯(lián)系能被計(jì)算機(jī)程序清晰地表達(dá),并實(shí)現(xiàn)自動(dòng)化處理。

    假設(shè)的驗(yàn)證。在沒(méi)有形式化標(biāo)簽集的文檔環(huán)境中,擁有標(biāo)記語(yǔ)義解釋能力的系統(tǒng)提供了一種測(cè)試猜測(cè)和驗(yàn)證假設(shè)的環(huán)境。在這種環(huán)境中,未公開(kāi)的標(biāo)記語(yǔ)言用戶(hù)會(huì)對(duì)那些他認(rèn)為在文檔數(shù)據(jù)庫(kù)中持續(xù)應(yīng)用的屬性和規(guī)則進(jìn)行推測(cè)。之后文檔處理軟件就會(huì)檢索那些與假設(shè)規(guī)則兼容或不兼容的文檔元素。

    語(yǔ)義約束的增強(qiáng)。支持有效性驗(yàn)證的解析器不僅能夠像常規(guī)語(yǔ)義解析器一樣完成語(yǔ)法驗(yàn)證,也能夠在發(fā)現(xiàn)或編寫(xiě)語(yǔ)義的過(guò)程中同時(shí)驗(yàn)證這種猜測(cè),這樣的解析器同樣能夠加強(qiáng)語(yǔ)義約束。這項(xiàng)操作同假設(shè)驗(yàn)證一致,但是在這種情況下,語(yǔ)義約束是已知且規(guī)范的。

    優(yōu)化的更有表現(xiàn)力的 APIs。使用SGML和XML應(yīng)用程序轉(zhuǎn)換或表示數(shù)字文檔時(shí),都會(huì)使用標(biāo)記語(yǔ)義。但是只有在執(zhí)行程序時(shí),更高級(jí)別的屬性和關(guān)聯(lián)才會(huì)顯示出來(lái)。形式化的、機(jī)器可讀的語(yǔ)義會(huì)豐富應(yīng)用程序的接口,加快軟件設(shè)計(jì)速度,隨著標(biāo)記語(yǔ)言的發(fā)展和變化,這些軟件維護(hù)起來(lái)也能更加方便和安全。

    8 相關(guān)工作

    針對(duì)上述挑戰(zhàn)和問(wèn)題,還有很多其他的文檔處理技術(shù)、標(biāo)準(zhǔn)和研究計(jì)劃。接下來(lái)我們梳理一下試圖解決這些問(wèn)題的現(xiàn)有想法。

    語(yǔ)義網(wǎng)[2]。語(yǔ)義網(wǎng)指的是眾多相互聯(lián)系的研究和標(biāo)準(zhǔn)化工作,就像當(dāng)下一些有關(guān)標(biāo)記和知識(shí)表示技術(shù)的想法。最核心的當(dāng)屬W3C的資源描述框架,當(dāng)然也包括其他的技術(shù),比如ISO的主題圖技術(shù)[16]。語(yǔ)義網(wǎng)的范圍很廣,目標(biāo)宏大,旨在利用通用知識(shí)表示技術(shù)來(lái)完善標(biāo)記語(yǔ)言,從而“促進(jìn)人類(lèi)知識(shí)的全面發(fā)展”[2]。語(yǔ)義網(wǎng)的研究和標(biāo)準(zhǔn)化不同于當(dāng)下的想法:不是對(duì)特定領(lǐng)域進(jìn)行語(yǔ)義描述,而是實(shí)現(xiàn)對(duì)所有領(lǐng)域的知識(shí)進(jìn)行語(yǔ)義標(biāo)注。當(dāng)前研究的目標(biāo)特別盯在“文檔標(biāo)記語(yǔ)義”上,而非“通用的語(yǔ)義標(biāo)記”。語(yǔ)義網(wǎng)技術(shù)的進(jìn)步會(huì)讓我們利用語(yǔ)義網(wǎng)標(biāo)記語(yǔ)言對(duì)標(biāo)記的語(yǔ)義進(jìn)行編碼成為可能。

    W3C的文檔對(duì)象模型。文檔對(duì)象模型是一個(gè)應(yīng)用程序接口,是對(duì)XML文檔進(jìn)行分析后生成的層級(jí)式數(shù)據(jù)結(jié)構(gòu)。人們想設(shè)計(jì)能為標(biāo)記語(yǔ)義提供各種接口的系統(tǒng),類(lèi)似于DOM所提供的標(biāo)記語(yǔ)法相關(guān)的形式,最終能夠形成“語(yǔ)義DOM”,對(duì)W3C的語(yǔ)法DOM形成補(bǔ)充。

    W3C 的Schema。XML Schema是一門(mén)基于XML的語(yǔ)言,能夠替代傳統(tǒng)的DTDs,用于約束XML文檔。DTDs的局限性推動(dòng)了這門(mén)語(yǔ)言的發(fā)展,這些局限同我們?cè)贐ECHAMEL計(jì)劃中面對(duì)的問(wèn)題是類(lèi)似的。Schema允許文檔類(lèi)設(shè)計(jì)師定義復(fù)雜的數(shù)據(jù)類(lèi)型,就像在高級(jí)程序語(yǔ)言里面的做法一樣。但是,為了對(duì)標(biāo)簽集建檔中的所有關(guān)系和約束進(jìn)行編碼,我們還需要比當(dāng)下的XML Schema更強(qiáng)大的表達(dá)形式。

    超媒體/時(shí)基結(jié)構(gòu)語(yǔ)言(Hypermedia/Time-based Structuring Language ,HyTime)的架構(gòu)形式。適應(yīng)性廣泛的架構(gòu)技術(shù)來(lái)自于這樣一種認(rèn)識(shí),即不同的標(biāo)記語(yǔ)言應(yīng)用程序常常通過(guò)樣式各不相同但語(yǔ)義上等價(jià)的結(jié)構(gòu)進(jìn)行編碼[15]。架構(gòu)形式允許文檔類(lèi)設(shè)計(jì)師將其自有的特定元素實(shí)例映射到更通用的各種架構(gòu)實(shí)例上,這些架構(gòu)實(shí)例更便于在不同的應(yīng)用程序之間進(jìn)行映射[34]。這些映射的確表示了語(yǔ)義知識(shí)的約束形式,有利于解決上述轉(zhuǎn)換和集成上的挑戰(zhàn)。BECHAMEL計(jì)劃在某種程度上就是要建立一個(gè)比架構(gòu)形式表達(dá)更多語(yǔ)義關(guān)系的模型。

    注 釋

    [1] AAP. Authors Guide to Electronic Manuscript Preparationand Markup. Electronic Manuscript Series. Association of American Publishers, Washington, DC, 1986. Current

    version: ANSI/NISO/ISO 12083 - 1995 Electronic Manuscript Preparation and Markup, National Information Standards Organization, 1995

    [2] BERNERS-LEE, T., HENDLER, J., AND LASSILA, O. The semantic web. Scientific American 284, 5 (May 2001), 35-43

    [3] COLE, T., AND KAZMER, M. SGML as a component of the digital library. Library High Tech 13, 4 (1995), 75-90

    [4] COOMBS, J. H., RENEAR, A. H., AND DEROSE, S. J. Markup systems and the future of scholarly text processing. Communications of the Association for Computing Machinery 30, 11 (1987), 933-947

    [5] DEROSE, S. J., DURAND, D., MYLONAS, E., AND RENEAR, A. H. What is text, really? Journal of Computing in Higher Education 1, 2 (1990), 3-26

    [6] DUBIN, D., RENEAR, A., SPERBERG-MCQUEEN, C. M., AND HUITFELDT, C. A logic programming environment for document semantics and inference. Presented at

    ALLC/ACH, T¨ubingen, Germany, July 2002

    [7] ENSIGN, C. SGML: The Billion Dollar Secret. Prentice Hall, Upper Saddle River, NJ, 1997, ch. 5: United Technologies Sikorsky Aircraft Corporation

    [8] FAUSEY, J., AND SHAFER, K. All my data is in SGML. Now what? Journal of the American Society for Information Science 48, 7 (1997): 638-643

    [9] FAY, C. The document management alliance. Bulletin of the American Society for Information Science 25, 1 (October/November 1998), 20-24

    [10] GOLDFARB, C. F. Document Composition Facility: Generalized Markup Language (GML) Users Guide. IBM General Products Division, 1978. SH20-9160-0

    [11] GOLDFARB, C. F. A generalized approach to document markup. In Proceedings of the ACM SIGPLAN-SIGOA Symposium on Text Manipulation (New York, 1981), ACM:68-73

    [12] IBM CORP. Application Description, IBM System/360 Document Processing: System. White Plains, NY, 1967. Form No. H20-0315

    [13] IDE, N. M., AND SPERBERG-MCQUEEN, C. M. Toward a unified docuverse: Standardizing document markup and access without procrustean bargains. In Proceedings of the 60th Annual Meeting of the American Society for Information Science (Medford, NJ, 1997), C. Schwartz and M. Rorvig, Eds., Information Today, Inc., pp. 347-360

    [14] ISO. ISO 8879-1986 (E). Information processing — Text and Office Systems — Standard Generalized Markup Language (SGML). International Organization for Standardization, Geneva, 1986

    [15] ISO. ISO/IEC 10744:1997: Information processing - Hypermedia/Time-based Structuring Language (HyTime), second ed. International Organization for Standardization, Geneva, May 1997, appendix A.3 Architectural Form Definition Requirements

    [16] ISO. ISO/IEC 13250: 2000 Information technology - SGML Applications - Topic Maps. International Organization for Standardization, Geneva, 2000

    [17] KNUTH, D. E. TEX and Metafont: New Directions in Typesetting. Digital Press, Bedford, MA, 1979

    [18] LAMPORT, L. LATEX - A document preparation system. Addison-Wesley, Reading, MA, 1985

    [19] LESK, M. E. Typing Documents on UNIX and GCOS: The -ms Macros for Troff, 1977

    [20] MAMRAK, S. A., BARNES, J., HONG, H., JOSEPH, C., KAELBLING, M., NICHOLAS, C., OCONNELL, C., AND SHARE, M. Descriptive markup - the best approach? Communications of the Association for Computing Machinery 31, 7 (1988), 810-811

    [21] MAMRAK, S. A., KAELBLING, M. J., NICHOLAS, C. K., AND SHARE, M. A software architecture for supporting the exchange of electronic manuscripts. Communications of the ACM 30, 5 (1987), 408-414

    [22] OSSANNA, J. F. NROFF/TROFF users manual. Tech. Rep. 54, Bell Laboratories, Murray Hill, NJ, October 1976. [23] RAMALHO, J. C., AND HENRIQUES, P. R. Beyond DTDs: constraining data content. In Proceedings of SGML/XML Europe 98 (Paris, May 1998), GCA

    [24] RAYMOND, D. R., AND TOMPA, F. W. Markup reconsidered. Technical Report 356, Department of Computer Science, The University of Western Ontario, 1993. Presented at the First International Workshop on the Principles of Document Processing, Washinton DC, October 21-23 1992; an earlier version was circulated privately as ”Markup Considered Harmful” in the late 1980s

    [25] RAYMOND, D. R., TOMPA, F.W., AND WOOD, D. From data representation to data model: Meta-semantic issues in the evolution of sgml. Computer Standards and Interfaces 18, 1 (January 1996), 25-36

    [26] REID, B. K. Scribe Introductory Users Manual, first ed. Carnegie-Mellon University, Computer Science Department, Pittsburgh, PA, August 1978

    [27] REID, B. K. Scribe: A Document Specification Language and its Compiler. PhD thesis, Carnegie-Mellon University, Pittsburgh, PA, 1981. Also available as Technical Report CMU-CS-81-100

    [28] RENEAR, A. The descriptive/procedural distinction is flawed. Markup Languages: Theory and Practice 2, 4 (2000), 411-420

    [29] RENEAR, A. Raising the bar: Text encoding from a logical point of view. CLIP 2001: Computers, Literature, Philology, Gerhard-Mercator University, Duisburg, Germany, December 2001

    [30] RIZZI, R. Complexity of context-free grammars with exceptions and the inadequacy of grammars as models for XML and SGML. Markup Languages: Theory and Practice 3, 1 (2002):107-116

    [31] ROWE, N. C. Artificial Intelligence through Prolog. Prentice Hall, Englewood Cliffs, NJ, 1988

    [32] SCHATZ, B., MISCHO, W. H., COLE, T.W., HARDIN, J. B., BISHOP, A. P., AND CHEN, H. Federating diverse collections of scientific literature. Computer 29 (May 1996), 28-36

    [33] SHOBOWALE, G. SGML, XML, and the document-centered approach to electronic medical records. Bulletin of the American Society for Information Science 25, 1 (October/November 1998), 7-10

    [34] SIMONS, G. F. Using architectural forms to map TEI data into an object-oriented database. Computers and the Humanities 33, 1-2 (1999), 85-101. Originally delivered in 1997 at the TEI 10 conference in Providence, RI

    [35] SPERBERG-MCQUEEN, C. M., DUBIN, D., HUITFELDT, C., AND RENEAR, A. Drawing inferences on the basis of markup. In Proceedings of Extreme Markup Languages 2002 (Montreal, Canada, August 2002), B. T. Usdin and S. R. Newcomb, Eds

    [36] SPERBERG-MCQUEEN, C. M., HUITFELDT, C., AND RENEAR, A. Meaning and interpretation of markup. Markup Languages: Theory and Practice 2, 3 (2000):215-234

    [37] SPERBERG-MCQUEEN, C. M., HUITFELDT, C., AND RENEAR, A. Practical extraction of meaning from markup. Paper delivered at ACH/ALLC 2001, New York, 2001

    [38] SPERBERG-MCQUEEN, C. M., RENEAR, A., HUITFELDT, C., AND DUBIN, D. Skeletons in the closet: Saying what markup means. Presented at ALLC/ACH, T¨ubingen, Germany, July 2002

    [39] SPERBERG-MCQUEEN, M., AND BURNARD, L., Eds. Guidelines for Text Encoding and Interchange (TEI P3). ACH/ALLC/ACL Text Encoding Initiative, Chicago, Oxford, 1994

    [40] SPRING, M. B. The origin and use of copymarks in electronic publishing. Journal of Documentation 45, 2 (June 1989), 110-123

    [41] TANIMOTO, S. L. The Elements of Artificial Intelligence. Computer Science Press, Rockville, MD, 1987

    [42] UNITED STATES DEPARTMENT OF DEFENSE. MIL-M-28001 Military Specification: Markup Requirements and Generic Style Specification for Electronic Printed Output and Exchange of Text, 1988

    [43] WELTY, C., AND IDE, N. Using the right tools: Enhancing retrieval from marked-up documents. Computers and the Humanities 33, 1-2 (1999), 59-84. Originally delivered in 1997 at the TEI 10 conference in Providence, RI

    ——本文注釋標(biāo)注順序遵英文原文,未作改動(dòng)。

    猜你喜歡
    語(yǔ)義
    語(yǔ)言與語(yǔ)義
    “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
    認(rèn)知范疇模糊與語(yǔ)義模糊
    “深+N季”組配的認(rèn)知語(yǔ)義分析
    語(yǔ)義分析與漢俄副名組合
    修辭的基礎(chǔ)——語(yǔ)義和諧律
    久久精品成人免费网站| 欧美 亚洲 国产 日韩一| 美女视频免费永久观看网站| 久久中文看片网| 男女免费视频国产| 少妇的丰满在线观看| 中文字幕高清在线视频| 三上悠亚av全集在线观看| 亚洲,欧美精品.| 男女下面插进去视频免费观看| 黄色片一级片一级黄色片| 50天的宝宝边吃奶边哭怎么回事| 亚洲专区国产一区二区| 国产不卡av网站在线观看| 亚洲国产精品一区二区三区在线| av网站在线播放免费| 丝袜美足系列| 大型黄色视频在线免费观看| 久久久国产精品麻豆| 麻豆国产av国片精品| 亚洲欧洲精品一区二区精品久久久| 成年人午夜在线观看视频| 色在线成人网| 久久中文字幕一级| 亚洲成a人片在线一区二区| 丁香六月欧美| 老熟女久久久| 久久人妻福利社区极品人妻图片| 久久这里只有精品19| 免费在线观看日本一区| 韩国精品一区二区三区| 精品国产乱码久久久久久男人| 18禁黄网站禁片午夜丰满| 免费在线观看日本一区| 国产精品影院久久| 国产av精品麻豆| 国产麻豆69| 国精品久久久久久国模美| 国产无遮挡羞羞视频在线观看| 久久中文看片网| 最新的欧美精品一区二区| 法律面前人人平等表现在哪些方面| 中文字幕精品免费在线观看视频| 久久精品熟女亚洲av麻豆精品| 久久99一区二区三区| 狂野欧美激情性xxxx| 精品久久久精品久久久| 天天躁狠狠躁夜夜躁狠狠躁| 香蕉丝袜av| 国产成人一区二区三区免费视频网站| 一本综合久久免费| 精品国产一区二区三区四区第35| 免费看十八禁软件| 黄色怎么调成土黄色| 妹子高潮喷水视频| 亚洲第一青青草原| 日韩有码中文字幕| 免费一级毛片在线播放高清视频 | 精品久久久久久电影网| 无限看片的www在线观看| 午夜影院日韩av| 国产精品自产拍在线观看55亚洲 | 精品国产一区二区三区四区第35| 最新的欧美精品一区二区| 久久影院123| 国产亚洲精品久久久久久毛片 | 亚洲av片天天在线观看| 无遮挡黄片免费观看| 久久人妻福利社区极品人妻图片| 在线av久久热| 99国产精品一区二区三区| 天天影视国产精品| 久久精品成人免费网站| 丁香六月欧美| 国产又爽黄色视频| 18禁裸乳无遮挡免费网站照片 | avwww免费| 天天操日日干夜夜撸| 国产精品免费大片| 国产亚洲一区二区精品| 女人久久www免费人成看片| 视频区图区小说| 精品卡一卡二卡四卡免费| 新久久久久国产一级毛片| 香蕉丝袜av| 精品久久蜜臀av无| 亚洲熟女毛片儿| 少妇被粗大的猛进出69影院| 亚洲熟女精品中文字幕| 美女福利国产在线| 亚洲第一av免费看| av网站免费在线观看视频| 欧洲精品卡2卡3卡4卡5卡区| 国产精品一区二区精品视频观看| 91精品三级在线观看| 99精品久久久久人妻精品| 日日摸夜夜添夜夜添小说| 亚洲专区中文字幕在线| 欧美日韩乱码在线| www.精华液| 欧美精品亚洲一区二区| 国产91精品成人一区二区三区| 欧美日韩成人在线一区二区| 男男h啪啪无遮挡| videos熟女内射| 51午夜福利影视在线观看| 校园春色视频在线观看| 在线观看www视频免费| 日日摸夜夜添夜夜添小说| 一本大道久久a久久精品| 村上凉子中文字幕在线| 久久天躁狠狠躁夜夜2o2o| 午夜久久久在线观看| 国产精品免费视频内射| 啦啦啦 在线观看视频| 美女 人体艺术 gogo| 91九色精品人成在线观看| 欧美av亚洲av综合av国产av| 亚洲国产欧美一区二区综合| 久久热在线av| 免费看a级黄色片| 51午夜福利影视在线观看| 国产精品欧美亚洲77777| 久久香蕉精品热| www.999成人在线观看| 日韩有码中文字幕| 曰老女人黄片| 久久久水蜜桃国产精品网| 精品国产一区二区久久| 欧美人与性动交α欧美软件| 另类亚洲欧美激情| 免费在线观看亚洲国产| 又紧又爽又黄一区二区| 大陆偷拍与自拍| 99久久综合精品五月天人人| 亚洲欧美精品综合一区二区三区| 国产亚洲欧美在线一区二区| 国产成人啪精品午夜网站| 久久香蕉精品热| 亚洲中文av在线| 国产97色在线日韩免费| 欧美日韩瑟瑟在线播放| 欧美日本中文国产一区发布| 亚洲欧美激情综合另类| 99国产精品一区二区三区| 国产精品久久久人人做人人爽| 久久精品国产亚洲av高清一级| 亚洲一卡2卡3卡4卡5卡精品中文| 免费日韩欧美在线观看| 国产xxxxx性猛交| 叶爱在线成人免费视频播放| 欧美大码av| 欧美日韩亚洲高清精品| 国产成人精品久久二区二区91| 搡老乐熟女国产| 亚洲国产欧美日韩在线播放| 久久中文字幕一级| 黄色a级毛片大全视频| 嫩草影视91久久| 日韩欧美免费精品| 黄色丝袜av网址大全| 悠悠久久av| 国产有黄有色有爽视频| 中文字幕最新亚洲高清| 人人妻,人人澡人人爽秒播| 久久久久久久精品吃奶| 日日爽夜夜爽网站| 国产精品久久久人人做人人爽| 欧美人与性动交α欧美精品济南到| 王馨瑶露胸无遮挡在线观看| 在线永久观看黄色视频| 99久久精品国产亚洲精品| 成年人午夜在线观看视频| 高清视频免费观看一区二区| aaaaa片日本免费| 国产精品99久久99久久久不卡| 一二三四社区在线视频社区8| 亚洲人成伊人成综合网2020| 黄网站色视频无遮挡免费观看| 大香蕉久久网| 黑人猛操日本美女一级片| 成人av一区二区三区在线看| 男女之事视频高清在线观看| 亚洲在线自拍视频| 精品亚洲成国产av| 国产av又大| 好看av亚洲va欧美ⅴa在| 国产主播在线观看一区二区| 国产极品粉嫩免费观看在线| 国产视频一区二区在线看| 亚洲av日韩精品久久久久久密| 校园春色视频在线观看| av线在线观看网站| 国产色视频综合| 一本大道久久a久久精品| 国产精品免费一区二区三区在线 | 婷婷成人精品国产| 久久中文字幕人妻熟女| 看免费av毛片| 久久久精品免费免费高清| 亚洲人成电影免费在线| 黑人巨大精品欧美一区二区mp4| 色94色欧美一区二区| 国产精品欧美亚洲77777| 亚洲 国产 在线| 69av精品久久久久久| 9色porny在线观看| 午夜福利欧美成人| e午夜精品久久久久久久| 国产精品99久久99久久久不卡| 女性生殖器流出的白浆| 久久久久久久久免费视频了| 国产xxxxx性猛交| 热re99久久精品国产66热6| 一级a爱片免费观看的视频| 国产黄色免费在线视频| 色婷婷久久久亚洲欧美| 99在线人妻在线中文字幕 | 一本一本久久a久久精品综合妖精| 日本vs欧美在线观看视频| 少妇 在线观看| 老司机影院毛片| 久久午夜综合久久蜜桃| 欧美精品高潮呻吟av久久| 午夜福利在线观看吧| 成人精品一区二区免费| 国产蜜桃级精品一区二区三区 | 久热这里只有精品99| 精品国产一区二区久久| 丝袜在线中文字幕| 欧美精品人与动牲交sv欧美| 国产亚洲精品一区二区www | www日本在线高清视频| 国产精品二区激情视频| 成人18禁在线播放| 午夜福利视频在线观看免费| 一进一出抽搐动态| 麻豆乱淫一区二区| 老鸭窝网址在线观看| 99国产精品99久久久久| 天堂动漫精品| 欧美大码av| 亚洲美女黄片视频| av福利片在线| 国产亚洲一区二区精品| 中国美女看黄片| 国产在视频线精品| 欧美日韩中文字幕国产精品一区二区三区 | 操美女的视频在线观看| 日韩免费av在线播放| 中国美女看黄片| 美国免费a级毛片| 久热这里只有精品99| 日本一区二区免费在线视频| 热re99久久精品国产66热6| 国产成人精品无人区| 热re99久久国产66热| 欧美激情 高清一区二区三区| 欧美黄色淫秽网站| 丝瓜视频免费看黄片| a在线观看视频网站| 老司机深夜福利视频在线观看| www.999成人在线观看| 国产成人啪精品午夜网站| 婷婷精品国产亚洲av在线 | 女人高潮潮喷娇喘18禁视频| 99热国产这里只有精品6| 亚洲欧美精品综合一区二区三区| 99国产精品一区二区蜜桃av | 亚洲国产欧美一区二区综合| av电影中文网址| 日本精品一区二区三区蜜桃| 国产人伦9x9x在线观看| 80岁老熟妇乱子伦牲交| 校园春色视频在线观看| 国产真人三级小视频在线观看| bbb黄色大片| 亚洲三区欧美一区| 夜夜爽天天搞| 搡老熟女国产l中国老女人| 十八禁网站免费在线| www.精华液| 色在线成人网| 十分钟在线观看高清视频www| 欧美 日韩 精品 国产| 久久天躁狠狠躁夜夜2o2o| 免费在线观看视频国产中文字幕亚洲| 色94色欧美一区二区| 国产成人av激情在线播放| 国产淫语在线视频| 欧美日韩亚洲国产一区二区在线观看 | 久久中文看片网| 大码成人一级视频| 亚洲美女黄片视频| 亚洲欧美激情综合另类| 久久精品国产a三级三级三级| 国产av又大| 黑人巨大精品欧美一区二区mp4| 满18在线观看网站| 久久精品亚洲精品国产色婷小说| 久久久国产精品麻豆| 黄片播放在线免费| 国产精品免费一区二区三区在线 | 亚洲av成人不卡在线观看播放网| 女警被强在线播放| 成人av一区二区三区在线看| 欧美人与性动交α欧美精品济南到| 麻豆乱淫一区二区| 欧美亚洲 丝袜 人妻 在线| 久久精品亚洲熟妇少妇任你| 亚洲七黄色美女视频| 午夜91福利影院| 十八禁网站免费在线| 制服人妻中文乱码| 国产又色又爽无遮挡免费看| 18禁裸乳无遮挡动漫免费视频| 韩国精品一区二区三区| 国产麻豆69| 日韩免费av在线播放| 久久午夜亚洲精品久久| 国产视频一区二区在线看| 国产精品久久久久久人妻精品电影| 午夜日韩欧美国产| 成人亚洲精品一区在线观看| 91精品国产国语对白视频| 人人妻人人爽人人添夜夜欢视频| 欧美久久黑人一区二区| 男女床上黄色一级片免费看| 国产成人av激情在线播放| 1024香蕉在线观看| 免费av中文字幕在线| 国产淫语在线视频| 国产精品欧美亚洲77777| 久久狼人影院| 亚洲综合色网址| 99国产极品粉嫩在线观看| 99热国产这里只有精品6| 婷婷成人精品国产| 99香蕉大伊视频| 亚洲成人免费电影在线观看| 久久九九热精品免费| 亚洲精品成人av观看孕妇| 久久久久久久久久久久大奶| 久热爱精品视频在线9| 最近最新中文字幕大全免费视频| 老司机亚洲免费影院| 久久中文字幕一级| 欧美性长视频在线观看| 久久99一区二区三区| 在线十欧美十亚洲十日本专区| 叶爱在线成人免费视频播放| 欧美 亚洲 国产 日韩一| 国产av精品麻豆| 午夜91福利影院| 天天添夜夜摸| 亚洲自偷自拍图片 自拍| 日韩视频一区二区在线观看| 99久久99久久久精品蜜桃| 国产一区二区激情短视频| 精品久久久久久久久久免费视频 | 国产欧美日韩精品亚洲av| 黑人欧美特级aaaaaa片| 亚洲第一青青草原| 9色porny在线观看| 在线天堂中文资源库| 黄色怎么调成土黄色| 深夜精品福利| 搡老乐熟女国产| 亚洲精品一二三| 欧美精品av麻豆av| 午夜福利,免费看| 9色porny在线观看| 日韩三级视频一区二区三区| 啦啦啦视频在线资源免费观看| 久久香蕉国产精品| 精品国产乱子伦一区二区三区| 国产91精品成人一区二区三区| 国产精品一区二区在线不卡| 欧美老熟妇乱子伦牲交| xxxhd国产人妻xxx| 亚洲精品粉嫩美女一区| 热re99久久国产66热| 老司机影院毛片| 天天躁日日躁夜夜躁夜夜| 一个人免费在线观看的高清视频| 无限看片的www在线观看| 男女之事视频高清在线观看| 国产乱人伦免费视频| 亚洲精品中文字幕一二三四区| 国产成+人综合+亚洲专区| 91av网站免费观看| 激情视频va一区二区三区| 精品福利永久在线观看| 少妇 在线观看| 十八禁人妻一区二区| 建设人人有责人人尽责人人享有的| 久久精品成人免费网站| 欧美亚洲日本最大视频资源| 99香蕉大伊视频| 日韩制服丝袜自拍偷拍| 老司机午夜十八禁免费视频| 丝瓜视频免费看黄片| 热99re8久久精品国产| 亚洲精品在线观看二区| 中文字幕色久视频| 国产精品久久久人人做人人爽| 欧美大码av| 亚洲成av片中文字幕在线观看| 国产99久久九九免费精品| 国产三级黄色录像| 又黄又粗又硬又大视频| av网站免费在线观看视频| 少妇 在线观看| 久久性视频一级片| 欧美 日韩 精品 国产| 午夜老司机福利片| 91成人精品电影| aaaaa片日本免费| 久久久久久免费高清国产稀缺| 国产伦人伦偷精品视频| 日日摸夜夜添夜夜添小说| 天堂√8在线中文| 久久人人爽av亚洲精品天堂| 亚洲美女黄片视频| 美女 人体艺术 gogo| 少妇粗大呻吟视频| 成年人黄色毛片网站| 丝袜在线中文字幕| 精品久久久久久电影网| 国产不卡一卡二| 成人18禁在线播放| 天堂√8在线中文| 在线国产一区二区在线| 91av网站免费观看| 一级黄色大片毛片| 亚洲人成电影免费在线| 在线视频色国产色| svipshipincom国产片| 久久中文看片网| 午夜激情av网站| 欧美日韩成人在线一区二区| 亚洲全国av大片| bbb黄色大片| 久久国产乱子伦精品免费另类| 亚洲综合色网址| 欧美午夜高清在线| 免费在线观看日本一区| 久久人妻福利社区极品人妻图片| av免费在线观看网站| 一边摸一边抽搐一进一小说 | 色婷婷av一区二区三区视频| av在线播放免费不卡| 搡老乐熟女国产| 亚洲精品国产精品久久久不卡| 亚洲成人手机| 欧美在线一区亚洲| 亚洲专区国产一区二区| 国产精华一区二区三区| 亚洲av第一区精品v没综合| 黄片播放在线免费| 久久中文看片网| www.熟女人妻精品国产| 久久国产精品男人的天堂亚洲| 午夜精品久久久久久毛片777| 在线观看www视频免费| 久久久久国内视频| 久热爱精品视频在线9| av超薄肉色丝袜交足视频| 老司机亚洲免费影院| 精品免费久久久久久久清纯 | 久久久精品免费免费高清| 熟女少妇亚洲综合色aaa.| 国产在线观看jvid| 亚洲精品乱久久久久久| 国产日韩欧美亚洲二区| 最新的欧美精品一区二区| 777久久人妻少妇嫩草av网站| 满18在线观看网站| 久久精品亚洲精品国产色婷小说| 黑丝袜美女国产一区| 国产1区2区3区精品| 一二三四社区在线视频社区8| 国产成人av激情在线播放| 免费在线观看完整版高清| 亚洲精品国产色婷婷电影| 人妻 亚洲 视频| 国产精品久久电影中文字幕 | 在线观看午夜福利视频| 不卡av一区二区三区| 极品教师在线免费播放| 王馨瑶露胸无遮挡在线观看| 在线免费观看的www视频| 久久影院123| 国产91精品成人一区二区三区| 国产高清国产精品国产三级| 国产不卡一卡二| 国产亚洲欧美精品永久| 亚洲国产毛片av蜜桃av| 少妇的丰满在线观看| videos熟女内射| 热99re8久久精品国产| 欧美+亚洲+日韩+国产| 亚洲久久久国产精品| 我的亚洲天堂| 捣出白浆h1v1| 欧美大码av| 午夜福利,免费看| 黄色a级毛片大全视频| 亚洲精品美女久久久久99蜜臀| 国产日韩一区二区三区精品不卡| 久久中文看片网| 最新美女视频免费是黄的| 日韩欧美三级三区| 免费观看精品视频网站| 国产午夜精品久久久久久| 看免费av毛片| 亚洲中文av在线| 午夜日韩欧美国产| 国产亚洲欧美在线一区二区| 一级毛片精品| 黄色视频不卡| 热re99久久国产66热| 日韩视频一区二区在线观看| 亚洲欧美一区二区三区久久| 免费观看人在逋| 欧美人与性动交α欧美软件| 中文字幕另类日韩欧美亚洲嫩草| 不卡av一区二区三区| 精品福利永久在线观看| 真人做人爱边吃奶动态| 亚洲精品国产精品久久久不卡| 国产成人免费无遮挡视频| 成人亚洲精品一区在线观看| 夜夜躁狠狠躁天天躁| 天堂√8在线中文| 国产1区2区3区精品| 日韩视频一区二区在线观看| 国产在视频线精品| 亚洲av第一区精品v没综合| 国产精品久久久久成人av| 香蕉丝袜av| 岛国在线观看网站| 91av网站免费观看| 亚洲国产精品合色在线| 亚洲五月天丁香| 亚洲av片天天在线观看| 亚洲九九香蕉| 99久久99久久久精品蜜桃| 黄频高清免费视频| a级毛片黄视频| 丝袜人妻中文字幕| 精品一区二区三区视频在线观看免费 | 在线观看舔阴道视频| 51午夜福利影视在线观看| 搡老熟女国产l中国老女人| 亚洲av第一区精品v没综合| 欧美日韩精品网址| 欧美日韩成人在线一区二区| 亚洲成人免费电影在线观看| 欧美精品一区二区免费开放| 亚洲成人免费电影在线观看| 久久久国产成人免费| 国产精品影院久久| 无人区码免费观看不卡| 午夜福利视频在线观看免费| 大片电影免费在线观看免费| 一进一出好大好爽视频| 亚洲欧美日韩高清在线视频| 色94色欧美一区二区| 不卡av一区二区三区| av超薄肉色丝袜交足视频| 日本黄色视频三级网站网址 | 国产精品综合久久久久久久免费 | 黑人巨大精品欧美一区二区mp4| а√天堂www在线а√下载 | 亚洲国产欧美一区二区综合| 成年版毛片免费区| 国产精品 国内视频| 中文亚洲av片在线观看爽 | 国产一区二区三区视频了| 国产国语露脸激情在线看| 色在线成人网| 日韩欧美在线二视频 | 十分钟在线观看高清视频www| 精品一品国产午夜福利视频| 人人澡人人妻人| 亚洲精品美女久久av网站| 精品卡一卡二卡四卡免费| 久久99一区二区三区| 午夜两性在线视频| 欧美精品一区二区免费开放| 久久人人97超碰香蕉20202| 精品欧美一区二区三区在线| 国产蜜桃级精品一区二区三区 | 大香蕉久久网| 亚洲一区二区三区不卡视频| 夜夜爽天天搞| 久久久久久人人人人人| 亚洲欧美一区二区三区久久| 欧美成人午夜精品| 欧美乱妇无乱码| 亚洲伊人色综图| 美女扒开内裤让男人捅视频| 黄片小视频在线播放| 男男h啪啪无遮挡| 亚洲av日韩在线播放| 999久久久精品免费观看国产| 久久这里只有精品19| 精品视频人人做人人爽| 国产精品一区二区免费欧美| 成人亚洲精品一区在线观看| 色老头精品视频在线观看| 久久九九热精品免费| 午夜影院日韩av| 黄色丝袜av网址大全|