孫俊麗
(徐州高等師范學(xué)校徐州221116)
淺談XML技術(shù)
孫俊麗
(徐州高等師范學(xué)校徐州221116)
簡單介紹了XML技術(shù),分析了XML技術(shù)的特點與趨勢,列出了XML的核心技術(shù),為XML技術(shù)的應(yīng)用奠定了理論基礎(chǔ)。
XML技術(shù) 特點 核心技術(shù)
KeywordXML technologyCharacteristicsThe core technology
可擴(kuò)展標(biāo)記語言XML(Extensible Markup Language)是一種描述型的標(biāo)記語言,它與HTML一樣,都是SGML(Standard Generalized Markup Language,標(biāo)準(zhǔn)通用標(biāo)記語言)。
XML是一種簡單的數(shù)據(jù)存儲語言,它實際上是一種用來表達(dá)結(jié)構(gòu)化數(shù)據(jù)的通用語法,是一種允許用戶對自己的標(biāo)記語言進(jìn)行定義的元語言。它使用一系列簡單的標(biāo)記描述數(shù)據(jù),而這些標(biāo)記可以用方便的方式建立,雖然XML占用的空間比二進(jìn)制數(shù)據(jù)要多,但XML極其簡單易于掌握和使用。所以說,XML是Internet環(huán)境中跨平臺的依賴于內(nèi)容的技術(shù),是當(dāng)前處理結(jié)構(gòu)化文檔信息的有力工具。
1、XML允許用戶自定義標(biāo)簽,具有擴(kuò)展功能,“擴(kuò)展性”就成為XML的一個中心特性。由于HTML只是以一套固定的標(biāo)簽來描述數(shù)據(jù)的顯示方式,因而在可擴(kuò)展性方面具有很大的局限性。XML則不同,它允許用戶根據(jù)需要定義數(shù)量不限的標(biāo)記來描述文檔中的資料,也允許嵌套的信息結(jié)構(gòu),從而把用戶從瀏覽器廠商固定標(biāo)簽的束縛中解脫出來。
2、識別文檔中的元素,使搜索具有智能性。由于HTML只是描述如何在頁面上布置文字和圖形等,而并沒有對信息的本身含義進(jìn)行描述,因此在基于HTML的Web中,準(zhǔn)確搜索到真正需要的特定信息相當(dāng)困難。而XML由于定義了各種標(biāo)識來描述信息中的所有元素,因而它對信息能夠進(jìn)行“自我描述”;而且XML的資源描述框架(RDF)還能提供類似圖書分類卡的Web數(shù)據(jù)。因此,XML不僅改變了HTML僵化的固定標(biāo)識集,而且改變了傳統(tǒng)的信息構(gòu)造方式,使得互聯(lián)網(wǎng)傳輸在信息檢索和獲取方面速度更快捷,搜索內(nèi)容更準(zhǔn)確。
3、嚴(yán)格遵循語法要求,具有良好的結(jié)構(gòu)性。HTML的語法要求并不嚴(yán)格而且具有一定的隨意性。XML則不同,雖然XML的擴(kuò)展性允許用戶創(chuàng)建新標(biāo)識,但它對語法有著嚴(yán)格的規(guī)定。
4、內(nèi)容和應(yīng)用分開,具有良好的復(fù)用性。HTML文檔雖然能夠包含豐富的數(shù)據(jù),但這些數(shù)據(jù)只能為相應(yīng)的瀏覽器所理解,其他應(yīng)用程序則無法有效地使用這些數(shù)據(jù)。而在XML文檔中,盡管文檔類型定義(DTD)描述了文檔數(shù)據(jù)的結(jié)構(gòu)、語義以及如何組織存放等,但卻沒有提供一套應(yīng)用程序接口(API)來控制其行為,它并不涉及數(shù)據(jù)如何被顯示和應(yīng)用,而只是簡單地將文檔數(shù)據(jù)解析成層次型的結(jié)構(gòu)化數(shù)據(jù)傳遞給應(yīng)用程序。因而,XML數(shù)據(jù)就可以被不同的應(yīng)用程序加以利用。
XML文檔主要由三個要素構(gòu)成:文檔類型定義DTD(或Schema),可擴(kuò)展樣式表語言XSL和可擴(kuò)展鏈接語言XLL。其中,DTD或Schema規(guī)定了XML文檔的邏輯結(jié)構(gòu),定義了XML文檔中的元素、元素的屬性以及元素和元素之間的屬性關(guān)系。XSL用來控制XML文檔在顯示時的版面風(fēng)格,XSL還可以處理多國文字、雙字節(jié)的漢字顯示等。XLL是XML的鏈接語言,它與HTML的鏈接相似,但功能更強(qiáng)大,可以進(jìn)一步擴(kuò)展當(dāng)前已有的簡單鏈接,支持可擴(kuò)展的鏈接和多方向的鏈接等。
1、DTD和Schema
DTD是一套關(guān)于標(biāo)記符的語法規(guī)則,它告訴你可以在文檔中使用哪些標(biāo)記符,它們應(yīng)該按什么次序出現(xiàn),哪些標(biāo)記符可以出現(xiàn)于其它標(biāo)記符中,哪些標(biāo)記符有屬性等等??偠灾?,DTD規(guī)定了一個語法分析器來解釋一個“有效的”XML文檔所需要知道的所有規(guī)則的細(xì)節(jié)。DTD可以包括在包含它所描述的文檔的文件中,或者與外部的URL相鏈接,這些外部DTD可以被不同文檔和網(wǎng)站所共享。DTD作為XML文檔的結(jié)構(gòu)起到了很好的描述作用,但是它也有一些缺點,比如它采用了非XML的語法規(guī)則、不支持?jǐn)?shù)據(jù)類型、擴(kuò)展性較差等等,Schema正好解決了這些問題。Schema利用元素的內(nèi)容和屬性來定義XML文檔的整體結(jié)構(gòu),對DTD進(jìn)行了擴(kuò)充,引入了數(shù)據(jù)類型、對域名的支持,這樣一個XML文檔可以有多個Schema與其對應(yīng),而一個XML文檔只能與一個DTD對應(yīng),從而使其具備較強(qiáng)的可擴(kuò)展性。表有CSS(Cascading Style Sheets,層疊樣式表)和XSL(Extensible Style Language,可擴(kuò)展樣式語言)。這些樣式表隨XML文檔發(fā)送給用戶,通過樣式表告訴瀏覽器如何格式化每個元素,使得不同的用戶可以根據(jù)自己的需要來定義數(shù)據(jù)的表現(xiàn)形式。
本文首先簡單介紹了XML技術(shù),接著從四個方面分析了XML技術(shù)的特點和趨勢,最后列出了XML的核心技術(shù),為XML的應(yīng)用奠定了理論基礎(chǔ)。
XML描述的是文檔的結(jié)構(gòu)和語義,它不描述文檔的表現(xiàn)形式。XML把內(nèi)容和顯示格式分開,這樣做的好處是可以讓不同的用戶按照各自希望的格式顯示同一文檔的數(shù)據(jù)內(nèi)容。為XML文檔提供格式信息的是樣式表(Style Sheet)。適用于文檔的樣式
[1]王海波.基于XML的數(shù)據(jù)交換的實現(xiàn)[J].計算機(jī)工程,2001.
[2]柴曉路.XML數(shù)據(jù)環(huán)境下基于關(guān)系模式的數(shù)據(jù)交換方法[J].IBM,2001.
[3]魚濱.基于XML的集成中間件技術(shù)研究[D].西安:西北大學(xué),2003.
[4]陳銀風(fēng).XML與HTML整合[J].現(xiàn)代計算機(jī),2011.
[5]任寧.XML技術(shù)研究[J].黑龍江科技信息,2010.
An Overview of XML Technology
Sun Junli
(Xuzhou Higher Normal SchoolXuzhou221116)
This paper briefly introduces the XML technology,analyzes the characteristics and trends of XML technology,lists the core technology of XML,and lays a theoretical foundation for the application of XML technology.
TP311.1
B
160620-7323
孫俊麗(1987),女,漢族,山東省鄒城市人,助理講師,研究方向計算機(jī)軟件。