隨著計(jì)算機(jī)應(yīng)用領(lǐng)域的不斷拓展和多媒體技術(shù)的發(fā)展, 數(shù)據(jù)庫已經(jīng)是計(jì)算機(jī)科學(xué)技術(shù)中發(fā)展最快、應(yīng)用最廣泛的重要分支之一,而數(shù)據(jù)庫技術(shù)的研究也取得了重大突破,目前,它已成為計(jì)算機(jī)信息系統(tǒng)和計(jì)算機(jī)應(yīng)用系統(tǒng)的核心技術(shù)和重要的基礎(chǔ)。數(shù)據(jù)庫技術(shù)僅僅40多年的歷史,卻已經(jīng)歷經(jīng)了3代變化,造就了C.W.Bachman、E.F.Codd和James Gray三位圖靈獎(jiǎng)得主,發(fā)展了以數(shù)據(jù)建模和DBMS核心技術(shù)為主,內(nèi)容豐富的一門學(xué)科,帶動(dòng)了一個(gè)巨大
的軟件產(chǎn)業(yè)——DBMS產(chǎn)品及其相關(guān)工具和解決方案。
隨著各類信息系統(tǒng)與數(shù)據(jù)庫的建立,在過去若干年的時(shí)間里都積累了海量的、不同形式存儲(chǔ)的各類數(shù)據(jù)。這些數(shù)據(jù)十分繁雜,僅僅依靠目前數(shù)據(jù)庫的查詢檢索機(jī)制和數(shù)據(jù)處理方法,已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)實(shí)的需要。數(shù)據(jù)中隱藏的深層次的豐富資源沒有得到充分地發(fā)掘和利用。人們迫切地需求把數(shù)據(jù)變成知識(shí),把知識(shí)變成決策,把決策變成利潤(rùn)(財(cái)富)。使之有效地在管理和決策中發(fā)揮作用,是急需解決的問題。而且,隨著信息化的不斷深入發(fā)展,信息資源開發(fā)利用,已成為當(dāng)前信息化的核心任務(wù)之一。然而,隨著用戶應(yīng)用需求的提高、硬件技術(shù)的發(fā)展和Internet/Intranet提供的豐富多彩的多媒體交流方式,促進(jìn)了XML數(shù)據(jù)庫、數(shù)據(jù)倉(cāng)庫技術(shù)、聯(lián)機(jī)分機(jī)處理技術(shù)和數(shù)據(jù)挖掘技術(shù)相互滲透,互相結(jié)合,成為當(dāng)前數(shù)據(jù)庫技術(shù)發(fā)展的主要特征,形成了數(shù)據(jù)庫新技術(shù)。
1、XML數(shù)據(jù)庫
XML數(shù)據(jù)庫是一個(gè)能夠在應(yīng)用中管理XML數(shù)據(jù)和文檔的集合的數(shù)據(jù)庫系統(tǒng)。XML數(shù)據(jù)庫是XML文檔及其部件的集合,并通過一個(gè)具有能力管理和控制這個(gè)文檔集合本身及其所表示信息的系統(tǒng)來維護(hù)。XML數(shù)據(jù)庫不僅是結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)庫,像管理其它數(shù)據(jù)一樣,持久的XML數(shù)據(jù)管理包括數(shù)據(jù)的獨(dú)立性、集成性、訪問權(quán)限、視圖、完備性、冗余性、一致性以及數(shù)據(jù)恢復(fù)等。這些文檔是持久的并且是可以操作的。 XML數(shù)據(jù)庫不僅是結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)庫,像管理其它數(shù)據(jù)一樣,持久的XML數(shù)據(jù)管理包括數(shù)據(jù)的獨(dú)立性、集成性、訪問權(quán)限、視圖、完備性、冗余性、一致性以及數(shù)據(jù)恢復(fù)等。這些文檔是持久的并且是可以操作的。
與傳統(tǒng)數(shù)據(jù)庫相比,XML數(shù)據(jù)庫能夠?qū)Π虢Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效的存取和管理。如網(wǎng)頁內(nèi)容就是一種半結(jié)構(gòu)化數(shù)據(jù),而傳統(tǒng)的關(guān)系數(shù)據(jù)庫對(duì)于類似網(wǎng)頁內(nèi)容這類半結(jié)構(gòu)化數(shù)據(jù)無法進(jìn)行有效的管理。提供對(duì)標(biāo)簽和路徑的操作。傳統(tǒng)數(shù)據(jù)庫語言允許對(duì)數(shù)據(jù)元素的值進(jìn)行操作,不能對(duì)元素名稱操作,半結(jié)構(gòu)化數(shù)據(jù)庫提供了對(duì)標(biāo)簽名稱的操作,還包括了對(duì)路徑的操作。 當(dāng)數(shù)據(jù)本身具有層次特征時(shí),由于XML數(shù)據(jù)格式能夠清晰表達(dá)數(shù)據(jù)的層次特征,因此XML數(shù)據(jù)庫便于對(duì)層次化的數(shù)據(jù)進(jìn)行操作。XML數(shù)據(jù)庫適合管理復(fù)雜數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)集,如果己經(jīng)以XML格式存儲(chǔ)信息,則XML數(shù)據(jù)庫利于文檔存儲(chǔ)和檢索;可以用方便實(shí)用的方式檢索文檔,并能夠提供高質(zhì)量的全文搜索引擎。另外XML數(shù)據(jù)庫能夠存儲(chǔ)和查詢異種的文檔結(jié)構(gòu),提供對(duì)異種信息存取的支持。
2、數(shù)據(jù)倉(cāng)庫技術(shù)(DW)
數(shù)據(jù)倉(cāng)庫(Data Warehouse,DW)是信息領(lǐng)域中近年來迅速發(fā)展起來的數(shù)據(jù)庫新技術(shù),是決策支持系統(tǒng)(dss)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉(cāng)庫是一個(gè)過程而不是一個(gè)項(xiàng)目;是一個(gè)環(huán)境而不是一件產(chǎn)品。數(shù)據(jù)倉(cāng)庫提供用戶用于決策支持的當(dāng)前和歷史數(shù)據(jù),這些數(shù)據(jù)在傳統(tǒng)的操作型數(shù)據(jù)庫中很難或不能得到。數(shù)據(jù)倉(cāng)庫最根本的特點(diǎn)是物理地存放數(shù)據(jù),而且這些數(shù)據(jù)并不是最新的、專有的,而是來源于其它數(shù)據(jù)庫的。數(shù)據(jù)倉(cāng)庫的建立,能充分利用已有的數(shù)據(jù)資源,把數(shù)據(jù)轉(zhuǎn)換為信息,從中挖掘出知識(shí),提煉成智慧,最終創(chuàng)造出效益。所以,越來越多的企業(yè)開始認(rèn)識(shí)到數(shù)據(jù)倉(cāng)庫應(yīng)用所帶來的好處。
數(shù)據(jù)倉(cāng)庫是支持管理決策過程、面向主題、集成的、穩(wěn)定的時(shí)變的數(shù)據(jù)集合。它將大量用于事務(wù)處理的傳統(tǒng)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的清理、抽取和轉(zhuǎn)換,并按決策主題的需要進(jìn)行重新組織。數(shù)據(jù)倉(cāng)庫的邏輯結(jié)構(gòu)可分為近期基本數(shù)據(jù)層、歷史數(shù)據(jù)層和綜合數(shù)據(jù)層,其中綜合數(shù)據(jù)是為決策服務(wù)的。數(shù)據(jù)倉(cāng)庫是不可更新的,數(shù)據(jù)倉(cāng)庫主要是為決策分析提供數(shù)據(jù),所涉及的操作主要是數(shù)據(jù)的查詢;該文原載于中國(guó)社會(huì)科學(xué)院文獻(xiàn)信息中心主辦的《環(huán)球市場(chǎng)信息導(dǎo)報(bào)》雜志http://www.ems86.com總第543期2014年第11期-----轉(zhuǎn)載須注名來源數(shù)據(jù)倉(cāng)庫是隨時(shí)間而變化的,傳統(tǒng)的關(guān)系數(shù)據(jù)庫系統(tǒng)比較適合處理格式化的數(shù)據(jù),能夠較好的滿足商業(yè)商務(wù)處理的需求。
3、知識(shí)數(shù)據(jù)庫
知識(shí)數(shù)據(jù)庫的功能是如何把由大量的事實(shí)、規(guī)則、概念組成的知識(shí)存儲(chǔ)起來,進(jìn)行管理,并向用戶提供方便快速的檢索、查詢手段。因此,知識(shí)數(shù)據(jù)庫可定義為:知識(shí)、經(jīng)驗(yàn)、規(guī)則和事實(shí)的集合。知識(shí)數(shù)據(jù)庫系統(tǒng)應(yīng)具備對(duì)知識(shí)的表示方法;對(duì)知識(shí)系統(tǒng)化的組織管理;知識(shí)庫的操作;庫的查詢與檢索;知識(shí)的獲取與學(xué)習(xí);知識(shí)的編輯; 庫的管理等功能。知識(shí)數(shù)據(jù)庫是人工智能技術(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合。
4、并行數(shù)據(jù)庫系統(tǒng)
并行數(shù)據(jù)庫系統(tǒng)是并行技術(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合,其發(fā)揮多處理機(jī)結(jié)構(gòu)的優(yōu)勢(shì),將數(shù)據(jù)庫在多個(gè)磁盤上分布存儲(chǔ),利用多個(gè)處理機(jī)對(duì)磁盤數(shù)據(jù)進(jìn)行并行處理,從而解決了磁盤“I/O”瓶頸問題,通過采用先進(jìn)的并行查詢技術(shù),開發(fā)查詢間并行、查詢內(nèi)并行以及操作內(nèi)并行,大大提高查詢效率。其目標(biāo)是提供一個(gè)高性能、高可用性、高擴(kuò)展性的數(shù)據(jù)庫管理系統(tǒng),而在性能價(jià)格比方面,較相應(yīng)大型機(jī)上的DBMS高得多。并行數(shù)據(jù)庫系統(tǒng)作為一個(gè)新興的方向,需要深入研究的問題還很多,但可以預(yù)見,由于并行數(shù)據(jù)庫系統(tǒng)可以充分地利用并行計(jì)算機(jī)強(qiáng)大的處理能力,必將成為并行計(jì)算機(jī)最重要的支撐軟件之一。
5、模糊數(shù)據(jù)庫系統(tǒng)
模糊數(shù)據(jù)庫是指能夠處理模糊數(shù)據(jù)的數(shù)據(jù)庫。模糊性是客觀世界的一個(gè)重要屬性,傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)描述和處理的是精確的或確定的客觀事物,但不能描述和處理模糊性和不完全性等概念,這是一個(gè)很大的不足,為此,開展模糊數(shù)據(jù)庫理論和實(shí)現(xiàn)技術(shù)的研究,其目標(biāo)是能夠存儲(chǔ)以各種形式表示的模糊數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)聯(lián)系、數(shù)據(jù)上的運(yùn)算和操作、對(duì)數(shù)據(jù)的約束(包括完整性和安全性)、用戶使用的數(shù)據(jù)庫窗口用戶視圖、數(shù)據(jù)的一致性和無冗余性的定義等都是模糊的,精確數(shù)據(jù)可以看成是模糊數(shù)據(jù)的特例;模糊數(shù)據(jù)庫系統(tǒng)是模糊技術(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合,由于理論和實(shí)現(xiàn)技術(shù)上的困難,模糊數(shù)據(jù)庫技術(shù)近年來發(fā)展不是很理想,但他已在模式識(shí)別、過程控制、案情偵破、醫(yī)療診斷、工程設(shè)計(jì)、營(yíng)養(yǎng)咨詢、公共服務(wù)以及專家系統(tǒng)等領(lǐng)域得到較好的應(yīng)用,顯示了廣闊的應(yīng)用前景。
數(shù)據(jù)庫系統(tǒng)發(fā)展到今天,其核心技術(shù)是依然是數(shù)據(jù)管理。隨著新應(yīng)用領(lǐng)域不斷涌現(xiàn),數(shù)據(jù)對(duì)象趨于多樣化,數(shù)據(jù)庫工作者也應(yīng)該不斷擴(kuò)寬數(shù)據(jù)庫的研究領(lǐng)域,在眾多新領(lǐng)域中勇敢地承擔(dān)起其中的數(shù)據(jù)管理研究開發(fā)任務(wù)。數(shù)據(jù)庫工作者應(yīng)該具有這樣的意識(shí),哪里有數(shù)據(jù),哪里有數(shù)據(jù)管理的任務(wù),哪里就有數(shù)據(jù)庫研究和開發(fā)的課題。面對(duì)新的挑戰(zhàn),我們要繼承數(shù)據(jù)庫技術(shù)和其他技術(shù)相結(jié)合的優(yōu)良傳統(tǒng),努力探索新的途徑、新的方法、新的技術(shù),來提高和改善對(duì)數(shù)據(jù)和信息的使用。
(作者單位:石家莊工程職業(yè)學(xué)院)