李紅育 李紹偉
(云南愛因森軟件職業(yè)學(xué)院 昆明 650000)
探討數(shù)據(jù)庫的歷史及發(fā)展趨勢
李紅育 李紹偉
(云南愛因森軟件職業(yè)學(xué)院 昆明 650000)
數(shù)據(jù)庫技術(shù)的發(fā)展,已經(jīng)成為信息技術(shù)的重要組成部分,是現(xiàn)代計算機(jī)信息系統(tǒng)和應(yīng)用系統(tǒng)的基礎(chǔ)和核心。但是,隨著時代的發(fā)展,以前的很多數(shù)據(jù)庫技術(shù)已經(jīng)越來越不能滿足市場的需要,各大數(shù)據(jù)庫巨頭公司都紛紛開始了新數(shù)據(jù)庫技術(shù)的研發(fā)。
數(shù)據(jù)庫 歷史 發(fā)展
數(shù)據(jù)庫(Databases,簡稱DB)是指長期保存在計算機(jī)的存儲設(shè)備上、并按照某種模型組織起來的、可以被各種用戶或應(yīng)用共享的數(shù)據(jù)的集合。數(shù)據(jù)庫管理系統(tǒng)(DatabaseManagementSystems,簡稱DBMS)是指提供各種數(shù)據(jù)管理服務(wù)的計算機(jī)軟件系統(tǒng),這種服務(wù)包括數(shù)據(jù)對象定義、數(shù)據(jù)存儲與備份、數(shù)據(jù)訪問與更新、數(shù)據(jù)統(tǒng)計與分析、數(shù)據(jù)安全保護(hù)、數(shù)據(jù)庫運行管理以及數(shù)據(jù)庫建立和維護(hù)等。由于企業(yè)信息化的目的就是要以現(xiàn)代信息技術(shù)為手段,對伴隨著企業(yè)生產(chǎn)和經(jīng)營過程而產(chǎn)生的數(shù)據(jù)進(jìn)行收集、加工、管理和利用,以改善企業(yè)生產(chǎn)經(jīng)營的整體效率,增強(qiáng)企業(yè)的競爭力。所以,數(shù)據(jù)庫是企業(yè)信息化不可缺少的工具,是絕大部分企業(yè)信息系統(tǒng)的核心。
數(shù)據(jù)庫技術(shù)的發(fā)展,已經(jīng)成為信息技術(shù)的重要組成部分,是現(xiàn)代計算機(jī)信息系統(tǒng)和計算機(jī)應(yīng)用系統(tǒng)的基礎(chǔ)和核心。數(shù)據(jù)庫技術(shù)最初產(chǎn)生于20世紀(jì)60年代中期,根據(jù)數(shù)據(jù)模型的發(fā)展,可以劃分為三個階段:第一代的網(wǎng)狀、層次數(shù)據(jù)庫系統(tǒng);第二代的關(guān)系數(shù)據(jù)庫系統(tǒng);第三代的以面向?qū)ο竽P蜑橹饕卣鞯臄?shù)據(jù)庫系統(tǒng)。
代表是1969年IBM公司研制的層次模型的數(shù)據(jù)庫管理系統(tǒng)IMS和70年代美國數(shù)據(jù)庫系統(tǒng)語言協(xié)商CODASYL下屬數(shù)據(jù)庫任務(wù)組DBTG提議的網(wǎng)狀模型。層次數(shù)據(jù)庫的數(shù)據(jù)模型是有根的定向有序樹,網(wǎng)狀模型對應(yīng)的是有向圖。這兩種數(shù)據(jù)庫奠定了現(xiàn)代數(shù)據(jù)庫發(fā)展的基礎(chǔ)。
主要特征是支持關(guān)系數(shù)據(jù)模型。關(guān)系模型具有以下特點:(1)關(guān)系模型的概念單一,實體和實體之間的聯(lián)系用關(guān)系來表示;(2)以關(guān)系數(shù)學(xué)為基礎(chǔ);(3)數(shù)據(jù)的物理存儲和存取路徑對用戶不透明;(4)關(guān)系數(shù)據(jù)庫語言是非過程化的。
產(chǎn)生于80年代,隨著科學(xué)技術(shù)的不斷進(jìn)步,各個行業(yè)領(lǐng)域?qū)?shù)據(jù)庫技術(shù)提出了更多的需求,關(guān)系型數(shù)據(jù)庫已經(jīng)不能完全滿足需求,于是產(chǎn)生了第三代數(shù)據(jù)庫。主要有以下特征:
(1)支持?jǐn)?shù)據(jù)管理、對象管理和知識管理;(2).保持和繼承了第二代數(shù)據(jù)庫系統(tǒng)的技術(shù);(3)對其它系統(tǒng)開放,支持?jǐn)?shù)據(jù)庫語言標(biāo)準(zhǔn),支持標(biāo)準(zhǔn)網(wǎng)絡(luò)協(xié)議,有良好的可移植性、可連接性、可擴(kuò)展性和互操作性等。第三代數(shù)據(jù)庫支持多種數(shù)據(jù)模型(比如關(guān)系模型和面向?qū)ο蟮哪P停?,并和諸多新技術(shù)相結(jié)合(比如分布處理技術(shù)、并行計算技術(shù)、人工智能技術(shù)、多媒體技術(shù)、模糊技術(shù)),廣泛應(yīng)用于多個領(lǐng)域(商業(yè)管理、GIS、計劃統(tǒng)計等),由此也衍生出多種新的數(shù)據(jù)庫技術(shù)。
為了能夠繼續(xù)在市場中立于不敗之地,各大數(shù)據(jù)庫巨頭公司紛紛推出其最新產(chǎn)品,數(shù)據(jù)庫市場競爭日益加劇。從最新的IDC報告顯示,在關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)軟件市場上,Oracle繼續(xù)領(lǐng)先對手IBM和微軟,但是微軟在2006年取得了更快的銷售增長率。根據(jù)對數(shù)據(jù)庫發(fā)展的技術(shù)趨勢不難看出,整個數(shù)據(jù)庫發(fā)展呈現(xiàn)出了六個主要特征:
IBM公司在它新推出的DB2 9版本中,直接把對XML的支持作為其新產(chǎn)品的最大賣點,號稱是業(yè)內(nèi)第一個同時支持關(guān)系型數(shù)據(jù)和XML數(shù)據(jù)的混合數(shù)據(jù)庫,無需重新定義XML數(shù)據(jù)的格式,或?qū)⑵渲糜跀?shù)據(jù)庫大型對象的前提下,IBM DB2 9允許用戶無縫管理普通關(guān)系數(shù)據(jù)和純XML數(shù)據(jù)。
對于傳統(tǒng)關(guān)系型數(shù)據(jù)與層次型數(shù)據(jù)的混合應(yīng)用已經(jīng)成為了新一代數(shù)據(jù)庫產(chǎn)品所不可或缺的特點。除了IBM,Oracle和微軟也同時宣傳了它們的產(chǎn)品也可以實現(xiàn)高性能XML存儲與查詢,使現(xiàn)有應(yīng)用更好的與XML共存。
為應(yīng)對日益加劇的商業(yè)競爭,企業(yè)不斷增加內(nèi)部IT及信息系統(tǒng),使企業(yè)的商業(yè)數(shù)據(jù)成幾何數(shù)量級不斷遞增,如何能夠從這些海量數(shù)據(jù)中獲取更多的信息,以便分析決策將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值,就成為目前數(shù)據(jù)庫廠商關(guān)注的焦點。各數(shù)據(jù)庫廠商在新推出的產(chǎn)品中,紛紛表示自己的產(chǎn)品在商業(yè)智能方面有很大提高。如:微軟最新版SQLServer2005就集成了完整的商業(yè)智能套件,包括數(shù)據(jù)倉庫數(shù)據(jù)分析、ETL工具、報表及數(shù)據(jù)挖掘等,并有針對性的做了一些優(yōu)化。如何更好的支持商業(yè)智能將是未來數(shù)據(jù)庫產(chǎn)品發(fā)展的主要趨勢之一。
SOA已經(jīng)成為目前IT業(yè)內(nèi)的一個大的發(fā)展趨勢,最初IBM和BEA是該理念的主要推動者,后來有越來越多的企業(yè)加入,開始宣稱支持SOA,其中包括Oracle,而微軟開始并不是非常贊同SOA的,但是,隨著時間的發(fā)展,目前國內(nèi)主流的數(shù)據(jù)庫廠商都開始宣稱他們的產(chǎn)品是完全支持SOA架構(gòu)的,包括微軟的SQLServer 2005,從微軟態(tài)度的轉(zhuǎn)變可以看出,未來IT業(yè)的發(fā)展與融合,SOA正在成長為一個主流的趨勢。
是行存儲還是列存儲,主要看如何應(yīng)用數(shù)據(jù)信息。以前數(shù)據(jù)庫都是以行的形式來存儲。理由很簡單,用戶需要的是對單條數(shù)據(jù)的讀取和存儲。而現(xiàn)在,單純的數(shù)據(jù)記錄已經(jīng)不足以支撐企業(yè)發(fā)展了,企業(yè)更需要的是數(shù)據(jù)分析和決策支持。那么,單純看一條記錄也就沒有了意義,而是要把所有數(shù)據(jù)的某一項都統(tǒng)計出來進(jìn)行分析,這就是“列”的概念。列存儲的出現(xiàn),實際上就是對數(shù)據(jù)分析需求的增多,而分析需求則一定是對某一個列的訪問。
所謂大的,主要是指企業(yè)級數(shù)據(jù)庫的規(guī)模。10年前,數(shù)據(jù)庫存儲的數(shù)據(jù)大都以GB為基準(zhǔn)衡量。而現(xiàn)在,僅僅廣東移動一個公司每個月新增的數(shù)據(jù)量就已經(jīng)用TB來衡量,相信不出3年,很多企業(yè)要存儲的數(shù)據(jù)就要達(dá)到PB級。數(shù)據(jù)量越來越大,需要更大的數(shù)據(jù)庫來做支撐,這就是數(shù)據(jù)庫的發(fā)展方向之一;
另一方面,數(shù)據(jù)庫又會越來越小。目前在國外的一款卡西歐手表中就帶有Sybase的數(shù)據(jù)庫。手表可以隨時記錄天氣情況、氣壓以及佩帶者的血壓、心跳、步頻等數(shù)據(jù),佩戴者還可以把這些數(shù)據(jù)下載到計算機(jī)上做簡單的分析,這種數(shù)據(jù)庫雖然并不要求數(shù)據(jù)存儲量大,但是要求在低計算量的情況下反應(yīng)快,而且能夠適應(yīng)外界環(huán)境的變化。小數(shù)據(jù)庫主要集中在移動數(shù)據(jù)庫領(lǐng)域,現(xiàn)有技術(shù)已經(jīng)能夠提供很好的支持。
數(shù)據(jù)倉庫就是面向主題的、集成的、不可更新的(穩(wěn)定性)、隨時間不斷變化(不同時間)的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程、數(shù)據(jù)倉庫中的數(shù)據(jù)面向主題,與傳統(tǒng)數(shù)據(jù)庫面向應(yīng)用相對應(yīng)。由于數(shù)據(jù)倉庫技術(shù)能夠在海量數(shù)據(jù)中快速提供科學(xué)的方法去整理數(shù)據(jù),從而從不同視角對企業(yè)的經(jīng)營管理提供精確分析與判斷,所以數(shù)據(jù)倉庫技術(shù)越來越受到企業(yè)的青睞和重視。
數(shù)據(jù)庫技術(shù)發(fā)展幾十年來,有些技術(shù)風(fēng)光一時,但終究被淘汰;有些技術(shù)則猶如“常青樹”一般,一直沿用至今。不管怎樣,所有的預(yù)測都只能是方向性的,有風(fēng)險的,各數(shù)據(jù)庫廠商彼此的理解也有著相當(dāng)?shù)牟町?。未來的?shù)據(jù)庫會如何發(fā)展,我們將拭目以待,但可以肯定的是它一定是最大地滿足用戶各種需求的。
[1]王 珊,陳 紅.數(shù)據(jù)庫系統(tǒng)原理教程[M].北京:清華大學(xué)出版社,2005.
[2]寧 洪,趙文濤,賈麗麗.數(shù)據(jù)庫系統(tǒng)原理[M].北京:北京郵電大學(xué)出版社,2005.
[3]http://dev.csdn.net/[EB/OL].
[4]http://bbs.study365.cn[EB/OL].
[5]http://www.javaeye.com[EB/OL].
Discussion on the History and DevelopmentTrendsof Database
LiHongyu LiShaowei
(Yunnan Einsun Software College Kunming 650000)
Database technology hasbecomean importantpartofmodern computer information systems.However,w ith the development of the times,many database technology has become increasingly unable to meet the needs of the market,the major database giant companies have started to the research and development on a new database technology.
Database History Development
TP311.13
B
100617-5432
李紅育,男,1983年生,云南昆明市,助教,研究方向:軟件工程。
李紹偉,男,1984年生,云南文山,助教,研究方向:網(wǎng)絡(luò)技術(shù)及軟件工程。