徐海東
隨著計(jì)算機(jī)應(yīng)用領(lǐng)域的不斷拓展和多媒體技術(shù)的發(fā)展,數(shù)據(jù)庫已是計(jì)算機(jī)科學(xué)技術(shù)中發(fā)展最快、應(yīng)用最廣泛的重要分支之一,數(shù)據(jù)庫技術(shù)的研究也取得了重大突破,他已成為計(jì)算機(jī)信息系統(tǒng)和計(jì)算機(jī)應(yīng)用系統(tǒng)的重要的技術(shù)基礎(chǔ)和支柱。
由于用戶應(yīng)用需求的提高、硬件技術(shù)的發(fā)展和Internet/Intranet提供的豐富多彩的多媒體交流方式,促進(jìn)了數(shù)據(jù)庫技術(shù)與網(wǎng)絡(luò)通信技術(shù)、人工智能技術(shù)、面向?qū)ο蟪绦蛟O(shè)計(jì)技術(shù)、并行計(jì)算技術(shù)等相互滲透,互相結(jié)合,成為當(dāng)前數(shù)據(jù)庫技術(shù)發(fā)展的主要特征,形成了數(shù)據(jù)庫新技術(shù)。
面向?qū)ο蟮姆椒ê图夹g(shù)對(duì)數(shù)據(jù)庫發(fā)展的影響最為深遠(yuǎn),起源于程序設(shè)計(jì)語言,把面向?qū)ο蟮南嚓P(guān)概念與程序設(shè)計(jì)技術(shù)相結(jié)合,是一種認(rèn)識(shí)事物和世界的方法論,他以客觀世界中一種穩(wěn)定的客觀存在實(shí)體對(duì)象為基本元素,并以“類”和“繼承”來表達(dá)事物間具有的共性和他們之間存在的內(nèi)在關(guān)系。
面向?qū)ο髷?shù)據(jù)庫系統(tǒng)將數(shù)據(jù)作為能自動(dòng)重新得到和共享的對(duì)象存儲(chǔ),包含在對(duì)象中的是完成每一項(xiàng)數(shù)據(jù)庫事務(wù)處理指令,這些對(duì)象可能包含不同類型的數(shù)據(jù),包括傳統(tǒng)的數(shù)據(jù)和處理過程,也包括聲音、圖形和視頻信號(hào),對(duì)象可以共享和重用。面向?qū)ο蟮臄?shù)據(jù)庫系統(tǒng)的這些特性通過重用和建立新的多媒體應(yīng)用能力使軟件開發(fā)變得容易,這些應(yīng)用可以將不同類型的數(shù)據(jù)結(jié)合起來。面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的好處是支持WWW應(yīng)用能力。
然而,面向?qū)ο蟮臄?shù)據(jù)庫是一項(xiàng)相對(duì)較新的技術(shù),尚缺乏理論支持,他可能在處理大量包含很多事務(wù)的數(shù)據(jù)方面比關(guān)系數(shù)據(jù)庫系統(tǒng)慢得多,但人們已經(jīng)開發(fā)了混合關(guān)系對(duì)象數(shù)據(jù)庫,這種數(shù)據(jù)庫將關(guān)系數(shù)據(jù)庫管理系統(tǒng)處理事務(wù)的能力與面向?qū)ο髷?shù)據(jù)庫系統(tǒng)處理復(fù)雜關(guān)系與新型數(shù)據(jù)的能力結(jié)合起來。
分布式數(shù)據(jù)庫系統(tǒng)是分布式技術(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合,在數(shù)據(jù)庫研究領(lǐng)域中已有多年的歷史和出現(xiàn)過一批支持分布數(shù)據(jù)管理的系統(tǒng),如SDD1系統(tǒng)、DINGRES系統(tǒng)和 POREL系統(tǒng)等。
從概念上講,分布式數(shù)據(jù)庫是物理上分散在計(jì)算機(jī)網(wǎng)絡(luò)各結(jié)點(diǎn)上,而邏輯上屬于同一個(gè)系統(tǒng)的數(shù)據(jù)集合。他具有數(shù)據(jù)的分布性和數(shù)據(jù)庫間的協(xié)調(diào)性兩大特點(diǎn)。系統(tǒng)強(qiáng)調(diào)結(jié)點(diǎn)的自治性而不強(qiáng)調(diào)系統(tǒng)的集中控制,且系統(tǒng)應(yīng)保持?jǐn)?shù)據(jù)的分布透明性,使應(yīng)用程序編寫時(shí)可完全不考慮數(shù)據(jù)的分布情況。
無疑分布式是計(jì)算機(jī)應(yīng)用的發(fā)展方向,也是數(shù)據(jù)庫技術(shù)應(yīng)用的實(shí)際需求,其技術(shù)基礎(chǔ)除計(jì)算機(jī)硬、軟件技術(shù)支持外,計(jì)算機(jī)通信與網(wǎng)絡(luò)技術(shù)當(dāng)然是其最重要的基礎(chǔ)。但分布式系統(tǒng)結(jié)構(gòu)、分布式數(shù)據(jù)庫由于其實(shí)現(xiàn)技術(shù)上的問題,當(dāng)前并沒有完全達(dá)到預(yù)期的目標(biāo),而客戶/服務(wù)器(Client/Server,C/S)體系結(jié)構(gòu)卻正在風(fēng)行,廣義的理解,C/S也是一種分布式結(jié)構(gòu),按照C/S結(jié)構(gòu),一個(gè)數(shù)據(jù)處理任務(wù)至少是分布在2個(gè)不同的部件上完成。
C/S結(jié)構(gòu)把任務(wù)分為2部分,一部分是由前端(Frontend,即Client)運(yùn)行應(yīng)用程序,提供用戶接口,而另一部分是由后端(Backend,即Server)提供特定服務(wù),包括數(shù)據(jù)庫或文件服務(wù)、通信服務(wù)等??蛻魴C(jī)通過遠(yuǎn)程調(diào)用或直接請(qǐng)求應(yīng)用程序提供服務(wù),服務(wù)器執(zhí)行所要求的功能后,將結(jié)果返回客戶機(jī),客戶機(jī)和服務(wù)器通過網(wǎng)絡(luò)來實(shí)現(xiàn)協(xié)同工作。C/S結(jié)構(gòu)具有性能優(yōu)越、保護(hù)投資、易于擴(kuò)展和保證數(shù)據(jù)完整性等優(yōu)點(diǎn)。
當(dāng)前,C/S技術(shù)日臻完善,客戶機(jī)與服務(wù)器允許有多種選擇,這樣計(jì)算機(jī)系統(tǒng)就可以實(shí)現(xiàn)橫向集成,即將來自不同廠家的、不同領(lǐng)域內(nèi)的最好的產(chǎn)品集成在一起,組成一個(gè)性能價(jià)格比最優(yōu)的系統(tǒng)。當(dāng)前已有多種數(shù)據(jù)庫產(chǎn)品支持C/S結(jié)構(gòu),其中Sybase是較典型的代表。
知識(shí)數(shù)據(jù)庫系統(tǒng)的功能是如何把由大量的事實(shí)、規(guī)則、概念組成的知識(shí)存儲(chǔ)起來,進(jìn)行管理,并向用戶提供方便快速的檢索、查詢手段。因此,知識(shí)數(shù)據(jù)庫可定義為:知識(shí)、經(jīng)驗(yàn)、規(guī)則和事實(shí)的集合。知識(shí)數(shù)據(jù)庫系統(tǒng)應(yīng)具備對(duì)知識(shí)的表示方法;對(duì)知識(shí)系統(tǒng)化的組織管理;知識(shí)庫的操作;庫的查詢與檢索;知識(shí)的獲取與學(xué)習(xí);知識(shí)的編輯;庫的管理等功能。知識(shí)數(shù)據(jù)庫是人工智能技術(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合。
模糊性是客觀世界的一個(gè)重要屬性,傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)描述和處理的是精確的或確定的客觀事物,但不能描述和處理模糊性和不完全性等概念,這是一個(gè)很大的不足,為此,開展模糊數(shù)據(jù)庫理論和實(shí)現(xiàn)技術(shù)的研究,其目標(biāo)是能夠存儲(chǔ)以各種形式表示的模糊數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)聯(lián)系、數(shù)據(jù)上的運(yùn)算和操作、對(duì)數(shù)據(jù)的約束(包括完整性和安全性)、用戶使用的數(shù)據(jù)庫窗口用戶視圖、數(shù)據(jù)的一致性和無冗余性的定義等都是模糊的,精確數(shù)據(jù)可以看成是模糊數(shù)據(jù)的特例;模糊數(shù)據(jù)庫系統(tǒng)是模糊技術(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合,由于理論和實(shí)現(xiàn)技術(shù)上的困難,模糊數(shù)據(jù)庫技術(shù)近年來發(fā)展不是很理想,但他已在模式識(shí)別、過程控制、案情偵破、醫(yī)療診斷、工程設(shè)計(jì)、營(yíng)養(yǎng)咨詢、公共服務(wù)以及專家系統(tǒng)等領(lǐng)域得到較好的應(yīng)用,顯示了廣闊的應(yīng)用前景。
工程數(shù)據(jù)庫是一種能存儲(chǔ)和管理各種工程圖形,并能為工程設(shè)計(jì)提供各種服務(wù)的數(shù)據(jù)庫。它適用于CAD/CAM、計(jì)算機(jī)集成制造(CIM)等通稱為CAX的工程應(yīng)用領(lǐng)域。工程數(shù)據(jù)庫針對(duì)工程應(yīng)用領(lǐng)域的需求,對(duì)工程對(duì)象進(jìn)行處理,并提供相應(yīng)的管理功能及良好的設(shè)計(jì)環(huán)境。
工程數(shù)據(jù)庫管理系統(tǒng)是用于支持工程數(shù)據(jù)庫的數(shù)據(jù)庫管理系統(tǒng)主要應(yīng)具有以下功能:(1)支持復(fù)雜多樣的工程數(shù)據(jù)的存儲(chǔ)和集成管理;(2)支持復(fù)雜對(duì)象(如圖形數(shù)據(jù))的表示和處理;(3)支持變長(zhǎng)結(jié)構(gòu)數(shù)據(jù)實(shí)體的處理;(4)支持多種工程應(yīng)用程序;(5) 支持模式的動(dòng)態(tài)修改和擴(kuò)展;(6)支持設(shè)計(jì)過程中多個(gè)不同數(shù)據(jù)庫版本的存儲(chǔ)和管理;(7)支持工程長(zhǎng)事務(wù)和嵌套事務(wù)的處理和恢復(fù);
在工程數(shù)據(jù)庫的設(shè)計(jì)過程中,由于傳統(tǒng)的數(shù)據(jù)模型難于滿足CAX應(yīng)用對(duì)數(shù)據(jù)模型的要求,需要運(yùn)用當(dāng)前數(shù)據(jù)庫研究中的一些新的模型技術(shù),如擴(kuò)展的關(guān)系模型、語義模型、面向?qū)ο蟮臄?shù)據(jù)模型。
統(tǒng)計(jì)數(shù)據(jù)是人類對(duì)現(xiàn)實(shí)社會(huì)各行各業(yè)、科技教育、國(guó)情國(guó)力的大量調(diào)查數(shù)據(jù)。采用數(shù)據(jù)庫技術(shù)實(shí)現(xiàn)對(duì)統(tǒng)計(jì)數(shù)據(jù)的管理,對(duì)于充分發(fā)揮統(tǒng)計(jì)信息的作用具有決定性的意義。統(tǒng)計(jì)數(shù)據(jù)庫是一種用來對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行存貯、統(tǒng)計(jì)(如求數(shù)據(jù)的平均值、最大值、最小值、總和等等)、分析的數(shù)據(jù)庫系統(tǒng)。多維性是統(tǒng)計(jì)數(shù)據(jù)的第一個(gè)特點(diǎn),也是最基本的特點(diǎn)。其次,統(tǒng)計(jì)數(shù)據(jù)是在一定時(shí)間(年度、月度、季度)期末產(chǎn)生大量數(shù)據(jù),故入庫時(shí)總是定時(shí)的大批量加載。經(jīng)過各種條件下的查詢以及一定的加工處理,通常又要輸出一系列結(jié)果報(bào)表。這就是統(tǒng)計(jì)數(shù)據(jù)的“大進(jìn)大出”特點(diǎn)。 統(tǒng)計(jì)數(shù)據(jù)的時(shí)間屬性是一個(gè)最基本的屬性,任何統(tǒng)計(jì)量都離不開時(shí)間因素,而且經(jīng)常需要研究時(shí)間序列值,所以統(tǒng)計(jì)數(shù)據(jù)又有時(shí)間向量性;第四,隨著用戶對(duì)所關(guān)心問題的觀察角度不同,統(tǒng)計(jì)數(shù)據(jù)查詢出來后常有轉(zhuǎn)置的要求。
對(duì)于廣大的數(shù)據(jù)庫用戶來講,主要有兩方面的要求:(1)希望得到自己所需要的數(shù)據(jù)或信息;(2)能夠方便地接受和使用這些數(shù)據(jù)或信息。前一類要求應(yīng)通過工程的硬、軟件環(huán)境支持和高質(zhì)量的數(shù)據(jù)庫設(shè)計(jì)來達(dá)到;后一類要求則應(yīng)為用戶提供良好的用戶界面和完善的應(yīng)用支持來達(dá)到。但值得注意的是,任何數(shù)據(jù)庫系統(tǒng)的建設(shè),其最根本的問題還是對(duì)應(yīng)用領(lǐng)域中基礎(chǔ)數(shù)據(jù)的識(shí)別與組織,如果做不到這一點(diǎn),是很難做出讓用戶滿意和認(rèn)可的數(shù)據(jù)庫系統(tǒng)的。因此,數(shù)據(jù)庫系統(tǒng)建設(shè)中的數(shù)據(jù)規(guī)劃、面向應(yīng)用領(lǐng)域的全面數(shù)據(jù)分析和全面數(shù)據(jù)庫設(shè)計(jì),將是系統(tǒng)建設(shè)中的頭等大事。
[1]張小平,馬垣,于淼.數(shù)據(jù)倉庫在高校教務(wù)系統(tǒng)的應(yīng)用研究[J].鞍山師范學(xué)院學(xué)報(bào),2003.
[2]高居泰,左映華,李晉宏.OLAP與數(shù)據(jù)挖掘一體化的研究與應(yīng)用[J].北方工業(yè)大學(xué)學(xué)報(bào),2005.
[3]吳少敏,馮建生.寶鋼數(shù)據(jù)挖掘系統(tǒng)[J].寶鋼技術(shù),2001.