[摘 要] 數(shù)據(jù)挖掘(Data Mining,DM)在應用于當前許多熱門領域的同時,也面臨著許多挑戰(zhàn),其中,數(shù)據(jù)挖掘集成與質(zhì)量管理問題越來越引起人們的關注。數(shù)據(jù)挖掘集成與質(zhì)量管理問題主要包括數(shù)據(jù)挖掘資源的利用率,即數(shù)據(jù)挖掘的資源配置,包括數(shù)據(jù)挖掘系統(tǒng)、數(shù)據(jù)倉庫系統(tǒng)和Web數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)挖掘集成(耦合問題);數(shù)據(jù)挖掘系統(tǒng)的質(zhì)量管理與評價,數(shù)據(jù)挖掘與軟件工程的相關理論、方法、工具等問題。本文闡述了數(shù)據(jù)挖掘系統(tǒng)的規(guī)范管理,說明了反規(guī)范方法在資源配置中的應用,以及合理應用數(shù)據(jù)挖掘資源耦合的重要意義。
[關鍵詞] 數(shù)據(jù)挖掘;耦合;資源配置;質(zhì)量管理
[中圖分類號]F270.7[文獻標識碼]A[文章編號]1673-0194(2008)18-0058-05
1 前 言
數(shù)據(jù)挖掘(Data Mining,DM)被應用于當前許多熱門的領域,出現(xiàn)了大量的商品化的數(shù)據(jù)挖掘系統(tǒng)。然而,數(shù)據(jù)挖掘仍然面臨著許多挑戰(zhàn),其中,數(shù)據(jù)挖掘集成與質(zhì)量標準化管理問題越來越成為具有挑戰(zhàn)性的任務。在數(shù)據(jù)挖掘應用的發(fā)展道路上,面對的挑戰(zhàn)至少包括兩點:其一,數(shù)據(jù)挖掘資源的利用率,即數(shù)據(jù)挖掘的資源配置,包括數(shù)據(jù)挖掘系統(tǒng)、數(shù)據(jù)倉庫系統(tǒng)和Web數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)挖掘集成(耦合問題);其二,數(shù)據(jù)挖掘系統(tǒng)的質(zhì)量管理與評價,數(shù)據(jù)挖掘與軟件工程的相關理論、方法、工具等問題。
耦合表示資源之間聯(lián)系的程度。數(shù)據(jù)挖掘的歷史相對較短但穩(wěn)步發(fā)展,新的數(shù)據(jù)挖掘系統(tǒng)每年都會在市場上出現(xiàn),新的功能、特性和可視化工具不斷地增加到相對穩(wěn)定的已有系統(tǒng)上,并且在朝著數(shù)據(jù)挖掘語言標準化和管理標準化的方向努力。很顯然,在今天浩如煙海的數(shù)據(jù)中“淘金”,僅靠人力是無法做到的。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。世界上最早的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘應用是NCR公司在1981年為世界最大的連鎖超市集團Wal-Mart建立的,最早將數(shù)據(jù)倉庫提升到理論高度進行分析并提出數(shù)據(jù)倉庫這個概念的是著名學者W. H. Inmon。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘是一個綜合的解決方案,主要用來幫助企業(yè)制定符合發(fā)展規(guī)律的相關決策。數(shù)據(jù)挖掘真正引起人們的普遍關注應該起始于該技術在各行業(yè)領域中的應用。近年來,數(shù)據(jù)挖掘技術在金融、電信、零售、醫(yī)療、科研等行業(yè)領域內(nèi)發(fā)揮了巨大的作用。DM不僅是面向特定數(shù)據(jù)庫的簡單檢索、查詢和調(diào)用,而且要對這些數(shù)據(jù)進行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,以指導實際問題的求解,試圖發(fā)現(xiàn)事件間的相互關聯(lián),甚至利用已有的數(shù)據(jù)對未來的活動進行預測。例如加拿大BC省電話公司要求加拿大Simon Fraser大學KDD研究組,根據(jù)其擁有的10多年的客戶數(shù)據(jù),總結(jié)、分析并提出新的電話收費和管理辦法,制定既有利于公司又有利于客戶的優(yōu)惠政策。美國NBA的教練利用IBM公司提供的數(shù)據(jù)挖掘技術臨場決定替換隊員一度在數(shù)據(jù)庫界被傳為佳話。除傳統(tǒng)的領域外,數(shù)據(jù)挖掘技術被廣泛應用于娛樂業(yè)、制造業(yè)等更為廣泛的領域,政府行政、康復、反垃圾郵件等帶有公益性色彩的事業(yè)也開始應用數(shù)據(jù)挖掘技術。
值得注意的是,數(shù)據(jù)挖掘技術的出現(xiàn),直接涉及技術與商務目的的互動,促進了將信息技術、管理和經(jīng)濟學融合的思考和研究。正是數(shù)據(jù)挖掘,前所未有地將技術人員和商務人員結(jié)合在一起。對于數(shù)據(jù)挖掘耦合的研究具有重要的意義:借助軟件工程、經(jīng)濟學的知識,研究數(shù)據(jù)挖掘資源的配置、耦合問題,實現(xiàn)交叉領域應用的突破;對于提高數(shù)據(jù)挖掘資源以及信息資源的利用效率具有重要的指導意義;對于管理信息系統(tǒng)以及數(shù)據(jù)倉庫結(jié)構(gòu)的設計和質(zhì)量評估具有重要的指導作用。
2 數(shù)據(jù)挖掘系統(tǒng)的管理
數(shù)據(jù)的質(zhì)量管理至關重要。低質(zhì)量的數(shù)據(jù)將影響企業(yè)經(jīng)營決策行為的正確性和時效性,低質(zhì)量的數(shù)據(jù)會使雇員對企業(yè)失去信心,顧客對錯誤的數(shù)據(jù)也是不能容忍的。而高質(zhì)量的數(shù)據(jù)可能會帶來新的顧客,提升數(shù)據(jù)倉庫的利用率和企業(yè)IT投資的回報率。大量的實例證明:在數(shù)據(jù)倉庫使用的過程中,最耗費精力和時間的是數(shù)據(jù)的檢查和清洗工作。
2. 1如何組織一個數(shù)據(jù)挖掘項目
數(shù)據(jù)挖掘的項目可以說和商業(yè)智能、數(shù)據(jù)倉庫有著千絲萬縷的聯(lián)系,為了加強質(zhì)量管理,有必要做好以下幾方面的事情:
(1)設計數(shù)據(jù)質(zhì)量管理系統(tǒng)的解決方案。
(2)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題。開發(fā)和測試數(shù)據(jù)質(zhì)量管理程序,設計異常處理程序。通過測試,列出常見的數(shù)據(jù)質(zhì)量問題,分析問題,把問題上報相關的領導。
(3)建立質(zhì)量管理組織,使質(zhì)量管理工作得到領導的支持。
(4)加強質(zhì)量管理的培訓。
(5)確定數(shù)據(jù)質(zhì)量管理項目成功的標準。
(6)分析數(shù)據(jù)的質(zhì)量。
(7)數(shù)據(jù)倉庫系統(tǒng)的開發(fā)方法。
數(shù)據(jù)倉庫系統(tǒng)的實現(xiàn)過程是:數(shù)據(jù)收集,數(shù)據(jù)集成,檢驗數(shù)據(jù)的偏差,設計決策支持系統(tǒng)DSS,分析結(jié)果,理解需求。
2. 2提高數(shù)據(jù)挖掘質(zhì)量管理的成熟能力
在軟件成熟能力度集成模型CMMI中,從過程管理、項目管理、工程、支持等方面劃分建立了關鍵過程域,如表1所示。
在面向數(shù)據(jù)挖掘的項目開發(fā)和應用中,需要針對數(shù)據(jù)挖掘的環(huán)境,在進行需求定義與系統(tǒng)的設計時,盡量與數(shù)據(jù)倉庫和挖掘工具形成緊密耦合。一方面,合理地利用資源,集成資源;另一方面,借助于數(shù)據(jù)挖掘的環(huán)境,提高服務于決策的能力。本文主要討論針對數(shù)據(jù)倉庫、數(shù)據(jù)挖掘的信息系統(tǒng)如何管理。在成熟能力度模型的應用進程中,關鍵過程域的應用需要賦予其新的內(nèi)涵。使用CMMI的重要價值不僅體現(xiàn)在關鍵過程域的應用上,更主要體現(xiàn)在提高可視化及通過度量與控制更好地滿足用戶要求。隨著研究對象與文檔的規(guī)范化程度的提高,從1級到5級信息系統(tǒng)的透明度會隨之增加。
在“組織級過程定義”的關鍵過程域中定義數(shù)據(jù)倉庫的開發(fā)過程,并將其鑲嵌在系統(tǒng)的開發(fā)周期中。其中,數(shù)據(jù)倉庫建設包括:實現(xiàn)數(shù)據(jù)倉庫、集成數(shù)據(jù)、檢驗偏差、編程、設計DSS系統(tǒng)、分析結(jié)果、理解設計需求。在此基礎上定義項目的需求。將上述數(shù)據(jù)倉庫變化內(nèi)容和“需求管理”、“需求技術”、“決策分析和解決方案”的關鍵過程域結(jié)合。
具體地說,傳統(tǒng)的系統(tǒng)開發(fā)往往是從需求開始的,然后進入設計和實施階段。而數(shù)據(jù)倉庫的建立過程不是這樣的,它的需求需要經(jīng)過數(shù)據(jù)分析后才能明確。也就是說,對于DSS(決策支持系統(tǒng)),首先,從數(shù)據(jù)和數(shù)據(jù)集成開始,經(jīng)過數(shù)據(jù)檢驗、編寫程序、分析運行結(jié)果,在此基礎上,建立系統(tǒng)需求。也就是說,在需求定義時,需要經(jīng)過不斷的反復,結(jié)合數(shù)據(jù)倉庫的技術和應用環(huán)境,反映在“組織級過程定義”的關鍵過程域。
集成管理在數(shù)據(jù)挖掘系統(tǒng)中占有重要的地位,包括數(shù)據(jù)、程序、系統(tǒng)平臺、數(shù)據(jù)庫或數(shù)據(jù)倉庫甚至網(wǎng)上資源的集成和共享,同時,包括資源的一致性、整合以及異構(gòu)數(shù)據(jù)庫的集成質(zhì)量管理和評價,并結(jié)合“組織級集成環(huán)境”、“集成化項目管理”等關鍵過程域的應用過程。
從1級到5級的另一個重要改進就是預測能力逐步提高。就像測量血壓、肝功等指標對人們的作用,度量的作用非同小可。在質(zhì)量的階梯上,是重復級即“2級”使系統(tǒng)擺脫了混沌,
測試和分析的“4級”使系統(tǒng)進入了定量管理。我們不妨追溯質(zhì)量的定義“穩(wěn)定地滿足用戶的需要”,是否穩(wěn)定?如何控制穩(wěn)定?當從傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)發(fā)展邁向數(shù)據(jù)挖掘系統(tǒng)時,測量系統(tǒng)質(zhì)量的指標體系需要隨之調(diào)整,其中,測量關鍵過程域的主要內(nèi)容如圖1所示。
一般地,管理者希望把積累多年的數(shù)據(jù)形成一張企業(yè)報表,但一方面,為了形成這樣一張表可能會花費很大費用;另一方面,每次查詢付出的代價較大,但只是一次性使用或再利用,這些形成的報表利用率不高。由此可以看
出,傳統(tǒng)的數(shù)據(jù)庫技術已無法滿足人們的需求,為此,數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、OLAP技術應運而生。商務智能就是由數(shù)據(jù)倉庫、聯(lián)機分析處理(On Line Analytical Processing,OLAP)和數(shù)據(jù)挖掘3種信息技術應用于商務活動后形成的一組信息技術的應用技術,如圖2所示。
3 反規(guī)范處理與數(shù)據(jù)挖掘耦合設計
信息經(jīng)濟學是信息科學與經(jīng)濟科學相結(jié)合的產(chǎn)物。信息資源是與物質(zhì)資源和能源并列的人類社會活動中重要的經(jīng)濟資源。在21世紀的今天,人們已經(jīng)接受“知識就是力量”、“科學技術是第一生產(chǎn)力”等觀念。原西方經(jīng)濟學,將勞動力、資本和土地視為企業(yè)生產(chǎn)不可或缺的三大生產(chǎn)要素。隨著市場競爭的加劇以及新技術的迅速發(fā)展,決策、創(chuàng)新活動以及知識性勞動在企業(yè)追求利潤和資本保值的進程中的作用日漸突出,產(chǎn)生了第四、第五生產(chǎn)要素即“企業(yè)家的才能”和“知識”。勞動者智慧與知識的運用能力的貢獻將日益超過體力。所謂知識經(jīng)濟,是以知識為基礎的經(jīng)濟。在知識經(jīng)濟時代,其他資源依然稀缺,但知識相對豐富并且可以共享,對知識的投資甚至會出現(xiàn)“邊際收益遞增”,但前提條件是對數(shù)據(jù)的有效配置、管理和利用。“資源配置的經(jīng)濟性”應該是數(shù)據(jù)挖掘系統(tǒng)設計中的重要指標。具體地講,即數(shù)據(jù)挖掘系統(tǒng)與原有系統(tǒng)資源的集成問題。這里借用了一個名詞——“耦合”。在許多領域里用到耦合的概念。“耦合”是指兩個實體相互依賴于對方的一個量度。計算機系統(tǒng)模塊設計的耦合度是對模塊之間相互依賴性大小的度量,耦合度越小,模塊的相對獨立性越大。
3. 1經(jīng)濟學的次優(yōu)理論與資源配置設計
配置是信息資源管理的重要問題,而配置問題的核心是對資源配置方式的設計和評價,在數(shù)據(jù)挖掘系統(tǒng)中,具體表現(xiàn)為對數(shù)據(jù)倉庫的設計和評價。配置(configuration)一詞在信息管理和經(jīng)濟學研究中均占有特殊重要的位置。其中,資源合理配置是經(jīng)濟學最主要的研究目標。配置一詞在計算機領域已有廣泛的應用。所謂“計算機系統(tǒng)配置”是指計算機系統(tǒng)或計算機部件按其組成的零件數(shù)量、性質(zhì)及相互聯(lián)系所確定的安排。軟件配置的含意與之有一些差別。軟件開發(fā)過程中的變更以及相應的返工會對產(chǎn)品的質(zhì)量造成很大的影響。如果不從配置管理方面加以控制,必將導致嚴重的后果。軟件配置管理的一個重要內(nèi)容就是對變更加以控制,軟件配置管理主要是對軟件生存期間的各種階段產(chǎn)品和最終產(chǎn)品演化和變更的管理,它是軟件質(zhì)量管理的重要組成部分。它的兩個關鍵點是:標識和變更控制。
3. 1. 1經(jīng)濟學中的次優(yōu)理論
自20世紀90 年代中期以來,許多國家對信息資源配置問題給予了高度重視。這里,暫不討論相關政策的制定,僅關注和分析一下相關經(jīng)濟學理論對數(shù)據(jù)資源設計實踐的啟迪和指導意義。在傳統(tǒng)的資源配置研究方面,亞當·斯密(Adam Smith)很早就提出了“看不見的手”這一命題,他的理論體系認為市場配置的動力是那只“看不見的手”,也就是這樣的理論說明只要每一個人都從利己的目的出發(fā),而最終全社會達到利他的結(jié)果。我們不妨重溫一下《國富論》中的一段名言:“通過追求(個人的)自身利益,他常常會比實際上想做的那樣更有效地促進社會利益?!倍院蟮募{什均衡引出了“看不見的手”理論的一個悖論,動搖了西方經(jīng)濟學的基石,是對亞當·斯密的“看不見的手”的原理的一個挑戰(zhàn)。著名的“囚徒困境”案例有著深刻的意義。“囚徒困境”案例說明個人理性與集體理性的沖突,個人追求自身利益導致的最終結(jié)局是對所有人都不利。可以說,“合作”是有利于己策略,并且,這種合作的前提是:按照你愿意別人對待的你的方式對待別人,但只有他們也以同樣方式行事才行!納什均衡理論是對經(jīng)濟理論的大發(fā)展。帕累托最優(yōu)(Pareto optimum)是指資源配置的任何改變都不可能在不使別人的境況變壞的情況下使一個人的境況變好。如果資源配置達到帕累托最優(yōu)狀態(tài),這表明在技術、消費者偏好、收入分配等條件給定時,資源配置達到最高效率,帕累托最優(yōu)的狀態(tài)為完全競爭條件下的一般均衡。
帕累托最優(yōu)的實現(xiàn)前提是完全競爭市場,而完全競爭的市場經(jīng)濟是一個理想化的經(jīng)濟模型,而現(xiàn)實存在的經(jīng)濟體系不是完全競爭環(huán)境。因此,在現(xiàn)實經(jīng)濟生活中,帕累托最優(yōu)狀態(tài)是難以到達的。所以,在20世紀50年代,一些西方福利經(jīng)濟學家提出了所謂次優(yōu)理論(theory of the second best),次優(yōu)理論不是追求達到帕累托最優(yōu),而是達到次優(yōu)狀態(tài)。在數(shù)據(jù)倉庫的設計中,反規(guī)范處理可以看作是提高生產(chǎn)效率的次優(yōu)設計的具體應用。
3. 1. 2次優(yōu)理論與數(shù)據(jù)庫的反規(guī)范處理
數(shù)據(jù)庫的規(guī)范化處理是將一些復雜的、依賴的大表分解成若干個內(nèi)容簡潔、關系清楚的小表。數(shù)據(jù)以二維表形式存儲,并遵循“一事一地”的原則,對數(shù)據(jù)表進行規(guī)范化。規(guī)范化的過程是將表逐步分解,將一個復雜的、冗余度較高的大表分解成為若干個內(nèi)容簡潔、鏈接清楚的小表。如果一個關系滿足某一個指定的約束集,則稱它屬于某種特定的范式。按照規(guī)范的程度不同,數(shù)據(jù)庫規(guī)范化分為:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BCNF以及第四范式(4NF)等。
但在查詢過程中,往往感到這些完全規(guī)范化后的小表不實用。查詢時,涉及大量的小表間關聯(lián)的操作,對CPU運算和數(shù)據(jù)庫存儲造成很大的壓力。如果從經(jīng)濟的角度出發(fā),完全嚴格的規(guī)范化設計不一定是合適的方案,需要進行“反規(guī)范處理”?!胺匆?guī)范化”處理包括表格合并、數(shù)據(jù)冗余、分解表格等方法。在關系型數(shù)據(jù)庫的設計中,為了減少數(shù)據(jù)的混亂、冗余、過分依賴,為了便于鏈接和維護,在此基礎上,為了便于實際操作,尤其是為了適合大規(guī)模的數(shù)據(jù)查詢,需要進行必要的反規(guī)范處理,以適當犧牲存儲空間為代價,促進系統(tǒng)整體能力的提升。反規(guī)范處理可以包括適當設置數(shù)據(jù)冗余、表格合并、對表格在原規(guī)范化的基礎上進一步分解等措施。
3. 1. 3反規(guī)范處理的例子
例1適當設置數(shù)據(jù)冗余,提高查詢效率
數(shù)據(jù)流程圖舉例。某單位新建就餐卡自動化售餐系統(tǒng)來替代用飯票的手工方式。在該系統(tǒng)中對就餐的職工建立就餐卡管理文件。該系統(tǒng)具有如下功能:①就餐卡申請功能:申請者填寫申請表送系統(tǒng)處理,系統(tǒng)核實申請者為本單位職工后,在就餐卡管理文件中填寫一條記錄,發(fā)給申請者一張就餐卡。②存款功能:新的就餐者在使用就餐卡前須在卡上存入一定數(shù)量的錢。老的就餐者在卡上的錢用完以前也須續(xù)存。存款時就餐者將卡和錢交由管理人員輸入系統(tǒng),系統(tǒng)根據(jù)卡號,將存款數(shù)加到就餐卡管理文件中。③購餐功能:購餐時就餐者將卡插入售餐窗口上的讀卡機,系統(tǒng)根據(jù)卡上的卡號從就餐管理文件上減去所用金額。當卡上的錢數(shù)不夠時,不讓購餐。④對賬功能:當就餐者要求時,可根據(jù)卡號打印該月的就餐者存款和購餐的對賬單,其格式為:
數(shù)據(jù)流程圖描述如圖3所示。
第一步:文件規(guī)范化。文件規(guī)范后,形成的第三范式的文件見表2。
第二步:反規(guī)范處理。鑒于用戶在明細查詢中經(jīng)常查詢到姓名,為了減少文件的訪問次數(shù)和鏈接的處理,在明細文件中添加“姓名”進行反規(guī)范處理,見表3。
例2學生數(shù)據(jù)庫的反規(guī)范處理
第一步:文件規(guī)范化。文件規(guī)范后,形成的第三范式的文件見表4。
第二步:反規(guī)范處理。在成績文件中添加“姓名”、“課程名”,便于成績查詢時減少文件鏈接的次數(shù)和時間,見表5。
例3表格分解處理
反規(guī)范的另一個措施,是在訪問率相差懸殊時,對表格在原規(guī)范化的基礎上進一步分解,表6給出了一個例子。賬號和余額是經(jīng)常用到的,為了提高I /O效率,將表格進一步分解,把經(jīng)常被訪問的數(shù)據(jù)放在一起。
3. 2提高系統(tǒng)設計的耦合程度
按照數(shù)據(jù)挖掘系統(tǒng)(DM)和數(shù)據(jù)倉庫/數(shù)據(jù)庫(DW/DB)耦合程度,耦合可分成以下幾種形式:緊密耦合、半緊密耦合、松散耦合和無耦合,具體說明如下:
(1)緊密耦合(tight coupling)是將數(shù)據(jù)挖掘子系統(tǒng)視為信息系統(tǒng)的一個功能組件。數(shù)據(jù)挖掘查詢功能根據(jù)DB或DW系統(tǒng)的挖掘查詢分析、數(shù)據(jù)結(jié)構(gòu)、索引模式和查詢處理方法優(yōu)化。緊密耦合意味著DM系統(tǒng)平滑地集成到DB/DW系統(tǒng)中。
(2)松散耦合(loose coupling)與半緊密耦合(semi tight coupling)是指DM系統(tǒng)連接到DB/DW,從DB/DW中提取數(shù)據(jù),有些基本數(shù)據(jù)挖掘原語(通過分析頻繁遇到的數(shù)據(jù)挖掘功能確定)由DB/DW提供。這些原語包括排序、索引、聚集、直方圖分析、多路連接等統(tǒng)計度量功能。
(3)無耦合(no coupling)是指在數(shù)據(jù)挖掘系統(tǒng)(DW)中沒有利用數(shù)據(jù)庫/數(shù)據(jù)倉庫(DB或DW)的任何功能,它的數(shù)據(jù)處理是通過特定的數(shù)據(jù)來源如文件進行的。在這種方式下,DB/DW提供的很好的資源沒有得到充分的利用。
可以看出:數(shù)據(jù)挖掘系統(tǒng)與DB/DW系統(tǒng)實現(xiàn)某種耦合至關重要。一方面,從質(zhì)量管理方面考慮,應提高信息一致性、規(guī)范性處理以及集成處理的能力即成熟能力;另一方面,從經(jīng)濟上,應避免資源混亂和浪費,合理地配置資源,提高資源的共享和整合能力。所以,提高數(shù)據(jù)挖掘系統(tǒng)與DB/DW系統(tǒng)的耦合度具有重要的管理意義和經(jīng)濟意義。
綜上所述,數(shù)據(jù)挖掘能夠使決策者們獲取及時準確的信息,以理解商務活動并做出智能化的、更有效的決策,即從海量的數(shù)據(jù)中提取有用的信息并轉(zhuǎn)化為商務知識。針對數(shù)據(jù)庫到數(shù)據(jù)挖掘技術的轉(zhuǎn)化,需要在經(jīng)濟上、管理上進行必要的策劃和調(diào)整。首先,從經(jīng)濟上考慮,通過提高系統(tǒng)耦合度,提高資源的共享程度;通過反規(guī)范化處理,提高查詢的效率。在質(zhì)量管理方面,針對數(shù)據(jù)倉庫的特點,調(diào)整管理對象和集成管理的對象,仍然以規(guī)范化、集成化、定量化管理為主線,強化資源配置的意識,借助經(jīng)濟、管理、質(zhì)量管理的知識體系,為數(shù)據(jù)挖掘信息系統(tǒng)的質(zhì)量管理提供策略。
主要參考文獻
[1] 楊一平,馬慧. 管理信息系統(tǒng)[M]. 北京:經(jīng)濟科學出版社,2006.
[2] 池太崴. 數(shù)據(jù)倉庫結(jié)構(gòu)設計與實施——建造信息系統(tǒng)的金字塔[M]. 北京:電子工業(yè)出版社,2005.
[3] 袁玉波. 數(shù)據(jù)挖掘與最優(yōu)化技術及其應用[M]. 北京:科學出版社,2007.