劉汝元
摘 要:本文探討了在一建構完善的數(shù)據(jù)庫中,挖掘建立利用數(shù)據(jù)挖掘的技術,將其應用在知識管理上,以有助于組織出有用的信息。期望能夠妥善地管理其知識,使企業(yè)能夠更具競爭。
關鍵詞:知識管理;知識管理系統(tǒng);信息系統(tǒng);數(shù)據(jù)挖掘
一、引言
隨著時間的演進,以及生活水平的提升,造成人類經(jīng)濟活動歷經(jīng)三個時代:農(nóng)業(yè)時代、 工業(yè)時代以及信息時代,而工作也從原先的勞力密集,漸漸轉向以腦力密集的工作為主,尤其在現(xiàn)今的信息時代里,企業(yè)強調(diào)的是如何運用員工的智能與知識來創(chuàng)造新的利潤與維持競爭力。另外Peter Drucker(1993)在《后資本主義社會》中指出: 現(xiàn)今社會面臨最大的挑戰(zhàn)為“管理革命”,而這也是知識運用的第三次變動,而前兩次的變動分別是知識運用在工具、制程以及產(chǎn)品上,以及知識運用在工作上,而第三次變動則是對知識本身作最適當?shù)墓芾恚诖怂^的管理就是運用知識去找出既有知識最有效的運用方法。換言之,即將知識應用在有系統(tǒng)的創(chuàng)新Jeremy & Tony Hope(1997)兄弟在其所著的書中《Competing In the Third Wave》指出我們將從第二波的工業(yè)經(jīng)濟明顯地轉換到第三波以信息為基礎的經(jīng)濟,而信息經(jīng)濟的特性是:知識將成為企業(yè)最主要的原物料,科技將是分布式作業(yè)組織生產(chǎn)的最主要工具。在此信息經(jīng)濟的環(huán)境中,智慧資本將變成衡量一家企業(yè)價值最重要的指針。
此外,在今日軟件界的巨人微軟公司的總裁比爾蓋茲于1999 年所出的著作《數(shù)字神經(jīng)系統(tǒng)—與思想等快的明日世界》中,更是明確的指出在數(shù)字神經(jīng)系統(tǒng)里,一個最重要的關鍵要素就是鏈接企業(yè)的三大系統(tǒng)功能:即知識管理、 企業(yè)經(jīng)營和電子商務,以打造明日高效能的企業(yè)。而知識管理就是企業(yè)能通過所建構的數(shù)字神經(jīng)系統(tǒng),來管理企業(yè)信息的流動,讓需要者能獲得正確的資訊,并因此能快速地采取行動,做出最好的決策。另一方面,隨著信息科技的進步,人類對計算機的依賴程度越來越高,無論在決策的制定上,或是在數(shù)據(jù)的處理上,都必須有賴于計算機科技的協(xié)助與幫忙,甚至到現(xiàn)在,計算機已經(jīng)不再只是局限于做數(shù)據(jù)的倉儲或是做快速運算的工具,而是發(fā)展出具備人工智能的功能,以協(xié)助人類作更精準的判斷與決策。并且在這信息爆炸的時代里,獲得的數(shù)據(jù)數(shù)量相當龐大,若無適當?shù)墓芾砟J?,將會造成?shù)據(jù)泛濫,導致數(shù)據(jù)無法充分運用,而形成所謂的信息垃圾, 因此要如何將過多的數(shù)據(jù)做最好的管理與運用,便成為現(xiàn)今最熱門的研究課題,亦即要找出一種適當?shù)臄?shù)據(jù)挖掘模式應用在一個完善的數(shù)據(jù)庫之中。而數(shù)據(jù)挖掘的目的,乃希望能通過豐富的數(shù)據(jù)庫,來幫助人類作數(shù)據(jù)的歸類與分析動作,進而從中找出企業(yè)未知的現(xiàn)象及關系,讓管理者得以充分利用手邊的信息,來了解企業(yè)的問題,并提出改善及因應之道。而數(shù)據(jù)挖掘所面臨最主要的問題為如何在大量且多樣的數(shù)據(jù)中,找出特定的模式與資訊,以有助于使用者的決策分析。
二、數(shù)據(jù)挖掘方法簡介
依不同的學習方式,學習可以劃分成兩類(Quinlan,1986)。
(1)人工神經(jīng)網(wǎng)絡。數(shù)據(jù)挖掘的相關問題也可采用人工神經(jīng)學習的方式,以幫助發(fā)掘出有用的信息。人工神經(jīng)網(wǎng)絡的基本原理主要是利用重復學習的方式,將一連串例子交予學習,使其歸納出一個足以區(qū)分的模式,如此日后在后面對新的例證推導時,進行預測。(2)歸納學習。歸納學習的方式在數(shù)據(jù)挖掘的領域中受到廣泛的運用。包含樹狀分類法、關聯(lián)數(shù)據(jù)分析法與概念數(shù)導向歸納學習法。樹狀分類法為利用各個屬性值, 將數(shù)據(jù)庫中的數(shù)據(jù)予以適當?shù)姆诸悾瞥膳卸洹6谌蘸?,也可將新增的?shù)據(jù),依據(jù)判定樹的分類方式,來將其歸至所屬的類別之中,并依據(jù)判定樹來作出最適當?shù)姆治瞿P?。關聯(lián)數(shù)據(jù)分析法其目的在找出各種數(shù)據(jù)之間的關聯(lián)性,希望能由
數(shù)據(jù)庫中各種數(shù)據(jù)的分布情況,以了解其中彼此互動的關系。 包含交易數(shù)據(jù)之關聯(lián)規(guī)則(Agrawal, Ghosh, Imielinski, Iyer
and Swamik,1992)、 KID3(Piatesky-Shapiro ,1991)等。
數(shù)據(jù)挖掘分析方式與統(tǒng)計分析方式最大的差異在于數(shù)據(jù)分析型態(tài):數(shù)據(jù)挖掘方法所分析的數(shù)據(jù)型態(tài)為定量數(shù)據(jù)與定性數(shù)據(jù);而至于統(tǒng)計方法所分析的數(shù)據(jù)為定量數(shù)據(jù)。所謂定量數(shù)據(jù)(Quantitative)是指:數(shù)據(jù)是由眾多數(shù)值組合而成,且針對此類數(shù)據(jù)的處理方法,可采數(shù)值分析的方法來做;而至于定性數(shù)據(jù)(Qualitative)則是指:凡是不以數(shù)值來表示,僅以類別區(qū)分的數(shù)據(jù),則稱為定性數(shù)據(jù),又稱為類別數(shù)據(jù),如性別、教育程度等
總結:本研究希望通過上述的數(shù)據(jù)挖掘方法,研究知識管理系統(tǒng)的構建,并在此系統(tǒng)中引進數(shù)據(jù)挖掘技術。然而在此系統(tǒng)中最主要的目的在于希望能通過建構完善的知識庫,并通過人工智能方式來提供知識工作者建議,以使得知識工作者在自我學習上有所依據(jù)與參考,并有助于知識工作者的知識提取,甚至進一步能使組織朝向?qū)W習型組織發(fā)展,以強化組織的核心競爭力,使組織能夠在這變化快速的環(huán)境中立足。
參考文獻:
[1] 王建平.數(shù)據(jù)挖掘技術的發(fā)展與研究?[期刊論文].情報雜志2007(6)
[2] 韓客松,王永成.?文本挖掘數(shù)據(jù)挖掘和知識管理[J].情報學報,2001,(01):45-47.doi:10.3969/j.issn.1000-0135.2001.01.015.