劉璐璐
(中州大學(xué)國(guó)資處,鄭州450044)
近年來,隨著我校北校區(qū)的大力建設(shè)和硬件設(shè)施的不斷完善及師生人數(shù)的不斷增加,固定資產(chǎn)和低值易耗品的購(gòu)入數(shù)量與使用頻率隨之增多,設(shè)備檔案資料的種類也在不斷增多,例如:固定資產(chǎn)種類和數(shù)目的不斷增長(zhǎng)和調(diào)整,使得資產(chǎn)賬目信息需要大量錄入與輸出,后期相關(guān)數(shù)據(jù)的保存難度和工作量都會(huì)隨之加大。要想進(jìn)一步提高檔案管理的工作效率,就得從原有的純手工檔案資料管理方式上有所突破,這就要求設(shè)備的管理模式不能局限于手工管理模式,要與現(xiàn)代化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)管理模式相結(jié)合。
與傳統(tǒng)的檔案管理方式不同,高校設(shè)備檔案具有使用范圍廣、次數(shù)多、使用者要求高的特點(diǎn)。隨著近些年學(xué)校設(shè)備的不斷引進(jìn)及設(shè)備資料的不斷增多,包括收集、整理、歸納等。傳統(tǒng)檔案管理是手工管理模式,管理方式已經(jīng)無法滿足現(xiàn)行工作需求,我們目前需要一個(gè)確實(shí)可行的技術(shù)方法——數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘技術(shù)從定義上講就是從大量的不完整的模糊的數(shù)據(jù)中提取信息的一種方法?;镜姆椒ㄓ?①關(guān)聯(lián)分析法。它是從統(tǒng)計(jì)學(xué)的角度出發(fā),指在從給定的數(shù)據(jù)集或者數(shù)據(jù)庫(kù)中發(fā)現(xiàn)頻繁出現(xiàn)的那部分項(xiàng)或者集合,從而分析這部分?jǐn)?shù)據(jù)集合的特征和性質(zhì)。例如,某電子市場(chǎng)通過關(guān)聯(lián)分析,找出了若干個(gè)用戶在購(gòu)買所需電子產(chǎn)品時(shí),所需或者偏好購(gòu)買的品牌電子產(chǎn)品,進(jìn)而反映出這部分用戶的購(gòu)買習(xí)慣。②序列模式分析法。它比關(guān)聯(lián)分析法能更進(jìn)一步解釋數(shù)據(jù)集合的特征。它是指在一組有序的集合中,頻繁出現(xiàn)的那部分集合按一定順序重新組合構(gòu)成的模式。例如:計(jì)算超市購(gòu)物中被共同購(gòu)買的商品,它把每個(gè)顧客的一次交易視作一個(gè)Transaction,計(jì)算在不同Transaction中不同Item組合的規(guī)律性。而如果我們考慮一個(gè)用戶多次在超市購(gòu)物的情況,那么這些不同時(shí)間點(diǎn)的交易記錄就構(gòu)成了一個(gè)購(gòu)買序列,N個(gè)用戶的購(gòu)買序列就組成一個(gè)規(guī)模為N的序列數(shù)據(jù)集。③分類分析法。將有關(guān)數(shù)據(jù)信息通過一定方式進(jìn)行分類的方法。例如:學(xué)??梢愿鶕?jù)學(xué)生的學(xué)習(xí)基礎(chǔ)、掌握知識(shí)情況和分?jǐn)?shù)情況,對(duì)其進(jìn)行層次分劃。④聚類分析法。從表面意義上講就是從分析過的數(shù)據(jù)信息中再次進(jìn)行細(xì)致的加工分析方法。在學(xué)校里,可以通過學(xué)生的基礎(chǔ)信息數(shù)據(jù)將所有學(xué)生信息分組,并對(duì)所有學(xué)生的學(xué)習(xí)模式進(jìn)行描述,找出他們的特征,進(jìn)而幫助教師制定有計(jì)劃和針對(duì)性的授課方案。⑤孤立點(diǎn)分析法。孤立點(diǎn)是所有數(shù)據(jù)信息中出現(xiàn)故障或排斥的信息點(diǎn)或信息段。孤立點(diǎn)分析法廣泛應(yīng)用于銀行、金融業(yè)、電信部門和企業(yè)的經(jīng)營(yíng)管理等。例如:銀行可以利用孤立點(diǎn)分析發(fā)現(xiàn)銀行卡信息詐騙、銀行卡或信用卡丟失等。
當(dāng)今的高校設(shè)備檔案管理模式既是對(duì)設(shè)備檔案的管理,也是對(duì)其數(shù)據(jù)信息的數(shù)字化統(tǒng)計(jì)過程。它不僅從表面上實(shí)現(xiàn)了檔案的靜態(tài)模式管理,更實(shí)現(xiàn)了其數(shù)字信息不斷更新的動(dòng)態(tài)管理,從而對(duì)檔案管理員的效率也是個(gè)提高。設(shè)備檔案管理系統(tǒng)模式的建立使檔案的錄入和查閱工作變得更加方便和快捷。以傳統(tǒng)手工整理模式進(jìn)而轉(zhuǎn)變?yōu)楦摺?zhǔn)、快的數(shù)字化錄入模式,使資產(chǎn)管理人員及時(shí)了解學(xué)校設(shè)備的信息,真正實(shí)現(xiàn)了錄入、編輯、修改等功能,達(dá)到了方便高效的管理目標(biāo)。
1.設(shè)備檔案的分類
設(shè)備檔案分類是將單位所有固定資產(chǎn)和低值易耗品所建立的檔案分成不同的種類,從橫向來說每一類里的檔案具有相似的屬性,從縱向來說不同類別里的檔案的屬性是不同的。數(shù)據(jù)挖掘可以幫助從事設(shè)備檔案管理的人員細(xì)致而準(zhǔn)確地將所屬檔案進(jìn)行分類。例如:數(shù)據(jù)挖掘可將檔案按照屬性類別進(jìn)行排序,從而提高檔案管理員的檢索效率。
2.設(shè)備檔案的收集工作
首先對(duì)各設(shè)備數(shù)據(jù)的基本信息進(jìn)行分析,建立一個(gè)已知的數(shù)據(jù)集模型,對(duì)每一個(gè)要測(cè)試的樣本,用已知的與預(yù)測(cè)的類別進(jìn)行比較,若一個(gè)模型的準(zhǔn)確率經(jīng)測(cè)試被認(rèn)可,則就可以用這個(gè)模型對(duì)未知對(duì)象進(jìn)行具體的分類。例如,設(shè)備檔案管理員對(duì)全校在編教師筆記本的領(lǐng)用情況進(jìn)行書面統(tǒng)計(jì),并將統(tǒng)計(jì)結(jié)果錄入數(shù)據(jù)庫(kù)中。這些信息包括姓名、年齡、性別、職稱、職務(wù)、學(xué)歷層次、所屬學(xué)院(部門)、領(lǐng)用時(shí)間、筆記本型號(hào)等。當(dāng)一個(gè)教師的信息被輸入到數(shù)據(jù)庫(kù)中時(shí),該教師與其他新進(jìn)教師的檔案屬性相匹配后,其他所有新進(jìn)教職工的信息屬性隨之自然分類。
3.設(shè)備檔案的保管工作
設(shè)備檔案的保管核心工作,是保管好新設(shè)備檔案的同時(shí)防止舊設(shè)備檔案流失的過程。對(duì)學(xué)校這樣一個(gè)特殊群體,其設(shè)備檔案在保管過程中,除了正常的手工保管紙質(zhì)文件要在通風(fēng)干燥的環(huán)境下保存,還要在檔案數(shù)據(jù)庫(kù)中建立一個(gè)完整的備份系統(tǒng),在這個(gè)系統(tǒng)里要建立好相關(guān)的網(wǎng)絡(luò)保護(hù)措施,防止外界的病毒侵入,造成整個(gè)設(shè)備檔案軟件系統(tǒng)癱瘓。
4.協(xié)助配合資產(chǎn)使用部門搞好服務(wù)工作
設(shè)備檔案信息是為檔案利用人員服務(wù)的,不同單位不同部門的利用人員對(duì)檔案的需求和利用程度不同,數(shù)據(jù)挖掘技術(shù)針對(duì)不同人員對(duì)設(shè)備檔案的不同需求,設(shè)定不同的屬性值和分類情況,為他們提供最優(yōu)的檢索結(jié)果,為國(guó)有資產(chǎn)管理部門的主動(dòng)服務(wù)提供可靠保證。例如:兩個(gè)不同的部門查找同一設(shè)備的不同檢索信息,分別輸入設(shè)備的兩個(gè)不同屬性,結(jié)果顯示出的結(jié)果是兩個(gè)部門所需的不同檢索結(jié)果。
數(shù)據(jù)挖掘技術(shù)的工作過程分為:數(shù)據(jù)的抽取、數(shù)據(jù)的存儲(chǔ)和管理、數(shù)據(jù)的展現(xiàn)等關(guān)鍵技術(shù)。
1.數(shù)據(jù)的抽取
數(shù)據(jù)的抽取是數(shù)據(jù)進(jìn)入倉(cāng)庫(kù)的入口。由于數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)獨(dú)立的數(shù)據(jù)環(huán)境,它需要通過抽取過程將數(shù)據(jù)從聯(lián)機(jī)事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源、脫機(jī)的數(shù)據(jù)存儲(chǔ)介質(zhì)中導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)抽取在技術(shù)上主要涉及互連、復(fù)制、增量、轉(zhuǎn)換、調(diào)度和監(jiān)控等幾個(gè)方面的處理。在數(shù)據(jù)抽取方面,未來的技術(shù)發(fā)展將集中在系統(tǒng)功能集成化方面,以適應(yīng)數(shù)據(jù)倉(cāng)庫(kù)本身或數(shù)據(jù)源的變化,使系統(tǒng)更便于管理和維護(hù)。
2.數(shù)據(jù)的存儲(chǔ)和管理
數(shù)據(jù)倉(cāng)庫(kù)的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫(kù)的特性,也決定了其對(duì)外部數(shù)據(jù)的表現(xiàn)形式。數(shù)據(jù)倉(cāng)庫(kù)管理所涉及的數(shù)據(jù)量比傳統(tǒng)事務(wù)處理大得多,且隨時(shí)間的推移而快速累積。在數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)存儲(chǔ)和管理中需要解決的是如何管理大量的數(shù)據(jù)、如何并行處理大量的數(shù)據(jù)、如何優(yōu)化查詢等。目前,許多數(shù)據(jù)庫(kù)廠家提供的技術(shù)解決方案是擴(kuò)展關(guān)系型數(shù)據(jù)庫(kù)的功能,將普通關(guān)系數(shù)據(jù)庫(kù)改造成適合擔(dān)當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的服務(wù)器。
3.數(shù)據(jù)的展現(xiàn)
數(shù)據(jù)展現(xiàn)主要有以下方式:
⑴查詢:實(shí)現(xiàn)預(yù)定義查詢、動(dòng)態(tài)查詢、OLAP查詢與決策支持智能查詢;
⑵報(bào)表:產(chǎn)生關(guān)系數(shù)據(jù)表格、復(fù)雜表格、OLAP表格、報(bào)告以及各種綜合報(bào)表;
⑶可視化:用易于理解的點(diǎn)線圖、直方圖、餅圖、網(wǎng)狀圖、交互式可視化等技術(shù)表現(xiàn)復(fù)雜數(shù)據(jù)及其相互關(guān)系;
⑷統(tǒng)計(jì):進(jìn)行平均值、最大值、最小值、期望、方差、匯總、排序等各種統(tǒng)計(jì)分析;
⑸挖掘:利用數(shù)據(jù)挖掘等方法,從數(shù)據(jù)中得到關(guān)于數(shù)據(jù)關(guān)系和模式信息。
通過數(shù)據(jù)挖掘技術(shù)在資產(chǎn)檔案中的應(yīng)用,大大提高了我校國(guó)有資產(chǎn)管理員的檔案管理效率,對(duì)于檔案利用者來說也更加及時(shí)與方便,通過使用這項(xiàng)技術(shù),我校設(shè)備檔案的管理也顯得更加規(guī)范和有秩序。總之,數(shù)據(jù)挖掘技術(shù)在我校國(guó)有資產(chǎn)檔案管理中起著至關(guān)重要的作用。
[1]萬睿,祁風(fēng)義.淺談高校儀器設(shè)備檔案現(xiàn)代化管理[J].2007(2):154-155.
[2]劉瑾.高校設(shè)備檔案的計(jì)算機(jī)化管理[J].檔案管理,2002(1):28-29.
[3]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小鋒,等譯.北京:機(jī)械工業(yè)出版社,2001.