薛泉祥
[摘 要]信息管理與信息系統(tǒng)專業(yè)是信息時代的產(chǎn)物,迄今經(jīng)歷了技術型、工程型和復合型三種類型人才培養(yǎng)的發(fā)展之路,其專業(yè)設置也發(fā)生了一系列變化。本文結合社會發(fā)展形勢提出了當下信息管理與信息系統(tǒng)專業(yè)人才的知識結構,并以某所高校信管專業(yè)學生成績數(shù)據(jù)為基礎,通過數(shù)據(jù)挖掘尋找關聯(lián)規(guī)則,為進一步做好信管專業(yè)課程設置提供決策支持。
[關鍵詞]數(shù)據(jù)挖掘;信息管理與信息系統(tǒng);課程設置;決策支持
[中圖分類號]G643 [文獻標識碼] A [文章編號] 1009 — 2234(2015)12 — 0153 — 03
信息管理與信息管理專業(yè)是信息時代的產(chǎn)物。它培養(yǎng)具備扎實的現(xiàn)代管理學基礎知識、計算機科學技術知識、動手能力強、適應面寬的信息管理人才。信息管理與信息系統(tǒng)學科是由管理學基礎理論與計算機科學技術相結合的交叉學科,具有基礎科學與應用科學的雙重屬性,由于數(shù)學定量方法和信息技術的融合,它又體現(xiàn)了應用學科的某些特征〔1〕。學科特征的復雜性決定了該學科課程設置的復雜性。本研究根據(jù)某高校信息管理與信息系統(tǒng)專業(yè)學生的成績數(shù)據(jù)通過數(shù)據(jù)挖掘的方法,從中尋找規(guī)律,為高校更為合理地設置信管專業(yè)的課程提供決策依據(jù)。
一.信息管理與信息系統(tǒng)專業(yè)的人才培養(yǎng)定位及課程設置變化
信息管理與信息系統(tǒng)專業(yè)人才的培養(yǎng)經(jīng)歷了技術型、工程型和復合型三種類型人才培養(yǎng)的發(fā)展之路〔2〕。不同類型人才的培養(yǎng)過程需要相應的課程設置,“技術型”人才的培養(yǎng)主要源于計算機應用等專業(yè),課程主要以計算機應用類課程為主,重點強調程序設計的能力。此類畢業(yè)生在工作中往往表現(xiàn)出較強的程序設計能力。
工程型人才培養(yǎng)課程主要以經(jīng)濟管理、工程數(shù)學、計算機、系統(tǒng)工程四類課程為核心,以計算機能力培養(yǎng)為重點。與前兩類人才相比,復合型人才更具有競爭力,因為他們具有信息分析能力與企業(yè)管理創(chuàng)新的知識,是具有駕馭信息資源知識與能力的新型管理人才。這類復合型人才的核心競爭力主要分為兩類:信息系統(tǒng)開發(fā)的能力和信息分析的能力。
二.數(shù)據(jù)挖掘及數(shù)據(jù)挖掘工具簡介
數(shù)據(jù)挖掘(Data Mining)簡稱DM,又稱為數(shù)據(jù)庫中知識發(fā)現(xiàn),它是一個從大量數(shù)據(jù)中抽取挖掘出未知的、有價值的模式或規(guī)律等知識的復雜過程〔3〕。具體的數(shù)據(jù)挖掘方法有關聯(lián)分析、聚類分析、分類和預測等。本文選取了Clementine12.0對數(shù)據(jù)進行挖掘建模分析。
三.利用Clementine軟件進行數(shù)據(jù)挖掘
1.數(shù)據(jù)收集
本文選舉一所以工科為主、經(jīng)管文理農(nóng)等學科為輔的教學型大學通過學校的教務部門的學生成績系統(tǒng),我們可完整獲取該高校2004級信息管理與信息系統(tǒng)專業(yè)學生的成績信息。
2.數(shù)據(jù)預處理
數(shù)據(jù)挖掘過程中數(shù)據(jù)預處理包括三個步驟:數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)轉換〔4〕。在本研究的數(shù)據(jù)預處理階段,我們主要通過對學生的成績數(shù)據(jù)庫進行信息抽取、轉換和加載,形成適合于本課題研究需要的學生成績分析基本數(shù)據(jù)庫;按照Clementine軟件對數(shù)據(jù)的要求,數(shù)據(jù)源中的連續(xù)值屬性如考試成績需進行離散化處理。在數(shù)據(jù)源中,我們令成績在90分以上的為“A”,令成績在80-89之間的為“B”,在70-79之間的為“C”,60-69之間的為“D”,小于60的為“E”。對于“優(yōu)”“良”“中”等非分數(shù)成績也按照同樣的方法進行離散化,形成目標數(shù)據(jù)表。
為便于開展研究和分析,我們信管專業(yè)人才知識結構將目標成績數(shù)據(jù)分成:公共基礎知識、經(jīng)濟類知識、管理決策類知識、信息技術類知識、信息系統(tǒng)開發(fā)類知識、建模知識六大類。并運用Clementine建模,進行數(shù)據(jù)挖掘,尋找各類六類課程之間的關聯(lián)關系。
3.數(shù)據(jù)挖掘的主要步驟及結果分析
(1)用Clementine的K-means模型對數(shù)據(jù)表S中各類課程成績數(shù)據(jù)進行聚類分析處理。
K-means節(jié)點提供了一種聚類分析方法,與Clementine中的其他學習方法不同,K-means模型不使用目標字段。K-means不是去預測某一結果,而是從輸入字段中發(fā)現(xiàn)特征,記錄被分成群組,同一群組中的記錄彼此相似,而不同群組的記錄大不相同,對于大型數(shù)據(jù)集,K-means模型通常是最快的分群方法〔5〕。運用Clementine的K-means聚類建模節(jié)點構建數(shù)據(jù)流,設置聚類結果為3簇,導入數(shù)據(jù)執(zhí)行數(shù)據(jù)流,形成聚類結果。以管理類課程為例,形成的聚類結果如表1:
通過表1所示結果的分析,我們可以較為直觀的看出:第二簇的17個記錄中,成績普遍偏低,大多在C與D之間徘徊。而第一簇的45個記錄中結果明顯好于Cluster2大部分在B;第三簇共有6個記錄,6個記錄中除會計信息系統(tǒng)分析與設計為B,其余均為A。據(jù)此我們可以令第三簇為A,即第三簇的6名學生的管理類課程的整體學習水平為優(yōu)秀。以此類推,第一簇的45名學生管理類課程的整體學習水平中等,我們令其為B,第三簇的17名學生管理類可課程的整體學習狀況較差,我們用C表示。
利用輸出節(jié)點輸出聚類結果,放入數(shù)據(jù)表S備用。按照同樣的方法,我們分別對其余五類課程成績進行了聚類。
(2)用Clementine平臺的Apriori規(guī)則挖掘模型分別對數(shù)據(jù)表S中的各類別的數(shù)據(jù)進行數(shù)據(jù)挖掘,尋找關聯(lián)規(guī)則。
利用數(shù)據(jù)挖掘平臺Clementine,構建數(shù)據(jù)挖掘流程,針對數(shù)據(jù)表S的具體挖掘過程以及挖掘出的關聯(lián)規(guī)則如下:
1)對六類課程組進行關聯(lián)規(guī)則挖掘,將六個字段全部設為既是條件屬性又是決策屬性,設置最小規(guī)則支持度為6%,最小置信度為80%。執(zhí)行數(shù)據(jù)流得出關聯(lián)規(guī)則,形成關聯(lián)規(guī)則,其中較為具有意義的規(guī)則如表2:
②構建數(shù)據(jù)挖掘數(shù)據(jù)流,把公共基礎類課程作為條件屬性,其他課程聚類及畢業(yè)設計成績決策屬性進行挖掘,設置最小規(guī)則支持度為5%,最小置信度為40%,執(zhí)行數(shù)據(jù)庫流得出關聯(lián)規(guī)則,形成關聯(lián)規(guī)則,其中有意義的如表3:
3)以其他各課程聚類字段為條件屬性,畢業(yè)設計成績字段作為被決策屬性,設置最小規(guī)則支持度為10%,最小置信度為80%,執(zhí)行數(shù)據(jù)流,得出關聯(lián)規(guī)則,其中有意義的規(guī)則如表4:
4)以各課程字段作為條件屬性,以畢業(yè)設計成績?yōu)闆Q策屬性,設置最小規(guī)則支持度為5%,最小置信度為50%,執(zhí)行數(shù)據(jù)流,得出關聯(lián)規(guī)則,其中有意義的共有10條。
(3)學生成績挖掘結果分析
1)信息管理與信息系統(tǒng)專業(yè)各類課程之間存在一定的依存關系,尤其體現(xiàn)在信息技術類課程與管理決策類課程之間。規(guī)則:公共基礎知識聚類=A?信息技術類聚類=A關聯(lián)規(guī)則(置信度82.5%,支持度85.824%)表明:信息技術類課程學習狀況良好的學生,管理決策類知識的學習狀況學習良好。這充分體現(xiàn)了學校信息管理與信息系統(tǒng)專業(yè)對學生的培養(yǎng)注重工程應用背景,側重于工程應用型專門人才的培養(yǎng)定位。
2)規(guī)則:公共基礎知識聚類=A?信息技術類聚類=A(置信度66.667%,支持度30.882%)、公共基礎知識聚類=A?信息技術類聚類=A(置信度61.905%,支持度30.882%)、公共基礎知識聚類=C?畢業(yè)設計=C(置信度43.75%,支持度23.529%)、公共基礎知識聚類=A?信息開發(fā)類聚類=A(置信度,42.857%,支持度30.882%),分別表明公共基礎類知識對于數(shù)學建模類、基礎信息技術類、畢業(yè)設計、信息系統(tǒng)開發(fā)類課程學習的重要作用。
3)表4所示規(guī)則重點反映了信息技術類、管理決策類等六類課程對于學生畢業(yè)設計的影響。表明,信息技術知識類、管理決策類和信息開發(fā)類課程對于信息管理與信息系統(tǒng)專業(yè)的學生的更好地從事實踐性開發(fā)工作作用明顯。其中信息技術類知識的影響尤為明顯。
4)表5所示規(guī)則反映了信息管理與信息系統(tǒng)所開設的各門課程對于畢業(yè)設計的關系,即該專業(yè)的所有課程,哪些對于學生較好地掌握信息管理與信息系統(tǒng)專業(yè)的知識,并進行綜合運用是有重要關聯(lián)意義的。通過這一關聯(lián)規(guī)則的挖掘,我們可以找到該專業(yè)學習過程中的關鍵學科,可以指導學生的學習,也可以為學校教學過程,優(yōu)化課程設置提供參考。該專業(yè)的關鍵課程為:《企業(yè)資源計劃》、《運籌學》、《會計系統(tǒng)分析與設計課程設計》、《管理信息系統(tǒng)課程設計》等10門課程。其中公共基礎類1門,經(jīng)濟類1門,數(shù)學建模類1門,管理決策類2門,基礎信息技術類4門,信息系統(tǒng)開發(fā)類1門,實踐性環(huán)節(jié)課程2門。
四.基于上面的論述,結合本文的研究,我們認為信息管理和信息系統(tǒng)專業(yè)的課程設置應注意四個方面的問題:
(1)把握好與計算機科學與應用學科的關系
信息管理與信息系統(tǒng)專業(yè)課程設置中,信息技術類課程比重較大,且該類課程的學習對于管理決策類課程的決定作用較為明顯。計算機應用是信息管理與信息系統(tǒng)的基本載體,信息技術是它的重要內容,軟件工程確為信息系統(tǒng)中項目開發(fā)的指導思想,但信息管理與信息系統(tǒng)專業(yè)更強調信息的組織與管理。在該專業(yè)的課程設置中,有關現(xiàn)代信息技術的課程應當占有相當大的比重,但是其重點在于“用”技術,而不是研究這些技術的本身,因此在重點和內容的取舍上有著明顯的區(qū)別。應該強調的是,該專業(yè)畢業(yè)的學生應能承擔各級各類信息管理工作,從事各種類型的信息系統(tǒng)建設和管理工作,其工作重點不是編程。因而在培養(yǎng)學生時,不宜過分強調編程能力,而應加強信息組織、信息管理、系統(tǒng)分析、系統(tǒng)設計的訓練。
(2)把握好與管理學科的關系
該專業(yè)也不同于管理科學,它與其他管理學科的區(qū)別在于:重點是信息管理,并且大量使用信息技術。在信息社會,信息已成為企業(yè)的生命線,信息資源是企業(yè)的重要財富,信息管理不容忽視。基于本研究,我們認為,在課程設置中,應適當加重信息系統(tǒng)開發(fā)類知識的比重。
(3)加強公共基礎類課程教學內容改革
表5所示關聯(lián)規(guī)則充分說明了公共基礎知識的基礎性地位。此次實證分析中,公共基礎類課程主要是數(shù)學類基礎課程。數(shù)學是基礎,不僅是信息處理的工具,也是提高思維能力的重要訓練手段?,F(xiàn)代信息處理技術越來越多地應用到諸多數(shù)學方法。依據(jù)本文的研究結果,我們認為應該提高本專業(yè)的數(shù)學要求;同時,現(xiàn)代數(shù)學軟件的使用已經(jīng)變得越來越重要,可考慮在數(shù)學課程中增加相應數(shù)學軟件的使用內容。此外,應用數(shù)學解決信息處理問題的第一步是建立相應問題的數(shù)學模型,不僅應在數(shù)學模型課程中向學生傳授數(shù)學建模方法,更應該在所有數(shù)學課程中融入數(shù)學建模思想。
(4)加大實踐環(huán)節(jié)的比重
在本文的研究對象中僅有兩門實踐類課程:《會計信息系統(tǒng)分析與設計課程設計》、《管理信息系統(tǒng)課程設計》。關聯(lián)規(guī)則:管理信息系統(tǒng)課程設計B?畢業(yè)設計B(置信度66.667%,支持度13.235%)和會計信息系統(tǒng)課程設計=A?畢業(yè)設計=B(置信度60%,支持度14.706%),充分說明了實踐性環(huán)節(jié)對于學生綜合運用專業(yè)知識解決實際問題的重要作用。
〔參 考 文 獻〕
〔1〕齊二石.中國管理科學與工程類專業(yè)教育教學改革與發(fā)展戰(zhàn)略研究〔R〕.高等教育出版社,2002.
〔2〕蔡淑琴,張自剛,張金隆.信息管理與信息系統(tǒng)專業(yè)人才培養(yǎng)的研究〔J〕.高等工程教育研究.2001(4):26
〔3〕劉同明等.數(shù)據(jù)挖掘技術及其應用〔M〕.北京:國防工業(yè)出版社.2001:15-27
〔4〕謝邦昌.數(shù)據(jù)挖掘Clementine應用實務〔M〕.機械工業(yè)出版社,2008:14-28
〔5〕武森,程鍇,陳鳳潔.聚類分析在電信客戶細分中的應用〔J〕.技術經(jīng)濟與管理研究.2008,(1):10
〔責任編輯:侯慶海〕