蘇延平
(閩南理工學(xué)院信息管理學(xué)院,福建石獅362700)
隨著大數(shù)據(jù)、云計(jì)算等技術(shù)的快速發(fā)展,數(shù)據(jù)交換共享平臺的應(yīng)用受到廣泛關(guān)注。目前,數(shù)據(jù)交換共享平臺的應(yīng)用已經(jīng)非常廣泛,例如數(shù)字化校園數(shù)據(jù)交換共享中心、金融數(shù)據(jù)交換共享平臺、政務(wù)數(shù)據(jù)交換共享平臺等。國務(wù)院發(fā)布的《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006-2020年)》中將信息支撐技術(shù)列為優(yōu)先發(fā)展課題,而數(shù)據(jù)交換共享平臺是支撐技術(shù)的典型代表。由于應(yīng)用的場景環(huán)境、數(shù)據(jù)的存儲介質(zhì)、數(shù)據(jù)格式、所使用數(shù)據(jù)庫的類型等都存在差異,因此有可能產(chǎn)生信息傳輸和交換信息不順暢問題的出現(xiàn)[1-2]。為了整合異構(gòu)數(shù)據(jù),研究如何提高數(shù)據(jù)交換共享平臺的效率具有重要的意義。本文以教育教學(xué)數(shù)據(jù)資源的數(shù)據(jù)交換共享平臺應(yīng)用為例,對數(shù)據(jù)交換共享平臺的體系結(jié)構(gòu)展開研究[3]。
數(shù)據(jù)交換共享平臺能夠通過網(wǎng)絡(luò)整合分散的信息,進(jìn)行信息的交換,達(dá)到數(shù)據(jù)的共享,提高數(shù)據(jù)信息的利用率。數(shù)據(jù)交換共享平臺的功能主要是數(shù)據(jù)集成、信息集成和可靠通信。數(shù)據(jù)集成是對各數(shù)據(jù)接口進(jìn)行識別,集成其中的文件、數(shù)據(jù)庫和接口,之后實(shí)現(xiàn)數(shù)據(jù)的交換共享;對系統(tǒng)間提出/應(yīng)答請求和發(fā)送/接收信息,達(dá)到可靠通信的目的,使得數(shù)據(jù)傳輸中出現(xiàn)的斷點(diǎn)能夠續(xù)傳,實(shí)現(xiàn)同步和異步消息的正常通信,從而達(dá)到高速傳輸?shù)哪康腫4]。在教學(xué)數(shù)據(jù)交換共享平臺的研究中,主要是數(shù)據(jù)的整合和數(shù)據(jù)的分析應(yīng)用兩個方面。
數(shù)據(jù)整合及體系結(jié)構(gòu)研究包括異構(gòu)數(shù)據(jù)發(fā)布、沖突以及整合問題。其中,異構(gòu)數(shù)據(jù)發(fā)布是在異構(gòu)數(shù)據(jù)庫中將異構(gòu)數(shù)據(jù)提取出來,對其進(jìn)行處理,用達(dá)到要求的格式發(fā)出。異構(gòu)數(shù)據(jù)的發(fā)布應(yīng)用層的用戶是看不見的[5]。異構(gòu)數(shù)據(jù)沖突是指在對數(shù)據(jù)命名、格式組織和數(shù)據(jù)結(jié)構(gòu)等方面產(chǎn)生的沖突,當(dāng)出現(xiàn)沖突時將其解決,使數(shù)據(jù)在應(yīng)用中得到統(tǒng)一數(shù)據(jù)視圖。異構(gòu)數(shù)據(jù)整合是將以上過程的數(shù)據(jù)整合起來,用戶得到統(tǒng)一的物理或邏輯視圖。經(jīng)過一系列的操作,屏蔽掉數(shù)據(jù)的異構(gòu)性,使應(yīng)用程序能夠統(tǒng)一訪問和處理異構(gòu)數(shù)據(jù)。
數(shù)據(jù)分析及應(yīng)用是對學(xué)習(xí)者學(xué)習(xí)過程中的學(xué)習(xí)行為、學(xué)習(xí)平臺中的領(lǐng)域知識庫的建立以及教學(xué)管理者管理教學(xué)中產(chǎn)生的數(shù)據(jù)進(jìn)行分析和挖掘。其中學(xué)習(xí)行為數(shù)據(jù)的分析是通過數(shù)據(jù)分析技術(shù)進(jìn)行的,得到學(xué)習(xí)者的學(xué)習(xí)特點(diǎn)數(shù)據(jù),對因材施教提供有力幫助。教學(xué)管理數(shù)據(jù)分析用于分析學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù),了解學(xué)習(xí)者在學(xué)習(xí)過程中的學(xué)習(xí)特點(diǎn)、知識掌握的程度,為管理員和教育者提供分配和管理教學(xué)資源提供有力依據(jù)。
根據(jù)各個數(shù)據(jù)共享交換平臺的功能和性能需求,設(shè)計(jì)一個跨平臺的體系結(jié)構(gòu),不需要改變用戶需求交互模型,就可以對底層的數(shù)據(jù)模型進(jìn)行配置。通用的數(shù)據(jù)共享交換平臺體系結(jié)構(gòu)如圖1所示。
圖1 通用的數(shù)據(jù)共享交換平臺體系結(jié)構(gòu)圖
目前,大多應(yīng)用是基于Web的服務(wù),此數(shù)據(jù)交換共享平臺的體系結(jié)構(gòu)能夠屏蔽各應(yīng)用系統(tǒng)的異構(gòu)性,提高不同應(yīng)用系統(tǒng)的服務(wù)質(zhì)量。平臺建立獨(dú)立的連接系統(tǒng),支持跨平臺和跨系統(tǒng)的數(shù)據(jù)交換共享。該數(shù)據(jù)交換共享平臺體系結(jié)構(gòu)基于J2EE體系結(jié)構(gòu),采用SOA思想,數(shù)據(jù)交換共享采用BEA ALSB(企業(yè)服務(wù)總線),構(gòu)建分布式數(shù)據(jù)共享交換平臺[6-8]。根據(jù)不同的服務(wù)類型,數(shù)據(jù)交換共享平臺由實(shí)體服務(wù)(服務(wù)提供商)、BEA ALSB和服務(wù)請求者三部分組成,它們之間通過HTTP(S)和SOAP協(xié)議互相通信。此平臺具有良好的可擴(kuò)展性,能夠提高數(shù)據(jù)共享效率和可靠性。
各類線上線下教育教學(xué)的不斷發(fā)展產(chǎn)生了大量的數(shù)據(jù)。如何從海量的教育教學(xué)數(shù)據(jù)中挖掘可能有用的信息,一直是教育工作者關(guān)心的問題。本部分從教育教學(xué)數(shù)據(jù)共享交換平臺出發(fā),展開基于數(shù)據(jù)共享交換平臺的智能導(dǎo)學(xué)系統(tǒng)的研究。
在智能導(dǎo)學(xué)系統(tǒng)中,追蹤每個教育者、學(xué)習(xí)者的教育教學(xué)數(shù)據(jù)行為,將收集到的學(xué)習(xí)信息和網(wǎng)絡(luò)日志信息存儲在數(shù)據(jù)庫中,把這些數(shù)據(jù)信息作為輸入數(shù)據(jù),供數(shù)據(jù)挖掘和個性化分析使用,提取其中的共同特征和個體特征,以規(guī)則集的形式存儲到關(guān)系型數(shù)據(jù)庫中[9-10]。教學(xué)策略集中記錄經(jīng)驗(yàn)豐富的教學(xué)經(jīng)歷數(shù)據(jù),以不同權(quán)重的知識數(shù)據(jù)來表示。
當(dāng)用戶注冊線上教學(xué)系統(tǒng)時,頁面跳轉(zhuǎn)到一個為學(xué)習(xí)者提供個性化推薦的頁面,根據(jù)規(guī)則調(diào)度工具,對教學(xué)策略進(jìn)行分析,基于數(shù)據(jù)共享交換平臺的智能導(dǎo)學(xué)系統(tǒng)為不同的用戶提供個性化的學(xué)習(xí)環(huán)境,學(xué)習(xí)者通過學(xué)習(xí)實(shí)現(xiàn)學(xué)習(xí)目標(biāo)。根據(jù)不同用戶的特征評估修改系統(tǒng)特征參數(shù)以及參數(shù)所占的權(quán)重,更好地反應(yīng)不同用戶的特征,魯棒性增強(qiáng)。
基于數(shù)據(jù)交換共享平臺的智能導(dǎo)學(xué)系統(tǒng)的知識庫主要包括教學(xué)中的知識點(diǎn)數(shù)據(jù)和教學(xué)所使用的資源數(shù)據(jù),不同知識以及知識之間的關(guān)系組成知識庫,由知識點(diǎn)之間的關(guān)系表示。知識庫包括知識點(diǎn)屬性庫和知識樹庫。知識點(diǎn)是教學(xué)內(nèi)容的集合,比如概念、規(guī)則、定義等。每個知識點(diǎn)指向相關(guān)的教學(xué)材料,例如視頻材料、試題庫材料、課件等。它們的特征和關(guān)系由屬性描述。知識點(diǎn)的屬性構(gòu)成唯一的網(wǎng)絡(luò)結(jié)構(gòu),相似度高的知識點(diǎn)分配到一個子集中,不同知識點(diǎn)之間的關(guān)系通過課程、所屬單位、知識點(diǎn)等呈現(xiàn)出來。知識庫模型如圖2所示。其中虛線所包圍的部分表示虛擬層,包含一節(jié)該課程的章節(jié)信息等。知識點(diǎn)包含的字段有課程代碼、章節(jié)編號、知識點(diǎn)編碼,知識點(diǎn)間以樹形結(jié)構(gòu)進(jìn)行組織,并將數(shù)據(jù)存儲到知識庫中。
圖2 知識庫模型圖
智能導(dǎo)學(xué)系統(tǒng)中用戶訪問知識庫留下大量瀏覽數(shù)據(jù)信息,將這些數(shù)據(jù)提純、分割,通過使用序列挖掘方法對用戶的行為進(jìn)行挖掘,豐富教學(xué)策略數(shù)據(jù)庫,為用戶提供個性化推薦服務(wù)。經(jīng)過數(shù)據(jù)挖掘,系統(tǒng)能夠找到最優(yōu)的知識點(diǎn)序列,設(shè)置最優(yōu)解為默認(rèn)路徑。推薦評估模型如圖3所示,通過決策樹算法實(shí)現(xiàn)個性化推薦和評估,通過分析和評估優(yōu)化教學(xué)策略。
圖3 個性化推薦評估模型
智能導(dǎo)學(xué)系統(tǒng)個性化推薦模型能夠形成教與學(xué)之間的對接,為學(xué)習(xí)者的學(xué)習(xí)建立良好的學(xué)習(xí)體系,對不同的學(xué)習(xí)者提供個性化推薦學(xué)習(xí),并使教育者及時獲得學(xué)習(xí)情況反饋。通過智能導(dǎo)學(xué)系統(tǒng)引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí),提高了教學(xué)效率,極大地提高學(xué)習(xí)者的學(xué)習(xí)興趣。
隨著大數(shù)據(jù)應(yīng)用的不斷發(fā)展,數(shù)據(jù)共享交換平臺作為大數(shù)據(jù)應(yīng)用的載體得到廣泛關(guān)注。基于數(shù)據(jù)交換共享平臺應(yīng)用的場景、存儲數(shù)據(jù)的介質(zhì)、數(shù)據(jù)格式、所使用的數(shù)據(jù)庫類型等存在差異的情況,設(shè)計(jì)了數(shù)據(jù)共享交換平臺的體系結(jié)構(gòu)。論文以智能導(dǎo)學(xué)系統(tǒng)為例,以教育教學(xué)數(shù)據(jù)資源數(shù)據(jù)交換共享平臺為基礎(chǔ),建立基于數(shù)據(jù)共享交換平臺的智能導(dǎo)學(xué)系統(tǒng)架構(gòu),在此基礎(chǔ)上建立所屬知識庫,設(shè)計(jì)基于數(shù)據(jù)交換共享平臺的智能導(dǎo)學(xué)推薦評估模型,此應(yīng)用能夠?yàn)閷W(xué)習(xí)者的學(xué)習(xí)建立良好的學(xué)習(xí)體系,為學(xué)習(xí)者提供個性化推薦學(xué)習(xí),調(diào)動學(xué)習(xí)者的學(xué)習(xí)積極性。此研究可以為后續(xù)的數(shù)據(jù)交換共享平臺研究與應(yīng)用提供一定的理論和應(yīng)用參考。