[摘要]:在對網(wǎng)絡化教育的現(xiàn)狀進行分析的基礎(chǔ)上,分析網(wǎng)絡教學資源知識表示與推理、機器學習、數(shù)據(jù)挖掘、信息過濾等多項技術(shù)構(gòu)建了智能化檢索系統(tǒng)知識庫模型,并對該系統(tǒng)執(zhí)行機制進行了相關(guān)介紹。重點對該知識庫的結(jié)構(gòu)模式,相關(guān)知識獲取、以及推理過程等關(guān)鍵技術(shù)問題進行了描述和分析。
[關(guān)鍵詞]:網(wǎng)絡化教育;教學資源管理;智能檢索;知識庫
引言
合理充分地利用網(wǎng)絡教學資源,有利于解決傳統(tǒng)教學環(huán)境下教學資源缺乏,理論性知識難以直觀呈現(xiàn)的問題,有利于學生和教師實現(xiàn)更大空間范圍內(nèi)的相互交流,有利于提高學生利用網(wǎng)絡自學的能力。有效而準確的檢索相關(guān)教學資源是實現(xiàn)網(wǎng)絡化教育的一個基本條件。然而,目前由于網(wǎng)絡教學資源具有動態(tài)性、海量性、模糊性等特征,信息系統(tǒng)難以獲取主題信息需求、難以將信息需求轉(zhuǎn)化為查詢表示、通用搜索引擎相關(guān)性排名體系難以滿足精確檢索教學資源的主題要求等。本文針對教學資源智能檢索的知識庫及相關(guān)技術(shù)進行了研究。
1系統(tǒng)框架及其知識庫模型
網(wǎng)絡教學資源智能化檢索系統(tǒng)是面向網(wǎng)絡教學資源專業(yè)領(lǐng)域主題搜索引擎,它通過建立相對固定的網(wǎng)絡地址集合和教學資源檢索知識庫,根據(jù)一定的檢索算法和有選擇性的抓取網(wǎng)絡信息。該系統(tǒng)建立了個性化的知識推送模塊,使用智能化復雜的決策與推理反饋機制,幫助用戶確定信息;它使得用戶不必再次訪問固定的站點就能獲取最新信息,知識推送機制根據(jù)知識庫中的相關(guān)知識將ROBOT所獲取的、用戶關(guān)注的教學資源信息推送給用戶。
網(wǎng)絡教學資源智能化檢索系統(tǒng)知識庫是關(guān)于教學資源知識的存儲機構(gòu),用于存儲解決用戶檢索所需的原理性知識、專家的經(jīng)驗性知識以及有關(guān)的事實等。知識庫中的知識來源于知識學習系統(tǒng),同時它又為推理機提供求解問題所需的知識。
1.1知識庫模型組織結(jié)構(gòu)
知識庫為信息檢索和智能推理提供有力的支持,系統(tǒng)的知識庫部分由領(lǐng)域知識庫和常識性知識庫兩部分組成。教學資源知識庫提供經(jīng)驗性的信息,常識性知識庫則從更廣泛的角度出發(fā),提供深層的事實信息和知識。
知識庫包含了知識分類體系、用戶需求信息推導規(guī)則、用戶學習規(guī)則等。系統(tǒng)將知識按照一種分級索引模型進行組織,這種分級結(jié)構(gòu)能夠促進知識庫的動態(tài)管理。這種模型自然而動態(tài)地表達了知識的層次結(jié)構(gòu),便于系統(tǒng)對用戶的信息需求在語義上進行擴充。在用戶的使用過程中,系統(tǒng)根據(jù)用戶的新需求的不斷提出來擴充自身。隨著用戶對系統(tǒng)的使用頻率的增多,知識庫也會因不斷加入用戶的思想而變得具有個性化的特征。
通過多種學習手段來修改模型和知識庫中知識權(quán)重和需求表達式,從而使得對知識和需求的描述更接近用戶的真實需求,最后,以最近的描述為信息查詢依據(jù),提高查全率和查準率。
學習單元接收到環(huán)境外界信息后,對信息進行分析、篩選,并利用有用的信息對知識庫知識體系做出修改。執(zhí)行單元利用知識庫中的知識執(zhí)行任務,將執(zhí)行任務后的信息又反饋給學習單元供進一步學習用。
1.2教學資源知識的分類與表示
在智能信息檢索系統(tǒng)設(shè)計中,知識的獲取和運用是系統(tǒng)智能化的基礎(chǔ),成為智能檢索系統(tǒng)的一個核心部分。知識表示實際上就是對知識的一種描述,一種計算機可以接受的用于描述知識的數(shù)據(jù)結(jié)構(gòu)。對知識進行表示的過程就是把知識編碼成某種數(shù)據(jù)結(jié)構(gòu)的過程。在信息檢索中,同一條知識對不同的用戶有著不同的重要性。目前針對智能信息系統(tǒng)知識表示方法主要分為兩大類:符號表示法,連接機制表示法。
本系統(tǒng)在選擇知識表示方法時,主要從以下幾個方面進行考慮:要充分表示教學資源領(lǐng)域知識,即在確定該系統(tǒng)的知識表示模式時,首先應該考慮的是它能否充分地表示領(lǐng)域知識,要考慮是否有利于對教學資源知識的利用,是否便于對教學資源知識的組織、維護與管理,是否便于理解和實現(xiàn)。
根據(jù)不同的教學與學習任務進行相關(guān)資源的檢索其實是一個多目標優(yōu)化的問題,在對檢索的結(jié)果的相關(guān)性反饋方面,可以并通過層次分析法或其他的分析評價方法建立多目標評價體系。在相關(guān)性評價體系中,指標具有定量和定性兩種,可采取不同的方法對它們進行處理,以便于各種數(shù)據(jù)在層次分析法中進行統(tǒng)一分析計算。根據(jù)不同教學任務來檢索相關(guān)的教學資源時,用戶可以根據(jù)任務的不同要求,來設(shè)置各指標的權(quán)重。檢索系統(tǒng)將把檢索任務分解成與各種指標相關(guān)具體任務,管理系統(tǒng)對采集子系統(tǒng)收集的信息的相關(guān)性進行計算評價,并反饋給用戶界面。
1.3知識的獲取
智能化信息檢索系統(tǒng)的核心在于機器學習,即系統(tǒng)對用戶相關(guān)信息的不斷學習,從而獲取檢索信息,豐富自身的知識體系。知識庫的主要作用是保存系統(tǒng)對用戶相關(guān)信息的學習記錄,體現(xiàn)了系統(tǒng)對用戶信息檢索需求的推導,更新和維護。為了在劃分用戶信息檢索需求時有據(jù)可依,知識庫還應起到規(guī)范知識體系的作用。
知識庫通過對用戶檢索需求信息的學習來獲取、更新知識體系。本系統(tǒng)的知識獲取主要來自以下兩個方面:
1.3.1學生信息反饋
用戶可以根據(jù)自己的知識背景、檢索需求,對知識庫中的部分知識點進行修改,但對于已經(jīng)在實踐中得到了廣泛驗證的科學體系結(jié)構(gòu),則不允許用戶修改,知識庫管理功能會給用戶設(shè)定相應的權(quán)限。用戶直接修改知識庫的方式具有直觀性的特點,有助于加快系統(tǒng)的學習速度。
1.3.2機器學習
系統(tǒng)根據(jù)信息呈現(xiàn)和反饋子系統(tǒng)提交的用戶行為分析結(jié)果,歸納出用戶在一段時間內(nèi)特別關(guān)注的某些教學資源信息,相應地增加該知識點在知識庫中的權(quán)重。系統(tǒng)將新關(guān)注的資源信息存入相應的位置,并賦予適當?shù)臋?quán)重,對用戶在一段時間內(nèi)沒有查詢過的教學資源信息。減少它的權(quán)重。這樣知識庫中的信息將會隨著用戶的需求而變化,從而實現(xiàn)了對用戶信息需求的動態(tài)追蹤。
本系統(tǒng)采用歸納學習方法,即從足夠多的具體檢索實例出發(fā),通過歸納推理,得到用戶的檢索規(guī)律和新的知識概念。用戶檢索信息的反饋、對用戶檢索界面的信息挖掘都是歸納學習實例來源。
2知識點關(guān)聯(lián)規(guī)則
知識庫中的各個知識詞條是存在一定的相互聯(lián)系的。我們用知識點關(guān)聯(lián)規(guī)則來表示各知識詞條之間的相互聯(lián)系。我們這樣描述知識詞典、知識點、知識關(guān)聯(lián)規(guī)則之間的關(guān)系。知識詞典D表示為{K11,K12,K13,…Kij,…Knn}其中Kij是知識庫中的知識點,第二下標表示該知識點在知識樹中所屬的層。
每個知識點用一個3維數(shù)組K(Name,Weight,Layer)表示,其中Name是該教學資源的名稱,Weight是權(quán)重,Layer是該知識點在知識樹上所處的層。
知識點關(guān)聯(lián)規(guī)則用三元組表示,記作R(Kij,Kmn,Weight),其中Weight表示Kij,Kmn兩知識點之間相互跳轉(zhuǎn)的權(quán)重,該權(quán)重值由初始設(shè)定值和累加值兩部分構(gòu)成,記作Weight=ValueO+Valuel,其中ValueO表示權(quán)重初始值,他由設(shè)計者根據(jù)兩知識點之間的關(guān)聯(lián)性設(shè)定,他是一個常量。Value1是系統(tǒng)在跟蹤用戶在查詢時多次在檢索關(guān)鍵詞(知識點)之間跳轉(zhuǎn)的記錄而推算而來,他是一個變量,隨著用戶查詢次數(shù)和檢索詞的變化而變化。
3結(jié)束語
網(wǎng)絡化教育的興起提供了全新的教育模式,缺乏有效的教學資源智能檢索系統(tǒng)是制約網(wǎng)絡化教育進一步發(fā)展的瓶頸,而相關(guān)知識庫則是該檢索系統(tǒng)的核心部分。本文在對教學資源檢索系統(tǒng)總體構(gòu)架進行分析的基礎(chǔ)上,重點敘述了知識獲取、知識表示、知識推理以及知識存取等建立知識庫的相關(guān)內(nèi)容,為教學資源智能化檢索系統(tǒng)的開發(fā)提供了技術(shù)保證。