【摘要】針對(duì)目前教學(xué)資源服務(wù)中普遍存在的海量教學(xué)資源與用戶(hù)個(gè)性化需求之間的矛盾,在基于校園網(wǎng)的英語(yǔ)教學(xué)資源庫(kù)系統(tǒng)中建立了一個(gè)教學(xué)資源個(gè)性化檢索模型,該模型把基于網(wǎng)絡(luò)的個(gè)性化信息服務(wù)引入英語(yǔ)教學(xué)資源體系,尊重用戶(hù)中存在的差異,學(xué)習(xí)和跟蹤用戶(hù)的個(gè)性化興趣,并根據(jù)用戶(hù)的個(gè)性化興趣特征對(duì)英語(yǔ)教學(xué)資源進(jìn)行過(guò)濾,實(shí)現(xiàn)少而精的教學(xué)資源個(gè)性化檢索。實(shí)驗(yàn)表明:該模型能有效地提高英語(yǔ)教學(xué)資源服務(wù)中個(gè)性化檢索的查全率和查準(zhǔn)率。
【關(guān)鍵詞】英語(yǔ)教學(xué)資源;個(gè)性化檢索;過(guò)濾技術(shù);用戶(hù)模型
【中圖分類(lèi)號(hào)】G434 【文獻(xiàn)標(biāo)識(shí)碼】A 【論文編號(hào)】1009—8097 (2008) 12—0094—03
引言
英語(yǔ)教學(xué)資源是指蘊(yùn)涵了特定的教育信息,可以提供給英語(yǔ)學(xué)習(xí)者使用,能幫助和促進(jìn)學(xué)生學(xué)習(xí)的各類(lèi)英語(yǔ)信息資源,特別是能以數(shù)字信號(hào)在互聯(lián)網(wǎng)上進(jìn)行傳輸?shù)挠⒄Z(yǔ)教學(xué)資源。數(shù)字化和教育價(jià)值是它的核心特征。網(wǎng)絡(luò)多媒體技術(shù)與外語(yǔ)教學(xué)的有機(jī)整合極大地豐富了外語(yǔ)教學(xué)的信息資源。特別是,Internet的出現(xiàn),使得大量的真實(shí)而鮮活的語(yǔ)料資源實(shí)現(xiàn)了電子化和網(wǎng)絡(luò)化,變“供給制”為“自助餐式”,為學(xué)習(xí)者提供了自主選擇語(yǔ)料的廣闊天地。為主動(dòng)式學(xué)習(xí)創(chuàng)造了有利條件。電子載體語(yǔ)料源不僅從數(shù)量上達(dá)到了“應(yīng)有盡有”的豐富程度,而且從質(zhì)量上實(shí)現(xiàn)了教學(xué)內(nèi)容的“零時(shí)差”,從根本上改變了外語(yǔ)資源單一匱乏和陳舊老化的局面[1]。
按照教育部現(xiàn)代遠(yuǎn)程教學(xué)資源建設(shè)委員會(huì)于2000年5月所推出的《現(xiàn)代遠(yuǎn)程教學(xué)資源建設(shè)技術(shù)規(guī)范》的規(guī)定[2],從教學(xué)資源建設(shè)的實(shí)際出發(fā),把教學(xué)資源分為以下幾類(lèi):媒體素材、題庫(kù)、試卷素材、課件、案例、文獻(xiàn)資料、常見(jiàn)問(wèn)題解答、資源目錄索引和網(wǎng)絡(luò)課程。
目前的英語(yǔ)教學(xué)資源庫(kù)系統(tǒng)主要提供教學(xué)資源上傳、教學(xué)資源查詢(xún)和教學(xué)資源下載等功能。主要就是以“物”為主,未能體現(xiàn)“以人為本”的思想,特別是現(xiàn)有的教學(xué)資源庫(kù)不具備個(gè)性化和智能化等特性,從而普遍存在海量教學(xué)資源與用戶(hù)個(gè)性化需求之間的矛盾[3]。由于這個(gè)矛盾的存在,一方面造成了教學(xué)資源的巨大浪費(fèi),另一方面,為用戶(hù)查找和使用所需要的教學(xué)資源造成了巨大的困難。這些問(wèn)題都阻礙了英語(yǔ)教學(xué)資源在教學(xué)中作用的發(fā)揮,造成了極大的教學(xué)資源浪費(fèi)。
向用戶(hù)提供個(gè)性化教學(xué)資源服務(wù)能很好的解決這個(gè)矛盾。個(gè)性化教學(xué)資源服務(wù)是根據(jù)用戶(hù)(這里指學(xué)習(xí)者)的使用行為和特點(diǎn),來(lái)向用戶(hù)提供滿(mǎn)足其個(gè)性化教學(xué)資源需求的一種服務(wù)。由于學(xué)習(xí)者的學(xué)習(xí)起點(diǎn)、學(xué)習(xí)風(fēng)格、學(xué)習(xí)愿望、學(xué)習(xí)步調(diào)等方面存在個(gè)體差異,在進(jìn)行資源庫(kù)建設(shè)時(shí)要考慮資源庫(kù)建設(shè)的多層次、多元化、開(kāi)放性和動(dòng)態(tài)更新及時(shí)性,讓不同的學(xué)習(xí)者能在資源庫(kù)中取得各自所需要的資源。
本文針對(duì)目前教學(xué)資源服務(wù)中普遍存在的海量教學(xué)資源與用戶(hù)個(gè)性化需求之間的矛盾,在校園網(wǎng)英語(yǔ)教學(xué)資源庫(kù)系統(tǒng)中增加一個(gè)教學(xué)資源個(gè)性化檢索模型(Individualized Search Model of Teaching Resource,以下簡(jiǎn)稱(chēng)ISMTR),該模塊把基于網(wǎng)絡(luò)的個(gè)性化信息服務(wù)引入英語(yǔ)教學(xué)資源體系,尊重用戶(hù)中存在的差異,學(xué)習(xí)和跟蹤用戶(hù)的個(gè)性化興趣,并根據(jù)用戶(hù)的個(gè)性化興趣特征對(duì)教學(xué)資源進(jìn)行過(guò)濾,實(shí)現(xiàn)少而精的教學(xué)資源個(gè)性化檢索。
一 關(guān)鍵技術(shù)
1 教學(xué)資源的描述
由于教學(xué)資源中,決大多數(shù)是多媒體信息,它們很難從其內(nèi)容中提取特征。教育部現(xiàn)代遠(yuǎn)程教學(xué)資源建設(shè)委員在《現(xiàn)代遠(yuǎn)程教學(xué)資源建設(shè)技術(shù)規(guī)范》中指出,為了便于檢索和共享,需要對(duì)教學(xué)資源進(jìn)行屬性標(biāo)注。在這些屬性中,很重要的一項(xiàng)為關(guān)鍵詞屬性。本文所設(shè)計(jì)的系統(tǒng)采用關(guān)鍵詞屬性作為教學(xué)資源特征。為了描述關(guān)鍵詞某個(gè)關(guān)鍵詞所代表的知識(shí)點(diǎn)占該教學(xué)資源總體內(nèi)容的比重,我們?cè)陉P(guān)鍵詞結(jié)構(gòu)類(lèi)型中增加一個(gè)“比重”字段,類(lèi)型為數(shù)值型。當(dāng)然,也可以不增加這一字段,系統(tǒng)默認(rèn)每個(gè)關(guān)鍵詞在該教學(xué)資源的比重相同,即每個(gè)關(guān)鍵詞的比重都為1/n,n為該教學(xué)資源的關(guān)鍵詞數(shù)量,一般為5~10個(gè)[4]。
2 用戶(hù)興趣的描述與獲取
(1) 用戶(hù)興趣的描述
用戶(hù)興趣即用戶(hù)的個(gè)性化特征,它是指由人類(lèi)個(gè)體特性所決定的其對(duì)英語(yǔ)教學(xué)資源的需求的特征信息的組合,也就是由特定用戶(hù)對(duì)英語(yǔ)教學(xué)資源需求的決定關(guān)系而產(chǎn)生的一系列對(duì)個(gè)體有用的信息。
在教學(xué)資源采用了以關(guān)鍵詞為特征后,用戶(hù)對(duì)某一教學(xué)資源的興趣就可以用他對(duì)該教學(xué)資源的這些關(guān)鍵詞的興趣。若用戶(hù)對(duì)某個(gè)教學(xué)資源有較大興趣就會(huì)花精力去獲取這些教學(xué)資源。由于Web用戶(hù)對(duì)教學(xué)資源的獲取的基本途徑是瀏覽,因此用戶(hù)的既往瀏覽教學(xué)資源中的包含該用戶(hù)的個(gè)性化特征,用戶(hù)對(duì)教學(xué)資源的訪(fǎng)問(wèn)的次數(shù)越多、最近訪(fǎng)問(wèn)時(shí)間越近,用戶(hù)對(duì)該教學(xué)資源的興趣度越高。即興趣強(qiáng)度應(yīng)包含訪(fǎng)問(wèn)次數(shù)和最近訪(fǎng)問(wèn)日期這兩個(gè)實(shí)際興趣指標(biāo)。
(2)用戶(hù)興趣的獲取
獲得反映用戶(hù)信息的個(gè)性化信息有這樣兩種方法:第一種方法是由系統(tǒng)記錄用戶(hù)的訪(fǎng)問(wèn)特征形成日志文件,然后通過(guò)分析該日志文件或由瀏覽器產(chǎn)生的日志文件總結(jié)出用戶(hù)興趣模型。第二種方法由用戶(hù)通過(guò)填寫(xiě)表單來(lái)提供自己的個(gè)性化特征信息。這種方式的優(yōu)點(diǎn)是用戶(hù)興趣模型的收斂快,并且能比較準(zhǔn)確地反映用戶(hù)的需要和興趣。需要用戶(hù)事先總結(jié)自己的信息需求。由于語(yǔ)言表達(dá)的問(wèn)題和分類(lèi)的模糊性與多樣性,用戶(hù)往往不能通過(guò)這種方法將信息需求表達(dá)清楚。另外,因?yàn)樗笥脩?hù)主動(dòng)填寫(xiě),所以系統(tǒng)不能主動(dòng)跟蹤用戶(hù)的興趣變化。
在本文所設(shè)計(jì)的系統(tǒng)中,對(duì)于新注冊(cè)用戶(hù),我們采用第二種方法來(lái)收集他們的初始個(gè)性化特征,對(duì)于已注冊(cè)用戶(hù),我們采用第一種方法來(lái)及時(shí)跟蹤他們的個(gè)性化特征。
3 向量空間模型
向量空間模型是由Salton提出的關(guān)于文檔表示的模型。它以特征項(xiàng)作為文檔表示的基本單位,特征項(xiàng)可以由字、詞或短語(yǔ)組成。所有的特征項(xiàng)構(gòu)成特征項(xiàng)集。每個(gè)文檔可以表示為一個(gè)向量,向量的維數(shù)是特征項(xiàng)集的個(gè)數(shù),向量的每個(gè)分量是特征項(xiàng)在文檔中出現(xiàn)的次數(shù)[5]。表達(dá)文檔和用戶(hù)興趣比較直接的做法是利用文檔特征。用戶(hù)興趣是多方面的,可以直接利用從瀏覽過(guò)的文檔中抽取的詞來(lái)表達(dá)用戶(hù)興趣。該方法不局限于預(yù)定義好的主題詞表,矢量的維數(shù)一般是不固定的,當(dāng)然也可以指定一個(gè)固定的大小。
采用向量空間模型表示文檔的特征后,用戶(hù)的興趣就可以看成是一個(gè)文檔,也就可以表示為一個(gè)向量U。文檔與用戶(hù)興趣的相似程度就可以用文檔向量V與用戶(hù)興趣向量U的余弦相似度sim(V,U)來(lái)表示。
4 信息過(guò)濾技術(shù)
目前人們習(xí)慣使用搜索引擎在廣闊的互聯(lián)網(wǎng)上獲取所需信息。但是當(dāng)人們輸入一個(gè)關(guān)鍵詞后,會(huì)有成百上千條乃至更多的信息被提供給用戶(hù),然而可能其中僅有一小部分信息滿(mǎn)足用戶(hù)的個(gè)性需求,甚至沒(méi)有。這就是所謂的信息龐大而知識(shí)匱乏。這就需要根據(jù)用戶(hù)的個(gè)性興趣進(jìn)行信息過(guò)濾,把所得到的不相關(guān)信息減至最小。
信息過(guò)濾技術(shù)(Information Filtering)正是為解決這一問(wèn)題而提出的[6]。它是用來(lái)描述尋找符合人們興趣的信息處理過(guò)程,也就是從大量的動(dòng)態(tài)信息中找出最忠實(shí)地滿(mǎn)足用戶(hù)所需信息的過(guò)程。它使用用戶(hù)模型(User Model)來(lái)描述用戶(hù)興趣主題,將新來(lái)的信息或者用戶(hù)檢索到的信息與用戶(hù)模型進(jìn)行相關(guān)度計(jì)算,然后對(duì)信息按相關(guān)度進(jìn)行排序,過(guò)濾掉不相關(guān)的或者相關(guān)度小于某一個(gè)閾值的信息。通過(guò)信息濾波,與用戶(hù)個(gè)性不相關(guān)的信息即用戶(hù)不感興趣信息被過(guò)濾掉了,反饋的結(jié)果都是用戶(hù)感興趣的信息,并按相關(guān)度大小排序。
二 模塊設(shè)計(jì)
ISMTR模型的主要功能是在網(wǎng)絡(luò)英語(yǔ)教學(xué)資源庫(kù)系統(tǒng)中學(xué)習(xí)和跟蹤用戶(hù)的個(gè)性化興趣,并根據(jù)用戶(hù)的個(gè)性化興趣特征對(duì)教學(xué)資源進(jìn)行過(guò)濾,幫助用戶(hù)在海量的網(wǎng)絡(luò)英語(yǔ)教學(xué)資源庫(kù)系統(tǒng)中快速而準(zhǔn)確檢索他所感興趣的教學(xué)資源。ISMTR模型的結(jié)構(gòu)如圖1所示:
(1)特征提取模塊實(shí)現(xiàn)根據(jù)用戶(hù)對(duì)英語(yǔ)教學(xué)資源瀏覽和相關(guān)反饋,來(lái)提取用戶(hù)感興趣的教學(xué)資源的特征信息,然后把這些特征信息保存在用戶(hù)個(gè)性特征庫(kù)中并及時(shí)跟蹤和更新。當(dāng)用戶(hù)在對(duì)教學(xué)資源進(jìn)行瀏覽、下載和檢索操作時(shí),特征提取模塊提取用戶(hù)個(gè)性化訪(fǎng)問(wèn)的特征信息,包括教學(xué)資源的關(guān)鍵詞、訪(fǎng)問(wèn)日期和累計(jì)訪(fǎng)問(wèn)次數(shù),并把這些信息保存在用戶(hù)個(gè)性特征庫(kù)中。
(2)用戶(hù)個(gè)性特征庫(kù)用于記錄用戶(hù)的個(gè)性化信息。它動(dòng)態(tài)跟蹤用戶(hù)的興趣,提取并記錄關(guān)鍵詞作為用戶(hù)個(gè)性特征,并為用戶(hù)模型構(gòu)建模塊提供用戶(hù)特征;
(3)用戶(hù)模型構(gòu)建模塊完成從用戶(hù)個(gè)性特征庫(kù)提取關(guān)鍵詞來(lái)構(gòu)成個(gè)體用戶(hù)模型;
(4)個(gè)性化教學(xué)資源過(guò)濾模塊是該ISMTR模型最重要的一個(gè)模塊,它可以根據(jù)用戶(hù)模型實(shí)現(xiàn)對(duì)英語(yǔ)教學(xué)資源的過(guò)濾;在我們的系統(tǒng)中,我們使用用戶(hù)興趣向量U來(lái)作為用戶(hù)模型(User Model),以此來(lái)描述用戶(hù)興趣主題;同時(shí)我們提取教學(xué)資源的關(guān)鍵詞來(lái)形成特征向量R。將用戶(hù)檢索到的教學(xué)資源的文檔特征向量R與用戶(hù)興趣向量U進(jìn)行余弦相關(guān)度計(jì)算,余弦值越大表明它們的相關(guān)度Sim(U,R)也就越大,反之則越小。計(jì)算公式如下:
(5)個(gè)性化檢索模塊是接受用戶(hù)的檢索請(qǐng)求,由過(guò)濾功能模塊根據(jù)用戶(hù)模型對(duì)英語(yǔ)教學(xué)資源進(jìn)行過(guò)濾,形成個(gè)性化檢索結(jié)果。用戶(hù)把自己的查詢(xún)需求表達(dá)成由關(guān)鍵詞組成的檢索詞或檢索表達(dá)式,通過(guò)用戶(hù)界面輸入到系統(tǒng);系統(tǒng)接收到用戶(hù)的檢索詞或檢索表達(dá)式后,由資源庫(kù)管理模塊依據(jù)查詢(xún)字段的匹配,從英語(yǔ)教學(xué)資源庫(kù)中查找出所有滿(mǎn)足條件的教學(xué)資源,形成第一次檢索結(jié)果;然后,由過(guò)濾功能模塊根據(jù)用戶(hù)模型對(duì)英語(yǔ)教學(xué)資源庫(kù)中符合第一次檢索結(jié)果的教學(xué)資源進(jìn)行過(guò)濾,得到按相關(guān)度排序的所有與用戶(hù)模型相關(guān)的教學(xué)資源,形成個(gè)性化檢索結(jié)果提交給用戶(hù)。
(6)英語(yǔ)教學(xué)資源庫(kù)保存英語(yǔ)教學(xué)資源的詳細(xì)信息,包括資源編號(hào)、資源名稱(chēng)、適用對(duì)象、內(nèi)容簡(jiǎn)介、關(guān)鍵詞、文件大小、存儲(chǔ)位置等。在這些屬性中,很重要的一項(xiàng)為關(guān)鍵詞屬性,它是教學(xué)資源的特征屬性。
(7)ISMTR模型的工作過(guò)程:首先由特征提取模塊來(lái)提取用戶(hù)感興趣的英語(yǔ)教學(xué)資源的特征信息,并把這些特征信息保存在用戶(hù)個(gè)性特征庫(kù)中并及時(shí)跟蹤和更新,其次由用戶(hù)模型構(gòu)建模塊根據(jù)用戶(hù)的個(gè)性化特征信息構(gòu)成用戶(hù)模型,然后由個(gè)性化教學(xué)資源過(guò)濾模塊根據(jù)用戶(hù)模型實(shí)現(xiàn)對(duì)教學(xué)資源的過(guò)濾,最后由個(gè)性化檢索模塊根據(jù)過(guò)濾結(jié)果實(shí)現(xiàn)個(gè)性化檢索。
三 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果分析
為了得到實(shí)驗(yàn)對(duì)比效果,我們把ISMTR系統(tǒng)進(jìn)行簡(jiǎn)化,去除與個(gè)性化服務(wù)相關(guān)的特征提取模塊、用戶(hù)模型生成模塊以及個(gè)性化教學(xué)資源過(guò)濾模塊,形成一個(gè)不具備個(gè)性化服務(wù)的對(duì)照實(shí)驗(yàn)系統(tǒng)作為對(duì)比。用戶(hù)在對(duì)照實(shí)驗(yàn)系統(tǒng)中進(jìn)行英語(yǔ)教學(xué)資源檢索時(shí),把自己的查詢(xún)需求表達(dá)成由關(guān)鍵詞組成的檢索詞或檢索表達(dá)式,通過(guò)用戶(hù)界面輸入到系統(tǒng);系統(tǒng)接收到用戶(hù)的檢索詞或檢索表達(dá)式后,由傳統(tǒng)的數(shù)據(jù)庫(kù)管理系統(tǒng)依據(jù)查詢(xún)字段的匹配,從教學(xué)資源庫(kù)中查找出所有滿(mǎn)足條件的教學(xué)資源,形成檢索結(jié)果。
信息過(guò)濾的主要技術(shù)包括三個(gè)方面:一是用戶(hù)模型和教學(xué)資源的表示技術(shù),二是匹配技術(shù),三是相關(guān)反饋的利用技術(shù)。系統(tǒng)中用戶(hù)模板和文檔的表示均采用向量空間模型,匹配技術(shù)采用計(jì)算向量空間距離的方法,相關(guān)反饋為用戶(hù)對(duì)于給出的教學(xué)資源做出明確的二元判斷,即“滿(mǎn)意”或者“不滿(mǎn)意”,其結(jié)果用來(lái)改進(jìn)特征項(xiàng)的比重,進(jìn)而影響相似度。
目前對(duì)信息檢索的代表性的評(píng)估標(biāo)準(zhǔn)為:查準(zhǔn)率(Precision)和查全率(Recall)。
這兩個(gè)指標(biāo)是目前信息服務(wù)系統(tǒng)最常用的指標(biāo),它們定義如下[7]:
查準(zhǔn)率=(過(guò)濾結(jié)果中符合用戶(hù)興趣的信息條數(shù))/(過(guò)濾結(jié)果得到得信息條數(shù));
查全率=(過(guò)濾結(jié)果中符合用戶(hù)興趣的信息條數(shù))/(信息源中符合用戶(hù)興趣的全部信息條數(shù))。
ITRDS系統(tǒng)注冊(cè)的用戶(hù)總數(shù)為40人,建立40個(gè)用戶(hù)個(gè)性特征庫(kù),興趣小組的人數(shù)為21人,教學(xué)資源庫(kù)規(guī)模為67個(gè),取相似度最大的前10篇教學(xué)資源提供給相應(yīng)的用戶(hù)。
通過(guò)實(shí)驗(yàn),ITRDS實(shí)驗(yàn)系統(tǒng)平均查準(zhǔn)率為0.2平均查全率為0.13;而對(duì)照實(shí)驗(yàn)系統(tǒng)平均查準(zhǔn)率為0.16平均查全率為0.09。
通過(guò)實(shí)驗(yàn),我們發(fā)現(xiàn)ITRDS系統(tǒng)的平均過(guò)濾精度要略大于對(duì)照實(shí)驗(yàn)系統(tǒng)的平均過(guò)濾精度,主要原因在于前者是根據(jù)用戶(hù)的個(gè)性化特征進(jìn)行教學(xué)資源過(guò)濾,其結(jié)果更具有針對(duì)性。由此可得,我們?cè)O(shè)計(jì)的具有用戶(hù)個(gè)性特征學(xué)習(xí)功能和過(guò)濾功能ISMTR模型能有效地提高英語(yǔ)教學(xué)資源服務(wù)中個(gè)性化檢索的查全率和查準(zhǔn)率。
然而,本文所設(shè)計(jì)的ISMTR模型主要針對(duì)的是海量數(shù)據(jù)庫(kù),對(duì)于小規(guī)模的數(shù)據(jù)庫(kù),它的優(yōu)勢(shì)不明顯。此外,用戶(hù)個(gè)性化特征有著一定的滯后性,需要經(jīng)過(guò)多次學(xué)習(xí)后才能收斂。
四 結(jié)束語(yǔ)
在英語(yǔ)教學(xué)資源的應(yīng)用中,每個(gè)學(xué)習(xí)者有各自不同的背景、語(yǔ)言、文化、興趣愛(ài)好,他們的學(xué)習(xí)起點(diǎn)、學(xué)習(xí)風(fēng)格、學(xué)習(xí)愿望、學(xué)習(xí)步調(diào)等方面存在個(gè)體差異,有各自不同的學(xué)習(xí)路徑和學(xué)習(xí)方法。建設(shè)適應(yīng)用戶(hù)個(gè)性化學(xué)習(xí)需要的教學(xué)資源個(gè)性化檢索模型將有助于英語(yǔ)教學(xué)資源庫(kù)的有效運(yùn)用,同時(shí)為用戶(hù)選擇更需要的教學(xué)資源,滿(mǎn)足各種用戶(hù)不同的個(gè)性化需求,使每個(gè)學(xué)習(xí)者能夠在特長(zhǎng)領(lǐng)域中得到充分發(fā)展。
參考文獻(xiàn)
[1] 沈彩芬.網(wǎng)絡(luò)多媒體環(huán)境下的外語(yǔ)教學(xué)特征及其原則[J]. 外語(yǔ)電化教學(xué),2008,121(5): 23-27.
[2] 教育部.現(xiàn)代教育技術(shù)規(guī)范[M], 北京:清華大學(xué)出版社,2001:21-23.
[3] 李寶敏.從知識(shí)管理的角度看遠(yuǎn)程教育中個(gè)性化資源庫(kù)的建設(shè)[J]. 中國(guó)遠(yuǎn)程教育,2003,192(3):28-30.
[4] 寇興權(quán), 劉興環(huán). 遠(yuǎn)程教育資源的描述、組織和管理系統(tǒng)設(shè)計(jì)[J]. 控制工程,20029,(4):35-37.
[5] Yan T W, at al. Index structure for information filtering under the vector space model[R]. Technical Report STAN CS 93. Stanford University. 1993.
[6] 曾春, 邢春曉, 周立柱. 基于內(nèi)容過(guò)濾的個(gè)性化搜索算法[J]. 軟件學(xué)報(bào),2003,14(5):999-1004.
[7] 徐小琳. 信息過(guò)濾技術(shù)和個(gè)性化信息服務(wù)[J]. 計(jì)算機(jī)工程與應(yīng)用, 2003,16(9):182-184.