陳 俊,許東民,蒲 實
成都醫(yī)學(xué)院教育技術(shù)中心,成都 610083
隨著高校網(wǎng)絡(luò)教學(xué)快速、深入地發(fā)展,構(gòu)建教學(xué)資源庫成為網(wǎng)絡(luò)教學(xué)的首要基礎(chǔ)任務(wù),也成為教育技術(shù)網(wǎng)絡(luò)應(yīng)用的重要課題。雖然各高校都進(jìn)行了不同程度的資源庫建設(shè),但存在的問題不少,主要表現(xiàn)在:資源結(jié)構(gòu)單一、查詢不便、利用率低、動態(tài)性與共享性差,以及未實現(xiàn)個性化與智能化服務(wù)幾個方面。
基于這些問題,該文借鑒Web 3.0的網(wǎng)絡(luò)理念提出構(gòu)建智能化醫(yī)學(xué)資源庫的設(shè)想。智能化資源庫對學(xué)習(xí)者來說應(yīng)該是一個開放的、動態(tài)的平臺。資源庫的內(nèi)容不僅包括教師所提供的資源,還應(yīng)包括學(xué)習(xí)者在學(xué)習(xí)過程中所產(chǎn)生的顯性和隱性知識,如學(xué)習(xí)經(jīng)驗、常見問題以及潛在的智力資源等[1]。在內(nèi)容的添加和查詢方面,智能化資源庫對不同用戶提供的信息推薦和搜索過濾都是不同的,以真正體現(xiàn)網(wǎng)絡(luò)的個性化智能服務(wù)。
互聯(lián)網(wǎng)專家認(rèn)為,對于普通用戶而言,Web 3.0帶來的最大好處就是讓你擁有了一個貼身的私人助理。根據(jù)專家們的觀點,Web 3.0時代網(wǎng)絡(luò)對你無所不知,可以自主地在互聯(lián)網(wǎng)上查詢所有信息來回答任何問題[2]。許多專家把Web 3.0比做為龐大的數(shù)據(jù)庫,如果說Web 2.0應(yīng)用于互聯(lián)網(wǎng)是為了把人與之間聯(lián)系起來,而Web 3.0應(yīng)用于互聯(lián)網(wǎng)則是為了把信息與信息聯(lián)系起來。Web 3.0的最大價值不是提供信息,而是提供基于不同需求的過濾器,每一種過濾器都是基于一個市場需求[3]。
今天,當(dāng)用戶使用互聯(lián)網(wǎng)搜索引擎時,搜索引擎其實并不真正理解用戶要搜索的東西。它只是簡單地、機械地查找與搜索框中的關(guān)鍵字相關(guān)聯(lián)的眾多網(wǎng)頁,而無法告訴某網(wǎng)頁是不是真與你搜索的東西相關(guān)。換句話說,它只能告訴你關(guān)鍵字出現(xiàn)在該網(wǎng)頁上,至于是否是用戶所希望查找的東西則與我無關(guān)。Web 3.0時代是把整個互聯(lián)網(wǎng)視為一個龐大的信息數(shù)據(jù)庫,可以滿足任何查詢要求。用戶只要發(fā)出一個很簡單的指令,剩下的事情則交給互聯(lián)網(wǎng)處理,互聯(lián)網(wǎng)完全可以替用戶做所有工作:它會根據(jù)用戶的愛好確定搜索參數(shù),以縮小搜索服務(wù)的范圍;然后,瀏覽器程序會收集、分析數(shù)據(jù)并提供給用戶,便于用戶進(jìn)行比較。瀏覽器之所以有這個本領(lǐng),是因為Web 3.0能夠“理解”網(wǎng)上的信息[2]。
借助Web 3.0,每個用戶會有一個獨有的互聯(lián)網(wǎng)配置文件,該配置文件基于該用戶的用戶信息以及瀏覽歷史記錄所形成。Web 3.0會使用該配置文件為每個用戶提供獨特的瀏覽體驗。這意味著,如果兩個不同的人使用相同的服務(wù),用相同的關(guān)鍵字在網(wǎng)上搜索,他們會得到由各自配置文件決定的不同搜索結(jié)果[2]。
Web 3.0采用智能整合的方式為用戶提供一種方便管理資源和有效查找信息的全新服務(wù)模式,開啟了高效、鮮活而且個性化的網(wǎng)絡(luò)新時代[4]。那么,我們就可以利用Web 3.0的理念來構(gòu)建智能化的資源庫。將用戶的愛好和資源本身的相關(guān)性作為設(shè)計的主要考慮因素,構(gòu)建完備的內(nèi)容聚合與應(yīng)用聚合平臺,創(chuàng)造出更加個性化、智能化、搜索反應(yīng)迅速而又準(zhǔn)確的資源庫。
資源建設(shè)要以學(xué)習(xí)者為中心,能滿足學(xué)習(xí)者個性化學(xué)習(xí)需要,使其成為開放的、動態(tài)的資源庫,以促進(jìn)知識的共享、交流與創(chuàng)新。Web 3.0的理念與服務(wù)對個性化資源庫的建設(shè)有著非常重要的啟發(fā)和指導(dǎo)意義。在傳統(tǒng)的數(shù)據(jù)庫基礎(chǔ)上,我們可以加入更多智能化、個性化的元素[5],具體可以體現(xiàn)在以下幾個方面:
系統(tǒng)根據(jù)用戶個人資料及瀏覽歷史可自動為每位用戶創(chuàng)建個人書簽,用戶也可自行查看并管理。書簽資料庫通常按照“自定義書簽”、“我的瀏覽歷史記錄”、“我的收藏”、“我的資源傳遞”等文件夾進(jìn)行分類[6]。點擊書簽欄的條目名稱即可訪問與資料庫相對應(yīng)資源。
基于醫(yī)學(xué)知識的相關(guān)性,系統(tǒng)在資源查詢的同時,會提供給用戶相關(guān)知識點的資源情況或關(guān)注情況,將原本相對獨立的資源建立起關(guān)聯(lián),提高資源利用率。即,由原來資源“點”的關(guān)系變成了“面”的關(guān)系。
Web 3.0的核心軟件技術(shù)是人工智能,它可以模仿、補充人類思維行為。因此,它具備較強的學(xué)習(xí)能力[5]。當(dāng)用戶瀏覽資源時,系統(tǒng)會根據(jù)該用戶訪問各類資源的次數(shù)和周期來判斷其最感興趣的資源。當(dāng)再次訪問資源庫時,資源庫就可以自動識別用戶最喜愛的資源科目及類別,并結(jié)合用戶自身信息、其他用戶的信息使用情況將其顯示為效果令人驚嘆的圖形預(yù)覽墻,即資源瀏覽首選推薦[2]。這樣,用戶可高效地找到自己關(guān)心的資源并進(jìn)行訪問。隨著訪問次數(shù)的增加,系統(tǒng)會更了解用戶,并為用戶列出的資源目錄中首選資源推薦會隨之改變,以精確定位用戶的興趣并適應(yīng)用戶日益提升的品位。
在用戶上傳資料的同時,提供資源庫里相關(guān)資料的存在情況和使用情況明細(xì),這樣可以防止資源的重復(fù),節(jié)約資源庫空間。同時,用戶可以清晰地看見該類資源的庫存情況,便于補缺,在不斷完善中構(gòu)建多元化資源庫。目前,對于信息的相似度比較只能借鑒關(guān)鍵字的描述,未來信息的比較不僅限于此,而是可以對圖形像素、視頻截圖進(jìn)行比對,給出信息重復(fù)的建議就會更加精確。
對于搜索引擎來說,Web 3.0的到來就是智能語意搜索的到來[2]。智能搜索具有比較復(fù)雜的邏輯判斷能力,能針對搜索人不同身份、不同要求而調(diào)整搜索結(jié)果及信息排列順序,使搜索更加人性化和智能化。Web 3.0時代的網(wǎng)絡(luò)是智能網(wǎng)絡(luò),這是一個以整個互聯(lián)網(wǎng)為基礎(chǔ),聚合了所有知識的平臺,用戶可以透過Web 3.0的技術(shù),非常高效地獲取所需要的知識,“拼湊”出自己所需要的信息和電子服務(wù)平臺[5]。當(dāng)用戶輸入比較模糊的問題時,如“檢驗系大一本科的婦產(chǎn)基礎(chǔ)”,搜索引擎立即返回給用戶有關(guān)檢驗系大一本科學(xué)生應(yīng)該學(xué)習(xí)的婦產(chǎn)科學(xué)中的檢驗科目相關(guān)內(nèi)容。完全拋棄了現(xiàn)在網(wǎng)絡(luò)的關(guān)鍵詞搜索,實現(xiàn)真正的智能。另一方面,搜索引擎具有超強的糾錯能力。對錯別字、地方口語、模糊概念等都能夠理解并給出用戶想要的結(jié)果。如“上半身平片圖”這樣的搜索問題,引擎也能給出正確的胸部X光片資料圖。
智能庫下一步要解決的重點問題是可視化搜索。在搜索建議中應(yīng)加入更加豐富多彩的內(nèi)容,不僅僅是文字條目,而且應(yīng)加入圖片或視頻性質(zhì)的信息。這讓我們可以有的放矢,從而能更加準(zhǔn)確地查找出想要獲得的內(nèi)容。
智能化服務(wù)雖然是全球研究的熱點,但在網(wǎng)上目前很難找到國內(nèi)外關(guān)于智能化服務(wù)模型構(gòu)建的相關(guān)報道,在僅有的一些報道中主要做法是提供個性化的服務(wù)和基于不同需求的過濾服務(wù)來構(gòu)建智能化服務(wù)模型。其較成熟的過濾模型主要有布爾模型、向量空間模型和概率模型三種。無論是哪種模型都涉及到4個基本問題:用戶興趣如何表示,信息特征如何選擇,如何計算信息和用戶興趣的相似程度,如何根據(jù)用戶的反饋信息自動更新用戶興趣[7]。
圖1 智能化服務(wù)操作模式框圖
針對以上4個問題,并接合醫(yī)學(xué)院校的實際情況,在充分分析各知識點間密切相關(guān)性的基礎(chǔ)上,我們可以通過以下幾個步驟來實現(xiàn)(如圖1所示)。在用戶個人信息錄入的時候,先對其專業(yè)需求和所關(guān)注信息進(jìn)行收集,以便構(gòu)建一個用戶基本信息模塊。另一方面對用戶的一些個性信息,比如用戶經(jīng)常訪問的欄目、感興趣的信息內(nèi)容、網(wǎng)頁停留時間、訪問的頻率等相關(guān)信息進(jìn)行采集,構(gòu)建一個用戶個性信息模塊。然后將兩模塊的數(shù)據(jù)進(jìn)行統(tǒng)計、比較、分析,得出該用戶獨有的配置文件。根據(jù)此配置文件,結(jié)合Web 3.0的智能核心部分即信息集合體,系統(tǒng)就能夠輕松地從數(shù)據(jù)資源庫里選擇適合的信息資料反饋給該用戶,這種搜索結(jié)果將更加契合用戶自身的需求。用戶配置文件是動態(tài)更新的,隨著個性信息的不斷采集,分析次數(shù)的不斷增加,配置文件會越來越迎合用戶的心意,變得“聰明又貼心”。
3.2.1 分析引擎 有相當(dāng)多的用戶提供的初始信息量明顯不足,這是造成容易產(chǎn)生過濾結(jié)果偏差的主要原因。因此,系統(tǒng)必須根據(jù)各種方式補足用戶信息,進(jìn)行用戶需求的擴展。用戶需求擴展的方法很多,可分為基于語義的方法和基于統(tǒng)計的方法[7]?;谡Z義的方法是分析用戶需求的含義,尋找語義上最相似的信息進(jìn)行擴展,如同義詞、近義詞等?;诮y(tǒng)計的方法由用戶個性信息模塊來完成,即對用戶常訪問的欄目、信息內(nèi)容,某主題網(wǎng)頁的停留時間、訪問的頻率等相關(guān)信息進(jìn)行采集。在分析引擎中根據(jù)采樣的統(tǒng)計結(jié)果對不同的信息乘以不同的權(quán)重,再配合用戶基本信息需求就能計算出貼合心意的用戶配置文件。某類信息訪問次數(shù)越多,訪問時間越長,則權(quán)重值越大,在配置文件中就越能被體現(xiàn)出來。
3.2.2 信息集合體 如何把數(shù)據(jù)庫的資源聯(lián)系在一起?系統(tǒng)如何知道每位用戶應(yīng)具備的知識結(jié)構(gòu),每個知識點是基于哪些基礎(chǔ)知識點構(gòu)成?顯然,這些問題的解決完全取決于數(shù)據(jù)庫的理解能力,它應(yīng)該如同一本詞典一樣,定義了所有醫(yī)學(xué)知識之間的聯(lián)系,定義了很多詞語之間的語義關(guān)聯(lián)。我們將此模塊稱為信息的集合體,也叫做本體(ontology)。本體會以元數(shù)據(jù)(元數(shù)據(jù)是指網(wǎng)頁代碼中所含的人類看不見而計算機能讀取的信息)的形式存在[1]。本體其實是一個文件,包含了很多的解釋性信息。比如:“檢驗醫(yī)學(xué)這個詞語是對來自人體的材料進(jìn)行生物學(xué)、微生物學(xué)、血清學(xué)、化學(xué)、血液免疫學(xué)、生物物理學(xué)、細(xì)胞學(xué)、病理學(xué)等檢驗[8]”。這樣一句話就在這些學(xué)科之間建立了聯(lián)系,一個檢驗系的用戶在查看資源庫時就可能得到許多生物學(xué)、病理學(xué)等方面的信息提示和搜索建議。又比如“X光片俗稱平片”。當(dāng)用戶在輸入“平片”時,資源庫可以立刻理解為X光片。多個這樣的元數(shù)據(jù)匯聚到一起就把整個醫(yī)學(xué)之間的牽連勾畫出來了。數(shù)據(jù)庫實際上就會變成一個巨大的大腦組織,能夠分析數(shù)據(jù),并根據(jù)這些信息得出新想法。以至于當(dāng)用戶輸入比較模糊的問題,如“檢驗系大一本科的婦產(chǎn)基礎(chǔ)”時,搜索引擎也能立即明白并給出搜索結(jié)果。
數(shù)據(jù)庫搜索引擎要成為善解人意的幫手,本體內(nèi)容就必須詳細(xì)而全面。但構(gòu)建本體需要大量的工作。實際上這也是智能化服務(wù)的重大障礙之一。醫(yī)學(xué)發(fā)展到今天,各學(xué)科之間充斥著千絲萬縷的聯(lián)系,我們要把這一切知識點的解釋和互相之間的聯(lián)系都錄入到本體不是短時間能夠完成的,更不是幾個人就能夠做到的。本體的創(chuàng)建、維護和更新需要大量醫(yī)學(xué)工作者長期不懈努力、積累才能逐步完善起來。
Web 3.0的提出迫使我們轉(zhuǎn)變思想觀念,從個性化服務(wù)、智能化管理的角度來構(gòu)建網(wǎng)站。該文僅對Web 3.0的醫(yī)學(xué)資源庫系統(tǒng)進(jìn)行了初步探討,該系統(tǒng)的建設(shè)可解決當(dāng)前教學(xué)資源在教學(xué)實踐中普遍存在的諸如資源結(jié)構(gòu)單一,資源庫利用率低,動態(tài)性、共享性差,隱性知識缺乏[9]等問題。即,建立一個個性化、功能強大的師生共建、共享平臺,更好地為用戶提供豐富的、易獲取的、確實需要的信息資源,實現(xiàn)教學(xué)資源的交互性及動態(tài)性增長。智能化資源庫在醫(yī)學(xué)中應(yīng)用意義顯著,它將醫(yī)學(xué)各門類的信息聯(lián)系起來,形成一個巨大的醫(yī)學(xué)信息網(wǎng),使醫(yī)學(xué)真正成為一個整體。下一步我們研究重點是如何提高系統(tǒng)的理解能力和學(xué)習(xí)能力,如何自動生成資源的特征描述,尤其是如何對手術(shù)、病例等圖像及視頻信息特征的提取,使用戶從手動輸入資源特征信息中解放出來,實現(xiàn)進(jìn)一步的智能化。
[1]百度文庫.網(wǎng)上醫(yī)學(xué)搜索引擎與網(wǎng)上醫(yī)學(xué)數(shù)據(jù)庫簡介[EB/OL].http://wenku.baidu.com/view/1c4c324cf7ec4afe04a1 df8c.html,2010-09-18
[2]PHP100中文網(wǎng).Web 3.0時代:網(wǎng)絡(luò)對你無所不知[EB/OL].http://www.php100.com/html/phpnews/PHPxinwen/2010/0528/4607.html,2010-05-28
[3]中文業(yè)界咨詢網(wǎng).擁抱Web 3.0[EB/OL].http://www.cnbeta.com/articles/62523.htm,2008-08-17
[4]百度百科.Web 3.0[EB/OL].http://baike.baidu.com/view/269113.h tm,2010-10-19
[5]邢方,張林.Web 3.0技術(shù)發(fā)展對網(wǎng)絡(luò)學(xué)習(xí)的啟示[J].科技信息:學(xué)術(shù)研究,2008,25(16):7-8
[6]孫毅,王子鵬.從Web 3.0的角度暢想檔案網(wǎng)絡(luò)服務(wù)的未來[J].云南檔案,2009,27(7):14-16
[7]于滿泉,許洪波,趙章界,等.基于內(nèi)容的個性化信息過濾系統(tǒng)的研究與設(shè)計[J].計算機工程,2005,31(12):78-80
[8]百度百科.醫(yī)學(xué)檢驗學(xué)[EB/OL].http://baike.baidu.com/view/2557661.htm,2010-07-01
[9]臧玉春,劉春宇.高校校園網(wǎng)應(yīng)用現(xiàn)狀的分析與探討[J].長春工業(yè)大學(xué)學(xué)報:高教研究版,2004,24(3):34-34