岳琳 王戰(zhàn)林 劉江寧
(1.東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院,長春 130117;2.新疆師范大學(xué)圖書館,烏魯木齊 830001)
電子圖書指以數(shù)字代碼方式將圖、文、聲、像等信息存儲在磁、光、電介質(zhì)上,通過計算機或其他終端設(shè)備供用戶使用,并指可復(fù)制發(fā)行的圖書、期刊、報紙及軟件讀物等,包括印刷型書刊的數(shù)字化和數(shù)字化出版的書刊。智能手機、電子書閱讀器和平板電腦等是配備電子閱讀器軟件的手持電子設(shè)備,可閱讀各種電子圖書和其他數(shù)字化的文獻。其中,一些文檔格式是獨立的,而另一些則會把用戶閱讀喜好存儲于正式記錄的系統(tǒng)中(如學(xué)習管理系統(tǒng))。為滿足用戶日益增長的電子閱讀需求,出版商和科技公司提供越來越多的電子圖書和電子閱讀設(shè)備。出版商對數(shù)字格式內(nèi)容的接受程度和受歡迎程度的提高,以及學(xué)術(shù)界電子內(nèi)容使用量的大幅增加,對教育生產(chǎn)力產(chǎn)生重要影響。
電子閱讀平臺包括電子閱讀器和平板電腦,已經(jīng)被大學(xué)生廣泛使用[1]。盡管數(shù)字書籍和高等教育的數(shù)字化教學(xué)被認為是有利的,但由于大多數(shù)高等教育受教育者要為所學(xué)內(nèi)容付費,因此,尋找相應(yīng)的互動平臺用于知識獲取、學(xué)習和傳播,更有助于提高信息利用率。
學(xué)者們對移動學(xué)習環(huán)境下電子閱讀平臺的功效展開了相關(guān)研究。Braun[2]發(fā)現(xiàn)Kindle電子閱讀器有助于鼓勵協(xié)作,用戶可以利用該設(shè)備突出特定段落,并讓其他用戶看到評論。
電子書具有可移植性、存儲性、交互性及快速發(fā)布和更新等特征[3]。William[4]研究表明,電子教科書對學(xué)術(shù)成果的取得有積極影響。Tonkery[5]提出當下學(xué)生更傾向于通過電子設(shè)備,如利用電腦或平板電腦等搜索參考資料,而不是到圖書館進行研究。一些電子文檔和書籍以可移植的文檔格式呈現(xiàn),另一些則被稱為圖書應(yīng)用程序,其功能較多,可增強用戶體驗,特色包括嵌入視頻、自我檢查測驗、互動填字游戲,以及推薦其他與興趣相關(guān)的資源[6]。這些特色中,視覺吸引力能達到傳統(tǒng)印刷書籍所不可能達到的效果。
電子教科書和教學(xué)輔助工具正迅速發(fā)展,而不僅局限于現(xiàn)有印刷產(chǎn)品的數(shù)字版本。電子教科書整合視頻、圖表、動畫的特征并具有交互功能。教師意識到這可以為學(xué)生提供一種完全不同的閱讀體驗,而這些體驗與建構(gòu)性學(xué)習技術(shù)更緊密地結(jié)合在一起。電子閱讀平臺的建構(gòu)與支持性的學(xué)習環(huán)境和活動有關(guān),這些活動可以為學(xué)生提供接觸數(shù)字化學(xué)習資源的機會[7]。Lamb[8]認為采用電子閱讀平臺進行閱讀對學(xué)生是一種完全不同的體驗,有別于傳統(tǒng)教科書的閱讀。閱讀電子文本不是簡單地理解文字,如在學(xué)生閱讀課文時幫助其構(gòu)思新情節(jié),這些新情節(jié)可能會有不同的結(jié)果而不僅是一種線性結(jié)果。電子格式的文本閱讀需要學(xué)習新的操作方法,如數(shù)字筆記、高亮顯示、搜索、虛擬書簽和詞匯表、屏幕分辨率設(shè)置、頁面重置、文字大小設(shè)置及文本朗讀等。由于許多電子文本中嵌入了多媒體功能,教師的目標更多地將課件整合到多模態(tài)的學(xué)習模式中以供學(xué)生使用。印刷文本主要側(cè)重視覺化,而電子文本具有更多的學(xué)習方式(包括聽覺和動覺),從而加強學(xué)生的參與度和強化回憶。
目前,對電子閱讀平臺的研究有很多,側(cè)重于兩個主要驅(qū)動因素:電子書的使用如何幫助提高教學(xué)效率;通過提高閱讀理解能力,提高學(xué)生的積極性和參與度。多數(shù)學(xué)者側(cè)重于研究電子內(nèi)容對基本學(xué)術(shù)成就的影響[9-12]。Horne[13]發(fā)現(xiàn),閱讀理解與電子閱讀平臺的使用存在正相關(guān)關(guān)系。尤其當圖書可在移動設(shè)備進行交互式閱讀時,包括文本、插圖、敘述,可增加學(xué)生的積極性及參與度。Huang等[14]發(fā)現(xiàn),在使用智能手機、電子閱讀器和平板電腦時沒有互動功能,對學(xué)生的閱讀理解沒有顯著影響;同時也發(fā)現(xiàn)如果電子閱讀平臺能夠跟蹤學(xué)生的學(xué)習過程,為學(xué)生設(shè)計更好的干預(yù)措施,那么電子閱讀平臺將是有益的。在教育研究中,學(xué)習動機和學(xué)術(shù)成就存在積極關(guān)系,盡管還需要更多的研究來探討電子閱讀平臺使用和過度使用的直接聯(lián)系。
Stephens[15-17]介紹試點項目:將Nook分配給50名學(xué)生分別使用一個學(xué)期,以研究《神曲》和其他公共領(lǐng)域的主題。對學(xué)生們使用設(shè)備的調(diào)查結(jié)果表明,學(xué)生們喜歡這些設(shè)備,由于設(shè)備可以存儲多個主題,因此可以減少去圖書館的次數(shù)。學(xué)生對這些設(shè)備的反饋非常積極。Mcclanahan等[12]對一名患有自閉癥的學(xué)生進行案例研究,發(fā)現(xiàn)利用平板電腦進行閱讀干預(yù),使學(xué)生在六周的時間里獲得的閱讀理解效果相當于普通用戶一年的進步。雖然僅通過該案例不能得出所有患有自閉癥或其他疾病的學(xué)生都能受益于此結(jié)論,但可以看到具有多媒體功能的電子書,可以幫助教師提供多樣的干預(yù)手段,用于特殊學(xué)習者。
電子閱讀平臺面臨的基本挑戰(zhàn)包括:電子閱讀平臺上的內(nèi)容有可能使學(xué)生承擔獲取閱讀資料的經(jīng)濟成本,特別是在公共領(lǐng)域和版權(quán)允許范圍外的資料;硬件設(shè)備和平臺的采購成本可能會讓教育機構(gòu)望而卻步;當前不同類型的移動設(shè)備和內(nèi)容提供商的文獻格式多樣且互不兼容;電子文獻需要不侵犯知識產(chǎn)權(quán)和克服無可用性障礙等。但真正制約電子閱讀平臺發(fā)展的核心挑戰(zhàn)在于以下方面。
(1)用戶偏好問題。平臺的兼容性、不侵犯知識產(chǎn)權(quán)及無可用性障礙,須依賴硬件的升級、法律法規(guī)的健全及行業(yè)統(tǒng)一標準的制定。從技術(shù)角度來看,平臺創(chuàng)建者和內(nèi)容提供商必須首要解決用戶偏好問題,才能將恰當?shù)碾娮觾?nèi)容推送到信息資源獲取者手中,使其在學(xué)習和教學(xué)實踐中發(fā)揮更大的作用。社會化搜索基于Web 2.0,強調(diào)用戶的參與,是社會化網(wǎng)絡(luò)帶來的一項變革。社會化網(wǎng)絡(luò)的出現(xiàn)為用戶帶來了更加豐富多樣的信息資源(如博客、微博、論壇等),如何充分分析資源并獲得用戶偏好,為用戶提供更加優(yōu)質(zhì)的服務(wù)應(yīng)引起學(xué)術(shù)界和商家的高度關(guān)注。
(2)智能化搜索問題。工業(yè)4.0發(fā)展時期,智慧圖書館強調(diào)信息處理的智能化,其通過物聯(lián)網(wǎng)、搜索技術(shù)及AI實現(xiàn)智慧化的服務(wù)和管理,改變傳統(tǒng)圖書館的服務(wù)方式。隨著用戶對搜索引擎依賴性的增強,必將促進電子閱讀平臺的不斷發(fā)展,由此引發(fā)相關(guān)產(chǎn)品的不斷更新?lián)Q代,搜索技術(shù)也必將成為電子閱讀平臺發(fā)展中最具競爭力的增長點。因此,如何利用用戶“痕跡”,進行智能化分析,以更精準地服務(wù)用戶,顯得更加重要。
電子閱讀平臺在給用戶提供豐富信息內(nèi)容的同時,也為用戶帶來信息選擇困擾,使用戶陷入“信息過載”和“資源迷向”的困境。用戶不再滿足于傳統(tǒng)電子閱讀平臺提供的檢索結(jié)果,而是轉(zhuǎn)向結(jié)構(gòu)化、細粒度、精準化的信息檢索需求,因此,出現(xiàn)了社會化搜索。社會化搜索可以使用戶在特殊的語境下深入地、精確地搜索,還可以從社區(qū)中學(xué)習,使搜索結(jié)果與用戶的興趣更加匹配。
社會化搜索概念目前還沒有統(tǒng)一的權(quán)威定義,學(xué)術(shù)界存在不同理解。一種是從群體智慧角度出發(fā),認為社會化搜索是人的因素體現(xiàn)在網(wǎng)絡(luò)用戶在信息檢索過程中的行為。維基百科將社會化搜索定義為用戶使用提問回答。百度百科直接將其描述為通過搜索形成有共同愛好的人際圈,繼而搜索每個用戶的愛好和收藏情況,為用戶提供更準確的信息。Sherman[18]將社會化搜索定義為“依據(jù)人類判斷的互聯(lián)網(wǎng)查詢方法,這些判斷以標簽、點擊,搜索歷史及其他動作為因素”,協(xié)同搜索從該角度研究社會化搜索[19]。另一種從專家智慧角度出發(fā),認為社會化搜索是基于社會網(wǎng)絡(luò)的、對具備某種特性的用戶進行搜索[20-21]。20世紀60年代末的六度分割實驗就是基于社交網(wǎng)絡(luò)對用戶的搜索[22-23]。
從學(xué)術(shù)界的理解看,社會化搜索強調(diào)信息搜索中的用戶因素,包括任何具有相關(guān)用戶活動的應(yīng)用,有效地整合了搜索和社區(qū),形成新的信息交流平臺。為使電子閱讀平臺更好地為用戶服務(wù),使用戶擺脫“信息過載”的困擾,進一步對社會化搜索進行分析,認為與用戶使用電子閱讀平臺相關(guān)的內(nèi)容主要包括社區(qū)問答、社區(qū)協(xié)同搜索和人物社會關(guān)系搜索。
社區(qū)問答系統(tǒng)使用論壇技術(shù)創(chuàng)造網(wǎng)絡(luò)社交空間,用戶以問答的方式交換知識和經(jīng)驗。在線環(huán)境下,分享共同興趣的用戶可以進行交互,形成虛擬用戶群組(即社區(qū))。問答社區(qū)具有臨時性,加入社區(qū)不必通過正式機制。在問答社區(qū)中,用戶通過問答分享知識,目的是集結(jié)用戶的經(jīng)驗和專長,使用戶找到滿意答案。社區(qū)問答系統(tǒng)作為一種新興的知識共享模式,其具有的交互性、開放性、靈活性特點吸引大量用戶參與,且存儲大量已經(jīng)解決的問題,能夠更好地為用戶提供個性化信息服務(wù),這對于滿足用戶進一步的信息需求,實現(xiàn)用戶之間的知識共享具有重要意義。
電子閱讀平臺中增加社區(qū)問答模塊,以新的途徑獲取用戶需求或興趣信息,從而針對性地提供內(nèi)容推薦服務(wù)。構(gòu)建初始模型可利用用戶興趣模型刻畫和存儲用戶興趣,然后分析用戶在社會化搜索系統(tǒng)中的行為活動信息,豐富用戶興趣模型。首先,對用戶的提問、回答、收藏和評價的答案使用分詞工具進行分詞和詞性標注,并抽取實意詞(特別是領(lǐng)域概念),將其表示為文本向量;其次,使用層次聚類算法,以用戶的提問、回答、收藏和評價的答案為語料,借助通用本體,構(gòu)建用戶興趣專用本體;最后,使用用戶興趣專用本體,豐富用戶興趣模型。
社區(qū)問答系統(tǒng)主要包括用戶行為分析、問題推薦和答案檢索。社區(qū)問答子框架如圖1所示。首先,以三元組資源描述方式存儲數(shù)據(jù),完整保存數(shù)據(jù)資源的語義信息,以準確分析用戶行為,構(gòu)建用戶興趣模型和權(quán)威度模型;其次,運用語義網(wǎng)技術(shù)從知識層面進行推薦;最后,利用通用本體解析查詢語義的方法,在已解答數(shù)據(jù)庫中尋找與之相似的問題,并依據(jù)問題相似度、回答者的權(quán)威度和用戶評價等因素將排序答案返回給用戶,完成答案檢索,最終實現(xiàn)基于群體智慧的知識共享平臺。
圖1 社區(qū)問答
利用一般搜索引擎進行關(guān)鍵字匹配得到的信息中存在大量冗余和不精確信息,而反饋信息的不精確很大程度上是由于沒有加入用戶領(lǐng)域信息。為有效快速地從互聯(lián)網(wǎng)中獲得精確信息,在搜索過程中加入用戶意愿成為必需。協(xié)同Web搜索是近年來在搜索引擎快速發(fā)展、用戶數(shù)量高速增長、用戶產(chǎn)生信息不斷增多及用戶搜索任務(wù)交流頻率增大等驅(qū)動下,形成的一個新的信息檢索研究方向。社區(qū)協(xié)同搜索建立在對互聯(lián)網(wǎng)用戶信息查詢活動記錄的基礎(chǔ)上,首先規(guī)范查詢關(guān)鍵字,并將規(guī)范后的查詢式提交給大型搜索引擎,對返回結(jié)果進行排序,與此同時,分析用戶查詢活動記錄,得出用戶的領(lǐng)域信息和興趣偏好,使排序結(jié)果能夠更符合用戶的查詢需求,達到有效快速提取信息的目的,實現(xiàn)網(wǎng)頁搜索的個性化服務(wù)。
結(jié)合社區(qū)協(xié)同搜索,首先分析社區(qū)中的用戶行為,得到社區(qū)模型;然后對查詢進行解析、重構(gòu)和分發(fā),從而改進查詢處理;最后,依據(jù)用戶興趣及用戶行為對查詢結(jié)果進行處理,以得到更準確的查詢結(jié)果。具體如圖2所示。首先,通過社區(qū)挖掘算法,挖掘有共同興趣的用戶,再從收藏列表和點擊歷史數(shù)據(jù)庫,獲得社區(qū)內(nèi)每個用戶的收藏列表和點擊歷史,將其整合以實現(xiàn)用戶行為建模;其次,根據(jù)每個搜索引擎調(diào)用的API(URL形式)寫好模版,查詢提交時,系統(tǒng)根據(jù)模版提供組合后的URL,調(diào)用各底層搜索引擎,進行查詢分發(fā);最后,對各成員搜索引擎的返回結(jié)果進行整合,依據(jù)社區(qū)點擊矩陣、社區(qū)收藏矩陣和網(wǎng)頁噪聲因素,結(jié)合算法對結(jié)果進行重新排序。
圖2 社區(qū)協(xié)同搜索
為充分分析用戶興趣需求,電子閱讀平臺還應(yīng)從海量互聯(lián)網(wǎng)信息中獲取并分析用戶社會關(guān)系?;ヂ?lián)網(wǎng)正逐步滲透到人們的社會活動中,如何快速、準確、方便地從海量互聯(lián)網(wǎng)信息中自動抽取人物社會關(guān)系是當前社會化搜索研究的重點問題之一。人物社會關(guān)系搜索力爭在全面分析互聯(lián)網(wǎng)用戶的社會活動信息的基礎(chǔ)上,揭示用戶間關(guān)系的動態(tài)結(jié)構(gòu)圖景,從而為用戶觀察和認識社會的關(guān)系結(jié)構(gòu)和運行狀態(tài)提供新視角。人物社會關(guān)系搜索的創(chuàng)造、發(fā)展與完善,必將有效地幫助用戶認知現(xiàn)實社會中人與人的關(guān)系,人與人的關(guān)系所決定的社會運行的主流動態(tài),人在社會普遍聯(lián)系結(jié)構(gòu)中的位置,整個社會聯(lián)系與運動的過程對個人的自身利益和命運的影響。這種致力于揭示用戶之間關(guān)系的社會化搜索技術(shù),能夠?qū)θ宋镞M行全方位的把握,使網(wǎng)絡(luò)世界對現(xiàn)實社會的描繪與解讀更加客觀、清晰、生動與深刻。因此,人物社會關(guān)系搜索的研究對于探索現(xiàn)實社會中人與人的復(fù)雜關(guān)聯(lián)具有重要意義。
人物社會關(guān)系搜索如圖3所示。首先,采用主題爬蟲和本體技術(shù),抓取Web網(wǎng)絡(luò)和社會網(wǎng)絡(luò)中的人物相關(guān)信息,通過識別語義塊提取人物社會信息的正文;其次,識別人物實體,判別同一性,融合人物信息片段,并利用語義網(wǎng)信任推理機制準確識別人物社會關(guān)系;再次,利用圖層分類準確定位任意人物間的關(guān)系鏈路,構(gòu)建關(guān)系索引,提高搜索效率;最后,采用“圖層”和“時間隧道”在時間維度對人物、事件進行可視化顯示,并追蹤不同時期人物關(guān)系的動態(tài)演化。
圖3 人物社會關(guān)系搜索
本文介紹了電子圖書的基本背景,移動學(xué)習電子閱讀平臺及其被廣為采用的原因,采用電子閱讀平臺面臨的挑戰(zhàn)。在此基礎(chǔ)上,介紹解決主要挑戰(zhàn)的困擾,進一步介紹與用戶使用電子閱讀平臺相關(guān)的社會化搜索內(nèi)容,包括社區(qū)問答、社區(qū)協(xié)同搜索和人物社會關(guān)系搜索。社會化搜索屬于全球社會計算領(lǐng)域的科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新,可充分利用社會網(wǎng)絡(luò)資源,拓展搜索范疇,提高搜索的精準度和權(quán)威性,并實現(xiàn)個性化信息推送,為用戶提供全新的搜索體驗。