王曉光?夏凌穎?段青玉
【關(guān)? 鍵? 詞】學(xué)術(shù)閱讀;智慧閱讀;閱讀系統(tǒng);優(yōu)化策略
【作者單位】王曉光,武漢大學(xué)信息管理學(xué)院;夏凌穎,武漢大學(xué)信息管理學(xué)院;段青玉,武漢大學(xué)信息管理學(xué)院。
【基金項(xiàng)目】大數(shù)據(jù)資源語義組織與管理應(yīng)用研究(2019CFA025)。
【中圖分類號(hào)】G252.17 【文獻(xiàn)標(biāo)識(shí)碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2021.13.003
學(xué)術(shù)閱讀是學(xué)者獲取科研資源、積累學(xué)術(shù)知識(shí)和跟蹤學(xué)科前沿的重要手段,其中學(xué)術(shù)論文因其易獲取性和高價(jià)值性成為學(xué)者獲取學(xué)術(shù)信息的主要來源[1],閱讀學(xué)術(shù)論文已然成為各學(xué)科領(lǐng)域中研究、教學(xué)和學(xué)習(xí)必不可缺的活動(dòng)[2]。然而,隨著數(shù)據(jù)密集時(shí)代的科研信息化,學(xué)者有限的閱讀時(shí)間難以應(yīng)對(duì)學(xué)術(shù)信息的爆炸式增長(zhǎng),單一、線性、靜態(tài)的學(xué)術(shù)內(nèi)容呈現(xiàn)與學(xué)者非線性、動(dòng)態(tài)化、差異化和多元化閱讀需求之間的矛盾日益突出。在大數(shù)據(jù)、人工智能等技術(shù)與其他產(chǎn)業(yè)縱深融合的背景下,智慧閱讀(或稱智能閱讀)概念日益興起,成為出版業(yè)發(fā)展的新趨勢(shì)[3],也成為解決學(xué)術(shù)論文閱讀矛盾的重要途徑,因此,亟待以學(xué)術(shù)用戶閱讀需求為導(dǎo)向,優(yōu)化學(xué)術(shù)論文出版模式,助推學(xué)術(shù)閱讀智慧化。
當(dāng)前,學(xué)界對(duì)智慧閱讀的探討較為有限,鮮有面向?qū)W術(shù)領(lǐng)域的智慧閱讀研究。本文在綜合考量智慧閱讀、語義出版、學(xué)術(shù)出版等相關(guān)概念研究的基礎(chǔ)上,認(rèn)為面向?qū)W術(shù)的智慧閱讀是智慧閱讀時(shí)代科研用戶開展學(xué)術(shù)閱讀活動(dòng)的新型閱讀模式。它以學(xué)者多維、動(dòng)態(tài)、非線性和差異化的學(xué)術(shù)閱讀需求為導(dǎo)向,借助大數(shù)據(jù)、人工智能、機(jī)器學(xué)習(xí)以及語義出版相關(guān)工具與技術(shù),對(duì)學(xué)術(shù)論文及其關(guān)聯(lián)信息、數(shù)據(jù)進(jìn)行結(jié)構(gòu)化組織、語義化處理、細(xì)粒度加工、深度關(guān)聯(lián)與相關(guān)要素增補(bǔ),以實(shí)現(xiàn)學(xué)術(shù)閱讀活動(dòng)的個(gè)性化、精準(zhǔn)化、關(guān)聯(lián)化、可視化、交互性與自適應(yīng),降低學(xué)者學(xué)術(shù)信息獲取難度、提升學(xué)術(shù)信息使用效率、助力知識(shí)發(fā)現(xiàn)與驗(yàn)證,以及實(shí)現(xiàn)學(xué)術(shù)信息價(jià)值增值,最終實(shí)現(xiàn)學(xué)術(shù)閱讀智慧化。
一、學(xué)術(shù)閱讀任務(wù)類型與需求
閱讀需求和閱讀任務(wù)會(huì)影響用戶的閱讀行為和閱讀效果[4]。學(xué)者在開展學(xué)術(shù)閱讀活動(dòng)時(shí),通常會(huì)帶有不同的閱讀任務(wù),進(jìn)而產(chǎn)生相應(yīng)的閱讀需求,并以此為導(dǎo)向采取不同的閱讀策略和認(rèn)知模式。
在學(xué)術(shù)閱讀任務(wù)研究上,Dillon認(rèn)為,學(xué)者閱讀學(xué)術(shù)論文主要出于兩種目的:一是將學(xué)術(shù)論文作為參考資料和學(xué)習(xí)資料;二是出于個(gè)人的閱讀興趣[5]。Kim將閱讀任務(wù)表征為解釋性任務(wù)、事實(shí)性任務(wù)和探索性任務(wù)三類,并基于不同任務(wù)中用戶采用信息搜尋策略模式和頻率的差異構(gòu)建了信息搜尋行為模型[6]。Lei. Z針對(duì)用戶在科學(xué)論文閱讀過程中產(chǎn)生的功能性需求,定義了學(xué)習(xí)背景知識(shí)、參考事實(shí)、參考論點(diǎn)、參考方法、跟進(jìn)前沿研究等六種科學(xué)論文語境下的信息使用任務(wù)[7]。
在學(xué)術(shù)閱讀需求研究上,蔡培發(fā)現(xiàn)在信息需求方面,科研人員更加注重國內(nèi)外相關(guān)科研進(jìn)展、學(xué)科前沿動(dòng)態(tài)和論文收錄引用與評(píng)價(jià),同時(shí)總結(jié)了信息需求的十類研究主題:科研數(shù)據(jù)需求、文獻(xiàn)計(jì)量需求、科研過程需求、隱性需求、文獻(xiàn)資源需求、網(wǎng)絡(luò)資源需求、學(xué)科信息需求、知識(shí)服務(wù)需求、創(chuàng)新型需求和個(gè)性化需求[8]。彭倩發(fā)現(xiàn),研究生用戶對(duì)學(xué)科領(lǐng)域前沿、研究方法、相關(guān)背景知識(shí)、工具技術(shù)、專業(yè)基礎(chǔ)知識(shí)等學(xué)術(shù)信息存在較大需求,且學(xué)科差異對(duì)用戶需求影響較大[1]。Ribaupierre等根據(jù)用戶訪談結(jié)果,降序排列學(xué)術(shù)用戶最強(qiáng)烈的學(xué)術(shù)閱讀需求為提升知識(shí)、寫論文、找到新想法/靈感、發(fā)現(xiàn)新觀點(diǎn)、了解新情況、文獻(xiàn)比較、對(duì)他人成果進(jìn)行評(píng)價(jià)、尋找特定定義、方法比較、知識(shí)總結(jié)、驗(yàn)證觀點(diǎn)等[9]。Al-Shboul等將人文學(xué)者在教學(xué)與研究過程中的信息需求分為研究信息需求、教學(xué)信息需求、信息素養(yǎng)需求、個(gè)人間信息需求四類[10]。劉晶總結(jié)得出人文學(xué)者最常見的六項(xiàng)閱讀需求是知識(shí)拓展、知識(shí)更新、找到特定內(nèi)容、發(fā)現(xiàn)新研究想法/觀點(diǎn)/主題、比較與分析不同觀點(diǎn)并驗(yàn)證觀點(diǎn)、梳理研究進(jìn)展,并將其歸納為三大閱讀任務(wù):理解任務(wù)、檢索任務(wù)和積累任務(wù)[4]。
本文綜合已有關(guān)于學(xué)術(shù)閱讀任務(wù)與需求研究的框架,歸納出三類學(xué)術(shù)閱讀任務(wù)下的七類學(xué)術(shù)閱讀需求:檢索任務(wù)包括獲取特定信息這一需求,理解任務(wù)包括文獻(xiàn)比較、發(fā)現(xiàn)新問題/觀點(diǎn)/主題、梳理研究進(jìn)展、觀點(diǎn)驗(yàn)證四類需求,積累任務(wù)包括知識(shí)擴(kuò)展和知識(shí)更新兩類需求。
具體而言,在檢索任務(wù)下,學(xué)者不需要深度理解全文,只需借助檢索工具就能快速定位并獲取所需內(nèi)容,而后進(jìn)行后續(xù)的處理加工,他們往往會(huì)采取選擇性閱讀的策略。因此,有必要對(duì)科學(xué)論文進(jìn)行結(jié)構(gòu)化處理和細(xì)粒度語義標(biāo)注,以及提供便捷的檢索途徑。
在理解任務(wù)下,學(xué)者需要對(duì)學(xué)術(shù)論文內(nèi)容進(jìn)行深度理解和意義建構(gòu),并將論文知識(shí)內(nèi)化并與自身知識(shí)體系融合,形成自己的觀點(diǎn)。因此,在閱讀時(shí),學(xué)者往往會(huì)采取詳讀和重讀相結(jié)合的閱讀策略,需要投入大量的精力才能完成理解任務(wù)。已有研究表明,外部語義增強(qiáng)環(huán)境能降低用戶閱讀科學(xué)論文的難度,提高科學(xué)信息的利用效率[11]。此外,學(xué)者在閱讀時(shí)所做的高亮、注釋、評(píng)注等行為有助于強(qiáng)化內(nèi)容理解[12]。因此,為了更好地滿足學(xué)者在開展理解任務(wù)時(shí)的閱讀需求,可從優(yōu)化外部語義增強(qiáng)環(huán)境和完善自定義輔助信息處理功能等方面考慮閱讀工具的設(shè)計(jì)。
在積累任務(wù)下,學(xué)者需要進(jìn)行廣泛閱讀,在閱讀過程中他們往往采取遙讀、首尾閱讀等策略了解概要,從而快速積累相關(guān)知識(shí),完成積累任務(wù)。因此,如何讓學(xué)者更高效、便捷地獲取所需學(xué)術(shù)內(nèi)容,更好地與學(xué)者在積累任務(wù)下的學(xué)術(shù)閱讀策略相匹配,是滿足積累任務(wù)學(xué)者學(xué)術(shù)閱讀需求的關(guān)鍵,可從深度數(shù)據(jù)挖掘與分析、知識(shí)內(nèi)容精準(zhǔn)推薦等功能考慮進(jìn)行系統(tǒng)優(yōu)化。
二、學(xué)術(shù)閱讀系統(tǒng)功能調(diào)查
根據(jù)學(xué)者使用度高、涵蓋全學(xué)科領(lǐng)域及較早提供增強(qiáng)型學(xué)術(shù)論文閱讀服務(wù)三條原則,本文選取在提供智慧學(xué)術(shù)閱讀方面具有學(xué)科全覆蓋和服務(wù)典型性的三個(gè)平臺(tái)——中國知網(wǎng)、ScienceDirect和Wiley Online Library進(jìn)行分析,以管窺當(dāng)前學(xué)術(shù)用戶論文閱讀需求滿足現(xiàn)狀。
調(diào)研發(fā)現(xiàn),這三個(gè)學(xué)術(shù)出版平臺(tái)主要提供特定內(nèi)容獲取、增強(qiáng)信息提供、輔助信息處理、信息推薦與個(gè)人知識(shí)庫、可視化五個(gè)方面的智慧閱讀服務(wù),在不同程度上滿足了學(xué)術(shù)閱讀在檢索、理解和積累任務(wù)方面的相關(guān)需求,如表1所示。
1.面向檢索任務(wù)的閱讀系統(tǒng)功能建設(shè)現(xiàn)狀
當(dāng)前,學(xué)術(shù)論文閱讀工具主要通過兩種智慧閱讀服務(wù)來滿足檢索任務(wù)相關(guān)需求,即滿足用戶獲取特定內(nèi)容的需求。
(1)不同粒度的檢索
中國知網(wǎng)提供知識(shí)元檢索,平臺(tái)與概念知識(shí)庫、問題方法知識(shí)元庫、中國經(jīng)濟(jì)社會(huì)大數(shù)據(jù)研究平臺(tái)等相關(guān)聯(lián),可以檢索圖片、統(tǒng)計(jì)數(shù)據(jù)、指數(shù)、方法、概念等知識(shí)元。如對(duì)概念的檢索不僅可以查詢到概念的基本定義、特征、結(jié)構(gòu)、分類、功能、原理、起源、發(fā)展、影響因素及文獻(xiàn)出處,還可以查看所有文獻(xiàn)的同文知識(shí)元內(nèi)容。ScienceDirect使用啟發(fā)式和機(jī)器學(xué)習(xí)方法自動(dòng)生成主題并提供主題檢索與列表瀏覽兩種獲取途徑,主題信息與Elsevier百科全書、參考文獻(xiàn)、相關(guān)主題相鏈接,可幫助學(xué)者快速獲取特定主題下的所有文獻(xiàn)。但上述兩種檢索方式都無法在特定論文閱讀界面上便捷使用。
Wiley目前只提供關(guān)鍵字、期刊和引文檢索,檢索粒度較粗。
(2)標(biāo)題與圖表導(dǎo)航
目前,中國知網(wǎng)和ScienceDirect在特定論文的閱讀界面只提供左側(cè)邊目錄導(dǎo)航欄,細(xì)化到三級(jí)標(biāo)題。部分論文提供文內(nèi)圖表導(dǎo)航,以超鏈接形式跳轉(zhuǎn),但學(xué)者只能跳轉(zhuǎn)到文內(nèi)相應(yīng)部分后自行閱讀查找所需內(nèi)容,無法在該論文頁面中直接檢索和獲取論文結(jié)構(gòu)單元信息。
Wiley在閱讀界面提供下拉式目錄導(dǎo)航欄,內(nèi)容細(xì)化到一級(jí)標(biāo)題,以超鏈接形式跳轉(zhuǎn)。其右側(cè)邊“Figures”一欄直接展示本文所涉所有圖片資源,學(xué)者可以直接點(diǎn)擊查看或下載,但未提供超鏈接直接跳轉(zhuǎn)至文內(nèi)圖片對(duì)應(yīng)位置。
基于以上分析可以發(fā)現(xiàn),當(dāng)前閱讀工具提供多維、多粒度方式獲取特定內(nèi)容,包括從具體文獻(xiàn)到文獻(xiàn)的內(nèi)部單元,但不同閱讀工具提供的學(xué)術(shù)閱讀智慧化程度存在較大差異,但整體來看對(duì)讀者閱讀情境和內(nèi)容需求的考慮不夠全面。尤其是閱讀作為一個(gè)持續(xù)性行為,用戶多項(xiàng)需求之間的連續(xù)性難以被保持和滿足,這反映出閱讀工具在提供特定內(nèi)容獲取方面的智慧閱讀服務(wù)尚未成熟和體系化。
2.面向理解任務(wù)的閱讀系統(tǒng)功能建設(shè)現(xiàn)狀
當(dāng)前,學(xué)術(shù)論文閱讀平臺(tái)主要提供以下兩種智慧閱讀服務(wù)來滿足理解任務(wù)的相關(guān)需求。
(1)語義關(guān)聯(lián)與要素增補(bǔ)
中國知網(wǎng)提供期刊、作者、機(jī)構(gòu)、關(guān)鍵詞以及基于引文網(wǎng)絡(luò)的相關(guān)文獻(xiàn)信息鏈接,其中關(guān)鍵詞可鏈接到知網(wǎng)百科查看詳細(xì)釋義,同時(shí)提供相似和相關(guān)詞鏈接,提供原圖表下載鏈接并可將表格數(shù)據(jù)導(dǎo)出到Excel,提供作者圖片和相關(guān)學(xué)術(shù)視頻等增補(bǔ)信息。
ScienceDirect可提供作者、期刊及相關(guān)文獻(xiàn)關(guān)聯(lián)信息,其中參考文獻(xiàn)大多鏈接至Scopus和Google Scholar頁面,但因版權(quán)等問題只有少部分直接提供全文鏈接;ScienceDirect還提供文內(nèi)所涉高質(zhì)量圖像下載及代碼、補(bǔ)充數(shù)據(jù)等增強(qiáng)信息,補(bǔ)充內(nèi)容文件格式多達(dá)近40種。
Wiley可提供作者、期刊、參考文獻(xiàn)、關(guān)鍵字、基金等關(guān)聯(lián)信息,并以內(nèi)嵌、浮窗或超鏈接的形式展示;還可提供基于文章的Altmetric關(guān)注評(píng)分,用以衡量文章收到的在線關(guān)注質(zhì)量和數(shù)量;提供關(guān)注該文章的讀者數(shù)據(jù)(包括地理位置、學(xué)歷和學(xué)科的細(xì)分統(tǒng)計(jì)),以及該文章在研究領(lǐng)域中的研究產(chǎn)出排名信息,以幫助學(xué)者更好地評(píng)估該文章的科研價(jià)值;提供論文增補(bǔ)信息和文內(nèi)所涉高質(zhì)量圖像下載。
(2) 內(nèi)嵌輔助閱讀標(biāo)記與檢索功能
在中國知網(wǎng)、ScienceDirect、Wiley中,只有中國知網(wǎng)在閱讀界面提供劃線、高亮、復(fù)制、摘錄、筆記等功能,并可對(duì)選中內(nèi)容進(jìn)行詞典檢索。當(dāng)前閱讀工具都會(huì)提供一定的語義關(guān)聯(lián)信息和增補(bǔ)要素,以提高學(xué)者知識(shí)獲取的效率。但不同閱讀工具在內(nèi)容語義關(guān)聯(lián)程度和增補(bǔ)要素的豐富度上差異較大,且語義關(guān)聯(lián)的粒度較粗,無法滿足學(xué)者基于細(xì)粒度特定內(nèi)容進(jìn)行延展閱讀,以梳理研究進(jìn)展并發(fā)現(xiàn)新問題、觀點(diǎn)、主題的需求。而且,增補(bǔ)數(shù)據(jù)不夠全面和語義化,在一定程度上也影響了作者觀點(diǎn)驗(yàn)證。此外,目前只有中國知網(wǎng)在閱讀界面提供輔助閱讀標(biāo)記與檢索功能,欠缺文獻(xiàn)多視圖顯示與并排比較的功能設(shè)計(jì),不利于學(xué)者直接高效地進(jìn)行文獻(xiàn)比較。
3.面向積累任務(wù)的閱讀系統(tǒng)功能建設(shè)現(xiàn)狀
當(dāng)前,學(xué)術(shù)論文閱讀平臺(tái)主要提供以下兩種智慧閱讀服務(wù)來滿足積累任務(wù)的相關(guān)需求。
(1) 信息精準(zhǔn)推薦與可視化
一方面,中國知網(wǎng)以可視化方式呈現(xiàn)源文獻(xiàn)的引文網(wǎng)絡(luò)并提供文獻(xiàn)鏈接,幫助學(xué)者快速循證和積累所涉主題下的豐富學(xué)術(shù)資源,掌握細(xì)分主題和研究點(diǎn)的發(fā)展動(dòng)向。另一方面,中國知網(wǎng)提供核心文獻(xiàn)推薦,可視化展現(xiàn)相關(guān)主題的研究起點(diǎn)、研究來源、研究分支、研究去脈,學(xué)者可快速對(duì)研究主題進(jìn)行溯源并明確其發(fā)展路徑、方向,還可以通過查看相應(yīng)主題詞下的核心文獻(xiàn)了解更多細(xì)節(jié)。此外,中國知網(wǎng)還提供相似文獻(xiàn)、讀者推薦、相關(guān)基金文獻(xiàn)、關(guān)聯(lián)作者等推薦信息,方便學(xué)者高效獲取知識(shí)擴(kuò)展所需學(xué)術(shù)信息;提供檢索結(jié)果的發(fā)表趨勢(shì)、主題、學(xué)科、作者、機(jī)構(gòu)、基金、文獻(xiàn)類型等可視化分析;提供關(guān)鍵詞的關(guān)注度指數(shù)可視化分析,幫助學(xué)者迅速把握關(guān)注主題的發(fā)展趨勢(shì)、研究熱點(diǎn)與研究前沿。
ScienceDirect則利用機(jī)器學(xué)習(xí)等技術(shù)智能匹配用戶畫像數(shù)據(jù)和數(shù)據(jù)庫信息,每周發(fā)送包含推薦文獻(xiàn)和書籍章節(jié)鏈接的電子郵件,以及在登錄頁面動(dòng)態(tài)顯示強(qiáng)相關(guān)推薦信息,為學(xué)者提供個(gè)性化推薦服務(wù),高效助力學(xué)者科研活動(dòng)開展。
Wiley只提供特定論文相關(guān)文獻(xiàn)推薦信息。
(2) 個(gè)人知識(shí)庫
中國知網(wǎng)的“個(gè)人書房”提供我的收藏、我的訂閱、我的歷史、引文跟蹤、我的成果五種功能,方便學(xué)者建立個(gè)人知識(shí)庫和及時(shí)獲取最新學(xué)術(shù)信息。ScienceDirect和Wiley則提供收藏、訂閱和引文追蹤等功能,幫助學(xué)者追蹤特定文獻(xiàn)或主題并及時(shí)獲取最新進(jìn)展。
綜上可以看出,以上三個(gè)平臺(tái)都會(huì)提供論文推薦和個(gè)人知識(shí)庫功能,但是在信息推薦智慧程度上差異較大。ScienceDirect根據(jù)智能算法精準(zhǔn)匹配知識(shí)內(nèi)容和學(xué)者需求,中國知網(wǎng)和Wiley則依靠文獻(xiàn)的語義關(guān)聯(lián)進(jìn)行推薦,沒有將用戶數(shù)據(jù)作為推薦依據(jù),智慧化程度不高,未能很好地滿足用戶知識(shí)拓展和更新的需求。此外,三者在可視化功能設(shè)計(jì)上仍不夠細(xì)致和完善,在個(gè)人知識(shí)庫的功能設(shè)計(jì)上也有待細(xì)化和拓展。
整體而言,國內(nèi)外各大學(xué)術(shù)出版平臺(tái)在整合知識(shí)體系,豐富關(guān)聯(lián)信息,優(yōu)化學(xué)術(shù)內(nèi)容呈現(xiàn),提供個(gè)性化服務(wù)等方面已經(jīng)實(shí)現(xiàn)了一定突破,在一定程度上優(yōu)化了學(xué)者的學(xué)術(shù)閱讀體驗(yàn)、提升了學(xué)者知識(shí)獲取的效率。但每個(gè)平臺(tái)都存在不足,如不能提供基于論文內(nèi)容組件的檢索和直接獲取,仍欠缺更細(xì)粒度、更豐富、更全面的基于論文內(nèi)容深度標(biāo)引基礎(chǔ)上的語義增強(qiáng)信息,個(gè)性化閱讀功能設(shè)計(jì)仍有待完善,數(shù)據(jù)可視化分析等服務(wù)尚待加強(qiáng)等。
三、學(xué)術(shù)論文在線閱讀系統(tǒng)優(yōu)化策略
基于學(xué)術(shù)閱讀需求及滿足現(xiàn)狀的分析結(jié)果,本文提出如表2所示的用戶學(xué)術(shù)閱讀需求與滿足優(yōu)化路徑,以期實(shí)現(xiàn)智慧學(xué)術(shù)閱讀的個(gè)性化、精準(zhǔn)化、關(guān)聯(lián)化、可視化、交互性與自適應(yīng),降低學(xué)者學(xué)術(shù)信息獲取難度,提升學(xué)術(shù)信息使用效率,助力知識(shí)發(fā)現(xiàn)與驗(yàn)證,從而實(shí)現(xiàn)學(xué)術(shù)信息價(jià)值增值和學(xué)術(shù)閱讀智慧化。
1.面向內(nèi)容的語義增強(qiáng)
面向內(nèi)容的語義增強(qiáng)對(duì)學(xué)術(shù)論文進(jìn)行多粒度的內(nèi)容結(jié)構(gòu)化處理和語義特征揭示,有助于學(xué)者快速定位最有價(jià)值的知識(shí)內(nèi)容[13],包括對(duì)正副文本內(nèi)容和增補(bǔ)要素的語義標(biāo)注和深度關(guān)聯(lián),能夠?qū)崿F(xiàn)學(xué)術(shù)閱讀的個(gè)性化、精準(zhǔn)化和關(guān)聯(lián)化。當(dāng)前,學(xué)界已經(jīng)從語句、語篇等多個(gè)層面和粒度提出論文內(nèi)容語義組織策略與模型,以優(yōu)化學(xué)術(shù)論文內(nèi)容檢索和呈現(xiàn)方式,提高學(xué)者的閱讀效率與閱讀效果。學(xué)術(shù)論文閱讀平臺(tái)應(yīng)充分利用已有研究,根據(jù)論文學(xué)科特點(diǎn)和不同粒度內(nèi)容的語義處理要求,綜合利用自然語言處理、機(jī)器學(xué)習(xí)、本體、知識(shí)圖譜等技術(shù),有針對(duì)性地實(shí)現(xiàn)論文內(nèi)容的多粒度語義標(biāo)注與可視化檢索。而在對(duì)知識(shí)內(nèi)容進(jìn)行細(xì)粒度語義標(biāo)注的基礎(chǔ)上進(jìn)行語義上的充分關(guān)聯(lián)與要素上的充分增補(bǔ),可構(gòu)建可信的、情境化的、關(guān)聯(lián)的、可認(rèn)知、可預(yù)測(cè)、可利用的智慧數(shù)據(jù)集,實(shí)現(xiàn)傳統(tǒng)論文資源向智慧數(shù)據(jù)的轉(zhuǎn)型升級(jí)。
具體可從宏觀和微觀兩個(gè)角度,實(shí)現(xiàn)論文內(nèi)容的深度語義增強(qiáng)。宏觀上,可構(gòu)建一個(gè)基于引用、作者、機(jī)構(gòu)、關(guān)鍵詞、主題、合作關(guān)系等的學(xué)術(shù)論文關(guān)聯(lián)網(wǎng)絡(luò),以為學(xué)者提供豐富的關(guān)聯(lián)資源與學(xué)術(shù)循證支持。微觀上,一是利用通用優(yōu)質(zhì)的本體模型自動(dòng)關(guān)聯(lián)論文各內(nèi)容構(gòu)件,形成文獻(xiàn)內(nèi)的知識(shí)網(wǎng)絡(luò);二是在論文資源整合的基礎(chǔ)上借助本體互操作、本體映射等實(shí)現(xiàn)不同論文內(nèi)容構(gòu)件間乃至不同數(shù)據(jù)庫、知識(shí)庫存儲(chǔ)內(nèi)容間的語義關(guān)聯(lián),這是助力形成論文間富語義網(wǎng)絡(luò)的重要一環(huán);三是為學(xué)術(shù)論文提供內(nèi)容豐富、形式多樣的補(bǔ)充或支持信息,并進(jìn)行深度語義標(biāo)注和關(guān)聯(lián),從而推動(dòng)形成更廣范圍的論文內(nèi)容智慧數(shù)據(jù)集。
2.面向閱讀過程的認(rèn)知增強(qiáng)
面向閱讀過程的語義增強(qiáng),在交互界面上可提供多樣實(shí)用的輔助信息處理功能,有效促進(jìn)學(xué)者理解和記憶知識(shí)內(nèi)容,從而實(shí)現(xiàn)學(xué)術(shù)閱讀的個(gè)性化、精準(zhǔn)化和交互性。
在用戶自定義生成內(nèi)容方面,可在已有的筆記、注釋、批注等功能上增加在線開放評(píng)價(jià)功能。一方面,在線開放評(píng)價(jià)能為其他學(xué)者評(píng)估文獻(xiàn)價(jià)值提供參考;另一方面,優(yōu)質(zhì)的同行評(píng)價(jià)能成為論文的有益補(bǔ)充,有助于其他學(xué)者理解和擴(kuò)展相關(guān)知識(shí)。
在個(gè)人知識(shí)庫建立方面,除為學(xué)者提供單篇文獻(xiàn)收藏、引文追蹤、文獻(xiàn)與期刊的訂閱功能外,還可在論文內(nèi)容深度語義標(biāo)引與關(guān)聯(lián)的基礎(chǔ)上提供論文構(gòu)件的單獨(dú)收藏。如將數(shù)據(jù)集、知識(shí)元、多媒體資源等分別收錄,以形成內(nèi)容粒度更細(xì)、收藏夾形式更多樣、語義關(guān)聯(lián)程度更深的個(gè)人智慧庫。此外,還可提供劃詞翻譯、不同語言版本內(nèi)容選擇、論文文檔多視圖并排顯示與比較等功能,滿足學(xué)者閱讀的多樣化需求,并利用用戶行為數(shù)據(jù)豐富用戶畫像,作為系統(tǒng)優(yōu)化和知識(shí)推薦服務(wù)的參考依據(jù)。
3.面向用戶的服務(wù)增強(qiáng)
面向用戶的服務(wù)增強(qiáng)運(yùn)用人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等智能技術(shù),以智慧化方式呈現(xiàn)和傳遞富語義的論文內(nèi)容,能夠?qū)崿F(xiàn)學(xué)術(shù)閱讀的個(gè)性化、精準(zhǔn)化、關(guān)聯(lián)化、可視化、交互性和自適應(yīng)。
一是利用機(jī)器學(xué)習(xí)等技術(shù)智能匹配用戶畫像數(shù)據(jù)和論文智慧數(shù)據(jù),及時(shí)、動(dòng)態(tài)地為學(xué)者提供精準(zhǔn)的推薦信息,助力知識(shí)拓展、知識(shí)更新和興趣發(fā)現(xiàn)。
二是對(duì)用戶數(shù)據(jù)尤其是相關(guān)閱讀數(shù)據(jù)進(jìn)行深度挖掘,發(fā)現(xiàn)用戶的個(gè)性化閱讀策略和閱讀模式。一方面可根據(jù)數(shù)據(jù)分析結(jié)果,自適應(yīng)調(diào)節(jié)內(nèi)容呈現(xiàn)方式和界面設(shè)計(jì);另一方面,可以此為依據(jù)對(duì)閱讀系統(tǒng)進(jìn)行優(yōu)化設(shè)計(jì)。
三是強(qiáng)化對(duì)論文數(shù)據(jù)的分析與挖掘??梢允腔谶x定領(lǐng)域論文內(nèi)容的知識(shí)單元識(shí)別與抽取,通過知識(shí)聚合與分析提供類似主題演化和趨勢(shì)探測(cè)等內(nèi)容服務(wù),也可以是基于用戶自定義內(nèi)容的數(shù)據(jù)分析服務(wù)。
四是提供覆蓋學(xué)術(shù)閱讀全過程的可視化功能,包括單篇論文知識(shí)結(jié)構(gòu)的可視化呈現(xiàn)、粒度可選的學(xué)術(shù)網(wǎng)絡(luò)可視化呈現(xiàn)、數(shù)據(jù)分析結(jié)果的可視化呈現(xiàn)等,充分利用視覺資源降低學(xué)者知識(shí)獲取難度,提升學(xué)者知識(shí)發(fā)現(xiàn)的能力。
四、結(jié)語
本文以學(xué)術(shù)論文閱讀為關(guān)注點(diǎn),對(duì)用戶學(xué)術(shù)閱讀的任務(wù)與需求進(jìn)行分析,并在案例分析的基礎(chǔ)上總結(jié)現(xiàn)有學(xué)術(shù)論文在線閱讀系統(tǒng)在內(nèi)容提供和呈現(xiàn)、功能設(shè)計(jì)和服務(wù)支持上的不足,提出應(yīng)當(dāng)充分利用論文內(nèi)容數(shù)據(jù)和用戶數(shù)據(jù)實(shí)現(xiàn)學(xué)術(shù)閱讀智慧化。
一是應(yīng)對(duì)論文知識(shí)內(nèi)容進(jìn)行深度語義化處理與要素增補(bǔ),形成內(nèi)容豐富、語義關(guān)聯(lián)程度高、價(jià)值密度大的智慧數(shù)據(jù)集;二是智能匹配內(nèi)容數(shù)據(jù)和用戶數(shù)據(jù),為用戶提供精準(zhǔn)內(nèi)容推薦,助力知識(shí)拓展與知識(shí)更新,實(shí)現(xiàn)知識(shí)提供的智慧化;三是充分滿足用戶利用各種輔助信息處理功能的需求,同時(shí)將可視化功能嵌入閱讀系統(tǒng)中,有效降低用戶知識(shí)處理難度,優(yōu)化用戶學(xué)術(shù)閱讀體驗(yàn),在以用戶學(xué)術(shù)閱讀需求為導(dǎo)向的基礎(chǔ)上進(jìn)行學(xué)術(shù)閱讀系統(tǒng)的優(yōu)化設(shè)計(jì),助推學(xué)術(shù)閱讀智慧化轉(zhuǎn)型。
|參考文獻(xiàn)|
[1] 彭倩. 研究生學(xué)術(shù)閱讀行為與需求分析[D]. 武漢:華中師范大學(xué),2017.
[2]NICHOLAS D . Using, Citing and Publishing Scholarly Content in the Digital Age:Case Study of Humanities Researchers[J]. Zagadnienia Informacji Naukowej - Studia Informacyjne,2015(105):7-19.
[3] 方卿,王欣月,王嘉昀. 智能閱讀:新時(shí)代閱讀的新趨勢(shì)[J]. 科技與出版,2021(5):12-18.
[4] 劉晶. 人文學(xué)者的電子書閱讀策略研究[D]. 武漢:武漢大學(xué),2019.
[5] DILLON A. Designing usable electronic text: Ergonomic aspects of human information usage[M]. CRC press, 2004.
[6]KIM J. Describing and predicting information-seeking behavior on the Web[J]. Journal of the Association for Information Science & Technology,2014 (4):679-693.
[7]LEI Z,KOPAK R, FREUND L,ET AL. A taxonomy of functional units for information use of scholarly journal articles[J]. Proceedings of the American Society for Information Science & Technology,2011(1):1-10.
[8] 蔡培,盧章平,王正興. 高??蒲杏脩粜畔⑿枨笱芯楷F(xiàn)狀與啟示[J]. 圖書情報(bào)研究,2019(4):58-64.
[9]RIBAUPIERRE H D,F(xiàn)ALQUET G. Extracting discourse elements and annotating scientific documents using the SciAnnotDoc model:a use case in gender documents[J]. International Journal on Digital Libraries,2017(3):1-16.
[10]Al-SHBOUL M K,ABRIZAH A. Information Needs:Developing Personas of Humanities Scholars[J]. Journal of Academic Librarianship,2014(5):500-509.
[11] 金秀坊. 外部語義增強(qiáng)環(huán)境對(duì)用戶認(rèn)知負(fù)荷及閱讀效果的影響研究[D]. 武漢:武漢大學(xué),2019.
[12] 肖鵬,潘燕桃,張久珍. 中國大陸大學(xué)生學(xué)術(shù)閱讀載體偏好與行為研究:基于全球調(diào)查數(shù)據(jù)的比較研究[J]. 中國圖書館學(xué)報(bào),2018(1):62-75.
[13] 宋寧遠(yuǎn),裴雷,王春迎. 科學(xué)論文語義增強(qiáng)的研究進(jìn)展與趨勢(shì)研判[J]. 圖書情報(bào)工作,2021(1):82-90.