郭碧玉 范艷芬 張羽
摘要:文章以中國知網(wǎng)、維普、萬方3個中文學(xué)術(shù)期刊數(shù)據(jù)庫為例,對三大數(shù)據(jù)庫期刊檢索平臺進(jìn)行訪問并實施檢索,從檢索項和檢索結(jié)果兩方面分析,發(fā)現(xiàn)中文學(xué)術(shù)期刊數(shù)據(jù)庫檢索效果并不理想,提出應(yīng)從完善檢索項、加深聚類層次、優(yōu)化關(guān)聯(lián)推薦、用戶檢索過程控制與幫助、豐富可視化展現(xiàn)等方面做出改進(jìn),提升數(shù)據(jù)庫檢索效果。
關(guān)鍵詞:學(xué)術(shù)期刊;數(shù)據(jù)庫;檢索效果
中圖分類號:G250.7文獻(xiàn)標(biāo)志碼:A0引言學(xué)術(shù)期刊具有及時性、新穎性、延續(xù)性等特點,能反映學(xué)科領(lǐng)域最新研究動態(tài)、研究成果和研究方向。因此,學(xué)術(shù)期刊數(shù)據(jù)庫成為國內(nèi)外學(xué)者從事科學(xué)研究、進(jìn)行資料查找的重要工具,而數(shù)據(jù)庫的檢索效果直接影響著科研人員的研究效率。影響數(shù)據(jù)庫檢索效果的主要因素一方面是用戶檢索策略的選擇,另一方面是數(shù)據(jù)庫系統(tǒng)本身的檢索性能。目前,我國對用戶檢索策略的研究較多,探究數(shù)據(jù)庫本身檢索效果的研究卻寥寥無幾。在中國知網(wǎng)中以“篇關(guān)摘=數(shù)據(jù)庫 AND 篇名=檢索策略”進(jìn)行精確檢索,檢出結(jié)果450條,近5年內(nèi)都有論文發(fā)表,但以“篇關(guān)摘=數(shù)據(jù)庫 AND 篇名=檢索效果”進(jìn)行檢索,檢出結(jié)果僅有21條,且國內(nèi)截至目前最新的一篇論文還停留在2014年,可見數(shù)據(jù)庫本身的檢索效果應(yīng)該引起重視。
1中文學(xué)術(shù)期刊數(shù)據(jù)庫檢索效果調(diào)查與分析1.1調(diào)查對象及調(diào)查方法目前,中國知網(wǎng)、萬方、維普已成為三大中文學(xué)術(shù)期刊數(shù)庫,在資源收錄、數(shù)據(jù)加工、系統(tǒng)功能和數(shù)據(jù)質(zhì)量方面具有較高水平,選取這3個數(shù)據(jù)庫為調(diào)查對象探究當(dāng)前中文學(xué)術(shù)期刊數(shù)據(jù)庫檢索效果具有可行性與代表性。運用網(wǎng)絡(luò)調(diào)查方法,對三大數(shù)據(jù)庫的期刊檢索平臺進(jìn)行訪問并實施檢索,客觀記錄數(shù)據(jù)并進(jìn)行分類處理。調(diào)查時間截至2023年3月。
1.2調(diào)查現(xiàn)狀說明檢索項是用戶選擇檢索策略實施檢索的重要入口,檢索結(jié)果的組織則直接體現(xiàn)出數(shù)據(jù)庫的檢索效果,因此從檢索項、檢索結(jié)果兩方面探究中文學(xué)術(shù)期刊數(shù)據(jù)庫檢索效果。
將檢索涉及的文獻(xiàn)信息內(nèi)容分為基本信息和輔助信息兩類:基本信息是與文獻(xiàn)內(nèi)容直接相關(guān)的信息,包括論文信息、作者信息、期刊信息、時間信息及其他信息;輔助信息是與文獻(xiàn)內(nèi)容間接相關(guān)的信息,包括關(guān)聯(lián)信息、特色信息、檢索歷史、結(jié)果排序。
檢索項方面,三大數(shù)據(jù)庫主要提供論文信息、作者信息、期刊信息、時間信息和其他信息五方面基本信息,如表1中標(biāo)有“√”的部分所示。
檢索結(jié)果方面,三大數(shù)據(jù)庫除基本信息外,還有關(guān)聯(lián)信息、特色信息等輔助信息,基本信息見表1中標(biāo)有“■”的部分,輔助信息如表2所示。
1.3調(diào)查結(jié)果分析1.3.1檢索項分析由表1可知,中國知網(wǎng)、萬方、維普三大數(shù)據(jù)庫的檢索項分別為28項、18項、20項,普遍設(shè)置的檢索字段有題名、關(guān)鍵詞、摘要、基金、作者、期刊和時間等,其區(qū)別如下。
論文信息:除題名、作者等基本字段外,還有題名或關(guān)鍵詞、篇關(guān)摘等組合式字段,并提供全文檢索、任意字段檢索,中國知網(wǎng)有小標(biāo)題檢索。文獻(xiàn)標(biāo)識方面,都提供中圖分類號檢索,知網(wǎng)和萬方設(shè)了DOI(Digital Object Identifier)檢索。維普和知網(wǎng)可進(jìn)行參考文獻(xiàn)檢索。
作者信息:三者設(shè)置的檢索項基本相同,都重視第一作者,為了提高查準(zhǔn)率,維普設(shè)了作者簡介字段,中國知網(wǎng)設(shè)了通訊作者和第一單位,沒有數(shù)據(jù)庫提供ORCID(Open Researcher and Contributor ID)檢索。
期刊信息:中國知網(wǎng)和萬方設(shè)置了國際標(biāo)準(zhǔn)連續(xù)出版物編號ISSN和國內(nèi)統(tǒng)一刊號CN字段。知網(wǎng)和維普設(shè)置了來源期刊類別選項,如北大核心期刊、EI來源期刊、SCI來源期刊、CAS來源期刊等,并提供期刊欄目信息檢索。知網(wǎng)在2021年有出版者和主辦單位字段,現(xiàn)已撤銷。
時間信息:三者都設(shè)置了收錄/發(fā)表時間檢索項,可對被檢文獻(xiàn)的時間范圍進(jìn)行限定。維普和中國知網(wǎng)設(shè)置了更新時間檢索項,可以檢索近一個月、近半年或近一年等時間段的論文更新動態(tài)。
其他信息:三者都設(shè)了檢索詞的中英文擴展、同義詞擴展或主題詞擴展,并支持基金信息檢索。中國知網(wǎng)和維普提供學(xué)科限定檢索。中國知網(wǎng)有出版信息檢索,如網(wǎng)絡(luò)首發(fā)、增強出版等。
1.3.2檢索結(jié)果分析結(jié)合表1與表2,三大數(shù)據(jù)庫都對檢索結(jié)果做了詳細(xì)處理。
基本信息:維普和中國知網(wǎng)都可對論文進(jìn)行引文追蹤與可視化引文網(wǎng)絡(luò),包括參考文獻(xiàn)、共引文獻(xiàn)、引證文獻(xiàn)等。萬方對不同機構(gòu)的同名作者作了區(qū)分,中國知網(wǎng)可查看作者機構(gòu)、關(guān)注領(lǐng)域、發(fā)表文獻(xiàn)、合作作者、指導(dǎo)的學(xué)生、主講視頻等信息。另外,中國知網(wǎng)有主要主題和次要主題區(qū)分,萬方設(shè)置了文獻(xiàn)出版狀態(tài)和來源數(shù)據(jù)庫。
關(guān)聯(lián)信息:都重視文獻(xiàn)信息的關(guān)聯(lián)推薦,設(shè)置了相關(guān)作者、相關(guān)機構(gòu)、相關(guān)主題等。中國知網(wǎng)的相關(guān)視頻可直接跳轉(zhuǎn)到知網(wǎng)在線教學(xué)界面查看相關(guān)學(xué)術(shù)會議或論壇視頻。萬方的相關(guān)熱詞相對于主題詞更能夠及時反映某一領(lǐng)域的研究熱點。萬方提供每一篇文獻(xiàn)的關(guān)鍵詞、作者和機構(gòu)等聚類信息,還可鏈接到萬方分析查看其可視化圖譜和相關(guān)推薦。維普在2019年未改版之前設(shè)有相關(guān)期刊,新版改為期刊導(dǎo)航與評價報告。
特色信息:中國知網(wǎng)提供檢索結(jié)果計量可視化分析,包括總體趨勢分析、關(guān)系網(wǎng)絡(luò)、主題及作者分布等。在每一篇文獻(xiàn)之后,中國知網(wǎng)設(shè)置了核心文獻(xiàn)推薦,有研究起點、研究來源、研究分支和研究去脈。萬方提供檢索語詞的智能擴展圖譜,包括同義詞、上位術(shù)語、下位術(shù)語、優(yōu)選術(shù)語等,還可選擇文獻(xiàn)獲取范圍(僅全文、僅免費全文、僅原文傳遞、僅國外出版物)。維普提供參考文獻(xiàn)和引證文獻(xiàn)的引用分析,包括學(xué)術(shù)成果產(chǎn)出、主要發(fā)文人物、主要發(fā)文機構(gòu)和主要學(xué)科
表2三大中文學(xué)術(shù)期刊數(shù)據(jù)庫輔助信息輔助信息中國知網(wǎng)萬方維普關(guān)聯(lián)信息關(guān)聯(lián)作者、相似文獻(xiàn)、相關(guān)基金文獻(xiàn)、讀者推薦、相關(guān)視頻、相關(guān)搜索相關(guān)主題、相關(guān)機構(gòu)、相關(guān)學(xué)者、相關(guān)文獻(xiàn)、相關(guān)視頻、相關(guān)熱詞相關(guān)作者、相關(guān)機構(gòu)、相關(guān)主題、相關(guān)文獻(xiàn)、相關(guān)期刊特色信息計量可視化分析、核心文獻(xiàn)推薦智能擴展、文獻(xiàn)獲取范圍、研究趨勢引用分析、統(tǒng)計分析檢索歷史檢索歷史、瀏覽歷史、下載歷史檢索歷史檢索歷史、瀏覽歷史結(jié)果排序相關(guān)度、發(fā)表時間、被引、下載、綜合相關(guān)度、出版時間、被引頻次、下載量相關(guān)度、被引量、時效性統(tǒng)計等。
檢索歷史:三大數(shù)據(jù)庫基本設(shè)置了檢索歷史、瀏覽歷史和下載歷史,用戶可查看具體的檢索詞列表或文獻(xiàn)列表。中國知網(wǎng)可查看檢索條件、檢索范圍和檢索時間,萬方可查看檢索列表、文獻(xiàn)類型、檢索式、檢索結(jié)果和檢索時間,維普可查看檢索結(jié)果和檢索表達(dá)式。三大數(shù)據(jù)庫都可對檢索歷史進(jìn)行刪除操作。
結(jié)果排序:三大數(shù)據(jù)庫對檢索結(jié)果的排序主要有相關(guān)度、發(fā)表時間、被引量、下載量4種類型,中國知網(wǎng)設(shè)有綜合排序。這些排序代表不同的相似度算法,檢索系統(tǒng)每次排序都會打亂原有順序重新排列,操作簡單卻存在缺陷,如會出現(xiàn)有關(guān)“某雜志被數(shù)據(jù)庫和期刊檢索機構(gòu)收錄”的通知類文獻(xiàn)等與主題內(nèi)容無關(guān)的干擾項。
2中文學(xué)術(shù)期刊數(shù)據(jù)庫檢索效果存在的問題2.1檢索項缺乏,影響檢索效果對一些對于學(xué)術(shù)研究極為重要且在國際社會較為關(guān)注的文獻(xiàn)信息標(biāo)識有所忽略,如DOI、ISSN/CN、通訊作者、ORCID等。維普在其檢索項里沒有設(shè)置DOI和ISSN/CN。近年來越來越多的期刊要求署名通信作者,而三大數(shù)據(jù)庫中只有中國知網(wǎng)提供通信作者檢索項。在ORCID方面,雖然萬方是ORCID系統(tǒng)的合作機構(gòu),但是三大數(shù)據(jù)庫都沒有提供ORCID檢索項。
2.2檢索結(jié)果聚類層次較淺,效果不突出檢索結(jié)果聚類大多是簡單的初始聚類,與檢索項多有重復(fù),且沒有加強聚類層次及對數(shù)據(jù)的深度分析與關(guān)系揭示。如維普對于“數(shù)字圖書館”的關(guān)鍵詞檢索,結(jié)果中以“數(shù)字圖書館”為主要主題的結(jié)果多達(dá)1.8萬條。這樣的簡單歸類對用戶選擇文獻(xiàn)來說并沒有很大作用。檢索結(jié)果排序并沒有有效排除與文獻(xiàn)主題無關(guān)的干擾項,導(dǎo)致聚類效果不突出。此外,三大數(shù)據(jù)庫也沒有提供基于文獻(xiàn)內(nèi)容的附加信息聚類,如圖、表格或其他材料等。
2.3關(guān)聯(lián)推薦質(zhì)量參差不一關(guān)聯(lián)推薦是指“挖掘分析文獻(xiàn)數(shù)據(jù)資源中文獻(xiàn)之間、作者之間、機構(gòu)之間、關(guān)鍵詞之間的關(guān)系,進(jìn)行關(guān)聯(lián)文獻(xiàn)、相關(guān)作者或機構(gòu)、相關(guān)詞語等數(shù)據(jù)資源的推薦”[1]。三大數(shù)據(jù)庫都提供關(guān)聯(lián)推薦,如相關(guān)作者、相關(guān)機構(gòu)、相關(guān)主題、相關(guān)文獻(xiàn)等,但在推薦的項目數(shù)量及內(nèi)容的數(shù)據(jù)分析層次方面存在較大差異,如相關(guān)文獻(xiàn)只是一系列相似文獻(xiàn)的簡單羅列,并沒有進(jìn)一步分析它們之間深層次的共現(xiàn)關(guān)系。
2.4用戶可選擇的檢索項少與檢索詞的多義性干擾提供給用戶的可選擇檢索項少,且用戶無法自由選擇檢索深度與展現(xiàn)方式,只能被動查看系統(tǒng)自動給出的檢索結(jié)果。在檢索項上,用戶只能選擇要不要進(jìn)行檢索詞的中英文擴展、同義詞擴展,數(shù)據(jù)庫并不提供相關(guān)詞匯列表,維普和萬方不支持用戶根據(jù)需求自主選擇一個或多個擴展詞或同義詞,致使檢出結(jié)果數(shù)量龐大,同時包含多個相似主題,檢索效果受到影響。萬方在實施檢索的檢索詞智能擴展雖然對用戶調(diào)整檢索式有一定作用,但是無法在用戶實施檢索之前起到輔助作用。
2.5檢索結(jié)果展現(xiàn)方式單一,可視化程度不足檢索結(jié)果的展現(xiàn)方式過于單調(diào),主要是文摘、列表,屬于原始圖展現(xiàn)方式[2],將檢索結(jié)果簡單地羅列在顯示區(qū)域內(nèi)。一些數(shù)據(jù)庫雖使用了目錄型或樹形展現(xiàn)方式,但只提供類目列表或二級到三級類目。同時,檢索結(jié)果可視化程度也不高,中國知網(wǎng)和維普可生成簡單的可視化分析圖譜,萬方的可視化分析主要在語詞方面,包括檢索詞的關(guān)系圖與主題詞的知識脈絡(luò)圖譜。
3中文學(xué)術(shù)期刊數(shù)據(jù)庫檢索效果提升策略3.1完善檢索項,與國際接軌(1)完善DOI檢索項。DOI符合數(shù)字融合和多媒體應(yīng)用發(fā)展趨勢,是管理數(shù)字網(wǎng)絡(luò)內(nèi)容識別的通用框架,對數(shù)字環(huán)境下的信息管理極為重要。重視通信作者,增加“通信作者”檢索項,與“第一作者”做出區(qū)分,更好地體現(xiàn)科研論文的作者分工協(xié)作關(guān)系,還可設(shè)“第一作者單位”,適應(yīng)未來科研評價與學(xué)術(shù)發(fā)展要求。(2)增加ORCID檢索項。ORCID作為目前使用最廣的“科研人員全球?qū)W術(shù)身份證”,在全世界備受關(guān)注,它不僅可以區(qū)分同名研究者,確保其學(xué)術(shù)活動可以被識別,還可以追蹤該研究者在不同階段學(xué)術(shù)思想的發(fā)展與變化。(3)增加ISSN/CN等國際標(biāo)準(zhǔn)出版物編號,促進(jìn)學(xué)術(shù)規(guī)范。隨著國內(nèi)外開放獲取運動的發(fā)展,OA(Open Access)資源越來越受到學(xué)界關(guān)注,三大數(shù)據(jù)庫也收錄了OA期刊,可增加OA資源文獻(xiàn)標(biāo)識,如arXiv作者ID、URL等。
3.2增加檢索結(jié)果聚類深度,豐富篩選方式科學(xué)設(shè)計檢索結(jié)果聚類體系,對數(shù)據(jù)庫中的文檔進(jìn)行預(yù)處理和分類。改進(jìn)聚類算法,對于二級類目以下的各類目層次,采用層次聚類算法,如基于貝葉斯和諧度的聚類算法、基于層次和密度的任意形狀聚類算法,或非層次聚類算法如高階聯(lián)合聚類算法等,由系統(tǒng)自動根據(jù)文獻(xiàn)對象的屬性特征和數(shù)據(jù)均密來確定聚類個數(shù)和聚類終止點,從而發(fā)現(xiàn)任意形狀的聚類。兩者結(jié)合,既保證類目設(shè)置的科學(xué)性,又根據(jù)本數(shù)據(jù)庫實際收錄的期刊范圍來增加聚類深度。豐富檢索結(jié)果的篩選方式,如增加影響因子分值來過濾論文,增加圖片、表格等附加信息模塊來直觀地查閱文章中文字以外的附加材料,設(shè)置分支學(xué)科細(xì)化學(xué)科大類等。在檢索結(jié)果排序上應(yīng)確保聚類算法的優(yōu)先級,在此基礎(chǔ)上按相關(guān)性、被引量等輔助排序方式顯示,排除干擾項。
3.3優(yōu)化關(guān)聯(lián)推薦,對關(guān)聯(lián)數(shù)據(jù)進(jìn)行深層次分析提供關(guān)聯(lián)推薦,實現(xiàn)知識重組與發(fā)現(xiàn)。一是提供基于內(nèi)容的推薦,如相關(guān)文獻(xiàn)、關(guān)聯(lián)作者、相關(guān)基金、相關(guān)博文、相關(guān)媒體資源推薦(圖像、音頻、視頻等)等;二是提供基于協(xié)同過濾的推薦,如讀者推薦、相似文獻(xiàn)等,如圖1所示。在提供關(guān)聯(lián)推薦的基礎(chǔ)上,利用各種關(guān)聯(lián)數(shù)據(jù)挖掘方法,如以關(guān)聯(lián)數(shù)據(jù)挖掘模型Liddm為代表的直接挖掘法,以事務(wù)構(gòu)建為代表的間接挖掘法和以啟發(fā)式關(guān)聯(lián)遍歷挖掘、深度學(xué)習(xí)為代表的鏈接挖掘法等[3],對數(shù)據(jù)的動態(tài)分布、語義聯(lián)系、范圍和規(guī)模等做出詳細(xì)描述與深層次分析,形成文檔分析報告或可視化圖譜,實現(xiàn)檢索系統(tǒng)的個性化推薦服務(wù)以及知識決策服務(wù)。
3.4加強對用戶檢索過程的控制與幫助建立全面的語料庫系統(tǒng),避免檢索詞的多義性干擾,將用戶輸入的自然語言轉(zhuǎn)換成相應(yīng)的規(guī)范語言(敘詞),并提供語詞列表讓用戶根據(jù)需要自主選擇檢索詞。如PubMed數(shù)據(jù)庫[4]在檢索詞方面提供了MeSH詞表詞、MeSH詞確立日期、MeSH主要主題詞、MeSH副主題詞、文本詞等供用戶選擇。EBSCO數(shù)據(jù)庫[5]為了防止漏檢和誤檢,提供專業(yè)的主題詞索引,根據(jù)用戶輸入的檢索詞自動推薦相關(guān)規(guī)范詞匯,使用戶可以優(yōu)先選擇主題詞來進(jìn)行檢索。提供用戶可選擇的檢索項,如信息類型、類目精確度、學(xué)科、網(wǎng)站、地域、資源類型、結(jié)果顯示方式等。如MDPI(Multidisciplinary Digital Publishing Institute)期刊檢索[6]設(shè)置了論文類型檢索項,作者在檢索時可選擇review、case report、commentary、concept paper、data descriptor、guidelines、study protocol、project report等多種論文類型。中國知網(wǎng)在檢索之前就提供包含資訊選項來區(qū)分學(xué)術(shù)研究文獻(xiàn)與資訊文獻(xiàn)。數(shù)據(jù)庫檢索系統(tǒng)應(yīng)該建立用戶反饋機制,使用戶在檢索過程中遇到的問題能得到及時反饋與有效解決。
3.5豐富檢索結(jié)果展現(xiàn)內(nèi)容與形式積極探索和嘗試多種可視化技術(shù),如基于幾何的技術(shù)、基于圖標(biāo)的技術(shù)、基于圖形的技術(shù)、面向像素的技術(shù)等[7],結(jié)合交互技術(shù)與扭曲技術(shù)[8],使用戶在可視化的基礎(chǔ)上能夠?qū)梢暬^程進(jìn)行干預(yù),對自定義的局部數(shù)據(jù)進(jìn)行多樣性操作。在內(nèi)容展現(xiàn)方面提供宏觀分析與微觀分析可視化,如圖2所示。宏觀分析應(yīng)提供對檢索結(jié)果的總體分析,包括某主題研究趨勢圖、資源類型分布、學(xué)科分布、作者及機構(gòu)分布、基金分布等;微觀分析應(yīng)以某篇文獻(xiàn)為對象進(jìn)行分析,如該文章的引文網(wǎng)絡(luò)、作者合作關(guān)系、關(guān)鍵詞共現(xiàn)等。通過各種方法對文獻(xiàn)進(jìn)行整合與分析,生成可視化文件,并在保護(hù)知識產(chǎn)權(quán)的前提下支持下載與利用。
4結(jié)語數(shù)據(jù)庫檢索水平的高低會直接影響科研人員研究的進(jìn)展與效率。隨著人工智能、云計算、大數(shù)據(jù)等信息技術(shù)的發(fā)展,特別是 ChatGPT的出現(xiàn),一定程度上沖擊了以往搜索引擎式的檢索與數(shù)據(jù)庫檢索,引起了新一輪信息檢索與服務(wù)方式的變革與轉(zhuǎn)型。應(yīng)加大對中文學(xué)術(shù)期刊數(shù)據(jù)庫檢索效果的理論與實踐研究,逐步升級現(xiàn)有數(shù)據(jù)庫檢索系統(tǒng),優(yōu)化檢索性能,促進(jìn)知識重組和知識發(fā)現(xiàn),滿足用戶對深層次復(fù)雜信息的需求,從而提高信息檢索效率和資源利用效率,帶給用戶更好的檢索體驗。
參考文獻(xiàn)
[1]吉雍慧.數(shù)字圖書館中的檢索結(jié)果聚類和關(guān)聯(lián)推薦研究[J].現(xiàn)代圖書情報技術(shù),2008(2):69-75.
[2]鄭海燕.關(guān)系數(shù)據(jù)庫對象級別檢索結(jié)果的聚類展現(xiàn)方法研究[D].大連:大連海事大學(xué),2013.
[3]崔家旺,李春旺.基于關(guān)聯(lián)數(shù)據(jù)的知識發(fā)現(xiàn)技術(shù)述評[J].圖書與情報,2016(5):119-125.
[4]NCBI.PubMed[DB/OL].[2023-02-09].https://www.ncbi.nlm.nih.gov/pubmed/advanced.html.
[5]EBSCOhost.ASP&BSP[DB/OL].[2023-02-09].http://search.ebscohost.com/.
[6]MDPI.Advanced search[DB/OL].[2023-03-01].https://www.mdpi.com/.
[7]吳靜.基于站點地圖的可視化研究及交互設(shè)計應(yīng)用[D].長沙:湖南大學(xué),2012.
[8]任永功,于戈.數(shù)據(jù)可視化技術(shù)的研究與進(jìn)展[J].計算機科學(xué),2004(12):92-96.
(編輯李春燕編輯)
Investigation and analysis of retrieval effect of Chinese academic journal databaseGuo? Biyu Fan? YanfenZhang? Yu
(1.Library, Sichuan Institute of Arts and Science, Dazhou 635002, China;
2.Library, Liaoning University, Shenyang 110036, China)Abstract:? The article takes three Chinese academic journal databases, namely CNKI, VIP, and Wanfang, as examples to access and implement searches on the three major database journal retrieval platforms. From the perspectives of search items and search results, it is found that the retrieval effect of Chinese academic journal databases is not ideal. It is proposed to improve search items, deepen clustering levels, optimize association recommendations, control and assist users in the retrieval process, improve the visual presentation and other aspects to enhance the effectiveness of database retrieval.
Key words: academic journal; database; retrieval effect