• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      讀秀與萬方:二維檢索空間與多維檢索空間的演繹?

      2014-12-25 02:15:38
      圖書館 2014年2期
      關鍵詞:標引字段全文

      (安徽大學管理學院 安徽合肥 230601)

      科學研究的起始建立在獲取大量真實并且有價值的信息數(shù)據(jù)之上。優(yōu)質(zhì)的學術搜索引擎可以滿足研究人員在不同研究階段所需的諸如起源性、全面性、新穎性的文獻要求。從使用者角度判別用戶信息需求是否完全實現(xiàn),可以通過兩個指標鑒定,即信息檢索結果的準確性和信息原文獲取的便捷性。同時,任何學術搜索引擎從基礎檢索服務到高級知識服務都需為用戶提供易于上手的檢索方法并實現(xiàn)檢索結果的便捷獲取。實現(xiàn)這一復雜過程,專業(yè)的學術搜索引擎系統(tǒng)需從信息資源來源、信息組織方式、信息檢索方式、信息篩選方式到原文顯示與提供做精心的布置。

      1 讀秀學術搜索與萬方知識服務平臺概況

      讀秀學術搜索擁有豐富的文獻類型、龐大的全文數(shù)據(jù)資源、簡明的檢索方式和330萬篇數(shù)字化圖書聯(lián)合成員館本地館藏書目,提供深入全文和章節(jié)目錄的知識檢索,實現(xiàn)館藏紙質(zhì)圖書、電子圖書、學術文章等各種異構資源在同一平臺的一站式檢索,海量全文數(shù)據(jù)通過系統(tǒng)自動化文獻傳遞服務,為研究人員學習、寫論文、做課題提供全面的學術資料和獲取知識資源的捷徑。

      萬方知識服務平臺融合了12種類型數(shù)據(jù)庫,以其強大的外文文獻庫、專利信息庫、科技成果庫成為研究人員查找科技信息必備的搜索引擎,數(shù)據(jù)庫對資源的有序組織配備完備的檢索系統(tǒng),達到高檢準率的要求。

      2 讀秀庫與萬方庫功能對比

      2.1 資源覆蓋對比

      從資源類型來看,萬方數(shù)據(jù)庫覆蓋13種資源類型,分別是學術論文、期刊、學位論文、會議論文、學者、專利、標準、成果、圖書、法規(guī)、機構和專家;讀秀數(shù)據(jù)庫覆蓋25種資源類型,除去萬方庫已有類型,還有電子書、視頻、詞條、詞典、課程、文檔、考試輔導、圖片、電影、音樂和虛擬咨詢。除了公開正式出版的學術文獻,讀秀庫還涉及了隱藏在博客、論壇、網(wǎng)頁、新聞、講座內(nèi)的學術信息,同時通過提供例如考試資料、電影、音樂資源滿足研究人員生活化和娛樂化信息需求。從資源數(shù)量來看,讀秀庫以7610萬的學術論文、330萬圖書和8300萬報紙數(shù)量優(yōu)勝于萬方庫的2680萬學術論文和4500萬圖書數(shù)量(見表1)。

      表1 文獻數(shù)量與類型對比

      綜上,讀秀庫文獻來源種類新穎繁多,資源數(shù)量龐大,涉及面廣,覆蓋面全,各種類型的資源收錄均勻。萬方庫的資源覆蓋面有限,分布的重點在全文收錄、按月更新的外文期刊庫、外文會議論文庫、學者庫、科技成果庫和專利庫,資源量總體少于讀秀庫(見圖1)。

      圖1 資源覆蓋對比

      2.2 檢索功能對比〔1〕

      標引深度。檢索功能的強大與否體現(xiàn)了數(shù)據(jù)庫的標引程度。讀秀知識搜索只提供輸入關鍵詞的初級檢索,對于查找資料的廣泛性和全面性達到保障,但是無法有效的保障查找資料的準確性。尤其是面對資源量龐大的讀秀庫,只通過關鍵詞的初級檢索得到的檢索結果亦是龐大的數(shù)量,用戶難以在短時間內(nèi)找出最精準的一篇文獻。萬方提供初級檢索、高級檢索和專業(yè)檢索。高級檢索的檢索模式為“某字段”匹配“精準度”匹配“年限”匹配“文獻類型”,字段與字段之間的運算關系運用“與”、“或”、“非”邏輯算符表達。專業(yè)檢索可以提供一段文本(比如科學技術要點),由系統(tǒng)推薦檢索詞。使用高級檢索和專業(yè)檢索查找文獻是研究人員提高檢準率必需掌握的檢索策略。

      表2 讀秀和萬方檢索字段對比

      檢索字段。一個字段即一個檢索入口,通過字段檢索用戶可以快速準確地查找所需文獻,每一個字段入口都是數(shù)據(jù)庫的一個倒排文檔。通過表2可以看出,讀秀庫提供的可檢索字段有13個,占所列字段的37%,僅僅提供文獻類型的主要特征檢索,降低檢準性。萬方庫提供的檢索字段共26個,占列出35個字段的74%,檢索字段豐富,提供用戶多入口檢索。萬方庫的檢索字段有主題檢索,說明在文獻入庫時加工人員對每篇文獻重新進行準確的主題標引和深加工。

      檢準率。以“學術搜索”為關鍵詞,分別在讀秀庫和萬方庫的期刊庫中使用關鍵詞字段檢索,讀秀庫得到85篇題錄,經(jīng)過排查,85篇題錄均為庫內(nèi)全文數(shù)據(jù),其中56篇的關鍵詞有“學術搜索”,29篇期刊論文無法檢索關鍵詞字段,說明讀秀庫對于29篇論文沒有做關鍵詞標引,只有題名、作者、刊名、出版日期、ISSN、期號、參考文獻格式、摘要。因此檢索讀秀庫的全文獲取率為100%,檢準率為56/85=66%。在萬方庫檢得文獻70篇,經(jīng)過檢查,67篇文獻為全文信息,并且都滿足檢索條件,因此全文獲取率為95%,檢準率為100%。

      圖2 檢索功能對比

      通過檢索功能的數(shù)據(jù)對比(見圖2),可以看出讀秀庫的檢索入口覆蓋率正好是萬方庫的一半。多字段匹配檢索某一文獻相當于在多維空間中多坐標定位某一點,快速而精準。庫內(nèi)文獻量龐大而系統(tǒng)檢索功能不充足,想要準確找到需求文獻需要花費一定時間和精力,這是檢索人員不希望遇到的情況。因此檢索功能強大的萬方庫檢準率必然比讀秀庫高。但從全文獲得率來說,讀秀庫的全文數(shù)據(jù)比萬方庫高。

      2.3 結果篩選對比

      讀秀庫的結果篩選方便易操作,在用戶檢索某一類型文獻時,系統(tǒng)自動將其他所有類型文獻執(zhí)行相同檢索,在同一界面顯示。檢索結果可以通過左側的年代、學科、期刊名、期刊種類篩選,或右側的匹配方式和排序方式篩選。

      萬方庫的結果篩選只有兩種方式:年份和學科兩大類。萬方數(shù)據(jù)庫對于入庫文獻的充分組織和標引,保證較高的檢索準確率,結果僅作基本篩選即可滿足需求。讀秀庫的檢索功能無法達到較高檢準率時,必須依靠強大的結果篩選功能才能保證檢索結果可視化。

      2.4 文獻獲取對比

      讀秀庫的文獻獲取方式多樣,主要方式為“圖書館文獻傳遞”,輸入接收電子郵箱和驗證碼即可,系統(tǒng)自動將文獻發(fā)送郵箱。這種獲取方式規(guī)避了未知數(shù)量的用戶點擊鏈接自主批量下載的法律風險,我國信息網(wǎng)絡傳播權規(guī)定在電子文獻通過網(wǎng)絡一對一傳遞的情況下,屬于合理適用范圍。其他獲取方式還有文獻互助、本地館藏信息、網(wǎng)絡書店信息推送。萬方的獲取方式只有一種,即點擊相應鏈接下載。

      3 檢索空間的構建

      數(shù)據(jù)庫對文獻組織和知識加工的目的在于有序揭示文獻資源,并建立一個簡潔明了、便于使用的檢索系統(tǒng)。一方面,文獻經(jīng)過深加工與挖掘,需要配備相應良好功能的檢索系統(tǒng),讓研究人員在不同檢索過程中深刻體驗到系統(tǒng)數(shù)據(jù)加工的有序性和檢索功能的易用性。另一方面,對文獻的標引深度、有序組織程度和知識挖掘程度影響研究人員對文獻和文獻間知識關聯(lián)的理解程度?!?〕按照知識挖掘深度,本文把數(shù)據(jù)庫組織程度分為如下幾個層次:

      ①一維組織是指對大量文獻有序的收納入庫,這個“序”可能是文獻入藏的序列號,所有文獻按照序號排列形成一維組織空間。一維空間是一條直線,決定直線長度的即文獻量的多少,對一維組織空間里的文獻進行檢索稱為一維檢索空間,特征是只有一條X軸,數(shù)據(jù)按序列號順排查找。從本質(zhì)講,維度組織空間和維度檢索空間是同一空間,每個坐標軸和軸上的刻度、量才是一樣的,每條軸對應一個檢索字段。標引人員使用則稱為組織空間,檢索人員使用則稱為檢索空間。②二維組織在一維組織的基礎上,對入藏文獻的外部特征進行二次標引和組織,外部特征主要有著者姓名、出版者、文獻題名、出版日期,增加檢索字段即增加一條軸,同時增加檢索維度形成二維檢索空間。二維空間是一個平面,特征是有兩條坐標軸:X軸和Y軸。③三維組織在二維組織的基礎上,增加標引深度同時也增加了檢索維度,在這一維的組織中,通常使用的組織方法是對文獻內(nèi)容特征進行挖掘,主要有關鍵詞、主題詞的標引、賦予分類號。三維空間是一個立體空間。④四維組織利用文獻間內(nèi)容的關聯(lián),諸如文獻與文獻的引證與被印證關系、科技查新對比尋求空間里點對點(點指代某篇文獻)的關系,組織成四維檢索空間。⑤五維組織主要是知識發(fā)現(xiàn)與趨勢預測技術,尋求點對面(面指代某個倒排文檔)、面對面的關系。例如用專利地圖分析A公司發(fā)展策略,檢索到某公司與其最大競爭對手公司所發(fā)明的專利,并用相應軟件平臺繪制兩家公司主要的技術分布和研發(fā)重點(見圖3)。圖中A圈區(qū)域表示A公司擁有專利的主題地形,B圈部分表示其競爭對手擁有專利的主題地形,C圈區(qū)表示兩公司專利申請的空缺部分,可以看出對手在此領域中專利申請量較少,對A公司而言,可適當考慮技術合作或并購其對手,避免技術重復研發(fā)或因?qū)@Wo造成兩敗俱傷。這種利用深層知識挖掘支持決策、預測方向在信息咨詢中具有較大應用價值。⑥多維組織。從一維空間到多維空間的組織,同時也是對文獻從定量分析到定性分析的過程,使得雜亂無序的文獻庫從線到面、從面到體,逐漸可視化。〔4〕而研究人員在研究過程中的文獻需求,正符合這個由線到體逐漸細化的特征:研究之初,科研人員需要研讀大量文獻,逐漸確定研究結構后,從文獻需求過渡到知識需求,這個知識需求的滿足可能就是某篇文章里的幾句話對作者的啟發(fā)。

      圖3 兩家公司專利分布地形圖〔3〕

      4 二維檢索空間和多維檢索空間的演繹

      讀秀庫的特色:①讀秀中文圖書資源不僅擁有超星數(shù)字圖書館公司所支持的海量書籍資源,同時聯(lián)合成員館實地館藏目錄和網(wǎng)上大型書店的圖書目錄。揭示資源在各館分布情況,保障使用者多種途徑獲取文獻。②可以大幅深入全文的知識點查找,提高檢全率;比如在圖書章節(jié)中,某段話中陳述的一個結論、提出的新名詞或關于研究的發(fā)展方向,這些新知識點雖還未成系統(tǒng)的在論文或?qū)V姓撌?,但很可能成為研究之初最寶貴的資料。需要檢索關于某主題在公開發(fā)表文獻中最早的資料,可以通過讀秀學術搜索引擎檢索知識點,不僅可以查找到專門、系統(tǒng)論述的文獻,還可以查找到隱藏在文獻內(nèi)容之間的起源知識點。③全文獲取率高,系統(tǒng)根據(jù)用戶郵箱自動將所需文獻發(fā)送至用戶郵箱。④實現(xiàn)一站式檢索,輸入一個關鍵詞,檢索結果包涵了25種類型的文獻。

      萬方庫的特色:①廣博的外文文獻庫保證了科研人員查找外文資料的信息需求。②包涵專利數(shù)據(jù)庫、科技成果數(shù)據(jù)庫、中外標準數(shù)據(jù)庫的科技信息庫成為萬方庫資源的最大特色。③數(shù)據(jù)庫對文獻進行精確的標引,加深數(shù)據(jù)標引程度的同時對文獻間的知識關聯(lián)漸進可視化。④檢索功能強大,多字段檢索入口保證用戶快速準確查找到空間內(nèi)某節(jié)點文獻。

      因此,擁有龐大的資源量但未配備強大、深入、可視化的檢索系統(tǒng),使得讀秀庫像平面一樣在二維檢索空間無限伸展,大量資源只能以單個特征存在于這個平面上,無法立體化展示點對點(某篇文獻與文獻或知識點與知識點)的關系、點對面(文獻與某個倒排文檔或知識點與所有文獻)的關系以及面對面(知識的深層挖掘)的關系。如果把擁有海量資源但標引未延伸到立體、可視化深度的讀秀庫比作二維檢索空間,那么萬方庫則可稱為多維檢索空間。多維首先體現(xiàn)在檢索入口的多樣化,雖然資源量少但質(zhì)量高,經(jīng)過數(shù)據(jù)庫組織人員的重新標引和逐步知識間關聯(lián)挖掘,使得使用者在數(shù)據(jù)庫中多維(一個維即一個倒排文檔的檢索入口)、多坐標定位檢索精準至某個文獻。〔5〕

      5 結語

      高檢全率的讀秀庫和高檢準率的萬方庫以其各自的特色為科研人員提供了不同廣度和深度的信息服務。海量資源以平面空間分布為特征、附帶便捷獲取方式的讀秀庫為科研人員在初期研究提供了廣泛、全面搜羅學術資源、網(wǎng)絡資源和館藏資源的平臺;精質(zhì)資源以立體空間分布為特征、深入挖掘知識關聯(lián)的萬方庫為研究人員提供了深層標引、準確定位科技信息和知識的平臺。讀秀庫在發(fā)揮其廣博資源量的基礎上,應該強化系統(tǒng)的檢索功能和標引深度,對于龐大的數(shù)據(jù)庫,可以嘗試自動標引輔以人工修正標引的方式進行,加深知識關聯(lián)和數(shù)據(jù)挖掘。萬方庫務必完善全文獲取途徑,在使用高檢準率的檢索系統(tǒng)時,檢索結果如果只是題錄信息,亦是使用者不希望看到的。數(shù)據(jù)庫的建設一方面需要包涵充足的資源,另一方面要加深文獻標引和文獻間知識關聯(lián)的挖掘,為科研人員提供可操作的知識發(fā)現(xiàn)平臺。

      1.肖滬衛(wèi).專利地圖方法與應用.上海:上海交通大學出版社,2011:337-338

      2.湯梅.主要國際性學術搜索引擎的比較分析.中國科技期刊研究,2011(3):385-387

      3.L.Ermann1,A.D.Towards Two - dimensional Search Engines.Journal of Physics A,2012(27):275-297

      4.Qinghua Zhu.Using a Delphi method and the analytic hierarchy process to evaluate Chinese search engines A case study on Chinese search engines.Online Information Review,2011(6):942 -956

      5.Koutsoudis,A .3DSSE -A 3D Scene Search Engine Exploring 3D scenes using keywords.Journal Of Cultural Heritage ,2011(2):187 -194

      猜你喜歡
      標引字段全文
      圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
      全文中文摘要
      風機技術(2021年3期)2021-08-05 07:41:38
      全文中文摘要
      風機技術(2019年4期)2019-06-24 05:42:14
      檔案主題標引與分類標引的比較分析
      本刊對來稿中關鍵詞標引的要求
      青年再造
      南風窗(2017年9期)2017-05-04 21:04:27
      本刊對來稿中關鍵詞標引的要求
      CNMARC304字段和314字段責任附注方式解析
      無正題名文獻著錄方法評述
      構思精巧余味無窮 諷刺鞭撻淋漓盡致——再談“虛榮”貫穿《項鏈》全文
      語文知識(2014年5期)2014-02-28 21:59:59
      肥乡县| 科尔| 凯里市| 章丘市| 永兴县| 玉树县| 台前县| 耿马| 灌云县| 博湖县| 康乐县| 右玉县| 涞水县| 广平县| 松溪县| 宝清县| 临城县| 连城县| 隆昌县| 潜山县| 拜城县| 鹤壁市| 庄河市| 如皋市| 垦利县| 德安县| 和林格尔县| 北流市| 吴桥县| 华亭县| 清水县| 宁河县| 普宁市| 延寿县| 宝应县| 金湖县| 通化市| 平阳县| 长葛市| 靖江市| 宣武区|