• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于人機交互的數(shù)字圖書相關聯(lián)查詢系統(tǒng)設計

    2022-02-13 10:00蘭小紅
    現(xiàn)代電子技術 2022年2期
    關鍵詞:數(shù)字圖書查全率文檔

    張 鑫,蘭小紅

    (1.江蘇科技大學,江蘇 張家港 215600;2.江蘇科技大學蘇州理工學院,江蘇 張家港 215600)

    0 引言

    在圖書館數(shù)字化技術發(fā)展的推動下,借書產(chǎn)生的數(shù)據(jù)量增大,數(shù)據(jù)種類越來越多,信息更新速度也越來越快,數(shù)字圖書資源呈現(xiàn)爆炸式增長趨勢。同時,高校科研人員對圖書查詢信息的要求也越來越高,體現(xiàn)在其針對性和實時性較強,需求種類較多。人們不再是僅需要了解圖書的基本信息,而是需要通過相關數(shù)據(jù),方便地獲得圖書目錄的權威分析,從而更準確、快速地找到科研所需的相關資源。在實時性方面,要求在短時間內(nèi)滿足當下最新的信息需求?,F(xiàn)代圖書館利用數(shù)字化技術為讀者提供查詢服務,成為讀者與圖書館聯(lián)系的第一途徑。圖書查詢的目的是從大量的圖書資源庫中找到滿足用戶需求的圖書,這個概念類似于數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)查詢。通過使用查詢系統(tǒng),用戶可以查詢圖書館的所有藏書并獲得有用的信息。因此,準確把握用戶需求是圖書館提供優(yōu)質服務的前提。與發(fā)達國家相比,中國數(shù)字圖書館的發(fā)展還處于起步階段,同時數(shù)字圖書館查詢系統(tǒng)的研究成果并不多見。目前最具代表性的查詢系統(tǒng)是:基于Access 的圖書查詢管理系統(tǒng)和基于語義關聯(lián)的查詢系統(tǒng)。但上述傳統(tǒng)查詢系統(tǒng)在數(shù)字圖書館服務的應用中查詢速度較慢、查全率較低。

    為此,本文采用人機交互技術,解決上述傳統(tǒng)查詢系統(tǒng)在實際工作中存在的應用問題。人?機互動技術是數(shù)字圖書館與用戶溝通的唯一橋梁,具有個性化、智能化的人機交互功能,是實現(xiàn)有效查詢信息的關鍵。文中運用人機交互技術為查詢系統(tǒng)設計友好、直觀、方便、人性化和智能化的人機交互界面,以確保查詢結果與用戶需求相一致。實驗結果表明,設計系統(tǒng)數(shù)字圖書查詢耗時較短且查全率較高,為實際應用提供了一定參考。

    1 數(shù)字圖書相關聯(lián)查詢硬件系統(tǒng)設計

    根據(jù)數(shù)字圖書館建設的實際需要,采用成熟的技術方案,保證系統(tǒng)的可用性及不斷升級。本文根據(jù)穩(wěn)定性、開放性和兼容性的原則,從硬件、數(shù)據(jù)庫和軟件三個方面對查詢系統(tǒng)進行了優(yōu)化。

    1.1 Solr 服務器

    Solr 為索引服務器,支持多種輸出格式,比如XML/XSLT,且主要提供級別搜索和高亮度顯示。Solr 易于安裝和配置,并且具有基于HTTP 的管理界面。當前Solr服務器已經(jīng)發(fā)展得比較成熟,同時Lucene 的相關術語包也得到了擴展,二者完全相容。使用簡單的Solr 配置可與其他Lucene 應用程序內(nèi)建的索引相兼容;在某些特殊情況下,使用Solr 服務器還可以在部分Lucene 工具中實現(xiàn)索引創(chuàng)建,只需進行額外的編碼即可。

    1.2 文本掃描機

    文本類型檢索系統(tǒng)還必須線性掃描文本,以確定其中是否存在特定的短語或查詢模式。掃描程序的基本結構包括磁盤控制器、項目檢測器、檢索控制器以及問題解答器四個特殊的單元,如圖1 所示。

    圖1 圖書文本掃描機結構

    項目檢測器是一種高性能硬件單元,用于對磁盤上的文本進行掃描,可以在接收到文本源時從多個項目中識別任意一個項目。在項目檢測和查詢解答器之間,檢索控制器進行數(shù)據(jù)傳輸操作和通信。查詢解答器是一個決策處理程序,確定項目檢測找到的項目列是否匹配用戶的查詢項。此外,在圖1 設備中,只使用一個搜索模塊時,掃描文本的速度可以達到每秒100 萬字符。

    1.3 單片機控制模塊

    圖2 單片機控制器

    圖2 中,單片機控制器可以單獨執(zhí)行一個程序,但是需要根據(jù)關聯(lián)規(guī)則將該程序預裝在控制器的某一區(qū)域,根據(jù)動作執(zhí)行相應指令。

    1.4 指令接收與發(fā)送模塊

    指令收發(fā)模塊可以設計為手持收發(fā)模塊,通過單片機與傳輸芯片接口相連,實現(xiàn)信號的收發(fā);然后處理反饋信號,利用內(nèi)部的語音模塊向主機發(fā)出提示。指令接收與發(fā)送模塊連接電路圖如圖3 所示。

    圖3 指令接收與發(fā)送模塊連接電路圖

    RXD 和TXD 引腳可分別與NRF401 的DOUT 和DIN引腳連接,并收發(fā)數(shù)據(jù)。當“T0.2”為“接收數(shù)據(jù)”時,終端將進入“發(fā)送數(shù)據(jù)”狀態(tài);當“發(fā)送數(shù)據(jù)”為“輸出”時,將進入“XEN”狀態(tài)。P.0 控制端可以從高跳到低。

    1.5 檢索處理機

    從整體上講,檢索處理機可分為并行和聯(lián)接兩部分,其中并行處理機可通過兩個不同的處理器分別檢索一個數(shù)據(jù)庫的不同部分,或每個處理器對同一個數(shù)據(jù)庫執(zhí)行不同的操作,從而使處理時間隨著處理器數(shù)量的增加而減少。第二種多處理器的設計包含多個相聯(lián)處理器,各處理器都相同,在每一個時刻執(zhí)行相同的任務。也就是每一行相聯(lián)處理機陣列都設計為接收信息項,并且所有行的內(nèi)容都是同步處理的。在保證系統(tǒng)查詢速度和精度的同時,本文設計系統(tǒng)還安裝了兩種處理器設備。

    2 數(shù)字圖書相關聯(lián)查詢系統(tǒng)數(shù)據(jù)庫設計

    數(shù)字圖書相關聯(lián)查詢系統(tǒng)是以ORACLLOG 為后臺數(shù)據(jù)庫,利用ADO JSP 程序與數(shù)據(jù)庫連接,進行數(shù)據(jù)庫查詢、添加、修改、刪除等操作的應用系統(tǒng)。利用數(shù)據(jù)關系進行數(shù)據(jù)庫設計的關鍵在于數(shù)據(jù)庫表中列的設計。在設計數(shù)據(jù)庫表時,本文根據(jù)各功能模塊建立數(shù)據(jù)表,對各功能模塊的功能數(shù)據(jù)進行分類,生成數(shù)據(jù)庫表中的列。該關系數(shù)據(jù)庫對數(shù)據(jù)表進行了合理的分類,更有利于操作管理、維護和升級。然后,根據(jù)概念模式設計相應的關系模式,確定查詢系統(tǒng)中關系模式表的結構。圖書屬性表是存儲圖書館藏書相關信息的表格,主要包括書名、條碼、作者、譯者、價格、出版者、出版日期、圖書類型、供應商、ISBN、館藏圖書數(shù)量、借閱金額、保存時間等內(nèi)容。圖書屬性表的結構如表1 所示。

    沒有完善的程序,檢察機關就可能既要面對對“檢察優(yōu)勢”的憂慮又要面對對監(jiān)督效果不彰的質疑。前文的論述主要是對民事訴訟法律監(jiān)督程序的方向性預測。整合現(xiàn)有制度、以最小社會成本發(fā)揮法律監(jiān)督作用的程序細節(jié)尚待思考??梢灶A見的是,制度的整合與過程的透明,將是程序設計的重心。

    表1 數(shù)字圖書屬性表

    同理可以將數(shù)字圖書的應用與查詢歷史信息按照時間順序存儲在數(shù)據(jù)庫中。數(shù)據(jù)庫安全分為保障與保密性兩部分,保障是指資料庫的可靠與穩(wěn)定;保密性包括數(shù)據(jù)加密和數(shù)據(jù)權限控制。數(shù)據(jù)庫定期對系統(tǒng)數(shù)據(jù)進行備份,并將數(shù)據(jù)文件和日志文件分別備份到不同的物理設備上,從而保證數(shù)據(jù)的可靠性。如出現(xiàn)數(shù)據(jù)問題,可保證恢復數(shù)據(jù)。本文系統(tǒng)的數(shù)據(jù)庫進行分級設置權限,不同的管理員有不同的訪問權限,既可保障數(shù)據(jù)庫的安全性,還保證數(shù)據(jù)訪問權不會被非法使用。

    3 數(shù)字圖書相關聯(lián)查詢系統(tǒng)軟件功能設計

    3.1 人機交互功能模塊

    在系統(tǒng)環(huán)境中建立可視化界面,方便操作人員以及用戶直接操作,以此來了解系統(tǒng)內(nèi)部功能的變化情況,并實現(xiàn)對系統(tǒng)功能的運行控制。本文利用多媒體平臺開發(fā)軟件功能,豐富系統(tǒng)的視覺界面,確定常用功能并控制其進入操作界面。建立的工作界面人機交互模塊功能向導框架如圖4 所示。

    圖4 人機交互模塊功能向導框架

    3.2 數(shù)字圖書相關聯(lián)查詢功能模塊

    3.2.1 收集數(shù)字圖書信息

    數(shù)字圖書信息包括圖書目錄信息、書目信息和書目數(shù)據(jù)信息。先給出圖書目錄的入口地址,然后下載該頁面,在目標內(nèi)容段中使用正則表達式匹配,可得到圖書目錄各個層次上的基本信息。例如:當前目錄下的圖書數(shù)包含分類號和書目數(shù)量等,而層次上的信息包含分類號、類名以及不同層次之間的關系等,若目前目錄的子目錄仍包含目錄,則繼續(xù)執(zhí)行遞歸操作,直到目前目錄下只有書籍,不包含目錄為止。查詢功能模塊能夠合理地收集書名、作者、書號等信息,并將所收集的數(shù)字圖書儲存在數(shù)據(jù)庫中指定的地方。

    3.2.2 數(shù)字圖書文本處理

    為使計算機能夠理解自然語言,需要對出現(xiàn)在計算機中的每一個詞都進行工作理解,即從詞義構造來表達語句的意思和從語義構造來表達言語的結構。其中,語法、語義、語用等知識的有效運用,以及與之相關的各種知識的運用是研究的重點。一般情況下,漢語理解可分為原文輸入、自動分詞與詞性標注、語法與句法分析、語義與語用和語境分析、產(chǎn)生目標形式表示、句群與篇章理解等步驟。詞匯量的分析是基礎,句子的分析是核心,篇章的理解是最終目標。文本特征選擇可分為信息增益、互信息、證據(jù)權值等,具體的提取過程如下:

    式中:和為文檔類變量;(?)為文檔類集合;odds(?)為文檔類特征量。最終的計算結果IG(),MI(,)和WE()分別表示信息增僧、互信息、證據(jù)權值。

    3.2.3 計算數(shù)字圖書關聯(lián)度

    使真正相關的文檔盡可能包含在通過相關性計算得到的高等級文檔中,而那些被過濾掉的低等級文檔包含的文檔數(shù)量盡可能少。文件間的相似性通常是通過對兩個文件的矢量進行內(nèi)積運算而獲得的,如下:

    式中:分別為文檔向量和的第維矢量;為文檔集合中所有詞的數(shù)目,即文檔向量的維數(shù)。

    3.2.4 生成查詢索引

    用戶可向任何Replica 服務器遞交文件。若提交到相應的服務器上的文件不是片頭Leader,它會將用戶請求轉發(fā)給同一片頭的Leader 進行處理,然后接收到片頭的Leader 將文檔分發(fā)到它包含的每個Replica 服務器上,以執(zhí)行響應命令,完成索引創(chuàng)建。若用戶提交的文檔不屬于已提交的分片,該分片的Leader 會將其傳遞到對應的分片Leader 處理,該Leader 會將用戶提交的文檔重新發(fā)送到其分片的所有Replica 中,以完成索引創(chuàng)建。

    3.2.5 實現(xiàn)數(shù)字圖書相關聯(lián)查詢

    在數(shù)字圖書相關聯(lián)查詢過程中,設置一個關聯(lián)度閾值,將查詢語句或關鍵詞輸入到系統(tǒng)中,并通過中文文本處理得出關鍵詞特征。將關鍵詞特征與系統(tǒng)數(shù)據(jù)庫中存儲數(shù)字圖書的關鍵特征進行關聯(lián)度計算,并將所有關聯(lián)度大于閾值的數(shù)字圖書名稱輸出,按照關聯(lián)度的降序順序進行排列,得出數(shù)字圖書相關聯(lián)的查詢結果。

    4 系統(tǒng)測試

    以測試基于人機交互的數(shù)字圖書相關聯(lián)查詢系統(tǒng)的運行功能和應用性能為目的,設計系統(tǒng)測試實驗,并通過與其他查詢系統(tǒng)的對比體現(xiàn)出設計查詢系統(tǒng)的優(yōu)勢。因此,分別設置文獻[4]系統(tǒng)和文獻[5]系統(tǒng)作為實驗的對比系統(tǒng)。

    4.1 開發(fā)與運行環(huán)境

    采用Code.behind 方式,使代碼與內(nèi)容保持獨立,避免因開發(fā)過程中內(nèi)容與腳本交叉而造成的維護困難,提高開發(fā)效率。另外,在ASP.NET 中,創(chuàng)建和使用Web 服務也很方便,Web 服務的創(chuàng)建者無需了解SOAP 和XML的詳細信息,只需專注于自己的服務。利用ASRNET,網(wǎng)絡應用程序的創(chuàng)建、運行和發(fā)布將變得非常方便和高效。

    4.2 準備數(shù)字圖書數(shù)據(jù)集

    為了保證實驗結果的可信度,在該系統(tǒng)環(huán)境下設置數(shù)字圖書數(shù)據(jù)集。實驗中使用的數(shù)據(jù)集分為兩個部分,第一部分選擇某市圖書館作為數(shù)據(jù)來源,使用掃描儀得出數(shù)字圖書信息,并存儲到測試數(shù)據(jù)庫中,數(shù)字圖書的添加過程如圖5 所示。

    圖5 數(shù)字圖書添加界面

    另一部分是在網(wǎng)絡環(huán)境中,下載數(shù)字圖書數(shù)據(jù),并剔除重復的部分,得出系統(tǒng)測試實驗的數(shù)據(jù)集。構建的測試數(shù)據(jù)集中共包含32 742 本圖書,圖書類型約為244 種。

    4.3 設置系統(tǒng)測試指標

    此次系統(tǒng)測試實驗分別從功能和性能兩個方面進行,其中功能主要是指人機交互功能和檢索功能,因此設置系統(tǒng)人機交互的響應時間和檢索功能運行時間作為系統(tǒng)功能的測試指標。而系統(tǒng)的性能主要就是檢索性能,設置查全率作為系統(tǒng)性能的測試指標,該指標反映了查詢系統(tǒng)對某個查詢返回結果中正確結果的比例。

    4.4 系統(tǒng)測試過程與結果分析

    為避免單一實驗對測試結果產(chǎn)生的影響,實驗設置多個查詢關鍵詞,并由此將實驗劃分成多個組別。數(shù)字圖書查詢關鍵詞分別為:“計算機”“醫(yī)療”“教育”“建筑”“數(shù)學”“圖像處理”“工業(yè)制造”“電網(wǎng)維護”。當查詢關鍵詞為“計算機”時,設計查詢系統(tǒng)的輸出結果如圖6所示。

    圖6 計算機相關聯(lián)圖書查詢結果

    同理可以得出不同關鍵詞在三個查詢系統(tǒng)中的查詢結果。分別記錄啟動查詢程序和查詢結果輸出的時間,便可以得出系統(tǒng)的查詢耗時;另外將查詢結果與數(shù)據(jù)集中的數(shù)據(jù)進行比對,便可以得出總正確樣本數(shù)量和查詢正確樣本數(shù)量,從而得出有關于查全率的測試結果。相關數(shù)據(jù)的統(tǒng)計與計算得出的系統(tǒng)測試結果如表2 所示。

    表2 系統(tǒng)測試對比結果

    通過對表2 中數(shù)據(jù)的計算可知:三種查詢系統(tǒng)的平均查詢耗時分別為1.34 s,1.11 s 和0.36 s;從查全率方面來看,兩種對比查詢系統(tǒng)的平均查全率為96.7%和98.1%,而設計系統(tǒng)的平均查全率為99.7%。

    5 結語

    為提高數(shù)字圖書查詢系統(tǒng)的查詢效率及查全率,本文利用人機交互技術設計一種數(shù)字圖書相關聯(lián)查詢系統(tǒng),通過軟硬件和數(shù)據(jù)庫多方面的優(yōu)化設計,實現(xiàn)了數(shù)字圖書相關聯(lián)查詢功能。通過實驗驗證了設計系統(tǒng)的查詢耗時為0.36 s,查全率為99.7%,性能較優(yōu)越,能夠通過輸入的關鍵詞,精準地輸出符合預期的數(shù)字圖書結果,具有一定的應用價值。

    猜你喜歡
    數(shù)字圖書查全率文檔
    區(qū)塊鏈在數(shù)字圖書侵權中的司法救濟作用分析
    淺談Matlab與Word文檔的應用接口
    有人一聲不吭向你扔了個文檔
    數(shù)字圖書回顧與反思
    基于詞嵌入語義的精準檢索式構建方法
    基于RI碼計算的Word復制文檔鑒別
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    數(shù)字圖書營銷方法探究
    數(shù)字圖書加密措施與密鑰管理
    基于Web的概念屬性抽取的研究
    磐安县| 永胜县| 平凉市| 沈丘县| 元江| 宁化县| 延川县| 额济纳旗| 天水市| 武义县| 中阳县| 柘城县| 墨玉县| 宜兴市| 安福县| 富源县| 华阴市| 元江| 利津县| 蕉岭县| 宝山区| 诸暨市| 福清市| 桐乡市| 新田县| 新兴县| 宝丰县| 襄城县| 桃江县| 南乐县| 泰和县| 通海县| 永福县| 望城县| 商丘市| 扬中市| 锡林郭勒盟| 塔河县| 甘谷县| 清河县| 丁青县|