• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    工程地質(zhì)資料檢索系統(tǒng)的設(shè)計(jì)和應(yīng)用

    2022-03-16 03:59:14朱泳標(biāo)
    關(guān)鍵詞:工程地質(zhì)里程結(jié)構(gòu)化

    楊 科,朱泳標(biāo),李 娜

    (中鐵二院工程集團(tuán)有限責(zé)任公司,四川 成都 610031)

    0 引 言

    鐵路工程地質(zhì)勘察階段中會(huì)產(chǎn)生大量資料,這些資料在施工建設(shè)期作為線路、路基、橋梁、隧道等專(zhuān)業(yè)設(shè)計(jì)依據(jù)之一,同時(shí)是鐵路工程項(xiàng)目的關(guān)鍵基礎(chǔ)資料。圍繞鐵路工程地質(zhì)資料一體化、標(biāo)準(zhǔn)化建設(shè)已持續(xù)多年,隨著鐵路工程建設(shè)項(xiàng)目穩(wěn)步增長(zhǎng),資料數(shù)量逐年增加,對(duì)資料的查閱暴露出響應(yīng)速度慢、資料類(lèi)型繁多、格式不統(tǒng)一等問(wèn)題,傳統(tǒng)的歸檔查詢(xún)已經(jīng)越來(lái)越難以滿足管理和使用要求,利用信息化前沿技術(shù),對(duì)傳統(tǒng)的查詢(xún)系統(tǒng)進(jìn)行智能化改造已經(jīng)刻不容緩。分布式檢索平臺(tái)是大數(shù)據(jù)生態(tài)圈中重要的組成部分,依托分布式橫向擴(kuò)展和倒排索引技術(shù),不僅支持處理PB級(jí)海量數(shù)據(jù)檢索,還能提高檢索效率,將耗時(shí)控制在毫秒級(jí)。該文借助分布式檢索平臺(tái),對(duì)工程地質(zhì)資料查詢(xún)過(guò)程中的難點(diǎn)、痛點(diǎn)進(jìn)行問(wèn)題分析,并通過(guò)大數(shù)據(jù)優(yōu)化設(shè)計(jì),實(shí)現(xiàn)了一套工程地質(zhì)資料檢索系統(tǒng)。

    1 問(wèn)題描述

    1.1 檢索資料的廣度問(wèn)題

    工程地質(zhì)專(zhuān)業(yè)主要為設(shè)計(jì)專(zhuān)業(yè)提供基礎(chǔ)數(shù)據(jù),傳統(tǒng)上,地質(zhì)人員通過(guò)模板整理資料,并提交給其他專(zhuān)業(yè)設(shè)計(jì)人員。設(shè)計(jì)人員在參考資料的時(shí)候,按照習(xí)慣和模板約束,在眾多資料里逐層手動(dòng)搜索,找到想要的文檔或圖像。在數(shù)據(jù)量大的情況下,這種方式效率較為低下,對(duì)于設(shè)計(jì)人員而言,所有資料應(yīng)該是一種“平面化”的數(shù)據(jù),自己只需要輸入搜索關(guān)鍵字,就能從這些平面化數(shù)據(jù)中得到想要的結(jié)果。

    例如想搜索某條線路里某段范圍內(nèi)的“風(fēng)化帶”資料,那么包括“風(fēng)化帶”的所有資料應(yīng)該以評(píng)分高低返回給用戶,評(píng)分越高的資料代表其更接近用戶的檢索意圖。但現(xiàn)實(shí)是,工程地質(zhì)資料分為地質(zhì)說(shuō)明書(shū)、地質(zhì)平面圖、縱橫斷面圖、試驗(yàn)結(jié)果表等類(lèi)型,包括了Office、AutoCAD、PDF、文本文件、圖像等多種格式,要在此多源異構(gòu)、非結(jié)構(gòu)化的數(shù)據(jù)背景下,完成海量數(shù)據(jù)檢索,且結(jié)果要高度貼合用戶意圖,就需要在“平面化”資料一側(cè)覆蓋所有文件格式,將其轉(zhuǎn)換、加載為文本。在檢索引擎一側(cè)支持服務(wù)的水平擴(kuò)展,為海量數(shù)據(jù)的實(shí)時(shí)檢索提供基礎(chǔ)支撐。

    1.2 檢索資料的深度問(wèn)題

    對(duì)地質(zhì)資料的檢索和應(yīng)用還存在更深層次的挖掘問(wèn)題,即怎么從簡(jiǎn)單的資料里獲取更多的信息,比如加入位置信息能夠方便用戶從地圖上直觀發(fā)現(xiàn)該資料,加入線路和工點(diǎn)信息則幫助用戶縮小檢索范圍,從而提高檢索的效率、精度。從信息論的角度來(lái)看,更多的信息,能使檢索的不確定性減少。增加信息量的方式,就是挖掘隱藏在已有資料之間的上下文信息。資料原作者在編寫(xiě)過(guò)程中,存在沒(méi)有明確寫(xiě)入事件發(fā)生的地點(diǎn)和時(shí)間的情況,究其原因可能是當(dāng)時(shí)編寫(xiě)環(huán)境就暗含了這些信息,也可能是資料存儲(chǔ)的路徑包含了這些信息,但是隨著文件上傳到中心平臺(tái),被分布式系統(tǒng)分塊、冗余到各個(gè)服務(wù)器后,上下文信息在轉(zhuǎn)移過(guò)程丟失。檢索資料的深度問(wèn)題,即如何利用技術(shù)手段和分析算法還原這些信息的問(wèn)題。

    1.3 檢索資料的存儲(chǔ)問(wèn)題

    工程地質(zhì)資料通常存儲(chǔ)在磁盤(pán)陣列(RAID)上,依靠RAID的冗余能力實(shí)現(xiàn)資料的妥善存儲(chǔ)。但是在對(duì)數(shù)據(jù)進(jìn)行挖掘和分析的情況下,磁盤(pán)陣列和分析系統(tǒng)位于不同的I/O會(huì)導(dǎo)致傳輸量大、延遲高等問(wèn)題,海量數(shù)據(jù)則會(huì)將該問(wèn)題更加放大。另一方面,需要基于RAID搭建文件服務(wù),在用戶檢索到某份資料并想下載的時(shí)候,需要從業(yè)務(wù)服務(wù)切換到文件系統(tǒng)服務(wù),進(jìn)一步增加了延遲,影響用戶體驗(yàn)。

    2 設(shè)計(jì)實(shí)現(xiàn)

    為了解決上述問(wèn)題,該文設(shè)計(jì)和實(shí)現(xiàn)了基于分布式檢索引擎的工程地質(zhì)資料檢索系統(tǒng),重點(diǎn)解決了從海量異構(gòu)資料中結(jié)構(gòu)化文檔資料、挖掘隱藏信息,并將原始資料妥善存儲(chǔ)在檢索系統(tǒng)內(nèi)部的問(wèn)題,提供了一個(gè)用戶友好、性能強(qiáng)大的資料檢索解決方案。

    2.1 搜索引擎選型

    Elasticsearch是一個(gè)基于Apache Lucene的分布式搜索引擎,它在Lucene支持的功能之上,提供了在節(jié)點(diǎn)管理、節(jié)點(diǎn)發(fā)現(xiàn)、建索引、查詢(xún)的功能,并提供了對(duì)開(kāi)發(fā)友好的 REST API,能夠較快實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)的交換。Elasticsearch采用倒排索引技術(shù),詞組全文檢索的準(zhǔn)確度、效率都遠(yuǎn)高于同類(lèi)產(chǎn)品,并且作為分布式原生架構(gòu),其水平擴(kuò)展的配置簡(jiǎn)單,可以做到按需擴(kuò)容,即使作為單點(diǎn)部署,在海量數(shù)據(jù)下仍然保持高響應(yīng)速度和高吞吐率。

    國(guó)內(nèi)已有很多學(xué)者將Elasticsearch用于各個(gè)行業(yè),解決了很多業(yè)務(wù)系統(tǒng)的檢索問(wèn)題。結(jié)合工程地質(zhì)資料特點(diǎn),以及對(duì)廣度、深度和存儲(chǔ)問(wèn)題的綜合分析,選擇以Elasticsearch作為基礎(chǔ)平臺(tái)開(kāi)發(fā)搭建地質(zhì)資料檢索系統(tǒng)。

    2.2 元數(shù)據(jù)設(shè)計(jì)

    元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),是數(shù)據(jù)屬性的結(jié)構(gòu)化信息,為數(shù)據(jù)的挖掘提供模板。從系統(tǒng)分析的角度來(lái)看,元數(shù)據(jù)約束了工程地質(zhì)資料應(yīng)具備的信息量,也為檢索系統(tǒng)定義了基本的數(shù)據(jù)結(jié)構(gòu)。良好設(shè)計(jì)的元數(shù)據(jù),能夠幫助檢索縮小范圍、提高命中率。

    按照用戶對(duì)資料檢索的使用習(xí)慣,結(jié)合對(duì)工程地質(zhì)資料的分析,該文將元數(shù)據(jù)分為兩大類(lèi),第一類(lèi)是對(duì)資料分類(lèi)的描述。資料分類(lèi)是本系統(tǒng)最大的變量,不僅新工程的納入會(huì)增加分類(lèi)數(shù)量,舊有的分類(lèi)也會(huì)隨著系統(tǒng)使用而更新關(guān)鍵字,因此,分類(lèi)元數(shù)據(jù)應(yīng)該設(shè)計(jì)為一個(gè)全局的、可維護(hù)的基礎(chǔ)字典,最終形成如表1所示的結(jié)構(gòu)。

    表1 資料分類(lèi)元數(shù)據(jù)設(shè)計(jì)

    資料分類(lèi)在系統(tǒng)上線前,通過(guò)梳理既有資料,統(tǒng)計(jì)得到資料分類(lèi)的關(guān)鍵詞組,再組織地質(zhì)人員和相關(guān)專(zhuān)家對(duì)關(guān)鍵詞組進(jìn)行篩選后,將篩選結(jié)果存入Elasticsearch。

    第二類(lèi)是對(duì)資料數(shù)據(jù)的描述,是資料在系統(tǒng)內(nèi)部的組織方式。用戶的檢索方式不局限于文字信息檢索,還包括地圖選點(diǎn)等方式以位置信息搜索資料。資料數(shù)據(jù)元數(shù)據(jù)設(shè)計(jì)為如表2所示的結(jié)構(gòu)。

    表2 資料數(shù)據(jù)結(jié)構(gòu)元數(shù)據(jù)設(shè)計(jì)

    資料數(shù)據(jù)在系統(tǒng)上線后,通過(guò)資料上傳頁(yè)面,由用戶批量導(dǎo)入資料。系統(tǒng)將對(duì)資料進(jìn)行預(yù)處理、結(jié)構(gòu)化、文本挖掘,得到元數(shù)據(jù)約束的信息,并存入Elasticsearch。

    2.3 資料預(yù)處理

    資料預(yù)處理是對(duì)工程地質(zhì)原始資料進(jìn)行數(shù)據(jù)清洗和轉(zhuǎn)換的過(guò)程,以確保入庫(kù)資料的有效性。通過(guò)對(duì)各類(lèi)資料的分析,發(fā)現(xiàn)大部分資料具備元數(shù)據(jù)要求信息量,以Word格式的“地質(zhì)說(shuō)明書(shū)”為例,其中包括了線路、里程和地質(zhì)信息,而dwg格式的“橫斷面圖”則包括了日期、線路、里程信息,但是不少文檔仍然需要一個(gè)或者多個(gè)信息才能補(bǔ)全元數(shù)據(jù)結(jié)構(gòu)。同時(shí)還存在少數(shù)資料,特別是一些數(shù)據(jù)緩存文件,只是作為數(shù)據(jù)計(jì)算過(guò)程的中間結(jié)果,不具備檢索的意義,應(yīng)通過(guò)數(shù)據(jù)清洗將這類(lèi)資料過(guò)濾掉。清洗的方法包括后綴名過(guò)濾、對(duì)文件名進(jìn)行正則表達(dá)式搜索淘汰。由于地質(zhì)資料這類(lèi)非結(jié)構(gòu)化數(shù)據(jù)需要對(duì)文件內(nèi)容進(jìn)行文本抽取后才能結(jié)構(gòu)化,因此很難在預(yù)處理階段應(yīng)用數(shù)據(jù)合法性檢查、一致性檢查等結(jié)構(gòu)化的清洗方法,對(duì)數(shù)據(jù)進(jìn)行補(bǔ)全和糾正將放在對(duì)文本進(jìn)行抽取、結(jié)構(gòu)化之后。

    數(shù)據(jù)轉(zhuǎn)換主要針對(duì)Office文件,特別是Office 2007之前的格式,這些文件不能被腳本語(yǔ)言直接抽取出文字,需要轉(zhuǎn)換為docx、xlsx等格式才能被后續(xù)流程處理。預(yù)處理流程如圖1所示。

    圖1 數(shù)據(jù)預(yù)處理流程

    2.4 文本抽取與結(jié)構(gòu)化

    文本抽取是整個(gè)系統(tǒng)的核心,設(shè)計(jì)的難點(diǎn)在于需要一套運(yùn)行在Linux服務(wù)器上,自動(dòng)化抽取多種資料格式的集成處理程序。考慮到系統(tǒng)將會(huì)使用到多種前沿技術(shù),以及對(duì)Linux系統(tǒng)的支持,程序由Python語(yǔ)言實(shí)現(xiàn)能夠很好地“粘合”這些不同技術(shù)。

    在數(shù)據(jù)預(yù)處理流程后,地質(zhì)資料可以分為四種類(lèi)型,第一類(lèi)是Office文檔,包括Word、PowerPoint、Excel格式。第二類(lèi)是PDF文檔,主要包括圖像和文字兩大類(lèi)內(nèi)容。第三類(lèi)是CAD文件,通常為dwg格式,主要內(nèi)容包括了平面圖和縱橫斷面圖。最后一類(lèi)是圖像,包括巖芯和踏勘現(xiàn)場(chǎng)圖像,這類(lèi)文件不僅數(shù)據(jù)量特別大,而且對(duì)工程地質(zhì)人員的工作開(kāi)展有極大的幫助,是重要的工程地質(zhì)資料。另外需要考慮后續(xù)應(yīng)用過(guò)程中,更多的資料類(lèi)型加入檢索,在設(shè)計(jì)階段,遵循對(duì)修改封閉,對(duì)擴(kuò)展開(kāi)放的原則,采用工廠方法模式,根據(jù)輸入文檔的格式,設(shè)計(jì)不同的工廠類(lèi)處理不同的地質(zhì)資料。以目前的四類(lèi)資料為主,每個(gè)工廠類(lèi)生成如下產(chǎn)品:

    (1)Office文件的抽取。

    Python中有多個(gè)庫(kù)可以對(duì)Office 2007以后的版本進(jìn)行全文提取,而圖像、樣式等信息將會(huì)被丟棄,只獲取所有文本內(nèi)容、作者和編輯時(shí)間。

    (2)PDF文件的抽取。

    根據(jù)對(duì)地質(zhì)PDF文件的研究,發(fā)現(xiàn)具有文本抽取價(jià)值的文件,大多數(shù)是文本型的,在Linux中有多個(gè)可執(zhí)行程序,可以將其中的文本提取出來(lái),使用Python的subprocess庫(kù),啟動(dòng)子進(jìn)程來(lái)處理PDF文件,提取出的文字存入緩存文件,再由Python腳本獲取。

    (3)CAD文件的抽取。

    目前已經(jīng)有多個(gè)商業(yè)或開(kāi)源的庫(kù)可以處理CAD文件,在Linux上可以選擇的控件比較少,libdxfrw開(kāi)源了對(duì)大多數(shù)版本CAD的解析,并支持Linux上GCC編譯。編寫(xiě)?yīng)毩⒌腖inux可執(zhí)行程序,調(diào)用相關(guān)函數(shù)從dwg文件對(duì)象(AcDbObject)的文本區(qū)域提取出所有文字,存入緩存文件,再由Python腳本訪問(wèn)緩存文件得到文本內(nèi)容。

    (4)圖像的抽取。

    圖像目前是處理最為耗時(shí)的一類(lèi)資料。主要思路是通過(guò)目標(biāo)檢測(cè)算法找到圖像中的實(shí)體,并根據(jù)這些實(shí)體能夠得到語(yǔ)義上的聯(lián)系。該文通過(guò)卷積神經(jīng)網(wǎng)絡(luò)和YOLO V3訓(xùn)練了地質(zhì)資料中常見(jiàn)的一些實(shí)體,例如巖芯中的泥土、巖石、鉆孔巖芯等,生成了一個(gè)可以識(shí)別這些實(shí)體的模型。在對(duì)圖像進(jìn)行處理中,首先讀取該模型對(duì)圖像中的實(shí)體進(jìn)行檢測(cè),再對(duì)檢測(cè)到的所有實(shí)體進(jìn)行去重,最后根據(jù)這些實(shí)體查詢(xún)實(shí)體關(guān)系字典,得到圖像的分類(lèi)。例如,一張圖像通過(guò)實(shí)體檢測(cè),得到了多個(gè)泥土、泥巖、鉆孔巖芯框?qū)嶓w,通過(guò)查詢(xún)實(shí)體關(guān)系字典,這張圖像很可能就是現(xiàn)場(chǎng)的鉆孔巖芯圖。

    文本抽取的類(lèi)設(shè)計(jì)如圖2所示,僅以O(shè)ffice文件和圖像抽取為例。

    圖2 文本抽取工廠方法類(lèi)圖

    原始文件經(jīng)過(guò)文本抽取后,得到原始文本、作者、編輯時(shí)間等元數(shù)據(jù)約束的信息。還需要對(duì)原始文本結(jié)構(gòu)化處理,為后續(xù)的挖掘提供關(guān)鍵字、詞頻等重要信息。但文本結(jié)構(gòu)化本身是一個(gè)復(fù)雜流程,應(yīng)根據(jù)待獲取的信息,將該流程分解為多個(gè)較小的子流程,逐步降低復(fù)雜度,具體流程如下:

    (1)去除停用詞,利用地勘語(yǔ)料庫(kù)進(jìn)行中文分詞,統(tǒng)計(jì)前20個(gè)詞頻較高的詞組并緩存。

    (2)調(diào)用中文文本摘要算法進(jìn)行單文本摘要,對(duì)應(yīng)元數(shù)據(jù)的“摘要”信息。

    (3)對(duì)原始文本進(jìn)行正則表達(dá)式搜索,得到線路里程信息。里程信息通常是以CK、DK、D1K、D2K冠號(hào)開(kāi)始,加上1 000以?xún)?nèi)的數(shù)字組成,由起始里程和終止里程成對(duì)出現(xiàn),如DK11+123~DK15+789。原始文本中可能包括多個(gè)里程信息對(duì),通常出現(xiàn)頻率最高的才是真正里程信息,但是為了防止關(guān)鍵信息丟失,所有里程文字和出現(xiàn)頻率作為鍵值對(duì)一起緩存,便于后續(xù)挖掘處理。

    (4)對(duì)于圖像這類(lèi)特殊資料,不參與分詞或摘要流程,直接將圖像抽取后得到實(shí)體名稱(chēng)作為詞組緩存。

    經(jīng)過(guò)文本抽取和結(jié)構(gòu)化后,元數(shù)據(jù)要求的大多數(shù)信息已經(jīng)具備,剩下較為隱蔽的信息等待挖掘。

    2.5 隱藏信息挖掘

    隱藏信息是指不明確寫(xiě)入資料,或者需要對(duì)資料進(jìn)行多次處理后才能得到的信息。結(jié)構(gòu)化后的原始文本中可能包括了線路、工點(diǎn)、資料類(lèi)型等關(guān)鍵信息,但是存在命名不一致、二義性等問(wèn)題,另外圖像資料則可能不包含上述任何信息。因此,應(yīng)在結(jié)構(gòu)化后應(yīng)用聚類(lèi)、相似度算法盡量挖掘出線路、位置等關(guān)鍵信息。

    (1)時(shí)間聚類(lèi),找到資料的時(shí)間軸。

    在資料中包括了眾多時(shí)間,有踏勘時(shí)間、編寫(xiě)時(shí)間、匯報(bào)時(shí)間,文檔本身還具備最近編輯時(shí)間,在這諸多時(shí)間中,哪一個(gè)時(shí)間更具備參考意義。當(dāng)完成文本結(jié)構(gòu)化后,不妨對(duì)單個(gè)文檔進(jìn)行升維,將其映射到本次上傳的所有文本中的時(shí)間維度中,因?yàn)橛脩舻氖褂昧?xí)慣往往同一批文件屬于同期所做工作的匯編。然后再對(duì)所有時(shí)間進(jìn)行K-means聚類(lèi),最后將單個(gè)文檔里的所有時(shí)間,與聚類(lèi)各個(gè)分簇中心計(jì)算歐氏距離,距離最短的時(shí)間往往更具備代表性,能夠體現(xiàn)該資料在時(shí)間軸上,與同批次文件編寫(xiě)的強(qiáng)關(guān)聯(lián)性,選擇該時(shí)間作為本資料的編輯時(shí)間。圖3表示了只對(duì)時(shí)間信息中的日期進(jìn)行聚類(lèi)后的結(jié)果。圖4為時(shí)間信息挖掘流程。

    圖3 同批次資料內(nèi)含時(shí)間信息聚類(lèi)示意圖

    圖4 時(shí)間信息挖掘流程

    (2)坐標(biāo)反算結(jié)合非極大值抑制,分析資料的位置信息。

    由于工程地質(zhì)資料都采用投影坐標(biāo)作為項(xiàng)目坐標(biāo),每個(gè)項(xiàng)目中央子午線和投影高是不同的,必須通過(guò)坐標(biāo)轉(zhuǎn)換系統(tǒng),對(duì)資料的項(xiàng)目坐標(biāo)進(jìn)行坐標(biāo)反算,得到其GPS坐標(biāo),這個(gè)坐標(biāo)是對(duì)資料最精確的位置描述,可以直接作為位置信息進(jìn)行存儲(chǔ)。但是很多資料并不具備項(xiàng)目坐標(biāo),而是里程信息,并且一個(gè)資料內(nèi)含多個(gè)里程信息,在前一步驟中,已經(jīng)得到了多對(duì)和多個(gè)里程作為候選信息,消除重疊的找到最佳的里程即能完善該資料的位置信息。具體做法是利用坐標(biāo)轉(zhuǎn)換系統(tǒng)將其轉(zhuǎn)換為GPS坐標(biāo),再沿線路方向建立笛卡爾坐標(biāo)系,圍繞GPS坐標(biāo)形成一個(gè)矩形,每個(gè)矩形具備一個(gè)分?jǐn)?shù)值,即該里程對(duì)的詞頻,如圖6所示,沿線路方向,將里程信息對(duì)轉(zhuǎn)換為左右兩個(gè)GPS坐標(biāo)點(diǎn),默認(rèn)500米作為矩形高度,單個(gè)里程則為500米的正方形。圖中深色的矩形為當(dāng)前詞頻最高的里程信息,計(jì)算剩余的矩形和該矩形的重疊區(qū)域(IOU),當(dāng)IOU大于預(yù)設(shè)值,則淘汰該里程信息。再在小于預(yù)設(shè)值的里程信息里選擇詞頻最高的,進(jìn)行下一次循環(huán),如圖中可以得到兩對(duì)里程信息,其對(duì)應(yīng)的GPS坐標(biāo)以空格分隔存儲(chǔ)到“位置信息”中。

    圖5 位置信息挖掘流程

    圖6 非極大值抑制算法獲取最佳里程示意圖

    (3)相似度算法,挖掘資料的分類(lèi)信息。

    在結(jié)構(gòu)化處理后,已經(jīng)具備了單個(gè)資料詞組到詞頻的映射,查詢(xún)Elasticsearch中的文檔分類(lèi)數(shù)據(jù),將分類(lèi)中的詞組詞頻映射取出,兩者計(jì)算余弦相似度,最相似的分類(lèi)即為該資料分類(lèi),最后存儲(chǔ)到“類(lèi)型信息”中。文檔分類(lèi)數(shù)據(jù)也需要定時(shí)更新維護(hù),通過(guò)同類(lèi)文檔的關(guān)鍵字的聚合,在專(zhuān)家的建議確認(rèn)下,逐步提高模型的準(zhǔn)確性。由圖7可見(jiàn),隨著同類(lèi)文檔的數(shù)量增加,單個(gè)文檔與同類(lèi)文檔的相似度越來(lái)越大,雖然數(shù)量達(dá)到一定量后,相似度有所下降,這是由于更多的關(guān)鍵字加入會(huì)降低相似度,但是整體保持了較高的相似度,保證了文檔分類(lèi)的準(zhǔn)確率。

    圖7 單個(gè)資料與相同分類(lèi)資料的余弦相似度折線圖

    在完成所有隱藏信息挖掘后,將原始文件通過(guò)BASE64編碼轉(zhuǎn)換成字符串,對(duì)應(yīng)到元數(shù)據(jù)中的“原始文件”,便于用戶在檢索到該資料后,快速的解碼并下載。該方式也可以最大化利用分布式系統(tǒng)的性能,防止文件下載的單點(diǎn)故障。

    3 結(jié)束語(yǔ)

    該文引入分布式搜索引擎,結(jié)合軟件設(shè)計(jì)模式和數(shù)據(jù)挖掘方法,實(shí)現(xiàn)了工程地質(zhì)資料檢索系統(tǒng),該系統(tǒng)已經(jīng)在中鐵二院地勘巖土工程設(shè)計(jì)研究院的多個(gè)項(xiàng)目組投入使用,并在兄弟設(shè)計(jì)單位中得到應(yīng)用驗(yàn)證。根據(jù)反饋,該系統(tǒng)支持資料格式多、檢索命中率高、檢索速度快、使用簡(jiǎn)單的特點(diǎn)得到了用戶的肯定,從根本上改變了傳統(tǒng)資料檢索的使用方式,提高了地質(zhì)、設(shè)計(jì)人員的工作效率。

    隨著川藏線、成渝中線等重大鐵路工程項(xiàng)目的推進(jìn),該系統(tǒng)將為廣大地質(zhì)人員、工程設(shè)計(jì)人員的工作、科研提供有力幫助。

    猜你喜歡
    工程地質(zhì)里程結(jié)構(gòu)化
    繼往開(kāi)來(lái) 守正創(chuàng)新——河北省水文工程地質(zhì)勘查院
    促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
    結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
    水文地質(zhì)在工程地質(zhì)勘察中的有效應(yīng)用
    騰勢(shì)400 用在上海市區(qū)的來(lái)回穿梭克服里程焦慮
    車(chē)迷(2017年12期)2018-01-18 02:16:12
    幸福合力 開(kāi)啟幸福里程
    幸福合力 開(kāi)啟幸福里程
    ABAQUS軟件在工程地質(zhì)勘察中的應(yīng)用
    算里程
    基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
    国产 精品1| 国产精品一区二区在线观看99| 成人毛片a级毛片在线播放| 成人国产麻豆网| 国产综合精华液| 亚洲欧美一区二区三区国产| 久久久a久久爽久久v久久| 成人亚洲精品一区在线观看| 精品一区二区三区四区五区乱码 | 中文字幕亚洲精品专区| 免费大片黄手机在线观看| 只有这里有精品99| 青青草视频在线视频观看| 久久久久国产精品人妻一区二区| 久久久国产欧美日韩av| 国产免费福利视频在线观看| 777米奇影视久久| 最后的刺客免费高清国语| 久久久久久久国产电影| 亚洲国产精品999| 亚洲激情五月婷婷啪啪| 中文字幕最新亚洲高清| 久久99热6这里只有精品| av视频免费观看在线观看| 欧美精品一区二区大全| 免费av中文字幕在线| 春色校园在线视频观看| 亚洲三级黄色毛片| 亚洲av国产av综合av卡| 欧美日韩视频高清一区二区三区二| 国产乱来视频区| av视频免费观看在线观看| 亚洲av欧美aⅴ国产| 大码成人一级视频| 水蜜桃什么品种好| 久久久久久久久久成人| 五月伊人婷婷丁香| 国精品久久久久久国模美| 另类精品久久| 色94色欧美一区二区| 少妇被粗大猛烈的视频| 欧美日韩国产mv在线观看视频| 99久久人妻综合| 久久久国产精品麻豆| 最黄视频免费看| 免费观看性生交大片5| 性色av一级| 午夜福利,免费看| 日产精品乱码卡一卡2卡三| 欧美国产精品一级二级三级| 日韩一区二区三区影片| 成年人免费黄色播放视频| 香蕉国产在线看| 国产综合精华液| 亚洲精品中文字幕在线视频| 不卡视频在线观看欧美| 亚洲av男天堂| 久久精品国产综合久久久 | 免费久久久久久久精品成人欧美视频 | 欧美日韩国产mv在线观看视频| 亚洲av在线观看美女高潮| 女性生殖器流出的白浆| 七月丁香在线播放| 老司机亚洲免费影院| 国产日韩欧美在线精品| 一级,二级,三级黄色视频| 黑人猛操日本美女一级片| 欧美xxxx性猛交bbbb| 两个人免费观看高清视频| 日韩人妻精品一区2区三区| 高清av免费在线| 国产片特级美女逼逼视频| 国产淫语在线视频| 国产黄频视频在线观看| 午夜福利视频精品| 天天影视国产精品| 大香蕉久久成人网| 久久久久久久精品精品| 男女午夜视频在线观看 | 侵犯人妻中文字幕一二三四区| 日韩一区二区视频免费看| 日韩人妻精品一区2区三区| 国产视频首页在线观看| 18禁动态无遮挡网站| 岛国毛片在线播放| 精品久久蜜臀av无| 侵犯人妻中文字幕一二三四区| 97超碰精品成人国产| 免费人妻精品一区二区三区视频| 久久国产亚洲av麻豆专区| 久久人人97超碰香蕉20202| 波野结衣二区三区在线| 国产成人91sexporn| 最后的刺客免费高清国语| 又黄又爽又刺激的免费视频.| 国产高清不卡午夜福利| 少妇的逼好多水| 水蜜桃什么品种好| 欧美日本中文国产一区发布| 免费播放大片免费观看视频在线观看| 国产在视频线精品| 少妇被粗大的猛进出69影院 | 成年人午夜在线观看视频| h视频一区二区三区| 日韩av不卡免费在线播放| 国产视频首页在线观看| 超碰97精品在线观看| 捣出白浆h1v1| 日韩制服骚丝袜av| 国产黄色视频一区二区在线观看| 免费看光身美女| 亚洲欧美成人综合另类久久久| 精品国产国语对白av| 午夜福利视频在线观看免费| 天天躁夜夜躁狠狠久久av| 国产日韩一区二区三区精品不卡| 久久精品国产亚洲av天美| 一级毛片黄色毛片免费观看视频| 男女国产视频网站| 精品99又大又爽又粗少妇毛片| 国产成人精品在线电影| 免费久久久久久久精品成人欧美视频 | 成人午夜精彩视频在线观看| 婷婷色综合大香蕉| 免费日韩欧美在线观看| 捣出白浆h1v1| 久久久久久伊人网av| av不卡在线播放| 成年动漫av网址| 这个男人来自地球电影免费观看 | 狂野欧美激情性xxxx在线观看| 亚洲成人一二三区av| 大香蕉久久网| 欧美精品国产亚洲| 欧美成人午夜精品| 国产成人精品在线电影| 男女高潮啪啪啪动态图| 丝瓜视频免费看黄片| 免费女性裸体啪啪无遮挡网站| 日本猛色少妇xxxxx猛交久久| 99热6这里只有精品| 国产欧美亚洲国产| 一级a做视频免费观看| 啦啦啦啦在线视频资源| 美女脱内裤让男人舔精品视频| 啦啦啦在线观看免费高清www| 一二三四在线观看免费中文在 | www.熟女人妻精品国产 | 少妇的丰满在线观看| 丝袜脚勾引网站| 亚洲性久久影院| 人人妻人人澡人人看| 婷婷色综合www| 久久毛片免费看一区二区三区| 国产精品一国产av| 国产精品熟女久久久久浪| 亚洲精华国产精华液的使用体验| 看非洲黑人一级黄片| 一区二区三区乱码不卡18| 日韩电影二区| 免费在线观看黄色视频的| 一本大道久久a久久精品| 少妇被粗大的猛进出69影院 | 韩国高清视频一区二区三区| 狠狠婷婷综合久久久久久88av| 欧美少妇被猛烈插入视频| 欧美 日韩 精品 国产| 中文字幕人妻丝袜制服| 国产亚洲最大av| 欧美日韩亚洲高清精品| 中文字幕另类日韩欧美亚洲嫩草| 国产成人av激情在线播放| 精品亚洲成a人片在线观看| 伊人亚洲综合成人网| 精品少妇久久久久久888优播| 国产乱人偷精品视频| 人成视频在线观看免费观看| 91精品伊人久久大香线蕉| 亚洲三级黄色毛片| 精品一区二区三区四区五区乱码 | 免费女性裸体啪啪无遮挡网站| 搡老乐熟女国产| 久久久久久人妻| 男女免费视频国产| 校园人妻丝袜中文字幕| 久久精品熟女亚洲av麻豆精品| 亚洲精品,欧美精品| 成人无遮挡网站| 久热这里只有精品99| 国产欧美日韩综合在线一区二区| 一二三四在线观看免费中文在 | 人人澡人人妻人| 伊人久久国产一区二区| 亚洲精品乱码久久久久久按摩| 国产成人免费无遮挡视频| 日韩电影二区| 亚洲av.av天堂| 成年av动漫网址| 肉色欧美久久久久久久蜜桃| 黄色怎么调成土黄色| 一个人免费看片子| 欧美日韩成人在线一区二区| 欧美国产精品va在线观看不卡| 国产精品不卡视频一区二区| 少妇的逼好多水| 国产欧美日韩一区二区三区在线| 日韩av在线免费看完整版不卡| 久久 成人 亚洲| 国产精品麻豆人妻色哟哟久久| 欧美日韩成人在线一区二区| 中文乱码字字幕精品一区二区三区| 十八禁网站网址无遮挡| av一本久久久久| 亚洲伊人色综图| a级毛片在线看网站| 日日摸夜夜添夜夜爱| 国产淫语在线视频| 日韩大片免费观看网站| 欧美丝袜亚洲另类| 精品人妻偷拍中文字幕| 久久 成人 亚洲| 久热这里只有精品99| 亚洲美女视频黄频| 国产成人欧美| 高清黄色对白视频在线免费看| 人人妻人人添人人爽欧美一区卜| 成人午夜精彩视频在线观看| 亚洲国产欧美在线一区| 99久久人妻综合| 日产精品乱码卡一卡2卡三| av电影中文网址| 亚洲久久久国产精品| 大码成人一级视频| 涩涩av久久男人的天堂| av福利片在线| 妹子高潮喷水视频| 久久免费观看电影| 成人无遮挡网站| 欧美+日韩+精品| 精品久久蜜臀av无| 精品99又大又爽又粗少妇毛片| 91午夜精品亚洲一区二区三区| 9191精品国产免费久久| 国产在线免费精品| 天堂8中文在线网| 免费少妇av软件| 26uuu在线亚洲综合色| 熟女人妻精品中文字幕| 亚洲国产精品一区二区三区在线| 王馨瑶露胸无遮挡在线观看| 在线天堂中文资源库| 多毛熟女@视频| 乱人伦中国视频| 国产精品偷伦视频观看了| 在现免费观看毛片| 香蕉丝袜av| 青青草视频在线视频观看| 免费人成在线观看视频色| 日韩不卡一区二区三区视频在线| 亚洲av综合色区一区| 在线看a的网站| 国产1区2区3区精品| 少妇的逼水好多| av免费在线看不卡| 久久精品国产亚洲av天美| 国产精品成人在线| 久久精品夜色国产| 国产永久视频网站| 最近手机中文字幕大全| 国产成人精品在线电影| 一二三四中文在线观看免费高清| 欧美+日韩+精品| 色哟哟·www| 高清在线视频一区二区三区| 26uuu在线亚洲综合色| a级毛色黄片| 永久免费av网站大全| 亚洲国产最新在线播放| 亚洲成色77777| 美女xxoo啪啪120秒动态图| 国产色婷婷99| 精品久久蜜臀av无| 国产高清三级在线| 搡女人真爽免费视频火全软件| 韩国av在线不卡| 成人毛片60女人毛片免费| 丝袜美足系列| 精品酒店卫生间| 精品第一国产精品| 欧美老熟妇乱子伦牲交| 伦理电影免费视频| 日韩欧美一区视频在线观看| 中文精品一卡2卡3卡4更新| 日韩制服丝袜自拍偷拍| 国产欧美日韩综合在线一区二区| 国产精品蜜桃在线观看| 婷婷色综合大香蕉| 18禁动态无遮挡网站| 亚洲精品,欧美精品| 熟女人妻精品中文字幕| 久久久久久久久久久久大奶| 在线 av 中文字幕| 欧美xxⅹ黑人| 国产精品嫩草影院av在线观看| 国产免费现黄频在线看| 国产成人a∨麻豆精品| 在线精品无人区一区二区三| 综合色丁香网| 久久久久精品人妻al黑| 中国国产av一级| 欧美97在线视频| 国产精品国产三级国产av玫瑰| 18禁观看日本| 欧美bdsm另类| 午夜精品国产一区二区电影| 国产熟女午夜一区二区三区| 丝袜在线中文字幕| 观看av在线不卡| 免费看av在线观看网站| 只有这里有精品99| 热re99久久精品国产66热6| 亚洲激情五月婷婷啪啪| 一级黄片播放器| av网站免费在线观看视频| 2021少妇久久久久久久久久久| 最近中文字幕2019免费版| 久久国产亚洲av麻豆专区| 精品少妇黑人巨大在线播放| 久久综合国产亚洲精品| 国产成人一区二区在线| 国产精品女同一区二区软件| 97超碰精品成人国产| 丰满乱子伦码专区| 亚洲精华国产精华液的使用体验| 青春草亚洲视频在线观看| 在线观看免费视频网站a站| 亚洲av福利一区| 国产色爽女视频免费观看| 亚洲国产精品专区欧美| 精品亚洲成国产av| 十分钟在线观看高清视频www| 乱人伦中国视频| av播播在线观看一区| 99热全是精品| 黄片无遮挡物在线观看| 韩国av在线不卡| 午夜日本视频在线| 国产精品国产三级国产专区5o| 1024视频免费在线观看| 麻豆精品久久久久久蜜桃| 亚洲精品日韩在线中文字幕| 人妻系列 视频| 最新的欧美精品一区二区| 久久久久国产精品人妻一区二区| 日韩人妻精品一区2区三区| 国产 精品1| 国产永久视频网站| 麻豆乱淫一区二区| 日本与韩国留学比较| 99热全是精品| 国产精品一国产av| 狠狠精品人妻久久久久久综合| 日本av免费视频播放| 热re99久久精品国产66热6| 中文欧美无线码| 亚洲成人一二三区av| 亚洲色图 男人天堂 中文字幕 | 男女啪啪激烈高潮av片| 99热全是精品| 国产 一区精品| 亚洲成人一二三区av| 如日韩欧美国产精品一区二区三区| 妹子高潮喷水视频| 精品国产乱码久久久久久小说| 亚洲精品456在线播放app| 哪个播放器可以免费观看大片| 如何舔出高潮| 99香蕉大伊视频| 女人被躁到高潮嗷嗷叫费观| 国产精品秋霞免费鲁丝片| 黑人巨大精品欧美一区二区蜜桃 | 亚洲国产精品一区二区三区在线| 男人爽女人下面视频在线观看| 交换朋友夫妻互换小说| 99热全是精品| 成人黄色视频免费在线看| 婷婷成人精品国产| 精品国产乱码久久久久久小说| 天天躁夜夜躁狠狠躁躁| 我的女老师完整版在线观看| 青春草视频在线免费观看| 又粗又硬又长又爽又黄的视频| 免费人成在线观看视频色| √禁漫天堂资源中文www| 精品一品国产午夜福利视频| 男女国产视频网站| 国产探花极品一区二区| 99久久综合免费| 国产精品一区二区在线观看99| 丰满少妇做爰视频| 日本黄大片高清| 国产老妇伦熟女老妇高清| 最近最新中文字幕大全免费视频 | 波多野结衣一区麻豆| 久久久久久人人人人人| 日韩制服骚丝袜av| 国产免费又黄又爽又色| av一本久久久久| 尾随美女入室| 免费大片18禁| 国产一区二区激情短视频 | 一个人免费看片子| 国产精品三级大全| 欧美+日韩+精品| 亚洲精品av麻豆狂野| 五月开心婷婷网| 9191精品国产免费久久| 国产福利在线免费观看视频| 免费黄色在线免费观看| 亚洲美女黄色视频免费看| 18禁动态无遮挡网站| 亚洲国产av新网站| 亚洲三级黄色毛片| 成人18禁高潮啪啪吃奶动态图| 久久久久精品人妻al黑| 丰满少妇做爰视频| 亚洲av欧美aⅴ国产| 99热全是精品| 国产极品粉嫩免费观看在线| 国产精品麻豆人妻色哟哟久久| 免费久久久久久久精品成人欧美视频 | 男女啪啪激烈高潮av片| 国产一级毛片在线| 日韩制服骚丝袜av| 男女无遮挡免费网站观看| 狂野欧美激情性xxxx在线观看| 91精品三级在线观看| 国产精品久久久久久av不卡| 亚洲第一区二区三区不卡| a 毛片基地| 久久99蜜桃精品久久| 女的被弄到高潮叫床怎么办| 一本—道久久a久久精品蜜桃钙片| 国产日韩欧美在线精品| av天堂久久9| 熟女av电影| 高清不卡的av网站| 香蕉丝袜av| 水蜜桃什么品种好| 国产熟女午夜一区二区三区| 国产亚洲av片在线观看秒播厂| 中文精品一卡2卡3卡4更新| 久久久欧美国产精品| 久久青草综合色| 亚洲成色77777| 亚洲av免费高清在线观看| 男女边摸边吃奶| 亚洲精品中文字幕在线视频| 久久久久久伊人网av| 免费人成在线观看视频色| 两个人看的免费小视频| 免费高清在线观看日韩| 熟女人妻精品中文字幕| 69精品国产乱码久久久| kizo精华| 日本av手机在线免费观看| 波野结衣二区三区在线| 中文乱码字字幕精品一区二区三区| 日产精品乱码卡一卡2卡三| 国产欧美日韩一区二区三区在线| 国产一区亚洲一区在线观看| 日韩成人伦理影院| 美女内射精品一级片tv| 22中文网久久字幕| 欧美亚洲日本最大视频资源| 一本—道久久a久久精品蜜桃钙片| 亚洲精品久久成人aⅴ小说| 人人妻人人添人人爽欧美一区卜| 插逼视频在线观看| 最近2019中文字幕mv第一页| 日韩伦理黄色片| 老女人水多毛片| 亚洲精品国产色婷婷电影| 免费看光身美女| 亚洲精品av麻豆狂野| 少妇高潮的动态图| 免费观看无遮挡的男女| 80岁老熟妇乱子伦牲交| videosex国产| 久久 成人 亚洲| 中国美白少妇内射xxxbb| 制服人妻中文乱码| 国产不卡av网站在线观看| 一级a做视频免费观看| 在线观看免费视频网站a站| 国产精品人妻久久久影院| videos熟女内射| 我的女老师完整版在线观看| 国产日韩欧美在线精品| 国产精品三级大全| 熟女av电影| 日本爱情动作片www.在线观看| 大香蕉久久网| 热re99久久国产66热| 九草在线视频观看| 国产1区2区3区精品| 欧美激情极品国产一区二区三区 | 青春草视频在线免费观看| 日本猛色少妇xxxxx猛交久久| 青春草视频在线免费观看| 一边亲一边摸免费视频| 一区二区日韩欧美中文字幕 | 成人无遮挡网站| 涩涩av久久男人的天堂| 少妇人妻 视频| 亚洲av在线观看美女高潮| 国产成人免费观看mmmm| 国产xxxxx性猛交| 最新的欧美精品一区二区| 美女视频免费永久观看网站| 波多野结衣一区麻豆| 内地一区二区视频在线| 国产精品国产三级专区第一集| 国产亚洲一区二区精品| 香蕉国产在线看| 国产爽快片一区二区三区| 亚洲av成人精品一二三区| 国产乱人偷精品视频| 少妇人妻久久综合中文| 国产色爽女视频免费观看| 成人国产av品久久久| 久久国产精品大桥未久av| 久久韩国三级中文字幕| 亚洲经典国产精华液单| 久久精品久久精品一区二区三区| 色5月婷婷丁香| 制服人妻中文乱码| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 国产精品偷伦视频观看了| 激情视频va一区二区三区| 国产精品偷伦视频观看了| 国产精品久久久久久精品古装| 欧美人与性动交α欧美精品济南到 | 精品午夜福利在线看| 日本91视频免费播放| 亚洲综合色网址| 少妇的逼水好多| 久久综合国产亚洲精品| 黄色配什么色好看| 国产成人免费无遮挡视频| 大陆偷拍与自拍| 我要看黄色一级片免费的| 在线看a的网站| 一二三四在线观看免费中文在 | 激情视频va一区二区三区| 少妇的丰满在线观看| 捣出白浆h1v1| 国产精品99久久99久久久不卡 | 一级毛片电影观看| 老司机影院毛片| a级毛色黄片| 各种免费的搞黄视频| 久久久久精品人妻al黑| 欧美日韩av久久| 少妇被粗大猛烈的视频| 十八禁高潮呻吟视频| 日韩中文字幕视频在线看片| 青春草视频在线免费观看| 久久久久久久久久成人| 观看美女的网站| 久久鲁丝午夜福利片| 啦啦啦视频在线资源免费观看| 大陆偷拍与自拍| 精品少妇久久久久久888优播| 国产成人精品福利久久| 一本久久精品| 高清黄色对白视频在线免费看| 麻豆乱淫一区二区| 69精品国产乱码久久久| videos熟女内射| 国产男人的电影天堂91| 免费看不卡的av| 国产成人免费无遮挡视频| 精品国产一区二区三区久久久樱花| 丝袜脚勾引网站| 日韩中字成人| av在线老鸭窝| 国产亚洲最大av| 亚洲成色77777| 成年人午夜在线观看视频| 一级,二级,三级黄色视频| 国产精品久久久久久精品古装| 亚洲国产av新网站| 久久国产精品男人的天堂亚洲 | 亚洲国产精品国产精品| 有码 亚洲区| 十八禁网站网址无遮挡| av国产久精品久网站免费入址| 你懂的网址亚洲精品在线观看| 黄色视频在线播放观看不卡| av播播在线观看一区| 亚洲国产精品国产精品| 国产亚洲午夜精品一区二区久久| kizo精华| 日韩成人av中文字幕在线观看| 国产精品.久久久| 中文字幕精品免费在线观看视频 | 黄色视频在线播放观看不卡| 亚洲熟女精品中文字幕| 亚洲少妇的诱惑av| 成人二区视频| 少妇人妻久久综合中文| 考比视频在线观看| 热re99久久国产66热| 母亲3免费完整高清在线观看 |