高峽 吳濤 高月仁
摘 要:傳統(tǒng)檢索方法查準(zhǔn)率和查全率相對(duì)較差,導(dǎo)致自動(dòng)檢索精準(zhǔn)度較低。為此,提出了基于云計(jì)算平臺(tái)的政務(wù)大數(shù)據(jù)系統(tǒng)自動(dòng)檢索方法研究。在云計(jì)算平臺(tái)下,利用CiteSpace軟件對(duì)政務(wù)大數(shù)據(jù)系統(tǒng)中的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,獲取相關(guān)資源。在電子政務(wù)聯(lián)機(jī)模式下,揭示政務(wù)大數(shù)據(jù)系統(tǒng)中資源相關(guān)屬性,在MapReduce挖掘模型支持下,進(jìn)行政務(wù)大數(shù)據(jù)系統(tǒng)數(shù)據(jù)挖掘,實(shí)現(xiàn)政務(wù)大數(shù)據(jù)系統(tǒng)自動(dòng)檢索。實(shí)驗(yàn)驗(yàn)證分析,該方法檢索查準(zhǔn)率和查全率較高,具有高效檢索效果。
關(guān)鍵詞:云計(jì)算平臺(tái);大數(shù)據(jù)系統(tǒng);自動(dòng)檢索
中圖分類號(hào):TP393????? 文獻(xiàn)標(biāo)識(shí)碼:A
Research on Automatic Retrieval Method of Government
Big Data System Based on Cloud Computing Platform
GAO Xia1,WU Tao2 ,GAO Yue-ren3
(1.Tangshan Caofeidian Development Investment Group Co., Ltd,Tangshan,Hebei 063200,China;
2. North China University of Science and Technology, Tangshan,Hebei 063200,China;
3.Tangshan Caofeidian Liancheng Technology Co., Ltd, Tangshan,Hebei 063200,China)
Abstract:The accuracy and recall of traditional retrieval methods are relatively poor, which leads to low accuracy of automatic retrieval. In response to this problem, a research on automatic retrieval methods for government affairs big data systems based on cloud computing platforms is proposed. Under the cloud computing platform, CiteSpace software is used to perform statistical analysis on keywords in the government's big data system to obtain related resources. Under the online mode of e-government, the resource-related attributes in the government's big data system are revealed. With the support of the MapReduce mining model, data mining of the government's big data system is performed to realize automatic retrieval of the government's big data system. The experimental verification analysis shows that the method has high retrieval accuracy and recall, and has an efficient retrieval effect.
Key words:cloud computing platform; big data system; automatic retrieval
隨著信息時(shí)代的到來,云計(jì)算和大數(shù)據(jù)技術(shù)為人們提供了豐富的信息資源,具有真實(shí)性高、多元化和實(shí)時(shí)性的特點(diǎn),在人類社會(huì)的生產(chǎn)和生活中發(fā)揮著重要的作用[1]。據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心統(tǒng)計(jì),每天被創(chuàng)建和復(fù)制的數(shù)據(jù)總量為1.8ZB,而生成這樣規(guī)模的信息量只需10分鐘。如此龐大的數(shù)據(jù)信息,給云計(jì)算平臺(tái)集成數(shù)據(jù)的檢索管理帶來難度,尤其面對(duì)互聯(lián)網(wǎng)政務(wù)服務(wù)體系,公共服務(wù)信息集成的數(shù)據(jù)占社會(huì)總量的90%以上,大大增加了云計(jì)算平臺(tái)的政務(wù)大數(shù)據(jù)系統(tǒng)檢索的工作量[2]。由于政務(wù)部門數(shù)據(jù)的類型復(fù)雜多樣,半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)較多,如何有效進(jìn)行采集、存儲(chǔ)、分析、處理等一系列數(shù)據(jù)的挖掘管理,需要建立新技術(shù)的大數(shù)據(jù)自動(dòng)檢索方法,以提高大數(shù)據(jù)信息的檢索工作。目前已有相關(guān)研究,文獻(xiàn)[3]根據(jù)Lucene索引原理,改進(jìn)緩沖區(qū)索引容量,并優(yōu)化磁盤文件索引書寫頻率。通過對(duì)單進(jìn)程Lucene索引安插并行Map Reduce計(jì)算模塊,構(gòu)建并行Lucene全文檢索引擎,實(shí)現(xiàn)大數(shù)據(jù)的檢索。文獻(xiàn)[4]提出考慮了云服務(wù)器可信狀態(tài),在支持用戶在密文上提出多關(guān)鍵詞語義排序搜索技術(shù),通過引入域加權(quán)評(píng)分概念,結(jié)合數(shù)據(jù)信息權(quán)重對(duì)關(guān)鍵詞進(jìn)行擴(kuò)展,提升數(shù)據(jù)查全率,在此基礎(chǔ)上創(chuàng)建的文檔向量分塊,過濾檢索過程中無關(guān)信息,提升查詢效率。
但上述方法無法在保證高查全率的同時(shí),提升系統(tǒng)查準(zhǔn)率,為此,提出基于云計(jì)算平臺(tái)的政務(wù)大數(shù)據(jù)系統(tǒng)自動(dòng)檢索方法。這種新技術(shù)的政務(wù)大數(shù)據(jù)自動(dòng)檢索方法是通過對(duì)數(shù)據(jù)特征和信息內(nèi)容的分析,采取與之相關(guān)聯(lián)信息的挖掘整理,在云計(jì)算環(huán)境下實(shí)現(xiàn)對(duì)政務(wù)大數(shù)據(jù)的自動(dòng)檢索工作。這種基于云計(jì)算平臺(tái)的政務(wù)大數(shù)據(jù)系統(tǒng)自動(dòng)檢索方法的研究與應(yīng)用,改變了傳統(tǒng)數(shù)據(jù)檢索技術(shù)的準(zhǔn)確性差、效率低的缺點(diǎn),提高了數(shù)據(jù)檢索的精準(zhǔn)性和高效性。
1 基于云計(jì)算平臺(tái)政務(wù)大數(shù)據(jù)系統(tǒng)資源抓取與整合
云計(jì)算平臺(tái)通過對(duì)政務(wù)數(shù)據(jù)進(jìn)行集中抓取和整合管理模式,明確政務(wù)各主體之間的關(guān)系,并對(duì)數(shù)據(jù)信息采取計(jì)算、分析和優(yōu)化處理,配置和調(diào)用大數(shù)據(jù)系統(tǒng)中反復(fù)出現(xiàn)頻率最高的關(guān)鍵詞,保障了政務(wù)大數(shù)據(jù)系統(tǒng)的統(tǒng)一性和準(zhǔn)確性[5]。通過對(duì)CiteSpace軟件的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,獲取政務(wù)相關(guān)的熱點(diǎn)關(guān)鍵詞知識(shí)圖譜。
云計(jì)算平臺(tái)通過對(duì)政務(wù)大數(shù)據(jù)系統(tǒng)資源的關(guān)鍵字自動(dòng)搜索,并將搜索的結(jié)果保存到數(shù)據(jù)庫中,根據(jù)獲取的網(wǎng)頁數(shù)據(jù)使用Jsoup解析網(wǎng)頁,自動(dòng)提取所需信息并存入資源庫之中[6]。
1.1 資源抓取
對(duì)數(shù)據(jù)資源進(jìn)行檢查、清洗,排除存在的殘缺數(shù)據(jù)和廢棄數(shù)據(jù),抓取有價(jià)值的數(shù)據(jù)資源。全部數(shù)據(jù)清洗整理完成后,對(duì)數(shù)據(jù)特征進(jìn)行特定條件的匹配,經(jīng)過格式化處理進(jìn)行數(shù)據(jù)的存儲(chǔ),提高了后續(xù)數(shù)據(jù)處理的速度和效率[7]。云計(jì)算平臺(tái)政務(wù)大數(shù)據(jù)系統(tǒng)資源的抓取,具有良好的一致性、完整性和準(zhǔn)確定,保障了數(shù)據(jù)資源的質(zhì)量[8-10]。
XML格式文檔中各字段基本信息說明如表1所示。
在政務(wù)大數(shù)據(jù)系統(tǒng)資源的抓取過程中,需將上述說明信息導(dǎo)入excel格式文件之中才能進(jìn)行[11]。
1.2 資源整合
由于抓取的數(shù)據(jù)資源種類繁多、信息資源規(guī)模巨大,必須對(duì)海量數(shù)據(jù)進(jìn)行整合處理,以保證政務(wù)大數(shù)據(jù)系統(tǒng)能夠容納大量的信息資源[12]。通過對(duì)不同位置、不同來源信息資源進(jìn)行挖掘、存儲(chǔ)、整合管理,使信息資源清晰明確、有序規(guī)范,有利于用戶在對(duì)信息資源檢索時(shí)快速準(zhǔn)確地獲取信息資源[13]。針對(duì)政務(wù)大數(shù)據(jù)系統(tǒng)信息資源的廣泛性和多元性,在云計(jì)算技術(shù)的支持下開展信息檢索方式、協(xié)議標(biāo)準(zhǔn)和技術(shù)等方面的資源整合[14]。
(1)對(duì)分散的不同位置、不同來源的數(shù)據(jù)信息進(jìn)行整合管理,形成一個(gè)有序的數(shù)字資源體系,方便數(shù)據(jù)資源的搜索與查找[15]。
(2)改變?cè)假Y源庫存在的信息資源繁瑣、多樣化狀態(tài)的管理方式,進(jìn)行新的資源整合,使資源庫信息結(jié)構(gòu)形成統(tǒng)一、規(guī)范的信息系統(tǒng),提高資源的管理。
(3)通過對(duì)網(wǎng)絡(luò)通信協(xié)議的標(biāo)準(zhǔn)整合,采用先進(jìn)的技術(shù)方法,能夠在同一界面內(nèi)完成不同資源庫資源的檢索[16]。
2 政務(wù)大數(shù)據(jù)挖掘
在數(shù)據(jù)挖掘技術(shù)中,需要針對(duì)數(shù)據(jù)屬性的表層信息、內(nèi)在關(guān)系和隱含信息等進(jìn)行挖掘提取。而政務(wù)大數(shù)據(jù)信息規(guī)模龐大、類型多樣、內(nèi)容復(fù)雜,如果從這些海量數(shù)據(jù)當(dāng)中挖掘提取出隱性潛在的信息資源,來滿足用戶不同概念和模式、不同規(guī)律規(guī)則的信息資源,需要采取創(chuàng)新分布式并行挖掘新技術(shù)。這種先進(jìn)的分布式并行數(shù)據(jù)挖掘技術(shù),改變了傳統(tǒng)串行數(shù)據(jù)挖掘算法存在的耗時(shí)長、效率低并且只能適用于小規(guī)模的數(shù)據(jù)處理的缺點(diǎn),發(fā)揮了精準(zhǔn)性、時(shí)間短、高效率的優(yōu)點(diǎn),并能進(jìn)行大規(guī)模數(shù)據(jù)的處理工作。
基于云計(jì)算的政務(wù)大數(shù)據(jù)挖掘技術(shù),采用分布式并行數(shù)據(jù)挖掘方式對(duì)系統(tǒng)中集中存儲(chǔ)的全部數(shù)據(jù)集,進(jìn)行分別的任務(wù)拆分并交由每一個(gè)單獨(dú)機(jī)器進(jìn)行處理。任務(wù)分解處理完成后,再把處理好的數(shù)據(jù)資源進(jìn)行集中匯總起來,其中,集中匯總將采用模糊C均值聚類算法進(jìn)行,則其表示為:
JFCM=∑Ni=1∑Rj=1uij(Di-vj)2(1)
式中,uij表示聚類系數(shù);Di表示分解前任務(wù)數(shù)量;vj表示分解后任務(wù)數(shù)量;N、R均為實(shí)數(shù)。這種分布式并行數(shù)據(jù)挖掘算法的設(shè)計(jì),不僅極大地提高計(jì)算效率,同時(shí)保證了計(jì)算集群擴(kuò)展性。計(jì)算方法采用在MapReduce云計(jì)算環(huán)境中的挖掘模型,開展大規(guī)模數(shù)據(jù)集的挖掘計(jì)算提取,程序員對(duì)Map(映射)函數(shù)中各分塊數(shù)據(jù)指定處理過程,并對(duì)Reduce(規(guī)約)函數(shù)中分塊數(shù)據(jù)指定處理的中間結(jié)果進(jìn)行挖掘,則挖掘輸出為:
W(s)=JFCM4(1-14)m-1λ(2)
式中,λ表示數(shù)據(jù)挖掘強(qiáng)度;m表示各分塊數(shù)據(jù)數(shù)量。通過模型計(jì)算結(jié)果表明,分部式并行挖掘計(jì)算方法在政務(wù)大數(shù)據(jù)中的應(yīng)用,不僅有效提高了數(shù)據(jù)挖掘效率,還發(fā)揮了計(jì)算集群的良好擴(kuò)展性。
3 政務(wù)大數(shù)據(jù)系統(tǒng)自動(dòng)檢索
3.1 字典建立
隨著政務(wù)信息種類不斷的擴(kuò)展,系統(tǒng)自動(dòng)檢索集成先進(jìn)的中文自然語言處理技術(shù),建立一個(gè)字典來滿足檢索需求。在業(yè)務(wù)數(shù)據(jù)資源逐漸增多的發(fā)展中,由于字典單詞的有限性,在進(jìn)行單詞的智能擴(kuò)展搜索中,需要對(duì)字典單詞進(jìn)行實(shí)時(shí)的更新和維護(hù),通過對(duì)字典進(jìn)行分類管理,實(shí)現(xiàn)擴(kuò)展增加單詞、刪除單詞的管理,并對(duì)詞典類別進(jìn)行分類展示、批量導(dǎo)人和搜索。利用elastic search默認(rèn)分詞詞庫構(gòu)建基本分詞詞庫,主要包括主詞典詞庫、介詞詞庫、量詞詞庫、姓氏詞庫等,擴(kuò)展增加了基本分詞詞庫的內(nèi)容,可以進(jìn)行自動(dòng)完成或手動(dòng)添加的方式。
3.2 信息索引機(jī)制建立
為了以最快的速度得到搜索結(jié)果,建立了信息索引機(jī)制。存儲(chǔ)服務(wù)器在進(jìn)行并行分布式檢索時(shí),可以采取標(biāo)題、關(guān)鍵字等進(jìn)行信息的廣度索引,也可以對(duì)所需的重要信息進(jìn)行優(yōu)先索引。檢索完成后的結(jié)果收錄在Index Repository中,網(wǎng)頁收錄在搜索引擎的索引,搜索過程在Index Repository進(jìn)行。這兩種采用廣度優(yōu)先算法和深度優(yōu)先算法的檢索方式,實(shí)現(xiàn)了信息挖掘的個(gè)性化服務(wù),提高了檢索服務(wù)的質(zhì)量。根據(jù)存儲(chǔ)器在并行分布式檢索中的工作流程,建立牽引機(jī)制圖形,以用戶提出請(qǐng)求的搜索過程進(jìn)行信息搜索,如圖1所示。
信息索引機(jī)制的工作原理,就是采用廣度優(yōu)先搜索或個(gè)性化深度優(yōu)先搜索,把索引存儲(chǔ)器中的倒序索引列表或頁面內(nèi)容抓取到本地?cái)?shù)據(jù)庫,通過關(guān)鍵字或標(biāo)題等信息采取不同的檢索技術(shù)。
3.3 自動(dòng)檢索方案實(shí)現(xiàn)
根據(jù)用戶提出的查詢要求,把頁面內(nèi)容或關(guān)鍵字提交給檢索請(qǐng)求代理,索引存儲(chǔ)器將檢索代理發(fā)送的關(guān)鍵字或頁面內(nèi)容信息進(jìn)行匹配,并按照檢索結(jié)果進(jìn)行查詢相關(guān)度的排序后,把檢索結(jié)構(gòu)返回給用戶,完成整個(gè)檢索工作流程。自動(dòng)檢索方案的實(shí)現(xiàn),不僅極大地提高了檢索速度,還有效增加了查詢的實(shí)時(shí)性和準(zhǔn)確率。如圖2所示。
自動(dòng)檢測過程通過對(duì)數(shù)據(jù)資源的統(tǒng)一整合,采取對(duì)數(shù)據(jù)進(jìn)行檢查清洗,去除重復(fù)破損等信息過濾的技術(shù)手段,開展數(shù)據(jù)的分析、排序、挖掘和提取,并采取不同的檢索方法,最后對(duì)檢索結(jié)果進(jìn)行處理,完成自動(dòng)檢測過程。
4 實(shí)驗(yàn)研究
為了驗(yàn)證基于云計(jì)算平臺(tái)的政務(wù)大數(shù)據(jù)系統(tǒng)自動(dòng)檢索方法研究合理性,需先設(shè)計(jì)實(shí)驗(yàn)環(huán)境,在該環(huán)境下對(duì)數(shù)據(jù)查準(zhǔn)率、查全率進(jìn)行驗(yàn)證分析。
采用Matlab7.0軟件,進(jìn)行檢索系統(tǒng)的仿真,得到檢索仿真軟件,其檢索界面如圖3所示。
4.1 實(shí)驗(yàn)數(shù)據(jù)選取
以“政府開放數(shù)據(jù)”數(shù)據(jù)庫為例,在上述云計(jì)算實(shí)驗(yàn)平臺(tái)下,通過對(duì)動(dòng)態(tài)信息庫的訪問,創(chuàng)建任務(wù)檢索目標(biāo),選取某政務(wù)動(dòng)態(tài)信息為研究對(duì)象,設(shè)置數(shù)據(jù)選取流程,如下所示:
①根據(jù)URL地址獲取原始政務(wù)信息資源;
②依據(jù)獲取的信息資源,進(jìn)行篩選與剔除處理,選取最為合適的資源信息;
③根據(jù)XML格式文檔,建立相應(yīng)數(shù)據(jù)模型;
④依據(jù)信息選取路徑,獲取相關(guān)政務(wù)內(nèi)容;
⑤將上述選取的兩種政務(wù)信息資源Q1、Q2內(nèi)容存儲(chǔ)到文檔之中,并保存。
4.2 查準(zhǔn)率對(duì)比結(jié)果與分析
將傳統(tǒng)方法與基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率進(jìn)行對(duì)比分析,結(jié)果如圖4所示。
Q1:在實(shí)驗(yàn)次數(shù)為2次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高45%;在實(shí)驗(yàn)次數(shù)為4次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高52%;在實(shí)驗(yàn)次數(shù)為6次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高53%;在實(shí)驗(yàn)次數(shù)為8次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高42.5%;在實(shí)驗(yàn)次數(shù)為10次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高62%;在實(shí)驗(yàn)次數(shù)為12次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高71%;在實(shí)驗(yàn)次數(shù)為14次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高63%。
Q2:在實(shí)驗(yàn)次數(shù)為2次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高45%,與Q1查準(zhǔn)率一致;在實(shí)驗(yàn)次數(shù)為4次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高55%;在實(shí)驗(yàn)次數(shù)為6次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高53%,與Q1查準(zhǔn)率一致;在實(shí)驗(yàn)次數(shù)為8次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高72%;在實(shí)驗(yàn)次數(shù)為10次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高73%;在實(shí)驗(yàn)次數(shù)為12次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高66%;在實(shí)驗(yàn)次數(shù)為14次時(shí),基于云計(jì)算平臺(tái)檢索方法的查準(zhǔn)率比傳統(tǒng)方法要高63%,與Q1查準(zhǔn)率一致。
4.3 查全率對(duì)比結(jié)果與分析
將傳統(tǒng)方法與基于云計(jì)算平臺(tái)檢索方法的查全率進(jìn)行對(duì)比分析,結(jié)果如表2所示。
在Q1政務(wù)大數(shù)據(jù)資源下,采用兩種文獻(xiàn)方法在實(shí)驗(yàn)次數(shù)為2次時(shí),查全率達(dá)到最高為76%。而所研究方法在實(shí)驗(yàn)次數(shù)為2、8、10次時(shí),查全率達(dá)到最高為96%。
在Q2政務(wù)大數(shù)據(jù)資源下,采用兩種文獻(xiàn)方法在實(shí)驗(yàn)次數(shù)為2次時(shí),查全率達(dá)到最高為77%。而所研究方法在實(shí)驗(yàn)次數(shù)為12、14次時(shí),查全率達(dá)到最高為98%。
5 結(jié) 論
隨著科技的快速發(fā)展,依據(jù)云計(jì)算平臺(tái)和大數(shù)據(jù)技術(shù)的基礎(chǔ)上,實(shí)現(xiàn)了基于云計(jì)算平臺(tái)的政務(wù)大數(shù)據(jù)系統(tǒng)自動(dòng)檢索方法的研究。通過對(duì)政務(wù)大數(shù)據(jù)信息資源的抓取和整合,實(shí)現(xiàn)了數(shù)據(jù)信息的統(tǒng)一規(guī)范的管理;對(duì)數(shù)據(jù)信息的挖掘、排序和提取,建立信息自動(dòng)檢索機(jī)制和方案。采取廣度檢索和深度優(yōu)化檢索的不同檢索方式,不僅提高了自動(dòng)檢索的速度和準(zhǔn)確率,同時(shí)還滿足了用戶個(gè)性化訪問檢索的需求。
大數(shù)據(jù)檢索技術(shù)具有速度快、準(zhǔn)確率高的優(yōu)點(diǎn),還可以實(shí)現(xiàn)海量、大規(guī)模數(shù)據(jù)檢索的請(qǐng)求,適用于各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)信息的檢索。隨著智能型、多媒體產(chǎn)品的增多,在圖形、聲音和視頻等許多大數(shù)據(jù)的檢索技術(shù)中,應(yīng)需進(jìn)行不斷的研究和創(chuàng)新,以促進(jìn)未來大數(shù)據(jù)檢索技術(shù)的快速發(fā)展。
參考文獻(xiàn)
[1] 江國文. 基于云計(jì)算的船舶大數(shù)據(jù)并行調(diào)度算法研究[J]. 艦船科學(xué)技術(shù), 2018, 3(20):142-144.
[2] 劉建鑫. 智能化媒體發(fā)展的引擎——基于大數(shù)據(jù)和云計(jì)算技術(shù)的應(yīng)用觀察[J]. 青年記者, 2018, 2(1):50-51.
[3] 劉永花, 楊麗娜, 王靜宇. 基于MapReduce的增量式全文Lucene引擎并行檢索[J]. 控制工程, 2018, 7(8) :1540-1546.
[4] 楊旸, 劉佳, 蔡圣暐, 等. 云計(jì)算中保護(hù)數(shù)據(jù)隱私的快速多關(guān)鍵詞語義排序搜索方案[J]. 計(jì)算機(jī)學(xué)報(bào), 2018, 41(6) :1346-1359.
[5] 蘇鈺雅. 基于云計(jì)算的高校財(cái)務(wù)績效動(dòng)態(tài)評(píng)價(jià)模式研究[J]. 會(huì)計(jì)之友, 2019, 4(8) :147-150.
[6] 周雪輝, 李浩宇. 云計(jì)算下基于激光虛擬的遠(yuǎn)程實(shí)驗(yàn)室系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 激光雜志, 2018, 6(10):165-170.
[7] 胡伏湘. 基于大數(shù)據(jù)的智慧職教——內(nèi)涵、平臺(tái)設(shè)計(jì)與應(yīng)用[J]. 中國職業(yè)技術(shù)教育, 2017, 7(3):85-91.
[8] 楊露. 大數(shù)據(jù)背景下農(nóng)業(yè)企業(yè)電子商務(wù)商品圖像特征提取檢索的方案設(shè)計(jì)[J]. 電視技術(shù), 2018, 5(11):82-86.
[9] 陳建平, 賈志杰, 徐彬. 地質(zhì)數(shù)據(jù)本體構(gòu)建及其在數(shù)據(jù)檢索中的應(yīng)用[J]. 地質(zhì)通報(bào), 2018, 37(5):945-953.
[10]賈賀, 艾中良,賈高峰,等. 基于Solr的司法大數(shù)據(jù)檢索模型研究與實(shí)現(xiàn)[J]. 計(jì)算機(jī)工程與應(yīng)用, 2017, 53(20):249-253.
[11]王華樹, 張成智. 大數(shù)據(jù)時(shí)代譯者的搜索能力探究[J]. 中國科技翻譯, 2018, 31(4) :26-29.
[12]毛萬華. 鐵路客運(yùn)電梯安全物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)構(gòu)建研究[J]. 鐵道運(yùn)輸與經(jīng)濟(jì), 2018, 5(12) :71-75.
[13]宋相龍, 李楠, 肖克炎, 等. 礦產(chǎn)資源潛力評(píng)價(jià)成果數(shù)據(jù)信息管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].地學(xué)前緣,2018, 25(3):196-203.
[14]蔡晨, 羅可. 融合BTM和圖論的微博檢索模型[J]. 計(jì)算機(jī)工程與科學(xué), 2019, 7(8) :1512-1518.
[15]李默. 數(shù)字政務(wù)大數(shù)據(jù)系統(tǒng)個(gè)性化移動(dòng)視覺搜索機(jī)制研究[J]. 政務(wù)大數(shù)據(jù)系統(tǒng)理論與實(shí)踐, 2019, 6(2) :107-112.
[16]張建坤, 禹思敏. 面向混合型位置大數(shù)據(jù)的差分隱私聚類算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2019, 6(9) :2451-2455.