• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于項(xiàng)目檔案的學(xué)術(shù)專題情報(bào)快速輔助生成系統(tǒng)技術(shù)分析

    2016-06-28 16:08:27張魯冀趙燕燕
    天津科技 2016年6期
    關(guān)鍵詞:爬蟲(chóng)搜索引擎網(wǎng)頁(yè)

    劉 念,張魯冀,趙燕燕,陳 默

    (1. 北京電子科技學(xué)院 北京100070;2. 北京市科學(xué)技術(shù)情報(bào)研究所 北京100048;3. 大唐電信科技股份有限公司 北京100094;4. 機(jī)械工業(yè)信息研究院 北京100037)

    基于項(xiàng)目檔案的學(xué)術(shù)專題情報(bào)快速輔助生成系統(tǒng)技術(shù)分析

    劉 念1,張魯冀2,趙燕燕3,陳 默4

    (1. 北京電子科技學(xué)院 北京100070;2. 北京市科學(xué)技術(shù)情報(bào)研究所 北京100048;3. 大唐電信科技股份有限公司 北京100094;4. 機(jī)械工業(yè)信息研究院 北京100037)

    從情報(bào)研究、信息源、分析需求等層面探討了信息情報(bào)的概念和特征,提出簡(jiǎn)單的統(tǒng)計(jì)分析已不能滿足當(dāng)前社會(huì)的決策需求,需要從大量信息中發(fā)現(xiàn)潛在模式,指導(dǎo)未來(lái)的發(fā)展,這就涉及數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)。目前,國(guó)外對(duì)情報(bào)研究中的智能化技術(shù)沒(méi)有統(tǒng)一的界定,但概觀之,可以將情報(bào)研究智能化的本質(zhì)概括為定量化、可計(jì)算、可重復(fù)。就此進(jìn)行了闡述和分析。

    信息挖據(jù) 情報(bào) 算法

    0 引 言

    搜索引擎是一種在Web上搜索和挖掘信息的軟件系統(tǒng),通過(guò)結(jié)合若干種策略,可以自動(dòng)地將信息搜集起來(lái)并以統(tǒng)一的組織形式呈現(xiàn)出來(lái),給用戶提供系統(tǒng)的信息查詢業(yè)務(wù)。搜索引擎的種類有很多,包括元搜索、垂直搜索、全文索引、目錄索引等。目前較為主流的搜索引擎有百度、Google、AltaVista、雅虎、SOSO、必應(yīng)等。在信息搜索方面,搜索引擎不僅需要龐大的硬件系統(tǒng)作為后備支持力量,還需要相當(dāng)復(fù)雜的軟件結(jié)構(gòu)的設(shè)計(jì)。

    從結(jié)構(gòu)上來(lái)講,搜索引擎主要分為網(wǎng)絡(luò)爬蟲(chóng)、資料庫(kù)和索引庫(kù),系統(tǒng)首先會(huì)啟動(dòng)大批量的爬蟲(chóng)對(duì)網(wǎng)絡(luò)上的檔案數(shù)據(jù)進(jìn)行采集,將這些數(shù)據(jù)保存到資料庫(kù)中,其中會(huì)運(yùn)用到復(fù)雜的URL調(diào)度策略和數(shù)據(jù)抓取策略,以保證同一個(gè)網(wǎng)頁(yè)不會(huì)被重復(fù)抓取。然后系統(tǒng)會(huì)對(duì)資料庫(kù)中的數(shù)據(jù)建立索引,保存到索引庫(kù)中,將無(wú)序的資料整理成有序的資料庫(kù)。目前建立索引的主流方式是倒排索引,也稱倒排文件法,由于本文主要介紹搜索引擎的網(wǎng)頁(yè)爬蟲(chóng)部分,不涉及建立索引的工作,故在此不進(jìn)行過(guò)度敘述。最后,用戶通過(guò)輸入關(guān)鍵詞,系統(tǒng)將對(duì)用戶輸入的信息進(jìn)行分析,包括分詞、去噪、合并同義詞等處理,最后從有序資料庫(kù)中將結(jié)果返回給用戶(見(jiàn)圖1)。

    圖1 搜索引擎工作原理結(jié)構(gòu)圖Fig.1 Working principle diagram of search engine

    1 元搜索模型

    1.1 基本概念

    元搜索是搜索引擎中的一種,也可稱為“多搜索引擎”,它的本質(zhì)是通過(guò)調(diào)用其他搜索引擎來(lái)進(jìn)行工作,元搜索中的“元”有總的、超越的意思,故也有人稱之為“搜索引擎之母”。Metacrawler是世界上最早的元搜索引擎,作者是華盛頓大學(xué)的教授Oren Etzi以及學(xué)生Erik。它是InfoSpaceInc的一部分,于1995年正式在網(wǎng)絡(luò)上運(yùn)行。元搜索模型不需要獨(dú)立的網(wǎng)頁(yè)數(shù)據(jù)庫(kù),它可以根據(jù)用戶的特定需求選擇不同的搜索引擎進(jìn)行檢索,傳統(tǒng)意義上的元搜索模型都是采用并行結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行抓取,還能根據(jù)需要對(duì)特定的數(shù)據(jù)類型進(jìn)行檢索,如圖片、視頻、文檔等。

    元搜索模型解決了傳統(tǒng)搜索引擎搜索結(jié)果不足的問(wèn)題,使之更為全面,如果元搜索引擎對(duì)一個(gè)關(guān)鍵詞檢索到了若干個(gè)相同或相似的信息,則說(shuō)明該信息對(duì)于用戶輸入的關(guān)鍵詞最為有用,相關(guān)度最高。相反地,元搜索模型會(huì)帶來(lái)更多的網(wǎng)頁(yè)噪音,對(duì)于網(wǎng)頁(yè)去噪帶來(lái)更大的挑戰(zhàn)。元搜索模型有著很好的發(fā)展前景,通過(guò)對(duì)檢索的個(gè)性化設(shè)置和數(shù)據(jù)的整合優(yōu)化,給用戶提供大而全的信息,這可以為很多行業(yè)帶來(lái)方便。

    1.2 工作原理

    元搜索模型可以被看作是有著雙層C/S結(jié)構(gòu)的系統(tǒng)。元搜索引擎接收用戶發(fā)送的請(qǐng)求后,同時(shí)并行連接多個(gè)搜索引擎,向其發(fā)送實(shí)際的檢索條件,然后將各個(gè)搜索引擎返回的結(jié)果收集起來(lái),做統(tǒng)一處理,最后顯示給用戶。元搜索模型的系統(tǒng)結(jié)構(gòu)包括檢索請(qǐng)求發(fā)送模塊、接口代理模塊以及檢索結(jié)果處理顯示模塊,以環(huán)形結(jié)構(gòu)相互順序連接。從搜索方式上可以分為詞語(yǔ)搜索、目錄搜索和高級(jí)搜索3種搜索方式。詞語(yǔ)搜索的對(duì)象是文本,可以是一個(gè)詞、詞組或是一句話,然后對(duì)其進(jìn)行分詞處理以及同義詞合并、關(guān)聯(lián)搜索。目錄搜索也被稱為“分類搜索”,用戶不需要輸入關(guān)鍵詞,而是通過(guò)搜索引擎提供的類別選擇不同的目錄進(jìn)行檢索。高級(jí)檢索也被稱為“定制檢索”,需要用戶輸入布爾邏輯匹配組來(lái)進(jìn)行檢索(見(jiàn)圖2)。

    圖2 元搜索模型結(jié)構(gòu)圖Fig.2 Meta model structure

    2 垂直搜索模型

    2.1 基本概念

    垂直搜索模型是搜索引擎的一種表現(xiàn)形式,比較百度、Google等通用搜索引擎“大而全”的檢索方式,垂直搜索引擎的特點(diǎn)則是“小而精”,是一種專門(mén)為某一行業(yè)或工作設(shè)計(jì)的搜索引擎。垂直搜索引擎不能為用戶提供數(shù)以億計(jì)的檢索結(jié)構(gòu),而是提供匹配程度極高的精確數(shù)據(jù)。垂直搜索針對(duì)的用戶群體普遍穩(wěn)定性強(qiáng)、專業(yè)性強(qiáng),且具有一定的行業(yè)色彩。與通用的搜索引擎比較,最大的不同是垂直搜索引擎使用結(jié)構(gòu)化的信息抽取方法,將數(shù)據(jù)以結(jié)構(gòu)化的方式存儲(chǔ)到數(shù)據(jù)庫(kù)中。通用搜索引擎是以網(wǎng)頁(yè)或鏈接為最小單元,而垂直搜索引擎則是以結(jié)構(gòu)化數(shù)據(jù)為最小單元,這種方法的好處在于可以利用不同數(shù)據(jù)的特征對(duì)象進(jìn)行比較分析。

    2.2 工作原理

    以購(gòu)物垂直搜索引擎為例,它的數(shù)據(jù)來(lái)源是網(wǎng)絡(luò)上各種各樣的購(gòu)物網(wǎng)站,首先購(gòu)物垂直搜索模型會(huì)對(duì)多個(gè)購(gòu)物網(wǎng)站與該產(chǎn)品相同或相關(guān)的產(chǎn)品信息進(jìn)行檢索,按照結(jié)構(gòu)化的形式將數(shù)據(jù)保存到數(shù)據(jù)庫(kù)中,例如該產(chǎn)品的名稱、重量、產(chǎn)地、價(jià)格等參數(shù),最后對(duì)結(jié)構(gòu)化數(shù)據(jù)建立索引。當(dāng)用戶通過(guò)輸入關(guān)鍵詞對(duì)某一產(chǎn)品進(jìn)行檢索時(shí),購(gòu)物垂直搜索引擎會(huì)從索引庫(kù)中根據(jù)關(guān)鍵詞提取數(shù)據(jù),然后返回給用戶。購(gòu)物垂直搜索引擎不僅能對(duì)用戶輸入的信息進(jìn)行采集,還能將產(chǎn)品按照價(jià)格、規(guī)格、產(chǎn)地等參數(shù)信息進(jìn)行統(tǒng)計(jì)和比較,給用戶提供最佳的選擇方案,或者滿足用戶特定的檢索需求。這種搜索模式產(chǎn)出的檢索結(jié)果比通用搜索引擎的結(jié)果有更大的參考價(jià)值,同時(shí)也滿足了商家的促銷目的。

    3 網(wǎng)頁(yè)信息采集的工作原理及相關(guān)技術(shù)

    3.1 網(wǎng)頁(yè)信息采集策略

    網(wǎng)頁(yè)信息采集主要使用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)。網(wǎng)絡(luò)爬蟲(chóng)是使用某種策略對(duì)Web頁(yè)面信息進(jìn)行采集的程序,是搜索引擎中重要的組成部分(見(jiàn)圖3)。傳統(tǒng)的網(wǎng)絡(luò)爬蟲(chóng)以一個(gè)或若干個(gè)URL作為初始節(jié)點(diǎn),然后將該URL頁(yè)面上的所有鏈接下載到服務(wù)器內(nèi),在爬蟲(chóng)搜索的過(guò)程中,不斷地從當(dāng)前網(wǎng)頁(yè)上獲取新的URL,直到滿足一定的終止條件時(shí)停止抓取。實(shí)現(xiàn)網(wǎng)頁(yè)抓取主要有廣度優(yōu)先策略、深度優(yōu)先策略以及最佳優(yōu)先策略。

    圖3 網(wǎng)絡(luò)爬蟲(chóng)結(jié)構(gòu)圖Fig.3 Web crawler structure

    廣度優(yōu)先搜索策略(Breadth First Search)也被稱為寬度優(yōu)先搜索策略,是指在網(wǎng)頁(yè)抓取的過(guò)程中,在獲取當(dāng)前層次中的全部URL后,再進(jìn)行下一層次的搜索。該算法的目的是為了盡可能多地覆蓋網(wǎng)頁(yè)URL。聚焦爬蟲(chóng)就是使用了這種搜索策略,其主要思想是與初始URL距離越近的網(wǎng)頁(yè),與搜索的主題相關(guān)性就越大。此外還能與網(wǎng)頁(yè)過(guò)濾技術(shù)結(jié)合,首先使用廣度優(yōu)先策略對(duì)網(wǎng)頁(yè)進(jìn)行抓取,再過(guò)濾掉其中相關(guān)性較低的網(wǎng)頁(yè)。這些方法的缺點(diǎn)在于,隨著抓取URL數(shù)量的增多,將會(huì)下載并過(guò)濾大量不相關(guān)頁(yè),結(jié)果降低了算法的效率。

    深度優(yōu)先搜索策略(Depth First Search)是指從起始URL開(kāi)始,獲取該URL中的其中一個(gè)鏈接,從這個(gè)鏈接進(jìn)入,分析這個(gè)網(wǎng)頁(yè)中的某一個(gè)URL,再選擇一個(gè)進(jìn)入。如此循環(huán)地抓取下去,直到完全處理一條URL路線上的鏈接后,再處理下一個(gè)URL。深度優(yōu)先搜索策略比較簡(jiǎn)單易行,網(wǎng)絡(luò)爬蟲(chóng)的初始網(wǎng)站往往具有較高的價(jià)值,網(wǎng)頁(yè)排名也很高,但每深入一層,網(wǎng)頁(yè)的價(jià)值和排名都會(huì)有一定比例的下降。這說(shuō)明了重要網(wǎng)頁(yè)通常距離初始URL較近,非重要網(wǎng)頁(yè)與初始URL距離較遠(yuǎn)。同時(shí),深度優(yōu)先搜索策略直接影響了搜索的準(zhǔn)確度和搜索效率,這種缺點(diǎn)是致命的,所以相對(duì)于其他兩種搜索策略來(lái)說(shuō),這種搜索策略極少被用到實(shí)際需求中。

    最佳優(yōu)先搜索策略(Best First Search)是指系統(tǒng)通過(guò)對(duì)URL的分析做出評(píng)價(jià),對(duì)評(píng)價(jià)值較高的URL進(jìn)行抓取,直接拋棄評(píng)價(jià)較低的URL,也就是說(shuō)這種搜索策略只會(huì)抓取系統(tǒng)認(rèn)為有用的網(wǎng)頁(yè)。這種策略容易陷入局部最優(yōu)解,一旦某些有用的網(wǎng)頁(yè)存在于被過(guò)濾掉的URL路徑的后面節(jié)點(diǎn)中,搜索的精度就會(huì)下降。但是這種搜索策略可以過(guò)濾掉30%,~90%,的無(wú)關(guān)網(wǎng)頁(yè),故在實(shí)際應(yīng)用中結(jié)合需求會(huì)對(duì)該算法進(jìn)行改進(jìn)。

    3.2 并行抓取策略

    為了提高信息采集的效率,需要使用多臺(tái)服務(wù)器進(jìn)行并行抓取,通用的搜索引擎如百度搜索引擎,至少使用上萬(wàn)臺(tái)服務(wù)器進(jìn)行并行抓取,如何保證不同的服務(wù)器抓取的URL不同是并行抓取技術(shù)的關(guān)鍵點(diǎn)之一。通用搜索引擎通常采用哈希表或信息指紋排重法來(lái)解決重復(fù)URL的下載問(wèn)題,在這之中需要網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng)配置一個(gè)專用的模塊來(lái)對(duì)龐大的服務(wù)器群進(jìn)行信息溝通,以避免服務(wù)器之間發(fā)生沖突。而使用元搜索模型或垂直搜索模型時(shí),往往不需要考慮服務(wù)器之間的通信問(wèn)題,因?yàn)樵阉髂P秃痛怪彼阉髂P驮诤芏嗲闆r下只需要對(duì)某些搜索結(jié)果進(jìn)行抓取。例如對(duì)百度搜索引擎的結(jié)果進(jìn)行抓取時(shí),共有K臺(tái)服務(wù)器,每臺(tái)服務(wù)器的編號(hào)是Ki(i∈[1,k]),檢索結(jié)果共有M頁(yè),則每臺(tái)服務(wù)器只需要抓取第到第頁(yè)即可。在不考慮服務(wù)器之間通信情況下,理論上網(wǎng)絡(luò)爬蟲(chóng)的執(zhí)行效率會(huì)提高K倍(K為服務(wù)器數(shù)量)。

    此外,每臺(tái)服務(wù)器在系統(tǒng)內(nèi)部也需要使用多線程控制模塊進(jìn)行加速,線程的數(shù)量依照服務(wù)器硬件水平、網(wǎng)絡(luò)帶寬以及即時(shí)網(wǎng)速而定。使用多線程技術(shù)可以有效地在網(wǎng)速范圍內(nèi)大大加快爬蟲(chóng)執(zhí)行效率,但線程過(guò)多會(huì)導(dǎo)致系統(tǒng)將過(guò)多的資源分配在線程調(diào)度上,從而導(dǎo)致系統(tǒng)崩潰;而線程過(guò)少又是對(duì)系統(tǒng)資源和網(wǎng)絡(luò)資源的浪費(fèi)。

    3.3 斷點(diǎn)續(xù)傳技術(shù)

    對(duì)于網(wǎng)頁(yè)抓取技術(shù)而言,斷點(diǎn)續(xù)傳是實(shí)現(xiàn)爬蟲(chóng)軟件的必要手段之一,顧名思義,斷點(diǎn)續(xù)傳就是當(dāng)爬蟲(chóng)軟件遇到錯(cuò)誤、線路中斷或者遇到意外強(qiáng)制關(guān)閉后,下次開(kāi)啟程序依然可以從上一個(gè)斷點(diǎn)處繼續(xù)運(yùn)行,這樣很大程度上減少了用戶的煩惱。如果一個(gè)爬蟲(chóng)軟件不支持?jǐn)帱c(diǎn)續(xù)傳,那么這個(gè)爬蟲(chóng)系統(tǒng)是非常不健全和不完整的。實(shí)現(xiàn)斷點(diǎn)續(xù)傳的方法很簡(jiǎn)單,每當(dāng)程序執(zhí)行到一定程度,例如系統(tǒng)抓取了1,000條數(shù)據(jù)時(shí),系統(tǒng)就將當(dāng)前的參數(shù)保存到一個(gè)文件中,這個(gè)文件可以保存到本地也可以保存到服務(wù)器上,文件中需要寫(xiě)入本次執(zhí)行的全部必要參數(shù),如檢索的關(guān)鍵詞、網(wǎng)址、開(kāi)始檢索的頁(yè)數(shù)、當(dāng)前檢索到多少頁(yè)、檢索結(jié)果總頁(yè)數(shù)、輸出文件路徑等,每次寫(xiě)斷點(diǎn)時(shí)更新這個(gè)文件,如果程序關(guān)閉,下次執(zhí)行時(shí)就先預(yù)讀這個(gè)斷點(diǎn)文件,然后從上次的斷點(diǎn)位置重新開(kāi)始抓取。

    一般的爬蟲(chóng)軟件都設(shè)置有啟動(dòng)后自動(dòng)運(yùn)行斷點(diǎn)續(xù)傳數(shù)據(jù)的功能,并且啟動(dòng)后自動(dòng)托盤(pán)化或執(zhí)行后臺(tái)運(yùn)行程序,這樣配合斷點(diǎn)續(xù)傳功能就可以真正脫離人工干預(yù)實(shí)現(xiàn)自動(dòng)運(yùn)行了。

    4 幾種經(jīng)典算法的優(yōu)缺點(diǎn)比較(見(jiàn)表1)

    表1 布爾模型在文本表示中的樣例Tab.1 The sample of the Boolean model in text representation

    5 文本聚類評(píng)價(jià)方法

    評(píng)價(jià)文本聚類算法的標(biāo)準(zhǔn)有很多,從類型上來(lái)說(shuō)可以分為外部度量法、內(nèi)部度量法和相對(duì)度量法。外部度量法是使用有監(jiān)督的評(píng)價(jià)方法,人工事先對(duì)文檔集合進(jìn)行標(biāo)注,即有文檔集合X={x1,x2,x3…xn},已知人工標(biāo)注的結(jié)果為{{x1,x3…},{x2,x4…},{xn-1},{xn}},對(duì)使用聚類算法進(jìn)行實(shí)際聚類后得到的結(jié)果再與人工標(biāo)注的方式進(jìn)行比對(duì)來(lái)評(píng)價(jià)。內(nèi)部度量是使用無(wú)監(jiān)督的評(píng)價(jià)方法,利用聚類后的文檔集合直接對(duì)聚類結(jié)果進(jìn)行評(píng)價(jià),不需要人工干預(yù),例如通過(guò)計(jì)算每個(gè)簇的平均誤差等方法進(jìn)行評(píng)價(jià)。相對(duì)度量法是結(jié)合上述兩種方法對(duì)聚類結(jié)果進(jìn)行評(píng)價(jià)。

    聚類算法評(píng)價(jià)的指標(biāo)主要是依據(jù)簇內(nèi)相似度最大,簇間相似度最小的標(biāo)準(zhǔn)來(lái)評(píng)價(jià)以及利用人工標(biāo)注的結(jié)果作為參考。本文中主要使用主流的外部度量評(píng)價(jià)方法,下面介紹有關(guān)的幾種算法。

    5.1 基于F值的評(píng)價(jià)方法

    F-Measure[48]值采用準(zhǔn)確率和召回率的方法進(jìn)行評(píng)價(jià),把文檔的類別記作{A1,A2…An},把文檔經(jīng)過(guò)聚類后的結(jié)構(gòu)類別記作{B1,B2…Bm},那么對(duì)于每個(gè)初始類別Ai,找到一個(gè)與其具有最大公共子集的類別Bj,它們重復(fù)的序列數(shù)為K,則召回率為;準(zhǔn)確率為。如圖4所示,簇A為聚類之前進(jìn)行過(guò)人工標(biāo)注的一個(gè)類別,簇B是聚類后的一個(gè)類別,首先找到與簇B有最大交集的簇A,有,對(duì)于簇B的召回率為,準(zhǔn)確率為,整體的召回率與準(zhǔn)確率等于每個(gè)簇的平均值,即。召回率體現(xiàn)同一類別的元素被分到同一類別中的程度,準(zhǔn)確率體現(xiàn)不同類別的元素被分到不同類別的程度,F(xiàn)值是對(duì)準(zhǔn)確率和召回率的綜合評(píng)價(jià)指標(biāo),,由于準(zhǔn)確率和召回率是此消彼長(zhǎng)的關(guān)系,因此一般取β=1,表示召回率和準(zhǔn)確率的比重相同(見(jiàn)圖4)。

    圖4 準(zhǔn)確率與召回率計(jì)算示意圖Fig.4 Accuracy and recall rate calculation diagram

    5.2 基于熵的評(píng)價(jià)方法

    熵使用了內(nèi)部一致性的方法對(duì)聚類結(jié)果進(jìn)行評(píng)價(jià),Ai表示人工標(biāo)注的簇,Bj表示聚類后的簇,Cj表示與Bj存在的最大公共子集,K表示人工標(biāo)注的簇個(gè)數(shù),M表示經(jīng)過(guò)聚類算法計(jì)算得出的簇個(gè)數(shù),則熵E的計(jì)算方法為:

    5.3 Jaccard、Rand及FM系數(shù)法

    與上面的方法類似,下面使用4種聚類結(jié)果與人工標(biāo)注的不同情況來(lái)進(jìn)行評(píng)價(jià)(見(jiàn)表2)。

    表2 Jaccard、Rand及FM系數(shù)法的參數(shù)說(shuō)明Tab.2 Jaccard,Rand,and the parameters of FM coefficient method

    Jaccard系數(shù)法,又被稱為Jaccard相似性系數(shù),Jaccard系數(shù)等于樣本集交集與樣本集合集的比值:

    Rand系數(shù)法體現(xiàn)了聚類結(jié)果與人工標(biāo)注的統(tǒng)一性的程度:

    FM系數(shù)法考慮了兩種情況下正確聚類的簇所占的比重:

    6 前期基礎(chǔ)

    建設(shè)了覆蓋所有學(xué)科領(lǐng)域的科技詞庫(kù),該項(xiàng)工作為人機(jī)結(jié)合智能情報(bào)工具的設(shè)計(jì)實(shí)現(xiàn)奠定了關(guān)鍵基礎(chǔ),是大數(shù)據(jù)時(shí)代和大科學(xué)時(shí)代科技情報(bào)工作的基石?!?/p>

    [1] 夏寧霞,蘇一丹. 一種高效的K-medoids聚類算法[J]. 計(jì)算機(jī)應(yīng)用研究,2010,27(12):56-65.

    [2] 周洪翠,莊新妍. 基于向量空間模型的文本信息表示[J]. 呼倫貝爾學(xué)院學(xué)報(bào),2011,6(1):35-44.

    [3] 鄭彥寧. 我國(guó)科技情報(bào)行業(yè)創(chuàng)新發(fā)展的關(guān)鍵問(wèn)題[J].情報(bào)學(xué)報(bào),2008,27(6):15-18.

    Technical Analysis of Fast Aid System for Information Generation for Academic Subjects Based on Project Archives

    LIU Nian1, ZHANG Luji2,ZHAO Yanyan3,CHEN Mo4
    (1.Beijing Electronic Science and Technology Institute,Beijing 100070,China;2.Beijing Institute of Science and Technology Information,Beijing 100048,China;3.Datang Telecom Technology Co.,LTD.,Beijing 100094,China;4.Machinery Industry Information Institute,Beijing 100037,China)

    The concept and features of informational intelligence were discussed from the aspects of intelligence research,information source and demand for analysis.It points out that the demand for simple statistical analysis cannot meet the demand of social decision now,and it needs to find potential models from a large number of information to guide the development of the future,which involves data mining and machine learning techniques.Today,there is no unified definition of intelligent technology in the circle of information research in foreign countries,but the nature can be summed up as quantification,calculability and repeatability.The above mentioned topic was discussed.

    information mining;intelligence;algorithm

    G27

    A

    1006-8945(2016)06-0043-04

    本論文得到“北京市科技計(jì)劃項(xiàng)目”資助,項(xiàng)目名稱:數(shù)字科技檔案自動(dòng)化與利用服務(wù)系統(tǒng)設(shè)計(jì)研發(fā)(Z151100003215042)。

    2016-05-12

    猜你喜歡
    爬蟲(chóng)搜索引擎網(wǎng)頁(yè)
    利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說(shuō)
    基于Python的網(wǎng)絡(luò)爬蟲(chóng)和反爬蟲(chóng)技術(shù)研究
    基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
    電子制作(2018年10期)2018-08-04 03:24:38
    利用爬蟲(chóng)技術(shù)的Geo-Gnutel la VANET流量采集
    基于URL和網(wǎng)頁(yè)類型的網(wǎng)頁(yè)信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
    電子制作(2017年9期)2017-04-17 03:00:46
    網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用
    網(wǎng)絡(luò)搜索引擎亟待規(guī)范
    基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
    10個(gè)必知的網(wǎng)頁(yè)設(shè)計(jì)術(shù)語(yǔ)
    悠悠久久av| 久久久久久久精品吃奶| 精品国产一区二区久久| 亚洲avbb在线观看| 国产精品乱码一区二三区的特点 | 精品一区二区三区四区五区乱码| 男男h啪啪无遮挡| 在线观看www视频免费| 免费少妇av软件| 亚洲精品国产精品久久久不卡| 久久久久九九精品影院| 国产激情久久老熟女| 亚洲中文日韩欧美视频| 人人妻,人人澡人人爽秒播| 91精品三级在线观看| www.www免费av| 亚洲精品国产一区二区精华液| av电影中文网址| 日韩精品青青久久久久久| www.999成人在线观看| 中亚洲国语对白在线视频| 老司机午夜福利在线观看视频| 国产精品电影一区二区三区| 亚洲全国av大片| 亚洲成av片中文字幕在线观看| 久久精品91无色码中文字幕| 91大片在线观看| 亚洲欧美精品综合一区二区三区| 久久中文看片网| 大型av网站在线播放| 在线av久久热| 欧美乱码精品一区二区三区| 国产在线观看jvid| 性色av乱码一区二区三区2| 老司机午夜十八禁免费视频| 成人永久免费在线观看视频| 日韩 欧美 亚洲 中文字幕| 制服丝袜大香蕉在线| 亚洲欧美激情综合另类| 精品国产国语对白av| 好男人电影高清在线观看| 国产一区二区三区综合在线观看| 国产成人av教育| 黄色毛片三级朝国网站| 亚洲少妇的诱惑av| 高清黄色对白视频在线免费看| 首页视频小说图片口味搜索| 亚洲国产日韩欧美精品在线观看 | 亚洲精品粉嫩美女一区| 精品国产一区二区久久| 丝袜美足系列| 亚洲av成人不卡在线观看播放网| 丝袜美腿诱惑在线| 成熟少妇高潮喷水视频| 麻豆成人av在线观看| 精品人妻在线不人妻| 69av精品久久久久久| 色综合欧美亚洲国产小说| 不卡av一区二区三区| 亚洲成人精品中文字幕电影| 俄罗斯特黄特色一大片| 国产亚洲欧美精品永久| 黑人巨大精品欧美一区二区mp4| 日韩欧美一区二区三区在线观看| 两性夫妻黄色片| 久久影院123| 成年版毛片免费区| 亚洲第一青青草原| 99香蕉大伊视频| 国产99久久九九免费精品| 老司机靠b影院| 天堂动漫精品| x7x7x7水蜜桃| 757午夜福利合集在线观看| 搡老岳熟女国产| 狠狠狠狠99中文字幕| 精品日产1卡2卡| 成人永久免费在线观看视频| 少妇被粗大的猛进出69影院| 视频在线观看一区二区三区| 看免费av毛片| 色在线成人网| av超薄肉色丝袜交足视频| 日韩欧美在线二视频| 亚洲色图av天堂| 国产主播在线观看一区二区| 如日韩欧美国产精品一区二区三区| 精品久久久久久久久久免费视频| 黑人巨大精品欧美一区二区蜜桃| 欧美在线一区亚洲| 亚洲第一电影网av| 女人被躁到高潮嗷嗷叫费观| 免费观看人在逋| 少妇的丰满在线观看| 色婷婷久久久亚洲欧美| 黄片小视频在线播放| 久久午夜亚洲精品久久| 一本大道久久a久久精品| 丁香欧美五月| 丝袜人妻中文字幕| 热re99久久国产66热| 神马国产精品三级电影在线观看 | 夜夜躁狠狠躁天天躁| 激情视频va一区二区三区| www.999成人在线观看| 欧美日韩一级在线毛片| 欧美国产精品va在线观看不卡| 亚洲国产看品久久| 男人的好看免费观看在线视频 | 午夜成年电影在线免费观看| 国产亚洲av高清不卡| 亚洲第一青青草原| aaaaa片日本免费| 久久精品亚洲精品国产色婷小说| 少妇被粗大的猛进出69影院| 一进一出抽搐动态| 韩国av一区二区三区四区| 国产在线观看jvid| 国产精品久久视频播放| 国产成人免费无遮挡视频| 人人妻,人人澡人人爽秒播| 久久人妻熟女aⅴ| 成熟少妇高潮喷水视频| 亚洲一区二区三区色噜噜| 欧美激情极品国产一区二区三区| 99久久精品国产亚洲精品| 欧美绝顶高潮抽搐喷水| 欧美黑人精品巨大| 一区二区三区精品91| 可以在线观看毛片的网站| 亚洲国产欧美日韩在线播放| 亚洲欧美一区二区三区黑人| 制服人妻中文乱码| 大型黄色视频在线免费观看| 久久久久久久精品吃奶| 亚洲色图综合在线观看| 久久国产精品男人的天堂亚洲| 一个人观看的视频www高清免费观看 | 女人爽到高潮嗷嗷叫在线视频| 成人三级黄色视频| 青草久久国产| 国产亚洲精品一区二区www| 亚洲国产看品久久| 在线观看免费午夜福利视频| 女性被躁到高潮视频| 国产蜜桃级精品一区二区三区| 禁无遮挡网站| 成人永久免费在线观看视频| 宅男免费午夜| 国产精品美女特级片免费视频播放器 | 国产一卡二卡三卡精品| 视频在线观看一区二区三区| 午夜精品久久久久久毛片777| 97碰自拍视频| 国产私拍福利视频在线观看| 淫秽高清视频在线观看| 久久性视频一级片| 欧美国产日韩亚洲一区| 欧美日韩瑟瑟在线播放| 久久久久亚洲av毛片大全| av有码第一页| 午夜福利视频1000在线观看 | ponron亚洲| 在线免费观看的www视频| а√天堂www在线а√下载| 欧美色欧美亚洲另类二区 | 啦啦啦 在线观看视频| 后天国语完整版免费观看| 两个人看的免费小视频| 精品不卡国产一区二区三区| 国产xxxxx性猛交| 日韩视频一区二区在线观看| tocl精华| 亚洲国产中文字幕在线视频| 女人爽到高潮嗷嗷叫在线视频| 久久人人97超碰香蕉20202| 中文字幕人妻丝袜一区二区| 母亲3免费完整高清在线观看| 国产97色在线日韩免费| 丝袜美足系列| 18禁观看日本| 天堂√8在线中文| 久久久久九九精品影院| 国产精品永久免费网站| 777久久人妻少妇嫩草av网站| 国产又色又爽无遮挡免费看| av网站免费在线观看视频| 成年女人毛片免费观看观看9| 精品国产乱子伦一区二区三区| 欧美日本亚洲视频在线播放| 制服诱惑二区| 美女国产高潮福利片在线看| 久久精品人人爽人人爽视色| 日本在线视频免费播放| 国产欧美日韩一区二区三区在线| 在线十欧美十亚洲十日本专区| 国产精品98久久久久久宅男小说| 国产一区二区三区在线臀色熟女| 最近最新中文字幕大全电影3 | 麻豆成人av在线观看| 黄色视频不卡| 国内久久婷婷六月综合欲色啪| 亚洲 国产 在线| 老鸭窝网址在线观看| 国产成人免费无遮挡视频| 国产三级在线视频| 国产熟女午夜一区二区三区| 九色亚洲精品在线播放| 叶爱在线成人免费视频播放| 怎么达到女性高潮| 精品一品国产午夜福利视频| 国产97色在线日韩免费| 国产午夜福利久久久久久| 一个人免费在线观看的高清视频| 国产成人av激情在线播放| 久久国产乱子伦精品免费另类| 在线观看午夜福利视频| 亚洲自偷自拍图片 自拍| 欧美老熟妇乱子伦牲交| 很黄的视频免费| 国产精品1区2区在线观看.| 成人免费观看视频高清| 熟女少妇亚洲综合色aaa.| 少妇熟女aⅴ在线视频| 亚洲成人精品中文字幕电影| cao死你这个sao货| 欧美日韩福利视频一区二区| 怎么达到女性高潮| 麻豆成人av在线观看| 搡老岳熟女国产| 免费高清在线观看日韩| 极品人妻少妇av视频| 91在线观看av| 欧美日本亚洲视频在线播放| 日本免费a在线| 久久久久国产一级毛片高清牌| 天天一区二区日本电影三级 | 中文字幕色久视频| 天天一区二区日本电影三级 | 国产激情久久老熟女| 又紧又爽又黄一区二区| 国产免费av片在线观看野外av| 视频在线观看一区二区三区| 欧美国产日韩亚洲一区| 9热在线视频观看99| 精品人妻1区二区| 亚洲av日韩精品久久久久久密| 非洲黑人性xxxx精品又粗又长| 看片在线看免费视频| av天堂在线播放| 一个人免费在线观看的高清视频| 亚洲人成伊人成综合网2020| 韩国av一区二区三区四区| 一级a爱片免费观看的视频| av网站免费在线观看视频| 国产高清videossex| 精品少妇一区二区三区视频日本电影| 男女下面进入的视频免费午夜 | 国产黄a三级三级三级人| 欧美日韩一级在线毛片| 亚洲人成网站在线播放欧美日韩| 少妇裸体淫交视频免费看高清 | 欧美人与性动交α欧美精品济南到| 久久久久国产精品人妻aⅴ院| 啦啦啦 在线观看视频| 丰满人妻熟妇乱又伦精品不卡| 人人妻人人澡欧美一区二区 | 亚洲少妇的诱惑av| 国产成人av教育| 亚洲三区欧美一区| 一级片免费观看大全| 亚洲国产欧美网| 亚洲男人天堂网一区| 精品日产1卡2卡| 亚洲伊人色综图| 精品欧美国产一区二区三| 又黄又爽又免费观看的视频| 黄频高清免费视频| netflix在线观看网站| 十八禁网站免费在线| 欧美另类亚洲清纯唯美| 波多野结衣av一区二区av| 欧美人与性动交α欧美精品济南到| 亚洲精品一卡2卡三卡4卡5卡| 亚洲无线在线观看| 中文字幕av电影在线播放| 久久天堂一区二区三区四区| 美女扒开内裤让男人捅视频| 99国产极品粉嫩在线观看| 久久午夜亚洲精品久久| 精品一区二区三区视频在线观看免费| 国产精品久久视频播放| 99国产精品一区二区三区| 国产一区二区激情短视频| 精品第一国产精品| 丰满的人妻完整版| 欧洲精品卡2卡3卡4卡5卡区| 久久狼人影院| 91麻豆av在线| 午夜影院日韩av| 黄色片一级片一级黄色片| 国产亚洲av高清不卡| av视频在线观看入口| 欧美日本视频| or卡值多少钱| 在线国产一区二区在线| 国产亚洲欧美在线一区二区| 国产精品电影一区二区三区| 亚洲熟妇熟女久久| 精品国内亚洲2022精品成人| 免费高清视频大片| 国产成人av激情在线播放| 色综合亚洲欧美另类图片| 色av中文字幕| 精品一品国产午夜福利视频| 欧美中文综合在线视频| 中文字幕人成人乱码亚洲影| 日韩一卡2卡3卡4卡2021年| 黄色 视频免费看| 亚洲人成电影观看| 亚洲成人免费电影在线观看| 亚洲精华国产精华精| 岛国在线观看网站| 日日干狠狠操夜夜爽| 欧美乱码精品一区二区三区| 视频区欧美日本亚洲| 成人18禁高潮啪啪吃奶动态图| 韩国精品一区二区三区| 国产成人精品无人区| 一级毛片女人18水好多| 欧美+亚洲+日韩+国产| 日本免费a在线| 午夜成年电影在线免费观看| 久久久久久免费高清国产稀缺| 久久精品人人爽人人爽视色| 免费久久久久久久精品成人欧美视频| 免费看美女性在线毛片视频| 精品午夜福利视频在线观看一区| 欧美成人午夜精品| 亚洲av日韩精品久久久久久密| 熟女少妇亚洲综合色aaa.| 12—13女人毛片做爰片一| 日本a在线网址| xxx96com| 日本五十路高清| av网站免费在线观看视频| 最近最新中文字幕大全电影3 | 少妇熟女aⅴ在线视频| 天堂动漫精品| 亚洲成a人片在线一区二区| 变态另类成人亚洲欧美熟女 | 黄色毛片三级朝国网站| 国产高清激情床上av| 亚洲人成电影免费在线| 一本大道久久a久久精品| 人人妻人人爽人人添夜夜欢视频| 免费在线观看亚洲国产| 亚洲成人免费电影在线观看| 日本免费a在线| 一级毛片精品| 在线视频色国产色| 大香蕉久久成人网| 成人精品一区二区免费| 国产又色又爽无遮挡免费看| tocl精华| 搞女人的毛片| 日本精品一区二区三区蜜桃| 十分钟在线观看高清视频www| 亚洲国产高清在线一区二区三 | 黄色女人牲交| 性少妇av在线| 国产亚洲av高清不卡| av在线天堂中文字幕| 久久人人爽av亚洲精品天堂| 亚洲国产毛片av蜜桃av| 麻豆国产av国片精品| 亚洲最大成人中文| 亚洲熟妇熟女久久| 国产av一区在线观看免费| 色在线成人网| 给我免费播放毛片高清在线观看| 成人永久免费在线观看视频| 亚洲,欧美精品.| 久久人妻熟女aⅴ| 亚洲精华国产精华精| 99久久99久久久精品蜜桃| 岛国视频午夜一区免费看| 自拍欧美九色日韩亚洲蝌蚪91| 成人特级黄色片久久久久久久| 国产成人精品久久二区二区91| 国产精品野战在线观看| 久久精品国产清高在天天线| 97超级碰碰碰精品色视频在线观看| 天天一区二区日本电影三级 | 日韩一卡2卡3卡4卡2021年| 国产精品一区二区精品视频观看| 91麻豆精品激情在线观看国产| 三级毛片av免费| 国产成人精品久久二区二区免费| 国产精品久久久久久精品电影 | 三级毛片av免费| 国产精品1区2区在线观看.| 极品教师在线免费播放| 亚洲欧美日韩高清在线视频| 亚洲第一av免费看| 热99re8久久精品国产| 亚洲成人免费电影在线观看| 搡老妇女老女人老熟妇| 免费一级毛片在线播放高清视频 | 亚洲国产精品久久男人天堂| 国产男靠女视频免费网站| 亚洲色图 男人天堂 中文字幕| 9热在线视频观看99| 成年女人毛片免费观看观看9| 女人高潮潮喷娇喘18禁视频| 色综合欧美亚洲国产小说| 一区福利在线观看| 成人18禁高潮啪啪吃奶动态图| 中文字幕人妻丝袜一区二区| 热re99久久国产66热| 国产精品av久久久久免费| 99国产精品一区二区三区| 欧美在线一区亚洲| 亚洲电影在线观看av| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲中文字幕日韩| 人成视频在线观看免费观看| 国产伦一二天堂av在线观看| 亚洲精品国产精品久久久不卡| 久久久久精品国产欧美久久久| av中文乱码字幕在线| 制服诱惑二区| 少妇 在线观看| 国产精品精品国产色婷婷| 黄色a级毛片大全视频| 日本 av在线| 99久久综合精品五月天人人| 日本五十路高清| 可以在线观看的亚洲视频| 一区二区三区激情视频| 久久久久久久久久久久大奶| 无限看片的www在线观看| videosex国产| 人妻丰满熟妇av一区二区三区| 日韩欧美一区视频在线观看| 97超级碰碰碰精品色视频在线观看| 女人被躁到高潮嗷嗷叫费观| 久久九九热精品免费| 国语自产精品视频在线第100页| 国产伦人伦偷精品视频| 热re99久久国产66热| 天堂√8在线中文| xxx96com| 他把我摸到了高潮在线观看| 欧美一级毛片孕妇| 亚洲少妇的诱惑av| 国产精品美女特级片免费视频播放器 | 咕卡用的链子| 99在线人妻在线中文字幕| 成人18禁高潮啪啪吃奶动态图| 黄色女人牲交| 亚洲国产中文字幕在线视频| 啦啦啦免费观看视频1| 亚洲一区高清亚洲精品| 久久人人97超碰香蕉20202| 国产欧美日韩一区二区精品| 一区二区三区激情视频| 午夜福利视频1000在线观看 | 人人妻人人澡人人看| 亚洲成人精品中文字幕电影| 伦理电影免费视频| 美女高潮到喷水免费观看| 精品久久久精品久久久| 一级片免费观看大全| 999精品在线视频| 极品人妻少妇av视频| 国产精品香港三级国产av潘金莲| 国产成人av激情在线播放| 亚洲狠狠婷婷综合久久图片| 免费无遮挡裸体视频| 欧美乱妇无乱码| 精品人妻1区二区| 国产激情久久老熟女| 亚洲成av片中文字幕在线观看| 热re99久久国产66热| 69av精品久久久久久| 国产一级毛片七仙女欲春2 | 国产免费男女视频| a在线观看视频网站| 日韩精品青青久久久久久| 国产成人欧美在线观看| 婷婷六月久久综合丁香| 久久青草综合色| 俄罗斯特黄特色一大片| 精品少妇一区二区三区视频日本电影| 国产国语露脸激情在线看| 国产xxxxx性猛交| 国产在线精品亚洲第一网站| 亚洲人成77777在线视频| 精品福利观看| 日韩有码中文字幕| 国产真人三级小视频在线观看| 欧美久久黑人一区二区| 亚洲九九香蕉| 亚洲熟女毛片儿| 99久久国产精品久久久| 久久精品aⅴ一区二区三区四区| 免费在线观看日本一区| 51午夜福利影视在线观看| 久久精品91蜜桃| e午夜精品久久久久久久| 丰满的人妻完整版| 亚洲国产欧美网| a级毛片在线看网站| 女人被躁到高潮嗷嗷叫费观| 成人三级做爰电影| 亚洲熟妇熟女久久| 又黄又爽又免费观看的视频| 久久香蕉激情| 久久狼人影院| 中文字幕av电影在线播放| 男女下面插进去视频免费观看| 老汉色∧v一级毛片| 国产成人欧美在线观看| 男女床上黄色一级片免费看| 欧美乱色亚洲激情| 两性夫妻黄色片| 波多野结衣av一区二区av| 精品第一国产精品| 国产亚洲精品久久久久5区| 亚洲熟女毛片儿| 操美女的视频在线观看| 国产欧美日韩一区二区三| 一区二区三区国产精品乱码| 亚洲精华国产精华精| 欧美+亚洲+日韩+国产| 可以免费在线观看a视频的电影网站| 午夜福利,免费看| 国产成+人综合+亚洲专区| 中国美女看黄片| 婷婷精品国产亚洲av在线| 国产av一区在线观看免费| 露出奶头的视频| 亚洲五月色婷婷综合| 日本撒尿小便嘘嘘汇集6| 国产私拍福利视频在线观看| 女人爽到高潮嗷嗷叫在线视频| 亚洲人成电影观看| 亚洲欧美日韩无卡精品| 精品国产乱子伦一区二区三区| 亚洲欧美一区二区三区黑人| 12—13女人毛片做爰片一| 熟女少妇亚洲综合色aaa.| 久久久久久国产a免费观看| 美女国产高潮福利片在线看| bbb黄色大片| 国产精品久久久人人做人人爽| 99久久99久久久精品蜜桃| 国产成人影院久久av| 无遮挡黄片免费观看| 午夜免费鲁丝| 欧美在线一区亚洲| www.自偷自拍.com| www.熟女人妻精品国产| 黑丝袜美女国产一区| 夜夜看夜夜爽夜夜摸| 国产精品亚洲av一区麻豆| 99精品欧美一区二区三区四区| 两性午夜刺激爽爽歪歪视频在线观看 | 午夜福利一区二区在线看| 男男h啪啪无遮挡| www.www免费av| 久久久国产欧美日韩av| 中文字幕久久专区| 母亲3免费完整高清在线观看| 此物有八面人人有两片| 成人18禁高潮啪啪吃奶动态图| 欧美日韩乱码在线| 免费在线观看影片大全网站| 国产成人啪精品午夜网站| or卡值多少钱| 国产午夜福利久久久久久| 人妻久久中文字幕网| 视频区欧美日本亚洲| 国产视频一区二区在线看| www国产在线视频色| 19禁男女啪啪无遮挡网站| 变态另类成人亚洲欧美熟女 | 午夜免费观看网址| 国产免费男女视频| 99精品久久久久人妻精品| 一区福利在线观看| 国产亚洲精品av在线| 如日韩欧美国产精品一区二区三区| 一级a爱片免费观看的视频| 国产1区2区3区精品| www.www免费av| 大型黄色视频在线免费观看| 大码成人一级视频| 黄片小视频在线播放| 最近最新中文字幕大全电影3 | 亚洲一区高清亚洲精品| 男女下面进入的视频免费午夜 | 黄色片一级片一级黄色片| 一a级毛片在线观看| 我的亚洲天堂| 久久人妻熟女aⅴ| 精品国产亚洲在线| 成人国语在线视频| 午夜免费观看网址| netflix在线观看网站| 免费看十八禁软件| 国产精品影院久久| 在线播放国产精品三级| 亚洲av日韩精品久久久久久密|