胡玲 李鵬 趙德平
摘要:隨著Internet深入發(fā)展,Web產(chǎn)生的信息迅速增長(zhǎng),使用專業(yè)搜索引擎進(jìn)行信息查詢已經(jīng)成為搜索引擎的發(fā)展趨勢(shì)。當(dāng)前,鋼鐵行業(yè)作為我國(guó)傳統(tǒng)的制造業(yè)信息化程度發(fā)展也十分迅速,人們對(duì)鋼鐵行業(yè)的信息需求也越來(lái)越多,但是目前還沒(méi)有專門針對(duì)鋼鐵行業(yè)信息的專業(yè)的搜索引擎。本文根據(jù)現(xiàn)實(shí)需求提出了針對(duì)鋼鐵行業(yè)信息的專業(yè)搜索引擎設(shè)計(jì)方法。重點(diǎn)論述了專業(yè)搜索引擎如何進(jìn)行信息采集,并提出了一種符合實(shí)際的針對(duì)鋼鐵行業(yè)信息的專業(yè)搜索引擎的設(shè)計(jì)方案。
關(guān)鍵詞:專業(yè)搜索;搜索引擎;鋼鐵行業(yè);信息;
中圖分類號(hào):TP311.52 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào):1009-3044(2018)28-0224-03
當(dāng)前我國(guó)鋼鐵企業(yè)和鋼鐵交易企業(yè)以及相關(guān)的第三方構(gòu)建起來(lái)的鋼鐵信息平臺(tái)已經(jīng)達(dá)到300多家,國(guó)內(nèi)的鋼鐵信息平臺(tái)注冊(cè)用戶達(dá)到了64.8萬(wàn),鋼鐵電子商務(wù)鋼材銷售量占重點(diǎn)企業(yè)總銷售量的22.3%,占重點(diǎn)企業(yè)其余銷售量(鋼材直供量除外)的比例為35.1%[1-4]。但是這些建立起來(lái)的鋼鐵行業(yè)的網(wǎng)站和平臺(tái)大多數(shù)都沒(méi)有建立起來(lái)一條能夠進(jìn)行綜合信息的有效查詢。同時(shí)通過(guò)通用的搜索引擎進(jìn)行信息查詢返回的數(shù)據(jù)信息非常龐大,有許多的無(wú)用和不相關(guān)的信息。想要獲取鋼鐵行業(yè)的信息仍然非常困難。
隨著互聯(lián)網(wǎng)信息的快速增長(zhǎng)以及信息的多方面發(fā)展,通用的搜索引擎需要收集的網(wǎng)頁(yè)數(shù)量越來(lái)越大。這種情況使得通用搜索引擎的工作量急劇增大,而且越來(lái)越不能滿足專業(yè)用戶的查詢需求。對(duì)于專業(yè)用戶來(lái)說(shuō),他們迫切需要一個(gè)能夠?qū)?shù)據(jù)進(jìn)行細(xì)致分類、精確及時(shí)、全面更新的面向?qū)I(yè)的搜索引擎,來(lái)獲得相關(guān)專業(yè)的資源信息。專業(yè)搜索引擎面向某個(gè)特定專業(yè)領(lǐng)域,這樣就能實(shí)現(xiàn)對(duì)該領(lǐng)域信息的全面收集和及時(shí)更新。通過(guò)建立面向鋼鐵行業(yè)信息搜索引擎可以為廣大的鋼鐵商業(yè)從業(yè)者、科研人員、管理部門和鋼鐵行業(yè)市場(chǎng)提供準(zhǔn)確快速的鋼鐵商業(yè)信息,必將能進(jìn)一步推動(dòng)我國(guó)鋼鐵行業(yè)的信息化和互聯(lián)網(wǎng)化,同時(shí)構(gòu)建鋼鐵行業(yè)的電子商務(wù)市場(chǎng)。當(dāng)前的搜索引擎的相關(guān)技術(shù)已發(fā)展到了第四代,但是當(dāng)前的搜索引擎關(guān)鍵技術(shù)大多是面向通用搜索引擎的,專業(yè)信息的檢索還沒(méi)有非常好的解決方法。本文在論述專業(yè)搜索引擎的基礎(chǔ)上,著重討論了專業(yè)信息的收集策略,提出了一個(gè)比較適合鋼鐵行業(yè)的專業(yè)搜索引擎設(shè)計(jì)方案。
1鋼鐵行業(yè)信息的內(nèi)容及特點(diǎn)
1.1 信息內(nèi)容
鋼鐵行業(yè)信息內(nèi)容包括了各個(gè)地區(qū)的鋼鐵企業(yè)的信息、產(chǎn)品信息、生產(chǎn)產(chǎn)量和銷售信息等概況,同時(shí)還包括上游的一些鋼鐵礦石是相關(guān)信息,同時(shí)也還包括一些法律法規(guī)等以文件形式出現(xiàn)的內(nèi)容,信息的主要表現(xiàn)形式有文本,表格和文獻(xiàn)等不同類型,也是所有與鋼鐵行業(yè)有關(guān)的綜合體。
1.2 鋼鐵行業(yè)信息的特點(diǎn)
1)內(nèi)容復(fù)雜,范圍廣闊。鋼鐵行業(yè)信息涉及方方面面,地理范圍廣闊,內(nèi)容形式多種多樣,格式不統(tǒng)一,極其復(fù)雜。
2)新技術(shù)新產(chǎn)品多,更新快。隨著鋼鐵行業(yè)的新技術(shù)的快速投入使用,產(chǎn)生很多新的信息。造成網(wǎng)絡(luò)信息更新嚴(yán)重滯后,更新不及時(shí)等問(wèn)題。
3)利用廣泛、能重復(fù)應(yīng)用。各種信息資源不僅可以給各級(jí)政府提供信息支持,也能夠?yàn)橄嚓P(guān)的鋼鐵企業(yè)和礦產(chǎn)企業(yè)提供信息服務(wù),為本領(lǐng)域的專業(yè)學(xué)者等研究人員提供最新的行業(yè)動(dòng)態(tài),也能夠給廣大的普通網(wǎng)絡(luò)用戶提供更好的信息參考。
4)信息收集困難、獲取代價(jià)高。鋼鐵行業(yè)的信息主要以人工或者半人工的方式進(jìn)行收集,因此速度較慢,更新也慢,同時(shí)需要投入的人力物力比較多,這樣的成本高、代價(jià)大。
2 專業(yè)搜索引擎的發(fā)展概況
傳統(tǒng)的搜索引擎是互聯(lián)網(wǎng)上信息查詢重要工具。當(dāng)前互聯(lián)網(wǎng)的信息量快速增長(zhǎng),同時(shí)信息向多維度發(fā)展,人們使用搜索引擎開(kāi)始從怎樣查詢到需要的信息,轉(zhuǎn)換成怎樣才能快速、準(zhǔn)確地找到有用信息上來(lái)。傳統(tǒng)的搜索引擎已經(jīng)很難滿足專業(yè)用戶的需求,主要體現(xiàn)在如下兩個(gè)方面:
1)由于社會(huì)分工越來(lái)越細(xì),不同專業(yè)領(lǐng)域的信息也越來(lái)越具體,信息的維度也越來(lái)越高?;ヂ?lián)網(wǎng)用戶在查詢信息時(shí),通常需要得到的是一個(gè)專業(yè)領(lǐng)域內(nèi)的信息,而不是把所有不相關(guān)領(lǐng)域信息一起呈現(xiàn)給用戶,讓用戶自己去分辨信息的領(lǐng)域。
2)傳統(tǒng)搜索引擎是無(wú)目的性地全互聯(lián)網(wǎng)的去收集信息,這樣對(duì)系統(tǒng)的軟件擴(kuò)張性和硬件的穩(wěn)定性都是巨大的考驗(yàn)。
面對(duì)這樣的情況,專業(yè)搜索引擎就應(yīng)運(yùn)而生并成為發(fā)展的新趨勢(shì),同時(shí)也可以叫作主題搜索引擎、專用搜索引擎或者垂直搜索引擎。專用搜索引擎只是針對(duì)某個(gè)領(lǐng)域進(jìn)行信息采集,這樣就可以加快索引的更新周期,通常1~2天能更新全部信息,甚至根據(jù)有效的算法可以在幾個(gè)小時(shí)內(nèi)完成重要信息的快速更新。
當(dāng)前專業(yè)搜索引擎正處于蓬勃發(fā)展的時(shí)期,已經(jīng)有推出專業(yè)的搜索引擎平臺(tái)。Google公司的學(xué)術(shù)搜索,NEC公司的CiteSeer等都是使用比較廣泛的科學(xué)論文搜索平臺(tái)。國(guó)內(nèi)的專業(yè)搜索引擎也有建設(shè),賽迪公司的“IT羅盤”、中搜公司也推出了行業(yè)搜索平臺(tái)和房地產(chǎn)行業(yè)的“房老大”等。
但是目前面對(duì)鋼鐵行業(yè)的上下游產(chǎn)業(yè)和全領(lǐng)域的信息搜索引擎還沒(méi)有建立;因此急需建立起這樣一個(gè)專業(yè)搜索引擎平臺(tái)來(lái)實(shí)現(xiàn)對(duì)鋼鐵行業(yè)的信息全面處理,提升整個(gè)行業(yè)的信息化水平,融入互聯(lián)網(wǎng)發(fā)展浪潮中,提升行業(yè)的整體競(jìng)爭(zhēng)力。
3鋼鐵行業(yè)專業(yè)搜索引擎的設(shè)計(jì)
鋼鐵行業(yè)專業(yè)搜索引擎應(yīng)該提供與鋼鐵行業(yè)相關(guān)的信息而不是收集所有互聯(lián)網(wǎng)的網(wǎng)頁(yè)信息,因此需要制定與傳統(tǒng)搜索引擎有區(qū)別的信息采集技術(shù)才能滿足用戶的需求。在系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)的時(shí)候,主要考慮的就是專業(yè)信息采集方法,這個(gè)是專業(yè)搜索引擎和傳統(tǒng)搜索引擎最重要的區(qū)別[5]。專業(yè)搜索引擎的信息采集是通過(guò)專業(yè)的智能爬蟲(ProfessionalRobotCrawler)來(lái)完成,要完成這個(gè)工作也需要多種的輔助算法。本文介紹鋼鐵行業(yè)專業(yè)搜索引擎的總體設(shè)計(jì)方案,其中重點(diǎn)說(shuō)明ProfessionalRobotCrawler的實(shí)現(xiàn)。在鋼鐵行業(yè)的專業(yè)搜索引擎中需要采用的是特征集首頁(yè)關(guān)聯(lián)、鏈接長(zhǎng)度比較和預(yù)測(cè)頁(yè)面內(nèi)容等技術(shù),實(shí)現(xiàn)對(duì)鋼鐵行業(yè)的專業(yè)信息采集。在網(wǎng)頁(yè)內(nèi)容信息提取方面,本文提出了鋼鐵行業(yè)專業(yè)詞典用于對(duì)行業(yè)特征信息的提取,同時(shí)還并提出一個(gè)基于網(wǎng)頁(yè)架構(gòu)的簡(jiǎn)潔高效的計(jì)算權(quán)值的方法。
3.1 系統(tǒng)架構(gòu)
同傳統(tǒng)搜索引擎一樣,專業(yè)搜索引擎也是四部分組成的:信息收集模塊(Robot, Crawler)、索引模塊( Indexer)、檢索模塊(Retriever)和用戶接口模塊((Query)[6]。信息收集模塊負(fù)責(zé)從互聯(lián)網(wǎng)上收集網(wǎng)頁(yè),對(duì)所有抓取的網(wǎng)頁(yè)進(jìn)行判斷篩選并進(jìn)行標(biāo)記;索引模塊是從收集到的信息中抽取出索引項(xiàng),用于表示文檔以及生成文檔庫(kù)的索引表;檢索模塊的功能是根據(jù)用戶的查詢?cè)谒饕龓?kù)中快速檢索文檔,進(jìn)行相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果排序,并能按用戶的查詢需求合理反饋信息;用戶接口模塊是提供用戶查詢的界面,并根據(jù)用戶的檢索關(guān)鍵詞,從信息庫(kù)中檢索出相關(guān)信息返回給用戶[7-8]。本文提出的鋼鐵行業(yè)的專業(yè)搜索引擎總體架構(gòu)如圖1所示。
3. 2 關(guān)鍵技術(shù)
1)專業(yè)信息抓取技術(shù)
特征集首頁(yè)關(guān)聯(lián)算法可以使用是因?yàn)榻^大部分網(wǎng)站中的首個(gè)網(wǎng)頁(yè)基本都包括了該網(wǎng)站的大部分內(nèi)容,是網(wǎng)站的一個(gè)索引,對(duì)于大型的互聯(lián)網(wǎng)網(wǎng)站更是如此。
專業(yè)的信息抓取技術(shù)就是首先構(gòu)建出鋼鐵行業(yè)的專業(yè)字典。在需要訪問(wèn)一個(gè)全新站點(diǎn)的時(shí)候,對(duì)該站點(diǎn)首頁(yè)用鋼鐵行業(yè)專業(yè)字典的專業(yè)詞進(jìn)行檢索匹配。如果首頁(yè)中沒(méi)有相關(guān)的匹配詞,就說(shuō)明該網(wǎng)站不是鋼鐵行業(yè)的有關(guān)站點(diǎn)。系統(tǒng)就把該網(wǎng)站網(wǎng)址列入ProfessionalRobotCrawler禁止訪問(wèn)的URL網(wǎng)址列表中,如果下次再訪問(wèn)到該站點(diǎn)的網(wǎng)址就直接拋棄不再進(jìn)行訪問(wèn)抓取。因?yàn)樘卣骷氖醉?yè)關(guān)聯(lián)方法能夠把非鋼鐵行業(yè)領(lǐng)域的網(wǎng)頁(yè)直接排除在訪問(wèn)范圍外,極大地提高了ProfessionalRobotCrawler的網(wǎng)頁(yè)抓取速度和準(zhǔn)確率。
2)預(yù)測(cè)頁(yè)面內(nèi)容技術(shù)
ProfessionalRobotCrawler對(duì)一個(gè)頁(yè)面進(jìn)行下載的時(shí)候,不是先把整個(gè)頁(yè)面都下載下來(lái),而是先把網(wǎng)頁(yè)中的HTML中的HRAD部分下載下來(lái),返回出網(wǎng)頁(yè)頭部信息,通過(guò)該信息進(jìn)行分析做出下列判斷:1)該網(wǎng)頁(yè)是否是與鋼鐵行業(yè)相關(guān)的;2)網(wǎng)頁(yè)的最近的更新時(shí)間。如果網(wǎng)頁(yè)和鋼鐵行業(yè)沒(méi)有關(guān)系,就不處理拋棄,進(jìn)入到下一個(gè)網(wǎng)址繼續(xù)處理;如果網(wǎng)頁(yè)上次下載以后到現(xiàn)在為止沒(méi)有進(jìn)行更新,也不需要再進(jìn)行下載。這樣系統(tǒng)就只會(huì)收集到與鋼鐵行業(yè)相關(guān)的同時(shí)也是上一次下載以后沒(méi)有更新的網(wǎng)頁(yè)來(lái)建立起索引。
3)Bloom過(guò)濾器去重
ProfessionalRobotCrawler執(zhí)行過(guò)程中,每次抓取到的一個(gè)鏈接都要判別它的重復(fù)性,當(dāng)這個(gè)鏈接不是重復(fù),進(jìn)行下一步的解析操作,如果是重復(fù),就丟棄這個(gè)鏈接,這樣就能夠減少重復(fù)的解析操作,加快系統(tǒng)的處理速度。本文就是使用Bloom過(guò)濾器對(duì)相關(guān)的鏈接進(jìn)行去重操作。目前國(guó)內(nèi)外也有許多研究者人員把這項(xiàng)技術(shù)應(yīng)用到網(wǎng)頁(yè)去重中[9-12]。Bloom過(guò)濾器是由Bloom在1970年提出的一種多Hash函數(shù)映射的快速查找算法,通常應(yīng)用在一些需要快速判斷某個(gè)元素是否屬于集合,這個(gè)算法有較好的時(shí)間和空間效率。該算法的描述如下:假設(shè)使用三個(gè)Hash函數(shù)對(duì)每個(gè)元素進(jìn)行映射,這樣每個(gè)元素對(duì)應(yīng)HashTable中的三個(gè)位置,
如果要查找[W]是否在HashTable中則仍舊利用三個(gè)哈希函數(shù)對(duì)其進(jìn)行映射,當(dāng)且僅當(dāng)三個(gè)哈希函數(shù)映射的位置的標(biāo)記都為1的時(shí)候,才表明[W]存在于集合中;但是由于HashTable中的每一個(gè)位由所有映射元素共享,[W]的三個(gè)映射位置可能分別被其他元素標(biāo)記[13],具體過(guò)程如圖2所示。Bloom過(guò)濾器算法實(shí)現(xiàn)有許多開(kāi)源代碼,本文參考部分開(kāi)源代碼利用Java語(yǔ)言實(shí)現(xiàn)。當(dāng)然Bloom過(guò)濾器也存在一些缺點(diǎn),比如具有一定的誤判概率和刪除困難。不過(guò)在處理海量的網(wǎng)頁(yè)抓取過(guò)程,這樣的誤判概率是完全在接受范圍之內(nèi)。
4)專業(yè)特征提取技術(shù)
目前搜索引擎技術(shù)和文本挖掘技術(shù)都是按照首先把需要處理的文本進(jìn)行特征化,就使用能夠表達(dá)文本基本含義的文本特征集合或者向量來(lái)表示原來(lái)文本的意思。而特征提取技術(shù)就是使用向量空間模型處理信息查詢的關(guān)鍵技術(shù)。
本文提出的系統(tǒng)是為查詢鋼鐵行業(yè)的專業(yè)信息進(jìn)行設(shè)計(jì)的,系統(tǒng)處理的目標(biāo)就是一個(gè)專業(yè)領(lǐng)域的技術(shù)文檔,網(wǎng)頁(yè)內(nèi)容中的特征項(xiàng)就是鋼鐵行業(yè)的專業(yè)詞語(yǔ),在進(jìn)行特征提取的時(shí)候就不需要對(duì)普通詞語(yǔ)進(jìn)行分詞和詞頻統(tǒng)計(jì)。因此為了能夠顯著提供系統(tǒng)運(yùn)行效率和分詞準(zhǔn)確性,本系統(tǒng)就不再使用通用大型分詞算法對(duì)詞語(yǔ)進(jìn)行分詞處理,而提出了專業(yè)詞典的概念來(lái)處理。系統(tǒng)針對(duì)專業(yè)搜索引擎平臺(tái)而構(gòu)建出鋼鐵行業(yè)領(lǐng)域的專業(yè)詞典,就可以利用較少的專業(yè)詞匯全面地覆蓋鋼鐵行業(yè)信息,這樣詞匯量就會(huì)大量減少,可以顯著降低算法的時(shí)間和空間復(fù)雜度;系統(tǒng)在進(jìn)行特征提取時(shí),只會(huì)去匹配專業(yè)字典中有的詞匯,這樣就會(huì)大大降低向量空間的維度,從而能夠在保證準(zhǔn)確提取特征值的情況下大幅度提高系統(tǒng)的整體運(yùn)行效率。
本文采取兩個(gè)方法來(lái)進(jìn)行專業(yè)詞典的更新:一個(gè)是根據(jù)鋼鐵行業(yè)的專家或者系統(tǒng)管理員不定期將鋼鐵行業(yè)的中出現(xiàn)的新詞語(yǔ)加入專業(yè)詞典中;二是建立一個(gè)全新的詞典庫(kù),每次遇到一個(gè)新的詞語(yǔ)如果不在詞典庫(kù)中,就將這個(gè)詞收錄到新詞典庫(kù)中,同時(shí)記錄日期和賦予相應(yīng)權(quán)值,在一定的時(shí)間范圍內(nèi)如果一個(gè)新詞的權(quán)值達(dá)到了設(shè)定的閾值,就把這個(gè)詞加入專業(yè)詞典中,如果在設(shè)定的時(shí)間范圍內(nèi)權(quán)值沒(méi)有任何改變或者變動(dòng)很?。](méi)有達(dá)到預(yù)定的閾值),就把這個(gè)詞從新詞庫(kù)中刪除掉,這樣就達(dá)到了更新專業(yè)詞典的目的。
4系統(tǒng)實(shí)現(xiàn)及結(jié)果分析
1)系統(tǒng)實(shí)現(xiàn)
本文系統(tǒng)算法使用Java 實(shí)現(xiàn),版本為jdk1.8.0,操作系統(tǒng)為Windows 10 64位專業(yè)版,集成開(kāi)發(fā)環(huán)境為MyEclipse 2016。系統(tǒng)實(shí)現(xiàn)主要包和類如圖3所示。其中,頂層的Crawler、Indexer、Retriever、Query分別用于專業(yè)信息抓取和提取、建立倒排索引、建立檢索和用戶查詢等核心功能。第二層次的ParaNounRcg用于進(jìn)行專業(yè)詞匯識(shí)別,ResultOps用于對(duì)專業(yè)詞典識(shí)別結(jié)果進(jìn)行進(jìn)一步的分析處理,AnsjOps用于導(dǎo)入和更新與鋼鐵行業(yè)相關(guān)自定義詞典,這樣就可以顯著提高專業(yè)詞匯的識(shí)別率。
2)結(jié)果分析
由于目前沒(méi)有專門針對(duì)鋼鐵行業(yè)的搜索引擎,其他行業(yè)的專業(yè)搜索引擎也無(wú)法提供對(duì)鋼鐵行業(yè)信息搜索結(jié)果的驗(yàn)證。因此,本文系統(tǒng)選擇與常見(jiàn)的中文綜合搜索引擎進(jìn)行測(cè)試比較。
本文系統(tǒng)的專業(yè)搜索引擎是配備了鋼鐵行業(yè)的專業(yè)字典,在查全率方面具有顯著的提高。在隨機(jī)選擇1000個(gè)鋼鐵行業(yè)的關(guān)鍵詞搜索的情況下,與Google、百度等中文搜索引擎檢索結(jié)果的數(shù)量相比,平均高出約23.32%左右。測(cè)試結(jié)果如圖4所示。
本文系統(tǒng)利用Ajax技術(shù)能夠分析用戶行為,進(jìn)而掌握用戶的搜索意圖,自動(dòng)進(jìn)行鋼鐵行業(yè)專業(yè)詞匯的匹配,同時(shí)利用Cookie 和 Session 技術(shù)對(duì)用戶進(jìn)行標(biāo)識(shí)并存放歷史搜索記錄,最終達(dá)到快速搜索匹配的效果。通過(guò)對(duì)1000個(gè)鋼鐵行業(yè)的隨機(jī)關(guān)鍵詞進(jìn)行搜索,分別以搜索結(jié)果前15、30為例,能找到目標(biāo)信息占搜索次數(shù)的比例為評(píng)價(jià)標(biāo)準(zhǔn),本文系統(tǒng)的查準(zhǔn)率明顯優(yōu)于其他傳統(tǒng)搜索18.72%左右。測(cè)試結(jié)果如圖5所示。
因此,經(jīng)過(guò)測(cè)試比較結(jié)果顯示,本文系統(tǒng)在查全率和查準(zhǔn)率等方面超過(guò)了傳統(tǒng)的綜合搜索引擎平均水平,在分類準(zhǔn)確率及查全率方面明顯優(yōu)于傳統(tǒng)綜合搜索引擎。
5 結(jié)束語(yǔ)
通過(guò)提升企業(yè)信息化水平,走信息化道路是我國(guó)鋼鐵行業(yè)的必然選擇。本文利用專業(yè)搜索引擎的信息收集方案,通過(guò)使用專業(yè)信息抓取、預(yù)測(cè)頁(yè)面內(nèi)容、Bloom過(guò)濾器去重和專業(yè)特征提取等關(guān)鍵技術(shù)結(jié)合起來(lái),設(shè)計(jì)出了一個(gè)面向鋼鐵行業(yè)的專業(yè)搜索引擎,通過(guò)系統(tǒng)的實(shí)驗(yàn)和測(cè)試,本文系統(tǒng)搜索結(jié)果明顯優(yōu)于傳統(tǒng)的綜合搜索引擎。下一步還需要完成的工作主要有:一是建立面向鋼鐵行業(yè)的圖片、音頻和視頻的信息搜索。二是對(duì)
多個(gè)主題詞的專用搜索引擎的實(shí)現(xiàn)。當(dāng)然,本文還是存在一定局限性,一些算法是通過(guò)開(kāi)源代碼實(shí)現(xiàn),還有許多工作要在后續(xù)工作陸續(xù)展開(kāi)。
參考文獻(xiàn):
[1] 袁久柱.鋼鐵行業(yè)信息化建設(shè)現(xiàn)狀及前景展望[J].河北冶金,2017(07).
[2] 漆永新.鋼鐵信息化現(xiàn)狀及發(fā)展趨勢(shì)分析[J].中國(guó)制造業(yè)信息化.2011(16).
[3] 謝世誠(chéng).鋼鐵行業(yè)信息化現(xiàn)狀及發(fā)展趨勢(shì)[J].中國(guó)信息界制造,2011(1).
[4] 閆祥嶺.“互聯(lián)網(wǎng)+鋼鐵”成為中國(guó)鋼鐵產(chǎn)業(yè)發(fā)展新趨勢(shì).建筑時(shí)報(bào),2015年12月21日.
[5] 陳俊源,北大宏博.SQL SERVER 2000中文版建置與管理手冊(cè)[M].北京:.北京大學(xué)出版社, 2001.
[6] GUO A,YANG T.Research and improvement of featurewords weight based on TFIDF algorithm[C] IEEE.Pro-ceedings of IEEE Information Technology,Networking,Electronic and Automation Control Conference. New York:IEEE Pubhcafions,2016:415-419.
【通聯(lián)編輯:光文玲】