陳秀麗
電子商務(wù)檔案是經(jīng)濟(jì)主體在各種電子商務(wù)活動(dòng)中,所形成的原始記錄,具有一定的保存價(jià)值。為了保證電子商務(wù)檔案的科學(xué)化、系統(tǒng)化和條理化的管理,保證電子商務(wù)檔案的安全性、真實(shí)性、有效性和完整性,實(shí)施電子商務(wù)檔案智能化管理是一種必然的趨勢(shì)。電子商務(wù)檔案智能化管理的一項(xiàng)重要內(nèi)容,就是檔案檢索,它是指建立檔案檢索系統(tǒng),編制檢索工具,通過(guò)對(duì)所需檔案信息的查找,提供業(yè)務(wù)服務(wù)。當(dāng)前,對(duì)于檔案信息,不同的用戶,有著不同的需求。隨著不斷發(fā)展和完善的信息檢索技術(shù),電子商務(wù)檔案信息檢索也產(chǎn)生了不同的類型,只有實(shí)現(xiàn)電子商務(wù)檔案檢索的智能化,才能滿足信息需求下,方便用戶準(zhǔn)確、快捷、高效的獲取檔案信息。
一、電子商務(wù)檔案的特點(diǎn)
1.虛擬性
相比于其他的檔案存在形式,電子商務(wù)檔案的顯著特征是虛擬性。首先,是在虛擬的網(wǎng)絡(luò)傳輸空間,發(fā)生電子商務(wù)行為的。其次,在各個(gè)環(huán)節(jié)中所發(fā)生的電子商務(wù)活動(dòng)的交易信息,具有一定的虛擬性:一是借助于網(wǎng)絡(luò),完成了以實(shí)物商品為內(nèi)容的貿(mào)易活動(dòng);二是通過(guò)網(wǎng)絡(luò),提供商品的信息;三是通過(guò)聯(lián)機(jī)訂購(gòu),查詢聯(lián)機(jī)數(shù)據(jù)庫(kù),提供信息資訊服務(wù);四是利用電子銀行和其他金融服務(wù),提供支付手段。
2.復(fù)雜性
電子商務(wù)檔案是利用存儲(chǔ)介質(zhì)存儲(chǔ)數(shù)字信息,它無(wú)法用手工操作和肉眼識(shí)別,只能通過(guò)計(jì)算機(jī)系統(tǒng)的解碼才能被識(shí)別。而隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,在各種介質(zhì)中所存儲(chǔ)的電子商務(wù)檔案的存儲(chǔ)形式、鏈接方式、傳輸協(xié)議、規(guī)范和信息格式也是不同的,這也因此形成了電子商務(wù)檔案的復(fù)雜性的特征。
3.集成性
和紙質(zhì)檔案的單一性的特征相比較,集成性是目前電子商務(wù)檔案信息的特征。它不僅僅是數(shù)字或文字信息,而且還可在同一份文件上,記錄不同媒體形式的信息。使電子商務(wù)活動(dòng)的各個(gè)環(huán)節(jié)都能被真實(shí)的、聲像并茂的記錄。所以我們應(yīng)針對(duì)電子商務(wù)檔案的特點(diǎn)進(jìn)行檢索,以提高其智能化的程度,與時(shí)代的智能化需求相符合。
二、現(xiàn)階段電子商務(wù)檔案檢索的類型
1.按檢索對(duì)象劃分
可分為文獻(xiàn)檢索、事實(shí)檢索和數(shù)據(jù)檢索。文獻(xiàn)檢索是以文獻(xiàn)為檢索對(duì)象,涵蓋了各類特定信息的文獻(xiàn),對(duì)用戶所需的文獻(xiàn)內(nèi)容進(jìn)行查找;事實(shí)檢索是指將事實(shí)作為檢索對(duì)象,內(nèi)容包括人物、企業(yè)和機(jī)構(gòu)的基本情況,對(duì)用戶所需的描述性事實(shí)進(jìn)行查找;數(shù)據(jù)檢索是將數(shù)據(jù)作為檢索對(duì)象,包括各種個(gè)性數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)和調(diào)查數(shù)據(jù),對(duì)用戶所需要的數(shù)值型數(shù)據(jù)進(jìn)行查找。
2.按檢索要求劃分
可分為強(qiáng)相關(guān)檢索和弱相關(guān)檢索。強(qiáng)相關(guān)檢索也稱特性檢索,是為用戶提供的一種對(duì)口的高度的信息檢索,對(duì)檢索的準(zhǔn)確性非常強(qiáng)調(diào);弱相關(guān)檢索也稱族性檢索,是為用戶提供完善而系統(tǒng)的信息檢索,注重查全,對(duì)檢索的全面性非常重視。
3. 按檢索性質(zhì)劃分
包括回溯檢索和定題檢索?;厮輽z索也稱追溯檢索,是對(duì)一段時(shí)期內(nèi)或者是近期內(nèi)的相關(guān)特定主題進(jìn)行查找;定題檢索是對(duì)特定主題的最新信息進(jìn)行查找。其特點(diǎn)是有較小的時(shí)間跨度,同時(shí)檢索到的也是最新的信息。這種檢索適合信息跟蹤,一旦檔案信息庫(kù)有更新,有新的檔案信息加入時(shí),定題檢索就會(huì)自動(dòng)的運(yùn)行,便于用戶對(duì)相關(guān)領(lǐng)域的最新發(fā)展動(dòng)態(tài)及時(shí)的跟蹤和掌握。
4.按檢索的信息形式劃分
可分為多媒體檢索和文本檢索。多媒體檢索是對(duì)含有特定信息的多媒體檔案文獻(xiàn)的查找,其結(jié)果是用包括影片、動(dòng)畫(huà)、聲音、圖像在內(nèi)的多媒體形式,對(duì)特定的信息進(jìn)行表現(xiàn);文本檢索是對(duì)含有特定信息的文本文獻(xiàn)進(jìn)行查找,其結(jié)果是對(duì)特定的信息內(nèi)容用文本形式進(jìn)行體現(xiàn)。
三、電子商務(wù)檔案信息檢索的智能化趨勢(shì)
隨著計(jì)算機(jī)智能技術(shù)的突飛猛進(jìn)的發(fā)展,尤其是近年來(lái)圖情信息智能檢索所取得成就,為電子商務(wù)檔案的信息檢索向智能化的發(fā)展,帶來(lái)了新的契機(jī)。電子商務(wù)檔案有著多種多樣的存儲(chǔ)形式,涵蓋了非固定長(zhǎng)度和一般固定長(zhǎng)度的信息檢索。信息既可以用數(shù)字、文字表達(dá),還可以用聲音、圖像表達(dá);有不加密和加密的信息;有在異地設(shè)備或者是云端存儲(chǔ)的信息,也有在本地設(shè)備上存儲(chǔ)的信息。因此,對(duì)電子商務(wù)檔案信息的智能檢索,具有非常重要的意義。而“智能檢索”的概念是指,在檢索詞和文獻(xiàn)的相關(guān)度的基礎(chǔ)上,對(duì)文獻(xiàn)的重要性指標(biāo)進(jìn)行綜合考察,再排序檢索結(jié)果,使檢索效率得到進(jìn)一步的提高。在排序智能檢索結(jié)果時(shí),要對(duì)其重要性和相關(guān)性進(jìn)行考慮。為了保證更加準(zhǔn)確的相關(guān)性分析,需采用各字段加權(quán)混合索引;重要性是指通過(guò)引用關(guān)系分析和文獻(xiàn)來(lái)源權(quán)威性分析,來(lái)評(píng)價(jià)文獻(xiàn)質(zhì)量,這樣會(huì)產(chǎn)生更加準(zhǔn)確的排序結(jié)果,在最前面排列與用戶愿望最相關(guān)的文獻(xiàn)。使檢索的效率提高。
1.電子商務(wù)檔案的全球化特征
在電子商務(wù)飛速發(fā)展的今天,電子商務(wù)活動(dòng)有著越來(lái)越顯著的全球化特征。甚至在世界上任何一個(gè)角落,都有著頻繁的商務(wù)活動(dòng)。因此,電子商務(wù)檔案信息具有交易方式多樣性、交易語(yǔ)言復(fù)雜性、信息管理系統(tǒng)分布性的特征。新形勢(shì)下,傳統(tǒng)檔案信息檢索工具已經(jīng)無(wú)法對(duì)用戶的需求給予滿足。在信息時(shí)代,使用和開(kāi)發(fā)智能檢索工具,已經(jīng)成為一個(gè)必然的發(fā)展趨勢(shì)和選擇。同時(shí),日益發(fā)展的人工智能技術(shù)和不斷使用的超大型計(jì)算機(jī),提供了強(qiáng)大的技術(shù)支撐,促進(jìn)了電子商務(wù)檔案信息檢索智能化的發(fā)展。而在未來(lái)的發(fā)展過(guò)程中,利用人工智能技術(shù)的最新成果,電子商務(wù)檔案智能化的發(fā)展會(huì)日益的人性化。同時(shí),在檔案管理的智能化應(yīng)用中,滲透人工智能領(lǐng)域計(jì)算推理等思維活動(dòng)。而在人工智能研究成果的基礎(chǔ)上,開(kāi)展物景分析、模式識(shí)別的圖形圖像檢索系統(tǒng),充分利用跨越語(yǔ)言障礙的檔案信息、搜索工具及人工智能關(guān)于聯(lián)想記憶模擬,對(duì)電子商務(wù)國(guó)際化的需求、以及用戶對(duì)圖形圖像檔案信息檢索的需求給以滿足。
譬如,基于圖像的檢索,可充分利用模式識(shí)別,通過(guò)對(duì)圖形和圖像的選擇,進(jìn)行電子商務(wù)活動(dòng)。交易雙方進(jìn)行商務(wù)洽談之前,首先是要對(duì)交易商品的圖形和圖形,進(jìn)行選擇和甄別,最后才能達(dá)成交易意向。所以,電子商務(wù)檔案信息的重要組成部分,就是保存交易商品的圖像和圖形。而實(shí)現(xiàn)智能檢索的基礎(chǔ),是專家系統(tǒng)。只有充分利用人工智能檢索系統(tǒng),才能將交易的產(chǎn)品信息,從海量的商務(wù)信息中篩選出來(lái)。
2.研究和利用圖形圖像智能檢索工具
分析電子商務(wù)檔案的信息,只有在充分利用和研究智能圖形圖像的基礎(chǔ)上,才能對(duì)電子商務(wù)檔案智能化的需求給予滿足。目前,業(yè)界開(kāi)始廣泛關(guān)注一種基于內(nèi)容的圖像檢索技術(shù),即基于視覺(jué)特征的圖像檢索技術(shù)。任何圖像都具有物體本身的特征,如空間關(guān)系、顏色、形狀、物體本身的紋理等。而利用視覺(jué)特征的圖像檢索技術(shù),對(duì)色彩、形狀、紋理及對(duì)象的空間關(guān)系等進(jìn)行提取,建立圖像的特征矢量庫(kù),而索引關(guān)鍵字又是在此特征矢量的基礎(chǔ)上建立的。在對(duì)圖像的內(nèi)容進(jìn)行標(biāo)注時(shí),和傳統(tǒng)的采用人工標(biāo)注方法所不同的是,從圖像中自動(dòng)提取,是視覺(jué)特征的提取方式,同時(shí)采取視覺(jué)特征間的匹配進(jìn)行檢索。相比較于傳統(tǒng)的檢索方法,它是對(duì)圖像理解技術(shù)進(jìn)行了融合,對(duì)圖像特征的分析,是在對(duì)象的空間關(guān)系、色彩、形狀、紋理等維度進(jìn)行分析,這樣才能提供更加有效的檢索方式。而這一發(fā)展趨勢(shì),是與電子商務(wù)智能化的發(fā)展需求相符合的。我們完全可以預(yù)計(jì),為了與未來(lái)個(gè)性化、智能化和網(wǎng)絡(luò)化需求相滿足,在電子商務(wù)檔案的管理領(lǐng)域中,將充分應(yīng)用信息融合技術(shù)、概念空間、問(wèn)答系統(tǒng)、跨語(yǔ)言信息檢索、自然語(yǔ)言檢索、全息檢索和異構(gòu)信息整合檢索、知識(shí)挖掘、知識(shí)的智能檢索、分布式檢索,屆時(shí)為用戶提供簡(jiǎn)潔、有效、及時(shí)、準(zhǔn)確和完整的商務(wù)信息。
總而言之,在社會(huì)人本化和信息網(wǎng)絡(luò)化的發(fā)展時(shí)代,電子商務(wù)檔案的信息檢索,已經(jīng)成為未來(lái)的發(fā)展趨勢(shì),它是網(wǎng)絡(luò)時(shí)代和信息社會(huì)的必然產(chǎn)物。為滿足用戶從海量的檔案信息中迅速檢索到所需信息,傳統(tǒng)的人工檢索已經(jīng)無(wú)法滿足其要求。而電子商務(wù)檔案信息檢索的智能化發(fā)展,得益于人工智能技術(shù)的發(fā)展。并充分利用自動(dòng)語(yǔ)言處理、專家系統(tǒng)、自動(dòng)程序設(shè)計(jì)、物景聯(lián)想、模式識(shí)別等方式。電子商務(wù)檔案信息檢索的智能化,是建立在專家系統(tǒng)的基礎(chǔ)上,而檔案信息檢索人工智能技術(shù)的應(yīng)用,必然會(huì)使電子商務(wù)檔案信息檢索方法和理論發(fā)生實(shí)質(zhì)性的變化,這樣電子商務(wù)檔案信息檢索必然進(jìn)入智能化的新時(shí)代。
(作者單位:華能瀾滄江水電有限公司)endprint