朱海燕
(安徽大學(xué)管理學(xué)院,安徽 合肥 230601)
朱海燕 女,1988年生,2010級(jí)圖書館學(xué)研究生。
隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展,網(wǎng)上信息急劇增長(zhǎng)。面對(duì)海量無(wú)序、內(nèi)容繁雜的網(wǎng)絡(luò)信息,如何對(duì)其有效地進(jìn)行組織,成為網(wǎng)絡(luò)信息使用者關(guān)注的重點(diǎn)。在目前網(wǎng)絡(luò)環(huán)境下,采用分類法進(jìn)行信息組織主要有兩種方式:一是人工標(biāo)引方式的傳統(tǒng)文獻(xiàn)分類法,二是以人工標(biāo)引或自動(dòng)標(biāo)引方式采用自編的網(wǎng)絡(luò)信息分類法[1],如搜狐網(wǎng)。筆者以搜狐網(wǎng)和《中圖法》為例,對(duì)網(wǎng)絡(luò)信息資源分類法與傳統(tǒng)文獻(xiàn)分類法進(jìn)行比較,并分析其特點(diǎn),指出其不足及完善之方法。
網(wǎng)絡(luò)信息分類法是按主題為中心或按主題與科學(xué)相結(jié)合為立類原則,從方便用戶使用的角度出發(fā),采用自然語(yǔ)言來(lái)命名類目。通過(guò)層層劃分,逐級(jí)展開(kāi)類目。例如,搜狐網(wǎng)根據(jù)網(wǎng)站的主題,首先把網(wǎng)站分為18大類,再按細(xì)分主題層層分下去,從而形成一個(gè)“樹(shù)技狀”分類結(jié)構(gòu),再根據(jù)不同用戶的使用習(xí)慣,以及不同的分類方式,把不同類目下“相關(guān)”的類目“鏈接”起來(lái),從而形成搜狐的“網(wǎng)狀”分類體系。其中以主題分類為主設(shè)立了娛樂(lè)休閑、新聞媒體、工商經(jīng)濟(jì)、公司企業(yè)、電腦網(wǎng)絡(luò)、教育培訓(xùn)、文學(xué)、藝術(shù)、體育健身、衛(wèi)生健康、科學(xué)技術(shù)、生活服務(wù)、旅游交通、社會(huì)文化、政法軍事、社會(huì)科學(xué)、個(gè)人主頁(yè)17個(gè)大類[2],另外結(jié)合分面組配的方法設(shè)立國(guó)家與地區(qū),把其他17個(gè)大類下的所有網(wǎng)站又按所屬地域進(jìn)行分類。
傳統(tǒng)文獻(xiàn)分類法是等級(jí)列舉式結(jié)構(gòu)的分類體系,以學(xué)科和邏輯劃分為標(biāo)準(zhǔn)展開(kāi)嚴(yán)密而深細(xì)的類目劃分,并以高度規(guī)范化的代碼和語(yǔ)詞為標(biāo)識(shí)來(lái)揭示和組織信息,用等級(jí)體系以及參照、注釋、互見(jiàn)、交替等方法來(lái)直接顯示類目之間的知識(shí)關(guān)聯(lián),比較全面客觀地反映了知識(shí)全貌及其內(nèi)在的邏輯關(guān)系[3]。如《中圖法》以自然科學(xué)、社會(huì)科學(xué)、哲學(xué)作為人類知識(shí)領(lǐng)域的基本構(gòu)成建立基本序列,并將作為社會(huì)主義分類法編制指導(dǎo)思想的“馬克思主義、列寧主義、毛澤東思想、鄧小平理論”和結(jié)合文獻(xiàn)特殊性設(shè)置的“綜合性圖書”作為部類,形成5個(gè)部類的基本序列,22個(gè)基本大類。其中按學(xué)科立類的有17個(gè),按主題立類的只有5個(gè):A馬克思主義、列寧主義、毛澤東思想、鄧小平理論;T工業(yè)技術(shù);U交通運(yùn)輸;V航空、航天;Z綜合性圖書。
網(wǎng)絡(luò)信息分類系統(tǒng)分類標(biāo)準(zhǔn)較傳統(tǒng)分類法更加多元化。它采用以主題為中心或者主題與學(xué)科相結(jié)合的兩種方式立類,類目之間邏輯關(guān)系不夠嚴(yán)密,不需要以標(biāo)記符號(hào)來(lái)表示類目之間的關(guān)系,主觀上不存在分類標(biāo)準(zhǔn)的使用數(shù)量問(wèn)題,客觀上每一等級(jí)的劃分都使用了多重分類標(biāo)準(zhǔn),劃分后子類之間的內(nèi)涵是相互交叉的。例如在搜狐網(wǎng)的新聞大類中,將其劃分為國(guó)內(nèi)、國(guó)際、社會(huì)、軍事、財(cái)經(jīng)、IT、體育、娛樂(lè)、教育、文化、旅游、健康等這些二級(jí)類目。其中,國(guó)內(nèi)、國(guó)際是根據(jù)新聞發(fā)生的地點(diǎn)進(jìn)行的劃分;軍事、體育是按照學(xué)科進(jìn)行的劃分;娛樂(lè)、財(cái)經(jīng)等是根據(jù)主題進(jìn)行的劃分。而在國(guó)際和國(guó)內(nèi)新聞中也包括有軍事、財(cái)經(jīng)、娛樂(lè)等多種類型的新聞,財(cái)經(jīng)、娛樂(lè)等也囊括有國(guó)內(nèi)和國(guó)際的新聞。因此,其各子類之間的內(nèi)涵是相互交叉的。
傳統(tǒng)文獻(xiàn)分類法是將知識(shí)的學(xué)科范疇屬性層層劃分,以代碼為標(biāo)識(shí)對(duì)信息分門別類地予以揭示和組織成系統(tǒng)。在分類標(biāo)準(zhǔn)的使用數(shù)量上,一般要求一次劃分采用一個(gè)分類標(biāo)準(zhǔn),必要時(shí)再采用兩個(gè)或兩個(gè)以上標(biāo)準(zhǔn)。如《中圖法》主要是從科學(xué)分類和知識(shí)分類的角度來(lái)解釋文獻(xiàn)內(nèi)容的區(qū)別與聯(lián)系,按學(xué)科和專業(yè)集中文獻(xiàn),提供從學(xué)科和專業(yè)角度檢索文獻(xiàn)的途徑,如I24小說(shuō),就是按照小說(shuō)的題材,將其劃分為革命斗爭(zhēng)小說(shuō)、軍事小說(shuō)、史傳小說(shuō)、經(jīng)濟(jì)政治小說(shuō)、科學(xué)科幻小說(shuō)、驚險(xiǎn)推理小說(shuō)、社會(huì)言情小說(shuō)等。
網(wǎng)絡(luò)信息分類法采用的類目名稱比較隨意,多采用自然語(yǔ)言命名類目,旨在便于用戶理解和使用。不少類目名稱不夠科學(xué),沒(méi)有準(zhǔn)確地表達(dá)類目的內(nèi)涵和外延,多是網(wǎng)民常見(jiàn)的俗稱、簡(jiǎn)稱、習(xí)慣用語(yǔ)。
傳統(tǒng)文獻(xiàn)分類法所使用的類目名稱能夠確切表達(dá)類目的實(shí)際內(nèi)容范圍,內(nèi)涵、外延清楚,通常采用科學(xué)、規(guī)范、通用、穩(wěn)定性高的術(shù)語(yǔ)或譯名。如《中圖法》一級(jí)類目中的“政治法律”、“軍事”、“經(jīng)濟(jì)”、“文學(xué)”、“藝術(shù)”等,讓用戶能夠清楚明了地知道各大類的主要內(nèi)容。
網(wǎng)絡(luò)分類法類目展開(kāi)主要是結(jié)合超文本技術(shù)的應(yīng)用,采取多維結(jié)構(gòu),從多個(gè)角度設(shè)置類目、展開(kāi)類目體系。如搜狐網(wǎng)提供了從地區(qū)和資源類型角度的檢索入口,是一種不同于傳統(tǒng)線性序列的網(wǎng)狀結(jié)構(gòu),從不同角度對(duì)主題關(guān)系進(jìn)行揭示。如檢索娛樂(lè)方面的信息,可以從國(guó)內(nèi)、國(guó)外地區(qū)開(kāi)始檢索,同時(shí)也可以從電影、電視、音樂(lè)、戲劇等多個(gè)角度進(jìn)行精確全面的檢索。搜狐網(wǎng)中,對(duì)于子類目同屬于幾個(gè)大類的類目,使用鏈接方式,將其在相應(yīng)類下重復(fù)反映,使其同時(shí)成為有關(guān)類目的有機(jī)組成部分。如搜狐網(wǎng)中新聞、體育等大類中都包含國(guó)內(nèi)、國(guó)外二級(jí)類目,都在其大類下列出。
傳統(tǒng)文獻(xiàn)分類法類目展開(kāi)基本上采用線性序列。如《中圖法》分類體系中采用的是從屬關(guān)系、并列關(guān)系、交替關(guān)系和相關(guān)關(guān)系4種關(guān)系類型。從屬關(guān)系、并列關(guān)系是類目體系展開(kāi)的主要線索,反映了類目的縱向聯(lián)系;交替類、類目參照則是對(duì)類目體系主要關(guān)系的補(bǔ)充,揭示被類目體系分散了的橫向聯(lián)系。通過(guò)二者的結(jié)合,文獻(xiàn)分類法按照類目之間的關(guān)系建立起了縱橫交叉、嚴(yán)密而又實(shí)用的分類體系。
類目交叉關(guān)系的處理是指涉及多個(gè)學(xué)科或主題的類目在不同學(xué)科或主題下的揭示和反映。網(wǎng)絡(luò)信息分類系統(tǒng)對(duì)類目交叉關(guān)系的處理采用類目重復(fù)反映的方法,也就是涉及多個(gè)學(xué)科的主題在多個(gè)類目下重復(fù)設(shè)置。如搜狐網(wǎng)中“體育”、“財(cái)經(jīng)”等既作為一級(jí)類目,同時(shí)又是“新聞”中的二級(jí)類目。
傳統(tǒng)文獻(xiàn)分類法對(duì)類目交叉關(guān)系的處理有3種手段:一種是設(shè)置交替類目。對(duì)于與兩個(gè)學(xué)科有關(guān)、可以隸屬于兩個(gè)科學(xué)部門的學(xué)科或類目,根據(jù)需要將一個(gè)類目設(shè)為正式類目,將另一個(gè)類目設(shè)為供選擇使用的交替類目。其次是作注釋說(shuō)明。對(duì)于一類事物的總論和分論,一般在總論的類目下說(shuō)明“總論入此,專論入有關(guān)各類”,或注明總論與分論的關(guān)系。第三是設(shè)參見(jiàn)項(xiàng)。對(duì)具有交叉關(guān)系的兩個(gè)類目,互設(shè)參見(jiàn)?!吨袌D法》運(yùn)用組配技術(shù)主要有3個(gè)方面:一是編制各種類型的復(fù)分表,作為全表或某個(gè)局部組配復(fù)分的依據(jù);二是采用部分類目仿照已列出的類目進(jìn)行細(xì)分;三是主類號(hào)之間使用冒號(hào)直接組配,合成新主題。
網(wǎng)絡(luò)信息分類方法是直接面向用戶的,沒(méi)有注釋,類目間的橫向聯(lián)系采用交叉列類,類目的內(nèi)容注釋則以有選擇的列舉下位類方式為主,便于鏈接[4]。在搜狐網(wǎng)中可以在主頁(yè)中看到各大類,然后直接選擇各大類進(jìn)入新頁(yè)面,進(jìn)行下一步選擇。
傳統(tǒng)分類法的類目注釋是標(biāo)引人員的重要參考,也是讀者使用分類目錄的參考。除了說(shuō)明類目含義的注釋外,還有大量的歸類方法注釋、組號(hào)方法注釋、參照注釋等。
網(wǎng)絡(luò)分類搜索引擎能提供多個(gè)檢索入口,適應(yīng)各種類型終端用戶的需要。它不同于傳統(tǒng)分類法的線性結(jié)構(gòu),網(wǎng)絡(luò)信息分類法從多角度利用文本技術(shù)和鏈接技術(shù)進(jìn)行全方位的分類揭示,為其大類體系提供了多維檢索入口。如搜狐網(wǎng)除從信息資源的主題角度設(shè)類外,一般還同時(shí)從地區(qū)、資源類型、機(jī)構(gòu)等角度設(shè)類。如設(shè)立“國(guó)家與地區(qū)”大類提供了地區(qū)檢索的入口,設(shè)立“視頻”、“博客”、“圖庫(kù)”等提供了資源類型的檢索入口,設(shè)立“公司企業(yè)”提供了機(jī)構(gòu)檢索的入口。
網(wǎng)絡(luò)信息用戶主要是通過(guò)類名來(lái)識(shí)別和選擇檢索途徑。網(wǎng)絡(luò)信息分類法采用自然語(yǔ)言標(biāo)引,簡(jiǎn)單易懂。用戶可以根據(jù)類目直接進(jìn)行檢索。如用戶登錄搜狐網(wǎng)后,在主頁(yè)上可以直接選擇“娛樂(lè)”、“體育”、“健康”等類目,進(jìn)行信息瀏覽。
網(wǎng)絡(luò)分類法采取以主題為中心或按主題與學(xué)科相結(jié)合的類目設(shè)置方式,增強(qiáng)了類目的包容性。從便于用戶使用的角度出發(fā),根據(jù)用戶使用需要列類,突出了與用戶生活息息相關(guān)的如教育、娛樂(lè)、旅行、生活等普通用戶感興趣的類目,弱化科學(xué)技術(shù)、學(xué)術(shù)性類目的設(shè)置,便于用戶檢索。如搜狐網(wǎng)將“娛樂(lè)休閑”、“旅游交通”、“衛(wèi)生健康”等用戶需求量高的類目單獨(dú)設(shè)為大類,置于首頁(yè)之上,極大地方便了用戶查找。
由于網(wǎng)絡(luò)信息具有高度的動(dòng)態(tài)性,各種信息處于不斷更新的狀態(tài)中,它所鏈接的網(wǎng)站、網(wǎng)頁(yè)也處于變化之中[5]。所以要求網(wǎng)絡(luò)信息分類體系具有跟蹤動(dòng)態(tài)發(fā)展的能力。網(wǎng)絡(luò)分類引擎利用超文本技術(shù),根據(jù)需要?jiǎng)討B(tài)調(diào)整類間關(guān)系,這種類間關(guān)系一旦不需要,可以隨時(shí)取消,出現(xiàn)新的類目關(guān)系也能夠及時(shí)添加。
一個(gè)完整的綜合性分類體系在劃分基本大類時(shí)應(yīng)將所涉及到的知識(shí)領(lǐng)域全部涵蓋進(jìn)去,而目前的搜索引擎往往只從商業(yè)角度出發(fā)設(shè)置類目,因此體系的系統(tǒng)性和完整性受到很大影響。從類目設(shè)置情況來(lái)看,搜狐網(wǎng)有18個(gè)基本大類,涵蓋的知識(shí)不夠全面,也沒(méi)有形成較為完整的科學(xué)體系,有些信息難以歸類。如教育大類中,有高等教育,無(wú)中等和初等教育;有國(guó)內(nèi)院校,無(wú)國(guó)外院校。
網(wǎng)絡(luò)信息分類采用自然語(yǔ)言設(shè)置類名,雖然直觀易懂,但是大量口頭語(yǔ)言、網(wǎng)絡(luò)語(yǔ)言的使用使得類目名稱不規(guī)范,有時(shí)給用戶查找?guī)?lái)困難,難以查到真正需要的東西。如搜狐網(wǎng)一級(jí)類目中的“女人”、“原創(chuàng)”等,不熟悉的話不能準(zhǔn)確地查找出所需信息。
目前許多網(wǎng)絡(luò)信息分類法未能嚴(yán)格地按照概念的內(nèi)涵和外延科學(xué)歸類,以用戶感興趣的內(nèi)容設(shè)置類目,對(duì)于用戶使用較少的信息沒(méi)有設(shè)置類目。因而,這種分類法不是科學(xué)的分類法,并未從知識(shí)領(lǐng)域、知識(shí)體系的角度分類。如《中圖法》中“工業(yè)技術(shù)”、“語(yǔ)言文字”等一級(jí)類目并沒(méi)有出現(xiàn)在搜狐網(wǎng)的類目中。搜狐網(wǎng)的大類設(shè)置使用了主題對(duì)象、學(xué)科、地區(qū)、文獻(xiàn)類型等多個(gè)標(biāo)準(zhǔn)但其類目之間邏輯性不強(qiáng),類目歸屬存在不合理的現(xiàn)象。這種分類使得類目層次不一,破壞了分類的等級(jí)結(jié)構(gòu)和系統(tǒng)性,影響了類目體系的清晰度,在一定程度上干擾了用戶的檢索,降低了查準(zhǔn)率。
網(wǎng)絡(luò)信息分類法普遍存在著分類體系不統(tǒng)一的問(wèn)題。在類目的劃分、排列上都存在很大差別。類目采用多重列類使得同一個(gè)子類目出現(xiàn)在不同大類下,類目劃分層次也參差不齊,有的類目劃分為兩三層,有的類目則多達(dá)十幾層。用戶從分類途徑查找某個(gè)類名,往往要鏈接10多個(gè)頁(yè)面,既費(fèi)時(shí)又費(fèi)力。最常見(jiàn)的是邏輯關(guān)系比較混亂,常出現(xiàn)隸屬關(guān)系不清的現(xiàn)象。例如搜狐網(wǎng)中,從“文化”大類入口查找小說(shuō),需再選擇“讀書”大類,在“讀書”大類中可以看到“小說(shuō)”子類目,可是該“小說(shuō)”子類目屬于“聽(tīng)書”上位類,檢索出來(lái)的小說(shuō)不是文本格式的,而是音頻格式的,這樣用戶花費(fèi)時(shí)間找到的并不是自己所需要的信息,而文本格式或在線閱讀的小說(shuō)應(yīng)該從“文化”大類下的“原創(chuàng)”子類入口查找。
分類法中基本大類的設(shè)置應(yīng)將穩(wěn)定的、較為概括的學(xué)科或知識(shí)領(lǐng)域作為一級(jí)類目。網(wǎng)絡(luò)信息分類法的基本大類除了要考慮網(wǎng)站的商業(yè)性,還必須考慮知識(shí)的完整性與穩(wěn)定性。因此,設(shè)計(jì)基本大類時(shí),應(yīng)盡量采用按學(xué)科進(jìn)行分類,一級(jí)類目數(shù)量控制在15~20個(gè)為宜。如將哲學(xué)、社會(huì)科學(xué)、自然科學(xué)等學(xué)科分明、較為穩(wěn)定的類目設(shè)為一級(jí)類目;二級(jí)類目的設(shè)置可采取按主題分類,如娛樂(lè)休閑、生活服務(wù)等,類目劃分一般控制在四~六級(jí)左右,不宜過(guò)多。二級(jí)以下類目可采用“多重列類”等方法合理立類。類目?jī)?nèi)容應(yīng)科學(xué)完整,既有學(xué)術(shù)信息、新聞信息,又有專業(yè)信息、個(gè)人信息等。
網(wǎng)絡(luò)信息類名的設(shè)置既要符合大多數(shù)用戶的使用習(xí)慣,同時(shí)要科學(xué)、準(zhǔn)確、規(guī)范,涵蓋的知識(shí)領(lǐng)域要全面并且應(yīng)采用規(guī)范語(yǔ)詞,不使用復(fù)雜的標(biāo)記制度,以便各種各樣的信息都有類可入??梢酝ㄟ^(guò)對(duì)類目進(jìn)行科學(xué)注釋的手段來(lái)幫助用戶了解類目的含義,提高網(wǎng)絡(luò)信息的查全率及查準(zhǔn)率??梢圆捎靡韵聝煞N注釋方式:一是通過(guò)精煉的文字,指明該類包含的內(nèi)容范圍;二是用列舉下位類的方式揭示本類的內(nèi)容范圍。
網(wǎng)絡(luò)信息分類法應(yīng)建立在科學(xué)的知識(shí)分類的基礎(chǔ)上,按照各學(xué)科之間的內(nèi)在聯(lián)系和相互關(guān)系并結(jié)合網(wǎng)絡(luò)信息資源的特點(diǎn),形成一個(gè)科學(xué)的檢索系統(tǒng)。類目的設(shè)置與排序必須遵守基本的學(xué)科劃分和邏輯劃分原則[6]。由于類目的排列次序?qū)τ脩羰褂煤蜋z索速度會(huì)產(chǎn)生一定的影響,所以確定合理的排列次序是分類體系建立的一個(gè)基本內(nèi)容。首先,應(yīng)按照知識(shí)的邏輯次序和重要程度排列,共性區(qū)分的問(wèn)題集中排列,采用相同標(biāo)準(zhǔn)區(qū)分的類目使用相同的次序排列。其次,對(duì)無(wú)明顯邏輯聯(lián)系的類目,可按照字順或網(wǎng)站信息點(diǎn)擊率排列。
網(wǎng)絡(luò)信息分類法的體系要統(tǒng)一,類目層次不宜過(guò)多,要突出重點(diǎn)類目。在編列類目時(shí),要符合網(wǎng)絡(luò)信息的實(shí)際情況,以足夠的信息內(nèi)容作為保障。信息內(nèi)容多,類目就分得細(xì);信息內(nèi)容少,類目就分得粗。對(duì)于一些類目在其上位類或其他類目中能明確反映出來(lái)的同時(shí)又不影響整個(gè)體系編制的情況下可以不單獨(dú)列出。如在網(wǎng)頁(yè)中可將熱點(diǎn)問(wèn)題單獨(dú)列出。
網(wǎng)絡(luò)信息分類與傳統(tǒng)文獻(xiàn)分類法各有所長(zhǎng)。隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展及人們?cè)絹?lái)越多地利用互聯(lián)網(wǎng),網(wǎng)絡(luò)分類法勢(shì)必要不斷完善。充分吸收傳統(tǒng)文獻(xiàn)分類法的優(yōu)勢(shì)來(lái)彌補(bǔ)其不足,是網(wǎng)絡(luò)信息分類體系趨于完善的必由之路。
[1] 鐘永萍.傳統(tǒng)文獻(xiàn)分類法與網(wǎng)絡(luò)信息分類法的比較研究[D].福建師范大學(xué),2008.
[2] 搜狐網(wǎng).搜狐首次對(duì)外展示搜索引擎網(wǎng)站分類法[EB/OL].[2011-11-27].http://it.sohu.com/77/81/article16718177.shtml.
[3]郭曉蘭.網(wǎng)絡(luò)信息分類方法與傳統(tǒng)分類法的比較研究[J].圖書館建設(shè),2003(3):48-50.
[4] 宋蓓玲.淺析構(gòu)建網(wǎng)絡(luò)信息分類體系[J].情報(bào)雜志,2004(8):110-111,114.
[5] 王麗瑜,李梅娟.網(wǎng)絡(luò)信息分類法與傳統(tǒng)文獻(xiàn)分類法的比較分析——以Yahoo!和《中圖法》為例[J].中國(guó)成人教育,2007(2):56-57.
[6]邰峻.從搜狐分類引擎分析網(wǎng)絡(luò)信息資源的分類組織[J].新世紀(jì)圖書館,2006(1):52-53.
[7] 王巍.搜狐分類體系初探[J].圖書館建設(shè),2001(1):72-74.