查清海
?
信息標(biāo)檢法的常識、評價及展望
查清海
(西安九德咨詢代理服務(wù)有限公司,陜西 西安 710082)
從信息常識開始提出信息標(biāo)檢領(lǐng)域的萬碼奔騰亂象。通過對信息標(biāo)檢法的評價以期說明一部信息標(biāo)檢法應(yīng)有的基本特征;對信息標(biāo)檢法工作能力評價的量化標(biāo)準(zhǔn)是什么;老一代信息標(biāo)檢法的缺陷是什么;信息時代的信息標(biāo)檢法應(yīng)該具有更強(qiáng)的工作能力是什么;呼吁統(tǒng)一的信息標(biāo)檢法和信息標(biāo)檢模式化。
信息標(biāo)檢法;標(biāo)檢廣度;標(biāo)檢深度;標(biāo)檢全率
信息標(biāo)檢法是對信息進(jìn)行標(biāo)引和檢索的方法或規(guī)則。
標(biāo)引:對信息進(jìn)行標(biāo)識、標(biāo)注、標(biāo)記、給信息做個記號。
檢索:根據(jù)標(biāo)識規(guī)則,對標(biāo)過的信息進(jìn)行檢索、查詢、尋找、查找。
信息標(biāo)檢法按標(biāo)的性質(zhì)分為三類。
1.2.1 分類標(biāo)檢法:種群標(biāo)檢
對信息進(jìn)行種類標(biāo)檢,比如對圖書進(jìn)行種類標(biāo)檢。
標(biāo)引:先把哲學(xué)類的書標(biāo)記為“E1”。
檢索:再根據(jù)標(biāo)記“E1”,在書堆里找出哲學(xué)類的書。
1.2.2 非分類標(biāo)檢法:個體標(biāo)檢
對信息進(jìn)行個體標(biāo)檢,比如對人進(jìn)行個體標(biāo)檢,
標(biāo)引:先給張三一個身份證號“12345678901”。
檢索:再根據(jù)標(biāo)記“12345678901”,從人群里找出張三這個人來。
1.2.3 種次標(biāo)檢法:類個標(biāo)檢
對數(shù)量大于1的同類信息進(jìn)行標(biāo)檢,比如對同樣的兩本哲學(xué)書的標(biāo)檢。
標(biāo)引:哲學(xué)類的第1本哲學(xué)類的書是“E1/1”,第18本哲學(xué)類的書是“E1/18”,第18本哲學(xué)類的書的第1本重復(fù)本的標(biāo)記是“E1/18—1”,第18本哲學(xué)類的書的第9本重復(fù)本的標(biāo)記是“E1/18—9”。
檢索:不管有多少本相同的書,少了哪一本都能查出來。
1.3.1 有關(guān)信息載體的信息標(biāo)檢法
圖書分類標(biāo)檢法:國外有杜威十進(jìn)法DC、通用十進(jìn)法UDC、冒號法CC、布利斯書目法BC、文獻(xiàn)分類ICS、美國會法LC、英布朗法SC、國際標(biāo)準(zhǔn)書號ISBN……國內(nèi)有中圖法、科圖法、人大法、標(biāo)準(zhǔn)(文獻(xiàn))分類法……
報刊分類標(biāo)檢法:國外有國際標(biāo)準(zhǔn)連續(xù)出版物編號ISSN;國內(nèi)有國內(nèi)統(tǒng)一刊號CN。
1.3.2 有關(guān)信息業(yè)務(wù)的信息標(biāo)檢法
國內(nèi)外各種分類法:國外有國際標(biāo)準(zhǔn)分類法ICS、國際產(chǎn)業(yè)分類ISIC、國際貿(mào)易標(biāo)準(zhǔn)分類SITC、商標(biāo)注冊用國際分類尼斯協(xié)定、國際專利分類法IPC……國內(nèi)有國標(biāo)學(xué)科分類法、國標(biāo)行業(yè)分類法、基金分類法、資產(chǎn)分類法……
國內(nèi)外各種編碼:國外有國際物品編碼GS1、化學(xué)物質(zhì)登錄號CAS、國家代碼、語種代碼……國內(nèi)有國民經(jīng)濟(jì)行業(yè)代碼、職業(yè)編碼、企業(yè)代碼、院校代碼、身份證編碼、行政區(qū)劃代碼、產(chǎn)品分類代碼、藥品編碼、職業(yè)資格證編碼……
由于交通運輸?shù)娜找姘l(fā)達(dá),地球在變小。由于信息交流的突飛猛進(jìn),信息語言(信息標(biāo)檢法)的統(tǒng)一是必須要解決的問題。而現(xiàn)在世界上的信息語言比自然語言還豐富,如同自然語言對不同語種的人們進(jìn)行語言交流很不方便一樣,現(xiàn)在成千上萬的政治圈的信息語言(信息標(biāo)檢法)已經(jīng)成為人們進(jìn)行信息交流的藩籬。不要說跨政治圈,就是在圈內(nèi),一個標(biāo)的有若干個標(biāo)識符的情況比比皆是,既不合理,又不方便。統(tǒng)一的信息標(biāo)檢法是信息資源共享繞不過去的課題。
1.4.1 信息標(biāo)檢法的主體基本特征評價
一部信息標(biāo)檢法,只有符合社會發(fā)展規(guī)律,自身科學(xué)、合理,能被更多數(shù)的人公認(rèn),方便實用才有生存和發(fā)展的必要性。
1.4.1.1 順應(yīng)信息語言統(tǒng)一大勢,沒有不被公認(rèn)的占主導(dǎo)地位的意識形態(tài)
今天的地球村,就像一個大雜院,家和家不能比,富強(qiáng)國和貧弱國的體量差距是幾倍到幾萬倍。盡管如此,各國謀生存求發(fā)展的意愿是相同的,只有融入交流,互相學(xué)習(xí),取長補(bǔ)短,互通有無,才能使自家和交往家取得較快發(fā)展和進(jìn)步。反之,閉關(guān)鎖國,孤家寡人,無情無義,必然發(fā)展就慢,且有被侵之危,你不理豺,豺會理你。
而交流的首要必定是信息,而信息利用的首項,必然是信息標(biāo)檢法。首先要解決的就是信息標(biāo)檢工具的協(xié)同性。不同的信息語言,信息標(biāo)檢法之間的交流就像自然語言一樣沒有翻譯就不行,交流效率可想而知。隨之的科技、文化、經(jīng)濟(jì)、實業(yè)、軍事的競爭力可想而知。讓地球村的各家把自然語言不能直接交流的詬病遺傳給信息語言,這是地球村的人們不能忍受的,理想的信息語言是統(tǒng)一的或通用的信息語言。信息標(biāo)檢法的大勢是走向統(tǒng)一,這個統(tǒng)一的路徑是標(biāo)準(zhǔn)化淘汰自主化、協(xié)同淘汰閉關(guān)、簡單淘汰復(fù)雜、快淘汰慢、大用戶淘汰小用戶。各種信息語言、信息標(biāo)檢法之間的障礙將被當(dāng)事的各家清除,這樣的清除主要有兩種辦法:①誰家有大家公認(rèn)的信息標(biāo)檢法直接拿來用;②大家共同協(xié)商一個共同認(rèn)可的新的信息標(biāo)檢法。當(dāng)然,信息文化戰(zhàn)略欲與必先強(qiáng),當(dāng)模范要先走一步,制高點是要爬坡才能登上的。為什么杜威十進(jìn)分類法(DC)被一百多個國家使用,通用十進(jìn)制圖書分類法(UDC)以英、法、德、日、西班牙、意、俄等文字出版,為什么中國的各種分類法對內(nèi)各自為政,對外走不出國門?
統(tǒng)一的信息標(biāo)檢法不限用戶,也就是說要讓所有的信息標(biāo)檢用戶都承認(rèn)統(tǒng)一的信息標(biāo)檢法,那就必須尊重所有的信息標(biāo)檢用戶的世界觀、價值觀以及他們的意識形態(tài)?,F(xiàn)在的信息標(biāo)檢用戶在世界觀、價值觀以及意識形態(tài)領(lǐng)域存在著差異化,有些互不承認(rèn)、互相排斥、甚至敵對。要想讓所有的信息用戶都承認(rèn)統(tǒng)一的信息標(biāo)檢法,統(tǒng)一的信息標(biāo)檢法就必須沒有占主導(dǎo)地位而又非所有信息用戶公認(rèn)的意識形態(tài),否則,你的信息標(biāo)檢法你認(rèn)為好但人家就是不承認(rèn)、不用,人家可以另搞一套。如果這樣,統(tǒng)一的信息標(biāo)檢法豈不又淪為非統(tǒng)一的各種信息語言。要讓所有的信息標(biāo)檢用戶都承認(rèn)統(tǒng)一的信息標(biāo)檢法,統(tǒng)一的信息標(biāo)檢法的編制就只能用像和平共處五項原則那樣的智慧和大度來團(tuán)結(jié)不同國家、不同地區(qū)、不同民族、不同信仰的所有信息標(biāo)檢用戶。
1.4.1.2 分類體系要科學(xué),內(nèi)容要跟上時代的發(fā)展
信息分類源于科學(xué)分類,但又不等于科學(xué)分類,只能是以科學(xué)分類為指導(dǎo),兼顧信息標(biāo)檢的特點而形成。知識是全人類的,信息是全人類的,信息標(biāo)檢工具的包容能力和分類體系應(yīng)該是能與人類社會發(fā)展到現(xiàn)代的政治經(jīng)濟(jì)科技文化及信息文明相稱的,能為世界各國不同意識形態(tài)的大多數(shù)人認(rèn)可的,非此就是局限的。
1.4.1.3 沒有復(fù)雜的標(biāo)檢技能
統(tǒng)一的信息標(biāo)檢法既然要不限用戶,就要讓所有的信息標(biāo)檢用戶都能用此法標(biāo)檢信息,也就是說,統(tǒng)一的信息標(biāo)檢法不是圖書館員、資料員、專業(yè)技術(shù)人員的專用品,而是廣大信息標(biāo)檢工作人員及信息用戶拿來就能用的像字典一樣的通用品,不需要有很專業(yè)的標(biāo)檢技能。
例如,傳統(tǒng)的圖書分類法為了縮短分類號,在大量引用復(fù)分表的同時,產(chǎn)生了大量的復(fù)分規(guī)則,雖然分類號延長不多,但是增加了標(biāo)檢的掌握和運用的難度。統(tǒng)一的信息標(biāo)檢法采用直接索號或直接組配產(chǎn)生新的分類號,雖然分類號可能延長多點,但是即便是非專業(yè)標(biāo)檢工作人員也易于掌握,提高了大多數(shù)普通人標(biāo)檢信息的效率?,F(xiàn)在的信息標(biāo)檢大多都是數(shù)字化的非手寫操作,縮短一個分類號給號時間的價值要高于學(xué)習(xí)復(fù)雜的給號邏輯而使分類號更短點的價值。
一部信息標(biāo)檢法應(yīng)用領(lǐng)域的能力決定了這部信息標(biāo)檢法的地位?,F(xiàn)在正在用于各個領(lǐng)域的成千上萬的各種信息標(biāo)檢法已經(jīng)成為信息交流的藩籬,而減少這些藩籬最簡單的辦法就是用能用于較寬領(lǐng)域的信息標(biāo)檢法替代用于較窄領(lǐng)域的標(biāo)檢法。
如果有一種“全信息載體分類法”可以代替“圖書分類法”“檔案分類法”“期刊分類法”“廣播電視資料分類法”,甚至“網(wǎng)絡(luò)信息分類法”……那么“全信息載體分類法”就優(yōu)于各種各自為政的信息載體分類法。
如果有一種“信息業(yè)務(wù)整合分類法”可以代替“學(xué)科分類法”“產(chǎn)業(yè)分類法”“行業(yè)分類法”“貿(mào)易標(biāo)準(zhǔn)分類”“資產(chǎn)分類法”“基金分類法”“專利分類法”“商標(biāo)協(xié)定”……那么“信息業(yè)務(wù)整合分類法”就優(yōu)于各種各自為政的信息業(yè)務(wù)分類法。
如果有一種“綜合代碼”可以代替“國民經(jīng)濟(jì)行業(yè)代碼”“職業(yè)編碼”“企業(yè)代碼”“院校代碼”,那“綜合代碼”就優(yōu)于各自代碼。
上面三條是對現(xiàn)在信息標(biāo)檢亂象的改良方案,終極目標(biāo)還得是統(tǒng)一信息標(biāo)檢法,這三條只是為了向信息標(biāo)檢領(lǐng)域的各個藩籬妥協(xié),只是一種過渡。如果能夠一步到位,那是最理想的。
信息標(biāo)檢法的標(biāo)檢廣度應(yīng)該與標(biāo)檢客體的廣度相匹配,比如說信息客體有100個行業(yè),信息標(biāo)檢法只有或者只能標(biāo)檢90個行業(yè),那么它的標(biāo)檢廣度就是90/100=0.9.
信息標(biāo)檢法的標(biāo)檢深度應(yīng)該與標(biāo)檢客體的深度相匹配,比如說信息客體有100 m深,信息標(biāo)檢法的標(biāo)檢能力只能到80 m,那么它的標(biāo)檢深度就是80/100=0.8.舉例說,由于現(xiàn)在的圖書分類法,水平只到“類”的能力,所以對于生物、化合物、商品等信息的標(biāo)檢能力就做不到具體化,如《中圖法》對生物的標(biāo)檢深度就只到“科”一級,數(shù)以百萬計的生物在這里沒法具體標(biāo)檢。例如標(biāo)檢兩本書“辣椒種植”“鹿的馴化”,就只能標(biāo)檢到它們的主語的上位甚至上上位分類號:茄科的代碼“Q949.777.7”(茄科還有“茄子”“枸杞”“龍葵”“西紅柿”等幾十種植物)和偶蹄目的代碼“Q959.842”(偶蹄目還有“麝科”“??啤薄柏i科”“羊亞科”“河馬科”等幾十個“科”,每個“科”還有多個品種)。至于謂語就談不上。
信息標(biāo)檢法的標(biāo)檢對應(yīng)能力就是信息標(biāo)檢法的標(biāo)檢全率,比如說信息客體有100條信息,信息標(biāo)檢法只能標(biāo)檢50條,那么它的標(biāo)檢全率就是50/100=0.5.例如,一張報紙有100條信息,標(biāo)檢工具只能標(biāo)檢50條,它的標(biāo)檢全率就是0.5.
信息標(biāo)檢法的標(biāo)檢準(zhǔn)率表現(xiàn)在信息標(biāo)檢法的聚焦能力,標(biāo)檢準(zhǔn)率=標(biāo)識碼響應(yīng)量/標(biāo)的顯示量。像前面提到的“辣椒植”這個標(biāo)的有兩個顯示量,即“辣椒”和“種植”;標(biāo)識編碼響應(yīng)量應(yīng)該有兩個,即“辣椒”的標(biāo)識編碼和“種植”的標(biāo)識編碼。一般任何一條信息,都可以用一句話表達(dá),而一句話是由幾個句子成分,如主語、謂語、定語等多維信息元素組成。現(xiàn)在的大多數(shù)信息標(biāo)檢工具都是列舉式的線性分類法,在自己的小圈子里,標(biāo)檢準(zhǔn)率或許還行,如行政區(qū)劃代碼,標(biāo)檢準(zhǔn)率可以達(dá)到100%.但一走上幾個信息要素組成的一條信息,標(biāo)檢準(zhǔn)率就力不從心了。
制造業(yè)的龍頭已經(jīng)到了個性化定制階段,個性化定制從信息標(biāo)檢的角度來把握就是標(biāo)檢準(zhǔn)率,只有整合單維的線性信息標(biāo)檢法,達(dá)到組配標(biāo)檢,信息標(biāo)檢法才有可能跟上時代的發(fā)展。
信息標(biāo)檢法的分類編碼和分類項是一一對應(yīng)關(guān)系,這個“一一”是一個分類編碼可能對應(yīng)個分類項,而不是一個分類編碼只能對應(yīng)一個分類項。信息標(biāo)檢法應(yīng)該而且可以允許用戶用他們熟悉的分類項,或稱主題詞向信息標(biāo)檢法索取對應(yīng)的分類編碼,例如“電動機(jī)”的分類編碼是“J2612”,用戶也可以在檢索窗口用“馬達(dá)”來索取。
一個分類編碼對應(yīng)的分類項從概念上應(yīng)該是一一對應(yīng)的,這里比較容易亂的有兩類問題,一類問題是對同義詞條的歸類要一致,例如“事例”“事實”“事物”“事情”“事”……這些分類項,或稱主題詞條實際是一個基本概念,就要把它們歸用同一個分類編碼;另一類問題是對異義詞條的分類要清晰,例如“情報工作”隸屬信息產(chǎn)業(yè),是工作,“黃頁”隸屬信息文獻(xiàn),是工具。兩者有關(guān)聯(lián)但不是一個標(biāo)著概念。在沒有計算機(jī)的時代,人們要想知道一個分類項的分類編碼還得查信息標(biāo)檢法工具書,現(xiàn)在,在依照分類主題數(shù)據(jù)庫的檢索窗口,索取一個分類項的分類編碼,響應(yīng)提問不到1 s。
信息標(biāo)檢法編制是一門學(xué)問,可對于用戶它就是一個類似字典的工具。它不是微積分教程,沒有必要把自己包裝成學(xué)科范。
信息標(biāo)檢法的兼容性實際上就是標(biāo)檢廣度、深度、標(biāo)檢全率及標(biāo)檢準(zhǔn)率這些能力的綜合體現(xiàn)。一般在時序上,后者兼容前者;在應(yīng)用領(lǐng)域上,是綜合能力兼容單一能力。例如,如果有一種信息標(biāo)檢辦法,能夠全部兼容或部分兼容各種圖書分類法、各種業(yè)務(wù)分類法(比如各種學(xué)科分類法、各種標(biāo)準(zhǔn)分類法、各種產(chǎn)業(yè)分類法、各種經(jīng)貿(mào)分類法、各種知識產(chǎn)權(quán)分類法)、各種編碼(比如行業(yè)代碼、企業(yè)代碼、院校代碼、產(chǎn)品代碼、職業(yè)編碼、藥品編碼……)則是信息用戶的福音。把復(fù)雜變簡單,一個規(guī)則走遍天下,是信息標(biāo)檢用戶所希望的。
人類現(xiàn)在已經(jīng)進(jìn)入信息化時代,《數(shù)字化生存》20年前就出版了。計算機(jī)運算速度已經(jīng)每秒過億次了,大數(shù)據(jù)已經(jīng)切入我們工作生活的方方面面,新的標(biāo)檢標(biāo)的的涌現(xiàn)已是一種常態(tài)。如果說信息時代以前的信息標(biāo)檢法的基本工作能力已經(jīng)是勉強(qiáng)維持的話,那么在進(jìn)入信息社會以后,無論從統(tǒng)一標(biāo)檢、標(biāo)檢廣度、標(biāo)檢深度、標(biāo)檢全率、標(biāo)檢準(zhǔn)率、應(yīng)變問題等各個方面,都已經(jīng)無法滿足信息社會人們對信息標(biāo)檢的需求了。
新的更科學(xué)合理又實用的信息標(biāo)檢法存在推陳出新重新洗牌的必要,新的信息標(biāo)檢法必將在舊的信息標(biāo)檢法的廢墟上樹立起來。新的信息標(biāo)檢法都有哪些超越舊的信息標(biāo)檢法的新功能呢?
現(xiàn)在國內(nèi)外占主流地位的信息標(biāo)檢法分類體系,比如圖書分類法等,有的是一百年前編制的,有的是幾十年前編制的。從工業(yè)社會進(jìn)入到信息社會以來,無論是科學(xué)技術(shù)還是人類社會都發(fā)生了巨大變化,舊的信息標(biāo)檢法的分類體系無論是與今天人們對人類社會和科學(xué)技術(shù)的認(rèn)知,還是從信息標(biāo)檢統(tǒng)一化、精準(zhǔn)化對其的要求來看都相差甚遠(yuǎn),已顯腐朽,今天的現(xiàn)實已不是老照片的模樣了。新的信息標(biāo)檢法的分類體系是對今天自然界和人類社會的寫真。
信息標(biāo)檢法的分類體系既要以客觀實際為藍(lán)本,又要符合信息標(biāo)檢的工作實際,科技信息及人類社會不斷在發(fā)展變化,雖然信息標(biāo)檢法相對滯后,但信息標(biāo)檢法還需要有一定的穩(wěn)定性,非此信息標(biāo)檢法的用戶將增加應(yīng)用難度。這就要求信息標(biāo)檢法的分類體系及內(nèi)容的標(biāo)檢能力既要能盡量真實地反映客觀世界,又要根據(jù)信息標(biāo)檢的實際需求和標(biāo)檢特點對客觀世界的未知領(lǐng)域備留編碼空間,并對客觀世界的發(fā)展變化盡可能有實用的應(yīng)變預(yù)案。
所以新的信息標(biāo)檢法分類體系把分類項分為先組式基本分類項和后組式應(yīng)變分類項兩大類。主表和隸屬主表的分表(如植物分表、動物分表、化合物分表等)的分類項為先組式基本分類項,功能如組成語言的一個個單詞一樣?;痉诸愴検切畔?biāo)檢法的基本成分,變化性相對較小。先組式基本分類項主要解決穩(wěn)定問題,后組式應(yīng)變分類項主要解決應(yīng)變問題。后組式應(yīng)變分類項的產(chǎn)生方法有分類主題法、分類組配法、組配下位法。
分類法對很多領(lǐng)域的標(biāo)檢不能縱深,不是它們不想,而是它們沒有整合主題法而無能為力。直接用列舉式線性分類,僅僅上百萬種動植物的標(biāo)檢就把它們擋住了,還有更多的化合物、藥品、化工產(chǎn)品等,它們邁不過去這個坎(這里沒有用“他們”)。
老師教學(xué)生學(xué)數(shù),最多從1教到100,更大的數(shù),老師只把進(jìn)位邏輯教給學(xué)生就可以了,沒有哪個老師把所有的數(shù)教給學(xué)生,也沒有哪個學(xué)生寫不出任意一個很大的數(shù)。
把眾多的同類的信息附著在它們的分類號之后,用主題法標(biāo)注,還有什么大數(shù)據(jù)標(biāo)注不了?例如,如果用“C58∶QIK”標(biāo)注茄科,則“C58∶QIK-FQ”=西紅柿,“C58∶QIK-GQ”=枸杞,“C58∶QIK-LK”=龍葵,“C58∶QIK-LJ”=辣椒,“C58∶QIK-QZ”=茄子……
分類主題法是對隸屬基本分類項的新生項、變化項和無需全列舉項的應(yīng)對辦法。比如“主題經(jīng)濟(jì)”的分類主題法就是應(yīng)對“經(jīng)濟(jì)主題詞”的不斷新生設(shè)立的,例如“主題經(jīng)濟(jì)”的分類編碼是“G1∶”過去沒有的“虛擬經(jīng)濟(jì)”可以標(biāo)著為“G1∶XN”;一個新詞條“寄生經(jīng)濟(jì)”只要冒出來,“寄生經(jīng)濟(jì)”的分類主題詞就可馬上跟進(jìn):“G1∶JS”,沒必要也沒可能全列舉。再比如,分類編碼“B2522”的對應(yīng)分類項是“山”,則黃山的分類編碼就是“B2522∶HS”,太行山的分類編碼就是“B2522∶TH”,沒有必要也沒有可能把所有的“山”都列舉出來。其他問題,以此類推。
分類組配法的原始思想其實早在1933年就被印度的圖書館學(xué)家阮岡納贊提出,當(dāng)時叫“冒號制圖書分類法”,他的分面組配方向是正確的,可是由于一方面他編制了復(fù)雜煩瑣的組面組配規(guī)則,另一方面那個年代的文獻(xiàn)量也不大,所以沒能推廣應(yīng)用。但是,組面分類法的思想功不可沒,在海量信息的今天,要想解決信息標(biāo)檢法的標(biāo)檢準(zhǔn)率非組配分類法莫屬。盡管他那復(fù)雜繁瑣的組面組配規(guī)則沒人茍同。
任何一個信息標(biāo)的(一本書、一句話、一份文件、一部電影等等)都能用不到十個單詞的標(biāo)題表達(dá),而組成單詞的文字只有幾千個。全世界的自然語言都是用的單詞組配法,這種組配法只用自身的不變或少變就應(yīng)付了人類社會幾千年的科技文化及信息增量。信息標(biāo)檢法的實質(zhì)就是給信息標(biāo)的一個有序的標(biāo)識符號,如果把自然語言的單詞歸類演變成有序的分類代碼,引用組配,就基本可以聚焦任何一個信息標(biāo)的,而且可以排序。
如前面提到的“辣椒種植”“鹿的馴化”“辣椒”的分類主題編碼是“C58∶QIK-LJ”,“鹿”的分類主題編碼是“C675∶LK1-L”。如果“種植”的分類號是“P16”“馴化”的分類號是“P5171”,則辣椒種植的標(biāo)識符就是“C58∶QIK-LJ∩P16”,鹿的馴化的標(biāo)識符就是“C675∶LK1-L∩P5171”。
舉項的應(yīng)對辦法。比如“指紋識別”的分類編碼是“T41612”,“指紋識別”的組配項可能是“指紋識別設(shè)備”“指紋識別技術(shù)”“指紋識別用戶”……,只需用基本項組配就可產(chǎn)生。例如“設(shè)備、技術(shù)、用戶”的分類編碼分別是“J、N47、N603”,則“指紋識別設(shè)備=T41612J”,“指紋識別技術(shù)= T41612N47”,“指紋識別用戶=T41612 N603”……
實際上,老式分類法的復(fù)分表也是一種組配法,但是太局限了,信息標(biāo)的的要組配可能性本是不可限量的,區(qū)區(qū)幾個復(fù)分表哪能應(yīng)對得了?
科學(xué)在發(fā)展,事業(yè)在進(jìn)步,概念在裂變。新事物,新概念,新名詞在科技信息飛速發(fā)展的今天不斷涌現(xiàn),勢如潮水,時刻在沖擊著現(xiàn)成的信息標(biāo)檢法的圍墻和管壁?!拔疫€沒準(zhǔn)備好,你先別來”。不可能!是先有信息,后有信息標(biāo)檢法,信息標(biāo)檢法從本質(zhì)上講只能是信息的應(yīng)聲蟲,信息標(biāo)檢法在信息大潮的沖擊下和信息細(xì)流的微壓下,經(jīng)常因為沒有現(xiàn)成的對應(yīng)分類編碼不得不改變自己。
這種改變分三種情況:上位改變、同級改變和下位改變。
上位改變:因為信息標(biāo)檢法的分類系統(tǒng)本身就是一個樹狀結(jié)構(gòu),所以往上位方向發(fā)生改變的概率最小。就如同我們生活中修正領(lǐng)導(dǎo)的機(jī)會總是最少的一樣。問題多發(fā)生在同級的改變和下位的改變上,同級的改變最容易,當(dāng)一個新詞條出現(xiàn)時,直接在同伙中加一個新成員即可。如當(dāng)“火箭軍”成長為一個新兵種時,只要在“發(fā)射兵種”內(nèi)添加上“火箭軍”即可。而下位的改變就不太簡單。
下位的改變分兩種情況:新生下位和組配下位。
新生下位:當(dāng)一伙有共同特點的新詞條出現(xiàn)時,這伙新詞條就作為新的下位詞條,這些新的下位詞條以新的同級詞條的下位加入分類體系。如“特許經(jīng)營”“聯(lián)鎖經(jīng)營”“加盟經(jīng)營”以一種新的經(jīng)營模式出現(xiàn)時,它們就可構(gòu)成“聯(lián)盟經(jīng)營”的新生下位。
組配下位:當(dāng)一伙有共同特點的詞條是兩個詞條的組配結(jié)果時,則令這些詞條做這種組配項的“組配下位”。如“120相機(jī)”“135相機(jī)”“數(shù)碼相機(jī)”“照相座機(jī)”……都是“照相”和“機(jī)”的組配結(jié)果,這些具體的照相機(jī)就是組配項“照相機(jī)”的組配下位。
那么為什么不把這些具體的照相機(jī)直接納入分類系統(tǒng)呢?這是因為,全列舉的線性信息標(biāo)檢法已被證明是信息標(biāo)檢工具的大忌,分類主題法、分類組配法、組配下位法都是在當(dāng)今信息社會要精準(zhǔn)標(biāo)檢信息而用全列舉的線性信息標(biāo)檢法無能的情況下被逼出來的。全列舉工具書即使編的比城墻厚,還是解決不了問題的萬分之一!這還不是沒干活不知道活難干的問題,而是因為工具有缺陷拼命干把活也干不好的問題。
雖然前面提到的分類主題法和組配法不用列舉就可以聚焦標(biāo)檢新的詞條,但是,在信息化社會的今天,個性化生產(chǎn)要體現(xiàn)材質(zhì)、工藝、品牌等要素;產(chǎn)品商品及知識產(chǎn)權(quán)溯源要有時間、產(chǎn)地、生產(chǎn)者、品牌等要素;排山倒海的大數(shù)據(jù),其數(shù)據(jù)庫的字段名更是根據(jù)需要五花八門。
全列舉的線性信息標(biāo)檢法,在信息時代以前對信息的標(biāo)檢就已經(jīng)力不從心了。即便現(xiàn)在開發(fā)出了新的具有分類主題和組配及組配下位功能的信息標(biāo)檢法。但還不能滿足現(xiàn)代社會信息化的最高需求。現(xiàn)代社會信息化對信息標(biāo)檢工具的最高要求是全要素信息標(biāo)檢,這對信息標(biāo)檢工具來說幾乎不可能實現(xiàn),例如一個人的全信息有姓名、性別、年齡、職業(yè)、學(xué)歷、家庭、經(jīng)歷、工作能力……可能有幾十種。一件商品的全信息有品名、材質(zhì)、廠家、產(chǎn)出工藝、品牌、保質(zhì)期、使用說明、本體代碼、價格、隸屬……可能也有幾十種。而且不同信息標(biāo)的的全信息要素不盡相同。
雖然信息標(biāo)檢工具對信息的全要素標(biāo)檢做不到,但是對信息的全要素中的共性要素,也就是基本要素的標(biāo)檢還是可以做到的,經(jīng)過對大多數(shù)信息標(biāo)的的信息共有要素的提煉,信息標(biāo)的一般有9個要素。
信息的內(nèi)容有6個基本要素:分類主語、組配謂語、品牌定語、空間定語、時間定語、實用編碼(如產(chǎn)品的條碼)。信息的形式有3個基本要素:種次編碼、載體代碼、所在或所屬代碼。有了這9個要素,對信息的標(biāo)檢可以用模式化標(biāo)檢,為了便于與數(shù)據(jù)庫的銜接,可以把這9個要素作為通用數(shù)據(jù)庫的前9個基本字段,使用者可以根據(jù)自己的需要在后邊添加自己需要的字段,這樣,既解決了信息基本要素的標(biāo)檢,也為信息的標(biāo)準(zhǔn)化統(tǒng)一標(biāo)檢和信息資源共享打下了堅實的基礎(chǔ),某個商品資料數(shù)據(jù)庫如表1所示。
表1 某個商品資料數(shù)據(jù)庫
字段名ID分類主語組配謂語品牌空間時間實用編碼種次編碼載體所在待續(xù) 字段值1J248182V12000OMK52802015GS1∶692…J248182/1M862402-6…… 2Y7134M81024WZH10002016GS1∶690…Y7134/1M862402-6…… ………………………………
第一條信息:J248182=可充電手電筒,V12000=價格表,OMK=該手電筒的品牌是歐美卡,5280=該手電筒的產(chǎn)地在佛山,2015=產(chǎn)出于2015年,GS1∶6926292566083=該手電筒的GS1條碼,J248182/1=第一份可充電手電筒文件,M862=該文件載體是紙質(zhì),402-6=該文件在402室6號架,……=可續(xù)參數(shù)。
內(nèi)容解讀:2015年佛山產(chǎn)歐美卡牌可充電手電筒的價格表。
形式解讀:該文件是有關(guān)可充電手電筒的第一份文件,紙質(zhì),放在402室6號架。
非格式表述:J248182/V12000/OMK/5280/2015/692629
2566083/。
第二條信息:Y7134=豆腐乳,M81024=產(chǎn)品合格證,WZH=該腐乳的品牌是王致和,1000=該腐乳的產(chǎn)地北京。出證時間是2016年,GS1∶6907592000026是該腐乳的GS1條碼,Y7134/1=第一份腐乳文件,M862=該文件的載體是紙質(zhì),402-6=該文件在402室6號架,……=可續(xù)參數(shù)。
內(nèi)容解讀:2016年北京產(chǎn)王致和牌腐乳的產(chǎn)品合格證。
形式解讀:該文件是有關(guān)豆腐乳的第一份文件,紙質(zhì),放在402室6號架。
非格式表述:Y7134/M81024/WZH/1000/2016/690759
2000026/。
……
結(jié):模式化信息標(biāo)檢是信息資源共享的捷徑。
資源共享需要即能從宏觀對信息進(jìn)行統(tǒng)一標(biāo)檢又能從微觀對信息進(jìn)行聚焦標(biāo)檢的新的信息標(biāo)檢工具。
伴隨著社會信息化的進(jìn)步,信息標(biāo)檢的硬件和軟件也在進(jìn)步。
過去人們對信息的需求主要表現(xiàn)在對信息載體整體的標(biāo)注和檢索,硬件主要表現(xiàn)為書架、目錄柜和索書卡片;軟件主要表現(xiàn)為工具書、圖書分類法。
現(xiàn)在人們對信息的需求除了要對信息載體整體進(jìn)行標(biāo)注和檢索,還要求對信息條目的標(biāo)注和檢索。硬件方面除了文件架或和目錄柜,還要求有電腦以提高標(biāo)檢效率。軟件對信息標(biāo)檢工具的要求提高到既可以對整體又可以對條目標(biāo)檢的信息標(biāo)檢法,附機(jī)軟件有ACCESS、VB、SQL等。
將來信息業(yè)的硬件主要是網(wǎng)絡(luò),輔助以電腦、手機(jī)、數(shù)字化服裝甚至人體植入芯片。那個時候人們已經(jīng)實現(xiàn)了信息標(biāo)檢工具的統(tǒng)一標(biāo)準(zhǔn),實現(xiàn)了信息語言和自然語言的自動轉(zhuǎn)換,一次信息作為文件產(chǎn)生的同時,與之相關(guān)的信息標(biāo)著可以同步同體產(chǎn)生。任何一部手機(jī)都可以是一個信息標(biāo)檢終端,任何一部手機(jī)或附著于人體的信息載體都可以通過云平臺向云數(shù)據(jù)庫貢獻(xiàn)存入和索取信息,與之相匹配的軟件必將產(chǎn)生。
如果說以前的信息標(biāo)檢和信息用戶是各自為戰(zhàn),以后的信息標(biāo)檢是統(tǒng)籌化,也就是眾籌眾享,一處標(biāo)著,萬處索用,重復(fù)勞動最小化。現(xiàn)在的網(wǎng)絡(luò)已初具雛形,之后還有信息語言標(biāo)準(zhǔn)化、信息存取大眾化、信息內(nèi)容純凈化、信息標(biāo)檢模式化、信息表述條理化等工作要做。
[1]國家標(biāo)準(zhǔn)局.GB/T 7635.1—2002全國主要產(chǎn)品分類代碼[S].北京:中國標(biāo)準(zhǔn)出版社,2002.
[2]國家標(biāo)準(zhǔn)局.GB/T 13745—92學(xué)科分類與代碼[S].北京:中國標(biāo)準(zhǔn)出版社,1992.
[3]國家標(biāo)準(zhǔn)局.GB/T 4754—2011國民經(jīng)濟(jì)行業(yè)代碼[S].北京:中國標(biāo)準(zhǔn)出版社,2011.
[4]杜青蓮.信息分類與代碼國家標(biāo)準(zhǔn)匯編[M].北京:中國標(biāo)準(zhǔn)出版社,1988.
[5]國家圖書館.中國圖書館分類法[M].北京:國家圖書館出版社,2012.
[6]阮岡納贊.冒號分類法解說及類表[M].北京:書目文獻(xiàn)出版社,1986.
[7]全國發(fā)明者聯(lián)誼會.科技發(fā)明成果信息[M].北京:科學(xué)出版社,1987:197-198.
[8]查清海.九格信息標(biāo)檢分類主題組配法原理[N].科學(xué)導(dǎo)報,2017(17).
[9]查清海.信息標(biāo)檢基本法產(chǎn)生的原因及其應(yīng)有的特點[N].科學(xué)導(dǎo)報,2017(18).
[10]查清海.九格信息標(biāo)檢分類主題組配法標(biāo)志及簡介[N].科學(xué)導(dǎo)報,2017(19).
[11]查清海.呼吁建立信息統(tǒng)一標(biāo)檢試驗區(qū)[J].科學(xué)與財富,2018(11).
2095-6835(2019)07-0040-06
TP391.3
A
10.15913/j.cnki.kjycx.2019.07.040
查清海(1952—),男,研究方向為信息標(biāo)檢法。
〔編輯:嚴(yán)麗琴〕