這種知識網(wǎng)絡(luò)建設(shè)的落后局面使出版社在與其它企業(yè)的競爭中陷入被動局面,大部分出版社淪落為數(shù)字出版產(chǎn)業(yè)鏈上內(nèi)容提供商的角色,無法體現(xiàn)出版社在知識生產(chǎn)和傳播中的先導(dǎo)地位,出版社的經(jīng)濟利益也一再受損。所以,通過構(gòu)建出版物知識網(wǎng)絡(luò),占據(jù)數(shù)字出版產(chǎn)業(yè)鏈的高端位置,是傳統(tǒng)出版社參與數(shù)字出版產(chǎn)業(yè)競爭的必要途徑。
在數(shù)字環(huán)境下,出版業(yè)面臨著日益嚴重的矛盾,一方面?zhèn)鹘y(tǒng)書刊、電子出版物品種和網(wǎng)絡(luò)信息量急劇增加,另一方面讀者在出版物信息海洋里越來越難以找到自己所需要的知識;這既不利于出版產(chǎn)品市場的開拓,也無益于讀者的知識利用和知識再生產(chǎn)活動,出版社和讀者的價值都難以充分實現(xiàn)。為克服這一問題,出版社需借鑒情報和圖書館領(lǐng)域的知識網(wǎng)絡(luò)建設(shè)思路,根據(jù)出版物所承載的知識之間的關(guān)聯(lián)建構(gòu)知識網(wǎng)絡(luò)。
一、知識網(wǎng)絡(luò)和出版物知識網(wǎng)絡(luò)
20世紀中期以后,知識網(wǎng)絡(luò)先后成為情報學(xué)、企業(yè)管理學(xué)、認知心理學(xué)、計算機科學(xué)等學(xué)科的研究熱點。在信息管理、情報學(xué)等研究領(lǐng)域,知識網(wǎng)絡(luò)主要是針對科學(xué)研究活動中知識的組織、存儲、檢索與利用;它被認為是知識節(jié)點及其結(jié)構(gòu)與關(guān)系。在管理學(xué)界,知識網(wǎng)絡(luò)是一批人、資源和它們之間的關(guān)系,為了知識的積累和利用,通過知識創(chuàng)造、知識轉(zhuǎn)移,促進新知識的利用。在計算機科學(xué)和人工智能等研究領(lǐng)域,知識網(wǎng)絡(luò)通常是語義網(wǎng)絡(luò)、概念網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、Wordnet、Knownet和知網(wǎng)等概念的統(tǒng)稱,反映知識和概念之間的邏輯關(guān)系,被廣泛應(yīng)用于數(shù)據(jù)信息可視化、知識挖掘、知識工程、知識表示、自然語言理解等眾多領(lǐng)域。不同學(xué)科從不同研究的目的和角度出發(fā),對于知識網(wǎng)絡(luò)的內(nèi)涵認識各異,但也不難看出各領(lǐng)域?qū)χR網(wǎng)絡(luò)的三點基本共識:(1)知識網(wǎng)絡(luò)是一個集合概念,“是指由知識節(jié)點(知識單元)和知識關(guān)聯(lián)構(gòu)成的知識體系” ;(2)知識網(wǎng)絡(luò)作為一種知識存在和結(jié)構(gòu)形式,以知識間普遍存在的聯(lián)系為基礎(chǔ),借助現(xiàn)代信息技術(shù)手段實現(xiàn)知識間廣泛而復(fù)雜的鏈接;(3)知識網(wǎng)絡(luò)構(gòu)建的根本目的是提高知識利用和知識創(chuàng)新的效率。
出版物所承載的知識之間存在著普遍的、多元的、復(fù)雜的聯(lián)系。 在數(shù)字化環(huán)境下,利用一定的技術(shù)手段把相互關(guān)聯(lián)的出版物及其知識內(nèi)容鏈接起來,就構(gòu)成了以出版物為主體的知識網(wǎng)絡(luò)??梢哉J為,出版物知識網(wǎng)絡(luò)是指由各類出版物(包括書、報、刊、音像、網(wǎng)絡(luò)等載體)所承載的知識及其相互之間的鏈接而構(gòu)成的知識體系。
二、出版物知識網(wǎng)絡(luò)構(gòu)建的意義
構(gòu)建出版物知識網(wǎng)絡(luò)對于出版社的數(shù)字化轉(zhuǎn)型來說意義重大,不僅是出版社順應(yīng)數(shù)字時代知識消費需求的必要途徑,也是提高出版社數(shù)字出版競爭優(yōu)勢的有效手段。
1.順應(yīng)數(shù)字時代的知識消費需求
據(jù)中美兩國有關(guān)機構(gòu)的研究表明,數(shù)字時代知識消費者的需求和行為相對過去發(fā)生了很大變化:知識獲取上,需要無縫鏈接和自助服務(wù);知識內(nèi)容上,需要從簡單文獻獲取轉(zhuǎn)移到知識發(fā)現(xiàn),甚至支持知識創(chuàng)新;知識檢索上,需要一站式、個性化、全文化、可下載;成本上,需要最快、最省力。 傳統(tǒng)出版業(yè)通過書、刊等出版物向社會傳播知識,一本(套、系列)書、一份期刊都是一個體系完整而又獨立的知識集合體。在一種書刊的內(nèi)部,知識之間通過“目錄”“索引”等方式建立起粗略的結(jié)構(gòu)鏈接和字詞鏈接;而書刊與書刊之間的知識關(guān)聯(lián),由于受物理載體的局限,除運用“注釋”“參考文獻”等有限的技術(shù)手段表明知識關(guān)聯(lián)外,知識之間的鏈接無法建立起來。為了打破書刊知識的這種片段性、孤立性存在方式,歷史上的編輯家和出版家們發(fā)明了叢書、類書、套書、大百科全書等圖書體裁,主要通過分類、集合等方式建立起出版物知識的鏈接。但這些鏈接所反映的知識之間的關(guān)聯(lián)比較單一、膚淺、片面和有限,根本無法滿足數(shù)字環(huán)境下讀者對知識消費的需要??梢姡瑸轫槕?yīng)知識消費方式的轉(zhuǎn)變,出版社需要改變傳統(tǒng)的知識提供和知識服務(wù)模式,建立起規(guī)模龐大的、功能健全的、相互之間可互通互聯(lián)的知識網(wǎng)絡(luò)。
2.提升在數(shù)字出版產(chǎn)業(yè)鏈中的競爭優(yōu)勢
相對于圖書館界和信息搜索行業(yè)來說,出版行業(yè)的知識網(wǎng)絡(luò)建設(shè)遠遠落后。圖書館界在情報學(xué)理論的指引下,在20世紀后半期就開始了數(shù)字圖書館建設(shè),努力構(gòu)建囊括人類所有文獻知識在內(nèi)的知識網(wǎng)絡(luò);以谷歌、百度為代表的新興信息搜索服務(wù)公司,先后推出了基于知識關(guān)聯(lián)的學(xué)術(shù)搜索和知識圖譜功能。近年來,數(shù)字圖書館和搜索型IT公司依靠強大的知識網(wǎng)絡(luò)提供便捷優(yōu)質(zhì)的服務(wù)而獲得高額的經(jīng)濟回報。而對于絕大部分出版社來說,基于出版物的知識網(wǎng)絡(luò)還沒有建立起來;在數(shù)字化轉(zhuǎn)型中,不少出版社雖然嘗試提供電子書刊、數(shù)據(jù)庫等數(shù)字化產(chǎn)品,但在知識組織和產(chǎn)品開發(fā)上仍拘泥于傳統(tǒng)的編輯出版方式,或改變知識載體和傳播方式,或改變知識的存在單元,而對傳統(tǒng)以(書)本、(刊)期、(論文)篇等為存在單元的知識內(nèi)部及相互之間深入、本質(zhì)的關(guān)聯(lián)缺乏有效關(guān)注。這種知識網(wǎng)絡(luò)建設(shè)的落后局面使出版社在與其他企業(yè)的競爭中陷入被動局面,大部分出版社淪落為數(shù)字出版產(chǎn)業(yè)鏈上內(nèi)容提供商的角色,在商業(yè)博弈中往往處于大型圖書館和谷歌、百度等公司的下風(fēng),無法體現(xiàn)出版社在知識生產(chǎn)和傳播中的先導(dǎo)地位,出版社的經(jīng)濟利益也一再受損。所以,通過構(gòu)建出版物知識網(wǎng)絡(luò),占據(jù)數(shù)字出版產(chǎn)業(yè)鏈的高端位置,是傳統(tǒng)出版社參與數(shù)字出版產(chǎn)業(yè)競爭的必要途徑。
三、出版物知識網(wǎng)絡(luò)的構(gòu)成要素
出版物知識網(wǎng)絡(luò)的構(gòu)成要素包括知識節(jié)點、知識關(guān)聯(lián)和知識鏈接。
1.知識節(jié)點
在知識網(wǎng)絡(luò)結(jié)構(gòu)中,知識節(jié)點是由在認識上可以相對獨立存在的各種知識單體形態(tài),即在認識上具有獨立性的知識元、知識單元構(gòu)成。 傳統(tǒng)以(書)本、(刊)期為基本物理單位的出版物是一個由多層次知識單元構(gòu)成的知識集合體,其知識內(nèi)容具有相對的完整性、系統(tǒng)性和獨立性。但從載體形式特點和內(nèi)容組織看,單個出版物的知識單元可分為三個基本層次:出版物、篇章和知識元。(1)出版物。如一本書、一期期刊、一份報紙等。(2)篇章。一個出版物的內(nèi)容由數(shù)量豐富、顆粒更小的知識單元組成,其中,書籍內(nèi)容的基本構(gòu)成單元是章節(jié),期刊的基本構(gòu)成單元是單篇的文章;出版物內(nèi)部的這些篇章也是相對獨立的知識單元。(3)知識元。當(dāng)知識單元被切分到“不可再分割的具有完備知識表達”的程度時,就達到了出版物內(nèi)容知識的最小單元,即知識元。知識元“是構(gòu)成知識結(jié)構(gòu)的最小獨立單元”,用來表示一個個針對特定問題的解決方案。根據(jù)主題或表達的內(nèi)容,知識元又可分為三種類型:理論與方法型知識元、事實型知識元和數(shù)值型知識元。在如上三個層次的知識單元中,知識元是最基本、最活躍的知識體,知識元之間的排列和組合方式的變化是新知識生產(chǎn)的一個重要途徑。
出版物具有物質(zhì)和精神雙重屬性,與此相對應(yīng),出版物的三層知識網(wǎng)絡(luò)節(jié)點也具有內(nèi)在和外在的雙重屬性。內(nèi)在屬性指出版物內(nèi)容知識的本質(zhì)屬性,反映知識與它所認識的客觀事物的關(guān)系,從這個角度也可將出版物中的知識節(jié)點稱為“概念”“事物”“規(guī)律”“規(guī)則”“學(xué)科”等。外在屬性是由于知識內(nèi)容的表達、識別、傳播和版權(quán)歸屬等需要所附帶的知識,包括名稱(標題)、作者、出版者、出版時間、出版地區(qū)(網(wǎng)址)、類型、載體形式等信息,這些信息實際上組成了獨立知識節(jié)點的“身份識別系統(tǒng)”,反映它所對應(yīng)的知識內(nèi)容的客觀存在性,是知識的知識,在數(shù)據(jù)庫中被稱為關(guān)于知識的“元數(shù)據(jù)”。
2.知識關(guān)聯(lián)
知識關(guān)聯(lián)是指構(gòu)成知識網(wǎng)絡(luò)的知識節(jié)點之間的聯(lián)系,是使各相關(guān)節(jié)點間形成意義系統(tǒng)的聯(lián)系。 出版知識網(wǎng)絡(luò)中的知識關(guān)聯(lián)是指出版物的知識單元(包括出版物,出版物中的篇章,知識元、句子、詞語等知識內(nèi)容)之間存在的各種聯(lián)系的總和?!叭魏我环N知識的屬性都可能作為一種關(guān)聯(lián)屬性構(gòu)成知識網(wǎng)絡(luò)”。 由于出版物知識節(jié)點具有雙重屬性,出版物知識單元之間的關(guān)聯(lián)也包括內(nèi)在屬性關(guān)聯(lián)和外在屬性關(guān)聯(lián)兩種。出版物知識的內(nèi)在屬性關(guān)聯(lián)是知識所描述的事物之間相互內(nèi)在的聯(lián)系性決定的,這種內(nèi)在的聯(lián)系一般表現(xiàn)為知識單元之間具有的同一性、隸屬性和相關(guān)性關(guān)聯(lián)。同一性關(guān)聯(lián)指知識節(jié)點間具有的某種相同性質(zhì)所形成的關(guān)聯(lián),是知識節(jié)點繼承性的表現(xiàn);它導(dǎo)致具有相同性質(zhì)的知識節(jié)點以同一性構(gòu)成聯(lián)系并相聚形成學(xué)科、專業(yè)的知識單元集合、網(wǎng)絡(luò)。隸屬性關(guān)聯(lián)指某一知識單元或知識單元集合隸屬于某一概念、范疇和類別的邏輯關(guān)系;它反映了知識單元之間一般和個別、總體和部分的內(nèi)在關(guān)系。相關(guān)性關(guān)聯(lián)是指在同一、隸屬關(guān)系之外知識單元間所具有的相互依存、相互滲透、相互制約、相互作用、互為中介的關(guān)系,一般是指相反、相對、因果、引用、應(yīng)用、影響等各種關(guān)系。出版知識的外在屬性關(guān)聯(lián)就是知識的外在屬性之間的各種聯(lián)系,如學(xué)術(shù)論文作者之間的聯(lián)系、某學(xué)術(shù)問題研究的時間和地區(qū)分布等。通常來說,外在屬性關(guān)系簡單明確,很容易被發(fā)現(xiàn)識別并加以利用;而內(nèi)在屬性關(guān)系復(fù)雜多樣,動態(tài)性較強,有的知識關(guān)系只能由領(lǐng)域?qū)<野l(fā)現(xiàn)和建立。
3.知識鏈接
在出版物知識網(wǎng)絡(luò)里,知識鏈接是指利用數(shù)字技術(shù)手段,將具有內(nèi)在或外在屬性關(guān)聯(lián)的出版物知識單元鏈接起來,構(gòu)成序列化或結(jié)構(gòu)化的知識網(wǎng)絡(luò)的一種知識組織方式。 在出版物所構(gòu)建的知識世界里,知識之間的關(guān)聯(lián)是客觀存在的,同時也可能是隱性的;通過知識鏈接,不僅可以使隱性關(guān)聯(lián)顯性化,實現(xiàn)現(xiàn)有知識之間的互聯(lián)互通,還可以發(fā)現(xiàn)新的知識。在當(dāng)下的信息技術(shù)環(huán)境下,不同知識單元聯(lián)系在一起的技術(shù)和方法有:傳統(tǒng)的目錄法、索引法、引用法,現(xiàn)代的超文本鏈接、主題網(wǎng)關(guān)、參考鏈接等。由于作為知識鏈接的對象是各種各樣的知識單元,知識的顆粒度不同,知識內(nèi)在屬性和外在屬性不同,出版物知識之間的知識鏈接異常復(fù)雜。按照知識單元從大到小來劃分,出版物知識單元之間的鏈接形式可分為基于出版物單元的知識鏈接(也稱為參考文獻鏈接或引文鏈接)、基于信息單元的知識鏈接(也稱為知識屬性鏈接)和基于知識元的知識鏈接(也稱為知識邏輯鏈接或語義鏈接)。這三種知識鏈接形式,能使知識顆粒度由大到小,表現(xiàn)形式由粗到細,對象內(nèi)容由表及里地對各種類型和屬性的知識進行全方位的網(wǎng)絡(luò)鏈接,為出版知識構(gòu)建一個完整的知識網(wǎng)絡(luò)體系。
四、出版物知識網(wǎng)絡(luò)構(gòu)建的類型
從知識節(jié)點的顆粒大小、屬性差異和知識關(guān)聯(lián)的鏈接方式看,目前國內(nèi)由出版社主導(dǎo)或參與建設(shè)的出版物知識網(wǎng)絡(luò)主要有三類:元數(shù)據(jù)知識網(wǎng)絡(luò)、全文出版網(wǎng)絡(luò)和知識元網(wǎng)絡(luò)。
1.元數(shù)據(jù)知識網(wǎng)絡(luò)
出版物的元數(shù)據(jù)是規(guī)定出版物外在屬性的附屬性知識,由這些知識集合并按照一定需要建立起鏈接關(guān)系的知識體系即是元數(shù)據(jù)知識網(wǎng)絡(luò)。該類知識網(wǎng)絡(luò)最早源自出版社紙質(zhì)版的圖書目錄或期刊題錄等,伴隨著出版網(wǎng)絡(luò)發(fā)行渠道的興起而產(chǎn)生,在互聯(lián)網(wǎng)上讀者可以通過它方便地查閱到其中的圖書信息及圖書之間的外部屬性聯(lián)系,如書刊名、(期刊中文章)標題、作者、出版時間、學(xué)科分類、定價等;但通過這些信息還不能鏈接到它所指向的知識內(nèi)容本身。目前大多數(shù)出版社都實現(xiàn)了此類知識網(wǎng)絡(luò)的開發(fā)和利用,其中最具代表性的是中國出版集團公司于2006年開始建設(shè)“中國可供書目數(shù)據(jù)庫”。到2011年,該庫收入書目數(shù)據(jù)200多萬條,覆蓋了90%的出版社的80%以上品種;實現(xiàn)了全國書目信息動態(tài)采集、更新、發(fā)布和服務(wù),具備瀏覽與檢索的全部功能,可以及時向市場傳播圖書產(chǎn)品信息,動態(tài)更新產(chǎn)品可供應(yīng)的狀態(tài)。 元數(shù)據(jù)知識網(wǎng)絡(luò)雖然還沒有涉及出版物的知識內(nèi)容,但也打破了出版物孤立、靜止的存在狀態(tài),使傳統(tǒng)出版物借助該知識網(wǎng)絡(luò)實現(xiàn)了生命周期的延伸。
2.全文知識網(wǎng)絡(luò)
一些出版社為了實現(xiàn)知識內(nèi)容的多渠道發(fā)布、多介質(zhì)傳播,以整本出版物(包含全部的知識內(nèi)容及附屬信息)或出版物的篇章為節(jié)點構(gòu)建全文知識網(wǎng)絡(luò),實現(xiàn)了知識元數(shù)據(jù)和知識內(nèi)容本身的同步網(wǎng)絡(luò)傳播。此類知識網(wǎng)絡(luò)是目前國內(nèi)出版社建設(shè)的主要形式。例如,人民交通出版社研發(fā)的“中國交通知識服務(wù)數(shù)字出版平臺”, 到2012年年底已經(jīng)上線該社電子書11798種,外購電子資源45819種;上線交通專業(yè)科技詞典類工具書68種,交通標準1584種;共形成交通標準、工具書、史書、教材教輔等6大品種的交通專業(yè)數(shù)據(jù)庫。在功能上,可以通過關(guān)鍵詞跨庫檢索、全文閱讀和下載。2009年,社會科學(xué)文獻出版社正式上線銷售的皮書數(shù)據(jù)庫,以連續(xù)性皮書系列為基礎(chǔ),囊括了近20年間數(shù)千名研究人員的年度報告類科研成果,內(nèi)容涉及經(jīng)濟、社會、文化、教育、金融等百余個行業(yè)和領(lǐng)域;內(nèi)容以篇章為基本單位;具有整合、審編、發(fā)布、管理、檢索瀏覽、版權(quán)保護、輸出流量統(tǒng)計、操作日志管理、計費管理等功能;庫內(nèi)所有篇章的文獻題目、內(nèi)容提要、作者名稱、作者單位、關(guān)鍵字等基本信息都可進行在線檢索,可在線閱讀或下載閱讀。 該類知識網(wǎng)絡(luò)實現(xiàn)了出版物內(nèi)容與外部屬性信息之間的關(guān)聯(lián)和鏈接,同時也打破了傳統(tǒng)出版物以本(冊)為單元的傳播方式,使知識節(jié)點細化到篇章層次。但是,構(gòu)成它知識節(jié)點的知識單元顆粒仍然太大,知識鏈接主要依據(jù)知識外部屬性之間的關(guān)聯(lián)發(fā)出,知識之間內(nèi)在的本質(zhì)聯(lián)系還沒有被挖掘出來。
3.知識元網(wǎng)絡(luò)
知識元網(wǎng)絡(luò)就是以知識元為基本知識節(jié)點所構(gòu)成的知識體系,其中,知識元之間的內(nèi)部屬性和外部屬性之間的關(guān)聯(lián)都是通過語義鏈接實現(xiàn)的。知識元及其語義鏈接,在知識網(wǎng)絡(luò)有機構(gòu)建和功能發(fā)揮中起著獨特的主導(dǎo)作用;知識元語義鏈接表示的是知識之間內(nèi)在屬性的邏輯關(guān)聯(lián)(也稱為語義關(guān)聯(lián)),在此基礎(chǔ)上所構(gòu)建的內(nèi)容交互的邏輯知識網(wǎng)絡(luò),能還原知識關(guān)聯(lián)的本來面目。這有益于消除信息孤島,提升知識自由集成服務(wù)能力,是用戶挖掘知識、組合知識、利用知識和創(chuàng)新知識的有力工具。 可見,知識元網(wǎng)絡(luò)對用戶的知識利用和知識創(chuàng)新的價值超過其他的知識網(wǎng)絡(luò),是知識網(wǎng)絡(luò)建設(shè)的最高層次,但也是建設(shè)難度最大的一類。目前可見的一個知識元網(wǎng)絡(luò)是“醫(yī)學(xué)知識庫”。它由人民軍醫(yī)出版社、解放軍醫(yī)學(xué)圖書館聯(lián)合研發(fā)的醫(yī)學(xué)類專業(yè)知識網(wǎng)絡(luò),它抽取醫(yī)學(xué)圖書中的知識元并將其重組,進行結(jié)構(gòu)形式上的歸納、選擇、整理,以疾病為知識核心,包括疾病、藥品、手術(shù)、輔助檢查、循證證據(jù)、疾病研究進展、醫(yī)保藥品、手術(shù)圖譜、臨床操作規(guī)范等相關(guān)知識,并且通過這些知識之間的內(nèi)在聯(lián)系將其有機地結(jié)合起來。 從知識節(jié)點及知識鏈接看,“醫(yī)學(xué)知識庫”以疾病及其相關(guān)領(lǐng)域的知識元為節(jié)點,主要通過庫內(nèi)知識超鏈接的方式,實現(xiàn)知識間的關(guān)聯(lián),知識獲取的精準性和便捷性很高;但該庫還是一個相對封閉的體系,庫內(nèi)知識元無法與外部知識進行鏈接;同時,其中的知識元及其鏈接都是預(yù)先設(shè)定的,不能根據(jù)用戶需求生成新的知識元及其與其他知識間的鏈接??梢?,“醫(yī)學(xué)知識庫”還是一個“入門級”的知識元網(wǎng)絡(luò)。
如上三類知識網(wǎng)絡(luò)分別代表了我國出版物知識網(wǎng)絡(luò)的基礎(chǔ)階段、過渡階段和目標階段的發(fā)展水平。但是,由于這些知識網(wǎng)絡(luò)大多以單個出版社資源為基礎(chǔ)建設(shè),知識網(wǎng)絡(luò)的規(guī)模普遍較小,知識網(wǎng)內(nèi)部的知識鏈接路徑有限,不同的知識網(wǎng)絡(luò)之間不能互聯(lián)互通,這既不利于讀者們的知識利用,也無法充分實現(xiàn)出版物的知識價值。所以,在當(dāng)下的數(shù)字化轉(zhuǎn)型過程中,出版社需要以這三類知識網(wǎng)絡(luò)為基礎(chǔ),繼續(xù)提高知識網(wǎng)絡(luò)的建設(shè)水平。
五、結(jié)語
構(gòu)建出版物知識網(wǎng)絡(luò)是出版社數(shù)字化轉(zhuǎn)型中的有效途徑,但目前我國的出版物知識網(wǎng)絡(luò)的建設(shè)還很不成熟。出版社需要通過相互間廣泛而深入的合作,共同開發(fā)和構(gòu)建基于知識互聯(lián)的、價值共享的知識網(wǎng)絡(luò),以滿足數(shù)字時代的讀者需求和出版產(chǎn)業(yè)健康發(fā)展需要。
(作者單位:張新華,北京印刷學(xué)院;龔賽群,湖南省交通科學(xué)研究院《公路工程》編輯部)
【本文受“教育部人文社科青年項目價值網(wǎng)視角下的數(shù)字出版商業(yè)模式創(chuàng)新研究”“北京市教委人才強教深化計劃——骨干教師項目(編號:06170113004)”支持】