涂佳琪,楊新涯,王彥力
數(shù)據(jù)庫(kù)是數(shù)字圖書(shū)館的文獻(xiàn)資源基礎(chǔ),數(shù)據(jù)庫(kù)的歷史就是另外一個(gè)角度的數(shù)字圖書(shū)館發(fā)展歷史。CNKI(China National Knowledge Infrastructure,中國(guó)知識(shí)基礎(chǔ)設(shè)施)工程是以實(shí)現(xiàn)全社會(huì)知識(shí)資源傳播共享與增值利用為目標(biāo)的信息化建設(shè)項(xiàng)目,其服務(wù)網(wǎng)站——中國(guó)知網(wǎng)是全球最大的中文知識(shí)門(mén)戶(hù),由《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》電子雜志社有限公司、同方知網(wǎng)(北京)技術(shù)有限公司、同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司等單位聯(lián)合運(yùn)營(yíng),是在《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》《中國(guó)期刊網(wǎng)》基礎(chǔ)上發(fā)展起來(lái)的中外文大型知識(shí)資源總庫(kù),是我國(guó)數(shù)字圖書(shū)館建設(shè)的重要參與者和見(jiàn)證者,甚至有學(xué)者認(rèn)為《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》的發(fā)布是我國(guó)進(jìn)入數(shù)字圖書(shū)館時(shí)代的標(biāo)志和里程碑①。
目前研究數(shù)字圖書(shū)館歷史的文獻(xiàn)主要集中在兩方面:一是數(shù)字圖書(shū)館系統(tǒng)的歷史演變,如莫少?gòu)?qiáng)總結(jié)1980-2012年廣東省立中山圖書(shū)館自動(dòng)化建設(shè)的6個(gè)時(shí)期[1];許天才等梳理重慶大學(xué)圖書(shū)館從自動(dòng)化管理系統(tǒng)到智慧圖書(shū)館系統(tǒng)研發(fā)過(guò)程中的成功案例、困難與挑戰(zhàn)[2]。二是圖書(shū)館發(fā)展歷程中某項(xiàng)技術(shù)的應(yīng)用史,如劉慧云等認(rèn)為縮微技術(shù)是文獻(xiàn)資源長(zhǎng)期保存的重要技術(shù)和手段,并梳理縮微技術(shù)在圖書(shū)館的實(shí)踐歷程,指出數(shù)字縮微是縮微技術(shù)的發(fā)展方向[3]。
我國(guó)數(shù)據(jù)庫(kù)建設(shè)始于20世紀(jì)80年代,90年代后期才逐漸商品化和產(chǎn)業(yè)化,因此研究數(shù)據(jù)庫(kù)歷史的文獻(xiàn)較少,大多將數(shù)據(jù)庫(kù)作為樣本來(lái)源進(jìn)行計(jì)量分析[4],或?qū)Ρ确治龆鄠€(gè)數(shù)據(jù)庫(kù)的期刊重復(fù)率、更新速度、檢索功能等內(nèi)容[5],再或是研究數(shù)據(jù)庫(kù)某一優(yōu)勢(shì)或特色[6-8]。對(duì)于CNKI的研究?jī)H包括它對(duì)某一行業(yè)或領(lǐng)域的影響,如薛培榮等從CNKI的資源基礎(chǔ)、服務(wù)領(lǐng)域、產(chǎn)業(yè)模式、國(guó)際競(jìng)爭(zhēng)與合作等方面論述其對(duì)科技信息服務(wù)的影響[9],王青梳理了1996-2000年CNKI對(duì)圖書(shū)館帶來(lái)的影響和變化[10]。有3篇文獻(xiàn)著重研究CNKI發(fā)展歷史,其中李柯回顧了1995-1999年CNKI的發(fā)展歷程以及取得的社會(huì)經(jīng)濟(jì)效益[11];朱素蘭等回顧1995-2004年CNKI的發(fā)展歷程,總結(jié)其發(fā)展經(jīng)驗(yàn),展望了全文數(shù)據(jù)庫(kù)檢索系統(tǒng)的發(fā)展方向[12];趙蓉英等認(rèn)為1995-2004年CNKI經(jīng)歷了光盤(pán)版、網(wǎng)絡(luò)版和知識(shí)服務(wù)平臺(tái)3個(gè)時(shí)代,梳理各時(shí)代重要事件和主要成就,指出CNKI對(duì)促進(jìn)我國(guó)知識(shí)信息服務(wù)產(chǎn)業(yè)發(fā)展發(fā)揮著重要作用[13]。總之,對(duì)CNKI發(fā)展的研究主要集中在2006年之前,2006年后13年間鮮有學(xué)者研究其歷史發(fā)展,而這一時(shí)期CNKI正處于高速發(fā)展階段,值得關(guān)注和重點(diǎn)研究。
CNKI歷經(jīng)數(shù)字圖書(shū)館的興起與繁榮,推動(dòng)了我國(guó)圖書(shū)館事業(yè)發(fā)展,因此CNKI發(fā)展歷史是我國(guó)數(shù)字圖書(shū)館史和圖書(shū)館技術(shù)史不可缺失的部分。為研究CNKI的發(fā)展歷史,筆者2018年12月4日前往CNKI總部采訪(fǎng)并參觀多條生產(chǎn)線(xiàn),詳細(xì)了解CNKI產(chǎn)品、技術(shù)及其在出版模式上的創(chuàng)新等。同時(shí),筆者就CNKI發(fā)展脈絡(luò)、核心技術(shù)、自主研發(fā)產(chǎn)品和未來(lái)發(fā)展分別采訪(fǎng)CNKI常務(wù)副總經(jīng)理張宏偉,副總經(jīng)理張振海、劉學(xué)東、張義民等親歷者。為保證資料的客觀性,同時(shí)調(diào)研了長(zhǎng)期接觸數(shù)據(jù)庫(kù)采購(gòu)的館員、使用且持續(xù)關(guān)注數(shù)據(jù)庫(kù)發(fā)展的學(xué)者,了解其對(duì)CNKI等數(shù)據(jù)庫(kù)商的發(fā)展和看法。在整個(gè)研究過(guò)程中,筆者深感CNKI在整個(gè)發(fā)展進(jìn)程中,一直努力堅(jiān)持自主創(chuàng)新,從底層數(shù)據(jù)庫(kù)到全文搜索技術(shù),從最初的光盤(pán)到完整的互聯(lián)網(wǎng)服務(wù)體系,從單一的面向圖書(shū)館服務(wù)到產(chǎn)業(yè)鏈的整合,使自主創(chuàng)新成為CNKI發(fā)展的最大特色。2019年5月,美國(guó)商務(wù)部工業(yè)和安全局宣布把華為公司列入“實(shí)體名單”,包括安卓操作系統(tǒng)在內(nèi)的多個(gè)核心技術(shù)受到封鎖。我國(guó)只有且必須自主開(kāi)發(fā)核心信息技術(shù)體系,這折射出知識(shí)服務(wù)領(lǐng)域的科技創(chuàng)新自主性的重要價(jià)值。在這樣的背景下,研究并總結(jié)CNKI等以自主創(chuàng)新為特色的數(shù)據(jù)庫(kù)商的發(fā)展過(guò)程與經(jīng)驗(yàn),就顯得尤為重要。
截至2018年12月,CNKI累計(jì)整合國(guó)內(nèi)外期刊文獻(xiàn)總量達(dá)2億多篇、題錄3億多條、統(tǒng)計(jì)數(shù)據(jù)2.6億條、知識(shí)條目10億條、圖片5000萬(wàn)張,日更新數(shù)據(jù)達(dá)24萬(wàn)條,在全球53個(gè)國(guó)家和地區(qū)擁有2.7萬(wàn)多個(gè)機(jī)構(gòu)用戶(hù)、1.2億個(gè)人用戶(hù),網(wǎng)站日訪(fǎng)問(wèn)量1600余萬(wàn)人次,年下載量23.3億篇次,已成為最大的中文數(shù)據(jù)庫(kù)服務(wù)商。
通過(guò)分析公開(kāi)文獻(xiàn)和訪(fǎng)談資料,筆者將CNKI的發(fā)展過(guò)程分為5個(gè)階段:(1)創(chuàng)業(yè)期。《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》發(fā)布,開(kāi)創(chuàng)中國(guó)數(shù)字出版先河,推動(dòng)我國(guó)文獻(xiàn)資源數(shù)字化和網(wǎng)絡(luò)化進(jìn)程,在我國(guó)數(shù)字圖書(shū)館發(fā)展過(guò)程中具有劃時(shí)代意義。(2)戰(zhàn)略形成與規(guī)模初具期?!吨袊?guó)期刊網(wǎng)》開(kāi)通,推動(dòng)學(xué)術(shù)期刊進(jìn)入全文網(wǎng)絡(luò)檢索時(shí)代,推動(dòng)圖書(shū)館資源數(shù)字化建設(shè)。(3)規(guī)?;c標(biāo)準(zhǔn)化建設(shè)期。《中國(guó)知識(shí)資源總庫(kù)》問(wèn)世,整合資源規(guī)?;M(jìn)一步豐富館藏,制定數(shù)字化出版標(biāo)準(zhǔn),推動(dòng)國(guó)內(nèi)數(shù)字資源標(biāo)準(zhǔn)化建設(shè)。(4)內(nèi)容生產(chǎn)與規(guī)模多元化期。重視國(guó)際合作,實(shí)現(xiàn)知識(shí)信息資源的社會(huì)化共享與國(guó)際化傳播。(5)總體架構(gòu)實(shí)現(xiàn)期。推進(jìn)知識(shí)管理與服務(wù),實(shí)現(xiàn)移動(dòng)知識(shí)服務(wù),提升圖書(shū)館對(duì)終端讀者的精準(zhǔn)服務(wù)能力,推動(dòng)了圖書(shū)館由數(shù)字化走向智慧化的進(jìn)程。
圖1 中國(guó)知網(wǎng)CNKI的發(fā)展脈絡(luò)圖
20世紀(jì)90年代初期,計(jì)算機(jī)和計(jì)算機(jī)技術(shù)普及,行業(yè)內(nèi)開(kāi)始嘗試用光盤(pán)存儲(chǔ)資源進(jìn)行檢索。1992年我國(guó)第一張CD多媒體光盤(pán)由北京金盤(pán)有限電子公司出版[14],CD光盤(pán)的出現(xiàn)為圖書(shū)館資料提供了新的存儲(chǔ)介質(zhì),使信息資源數(shù)字集成、整合與傳播成為可能。1993年中國(guó)科技情報(bào)研究所重慶分所實(shí)現(xiàn)文獻(xiàn)題錄檢索[15]。盡管這些技術(shù)逐步發(fā)展,但是未解決一、二次文獻(xiàn)資源的關(guān)聯(lián)問(wèn)題,學(xué)者使用光盤(pán)檢索后仍需通過(guò)紙本資源獲取一次文獻(xiàn)。
1.1.1 靈感萌發(fā),從題錄摘要到全文
1995年初CNKI創(chuàng)始人、北京清華信息系統(tǒng)工程公司總經(jīng)理王明亮通過(guò)分析《中國(guó)婦女》全文光盤(pán)的數(shù)據(jù)格式受到啟發(fā),提出“版面顯示+全文檢索技術(shù),可形成供全文檢索、原版瀏覽,且數(shù)據(jù)量小、便于CD存儲(chǔ)和窄帶傳輸,并可長(zhǎng)期保存和二次開(kāi)發(fā)的實(shí)用化電子文檔數(shù)據(jù)庫(kù)系統(tǒng)”,并憑借科研、教學(xué)、學(xué)習(xí)經(jīng)驗(yàn),以及對(duì)光盤(pán)、學(xué)術(shù)期刊出版、印刷等行業(yè)的了解,提出《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》(CAJ-CD)項(xiàng)目的經(jīng)營(yíng)方案,于1995年8月被列為清華大學(xué)科研和產(chǎn)業(yè)化開(kāi)發(fā)項(xiàng)目[10]。
1.1.2 CAJ-CD誕生,開(kāi)創(chuàng)數(shù)字出版先河
1996年1月,北京清華信息系統(tǒng)工程公司(以下簡(jiǎn)稱(chēng)“清華信息公司”)將光盤(pán)存儲(chǔ)技術(shù)與現(xiàn)代信息檢索技術(shù)結(jié)合,不僅維持收錄紙本期刊的原貌,實(shí)現(xiàn)文獻(xiàn)檢索從題錄摘要向期刊全文轉(zhuǎn)變,而且基本實(shí)現(xiàn)與紙本期刊同步出版。經(jīng)過(guò)與期刊界、學(xué)術(shù)界展開(kāi)廣泛合作,創(chuàng)辦了“國(guó)內(nèi)外首個(gè)大規(guī)模集成學(xué)術(shù)期刊并與其同步出版的電子期刊——CAJ-CD”。經(jīng)新聞出版總署批準(zhǔn),1996年12月24日,CAJ-CD首次以電子書(shū)號(hào)方式正式出版我國(guó)自1994年以來(lái)2000多種學(xué)術(shù)期刊全文[10];1997年9月,CAJ-CD獲準(zhǔn)出版中國(guó)大陸首批8個(gè)連續(xù)型電子出版物,標(biāo)志著我國(guó)第一個(gè)以電子期刊方式按月連續(xù)出版的大型集成化學(xué)術(shù)期刊現(xiàn)刊原版全文數(shù)據(jù)庫(kù)誕生[16]。
CAJ-CD作為我國(guó)自主研發(fā)的“首個(gè)原版顯示+全文檢索的全文數(shù)據(jù)庫(kù)管理系統(tǒng)”,從功能設(shè)計(jì)到技術(shù)方案均達(dá)到“國(guó)際領(lǐng)先水平”,得到中宣部出版局、新聞出版總署、教育部等的指導(dǎo)和支持,獲得1998年教育部科技進(jìn)步三等獎(jiǎng)。
為了擴(kuò)大CAJ-CD的影響,1997年3月31日至4月11日,清華信息公司先后在國(guó)內(nèi)建立300多家檢索咨詢(xún)站[17],向國(guó)內(nèi)外廣大用戶(hù)提供全文檢索服務(wù),迅速占領(lǐng)國(guó)內(nèi)圖書(shū)情報(bào)市場(chǎng)。1998年7月,在“1998年美國(guó)圖書(shū)館協(xié)會(huì)年會(huì)”上,CAJ-CD受到各國(guó)圖書(shū)館代表的強(qiáng)烈關(guān)注,迅速在海外著名公共圖書(shū)館、重點(diǎn)大學(xué)圖書(shū)館等設(shè)立中國(guó)學(xué)術(shù)期刊文獻(xiàn)檢索站[11],中國(guó)學(xué)術(shù)文獻(xiàn)資源開(kāi)始走向世界。
CAJ-CD解決了圖書(shū)館館舍緊張的問(wèn)題,滿(mǎn)足了圖情單位“以有限經(jīng)費(fèi)采集盡可能多的文獻(xiàn)”的需求,豐富了館藏資源,成為中國(guó)圖書(shū)館進(jìn)入數(shù)字圖書(shū)館時(shí)代的重要標(biāo)志。CAJ-CD作為中國(guó)第一個(gè)全文數(shù)據(jù)庫(kù),創(chuàng)辦伊始即在國(guó)家版權(quán)局版權(quán)司的指導(dǎo)下,創(chuàng)建通過(guò)學(xué)術(shù)期刊編輯部解決文獻(xiàn)著作權(quán)的使用授權(quán)模式,與每一個(gè)編輯部簽訂授權(quán)協(xié)議,這對(duì)我國(guó)數(shù)字出版產(chǎn)業(yè)與數(shù)字圖書(shū)館的發(fā)展具有重要意義和示范作用。
1995年我國(guó)互聯(lián)網(wǎng)接入美國(guó)64K專(zhuān)線(xiàn),開(kāi)始向社會(huì)提供互聯(lián)網(wǎng)接入服務(wù),各單位亦紛紛組建局域網(wǎng)。隨后網(wǎng)易、搜狐、新浪等門(mén)戶(hù)網(wǎng)站相繼成立[18],加速了互聯(lián)網(wǎng)的普及與滲透,人們使用互聯(lián)網(wǎng)的頻率與日俱增,因此CNKI開(kāi)始向互聯(lián)網(wǎng)轉(zhuǎn)型。
1.2.1 CJN開(kāi)通,從光盤(pán)檢索到網(wǎng)絡(luò)檢索
1999年6月18日,在整合CAJ-CD數(shù)字資源的基礎(chǔ)上,CNKI開(kāi)通“中國(guó)期刊網(wǎng)”(www.chinajournal.net.cn,簡(jiǎn)稱(chēng)CJN),以全文形式開(kāi)展網(wǎng)絡(luò)期刊資源服務(wù),初步實(shí)現(xiàn)了全文檢索從光盤(pán)到網(wǎng)絡(luò)的轉(zhuǎn)變,文獻(xiàn)檢索進(jìn)入全文網(wǎng)絡(luò)檢索時(shí)代。此外,為方便檢索,打破時(shí)間、網(wǎng)絡(luò)出口帶寬和上網(wǎng)通訊費(fèi)的限制,CNKI將全國(guó)360多家單機(jī)、局域網(wǎng)光盤(pán)檢索系統(tǒng)升級(jí)為鏡像站點(diǎn),便于保存數(shù)字館藏,集中管理內(nèi)網(wǎng)服務(wù)[19]。
CJN匯聚我國(guó)中英文學(xué)術(shù)期刊精華,向國(guó)內(nèi)外廣大用戶(hù)提供檢索咨詢(xún)等信息網(wǎng)絡(luò)服務(wù),提高了圖書(shū)館閱覽服務(wù)質(zhì)量和參考咨詢(xún)服務(wù)水平。
1.2.2 《中國(guó)知識(shí)資源總庫(kù)》起步,逐步建設(shè)系列知識(shí)倉(cāng)庫(kù)
1999年CJN開(kāi)通之際,即制定了全面打通知識(shí)生產(chǎn)、傳播、擴(kuò)散與利用全過(guò)程,建設(shè)中國(guó)知識(shí)基礎(chǔ)設(shè)施的戰(zhàn)略目標(biāo)。2002年底,CNKI已經(jīng)整合4000多種重要學(xué)術(shù)期刊,建成國(guó)內(nèi)首個(gè)高質(zhì)量學(xué)術(shù)期刊全文檢索與評(píng)價(jià)數(shù)據(jù)庫(kù)《中國(guó)期刊全文數(shù)據(jù)庫(kù)》。以此為基礎(chǔ),建設(shè)了優(yōu)秀博碩士學(xué)位論文、報(bào)紙、會(huì)議論文、科學(xué)文獻(xiàn)、專(zhuān)利、圖書(shū)等一系列數(shù)據(jù)庫(kù)[12],其中的文獻(xiàn)題錄免費(fèi)向全社會(huì)提供服務(wù)。CNKI還陸續(xù)建成醫(yī)院、企業(yè)管理等多領(lǐng)域?qū)I(yè)知識(shí)倉(cāng)庫(kù),為《中國(guó)知識(shí)資源總庫(kù)》的建設(shè)奠定了基礎(chǔ)。
CNKI相當(dāng)于一個(gè)專(zhuān)業(yè)文獻(xiàn)的數(shù)字圖書(shū)館,圖書(shū)館引進(jìn)CNKI不僅可以滿(mǎn)足讀者檢索和閱覽需求,還可以利用光盤(pán)或網(wǎng)絡(luò)向單位內(nèi)部和社會(huì)提供咨詢(xún)等服務(wù)。CNKI通過(guò)檢索咨詢(xún)站和鏡像站點(diǎn),迅速在全國(guó)圖書(shū)情報(bào)界建立起完善的知識(shí)服務(wù)網(wǎng)絡(luò),在一定程度上促進(jìn)了這個(gè)時(shí)期圖書(shū)館電子閱覽室的建設(shè),也加快了圖書(shū)館資源數(shù)字化進(jìn)程。
早在20世紀(jì)60年代,袁翰青便指出對(duì)文獻(xiàn)中新發(fā)現(xiàn)的知識(shí)進(jìn)行組織,可以深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等細(xì)粒度的“知識(shí)元”[20]。21世紀(jì)初期,圖書(shū)館界開(kāi)始關(guān)注知識(shí)服務(wù),而知識(shí)元是數(shù)字圖書(shū)館知識(shí)構(gòu)建的基礎(chǔ)。
1.3.1 CNKI問(wèn)世,實(shí)現(xiàn)知識(shí)檢索細(xì)粒度
CNKI一直致力于知識(shí)元的構(gòu)建,2003年《中國(guó)期刊網(wǎng)》正式更名為中國(guó)知網(wǎng)(www.cnki.net),《中國(guó)知識(shí)資源總庫(kù)》建設(shè)工程初具規(guī)模。CNKI依據(jù)嚴(yán)格的標(biāo)準(zhǔn)數(shù)字化加工流程,整合文獻(xiàn)數(shù)據(jù)庫(kù)、專(zhuān)業(yè)知識(shí)倉(cāng)庫(kù)、知識(shí)元庫(kù),并以知識(shí)元庫(kù)和引文鏈接等方式組成知識(shí)網(wǎng)絡(luò)系統(tǒng)。到2010年,CNKI建成“概念、原理、方法”“圖形圖像”“科學(xué)數(shù)據(jù)”“社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)”“社會(huì)發(fā)展事件事實(shí)”等知識(shí)元數(shù)據(jù)庫(kù),以及涵蓋各學(xué)科300萬(wàn)詞條的概念關(guān)系詞典,并以此為基礎(chǔ)發(fā)布全球首個(gè)知識(shí)元搜索系統(tǒng),實(shí)現(xiàn)了學(xué)術(shù)資源深度聚合和知識(shí)的細(xì)粒度檢索。
1.3.2 深度整合,開(kāi)發(fā)數(shù)據(jù)庫(kù)系列產(chǎn)品
2004年CNKI開(kāi)始整合百科全書(shū)、詞典和專(zhuān)科辭典等資源,出版了我國(guó)首個(gè)《工具書(shū)數(shù)據(jù)庫(kù)》,并將其中的概念、圖片、數(shù)字和圖表等進(jìn)行詳細(xì)標(biāo)引,為讀者提供增值服務(wù)[21]。2006年10月,CNKI又根據(jù)讀者層次和產(chǎn)品用途將《中國(guó)期刊全文數(shù)據(jù)庫(kù)》分為學(xué)術(shù)、高教等9種期刊數(shù)據(jù)庫(kù)產(chǎn)品,并以網(wǎng)絡(luò)出版方式經(jīng)營(yíng)。除收錄學(xué)術(shù)期刊外,CNKI還收錄了黨建期刊、政報(bào)公報(bào)等8種非學(xué)術(shù)期刊文獻(xiàn),并建立對(duì)應(yīng)數(shù)據(jù)庫(kù)。2008年CNKI首次發(fā)布能源電力、黨政、法律等20多個(gè)企業(yè)知識(shí)倉(cāng)庫(kù)。
1.3.3 建成中國(guó)學(xué)術(shù)期刊的權(quán)威性文獻(xiàn)檢索工具和網(wǎng)絡(luò)出版平臺(tái)
2006年《中國(guó)知識(shí)資源總庫(kù)》被確定為學(xué)術(shù)期刊的權(quán)威性文獻(xiàn)檢索工具。這不僅標(biāo)志著CNKI進(jìn)入規(guī)?;l(fā)展階段,也意味著我國(guó)學(xué)術(shù)期刊數(shù)字化、網(wǎng)絡(luò)化建設(shè)的目標(biāo)基本實(shí)現(xiàn),具有自主知識(shí)產(chǎn)權(quán)的文獻(xiàn)檢索、知識(shí)挖掘、文獻(xiàn)評(píng)價(jià)研究等系統(tǒng)和數(shù)字化學(xué)習(xí)與研究平臺(tái)達(dá)到領(lǐng)先水平[22]。
1.3.4 網(wǎng)絡(luò)出版物產(chǎn)品進(jìn)入標(biāo)準(zhǔn)化時(shí)代
隨著出版社數(shù)字化意識(shí)的覺(jué)醒,大量數(shù)字出版產(chǎn)品問(wèn)世[7]。為實(shí)現(xiàn)資源開(kāi)發(fā)系統(tǒng)化、標(biāo)準(zhǔn)化,規(guī)范數(shù)字產(chǎn)品的出版,CNKI于1998年7月啟動(dòng)中國(guó)學(xué)術(shù)電子期刊標(biāo)準(zhǔn)化數(shù)據(jù)庫(kù)系統(tǒng)工程[23],并在2005年參照相關(guān)技術(shù)標(biāo)準(zhǔn)和傳統(tǒng)出版物的產(chǎn)品標(biāo)準(zhǔn),制定了國(guó)際國(guó)內(nèi)首部公開(kāi)發(fā)表的連續(xù)型電子與網(wǎng)絡(luò)出版物產(chǎn)品標(biāo)準(zhǔn)——《CNKI系列數(shù)據(jù)庫(kù)產(chǎn)品與技術(shù)服務(wù)標(biāo)準(zhǔn)》,從全文數(shù)據(jù)庫(kù)基本屬性、產(chǎn)品用途、內(nèi)容、結(jié)構(gòu)、功能與性能6個(gè)方面規(guī)范出版產(chǎn)品、確保產(chǎn)品質(zhì)量[24],體現(xiàn)了文獻(xiàn)數(shù)據(jù)的規(guī)范化和標(biāo)準(zhǔn)化,為圖書(shū)館數(shù)字資源建設(shè)質(zhì)量保駕護(hù)航,為知識(shí)信息的傳播和利用打下良好基礎(chǔ),象征著網(wǎng)絡(luò)出版物產(chǎn)品進(jìn)入標(biāo)準(zhǔn)化時(shí)代。
計(jì)算機(jī)和互聯(lián)網(wǎng)的普及、國(guó)際交流增強(qiáng),使得讀者對(duì)于國(guó)外資源的使用需求逐步提升。讀者開(kāi)始質(zhì)疑圖書(shū)館參考咨詢(xún)服務(wù)的內(nèi)容和形式,圖書(shū)館亦開(kāi)始重新審視自身在數(shù)字環(huán)境中的價(jià)值和地位,并重視國(guó)外學(xué)術(shù)資源的采購(gòu),通過(guò)大規(guī)模應(yīng)用新技術(shù)和新理念以滿(mǎn)足讀者訴求。
1.4.1 重視信息服務(wù)國(guó)際合作
CNKI不僅注重國(guó)內(nèi)信息資源開(kāi)發(fā),也重視與國(guó)外大型出版商建立聯(lián)系。根據(jù)國(guó)內(nèi)用戶(hù)需要篩選和統(tǒng)一引進(jìn)海外文獻(xiàn)資源,利用自身平臺(tái)和服務(wù)體系在網(wǎng)上代理發(fā)行國(guó)外數(shù)據(jù)庫(kù)。2008年CNKI與德國(guó)Springer出版集團(tuán)合作,將雙方數(shù)據(jù)庫(kù)整合并在CNKI知識(shí)服務(wù)平臺(tái)發(fā)布,開(kāi)啟國(guó)際合作新紀(jì)元[25]。隨后英國(guó)Taylor&Francis出版社、劍橋大學(xué)出版社,美國(guó)大英百科全書(shū)出版集團(tuán)、ProQuest信息公司等國(guó)外出版機(jī)構(gòu)紛紛與CNKI簽約,整合雙方資源。CNKI此舉方便了我國(guó)廣大用戶(hù)以最低的成本和便捷的方式利用國(guó)外數(shù)據(jù)庫(kù)。與此同時(shí),CNKI積極響應(yīng)政府“走出去”戰(zhàn)略,注重學(xué)術(shù)期刊、產(chǎn)品市場(chǎng)推廣國(guó)際化。2010年,CNKI開(kāi)始建設(shè)中國(guó)學(xué)術(shù)文獻(xiàn)全球營(yíng)銷(xiāo)網(wǎng)絡(luò)平臺(tái),在美國(guó)、德國(guó)等地建成8個(gè)境外鏡像網(wǎng)站[26],我國(guó)學(xué)術(shù)成果、產(chǎn)品開(kāi)始逐步走向境外知名大學(xué)、研究機(jī)構(gòu)、政府等單位。一系列國(guó)際合作表明,CNKI數(shù)字資源整合出版與服務(wù)模式受到了國(guó)際同行的認(rèn)同,而CNKI遍及世界各地的用戶(hù)也意味著我國(guó)知識(shí)信息資源實(shí)現(xiàn)了互聯(lián)網(wǎng)條件下的國(guó)際化傳播。
1.4.2 開(kāi)拓科技信息服務(wù)新領(lǐng)域
2008年蘋(píng)果公司推出iPhone后,智能手機(jī)、移動(dòng)終端層出不窮,社會(huì)進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代。移動(dòng)互聯(lián)網(wǎng)帶來(lái)的時(shí)間碎片利用是社會(huì)和圖書(shū)館界共同思考的問(wèn)題。為提高服務(wù)的針對(duì)性和個(gè)性化,精準(zhǔn)把握讀者訴求,CNKI面向用戶(hù)開(kāi)展各種增值知識(shí)服務(wù),如科技查新、參考咨詢(xún)、定題服務(wù)、知識(shí)比較與評(píng)價(jià)、知識(shí)推送。
在大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)的產(chǎn)生、采集、存儲(chǔ)、智能化、可視化呈現(xiàn)以及大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,給數(shù)據(jù)庫(kù)行業(yè)、圖書(shū)館界帶來(lái)巨大的發(fā)展機(jī)遇和挑戰(zhàn),雙方開(kāi)始意識(shí)到知識(shí)服務(wù)的重要性,推出相應(yīng)的知識(shí)獲取、知識(shí)管理等服務(wù)。
1.5.1 借助優(yōu)勢(shì),推進(jìn)知識(shí)管理與服務(wù)
2013年CNKI重構(gòu)工程技術(shù)與產(chǎn)業(yè)體系,突破復(fù)雜數(shù)據(jù)自動(dòng)加工、大數(shù)據(jù)分析、隱性知識(shí)顯性化等重要環(huán)節(jié)關(guān)鍵技術(shù),打造了120多個(gè)行業(yè)平臺(tái),確立了數(shù)字出版、知識(shí)管理、知識(shí)服務(wù)、信息化教育四大主營(yíng)產(chǎn)業(yè)方向,大力推進(jìn)面向創(chuàng)新和創(chuàng)新人才培養(yǎng)的精準(zhǔn)知識(shí)服務(wù)。憑借其在知識(shí)管理和知識(shí)服務(wù)領(lǐng)域多年的研究和實(shí)踐,針對(duì)用戶(hù)科研創(chuàng)新和技術(shù)創(chuàng)新過(guò)程,2015年CNKI推出基于大數(shù)據(jù)研究范式的機(jī)構(gòu)知識(shí)管理系統(tǒng)(Organization Knowledge Manage System,OKMS),該系統(tǒng)融合機(jī)構(gòu)內(nèi)外大數(shù)據(jù)知識(shí)資源,提供集知識(shí)管理、大數(shù)據(jù)分析、協(xié)同研究、協(xié)同創(chuàng)新、項(xiàng)目管理、人才體系構(gòu)建、科研評(píng)價(jià)與成果轉(zhuǎn)化于一體的知識(shí)創(chuàng)新服務(wù)支撐平臺(tái)。2016年,CNKI基于XML碎片化、增強(qiáng)出版、知識(shí)重組、知識(shí)網(wǎng)絡(luò)構(gòu)建等技術(shù),推出CNKI研究型協(xié)同學(xué)習(xí)平臺(tái)(簡(jiǎn)稱(chēng)“研學(xué)平臺(tái)”),提供“閱讀、思考、表達(dá)、寫(xiě)作”四位一體的深度閱讀學(xué)習(xí)平臺(tái),服務(wù)于個(gè)人探究式學(xué)習(xí)平臺(tái)、知識(shí)體系構(gòu)建,以及創(chuàng)新人才培養(yǎng)。
1.5.2 面向需求,實(shí)現(xiàn)移動(dòng)知識(shí)服務(wù)
2014年CNKI打造了移動(dòng)知識(shí)服務(wù)平臺(tái)《全球?qū)W術(shù)快報(bào)》,收錄了中國(guó)90%以上的知識(shí)資源、2億多篇外文文獻(xiàn),具備一站式中英文檢索、個(gè)性化定制、精準(zhǔn)推送、熱點(diǎn)追蹤和流式閱讀等功能,為用戶(hù)創(chuàng)造了一個(gè)移動(dòng)的科研創(chuàng)新環(huán)境,使其成為真正的“口袋圖書(shū)館”“口袋研學(xué)系統(tǒng)”。這個(gè)時(shí)期,CNKI一方面把各領(lǐng)域事實(shí)信息整合起來(lái),使內(nèi)容資源日益完備,另一方面用人工智能對(duì)文獻(xiàn)內(nèi)容與形式屬性進(jìn)行精確的多維度標(biāo)引,使文獻(xiàn)檢索結(jié)果盡可能精準(zhǔn)和完整,情報(bào)分析盡可能全面和系統(tǒng)。知識(shí)管理平臺(tái)、移動(dòng)服務(wù)平臺(tái)與協(xié)同服務(wù)平臺(tái),分別對(duì)應(yīng)知識(shí)獲取、知識(shí)組織與知識(shí)創(chuàng)新3個(gè)層次的服務(wù),提升了圖書(shū)館對(duì)終端讀者的精準(zhǔn)服務(wù)能力。
從CAJ-CD立項(xiàng)開(kāi)始,CNKI就一直堅(jiān)持自主研發(fā)的戰(zhàn)略,這成為CNKI發(fā)展進(jìn)程的一大特點(diǎn)。由于多年來(lái)堅(jiān)持不懈地加強(qiáng)技術(shù)研發(fā)投入,實(shí)現(xiàn)多項(xiàng)技術(shù)突破,取得大量的技術(shù)成果,僅2009-2018年間,CNKI獲得專(zhuān)利達(dá)200多項(xiàng)。
1995年CNKI自主研究中文信息處理,并成功自主研發(fā)中文全文檢索技術(shù)、中英文混合全文檢索技術(shù),解決用戶(hù)對(duì)文獻(xiàn)信息和知識(shí)獲取全面性和準(zhǔn)確性的需求。
2002年開(kāi)始,CNKI嘗試把散落的知識(shí)通過(guò)微觀水平上的聯(lián)系組建“知識(shí)網(wǎng)絡(luò)”,并把關(guān)聯(lián)的知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)稱(chēng)為知網(wǎng)節(jié)。CNKI在此基礎(chǔ)上自主研發(fā)出其核心檢索技術(shù)——知網(wǎng)節(jié)技術(shù),構(gòu)建了文獻(xiàn)知識(shí)網(wǎng)絡(luò),揭示文獻(xiàn)之間的多種邏輯關(guān)系;同時(shí)為用戶(hù)提供了集文獻(xiàn)信息加工、標(biāo)引、分類(lèi)發(fā)布于一體的文獻(xiàn)自動(dòng)化管理TPI系統(tǒng)。
2004年,CNKI研發(fā)了以自然語(yǔ)言分析技術(shù)為核心的技術(shù)體系,并發(fā)布我國(guó)第一套醫(yī)學(xué)專(zhuān)業(yè)主題詞、分類(lèi)號(hào)一體化標(biāo)引和智能檢索系統(tǒng)。
2006年,基于CNKI知識(shí)元抽取和挖掘技術(shù),發(fā)布CNKI概念、術(shù)語(yǔ)、方法、數(shù)值、公式、圖形、表格等知識(shí)元搜索工具及翻譯助手。
2008年,CNKI研制成功基于語(yǔ)義的自適應(yīng)多階數(shù)字指紋特征檢測(cè)技術(shù),并發(fā)布“學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)”。
2009年,CNKI研制成功基于讀者學(xué)習(xí)需求驅(qū)動(dòng)的智能推薦技術(shù),并發(fā)布“研究型個(gè)人數(shù)字圖書(shū)館”和面向創(chuàng)新的“數(shù)字化學(xué)習(xí)和研究平臺(tái)”。
2010年,CNKI制定資源國(guó)家化戰(zhàn)略,提出“深化整合中外資源,服務(wù)高端科技創(chuàng)新”,研發(fā)了外文本體詞庫(kù)、相關(guān)文獻(xiàn)關(guān)聯(lián)技術(shù)、內(nèi)容深度挖掘系統(tǒng)等。自主開(kāi)發(fā)NXD(Native XML Database)數(shù)據(jù)庫(kù),全面開(kāi)展資源的XML化加工,為知識(shí)元的動(dòng)態(tài)重組出版提供資源和技術(shù)支持。
2011年,CNKI啟動(dòng)知識(shí)服務(wù)戰(zhàn)略,提出決策知識(shí)結(jié)構(gòu)5W2H(What、Why、When、Who、Where、How、How About),開(kāi)發(fā)文獻(xiàn)碎片化、數(shù)據(jù)XML化、NXD數(shù)據(jù)庫(kù)與動(dòng)態(tài)重組、文獻(xiàn)與段落主題標(biāo)引、5W2H標(biāo)引、智能問(wèn)答技術(shù)等,為用戶(hù)提供知識(shí)服務(wù)和移動(dòng)化服務(wù)。
2012年,CNKI研制成功云出版技術(shù),發(fā)布書(shū)報(bào)刊全流程數(shù)字化“騰云數(shù)字出版平臺(tái)”,推出增強(qiáng)出版、數(shù)據(jù)出版等多種新型出版形態(tài),打通了知識(shí)生產(chǎn)、傳播全流程。
2015年,CNKI研制成功基于XML的融媒體協(xié)同編撰技術(shù),并推出基于大數(shù)據(jù)研究范式的機(jī)構(gòu)知識(shí)管理與協(xié)同創(chuàng)新平臺(tái)。
2017年,CNKI突破檢索領(lǐng)域“檢全率”和“檢準(zhǔn)率”不能兼顧、“時(shí)間排序”和“主題排序”無(wú)法二維兼容的技術(shù)難題,實(shí)現(xiàn)主題相關(guān)條件下按時(shí)間排序。
2018年,CNKI研制成功基于世界知識(shí)大數(shù)據(jù)的知識(shí)圖譜智能構(gòu)建技術(shù),發(fā)布“政產(chǎn)學(xué)研大數(shù)據(jù)融合應(yīng)用平臺(tái)”。
綜上所述,CNKI核心技術(shù)按照技術(shù)類(lèi)型可分為7類(lèi),具體見(jiàn)表1。這些核心技術(shù)中以智能標(biāo)引與文獻(xiàn)檢索技術(shù)、知識(shí)元自動(dòng)抽取技術(shù)、XML碎片化技術(shù)、基于深度學(xué)習(xí)的超大字符OCR技術(shù)和語(yǔ)義相似性檢測(cè)技術(shù)為重中之重。
表1 中國(guó)知網(wǎng)CNKI核心技術(shù)一覽
XML碎片化技術(shù)能把文獻(xiàn)中具有獨(dú)立意義的段落分解出來(lái),除獨(dú)立檢索外,還可通過(guò)“知網(wǎng)節(jié)”關(guān)聯(lián)構(gòu)成碎片化內(nèi)容的知識(shí)網(wǎng)絡(luò),形成比“文獻(xiàn)知網(wǎng)節(jié)”內(nèi)容更深、使用更為方便的探究式學(xué)習(xí)工具。知識(shí)元自動(dòng)抽取技術(shù)則是在XML碎片化的基礎(chǔ)上,從海量文章中抽取概念、原理、公式和圖形等知識(shí)元,加以清洗、規(guī)范和組織,分類(lèi)建成各種專(zhuān)業(yè)知識(shí)庫(kù)。CNKI在這兩種技術(shù)基礎(chǔ)上構(gòu)建了XML碎片化加工系統(tǒng),縮短了資源的結(jié)構(gòu)化加工時(shí)間,可以同時(shí)標(biāo)引整刊數(shù)據(jù)和篇名、作者、關(guān)鍵詞、摘要等篇源數(shù)據(jù),也能從全文中一次性提取章節(jié)、段落以及表格公式,工作人員只需對(duì)標(biāo)引結(jié)果進(jìn)行校對(duì)即可。經(jīng)測(cè)試,一本期刊只需20多秒即可完成內(nèi)容提取,自動(dòng)標(biāo)引正確率達(dá)到96.5%。該系統(tǒng)在第六屆中國(guó)數(shù)字出版博覽會(huì)上獲得“數(shù)字出版創(chuàng)新技術(shù)獎(jiǎng)”,目前《圖片知識(shí)數(shù)據(jù)庫(kù)》《統(tǒng)計(jì)年鑒數(shù)據(jù)庫(kù)》都是基于此技術(shù)開(kāi)發(fā)。此外,CNKI進(jìn)一步開(kāi)發(fā)了知識(shí)圖譜智能構(gòu)建技術(shù),該技術(shù)獲得2019年中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)領(lǐng)先科技成果“優(yōu)秀項(xiàng)目獎(jiǎng)”,已應(yīng)用于貴州省“一云一網(wǎng)一平臺(tái)”。
基于深度學(xué)習(xí)的超大字符集OCR技術(shù)采用深度學(xué)習(xí)等人工智能技術(shù),針對(duì)包括中文簡(jiǎn)體、繁體、古籍中大量的異體字、少數(shù)民族文字在內(nèi)的超大字符集,實(shí)現(xiàn)高精度的智能OCR,漢字識(shí)別準(zhǔn)確率可以達(dá)到99.95%。采用此技術(shù)識(shí)別后,其內(nèi)容無(wú)需再進(jìn)行編改,利用率大幅提高。
語(yǔ)義相似性檢測(cè)技術(shù)是通過(guò)計(jì)算機(jī)自動(dòng)查找相似文檔,發(fā)現(xiàn)剽竊行為。其原理是通過(guò)計(jì)算可疑文檔與參照文檔之間的相似程度來(lái)判斷可疑文檔是否存在抄襲,通過(guò)構(gòu)建語(yǔ)義網(wǎng)絡(luò),在語(yǔ)義空間里計(jì)算語(yǔ)義距離來(lái)衡量相似度,以判斷論文是否重復(fù)。
多年來(lái),CNKI依托文獻(xiàn)加工自動(dòng)化技術(shù)和中文全文檢索技術(shù)等核心技術(shù),形成了完整的技術(shù)體系和研發(fā)體系,不僅為公司產(chǎn)品和服務(wù)提供支持,還為包括科研領(lǐng)域在內(nèi)的各行業(yè)提供了信息化的技術(shù)、產(chǎn)品和服務(wù),為圖書(shū)館知識(shí)基礎(chǔ)設(shè)施提供了強(qiáng)有力的技術(shù)支持,加快了圖書(shū)館信息化的進(jìn)程,提升了文獻(xiàn)信息化和知識(shí)化水平,促使圖書(shū)館從傳統(tǒng)以藏書(shū)為主的信息機(jī)構(gòu)轉(zhuǎn)變?yōu)檫m應(yīng)社會(huì)發(fā)展需要的知識(shí)服務(wù)機(jī)構(gòu)。
2007年前后,國(guó)際許多著名期刊幾乎消滅了出版時(shí)滯[15]。盡管我國(guó)互聯(lián)網(wǎng)期刊出版產(chǎn)業(yè)發(fā)展增速較快,但大部分仍停留在紙刊數(shù)字化后再上網(wǎng)的模式,增加了出版時(shí)滯,大大影響了科研成果的首創(chuàng)價(jià)值和利用價(jià)值,降低了科研人員、期刊的創(chuàng)新競(jìng)爭(zhēng)力、影響力和國(guó)際競(jìng)爭(zhēng)力。
CNKI一直致力于期刊出版模式革新。1998年6月創(chuàng)辦我國(guó)第一個(gè)電子期刊出版機(jī)構(gòu)——《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》電子雜志社[10],創(chuàng)立了學(xué)術(shù)期刊全文數(shù)字出版運(yùn)營(yíng)模式,成為世界上第一個(gè)與紙本期刊同步出版的數(shù)據(jù)庫(kù)電子期刊。1999年CNKI自主研發(fā)了第一代網(wǎng)絡(luò)出版技術(shù)KNS系統(tǒng),發(fā)布了學(xué)術(shù)期刊“采編發(fā)網(wǎng)絡(luò)平臺(tái)”1.0、學(xué)術(shù)研究平臺(tái)1.0,利用網(wǎng)絡(luò)打通了我國(guó)知識(shí)生產(chǎn)、傳播、擴(kuò)散、利用的各個(gè)環(huán)節(jié)。
為縮短并最終消滅出版時(shí)滯,提高我國(guó)科研成果的首創(chuàng)價(jià)值,推動(dòng)學(xué)術(shù)期刊出版數(shù)字化轉(zhuǎn)型,CNKI建成“學(xué)術(shù)期刊、會(huì)議論文優(yōu)先數(shù)字出版平臺(tái)”(2008年)、“中國(guó)知網(wǎng)學(xué)術(shù)期刊優(yōu)先數(shù)字化出版平臺(tái)”(2010年)、“騰云期刊協(xié)同采編系統(tǒng)”(2012年)、“騰云期刊數(shù)字復(fù)合出版系統(tǒng)”(2012年)、“騰云全媒體數(shù)字復(fù)合系統(tǒng)”(2012 年)。
鑒于學(xué)術(shù)不端現(xiàn)象愈演愈烈,2006年9月14日,科學(xué)技術(shù)部審議通過(guò)《國(guó)家科技計(jì)劃實(shí)施中科研不端行為處理辦法(試行)》[27]。2008年,CNKI啟動(dòng)“科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)(AMLC)”和“社科期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)(SMLC)”的研發(fā)。2008年12月,學(xué)術(shù)不端監(jiān)測(cè)系統(tǒng)正式上線(xiàn),達(dá)到大規(guī)模實(shí)用化的成熟程度,系統(tǒng)采用自適應(yīng)多階段數(shù)字指紋特征對(duì)PDF、CAJ、DOC、TXT等格式文件及其壓縮包進(jìn)行檢測(cè),以《中國(guó)知識(shí)資源總庫(kù)》和Springer、Taylor&Francis期刊數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)資源、優(yōu)先出版文獻(xiàn)庫(kù)、互聯(lián)網(wǎng)文檔等資源作為對(duì)比庫(kù),依托文獻(xiàn)和圖表相似性開(kāi)展重復(fù)率表征和檢測(cè),具備文獻(xiàn)檢測(cè)、黑名單管理、問(wèn)題文獻(xiàn)管理、檢測(cè)報(bào)告自動(dòng)生成、原文在線(xiàn)檢測(cè)比對(duì)等多項(xiàng)功能,僅需幾秒鐘就可以完成一篇學(xué)術(shù)論文的檢測(cè)工作。
期刊編輯部使用學(xué)術(shù)不端檢測(cè)系統(tǒng)可快速檢測(cè)編輯部來(lái)稿和已發(fā)表的論文是否存在學(xué)術(shù)不端問(wèn)題。不僅如此,學(xué)術(shù)不端檢測(cè)系統(tǒng)還在學(xué)位論文管理、科研項(xiàng)目立項(xiàng)驗(yàn)收、職稱(chēng)評(píng)審等方面充當(dāng)重要角色,能有效提高學(xué)術(shù)出版的文獻(xiàn)質(zhì)量和科研隊(duì)伍的基本素質(zhì),促進(jìn)學(xué)風(fēng)建設(shè)。
2017年10月16日,CNKI聯(lián)合436家學(xué)術(shù)期刊編輯部發(fā)布“學(xué)術(shù)論文錄用定稿網(wǎng)絡(luò)首發(fā)聯(lián)合公告”,啟動(dòng)網(wǎng)絡(luò)首發(fā)模式,將已經(jīng)同行評(píng)議審定、編輯部錄用的文章先在學(xué)術(shù)期刊平臺(tái)上第一次發(fā)表,再進(jìn)行紙版印刷,進(jìn)一步提高了我國(guó)學(xué)術(shù)科研成果的發(fā)表時(shí)效。2017年7月11日,《中國(guó)學(xué)術(shù)期刊(網(wǎng)絡(luò)版)》出版?zhèn)鞑テ脚_(tái)(CAJ-NP)發(fā)布,打通了編輯出版、作者服務(wù)、網(wǎng)絡(luò)傳播、讀者應(yīng)用的全流程,實(shí)現(xiàn)了知識(shí)生產(chǎn)、管理、傳播、擴(kuò)散、利用的各環(huán)節(jié)與過(guò)程全覆蓋。網(wǎng)絡(luò)首發(fā)能加速科研成果的生產(chǎn)力轉(zhuǎn)化;對(duì)于保障作者首發(fā)和原創(chuàng)權(quán)益,提高科技期刊的品牌價(jià)值和學(xué)術(shù)影響力具有重要意義[27]。這一系列平臺(tái)和系統(tǒng),不僅打通了期刊出版的上下游,優(yōu)化數(shù)字化出版流程,提高了期刊出版的時(shí)效性和影響力,而且意味著我國(guó)初步實(shí)現(xiàn)期刊由傳統(tǒng)印刷模式向數(shù)字化模式轉(zhuǎn)型,對(duì)于推動(dòng)我國(guó)數(shù)字圖書(shū)館進(jìn)程具有重要作用。
4.1.1 堅(jiān)持自主研發(fā)核心技術(shù),符合國(guó)家戰(zhàn)略
CNKI始終堅(jiān)持自主研發(fā)核心技術(shù),一方面能確保技術(shù)的可控性,及時(shí)提升技術(shù)能力和水平,更快、更好地滿(mǎn)足用戶(hù)迅速增長(zhǎng)的功能、性能需求,提高產(chǎn)品服務(wù)質(zhì)量和用戶(hù)滿(mǎn)意度,保證公司長(zhǎng)遠(yuǎn)發(fā)展;另一方面能保持我國(guó)數(shù)字出版與信息服務(wù)產(chǎn)業(yè)的獨(dú)立性和國(guó)際先進(jìn)性,符合國(guó)家發(fā)展戰(zhàn)略。
4.1.2 對(duì)圖書(shū)館資源數(shù)字化貢獻(xiàn)巨大,推動(dòng)圖書(shū)館地位變化
CNKI不斷提升對(duì)讀者的精準(zhǔn)服務(wù)能力,促進(jìn)圖書(shū)館從知識(shí)獲取、知識(shí)組織與知識(shí)創(chuàng)新三個(gè)層次為讀者提供服務(wù)。早期CNKI順應(yīng)了文獻(xiàn)資源數(shù)字化的發(fā)展趨勢(shì),不僅豐富了館藏資源,解決了館舍緊張的問(wèn)題,提高了圖書(shū)館服務(wù)質(zhì)量和參考咨詢(xún)服務(wù)水平,而且其期刊統(tǒng)計(jì)評(píng)價(jià)功能為圖書(shū)館采購(gòu)印本期刊提供了依據(jù),使有限的購(gòu)書(shū)經(jīng)費(fèi)發(fā)揮最大作用。后期CNKI通過(guò)出版平臺(tái)與圖書(shū)館的深度融合,把圖書(shū)館從傳統(tǒng)角色定位發(fā)展成適應(yīng)社會(huì)發(fā)展需要的知識(shí)服務(wù)機(jī)構(gòu),不斷推動(dòng)圖書(shū)館地位的變化。
4.1.3 革新數(shù)字出版模式,加速科研成果傳播
CNKI關(guān)注期刊出版模式的變革與技術(shù)進(jìn)步,打通了期刊出版“采編發(fā)”全流程,推動(dòng)我國(guó)期刊由傳統(tǒng)印刷模式向數(shù)字化模式轉(zhuǎn)型;注重學(xué)風(fēng)建設(shè),研發(fā)學(xué)術(shù)不端檢測(cè)系統(tǒng),確保學(xué)術(shù)成果質(zhì)量。率先提出優(yōu)先出版、網(wǎng)絡(luò)首發(fā)等出版方式,不僅加速科研成果向現(xiàn)實(shí)生產(chǎn)力的轉(zhuǎn)化,而且有利于保障作者首發(fā)和原創(chuàng)的權(quán)益,提高期刊的品牌價(jià)值和學(xué)術(shù)影響力。
4.1.4 推動(dòng)知識(shí)生產(chǎn)與傳播的上下游產(chǎn)業(yè)鏈融合發(fā)展
從服務(wù)科研、服務(wù)讀者、服務(wù)創(chuàng)新的意義上講,出版與圖書(shū)館的目標(biāo)是一致的,利益是相關(guān)的,是唇齒相依、生死與共的關(guān)系。CNKI努力破解數(shù)字出版產(chǎn)業(yè)化發(fā)展難題,積極探索符合我國(guó)國(guó)情的數(shù)字出版與數(shù)字圖書(shū)館融合發(fā)展產(chǎn)業(yè)運(yùn)營(yíng)模式,為從根本上解決數(shù)字出版與傳統(tǒng)出版、數(shù)字出版與數(shù)字圖書(shū)館在生與死、價(jià)值與價(jià)格等方面的矛盾開(kāi)辟了新的發(fā)展途徑。
4.1.5 堅(jiān)持依法合理解決版權(quán)問(wèn)題,構(gòu)建健康的產(chǎn)業(yè)發(fā)展生態(tài)
從1995年創(chuàng)辦伊始,CNKI即以高度負(fù)責(zé)的態(tài)度認(rèn)真解決版權(quán)問(wèn)題,不惜成本與全國(guó)數(shù)以萬(wàn)計(jì)的各類(lèi)機(jī)構(gòu)和組織簽訂合作協(xié)議,并通過(guò)這些機(jī)構(gòu)取得作者授權(quán),每年結(jié)算和支付著作權(quán)使用費(fèi),并免費(fèi)提供個(gè)人使用的檢索卡。這在當(dāng)時(shí)環(huán)境下十分難能可貴。此后20多年CNKI始終堅(jiān)持此項(xiàng)版權(quán)策略,對(duì)構(gòu)建我國(guó)數(shù)字出版與數(shù)字圖書(shū)館的良好產(chǎn)業(yè)生態(tài)、保證上下游健康可持續(xù)共同發(fā)展起到了極為重要的作用。
文獻(xiàn)數(shù)據(jù)庫(kù)作為新生事物給圖書(shū)情報(bào)界帶來(lái)眾多便利的同時(shí),其發(fā)展和服務(wù)模式也存在一些弊端。CNKI作為文獻(xiàn)數(shù)據(jù)庫(kù)行業(yè)中的翹楚,在發(fā)展過(guò)程中也需要不斷完善,解決存在的問(wèn)題。必須指出的是,科學(xué)合理的定價(jià)、上下游利益的平衡、對(duì)作者的良好服務(wù)、著作權(quán)使用行為的規(guī)范與法規(guī)等是整個(gè)數(shù)據(jù)庫(kù)產(chǎn)業(yè)鏈各環(huán)節(jié)都需要從根本上解決的問(wèn)題,也是政府需要高度重視和盡快出臺(tái)相關(guān)政策法規(guī)的全局性大事。
4.2.1 完善價(jià)格體系,方便圖書(shū)館精準(zhǔn)選購(gòu)
CNKI擁有豐富的學(xué)術(shù)資源,其檢索、排序、知識(shí)關(guān)聯(lián)等研究學(xué)習(xí)功能優(yōu)于同類(lèi)產(chǎn)品,因此深受讀者的喜愛(ài)。經(jīng)調(diào)研,其在國(guó)內(nèi)外知識(shí)資源的深度挖掘、廣度整合、高度凝聚以及知識(shí)管理與服務(wù)系統(tǒng)研發(fā)、運(yùn)維方面持續(xù)不斷的高投入,是造成其比國(guó)內(nèi)同類(lèi)數(shù)據(jù)庫(kù)價(jià)格更高的主要原因。2016年3月北京大學(xué)圖書(shū)館宣布即將停用CNKI,稱(chēng)“由于數(shù)據(jù)庫(kù)上漲價(jià)過(guò)高,圖書(shū)館目前正在全力與對(duì)方進(jìn)行2016年的續(xù)訂判斷”;2016年4月有報(bào)道稱(chēng)“CNKI學(xué)術(shù)期刊數(shù)據(jù)庫(kù)價(jià)格漲幅每年都在10%以上……”[28]。同方知網(wǎng)副總經(jīng)理單清龍對(duì)筆者表示,經(jīng)核實(shí)CNKI學(xué)術(shù)期刊數(shù)據(jù)庫(kù)2012-2016年價(jià)格平均增幅為6.8%,媒體報(bào)道提及的用戶(hù)是誤將購(gòu)買(mǎi)新產(chǎn)品的費(fèi)用,計(jì)算到續(xù)訂數(shù)據(jù)庫(kù)價(jià)格之內(nèi)。雖然個(gè)別報(bào)道缺乏深入調(diào)查或以一概全,有些用戶(hù)單純以文獻(xiàn)量衡量?jī)r(jià)格等,但其價(jià)格的確給一些圖書(shū)館造成較大負(fù)擔(dān),一直受到圖書(shū)館詬病。因此,如何結(jié)合圖書(shū)館當(dāng)前情況、地域差別等,制定科學(xué)的價(jià)格體系是CNKI必須解決的問(wèn)題,比如以單刊選購(gòu)的模式使圖書(shū)館選購(gòu)更精準(zhǔn),或區(qū)分文獻(xiàn)量、適當(dāng)考慮GDP上漲等因素制定價(jià)格等。
4.2.2 上下游利益和各自發(fā)展要求還不夠平衡
CNKI作為出版產(chǎn)業(yè)與圖書(shū)情報(bào)業(yè)的橋梁和紐帶,應(yīng)合理平衡上下游利益和各自發(fā)展要求,致力于打通知識(shí)生產(chǎn)、傳播、應(yīng)用全過(guò)程。毋庸置疑,紙質(zhì)出版的大幅下滑源于數(shù)字出版的發(fā)展。拋開(kāi)功能不說(shuō),數(shù)據(jù)庫(kù)的價(jià)格遠(yuǎn)遠(yuǎn)低于相應(yīng)紙質(zhì)出版物的總價(jià),這是我國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)與期刊出版產(chǎn)業(yè)經(jīng)營(yíng)相脫離、圖書(shū)館紙刊與期刊數(shù)據(jù)庫(kù)采購(gòu)預(yù)算機(jī)制相脫離造成的消極后果,使整個(gè)產(chǎn)業(yè)鏈存在不可持續(xù)發(fā)展風(fēng)險(xiǎn)。CNKI作為供需兩側(cè)的紐帶,應(yīng)積極推動(dòng)出版?zhèn)鞑ス┙o側(cè)、圖書(shū)情報(bào)需求側(cè)的結(jié)構(gòu)化調(diào)整,科學(xué)建立平衡上下游的商業(yè)模式與運(yùn)營(yíng)模式,保證我國(guó)知識(shí)傳播服務(wù)業(yè)的健康穩(wěn)定發(fā)展。
4.2.3 在兼顧各方效益的同時(shí)加強(qiáng)對(duì)作者的服務(wù)
在知識(shí)資源采集方面,CNKI通過(guò)銷(xiāo)售收入分成、保底分成、約定稿酬等著作權(quán)使用費(fèi)制度收錄知識(shí)資源,通過(guò)出版單位、學(xué)位授予單位等取得作者授權(quán)和支付作者稿酬。這種模式始于CNKI創(chuàng)辦的1995年,是解決海量數(shù)據(jù)庫(kù)和建設(shè)國(guó)家戰(zhàn)略性知識(shí)資源體系的可行與合法之策。目前CNKI每年支付的著作權(quán)使用費(fèi)已超過(guò)總收入的30%,但相對(duì)于出版者提供的海量文獻(xiàn)而言,數(shù)字出版給予原出版者的版權(quán)回報(bào)顯然不足以支持出版者以市場(chǎng)主體地位生存和發(fā)展,各編輯部在實(shí)際履約過(guò)程中也存在各種問(wèn)題和困難。盡管CNKI做了各種努力,包括為期刊免費(fèi)提供文獻(xiàn)服務(wù);為作者提供檢索卡;投入大量研發(fā)力量開(kāi)發(fā)采編發(fā)系統(tǒng),為期刊轉(zhuǎn)型升級(jí)、提高出版質(zhì)量和作者創(chuàng)作投稿提供服務(wù)等,絕大多數(shù)以傳播科研成果、提升學(xué)術(shù)影響力為目的的學(xué)術(shù)文獻(xiàn)作者對(duì)此給予了理解和認(rèn)可,但少數(shù)作者與CNKI就稿酬問(wèn)題仍存在爭(zhēng)議。近10年來(lái),就這個(gè)問(wèn)題被作者起訴的案件有10余起[29]。尤其是2019年2月翟天臨學(xué)術(shù)不端事件成為輿論焦點(diǎn)后,CNKI也成為社會(huì)熱點(diǎn),一些人借此機(jī)會(huì)討論CNKI支付給著作權(quán)人的稿酬問(wèn)題[30]。筆者認(rèn)為,雖然CNKI與期刊編輯部制定了由編輯部向作者支付稿酬的制度,但應(yīng)對(duì)執(zhí)行情況進(jìn)行嚴(yán)格監(jiān)督,徹底規(guī)范期刊的作者稿酬制度,消除由此造成的不良影響,并進(jìn)一步加強(qiáng)對(duì)作者的相關(guān)服務(wù),更全面地支持作者學(xué)術(shù)創(chuàng)新國(guó)際競(jìng)爭(zhēng)能力的提高。
CNKI自1995年成立以來(lái)始終秉承“為提升我國(guó)創(chuàng)新能力與文化軟實(shí)力服務(wù)”的宗旨,致力于國(guó)內(nèi)外優(yōu)質(zhì)出版知識(shí)資源的開(kāi)發(fā)利用與傳播,堅(jiān)持大數(shù)據(jù)與互聯(lián)網(wǎng)條件下的知識(shí)生產(chǎn)、傳播與利用模式創(chuàng)新,致力于海內(nèi)外期刊、博碩論文、報(bào)紙、會(huì)議論文、圖書(shū)、年鑒、統(tǒng)計(jì)數(shù)據(jù)等文化、教育文獻(xiàn)資源的集成化數(shù)字出版、傳播與內(nèi)容增值服務(wù)及相關(guān)軟件技術(shù)開(kāi)發(fā)。多年來(lái),研發(fā)了基于內(nèi)容的智能碎片化、XML智能標(biāo)引、協(xié)同技術(shù)、語(yǔ)義分析、圖像處理及檢索、數(shù)據(jù)挖掘、人工智能等自主知識(shí)產(chǎn)權(quán)核心技術(shù),逐步發(fā)展成為我國(guó)數(shù)字出版、知識(shí)服務(wù)、信息化教育服務(wù)領(lǐng)域的領(lǐng)軍企業(yè),以實(shí)際行動(dòng)逐步推動(dòng)我國(guó)數(shù)字圖書(shū)館事業(yè)進(jìn)程。面對(duì)激烈的國(guó)際競(jìng)爭(zhēng),CNKI自主研發(fā)的核心技術(shù)對(duì)于推動(dòng)我國(guó)自主的科技創(chuàng)新具有重要意義,特別是網(wǎng)絡(luò)首發(fā)模式對(duì)于加快創(chuàng)新科技成果轉(zhuǎn)化作用凸顯,將有效提高我國(guó)的科技競(jìng)爭(zhēng)力和國(guó)際地位。盡管中國(guó)知網(wǎng)在發(fā)展過(guò)程中出現(xiàn)了各種歷史遺留或新形勢(shì)催生的問(wèn)題,但其對(duì)圖書(shū)館、出版行業(yè)的積極影響卻不可磨滅。未來(lái)在服務(wù)創(chuàng)新和學(xué)習(xí)創(chuàng)新的目標(biāo)下,學(xué)術(shù)文獻(xiàn)出版、傳播與利用各方共同努力、協(xié)同運(yùn)行,一定能構(gòu)建更科學(xué)、更具活力的合作共贏機(jī)制,更好地推動(dòng)我國(guó)圖書(shū)館事業(yè)的發(fā)展。
注釋
①2017年12月12日,重慶大學(xué)圖書(shū)館館長(zhǎng)楊新涯在西南大學(xué)舉行的“川渝情報(bào)研究會(huì)”上所作題為《大學(xué)圖書(shū)館新趨勢(shì)》的報(bào)告中指出,《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》的發(fā)布是我國(guó)進(jìn)入數(shù)字圖書(shū)館時(shí)代的標(biāo)志和里程碑。